[딥테크] ‘인간이 앞서는 영역은 분명히 있다’
입력
수정
인공지능, ‘반복적 업무’ 탁월한 성과 추론 과정 평가 없으면 “AI 활용 능력 평가” ‘문제 풀이’ 아닌 ‘문제 발견’ 능력
본 기사는 스위스 인공지능연구소(SIAI)의 SIAI Researh Memo 시리즈 기고문을 한국 시장 상황에 맞춰 재구성한 글입니다. 본 시리즈는 최신 기술·경제·정책 이슈에 대해 연구자의 시각을 담아, 일반 독자들에게도 이해하기 쉽게 전달하는 것을 목표로 합니다. 기사에 담긴 견해는 집필자의 개인적 의견이며, SIAI 또는 그 소속 기관의 공식 입장과 일치하지 않을 수 있습니다.
최근 세계에서 가장 권위 있다고 하는 국제 수학 올림피아드(International Mathematical Olympiad)에서 인공지능(AI)이 금메달을 획득했다. 6문제 중 5개를 풀었고 점수는 35점이었다. 하지만 감탄만 하지 말고 더 자세히 들여다볼 필요가 있다. AI는 이미 정의된 방법론과 검색 가능한 증거가 있어야 놀랄만한 능력을 발휘한다.

AI, 수학 경시대회 ‘금메달’
따라서 학교가 정해진 절차를 따라가는 능력만을 보상하면 AI를 잘 흉내 내는 학생들이 길러질 뿐이다. 중요한 점은 절차를 반복하는 수준을 벗어나 문제를 해석하고, 가정을 실험하며, 불확실한 아이디어를 증명하는 인간 고유의 기술을 익히게 하는 것이다.
AI의 역량은 반복적인 업무에서 빛을 발한다. AI 코딩 조수를 둔 개발자는 일상적인 업무를 50% 이상 빠르게 완료했으며, 챗봇을 사용하는 고객 서비스 담당 직원은 정해진 업무에서의 생산성을 14% 끌어올렸다. 초심자일수록 이러한 경향은 커진다. 수학 분야에서도 AI는 올림피아드 수준의 기하학 문제를 메달권 학생들과 동등한 수준으로 풀어낸다. 과거의 경험을 통해 다음 과정을 예측할 수 있으면 탁월한 실적을 낸다.

주: AI 지원을 이용한 고객 서비스, GitHub 코파일럿을 이용한 소프트웨어 코딩
‘자동화 불가능’이 인간의 영역
우려 사항은 명확하다. 교육이 알려진 경로를 이용하는 능력에만 보상한다면 학생들은 시간을 줄이기 위해 AI에 의존할 수밖에 없다. 조금 다른 예일 수 있지만 2022년 국제 학생 평가 프로그램(PISA)에서는 게임이나 소셜 미디어 등에 시간을 덜 사용하는 참가자들의 성적이 훨씬 높았다. 디지털 기기를 금지하자는 말이 아니라 학교 과제가 알려진 단계를 찾는 연습이 돼서는 안 된다는 것이다. 2030년이 되면 현재 업무 시간의 1/3이 자동화되는데, 대부분이 절차적인 과정일 것이라고 한다. 학교가 변하지 않으면 학생이 아닌 AI를 평가하는 꼴이 될 수도 있다.
대안은 기계가 자동화할 수 없는 역량을 가르치는 것이다. ‘X를 풀 수 있는가?’라고 묻는 대신 ‘X가 고려할 가치가 있는 변수인가?’라고 물어야 한다. 또는 ‘도함수(derivative)를 구하라’ 대신 ‘어떤 모델이 문제 풀이에 최적화됐는가?’와 ‘어떤 허용 오차가 유의미한가?’를 질문해야 한다.
구체적인 방법을 제안한다면 학생들에게 정답을 먼저 주고 문제를 만들게 하거나, 가정 리스트를 제출하게 하며, 해답을 구두로 설명하게 하는 것 등이 포함된다. 이 과정에서 AI는 기준점 역할을 할 수 있다. AI의 단계적 풀이 과정을 본인의 추론 과정과 대조하며 모델의 오류를 찾아낼 수도 있다. 출석률 데이터 등 실생활 자료를 활용하면 가정과 근사치를 해명하고 결론의 견고함을 되돌아보게 할 수 있다. 이러한 연습을 통해 학생들은 선택과 정의, 증명을 포함한 판단력을 기르는 습관을 생활화할 수 있을 것이다.
실제로 연구에 따르면 디지털 도구를 절도 있게 사용하면 심층적 사고 과정에 필요한 시간을 더 많이 확보할 수 있고, 이는 일정 수준에 이르지 못한 학생들에게 더 큰 도움을 줄 수 있다. 형평성 차원에서도 의미가 크다. AI가 공평한 경쟁 환경을 만들 수 있는 상황은 학교가 내주는 과제가 반복보다는 추론을 강조할 때 가능하다.
평가 방식 변화가 ‘최우선’
그러려면 평가 방식의 변화가 선행돼야 한다. 학생이 과정에서 AI를 활용할 수 있지만, 평가는 스스로가 내린 결정에 의거하는 것이다. 교사는 AI의 풀이를 보여주고 학생들의 비판과 대안, 가정이 맞지 않을 경우 발생하는 위험 등에 대해 물을 수 있다. 짧더라도 구두 설명을 추가하면 본인이 작성한 과제물을 더 깊이 이해하는 데 도움을 준다. 교사들은 채점과 평가에 드는 시간을 절약해 학생들의 발표와 토론, 증명에 할애할 수 있다.
교육 당국은 중요한 시험에 ‘추론 평가’(reasoning audits)를 추가해 학생들이 풀이에 들어가기 전 문제 해결 계획을 제안할 수 있도록 해야 한다. 범위 지정(bounding), 복수의 자료 검색(triangulating), 증명(justifying) 등에 추가점을 주는 문제 은행을 배포하는 것도 좋은 방법이다.
AI를 활용하는 학생 수는 최근 2년 동안 두 배 증가했다. 이를 공식화하지 않는 것은 현실을 부정하는 것에 지나지 않는다. 하지만 인정하는 대신 명확한 요구 사항을 제시해야 한다. 정확한 기록을 남기는 조건으로 AI를 반복적인 작업에 활용할 수 있지만, 평가는 문제 해석, 결과에 대한 이의 제기, 선택에 대한 설명 등 인간의 과업에 내려진다는 것이다.

‘없던 길 내는 능력’이 진정한 역량
언급한 해법이 학생들의 숙련도 향상을 지연시키고 주관적인 채점의 가능성을 높인다는 우려가 나올 수 있지만, 과정 자체가 구조화되면 숙련도를 향상하는 데 문제가 없고 채점 기준도 객관화할 수 있다. 오히려 AI의 오류를 배움의 기회로 확장할 기회도 커진다. 실수를 발견하고 수정하는 과정이야말로 의존이 아닌 자생력을 기르는 최적의 방법이다.
성공적이라면 학교는 단순히 문제를 푸는 것에서 나아가 가치 있는 문제를 발견하고 스스로의 선택을 방어할 수 있는 졸업생을 배출할 수 있을 것이다. 기계가 시험에서 만점을 받은 시대에 진정한 평가는 존재하지 않았던 길을 만드는 능력에 내려져야 한다.
본 연구 기사의 원문은 Redesigning Education Beyond Procedure in the Age of AI를 참고해 주시기 바랍니다. 본 기사의 저작권은 스위스 인공지능연구소(SIAI)에 있습니다.