
광주과학기술원(GIST·총장 임기철)은 김선동 AI융합학과 교수팀이 사람의 문제 풀이 과정에 담긴 '의도'를 추정·정렬하는 학습 알고리즘과 인공지능(AI) 생성모델을 결합해 사람처럼 다양한 풀이 과정을 만들어 내는 데이터 증강 기법을 제안했다고 25일 밝혔다.
AI는 주어진 문제의 정답을 빠르게 도출하는 데 강점을 보이지만, 사람처럼 단계적 사고 과정을 거쳐 문제를 해결하는 추론 능력은 여전히 부족하다. 인간은 문제를 풀 때 시행착오를 겪으며, 같은 목표를 여러 방식으로 시도한다. 이 과정에서 축적된 풀이 데이터에는 단순한 행동의 나열이 아니라 의도가 담겨 있다. 이러한 의도를 학습하는 것이 '사람처럼 추론하는 능력'을 갖춘 AI의 핵심이다.
연구팀은 이러한 관점에서 문제 풀이 과정 속 의도를 추정·정렬하는 알고리즘을 개발하고, 생성모델 중 하나인 지플로우넷(GFlowNet)을 활용해 다양한 풀이 궤적을 생성하는 데이터 증강 기법을 제안했다.
사람의 문제 풀이 데이터를 분석해 최적 풀이에 도달하지 못한 경우를 △기능 부족 △비효율적 시도 △잘못된 전략 등 세가지 유형으로 분류하고 이를 학습에 반영했다. 이어 문제 풀이 궤적을 여러 단계로 분할해 각 단계의 의도를 추정·정렬하는 알고리즘을 제시하고, 이를 AI 학습에 반영함으로써 사람의 사고 과정을 모방한 학습을 구현했다.
지플로우넷 기반 데이터 증강 기법으로 사람처럼 다양한 풀이 과정을 생성함으로써 학습 데이터의 다양성과 일반화 성능을 크게 확장했다.

연구팀은 실제 사람들로부터 풀이 궤적 데이터를 수집하고 궤적이 부족한 경우에는 지플로우넷으로 생성해 보충했다. 이렇게 확보한 다양한 풀이 데이터를 학습에 적용한 결과, 기존 모델 대비 정확도가 83.59%에서 89.44%로 5.85% 포인트(p) 향상됐다. 이는 AI가 사람처럼 사고하고 일반화할 수 있음을 입증한 것이다.
□ 김선동 교수는 “인간은 늘 정석적인 풀이 과정을 따르기보다, 익숙한 방식으로 요령 있게 해답을 찾아내는 경우가 많지만 AI 모델 학습에서는 인간이 수집한 데이터를 별 고민 없이 사용하는 사례가 흔하다”며 “전·후처리 과정을 체계적으로 적용하면 데이터 내재적 한계를 극복하고, 보다 바람직한 행동을 구현하는 AI를 개발할 수 있을 것”이라고 말했다.
이어 “데이터 생성 기법은 인간 풀이 데이터가 부족한 분야에서 학습 데이터를 확장하는 데 크게 기여할 것”이라고 덧붙였다.
김영준 기자 kyj85@etnews.com



















