매스프레소·업스테이지·KT가 개발한 '수학 GPT', 오픈AI 제쳐

Photo Image
콴다

'콴다' 운영사 매스프레소가 업스테이지·KT가 개발한 공동 개발한 수학 도메인 특화 프라이빗 거대언어모델(LLM)이 오픈AI와 마이크로소프트(MS) 모델을 제쳤다고 8일 밝혔다.

3사가 개발한 'MathGPT(가칭)'는 'MATH'(1만2500개의 고난도 수학 경시 문제), 'GSM8K'(8500개의 초등학교 수학 문제) 등 수학 능력을 평가하는 벤치마크에서 기존 최고 기록인 MS 'ToRA 13B'를 제치고 13B 이하 모델 기준 1위를 차지했다.

MATH 벤치마크에서는 GPT-4의 성능을 넘어섰다. GSM8K와 MATH 두 벤치마크에서 동시에 1위를 달성한 경우는 세계적으로도 드물며, 국내 스타트업이 개발한 경량 모델이 글로벌 빅테크 모델 성능을 뛰어넘은 것이다.

KT의 강력한 인프라와 기반 모델 분야에서 축적된 노하우, 매스프레소의 독보적 수학 특화 데이터, 업스테이지의 뛰어난 모델링 기술력이 결합돼 이런 결과를 만들어냈다는 것이 회사 측 설명이다.

3사는 지난해 11월부터 전략적 파트너십을 체결하고 'MathGPT' 개발에 착수했다. 콴다는 매일 1000만건 문제 검색을 통해 축적된 학습 수준, 맥락, 상호작용 등 학습 데이터를 업스테이지에 제공했다. 업스테이지는 이를 환각현상 방지에 특화된 자체 솔루션에 학습시켜 자연어 기반 언어모델이 논리적 추론과 프로그래밍화를 통해 복잡한 수학 문제를 풀 수 있도록 파인튜닝을 진행했다.

콴다 측은 이 'MathGPT' 모델의 정확도와 성능을 지속해서 향상하고, 궁극적으로는 이를 자사 학습 인터페이스와 결합해 인공지능(AI) 보조 교사인 AI 튜터로 구현하겠다고 밝혔다. 향후 AI 튜터 서비스를 모든 교육 현장과 솔루션에 접목해 글로벌 AI 튜터로 교육 시장을 혁신한다는 구상이다.

이용재 매스프레소 대표는 “콴다, 업스테이지, KT 3사의 기술력과 노하우가 합쳐져 글로벌 빅테크를 뛰어넘은 의미 있는 결과를 만들어냈다”라며 “콴다의 AI 튜터를 통해 아시아를 넘어 전 세계 학생들의 교육 경험을 혁신할 것”이라고 말했다.

김성훈 업스테이지 대표는 “콴다, KT와의 협력을 통해 챗GPT를 뛰어넘고 세계 최고 수준 수학 특화 언어모델을 개발하게 돼 뜻깊다”라며 “업스테이지는 글로벌 1위 LLM 기술력을 바탕으로 다양한 영역에서 생성형 AI 혁신을 주도해 나갈 것”이라고 말했다.


김명희 기자 noprint@etnews.com