카카오뱅크, 허깅페이스 인공지능 LLM 평가 1위

Photo Image
카카오뱅크

카카오뱅크가 인공지능(AI) 기술 대규모언어모델(LLM) 분야에서 글로벌 리더보드 1위에 올랐다.

카카오뱅크는 자체 개발한 LLM 신형모델 '카본빌런'으로 지난달 31일(한국시간) 허깅페이스 오픈 LLM 리더보드 평가점수 1위에 올라 자리를 지키고 있다.

LLM은 AI 분야 중 하나인 자연어처리(NLP)에서 사용되는 언어 모델로, 챗GPT가 대표적이다. 대량 텍스트 데이터를 학습해 언어 패턴과 규칙을 습득하고, 새로운 텍스트를 생성하거나 이해하는 능력을 갖췄다. 챗봇, 기계 번역, 텍스트 요약, 텍스트 분류 등 다양한 자연어 처리 업무에 활용되고 있다.

Photo Image

카카오뱅크 '카본빌런'은 세계 최대 인공지능 플랫폼 허깅페이스가 운영하는 오픈 LLM 리더보드에서 평균 74.52점을 얻어 1위에 올랐다. 이는 챗GPT 기반이 되는 GPT-3.5 평가 점수 71.9점을 넘는 수치다.

오픈 LLM 리더보드는 전세계 테크 기업들이 표준 평가 지표로 AI 모델 성능을 비교하는 개방형 플랫폼이다. 현재 2200개가 넘는 모델이 등록돼 추론과 상식능력, 언어 이해 종합능력 등 7가지 지표로 리더보드 순위를 경쟁한다. 평가 지표가 지속 업데이트되며, 성능 검증 창구로 활용된다.

Photo Image
4일 기준 허깅페이스 오픈 LLM 리더보드 화면캡쳐

이번에 공개된 '카본빌런'은 AI 학습 과정에서 발생하는 막대한 양의 탄소를 줄여보자는 취지로 개발된 머지(Merge)모델이다. 머지모델은 두 개 이상 모델을 섞어 하나의 모델로 만드는 방식으로 최근 LLM에서 많이 사용되는 기법이다. 학습 없이 다양한 모델들의 강점은 활용하고 약점은 보완해 성능을 높일 수 있다. 직접 학습하지 않기 때문에 빠른 수행능력도 갖췄다. 카카오뱅크는 업스테이지 '솔라' 모델을 기반으로 해당 모델을 구축했다. 지난달 업스테이지 '솔라' 모델 공개 이후 이를 활용한 한국 모델들이 오픈LLM 리더보드 최상위권을 차지하기도 했다. 4일 현재 상위 25개 모델은 모두 솔라를 기반으로 만들어졌다.

카본빌런 개발을 주도한 카카오뱅크 전은광, 김정대 매니저는 “자체 LLM 개발 및 검증 과정에서 성능 개선을 위해 새로운 모델을 구현, 접근 방식 유효성을 검증하기 위해 오픈 LLM 리더보드를 활용했다”며 “다양한 시도를 통해 AI 발전에 기여하고 싶다”고 말했다.


정다은 기자 dandan@etnews.com


브랜드 뉴스룸