생성 인공지능(AI)은 막대한 효과 및 파급력을 보이지만, '진실성' 측면에서는 발전 여지가 있다. '환각 현상'과 같은 사례는 해당 AI 발전에 걸림돌이 되고 있다. 이런 가운데 우리 연구진이 '생성 AI가 생성한 결과물의 진실성·일관성 확보를 위한 기술 연구'를 통해 문제 해결에 보다 다가섰다. 과학기술정보통신부·정보통신기획평가원(IITP) 지원에 힘입은 성과로, '2026 국가 연구개발(R&D) 우수성과 100선'에 꼽히기도 했다.
임희석 고려대 컴퓨터학과 교수를 비롯한 연구진이 영광의 주인공이다. 이들은 2023년 '구름(KULLM:Korea University Large Language Model) 1'을 시작으로 한국어 특화 거대언어모델(LLM)을 선보여 왔는데, 이를 이번 연구를 통해 '구름 3'까지 발전시켰다.

이번 구름 3는 사용자가 할 수 있는 공감 대화, 명령 수행, 일반적인 사실 관련 질문, 유해한 질문 등 '가능한 모든 입력'에 유연·정확하게 대답하며, 특히 환각 현상을 피할 수 있도록 개발됐다.
이에 대해 임희석 교수는 “환각 현상은 사용자와 AI가 여러 번 질문·답변을 주고 받는 '멀티턴' 상황에서 심해지는데, 한 번으로 대화가 끝나는 경우와 달리 대화 맥락과 의도, 정보 기억이 필요해 성능 저하, 정보 일관성 부족 문제가 발생하기 쉽다”라며 “우리 연구진이 많은 노력으로 이를 해소했다”고 강조했다.
구름 3는 이미 성능을 인정받고 있다고 했다. 임 교수는 “오픈소스 플랫폼인 깃허브에서 '스타(프로젝트 인기 지표)'를 50개 받기도 어려운데, 구름 3는 600개 이상을 받았고, 허깅페이스에서는 30만회 이상 누적 다운로드를 기록했다”며 “국민권익위원회로부터 국민신문고에 우리 기술을 활용, 성공적인 개념증명(POC)을 수행할 수 있었다는 감사의 연락을 받기도 했다”고 전했다.
이번 연구로 연구진은 임베딩 모델 큐어(KURE:Korea University Retrieval Embedding model) 역시 선보였는데, 이 역시 환각 현상 해소에 일조한다고 했다. 큐어와 같은 임베딩 모델은 텍스트를 수치로 표현하는 기술로 검색, 질의응답, 분류 태스크 등 다양한 분야에 핵심 기술로 활용된다. 이를 통해 검색 내용을 정확하게 도출하고, 구름 3를 통해 올바른 답까지 생성한다는 설명이다.
임 교수는 “큐어 역시 깃허브 스타를 200여개 받고, 허깅페이스에서 66만회 이상 다운로드 수를 기록하는 등 세계에서 기술력을 인정받고 있다”고 밝혔다.
연구진은 이밖에 긴(long) 컨텍스트에서 환각 발생을 탐지하는 프레임워크까지 개발, 환각 현상을 탐지·완화하는 검증법까지 제시했다.
임 교수는 연구 과정에서 적잖은 어려움이 있었다고 했다. 당장 모델 학습에 필요하지만, 구하기 어려운 한국어 데이터를 직접 구축하는데 많은 시간과 노력을 기울였다고 했다. 분야 자체도 과거에는 희소해 관심을 못받았는데, 정부 및 IITP 지원이 힘이 됐다고 밝혔다.
임 교수는 “1992년부터 관련 연구를 했는데, '챗GPT'가 등장하기 전 30여년 동안은 척박한 환경이었다”며 “정부와 IITP 지원으로 한국어 데이터를 만들고, 그래픽처리장치(GPU)를 지원받아 과거에는 불가능하다고 여겼던 일을 할 수 있었다”고 말했다. 그러면서 “앞으로도 '생성 AI를 잘하는 연구진이 한국에도 있어'라는 말이 세계에서 나오도록 연구에 힘을 기울이겠다”고 덧붙였다.
김영준 기자 kyj85@etnews.com



















