
카카오가 인공지능(AI) 에이전트 구현의 핵심 기술인 '툴 호출(Tool Calling)' 기능의 학습 기법을 공개했다.
카카오는 글로벌 학회 'SIGdial 2025'에서 언어모델의 학습을 위한 기술을 발표하고 이를 오픈소스로 공유했다고 27일 밝혔다.
올해로 26회를 맞는 'SIGdial 2025'는 자연어처리(NLP) 내에서 담화 구조, 대화 시스템, 상호작용 연구 등 주제를 다루는 대표적인 국제 학회다. 매년 학계와 산업계 연구자들이 첨단 연구에 대해 발표한다.
카카오는 최근 언어모델 핵심 기능으로 주목받고 있는 '툴 호출(Tool Calling)' 기능을 한층 정교하게 만들기 위한 새 학습 기법을 개발해 이를 'SIGdial 2025'에서 발표했다. 또 연구 성과 생태계 기여를 목적으로 지난 25일 깃허브에 오픈소스로 소스코드를 공개했다.
이번에 공개된 기술은 카카오가 자체 구축한 벤치마크 'FunctionChat-Bench' 연구 일환으로 진행됐다. 카카오는 인공지능 언어모델의 '함수호출(Function Calling)' 성능 평가 데이터셋 'FunctionChat-Bench'를 지난해 9월 오픈소스로, 지난달 업데이트된 버전을 깃허브에 공개한 바 있다.
툴 호출 기능은 최근 AI 모델이 에이전틱 AI로 발전하면서 중요성이 크게 떠오르고 있다. 에이전틱 AI는 사용자 요청에 단순히 답변을 생성하는 수준을 넘어 대화 맥락을 이해한 뒤 적절한 외부 도구를 유기적으로 연결해 다양한 작업을 수행한다. 기존의 단순한 툴 호출 기능은 사용자 요청을 처리할 때 필요한 정보 부족으로 제대로 대응하지 못하거나 무관한 도구를 잘못 호출하는 한계점을 보였다. 이는 언어 모델이 요청을 제대로 이해하지 못하거나 환각 현상을 일으키는 상황을 주요 원인으로 지적돼 왔다. 카카오는 이번 고도화로 이 문제를 효과적으로 방어하고, AI가 보다 높은 정확도와 신뢰도를 갖춰 사용자 요청을 처리하도록 연구 개발을 진행했다.
카카오는 멀티턴(Multi-turn) 대화에서 기존 '직접 선호 최적화(DPO)' 방식을 응용한 '멀티턴 DPO' 기법으로 이 문제를 해결했다. 멀티턴 대화란 한 번의 질문과 '답변(Single-turn)'으로 끝나지 않고, 여러 차례 대화를 주고 받는 방식을 뜻한다.
기존의 DPO 방식이 틀린 답변과 맞는 답변을 대조해 학습하는 식이라면, 멀티턴 DPO 방식은 '강화 학습(Reinforcement Learning)' 기법을 적용해 일련의 틀린 대화 패턴과 맞는 대화 패턴을 학습해 문제를 개선한다. 단순한 질의응답이 아닌 전체 대화 흐름을 학습하는 방식을 기반으로, AI가 어떤 상황에서 추가 질문을 해야 하고 언제 요청을 거절해야 하는지를 효과적으로 학습하도록 설계됐다.
카카오 관계자는 “언어모델과 외부 도구를 연결하는 툴 호출 기능을 넘어 여러 단계를 거치는 멀티턴 기반의 다양한 AI 서비스에 적용하는 범용성을 보유한 것이 이 기술 특징”이라면서 “자사 AI 모델 '카나나'와 AI 서비스 고도화를 위해서도 활용할 계획”이라고 밝혔다.
변상근 기자 sgbyun@etnews.com





















