카카오, '카나나' API 첫 개방…멀티모달 AI 상용화 가속

Photo Image
정신아 카카오 대표가 2024년 10월 22일 경기 용인시 카카오 AI 캠퍼스에서 열린 '이프 카카오(if kakao) AI 2024'에서 카카오의 인공지능(AI) 통합 브랜드 '카나나(Kanana)'에 대해 소개하고 있다. 〈자료 카카오〉

카카오가 자체 개발한 멀티모달 생성형 인공지능(AI) 모델 '카나나'의 응용 프로그래밍 인터페이스(API)를 공개한다. 카카오가 AI 모델 API를 공개하는 첫 사례다. 멀티모달 AI의 상용 서비스 개발의 기폭제로 활용될 것으로 기대된다.

업계에 따르면 카카오는 오는 27일 '카나나(Kanana)-o'의 API 베타 서비스를 시작한다. 제한된 인원을 대상으로 카나나-o API를 공개하고, 피드백을 받는 비공개 베타 테스트(CBT) 형태로 운영한다. CBT에 선정되면 베타 기간 정해진 매일 횟수만큼 API를 테스트할 수 있다. 오는 5월 27일까지 3개월간 활용 가능하다.

카카오가 자체 개발한 생성형 AI 카나나의 API를 공개하는 것은 이번이 처음이다. API는 직접 모델 구동을 위한 여러 복잡한 과정을 수반하는 오픈소스 공개와 달리 간단한 과정만을 거쳐 모델을 서비스에 연동할 수 있다. 카카오는 다수 이용자가 효율적으로 모델의 성능을 경험해 볼 수 있다는 점에 착안해 API 공개를 결정했다. 실제 상용 서비스를 구현하도록 카카오의 그래픽처리장치(GPU) 등 자원을 지원할 예정이다.

AI 모델의 API를 공개하면 다양한 파생 서비스가 개발돼 생성형 AI 모델의 시장 지배력을 강화할 수 있다. API를 바탕으로 한 과금 체계도 운영 가능하다. 구글, 오픈AI, 앤트로픽 등 주요 해외 빅테크는 이미 주요 생성형 AI 모델의 API를 공개했다.

한 AI 기업 대표는 “카카오가 카나나-o의 API를 CBT 형태로 공개하는 것은 개발자와 기업의 실제 사용성을 조기에 확인하고, 카카오 AI 영향력을 확대해 생태계를 구축하는 전략으로 보인다”고 전했다.

Photo Image
'카나나-o'와 글로벌 경쟁모델 벤치마크 성능비교 〈자료 카카오〉

카나나-o는 카카오가 지난해 5월 성능을 공개한 통합 멀티모달 언어모델이다. 해외 모델과 비교해도 뒤지지 않는 성능으로 주목받았다.

이번에 API로 제공되는 모델은 한국어에 특화한 'Kanana-1.5-o-9.8b-2602' 버전이다. 텍스트, 이미지, 오디오 등 두 가지 이상 정보를 동시에 이해하고 처리한다. 억양·속도·화자 특성을 고려한 감정 표현도 장점이다.

카카오가 해당 모델을 API로 공개하면 음성이나 이미지를 활용한 AI 서비스를 본격적으로 발굴할 것으로 기대된다. 예컨대 시각 장애인을 위한 쇼핑 도우미 등 기능을 구현할 수 있다. 다양한 멀티모달 서비스가 개발되는 것과 함께 카카오 AI 기술의 인지도도 높아질 수 있다.

이경전 경희대 교수는 “카카오의 AI 모델 API 공개는 국내 다른 기업에 비해 늦은 편인데, 카나나-o API 공개로 AI 시장에서 주목받을 것으로 보인다”면서 “특히 국내 AI 모델 중 옴니모달 모델을 API로 공개한 사례가 없기 때문에 더욱 의미가 있다”고 평가했다.

한편 카카오는 올해 상반기 자체 AI 서비스에도 멀티모달을 도입한다. 기존에는 텍스트 입출력으로 카카오의 AI 서비스를 이용할 수 있었다. 앞으로는 음성이나 이미지를 자유롭게 입력하면서 대화하듯이 사용할 수 있는 AI 서비스를 구현할 것으로 전망된다.


변상근 기자 sgbyun@etnews.com, 현대인 기자 modernman@etnews.com

브랜드 뉴스룸