네이버, '프로덕트 네이티브 LLM'으로 AI탭 고도화…속도 높이고 환각 줄였다

발행일 : 2026-07-05 08:00 업데이트 : 2026-07-03 13:24

Photo Image — 이기창 네이버클라우드 하이퍼스케일 AI 모델 이사가 지난 2일 서울 강남구 D2SF 강남에서 '프로덕트 네이티브 거대언어모델(LLM)'에 대해 설명하고 있다. 〈자료 네이버〉

네이버가 대화형 인공지능(AI) 검색 서비스 'AI탭'의 핵심 기술로 서비스 환경에 최적화한 '프로덕트 네이티브 거대언어모델(LLM)'을 제시했다. AI가 서비스에서 안정적으로 작동하도록 지원하는 '하네스 엔지니어링'도 접목했다. 올해 하반기 AI탭 기능을 고도화하면서 이들 기술을 적극적으로 적용한다.

네이버는 2일 서울 강남구 D2SF 강남에서 열린 'AI 검색 테크 딥톡 스터디'에서 대화형 AI 검색 서비스 'AI탭'에 적용한 차세대 AI 모델과 운영 기술을 공개했다.

AI탭에 적용한 차세대 AI 모델은 네이버가 자체 개발한 '하이퍼클로바X'를 기반으로 AI 검색에 맞게 경량으로 개발됐다. 네이버의 데이터와 서비스 시나리오, 사용자 피드백을 모델 설계 전반에 반영한 프로덕트 네이티브 LLM이다.

이기창 네이버클라우드 하이퍼스케일 AI 모델 이사는 “긴 대화 맥락에서 멀티턴 대화를 이어가고, 상황에 맞는 도구를 적절하게 선택하며, 사용자가 원하는 과업을 끝까지 완수하는 데 중점을 뒀다”고 설명했다.

차세대 모델에는 전문가 혼합(MoE) 기반의 맞춤형 구조를 적용했다. 기존 모델보다 응답 속도를 약 2배 높였다. 1만6000토큰까지 응답 시간 증가를 최소화했다.

모호한 요청을 임의로 해석하지 않고 추가 질문으로 사용자 의도를 확인하는 '명료성 강화학습' 기술도 적용했다. 핵심 단서를 일부러 제거해 답할 수 없는 질문을 만들고 정상적으로 답할 수 있는 질문과 함께 학습에 활용했다.

이 이사는 “차세대 모델은 외부 벤치마크를 기준으로 환각률을 기존 하이퍼클로바X 모델보다 최대 30%포인트 줄였다”면서 “실제 서비스에서 불완전한 질문에 성급하게 답을 추측하기보다 필요한 정보를 되물어 신뢰할 수 있는 AI 경험을 제공하겠다”고 말했다.

네이버는 AI탭을 안정적으로 구동하는 핵심 기술인 하네스 엔지니어링도 소개했다. AI가 부적절한 답변을 하지 않도록 제어하면서 필요한 정보를 찾고 적절한 도구를 활용해 사용자 요청을 끝까지 수행하도록 지원하는 기술이다. AI 모델이 실제 서비스에서 제대로 일하도록 만드는 '일머리'라는 설명이다.

한승균 네이버 AI 검색 서비스 리더는 “네이버는 검색 서비스를 오랫동안 운영하면서 쌓아온 신뢰를 바탕으로 서비스 설계 단계부터 LLM의 대표적인 문제인 환각을 줄이기 위한 여러 안전장치를 구축했다”고 밝혔다.

AI탭에는 역할별 소형언어모델(SLM)을 조합하는 분업형 구조도 적용했다. 하나의 LLM이 모든 작업을 처리하는 대신 기능별로 특화한 SLM이 작업을 나눠 맡는다. 이를 통해 일부 구성 요소의 장비 운영 비용을 기존의 최고 3분의 1 수준으로 줄였고 응답 속도는 2배 이상 높였다.

네이버는 스마트렌즈를 중심으로 한 멀티모달 기술 고도화 전략도 공개했다. 지난달 AI탭을 정식 출시하면서 스마트렌즈를 AI탭 버튼 옆에 전면 배치했다. 스마트렌즈를 활용하면 상품을 스마트폰 카메라로 인식하고 구매까지 실행될 수 있다. 향후 사용자가 이미지를 한 번만 입력해도 탐색과 질의, 예약 등 실제 실행까지 이어지도록 지원한다.

윤상두 네이버 퓨처 AI 센터 리더는 “네이버가 지향하는 것은 사용자가 보고 있는 대상을 이해하고, 사용자의 의도를 더욱 정확하게 파악하며, 네이버의 다양한 서비스에 연결해 실제 행동까지 돕는 실행형 에이전트”라면서 “멀티모달 기술을 기반으로 실행형 에이전트 능력을 확장하겠다”고 강조했다.

네이버는 이들 기술을 기반으로 올해 하반기 AI탭 기능을 차례로 고도화한다. 이달 요약형 검색 서비스 'AI 브리핑'과 멀티모달 검색 서비스 '스마트렌즈'를 AI탭에 연동한다. 다음 달에는 네이버 부동산을 연결하고, 연내 건강 에이전트 기능을 구현한다.