[DAN 24] 네이버, '플레이스 AI 모델' 공개…내년 멀티모달 고도화

발행일 : 2024-11-12 17:00 업데이트 : 2024-11-12 16:53 지면 : 2024-11-13 10면

Photo Image — 양서윤 네이버 플레이스 AI팀 개발자가 12일 서울 강남구 코엑스에서 열린 '단 24(DAN 24)'에서 자체 개발한 '플레이스 특화 AI 모델'에 대해 설명하고 있다. 〈자료 네이버〉

네이버가 '플레이스 특화 인공지능(AI) 모델'로 내년 지도 서비스에서 메뉴판·리뷰 이미지 분석 기능을 도입한다.

네이버의 플레이스 AI팀은 12일 서울 강남구 코엑스에서 열린 '단 24(DAN 24)'에서 자체 개발한 '플레이스 특화 AI 모델'을 소개하면서 이 같이 밝혔다.

네이버는 범용 모델 대신 소형언어모델(sLLM), 멀티모달 등으로 구성된 플레이스 특화 AI 모델을 개발했다. 이 모델로 관심지정정보(POI) 정보를 업데이트하고 플레이스 등 로컬 서비스를 고도화하는데 활용하고 있다.

양서윤 네이버 플레이스 AI팀 개발자는 “거대언어모델들은 크기가 큰 만큼 처리 주기가 길고, 제약도 있다”면서 “sLLM과 멀티모달을 도입해 빠른 모델 업데이트가 가능하고 복잡한 태스크도 하나의 모델로 처리할 수 있다”고 말했다.

네이버는 이 모델을 활용해 내년 플레이스 상세페이지 내 사진탭을 개편한다. 현재는 '음식', '메뉴판' 같이 큰 범주 필터를 제공하지만 이를 메뉴명에 따라 '파스타', '스테이크' 등으로 구체화해 제공할 계획이다. LLM과 ViT(Vision Transformer) 기술을 결합해 플레이스 특화 이미지 분석 기술인 '플레이스 VLM(Vision Language Model)'도 고도화한다. 메뉴판이나 리뷰 이미지를 분석해 텍스트로 묘사하고 이미지 대표 특징 키워드를 추출하는 기술이다.

향후 플레이스 업체명 번역 기술도 고도화한다. 대부분 글로벌 지도 서비스는 유명 프랜차이즈에 한해 영어·한국어 번역을 제공한다. '분당점' 같은 지점 위치는 번역을 지원하지 않는다. 네이버는 지점 위치와 함께 도서관·식당 등 프랜차이즈가 아닌 장소도 번역을 제공할 계획이다.

네이버는 이 모델을 플레이스, 호텔 검색, 이미지 제공 등 다양한 서비스에 적용하고 있다.

'플레이스 방문자 리뷰 요약'은 이 모델을 활용한 대표 서비스다. 이 서비스는 플레이스에 쌓인 키워드·방문자 리뷰를 sLLM으로 분석해 메뉴·맛, 가격, 분위기 등에 대해 요약하고 정리해 보여준다.

이 모델을 활용해 호텔 검색 서비스도 고도화하고 있다. 이용자가 호텔에 대한 정보를 남길 때 호텔명을 현지어로 표현하는 경우가 많아 장소명을 매칭하는 작업이 필수다. 예컨대 '라 카사 디 아네우페'라고 쓰인 호텔명을 'La Casa di Aneupe'로 변환하는 식이다.

네이버는 플레이스 특화 AI 모델에 멀티모달 기술도 적용하고 있다. 이용자 의도에 맞는 고품질 이미지를 제공하기 위해서다. '단풍'을 검색했을 때 단풍잎 이미지를 보여준다면, '단풍 명소' 등을 검색했을 때는 전경 사진을 제시한다.

이주영 네이버 플레이스 AI팀 개발자는 “서비스 개선 사항을 반영하기 위해 하나의 모델로 운영하도록 이미지 검색 솔루션을 적용했다”고 설명했다.