173개국서 1000만명 이상 사용자 확보
집단지성 플랫폼으로 방대한 DB 학습
실시간으로 '산업 특화 번역' 차별화
e커머스·여행·숙박 등 활용도 높아

Photo Image
<이정수 플리토 대표>

지난해 '사업모델 특례상장 1호'로 국내 증시에 입성한 플리토가 네이버·카카오에 이어 자체 개발한 인공지능(AI) 번역 엔진을 상용화했다. 그동안 집단지성 번역 플랫폼을 통해 구축한 방대한 번역 데이터베이스(DB)를 기계학습 방식으로 학습시킨 것이 특징이다.

각 산업 분야 기업에 개방형 응용프로그램개발환경(API) 방식으로 맞춤형 번역 엔진을 공급하고, 전문 번역 요청에 비례해 일정한 수수료를 받는 수익 모델로 접근한다.

이정수 플리토 대표는 1일 “번역 AI 성능은 확보한 DB 양에 비례한다”면서 “플리토는 언어 데이터 수집과 분석에 강점이 가장 크다”고 말했다. 이 대표는 “집단지성 플랫폼으로 확보된 고품질 데이터로 모델을 학습시켰고, 객관적 지표로 따져도 상당히 높은 번역 성능을 보였다”고 부연했다.

국내 AI 번역 엔진은 네이버와 카카오가 자체 개발해 서비스하고 있다. 외부 소스로 번역 엔진을 돌리는 사업자가 있지만 플리토는 자체 확보한 데이터와 기술로 번역 엔진을 상용화했다.

플리토는 2012년 집단지성 번역 서비스를 일반에 개방, 이후 전문 번역 및 AI 번역으로까지 서비스를 확장했다. 25개 언어로 번역이 가능하며, 173개 국가에서 1000만여명의 사용자를 확보했다. 지금까지 누적 번역은 약 4800만건이다.

Photo Image
<국내 사업모델 특례상장 1호 업체 플리토가 네이버, 카카오에 이어 인공지능(AI) 기반 번역엔진 개발에 성공했다. 기존 크라우드 소싱 방식을 통해 확보한 번역 데이터로 학습시킨 모델이다. 1일 서울 강남구 플리토에서 개발자들이 AI 번역엔진 고도화 작업을 하고 있다. 박지호기자 jihopress@etnews.com>

플리토는 확보한 데이터에 강점이 있다고 자신한다. 번역 데이터를 확보하려면 다수의 번역자를 채용해 '원문-번역문' 문장쌍 데이터를 모으거나 시중에 나와 있는 번역물 저작권을 일일이 사들여야 한다. 비용이 비싼 데다 기계학습에 적용할 수 있는 고품질의 데이터 확보가 어렵다.

구글이나 네이버도 번역 데이터 확보 및 검증에 집단지성을 활용하고 있지만 보상 체계가 없어 크게 활성화되지 못했다. 반면에 플리토는 지난 10여년 동안 플랫폼을 운영하면서 번역자에게 보상을 지급, 번역 문장쌍에 대한 저작권을 구입했다. 참여자의 번역 이력과 능력치에 대한 자료를 확보하고 있기 때문에 번역 결과물에 대한 품질 평가에도 유리하다.

플리토는 이렇게 확보한 번역 데이터를 활용, 자체 번역 엔진 개발에 성공했다. 이 엔진은 현재 '라인'과 '카카오톡' 메신저 플랫폼에서 '예서'라는 코드명의 챗봇 서비스로 활용되고 있다. 예서는 성능 시연을 위해 개발된 플랫폼이기 때문에 기업간거래(B2B) 고객사에만 공개되고 있다.

플리토의 번역 엔진은 각 서비스 플랫폼에 무료로 적용할 수 있다. 다국어로 후기 정보가 작성되는 e커머스나 여행 및 숙박 중개 플랫폼에서 활용도가 높다. 신조어나 전문용어가 포함돼 기본 번역으로 내용 이해가 어렵다면 해당 문장에 대해 플리토 플랫폼에 번역을 요청할 수 있다. 플리토는 해당 고급 번역에 대해서만 비용을 청구하고, 번역된 데이터의 저작권은 클라이언트사가 가져간다.

다른 번역 엔진과의 차별점은 실시간 학습 가능이다. 번역 요청으로 업데이트된 데이터는 다시 학습을 통해 점차 해당 산업에 특성화된 번역 성능을 확보하게 된다. 같은 단어를 입력하더라도 문장에서 어떤 역할을 하느냐에 따라 의학 용어, 과학 용어로 다르게 번역해 내는 AI 독자 엔진을 구축할 수 있다는 의미다.

이 대표는 “플리토의 AI 번역 엔진은 '알파고'처럼 데이터 수정과 학습이 동시에 가능하다”면서 “집단지성 번역과 AI 번역을 잘 조합해 웹툰·웹소설, 온라인 커뮤니티에서도 언어 장벽을 해결할 수 있는 기술을 곧 선보일 예정”이라고 말했다.

이형두기자 dudu@etnews.com