“아직까지 사람이 번역하는 품질보다 못하지만 수능 영어 문제를 풀 수 있을 정도까지는 왔습니다.”
올해 수능 영어 문제 지문을 입력하니 1초 만에 한글로 번역된다. 시연자는 해석하지 않고도 답이 4번이라는 사실을 손쉽게 파악한다.
구글코리아는 29일 서울 역삼동 본사에서 열린 `AI 혁신의 시대:구글 포토와 구글 번역` 기자간담회를 열고 구글 대표 인공지능(AI) 적용 제품 `구글 번역` `구글 포토` 기능 혁신과 신제품 `구글 포토스캐너`를 소개했다.
구글 번역 기능이 수능 문제를 풀 정도로 강화된 것은 최근 인공신경망 기술을 적용했기 때문이다. `구글 신경망 기계번역(GNMT)` 기술은 인간 언어 구사 방식과 유사하게 전체 문장을 하나의 번역 단위로 간주해 한 번에 번역한다. 기존에 문장 내 구문 단위(PBMT)로 쪼개서 번역하던 수준에서 진화했다.
버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 “신경망 번역 방식 도입으로 10년간 모든 업데이트를 합친 것보다 더 큰 도약을 이뤘다”면서 “번역 오류가 55~85%가량 줄고 자연스럽고 부드러운 해석이 가능해졌다”고 강조했다.
유사한 여러 언어를 함께 학습시킨 다중언어학습 방식도 기능 개선에 기여했다. 한국어는 유사성이 높은 일본어, 터키어와 같은 모델로 학습했다. 각 언어에서 학습된 내용을 서로 공유하는 `학습이전`으로 더 많은 데이터를 확보했다. 제작 환경을 크게 단순화했다. 각각 모델을 구축할 경우 구글 번역이 서비스하는 103개 언어를 위해 1만개 이상 새로운 모델을 만들어야 한다. 버락 총괄은 “다중언어학습으로 인터넷에 잘 사용되지 않거나 공개되지 않은 언어마저도 학습이 가능하다”면서 “언어를 추가할 때마다 전혀 추가 자원이 필요하지 않게 됐다”라고 말했다.
맞춤형 하드웨어도 기능 개선에 일조했다. 구글 자체 개발한 전용 프로세서 칩을 도입해 다른 하드웨어보다 3~8배 빨리 구동된다. 기존 신경망 번역의 가장 큰 단점인 오랜 번역 시간문제를 해결했다.
아직까지 한계도 존재한다. 직업에 따라 남성이나 여성으로 상정해 번역하는 문제가 지적됐다. 유치원교사는 여성, 소방관은 남성 등으로 지정하다는 것이다. 기계학습 방식을 이용하다보니 인터넷에 올라온 인간이 미리 번역한 콘텐츠를 스스로 긁어와 학습한다. 학습하는 데이터, 알고리즘 등에 따라 문맥 이해나 성별 이해가 완벽치 않다. 이날 구글 본사와 화상 기자간담회 통역도 `아직` 인간 통역사가 맡았다.
구글 포토와 이를 지원하는 구글 포토스캐너 앱을 소개했다. 구글포토는 2억명 월사용자를 보유한 클라우드 기반 사진 관리 서비스다. 기계학습과 AI 기술을 활용해 태그 없이도 날짜, 장소, 테마 등 다양한 분류와 검색이 가능하다.
구글 포토스캐너는 아날로그(종이) 사진을 고품질 디지털 이미지로 스캔해 관리하는 앱이다. 구글 이미지 검색 결과와 인터넷 이미지를 스스로 학습시켰다. 인간의 뇌처럼 네 지점을 찍은 사진을 합성해 스캔하는 사진 반사광을 제거했다. 사진 가장자리를 감지하고 이미지를 올바른 방향으로 회전시킨다. 구글 포토와도 연동돼 사진 검색·공유 등 똑똑한 사진 관리를 하도록 돕는다. 오랜 스캔시간, 저품질 등 기존 스캐너 문제를 해결했다.
제임스 갤러거 구글 포토 소프트웨어 엔지니어링 디렉터는 “구글 포토는 AI 기술을 활용, 정교화된 검색과 자동 분류 기능을 제공 한다”면서 ”구글 포토와 포토스캐너를 이용해 이용자가 사진을 간편하게 보관, 검색, 관리할 것”이라고 말했다.
오대석기자 ods@etnews.com