한국전자통신연구원(ETRI)도 테크비즈코리아 2023에 참여해 기술사업화 유망 기술을 공개한다.
외국인과 소통하는 대면 상황에서, 별다른 조작없이 자연스럽게 실시간 통역이 이뤄지게 하는 '제로 UI 동시통역 기술'이 그 주인공이다.
통역 기술들은 기존에 적잖은 문제들이 있었다. 통역 실행을 위해 일일히 스마트폰 등 기기를 터치하는 과정에서 대화에 방해를 받았다.
음성인식 기반 기술의 경우도 인식 성능이나 응답속도 등의 한계가 있었다. 다양한 언어 지원도 쉽지 않았다.
ETRI 기술은 입술 움직임 영상, 음성신호를 동시에 이용해 발화자를 검출할 수 있다. 통역 과정의 이용자 개입이 필요 없다.
또 30개 이상 언어를 실시간 스트리밍 기반 종단형(End to End) 음성인식한다. 한국어를 비롯한 12개 언어(영어, 중국어, 일어, 동남아어 및 유럽어)간 자동 통역을 지원한다.
ETRI는 이 기술을 관광, 비즈니스, 군사, 교육, 외교 등 다양한 민간 산업 및 공공분야에서 활용해 언어의 벽을 허물 수 있다고 설명했다.
김영준 기자 kyj85@etnews.com