인공지능(AI) 음성인식·기계번역 전문기업인 엘솔루(옛 시스트란인터내셔널)가 구어체 방송 콘텐츠 제작을 위한 자막·편집 기술을 개발해 국내 OTT(Over The Top) 서비스의 해외 진출 물꼬를 튼다.
국내 OTT 서비스 사업자는 콘텐츠 특성상 음성인식을 통한 실시간 번역과 자막 생성에 어려움을 겪는 등 한글과 외국어 간 언어 장벽에 막혀 글로벌 OTT 서비스 시장에 진출하는 데 한계를 안고 있다.
엘솔루(대표 김우균)는 과학기술정보통신부의 방송통신산업기술개발 사업 주관기관에 선정, 협약을 체결했다고 11일 밝혔다. 이번 사업은 국내 OTT 산업 육성 발전 지원을 위한 구어체 방송 콘텐츠에 특화된 AI 기반 음성인식 기술과 기계번역 기술을 고도화해 클라우드 기반으로 자막 제작·편집이 가능한 툴을 개발하는 것이다.
이 사업은 정부 36억원·민간 10억6000만원 등 총 46억6000만원억을 투자해 오는 2024년 12월 31일까지 총 4년에 걸쳐 연구개발을 진행한다. 주관기관 엘솔루 이외 SBS콘텐츠허브, CBS, 온더아이티, 고려대학교, 한양대학교 등이 연구개발에 공동 참여한다.
회사는 이번 국책 과제를 통해 고난이도의 AI 기반 음성인식 기술을 선보인다. 현재 드라마나 예능프로그램에서 기존 음성인식 기술은 음악소리 등 주변 잡음과 여러 사람의 이야기 중 주인공의 이야기를 구분하기 힘든 문제점을 내포하고 있다.
엘솔루는 또 주어 생략, 불완전문장 처리 등 자연어처리 분야에서 고난이도 AI 기계번역 기술 을 개발함으로써 정확한 자동번역이 가능하도록 할 계획이다.
회사는 이를 위해 방송 콘텐츠 특성에 특화된 AI 기반 음성인식 기술과 구어체 표현(문맥인식 기반)에 특화된 구어체인식신경기계번역(CANMT, Colloquial Aware Neural Machine Translation) 모델을 선보인다.
또 국내 OTT 미디어 제작·개발자들이 직접 사용하고 개선하는 도메인 맞춤형 번역(Domain Specialized NMT) 모델을 자동 생성하고 서비스형AI(AIaaS) 기술을 위한 클라우드 플랫폼 서비스(자막번역 편집 전용 CAT 툴) 기술을 개발한다.
김우균 엘솔루 대표는 “구어체 방송 콘텐츠에 특화된 음성인식·기계번역 기술 개발 사업은 국내외 AI 기술의 한계를 한 단계 극복하는 등 고도 기술을 요구하는 연구개발 프로젝트가 될 것”이라고 말했다.
그는 “이번 연구개발 사업을 통해 기존 구어체 방송 콘텐츠의 자막번역의 한계를 극복해 K-콘텐츠의 우수성을 전 세계에 널리 알리고 다양한 음성기반 번역서비스 사업에 폭넓게 용용될 것”으로 기대했다.
안수민기자 smahn@etnews.com