솔트룩스(대표 이경일)는 `스마트 모바일용 다국어 언어음성 데이터베이스(DB) 구축` 주관 사업자로 선정됐다고 7일 밝혔다.
스마트 모바일용 다국어 언어음성 DB 구축 사업은 미래창조과학부가 한국정보화진흥원을 통해 추진하는 국가 DB사업 중 하나다. 한국전자통신연구원(ETRI)이 주관으로 2017년까지 언어마다 구어체 5만~10만 대역문장, 대화체 음성 10만 발화 DB 구축이 목표다.
기존 한국어·영어·중국어·일본어·스페인어·프랑스어 외에 독일어·러시아어·이탈이아어·포르투갈어·영국영어·아랍어·베트남어·태국어 등 언어음성 DB를 구축한다. 언어음성 DB는 대학·연구소·기업 등 70개 기관에 공급해 언어음성 기술 연구, 통·번역 소프트웨어(SW) 기술 개발에 활용한다.
솔트룩스는 지난 30년간 한국을 대표하는 언어·지식처리 전문기업이다. 2004년부터 10여 년간 표준형 한국어 언어음성 DB, 다국어 언어음성 DB 등과 같은 대규모 표준형 언어음성 DB를 구축했다. 솔트룩스 컨소시엄이 진행하는 이번 사업은 △독일어·러시아어·아랍어·베트남어 발성 후보 목록 각 12만 문장 △언어별 한국어 대역쌍 각 5만 문장과 9만 발화 △여행·일상·비즈니스 생활회화 영역 구어체 언어 및 음성 DB 구축 등이 핵심이다.
해당 언어는 독일·러시아·이집트·베트남 등 국가별 주요 도시에서 현지 구축한다. 구축자 1명당 최대 150문장을 발성하고 총 600명분 음성 DB를 구축한다. 언어음성 DB는 해당 언어의 원어민 품질검사와 솔트룩스 솔루션을 활용해 검증한다. DB 유효성과 활용성을 위해 한국정보화진흥원 `데이터베이스 구축 방법론 V4.0`을 준수해 진행한다.
신석환 솔트룩스 부사장은 “국내에서 연구된 적 없는 러시아어·아랍어 등 언어 DB를 구축하는데 큰 책임감을 가지고 본 사업에 임할 것”이라며 “솔트룩스 컨소시엄은 2018년 평창동계올림픽에서 우리나라 음성인식 및 통·번역 기술력으로 세계인 모두가 소통할 수 있도록 최선을 다할 것”이라고 말했다.
권동준기자 djkwon@etnews.com