ETRI, 4개국 신규 언어음성DB 56만건 배포

Photo Image
이영직 ETRI 책임연구원이 독일·러시아·아랍·베트남4개국어 언어음성DB가 들어있는 DVD를 들어 보이고 있다.

한국전자통신연구원(ETRI)은 4개국 신규 언어음성DB 56만 문장을 구축, 배포한다고 30일 밝혔다.

이 음성DB는 독일어·러시아어·아랍어·베트남어 대화체 음성DB 36만 문장과 한국어-독일어·한국어-러시아어·한국어-아랍어·한국어-베트남어 대화체 대역문장DB 20만 문장 등 8종이다.

음성인식 및 언어번역 분야 SW 개발이나 음성언어처리 연구용 기초데이터로 사용할 수 있다.

여행이나 관광, 어학 분야에 활용된다. 음성리모컨 제조업체, 외국어 교육업체, 자동통번역 서비스업체, 자동차 및 내비게이션 제조업체, 포털 등이 이용할 것으로 예측했다.

그동안 태블릿PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야에서 음성DB가 활용돼 왔다.

이 DB 배포는 미래창조과학부와 한국정보화진흥원(NIA)이 추진하는 `스마트 모바일용 다국어 언어음성DB 구축사업` 일환으로 진행됐다.

ETRI 측은 이번에 배포하는 8종 DB를 국내 10개 기관에 배포하면 최소 120억원 수입대체 효과를 얻을 수 있을 것으로 예측했다.

ETRI는 현재까지 국내 57개 기관에 247개 DB를 배포했다. 이를 비용으로 환산하면 430억원에 이른다. 삼성전자, LG전자, KT, 네이버, 카카오, 보이스웨어, 쓰리소프트, 인피니티텔레콤, 디오텍, 시리우스소프트, 시스트란 인터내셔널, 솔트룩스 등이 이 음성DB를 받아갔다.

Photo Image
이영직 ETRI 책임연구원이 언어음성DB 중 아랍어 문장을 검토하고 있다.

ETRI는 그동안 한국어, 영어, 일본어, 중국어를 비롯한 프랑스어, 독일어, 러시아어, 아랍어, 베트남어 음성DB를 구축했다. 현재 배포 중인 DB목록은 총 37개 자료다. 음성 2300시간, 텍스트는 A4 기준 2만8000면이다.

이영직 ETRI 자동통역연구실 책임연구원은 “국가DB 사업에서 요구하는 고품질이고 국가지정 감리업체로부터 품질 합격통지도 받았다”며 “업계 신규시장 창출 및 국제경쟁력 강화에 기여할 것”이라고 말했다.

대전=박희범 과학기술 전문기자 hbpark@etnews.com