MS "사람 수준 획기적 음성인식 시스템 개발"

Photo Image
MS 연구원들이 사람 수준 새로운 음성인식시스템을 개발했다.

컴퓨터 등 기계가 사람과 비슷한 수준으로 음성을 인식할 수 있는 기술을 마이크로소프트(MS)가 개발했다고 외신이 보도했다. 새 음성인식기술에 대해 마이크로소프트는 “이 분야 역사적인 진보”라고 강조했다.

외신에 따르면 마이크로소프트는 음성 언어를 문서로 전환할 때 단어 오류율(WER:Word Error Rate)이 5.9%에 불과한 새 음성인식시스템을 개발했다고 17일(현지시간) 밝혔다. 이는 전문 속기사가 직접 대화 내용을 기록했을 경우 오류율과 비슷한 수준이다.

해리 셤(Harry Shum) 마이크로소프트 인텔리전스&리서치 그룹 부사장은 “한 달 전 만해도 오류율이 6.3%였는데 한 달 만에 이를 크게 줄였다”면서 “사람과 비슷한 수준의 음성인식 수준”이라고 밝혔다.

그는 “연구를 시작한 5년 전 만하더라도 이 같은 성과를 거둘지 예상하지 못했다”며 “생각한 것보다 이른 시일에 역사적 성취를 달성했다”고 덧붙였다. 마이크로소프트는 이 음성인식 기술을 윈도와 음성비서 `코타나` 등에 활용할 계획이다. 셤 부사장은 “새로 개발한 기술은 `코타나`를 더 파워풀하게 해주는 한편 진정한 지능형 디지털 비서로 만들어 줄 것”이라며 “다음 단계는 인식(recognition)에서 이해(understanding)로 넘어가는 것”이라고 말했다.

음성인식 기술 개발은 1970년대 미 국방부 산하 첨단기술연구소인 `다파(DARPA:Defence Advanced Research Projects Agencey)`에서 시작됐고, 컴퓨터업계가 이를 발전시켰다. 사람 말을 바로 알아들을 수 있는 컴퓨터나 기계 개발이 목표다.


방은주기자 ejbang@etnews.com


브랜드 뉴스룸