음성인식 기술이 ‘낮은 인식률’이라는 한계에도 불구하고 다양한 분야에서 응용되기 시작했다. 이는 음성인식 기술이 비록 음성의 내용을 100% 정확히 인식하지는 못하더라도 어느 정도의 골격을 파악해 주는 데에는 무리가 없기 때문이다.
뉴욕타임스에 따르면 음성우편을 일반적인 전자우편 형태로 바꾸어주고 검색할 수 있도록 해주는 ‘스캔메일’, 인터넷의 오디오 콘텐츠를 검색해주는 ‘스피치봇’ 등 음성인식 응용 기술이 속속 등장하고 있으며 다양한 분야로의 응용이 시도되고 있다.
AT&T연구소가 개발한 스캔메일은 음성우편을 키워드, 발신자의 이름이나 전화번호 등으로 검색할 수 있도록 문자 형태로 변환해 주는 시스템이다. 사용자는 자신의 PC나 PDA 등에 오디오 파일 형태로 받은 우편을 허브를 통해 스캔메일의 자동화된 음성인식 서버로 보내 문자화한 후 이를 다시 전자우편 메시지로 돌려받을 수 있다. 또 정보의 추출과 복구를 처리하는 서버에 특정 콘텐츠의 검색을 요청할 수도 있다.
이 시스템은 종종 사무실을 떠나 외부 미팅에 참여해야만 하는 경영자나 마케팅 전문가에게 유용할 전망이다. 이들은 틈틈이 사무실에 전화를 걸어 긴급한 메시지가 있는지 확인해야 하기 때문이다.
물론 이 시스템은 음성의 악센트, 속도, 정확성 등에 의해 상당한 오류가 발생할 수도 있다.
이에 대해 음성인식 부분의 개발을 담당했던 AT&T의 마이클 바치아니 박사는 “시스템의 에러율이 27%로 무시 못할 수준이지만 그 정도면 음성우편의 콘텐츠를 탐색하고 브라우징하기에는 충분하다”고 주장했다.
컴팩 케임브리지 연구소가 개발한 스피치봇은 웹상의 오디오파일을 다운로드해 이를 문자로 바꾸어준다. 컴팩연구소는 이미 스피치봇과 90대의 컴퓨터로 구성된 네트워크를 이용해 주로 언론사의 오디오 콘텐츠를 중심으로 1만4000시간 분량의 콘텐츠를 문자화시켰다.
스피치봇 역시 오디오의 품질에 따라 어느 정도의 에러를 감수해야 한다.
이에 대해 개발자 중 하나인 페드로 모레노 박사는 “스피치봇은 비교적 높은 에러율에도 사용자가 원하는 특정 오디오 콘텐츠의 위치를 찾아줄 수 있다”고 설명했다.
스피치봇은 인터넷(speechbot.research.compaq.com)에서 무료로 시험해 볼 수 있다.
음성인식 기술은 첩보 수집에도 응용될 것으로 전망된다. 음성인식 기술을 이용하면 전세계의 수많은 라디오·TV 방송의 콘텐츠를 손쉽게 분석할 수 있기 때문이다. 모레노 박사는 “음성인식 기반 탐색 기술은 (첩보당국) 분석가들의 시간을 절약해줄 것”이라고 설명했다.
그러나 음성인식 기술은 당분간 특정한 분야를 중심으로 응용이 늘어나겠지만 보편화에는 상당한 시간이 필요할 것으로 예상된다.
BBN테크놀로지스의 음성·언어처리 연구원인 존 마크호울은 음성인식 기술이 폭넓게 응용되려면 보다 정확도가 높아져야 한다고 전망했다. 일례로 가정용 음성인식 시스템은 주로 정형화되고 문어체로 이뤄진 콘텐츠를 다루는 비즈니스용보다 정교한 능력을 갖춰야 한다는 것이다.
<황도연기자 dyhwang@etnews.co.kr>
국제 많이 본 뉴스
-
1
주름 거의 안 보인다?… 폴더블 아이폰 '역대급 완성도' 예고
-
2
“실적 사상최대인데 주가는 폭락”… 엔비디아 쇼크에 나스닥 1%대 급락
-
3
속보이스라엘, 이란 정조준 선제공격…테헤란서 '폭발음' 울렸다
-
4
속보이란, 카타르·쿠웨이트·UAE·바레인 미군기지 공습
-
5
속보미국 당국자 “미국, 대이란 타격 진행중”〈로이터〉
-
6
美·이스라엘 “이란 전역에 4일간 고강도 타격 지속”...중동 확전 긴장 최고조
-
7
美·이스라엘, 이란 공격… 트럼프 “중대한 전투 개시”
-
8
두바이 7성급 호텔 '부르즈 알아랍' 화재…이란 드론 파편과 충돌
-
9
트럼프, 모든 연방기관에 앤트로픽 기술 사용 중단 지시… '위험기업' 지정도
-
10
AI에 가상전쟁 맡겼더니…95%가 핵무기 버튼 눌렀다
브랜드 뉴스룸
×


















