소형단말기에서 음성인식기술을 구현할 수 있는 분산음성인식기술(DSR:Distributed Speech Recognition)이 주목받고 있다.
그동안 인터넷·PC·홈오토메이션 등 다양한 분야에 음성기술이 접목되고 있음에도 불구하고 휴대폰이나 PDA와 같은 휴대형 통신기기에서는 CPU 용량의 한계로 음성인식기술의 구현에 어려움을 겪어왔다.
컴퓨터와 무선 네트워크 통신을 이용해 이같은 PDA와 휴대폰 등 단말기가 가지는 한계성을 극복하고 음성인식 기능을 구현할 수 있는 기술이 바로 DSR다.
분산음성인식은 음성인식을 위한 다단계 프로세스 중 일부는 모바일 컴퓨터 장치에서 하고 나머지 작업은 컴퓨팅 파워가 좋은 서버에서 수행한 다음 그 결과를 다시 모바일 컴퓨터가 받아 사용자에게 결과를 전달하는 일련의 작업이다. 따라서 사용자는 컴퓨터가 음성인식을 위해 어떤 작업을 수행하는지를 알 필요가 없으며 모바일 단말기에서 모든 작업이 이뤄지는 듯이 음성이 인식된 결과를 받아보게 된다.
단말기에서 음성인식을 위해 앞단계에서 실행해야 하는 음성특징추출을 수행하는 것은 상당히 작은 컴퓨팅 파워만으로 가능하다. 또한 이 음성특징에 대한 데이터 스트림은 PCM이나 웨이브 등과 같은 오디오 파일보다는 훨씬 작은 크기다. 일반적인 음성 샘플은 11㎑에 8∼16비트 폭을 가진다. 여기에 음성특징의 데이터 스트림을 압축하면 기본 16비트 11㎑ 샘플 오디오의 35분의 1 크기가 되는 것이다. 음성 특징의 데이터 스트림을 추출하는 과정을 수행한 이후 그 데이터 스트림을 압축하는 것까지만 PDA에서 수행하고 나머지 부분은 압축된 음성특징의 데이터 스트림을 무선 네트워크를 통해 서버나 성능이 더 좋은 컴퓨터로 전송해서 실행한다. 따라서 인식의 정확성도 높아지고 PDA와 휴대폰의 활용성도 좋아지게 되는 이점이 실현되는 것이다.
현재 DSR의 가장 큰 시장인 휴대폰 부문에서 퀄컴사는 자사가 공급하는 칩에 분산음성인식모듈을 탑재하고 이를 표준화하는 작업을 추진하고 있으며 음성업체들은 이에 발맞춰 서버 부문의 음성인식시스템 개발을 서두르고 있다.
국내 DSR시장은 시작단계지만 텔레매틱스사업이 본격화될 경우 DSR 관련 초기시장만 100억원을 상회할 전망이다. 이에 따라 기술을 확보하기 위한 업계의 움직임도 분주해지고 있다.
보이스웨어는 지난해초부터 무선통신전문업체인 와이더댄사와 공동으로 DSR를 구현하는 솔루션 개발에 착수, 현재 데모 솔루션 개발을 완료한 상태다. 또 SL2는 지난해말부터 PDA를 중심으로 한 DSR개발 전담팀을 구성하고 PDA에서 전자차트를 실행할 수 있는 기술개발에 착수했다. SL2는 올해 상반기에 상용화할 수 있는 제품을 선보인다는 계획이다.
스피치웍스코리아는 이미 지난해 3월 DSR를 이용한 휴대통신장비 초기제품을 개발했으며 이를 바탕으로 현재 휴대폰 단말기 제조업체들을 대상으로 제안작업을 벌이고 있다.
<윤대원기자 yun1972@etnews.co.kr>
관련 통계자료 다운로드 분산음성인식기술 개념도