[PC세계] 음성인식 프로그램 개발 러시

멀티미디어시대에 「말을 하는 PC」는 흔하다. PC에 소리를 불어 넣는 일은 이제 아주 쉬워졌기 때문이다. 왠만한 PC는 사운드카드와 스피커가 내장되어 있다. MP3 파일을 PC 하드드스크에 옮겨 놓는 일도 클릭 한 번에 끝난다. 통신에선 곡당 30원만 내면 되고 인터넷에 가면 공짜 소리파일과 미디파일이 넘친다. TTS를 지원하는 쉐어웨어만 찾아 내면 컴퓨터에게 책을 읽힐 수도 있다.

TTS(Text to Speech)란 텍스트를 소리로 바꿔 주는 음성합성기술. 예를 들어 방금 작성한 E-메일이나 워드 프로세서로 입력한 문장, 웹 브라우저가 화면에 보여주는 HTML문서를 조금 딱딱하긴 하지만 기계음으로 들어볼 수 있게 해준다. 인터넷에서 쉽게 구할 수 있는 거원시스템의 제트토크(JetTalk)가 바로 PC에 입을 붙여주는 TTS 프로그램.

요즘엔 PC에 귀를 달아주는 일도 어렵지 않게 됐다.

컴퓨터가 말을 하는 대신 거꾸로 사람의 음성을 알아듣도록 하는 것. 컴퓨터의 두뇌가 CPU라면 귀의 역할을 하는 것은 키보드나 마우스. 이런 입력장치 없이 PC가 사람의 말을 이해하려면 음성인식 기술을 구현한 소프트웨어가 필요하다.

알고보면 PC가 보급률이 높아진 80년대 이후 음성인식 기술을 선보인 제품은 많았다. 국내 유저들이 기억할 만한 최초의 제품은 94년 등장한 「보이스 어시스트(Voice Assist)」. 사운드카드의 대명사격인 사운드 블러스터(크리에이티브 랩스사)에 번들로 제공됐던 이 소프트웨어는 아이콘을 누르는 대신 음성명령으로 윈도 3.1의 다양한 창을 열 수 있도록 고안되었다. 전문용어로 「커맨드 앤 컨트롤(Command & Control)」을 구현했기 때문.

커맨드 앤 컨트롤이란 사용자가 마이크를 통해 미리 저장해 놓은 명령어를 들려줌으로써 PC를 제어하는 기능이다. 두인전자도 몇 년 전 「보이스 액세스」라는 음성명령 프로그램을 개발해 대기업 PC에 번들로 공급한 적이 있다.

이런 프로그램을 이용하면 툴 바에 등록된 애플리케이션을 실행시키고, 파일열기와 저장하기 같은 키보드 조작을 대신하고, 북마크 해둔 인터넷 사이트로 이동하는 것이 모두 음성명령으로 가능하다. 외국제품이라면 「체크 이 메일(Check E-mail)」, 우리나라 프로그램의 경우엔 「우편함 열기」라고 말하면 된다. 컴퓨터를 핸즈 프리로 사용할 수 있게 되는 셈이다.

요즘엔 윈도95/98 및 NT4.0용, 파워포인트용, 인터넷 브라우징용 등 용도별로 커맨드 앤 컨트롤 제품이 세분화 되어 소매상에서 팔리고 있다. 보이시스(VoiSys)사의 「보이스 파워(Voice Power)」 시리즈와 커맨드(Command) 사의 「인큐브(InCube)」 등이 미국에서 가장 인기있는 상품들로 가격은 대략 50-60달러 선. 인터넷에서 시험판을 다운로드 받아 사용해 볼 수도 있다.

아예 PC 운영체제 상에서 음성인식을 구현한 것은 지난 90년 매킨토시가 선보인 「플레인 토크(Plain Talk)」가 처음이었다. 지난해 발표된 IBM의 OS/2 Warp 4.0 시연회는 놀라운 음성인식률로 한때 국내외 언론의 시선을 집중적으로 받기도 했다.

그런가 하면 PC에 적용할 수 있는 음성인식기술의 최고봉은 단연 「딕테이션(Dictation)」. 컴퓨터에게 받아쓰기를 시킬 수 있는 기술이다. 미국에서는 드래곤시스템즈사의 「내추럴리 스피킹(Naturally Speaking)」, IBM의 비아보이스(ViaVoice) 시리즈 등이 최고의 인식률을 자랑하는 딕테이션 프로그램들. 그러나 1시간 가량 사용자의 목소리에 익숙하도록 연습이 필요하고 긴 문장을 읽었을 때 오타가 많아 아직 대중화에는 시간이 필요한 것으로 지적된다. 국내의 경우 거원시스템 등 소프트웨어 벤처업체와 정부 산하기관, 기업체 부설 연구소에서 2∼3년내 상품화를 목표로 프로그램을 개발 중이다. 기술 격차가 심하다기 보다는 언어학적으로 한글이 영어보다 음성인식 기술 구현이 어렵기 때문.

앞으로 음성명령(Command and Control) 제품군이 더욱 늘어나고 한글 딕테이션 기능으로 무장된 음성인식 프로그램이 등장한다면 컴퓨터에 귀를 달아주는 일은 밥먹는 일보다 쉬울 것으로 보인다.

<이선기 기자>


브랜드 뉴스룸