[e테크]음성인식기술-말 한마디면 인터넷 `뚝딱`

정보기술(IT) 분야 첨단 기술의 산실인 IBM 토머스 웟슨 연구소에서 음성인식 기술개발에 주력하고 있는 리암 코머퍼드 박사는 평소에도 자신의 개인휴대단말기(PDA)인 팜III와 대화하는 것을 즐긴다.

 그는 이 단말기에 자신의 자질구레한 일들을 털어놓기도 하고, 거꾸로 이 기기가 자신의 하루일정을 환기시켜주는 것을 듣기도 한다. 지금까지 개발된 첨단 음성합성 및 음성인식 기술을 총동원해 제작된 그의 PDA(시제품)는 텍스트 문장을 읽는 것은 물론 주인의 말을 알아들을 수도 있다.

 그 동안 공상과학 영화에서나 볼 수 있었던 음성인식 기술개발이 최근 활발해지고 있다. 첨단 기술분야 시장조사회사 스탠퍼드리서치연구소(SRI)는 앞으로 음성인식 관련 기술이 이동통신 기기는 물론 TV·냉장고를 비롯한 가정용 전자제품과 로봇 등에도 접목하면 우리들이 살아가는 일상생활에 혁명적인 변화를 몰고 올 것으로 전망하고 있다.

 벌써 운전중에도 전화를 연결해주는 초보적인 음성인식 휴대폰은 상용화 단계에 들어섰고 최근에는 무인 콜 센터를 가능케 해주는 솔루션과 인터넷 자동 검색 프로그램들이 쏟아져 나오고 있다.

 약 500개 펀드를 운영하고 있는 세계 최대 뮤추얼 펀드(자산) 회사 피델리티인베스트먼트(http://www.fid-intl.com)의 콜 센터를 방문하면 말로만 듣던 음성인식 기술의 위력을 실감할 수 있다.

 전세계에 흩어져 있는 증권 및 투자회사 직원들이 수시로 전화를 걸어 주식시세와 펀드 수익률 등을 확인하는 이 회사 콜 센터는 언제나 장터를 연상케 했었다. 그러나 최근 이 회사가 음성인식 기술을 도입해 문의전화를 사람 대신 자동 응답기(컴퓨터)로 알려주기 시작하면서 콜 센터의 분위기도 180도 달라졌다.

 미국 캘리포니아에 있는 뉘앙스커뮤니케이션스(http://www.nuance.com)가 개발한 이 시스템은 주요 고객들의 목소리를 인식하기 때문에 고객들은 더 이상 복잡한 주식과 펀드의 코드번호 등을 외울 필요도 없다. 거래하고 싶은 회사의 이름만 말하면 주가와 거래량 등 필요한 정보를 정확하게 확인해 준다는 설명이다.

 또 IBM이 최근 내놓은 ‘말하는 웹브라우저(홈페이지 리더)’를 이용하면 앞을 못보는 장님들이 음성명령만으로 인터넷에 접속해 필요한 정보를 검색할 수 있다. IBM이 자체 개발한 음성인식 엔진인 비아보이스(ViaVoice)를 채택한 홈페이지 리더는 사용자의 음성명령을 이해하는 것은 물론 사용자와 대화하면서 인터넷을 검색한 후 그 내용을 큰 소리로 읽어주기도 한다는 설명이다.

 이처럼 오랫동안 실험실 속에 갇혀 있던 음성인식 기술이 상용화에 성공하면서 차세대 유망 사업으로 떠오르면서 마이크로소프트(MS)와 IBM 등 IT 거인들도 속속 관련기술 개발에 주력하고 있다.

 특히 MS 진영에는 네트워크의 대명사인 시스코시스템스를 비롯해 인텔(반도체), 필립스(전자) 등 다국적 기업과 컴버스(통합 메시징), 스피치웍스(음성인식) 등 기술력이 우수한 벤처기업들까지 끌어들여 ‘음성인식 응용언어(SALT) 개발을 위한 포럼’을 결성했다. 이들의 목표는 문자(텍스트)는 물론 동영상 정보도 정확하게 인식할 수 있는 기술을 개발하는 것.

 이러한 목표는 속속 실천에 옮겨지고 있다. 미국 전역이 아프간 공격과 탄저 균 파동 등으로 정신이 없던 지난 15일에도 미국 캘리포니아주 마운틴뷰에 있는 MS 본사 대회의실에서는 음성인식 기술개발의 이정표를 바꿔놓을 수 있는 중요한 회의가 열렸다.

 MS의 자연언어 인터페이스(내추럴 인터렉티브) 서비스를 담당하는 카이 푸 리 부사장을 시스코시스템스 음성기술센터의 앨리스테어 우드맨 이사, 인텔 통신 및 임베디드 그룹의 하워드 밥 부사장 등 미국 IT업계를 주무르는 숨은 실력자들이 대거 참석한 이날 ‘SALT 포럼’ 회의에서 회원사들은 사람의 자연언어를 이해하는 기술을 개발하기 위한 특허 공유(크로스 라이선스) 등 광범위한 협력방안을 논의했다.

 MS의 카이 푸 리 부사장은 이날 가진 기자 간담회에서 “음성인식 기술관련 세계 최강의 업체들이 손을 잡은 만큼 휴대폰과 PDA, TV에 버튼이 사라질 날도 멀지 않았다”고 주장했다.

 그는 “앞으로 2∼3년만 지나면 소비자들은 휴대폰은 물론 PDA, 유선전화, TV 등 다양한 단말기를 통해 언제 어느 때든 음성명령만으로 인터넷에 접속할 수 있게 될 것”이라고 덧붙였다.

 MS와 인텔은 또 이날 각각 윈도XP와 펜티엄4 칩에 음성인식 소프트웨어를 포함시킨다는 청사진도 내놓았다.

 컴퓨터 거인 IBM도 최근 음성인식 분야 기술개발에 총력을 기울이고 있다. 이 회사는 서버와 PC, 그리고 각종 핸드헬드 단말기에 응용할 수 있는 소프트웨어를 선보인 데 이어 지난주에는 음성인식 기술을 사용한 PDA용 칩(파워PC 405LP)의 자세한 기술내용을 공개한 바 있다.

 SRI는 “특히 세계에서 가장 많은 음성인식 과학자를 보유하고 있는 IBM이 음성인식 칩 기술을 공개한 것을 계기로 앞으로 음성인식 PDA 및 이를 응용하는 기술개발 경쟁이 본격화될 것”이라고 전망하고 있다.

 이에 따라 음성인식 관련 원천기술을 개발하고 있는 벤처기업의 몸값도 최근 천정부지로 치솟고 있다.

 이들 가운데 선두주자는 벨기에의 음성인식 회사 레나웃앤드호스피(L&H http://www.lhsl.com). 지난해 법원에 파산보호 신청을 냈지만 기술력만큼은 여전히 세계 최고 수준이라는 평가를 받고 있는 이 회사는 올해 안에 ‘PD세이(PDSay)’라는 PDA용 소프트웨어 출시를 계기로 화려한 재기를 노리고 있다.

 미국 보스턴에 있는 벤처기업 스피치웍스(http://www.speechworks.com)도 최근 PDA용 음성인식 시스템을 개발해 큰 관심을 끌고 있다. 이 시스템은 텍스트를 음성으로 변환할 수 있는 것은 물론 컴퓨터 파일을 열거나 홈페이지 주소 등을 읽는 데 사용하는 음성 명령어를 이해할 수 있다.

 또 매사추세츠주 워번에 있는 보이스시그널(http://www.voicesignal.com)도 최근 샌디에이고에서 열린 통신기술 전시회 데모모바일 2001에 엘비스라는 음성인식 시스템을 선보인 후 주가가 급등하고 있다. 엘비스는 음성합성 기능은 없지만 음성 명령어를 인식한 후 받아쓰는 업무에는 탁월한 성능을 보이고 있다. 시연회에서 보이스시그널의 직원은 전자우편(음성) 메시지 100단어를 눈깜짝할 사

이에 컴팩의 아이팩 PDA에 텍스트 문장으로 옮겨놓아 관람객들을 놀라게 했다.


브랜드 뉴스룸