음성인식 기술은 지난 몇년간 IT시장에서 중요한 기술 가운데 하나로 평가받아왔다. 한때 음성인식 기술은 정체에 부딪히기도 했지만 개발자들의 부단한 노력으로 관련 시스템의 상용화는 진일보했다. 그럼에도 불구하고 정확하게 말하자면 목소리의 종류, 즉 말하는 사람에 구애받지 않고 수많은 단어를 정확하게 이해하는 시스템은 아직 개발되지 않았다. 음성인식 시스템은 여전히 일반적인 회화나 법적·의학적 용어, 금융·항공분야에서 사용되는 단어에 익숙하지 않기 때문이다.
최근 들어서는 자연어처리가 가능한 고성능 시스템이 선보이고 있다. 실제 자연어 이해와 같은 기술적 문제들은 인터페이스 활용에 달려 있다. 나아가 음성인식 시스템은 전화·컴퓨터·휴대단말기·대화형 음성응답 시스템·문자입력 시스템 등 다양한 사용제품 및 서비스 전면에 나서고 있다.
관계자들은 결국 음성기술이 시장에서 얼마만큼 받아들여지는지 여부는 시스템의 유용성에 달려 있다고 본다. 시스템 공급업체들은 음성인식을 제품의 주요 기능으로 받아들였지만 적용에 어려움을 겪었다. 그러나 최근들어 음성인식은 자동화 시스템에서 보편화된 기능이 돼버렸다. 음성인식 기술이 컴퓨터 기술의 첨단여부를 판단하는 가장 중요한 기능 가운데 하나로 자리잡게 된 것이다.
상황이 이렇게 전개되자 시스템 공급업체들은 음성인식 인터페이스를 보다 폭넓게 받아들이기 위해 어떻게 하면 이 기능을 일반적인 시스템과 통합시킬 수 있을 것인가 하는 문제를 검토하기 시작했다. 이에 따라 유용성 시험을 비롯해 상식, 심지어 인류학적 접근방법 등 사회과학적 연구틀이 고려됐다.
소비자 측면에서 볼 때 결국 음성인식기기의 기능은 시장의 선택에 달려 있다. 인간이 교류하는 가장 일반적인 방법은 음성이다. 따라서 사람들은 음성을 통한 휴먼머신인터페이스(HMI)간 통신품질이 인간 대 인간의 교류와 비슷한 수준에 도달하기를 희망한다. 더욱이 일부 업체들이 음성입력을 제품에 잘못 적용하면서 일부 음성관련 제품은 시장에서 거부되기도 했다. 만약 업체들이 소비자들을 현재의 기술방향대로 끌고가고자 한다면 과거와 같은 전철을 밟지 말란 법도 없다.
◆각국의 음성인식 기술개발 현황
◇미국=미국에서 음성인식 기술과 관련한 연구·개발(R&D)은 대부분 국방부에서 비롯됐다. 많은 음성인식 프로그램들이 사안의 민감성으로 인해 민간에서는 논의되지 않은 반면 국방과 관련한 음성인식 프로젝트들은 다수가 개방적으로 논의됐다. 미 공군과 방위고등연구계획국(DARPA)의 주도아래 수억달러가 음성인식 프로젝트에 할당됐다. 미 육군과 항공우주국(NASA)이 뒤를 따랐다. 미국 국방부문의 경우 음성인식 기술은 R&D단계에서 시제품이 선보이는 단계로 옮겨가고 있다.
미 공군은 음성인식과 관련한 프로젝트에 2500만달러를 투자한 것으로 알려졌다. 이들 프로젝트는 항공기 조종실이나 지능형 시스템 등 항공공학과 관련있다.
DARPA는 대학 및 업계 연구소와 공동으로 ‘전략컴퓨팅 음성프로그램’을 연구중이다. 여기에서는 첨단 음성기술과 관련한 연구가 수행된다. 프로그램의 목표는 1만단어를 인식할 수 있는 음성인식 기술을 기반으로 이해도 높은 시스템을 개발하는 것이다. 결과, 음향학적 데이터베이스에 접근 가능하면서 항공기 등 소음환경 속에서도 사용할 수 있는 고기능 음성인식 시스템을 개발할 수 있었다.
DARPA는 또 NIST에 기금을 제공해 음성인식 기능을 극대화한 제품을 개발하도록 하고 있다. 연구자들은 최근 음성인식 시스템의 표준화에 있어 장족의 발전을 이루고 있다고 말한다. 표준을 사용함으로써 개발자들은 유사 시스템간 비교와 측정이 가능해진다.
◇유럽=유럽 각국 역시 EU를 중심으로 음성인식 기술에 대한 노력을 아끼지 않고 있다. EU는 IT분야에서 ‘연구개발 전략 프로그램(ESPRIT)’을 진행시켰다. 목적은 유럽 IT업계의 개발을 고무시켜 협력을 가속화하자는 것.
ESPRIT의 장점은 학계와 산업계의 경험을 통합할 수 있다는 데 있다. ESPRIT는 지난 84년 시작돼 98년 4단계가 막을 내렸다. ESPRIT에서는 IVORY·OVID·AUDIS·EUTRANS·MELISSA 등 수많은 음성관련 연구가 진행됐다.
IVORY(Integrated Voice Recognition System)는 비디오게임용 음성인식 및 음성처리 하드웨어 소프트웨어의 개발과 시험을 목표로 하고 있다. 또 PC기반 게임과 아케이드 게임기반 아키텍처 등 2개의 비디오게임 시험프로그램을 운용중이다. 이 가운데 비디오게임 부문은 명령어와 단어가 많지 않다는 점에서 음성인식기술의 활용도가 높다.
OVID는 전화나 직접 금융거래 등 금융부문에서 음성처리 소프트웨어의 유용성을 높이는 것을 목표로 한다. 이 프로젝트는 음성처리기술을 사용하는 유럽 자동전화 시험 뱅킹 애플리케이션용 및 국제 뱅킹 협력업체나 기술제공업체를 한데 묶어준다.
AUDIS는 3차원 듣기 애플리케이션용 다중목적의 음성 디스플레이 개발을 추진하고 있다. 보다 융통성 높은 HMI의 개발을 목적으로 한다. 또 통신채널에 지능성을 부가해 사용자의 편의성을 증대시키는 데도 있다.
EUTRANS(Example-based Understanding and Translation System)는 비록 문자·음성인식으로 제한되지만 실제 사례를 기반으로 한 기술들의 활용을 통해 기계번역 및 언어이해 시스템을 개발하는 것을 목표로 한다. 이 프로젝트는 기본적인 이해기반 방법에 비해 개발비용이 적다는 장점이 있다.
MELISSA(Method and Tool for Natural Language Interfacing to Standard Software Applications)는 엔드유저들이 컴퓨터 애플리케이션 시스템에서 자연어를 사용하는 기술을 개발해 툴을 제공한다.
이밖에 영국이 ESPRIT의 참여를 통해 정부후원의 제5세대 컴퓨터 프로젝트인 ‘앨비(Alvey)’프로그램을 완료했다. 이 프로젝트는 초거대규모 통합, 소프트웨어 엔지니어링, 휴먼머신인터페이스, 지능형 이해기반 시스템 등 4개의 주요 분야로 나뉜다.
많이 본 뉴스
-
1
기계연, '생산성 6.5배' 늘리는 600㎜ 대면적 반도체 패키징 기술 실용화
-
2
네이버멤버십 플러스 가입자, 넷플릭스 무료로 본다
-
3
KT 28일 인사·조직개편 유력…슬림화로 AI 시장대응속도 강화
-
4
삼성전자, 27일 사장단 인사...실적부진 DS부문 쇄신 전망
-
5
K조선 새 먹거리 '美 해군 MRO'
-
6
인텔, 美 반도체 보조금 78.6억달러 확정
-
7
갤럭시S25 울트라, 제품 영상 유출?… “어떻게 생겼나”
-
8
GM, 美 전기차 판매 '쑥쑥'… '게임 체인저' 부상
-
9
삼성전자 사장 승진자는 누구?
-
10
美 캘리포니아 등 6개주, 내년부터 '전기차 판매 의무화'
브랜드 뉴스룸
×