[해외기술동향] MS, 듣고 보는 컴퓨터 「눈앞」

NLP 「마인드넷」

컴퓨터가 일반에 본격적으로 보급된 이래 사람과 보다 친화된 컴퓨터 사용환경을 만들기 위한 연구개발도 꾸준히 진행돼 왔다.

이와 관련, 컴퓨터로 하여금 사람의 일상적인 언어를 이해하도록 하는 이른바 「자연어처리(NLP)」기술에 관한 연구가 급진전되면서 음성인식이나 자동번역시스템, 인터넷 검색 등 다양한 분야에 NLP가 응용되고 있다.

마이크로소프트(MS)연구센터의 NLP연구프로젝트는 일반 PC이용자들의 대량수요를 겨냥한다는 점에서 컴퓨터의 언어인식 처리능력에 새로운 전기를 가져올 전망이다.

이미 부분적으로는 현재 공급중인 워드프로세서 「워드97」에 NLP를 바탕으로 한 문법체킹기능을 채용하고 있지만 궁극적으로 MS는 컴퓨터로 하여금 인간의 자연어를 모두 이해할 수 있는 단계의 실현을 목표로 하고 있다.

MS연구센터가 50명이 넘는 컴퓨터 과학자,언어학자 등으로 팀을 구성해 의욕적으로 추진하는 프로젝트의 핵심은 바로 컴퓨터가 인간의 언어를 이해하는 데 도움을 줄 수 있는 단어 정의나 문법,문장사용 등에 관한 일종의 모음집을 개발하는 것이다. 「마인드넷(MindNet)」이라고 이름붙여진 이 모음집은 방대한 양의 단어,문법들이 체계적으로 수록돼 있어 단어들간의 연관관계를 분석해 입력된 단어의 의미를 파악한다.

예를 들어 일반적으로 인터넷에서 검색엔진에게 「누가 가장 빠른 칩을 만드는가?(Who makes the fastest chip?)」라고 물어 본다고 가정했을 때 검색결과중 이용자가 찾고자 하는 내용은 평균 10개중 1,2개에 불과하다. 즉, 키워드방식에 의존하는 검색엔진 서비스는 이용자가 원하는 내용이 컴퓨터칩인지 감자칩인지 구분하지 못하고 기계적으로 한 단어인 「칩」에 관한 내용을 찾는 데 그치기 때문이다.

반면 MS의 「마인드넷」은 NLP를 이용,방대한 양의 단어와 이 단어가 포함된 문장,문맥 등의 관계를 분석과 다른 언어분석방법들을 적용함으로써 이용자가 의도하는 내용과 가장 가까운 결과를 검색할 수 있다.

이러한 방법으로 마인드넷을 이용하면 인터넷 검색어 입력시 10개내용중 이용자가 원하는 것을 6개이상 찾을 수 있어 인터넷 검색기능의 향상에 획기적인 전기를 가져 온다는 것이 MS측의 설명이다.

MS는 현재 이 마인드넷이 일부 영어처리만 완료된 상황이기 때문에 이 언어를 완벽히 이해하는 데는 시간이 걸릴 것이며 동시에 이 작업을 다른 언어권에도 적용해 보고 있다고 전했다.

대상인식시스템

마이크로소프트(MS)가 컴퓨터와 인간의 인터페이스를 향상시키기 위해 의욕적으로 추진하고 있는 또하나의 연구는 컴퓨터의 「대상인식(Vision Recognition)」 기능이다.

즉, 음성인식단계에서 한 걸음 더 나아가 컴퓨터가 이용자의 얼굴이나 몸짓 등을 인식하고 이용자가 고개를 한 번만 끄덕여도 자동으로 전원을 끌 수 있는 단계까지 이르는 것이다.

MS연구소의 비전기술그룹이 지난 95년부터 연구해 오고 있는 이 기술은 아직 개발중이긴 하지만 컴퓨터에 사람의 형체와 동작을 인식하고 이에 따라 스스로 작동하는 「상호작용」의 기능을 부여함으로써 컴퓨터의 인터페이스를 한단계 끌어올릴 수 있는 새로운 가능성을 제시하기도 한다.

지금까지 컴퓨터는 엄청난 처리속도와 저장용량에도 불구하고 사람을 알아보거나 사람과 대화를 나누는 상호작용의 기능은 거의 없었다.

일반적으로 영상회의시스템에 이용되는 PC의 경우 디지털스틸 영상이나 사람의 동작 등을 포착해 화면에 띄우기는 하지만 이는 어디까지나 PC와 연결된 카메라로 촬영, 압축한 이미지를 전화선으로 전송함으로써 가능한 것이다. 여기서 PC는 단순히 비디오 이미지를 처리하고 화면에 나타내 주는 기능을 할 뿐 그 자체가 사람의 존재를 인식한다거나 동작 등을 이해하는 것은 아니다.

반면 MS가 1차적으로 공개한 대상인식시스템은 PC 자체가 사람의 존재를 인식할 수 있도록 프로그래밍한 것이다.

여기서는 PC 자체에 내장된 카메라가 사람의 이미지를 포착해 PC 화면의 「비전 존(visionzone)」이라는 일정한 공간에 이를 표시하는데 이때 PC는 비전 존을 통해 컴퓨터 앞에 사람이 있는지 여부를 확인하다.

비전 존 내에 사람이 감지되면 PC는 자동으로 작업화면을 띄우게 된다.

이 시스템은 정교한 대상처리 소프트웨어를 이용, 개개인을 인식하는 방법으로 불법이용자의 접근을 원천봉쇄한다.

MS개발팀은 장기적으로 눈동자의 움직임까지 인식할 수 있는 소프트웨어 개발을 목표로 하고 있다.

예를 들어 어떤 이용자가 컴퓨터 게임을 할 때 눈동자만으로도 게임을 조작할 수 있게 하는 것이다.

이러한 대상인식 프로그램은 지체부자유자들의 컴퓨터 이용에 큰 도움을 줄 뿐 아니라 입술 움직임을 읽을 수 있을 정도로 컴퓨터의 음성인식 기능을 강화시키는 데도 이용될 수 있다고 MS연구소측은 설명한다.

<구현지 기자>


브랜드 뉴스룸