[콘텐츠피플]이상호 NHN 기술연구팀장

 “박사 1년차이던 1995년, ‘음성인식’이 21세기 10대 기술에 든다는 발표를 접하고 선배들과 ‘과연 그렇겠느냐’고 이야기한 적이 있어요. 이런 시대가 올 거라고는 상상도 못했죠.”

 구글에 필적할 만한 자체 음성인식 기술을 개발해낸 이상호 박사지만, 그 역시 음성인식 기술의 장밋빛 미래를 처음 접하고는 그저 어리둥절할 뿐이었다고 회상했다.

 음성은 손으로 입력하는 타자에 이어 차세대 입력장치로 각광받고 있다. 기계가 사람의 말을 알아듣기 시작하면 응용분야는 무궁무진하다. 검색도 그 중 하나다.

 NHN(대표 김상헌)이 제공하는 네이버 음성검색의 총 책임자인 이상호 박사는 최근 자체 음성인식 기술을 개발해 엔진을 교체했다. 그러자 지난해 10월 모바일 음성검색 서비스를 선보인 뒤 줄곧 포털 다음의 음성검색 서비스와 비교돼 왔던 NHN의 서비스는 이제 구글의 음성검색과 비견할 만한 경지에 올랐다.

 음성인식이 잘 되도록 하기 위한 핵심은 ‘모델링’을 어떻게 하느냐에 달려 있다. 사람들이 많이 검색하는 단어는 비교적 모델링 영향 없이 검색이 잘 된다. 그러나 검색 빈도가 상대적으로 낮지만 전체적인 검색 만족도에 결정적인 역할을 하는 키워드, ‘롱테일’의 인식률이 올라가려면 모델링에 심혈을 기울여야 한다.

 “어쩌다 한 번 검색해본 단어가 인식이 잘 되고 그런 경험이 쌓이면, 다음에 다른 검색을 하고 싶을 때도 그 때 검색이 잘됐던 인식기를 쓰게 되잖아요. 이래서 롱테일 인식률이 중요한데, 이를 높이기 위한 특별한 방법은 없어요. 기존의 연구자들끼리 서로의 모델링을 보고 업그레이드 시켜 적용하는 과정의 반복이 있을 뿐이죠.”

 이를 위해 지난해 7월 15일부터 약 5개월간 이상호 박사를 주축으로 한 기술연구팀원들은 거의 매일 야근을 하고 토요일에도 회사에 나와 연구를 계속했다. 국내 연구기관의 인력에 비하면 현저히 적은 숫자고, 서비스 구현 기간은 짧은 편이었다. 지난 12월 업데이트를 단행했지만 바로 전 주까지도 만들어놓은 모델링을 개선하는 작업을 진행했다고 토로했다.

 현재 네이버가 개발한 음성인식 기술 단계는 ‘연속음성인식시스템’이다. 이는 검색 단어를 아무리 길고 복잡하게 말해도 인식할 수 있는 수준이다. 다음이나 구글의 음성검색도 이 단계의 기술을 사용하고 있지만 같은 시스템도 연구진마다 모델링이 달라 인식률이 다르다.

 이상호 박사는 “기술개발진과 서비스운영진이 한 회사에 있어 네이버에 최적화된 엔진을 만들기가 더 유리한 부분도 있다”고 덧붙였다.

 이번 네이버 음성검색 자체기술 개발은 자국어의 음성 데이터베이스를 자국 기업 서버에 보유하게 됐다는 점에서도 의미있는 것으로 보인다.

 이상호 박사는 “사실 한국어 음성인식 기술개발은 한국인이 아니어도 할 수 있습니다. 하지만 자국어로 이뤄진 웹 페이지는 사실 그 나라에 관한 엄청난 정보이고 국민의 생활방식, 문화에 스며있는 기록입니다. 텍스트검색이든 음성검색이든, 자국어 데이터베이스를 자국서버에서 확보해 놓아야 할 필요가 있다”고 말했다.

정미나기자 mina@etnews.co.kr


브랜드 뉴스룸