음성데이터 수집에 열 올리는 글로벌 IT기업들

구글, 아마존, 마이크로소프트(MS) 등 글로벌 IT기업이 사용자 음성 데이터 수집에 열을 올리고 있다. 인공지능(AI) 비서 서비스 음성 인식률 향상을 위해서다.

블룸버그는 아마존, 애플, MS, 중국 바이두 등이 수천 테라바이트(TB)에 달하는 사용자 음성 데이터 수집에 나서고 있다고 최근 보도했다.

아마존은 개인비서 서비스 `알렉사(Alexa)`에 올라온 음성 검색어를 매시간 서버에 업로드하고 있다. 바이두는 중국 내 방언을 수집하고 있고, MS는 일상 언어 음성 녹음을 위한 자원봉사자를 세계적으로 모집하고 있다.

이처럼 글로벌 IT기업이 음성 데이터 수집에 나서는 것은 음성 인식률을 높이기 위해서다. AI가 다양한 대화를 익힐수록 자연스러운 응답이 가능하기 때문이다.

글로벌 기업의 관심은 자연스러운 대화 정보다. 올해 초 바이두는 전국 각지 중국 방언 수집을 위해 대대적 마케팅을 펼쳐 2주 만에 1000시간이 넘는 대화 정보를 수집했다고 블룸버그는 전했다.

MS는 사용자들이 게임을 하거나 영화를 보며 내는 소리를 수집하기 위한 애플리케이션을 배포하기도 했다. 이렇게 수집한 음성 데이터는 올해 초 MS가 발표한 AI 서비스 포르투갈어 버전에 사용됐다.

특정 상황에 음성 인식 기술을 적용하기 위한 움직임도 빠르게 이뤄지고 있다. MS는 공항에서 탑승 안내 방송을 분리하는 기술 시험을 마치고 이를 맥도날드 드라이브스루에 적용했다. 아마존도 `알렉사`의 자동차 적용을 위해 도로 소음과 자동차 창 내리는 소리 등을 분리하는 소음 제거 기술 개발에 한창이다.

Photo Image

유근일기자 ryuryu@etnews.com


브랜드 뉴스룸