[이머징 이슈]개인화 검색

Photo Image

인류 최초의 검색은 고대로 거슬러 올라간다. 동굴생활을 하던 시절 인류는 “이런 딸기를 먹으면 위험하다”는 마을 어른의 조언에서 정보를 얻었다. 인쇄 기술이 발달한 후로는 거대한 도서관과 사서가 생겼다. 인터넷이 도입되자 도서관의 정보를 1초 만에 찾아주는 검색이 상용화됐다.

이제 사용자는 방대하게 나열된 정보보다 `나`에게 최적화된 검색결과를 원한다. 요즘 검색 시장의 최대 화두인 `개인화 검색`이다.

“전 세계 60억 인구는 각자 관심사가 다르고 사물을 보는 시각도 다릅니다. 개인에 대한 `이해`가 바로 검색의 성배입니다. 나보다 나를 더 잘 알고, 내가 찾지 않아도 필요한 정보가 내 앞에 `보이는` 검색이 미래의 검색이 될 것입니다.”

`검색의 제왕`으로 군림하고 있는 구글 본사에서 20년간 검색 품질을 담당해온 아밋 싱할 구글 펠로(최고 임원)는 올 6월 일본 도쿄에서 열린 `검색의 과학` 콘퍼런스에서 앞으로 구현될 검색의 미래에 대해 이렇게 말했다. 싱할은 “뜻이 여러 개인 단어라도 그 사람이 원했던 뜻의 결과를 보여준다는 것”이라고 덧붙였다.

◇`검색 없는 검색(Queryless Search)`이 시작됐다=개인화 검색은 나에게 최적화된 검색환경을 제공하는 검색의 새로운 패러다임을 말한다. 말 그대로 검색결과가 개인맞춤형으로 제공된다는 뜻이다.

개인화 검색은 소셜 검색, 실시간 검색, 시맨틱 검색 등 검색 결과의 만족도를 향상시키는 방향과 음성 검색, 사물 검색 등 사용자환경(UI)을 편리하게 만드는 방향으로 나뉘어 진화해 왔다. 서비스로 구현된 형태는 회사마다 조금씩 다르지만 통칭해 개인화 검색으로 부른다.

최근 검색 시장에서는 개인화 검색 중에서도 내 지인들과 나눈 이야기를 검색해 주는 소셜 검색과 검색한 시점에 등록된 관련정보를 볼 수 있는 실시간 검색, 그리고 사용자의 의도를 파악해 결과를 찾아주는 시맨틱 검색이 주목받고 있다.

이는 모바일 시장의 폭발적인 성장과 관련이 있다. 구글코리아가 발표한 통계에 따르면 2013년 스마트폰 판매량은 PC를 넘어설 예정이다. 모바일기기 사용자는 46억명에 육박한다. 트위터가 발표한 전 세계 트위터 가입자는 1억명을 넘어섰고 일일 신규 가입자 수도 평균 30만명에 달한다. 전문가들은 국내 스마트폰 누적 가입자가 연내 500만명을 돌파할 것이라고 전망한다. 여기에 태블릿PC 등 다양한 모바일 디바이스가 가세했다. 이에 좀 더 빠르고, 쉽고, 연관성 있는 검색이 요구되며 실시간 검색, 시맨틱 검색 등이 대두됐다는 분석이다.

조원규 구글코리아 R&D 사장은 “모바일에서 검색은 여전히 킬러 앱이다. 이제 인간의 오감을 대표하는 센서를 추가해 인간이 감지하지 못하는 종류의 정보까지 모바일이 찾아낼 것”이라며 “중력, 방향, 위치 등 새 종류의 센서를 계속 추가할 예정”이라고 전했다.

음성 검색, 사물 검색 등은 사용자가 검색어를 키보드로 입력할 필요 없이 말하거나 카메라로 찍으면 검색엔진이 이를 인식하고 결과를 찾아준다.

이 밖에 `언어의 장벽`을 넘어선 검색기술도 개발된 상태다. 현재 구글, 마이크로소프트(MS)의 검색엔진 `빙(Bing)` 등에서 제공하는 번역 및 통역 기술은 완성도를 높이는 과정에 있다. 언어가 다른 두 사람이 모바일 기기를 사이에 두고 앉아 각자 자신의 언어로 대화하는 상황이 기술적으로는 가능해지는 셈이다.

이원진 구글코리아 사장은 모바일 통역 기술에 대해 “이미 음성인식, 번역 등의 기술이 있기 때문에 조합하기만 하면 된다”고 설명했다.

◇기술적 배경=최근 포털 등 거대 기업은 신 검색기술을 공부하기 위한 인수합병에 적극적이다. 구글은 소셜 검색을 위해 지난 2월 소셜검색 사이트 `아드바크(Aardvark)`를 인수했다. 아드바크는 내가 가진 소셜 네트워크에 질문을 던져서 신뢰할 만한 답을 빠르게 얻기 위한 서비스로 메신저나 메일도 함께 이용할 수 있다. MS는 시맨틱웹 기술기업 파워셋을 인수했다. 다음커뮤니케이션(대표 최세훈)은 QR코드 검색을 주요 검색으로 내세우면서 인투모스를 인수했다. 인투모스는 모바일 코드인식 애플리케이션 `쿠루쿠루`와 위치기반 앱 `아루아루`를 개발한 회사다.

말의 의미와 배경을 이해하기 위한 시맨틱 웹 기술 연구도 활발하다. 시맨틱 검색은 기본적으로 의미구조화가 이뤄진 시맨틱 웹을 기반으로 하는 서비스다. 하지만 현재의 웹 환경을 단기간에 시맨틱 웹 기반으로 바꾸는 것은 불가능하다. 이에 따른 대안들이 대두되고 있다. 가장 대표적인 것이 구문 분석 방식과 클러스터링 통계 방식이다.

클러스터링 방식은 문장 수준의 의미 분석 없이 통계 기반으로 주제별 분류와 연관 주제어를 제공한다. 현재 클러스티, 큐로보, 아울림 등에서 서비스 중인 방식이다.

구문 분석 방식은 문장의 의미를 분석하는 시맨틱 본래의 의미에 더 가깝다. 하지만 기술적 어려움이 있어 특정 영역에 한정된 개발이 주로 시도됐다. 구글 스퀘어드와 MS에서 인수한 파워셋, 국내 기술기업 코난테크놀로지 등이 이에 해당한다.

SK커뮤니케이션즈가 상용화한 네이트의 시맨틱 검색은 여기서 한 차원 더 나아간 기술을 적용했다. 네이트 시맨틱 검색은 도메인 제약 없이 문장 · 문단의 의미 분석을 바탕으로 한 기술로 기술적 난이도가 가장 높은 접근 방식이다.

빙은 MS가 인수한 파워셋의 시맨틱 검색 기술을 반영해 컴퓨터가 정보의 의미를 이해하고 정보 간에 논리적 추론까지 진행해 이전보다 정확한 검색 결과를 제시한다.

음성 검색의 경우 차세대 IT로 꼽히는 `클라우드 컴퓨팅` 기술에 기반을 둔다. 구글은 음성인식과 외국어 번역검색의 경우 언어 규칙을 이해할 수 있는 시스템을 설계하는 대신 통계학적 접근법을 취했다고 설명했다. 방대한 문서를 번역엔진에 돌리고 수백만개의 단어 및 언어조합을 인식시키며 상관관계를 잡아가는 방식이다. 규칙에 예외가 있는 언어가 발견되면 그때 그때 시스템이 학습한다. 한편 국내 업체 다음의 음성 검색은 한국전자통신연구원(ETRI)의 음성인식 기술을 활용했다.

박종헌 서울대 산업공학과 교수는 “향후 검색은 사용자에 대한 더 많은 데이터를 가지고 이를 토대로 정교한 의미 기반의 사용자 및 상황 모형을 구축해야 한다”며 “통계적인 추론으로 사용자가 유용한 정보를 적시적소에서 발견할 수 있게 해줘야 할 것”이라고 내다봤다.

◇국내 검색의 현주소=국내 개인화 검색은 지난 2월 라이브K가 1초마다 검색결과를 업데이트해주는 실시간 소셜 검색을 선보인 것이 최초였다. 그러나 경영 악화로 5개월 만에 서비스를 종료했다.

현재 NHN, 다음커뮤니케이션, SK커뮤니케이션즈 포털 3사는 자사만의 소셜 검색 및 실시간 검색 서비스를 출시했거나 연내 출시 예정이다. 그러나 전문가들은 국내 업체의 소셜, 실시간 검색은 각자 자사 소셜네트워크서비스(SNS)에 올라온 정보만을 검색 대상으로 하는 한계를 안고 있다는 점을 지적한다. 트위터 등의 타 SNS 콘텐츠가 검색되기는 하지만 이는 해당 기업이 외부에 오픈한 범위 내에서 검색된 결과기 때문에 온전한 소셜 검색이라 보기 힘들다는 것이다.

한편 NHN은 지난 15일 모바일 애플리케이션에서 음성 검색, 음악 검색, 바코드 검색을 선보였다. 다음은 현재 모바일에서 음성 검색, 바코드 검색을 선보였으며 이달 말 음악 검색을 추가할 예정이다.

정미나기자 mina@etnews.co.kr

Photo Image
안드로이드폰에서 `확장 음성 검색`앱을 통해 음성을 인식하는 화면. 검색엔진이 네이버로 설정돼 있다.
Photo Image
Photo Image

브랜드 뉴스룸