
“검색할 때 내가 검색하고 있다는 사실을 느끼지 못해야 좋은 검색이죠.”
최영훈 SK커뮤니케이션즈 검색본부장은 자신이 생각하는 `검색의 본연`을 이렇게 표현했다. 최 본부장은 SK컴즈가 23일 부분적으로 적용됐던 시맨틱 검색을 전체 확대 적용하고 기술개발 및 서비스 공급을 주도한 주역이다.
시맨틱 검색은 검색어와 연관된 정보를 찾아주는 기존 웹 검색에서 벗어나 사용자의 검색 의도와 질의어의 의미를 분석해 포괄적인 정보를 주제별로 제공해 주는 서비스다. `시맨틱`이라는 용어는 시맨틱 웹이라는 기술적 용어에서 따온 말이다. 시맨틱 웹이란 한마디로 웹 상의 정보에 주석을 달아 정보와 의미의 관계를 정의하는 말이다.
해당 문서의 주제와, 주제가 의미하는 내용 등을 기계가 알아서 풀어낸다. 예를 들어 가수 `이효리`를 검색하면 이효리라는 단어가 들어간 모든 웹 문서를 통째로 늘어놓는 것이 아니라 이효리의 키, 이효리가 부른 노래들, 이효리 스캔들 등 이용자가 찾고 싶어했을 만한 다양한 검색결과를 주제별로 분류해서 딱 떨어지는 답으로 보여준다는 것이다.
최 본부장은 “미국인이 검색창에 넣는 평균 키워드 수가 3개 정도라면 한국은 많아야 2개라는 통계가 있다”며 “한국인은 검색할 때 다소 수줍어하는 경향이 있는 것 같다. `이효리의 키`가 궁금해도 그냥 `이효리`라고 써넣지 않나. 이러한 이용자들의 접근방식에도 똑똑하게 반응하기 위한 기술이 우리의 시맨틱”이라고 설명했다.
SK컴즈의 시맨틱 검색이 진정한 `시맨틱 웹`과는 거리가 있다는 지적에 최 본부장은 “시맨틱은 학계의 다양한 학설을 조합해 만들어진 개념이며 접근방식이 반드시 무엇이어야만 한다고 결론이 나온 것은 아니다”며 “글자가 아닌 의미를 전달해 준다는 큰 줄기에서 SK컴즈의 검색은 시맨틱 검색이라고 할 수 있다”고 설명했다.
그는 “SK컴즈는 자연어 처리기술과 데이터를 군집시켜주는 클러스터링 기술을 혼용해 이를 실현하고 있다”며 “검색이라는 이름 아래 다양한 접근법이 있는데, 서비스 제공자 입장에서는 사용자에게 쉽고 정확한 검색경험을 주는 것이 중요하기 때문에 그 점에서 성공했다고 자평한다”고 전했다.
SK컴즈의 시맨틱 기술은 지난해 기술기업 코난테크놀로지의 검색엔진을 독점 공급받아 상용화시킨 모델이다. 이번 개편을 통해 자체 기술을 추가로 적용했다. 최 본부장은 “SK컴즈의 포털 네이트에서 이뤄지는 검색량 중 전체 트래픽의 일정 수준 이상을 차지하는 상위 10만개 검색어에 한해 시맨틱(의미 추출)이 적용돼 있으며 빠르게 등장했다 사라지는 인터넷 신조어 등에 대해서는 바로 시맨틱을 적용하지 못하는 한계가 있다”고 설명했다. 현재 시맨틱 검색과 통합 웹 검색을 혼용하고 있는 SK컴즈는 향후 필요한 기술이 있다면 어떤 접근법이든 추가로 도입할 예정이다.
서울대 컴퓨터 공학과 및 포항공대 컴퓨터 공학과 석사를 졸업하고 LG전자, 오라클, MS, SK텔레콤 등 다양한 IT업계에 몸담았던 최영훈 검색본부장의 검색 철학은 뚜렷했다. 그는 “검색은 세상으로 들어가는 문이다. 이 문에서부터 스트레스를 받으면 안된다. 보이지 않고 느끼지 못하는 쉽고 빠른 사용자 지향적 검색이 SK컴즈의 목표다”라고 말했다.
정미나기자 mina@etnews.co.kr