[글로벌 IT이슈 진단]검색엔진, 구글 말고도 있다

관련 통계자료 다운로드 검색엔진별 비교

  미국 검색 시장의 1인자는 단연 구글이다.

히트와이즈가 웹 트래픽을 측정한 결과, 최근 구글의 미국 검색시장 점유율은 64%를 넘었다. 지난해 3월 대비 10%포인트 이상 늘어난 수치다. 이런 추세대로라면 올해 안에 미국 검색시장 점유율이 3분의 2를 훌쩍 넘어설 전망이다.

하지만 검색엔진은 구글만 있는 것은 아니다. 구글이 기술·철학·조직에서 탁월한 면이 많지만 기술 개발이 빠르게 이뤄지는 인터넷 분야에서는 구글도 도전에 직면할 수밖에 없다. 특정 분야나 기술에서 전문성과 강점을 가진 검색엔진들이 속속 선보여 나름의 영역을 구축해 가거나 선보일 준비를 하고 있기 때문이다. 바로 애스크닷컴·파워셋·애스크미나우·하키아·디거·블링스·코스믹스·리트리보 등이 그들이다.

많은 신규 검색엔진들은 자연어나 시맨틱 검색기술을 사용한다. 이런 검색엔진은 “달에 처음으로 간 사람은 누구인가?” 같은 평범한 질문에 의미있는 결과를 적절히 제공한다. 어떤 검색엔진은 전문가 시장에 초점을 맞춰 새로운 방향을 모색하고 있다.

현재 인기를 누리고 있는 유명 검색엔진들은 대부분은 키워드에 근거해 웹 페이지의 목록을 보여주는 데 힘을 쏟는다. 그러나 키워드 기반 검색엔진은 평범한 자연어 검색어에 잘 대처하지 못하는 단점이 있다.

애스크닷컴(www.ask.com)은 ‘엑스퍼트랭크’라고 불리는 특정주제 인기 랭킹 기술을 사용해 종종 구글보다 나은 검색 결과를 제공한다. 검색 결과를 보여 줄 때 웹 페이지에 링크된 횟수에 따라 웹 페이지의 목록을 보여주는 방식을 넘어, 검색 주제 관련 웹 페이지를 전문가의 시각을 근거로 순서를 결정해 보여준다. 이 기능 때문에 애스크닷컴은 지속적으로 적절한 검색 결과를 제공한다.

파워셋(www.powerset.com)은 자연어 처리의 한계에 도전하고 있다. 파워셋은 미국 실리콘밸리 소재의 신생업체로 키워드 검색의 한계를 뛰어넘는 검색엔진을 개발하기 위해 자연어의 구조와 뉘앙스를 사용한다. 아직 서비스는 본격화하지 않았다.

애스크미나우(www.askmenow.com)는 자연어 시맨틱 검색 기술을 이용해 휴대폰용 검색 서비스를 제공하고 있다. 이동통신 서비스 가입자들은 휴대폰 키패드에서 “애스크미(ASKME)”를 입력하고 몇 초를 기다리면 된다. 이동통신 서비스 가입자들은 휴대폰에 SW를 내려받고 월 5달러의 비용을 내면 사용할 수 있다. 같은 기술을 사용한 웹 기반 서비스도 곧 선보일 예정이다.

하키아(www.hakia.com)는 현재 베타 버전을 시범적으로 운영 중이며 올해 상용 서비스를 선보일 계획이다. 이 회사는 첫 시맨틱 웹 분야 기업이 될 것으로 꼽히던 곳 중 하나로, 유럽의 벤처캐피털 컨소시엄에서 투자를 유치했다. 하키아는 검색자들이 입력한 질문을 이해해 의미 기반의 검색을 수행할 수 있다. 실제 상대적으로 복잡한 질문에 대해 구글보다 뛰어난 검색 결과를 제공한다. 특히 의약품·법률·재무·과학·문학 같은 집약적 주제 검색에 뛰어나다.

텍스트디거가 제공하는 검색엔진 디거(www.digger.com)는 검색자가 입력한 검색어가 어떻게 다뤄지는지 알려주고 결과를 보여주며 오해를 바로잡는지 알려준다. 디거는 검색속도가 조금 느리긴 하지만 일반적 질문에 적합한 검색 결과를 제공한다. 현재 베타 버전이며 테스트하려면 ID와 비밀번호를 등록해 입력해야 한다.

블링스(www.blinkx.com)는 동영상 검색엔진으로 뛰어난 검색 결과를 제공한다. 블링스는 이미 오디오와 비디오 및 TV 프로그램 700만시간 이상 분량의 목록을 구축했다. 코스믹스(www.kosmix.com)는 건강·여행·재무·미국 정치 등의 분야에서 깊이 있는 검색 서비스를 제공한다.

이에 대해 파이낸셜타임스의 기술 칼럼니스트 폴 테일러는 “구글이 검색의 제왕일지는 모르지만, 혁신적인 신생기업과 틈새 검색 기업들에겐 시장에 파고들 여지가 있다”고 지적했다.

◆구글의 강점

 구글은 미국 인터넷 검색시장뿐 아니라 전체 인터넷 시장을 뒤흔들고 있다.

구글은 지난 13일(현지시각) 미국의 인터넷 광고 대행사인 더블클릭을 현금 31억달러에 인수하기로 합의했다고 발표했다. 지난해 10월엔 인터넷 동영상 UCC 공유사이트 ‘유튜브’를 16억5000만달러에 인수했다. 검색 분야를 넘어 인터넷의 전 방위로 영역을 확대하고 있는 것이다.

검색엔진 전문 교육 및 컨설팅 업체 ‘검색엔진마스터’의 전병국 사장은 “구글은 단순한 검색기술 업체가 아니다”라며 “구글이 승승장구하는 것은 기술·철학·조직의 탁월성 때문”이라고 평가했다.

구글의 장점은 대용량 데이터를 관리하는 능력이다. 구글은 다양한 소스와 형태의 데이터들을 해체, 재구성하고 순위를 매기는 능력이 뛰어나다. 또 독자적인 기술로 데이터 관리 비용을 최대한 낮춰 인터넷 사업에서 놀라운 성과를 거두고 있다.

특히 구글에서는 광고주가 검색광고비를 아무리 많이 내도 검색 결과에서 무조건 1위가 될 수는 없다. 검색 결과를 광고비에 흔들리지 않고 보여준다. 이용자들이 구글에 열광하는 것도 바로 이런 검색엔진 운영 방식 덕분이다.

또 구글의 조직은 웹 구조와 비슷하다. 구글은 직원들에게 내부 정보와 프로젝트를 모두 공개하고 서로 치열하게 경쟁시킨다. 이 과정에서 창조성이 나오는데 구글은 뛰어난 인재만을 고집하기 때문에 이들의 경쟁이 더 큰 성과를 낳는다.

뿐만 아니다. 구글은 무료 통근버스, 사내 체력단련실·수영장·스파 세탁소 등 편의시설, 전문 요리사가 제공하는 유기농·무공해 식사 등을 제공하고, 업무시간 중 20%를 업무 외 관심 분야나 프로젝트에 사용하게 하는 등 직원들을 최대한 배려한다.

한편 전 사장은 구글이 철저히 시스템 중심이라는 구조가 웹2.0 시대에는 단점이 되기도 한다고 지적했다. 집단과 사람의 활동이 중시되는 영역이나 그런 능력에 기반한 수직적 구조 속에서는 구글의 조직 체계가 빛을 발하기 어렵다는 분석이다.

그는 “구글의 분명한 검색 철학과 시스템 중심은 장점과 단점이 될 수도 있다”며 “이는 경쟁사들에게 기회가 되기도 한다”고 지적했다.

◆검색엔진의 종류와 특성

 검색엔진은 기술적인 면에서 △인덱스(키워드 검색) △디렉터리(메뉴 검색) △통합검색 방식 등으로 크게 구분된다.

인덱스는 가장 일반적인 방식으로 검색어가 포함된 웹 페이지를 검색한다. 검색엔진에 내장된 검색로봇이 주기적으로 인터넷의 정보를 검색해 검색엔진 업체의 컴퓨터에 보내고 인덱스 DB를 업데이트한다. 검색로봇의 데이터 추출 방법과 효율성에 따라 검색엔진의 성능이 결정된다. 그러나 인덱스 방식은 검색 결과가 너무 많아 검색자를 혼란스럽게 하고, 웹 페이지의 내용이 검색자가 원래 찾으려던 의도와 맞지 않을 가능성이 높다. 알타비스타(www.altavista.com), 라이코스(www.lycos.com), 네이버(www.naver.com), 심마니(www.simmani.com) 등이 있다.

디렉터리 방식은 인터넷의 웹 페이지들을 주제와 계층별로 구분해 DB를 구축한다. 사람이 직접 문서를 수집하고 관리하기 때문에 웹 페이지 내용의 신뢰도가 높은 것이 장점. 그러나 검색된 웹 페이지의 수가 상대적으로 적다는 것이 단점이다. 야후(www.yahoo.com)가 대표적이다.

통합검색 방식은 별도의 인덱스 DB를 보유하지 않고 사용자가 입력하는 검색어를 다른 검색엔진에 보내 검색결과를 사용자에게 통합적으로 보여준다. 검색 방법은 인덱스 방식과 비슷하다. 메타크롤러(www.metacrawler.com), 올인원(www.albany.net/allinone) 등이 이 방식을 채택하고 있다.

검색엔진을 단순히 모아 놓기만 한 메타 검색엔진도 있다. 11개 분야 200여 검색엔진을 제공하는 올원서치(allonesearch.com), 24개 분야 300여 검색엔진을 제공하는 서치컴(www.search.com) 등이 이 부류다.

한편 서치엔진콜러서스닷컴(http://www.searchenginecolossus.com)에서는 각 나라별 주요 검색엔진을 알파벳 순으로 찾을 수 있다.

정소영기자@전자신문, syjung@


브랜드 뉴스룸