[인터넷 신기술 50] 영상 검색엔진

「구슬이 서 말이라도 꿰어야 보물」이듯 정보의 바다 인터넷에서 원하는 정보를 찾지 못한다면 인터넷의 효용을 기대하는 것 자체가 의미가 없다. 따라서 인터넷에서는 사용자들이 더 빠르고 정확하게 원하는 정보를 찾게 하기 위한 서치엔진이 개발돼 활용되고 있다. 이같은 서치엔진은 텍스트를 기반으로 하는 자료에의 접근은 쉬우나 그림이나 사진, 동영상 데이터로의 접근은 어려운 것이 단점이다.

야후나 알타비스타와 같은 유명 서치엔진들이라도 기본적으로는 텍스트 기반의 서치엔진을 갖고 있기 때문이다.

그러나 최근들어 사진이나 그래픽 이미지를 텍스트키워드로 검색하는 것과 같이 검색할 수 있게 해주는 영상전용 검색엔진이 속속 개발되고 있다.

영상전용 검색엔진은 인터넷 사용자들이 꼭 필요로 하는 사진이나 웹 상에 산재해 있는 그래픽이미지를 데이터베이스화해 검색할 수 있게 해주는 것으로 원하는 사진을 찾기 위해 키워드로 관련 아이템을 검색해 사진을 찾는 단계를 거치지 않아도 된다.

시카고대학의 컴퓨터공학도들이 만든 「웹 시어(WebSeer)」가 이미지데이터베이스 전용 서치엔진. 하나의 홈페이지일 뿐 아니라 웹 이미지 내비게이터다.

웹 시어(http://webseer.cs.uchicago.edu)는 검색자들이 원하는 사진을 쉽게 찾을 수 있게 문답식으로 홈페이지를 디자인했다.

즉 흑백사진인지 컬러사진인지, 또는 원하는 파일크기는 어느정도 수준인지, 그래픽삽화인지 실제 사진인지 물어보는 대로 선택하면 이미지를 찾아주는 방식. 물론 가장 많은 검색빈도를 보이는 인물도 검색할 수 있으며 여러 명이 찍은 기념사진이나 독사진 여부 등도 선별해 찾아준다.

이를 위해 웹 시어에서는 1백여만장 정도의 이미지 카탈로그를 만들어 운영하고 있다. 물론 이 학교출신의 컴퓨터공학 전문가와 기획자들이 더 효율적이면서도 수준높은 검색엔진을 개발하기 위해 노력하고 있다.

웹 시어는 각각의 이미지에 그림을 설명하는 텍스트데이터를 추가, 이미지 검색이 의도에 적합하도록 구성했다. 이를테면 무죄냐 유죄냐를 두고 세기의 재판을 벌였던 심슨을 찾고자 할 때, 심슨의 흑백 독사진이면서 사이즈는 50k안쪽인 이미지를 찾도록 선택하는 것이 가능하다. 물론 프린터로 출력하거나 출판에 활용하려면 이에 맞는 해상도를 선택하면 된다.

컬럼비아대학이 개발, 운영하고 있는 「웹 시크(WebSeek)」도 사진이미지를 검색할 수 있는 영상이미지 데이터베이스 엔진이다.

웹 시크(http://www.ctr.columbia.edu/webseek/)는 웹 시어와는 달리 텍스트기반의 이미지 검색폼을 갖고 있다. 즉 야후의 검색구조와 같이 주요 아이템에서 세부아이템으로 선택해 나가는 형식. 사진이 확보돼있는지 여부를 한눈에 파악하면서 검색할 수 있고 사진수량도 가시적으로 보여주기 때문에 초보자들도 얼마든지 활용할 수 있다.

웹 시크에서는 현재 동물관련 사진이 1만2천여장, 예술관련 사진 3만여장 등 수십만장에 이르는 영상이미지 데이터를 분류해놓은 상태다.

야후, 알타비스타와 함께 대표적인 서치엔진으로 유명한 「라이코스(http://www.lycos.com)」 역시 사진을 위한 툴을 제공한다. 라이코스는 사진 검색기능을 추가한 최초의 상업적인 서치엔진으로 이미 지난 연말부터 서비스를 해오고 있는 상태. 라이코스는 다른 서치엔진과의 경쟁에서 우위를 점한 상태다.

라이코스의 영상검색엔진은 동물이나 사물에 대한 영상 데이터는 물론이고 음성이나 사운드 데이터도 검색할 수 있는 구조로 설계돼있다. 그러나 라이코스 서치엔진은 컬러와 흑백사진, 사람의 숫자와 같은 사진의 특징적인 개성은 사용할 수 없게 돼있어 사진 데이터베이스 활용에는 제한적인 게 단점이다.

<이규태 기자>

브랜드 뉴스룸