네이버, 검색 결과서 원본문서 우대하는 기술 만들어 적용

네이버가 검색 결과에서 원본이 더 우대받는 기술을 적용한다.

네이버(대표 김상헌)는 검색 결과에서 원본문서를 우선 노출하기 위해 문서수집과 유사문서 판독 등 기술적 문제 개선에 나선다고 29일 밝혔다. 원본문서 반영 관련 제반 요청사항을 전담 처리할 `원본반영 신청센터`도 신설한다.

네이버는 검색로봇의 문서수집 체계 전반을 개선하고, 원본문서와 펌글 등 유사문서 간 판독도 정교화할 계획이다. 다수 이용자가 검색했거나 원본문서일 가능성이 높은 문서의 수집량을 늘리는 방향으로 문서수집 시스템 전반을 개선한다. 검색로봇이 수집한 문서에 대해서는 본문 내용을 정확하게 추출 및 분석하는 연구과제도 병행한다.

유사문서가 검색결과에 노출되는 것을 제어하고자 지난 수년 간 지속적으로 추진해 온 `유사문서판독 시스템`에 이어, 원본문서 판독 가능성을 더욱 높일 `소나`(SONAR)라는 새 알고리즘 로직을 추가할 계획이다.

소나는 문서 간 인용관계와 문서의 중요도 등을 분석해 이용자가 찾는 정보의 원본문서를 추출하는 새로운 검색 알고리즘이다. 이 로직이 적용되면 통합검색 최상단에 원본문서를 단독 노출하는 형태로 서비스를 제공할 예정이다.

네이버는 원본문서 반영과 관련한 제반 요청사항을 전담 처리할 `원본반영 신청센터`를 신설, 관련 문의 접수 절차도 간소화한다.

이 센터는 △검색결과에서 원본문서 검색 반영 요청 △유사문서로 분류시 원본문서 반영 요청 △검색결과 내 원본문서 노출순서 관련 문의 등을 전담 처리한다.

이윤식 네이버 검색본부장은 “검색 결과에서 원본문서 우선 노출을 위한 기술적·관리적 개선 노력에 지속적으로 힘쓰겠다”고 말했다.


한세희기자 hahn@etnews.com

브랜드 뉴스룸