포털 ‘다음’이 온라인에서 자주 언급되는 관심사를 검색 결과창에서 키워드 형태로 보여주는 ‘투데이 버블’ 베타 서비스를 10일 오픈했다.
투데이 버블은 온라인 이용자들의 최근 관심사 및 유용한 정보를 파악할 수 있도록 도와주는 서비스다. 카카오는 내·외부 웹페이지를 통해 관심량이 늘어난 트렌드 키워드를 추출한 뒤 검색 결과에서 무작위로 노출하는 방식으로 ‘실시간 검색어’와는 다르다고 설명했다.
카카오 측은 “투데이 버블은 다음의 내부 서비스뿐 아니라, 제휴된 뉴스 사이트 및 온라인 커뮤니티 등 다양한 외부 웹페이지를 정보가 출처”라며 “출처의 다양성을 고려한 보정 과정을 거치고, 또한 분석의 기준이 되는 시간을 늘리고, 키워드에 순위를 매기지 않았다”라고 강조했다.
투데이 버블의 데이터 출처는 웹크롤러를 사용해 다양한 웹페이지를 자동으로 모으고 정리한 것이다. ‘다음 웹문서 검색’과 마찬가지로, 공개된 웹페이지에만 방문한다. 이어 수집한 문서를 분석해 최근 언급량이 현저하게 증가한 키워드를 추출한다.
최근 수 일 동안 웹페이지들에서 언급된 단어를 분석한 뒤 비교적 짧은 시간(몇 시간 내) 동안 웹페이지들에서 언급된 단어를 분석한다. 이 두 분석 결과를 비교해, 평소 대비 최근 언급량이 현저하게 증가한 단어를 추출한다.
여기에는 다양한 곳에서 나온 키워드가 더 잘 드러나도록 보정이 이뤄진다. 그리고 유사한 의미를 가진 단어 조합들을 통합하고 중복을 제거한 뒤, 주제의 특징을 가장 잘 표현하는 키워드 조합을 선택한다.
이런 키워드 추출을 위한 데이터 수집, 분석 및 대표 키워드 조합 도출까지의 과정은 사람의 별도 개입 없이 알고리즘에 의해 자동으로 이뤄진다.
다만 키워드 추출 결과가 이용자에게 전달되기 전에 운영 가이드라인에 근거한 모니터링을 거친다. 알고리즘이 구분하기 힘든 홍보성 자료나 부적절한 표현 등이 포함되지 않도록 검토한다. 가령 선정성·폭력성 등 아동·청소년 유해 정보나, 증오·혐오·차별 표현, 광고·홍보·마케팅 등 상업적 목적의 정보 등은 걸러진다.
이와 관련 네이버도 모바일앱 검색홈에서 관심사 및 트렌드에 따라 자동으로 제공되는 추천피드를 일부 이용자를 대상으로 AB테스트를 진행하고 있다. 콘텐츠 추천 방식은 크게 개인화 추천과 트렌드 추천으로 나뉜다. 이 중 트렌드 추천은 네이버 전체 사용자들이 좋아한 주제와 문서를 바탕으로 추천된다. AI가 추천하는 트렌드 토픽이 여행, 예능, 스포츠 등 주제별로 보여지거나, 요즘 뜨는 주제의 추천 콘텐츠, 연령별 인기 콘텐츠 등을 보여주는 방식이다.
함봉균 기자 hbkone@etnews.com