부활한 다음 '실검' 어떻게 달라졌나
10분 단위 업데이트…검색어 뿐만 아니라 뉴스도 반영
'AI+인간 필터링'…허위사실·개인정보 노출 막아
- 이기범 기자
(서울=뉴스1) 이기범 기자
"왕사남, 코스피, 이란, 김선태…"
무지개색 검색창 밑에 실시간으로 키워드가 노출된다. 1위부터 10위까지 차례로. 키워드는 10분 단위로 업데이트된다. 6년 만에 돌아온 포털 다음의 '실시간 트렌드' 서비스 모습이다.
다음을 운영하는 AZX는 지난 3일 '실시간 트렌드' 베타 서비스를 열었다. 다음은 '초상난 것 같다'는 평을 들은 단색(딥 블루) 로고 디자인 대신 근본 있는 4색 로고와 함께 '양대 포털' 시절 다음을 상징하는 요소 중 하나인 '실검'(실시간 검색어)을 부활시켰다.
이번에 추가된 실시간 트렌드는 실검과 같으면서도 다르다.
다음 측은 "실시간 트렌드는 실검의 문제점을 해결하기 위해 설계 단계부터 다르게 구축된 서비스"라고 강조했다.
지난 2020년 2월, 약 20년간 운영되던 실검 서비스가 자의반 타의으로 폐지됐다는 점에서 부활에 대한 다음의 고심은 컸다. 당시 실검은 여론 왜곡 및 광고 조작에 악용된다는 비판을 받으며 역사 속으로 사라졌다.
이에 다음은 이번 실시간 트렌드를 실검과 다른 서비스라고 구분지었다.
다음은 "단순히 검색량에 의존하던 과거 방식에서 벗어나 기사를 비롯한 다양한 문서와 여러 경로의 검색 로그를 결합했으며, 조작·선거개입 같은 리스크를 줄이기 위한 가드레일(선제 제한, 이상 징후 대응, 다층 검수)을 설계에 포함했다"고 강조했다.
기본적인 이용자 경험(UX)은 이전 실검과 크게 차이가 없다. 검색창 하단에 붙어 순위별 키워드를 차례로 노출시키며 이용자의 호기심을 자아내는 방식은 거의 동일하다.
그러나 서비스 뒷단(백엔드)에서 데이터를 수집하고, 키워드를 노출시키기까지의 과정은 6년 전과 달라졌다.
우선 데이터 수집 범위가 넓어졌다. 검색어에만 의존해 '어뷰징'에 취약했던 방식에서 벗어나 '뉴스 기사'로 기반 데이터 범위를 넓혔다.
현재 다음이 활용 중인 데이터 기반은 '다음 통합 검색', '다음 뉴스 검색', '다음 카페 검색' 등으로 향후 커뮤니티나 소셜 등 다음 서비스 전체 검색 로그로 데이터 소스를 확대할 예정이다.
다음은 뉴스 기사를 두고 "뉴스 기사는 공정성과 객관성을 기반으로 생산되는 콘텐츠이기 때문에, 순위 왜곡이나 여론전의 수단으로 활용되는 상황을 비교적 효과적으로 피할 수 있다는 점에서도 가치가 있었다"고 평가했다.
또 단순 기사수가 아닌 얼마나 다양한 언론사에서 보도하는지를 토대로 '채널 다양성 보정'을 한다.
문제는 여러 언론사에서 보도된 특정 주제의 기사를 묶는 클러스터링 보정이 현재 언론 지형상 오히려 실제 이용자의 관심사를 왜곡할 수 있다는 점이다. 특히 연예 이슈의 경우 여러 언론사에서 독자를 끌어모으기 위한 '클릭베이트' 수단으로 이용된다는 점에서 실제 여론과 다를 가능성이 있다.
실제로 6일 기준 다음의 '실시간 트렌드'의 상위권은 연예 이슈가 주로 차지하고 있다. 10위권 내 70~80%를 연예 이슈가 차지하는 경우도 적지 않다. 다음 포털 서비스 전체 이용자와 국민의 전반적인 관심이 연예 이슈에 80%나 쏠렸을 것이라고 보기는 쉽지 않다.
다음 측은 구체적인 기사 기반 키워드의 가중치를 밝히진 않았다. 다음은 검색 기반 키워드와 뉴스(문서) 기반 키워드의 비중을 놓고 "속보성이 중요한 이슈에는 문서(뉴스) 가중치를 높이고, 일상적인 트렌드나 대중적 관심사가 중요한 카테고리에는 검색 가중치를 높이는 가중 합산 방식을 통해 균형 있는 정보를 제공한다"고 설명했다.
아울러 AI 필터링을 비롯해 인간의 검수를 거쳐 키워드를 노출하는 방식을 택했다.
사실 확인이 되지 않아 △공익성 △신뢰성 △조작 가능성 △유해성 원칙에 어긋나는 키워드는 노출되지 않는다. 정확한 결과가 나오지 않은 유명인의 사건사고와 연관된 추측성 키워드나 장난성·단순 낚시성 순위 올리기 키워드, 음란성·선정성·불법·오탈자 키워드 등은 제외한다. 향후 사안이 명확히 파악되면 노출한다.
다음 측 관계자는 "과거 실검은 검색어 데이터가 많으면 순위에 올랐는데, 지금은 과거처럼 데이터양이 많다고 서비스에 노출되지 않는다"며 "뉴스 기사와 검색, 다음 카페 등 웹페이지 기반으로 데이터를 보고 가중치를 돌려 현재 이용자의 관심을 파악한다"고 말했다.
이어 "얼마나 다양한 언론사가 해당 이슈를 골고루 다루는지를 보고 중요도를 판단한다"며 "정치 이슈를 인위적으로 거르진 않지만, 개인의 사생활이나 정확한 사실 여부가 밝혀지지 않은 정보는 수동 검수를 통해 걸러내 정확한 정보를 노출하려고 한다"고 덧붙였다.
Ktiger@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.








