검색 본문 바로가기 회사정보 바로가기

'제2의 설리' 지키자…포털공룡의 '악플과의 전쟁' 초강수 통했나

카카오 악성댓글 20%↓…네이버 뉴스 댓글이력 공개 소식에 자진삭제 21%↑
욕설단어 넘어 모욕적 문장도 탐지...네이버 AI '뉴스 악플' 걸러낸다

(서울=뉴스1) 송화연 기자 | 2020-06-21 06:30 송고
 
 

악플에 시달리다 지난해 세상을 떠난 가수 겸 배우 설리(본명 최진리)와 같은 사고를 막겠다며 '악플과의 전쟁'을 선포한 네이버와 카카오가 소기의 성과를 거두고 있다.

두 포털공룡은 정책 변경과 자체 기술력을 내세워 악플의 민낯을 공개하는 초강수를 뒀고 악플러들이 몸 사리기에 들어가면서 포털 내 욕설, 비속어가 눈에 띄게 감소했다.
◇악플을 음표(♩♪)로 바꿨더니…다음·카톡 욕설·비속어 20%↓

카카오는 지난 2월26일 포털 다음과 카카오톡 탭의 뉴스 댓글 서비스에서 댓글 신고 기준에 '차별·혐오' 항목을 추가하고 '덮어두기' '접기' 등 댓글 영역의 노출을 관리하는 기능을 신설했다.

회사 측에 따르면 개편 직후인 3월 한 달간 댓글 신고 건수는 개편 이전 대비 약 2배 증가했고 21대 국회의원 선거가 끝난 5월에도 개편 이전보다 14% 늘어났다. 악성 댓글 삭제 건수도 3월 한 달간 개편 이전 대비 65% 증가했고, 5월에도 개편 이전보다 7% 늘어났다.
욕설 및 비속어를 포함한 댓글은 20% 이상 감소했다. 카카오는 인공지능(AI)을 활용해 댓글의 욕설 및 비속어를 필터링해 음표 모양으로 바꿔주는 '욕설 음표 치환 기능'을 운영하고 있는데 이같은 조치 후 음표 치환된 댓글이 20% 이상 감소한 것으로 나타났다.

네이버는 지난 3월19일부터 뉴스 댓글 작성자의 활동이력과 닉네임을 공개하며 댓글정화에 나섰다. 이전까지는 본인이 쓴 댓글의 공개 여부를 스스로 정할 수 있었지만, 정책 변경 후 댓글 작성자가 지금까지 작성한 모든 댓글의 목록이 공개로 전환됐다.

또 현재 게시중인 댓글과 댓글 수, 받은 공감 수가 집계되며 최근 30일간 받은 공감 비율과 본인이 삭제한 댓글 비율도 공개됐다. 포털사이트 내부에서 지속적으로 제기된 문제인 악성댓글과 어뷰징 시도 등의 '역기능'을 줄이려는 방편이었다.

네이버 댓글이력 공개 예고 보도 이후 일부 누리꾼은 댓글 자진삭제에 나섰다. 보도 직후 네이버 뉴스 내 삭제 댓글 수는 8만1217건으로 직전 6만6826건 대비 21.5% 증가했다. 악플러의 민낯을 공개해 악성댓글을 정화하겠다는 네이버의 고육지책이 먹힌 결과였다.

이밖에도 네이버는 지난 5월부터 연예 뉴스에 독자들이 '화나요' 같은 부정적인 감정 표현을 '놀랐어요', '응원해요' 등 긍정적인 감정으로 표현하는 정책을 도입했다.

네이버는 현재 기술적 노력만으로는 연예인들의 고통을 해소하기에 부족함이 있다는 이유로 연예뉴스 댓글창을 닫은 상태다. 이에 네이버는 긍정적인 이모티콘(그림말)을 통해 독자와의 소통을 강화하고 긍정적인 댓글문화 조성에 나섰다.

네이버 관계자는 "연예뉴스 공감표현 개선은 댓글 폐지 이후에도 남아있던 '화나요' 등 부정적인 감정 표현으로 인한 부작용을 해소하기 위한 결정"이라고 말했다.

네이버 AI 클린봇 업그레이드 (네이버 다이어리 블로그 갈무리) © 뉴스1
네이버 AI 클린봇 업그레이드 (네이버 다이어리 블로그 갈무리) © 뉴스1

◇욕설 단어 없는 모욕적 문장도 '척척' 걸러내는 네이버 AI

네이버는 AI 기술을 고도화해 악플러 색출에 나섰다. 네이버는 지난해 4월부터 AI 기술을 이용해 불쾌한 욕설이 포함된 댓글을 체크하고 자동으로 숨겨주는 'AI클린봇' 기능을 선보이고 있다.

클린봇은 뉴스, 스포츠, 쥬니버 등에 적용돼 욕설과 비속어가 들어간 댓글을 탐지해 자동으로 블라인드(가림) 처리해왔다. 19일 네이버는 클린봇이 문장 맥락을 탐지해 욕설이 없지만 무례한 표현까지 걸러내도록 업데이트(클린봇 2.0)했다.

클린봇 2.0은 비속어를 포함하지 않았더라도 모욕적인 표현이나 무례한 댓글을 탐지해낸다. 이를 위해 네이버는 기존의 방대한 악성댓글 데이터를 기반으로 축약어와 오탈자가 많은 구어체 댓글에 대한 더욱 정밀한 분석을 진행했다.

클린봇 2.0에는 'CNN'과 'Bi-LSTM', 'LSTM' 3가지 레이어를 결합한 모델을 만들었다. 이 레이어들은 기계학습, 자연어처리 등과 관계됐다. 네이버는 여기에 이용자들이 주로 쓰는 어휘와 표현을 벡터로 표현하는 자체 연구·접근법(persona embedding pre-training)을 도입해 악플 탐지 예측 성능을 극대화했다.

업데이트된 클린봇은 상습적인 악성 댓글 작성자를 판단에도 활용된다. 네이버는 클린봇이 인지한 악성 댓글을 반복 작성하는 이용자에게 일정기간 동안 댓글 서비스 이용을 제한할 예정이다. 나아가 반복 정도에 따라 작성할 수 있는 댓글과 참여할 수 있는 공감 수를 제한하는 정책도 준비하고 있다.

네이버 측은 "하나의 비속어에 대해 많게는 10만개 이상의 변칙어가 존재한다. 이같은 상황에서 클린봇 만으로 100%의 악성댓글 감지 효과를 기대하기엔 버거운 것이 사실"이라며 "네이버는 클린봇이 최대한 많은 악성댓글을 탐지할 수 있도록 다양한 AI 모델을 결합하고 빅데이터 학습을 계속해 보다 정밀하고 고도화된 클린봇 모델 구축을 구축하겠다"고 말했다.


hwayeon@news1.kr

이런 일&저런 일

    더보기