검색 본문 바로가기 회사정보 바로가기

[後스토리] 싹 잘린 'AI 챗봇'…이루다 과징금은 '스타트업 죽이기'?

AI 개발 위한 개인정보 수집·이용 기준 제시하며 '불확실성' 해소
이용자 동의 없이 처리가능한 가명정보에 '산업적 연구'도 포함

(서울=뉴스1) 손인해 기자 | 2021-05-20 07:30 송고 | 2021-05-20 08:24 최종수정
인공지능(AI) 챗봇 이루다. © 뉴스1
인공지능(AI) 챗봇 이루다. © 뉴스1

"저희가 한국 인공지능(AI) 발전에 있어 걸림돌을 만드는 것 아닐까 하는 고민도 있다."

지난달 28일 AI 챗봇 '이루다' 개발사 스캐터랩에 개인정보보호위원회가 1억330만원의 과징금·과태료를 부과하기 직전 열린 전체회의에서 김종윤 스캐터랩 대표의 최후 진술이다.
미래 핵심 기술로 꼽히며 구글·페이스북 등 글로벌 빅테크 기업이 사활을 걸고 있는 AI 분야 기술 개발이 국내 스타트업에서 제대로 꽃 피우기도 전에 싹이 잘릴까 우려스럽다는 취지였다.

김 대표는 "AI는 이제 시작하는 초기 단계 기술이라고 본다. 토론과 합의를 통해 함께 사례를 만들어 가는 게 좋지 않을까 싶다"며 '섣부른' 정부 규제를 경계했다.

스캐터랩 측 법률 대리인을 맡은 마경태 변호사(39·변호사시험 3기) 역시 이날 회의에서 "소규모 스타트업으로 충분한 선례 없이 일부 미흡한 점이 발생했다는 점을 참작해달라"고 선처를 호소했다.
이루다를 둘러싼 개인정보 유출 논란이 불거진 직후부터 정보통신기술(ICT)업계와 스타트업계에서 우려의 목소리는 터져 나왔다.

국내 IT업계에서 대표적인 '어피니언 리더'로 꼽히는 남궁훈 카카오게임즈 대표는 이루다의 등장에 대해 페이스북을 통해 "이제 시작일 뿐인 이 산업, 그리고 매우 매력적인 시작으로 보이는 이 캐릭터에 엉뚱한 규제로 혁신을 또 가둬두지 않을지 걱정스럽다"며 "혁신적 서비스를 출시한 회사에 박수를 보낸다"며 공개 지지 선언을 하기도했다.

스캐터랩에 대한 과징금 처분은 정말 "스타트업 죽이기"일까?

송상훈 개인정보위원회 조사조정국장이 지난달 28일 오후 서울 종로구 정부서울청사에서 AI 챗봇 '이루다' 사건 등 개인정보 법규 위반행위 시정조치 브리핑을 하고 있다.  © News1 송원영 기자
송상훈 개인정보위원회 조사조정국장이 지난달 28일 오후 서울 종로구 정부서울청사에서 AI 챗봇 '이루다' 사건 등 개인정보 법규 위반행위 시정조치 브리핑을 하고 있다.  © News1 송원영 기자

◇ 불확실성 해소

스캐터랩을 포함해 AI 서비스를 개발하는 스타트업 입장에서 가장 피하고 싶은 건 '불확실성'이다.

편법과 위법 사이를 줄타기하며 신사업 서비스하다가 정부 규제망에 걸려서 최악의 경우 사업을 접어야 할 수도 있다. 이른바 '타다 금지법'(여객자동차 운수사업법 개정안)에 걸려 시동을 끈 '타다 베이직'이 대표적 사례다.

개인정보위의 이번 결정은 스타트업계의 AI 서비스 개발을 위한 개인정보 수집·이용 기준을 제시했다는 점에서 이러한 불확실성을 해소했다.

앞으로 AI 서비스를 준비하는 스타트업은 개인정보위의 개인정보보호법 해석에 따라 개인정보를 수집·이용하면 된다.

◇ 이루다 개인정보 처리 위반 단 2건

나아가 개인정보위의 이번 처분을 뜯어보면 산업계에 유리한 해석도 다수 포함돼 있다.

먼저 개인정보위가 이루다의 개인정보 처리를 문제 삼은 건 △법정 대리인 동의 없이 만 14세 미만 아동의 개인정보를 수집한 행위(개인정보보호법 22조6항) △수집 목적 외 이루다 학습·운영에 카카오톡 대화문장을 이용한 행위(같은법 18조 1항) 단 2건뿐이다.

이에 따른 시정조치는 시정명령과 각각 과징금 780만원·과태료 700만원과 과징금 780만원으로 전체 과징금·과태료의 20% 수준이다.

나머지 80%는 이루다 학습에 쓰인 스캐터랩의 연애 분석 앱 '텍스트앳'과 '연애의 과학' 개발자들의 코드 공유 및 협업 사이트인 '깃허브(Github)' 관련 개인정보 처리 위반 6건에 따른 처분이다. AI 서비스 자체보다는 이를 구현하기 위한 정보 수집 과정을 문제 삼은 것이다.

2020년 12월1일 발표된 네이버 데뷰 2020(DEVIEW 2020)의 '오픈도메인 챗봇 ‘루다’ 육아일기: 탄생부터 클로즈베타까지의 기록' 발표화면. 김종윤 스캐터랩 대표가 '이루다'의 페르소나에 맞지 않는 응답을 제거하는 과정을 설명하고 있다. (네이버TV, NAVER Engineering 계정 영상 갈무리) 2021.01.12 /뉴스1
2020년 12월1일 발표된 네이버 데뷰 2020(DEVIEW 2020)의 '오픈도메인 챗봇 ‘루다’ 육아일기: 탄생부터 클로즈베타까지의 기록' 발표화면. 김종윤 스캐터랩 대표가 '이루다'의 페르소나에 맞지 않는 응답을 제거하는 과정을 설명하고 있다. (네이버TV, NAVER Engineering 계정 영상 갈무리) 2021.01.12 /뉴스1

◇ '수집 목적 외 개인정보 이용' 쟁점 3가지는

개인정보위 내부에서 이견 없이 이루다 관련 개인정보 처리 위반항목으로 꼽힌 '만 14세 미만 아동 개인정보 수집'과 달리 '수집 목적 외 개인정보 이용'을 두고는 막판까지 치열한 논쟁이 벌어진 것으로 전해진다.

쟁점은 3가지였다.

첫째, 수집·이용 고지가 충분했느냐 문제다. 스캐터랩은 2020년 2월부터 2021년 1월까지 텍스트앳과 연애의 과학 이용자 약 60만명이 제공한 카카오톡 대화 문장 94억건을 토대로 이루다를 개발했는데, 개인정보 수집 목적이 '신규 서비스 개발에 활용될 수 있다'고 고지한 게 부합했는가가 골자였다.

개인정보위 위원들은 대부분 이견 없이 신규 서비스 개발이란 고지가 미흡했다고 봤다. 텍스트앳과 연애의 과학 개인정보 처리 방침에 신규 서비스 개발을 포함해 이용자가 로그인함으로써 동의한 것으로 간주하는 것만으로는 이용자가 이루다 같은 신규 서비스 개발 목적 이용에 동의했다고 보기 어렵다는 취지였다.

두 번째로 제대로 된 고지가 이뤄지지 않았더라도 개인정보보호법상 '합리적 범위 내'라면 개인정보 수집·이용이 허용되지만 이 역시 아니라고 봤다.

개인정보위에 따르면 스캐터랩은 텍스트앳과 연애의과학 이용자의 카카오톡 대화에 포함된 이름과 휴대전화 번호, 주소 등 개인정보를 삭제하거나 암호화 조치를 전혀 하지 않았다.

한 이용자가 업로드한 이루다와의 대화 (온라인 커뮤니티 갈무리) © 뉴스1
한 이용자가 업로드한 이루다와의 대화 (온라인 커뮤니티 갈무리) © 뉴스1

◇ '산업적 연구' 위한 가명정보 처리 길 열려

마지막으로 지난해 2월 개정된 개인정보보호법에 따라 신설된 '가명정보 처리 특례'에 해당하는지 여부였다.

가명정보는 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 방법으로 추가 정보 없이는 특정 개인을 알아볼 수 없도록 처리한 정보로, 개정된 개인정보보호법은 개인정보 처리자가 통계 작성이나 과학적 연구, 공익적 기록 보존을 위해서라면 정보주체의 동의 없이 처리할 수 있도록 허용했다.

주목할 점은 개인정보위가 스캐터랩의 개인정보 처리가 가명정보 처리 수준에 미치지 못했다고 판단했음에도, 그동안 애매모호한 표현으로 논란이 됐던 '과학적 연구'에 '산업적 연구'를 포함해 사업자의 서비스 개발을 위한 가명정보 처리를 허용한다고 해석했다는 것이다.

개인정보위 비상임 위원 백대용 변호사(47·사법연수원 31기)는 "개인정보위의 결정을 종합하면 앞으로 스타트업은 개인정보 수집·이용에 있어서 △이용자에게 고지를 제대로 하고 △합리적 범위 내에서라면 문제가 없다는 것"이라며 "무엇보다 가명정보 처리를 한다면 정보주체 동의 없이도 이를 처리할 수 있는 길을 열어줬다"고 말했다.

업계의 한 관계자는 "불확실성이 해소된 스캐터랩은 앞으로 공격적으로 외부 자금을 수혈받을 것"이라며 "개인정보위의 이번 결정은 안 그래도 산업계 목소리를 반영해 탄생한 개인정보보호법 개정안에 산업계에서 두 팔 벌려 환영할 만한 해석을 얹어준 모양새"라고 했다.


son@news1.kr

이런 일&저런 일

    더보기