검색 본문 바로가기 회사정보 바로가기

스타트업이라고 안 봐준다…AI 기업 '개인정보 부실처리' 첫 철퇴

개인정보위, 이루다 개발사 스캐터랩에 1억330만원 과징금·과태료
"투자유치에 법적이슈 밀려…미중은 왜 챗봇 개발 안했나 고민해야"

(서울=뉴스1) 손인해 기자, 박혜연 기자 | 2021-04-28 16:31 송고
윤종인 개인정보보호위원회 위원장이 23일 오전 서울 종로구 정부서울청사에서 열린 제9회 개인정보보호위원회 전체회의에 참석해 발언하고 있다. © News1 송원영 기자
윤종인 개인정보보호위원회 위원장이 23일 오전 서울 종로구 정부서울청사에서 열린 제9회 개인정보보호위원회 전체회의에 참석해 발언하고 있다. © News1 송원영 기자

"스캐터랩은 소규모 스타트업이다. 충분한 선례 없이 일부 미흡한 점 발생했다는 점을 참작해달라."(스캐터랩 측 마경태 법무법인 태평양변호사)

"스타트업이라고 하지만 규제 영향 크게 받지 않는 분야다. 저희가 문제 삼는 부분은 가장 기본적인 내용이다."(백대용 개인정보위원회 위원·법무법인 세종 변호사)
28일 오전 열린 개인정보위 제7회 전체회의에서 인공지능(AI) 챗봇 '이루다' 행정처분을 놓고 이루다 개발사인 스캐터랩과 개인정보위 양측 의견은 평행선을 달렸다.

스캐터랩은 "스타트업이 이제 막 열리기 시작하는 AI 사업에 뛰어든 것"이라는 점을 강조하며 선처를 호소했으나 개인정보위는 "스타트업이라 하더라도 원칙을 지켜야 한다"며 회사에 총 1억330만원의 과징금·과태료 철퇴를 내렸다.

◇ "투자유치 치중해 법적 이슈 후순위"
이날 백대용 위원은 "회사가 2011년에 설립됐다. 가장 신경쓴 부분이 개인정보보호법이었을 것 같다"며 "사업하는 10년 간 지키지 않은 것에 대해 어떻게 생각하나"고 따져물었다.

이에 김종윤 스캐터랩 대표는 "부족했던 게 분명히 있다. 죄송하다"면서도 "저희를 포함해 많은 스타트업이 법은 아무래도 어려우므로 14세 동의받는 부분 등 앱 기획 및 서비스 과정에서 유사 서비스를 많이 참고한다. 모든 서비스가 문제없었다면 저희도 안 그랬을 것"이라고 했다.

김 대표는 이날 전체회의에서 만 14세 미만 개인정보 수집과 관련해 "이루다 서비스가 이뤄진 페이스북은 14세 미만 이용이 불가능하므로 가입 포맷을 만들 때 사용자 나이를 아는 건 중요한 이슈가 아니었다"는 취지로 말했다.

하지만 백 위원은 "미국은 스타트업을 하더라도 분쟁 이슈를 잘 찾아서 한다"며 "우리나라가 비즈니스 모델을 개발하는 과정에서 투자 유치에 치중하다 보니 먼저 (데이터를) 이용하고 이런 (법률적인) 건 나중에 체크하자는 부분이 있다"고 지적했다.

그러면서 "이루다 관련 문제 이전에 스타트업, AI 쪽에 계신 분들이 마인드를 전환해야 할 사건"이라고 덧붙였다.

그는 "개인정보보호법이 개정되면서 산업계 요구를 상당히 많이 받아들였다"며 "가명 특례조항처럼 자유롭게 사업할 수 있도록 영역을 만들었는데, 안전하게 적절하게 활용을 못했지 않나 하는 아쉬움이 있다"고 했다.

송상훈 개인정보위원회 조사조정국장이 28일 오후 서울 종로구 정부서울청사에서 AI 챗봇 '이루다' 사건 등 개인정보 법규 위반행위 시정조치 브리핑을 하고 있다. © News1 송원영 기자
송상훈 개인정보위원회 조사조정국장이 28일 오후 서울 종로구 정부서울청사에서 AI 챗봇 '이루다' 사건 등 개인정보 법규 위반행위 시정조치 브리핑을 하고 있다. © News1 송원영 기자

◇ "미·중은 왜 챗봇 개발 안했나 고민 필요"

지성우 개인정보위 위원(성균관대 로스쿨 교수)도 "미국이나 중국처럼 우리나라보다 AI기술이 훨씬 발전한 국가에서도 (챗봇 서비스가) 왜 안 됐는지 생각해 본 적 있나"며 "데이터 발전을 위해 법률이나 사회에서 허용할 수 있는 부분이 있고, 허용 안 되는 분야는 '원칙'이라고 한다"고 짚었다.

지 위원은 "개인정보보호, 아동·청소년 보호 문제 두 개가 걸리는데, 미국은 과거 아동·청소년 관련 문제가 나오면 (기업이) 다신 일어서지 못한다"며 "데이터를 모으는 게 어렵긴 하기 때문에 일부 열어주는 건데, 그렇다고 이렇게 특히 아동·청소년 데이터까지 무분별하게 모은 건 서비스 유지되는 한 문제가 될 수 있다"고 했다.

마경태 변호사는 "저희가 수집한 대화정보에 대해 언론에서 마치 개인정보를 그대로 유출된 것처럼 보도했으나 실제로는 굉장히 엄격한 비식별 절차를 거쳤다"며 "발화 데이터를 보면 문제 될 소지가 된 게 700만 대화 중 3~4건 정도다"고 주장했다.

마 변호사는 "비식별 처리를 위해 7가지 절차를 거치고, 독자적인 AI 모델을 개발할 정도로 전념했다"고 했다.

AI 챗봇 이루다. © 뉴스1
AI 챗봇 이루다. © 뉴스1

◇ "동의 없이 개인정보 수집하고 목적 외 이용"

개인정보위에 따르면 스캐터랩은 2020년 2월부터 2021년 1월까지 자사 앱 서비스인 '텍스트앳'과 '연애의 과학'에서 수집한 이용자들 약 60만명의 카카오톡 대화문장 94억여건을 이루다 개발에 이용하는 과정에서, 카카오톡 대화에 포함된 이름과 휴대전화번호, 주소 등 개인정보를 삭제하거나 암호화 등 조치를 전혀 하지 않았다.

또 이루다 서비스 운영 과정에서는 20대 여성의 카카오톡 대화문장 약 1억 건을 응답 DB로 구축하고 이루다가 이 중 한 문장을 선택해 발화할 수 있도록 운영했다.

개인정보위는 텍스트앳과 연애의 과학 이용자들이 단지 로그인한 것으로는 이루다와 같은 '신규 서비스 개발' 목적을 위한 개인정보 이용에 동의했다고 보기 어렵다고 봤다.

그리고 이용자의 개인정보 자기결정권이 제한되는 등 이용자가 예측할 수 없는 손해를 입을 우려가 있다는 이유로 스캐터랩이 이용자의 개인정보를 수집한 목적을 벗어나 이용한 것이라고 판단했다.

스캐터랩은 또 2019년 10월부터 2021년 1월까지 개발자들의 코드 공유 및 협업 사이트인 '깃허브(Github)'에 이름 22건과 지명정보 34건, 성별, 대화 상대방과의 관계 등이 포함된 카카오톡 대화문장 1431건과 함께 AI 모델을 게시했다.

개인정보위는 이같은 행위가 '특정 개인을 알아보기 위해 사용될 수 있는 정보'를 포함했다는 점에서 개인정보보호법을 위반한 것이라고 판단했다.


son@news1.kr

이런 일&저런 일

    더보기