데이터 학습에 2조원 배상한 앤트로픽…한국형 AI 숙제는

국내 방송·신문협회, 네이버 '뉴스 무단 학습' 저작권 소송 중
與, 학습용 공공데이터 보장 법안 발의…저작권 분쟁 없이 학습

미국 인공지능(AI) 기업 앤트로픽의 로고. 앤트로픽은 대형 언어 모델 '클로드'를 개발했다. 2025.6.25 ⓒ 로이터=뉴스1 ⓒ News1 강민경 기자

(서울=뉴스1) 신은빈 기자 = 생성형 인공지능(AI) 기업이 AI 학습에 데이터를 활용한 대가로 배상금을 지급한 첫 주요 합의가 이뤄지면서 AI 저작권 분쟁의 이정표가 될 수 있다는 전망이 나온다.

국내에서는 네이버(035420) 등 AI 기업을 상대로 저작권 침해 소송이 진행 중이다. 이번 합의는 AI 학습에 데이터를 활용하는 업계 관행의 기준으로서 국내 소송 결과에도 영향을 미칠 가능성이 있다.

정부와 여당은 공공 데이터의 AI 학습용 활용을 허가하는 법안을 내놨다. 저작권 분쟁을 최소화하면서 데이터를 안정적으로 확보해 산업 진흥 발판을 마련하려는 시도다.

앤트로픽 2조원 배상…국내는 '뉴스 무단 학습' 소송

8일 뉴욕타임스와 블룸버그 통신 등 외신을 종합하면 AI 모델 '클로드' 개발사 앤트로픽은 클로드 훈련 과정에 책이 무단 사용됐다며 작가들이 제기한 집단 소송에서 15억 달러(약 2조 원)를 배상하기로 합의했다.

합의안에 따라 앤트로픽은 책 한 권당 약 3000달러씩 총 50만 권의 책에 배상금을 지급할 예정이다. 불법적으로 확보된 것으로 지목된 데이터세트는 파기하기로 했다.

이번 합의는 법원의 최종 승인을 앞두고 있지만 전문가들은 주요 AI 기업들의 유사한 저작권 침해 소송 결과를 가늠하는 중요한 기준점이 될 것이라고 내다본다.

앤트로픽을 고소한 작가 측 공동 수석 변호사 저스틴 넬슨은 성명을 통해 "이번 합의는 AI 기업과 창작자 모두에게 저작권이 있는 작품을 무단 사용한 것은 잘못된 일이란 강력한 메시지를 준다"고 말했다.

(한국방송협회 홈페이지 갈무리)

이에 따라 국내에서 진행 중인 AI 학습용 데이터의 저작권 분쟁에도 관심이 모인다.

1월 지상파 방송 3사는 네이버가 자사 AI 학습에 기사를 무단 활용하고 있다며 저작권 침해 소송을 제기했다. 소송은 현재 재판 절차 중에 있다. 지난해에는 한국방송협회가 네이버와 카카오(035720), 구글코리아, 마이크로소프트 등 국내외 정보기술(IT) 기업을 대상으로 학습용 데이터의 보상 협의가 필요하다는 의견서를 발송했다.

한국신문협회 역시 네이버가 AI 모델 '하이퍼클로바 X'에 뉴스를 무단 이용했다며 2월 공정거래위원회 제소를 추진했다. 협회는 내년 1월 시행될 'AI 기본법'(인공지능 발전과 신뢰 기반 조성 등에 관한 기본법)에 학습용 데이터의 출처 공개 의무화 조항을 반영하고 저작권법을 개정해 뉴스를 별도의 저작권 보호 대상으로 추가할 것을 주장했다.

한국방송협회 관계자는 "미국을 비롯한 여러 국가에서 AI 기업과의 학습용 데이터 이용 보상 협의 또는 합의가 이뤄지는 상황에서 우리나라도 명확한 기준을 정립해야 한다"고 말했다.

최민희 과학기술정보방송통신위원장이 26일 오전 서울 여의도 국회에서 열린 과학기술정보방송통신위원회 제17차 전체회의에서 인공지능(AI) 관련 법안들을 가결하고 있다. 2024.11.26/뉴스1 ⓒ News1 김민지 기자
"공공데이터 학습용으로" AI 기본법 개정안 발의

국회는 국가와 지자체가 보유·관리하는 공공 데이터를 AI 학습용으로 제공할 수 있는 법적 근거를 마련하고 있다. 저작권 분쟁에 휩싸이지 않으면서 AI 개발에 필요한 데이터를 안정적으로 확보하기 위한 국가 차원의 AI 진흥책으로 풀이된다.

4일 국회에서는 더불어민주당 주도로 이 같은 내용의 'AI 기본법' 개정안이 발의됐다. 그간 AI 학습용 데이터 구축과 관련된 시책은 과학기술정보통신부 장관의 책무로 규정되긴 했지만, 실제로 공공 데이터를 AI 산업에 적극적으로 활용할 수 있는 명확한 규정은 없었다.

이번 개정안은 과기정통부 장관이 관계 중앙행정기관의 장과 협의해 학습용 데이터의 생산·수집·관리·유통·활용 촉진 등에 필요한 시책을 추진하도록 명시했다.

또 국가와 지자체가 학습용으로 제공하는 공공 데이터의 적절한 품질 확보를 지원하도록 하는 조항을 신설했다.

개정안을 대표 발의한 최민희 의원은 "AI 경쟁은 결국 양질의 데이터 싸움"이라며 "양질의 데이터를 AI 개발에 활용하도록 제공할 수 있는 법적 근거가 필요하다"고 제안 이유를 설명했다.

bean@news1.kr