업스테이지, '솔라 오픈 100B' 中 표절 의혹 반박…공개 검증

(업스테이지 제공)/뉴스1
(업스테이지 제공)/뉴스1

(서울=뉴스1) 김정현 기자 = 업스테이지가 최근 제기된 '솔라 오픈 100B' 모델의 표절 의혹에 공개 검증을 실시했다.

김성훈 업스테이지 대표는 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상의 현장 설명회를 개최했다. 의혹을 제기한 당사자인 고석현 사이오닉AI 최고경영자(CEO)도 초청했다.

이날 김 대표는 모델 학습 로그와 체크포인트 등 개발 관련 주요 데이터를 공개하며 제기된 의혹을 반박했다.

먼저 타 모델의 가중치를 재사용했다는 주장은 "해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역"이라며 "오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표"라고 강조했다.

또 유사성 판단에 사용된 '코사인 유사도' 역시 적절한 비교 기준이 아니라고 했다. 코사인 유사도는 벡터의 방향만 비교하는 단순 지표라, 독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스럽다는 설명이다.

업스테이지는 이 대신 '피어슨 상관계수'로 재분석한 결과, 솔라 오픈과 타 모델 간 패턴이 전혀 일치하지 않았다고 밝혔다.

김 대표는 "솔라 오픈이 타 모델의 토크나이저를 그대로 사용했다는 주장 역시 사실과 다르다"며 "해당 모델의 어휘수는 약 15만 개, 솔라 오픈은 19만 6000개로, 공통 어휘는 약 8만 개(41%) 수준"이라고 말했다.

또한 특정 모델의 소스코드를 가져와 라이선스를 조작했다는 의혹도 사실과 다르다고 덧붙였다.

김 대표는 "의견을 주고 받는 건강한 토론은 환영하나 이와 같은 허위 사실을 단정적으로 전달하는 행위는 업스테이지와 정부 노력의 의미를 심각하게 훼손하는 것"이라며 사과를 촉구했다.

한편 고 CEO는 지난 1일 자신의 페이스북에 깃허브 보고서를 인용해 업스테이지가 개발한 AI 모델 '솔라 오픈 100B'가 중국 기업 지푸AI의 'GLM-4.5-에어' 모델에서 파생됐다는 의혹을 제기했다. 최초 의혹을 제기한 해당 글은 현재는 삭제된 상태다.

Kris@news1.kr