中 딥시크 추론 AI 모델 훈련비용 '4억'…오픈AI 대비 300분의 1
네이처 동료심사 논문 발표 R1 훈련비용 최초 공개
- 신기림 기자
(서울=뉴스1) 신기림 기자 = 중국 인공지능(AI) 개발사 딥시크가 자사 추론 중심 모델 R1의 훈련 비용이 29만4000달러(약 4억원)라고 처음 밝혔다. 챗GPT를 개발한 미국 오픈AI가 2023년 "1억 달러 이상"이라고 밝힌 기초 모델 훈련 비용과 비교하면 약 0.3%, 즉 300분의 1 수준에 불과하다.
18일(현지시간) 로이터에 따르면 딥시크는 전날 학술전문지 네이처(Nature)에 동료심사를 거친 논문을 통해 관련 비용을 처음 공개했다.
논문에 따르면 R1은 미국 반도체 엔비디아의 H800 칩 512개를 활용해 총 80시간 훈련됐으며, 비용은 29만4000달러로 집계됐다. 훈련비용은 딥시크가 처음 R1을 공개했던 지난 1월 초기 논문에는 포함되지 않았던 정보다.
오픈AI의 샘 올트먼 최고경영자(CEO)는 2023년 기초 모델 훈련에 "1억 달러 이상"이 들었다고 밝힌 바 있다. 단순 비교하면 딥시크의 비용은 수백 배 저렴한 셈이다.
하지만 딥시크의 비용과 기술에 대한 의문은 끊임없이 제기됐다. H800 칩은 미국이 2022년 10월부터 H100·A100 칩의 대중국 수출을 금지한 이후 엔비디아가 중국 시장용으로 설계한 제품이다. 미국 당국은 딥시크가 여전히 대량의 H100 칩을 확보했다고 의심했으나, 엔비디아는 딥시크가 합법적으로 취득한 H800 칩을 사용했다고 설명했다.
딥시크는 이번 논문 부속 문서에서 처음으로 A100 칩을 보유하고 있으며, 개발 준비 단계에서 이를 사용했다고 인정했다. 연구진은 "소규모 모델 실험 준비 과정에서 A100 GPU를 활용했다"며, 이후 본격 훈련에는 H800 칩 클러스터에서 진행됐다고 밝혔다.
딥시크는 '오픈AI 모델을 증류(distillation)했다'는 미국 측의 의혹에 간접적이지만 처음으로 입장을 밝혔다. 증류란 기존 AI 모델이 학습한 지식을 새로운 모델이 간접적으로 흡수하는 방식으로, 막대한 비용과 자원을 절감할 수 있다. 딥시크는 그동안 증류가 성능 향상과 비용 절감에 유리하다고 주장해왔다.
딥시크는 지난 1월 메타의 오픈소스 모델 라마(Llama)를 일부 활용했다고 인정한 바 있다.
이번 네이처 논문에서는 '웹 크롤링 데이터(인터넷의 웹 페이지에서 긁어모은 데이터)'가 오픈AI 모델이 생성한 답변을 상당수 포함하기 때문에 결과적으로 다른 모델의 지식을 간접적으로 흡수했을 가능성이 있다고 딥시크는 밝혔다. 다만, 의도적인 것이 아니라 부수적인 결과라고 딥시크는 강조했다.
딥시크는 지난 1월 저비용 AI 시스템을 공개하며 전 세계 투자자들의 주목을 받았다. 당시 투자자들은 딥시크의 모델이 미국 AI 선두 기업들의 지배력을 위협할 수 있다고 우려해 미국의 주요 기술주를 매도하기도 했다.
한편, 딥시크의 창업자 량원펑은 신제품을 일부 출시하는 것 외에는 대외 활동을 자제했는데 이번 네이처 논문의 공동 저자로 이름을 올리며 대외적으로 연구 활동을 알렸다.
shinkirim@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









