(서울=뉴스1) 김민재 기자 = SK텔레콤이 초거대 인공지능(AI) 모델 '에이닷 엑스 K1'(A.X K1) 기술 보고서를 공개했다. 최근 정부 '독자 AI 파운데이션 모델' 프로젝트를 둘러싼 외산 기술 의존 우려와 달리, 설계 단계부터 독자 개발한 모델임을 명시하는 모양새다.
8일 SK텔레콤 기술 보고서에 따르면 에이닷 엑스 K1은 수학과 코딩 등 고난도 추론 영역에서 매개변수 685B(6850억 개) 규모의 '딥시크-V3.1'을 앞섰다.
에이닷 엑스 K1은 매개변수 519B(5190억 개) 규모의 초거대 AI 모델이다. SK텔레콤이 크래프톤 등과 컨소시엄을 구성해 개발했다.
해당 모델은 미국 고등학생 수학 올림피아드 문제인 'AIME25' 벤치마크에서 89.8점을 기록해 88.4점의 딥시크를 제쳤다.
LiveCodeBench로 측정한 코딩 활용도 점수는 영어 기반 75.8점, 한국어 기반 73.1점을 기록했다. 이는 딥시크-V3.1(영어 기반 69.5점·한국어 기반 66.2점) 대비 각각 109%, 110% 수준 성능이다.
SK텔레콤은 보고서 초록에 해당 모델이 '프롬 스크래치' 모델이라고 명시했다. 최근 네이버클라우드가 알리바바의 오픈 소스 기술을 차용하며 생겨난 논란과 거리를 둔 셈이다.
SK텔레콤 컨소시엄은 복잡한 한국어 시각 콘텐츠를 해석하기 위해 자체 개발한 시각-언어 모델을 도입했다.
대량의 PDF 문서에서 텍스트를 추출하기 위해서는 SK텔레콤의 자체 모델인 A.X 4.0 VL Light을 파인튜닝해 사용했다.

이번 모델의 또 다른 핵심 특징은 '씽크 퓨전'(Think-Fusion) 기술이다. 이는 하나의 모델로 복잡한 추론 모드와 일반 모드를 둘 다 구동하는 기술이다.
통상 주요 빅테크 기업은 추론 특화 모델과 일반 모델을 분리했다. 오픈AI가 일반 모델인 'GPT-4o'와 추론 특화 모델 'o1'을 구분하는 것이 대표적 사례다.
에이닷 엑스 K1은 '모드 오버랩'(Mode-Overlap) 학습 방식으로 이를 통합했다. 동일한 질문에 '단계적으로 생각하는 답변'과 '즉답형 답변'을 동시에 학습시킨 뒤 상황에 맞춰 사고의 깊이를 조절하는 식이다.
크래프톤 AI 조직은 이 과정에서 최적의 모델 병합 비율을 찾아내는 데 기여했다. 크래프톤은 일반 모델과 추론 모델을 결합할 때 발생하는 '모드 혼동'(Mode Confusion) 현상을 억제하고 성능 균형을 맞췄다.
SK텔레콤은 이러한 성과를 기반으로 연내 멀티모달 기능을 추가하고, 파라미터를 조(Trillion) 단위로 확장해 글로벌 모델과의 기술 격차를 좁힐 계획이다.
minjae@news1.kr
