알리바바 '큐원3-맥스-싱킹' 공개…제미나이·클로드·GPT와 경쟁

1조 파라미터 추론모델…적응형 도구활용·복합추론 성능높여
경험 누적형 다회차 테스트 방식 도입…효율·정확도 개선

본문 이미지 - 알리바바 큐원3-맥스-싱킹(Qwen3-Max-Thinking) 공개(알리바바 제공)
알리바바 큐원3-맥스-싱킹(Qwen3-Max-Thinking) 공개(알리바바 제공)

(서울=뉴스1) 김민석 기자 = 알리바바그룹이 1조 개 이상 파라미터를 탑재한 차세대 추론 모델 '큐원3-맥스-싱킹'(Qwen3-Max-Thinking)을 공개했다고 28일 밝혔다.

알리바바에 따르면 이 모델은 19개 주요 벤치마크 평가에서 앤트로픽의 '클로드 오푸스 4.5'(Claude Opus 4.5), 구글 '제미나이 3 프로', 오픈AI 'GPT-5.2-싱킹-하이' 등 최신 고성능 모델과 비교해 성능 면에서 경쟁력을 발휘했다. 과학·수학·코딩 문제 해결뿐 아니라 검색 도구를 활용한 전문가급 질의 답변에서도 상위권 성능을 기록했다.

알리바바 관계자는 "주요 성능 개선은 '적응형 도구 활용'(Adaptive Tool-use)과 '고도화된 테스트 단계 확장'(Test-time Scaling)'라는 2가지 기술 혁신에서 비롯됐다"며 "적응형 도구 활용 기능을 통해 모델이 대화 흐름에 따라 검색·메모리·코드 실행 기능을 자율적으로 선택해 문제를 해결하도록 설계했다"고 설명했다.

알리바바는 이를 위해 규칙 기반(rule-based)과 모델 기반(model-based) 피드백을 결합한 복합 학습 전략을 적용했다. 초기 파인튜닝 이후 학습을 통해 모델이 상황에 맞게 도구를 선택·사용한다고 설명했다.

또 검색과 메모리 기능은 환각(hallucination) 발생을 줄이고, 최신 정보에 접근할 수 있도록 해 응답의 신뢰도와 개인화 수준을 동시에 높였다.

알리바바는 '경험 누적형 다회차 테스트 확장'(experience-cumulative, multi-round test-time scaling) 방식도 도입했다. 이전 대화에서 도출한 핵심 정보를 반복 재추론하지 않고 불확실한 부분 해결에 집중할 수 있도록 설계한 방법론이다.

알리바바는 큐원3-맥스-싱킹을 자체 생성형 AI 서비스 '큐원 챗'(Qwen Chat)에 우선 적용했다. 개발자와 기업 고객은 AI 개발 플랫폼 '모델 스튜디오'(Model Studio)를 통해 큐원3-맥스-싱킹 API를 이용할 수 있다.

ideaed@news1.kr

대표이사/발행인 : 이영섭

|

편집인 : 채원배

|

편집국장 : 김기성

|

주소 : 서울시 종로구 종로 47 (공평동,SC빌딩17층)

|

사업자등록번호 : 101-86-62870

|

고충처리인 : 김성환

|

청소년보호책임자 : 안병길

|

통신판매업신고 : 서울종로 0676호

|

등록일 : 2011. 05. 26

|

제호 : 뉴스1코리아(읽기: 뉴스원코리아)

|

대표 전화 : 02-397-7000

|

대표 이메일 : webmaster@news1.kr

Copyright ⓒ 뉴스1. All rights reserved. 무단 사용 및 재배포, AI학습 활용 금지.