알리바바 '큐원3-맥스-싱킹' 공개…제미나이·클로드·GPT와 경쟁

1조 파라미터 추론모델…적응형 도구활용·복합추론 성능높여
경험 누적형 다회차 테스트 방식 도입…효율·정확도 개선

본문 이미지 - 알리바바 큐원3-맥스-싱킹(Qwen3-Max-Thinking) 공개(알리바바 제공) — 알리바바 큐원3-맥스-싱킹(Qwen3-Max-Thinking) 공개(알리바바 제공)

(서울=뉴스1) 김민석 기자 = 알리바바그룹이 1조 개 이상 파라미터를 탑재한 차세대 추론 모델 '큐원3-맥스-싱킹'(Qwen3-Max-Thinking)을 공개했다고 28일 밝혔다.

알리바바에 따르면 이 모델은 19개 주요 벤치마크 평가에서 앤트로픽의 '클로드 오푸스 4.5'(Claude Opus 4.5), 구글 '제미나이 3 프로', 오픈AI 'GPT-5.2-싱킹-하이' 등 최신 고성능 모델과 비교해 성능 면에서 경쟁력을 발휘했다. 과학·수학·코딩 문제 해결뿐 아니라 검색 도구를 활용한 전문가급 질의 답변에서도 상위권 성능을 기록했다.

알리바바 관계자는 "주요 성능 개선은 '적응형 도구 활용'(Adaptive Tool-use)과 '고도화된 테스트 단계 확장'(Test-time Scaling)'라는 2가지 기술 혁신에서 비롯됐다"며 "적응형 도구 활용 기능을 통해 모델이 대화 흐름에 따라 검색·메모리·코드 실행 기능을 자율적으로 선택해 문제를 해결하도록 설계했다"고 설명했다.

알리바바는 이를 위해 규칙 기반(rule-based)과 모델 기반(model-based) 피드백을 결합한 복합 학습 전략을 적용했다. 초기 파인튜닝 이후 학습을 통해 모델이 상황에 맞게 도구를 선택·사용한다고 설명했다.

또 검색과 메모리 기능은 환각(hallucination) 발생을 줄이고, 최신 정보에 접근할 수 있도록 해 응답의 신뢰도와 개인화 수준을 동시에 높였다.

알리바바는 '경험 누적형 다회차 테스트 확장'(experience-cumulative, multi-round test-time scaling) 방식도 도입했다. 이전 대화에서 도출한 핵심 정보를 반복 재추론하지 않고 불확실한 부분 해결에 집중할 수 있도록 설계한 방법론이다.

알리바바는 큐원3-맥스-싱킹을 자체 생성형 AI 서비스 '큐원 챗'(Qwen Chat)에 우선 적용했다. 개발자와 기업 고객은 AI 개발 플랫폼 '모델 스튜디오'(Model Studio)를 통해 큐원3-맥스-싱킹 API를 이용할 수 있다.

ideaed@news1.kr

용어설명

환각

환각(할루시네이션·Hallucination)은 생성형 인공지능(AI)이 실제로 존재하지 않거나 사실이 아닌 정보를 마치 사실인 것처럼 생성하는 현상을 말한다. 대규모언어모델(LLM)이 존재하지 않는 패턴이나 객체를 인식해 부정확한 답변을 내놓는 현상이다.

API

API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다.

알리바바 '큐원3-맥스-싱킹' 공개…제미나이·클로드·GPT와 경쟁

1조 파라미터 추론모델…적응형 도구활용·복합추론 성능높여
경험 누적형 다회차 테스트 방식 도입…효율·정확도 개선

뉴스1 부산ㆍ경남

뉴스1 제주

알리바바 '큐원3-맥스-싱킹' 공개…제미나이·클로드·GPT와 경쟁

1조 파라미터 추론모델…적응형 도구활용·복합추론 성능높여경험 누적형 다회차 테스트 방식 도입…효율·정확도 개선

1조 파라미터 추론모델…적응형 도구활용·복합추론 성능높여
경험 누적형 다회차 테스트 방식 도입…효율·정확도 개선