국가대표 AI 5개 모델 평가에 '개별 벤치마크' 점수 도입

1차 평가 진행 중…"정예팀 과반 반대에도 강행" 주장도

배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 청와대 AI미래기획수석 등 참석자들이 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 기념촬영을 하고 있다. 2025.12.30/뉴스1 ⓒ News1 구윤성 기자
배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 청와대 AI미래기획수석 등 참석자들이 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 기념촬영을 하고 있다. 2025.12.30/뉴스1 ⓒ News1 구윤성 기자

(서울=뉴스1) 김정현 이기범 기자 = 국가대표 AI를 선발하는 정부의 '독자 파운데이션 모델'(AI) 프로젝트에서 정부가 평가 기준에 공통 벤치마크 외에 개별 벤치마크 점수를 넣었다.

13일 AI 업계에 따르면 과학기술정보통신부는 네이버클라우드·업스테이지·SK텔레콤·NC AI·LG AI연구원 등 5개 정예팀의 1차 평가에 개별 벤치마크 기준을 추가했다.

현재 과기정통부가 선발한 전문 심사위원단은 지난 5일부터 5개 정예팀의 AI 모델의 1차 평가를 진행 중이다.

당초 심사위원단은 객관적인 모델 평가를 위해 표준화된 공통 벤치마크를 통한 AI 모델 성능 검증을 진행할 예정이었다. 결과적으로 공통 벤치마크외에 업체별 개별 벤치마크 2개씩을 선택해 평가하는 것으로 확정됐다.

이를 두고 과기정통부 관계자는 "5개 기업간 사업 목표 및 추구하는 모델들이 달라서 협의해서 조금씩 다른 평가 방식을 도입했다"면서도 "기업별로 어떤 개별 벤치마크를 선택해 평가에 반영하는지는 현재는 공개적으로 밝히기 어렵다"고 말했다.

현재 5개 정예팀 중 네이버클라우드 한 곳만 '옴니모달' AI 모델을 개발 중이다. 네이버클라우드 측은 그간 일반적인 대형언어모델(LLM)과 옴니모달 모델을 같은 잣대로 평가하는 것이 불합리하다는 목소리를 내온 것으로 전해졌다.

다만 5개 정예팀 중 과반은 개별 벤치마크 도입을 반대한 것으로 알려졌다.

한 업계 관계자는 "일부 정예팀에서는 강한 반대 의견도 냈지만 결국 개별 벤치마크 평가 기준이 도입된 걸로 안다"고 말했다.

한편 과기정통부는 심사위원단의 평가를 오는 15일 중 마무리할 계획이다. 결과 발표는 평가 종료 후 조속한 시일 내에 하겠다는 방침이다.

Kris@news1.kr

대표이사/발행인 : 이영섭

|

편집인 : 채원배

|

편집국장 : 김기성

|

주소 : 서울시 종로구 종로 47 (공평동,SC빌딩17층)

|

사업자등록번호 : 101-86-62870

|

고충처리인 : 김성환

|

청소년보호책임자 : 안병길

|

통신판매업신고 : 서울종로 0676호

|

등록일 : 2011. 05. 26

|

제호 : 뉴스1코리아(읽기: 뉴스원코리아)

|

대표 전화 : 02-397-7000

|

대표 이메일 : webmaster@news1.kr

Copyright ⓒ 뉴스1. All rights reserved. 무단 사용 및 재배포, AI학습 활용 금지.