"언슬로스 지원으로 LLM학습 향상"…엔비디아 '네모트론3' 공개

나노·슈퍼·울트라 3종 라인업…하이브리드 MoE 설계
DGX스파크로 300억 파라미터 모델구동…로컬 AI 파인튜닝 가속

젠슨 황 엔비디아 CEO. FILES-US-CHINA-AI-TRADE-TECH-NVIDIA ⓒ AFP=뉴스1

(서울=뉴스1) 김민석 기자 = 엔비디아는 차세대 오픈 모델 제품군 '네모트론 3'(Nemotron 3)와 미세조정(Fine-tuning) 프레임워크 '언슬로스'(Unsloth)를 공개한다고 15일(현지시간) 발표했다.

네모트론 3 제품군은 △나노(Nano) △슈퍼(Super) △울트라(Ultra) 등 3가지 모델로 구성됐다. 각 모델은 하이브리드 전문가혼합(MoE) 아키텍처 기반으로 설계돼 정확도와 효율성을 높였다.

상위 모델인 '슈퍼' '울트라'는 내년 상반기 출시 예정이다.

언슬로스 미세 조정 요구 사항(엔비디아 제공)

엔비디아 관계자는 "네모트론 3 나노 30B-A3B는 추론 토큰을 (전작 대비) 최대 60% 줄여 비용을 절감하면서 100만 토큰의 컨텍스트 윈도(Context Window)를 지원해 장시간 작업 시에도 정보 유지 능력도 높다"고 말했다.

엔비디아는 오픈소스 프레임워크인 '언슬로스'와의 협업도 강화했다. 언슬로스는 복잡한 수학적 연산을 GPU에 최적화된 커널로 변환해 메모리 사용량은 줄이고 훈련 속도는 높여준다.

엔비디아 관계자는 "개발자들은 언슬로스를 통해 효율적인 파라미터 미세 조정(LoRA)부터 강화 학습에 이르기까지 다양한 훈련 방식을 RTX 데스크톱과 노트북, 워크스테이션 등 로컬 환경에서 손쉽게 수행할 수 있다"고 설명했다.

엔비디아 네모트론 3 오픈 모델 제품군(엔비디아 제공)

엔비디아는 지포스 RTX AI PC와 소형 슈퍼컴퓨터인 'DGX 스파크'(DGX Spark) 환경에서 개인화 AI 어시스턴트 구축을 가속한다는 구상이다.

언슬로스 프레임워크를 적용하면 엔비디아 GPU 환경에서 '허깅페이스' 트랜스포머 라이브러리 성능을 최대 2.5배까지 끌어올릴 수 있다.

그레이스 블랙웰 아키텍처 기반의 DGX 스파크는 통합 CPU-GPU 메모리 128GB를 탑재해 일반 소비자용 GPU로는 처리가 힘든 300억 개 이상의 파라미터 모델을 구동한다.

엔비디아 관계자는 "최신 워크플로는 PC 환경에서 생성형 AI와 에이전틱 AI의 무한한 가능성을 보여준다"며 "네모트론 3와 언슬로스는 개발자가 맞춤형 AI 애플리케이션을 구축하는 데 필요한 핵심 기반이 될 것"이라고 했다.

ideaed@news1.kr