엔비디아, 개방형 추론모델 '라마 네모트론 모델' 제품군 공개
"다른 개방형 모델 대비 5배 빨라"…MS·SAP 등 협력 확대
에이전틱 AI 구축 도구·소프트웨어 플랫폼 패키지 제공
- 김민석 기자
(서울=뉴스1) 김민석 기자 = 엔비디아가 18일(현지시간) 미국 새너제이에서 열린 'GTC'에서 개방형 '엔비디아 라마 네모트론'(NVIDIA Llama Nemotron) 모델 제품군을 공개했다.
라마 모델 기반 엔비디아 라마 네모트론 모델은 사후 훈련(Post-Training) 과정으로 성능을 대폭 높였다. 이를 통해 개발자와 기업들이 복잡한 작업을 처리할 수 있는 고급 인공지능(AI) 에이전트를 구축하는 데 즉시 활용 가능한 기반을 제공한다.
엔비디아에 따르면 라마 네모트론 모델은 처리 속도가 다른 주요 개방형 추론 모델 대비 5배 빠르다. 정확도도 기본 모델보다 최대 20% 높였다.
제품군은 △나노(Nano) △슈퍼(Super) △울트라(Ultra) 3가지로 엔비디아 NIM 마이크로서비스로 제공한다.
나노 모델은 PC와 엣지 디바이스에, 슈퍼 모델은 단일 GPU, 울트라 모델은 다중 GPU 서버 환경에 각각 최적화됐다.
이미 마이크로소프트(MS), 액센츄어, SAP, 서비스나우 등은 라마 네모트론 모델을 활용하고 있다.
엔비디아 관계자는 "MS는 라마 네모트론 모델을 애저 AI 파운드리 플랫폼에 추가해 고객 서비스를 강화하고 있고 SAP는 비즈니스 AI 설루션과 AI 코파일럿 '줄'을 발전시키는 데 이 모델을 활용하고 있다"고 설명했다.
엔비디아는 AI 엔터프라이즈 소프트웨어 플랫폼을 통해 에이전틱 AI 구축을 위한 다양한 도구를 제공한다.
AI-Q 블루프린트는 기업이 AI 에이전트에 지식을 연결하도록 지원한다. AI 데이터 플랫폼은 AI 쿼리 에이전트가 포함된 기업 인프라를 위한 참조 설계를 제공한다.
NIM 마이크로서비스는 복잡한 에이전틱 AI 앱 추론을 최적화해 준다. 네모 마이크로서비스는 AI 에이전트가 인간과 AI 생성 피드백을 통해 지속적으로 학습할 수 있는 데이터 플라이휠을 구축할 수 있도록 한다.
ideaed@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









