(서울=뉴스1) 김민석 기자 = 인텔은 차세대 인공지능(AI) 가속 칩인 '가우디 3'(Gaudi 3)가 IBM 클라우드에 도입된다고 8일 밝혔다.
가우디 3는 △생성형 AI △대규모언어모델(LLM) 추론 △파인튜닝 △검색 증강 생성(RAG) 워크로드에 최적화한 설계를 채택했다.
인텔 관계자는 "가우드 3 AI 칩은 개방형 개발 프레임워크를 지원한다" 며 "멀티모달 LLM과 최신 AI 트렌드에 맞춘 아키텍처를 갖췄다"고 설명했다.
가우드 3는 IBM 클라우드를 통해 독일 프랑크푸르트, 미국 워싱턴 D.C., 텍사스 댈러스 리전에 우선 적용된다. IBM 가상 프라이빗 클라우드(VPC) 가상 서버를 통해 접근할 수 있다.
인텔은 레드햇 오픈시프트와 IBM 왓슨엑스(watsonx)와 통합도 2분기 내 완료할 예정이다.

인텔이 의뢰한 시그널65 최신 벤치마크 결과에 따르면 가우디 3은 메타의 Llama-3.1-405B-Instruct-FP8 모델 실행 시 경쟁 제품 대비 92% 높은 비용 효율성을 기록했다.
처리량도 IBM의 Granite-3.1-8B-Instruct 모델 기준 소규모 워크로드에서 초당 토큰 처리량이 43% 높았다.
사우라브 쿨카니 인텔 데이터센터 AI 전략 담당은 "가우디 3의 IBM 클라우드 도입으로 기업 고객은 추론과 파인튜닝에 최적화된 성능으로 생성형 AI 워크로드를 확장할 수 있게 됐다"며 "전 세계 기업들은 비용 효율성을 높인 AI를 구현할 수 있을 것"이라고 말했다.
ideaed@news1.kr