KAIST 연구팀, ISPASS 2026 최우수 논문상 수상
AI 반도체 스타트업도 적극 활용 기대
차세대 AI 데이터센터 설계·최적화 기여
- 이동원 기자
(대전=뉴스1) 이동원 기자 = 박종세 한국과학기술원(KAIST) 전산학부 교수 연구팀이 개발한 거대언어모델(LLM) 서비스 인프라 시뮬레이터(simulator·가상 실험 소프트웨어) 연구가 컴퓨터 시스템 성능 분석 분야의 세계적 권위 학회인 'ISPASS 2026'(IEEE International Symposium on Performance Analysis of Systems and Software)에서 최우수 논문상을 수상했다.
29일 수상 소식을 전한 카이스트에 따르면 최근 LLM 기반 서비스가 검색, 코딩, 문서 작성, 업무 자동화, 에이전트 시스템 등 다양한 분야로 확대되면서, 이를 효율적으로 구동하는 차세대 서빙 인프라의 중요성이 커지고 있다.
기존 GPU 중심 환경을 넘어 앞으로는 TPU, NPU 같은 고성능 AI 가속기와 프로세싱 인 메모리(PIM), PNM 같은 메모리 중심 가속기, CXL 기반 메모리 확장 장치, 그리고 다중 서버 기반 분리형 서빙 구조가 통합적으로 활용될 전망이다.
LLMServingSim 2.0은 이러한 다양한 하드웨어 환경과 최신 서빙 소프트웨어 기법을 실제 구축 전에 시뮬레이션으로 신속하게 평가할 수 있도록 지원한다.
특히 prefill-decode 분리, prefix caching, KV cache offloading, MoE expert offloading 등 첨단 서빙 기법이 시스템 성능, 메모리 사용량, 전력 소모에 미치는 영향을 통합적으로 분석해 연구자와 산업계가 효율적 LLM 서빙 시스템을 설계하는 데 크게 기여할 것으로 기대된다.
본 시뮬레이터는 복잡한 데이터 처리, 요청 분배, 메모리 활용 등 현실적 AI 서비스 운영 상황을 상세히 재현하며, 분산형 인프라 환경까지 분석할 수 있어 차세대 AI 데이터센터 연구에도 활용할 수 있다.
이번 연구는 조재홍, 최현민 석사과정 학생이 공동 1저자로 참여했으며, 과학기술정보통신부, 정보통신기획평가원(IITP), 한국전자통신연구원(ETRI), SK하이닉스의 지원을 통해 진행됐다.
박종세 교수는 “AI 서비스의 경쟁력은 모델뿐 아니라 이를 안정적이고 효율적으로 운영하는 인프라 기술에서 결정된다”며 “이번 시뮬레이터가 차세대 AI 인프라의 빠른 개발과 최적화에 중추적 역할을 할 것”이라고 밝혔다.
newskija@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









