UNIST 연구팀, AI 모델 실행 속도 2.5배 줄이는 기술 개발
- 조민주 기자

(울산=뉴스1) 조민주 기자 = 딥러닝 AI 모델을 실행 가능한 프로그램 형태로 바꾸는 데 걸리는 시간을 절반 이상 줄일 수 있는 기술이 국내에서 개발됐다.
이슬기 울산과학기술원(UNIST) 컴퓨터공학과 교수팀이 개발한 오토튜닝 과정을 최대 2.5배 빠르게 할 수 있는 기법이 컴퓨터 시스템 분야 학회 OSDI(Operating Systems Design and Implementation)에서 채택됐다고 12일 UNIST가 밝혔다.
OSDI는 SOSP(Symposium on Operating Systems Principles)와 함께 컴퓨터 시스템 분야의 양대 학회로 꼽히는 곳이다.
이 교수 연구팀에 따르면 AI 모델이 실제 작동하려면 사람이 짠 고수준 프로그램인 AI 모델을 컴퓨터 연산장치가 이해할 수 있는 형태로 바꾸는 '컴파일' 과정이 필요하다. 예를 들어 '고양이 사진을 구분해 줘'란 명령은 수천 줄에 이르는 복잡한 계산 코드로 바꿔야 연산장치인 GPU나 CPU가 실행할 수 있다.
오토튜닝은 이 과정에서 가능한 수십만 개 코드 조합 중 연산 장치에서 가장 빠르고 효율적인 구성을 자동으로 찾아주는 기술이다. 그러나 이 같은 튜닝 시간은 경우에 따라 수십 분에서 수 시간까지 걸려 연산 부담이 크고 전력 소모도 많다는 점이 문제로 지적돼 왔다.
이와 관련 연구팀은 딥러닝 모델 안에 반복되는 계산 구조가 많다는 점에 주목, 유사한 연산자끼리 정보를 공유하는 방식으로 탐색 범위를 줄이고, 코드 조합을 일일이 새로 찾는 대신 기존 결과를 재활용하는 방식으로 오토튜닝 속도를 높였다.
실제 이 방식을 기존 오토튜닝 프레임워크(Ansor)에 적용한 결과, 동일한 성능 실행 코드를 생성하는 데 걸리는 시간이 CPU 기준 평균 2.5배, GPU 기준 평균 2배 단축됐다고 한다.
이에 대해 이 교수는 "컴파일 시간을 줄이면서도 GPU나 CPU를 직접 실험에 쓰는 횟수가 줄어 제한된 연산 자원을 효율적으로 쓸 수 있을 뿐만 아니라 전력 소모도 줄일 수 있다"고 말했다.
과학기술정보통신부 정보통신기획평가원의 지원을 받은 이번 연구엔 정이수 UNIST 연구원이 제1저자로 참여했다.
minjuman@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









