GIST '스타크래프트 II' 상황 1만 배 빠르게 예측하는 기술 개발
자율주행, 주식거래 등 실세계 응용 문제 해결 위한 의사결정 활용 기대
- 조영석 기자
(광주=뉴스1) 조영석 기자 = 광주과학기술원(GIST)은 AI대학원 안창욱 교수 연구팀이 몬테카를로 트리 탐색(MCTS) 방법을 '스타크래프트 II'에 적용해 기존 MCTS에 비해 1만 배 빠르게 게임 상황을 예측, 탐색 효율성과 성능 안정성을 획기적으로 향상시켰다고 25일 밝혔다.
이번 연구 성과는 게임뿐 아니라 실세계 문제에도 적용할 수 있을 것으로 기대된다.
'몬테카를로 방법(MCTS)'이란 함수의 값을 확률적으로 계산하는 알고리즘으로 도박의 도시로 유명한 모나코 공국 몬테카를로(Monte-Carlo)에서 유래됐다.
무작위 시뮬레이션을 기반으로 상황 예측에 대한 기댓값을 추정하는 기존 MCTS 기법은 실행 시간이 오래 걸리고 복잡해 높은 연산량이 요구되는 실시간 전략 게임(RTS)에 적용하는 데 한계가 있다.
연구팀은 가상으로 재현된 게임 데이터를 학습해 대체 모델을 구축하고 이를 활용해 시뮬레이션의 일부 결과만으로 상황 예측에 대한 기댓값을 추정할 수 있는 대체 모델 기반 MCTS 기법을 제안, 스타크래프트 II에 적용해 그 성능을 검증했다.
연구팀이 개발한 기법은 대체 모델을 활용해 게임 내 상태에 대한 기댓값을 시뮬레이션 없이 바로 추정, 시뮬레이션 추론 시간을 밀리초(1천분의 1초)에서 초 단위 범위로 줄이는 데 성공했다.
연구팀은 또 연구의 확장성과 재현성을 높이기 위해 대체 모델 학습을 위한 데이터 수집과 스타크래프트 II에서 데이터 분석이 가능한 자체 소프트웨어를 구현하는 데 성공했다.
수집된 데이터를 기반으로 대체 모델을 학습한 후 적용한 결과 게임의 진행 결과를 기존 MCTS 대비 1만 배 빠르게 예측했다.
안창욱 교수는 "이번 연구 성과는 몬테카를로 트리 탐색 기법의 활용이 불가능하던 실시간 게임 환경에서 각 개체의 공격이나 후퇴 등 실시간 행동 결정을 가능하게 했다는 데 의의가 있다"며 "향후 상충하는 이해관계 갖는 실세계 응용 문제(자율주행, 주식거래 등)에 있어 실시간 의사결정을 내리는 데 활용될 수 있을 것으로 기대된다"고 말했다.
kanjoys@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









