AI 시각 더 밝게…적은 메모리로 고해상도 업샘플링 기술 개발

KAIST-MIT-MS 국제공동연구팀

업샘플링 기술 적용 비교 모식도 (AI 생성이미지·KAIST 제공) /뉴스1

(대전=뉴스1) 김종서 기자 = 한국과학기술원(KAIST)은 전기및전자공학부 김창익 교수 연구팀이 미국 사추세츠공과대학교(MIT), 마이크로소프트 연구진과의 공동 연구를 통해 제한된 GPU 메모리만으로도 인공지능(AI)의 시각 성능을 높일 수 있는 범용 기술 '업샘플 애니띵'을 개발했다고 17일 밝혔다.

최근 휴머노이드 로봇과 자율주행 시스템, 세계모델 기반 인공지능은 연산 속도를 높이고 메모리 사용량을 줄이기 위해 입력 영상을 저해상도 특징 정보로 압축해 활용하고 있다.

그러나 압축 과정에서 작은 물체나 얇은 구조물, 미세한 결함과 같은 중요한 시각 정보가 손실되는 문제가 발생한다. 반대로 모든 영상을 처음부터 고해상도로 처리하면 막대한 GPU 메모리와 연산 자원이 필요해 실시간 처리가 어려워진다.

이는 스마트폰과 같은 소형 기기나 기동성이 중요한 로봇이 주변 환경을 정밀하게 인식해야 하는 상황에서 오랫동안 해결되지 않은 과제로 남아 있었다.

특히 물류·제조·자율주행·의료·위성영상·휴머노이드 로봇과 같이 정밀한 고해상도 이미지 분석이 필요한 분야에서는 메모리와 연산 자원이 제한된 환경에서도 효율적으로 픽셀 단위 정보를 복원할 수 있는 범용 업샘플링 기술 필요성이 크다.

연구팀은 입력 이미지의 경계와 구조 정보를 활용해 저해상도 특징 정보를 고해상도로 복원하는 학습 없는 업샘플링 기술을 개발했다.

기존 기술은 새로운 환경이나 데이터에 적용하기 위해 별도의 재학습이나 복잡한 최적화 과정을 거쳐야 했다. 반면 업샘플 애니띵은 입력 이미지 한 장만으로 최적의 복원 방식을 찾아낼 수 있어 다양한 환경에 즉시 적용할 수 있다.

또 모든 시각 정보를 고해상도로 저장·처리하지 않고 핵심 정보만 압축해 활용함으로써 GPU 메모리 사용량을 크게 줄였다. 연구팀은 AI 연구에서 널리 활용되는 224×224 크기 이미지(약 5만개 픽셀) 기준 0.4초가량의 짧은 계산만으로 원본에 가까운 시각 정보를 복원했다. GPU 메모리 효율은 최대 16배까지 향상시키는 성과를 거뒀다.

이번 기술은 스마트폰과 같은 소형 기기는 물론, 작은 물체를 정확하게 식별하고 조작해야 하는 휴머노이드 로봇, 자율주행 시스템, 온디바이스 AI 등 다양한 차세대 인공지능 분야에 폭넓게 활용될 것으로 기대된다.

김 교수는 "이번 기술은 적은 자원으로도 인공지능의 시각 정밀도를 크게 높일 수 있는 알고리즘으로, 휴머노이드 로봇과 온디바이스 AI의 실용화를 앞당길 것으로 기대한다"며 "CVPR에서 성능뿐 아니라 계산 효율성과 연구 투명성까지 인정받았다는 점에서 더욱 의미가 크다"고 말했다.

KAIST 서민석 박사과정 학생이 제1 저자로 참여한 이번 성과는 인공지능 및 컴퓨터 비전 분야 국제 학회 'CVPR 2026'에서 발표됐다.

학회 논문 채택에 이어 계산 자원의 효율적 활용을 인정받아 전체 1위인 'CVPR 컴퓨트 골드 스타'를 수상하고 연구 과정의 투명성과 재현 가능성 부문 '트랜스패런시 챔피언'에 선정됐다.

jongseo12@news1.kr