"학습시간 줄어도 성능 그대로"…UNIST, 3D 점 데이터 압축기술 개발

3D 데이터셋 증류 기술 개요.(UNIST 제공. 재판매 및 DB금지)/뉴스1

(울산=뉴스1) 김세은 기자 = 자율주행차나 로봇의 눈 역할을 하는 사물 인식 인공지능(AI) 모델이 학습할 데이터 양을 요약하면서도 성능을 유지하는 기술이 나왔다.

심재영 울산과학기술원(UNIST) 인공지능대학원 교수팀은 3D 포인트 클라우드 데이터를 압축해 학습 효율을 높이는 '데이터 증류'(dataset distillation) 기술을 개발했다고 1일 밝혔다.

'데이터 증류'는 대규모 학습 데이터 중 요점만을 추출해 새로운 요약 데이터를 만들어내는 기술이다.

'3D 포인트 클라우드 데이터'는 사물을 점으로 표현해 놓은 데이터로서 점들의 배열에 정해진 순서가 없고 물체가 회전해 있는 경우가 많아 데이터 증류 과정의 어려움을 겪는 경우가 많다. 데이터 증류는 원본 데이터와 요약 데이터의 특징을 비교하는 방식으로 완성도를 높이기 때문이다.

좌측부터 심재영 교수, 임재영 연구원(제1저자), 김동욱 연구원(UNIST 제공. 재판매 및 DB금지)/뉴스1

심 교수 연구팀은 이 같은 문제를 해결한 데이터 증류 기술을 개발했다고 설명했다. 순서가 제각각인 점 데이터의 의미 구조를 자동으로 정렬해 주는 손실 함수(SADM)와 물체의 회전 각도를 AI가 스스로 최적화해 학습하는 방향 최적화(learnable rotation) 기법이 적용된 기술이다.

연구팀이 개발한 기술은 원본 대비 수십 분의 1 수준으로 데이터를 줄여도 모델 정확도를 유지하는 것으로 확인됐다. 특히 특정 데이터 세트에서는 데이터를 원본 크기의 25분의 1로 줄인 요약 데이터로 학습해도 80.1%의 인식 정확도를 기록, 전체 데이터로 학습했을 때의 87.8%와 큰 차이가 나지 않았다.

심 교수는 "이번 기술은 3D 점 데이터의 무질서한 구조와 회전 불확실성으로 인해 기존 기술들이 겪던 매칭 오류를 근본적으로 해결한 것"이라며 "자율주행, 드론, 로봇, 디지털 트윈 등 대규모 3D 데이터 활용이 필요한 분야에서 AI 학습 비용과 시간을 크게 줄이는 데 기여할 수 있을 것"이라고 말했다.

이번 연구 결과는 3대 인공지능 분야 국제학회인 '신경정보처리시스템학회(NeurIPS) 2025'의 정식 논문으로도 채택됐다. 이번 연구 수행은 과학기술정보통신부 한국연구재단, 정보통신기획평가원의 지원을 받았다.

syk000120@news1.kr