과기정통부, 자율주행 E2E 데이터 가이드라인 국내 첫 발표
인지·판단·제어 통합 AI 학습 위한 데이터 규격 정립
국토부 실증도시·자율주행 AI 챌린지와 연계 추진
- 김민수 기자
(서울=뉴스1) 김민수 기자 = 과학기술정보통신부는 자율주행 인공지능(AI) 개발에 필요한 학습데이터를 국내 산·학·연이 함께 구축하고 공유할 수 있도록 '자율주행 E2E 데이터 구축 가이드라인 및 규격 정의서'를 발간했다고 19일 밝혔다.
엔드투엔드(E2E)는 센서 입력부터 차량 제어 명령까지 하나의 AI 모델로 구현하는 방식이다. 사전에 정한 규칙에 따라 움직이는 기존 방식과 달리, 정의되지 않은 상황에서도 유연하게 대응할 수 있는 점이 특징이다.
최근 글로벌 자율주행 기술은 하나의 AI가 인지·판단·제어를 통합 수행하는 E2E 방식으로 전환되고 있다. 웨이모, 바이두 등 글로벌 기업도 실증 거리를 늘리며 대규모 학습데이터 확보에 주력하고 있다.
그러나 국내에서는 기업과 기관이 자율주행 학습데이터를 개별적으로 구축해 왔다. 차종에 따라 센서 위치나 구성 방식이 다르면 데이터를 서로 활용하기 어려워 데이터 부족 문제가 이어졌다.
자율주행 경쟁의 무게중심이 알고리즘 개발에서 대규모 데이터 확보와 표준화된 공유 체계로 옮겨가면서, 학습데이터 규격 정립이 산업 경쟁력의 기반으로 떠오르고 있다.
이번 가이드라인은 자율주행 E2E AI 학습에 필요한 데이터 전 주기를 포괄한다. 데이터 수집, 가공, 정합·보정, 라벨링 등 학습데이터 구축 절차를 정의하고 센서 구성과 저장 포맷 등 수집 시스템 요구사항을 제시했다.
또 수집된 원시데이터 검증 방법과 시나리오 선별 등 데이터 가공 절차, 위치 보정과 공간 정합 방법, 라벨링 항목과 학습데이터 세트 규격 등을 담았다. 이를 기반으로 구축한 학습데이터 사례도 포함했다.
가이드라인은 범부처 자율주행 연구개발(R&D) 사업인 '자율주행기술개발혁신사업' 과제를 통해 개발됐다. 해당 사업은 2021년부터 2027년까지 과기정통부, 산업통상자원부, 국토교통부, 경찰청이 협업해 추진하는 사업이다.
과기정통부는 정보통신기획평가원(IITP), 자율주행기술개발혁신사업단(KADIF), 한국전자통신연구원(ETRI)과 함께 과제 목표를 상향 조정했고, ETRI가 주도해 가이드라인을 개발했다.
가이드라인 초안은 지난해 말 마련됐다. 이후 올해 4월 한국 ITS 학회 특별세션과 이달 자율주행 산·학·연 간담회 등을 통해 업계와 전문가 의견을 수렴했다.
과기정통부는 국토부와 협력해 도시 단위 대규모 E2E AI 학습데이터 구축을 지원하는 자율주행 실증도시 등에 가이드라인을 실제 적용하고 지속 보완할 계획이다.
가이드라인은 자율주행기술개발혁신사업단 홈페이지에서 확인할 수 있다. 학교, 기업, 연구소 등 누구나 자유롭게 열람할 수 있다.
kxmxs4104@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









