통계청, 데이터 프로그램 'KOSTAT-Did' 개발…"개인정보 노출 방지"
4일부터 마스킹·자료 고환 등 15종 서비스 제공
- 임용우 기자
(세종=뉴스1) 임용우 기자 = 통계청은 마이크로데이터에서 특정 개인·사업체를 식별할 수 없도록 처리하는 프로그램인 'KOSTAT-Did'를 개발했다고 4일 밝혔다.
해당 프로그램은 이날부터 국가통계작성기관을 대상으로 서비스가 제공된다.
최근 인공지능(AI) 대전환(AX) 시대를 맞아 AI 학습용 데이터 개방 등 개인·사업체 단위의 상세 자료 제공 요구가 증가하고 있다. 자료가 상세할수록 개인정보 노출 위험이 크게 커지는 만큼, 통계청 등은 비식별화 작업을 수작업으로 진행해 왔다.
KOSTAT-Did는 통계자료의 특성을 고려해 마스킹, 범주화, 통계적 잡음(노이즈) 첨가, 자료 교환(스와핑) 등 15종의 비식별화 기법을 지원한다.
프로그램을 통해 비식별화 처리가 완료되면 표준화된 평가 보고서가 자동 생성된다.
처리 전후의 정보손실도와 노출위험도를 시각화된 그래프와 정량화된 지표로 비교할 수 있는 기능도 제공한다.
통계청은 오는 10월부터 맞춤형 사용자 교육을 실시할 계획이다.
안형준 통계청장은 "통계청이 통계자료 개방과 관련한 지침이나 가이드라인 제공을 넘어, 실무에 적용할 수 있는 자동 프로그램을 보급한 것은 이번이 처음"이라며 "이번 비식별화 프로그램 보급을 계기로 통계청은 최신 정보보호 신기술 연구와 인프라를 확충해 437개 국가통계작성기관 전체가 보다 많은 데이터를 손쉽고 안전하게 개방할 수 있도록 적극 지원하겠다"고 말했다.
phlox@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









