통계청, 데이터 프로그램 'KOSTAT-Did' 개발…"개인정보 노출 방지"

4일부터 마스킹·자료 고환 등 15종 서비스 제공

KOSTAT-Did 실행화면. (통계청 제공)

(세종=뉴스1) 임용우 기자 = 통계청은 마이크로데이터에서 특정 개인·사업체를 식별할 수 없도록 처리하는 프로그램인 'KOSTAT-Did'를 개발했다고 4일 밝혔다.

해당 프로그램은 이날부터 국가통계작성기관을 대상으로 서비스가 제공된다.

최근 인공지능(AI) 대전환(AX) 시대를 맞아 AI 학습용 데이터 개방 등 개인·사업체 단위의 상세 자료 제공 요구가 증가하고 있다. 자료가 상세할수록 개인정보 노출 위험이 크게 커지는 만큼, 통계청 등은 비식별화 작업을 수작업으로 진행해 왔다.

KOSTAT-Did는 통계자료의 특성을 고려해 마스킹, 범주화, 통계적 잡음(노이즈) 첨가, 자료 교환(스와핑) 등 15종의 비식별화 기법을 지원한다.

프로그램을 통해 비식별화 처리가 완료되면 표준화된 평가 보고서가 자동 생성된다.

처리 전후의 정보손실도와 노출위험도를 시각화된 그래프와 정량화된 지표로 비교할 수 있는 기능도 제공한다.

통계청은 오는 10월부터 맞춤형 사용자 교육을 실시할 계획이다.

안형준 통계청장은 "통계청이 통계자료 개방과 관련한 지침이나 가이드라인 제공을 넘어, 실무에 적용할 수 있는 자동 프로그램을 보급한 것은 이번이 처음"이라며 "이번 비식별화 프로그램 보급을 계기로 통계청은 최신 정보보호 신기술 연구와 인프라를 확충해 437개 국가통계작성기관 전체가 보다 많은 데이터를 손쉽고 안전하게 개방할 수 있도록 적극 지원하겠다"고 말했다.

phlox@news1.kr