통계청, 개인정보 노출위험 예방 ‘KOSTAT-Did’ 보급

김지현 기자 (kjh@dailian.co.kr)

입력 2025.09.04 12:00  수정 2025.09.04 12:00

KOSTAT-Did…엑셀 기반 자동 프로그램

마스킹, 범주화, 자료교환 등 비식별화 지원

KOSTAT-Did 비식별화 처리 결과 시각화 화면.ⓒ통계청

통계청은 4일부터 국가통계작성기관을 대상으로 통계자료(마이크로데이터)의 개인정보 노출 위험을 평가하고 특정 개인·사업체를 식별할 수 없도록 처리하는 프로그램인 ‘KOSTAT-Did (De-identification)’을 서비스한다고 밝혔다.


최근 인공지능 대전환(AX) 시대를 맞아 인공지능 학습용 데이터 개방 등 개인·사업체 단위의 상세 자료제공 요구가 증가하고 있다.


그러나 국가통계작성 기관들은 마이크로데이터 전면 개방의 가장 큰 장애 요인으로 개인정보 노출 위험을 꼽고 있다. 제공되는 자료가 상세해질수록 정보의 유용성은 높아지지만, 개인정보 노출 위험도 함께 증가하기 때문이다.


이에 통계청은 2023년 통계작성 및 통계자료 제공을 위한 비식별화 가이드라인을 배포해 개인 및 단체 기밀 보호와 통계적 유용성 간 균형을 권고한 데 이어 2024년에는 담당자들이 수작업으로 처리해 온 비식별화 업무를 지원하기 위해 엑셀 기반의 자동 프로그램인 KOSTAT-Did를 개발했다.


이후 통계청 및 외부 기관 실무자와 전문가의 테스트를 거쳐 최종 프로그램을 확정했으며 오늘부터 통계정책관리시스템을 통해 제공한다.


내달부터는 국가통계작성 기관을 대상으로 맞춤형 사용자 교육도 실시할 예정이다.


KOSTAT-Did는 통계자료의 특성을 고려해 마스킹, 범주화, 통계적 잡음(노이즈)첨가, 자료교환(스와핑) 등 15종의 비식별화 기법을 지원한다.


프로그램상에서 마이크로데이터의 비식별화 처리가 완료되면 표준화된 평가 보고서가 자동 생성된다. 처리 전후의 정보손실도 및 노출위험도를 시각화된 그래프와 정량화된 지표로 비교할 수 있는 것 또한 이 프로그램의 특징 중 하나이다.


이를 통해 통계담당자는 통계자료의 객관적인 정보보호 수준 측정 및 평가를 할 수 있다. 기관 차원에서는 프로그램에서 제공하는 정량화된 측정 지표와 기준을 활용, 최적의 마이크로데이터 공개 범위를 설정할 수 있다.


안형준 통계청장은 “통계청이 통계자료 개방과 관련한 지침이나 가이드라인 제공을 넘어, 실무에 적용할 수 있는 자동 프로그램을 보급한 것은 이번이 처음이다. 보급하게 된 계기는 정부가 AI 대전환을 통한 세계 3대 AI 강국 도약을 목표로 하고 있고, 이를 위해서는 양질의 데이터인 국가통계를 안전하게 개방할 수 있는 인프라 지원이 반드시 필요하기 때문”이라고 밝혔다.


이어 “이번 비식별화 프로그램 보급을 계기로 최신 정보보호 신기술 연구와 인프라를 확충, 437개 국가통계작성 기관 전체가 보다 많은 데이터를 손쉽고 안전하게 개방할 수 있도록 적극 지원하겠다”고 말했다.

0

0

기사 공유

댓글 쓰기

김지현 기자 (kjh@dailian.co.kr)
기사 모아 보기 >
관련기사

댓글

0 / 150
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기