노동연구원 보고서 ‘행정자료·가명정보 결합 중심’
현행 한국노동패널조사(KLIPS)가 노동시장 관련 연구 등에 활용되고 있으나 다른 분야 데이터와의 가명정보 결합률이 낮다는 주장이 제기됐다.
특히 행정자료의 수급정보가 일치하지 않아 이름, 성별, 생년월일에 대한 검증이 필요한 것으로 지적됐다.
한국노동연구원이(KLI)은 지난 15일 KLI 패널브리프 ‘한국노동패널조사의 사회보장정책 분석 제고 방안 : 행정자료와 가명정보 결합을 중심으로’ 보고서를 발간했다.
보고서는 가명정보 겹할률이 낮은 이유에 대해 가명정보 결합 시 생성된 결합키에서 사용된 변수(이름, 성별, 생년월일)의 측정오차로 인해 결합이 제대로 이뤄지지 않았을 가능성이 있다고 주장했다.
가명정보 결합률은 KLIPS와 한국사회보장정보원 사회보장정보시스템(행복e음) 행정자료를 결합해 파악했다.
사회보장급여 항목 중 아동수당(74.3%·2019~2020년 평균)을 제외하고 기초연금(52.1%·2018~2022년 평균), 맞춤형 급여(56.6%·2018~2022년 평균),가정양육수당(58.8%·2018~2022년 평균)은 약 50% 내외였다.
보고서는 “결합과정에서 결합키가 중보돼 결합대상에서 제외될 가능성이 있고, 사회보장급여 수급자에 대한 조사 성공률이 다른 집단에 비해 낮거나 수급자의 표집이 제대로 이뤄지지 않았을 가능성이 있다”고 밝혔다.
행정자료의 수급정보가 일치하지 않는 5가지 문제점으로 부정확한 응답, 생년월일 일치, 거짓 보고, 조사 시점 등을 꼽았다.
우선 KLIPS에서 결합키로 사용된 변수의 부정확한 응답에 기인했을 가능성이 있고 수급받는 사회보장급여를 혼동해 부정확한 응답을 했을 수도 있다고 했다.
이어 사회보장급여와 같은 민감한 항목에 대해 대면조사에서 거짓 보고를 하거나 수급액에 대해 과대하거나 과소하게 응답해 조사정확도가 낮을 가능성이 있다고 지적했다.
또 사회보장급여 변수의 조사 시점으로 인해 수급정보가 일치하지 않을 가능성이 있다고 했다.
이밖에 KLIPS는 가구설문에 포함된 사회보장급여의 수급정보를 가구 대표자가 응답하도록 설계돼 있는데 응답자가 가계경제 전반에 관해 알지 못할 경우 다른 가구원이 수급하는 사회보장급여 종류 및 수급액 등을 정확히 응답하기 어렵다고 했다.
보고서는 “한국사회보장정보원 행정자료와 가명정보 결합 과정의 문제점을 개선하기 위해 한국사회보장정보원에 일괄 승인을 받는 방식으로 자료제공 승인 방식을 일원화하고, 이용 가능한 행정자료 목록과 메타데이터 등을 자료 이용자에게 제공할 필요가 있다”고 제언했다.
특히 “향후 결합키 생성에 주요 변수인 이름, 성별, 생년월일에 대한 검증이 필요하다”며 “ 이를 해결하기 위해 조사응답자 주민등록번호를 확인해 조사원이 직접 기입하는 방식이 해결책으로 제시될 수 있겠으나 개인정보 우려로 인해 조사 거절로 이어질 가능성이 높다”고 조언했다.
아울러 “행정안전부의 주민등록통계와 가명정보 결합하여 KLIPS에서 수집되는 결합키 항목에 대한 정확성 검토를 고려해 볼 수 있다”고 덧붙였다.