[ET시론]뇌처럼 자유롭고 효율적인 데이터 연계, 꿈이 아닌 미래

이형일 통계청장
이형일 통계청장

디즈니와 픽사의 애니메이션 영화 '인사이드 아웃'에는 주인공 라일리의 머릿 속 세상이 흥미롭게 펼쳐진다. 머릿 속, 즉 뇌에서는 기쁨, 슬픔 등 다양한 감정과 기억의 구슬이 이리저리 조합되며 라일리의 삶을 만들어간다. 이렇듯 우리의 뇌는 평소 수없이 많은 정보를 저장해두었다가 필요할 때 자유롭게 연계해 새로운 판단을 내린다.

우리 사회를 하나의 몸이라고 생각해보자. 금융, 세금, 복지, 인구, 소비, 취향에 이르기까지 다양한 데이터가 사회 곳곳에 저장되어 있고, 지금, 이 순간에도 생성되고 있다. 이때 이 데이터들을 마치 애니메이션 속 주인공처럼 자유롭게 연계하고 활용할 수 있다면 그 가치는 엄청날 것이다. 하지만 현실은 녹록지 않다. 데이터 보유기관은 개인정보 등 민감한 데이터의 노출을 우려하고, 조직 사이의 칸막이는 데이터 접근을 어렵게 한다.

개인정보를 보호하는 동시에 효율적으로 데이터를 연계하는 방법이 없을까? 통계청은 여기에 대한 답을 허브-스포크(hub and spokes) 모형에서 찾는다. 통계청의 통계등록부(statistical registers)를 통계 허브(hub)로 삼고, 여기에 각 기관이 보유한 데이터를 바퀴살(spokes)로 연결해 최신 정보기술로 암호화한 상태에서 안전하게 분석하는 틀이다. 지난해 유엔(UN)의 빅데이터 및 데이터과학 전문가위원회(Committee on Experts of Big data and Data science)에서는 '개인정보 보호 기술 가이드북(The PET Guide)'을 발간하며 한국 통계청의 '허브-스포크 모형을 활용한 기업통계등록부와 지자체의 소상공인 데이터 연계·분석'을 세계적인 통계데이터 혁신사례로 꼽기도 했다.

통계청은 통계데이터의 허브이자 공신력 있는 중개자로서 그동안 통계데이터의 연계·활용 시도를 꾸준히 진행해 왔다. 그리고 작년 10월, 큰 의미가 있는 성과를 만들어 냈다. 노인빈곤과 연금개혁이 회자되는 가운데, 통계청이 통계등록부를 중심으로 기초연금, 국민연금, 직역연금, 주택연금 등 여러 기관에 흩어져 있던 11종의 공·사적 연금 데이터를 연계하여, 우리나라 전체 인구·가구의 연금 수급 및 가입현황을 볼 수 있는 연금통계를 사상 최초로 작성, 공표한 것이다.

연금통계 개발을 통해, 현재 노령층의 은퇴 후 주된 소득인 연금의 수급 현황뿐아니라 미래 노후 소득을 준비하는 청장년 세대의 연금 가입현황을 종합적으로 파악하여, 초고령 시대에 필요한 다층적 노후소득보장정책 등 과학적 국정운영을 지원하는 역할을 할 수 있을 것으로 기대한다.

약 3년간의 연금통계 개발 과정은 순탄치 않았다. 기초·국민연금은 보건복지부, 퇴직연금은 고용노동부, 개인연금은 국세청 등 각 데이터를 개별 부처가 관리하고 있어, 법과 제도의 칸막이로 인해 연계가 불가능해 보이는 상황이었다. 그러나 전 세계적으로 유례없는 우리 사회의 고령화와 노인빈곤 대책의 과학적 기반이 될 포괄적 연금통계의 필요성에 대한 통계청의 설득 노력과 다수의 정부부처와의 지속적인 회의를 통해 정부 내 빅데이터 연계·활용에 대한 공감대가 차츰 형성되어 갔다. 통계청은 통계 전문 기관이자 데이터 허브로서 최신 개인정보 보호기술과 데이터 보안·처리 전문성을 바탕으로 정책부처, 데이터 제공기관 및 전문가 등의 참여를 끌어냈고, 그 결과 개발에 성공한 연금통계는 통계청의 허브-스포크 모형 적용의 모범사례가 되었다.

그리고 이제 통계 활용의 미래는 새로운 장이 펼쳐질 것이다.

통계청이 추진 중인 '통계데이터 허브플랫폼' 구축 사업
통계청이 추진 중인 '통계데이터 허브플랫폼' 구축 사업

통계청은 허브-스포크 모형을 바탕으로 곳곳에 흩어진 데이터를 찾아 연결하고, 연계된 데이터를 전문가뿐만 아니라 일반 이용자도 쉽고 안전하게 이용할 수 있도록 '통계데이터 허브플랫폼' 구축 사업을 추진하고 있다. 통계데이터 허브플랫폼은 인구, 가구, 사업체 모집단 자료인 통계등록부를 기반으로 공공과 민간에 산재한 데이터를 분석주제 또는 이용목적에 맞게 연계·활용할 수 있는 시스템이다. 또한 민감정보를 보호하면서도 다양한 통계데이터를 원스톱으로 연계·활용할 수 있도록 최신 데이터보호 선도기술이 적용된 안전한 분석환경도 제공한다. 이에 통계청은 지난해 통계데이터 허브플랫폼과 함께 한 곳에서 모든 통계서비스를 이용할 수 있는 '원포털'시스템 구축을 위한 정보화전략계획을 수립했다. 올해 예비타당성조사를 수행한 이후 내년부터 4개년에 걸쳐 시스템을 구축할 계획이다.

흔히 챗GPT와 같은 인공지능(AI)이 마치 뇌처럼 정보를 학습하고 새로운 정보를 생성해 낸다고 한다. 하지만 AI는 정확한 데이터 없이는 무용지물이며, 칸막이로 둘러쳐진 고품질의 데이터들은 여전히 접근하지 못하는 것이 현실이다. 앞으로 통계데이터 허브플랫폼이 구축되면 누구나 고품질의 통계데이터를 한 곳에서 편리하게 연계·활용할 수 있게 된다. 이를 통해 복잡하고 다양해진 사회문제를 해결하고 새로운 가치를 창출할 수 있는 데이터 생태계가 조성되기를 기대해 본다.

이형일 통계청장

〈필자〉 이형일 통계청장은 서울대 경제학과를 졸업하고 텍사스 A&M에서 경제학 박사 학위를 받았다. 행정고시 36회 공직에 입문해 경제분석과장, 종합정책과장, 경제정책국장, 차관보 등 거시경제와 경제정책에 정통하다. 특히 윤석열 정부가 추진중인 민간 주도 경제정책 방향 등이 이 청장의 손을 거쳤다. 현재는 통계로 국가 주요 정책을 뒷받침하고, 국민들이 쉽게 통계를 활용할 수 있는 서비스 개발에 매진하고 있다.

이준희 기자 jhlee@etnews.com