국민건강보험공단(이사장 김용익)은 정부 K뉴딜 정책에 발맞춰 올해 8월에 시행한 데이터 3법에 대비해 빅데이터를 활용하는 연구자의 사용편의를 높이기 위해서 연구자가 활용하는 빅데이터 분석 환경 인프라를 확장한다고 21일 밝혔다.
공단은 '건강보험 빅데이터 연구분석 시스템 기능 개선사업'을 통해 기존 대비 2.1배의 가상분석 환경을 확보할 예정이다. 올해 12월 구축을 목표로 연구 신청자의 절차 효율성을 높이고 가상화 분석 인프라 확장으로 연구자의 사용편의를 높일 계획이다.
공단은 이번 사업으로 '분석센터 예약 기능'의 효율을 높이고 '연구DB 추출 프로세스 기능'을 개선해 연구자의 불편을 해소할 뿐만 아니라 '이용자 본인인증'을 강화해 효율적이고 안정적인 클라우드 시스템을 확보한다는 계획이다. 연구자는 전국에 분포한 공단의 분석센터를 통해 이전보다 훨씬 짧아진 대기시간으로 원활하게 데이터를 분석할 수 있게 된다.
그동안 공단은 늘어나는 데이터 활용신청 수요로 신청자의 연구 대기시간이 증가함에 따라 인프라 확장을 고민해왔다. 데이터 3법이 통과되면서 체계적인 데이터를 가장 많이 보유한 공단 DB 수요가 폭발적으로 증가할 것이 예상됨에 따라 선제적인 인프라 확장을 결정했다.
공단은 2014년부터 연구DB 제공을 시작했으며, 첫 해 65건이던 제공건수는 2019년 1162건으로 18배가량 증가했고, 올해는 15일 현재 911건으로 지난해보다 크게 늘어날 전망이다.
공단은 국내 보건의학 연구자를 위해 자체보유 빅데이터를 다양한 형태로 제공해왔으며, 보건의학 전문가들은 맞춤형DB를 통해 연구단위의 최적화한 데이터를 제공받아 다양한 연구를 수행하고 있다.
또 의학 전문학회와 MOU 체결 등을 통해 특수한 연구에 범용적으로 활용할 수 있는 노인, 영유아, 직장여성, 당뇨병 등 코호트DB뿐만 아니라 미세먼지 등의 외부 환경에 대응하는 환경성질환 DB를 구축했다.
공단DB는 다른 공공기관 대비 압도적으로 많은 테이블과 변수들을 제공해 연구자들이 선호한다. 특히 의학 연구에 필수적인 환자 사망 여부를 파악할 수 있고 데이터의 종적범위 자체가 넓어 다양한 보건의료 분야에서 무리 없이 연구를 수행할 수 있다.
국민건강보험공단 관계자는 “공단의 빅데이터센터 내엔 이미 의학, 통계, 컴퓨터사이언스 전문가가 D.N.A(DATA, Network, AI) 시대에 대비해 다양한 연구와 서비스 제공을 위한 구상 중에 있다”며 “연구자가 개인정보 보안이 강화된 환경에서 부족함 없이 데이터를 활용하는 환경을 구축해 정부의 K-뉴딜 정책 핵심인 데이터댐의 밑거름이 되겠다”고 밝혔다.
정현정기자 iam@etnews.com