국내 보건의료데이터는 양과 질 모든 면에서 보물창고라고 불려도 손색이 없다. 국내 의료정보시스템(EMR) 도입률은 90% 이상으로 세계 1위다. 국민건강보험공단에 약 3조4000억건, 건강보험심사평가원에 약 3조건의 의료데이터가 저장·관리되고 있다. 또 대부분 상급종합병원이 수도권에 밀집돼 있어 데이터의 지리적 접근성 및 관리 용이성 또한 경제협력개발기구(OECD) 국가에 비해 뛰어나다. 보건복지부 보고서에 따르면 국내 의료데이터 경제적 가치는 약 2조원이다. 아직 발굴되지 않은 보물을 품고 있는 셈이다.
최근 정부는 다양한 보건의료정책 및 지원사업을 통해 적극적으로 의료데이터산업을 육성하고 있다. 그 결과 의료데이터 가공 및 활용 규제가 완화됐으며, 데이터 통합 플랫폼이 구축됐다. 이전보다 체계적으로 관리할 수 있게 된 것이다. 민간 부문에서도 의료데이터를 활용한 사업들이 활성화하고 있다. 대표적으로 의료 인공지능(AI) 회사와 보험회사들은 고객 동의 아래 건강검진 데이터를 분석해서 맞춤형 건강보고서를 만들어 제공할 수 있게 됐다. 건강보고서에는 그 사람의 장기별 생체 나이, 주요 질병 발생 확률 등이 담긴다. 자신의 건강보고서를 바탕으로 맞춤형 보험상품도 설계 받을 수 있다.
하지만 여전히 해결해야 하는 문제가 남아 있다. 병원들이 의료데이터 공유를 기피하고 있다. 이런 현상이 나타나는 것은 데이터 반출 과정에서 잇달은 개인정보 유출 사건으로 말미암아 병원이 지게 되는 부담이 커졌기 때문이다. 병원에서 데이터를 반출하기 위해선 환자 동의뿐만 아니라 임상연구심의위원회(IRB) 승인, 자체 데이터위원회 심의 등 복잡한 과정을 거쳐야만 한다. 이에 AI 연구를 시작하기 위해선 길게는 수개월의 심의 과정을 기다려야 한다. 병원 입장에선 데이터 반출에 따른 리스크가 큰 데에 비해 얻게 되는 이득은 명확하지 않다는 것도 문제로 지적된다.
병원마다 데이터 관리 형식이 상이한 점도 연구의 발목을 잡는다. 의료 AI 연구를 위해선 방대한 양의 의료데이터가 필요하다. 그러나 병원의 데이터 관리 형식이 통일돼 있지 않다 보니 AI 학습에 어려움을 겪고 있다. 또 데이터 가공 방식도 표준체계가 세워져 있지 않아서 각 병원의 연구팀이 세운 기준에 따라 각기 다른 방식으로 데이터를 가공하고 있다. 결국 데이터를 처음부터 재가공하거나 형식에 맞춰 변환하는 일련의 과정이 수반될 수밖에 없다. 이 때문에 의료 AI 산업 활성화를 위해 각 병원 연구팀이 동일한 방식으로 데이터를 가공할 수 있도록 표준 절차를 정립하고 가이드라인을 수립해야 한다는 목소리가 나온다. 이러한 노력의 하나로 최근 인그래디언트는 'ISO-IEC WG12'에서 데이터셋을 만드는 표준운영 프로세스에 대한 국제표준을 제안, 채택됐다.
표준 정립과 더불어 자생하는 의료 AI 생태계 조성을 위해 선제해야 할 것은 바로 의료데이터의 가치 측정이다. 데이터 공유에 따른 보상을 주기 위해선 의료데이터 가치를 측정할 수 있어야 한다. 하지만 의료데이터에 대한 거래시스템이 부재하다 보니 명확한 가치 평가를 할 수 없는 상황이다. 의료데이터는 '공공재'라는 인식이 사회적으로 퍼져 있어 의료데이터 가격 논의 자체가 진행되기 어렵다. 그래서 국내 의료 AI 업체들은 자국의 양질 데이터를 놔두고 해외에서 데이터를 구매해서 사용하고 있다. 우리나라 의료데이터산업의 경쟁력을 높이려면 의료데이터 '가격' 논의부터 해야 할 것이다.
김주성 인그래디언트 부대표 joosung@ingradient.ai
-
조재학 기자기사 더보기