[이슈분석]버려지는 의료데이터...표준화와 안전한 활용 시급

[이슈분석]버려지는 의료데이터...표준화와 안전한 활용 시급

의료 빅데이터 시장이 급성장하고 있지만 국내 병원은 데이터 표준화 기반을 갖추지 못해 경쟁력을 상실하고 있다. 대형 병원조차 생성되는 의료 데이터 80%를 제대로 활용하지 못하고 버린다. 맞춤형 의학과 인공지능(AI) 기술 개발을 위해 의료 데이터 표준화와 개인정보를 보호하는 안전한 활용이 시급하다.

◇병원은 왜 데이터를 버리나

국내 5대 상급병원도 의료 데이터를 제대로 활용하지 못하는 것으로 드러났다. 한 달에 약 90테라바이트에 달하는 의료 데이터가 생성되는 데 이중 80% 이상이 버려진다.

병원에는 비정형 데이터가 대부분이다. 국내 최대 상급종합병원인 서울대병원과 서울아산병원은 각각 500만명 환자 전자의무기록(EMR)데이터를 보유한 것으로 추산된다. 분당서울대병원도 약 200만명 환자 데이터를 보유했다. 여전히 많은 데이터들이 쌓이고 있지만 연구 목적이나 산업 발전 목적으로 사용하지 못한다. 서울대 의대에 따르면 의료빅데이터 80~90% 이상이 비정형 데이터다. 의료데이터 표준화와 정형화가 시급하다. 비정형 데이터란 미리 정의된 데이터 모델이 없거나 정리되지 않은 정보를 말한다.

중환자실은 의료진이 환자를 소홀히 하면 언제든 생명을 잃을 수 있는 위험이 있는 공간이다. 중환자실 환자는 다양한 첨단 장비를 연결한다. 혈압과 심박수를 체크하는 의료기기, 환자 상태를 보여주는 환자용 모니터, 환자 폐에 공기를 주입하는 기계식 환기기 등이 있다. 이들 기기가 생성하는 데이터양은 엄청나다. 위내시경, 대장내시경 등 내시경 촬영 영상 기록의 경우 병변이 발견된 부분만 저장되고 나머지 데이터는 버린다.

윤형진 서울대 의과대학 의공학교실 교수는 “중환자실이나 응급실에서 환자 모니터링을 통해 심전도, 심박수, 혈압, 산소포화도 등이 기록된다”면서 “병원마다 다르지만 1분~5분 간격으로 영상에서 보여진다”고 설명했다. 이어 “환자 생존과 직결된 이 같은 중요한 수치와 영상 기록이 저장되지 않고 버려진다”면서 “저장되더라도 유의미한 연구자료로 쓰기 어렵다”고 말했다. 윤 교수는 “AI기술이 개발됐다고 하더라도 양질의 병원 데이터가 없으면 무용지물”이라면서 “표준화하고 관리해 유의미한 데이터로 만드는 것이 병원이 해야 할 과제”라고 지적했다.

게티이미지
게티이미지

◇'데이터' 입력단계부터 표준화, '공동데이터모델' 개발 시급

전문가들은 의료 AI 개발을 말하기에 앞서 버려지는 데이터부터 관리해야 한다고 입을 모은다. 현재 활용가치가 있는 데이터는 의료기관 전자의무기록(EHR)이나 의료용영상저장전달장치(PACS) 데이터가 꼽힌다. PACS는 의학영상정보시스템이다. PACS는 X선, 컴퓨터단층촬영(CT), 자기공명영상(MRI), 양전자방출 단층촬영(PET) 등에 의해 촬영한 의학용 영상정보 저장, 판독, 검색 기능 등을 통합 처리하는 시스템이다.

문제는 PACS라는 영상의학정보시스템을 사용하지 않는 병원도 많다. 일부 병원에서는 PACS 시스템을 사용하지 않아 표준화된 정보를 활용하기 어렵다. PACS에 기록된 영상정보도 제한적이다. 이를 산업·연구 목적으로 사용하기 위해서는 영상 기록 단계부터 표준화된 형태, 분석할 수 있는 형태로 저장해야 한다.

EHR 활용도 제한적이다. EHR이 표준화되지 않거나, 병원마다 제각각인 시스템을 사용해 데이터로 활용하기 어렵다. EHR는 환자의 각종 인적사항, 질병명, 입퇴원 기록, 컴퓨터단층촬영(CT), 자기공명영상(MRI) 결과 등 방대한 정보가 기록된다. 의사가 병원에서 환자를 진료하기 위해 기입한 내용이다. 환자 질병 상태를 저장하는 데 목적이 있기 때문에 빅데이터로 활용하기엔 무리가 있다.

병원 간 진료정보를 제공하는 기관도 제한적이다. 병원 간 데이터 코드, 체계도 다르다. 병원 EHR 기반 공통데이터모델(CDM) 확대 구축이 필요하다. 한 환자 의료정보를 CDM으로 변환해 개인정보 유출 없는 비식별데이터로 변환, 다기관 환자전자의무기록 데이터를 통합·분석하면 신약개발이나 약물 부작용 등에 활용할 수 있다.

CDM은 의료기관별로 다양한 전자의무기록 양식에 기록된 환자 질병 관련 정보 중 '인구통계학적 정보, 진단, 처방약, 시술, 검사결과' 등 분석에 필수적인 데이터를 추출해 표준 모델화한 것이다.

분당서울대병원 디지털연구소장 유수영 교수팀은 의료정보 국제표준인 HL7(헬스레벨7)을 토대로 의료정보 시스템 활용성을 높인다. 그는 데이터 입력단계부터 표준화한 데이터를 만드는 것이 선행돼야 한다고 말한다. 유 교수는 “양질 데이터를 잘 만들고 입력 단계에서부터 표준 체계를 갖고 컴퓨터에 입력할 수 있는 코드로 만드는 것이 중요하다”면서 “정부와 병원이 나서 표준화된 거버넌스 체계를 확립해야 한다”고 강조했다.

국내에서는 의료빅데이터연구센터 등이 출범해 동영상, 바이오 시그널, 생명과 관련된 사운드 등 비정형 데이터를 정형화된 데이터로 전환해 쓸모 있는 의료정보로 만드는 작업을 시작한다.

김석화 서울대 의료빅데이터연구센터 센터장은 “쓸모 있는 의료 빅데이터가 확보되면 희귀질환, 암, 응급환자 심정지 예방 등 다양한 곳에 활용돼 질병 증진에 기여할 것”이라면서 “정부가 의료산업 선도할 인공지능, 빅데이터에 적극 지원해야 한다”고 말했다.

[이슈분석]버려지는 의료데이터...표준화와 안전한 활용 시급

◇갈수록 커지는 의료 빅데이터 시장

의료 빅데이터 시장은 성장세다. 산업통상자원부에 따르면 국내 의료 빅데이터 시장은 2023년 5600억원 규모로 2013년보다 약 6.5배 성장할 것으로 전망된다.

빅데이터가 성장하면서 의료분야 인공지능 시장 수익규모도 커질 전망이다. 프로스트&설리번에 따르면 세계 의료분야 AI 시장 수익규모는 2014년 약 7120억원에서 2021년 748조원으로 증가한다. 산업계도 개발에 활발한 추세다. 딥러닝 기반 의료 분야 AI스타트업도 2011년 이래 전체 9770억원 규모로 성장할 것으로 전망된다.

EMR 영상 기록 데이터 등은 신약개발, 혁신 의료기기 개발, 모바일 애플리케이션 개발 등 상업화 목적으로 쓸 수 있다. 뷰노, 루닛 등 국내 업체가 개발한 AI 소프트웨어 진단 기기들이 국내 최초로 의료기기로 허가받았다. 엑스레이, 컴퓨터단층촬영(CT), 자기공명영상촬영(MRI) 결과와 조직 사진을 보고 각종 질병 검진 소프트웨어를 개발했다. IBM, 구글, 마이크로소프트(MS) 등 글로벌 IT 기업들도 인공지능 접목 의료기기 개발을 추진 중이다. 현재까지는 질병 진단 목적 영상 판독에 기술들이 주로 개발됐지만, 앞으로는 치료에도 적극 활용될 수 있는 의료기기가 등장할 것이다.

병원에서도 진료시스템 효율화를 높이는 데 인공지능과 빅데이터가 활용된다. 화상, 심장치료를 전문으로 하는 병원도 AI 진료시스템을 도입했다. 심장전문 화상전문 베스티안병원, 세종병원은 AI 진료시스템을 적용해 환자 치료 효율을 높였다.

장윤형 의료/바이오 전문기자 why@etnews.com