정부 주도의 다양한 의료 빅데이터 구축사업이 시행되고 있지만 의료 챗GPT에 활용하기에는 데이터 품질이 충분치 않다는 지적이 제기됐다. 보건의료데이터 구축도 중요하지만 고품질 데이터를 체계적으로 확보하는 전략이 시급하다는 분석이다.
서울대학교병원은 BioGeniOs사업단이 최근 개최한 '품질 관리없는 바이오 빅데이터를 활용한 의료 인공지능의 한계' 토론회에서는 이같은 의견이 제기됐다고 밝혔다.
김경환 서울대병원 교수는 “국가 바이오 빅데이터 구축사업, AI 학습용 데이터 구축지원 등의 사업에서 의학적으로 검증된 고품질 데이터가 없다면 챗GPT와 같은 생성형 AI의 실질적 한계가 많아질 수밖에 없다”면서 “보건의료 분야 빅데이터에 대해 인공지능화를 위한 막대한 비용이 투자되고 있지만 실제로는 저품질 데이터에 그쳐 AI를 실제로 사용하기에는 적절치 못하다”고 지적했다.
의료AI를 위해 품질이 관리된 데이터를 별도 정의해야 한다는 의견이 제기됐다.
이수현 가천대학교 컴퓨터공학과 조교수(헬스IT센터 부센터장)는 “의료 분야 데이터는 양적으로도 방대하지만 종류·형태·속성이 각 기관과 질병에 따라 매우 다양하다”면서 “각 병원에서 현재처럼 단순 기술적 방법만으로 2차 데이터를 생성하면 빅데이터 분석과 AI 학습용 데이터 등으로 사용하는데 한계가 있어 별도 정의가 필요하다”고 말했다.
'보건의료 데이터 큐레이터' 도입과 국가공인 민간자격증 제도 신설이 필요하다는 의견도 나왔다. 보건의료 데이터는 전문용어와 국제질병분류체계(ICD)가 적용돼 있어 전문지식이 필요하고 데이터 오류 식별과 대안 제시 등의 역량을 갖춘 전문가가 필요하다는 것이다.
강성홍 인제대 보건행정학과 교수는 “기존 의료데이터의 정확성과 완전성을 보완해 가치있는 의료데이터로 변환하는 보건의료 데이터 큐레이터가 필요하다”면서 “양질의 일자리 제공은 물론 의료데이터 가치를 높일 수 있어 국가 차원의 큐레이터 인력양성사업을 집행해야 한다”고 제언했다.
권애경 한국보건의료정보원 보건의료표준화부장은 “의료데이터가 폭발적으로 증가하고 데이터 활용 수요가 커졌지만 국민이나 환자의 의료데이터 접근성은 크게 나아지지 않았는데 근본적 이유는 상호운용성이 갖춰지지 않은 저품질 비표준 데이터가 원칙없이 생성됐기 때문”이라며 “지난달 15일 시행된 '보건의료데이터 용어 및 전송 표준' 개정 고시를 지속 개정·고도화해 표준 체계를 꾸준히 정립해 나갈 예정”이라고 말했다.
배옥진 기자 withok@etnews.com
-
배옥진 기자기사 더보기