“의료 인공지능(AI)이 임상에서 유용하게 쓰이려면 알고리즘만 잘 짜서는 안 되고 맞춤형 데이터로 성능을 향상시키는 것이 중요합니다. 선진국에서는 까다로운 규제와 높은 비용 때문에 의료 데이터 확보가 쉽지 않았죠. 개발도상국으로 눈을 돌려 합법적 방법으로 가명화된 데이터를 수집하려고 합니다. 21세기 석유는 데이터라면 힐세리온은 석유를 캐는 기업입니다.”
류정원 힐세리온 대표는 의료 AI 개발에 있어 정제된 데이터 중요성을 이같이 말했다. 힐세리온은 '디지털 헬스케어 플랫폼(DHP)'을 구축하고 인도 등 개발도상국 병원과 협력해 의료 데이터 확보에 나섰다. 이를 통해 의료 AI 학습용 데이터 라벨링 사업을 본격화한다.
힐세리온은 최근 인도 1000여개 검진센터와 파트너십을 맺고 있는 헬스케어 스타트업 다이애그노스마트와 디지털 헬스케어 플랫폼을 통한 데이터 확보 협약을 맺었다. 우선 하이드라바드 지역 100개 검진센터를 통해 월 1만장 초음파 영상 수집을 목표로 한다. 1만장은 AI 학습에 필요한 데이터 최소 단위다.
제약·의료기기·AI 서비스 분야에서 경쟁력 있는 제품 개발을 위해 고품질 의료 데이터를 필요로 한다. 하지만 우리나라를 포함한 선진국에서는 까다로운 개인정보 관련 규제와 병원과 협력 어려움, 높은 의료 전문인력 인건비 등으로 질좋은 데이터를 확보하기가 어려웠다.
이들 회사가 필요한 자료나 AI 모델을 요청하면 힐세리온은 플랫폼을 통해 관련 데이터를 요청한다. 개도국 의료진들은 힐세리온 초음파 기기로 얻은 영상 데이터를 판독해 플랫폼에 업로드하고 힐세리온은 이를 검수해 의료진들에게 현금화할 수 있는 포인트를 지급한다. 모아진 데이터 자체로도 공급이 가능하고 이를 토대로 AI 엔진을 개발해 공급할 수도 있다.
힐세리온은 의사 출신 류정원 대표가 2012년 창업한 회사다. 2014년 스마트폰과 연결해 사용할 수 있는 무선 휴대형 초음파 기기 '소논'을 세계 최초로 출시했다. 의료진 가운데서도 일부 전문가들만 사용하던 초음파 기기를 대중화시킬 방법을 고민하며 AI를 접목한 초음파를 개발하다가 맞춤형 데이터 필요성을 절감하게 됐다.
류 대표는 “알고리즘보다 AI를 학습시키기 위한 맞춤형 데이터가 더 중요하지만 의료 데이터 가격이 너무 비싸고 규제가 심한데다 이 데이터를 전문 의료인이 해석해 라벨링 해야 데이터로써 의미가 있기 때문에 확보가 쉽지 않았다”면서 “이 때문에 의료 AI 발전이 더디게 이뤄지고 있고 실제 임상 적용까지는 더욱 요원하다”고 말했다.
힐세리온은 향후 디지털 헬스케어 플랫폼이 다루는 데이터 분야를 초음파 영상뿐만 아니라 CT, MRI, X레이 등 의료영상 데이터와 체온, 혈압, 혈당, 체중, 심전도, 운동량 데이터 등으로 확장한다는 계획이다. 주변 다른 동남아 국가로도 데이터 공급 채널을 확장한다.
류 대표는 “병원에 데이터가 잔뜩 모여있어도 라벨링이 이뤄지지 않으면 AI 학습용으로 바로 쓸 수 없고 데이터 라벨링이 잘못돼 있으면 되레 학습률만 떨어뜨린다”면서 “축적된 데이터 양을 늘리는 동시에 순도 높은 데이터를 공급하는게 핵심으로 디지털 헬스케어 플랫폼이 의료 AI 개발에 특화된 데이터 허브 역할을 하게 될 것”이라고 강조했다.
정현정기자 iam@etnews.com