클라우드로 의료데이터 연구한다…네이버클라우드 연내 '데이터박스' 출시

ⓒ게티이미지뱅크
ⓒ게티이미지뱅크

네이버클라우드가 이르면 3분기 의료 데이터 활용 연구 촉진을 위해 의료기관 대상으로 '(가칭)데이터박스' 서비스를 시작한다. 외부 연구자가 클라우드 안심존에 접속해 데이터 기반 연구를 진행하고 결과물을 반출할 수 있는 플랫폼으로 클라우드 기반 의료 데이터 활용 생태계 구축에 도움이 될 것으로 전망된다.

4일 업계에 따르면 네이버클라우드는 연내 데이터박스 서비스 출시를 계획하고 있다. 회사는 데이터박스 서비스를 의료 분야에 활용할 수 있도록 최근 복수의 의료기관과 비공개 모의테스트 협의에 착수했다.

네이버클라우드 데이터박스는 병원이 보유한 의료 데이터를 보안성 높은 클라우드에 한데 모아 인공지능(AI) 연구와 혁신기술 개발에 활용할 수 있도록 지원하는 데이터 플랫폼이다.

데이터박스는 당초 쇼핑, 지역, 검색 등 사용자 행동 데이터 등 네이버가 보유한 데이터를 외부 연구자에게 안전하게 제공할 수 있는 방안으로 기획된 서비스다. 네이버는 데이터박스가 민감정보를 포함한 의료 데이터 연구에도 적합할 것으로 판단했다.

의료 분야는 데이터를 의료기관 밖으로 반출하기 어렵다. 일반적으로 외부 연구자들이 병원을 방문해 별도 폐쇄망에서 연구하다보니 제약이 따랐다. 데이터박스를 활용하면 보안성 높은 클라우드 내 안심존에서 데이터 연구를 하고 결과물을 반출할 수 있다. 디지털 헬스케어·바이오 기업 등 산업계의 의료 데이터 연구 과정에서 물리적 제약을 줄일 수 있다.

원천 데이터는 보안을 위해 데이터 소유자인 의료기관이나 의료진이 읽기전용 모드로만 업로드할 수 있다. 외부 연구자는 데이터 소유자의 승인을 받아 접속해 AI 학습이나 데이터 연구를 진행하고 알고리즘이나 결과 데이터를 추출할 수 있다. 결과값은 데이터 소유자에게 승인받아야만 반출할 수 있도록 해 유출 가능성을 차단한다. 네이버는 클라우드 인프라와 데이터 분석 도구 등 분석 환경을 지원한다.

의료기관은 별도의 클라우드 기반 임상데이터웨어하우스(CDW)를 구축하고 있지 않더라도 원하는 시기에 원하는 기간 동안 필요한 만큼 자원을 구매해 안심존을 활용한 공동 연구를 할 수 있어 다기관 협력이 용이해진다. 개별 의료진이 임의로 외부기관과 공동연구하며 생길 수 있는 데이터 유출 우려를 차단해 환자 정보를 보호하고 의료 데이터 관리 효율성을 높일 수 있다.

네이버클라우드 관계자는 “원할 때 원하는 만큼 자원을 생성할 수 있는 클라우드의 장점을 살려 내·외부 연구자가 의료 데이터를 활용한 공동 연구를 효율적으로 할 수 있다”고 설명했다.

향후 전국 병원과 일반 시민이 참여해 1~3차 의료기관 데이터, 라이프로그, 생체정보, 유전체 데이터를 모을 수 있는 플랫폼이 구축되면 효과는 더욱 커진다. 회사 관계자는 “바이오 기업, 병원, 연구소, 디지털 헬스케어 스타트업 등이 안전한 환경에서 데이터 연구를 진행할 수 있는 헬스케어 빅데이터 선순환 생태계 구축에 도움이 될 것”이라고 말했다.

정현정기자 iam@etnews.com