
민간기업부터 공공기관까지 코로나19 관련 데이터 제공이 늘어난다.
건강보험심사평가원(원장 김승택)은 19일부터 공공데이터포털을 통해 '국민안심병원(325개)'과 '선별진료소(616개)' 오픈 API 정보를 제공한다.
오픈 API 정보는 국민안심병원과 선별진료소에 대한 정보로 지역(시도, 시군구), 의료기관명, 전화번호, 국민안심병원 유형, 검체 채취 가능여부 등이다. 해당 정보는 매일 오전 6시 기준으로 업데이트되며 국민 누구나 공공데이터포털을 통해 이용할 수 있다.
김현표 건강보험심사평가원 빅데이터실장은 “앞으로도 코로나19와 관련해 국민이 보다 빠른 정보를 앱(애플리케이션) 등을 통해 쉽게 접근할 수 있도록 실시간 정보를 제공할 계획”이라고 말했다.
민간기업도 데이터 공개 대열에 합류했다. 마인즈랩은 코로나19 환자 경로 시각화와 관련, 국내 최대 규모 데이터셋을 오픈소스로 공개했다.
마인즈랩이 공개한 '코로나 19 동선 추적 데이터셋'은 확진자 경로, 연령, 성별, 진단 날짜 등 기초적 환자 경로 데이터를 제공한다. 22가지 주요 전염병, 16개 백신, 의료 시설 등을 포함한 의료 통계 데이터와 다양한 변수에 따른 시각화된 데이터로 AI 모델 개발 등 기계학습에 필요한 데이터 집합이다.
마인즈랩 데이터셋은 기존 코로나19 관련 오픈 데이터셋에 비해 데이터 양과 품질, 데이터 시각화 부분에서 차별화를 뒀다. 미국 커뮤니티 사이트 레딧 개발·딥러닝 부문 1위에 오르는 등 해외 네티즌들 사이에서도 관심을 받는다.
데이터셋을 구축한 이중건 마인즈랩 브레인팀 선임 연구원은 “공익 가치를 고려해 누구나 쉽게 사용하도록 소셜 코딩 플랫폼 깃허브에 오픈 소스로 공개했다”면서 “빠르게 확산하는 코로나19를 막기 위해 최전선에서 사투를 벌이는 의료진과 관계자에게 마인즈랩이 구축한 데이터셋이 도움이 되기를 바란다”고 말했다.
최홍섭 마인즈랩 연구 개발 조직 부문대표는 “이번 데이터셋 공개는 마인즈랩 연구 개발 조직 연구역량이 세계 수준에 이르고 있음을 보여주는 획기적 성과”라면서 “데이터셋 구축을 기반으로 코로나19뿐만 아니라 다른 감염병에도 적용할 수 있어 추후 위기 사태에서도 모델링해 활용도가 높아질 것”이라고 말했다. 마인즈랩 브레인팀이 구축한 코로나19 동선 추적 오픈 데이터셋은 깃허브에서 누구나 이용할 수 있다.
김지선기자 river@etnews.com, 정영일기자 jung01@etnews.com