정부가 연구 과정에서 발생하는 데이터를 공유, 개방, 활용하는 체계를 만든다. 연구 성과물 범위에 '연구 데이터'를 포함해 '연구 빅데이터' 체계를 구축한다. 그 동안 사장됐던 중간 데이터에 빅데이터, 인공지능(AI) 기술을 적용하면 연구개발(R&D) 성과 제고에 기여할 것으로 기대된다.
과학기술정보통신부는 26일 서울 중앙우체국에서 유영민 장관 주재로 '모아서 새롭게' 확대 태스크포스(TF) 회의를 개최했다. TF는 연구 데이터를 빅데이터화하는 게 임무다.
8월부터 바이오, 소재 등 분야 별 회의를 거쳤고 이날 여러 분야 전문가 의견을 종합 청취했다. 바이오와 소재는 물론 천문·물리·우주 등 여러 분야의 데이터 활용 연구자와 대용량데이터·컴퓨팅 전문가, 연구행정 전문가와 과기정통부 담당관 등 30여명이 모였다.
과기정통부는 연구데이터 관리, 활용 추진 과제를 제시했다. 연구 데이터를 '연구 성과물' 범위에 추가한다. 국가 차원의 관리, 공유, 활용 체계를 마련한다. 데이터 분석으로 난제를 해결하는 집단 연구를 지원한다.
국가연구데이터 플랫폼 아래 분야 별 데이터를 공유·활용할 수 있는 생태계를 조성한다. 클라우드 방식 데이터 관리 기반을 지원한다. 대규모, 대용량 데이터 관리 수요에 대응해 연구자와 공동체 부담을 최소화한다. 연구자 대상으로 데이터 활용 교육 프로그램을 제공한다. 데이터 기반 공동연구 참여 기회를 넓힌다.
과기정통부 정책은 연구 과정 중간에 나오는 데이터 활용도를 높이는 게 목적이다. 그 동안 연구 결과만 관리·공유하던 것에서 데이터까지 자원으로 본다. 과학 연구에서 새로운 발견, 효율적 연구를 위해서는 데이터 공동 활용이 필수라고 봤다. 미국, 영국 등 선진국 추세도 비슷하다.
유 장관은 취임 직후 과학계와 간담회에서도 연구 데이터 공유, 개방을 여러 차례 강조했다. 관련 TF 구성을 제안했고, 직접 주재했다.
유 장관은 “중간 데이터나 실패로 규정해 사장됐던 데이터를 모아 새롭게 '지식자산화' 할 노력을 해야 할 때”라면서 “연구데이터를 빅데이터화하고, 많은 이들이 공유하고 융합하면 새로운 지식을 창출할 것”이라고 강조했다.
이날 회의 참석자들은 분야별 데이터·연구 특성을 고려한 추진 방안을 제안했다. 정부출연연구기관(출연연)은 데이터 관리 시범사업 추진 계획을 소개했다. 연구자들은 데이터 공유 시 연구 수행 결과, 과정에서 권리 보호 방안을 마련할 것을 주문했다.
과기정통부는 데이터 활용 정책이 R&D 환경의 전면변화로 이어질 것으로 내다봤다. 연구 현장 의견을 수렴해 신중하게 추진할 계획이다.
송준영기자 songjy@etnews.com