바이오 분야 정보를 망라해 수집·관리하는 데이터 댐 '국가 바이오 데이터 스테이션'이 내년 초부터 구축된다. 내년 하반기부터는 일부 서비스를 이용할 수 있을 전망이다.
한국생명공학연구원(원장 김장성) 산하 국가생명연구자원정보센터(KOBIC)는 효율적인 바이오 데이터 수집을 위한 수요자 친화형 데이터 수집·제공·활용 플랫폼 '국가 바이오 데이터 스테이션' 구축사업을 내년 초부터 본격화할 계획이라고 31일 밝혔다. 바이오 데이터와 소재 활용을 강조한 제3차 국가생명연구자원 관리활용 기본계획 수립에 따라 범부처 사업으로 진행된다.
스테이션은 인체유래물·줄기세포·배양세포를 비롯해 각종 천연물과 합성화합물, 종자, 병원체 등 총 14개에 달하는 바이오 소재 관련 데이터베이스(DB)를 보유한다. 정부 예산으로 시행된 국가 연구개발(R&D) 유래 연구성과도 갖춰 국내 연구현장에서 폭넓게 쓸 수 있도록 한다.
현재는 스테이션 구축을 위한 사전준비 작업에 한창이다. 이미 데이터 수집을 위한 가이드라인 역할을 하는 '수집관리 표준지침' 초안을 마련하고 있다. 다양한 데이터를 등록하는 양식 표준화 작업도 진행 중이며, 9월 중에는 표준화를 마치겠다는 계획이다.
데이터 품질 관리를 위한 인력 활용 계획도 입안 중이다. 데이터 엔지니어, 큐레이션 인력 등을 충분히 활용하는 방향으로 안을 마련하고 있다.
내년 초부터 본격적인 구축에 들어간다. 실제 플랫폼, 전산환경 구축은 한국과학기술정보연구원(KISTI)이 맡았다. KISTI는 이미 생명연과 국가바이오 빅데이터 시범 사업을 진행한 경험이 있다. 이번에도 공동으로 사업을 진행한다.
미국 국립생물정보센터(NCBI)를 참고해 데이터 분석 기능까지 제공하는 형태를 구상하고 있다. 전산 리소스를 클라우드로 제공, 연구자가 어디서든 활용할 수 있게 하는 기능도 담을 예정이다. 시각화 기능, 온라인 협업공간 마련도 염두에 두고 있다.
오두병 생명연 연구전략본부장(KOBIC 센터장)은 “인공지능(AI) 부각으로 데이터가 한곳에 모여 빅데이터를 이루는 것이 중요해진 시점”이라며 “이제 시작하는 단계지만 새로 구축하는 스테이션으로 국내 기업이 글로벌 경쟁력을 갖추고 새로운 바이오 분야 가치를 창출할 수 있도록 돕고 싶다”고 말했다.
대전=김영준기자 kyj85@etnews.com