바이오 정보처리 `밑그림` 나왔다

관련 통계자료 다운로드 바이오정보처리시스템 설계도

 21세기 신산업의 대표주자로 주목받고 있는 생병기술(BT) 분야의 핵심기술인 바이오인포매틱스 시스템 설계도가 처음으로 완성됐다.

 한국전자통신연구원(ETRI) 컴퓨터·소프트웨어연구소의 바이오정보연구팀(팀장 박선희 박사)은 우리나라의 강점인 IT 기반에서 바이오인포매틱스와 관련된 요소기술들을 분류·정리하고 통합하는 바이오정보처리시스템 설계도(아키텍처)를 완성했다고 29일 밝혔다.

 국내에서 산·학·연 관계자를 대상으로 기술수요 조사를 실시하는 등 각계 전문가의 정밀자문을 받아 정부 출연연구기관 차원에서 바이오인포매틱스와 관련된 시스템을 종합적으로 설계하기는 이번이 처음이다.

 미국의 경우 IBM·컴팩 등 거대 IT업체가 바이오인포매틱스 시장상품인 서버뿐만 아니라 통합솔루션·소프트웨어시스템까지 포함하는 제품을 내놓고 시장을 공략하고 있는 데 반해 그동안 국내에서는 바이오인포매틱스상품이 일부 벤처기업에 의해 부분적으로 출시돼 바이오산업 전반의 ‘밑그림’에 쓰이는 원천기술로 이용하기에는 한계가 있었다.

 이번에 바이오정보연구팀이 내놓은 설계도는 바이오인포매틱스시스템을 크게 바이오 데이터 처리와 마이닝, 통합관리 등 3개 모듈로 분류하고 10개 세부 요소기술을 일목요연하게 접목시켜 전체의 흐름도를 완성했다.

 바이오정보처리시스템의 첫 프로세스인 바이오 데이터 처리과정은 전·후 처리 모듈로 나누고 전처리에서는 영상의 객체 정보를 추출하는 DNA칩 영상인 마이크로 어레이 영상이나 2차원 단백질 겔 영상처리기술 등 고정밀 영상처리기법을 이용하도록 했다.

 또 대량의 데이터를 손쉽게 처리할 수 있는 GUI와 실감형 장비를 연결하는 인터페이스 기술, 여러 정보를 직감적으로 표현할 수 있는 가시화 및 가상현실 기술 등이 연계되도록 전체 시스템을 설계했다.

 전처리를 거친 데이터를 가공하는 작업인 바이오 데이터마이닝 모듈에서는 DNA나 단백질의 서열을 결정하고 서열에서 의미있는 패턴을 발견하기 위한 패턴 인식 및 학습, 바이오 데이터 자동분류 및 클러스터링, 문헌 추출, 신약개발에 필수적인 단백질의 3차원 데이터 분석 및 예측, 네트워크 분석 및 구축 등 다양한 컴퓨팅 기술이 소개되고 있다.

 바이오 데이터 통합관리부문에서는 다양한 형태의 대용량 바이오 데이터를 저장·관리하고 통합검색하기 위한 바이오 온톨로지 구축 관리 및 표준화 기술과 분산 이질 바이오 데이터 통합기술, 대용량 데이터 아카이빙 기술을 꼽았다.

 이들 기술은 서로 다른 DB의 정보를 교환하거나 통합지식의 기반을 제공할 수 있는 데다 테라비트급 대용량 바이오 정보를 효율적으로 저장·관리하고 고성능 색인 및 특성 기반 검색까지 제공하는 기능 등을 모두 갖추고 있다.

 박선희 팀장은 “우리나라는 바이오인포매틱스 분야의 인프라가 제대로 갖춰지지 않아 업체의 수익구조가 매우 취약한 것이 사실”이라며 “그러나 국내 IT가 뒷받침되고 인력수급이 가능한 산업 분야를 선택해 집중적인 기술 개발 지원이 이뤄진다면 선진국과 경쟁이 가능한 새로운 분야로 주목받게 될 것”이라고 말했다. <대전=박희범기자 hbpark@etnews.co.kr>



★관련 그래프/도표 보기