인간 유전자 해독 IT가 일등공신

최근 인간 유전자 비밀이 밝혀져 전세계에 큰 충격을 던진 인간 게놈 프로젝트에도 정보기술(IT)이 절대적인 역할을 해 IT의 중요성을 새삼 일깨워주고 있다.

HGP와 함께 지난 26일 유전자 염기의 배열지도를 밝힌 셀레라 제노믹스는 이 프로젝트에서 첨단 IT를 최적의 수준으로 활용한 것으로 알려졌다. 특히 설립된 지 2년밖에 되지않는 신생 벤처기업인 셀레라사가 15년동안 유전자 분석 연구를 진행해 온 18개국의 국제공공연구컨소시엄인 HGP와 똑같은 날짜에 유전자 비밀을 발표할 수 있었던 배경에는 IT가 일등공신으로 작용했다는 것이다. 셀레라 역시 공식 보도자료에서 이번 유전자 염기 배열지도를 밝혀준 두 가지 핵심 기술이 첨단 IT를 적용한 시스템과 고성능 슈퍼컴퓨팅 파워였음을 인정하고 있다.

인간 게놈은 인체세포에 존재하는 23쌍의 염색체와 염색체를 이루는 DNA(핵산), DNA를 구성하는 30억쌍의 염기들의 이중나선형 조합으로 구성된 유기체로 셀레라가 규명한 것은 염기의 배열순서. 따라서 앞으로 이 지도를 통해 개별 유전자의 기능이 무엇인지를 알면 인간 게놈의 모든 비밀이 밝혀지게 된다는 점에서 이번 발표는 일대 사건에 해당한다.

이 프로젝트를 위해 셀레라는 자매회사인 PE바이오시스템의 300 ABI 프리즘 3700 시스템과 컴팩컴퓨터의 슈퍼컴퓨팅 기술을 이용했다. 데이터베이스(DB)로는 오라클사 제품이, 애플리케이션의 개발 성능 및 기간을 단축시키기 위한 미들웨어로는 퍼시스턴스사의 파워티어가 사용되는 등 각종 첨단 IT 솔루션들이 동원됐다.

300 ABI 프리즘 3700은 셀레라의 대형 DNA배열 작업장에 배치된 게놈 자동배열기로 초파리 게놈과 인간 유전자를 배열하고 조합하는 작업과 쥐 유전자의 절반을 배열하는 작업을 신속히 처리하는데 큰 공헌을 했다.

특히 이 가운데 바이오스코프라고 불리는 유전자 분석 시스템의 경우 유전자 현상 프로파일 테크놀로지인 진태그(GeneTag) 데이터를 빠르게 분석, 죽은 세포와 건강한 세포에서 어떤 유전자가 「활동중」이고 「활동중이 아닌지」 판단할 수 있도록 했으며 유전자 활동 단계마다 다양한 변화를 정확히 측정할 수 있는 등 상당한 역할을 한 것으로 알려졌다.

특히 이 시스템에는 파워티어라는 미들웨어 솔루션이 적용돼 방대한 유전자 현상 비교 데이터를 처리할 때 중요한 문제로 떠오르는 성능 및 데이터 병목현상을 방지, 분석속도를 크게 단축시켰다는 것. 셀레라사의 시스템 개발팀장은 『이 시스템 개발에 당초 2년 가량의 개발기간이 소요될 것으로 예상했으나 첨단 IT의 활용으로 4개월만에 개발을 완료할 수 있었다』고 강조했다.

셀레라가 신속하면서도 성공적으로 유전자 배열지도를 규명할 수 있었던 또 하나의 요인은 고성능 슈퍼컴퓨팅 기술 덕분이다. 셀레라는 31억2000쌍의 유전코드 문자를 배열하고 조합하는 작업을 수행하기 위해 컴팩사의 트루64 유닉스 및 트루클러스터 소프트웨어 상에서 운영되는, 클러스터된 알파서버 컴퓨터를 활용했다.

이 슈퍼컴퓨팅 파워를 이용해 80테라바이트 이상의 데이터를 효과적으로 관리하는 것은 물론 성능 최적화를 이룰 수 있었으며 5해(1000조의 50만배)번에 걸친 염기간 비교 연산을 수행할 수 있었다는 것. 이러한 연산은 이제까지 생물학 분야에서 이뤄진 최장 시간, 최대 규모 연산이며 슈퍼컴퓨팅 역사에서도 가장 복잡한 연산 작업 가운데 대표적인 사례로 꼽힌다. 최종 조합 연산 부문은 컴팩의 새로운 알파서버 GS160에서 이뤄진 것으로 알려졌다.

<조인혜기자 ihcho@etnews.co.kr>