[ET단상]유전체 분석의 미래

전 세계적으로 코로나19 변이 바이러스와의 싸움이 장기화하면서 변이 바이러스를 신속하고 정확하게 검출하는 능력이 그 어느 때보다 중요해졌다. 유전체 염기서열 분석은 질병 유발과 관련된 유전자와 새로운 변이 발견을 가능하게 할 수 있는 기술이다. 역사적으로 DNA 연구는 대규모 표본 집단을 대상으로 진행돼 많은 시간과 컴퓨팅 성능을 요구했다. 그러나 이는 과거 기술로 구현하기 어려웠다.

ⓒ게티이미지뱅크
ⓒ게티이미지뱅크

2003년 유전정보 분석방법이 밝혀졌지만 단일 염기서열 분석에는 13년이나 걸렸다. 그러나 분석시간을 단축하려는 과학자들의 노력과 기술 진보 덕에 의학연구 및 진단 가속화 기술을 저렴한 비용으로 개발할 수 있게 됐다. 2019년 기준 유전정보분석 시간은 60~150시간으로 단축되기에 이르렀다.

유전정보 분석 가속화에 큰 역할을 한 기술은 바로 '고성능컴퓨팅'(HPC)과 '차세대 염기서열 고속 분석'(NGS) 기술이다. 코로나19 유행 이후 유전체학 분야에서 백신설계, 진단키트 개선, 독성평가, 민감성 결정요인 식별, 바이러스 추적, 약물 표적 식별 연구가 활발하게 이뤄졌다. 이를 위한 집단 유전체학 연구 규모 확대는 HPC와 가속 성능이 좌우하게 됐고, 처리 속도가 빠를수록 많은 양의 유전체 데이터를 처리하고 분석할 수 있게 됐다.

예를 들어 최근 대량의 체학(유전체학·단백질체학 등 생물학의 다양한 영역) 데이터 분석에 최적화된 성능을 발휘하는 유전체학 특화 HPC 솔루션이 개발됐다. 효율적이고 접근성 높은 HPC 솔루션은 크고 작은 연구기관의 과학자들이 방대한 양의 유전체 데이터를 더 빠른 시간 안에 분석할 수 있게 돕는다.

HPC는 인공지능(AI)과 함께 인류 건강은 물론 기후예측, 제조, 기초연구 산업에서 발전 핵심 원동력이다. 특히 생명과학 연구에서 높은 처리량, 연구 인프라 최적화 및 데이터 보호를 지원하는 HPC 시스템은 필요하다. HPC 기술을 이용해 고성능 R&D 인프라를 제공, 이에 대한 유전체 염기서열을 신속하게 분석할 수 있기 때문이다. 이를 통해 백신 개발에 적용할 수도 있다.

신규식 레노버 ISG 코리아 대표
신규식 레노버 ISG 코리아 대표

AI는 방대한 양의 유전체 정보를 유의미하게 구분하고 필요한 정보만을 걸러서 객관적인 의사결정에 활용하도록 하는 또 다른 핵심 기술이다. 새롭게 개발된 유전체학 최적화 HPC시스템의 유전체 분석 시간은 단 48분이다. 기존 150시간에서 크게 단축돼 더 많이 생산성 높은 유전체 분석을 가능하게 했다. 이는 글로벌 팬데믹 상황에서 중요한 역할을 하고 있다.

HPC 시스템은 정밀의학이나 농업 분야에도 유전체분석 연구를 실행하는데 필요한 기술 토대를 제공한다. 아시아 지역 '유전적 다양성'을 세계 유전학 연구에 반영하기 위해 우리나라를 포함한 싱가포르, 미국, 인도 등 산·학·연 기관이 10만개 아시아인 유전체 분석에 협력하는 프로젝트를 진행하고 있다. '게놈 아시아 프로젝트'에서는 아시아 인구 집단별 질병, 약물 부작용과 연관된 유전적 변이를 연구하고 있다. HPC 기반의 고성능 유전체 분석기술은 다양한 국가의 아시아인 유전체 데이터 분석에 활용되고 있다. 또 HPC 기술이 인구 집단별 차이를 고려한 치료법 개발에 사용되면서 환자에게 접근성이 더 높고 저렴한 치료 옵션을 제시하는 정밀의학 구현도 돕는다.

HPC 기반의 고속 유전체 분석기술은 농산물 최적 재배법 개발과 관개, 물부족, 병해충 등 작황환경 개선에 활용될 수 있다. 인도 뉴델리에 위치한 델리대의 '농작물 유전적 변이 센터'(CGMCP)에서는 HPC 및 유전체 염기서열 분석 기술을 활용해 유해균, 가뭄과 같은 열악한 환경 조건에 저항할 수 있는 농작물 품종 개선 연구를 하고 있다.

HPC 환경의 최첨단 연구 지원 가능성은 무궁무진하다. 백신 치료제의 빠른 개발부터 유전체 염기서열 분석시간 단축까지 HPC 시스템은 인류의 가장 큰 도전 과제 해결에 도움을 줄 것이다.

신규식 레노버ISG코리아 대표 sshin2@lenovo.com