[ET시론]데이터의 힘:바이오 빅데이터 융합의 시대

관련 통계자료 다운로드 최고 수준 AI 연구자 출신국 비중

올해 노벨화학상은 미국 워싱턴주립대 산하 단백질설계연구소 소장인 데이비드 베이커 교수, 미국 구글의 인공지능(AI) 기업 '딥마인드'의 데미스 허사비스 최고경영자(CEO)와 존 점퍼 선임연구원이 공동 수상했다.

데이비드 베이커 교수는 2003년 단백질의 기본 요소인 아미노산을 사용해 기존 단백질과는 다른 완전히 새로운 단백질을 설계하는데 성공한 공로를 인정 받았다.

딥마인드의 허사비스는 바이오와는 전혀 관계없는 정보기술(IT) 전문가다. 2016년 딥마인드에서 개발한 AI 바둑 프로그램 '알파고'와 우리나라 이세돌 프로기사가 펼친 바둑 대결이 전 세계에 파장을 일으키며 덩달아 유명세를 탔다.

박준형 쓰리빅스 대표
박준형 쓰리빅스 대표

2020년 딥마인드는 '알파폴드2'라는 AI 모델을 발표해 약 2억개의 단백질 구조를 예측하게 했다. 현재 190개국 200만명 이상 연구자들이 알파폴드2를 사용하는 것으로 알려졌다. 알파폴드2 공개 4년 뒤 노벨화학상을 수상하기에 이르렀다.

노벨위원회는 “생명체는 단백질 없이 존재할 수 없다. 따라서 단백질 구조를 예측하고 직접 단백질을 설계할 수 있게 된 것은 인류의 가장 큰 혜택”이라고 딥마인드의 노벨화학상 선정이유를 밝혔다.

이제 바이오와 IT를 분리할 수 없는 시대다. 국내에서는 지난 2000년 부산대에서 생물정보협동과정이라는 대학원 교육과정이 개설돼 국내 10여개 대학에서 교육이 진행됐지만 20여년이 지난 현재는 오히려 이전보다 학생 수나 교육이 저조한 상태다. 졸업 후 취업의 불안정성과 다양한 분야 섭렵의 어려움으로 인해 학생들의 지원이 더욱 줄어드는 상태다.

최고 수준 AI 연구자 출신국 비중 (자료:마르코폴로)
최고 수준 AI 연구자 출신국 비중 (자료:마르코폴로)

바이오 IT 융합 기술을 가장 적극적으로 투자하고 활용하는 국가는 미국과 중국이다. 중국은 국가 차원에서 대규모 바이오 빅데이터 프로젝트를 추진하고, 이를 활용하고 분석할 수 있는 전산시스템 개발과 인력 양성에 엄청난 지원을 하고 있다. 필자가 직접 눈으로 확인한 중국의 바이오센터와 기업 규모, 수준은 국내 바이오 연구기관과 기업들보다 압도적으로 크고 높았다.

인도의 경우 'IT 허브'라고 부를 만큼 전문 인력이 육성되고 있다.

인도는 미국 다음으로 고도화된 AI 머신러닝 및 빅데이터 인재풀을 보유하고 있다. 세계 AI 인재 풀의 16%를 배출하며 미국, 중국과 함께 3대 인재 시장에 속한다. 그리고 선진국 대비 낮은 인건비와 고급 IT 전문 기술이 뛰어나 글로벌 IT 기업들의 각축장이 되고 있다.

실제 인도인들은 유명한 IT 기업 CEO 등 주요임원 자리를 상당수 꿰차고 있다. 구글 CEO 순다르 피차이, 마이크로소프트 CEO 사티아 나델라 등이 인도의 우수한 대학교 출신 CEO다. 현재 인도에서 가장 크게 성장하고 있는 도시인 방갈로르는 1200만명의 인구 중 IT 종사자 수만 400만명이 넘을 정도로 IT 인력들이 넘쳐난다. IBM, 인텔, 구글, 아마존 등 글로벌 대기업뿐 아니라 우리나라 삼성전자, LG전자도 진출해 인도 현지인을 고용하고 있다.

앞으로 이러한 바이오 빅데이터를 활용한 가장 큰 시장은 중동이다.

20여년 전부터 사우디아라비아, 아랍에미리트(UAE), 카타르 등 중동국가는 글로벌 연구기관, 산업체 등과 협력해 선진기술을 빠르게 구축하고 있다. 막대한 오일머니를 기반으로 3차 제조산업을 건너뛰고 4차 데이터 산업으로 빠르게 집중하고 있는 것이다.

이미 수십만명의 유전체 프로젝트를 진행했고, 이를 활용하는 산업을 준비하고 있다. 지난 1년 동안 중동국가의 바이오연구소, 기업, 대학, 병원들과 공동연구 및 협력을 진행하고 있다.

한국의 IT 및 바이오 빅데이터 기업들이 중동국가를 큰 시장으로 생각하고 비즈니스를 준비하는 것이 필요한 때다.

주요 국가별 AI 전문인력 현황
주요 국가별 AI 전문인력 현황

그리고 세계에서 가장 경제성장률이 빠른 곳인 필리핀, 인도네시아, 베트남, 말레이시아, 태국 등 동남아시아 국가도 주목할 필요가 있다. 아직은 바이오 헬스 분야 시장이 크지 않지만, 앞으로 5~10년 뒤에는 가장 큰 시장이 될 것이다. 동남아시아 국가와 바이오헬스에 대한 공동 협력 및 연구 제휴 등 정부차원에서 지원과 기업체의 기술지원, 대학교 인력양성 지원 등이 앞으로 시장 확대에 큰 도움이 될 것이다.

필자가 기계공학과 전기, 전자공학, 정보 공학의 융합 분야인 메카트로닉스를 전공한 후 생물정보학에 박사과정을 지원했을 때 지도교수님이 2000년에 하신 말씀이 아직도 선명하게 떠오른다. “앞으로 바이오 빅데이터를 기반으로 신약을 만드는 날이 올 것이다. 그래서 IT에 대한 지식과 바이오에 대한 지식을 함유하면 큰 시장을 만들어 갈 것이다”라는 말에 박사과정을 선뜻 지원했는데 벌써 그 말이 현실화되고 있다.

바이오 융합의 시대. 앞으로 우리나라가 다시 한 번 도전해야 되는 시장이다. 20여년 전에는 이 분야를 공부하고 졸업해도 취업에 대해 걱정하는 시기였지만, 이제는 이미 글로벌 시장에서 검증됐고 선진국은 더욱 집중하고 있다.

바이오 빅데이터 기업을 운영하면서 한국 부산대와 인도 Manipal대에서 겸임교수를 맡고 있는 필자는 시장의 성장을 위해서는 우수한 인력 양성이 필수이며, 앞으로 가장 큰 시장인 바이오헬스 분야의 체계적인 산학연과 정부의 협력 및 노력이 필요하다고 생각한다.

박준형 쓰리빅스 대표·부산대 의대 겸임교수 jhpark@3bigs.com

〈필자〉부산대에서 생물정보학협동과정을 졸업했다. 일찍부터 바이오와 IT를 결합한 생물정보학 연구에 매진해 제약사, 병원 등과 바이오 빅데이터 공동 프로젝트를 수행해 왔다. 2006년부터 2015년까지 바이오 기업 인실리코젠에서 본부장을 역임하며 다양한 유전자 분석 프로젝트를 주도했고, 2015년부터 2년간 테라젠이텍스 생물정보부 이사직을 수행했다. 2018년 쓰리빅스를 설립해 바이오 빅데이터 플랫폼, AI 기반 신약 개발 사업을 주도하고 있다. 아시아 종묘, 화장품 신소재, 신약 개발 등 다양한 영역에서 IT와 BT를 접목하는데 집중하고 있다.