인공지능(AI) 기반 생물 유전체 빅데이터 분석기업 인포보스(공동대표 손장혁·박종선)는 최근 세계 최대 식물 게놈 데이터베이스 'Plant Genome Database(이하 PGD)'를 구축했다고 25일 밝혔다.
PGD는 게놈아카이브(GenomeArchive)에서 제공되는 표준화된 구조를 바탕으로 자료 접근이 가능한 식물 게놈 데이터를 통합한 데이터베이스다. 주석이 된 정보를 제공하며 블라스트(BLAST)를 포함한 여러 생물정보학 도구들을 사용할 수 있다.
PGD는 현재 638종으로부터 총 1986개의 식물 게놈을 보유하고 있다. 수집된 게놈 총 길이는 939,574,681,579염기쌍(bp, basepairs)로 인간 게놈 길이(3.2Gbp)의 약 293배에 달한다.
PGD는 모든 데이터 접근이 가능한 무료 웹서비스 형태로 공개됐다. 유저들이 웹 상에서 유전체, 염기서열 등 오브젝트를 저장하고 분석 프로그램을 구동할 수 있는 웹 기반 플랫폼인 글로벌스크랩(GlobalScrap)이 적용됐다.
PGD는 4년간 유지·관리되며 총 8번 업데이트를 수행했다. 향후 세포 내 단백질 위치를 예측하는 TargetP, 분비 단백질을 예측하는 SignalP 등 도구를 추가했다.
박종선 대표는 “세계적으로 진행되는 수백종 식물유전체 데이터를 비교 분석하는 기반을 마련했다”며 “생물정보학 분야 풍부한 식물자원을 연구하는 기초자료로 활용되길 기대한다”고 밝혔다.
정현정기자 iam@etnews.com
-
정현정 기자기사 더보기