KAIST, 그래프 AI 추론 가능한 SSD 세계 최초 개발...엔비디아 GPU 성능 '7배'

한국과학기술원(KAIST)은 정명수 전기 및 전자공학부 교수팀이 세계 최초로 그래프 기계학습 추론의 그래프 처리, 그래프 샘플링, 신경망 가속을 스토리지 장치 근처에서 수행하는 '전체론적 그래프 기반 신경망 기계학습 기술(홀리스틱 GNN)'을 개발했다고 10일 밝혔다.

연구진은 프로그래밍 가능 반도체(FPGA)를 갖춘 새로운 계산형 스토리지SSD 시스템을 구현하고, 기계학습 전용 신경망 가속 하드웨어(HW)와 그래프 전용 처리 컨트롤러 및 소프트웨어(SW)를 시제작했다. 이는 최신 엔비디아 GPU 이용 기계학습 가속 컴퓨팅 대비 최대 7배 빨랐다.

홀리스틱 GNN 기술의 개요
홀리스틱 GNN 기술의 개요

그래프 자료구조를 적용한 기계학습 모델은 기존 신경망 기반 기계학습 기법들과 달리, 데이터 사이 연관 관계를 표현할 수 있다. 상품 및 아이템 추천, 사람이 추론한 것 같은 친구 추천 등이 가능하다.

그간 일반 가속 시스템으로 연산됐는데, 데이터를 스토리지로부터 메모리로 적재하고 샘플링하는 등 전처리 과정에서 심각한 성능 병목현상, 장치 메모리 부족 현상이 발생했다.

홀리스틱 GNN 기술은 데이터가 저장된 스토리지 근처에서 사용자 요청에 따른 추론 과정을 직접 가속한다. FPGA를 스토리지 근처에 배치한 새로운 계산형 스토리지(Computational SSD) 구조를 활용해 대규모 그래프 데이터 이동이 필요 없게 했다. 전처리 과정 병목현상을 해결했다.

홀리스틱 GNN 기술은 또 다수 그래프 기계학습 모델을 프로그래밍할 수 있는 SW, 사용자가 자유롭게 변경할 수 있는 신경망 가속 HW 프레임워크 구조를 제공한다.

홀리스틱 GNN 기술의 로고
홀리스틱 GNN 기술의 로고

연구팀은 기술 실효성을 검증하기 위해 계산형 스토리지 프로토타입을 자체 제작한 후, 그래프 기계학습용 HW와 SW 프레임워크를 구현해 탑재했다. 그래프 기계학습 추론 성능을 제작된 계산형 스토리지 가속기 프로토타입과 최신 고성능 엔비디아 GPU 가속 시스템(RTX 3090)에서 평가한 결과, 홀리스틱 GNN 기술이 이상적인 상황에서 엔비디아 GPU 이용 그래프 기계학습 가속 시스템에 비해 평균 7배 빠르고 33배 에너지를 감소시킴을 확인했다. 특히, 그래프 규모가 점차 커질수록 전처리 병목현상 완화 효과가 증가해 최대 201배 속도가 향상되고, 453배 에너지를 감소할 수 있었다.

정명수 교수는 “대규모 그래프에 대해 스토리지 근처에서 그래프 기계학습을 고속으로 추론할 뿐만 아니라 에너지 절약에 최적화된 계산형 스토리지 가속 시스템을 확보했다”며 “기존 고성능 가속 시스템을 대체해 초대형 추천시스템, 교통 예측 시스템, 신약 개발 등의 광범위한 실제 응용에 적용될 수 있을 것”이라고 말했다.

김영준기자 kyj85@etnews.com