'AI 추천시스템' 최대 17배 가속...데이터센터 최적화 가속기 반도체 개발

유민수 KAIST 교수팀, MCM 기술 기반
데이터센터 공간 효율성 난제 해결

유민수 한국과학기술원(KAIST) 전기및전자공학부 교수팀은 추천 시스템 고속화를 위한 '다중 칩 모듈'(MCM) 기술 기반의 혼합형 인공지능(AI) 가속기를 세계 최초로 개발했다고 6일 밝혔다.

MCM 기반 프로세서(이미지 왼쪽)와 FPGA에 구현된 추천시스템 가속기(오른쪽)를 도식화 한 이미지.
MCM 기반 프로세서(이미지 왼쪽)와 FPGA에 구현된 추천시스템 가속기(오른쪽)를 도식화 한 이미지.

기존 서버 시스템의 구조 변경은 최소화하면서 AI 기반 추천 시스템 성능을 대폭 강화하는 기술이다. 기존 추천 시스템을 최대 17배까지 가속할 수 있다.

AI 추천서비스는 사용자 이력·기록을 활용해 맞춤형 추천 정보를 제공하는 서비스다. 이용자 만족도, 기업 이윤을 확대하려면 빠르게 결과를 도출해야 하는데 '메모리 병목현상'이 발목을 잡아 왔다. 연산 시 프로세서인 중앙처리장치(CPU)가 메모리에서 데이터를 가져올 때 액세스 빈도가 불규칙하고 데이터 전송량이 늘어 문제였다.

연구팀은 지난해 AI 가속기를 메모리 근처에 두는 '프로세싱 인 메모리'(PIM) 기술을 개발, 병목현상 해결 방법론을 세계 최초로 제시했다. 프로세서와 메모리 간 실물 거리를 좁혀 병목현상 발생을 줄이는 식이다.

그러나 이 경우 PIM 기술을 활용하기 위한 별도의 연산 장치가 필요하다는 문제가 생겼다. 서버 시스템 구조를 변경해야 하기 때문에 데이터 센터 공간·전력 효율성을 저해한다는 한계가 있었다.

이번 연구에서는 MCM 기술로 이 같은 한계를 극복했다. MCM은 역할이 서로 다른 칩렛(칩 다이 탑재 기능을 분리한 작은 조각)을 하나로 패키징하는 것을 뜻한다. 연구팀은 이 기술로 프로세서와 '프로그램 가능 비메모리 반도체'(FPGA)가 단일화된 칩을 구현, 가속기를 개발했다.

이렇게 만든 가속기는 하드웨어(HW)를 단 메모리의 접근을 가능하게 한다. 또 FPGA 가변 논리회로로 추천 연산을 가속한다. 가속 효과는 2~17배에 이르고, 에너지 효율도 이전보다 높다. 또 기존 데이터센터 서버 시스템에 곧바로 적용할 수 있다.

유민수 KAIST 교수
유민수 KAIST 교수

연구팀은 삼성전자 미래기술육성센터의 지원을 받아 연구 성과를 냈다. 인텔 연구소로부터 MCM 기반 칩 관련 도움도 받았다. MCM 기반 칩은 인텔이 개발했다.

관련 연구 논문은 지난달 컴퓨터 시스템 구조 분야 최우수 국제 학술대회인 ACM/IEEE (ISCA)에서 발표됐다.

유 교수는 “추천 시스템 가속, 기존 데이터센터 시스템 적용 가능성과 공간 효율성을 모두 잡은 기술을 개발했다”면서 “AI 가속기 시장 판도를 국내 메모리 반도체 기업이 주도할 수 있도록 더욱 적극 산학 협력을 지속해 나가겠다”고 말했다.

대전=김영준기자 kyj85@etnews.com