“인공지능(AI) 반도체는 뛰어난 성능의 하드웨어(HW)뿐만 아니라 사용자가 원하는 AI 모델을 칩에 최적화해 적용하게 하는 소프트웨어(SW) 스택까지 통합 지원돼야 합니다.”
백준호 퓨리오사AI 대표는 “2세대 AI 반도체 '레니게이드' 기반의 상용 AI 서비스가 이르면 내년 1분기 나올 예정”이라면서 이같이 밝혔다.
백 대표는 “퓨리오사AI는 실제 고객들이 서비스를 구현할 수 있도록 SW 스택까지 통합 지원하고 있다”며 “150여명의 임직원 중 120여명이 엔지니어인데 이중 70%가 SW 엔지니어로 공을 들이고 있다”고 설명했다.
퓨리오사AI는 2017년 설립된 AI 반도체 설계전문(팹리스) 기업이다. 백 대표는 조지아공과대 학·석사 학위를 받은 뒤 AMD, 삼성전자에서 HW·SW 엔지니어링을 모두 경험한 전문가로 회사 공동 창업자 중 한 명이다.
퓨리오사AI는 AI 추론을 위한 서버용 AI 반도체를 개발하는 국내 업체들 중 가장 빠른 행보를 보이고 있다. 2021년 컴퓨터 비전용 AI 반도체 '워보이'를 출시한 데 이어 올해 5월 서버 시장을 겨냥한 추론용 AI 반도체 '레니게이드'를 내놨다. 선두 업체인 만큼 업계는 퓨리오사AI의 AI 반도체가 실제 데이터센터 적용되는지 관심이 쏠린 상태다.
그는 “LG, 사우디 아람코를 비롯해 3~4개 업체가 연내 평가를 진행하고 내년 1월 국내 대기업을 비롯해 국내외 고객사로 확대될 예정”이라며 “현재 레니게이드는 소량만 생산 중이나, 내년 2분기부터는 대량 생산에 들어갈 것으로 기대한다”고 전했다.
레니게이드는 TSMC 5나노미터(㎚) 공정으로 만들어지며 하드웨어 연산 처리 성능은 FP8 기준 512TFLOPS다. 초당 512조번의 부동소수점 연산 처리가 가능하다는 의미다. 메모리는 48기가바이트(GB) HBM3를 탑재해 초당 1.5테라바이트(TB) 대역폭을 지원하며 열설계전력(TDP)은 150와트(W)다.
백 대표는 “레니게이드는 고대역폭메모리(HBM)를 통합한 첫 국내 AI 반도체로 시스템온칩(SoC)도 400억개의 트랜지스터를 집적한 652제곱밀리미터(㎟)로 매우 크다”며 “2021년 제품 구상 단계에서 우려도 있었지만 목표한 성능의 칩을 선보일 수 있었다”고 회상했다.
이어 “레니게이드는 전력 소모와 투자 비용 측면에서 강점을 갖고 있다”며 “TDP도 150~200W 수준으로 기존 공랭식 데이터센터에서도 잘 구동되는 제품”이라고 자신했다.
그러면서 경쟁 제품으로 엔비디아 'L40S'을 꼽았다. 백 대표는 GPT-J 6B 모델 기준 MLPerf 벤치마크에서 두 제품의 추론 성능은 12.3QPS(초당 처리 가능한 쿼리)로 같으나 전력소모량은 레니게이드가 209W로 L40S(320W)보다 50% 가까이 낮다고 소개했다.
박진형 기자 jin@etnews.com
-
박진형 기자기사 더보기