디에스앤지, '엔비디아 블랙웰 GPU 최적화' 슈퍼마이크로 서버 선봬

발행일 : 2024-06-24 09:51 지면 : 2024-06-25 22면

슈퍼마이크로 국내 최대 총판 디에스앤지는 슈퍼마이크로가 생성형 인공지능(AI) 개발·구축을 지원하는 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼에 최적화된 '플러그앤플레이 액체 냉각식AI 슈퍼클러스터'를 공개했다고 24일 밝혔다.

슈퍼마이크로 슈퍼클러스터는 엔비디아가 최근 공개한 블랙웰 GPU에 최적화된 서버다. 여기엔 10U 공냉식 및 4U 수냉식 냉각 서버가 포함됐다. 액체 냉각식 AI 데이터센터에도 활용될 수 있다.

블랙웰은 엔비디아 호퍼 아키텍처의 후속 기술로 기존 AI칩의 성능을 개선한 차세대 AI칩이다. 2080억개의 트랜지스터를 탑재했고, 최대 10조개의 파라미터로 확장되는 모델에 대한 AI훈련과 실시간 거대 언어모델(LLM) 추론을 지원한다. 기존 대비 추론 성능은 최대 30배까지 향상될 수 있으며, 비용과 에너지 소비는 약 25분의 1 수준이다.

디에스앤지 관계자는 “슈퍼마이크로는 엔비디아와 긴밀한 협업을 기반으로 AI 혁신을 주도할 대규모 데이터센터까지 전환에 앞장서고 있다”며 “AI시대에 최적화된 데이터센터는 물론 관리형 서비스, 맞춤형 모델 개발 등 생성형 AI 활용 극대화 및 통합 인프라 구축을 위해 접근성을 높이고 있다”고 전했다.

실제로 슈퍼마이크로 엔비디아 MGX GH200 슈퍼클러스터는 9개의 랙에서 확장 가능한 컴퓨팅 단위로 그레이스 호퍼 슈퍼칩 256개를 탑재한다. 여기엔 전용 네트워킹 랙 1개도 포함돼 있다. 아울러 엔비디아 NIM 마이크로서비스 및 엔비디아 네모(NeMo) 플랫폼 등 엔비디아 AI 엔터프라이즈를 탑재했다. LLM 학습, 딥러닝, 추론 등을 최적화하기 위해 데이터센터에서 도입이 쉽고, 빠르게 결과를 확인할 수 있는 플러그 앤 플레이 확장형 유닛도 제공한다.

엔비디아는 최근 호퍼 아키텍처 기반의 엔비디아 H200 GPU가 엠엘퍼프(MLPerf) 추론 v4.0 테스트에서 가장 높은 기록을 세웠다고 발표하기도 했다. MLPerf는 기계 학습을 뜻하는 '머신러닝'과 성능을 의미하는 '퍼포먼스'를 합친 단어로, 규정된 절차를 통해 AI 반도체의 성능을 변별력 있게 시험하는 절차다.

디에스앤지 측은 “H200 GPU가 9개월 전 엔비디아 H100 GPU로 진행한 MLPerf 추론 v3.1 결과와 비교해 오프라인 기준 2.4배, 서버 조건 대비 2.9배 높은 값”이라며 “이를 통해 AI 발전이 더 빨라질 것” 이라고 설명했다. 또 “H200은 물론이고 올해 하반기에 출시 예정인 블랙웰에 대한 기술검증(PoC)도 진행할 것”이라고 덧붙였다.

김정희 기자 jhakim@etnews.com