엔비디아는 LG AI연구원이 지난달 공개한 최신 거대언어모델(LLM) '엑사원 3.0'에 자사 그래픽처리장치(GPU) 'H100'과 '네모(NeMo)' 프레임워크가 활용됐다고 24일 밝혔다.
H100은 엔비디아가 2022년 출시한 4나노미터(㎚) 공정 기반의 인공지능 서버용 GPU다.
엑사원 3.0이 사용한 엔비디아 네모는 어디서든 생성형 AI 모델을 구축, 배포할 수 있는 '엔드 투 엔드' 프레임워크다. LLM을 빠르게 훈련하고, 맞춤화하며, 규모별로 배포해 솔루션 구축 시간을 단축할 수 있다.
엔비디아 '텐서RT-LLM' 소프트웨어 개발 도구(SDK)도 사용됐다. 텐서RT-LLM은 엔비디아 AI 플랫폼에서 최신 LLM의 추론 성능을 가속화하고 최적화하는 오픈 소스 라이브러리다.
엔비디아는 엑사원 3.0이 이를 기반으로 한국어와 영어, 코딩 등 13개 벤치마크 점수 순위에서 1위를 차지했다고 소개했다. 특히 '메타'의 '라마' 등 동급 규모의 오픈소스 AI 모델 대비 한국어와 영어에서도 우수한 벤치마크 성능을 확보했다고 강조했다.
박진형 기자 jin@etnews.com
-
박진형 기자기사 더보기