서버전문업체 테라텍이 더 빠른 딥러닝 서비스를 보장하는 인공지능(AI)용 대용량 GPU 서버 시장 공략에 시동을 걸었다. 막중한 데이터 처리 부하를 해결, 신속한 웹서비스와 머신러닝 작업을 보장받고자 하는 고객 수요를 집중 공략한다.
테라텍(대표 공영삼)은 엔비디아 테슬라 계열 GPU 카드 또는 인텔 FPGA 카드를 최대 16개까지 지원하는 'JBOG(Just Bunch GPU)'인 대용량 GPU 박스(모델명 XC200) 공급을 시작한다고 14일 밝혔다. CPU가 없고 별도 서버와 스토리지에 연결하는 독립된 박스 형태를 JBOG라고 칭한다.
세계적 오픈컴퓨터프로젝트(OCP) 서버 제조사인 대만 위윈사가 작년 OCP커뮤니티에 'XC 200' 콘셉트를 소개한 후 많은 관심을 받아왔다. 위윈사는 기존 JBOD(Just Bunch Of Disc)에서 디스크를 GPU로 바꿨다.
이 제품은 기존 서버와 연결하기만 하면 손쉽게 GPU 카드를 최대 16개까지 늘릴 수 있는 장점이 있다. 4개 서버에 4개 GPU 카드를 배정하는 '4X4' 구성 △2개 서버에 8개 GPU 카드를 배정하는 '2X8' 구성 △1개 서버에 16개 GPU 카드를 배정하는 '1X16' 구성 등이 가능하다.
고객은 서버 대수와 GPU 카드수를 원하는 대로 구성할 수 있다. 특히 가격이 비싼 GPU 전용서버를 별도 구매하지 않아도 GPU 전용서버와 동일한 성능을 유지, 탁월한 가성비를 자랑한다.
김성윤 테라텍 기술연구소장은 “단순한 PCIe 확장 박스가 아닌 고성능 PCIe 스위치 칩을 사용해 서버와 연결된 트래픽 성능을 최대한 높여 결과적으로 'XC200'은 PCIe 슬롯에 직접 장착한 GPU 전용 서버와 거의 동일한 성능을 보인다”고 말했다.
또 이 제품은 4U사이즈에 4개 서랍(드로우어) 형태 구조를 갖고 있다. 하나 드로우어에는 각 4개 GPU 또는 FPGA 카드를 장착할 수 있고 각 서버와는 전용 리타이머카드를 통해 듀얼 링크로 연결된다. 현재 최고 사양 GPU인 테슬라 V100을 장착하면 4U에 1만280개 텐서코어를 수용할 수 있다.
GPU카드 수가 많은 만큼 전력 공급장치도 2+1기능을 지원하는 3㎾ 고용량 전원공급장치(PSU)를 3개 장착해 전력을 충분하게 공급한다. 21인치 OCP 랙에도 장착할 수 있다.
전승범 테라텍 영업본부장은 “본격적 출하는 3분기부터지만 이미 시제품을 주문받아 이달 중 국내 연구기관에 설치한다”면서 “현재 여러 연구기관과 딥러닝 관련 업체와 제품 상담을 진행하고 있다”고 말했다.
그는 “하반기부터는 GPU 클라우드 서비스 업계까지 마케팅 영역을 확대하는 등 본격적 영업에 나선다”고 덧붙였다.
한편 테라텍은 위윈사와 공동으로 NV링크형 32개 SXM3 GPU를 지원하는 하이브리드형 서버 및 PCIe Gen4 지원 GPU 서버 등도 내년 초 선보일 계획이다.
안수민기자 smahn@etnews.com
-
안수민 기자기사 더보기