GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

엔비디아가 실리콘밸리 산호세컨벤션센터에서 GTC(GPU Technology Conference) 2015 행사를 개최했다. 3월 17∼20일까지 열리는 이번 행사의 가장 큰 주제는 딥러닝(Deep Learning). 17일 키노트를 진행한 엔비디아 CEO 젠슨 황(Jen Hsun Huang)의 첫마디도 딥러닝이었다.

GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

키노트에서 소개한 내용은 크게 4가지다. GPU와 디지츠 데브박스(Digits Devbox), 향후 로드맵과 자동운전 차량 기술이 그것. 물론 이들 기술은 모두 GPU와 딥러닝이라는 공통 분모를 갖고 있다.

GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

무대에 오른 젠슨 황은 먼저 GPU 컴퓨팅이 얼마나 성장했는지에 대해 언급했다. GP GPU(General Purpose Graphics Processing Units), GPU를 연산에 활용하는 기법인 GPU 병렬 컴퓨팅은 지난 10년 동안 10배에 달하는 성장을 해왔다. 지난 2008년까지만 해도 쿠다 다운로드 수는 15만에 불과했지만 2015년 현재 300만에 달한다. 같은 기간 쿠다 앱은 27개에서 319개로 늘었다. 대학 교육은 60개에서 80개, 논문은 4,000개에서 6만 개로 늘어났고 테슬라 GPU 수는 6,000개에서 45개로 성장했다.

GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

엔비디아가 이런 GPU 컴퓨팅 발전을 위해 주목하고 있는 분야는 바로 딥러닝이다. 젠슨 황 CEO은 맥스웰 아키텍처를 적용한 타이탄X(TitanX)를 소개했다. 타이탄X는 개발 코드명 GM200으로 불리던 것으로 쿠다 코어 3,072개를 적용했다. 칩에 들어간 트랜지스터 집적수는 80억 개에 달한다. 연산 성능은 7TFlops(테라플롭스), 메모리 용량은 12GB에 달한다. 단일 정밀도(single precision) 뿐 아니라 배정밀도(double precision)도 지원하지만 성능 향상폭이 별로 없어 사실상 단일 정밀도 위주로 생각하는 게 좋다.

GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

타이탄X는 게이머용이지만 딥러닝 연구 목적으로도 활용할 수 있다. 알렉스넷(AlexNet)이라는 신경 회로망을 예로 들면 인텔 제온 CPU 16코어가 43일 걸릴 일을 타이탄은 6일, 타이탄 블랙 cuDNN은 4.5일 수준으로 줄였지만 이번에 선보인 타이탄X cuDNN을 적용하면 2.5일까지 줄어든다는 설명이다. 타이탄X의 가격은 999달러다.

GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

디지츠 데브박스(Digits Devbox)는 일종의 컴퓨터라고 생각하면 쉽다. 다만 이 제품은 개발자나 연구자를 돕기 위한 것이다. 연구를 할 때에는 PC 같은 하드웨어도 동일 연구 환경이어야 개발이나 연구가 훨씬 용이하다. 디지츠 데브박스는를 위한 제품으로 하드웨어 기반 외에 소프트웨어를 함께 공급한다. 젠슨 황 CEO는 이를 통해 의학 같은 분야는 물론 음성 검색 등에도 활용할 수 있을 것이라고 말했다.

GPU 컴퓨팅 “이젠 딥러닝에 주목한다”

디지츠 데브박스를 이용한 이미지 인식 알고리즘이나 이미지를 인식해 텍스트 캡션으로 설명하는 데모도 함께 진행했다. 토론토대학 알렉스 크리체프스키 등이 개발한 방식으로 CNN 나선형 신경망(Convolutional Neutral Networks) 알고리즘인 알렉스넷을 이용해 여러 이미지를 인식한 뒤 캡션을 다는 등 다양한 딥러닝 작업에 디지츠 데브박스를 활용할 수 있다는 것.

알렉스넷이 등장한 이후 머신러닝 학습이 어려웠던 이유는 크게 2가지였다. 네트워크 속도가 느렸다는 것과 컴퓨팅 파워가 떨어졌다는 것. 디지츠 데브박스는 이런 컴퓨팅 파워를 끌어올려 원활한 딥러닝 학습을 돕는다. 하드웨어 외에도 쿠다, 미들웨어인 cuDNN(cuda Deep Neutral Network) 등을 함께 제공한다. 디지츠 데브박스는 인텔 코어i7 프로세서에 에이수스 X99, 타이탄X GPU 4개에 DDR4 64GB, 우분투 14.04, 쿠다 툴킷 7.0 등으로 이뤄져 있다. 5월 출시되며 가격은 1만 5,000달러다.

향후 로드맵에 대해서도 언급했다. 파스칼은 현재 사용 중인 맥스웰의 차기 아키텍처로 오는 2016년 선보일 예정이다. 엔비디아는 파스칼에 대해 이미 지난해 대략적인 내용을 밝힌 바 있다. 파스칼은 메모리 여러 개를 쌓아올리고 이를 수직으로 연결하는 기술인 3D 메모리(3D memory), CPU와 GPU 혹은 GPU끼리 데이터 병목 현상을 해결한 NV링크(NV Link) 외에 이번에 새로 밝힌 내용은 단일 정밀도와 배정밀도에서 모두 잘 돌아간다는 점이다. 예전에는 단일 정밀도나 배정밀도를 이용할 땐 따로 모드를 설정했지만 모드 설정 없이 이용할 수 있게 될 것으로 보인다. 엔비디아 측은 파스칼이 메모리 속도 6배, NV링크 10배 등 성능 향상을 통해 현재 맥스웰 아키텍처보다 10배에 달할 것으로 전망하고 있다. 파스칼 이후 차기 버전인 볼타(Volta)는 오는 2018년 선보일 예정이다.

젠슨 황이 소개한 마지막 제품은 자동 주행 개발 플랫폼인 드라이브 PX(Drive PX)다. 현재 나온 ADAS(Advanced Driver Assistance System), 고급 운전자 지원 시스템의 경우 단순한 정보 인식 수준이지만 딥러닝을 결합하면 사람보다 더 인지 능력을 좋게 할 수도 있다는 것. 미국방위고등연구계획국(DARPA)과 개발 중인 프로젝트 데이브(Project DAVE)의 경우 DNN(Deep Neutral Network) 기반 자동 운전 로봇이다. 이 로봇은 머신 러닝을 통해 22만 5,000장에 달하는 이미지를 학습해 카메라와 이미지를 통한 머신 러닝만으로 자동 주행을 한다.

현재 데이브는 초당 12프레임을 인식하지만 드라이브PX를 이용하면 이를 184프레임으로 끌어올리는 등 지금보다 3,000배나 빨라진다는 설명. 머신러닝을 통한 뉴런, 신경망 구조는 결국 사람의 뇌처럼 컴퓨터로 신경망을 구성하는데 필터가 많을수록 정확도가 높아진다는 점에서 드라이브PX가 강점을 지니고 있다는 것이다. 드라이브PX는 5월 출시되며 가격은 1만 달러다. 이 날 행사장에는 테슬라모터스의 CEO인 엘론 머스크가 무대에 등장해 젠슨 황 CEO와 대담을 나누기도 했다. 엘론 머스크는 “결국 사람이 운전하는 것보다 더 안전해질 것”이라면서 머신러닝과 딥러닝, 신경망 구성을 위해 뛰어난 컴퓨팅이 필요하다는 점을 강조했다.

전자신문인터넷 테크홀릭팀

이석원기자 techholic@etnews.com