[신년기획] 빅데이터 딥러닝 시대 이끌 핵심 반도체 키워드 GPU

빅데이터 처리 기술이 지향하는 모델은 ‘딥러닝(Deep Learning)’이다. ‘머신러닝(Machune Learning)’으로 불리기도 한다. 궁극적 목표는 이를 기반 삼아 컴퓨터 같은 기계 덩어리에 인공적 지능을 부여하는 것이다. 딥러닝은 단어 뜻 그대로 학습법을 의미한다. 수많은 데이터를 컴퓨터에 주입하고 해당 데이터가 의미하는 바를 해독할 수 있도록 만드는 것이 딥러닝의 일반적 정의다.

[신년기획] 빅데이터 딥러닝 시대 이끌 핵심 반도체 키워드 GPU

◇자율주행차 상용화 등 생활에 큰 변화 불러올 것

사람은 개나 고양이 사진을 보면 곧바로 개, 고양인지 분간한다. 컴퓨터도 딥러닝 과정을 거치면 이런 인지 능력을 가지는 것이 가능하다. 방법은 이렇다. 다양한 개, 고양이 사진을 수없이 보여주고 ‘이것은 개다’ ‘저것은 고양이다’라고 학습시키면 된다. 딥러닝을 발전시키면 컴퓨터가 사물이나 글자, 음성도 인식하게 된다. 2012년 7월 앤드류 응 스탠퍼드대학 교수는 구글 연구진과 함께 이 같은 딥러닝 관련 논문(Building High-level Features Using Large Scale Unsupervised Learning)을 발표해 화제를 낳았다.

딥러닝 다음 세대는 학습하지 않아도(Unsupervised Learning) 스스로 판단하는 환경이다. 스탠퍼드대학교 컴퓨터 과학과 소속 연구팀이 지난해 발표한 논문(Deep Visual-Semantic Alignments for Generating Image Descriptions)을 보면 별도 학습 없이도 컴퓨터가 사진 속 사물이 어떤 상태인지를 정확히 정의했다.

딥러닝과 이에 기반을 둔 인공지능 기술은 다양한 영역에 적용되며 우리 삶을 변화시킬 것으로 보인다. 차량 비전 시스템에 딥러닝과 인공지능이 부여되면 자율주행이 가능해진다. 바꿔 말하면 자율주행을 상용화하기 위한 선결 조건은 딥러닝과 인공지능 부여라는 의미다.

의료 분야에도 적용된다. 사람보다 컴퓨터가 더 정확하게 종양 발생 여부를 판독할 수 있다. 천체 시뮬레이션, 기상예측, 유전체 연구 등 전통 과학계산 영역에도 딥러닝이 활용될 가능성이 높다.

산업계도 바삐 움직이고 있다. 중국 검색포털 바이두는 음성, 물체인식과 번역 서비스 품질을 끌어올리기 위해 딥러닝 기술을 도입했다. 넷플릭스도 스트리밍 서비스 가입자 영화시청 패턴을 분석하는데 딥러닝 기술을 활용한다.

◇딥러닝에는 병렬 연산구조 GPU가 유리

문제는 딥러닝 환경을 갖추는 데 드는 비용과 학습 속도다. 앤드류 응 교수는 딥러닝 연구를 수행하기 위해 구글과 협력, 서버 1000개를 병렬로 연결했다. 이 시스템이 바로 한때 화제가 됐던 ‘구글 브레인’이다. 구글 브레인에는 총 2000개 CPU가 동원된 셈이다. 이 거대한 시스템은 3일 간 유튜브에서 200×200픽셀 크기 이미지 1000만개를 발췌, 분석한 결과 사람과 고양이 사진을 분간할 수 있었다고 한다.

이 연구는 딥러닝 가능성을 발견했다는 점에서 호평을 받았으나 업계와 학계에선 구축 비용이 너무 높고 학습 속도가 기대치에 미치지 못했다는 평가를 내놨다. 특히 비용이 문제다. 구글 브레인을 구축하기 위한 하드웨어 비용은 50억원에 달해 일반 중소·중견기업과 연구소는 도입 엄두를 내지 못한다. 도입한다 하더라도 60만와트(W)에 이르는 높은 전력비용을 감당할 기업은 많지 않다.

업계에선 병렬 연산에 특화된 그래픽처리장치(GPU)가 딥러닝 환경 구축 비용 장벽을 허물어줄 것으로 기대한다. 엔비디아는 자사 GPU 가속화 서버 3대(1만8432개 GPU 코어)면 구글 브레인과 동등한 성능을 낼 수 있다고 강조했다. 구축비용은 3300만원으로 저렴하고 전기 소모량도 구글 브레인 대비 현저히 낮은 4000W에 그친다. 실제 응 교수는 2013년 엔비디아와 함께 이 같은 사실을 검증한 논문(Deep Learning with COTS HPC Systems)을 국제기계학습학술대회(ICML)에 공개했다.

엔비디아 GPU로 딥러닝을 구현하는 방법은 C언어에 기반한 독자적 병렬처리 개발 플랫폼 쿠다(CUDA)를 활용해 학습 프로그램을 짜면 된다. 2008년까지만 해도 쿠다 다운로드 수는 15만회에 불과했지만 2015년 말 이 숫자는 300만회를 상회한다. GPU와 쿠다 관련 논문 또한 4000개에서 6만개로 크게 늘었다. GPU 병렬처리, 그리고 딥러닝 연구가 활발하게 이뤄진다는 증거다.

AMD도 딥러닝 시장에 들어오기 위한 채비를 마쳤다. AMD는 엔비디아처럼 독자적 병렬처리 개발 플랫폼을 내놓는 대신 업계 표준에 부합하는 ‘오픈CL’을 밀고 있다. 적어도 빅데이터를 처리하는 병렬처리 시장에선 GPU가 CPU를 압도하는 모양새다.

한주엽기자 powerusr@etnews.com