인공지능 핵심 인프라 국산화 착수, 클라우드로 제공한다

오는 3월 서울에서 프로기사를 꺾은 알파고 인공지능 프로그램과 이세돌이 인간의 자존심을 걸고 대결을 벌인다. 사진은 이세돌과 인공지능 바둑프로그램. 사진=구글
오는 3월 서울에서 프로기사를 꺾은 알파고 인공지능 프로그램과 이세돌이 인간의 자존심을 걸고 대결을 벌인다. 사진은 이세돌과 인공지능 바둑프로그램. 사진=구글

정부가 인공지능(AI)을 구현하는 핵심 인프라를 국산화한다. ‘4차 산업혁명’ 핵심 키워드인 인공지능 영역에서 선진국과 격차를 줄인다는 목표다. 중소기업 활용을 확대하고자 클라우드로 제공한다.

24일 정부에 따르면 미래창조과학부는 2019년까지 70억원을 투입, 딥러닝(Deep Learning)용 고성능컴퓨팅(HPC) 시스템을 개발한다. 인공지능 영역의 하나인 딥러닝을 구현하는 핵심 인프라를 국산화한다.

딥러닝은 컴퓨터가 사람 개입 없이 스스로 학습해 데이터를 인지·분석하는 인공지능 기술이다. 세계 바둑 챔피언 이세돌 9단에게 도전장을 낸 구글 인공지능 ‘알파고’도 딥러닝 알고리즘에 바탕을 두고 있다. 인간과 로봇 간 소통으로 주목받은 영화 ‘로봇, 소리’도 마찬가지다.

딥러닝을 구현하려면 스스로 학습하는 ‘모델 트레이닝’을 거쳐야 한다. 기계가 언어, 이미지 등을 반복 학습하는 훈련이다. 엄청난 데이터를 빠른 시간에 습득하는 데 모델 알고리즘과 대용량·고성능 하드웨어(HW)는 필수다. 구글, 페이스북, 바이두 등은 자체 개발한 병렬 분산처리 프레임워크와 대규모 데이터센터로 기술을 확보했다.

대규모 딥러닝 모델을 위한 분산 병렬처리 개념도(자료 IITP)
대규모 딥러닝 모델을 위한 분산 병렬처리 개념도(자료 IITP)

정부는 국내에서 처음으로 딥러닝 핵심 소프트웨어(SW) ‘다중 노드 분산처리 SW 프레임워크’를 개발한다. 단일 서버가 수행하던 모델 트레이닝을 복수 서버가 나눠 처리한다. 딥러닝 트레이닝 가속기 성능은 60밀리세컨드, 대규모 이미지와 음성인식 시간은 각각 2시간 및 9시간을 목표로 했다. 세계 최고 수준인 바이두와 MS 이미지, 음성 인식 성능이 각각 8.6시간, 39.27시간이다. 이를 최대 6분의 1 수준으로 단축한다.

훈련 지원 서버도 개발한다. 범용 x86서버가 아닌 프로그래머블반도체(FPGA) 기반 딥러닝 전용 서버가 유력하다. FPGA는 특정 프로그램만 수행하도록 설계된 프로세서다. 빅데이터와 검색엔진 등 빠른 처리 속도가 필수인 곳에 활용된다.

이재진 서울대 컴퓨터공학과 교수는 “딥러닝 분야에서 다중 노드 분산처리 기술을 상용화한 사례는 국내에 없다”면서 “빅데이터, 인공지능 영역으로 적용이 확대되는 FPGA 기술도 확보할 가치가 있다”고 말했다.

4차 산업혁명 핵심인 인공지능은 혁신 기술로 주목받고 있다. 미국, 일본 등 각국 정부와 기업까지 기술 확보에 뛰어들었다. 우리나라는 선진국과 비교해 2~3년 뒤처졌다.

딥러닝용 HPC 기술 개발은 국가 경쟁력 확보 기반을 마련했다는 데 의의가 있다.

무엇보다 이번 사업은 중소기업에 희소식이다. 정부는 기술개발이 완료되면 서비스형 인프라(IaaS) 방식으로 제공한다. 판교 창조경제밸리 내 중소기업이 우선 적용 대상이다. 빅데이터, 딥러닝 등을 위해 값비싼 그래픽처리장치(GPU) 탑재 서버를 구매하거나 아마존웹서비스(AWS), 구글 등 HPC 클라우드 서비스를 이용할 필요가 없다. 정부가 제공하는 국산 HPC 클라우드를 저렴한 비용으로 사용할 수 있다.

박유미 한국전자통신연구원(ETRI) 책임연구원은 “그동안 데이터가 있어도 분석할 시스템이 없던 중소기업이 저렴한 클라우드 방식으로 HPC 자원을 쓸 수 있게 됐다”면서 “경쟁력 있는 스타트업도 딥러닝을 활용한 사업 모델을 발굴하는 상황에서 이 사업은 큰 도움을 줄 것”이라고 말했다.

인공지능 핵심 인프라 국산화 착수, 클라우드로 제공한다


정용철 의료/SW 전문기자 jungyc@etnews.com