‘중국판 구글’ 바이두가 세계에서 가장 정확한 컴퓨터 비전(vision) 시스템을 구축했다. 지난해 구글 출신의 딥러닝(deep learning) 분야 핵심 연구자를 영입한 데 이어 인공지능(AI) 분야에서 구글을 넘어선다는 전략이다.
중국 최대 검색 엔진 업체 바이두가 세계에서 가장 정밀한 컴퓨터 비전 시스템 ‘딥이미지(Deep image)’를 자사 슈퍼컴퓨터 ‘민화(Minwa)’에 구축했다고 18일 기가옴은 보도했다. 회사 측에 따르면 딥이미지의 이미지 인식 에러율은 5.98% 수준을 기록해 지난해 열린 ‘2014 이미지 인식 기술 대회(ImageNET)’에서 1위를 차지한 구글의 6.66%를 뛰어넘었다. 인간의 에러율은 5.1%로 알려져 있다.
딥이미지는 슈퍼컴퓨터에 인공지능 알고리즘을 접목해서 만들어졌다. 비전 분야에 인공지능의 일종인 딥러닝을 더한 것은 세계 처음이다.
딥러닝은 다량의 데이터나 복잡한 자료에서 핵심적인 내용이나 기능을 요약하는 알고리즘의 집합을 말한다. 얼굴·음성을 인식하거나 빅데이터로부터 중요한 의미를 추출하는 등 다양하게 활용된다. 애플의 음성인식 기술 시리(Siri)가 대표적이다. 초기 AI 기술은 수많은 데이터를 하나씩 살펴야 했기 때문에 학습 능력이 더뎠지만 딥러닝은 데이터가 많을수록 결론을 쉽게 낼 수 있다.
민화에는 총 144개의 그래픽저장장치(GPU)가 적용됐다. 서버 노드 하나당 GPU 4개가 들어갔고, 총 36개 서버가 3개의 클러스터로 나뉘었다. 딥러닝 알고리즘을 적용하기 위해 대역폭을 높였고 시스템 간 연결 지연(latency) 현상을 최저로 줄였다.
이는 구글의 인공지능 프로젝트 ‘구글 브레인’이 활용한 중앙처리장치(CPU) 클러스터 방식과 맞먹는 수준으로, 구글은 노드 1000개짜리 CPU 클러스터를 적용한 바 있다.
이 결과 빛의 상태 등 외부 조건이나 색상을 포함한 이미지 상태와 무관하게 이를 인식할 수 있게 됐다. 알고리즘을 최적화하는 과정에서 이미지 해상도도 종전 256×256픽셀에서 512×512픽셀로 끌어올려 더 작은 크기라도 판별해낼 수 있게 만들었다.
바이두가 딥러닝 등 인공지능에 몰두하는 것은 업계 1위인 구글을 따라잡기 위한 포석이라는 게 외신들의 해석이다. 바이두는 인공지능 역량을 보강, 2020년까지 매출액 1600억위안을 달성하겠다는 계획이다.
회사는 지난해 5월 미국 실리콘밸리에 인공지능 연구소를 세우고 앤드류 응(Andrew Ng) 스탠포드대학 박사를 총책임자로 영입했다. 앤드류 응은 구글 브레인 프로젝트에 참여했던 세계 딥러닝 1인자다. 11월에는 언어 인식 시스템인 ‘딥스피치(Deep Speech)’를 만든다고 발표한 바 있다. 올해 인공지능 전문 연구원 200여명을 더 고용할 예정이다. 딥이미지 서비스는 딥스피치가 정식 공개된 후 한달 내 서비스될 예정이다.
한편 구글도 인간을 대신해 문제를 해결하게 만드는 딥러닝 소프트웨어로 독자 생태계를 조성하고자 관련 사업에 박차를 가하고 있다. 지난해 1월 인공지능 기술 업체 ‘딥 마인드’를 4억달러에 인수하고 자사 모바일 음성인식 서비스에 딥 러닝을 접목했다.
김주연기자 pillar@etnews.com