로봇이 사람보다 뛰어난 분야는 얼마나 될까. 자동차 조립, 체스에 이어 이미지를 분류해 정렬하는 데도 로봇이 사람보다 높은 성적을 기록했다.
외신은 중국 최대 검색 포털 바이두(Baidu) 슈퍼컴퓨터 ‘민와(Minwa)’가 이미지넷 벤치마크 테스트에서 역대 최저 오류율인 4.58%를 기록했다고 14일 보도했다.
이미지넷 테스트는 데이터베이스에 저장된 100만개 이상 이미지를 1000여개 사전 정의된 카테고리로 분류하는 작업이다. 예를 들어 다양한 종의 개를 보여주고 그 중 ‘요크셔테리어’를 고르는 식이다.
이미지넷 테스트에서 인간 오류율은 평균 5%대로, 컴퓨터는 5년여 전부터 이 수치에 근접하기 시작해 최근에는 이를 훌쩍 뛰어넘는 성적을 기록 중이다. 올 초 마이크로소프트(MS)는 4.94%, 구글은 4.8%을 각각 기록했다. 바이두의 이번 기록으로 세계 주요 슈퍼컴퓨터의 이미지 인식 및 분류 능력이 인간보다 완연히 높아졌다고 가디언은 분석했다.
바이두는 민와 인공지능(AI)을 향상해 이같은 성적을 냈다. 민와에 비주얼 데이터를 다루는 데 쓰이는 고성능 그래픽프로세싱유닛(GPU) 144개, 432개 코어를 탑재한 중앙처리장치(CPU) 72개, 서버노드(Server node) 36개를 탑재해 대형 클러스터(cluster) 구조의 AI 소프트웨어(SW)를 가동했다.
이미지를 인식할 때 ‘신경 네트워크’를 적용, 소프트웨어가 이미지를 고해상도로 읽어들이도록 하고 인식이 안되면 해상도를 더 높이도록 설정한다.
이런 딥러 형태 인공지능은 학습하는 데이터에 의존해 ‘과잉적합(overfitting)’ 현상이 발생한다. 이미지 속 한 부분에만 집중, 이미지 전체를 인식하는 데 실패하는 게 대표적인 예다. 바이두는 이를 막기 위해 이미지를 기울이거나 색상·모양 등을 왜곡해도 이미지 속 피사체를 바르게 인식하도록 했다. 류 응 바이두 수석 과학자는 “이 기술을 응용해 우리가 1년 전에는 하지 못했던 다양한 것들을 할 수 있을 것”이라고 말했다.
바이두는 이 알고리즘을 자사 음성 인식 기능을 보강하는 데 쓸 계획이다. 1만4000여시간에 달하는 대화 데이터를 배우게 해 중국어와 영어를 식별하게 하겠다는 내용이다. 향후 1년 반 내 초당 7000조를 계산해내는 성능의 시스템도 구축한다. 이는 세계에서 가장 성능이 좋은 슈퍼컴퓨터 중 10위 안에 드는 수치다.
김주연기자 pillar@etnews.com