이미지 분류? 사람보다 컴퓨터가 낫다

로봇이 사람보다 뛰어난 분야는 얼마나 될까. 자동차 조립, 체스에 이어 이미지를 분류해 정렬하는 데도 로봇이 사람보다 높은 성적을 기록했다.

가디언 및 주요 외신은 중국 최대 검색 포털 업체 바이두(Baidu)의 슈퍼컴퓨터 ‘민와(Minwa, 사진)’가 이미지넷(ImageNet) 벤치마크 테스트에서 역대 최저 오류율인 4.58%를 기록했다고 14일 보도했다.
가디언 및 주요 외신은 중국 최대 검색 포털 업체 바이두(Baidu)의 슈퍼컴퓨터 ‘민와(Minwa, 사진)’가 이미지넷(ImageNet) 벤치마크 테스트에서 역대 최저 오류율인 4.58%를 기록했다고 14일 보도했다.

외신은 중국 최대 검색 포털 바이두(Baidu) 슈퍼컴퓨터 ‘민와(Minwa)’가 이미지넷 벤치마크 테스트에서 역대 최저 오류율인 4.58%를 기록했다고 14일 보도했다.

이미지넷 테스트는 데이터베이스에 저장된 100만개 이상 이미지를 1000여개 사전 정의된 카테고리로 분류하는 작업이다. 예를 들어 다양한 종의 개를 보여주고 그 중 ‘요크셔테리어’를 고르는 식이다.

이미지넷 테스트에서 인간 오류율은 평균 5%대로, 컴퓨터는 5년여 전부터 이 수치에 근접하기 시작해 최근에는 이를 훌쩍 뛰어넘는 성적을 기록 중이다. 올 초 마이크로소프트(MS)는 4.94%, 구글은 4.8%을 각각 기록했다. 바이두의 이번 기록으로 세계 주요 슈퍼컴퓨터의 이미지 인식 및 분류 능력이 인간보다 완연히 높아졌다고 가디언은 분석했다.

바이두는 민와 인공지능(AI)을 향상해 이같은 성적을 냈다. 민와에 비주얼 데이터를 다루는 데 쓰이는 고성능 그래픽프로세싱유닛(GPU) 144개, 432개 코어를 탑재한 중앙처리장치(CPU) 72개, 서버노드(Server node) 36개를 탑재해 대형 클러스터(cluster) 구조의 AI 소프트웨어(SW)를 가동했다.

이미지를 인식할 때 ‘신경 네트워크’를 적용, 소프트웨어가 이미지를 고해상도로 읽어들이도록 하고 인식이 안되면 해상도를 더 높이도록 설정한다.

이런 딥러 형태 인공지능은 학습하는 데이터에 의존해 ‘과잉적합(overfitting)’ 현상이 발생한다. 이미지 속 한 부분에만 집중, 이미지 전체를 인식하는 데 실패하는 게 대표적인 예다. 바이두는 이를 막기 위해 이미지를 기울이거나 색상·모양 등을 왜곡해도 이미지 속 피사체를 바르게 인식하도록 했다. 류 응 바이두 수석 과학자는 “이 기술을 응용해 우리가 1년 전에는 하지 못했던 다양한 것들을 할 수 있을 것”이라고 말했다.

바이두는 이 알고리즘을 자사 음성 인식 기능을 보강하는 데 쓸 계획이다. 1만4000여시간에 달하는 대화 데이터를 배우게 해 중국어와 영어를 식별하게 하겠다는 내용이다. 향후 1년 반 내 초당 7000조를 계산해내는 성능의 시스템도 구축한다. 이는 세계에서 가장 성능이 좋은 슈퍼컴퓨터 중 10위 안에 드는 수치다.

김주연기자 pillar@etnews.com