[ICT시사용어]알파고 제로

발행일 : 2017-10-26 14:23 지면 : 2017-10-27 26면

알파고 제로는 구글 딥마인드가 공개한 새로운 인공지능(AI)이다. 순수 독학만으로 기존 버전인 알파고마저 압도하는 실력을 갖췄다고 알려지면서 유명해졌다.

데미스 허사비스 딥마인드 최고경영자(CEO)와 소속 연구원 17명은 이런 내용을 담은 '인간의 지식 없이 바둑 마스터하기(Mastering the game of Go without human knowledge)'라는 논문을 과학 학술지 네이처에 발표했다.

알파고 제로는 바둑 규칙 이외에 아무 사전 지식이 없는 상태로 인공신경망 기술을 활용, 스스로 대국하며 바둑 이치를 터득한다. 승률을 높이는 수에 관한 데이터를 스스로 생성하며 수준을 높인다. 생물의 뇌에서 실제 작동하는 '강화 학습'과 유사하다.

이런 과정으로 단기간에 알파고마저 뛰어넘었다. 독학 36시간 만에 지난해 3월 이세돌 9단을 압도한 버전(알파고 리)의 실력을 넘었다. 알파고 제로가 72시간 독학한 뒤 이세돌 대국 당시와 같은 대국 조건(제한 시간 2시간씩)으로 알파고 리와 대결한 결과 100전 완승했다. 알파고 제로는 한 수에 0.4초가 걸리는 초속기 바둑으로 490만판을 혼자 두면서 연구했다.

40일 동안 2900만판을 혼자 둔 뒤 올해 5월 중국의 커제 9단을 꺾은 기존 최강 버전 '알파고 마스터' 실력까지 압도했다. 알파고 제로는 알파고 마스터와 대결, 100전 89승 11패를 거뒀다.

알파고 제로가 기존 버전마저 넘어선 이유는 인간의 선입견을 철저히 배제했기 때문이다. 기존 알파고 버전은 인간의 기보와 정석으로 공부했다. 독학 과정에서 스스로 기존 정석을 깨닫고 독특한 정석까지 개발했다.

유창선 성장기업부 기자 yuda@etnews.com