1968년에 최초의 컴퓨터 바둑 프로그램을 만든 이는 앨버트 조브리스트다. 초보자 정도는 쉽게 이길 수 있었다. 조브리스트는 1970년에 박사학위를 받았다. 1965년 과학전문지 뉴사이언티스트(New Scientist)에 게재된 '바둑의 신비'는 바둑의 상태 공간이 19×19로 체스보다 넓을 뿐만 아니라 매수 가능한 경우의 수가 체스의 35에 비해 매우 큰 250으로, 연산량이 기하급수적으로 폭증한다는 어려움을 토로했다. 1997년 세계 체스 챔피언 가리 카스파로프를 IBM의 '딥블루'가 꺾은 후 2016년 알파고가 바둑에서 이세돌 9단을 이기기까지는 또 다른 20년의 세월이 필요했다.
전통적인 게임 프로그래밍 이론은 민맥스(MinMax)다. MinMax는 결코 현재 나에게 가장 유리해 보이는 수를 덜컥 선택하지 않는다. 상대는 바보가 아니다. 상대는 내가 둔 수에 대응할 '최상의 수'로 반격한다. 내가 250수 가운데 하나를 고르면 상대는 250의 제곱인 6만2500가지 가운데 최상의 수를 찾아내어서 반격할 것이다. 그러므로 MinMax는 내 선택에 대응한 최상의 상대방 반격 후보 가운데 최악의 수를 찾아내어 상대방의 능력 발휘를 차단한다. 한 수 앞을 내다본 것이다. 하지만 두 수 앞을 보려면 40억, 세 수 앞이면 200조의 기하급수적 수 폭발로 연산용량의 한계에 곧 부닥친다. 이를 극복하는 큰 발전은 실전바둑의 고수로서 전문지식과 경험을 겸비한 융합형 프로그래머들이 뛰어들어 이루어진다. 1970~1980년대 '전문가 시스템' 운동이다. 2000년대에는 몬테카를로 기법이 탐색 공간을 크게 줄이며 또 한 번 큰 발전을 이룬다. 2000년대에 빠르게 발전한 딥러닝 기법, 방대한 기보 빅데이터, 고성능 컴퓨팅에 힘입어 2016년 알파고는 이세돌 9단에게서 승리를 거둔다. 드디어 오래된 '바둑의 신비'가 풀렸다. 그동안 사람들을 매료시킨 '동양의 신비'는 깨졌다. 바둑은 신비해 보였을 뿐 '덩치가 꽤나 큰 체스 문제'에 불과했음이 확인됐다.
대중은 딥러닝과 빅데이터에 열광했다. 빅데이터 구축이 궁극의 문제해결 방법이라는 '빅데이터 만능주의'가 퍼졌고, 여기저기서 빅데이터와 데이터 댐을 구축하는 사업이 우후죽순처럼 시작됐다. 딥러닝에 필요한 좋은 데이터를 만든다며 수많은 의료 영상에 라벨 붙이기 수작업에 의사들이 총동원되면서 '기계를 위해 사람이 봉사하는' 촌극도 벌어졌다. 하지만 알파고는 계속 진화했다. 2016년 말 업데이트된 '알파고 마스터'는 2017년 1월까지 세계 챔피언 커제에 대한 3연승을 포함, 무패 60연승의 눈부신 기록을 세웠다. 알파고 마스터는 이세돌 9단을 이긴 '알파고 리'에게 3점을 접어 주는 수준이었다. 2017년 10월에 출현한 '알파고 제로'는 사흘 만에 알파고 리에게 100연승을 거두었고, 21일 만에 알파고 마스터 수준에 도달하고 40일째에는 기존의 모든 버전을 다 격파했다. 중요한 점은 알파고 제로가 더 이상 인간의 바둑 빅데이터를 필요로 하지 않는다는 점이다. 데이터 의존형 딥러닝보다 학습이론 기반의 '강화학습'을 활용한 알파고 제로는 두 대의 알파고 제로가 백지상태에서 서로 바둑을 두면서 동반 진화한 것이다. 알파고 제로의 바둑은 사람의 바둑 스타일과 전혀 딴판이다. 사람이 둔 적 없는 많은 수를 두었다. 이제 '딥러닝'과 '빅데이터 신비주의'도 깨어졌다.
반세기에 걸친 긴 여행이었다. 단순 알고리즘에서 출발해서 게임 이론, 전문가 시스템, 몬테카를로, 딥러닝, 강화학습으로 이어진 끊임없는 탐구로 우리는 수천 년을 함께한 바둑이 무엇인지 조금 더 알게 되었다. 아직 미지의 영역인 '언어'나 '생명'의 신비가 다음 여행지다. 알파고는 2017년에 은퇴했고, 이세돌 9단은 제4국 승리로 기계와의 전쟁에서 '인류 최후의 승자'로 남았다.
서울대 의대 정보의학 교수·정신과전문의 juhan@snu.ac.kr
-
정현정 기자기사 더보기