컴퓨터와 인간의 두뇌, 둘 중 누가 더 뛰어날까?
난제로 알려졌던 ‘텍사스 홀덤’ 2인용 포커게임을 풀이한 컴퓨터 알고리즘이 개발됐다. 이 알고리즘을 적용해 컴퓨터가 사람을 이긴다면 체스, 체커 등에 이어 포커까지 컴퓨터가 승리하게 되는 셈이다.
컴퓨터가 처음 인간에게 이긴 것은 약 20년 전이다. IBM의 슈퍼컴퓨터 ‘딥블루(Deep Blue)’는 세계 체스 챔피언 가리 카스파로프(Garry Kasparov)를 1997년부터 무려 12년간 이겼다. 딥블루의 메모리에는 지난 100여년간의 체스 경기가 저장돼 있었다. 지난 2005년에는 아랍에미레이트 슈퍼컴퓨터 3대와 인간 복식조 3인이 겨뤘다. 결과는 컴퓨터의 승리였다.
포커는 달랐다. 텍사스 홀덤 포커는 각 참가자가 자신만 볼 수 있는 카드 2장을 받아 진행된다. 서로가 가진 카드에 대한 정보가 전혀 없어 심리전이 필요하다. 때문에 알고리즘도 불확실하게 짜여 질 수밖에 없었다.
캐나다 앨버타 대학 마이클 보울링 교수가 이끄는 연구진은 기존 CFP 알고리즘을 보완한 ‘CFP+’ 알고리즘을 최근 개발했다. 이를 활용해 2인용 텍사스 홀덤 포커를 해결, 해당 내용을 담은 논문을 사이언스지에 게재했다.
CRF+ 알고리즘은 게임 도중 각 결정 시점에서 최선이라고 여겨지는 전략에 따라 미세하게 다른 기술들이 작동해 그때그때 해결책을 내놓도록 했다. 결정 시점에서의 전략도 직전의 전략들을 무시하고 상대방의 전략을 반영해 계산하도록 짜여졌다.
논문에서는 이 알고리즘을 개발하기 위해 컴퓨터와 인간이 하루에 12시간씩, 무려 70년간 포커 게임을 해야 한다고 정의했다. 이만큼의 용량이 담기려면 메모리가 262테라바이트급이어야 한다. 기존 CFR알고리즘에서는 포커 게임을 단순화해 이를 해결하려 했지만 역부족이었다.
이들은 개발 소요 시간을 68.5일로 단축했다. 메인 전략을 짜는데 6테라바이트, 저장에 11테라바이트 이하가 들어가도록 프로그램을 짰다. 계산 노드 200개를 구성하고 각각의 디스크에 연결했다. 연결된 중앙처리장치(CPU)가 5000여개에 달했다.
여기에 포커 플레이어들 사이에서 널리 알려진 ‘케페우스’ 전략을 CFR+ 알고리즘에 구현했다. 케페우스는 각 플레이어들이 동등한 수준의 지적 능력을 가졌다고 인식해 먼저 베팅을 걸기보다는 상대방이 부른 가장 높은 값에 맞추도록 한다. 에이스 카드를 가졌을지라도 딜러에게 첫 베팅을 맡겨 게임을 진행하는 식이다.
연구진은 케페우스가 상대방을 ‘거의 완벽하다’고 인식하도록 적용해 컴퓨터의 실수가 거의 없다고 단언한다. 여기에 게임을 할수록 전략 완성도가 높아져 케페우스 자체를 인간이 손보지 않으면 이기기 힘들다고 봤다.
이제 이들은 CFR+ 알고리즘으로 좀 더 복잡하고, 더 많은 인원이 참가하도록 발전시키려 하고 있다. 궁극적으로는 이 같은 알고리즘을 현실에 적용, 예측 불가능한 문제를 해결할 때 도움을 줄 수 있을 것이란 취지다. 컴퓨터와 알고리즘이 어디까지 발전할 수 있을지 주목된다.
김주연기자 pillar@etnews.com