이세돌 9단이 NHN 바둑게임 인공지능(AI) '한돌3.0'과 대결에서 승리했다. 2016년 '알파고'에 1승을 거둔 데 이어 은퇴 대국에서 인공지능을 상대로 또 승리를 거뒀다. 이 9단은 '인공지능을 이긴 유일한 인간'에서 '인공지능을 두 번이나 이긴 유일한 인간'으로 기억되게 됐다.
이 9단은 18일 서울 도곡동 바디프랜드 본사에서 진행된 은퇴 대국 1국에서 1시간30분, 92수 만에 불계승했다.
대결은 이 9단이 한돌의 우위를 인정해 접바둑 치수고치기로 진행됐다. 치수고치기는 이세돌이 흑을 잡아 두 점을 깔고 시작하는 방식이다. 대신 한돌은 덤 7집 반을 받았다.
이날 상황은 계속 한돌이 이끌어갔다. 그러다 오후 2시 5분쯤 한돌이 갑자기 '악수'를 두면서 판세가 뒤집혔다. 이 9단은 중앙쪽 전투에서 승리를 거두며 기권을 받아냈다. 갑작스러운 한돌의 실수가 패배로 연결됐다. 이 9단은 한돌의 이해할 수 없는 착수에 깜짝 놀라거나 멋쩍은 웃음을 보이기도 했다.
유창혁 해설위원은 “한돌 수준에서는 나올 수 없는 오류가 나왔다”며 “대리착수를 하는 이화섭 아마 5단도 매우 괴로울 것”이라고 말했다.
한돌의 패인은 데이터 부족으로 분석된다. 2달간 2점 접바둑을 집중 학습했으나 오랜시간 호선(맞바둑) 중심으로 학습해온 AI이기 때문이다. NHN 측은 당혹스러운 결과라고 평했다. 첫 대결에서 이 9단이 승리함에 따라 2국은 호선으로 진행된다.
이 9단은 대결 후에 “인간과 AI 차이를 알고 싶어서 치수고치기로 진행했다”며 “다음 대국에서 승리 확률은 조금 낮지만 승패보다는 최선을 다하겠다”고 말했다.
한돌은 NHN이 2017년 12월 선보인 바둑 AI 프로그램이다. 1999년부터 '한게임 바둑'을 서비스하며 축적해 온 방대한 데이터를 바탕으로 개발했다.
한돌은 3년 전 이 9단이 대결한 알파고 보다 더 발전한 바둑 AI다. 기력을 측정하는 ELO레이팅 기준으로 4500 수준이다. 알파고는 3700이다. 인간 9단은 평균 3500정도로 평가된다. ELO 레이팅이 상대보다 150 정도 높으면 승률이 60~70% 정도다. 400 이상 높으면 사실상 꺾기 어려운 수준으로 분석된다.
바둑 AI핵심은 다음 수 예측이다. 개발 초기 한돌은 한게임 바둑 데이터 등 사람이 둔 기보를 학습해 다음 수를 예측하는 '정책망'을 사용했다. 정책망으로 후보 수를 선택한 후 자가 대국 기보로 학습한 '가치망'과 패턴으로 다음 수에 대한 승리 확률을 얻었다. 선택하고 얻은 수에 대한 승리 확률에 MCTS라는 수읽기 알고리즘을 사용해 다음 수를 예측했다.
한돌 3.0은 다음 수를 분석할 때 여러 예측 모델을 동시에 사용하는 '앙상블 추론'을 도입해 기력을 크게 끌어 올렸다. 사람으로 치면 한 명이 아니라 여럿과 동시에 상의해 가장 좋은 수를 찾는 방식이다.
한돌은 2.1 버전 시절이던 올해 1월 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단, 신진서 9단과 호선을 펼쳐 5연전을 모두 이겼다.
이현수기자 hsool@etnews.com