“아주 가볍게 놓은 듯한 돌이 나중에 중앙에서 큰 영향력을 발휘하는 것 같다. 이게 알파고 스타일이 아닐까 한다.”
데미스 하사비스(Demis Hassabis) 구글 딥마인드 공동 창업자 겸 CEO는 11일 KAIST 바이오및 뇌공학과가 ‘인공지능과 미래’를 주제로 마련한 `바이오및뇌공학과 석학 초청강연`에서 이 같이 말했다.
이날 초청강연에는 행사가 열리는 KAIST정문술 빌딩에 30분부터 학생 및 교직원들이 500여명 몰려 성황을 이뤘다.
하사비스 CEO는 알파고 아버지로 불리고 있다. 2010년 딥마인드를 창립했다. 2014년 구글에 의해 인수된 후 인공지능 연구에 매진했다. 딥마인드는 인공지능 분야 아폴로 프로그램(인류가 달에 첫 착륙한 우주선처럼)이 되는 것이 목표라고 설명했다.
딥마인드에는 현재 200여 연구원이 인공지능을 연구하고 있다. 이 규모는 전세계 최대 규모다.
하사비스 CEO는 알파고가 실수로 둔 돌도 계산에 의한 것 아니냐는 질문에 “알파고 37번째 수에 대해 얘기하는 것 같은데 판 후이와 얘기해봤다. 물론 이세돌 표정에서도 다른 사람의 놀라는 반응에서도 이 돌이 이상한가보다 하고 느꼈다”고 말했다.
하사비스 CEO는 “판 후이는 처음 10분은 정말 이상하다고 했지만 알파고가 실수했다고 했고 그 이후 10분 뒤에는 뭔가 이유가 있을 것 같다고 했다. 또 10분 후에는 정말 신의 한수였다고 얘기했다”며 “어떻게 보면 그냥 둔 돌이 다른 한편에서 영향력을 행사한다는 게 흥미로워 보였다”고 설명했다.
“이를 보면 컴퓨터가 바둑을 두는게 얼마나 어려운지를 알 수 있습니다. 이와 관련해 영어권 바둑 해설자와 얘기를 나누었는데 알파고 스타일은 아주 가볍게 놓은 듯 한 돌이 나중에 중앙에 큰 영향력을 행사한 것 같다고 얘기하더군요.”
하사비스 CEO는 “인공지능에 대한 인간 의존도는 인터넷, 이메일 스마트폰 등에서 처럼 이 기술을 유용하게 쓴다면 도움을 줄 것”이라며 “인공지능을 인류 발전을 도와줄 수 있도록 사용하도록 노력해야 할 것”이라고 덧붙였다.
예를 들어 인공지능에 기반 한 과학(as-assisted science)이 연구를 할 때 인공지능이 연구자가 데이터를 분석하는데 도움을 주고 연구자가 최종적인 의미를 찾는 일을 하는 것이다.
알파고 승리에 디스토피아를 걱정하는 질문에 대해서도 대답을 내놨다.
“공상과학소설 같은 반응은 과학 발전에 도움이 안됩니다. 인공지능을 툴로 봅니다. 인간이 하기 힘든 작업이나 지겨운 일을 자동화하는데 도움을 줄 것입니다. 이번 대국에서 보여준 범용 인공지능은 이런 목적을 도와주는데 유용하게 쓰일 것입니다.”
하사비스 CEO는 “인간을 대체할 수 있는 수준의 인공지능은 아직도 멀었다”며 “게임도 일종의 제한된 환경에서 하는 것이라 인간의 영역에 영향을 끼칠 인공개발 개발에는 많은 시간이 걸릴 것”으로 전망했다.
딥마인드를 창업 과정에 대해서도 한마디 했다. 밖에서 보기엔 쉬워보였지만 아주 길고 어려운 과정이었다는 것.
“2010년 시드머니 구하는 것이 어려웠습니다. 2009년에는 인공지능 인기가 없었습니다. 딥러닝에 관한 논문이 나오기 시작했지만 아무도 이를 응용하지 않았습니다.”
실수도 많이 했다고 언급했다. 마이크로 수준에서는 물론 엄청난 실수를 했지만 매크로 수준에서는 그래도 한결 같았다고 말했다.
하사비스 CEO는 “체스 게임처럼 구체적인 계획을 세우고 자신의 가야 할 위치를 명확하게 찾은 후 꿈을 따라 가면 될 것 같다”며 “무엇을 할 것인지 열심히 생각하고 어떻게 그것을 이룰 것인지 계획을 세워 몰두하면 될 것이다. 그러면 꿈에 도달할 것”이라고 덧붙였다.
다음은 하사비스 강연 내용이다.
인공지능을 만드는 방법은 두가지다. 컴퓨터에 프리(pre) 프로그램밍과 솔루션을 넣고 컴퓨터가 이에 따라 처리하도록 하는 것과 기계를 가르치는 것, 즉 스스로 학습해 문제를 해결할 수 있는 능력을 기계에 넣어주는 것 등이다.
딥마인드 미션은 두단계가 있다. 우선 “지능을 만들어라”다. 또 하나는 “이 지능을 다른 문제 해결을 위해 사용하라”라는 것이다.
딥마인드는 범용 목적을 가진 학습 기계 개발이 최종 목표다. 학습에 대한 의미는 알고리즘이 사전에 프로그램 되지 않고 인간에 의해 손으로 만들어진 데이터가 아닌, 가공되지 않은 입력 자료로부터 스스로 학습할 수 있다는 것이다. 범용은 하나의 시스템 혹은 개발된 일련의 알고리즘이 한 문제뿐만 아니라 다양한 여러 상황에서도 사용될 수 있다는 것을 나타낸다. 이는 범용인공지능(AGI)이라 부른다. AGI는 어디에서도 유동적으로 적용가능하며 이는 흔히 지금 많이 연구되고 있는 전통적인 인공지능, 즉 좁은 의미(narrow)의 인공지능(AI)과 구별된다.
AGI와 AI 차이점으로 IBM 딥블루와 체스 선수 가리 카스파로프와의 경기를 예로 들수 있다. 1997년 딥블루가 게리 카스파로프를 이겼는데 이는 인공지능 분수령이라 할 만큼 과학기술의 업적으로 평가받고 있다.
하지만 딥블루 시스템이나 소프트웨어는 한 가지 기능만 할 수 있도록 프로그램 되어 있는 좁은 도메인을 벗어나면 아무것도 할 수 없다. 따라서 어떤 의미에서 이를 진정한 인공지능이라 보지 않는다.
딥마인드는 일반적인 인공지능을 개발하기 위해 심화학습개념을 활용했다. 이는 인공지능에 탑재된 감각센서(딥마인드는 시각을 이용하지만)를 사용해 현실을 관찰한다. 인공지능이 하는 첫 번째 일은 관찰된 미완성된 불확실한 자료에 근거에 현실을 가장 근접하게 나타낼 수 있는 모델을 만드는 것이다. 그리고 새로운 관찰이 이루어질 때마다 이 모델을 업데이트 하는 것이다.
또 하나는 모델이 만들어지면 에이전트(인공지능)는 어떤 상황에서 무엇을 할 것인지, 특정 행위에 대한 결과가 무엇인지 등에 대한 플랜(plan)을 만들게 된다. 여러 개의 플랜을 만들어 각각에 대한 시뮬레이션을 한 후 최종적으로 주어진 그 순간적인 상황에서 어떤 플랜이 자신이 설정한 목표에 가장 근접하게 달성할 수 있을 지를 결정하고 액션을 내놓게 된다.
이 액션이 목표 달성에 미흡하면 다시 환경을 관찰하고 플랜을 짜고 새로운 액션을 내놓는 주기(사이클)를 형성한다. 알파고가 최적의 답을 찾아가는 원리다.
딥마인드는 다양한 게임에 AI를 적용하는 시험을 수행했다. 1980년대 유명한 비디오 게임 ‘아타리 2600 테스트베드(testbed)’와 ‘스페이스 인베이더 아타리 게임’, ‘브레? 아웃 게임’ 등이 있다.
하사비스 CEO는 인공지능알고리즘(DQN)으로 49개 게임에 적용한 결과 사람보다 더 게임을 잘했다고 소개하며, 이 알고리즘 코드도 공개해 직접 시연해 볼수 도 있다.
3차원 게임 오픈 레이싱 카 시뮬레이터 테스트에서는 인공지능을 적용한 프로그램이 며칠 동안 레이싱을 하게 했더니 인간의 손으로 프로그램한 레이싱 카 시뮬레이터보다 더 성능이 좋게 나왔다. 시간당 200㎞ 이상을 달리고 다른 차를 추월하는 법도 구사했다.
딥마인드는 현재 보다 더 복잡하고 정교한 3D 환경에서의 인공지능 알고리즘을 개발 중이다. 이에 관한 논문을 올해 발표할 계획이다.
딥마인드는 신경과학을 접목해 시스템 차원에서 연구하는 것에도 관심이 있다. 알고리즘이 나타내고자 하는 것, 그리고 아키텍처, 두뇌처럼 이들이 어떻게 상호작용하는지에 관심이 있다. 두뇌를 새로운 알고리즘 개발의 영감으로 보고 있다. 인공지능 해마를 만들겠다는 것이다.
딥마인드는 게임과 3D에서 시험을 마친 후 체스나 바둑 같은 전략 게임에 관심을 갖게 됐다. 궁극적인 목표는 로봇에 실질적으로 응용하는 것이다. 딥블루 이후 인공지능이 깰 수 없는 벽으로 남은 것이 바둑이었다.
바둑은 인간이 만든 가장 복잡한 게임이다. 바둑판이 달라질 수 있는 복잡성은 10의 170 제곱. 우주 속 원자보다 더 많다는 것이다.게임을 할 수 있는 경우의 수는 10의 700제곱이나 된다.
바둑은 직관과 연산이 필요하기에 딥마인드는 패턴 인식과 플랜이 필요했다. 주요 도전 과제로 우선 조절 가능한 수준에서 바둑알이 갈 수 있는 탐색 공간을 줄이는 것. 둘째 어떤 바둑판에서 누가 이기는지를 평가하고 결정하게 만드는 것이었다.
딥 신경망과 러닝으로 바둑의 어려움을 극복했다. 두 개의 신경망을 구축했다. 10만개 인터넷 바둑 서버에서 전문가 데이터를 다운로드 받아 입력했다. 아마추어 수준 정도다. 이들 데이터를 통해 정책망을 훈련시켰다. 슈퍼바이저(사람이 가공한 데이터를 활용하는 것) 러닝 방식으로 훈련했다. 여기에서 우리는 사람이 어떤 위치에 바둑알을 놓은 지를 연구하고 이를 모방하는 훈련을 했다. 심화학습을 이용해 인간을 흉내 내는 것에 그치지 않고 더 잘하기 위해 훈련했다. 그래서 이전 정책망보다 성능이 80% 더 잘 나오는 새로운 정책망을 만드는데 성공했다. 이 새로운 정책망에 3000만 개 기보를 더 훈련시켰다. 3000만 게임을 훈련시킨 결과를 가지고 가치망을 훈련시켰다. 3000만 개 기보위에서 누가 이길 건지를 예측한다. 정책망 가치망에 몬테카를로 탐색과 롤업 폴리시를 통합해 알파고 구축했다. 정책망은 탐색의 폭을 줄여주고 가치망은 탐색 깊이를 줄여 적정수준에서 프로세싱이 가능하도록 해준다.
알파고 수준을 평가하기 위해 지난해 여름부터 인터넷 바둑 게임과 대국했다. 가장 유명한 크레이지 스톤과 젠과 경쟁(아마추어 8,9단 정도)한 결과 495번 게임에서 494번 이겼다. 4수를 깔아주고도 75% 승율이다.
작년 10월 유럽 참피언 판 후이와 대국했다. 알파고가 5대0으로 이겨 인간 프로를 이긴 유일한 프로그램이다. 이는 머신러닝, 인공지능, 바둑계를 놀라게 했다. 이 결과는 또 몇 달 전 네이쳐 표지 논문으로 나왔다.
이세돌과의 대국에서 알파고가 강한 줄은 알았다. 우리는 이전에 개발된 모든 알파고 버전과의 수백만 번 대국을 통해 새로운 알파고가 강한 줄 알았다. 판 후이와의 대국 이후 계속해서 업데이트를 했기 때문이다. 우리는 이세돌이 얼마나 판후이에 강한지 알고 있었고, 그에 맞춰 새로운 알파고가 예전의 알파고에 비해 강한 줄 알고 있었다. 그럼에도 불구하고 이세돌 대국 전에 불안했던 것은 많은 수의 훈련을 통한 알파고 데이터가 과잉선택하는 것이었다. 이세돌을 선택한 것은 그의 창의적인 바둑과 대국 스타일 때문이다. 알파고 약점을 가장 잘 파악해줄 선수 같아서다.. 내부적인 알파고 대국에서 현재 알파고 성능이 너무 강해 우리 스스로 평가 할 수 없었기 때문에 대국을 하게 됐다. 다음 세 번의 대국에서 이세돌이 잘 해주기를 바란다.
우리가 사용한 컴퓨터 파워는 판후이 매치와 유사하다. 50~100개 GPU 수준이다. 몬테카를로 서치를 사용하는 경우 병렬 컴퓨터를 너무 많이 쓰면 오히려 축소된 결과를 얻는다. 네이처 논문 보충자료로 낸 것에 파워를 많이 사용하는 게 높은 성능을 가져 오지 않는다는 커브를 그려놓았다. 우리는 하드웨어 측면이 아닌 알고리즘적 발전을 가져 오기 위해 연구했다.
우리는 대국에서 이기는 것보다 어떻게 무슨 방법으로 이겼는지 아는 게 더 중요하다고 본다. 딥블루는 손으로 만든 데이터를 활용한다. 알파고는 정제되지 않는 데이터에 스스로 학습한다. 체스는 모든 수를 입력한 방대한 자료를 사용한다. 알파고는 2개의 신경망을 이용해 선택된 선정된 자료만 사용한다. 딥 블루는 초당 2000만 게임을 찾는다. 알파고는 초당 십 만개를 찾는다.. 이는 알파고가 더 인간에 가깝다는 증거다.
딥블루는 기계적으로 방대한 양의 자료를 처리한다면 알파고 신경망을 통한 일련의 과정을 거쳐 선택된 소수의 정보만을 처리한다는 것이다. 마치 인간이 무의식적인 직관을 통해 상황을 판단하고 인지하는 것처럼. 인간은 많은 양의 정보를 처리할 수 없다. 물론 아직 인간처럼 정교하지 않지만 그런 목표를 가지고 있다.
우리의 알고리즘이 의료, 로봇, 퍼스널리제이션, 스마폰 등에 쓰이길 원한다.
내가 인공지능을 하는 철학적인 이유는 정보 과부하. 유전자 정보, 물리학 등 모든 분야에서 엄청난 정보가 쏟아지고 있다. 우리가 처리할 수 있는 것보다 더 많은 정보가 나온다. 시스템의 복잡성. 기후변화, 입자물리학, 거시경제, 질병 등 점점 더 복잡해지는 시스템을 더 잘 이해하기 위해서다.
인공지능은 이런 문제들에 대한 메타 솔루션으로 쓰이길 원한다. 인공지능이 여러 분야 과학, 의학 등에 쓰여 이들 분야의 발전을 더 빨리 가져 오길 바란다. 나의 꿈은 인공지능 과학(ai scientist) 혹은 인공지능 지원(ai-assisted science)과학으로 발전시키는 것이다.
모든 새로운 기술처럼 인공지능도 책임감 있고 윤리적으로 쓰이길 바란다. 기술 자체는 중립적이나 이걸 우리가 어떻게 쓰느냐에 따라 긍정적이든 부정적이든 그 영향력이 달라짐. 창의성, 꿈, 의식 등 인간의 마음을 더 잘 이해하는데 인공지능이 사용되길 바란다.
대전=박희범 과학기술 전문기자 hbpark@etnews.com