무인자율주행차가 승객 호출에 응하는 택시 서비스가 시작된다. GPT-3라는 인공지능(AI)이 '사람들은 AI를 두려워할 필요가 없다'는 신문 기고문을 작성했다. 6년 전 알파고가 바둑으로 이세돌 기사를 물리친 사건 이래 이와 같은 AI 성공사례가 매일 지면을 장식하고 있다. 자율운전과 글짓기, 그리고 바둑을 두는 것이 무슨 상관이 있어 이들을 모두 AI라고 하는 것일까.
AI란 컴퓨터에게 지능이 필요한 일을 시키도록 하는 연구 분야이자 기술이라고 정의한다. 지능이 필요한 일은 매우 광범위하다. 보고 듣고 이해하며, 생각해서 의사결정을 하고, 계획을 세워서 집행을 하고. 새로운 것을 배우는 것을 가능하게 하는 것이 바로 지능이다. 이런 목표의 AI는 지난 70년간 꾸준히 연구개발돼 이제는 여러 분야에서 실용적 성과를 내는 수준에 도달했다. 산업 현장에서 이런 요소기술을 종합해 업무를 자동화하고, 어려운 의사결정을 하며, 사람과 같은 방법으로 기계와 소통을 시작했다.
AI 기술은 여러 번의 기술적 도약이 있었다. 40년 전에는 전문가시스템이란 기술이, 10여년 전에는 딥러닝라고 불리는 기술이 부상해 AI 수준을 각각 한 단계 높이는 역할을 했다. 우리가 잘 아는 알파고의 승리는 딥러닝의 승리다. 그 이후 딥러닝이 산업 현장에서도 혁신적 성과를 보여줌으로써 그 가치를 확인했다. 우리 기업도 속히 이 기술을 내재화해야 할 것이다.
그러나 모든 기술이 그렇듯이 사용하다 보면 약점도 발견되고 그 기술의 능력과 한계 등 본질을 알게 된다. 딥러닝 기술도 마찬가지다. 지난 10여년간 놀라운 성과도 많았지만 약점도 여럿 발견됐다. 이러한 약점들은 데이터 기반 기계학습이 갖는 원초적인 것부터 시작해 엔지니어링 노력 부족까지 다양하다. 이런 약점들을 잘 극복해야 현장에서 그 가치를 극대화할 수 있다.
약 4개월 전 타이완의 한 고속도로에서 자율주행 모드로 달리는 자동차가 누워 있던 트럭을 그대로 들어 박았다. 이 사건은 현재 AI의 약점을 여실히 보여주는 것이다. 현재 AI는 학습에 사용한 데이터와 유사한 상황에서만 작동한다. 누워서 바퀴가 보이지 않는 트럭을 훈련 데이터에서 본적이 없는 AI는 이를 트럭으로 인식하지 못했다. 이렇듯 기계학습 기술은 아직 안정성이나 신뢰성 부분에서 개선해야 할 점이 많다. 전통적인 기계공학이나 소프트웨어 공학기술과 같이 안정적이고 신뢰할만한 기술로 발전하기까지는 지속적 연구개발이 필요하다.
여러 가지 방향으로 AI 기술을 추진하고 있다. 첫째는 너무나 많은 데이터와 컴퓨팅을 필요로 하는 이 기술의 학습 효율을 높여서 적은 데이터로부터 효율적으로 배울 수 있는 방법에 대한 연구다. 또 학습에 참여하지 않은 데이터 유형에서도 잘 작동하는 일반화 능력의 신장도 중요하다. 사람은 배운 것을 응용하고 일반화해서 유사한 문제도 잘 풀지만 현재의 AI는 일반화 능력이 약하다. 그래서 일어날 수 있는 현장의 모든 데이터를 미리 모아서 학습시키지 않으면 그 시스템을 현장에 배치할 수 없다. AI가 주어진 문제를 해결할 수 있는가를 판단하기 위해 모든 학습데이터를 검토해야 한다면 현장에서는 이 기술을 사용할 수 없다. 일반화 능력이 강해진다면 AI의 효용성은 더욱 커질 것이다.
지도학습을 위한 데이터의 준비는 매우 고통스럽다. 모든 데이터에 라벨을 붙여야 하기 때문이다. 비지도학습이나 준지도학습을 통해서 데이터의 의존도를 낮추는 것이 필요하다. 데이터의 개인정보와 소유권이 공유를 억제한다. 여러 사람의 데이터를 한 곳에 모아서 학습을 시킨다는 것은 현실적으로 불가능하다. 데이터가 분산된 상태에서 학습알고리즘이 찾아가서 학습하고 나오는 방법이 현실적 대안이다. 암호화된 데이터를 암호를 풀지 않고 직접 학습에 사용하는 것도 멋진 아이디어다. 인과관계, 계층적 구조, 세상모델, 상식 등을 어떻게 표현하고 활용할 것인가 하는 것은 오래된 숙제다. 인간처럼 시각기능, 언어, 손짓 등이 자연스럽게 통합하여 소통하는 기술도 더 연구해야 하는 영역이다.
AI 능력을 신장하려는 여러 노력에는 과학적 발견이 필요한 부분도 있고, 그 발견을 이용해 문제를 해결하고 효율성을 높이는 공학적 영역도 있다. 기초연구로부터 특정영역의 AI 구축에는 많은 기술적 계단이 있다. 또 응용 영역의 특성에 따라서 필요한 기술이 많이 다를 수 있다. 따라서 우리나라가 어떤 영역에 집중할 것인가를 결정하고, 그에 필요한 기술의 개발에 집중하는 것이 바람직하다. AI를 이용해 무엇을 할 것인지에 대한 국민적 합의를 먼저 도출하기 바란다. 그 목표 아래서 성과를 올리기 위한 기술지도를 완성하고 그 중에서 우리가 선도적 위치를 차지하고 싶은 것을 선택해 연구를 집중하는 것이 바람직하다.
아직 최고의 AI는 나타나지 않았다. 가야 할 먼 길에 비하면 AI는 이제 시작이다. 우리도 국력을 집중해 차세대 AI 연구를 통해 새로이 시작되는 경쟁에서 역할을 찾아야 할 것이다.
김진형(중앙대학교 석좌교수)