“세계 최고 바둑기사를 잇따라 물리친 알파고는 좌표세계만 놓고 움직입니다. 물체를 인지하고 바둑을 두는 것이 아닙니다. 이는 인공지능(AI)이 가진 학습 방식의 한계입니다.”
장병탁 서울대 AI연구원장은 AI의 학습 방식을 획기적으로 개선해야 한다고 말했다. 차세대 AI 연구의 한 축으로 인간 학습을 모방하는 방법론이 제기된다.
장 원장은 “마치 어린아이가 환경과 상호작용 통해 발달하고 지능이 발달하듯이 AI도 상호작용 경험을 통해 데이터를 관측해 발달 학습함으로써 순차적으로 모델 구성요소를 만들고 이를 재조립하면서 보다 고차원적인 복잡한 구조로 발전할 수 있다”고 말했다. 이는 진화 원리가 뇌인지 시스템 발달과정에서도 적용되는 것과 같다고 설명했다.
서울대 AI연구원이 추구하는 방향도 이와 같다. 인간 수준 학습능력을 보유한 AI를 만들기 위해 언어, 시각, 데이터지능, 로보틱스까지 접목시킨다. 실제 서울대는 영상에 대한 연속적 질의에 응답하는 기계학습 모델을 개발해 세계 최고 수준 성능을 선보였다.
장 원장은 “AI가 TV 드라마를 보며 이해하고 반응하게 하는 것이 목표”라고 말했다. 이른바 베이비 마인드 프로젝트다. 이를 위해서는 시각, 센서, 언어학, 뇌과학 등 요소기술이 병행해 발달해야 한다.
이처럼 인간이 학습하는 방식을 모방해 AI에게 학습시키는 방법론 중 하나가 멀티모달이다. AI 멀티모달은 음성, 텍스트, 영상, 이미지 등을 통해 AI를 학습시킨다.
민옥기 ETRI 지능정보연구본부장은 “AI에게 인간 수준으로 상황에 맞게 적절하게 답을 하도록 학습하기 위해서는 멀티모달을 통해 학습시키는 것이 필요하다”고 말했다.
일반 지능을 구현하기 위해선 언어를 넘어선 시각, 청각, 촉각 등 다양하고 일반적인 지식 습득과정 연구가 필요하다. AI에 직관적 지식인 상식을 구조화시키는 것이 필요하다.
또 인지발달론적 접근을 통해 AI의 일반지능화를 추구할 수 있지만 아직 인간 기초인지기능의 신경인지적 기전이 명확히 밝혀지지 않아 핵심인지능에 대한 연구가 복합해 이뤄져야 한다.
전문가들이 차세대 AI 목표로 어린아이 수준 지능을 접목하려는 것은 AI가 종국에는 자율적으로 학습하고 판단할 수 있는 지점에 도달하기 위해서다.
국내에서는 서울대가 활발히 연구를 진행 중이다. 또 KAIST는 작업 간 유사성을 고려한 비대칭 다중학습 모델을 개발하고 있다. 또 포항공대는 적은 수의 학습 데이터가 주어진 환경에서 전이학습과 다중작업 아직 초기 단계로 다학제적인 연구 접목을 시도 중이다. 또 민간에서 삼성SDS, 네이버 등이 AI 학습 능력 배양을 위해 멀티 모달 방식을 활용하고 있다.
미국에선 DARPA와 페이스북이 이 같은 도전을 하고 있다. DARPA는 18개월 유아인지 수준 콘먼센스 기술 개발을 지난 2018년부터 추진 중이다. 페이스북 역시 12개월 수준 기초인지 기능을 학습하는 연구를 진행 중인 것으로 알려졌다. IBM은 시계열 데이터를 빠르게 분석하고 예측하는 모델을 개발 중이다.
다만 기계가 환경과 상호작용하고 환경 내에서 동작하는 인간적 접근을 위해선 환경을 모델링해야하는데 이를 구현하기가 어려운 것이 현실이다. 이를 해소하는 것이 센서인데 다양한 센서 기술 개발도 중요하다.
AI가 스스로 학습하는 능력을 갖추면 다양한 분야에서 활용이 가능하다.
대화가 가능한 AI는 물론 상황에 맞게 적절하게 대처하는 것도 가능해지고 실제 창작도 가능해진다. 또 물류 구축이나 교통정책, 과학 발전 등에도 보다 인간적인 관점에서 접근이 가능해진다.
장병탁 원장은 “상식과 인지발달을 접목한 AI 개발은 세계적으로 활발한 연구가 시작된 지 1~2년에 불과하고 적극적인 투자를 통해 세계 시장에서 기술 선점이 가능하다”고 말했다.
이경민기자 kmlee@etnews.com