요즘 뉴스를 보면 '인공지능'이라는 단어가 사실 지겨울 정도로 많이 보인다. 필자가 학부를 다닐 때만 하더라도 인공지능이라는 분야는 이른바 '잘 나가는 분야'와 거리가 먼, 한 때 유행했던, 주류에서 멀어진 학문이라는 인식이 강했다. 인공지능 인기는 상전벽해라는 말이 무색할 만큼 '미래 기술 핵심 요소'로 인정받고 있다.
인공지능을 학습하는 방법은 인간이 지식을 학습하는 과정과 비슷할 것이라는 통념과는 다르다. 현재 개발된 인공지능 학습 방법론, 즉 기계학습 방법론은 인간이 지식을 습득하는 방법과 다른 방법으로 '지식'을 '학습'하는 사례가 많다. 좀 더 정확하게 인공지능 모델은 인간 지식과 다른 '데이터의 표현법'을 생성하는 함수를 주어진 데이터로 '최적화'하고 있다. 즉 기계가 학습한 인공지능은 사람이 학습한 것과 '내용'과 '방법'이 다르다.
일례로 사람은 새로운 물체를 배우게 되었을 때 새로운 물체 클래스에 대해서만 학습할 뿐 기존 지식에 대해 대대적인 업데이트를 하지는 않는 것 같다. 그러나 기계학습의 주류 학습 방법인 분류적 학습에서는 새로운 클래스를 학습하기 위해서 그 새로운 클래스를 포함한 모든 클래스에 대해 다시 학습하는 방식을 취하고 있다. 이러한 학습 방법은 데이터 활용과 계산 비용 측면에서 비효율적이다. 이를 개선하기 위해 최근 새로운 클래스만 추가로 학습하는 연속 학습 방법론이 연구되고 있다.
학습 모델로는 높은 성능을 내는 뉴럴 네트워크가 널리 사용되는 데 증가적 학습이 아닌 일반 학습 설정에서도 뉴럴 네트워크는 학습 초기에 입력했던 데이터 정보가 손실되는 '치명적 망각' 문제가 있다. 증가적 학습에서는 이 망각 문제가 더욱 심각하게 부각된다. 게다가 그동안 연속 학습 연구는 새로운 클래스가 추가될 때 기존 클래스 데이터는 추가되지 않는 등 비현실적인 가정을 포함하고 있다. 이를 개선하기 위해 최근에는 새로운 물체 클래스가 추가될 때 기존 클래스의 데이터가 추가될 수도 있는 현실적인 가정을 담은 연속 학습 시나리오에서 좋은 성능을 내는 알고리즘을 개발하려는 노력이 시도되고 있다.
사람은 시각 인식, 언어 정보를 모두 이용해 종합적으로 인지한다. 인지 성능을 궁극적으로 높이기 위해서는 언어, 시각 정보 등을 종합적으로 이용하는 것이 필요하다. 이 중 언어 이해와 시각 인식 두 분야 교차점에 있는 연구 분야 중 자연어를 통해 동영상을 검색하는 분야가 있다. 이 분야는 아직 각 도메인에서의 연구가 성숙되지 않은 '동영상 이해' 분야와 '자연어 처리' 교차점에 있기 때문에 난도가 매우 높다. 더욱이 두 분야 모두 고성능 추론 모델을 학습하기 위해서는 대용량 학습 데이터가 필요하다는 점도 연구를 어렵게 만드는 부분이다. 지도된 데이터가 적은 상황에서 동영상과 언어를 모두 이해하는 인공지능 모델을 학습하는 것은 중요한 문제임과 동시에 아직은 난도 높은 문제로 다양한 방법론의 개발이 필요하다.
마지막으로 인간은 시각 정보를 받아들일 때 시세포에서 받아들인 정보를 시뇌에서 영상을 재구성하는 것으로 알려져 있다. 만일 시세포에서 받아들인 것과 비슷한 시각 정보를 인식의 입력으로 사용한다면 렌더링을 거치지 않고 효율적으로 시각 인식을 할 수 있을 것으로 기대된다. 이와 비슷한 형태 데이터를 받는 장치로 이벤트 카메라 또는 뉴로모픽 카메라가 있다. 이 센서는 인간의 시세포 정보와 비슷하게 각 픽셀마다 밝기 값 '변화량'을 기록해 인간 눈보다 프레임 레이트와 다이나믹 레인지가 월등히 높으면서 전력 소모도 매우 적다는 장점을 갖고 있다. 다만 이 이벤트 데이터는 컴퓨터 프로그램으로 모델로부터 이미지를 생성해내는 렌더(render)된 영상과는 매우 다르기 때문에 기존 시각 인식 알고리즘을 바로 적용하기에 어려움이 있다. 이를 해결하려는 노력을 통해 현재 시각 인식 시스템 효율성과 한계를 극복할 수 있는 솔루션을 얻을지도 모르는 일이다.
이처럼 인공지능은 인간 학습 방법을 모사하는 형태로 발전한 것이 아니라 학습을 위해 지도한 데이터를 잘 기억하고 일반화하기 위한 알고리즘을 개발하는 방향으로 발전했다. 이렇게 개발된 알고리즘은 고성능 하드웨어 도움으로 지루한 일을 매우 효율적으로 할 수 있게 해주는 다양한 '인공지능 응용 시스템'으로 발전하고 있다. 이러한 효율성의 비약적 발전은 산업혁명에 비유돼 이른바 '4차 산업혁명'이라고 일컬어진다.
미국 16대 대통령이었던 에이브러햄 링컨은 “미래를 가장 정확하게 예측하는 방법은 미래를 만드는 것”이라고 말했다. 2·3차 산업혁명 당시 과거에도 그랬지만 이런 생산 효율성 증대 과도기에서는 현재 기술을 깊이 있게 이해하고 효율성 증대 원인을 명확히 파악하는 것이 미래를 준비하는 가장 좋은 자세가 아닐까 한다. 즉 기술을 정확히 이해하고 이를 이용해 인류가 아직 풀지 못한 중요한 문제를 먼저 풀어낸다면 미래 주인이 될 수 있지 않을까 조심스레 예측해 본다.
최종현 광주과학기술원(GIST) AI대학원 조교수 jhc@gist.ac.kr
-
김한식 기자기사 더보기