[KAIST AI를 선도한다] <5>AI의 꽃 '딥러닝'

발행일 : 2017-05-14 17:00 지면 : 2017-05-15 8면

지난해 초에 열린 '알파고'와 이세돌 9단의 바둑 대결은 인공지능(AI)이 인간의 지능을 앞지를 수 있음을 보여 줬다. 그동안 바둑은 AI가 인간을 넘볼 수 없다고 여겨졌지만 경기는 끝내 알파고의 승리로 마무리됐다. '딥러닝' 기술의 힘이었다.

딥러닝 기술은 이전의 수동형인 AI와 다르다. 스스로 학습한다는 점이 가장 큰 특징이다. 보고 배운 지식을 스스로 분류하고 군집시켜서 그동안 AI가 갈 수 없던 '직관'의 영역에 도달한다.

마치 인간처럼 정보를 능동 처리하고, 정확도와 속도는 인간의 지능을 뛰어넘는다. 이런 압도하는 성능이 딥러닝을 'AI의 꽃'으로 만들었다. AI의 도움이 필요한 모든 영역에서 딥러닝 기술을 활용한 연구가 진행되고 있다.

KAIST(총장 신성철)는 AI를 활용하는 각종 연구에 딥러닝 기술을 적극 적용하고 있다. 딥러닝 기술은 이미 세계 AI 연구의 핵심 분야로 자리 잡았다.

딥러닝을 활용한 연구 없이는 올해부터 시작한 'AI 중심 연구 혁신'의 성공은 장담할 수 없다. 딥러닝의 자가 학습 기능과 높은 성능을 기반으로 KAIST가 개발하고 있는 다양한 AI에 완성도를 더한다.

일부 성과는 가시권에 들어왔다. 윤성의 전산학부 교수 연구팀의 '웹 스케일 이미지 검색 기술'이 대표 성과다. 이미지 빅데이터에서 사용자가 원하는 정보만을 신속하게 골라내는 기술이다. 사용자가 제시하는 사진을 바탕으로 유사한 사진을 찾아내 보여 주는 식이다. 인터넷을 이용한 방대한 '웹 스케일'의 빅데이터에서도 기존 기술보다 정확하고 빠르게 정보를 검색할 수 있도록 했다.

그동안 이미지 검색 기술은 대용량 빅데이터에서 성능을 발휘하기 어려웠다. 사진을 정확하게 분석해서 빅데이터 속 사진과 비교하려면 약 4000개에 이르는 특징 정보(표현자)를 수집해야 하기 때문이다. 사진 장당 표현자 정보만 대략 16kB(킬로바이트)에 이른다. 최소 이미지 10억장 규모의 웹 스케일에서 유사 이미지를 찾으려면 TB(테라바이트) 수준의 정보를 처리해야 한다. 소요 시간이 오래 걸릴 수밖에 없다. 검색 시간을 줄이면 그만큼 검색의 정확성이 떨어진다.

연구팀은 딥러닝 기술이 세계적으로 각광받기 이전인 2009년부터 관련 연구를 시작, 검색 성능 향상의 돌파구로 삼았다. 표현자를 0과 1의 '이진 코드'로 변환·압축하는데 딥러닝 기술을 적용, 시간을 줄이는 최적화 방법을 찾았다.

윤성의 교수 연구팀이 개발한 웹스케일 이미지 검색 기술(빨간색 실선)과 다른 기술의 성능을 비교한 그래프.

빅데이터에서 유사점을 찾아내는 것에도 딥러닝 기술을 활용했다. 기존 방법은 사진의 한 부분만을 다뤘지만 연구팀은 최대 40개의 각기 다른 지점을 분할 검색하는 방법을 썼다.

딥러닝으로 비교에 적합한 부분 영역을 다수 찾아내 비교 검색의 정확도를 높인다. 이 기술을 적용하면 기존의 이미지 검색 기술에 비해 같은 검색 조건에서 두 배에 가까운 검색 성능을 발휘한다. 이 기술은 이미지 관련 해외 유수 기업인 '어도비'에 이전됐다.

연구팀은 청각 분야에서 딥러닝 활용 AI 시스템을 구축하기 위한 기반 기술도 개발하고 있다. 총 8개의 빅데이터 수집 마이크 센서를 활용, 주변의 음향 정보를 수집하고 주변 환경에 대응하는 기술이다.

윤 교수는 “딥러닝 기술은 모든 AI 기술에 대응할 수 있다”면서 “특히 이미지와 같이 대용량의 정보를 신속·정확하게 처리하는 데 큰 역할을 한다”고 설명했다. 윤 교수는 “기술이 더욱 발전하고 학습량이 늘어난다면 자동차 사진에서 택시와 트럭을 구분하는 것과 같이 세세한 임무 수행도 가능해진다”고 부연했다.

KAIST는 딥러닝 응용 연구뿐만 아니라 딥러닝 기술 성능을 배가시키는 연구도 함께 진행하고 있다. 딥러닝 기술 성능을 발전시키면 AI 활용 가능성도 커진다. 정세영 전기전자공학부 교수는 '심층 강화 학습' 기법을 적용, 딥러닝 AI의 학습 시간을 줄이는 연구에 힘쓰고 있다.

딥러닝 기술은 활동을 위해 오랜 기간 학습해야 한다는 문제점이 있다. 사람이라면 2시간 이내에 깨우칠 수 있는 동작 원리도 30일 이상 학습을 거쳐야 한다. 벽돌 깨기와 같은 간단한 컴퓨터 게임도 수많은 시행착오를 거친 후에 고득점을 얻을 수 있다.

딥러닝 AI가 게임 속에서 행동할 수 있는 모든 경우의 수를 직접 실행하면서 정보를 얻기 때문이다. 정 교수는 딥러닝 AI가 '몬테카를로 트리 탐색(의사 결정을 위한 탐색 알고리즘)'으로 자체 연산을 먼저 거칠 수 있도록 했다. 사용자가 제시한 목표를 달성하기 위해 필요한 행동만 추려 행동하게 했다. 이렇게 경우의 수를 줄인다면 딥러닝 학습 기간을 대폭 줄일 수 있다는 설명이다. 사람이 머릿속으로 목표에 맞는 여러 가지 상상을 한 다음에 적합한 행동을 하는 것과 같은 원리다. 심층 강화 학습을 적용한 딥러닝 AI는 기존보다 10배 빠른 학습 속도를 보였다.

정 교수는 “딥러닝 기술의 학습 속도를 줄일 수 있다면 이를 활용한 AI에 더 많은 기능을 담을 수 있게 된다”면서 “딥러닝을 활용한 AI가 널리 퍼지기 위해서는 필수로 해야 되는 일”이라고 말했다.

<단위:점>

<연도별 신경정보처리시스템학회(NIPS) 참여 인원, 단위:명>

<세계 대학의 주요 딥러닝 기술 스타트업 및 매각 현황>

대전=김영준기자 kyj85@etnews.com

검색 게임 대학 도움 빅데이터 어도비시스템즈 코리아 인터넷 자동차 침입방지 한국과학기술원