MAM(Media Asset Management) 및 인공지능 테크기업 코난테크놀로지(대표 김영섬)는 아주대학교(총장 박형주)의 학습관리시스템(LMS, Learning Management System)에 인공지능 기술을 적용한다고 밝혔다. 특히 딥러닝을 활용한 자동 자막 생성 기술로 외국인 유학생, 청각장애인, 학습 부진 학생 등 학습 과정에서 불편함을 경험하는 학습자들의 편의성이 강화된다.
코난테크놀로지가 선보이는 자막 자동 생성 솔루션 ‘D-listener’는 온라인강의 및 미디어 도메인학습, 비정형 자연어 인식 기술 및 음성 인식 기술을 적용해 높은 인공지능 자막 생성 정확도를 갖추게 되었다는 설명이다. 특히 화자에 대한 개별 음성을 인공지능이 학습한 점이 돋보인다. 교수 등 강의하는 화자마다 어투, 음성, 발음, 특징이 다양하고 과목에 따라 용어가 다른데, 보편적이고 일반적인 STT(Speech to Text) 기술을 사용한 경우 화자에 따라 인식률과 텍스트 생성 정확도가 떨어지고 편차도 크다. 대학혁신지원사업으로 이번 프로젝트를 함께 진행하는 아주대학교 교수학습개발센터와 코난테크놀로지는 정확한 내용의 지식 전달이 중요한 교육 특성을 고려해 인공지능을 활용해 기술 완성도를 높였다는 설명이다. 복잡하고 어려운 한국어에 대한 높은 인식률과 정확한 텍스트 변환으로 아주대학교는 강의 제작 시간과 비용이 현저히 줄 것으로 기대하고 있다.
일반적으로 온라인 강의의 자막은 수작업으로 작성하기 때문에 제작에 드는 노력이 상당하다. STT기술을 사용해 텍스트를 자동으로 생성한다 하더라도 완벽하지는 않아, 후처리 과정으로 보정이 필요한 현실이다. 그러나 코난테크놀로지의 ‘D-listener’는 특정 화자의 목소리를 개개인 별로 학습하여 정확도에 있어 높은 품질을 확보할 수 있었다. 음성 인식 품질 강화에는 코난테크놀로지가 20년 동안 쌓아온 언어사전 베이스가 활용되었다. 코난테크놀로지의 축적된 자연어 처리 자산은 형태소 분석사전, 개체명사전, 동의어사전, 오타교정사전 등을 포함하며, 이는 총 560만여 개 엔트리를 가진 국내 최대 규모다.
코난테크놀로지는 인공지능 분야의 꾸준한 R&D 투자를 지속해왔으며, 2020년 딥러닝 기반의 STT기술을 사업화한 D-listener 솔루션을 2020년 본격 출시한다. 지능형콘텐츠사업부를 총괄하는 박정선사업부장은 “이러닝 구축이 필요한 대학교의 러브콜이 쇄도하고 있다”라며 “아주대학교를 시작으로 전국의 대학교에 자막 자동 생성 솔루션을 구축할 예정이다”라고 밝혔다.
전자신문인터넷 유은정 기자 (judy6956@etnews.com)