최근 국내·외 코로나19 바이러스 확산으로 대다수의 학교, 기관, 기업 등이 비대면 방식의 온라인 학습이 중요한 이슈로 대두되고 있다. 온라인 학습 지원 시스템 구축과 더불어 학습자의 교육 평등권 보장과 학습 성취도 향상에 필요한 편의 기능인 자막 제공 서비스는 더욱 중요한 요소로 자리매김할 것으로 보인다.
인공지능 테크기업 코난테크놀로지(대표 김영섬)는 AI기반 음성인식 기술을 적용한 온라인 강의 자막 자동 생성 홍보 사이트를 공개했다. 이 기술을 활용하면 비장애인뿐만 아니라 청각장애인, 한국어 듣기에 미숙한 외국인, 학습 부진 학생 등 온라인 강의 학습 과정에서 불편함을 경험하는 사용자들에게 편의성을 제공할 것으로 보인다.
코난테크놀로지의 인공지능 기반 자막 자동 생성 솔루션 ‘D-Listener’는 온라인 강의 영상의 딥러닝 기반 언어 및 음향 모델 학습과 비정형 자연어 처리 기술을 적용해, 보다 높은 정확도를 갖는 자막을 생성할 수 있다.
특히 화자 개별로 음향 모델을 학습하여 맞춤 서비스를 제공하는 점이 돋보인다. 화자마다 말투, 음성, 발음 등의 특징이 다양하고 과목에 따라 용어가 다른데, 하나의 모델로 서비스할 경우에는 화자에 따라 자막 생성의 정확도가 떨어지고 결과물 편차도 크게 발생할 수 있는 문제를 화자별 특화된 학습 모델을 활용해 자막을 자동으로 생성함으로써 이를 보완할 수 있을 것으로 기대된다.
또한 현실적으로 음성인식 기술을 활용하여 텍스트를 자동으로 생성한다고 하더라도 100% 완벽하지 않기 때문에, 후처리 보정 작업이 필요한 상황이다. 이 부분에서 코난테크놀로지는 음성 인식 품질 강화를 위해 20년 동안 축적한 한국어 자연어 처리 기술과 560만 형태소 분석 사전, 개체명 사전, 동의어 사전, 오타 교정 사전 등을 활용하여 손쉽게 자막을 수정할 수 있는 도구를 제공한다.
코난테크놀로지는 인공지능 분야의 꾸준한 R&D 투자를 지속해왔으며, 딥러닝 기반 음성인식 기술을 사업화한 D-listener 솔루션을 2020년 본격 출시할 예정이다. 코난테크놀로지 허세흥 그룹장은 “특히 장애인 차별 금지법 시행 등에도 불구하고 전국 약 1만 명의 장애학생의 온라인 교육 청취 불편은 온라인 학습 지원 정책 등의 방법으로 교육 당국과 대학 기관이 해결해야 할 오래된 문제"라며 "이에 따른 기술적인 지원을 확대해 나갈 계획“이라고 밝혔다.
전자신문인터넷 유은정 기자 (judy6956@etnews.com)