한국저작권위원회, 2017 저작권 기술 R&D 신규과제 1차년도 성과 발표

한국저작권위원회는 2017년 저작권기술 R&D신규과제인 ‘객체기반의 출판교육 저작권 추출 및 분류기술 개발’ 1차년도 성과보고가 12월 13일에 개최된다고 밝혔다.

해당 과제는 (사)한국인지과학산업협회(협회장 서울대학교 장병탁교수)가 주관기관, ㈜무하유(대표이사 신동호)가 참여기관으로서 진행 중이며, 3년 간의 기술개발을 통해 ‘인공지능기반 교육 저작물 관리시스템’을 상용화하는 것을 최종 목표로 하고 있다.



교과서 등의 교육저작물에 이용되는 사진, 그림 등은 이미지에 대한 DB화가 이루어지지 않아 미보상 저작물이 지속적으로 발생하고 있다. 그 중에서도 사진, 미술 이미지의 미분배율이 78%를 차지하고 있는 상황이다. 또한 기존에는 교육저작물 라이선스가 수동으로 관리되고 있어 이를 개선하여 인공지능을 활용해 자동화하고자 하는 것이 이번 과제의 배경이 되었다.

1차년도 과제 진행 성과는 다음과 같다. △교육저작물 학습데이터 제작 △이미지와 텍스트가 혼합된 저작물의 인식 모듈 개발 △주의(attention)기반 고속 시각처리 알고리즘 개발 △딥러닝 기반 어문 저작물 인식 모듈 개발 △시각 지능정보 학습데이터 유형 분석서 작성 △교육저작물 메타데이터 유형 분석서 작성 △시각 지능정보기술 기반 교육저작물 학습관리 프로그램 개발 1종

인공지능의 핵심기술인 딥러닝은 학습데이터가 부족할 경우 충분한 학습이 이루어지지 않아 실 서비스에 적용할 만한 품질을 이끌어내기 어렵다. 참여기관인 ㈜무하유는 실 서비스 중인 대량의 학술, 교육데이터를 대상으로 자체 보유한 문서포맷 기술을 적용하여 본 연구과제의 학습데이터 제작에서 목표대비 10배에 해당되는 10,000건, 900GB 분량의 학습데이터를 생성하여 딥러닝 품질 개선의 고질적 장애물이었던 학습데이터 부족 문제를 해결했다. 또한 다중저작물의 자동분리 추출의 경우, 정확도가 90%이상으로 구현된 상태다.

본 연구과제로 개발되는 텍스트 저작물 인식기술은 (사)한국인지과학산업협회로부터 ㈜무하유가 기술이전 받아 ㈜무하유의 카피킬러 DS(Deep Structure, 심층검사)에 적용되어 상용화 될 예정이다.

연구책임자인 김철연교수는 “1차년도에 계획했던 목표치를 초과달성 하였다.”며 “(사)한국인지과학산업협회와 ㈜무하유의 협력이 향후 교육 저작물 관리에 큰 기여를 할 수 있을 것이라 기대된다.”고 밝혔다.

한편, 과제는 2차년도에는 교육 저작물 식별 및 관리기술을 개발하고, 3차년도에는 시각 지능정보기술을 활용한 교육 저작물 관리서비스를 구축하는 것을 목표로 하고 있다.

전자신문인터넷 이종민 기자 (jongmin1@etnews.com)