무하유(대표 신동호)는 이러닝 시스템 연동형 표절검사 서비스 'CK브릿지'를 개발했다.
CK브릿지는 이러닝 시스템에 연동돼 과제물을 제출하는 즉시, 실시간으로 표절검사를 수행한다. 검사 소요 시간은 1분 내외로 과제물의 정확한 표절률과 함께 비교된 문서 정보를 제공한다. 교수자는 이러닝 시스템 과제 관리 화면에서 과제물 표절검사 결과를 확인해 공정하고 효율적 평가를 수행한다.
CK브릿지는 다양한 표절 기준과 비교 데이터 범위를 설정할 수 있어 학습 분야에 최적화된 표절검사를 제공한다. 과제물, 서술형 시험 답안 등을 표절검사를 비롯해 소스코드 표절 여부와 이른바 '족보'를 사용한 표절 여부까지 검출할 수 있다.
무하유는 인공지능(AI) 기반 언어처리 기술을 보유한 기업이다. AI 기술을 적용해 표절검사 정확도를 높인다. CK브릿지에는 수천만 건의 문서 데이터를 학습한 AI 기술이 적용됐다. AI는 학습한 문서 데이터를 토대로 표지, 목차, 참고문헌과 같은 문서 영역을 자동으로 인식한다. 출처나 인용표기 여부를 확인하고 표절률에서 제외하는 기능을 포함한다. 올바르게 작성한 출처표기만을 인식해 표절률에서 제외하는 방식이다. 성경, 법령, 불경과 같이 널리 알려져 있고 누구나 사용 가능한 문구도 표절률 수치에서 제외하고 작성자가 사용한 문장의 출처 정보를 제공한다.
무하유는 CK브릿지 표절검사 비교 데이터 관리에도 총력을 기울인다. CK브릿지는 60억건 이상 공개된 웹 콘텐츠, 9000만건 이상 문서 데이터를 표절검사 비교 데이터로 보유했다. 실시간으로 많은 양의 데이터가 생성되는 블로그와 뉴스, 위키와 같은 웹 페이지 데이터를 검사 즉시 색인을 거쳐 결과로 제공함으로써 정확한 표절검사가 가능하다.
김성원 무하유 데이터 수집 유닛 프로는 “무하유는 국내외를 아우른 비교 데이터를 확보하고 있다”면서 “실시간으로 생성되는 웹 페이지를 참고해서 작성하는 과제물이 많은 만큼 CK브릿지도 실시간으로 생성되는 데이터를 비교 데이터로 제공하고 있다”고 전했다.
-제품 개발 배경은.
학생 과제물 표절 문제는 이미 오래 전부터 이슈였다. 단순히 인터넷에서 본 글을 복사, 붙여넣기 하는 것을 넘어 작성했던 과제물을 돈을 주고받으며 거래까지 하는 표절 행위는 다양한 형태로 발전했다.
문제는 사람의 눈으로는 인터넷 상에 공개된 수많은 문서를 비교하며 표절 여부를 확인하거나, 흔히 말하는 '족보' 사용 여부를 발견하기 어렵다는 점이다. 공정하고 공평한 평가를 진행하고자 했던 고객사 요청으로 LMS(학습 관리 시스템) 전용 표절 검사 시스템 'CK브릿지'를 개발했다.
-수출 현황과 계획은.
무하유 자연어 분석 기술은 비영어권 국가의 2바이트 글자 데이터 분석에 탁월한 성능을 자랑한다. 무하유는 9년간 자연어를 분석하며 쌓아온 기술력으로 일본 시장에 표절검사 서비스 '카피모니터'를 출시했다. '카피모니터'는 현지 업체는 해결하지 못했던 과탐지 문제를 해결해 능력을 인정받는다. 대만, 중국 시장에서도 기술력을 인정받아 진출을 앞두고 있다.
-향후 신제품 개발과 출시 계획은.
코로나19로 비대면 원격 교육이 활성화되면서 CK브릿지는 전년 대비 5배가 넘는 과제물을 표절검사하고 있다. CK브릿지의 차별점은 사용자의 만족도가 높은 서비스라는 것이다. LMS에 연동돼 있어 과제물이 제출되면 교수자는 별도의 절차 없이 표절 여부를 확인하고 평가할 수 있다. 서비스의 편리성과 필요성이 입증되니 상대적으로 쉽게 고객에게 다가갔다.
자연어를 이해하는 AI 기술을 다양한 분야의 문서 분석에 접목해 평가와 판단을 돕는 서비스를 개발 중이다. AI가 수만 건의 판례를 수집·분석해 사용자가 키워드를 입력하면 사용자에게 도움이 될 만한 판례를 추천하거나, 재판부에 제출된 서류를 분석한 요약 데이터를 제공해 재판의 사안과 쟁점 파악을 돕는 용도로 활용 가능한 서비스 등이다.
김지선기자 river@etnews.com