무하유가 과학기술정보통신부 주관, 한국지능정보사회진흥원(NIA)이 추진하는 '2024년 초거대 AI 데이터 구축사업'의 주관기업으로 선정됐다.
무하유는 이 사업 교육 영역 중 학술논문 이해 데이터 수집부터 모델링까지 인공지능(AI) 모델 제작 전 과정을 담당한다. 저작자를 표시하는 개방형저작물(CCL) 형태의 학술 논문 1만 건에 대한 포스터 생성을 자동화하는 것이 이 사업의 목표다.
무하유는 포스터 생성을 위한 △논문 요약 △핵심 표·그림 선정 △표·그림에 대한 설명문 작성 등을 지원하는 학습 데이터를 구축해 AI 모델을 개발한다.
데이터 구축 과정에서 학술 논문 전문 중 포스터에 활용될 영역을 매핑하는 데이터 라벨링 작업이 핵심인데, 무하유는 이 작업에 국내 연구기관출신의 석·박사급 인재를 투입해 정확도를 높일 계획이다.
무하유는 지난 13년간 AI 기반 학술논문 전문 표절검사 서비스 '카피킬러'를 운영하며 축적한 자연어 이해(NLU) 전문성과 학술 논문에 대한 높은 이해도를 바탕으로 안정적으로 데이터를 구축해왔다.
신동호 무하유 대표는 “자체 보유한 데이터 팩토리를 통해 신뢰할 수 있는 고품질 데이터를 대량 구축할 수 있어 공공 부문에서의 구축 사례가 늘고 있다”고 말했다.
현대인 기자 modernman@etnews.com
-
현대인 기자기사 더보기