무하유, 국회도서관 융복합서비스 데이터셋 구축사업 완료

무하유, 국회도서관 융복합서비스 데이터셋 구축사업 완료

무하유가 '국회도서관 융복합서비스 데이터셋 구축 사업'을 완료했다고 15일 밝혔다.

무하유는 이번 사업을 통해 국회도서관에서 제공 중인 인공지능(AI) 의정분석 서비스 '아르고스'에 법률 관련 질문·답변(Q&A) 데이터셋을 구축했다. 이를 통해 국회와 공공 관련 법규 등 법률 관련 질의사항에 대화형 문답으로 쉽게 설명함으로써 이용자 편의성을 높였다.

무하유는 원활한 사업 추진을 위해 법률 지식을 보유한 전문가들을 포함한 데이터셋 구축인력을 구성했다. 이는 법률에 관련 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목과 매칭 키워드 등 광범위한 영역을 포함하는 고품질 데이터셋이 구축됐다.

HWP와 PDF 파일 내 법률 관련 통계 표 또는 이미지의 제목과 매칭 키워드 데이터도 구축해 국회도서관 콘텐츠 품질을 강화했다. 표와 이미지 데이터 구축은 무하유 표절검사 서비스 내에 적용된 이미지 인식·추출 기술을 활용해 자동으로 해당 데이터를 추출, 다차원 품질 검수를 실시하는 식으로 이뤄졌다.

신동호 무하유 대표는 “무하유는 기술로 공정 효율화를 높이고, 인력으로 데이터 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다”며 “검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것”이라고 밝혔다.

김명희 기자 noprint@etnews.com