사이냅소프트가 인공지능(AI) 기반 문서 학습 도구인 '사이냅 도큐애널라이저'를 출품했다.
이 솔루션은 비정형 문서의 정보를 정형화하여 기업과 정부기관 데이터 자산화를 지원한다. 대규모 언어 모델(LLM) 구축을 위한 데이터 전처리와 정제의 부담을 덜어준다.
사이냅 도큐애널라이저는 PDF, 이미지 문서 뿐만 아니라 한글, 오피스 문서 등 다양한 비정형 문서의 포맷과 레이아웃을 분석하여 정보를 정형화한다.
이를 통해 고객은 수작업 데이터 입력, 메타데이터 관리, 데이터 분류 등의 비효율성을 해결할 수 있다. 내부 문서를 기반으로 LLM 구축을 원하는 고객은 대규모 데이터 관리의 부담을 줄일 수 있다.
이 솔루션은 표, 이미지, 차트 등 시각적 정보를 다양한 출력 형식으로 변환해 제공한다. 이는 생성 AI의 약점인 할루시네이션(환각현상)을 최소화하는 검색증강(RAG) 시스템 구성에 기여한다.
결과적으로 데이터의 정확성과 신뢰도를 높이며, 분석 결과는 디지털 정보 자산 구축 및 LLM 학습에 활용될 수 있다.
사이냅소프트는 사이냅 문서필터, 사이냅 문서뷰어와 사이냅 OCR 등 AI 기술와 결합한 차세대 제품 및 서비스를 지속적으로 선보이고 있다.
사이냅소프트는 자체 개발한 문서 이해 AI인 '사이냅 DU LLM'을 출시해 도큐애널라이저와 함께 제안할 계획이다.
도큐애널라이저와 DU LLM 기술을 활용해 금융감독원 전자공시시스템(DART)에 공개되는 기업 공시 정보를 학습한 '전자공시 이해 기업 정보 서비스'를 사내에서 오픈하고 현재 베타 테스트 중이다.
이 서비스는 올해 외부에 공개될 예정이다. 방대한 공시 정보를 더 빠르게 파악하고 해석하여 활용할 수 있게 된다.
전경헌 사이냅소프트 대표는 “코난테크놀로지, 셀렉트스타, 미소정보기술, 모비젠 등과 협력하여 다수의 기술검증(PoC)을 진행 중이며 LLM 모델 생성에 있어 학습 데이터 품질을 중시하는 고객들로부터 큰 관심을 받고 있다”며 “이 제품이 디지털 자산 활용이 필요한 기업과 기관에 실질적인 도움을 줄 것으로 기대한다”고 말했다.
박두호 기자 walnut_park@etnews.com