[신SW상품대상 추천작]세연아이넷 `사이도스`

세연아이넷(대표 정은호)은 공공기관과 민간기업 등에 잠재된 비정형 파일과 원문 종이문서를 수집해 정형 데이터화하는 동기적 문서지향 솔루션 `사이도스`를 출품했다. 종속된 소프트웨어 없이 본문 검색과 데이터를 마이닝해 각종 업무에 적용 가능하도록 돕는다.

세연아이넷 `사이도스` 실행화면
세연아이넷 `사이도스` 실행화면

문서형식 데이터 중에 본문을 분석해 목록과 항목, 내용 등을 자동 추출·규격화한다. 보기 항목 자동 생성 후 웹에서 검색이 가능하다. 기존 RDB는 물론이고 NoSQL과 연동해 비정형 데이터를 정형 데이터처럼 분석 가공한다. 비정형으로 재가공해 리포트 출력도 지원한다.

XML과 HTML5를 활용한 빅데이터 분석 시스템 개발에 주력해 왔다. 지난해 XML을 활용한 `RTE 기반 빅데이터 분석 시스템과 개발 방법론`에 대한 특허를 취득했다. 후속 제품으로 모든 비정형 데이터를 정형화시켜 자유자재로 활용 가능한 솔루션 개발에 박차를 가해 사이도스를 완성했다.

업무 연계와 연동에 분류체계 비표준이 주는 불편함을 해소한다. 상호 교류·공유하고 융합하는 데이터 모델링과 매핑, 데이터웨어하우스, 데이터마트 등을 구성한다. 규격화된 동기적 표준데이터 구조를 적용해 데이터 통합관리가 쉽다.

비정형 데이터 규격화로 업무분석과 참조, 분류체계 표준화, 통계·빅데이터 분석에 도움을 준다. 빅데이터 분석 사업 중 가장 어렵고 많은 비용을 필요로 하는 비정형 데이터 수집 부문과 데이터 모델링을 간단하게 해결한다.

▶운용체계: WIN-NT/윈도7, 10

▶다양한 형태 문서 자료에서 내용을 추출해 표준 규격화하는 솔루션

▶문의:(02)2634-6100

[정은호 세연아이넷 대표]

정은호 세연아이넷 대표
정은호 세연아이넷 대표

“정부와 금융, 의류, 국방, 교육 등 공공기관과 기업, 학계 등에 존재하는 여러 형태 문서는 활용도 높은 중요한 자료임에도 많은 부분이 텍스트화 되지 못하고 있습니다.”

정은호 세연아이넷 대표는 여러 형태 문서를 표준형식으로 분류·규격화해 바로 확인 가능하게 돕는 솔루션을 개발했다. 누구나 쉽게 업무 연계와 빅데이터 분석 등 데이터를 응용하는 형식으로 구성하기 위해서다.

정 대표는 “전자정부3.0 공공데이터 대부분은 비정형 파일이라 단독으로 열어 사용해야 한다”며 “W3C 표준 형식인 XML은 뷰어가 없으면 일반인 활용에 어려움이 많다”고 말했다.

대부분 비정형 파일이 한글문서와 엑셀, PDF인 점을 감안해 주로 공공기관을 대상으로 영업을 추진한다. 국회와 국립중앙도서관 등은 바로 영업과 시연을 준비 중이다. 정부와 금융, 의료, 국방, 교육기관, 일반 기업 등을 대상으로 마케팅을 전개한다.

5월 초 GS 인증을 획득했다. 올해 상반기에는 홍보와 영업, 솔루션 완성도 향상을 우선 목표로 잡았다. 하반기 20억원에서 30억원으로 매출 목표로 잡았다.

정 대표는 “솔루션 엔진을 활용한 응용 시스템을 개발 중”이라며 “원문 전자화 시스템은 개발을 완료했고 빅데이터 관련 수집·분산처리시스템 등 관련 제품을 상반기 내 출시 예정”이라고 말했다.

박정은기자 jepark@etnews.com