[SW유망기업을 찾아서] 세연아이넷 ‘사이도스’, 비정형데이터도 항목별 구분 ‘착착’

 “김 과장 그 때 그 서류 어디다 놨어? 지금 빨리 써야돼”
“잠시만요 최 부장님, 그 자료가 여기 있었는데, 어디갔지”
“잘 정리해놨어야지. 지금 그러면 어쩌나!”

하루에도 수십건씩 쌓이는 서류 더미에 압사당할지도 모르겠다. 때마다 잘 정리해놓으면 적재적소에 쓰겠지만, 현실적으로 막막하기만 할 따름이다. 공공기관과 민간기업등 잠재된 비정형 파일과 원본 종이문서를 수집해 정형 데이터화하는 목록 자동분류 솔루션이 있다면 이러한 상황을 미연에 방지할 수 있다.

세연아이넷이 개발한 동기적 문서지향 솔루션 ‘사이도스(SyDos Ver3.1)’는 이러한 문제를 슬기롭게 극복할 수 있는 수단이다.

사이도스는 문서형식의 데이터 중 본문을 분석해 목록과 항목, 내용 등을 자동 추출해 규격화해준다. 보기 항목을 자동으로 생성한 다음에는 웹에서도 검색할 수 있다. RDB는 물론이고 NoSQL과 연동해 비정형 데이터를 마치 정형 데이터처럼 분석해서 사용할 수도 있다. 비정형으로 재가공한 후 보고서로도 만들 수 있다.

세연아이넷은 이러한 사이도스 구현을 위해 XML과 HTML5를 활용한 빅데이터 분석 시스템을 개발하는데 힘썼다. 개발에 대한 노력으로 세연아이넷은 ‘RTE 기반 빅데이터 분석 시스템과 개발 방법론’에 대한 특허까지 따내는데 성공했다. 모든 비정형 데이터를 정형화시켜 어디서든 활용할 수 있는 솔루션도 개발해 사이도스 완성도를 더 높였다.

실제로 문서작업을 하는 실무자들은 한글과컴퓨터의 ‘한글’이나 마이크로소프트 ‘워드’, ‘엑셀’, ‘파워포인트’, 기본 문서인 ‘텍스트’, 웹 기반의 XML뿐만 아니라 이미지와 영상등 수많은 콘텐츠를 다양한 프로그램을 통해 사용한다.

실무자가 작성한 콘텐츠는 다양한 포맷으로 저장된다. 각각이 호환된다면 때에 따라 열겠지만 콘텐츠가 기하급수적으로 늘어나기 때문에 분류작업이 만만치 않다.

사이도스는 이러한 비정형 데이터를 표준 형식으로 자동변환 해준다. 분류체계를 분석하고 분류항목을 자동으로 추출한다. 첨부자료도 물론이다. 분류된 항목의 자료를 암호화 및 비실명화 작업까지 도와준다.

이러한 과정을 거치면 1개의 문서 안에서만 본문 검색이 가능한 기존과는 달리 정보를 데이터베이스 또는 폴더내에 있는 상태에서 공유 및 검색을 할수 있어 업무운영이 보다 효율적으로 바뀐다. 다양한 자료 형식과 정보 장치들에서 쏟아진 모두 콘텐츠를 실시간으로 전송해 분류해주기 때문에 업무 속도가 늘어남은 물론이고 문서 중앙화가 자연스럽게 가능하다.

정은호 세연아이넷 대표
정은호 세연아이넷 대표

◇ 정은호 대표 “안주하지 않고 비전을 위한 추진력 필요”
“한국정보통신기술협회에서 소프트웨어 품질인증서를 받았다. 무려 1등급이다. 대부분의 인증은 무등급이거나 2등급이다. 웬만하면 나오기 힘든게 1등급이다. 그만큼 자부심이 있다”

정은호 세연아이넷 대표는 동기적 문서지향 솔루션 ‘사이도스(SyDos)’에 대해 이같이 말했다. 기술력만큼은 최고라는 자부심이 대단하다. 그만큼 주위에서도 인정받고 있다.

실제로 세연아이넷은 국가권익위원외에 프로젝트를 제안한 바 있다. 국내 내노라하는 SI업체들이 모두 참여했다. 1년에만 해도 공공사업에 제안하는 업체가 100군데가 넘는다. 그 중에서도 세연아이넷은 한 번의 도전에도 불구하고 기술력을 인정받아 제안 보상금까지 받았다.

물론 ‘사이도스’가 도깨비 방망이 내리치듯 한번에 개발된 것은 아니다. 코오롱 정보통신 출신인 정 대표는 다양한 고객사의 니즈를 귀담아 듣고 소프트웨어 유지 보수에 힘쓴 인물이다. 향후 비전을 모색하던 정 대표는 통계 관련 업무를 20년간 도맡아온 현재의 연구소장을 만나 ‘사이도스’에 대한 설명을 듣게 됐다. 그간 업무 효율성을 높이기 위해 비정형 데이터를 활용할 수 있는 방안을 찾던 연구소장과 또 다른 비전을 찾는데 고심한 정 대표의 방향이 맞아 떨어진 셈이다.

정 대표는 “재고, 회계, 급여 등은 모두 정형 데이터다. 언제든지 분석이 가능한 데이터다. 마케팅 보고서, 신문 사설 등은 모두 비정형 데이터다. 이러한 비정형 데이터도 정형 데이터처럼 항목별로 분류하고 원하는 키워드에 맞춰 손쉽게 뽑아낼 수 있는 솔루션이 국내는 전무했다”라며, “충분히 승산이 있다고 판단해 적극적으로 투자한 게 맞아 떨어졌다”고 말했다.

비정형 데이터를 정형화시킬수만 있다면 업무에 있어 효율성이 크게 증대한다. 가령 군대의 관심사병을 찾는데도 사이도스를 응용할 수 있다. 중대장이 매일 워드프로세서에 기록해둔 상담일지에 ‘불안’, ‘초조’, ‘휴가’, ‘외박’ 등 관련 키워드를 넣어 검색하면 특정 사병의 상태가 어떤지 금새 파악이 가능하다.

미국 등 글로벌 선진국에서는 약 5년 전부터 수작업으로 고비용을 투자하여 비정형 빅데이터를 정형화시키는데 매진했다. 반면 국내는 이 분야에서 미진했던 게 사실이다. 세연아이넷은 거꾸로 미국 시장 진출을 모색하고 있다. 이미 관련 인재를 발굴해 미국 시장의 문을 두드리는 중이다. 향후에는 중소기업을 위한 라이트 버전도 내놓을 계획이다.

정 대표는 기존 소프트웨어 유지보수에만 안주했다면 ‘사이도스’와 같은 솔루션이 빛을 보지 못했을수도 있다고 반문했다. 정 대표는 “직원들에게 우리 회사가 할 수 있는 새로운 비전을 제시하려고 노력했다. 젊은 패기로 뛰다보면 반드시 그에 따른 성취감을 얻을 수 있으며, 국가를 위해 공헌 할 수 있는 솔루션을 만들겠다는 의지를 보여주고 싶었다”라며, “대표로써 기본을 지켜야 한다고 생각했고, 지금도 그 기본을 지키려 노력한다”고 강조했다.


자세한 사항은 [유망SW TOP 15] - 세연아이넷 에서 확인하실 수 있습니다.

김문기 기자 (moon@nextdaily.co.kr)