서치퍼트는 일반 포털에서 구하기 어려운 문서를 찾아주는 서비스 회사다. 공공기관 데이터를 인공지능(AI)을 포함한 정보통신기술(ICT) 기업에 제공한다. 문서 수집 비용 절감에 따른 AI 연구가 활성화될 것이라는 게 회사 측 설명이다.
서치퍼트(대표 노범석)는 업무용 검색 서비스 생태계 확장을 꾀하고 있다. 현재 서비스명은 딥서치다. 지난달 16일 출시했다. 이달 말 회사명과 같게 서치퍼트로 변경한다. 214개 공공기관이 2009년 1월 2일부터 선보인 500만건 상당의 문서를 검색할 수 있다.
국회·정부부처·공공기관 보유 자료에서 법원 판례, 연구기관 보고서, 기업 공시 데이터를 한눈에 보여 준다. 개별 공공기관 사이트에 접속해 원하는 자료를 일일이 뒤져야 하던 불편함을 덜었다.
검색 결과물에는 최신 자료가 포함됐다. 서치퍼트는 하루 세 차례 업데이트 작업에 나선다. 분산된 데이터를 추출하는 크롤링 기술을 활용, 새 문서가 추가될 때마다 실시간에 가깝게 검색 색인에 저장한다.
서치퍼트는 스트리밍 서비스를 지향한다. 음악, 영화처럼 데이터를 별도 저장을 하지 않고 필요할 때 꺼내 볼 수 있도록 할 방침이다. 이렇게 모은 공공기관 자료 데이터베이스(DB)를 AI 기업에 제공한다. 6테라바이트(TB) 규모의 대용량 비정형 데이터다. 상업 활용 목적이 아니라면 무상으로 지원한다.
서치퍼트는 다양한 AI 기반의 공공 서비스가 나올 것으로 기대하고 있다. 챗봇이나 검색 기술 향상에 쓰일 것으로 전망된다.
시스템 고도화도 추진한다. 검색 가능 자료 범위를 늘린다. 절판 도서, 잡지, 논문을 비롯해 사용자가 직접 만든 문서를 스트리밍 방식으로 뽑아 쓰도록 하는 '딥페이퍼' 서비스를 선보일 계획이다. 공공기관 자료 트렌드를 분석해서 알려주는 보고서도 내놓는다. 미국 정부 및 공공기관 자료도 추가한다.
서치퍼트는 지난해 6월 문을 열었다. 7억원 상당의 엔젤투자를 유치했다. 노범석 서치퍼트 대표는 공인회계사다. 유병우 엠파스 전 개발본부장을 영입, 조직을 꾸렸다.
노 대표는 6일 “미국을 시작으로 해외 서비스도 본격화할 목표”라면서 “서치퍼트 데이터 기술이 우리 사회에 기여할 수 있는 기회를 찾으려 한다”고 말했다.
[표]서치퍼트 개요
최종희기자 choijh@etnews.com