[실리콘밸리투데이]IBM, 고성능 검색 SW 웹파운틴 주목

산호세 남쪽 언덕에 자리잡은 IBM 알마덴 연구소 지하에 있는 수백 대의 컴퓨터 서버들은 1주일에 2억 5000만장의 웹 페이지를 수집하고 있다. 이 서버들이 수집한 총 51만 2000Gb 분량의 데이터들은 `웹파운틴 (WebFountain)`이라고 불리는 최신 분석 소프트웨어에 의해 분류되고 있다.

‘웹파운틴’은 이 연구소 댄 그룰 연구원과 앤들 톰킨스 연구원이 지난 4년 동안 각고의 노력을 기울인 끝에 개발됐으며 노련한 도서관 사서 조차도 파악하기 힘든 자료 패턴을 찾기 위해 온라인 데이터를 검색,분석한다.

IBM은 최근 이 기술을 신제품에 대한 소비자 반응을 온라인 데이터에서 찾아내는 용도로 기업들에게 라이센스하기 시작했다. 웹파운틴은 웹 로그, 채팅방, 신문기사 등 입수 가능한 모든 정보원을 뒤져 정보의 연관성을 찾아내 나름대로 결론을 내린다.그룰 연구원은 웹파운틴의 용도에 대해 “자료에 대한 총체적 이해를 돕는다”며 “한 주유소 업체가 이 소프트웨어를 사용해 고객들이 주유소를 선택할 때 휘발유 가격이나 무료 세차 서비스에만 관심이 있는 것이 아니라 주유 도중 강도를 당할 가능성도 고려한다는 사실을 알게 됐다“고 설명했다.

그는 또다른 고객인 한 보안 회사는 거액 예금자의 돈 세탁 관련 가능성을 은행에 알려주기 위해 웹파운틴을 활용했다고 덧붙였다.즉 웹파운틴은 공공 정보 데이터베이스와 이 보안회사 내부의 고객 파일을 접근,돈 세탁자 명부를 작성한 뒤 신문 결혼식 알림 기사,고등학교 동창 웹 사이트 등 각종 자료를 뒤져 은행 고객과 돈 세탁자의 인맥 여부를 조사한다는 것이다.

만약 거액 예금자 아내의 친구가 돈 세탁 전과자라는 사실이 발견되면 은행은 이 예금자의 입금을 거절할 명분이 생기게 된다.

웹파운틴은 정해진 패턴만 맞으면 결과를 보여주는 보통의 표준적 검색 엔진과는 달리 누군가의 이름이 다른 누군가와 얼마나 자주 관련되는 지에 촛점을 맞춰 50가지 방식으로 자료를 분석,검색 문의에 대해 가능한 한 가장 정확한 답을 제공한다고 개발자들은 주장하고 있다.

IBM은 현재 웹파운틴의 자료 분석비용 절감 방법을 연구중에 있다.정보 서비스 업체인 팩티바는 웹파운틴의 라이센스를 구입,자사 고객들에게 연간 20만 달러 정도에 정보 서비스를 제공할 계획이다.톰킨스 웹파운틴 공동개발자는 “결국 모든 사람들이 이 툴을 사용하게 될 것”이라고 자신만만해 했다.

<제이 안 기자 jayahn@ibiztoday.com>