올 들어 데이터웨어 하우징(DW)에 대한 관심이 부쩍 늘고 있다.
국내 주요 컴퓨터업체들이 앞다투어 데이터웨어 하우징 솔루션을 내놓고세미니와 전시회 그리고 개별 면담 등을 통해 활발한 영업활동을 추진하고있다.
현재 데이타웨어 하우징 솔루션을 내놓고 있는 업체들은 한국IBM, 한국유니시스, 한국디지탈, NCR코리아 등 하드웨어업체들과 한국오라클, 인포믹스 다우코리아(IDK), 한국사이베이스 등 소프트웨어업체로 크게 분류할수 있다.
아직까지는 개념 조차 낯선 데이타웨어하우징은 일반적으로 겉으로 아무런관계도 없어 보이는 데이타간 숨어 있는 상관관계를 끌어내 기업의 경영활동에 활용하기 위한 새로운 데이타 활용 기술을 말한다.
예를 들어 비오는 날에 수퍼마켓 식품 매장의 매출이 평소보다 늘어나는비율, 반바지를 입은 사람이 정장을 입은 사람 보다 아이스크림을 찾을 확률등 비와 식품, 바지와 아이스크림 등 전혀 관계가 없는 것 처럼 흩어져 있는자료들 간의 상관관계를 찾아내는 것이 데이타웨어 하우징의 구축 목적이다.
물론 이 자체 만으로도 영업활동에 활용할 수 있는 훌륭한 자료가 되지만이를 좀더 발전시켜 「아시아 지역에 3개 이상의 지사를 추가 설립한다면 지난 12개월간 실적을 기준으로 분기별 매출액을 예상」하는 모델링, 「계획대비 5% 이상의 올린 상품과 총 매출의 2% 이상을 차지하는 상품간 관계」등 다차원적인 분석에도 활용할 수 있다.
데이터웨어 하우징은 이론상으로는 개인용 노트북 PC에서도 구현할 수있지만 경제성을 살린 시스템을 구축하기 위해서는 적어도 5백기가 바이트이상의 원천 데이타를 보유하고 있어야 하며 이를 처리할 수 있는 메인프레임급 하드웨어 그리고 자료 관리를 위한 관계형데이터베이스관리시스템(RDBMS) 및 온라인분석처리(OLAP) 도구 등이 필요하다.
또 파일시스템 등을 이용해 입력한 기존 자료를 RDBMS 구조에 따라다시 체계적으로 정리하고 자료를 변환시키기 위한 작업이 필요하다. 하지만대부분 기업들이 축적하고 있는 자료만 해도 이미 방대한 수준에 이르고 있기 때문에 데이터웨어 하우징 구축을 위해서는 단순한 시스템 구성 뿐 만 아니라 정밀한 컨설팅 작업이 무엇보다도 먼저 선결돼야 한다는게 일반적인 견해다.
현재 국내에서도 데이터웨어 하우징 구축을 위한 논의가 활발히 진행되고있지만 실제 구축사례가 드믄 이유도 바로 기업이 갖고 있는 방대한 기존 데이타(legacy data)를 효과적으로 처리하기 어렵기 때문으로 지적되고 있다.
이런 이유로 현재 국내에서는 대규모 기업 보다도 기존 데이타를 다시 정리해야 하는 부담이 적은 중견기업, 신생업체들이 데이터웨어 하우징 구축에앞장서고 있다.
현재 국내에서는 대한항공이 마일리지 서비스 회원관리를 위해서 데이터웨어하우징을 구축했으며 신용카드사, 자동차회사, 후발 은행 등도 일부 시스템을 도입했거나 도입을 적극 추진하고 있는 실정이다.
<함종렬 기자>