「데이터웨어하우스(DW)」는 80년대 후반에 생긴 개념이다. IBM의 빌 인먼(Bill Inmon)이 「정보 웨어하우스(Information Warehouse)」라는 말로 이 개념을 처음 정립했으며 실제 구축이 이루어진 것은 90년대 초반 들어서였다.
당시 DW의 구축목표는 분산된 시스템을 통합하고 종합적인 장표(Report)를 생성하기 위해서였다. 특히 고객관리를 위해서 분산된 시스템의 고객 데이터를 통합할 필요가 있었다. 초기의 DW는 주로 통신·유통·금융분야의 대기업에 의해 시도됐다.
미국에서도 초기에는 OLAP도구라는 것이 많지 않았고 하드웨어 또는 소프트웨어적인 제약이 있어 많은 사이트에서 구축에 실패했다. 그것은 대용량 데이터 처리에 대한 미숙과 하드웨어 용량 부족, 과도한 구축비용, 사용자 액세스 도구의 부족이 큰 이유였다. 이 당시는 다운사이징이 시작되고 클라이언트서버기술이 시작되는 시점과 맞물려 거의 OLAP를 사용하지 않았다.
DW 구축 초기부터 스타스키마를 사용하는 다차원 모델링으로 DW를 구현한 것은 아니였다. 다차원 모델링은 랠프 킴볼(Ralph Kimball)이 최초로 시작했고 이 개념에 의해 RDBMS기반의 OLAP도구인 ROLAP도구가 출현했다. 데이터베이스의 DW에 대한 지원, 다양한 형태의 OLAP도구, 하드웨어 가격의 급격한 하락과 성능향상이 DW를 구현할 수 있는 중요한 요인이 되었다. 90년 중반을 지나면서 미국의 DW시장은 폭발적으로 성장했다.
국내에서는 정보계시스템과 DW에 대한 개념적 차이를 인식하는 데 시간이 걸리다 95년 12월 인포믹스가 삼성생명의 데이터를 가지고 미국 본사에서 DW 파일럿 프로젝트를 한 것이 최초였다.
96년경부터 몇 개의 기업이 DW 도입을 검토하기도 했으나 실제 구축에 들어간 사이트는 96년 8월 오라클과 삼성SDS가 공동으로 구축한 삼성전자였다. 곧 이어 삼성카드·신세기통신 등이 구축에 들어갔고 그 이후 십여개 기업이 뒤를 따랐다.
97년에는 DB마케팅이 IT업계의 화두가 됐다. 이것은 IT를 이용해서 고객관리를 효과적으로 하는 것인데, 기존에는 정보계시스템과 유사하게 구현된 패키지 형태가 대부분이었으나 DB마케팅을 DW로 구현하는 것이 효과적이라는 사실이 점차 인정됐다.
98년에는 IMF라는 최대의 경제위기를 맞아 거의 모든 IT투자가 동결되었다.
그러나 DW 도입이 IMF를 효과적으로 극복할 수 있는 고객관리, 투명한 경영, 혁신적인 마케팅 지원 등에 많은 도움을 준다는 것이 인정되면서 하반기부터는 DW 도입이 크게 증가되었다.
내년 이후에는 DW와 데이터마이닝의 결합이 매우 중요한 기술로 각광을 받을 것이다. 또한 전사적인 DW 구축이 국내에서 시작될 것이다. 또한 ERP와 DW간의 연동, 컴퓨터통신통합(CTI), 전자상거래(EC) 등 타 기술과 DW의 통합이 주요 이슈로 부각될 전망이다.