![[CIO BIZ]빅데이터 분석, 이젠 CIO만의 고민 아니다](https://img.etnews.com/photonews/1111/209802_20111118184120_680_0001.jpg)
페타바이트(PB)급 데이터웨어하우스(DW), 소셜네트워크, 실시간 센서 데이터, 공간정보 등이 새로운 이슈로 떠올랐다. 과거엔 상상조차 못하던 데이터들이 쏟아지고 있다. 본격적으로 빅데이터 시대가 온 것이다. 기업들은 앞 다퉈 빅데이터 활용 방안 마련에 나섰다. 정부도 정책에 빅데이터를 활용하겠다고 선언했다.
빅데이터는 기업 및 기관에게 위기이자 새로운 기회이다. CIO BIZ+는 IDC가 ‘빅데이터 분석, CIO를 위한 미래지향적 아키텍처, 기술 그리고 로드맵’이라는 주제로 발간한 보고서를 기반으로 경영진이 알아야 할 빅데이터 분석 기술과 접근 방식을 짚어본다.
오늘날 빅데이터 분석은 최고정보책임자(CIO)만의 고민이 아니다. 기업 최고경영자는 물론이고 국가를 운영하는 대통령에게도 빅데이터 분석은 핵심 이슈다.
최근 이명박 대통령은 국가정보화전략위원회 보고를 듣는 자리에서 “빅데이터 활용을 빨리 실천해 다른 나라보다 앞서야 한다”고 강조했다. 그러나 빅데이터 분석은 기존 데이터베이스 분석 기술과 아키텍처로는 불가능하다. 새로운 미래지향적 분석기술과 아키텍처가 필요하다.
◇CIO, 빅데이터 분석을 전사 영역으로=빅데이터 시대에서 CIO는 분석 역량을 IT 영역이 아닌 전사 영역으로 확장해 강화해야 한다. 기존 IT인프라 아키텍처도 변화시켜야 한다. 이를 위해 CIO는 △클라우드 버스팅(Bursting) △분석 어플라이언스(Analytics Appliance) △전사 아키텍처 등을 고민해야 한다.
첫째는 클라우드 버스팅이다. 프라이빗 클라우드는 전사 차원 비즈니스 분석 요구와 방향을 같이 한다.
CIO는 프라이빗 클라우드 업무 평가를 보다 엄격하게 수행하고 리스크를 최소화 할 수 있도록 해야 한다. 클라우드 서비스 업체의 클라우드 버스팅에 대한 평가는 더욱 중요하다. 이 평가를 기반으로 기업이 실시간 비즈니스 분석 환경을 활용하면 인프라 자원에 충분한 공급과 시스템 가용성이 높아진다.
둘째는 분석 어플라이언스다. 분석 어플라이언스 모델은 최적화된 소프트웨어(SW)가 통합돼 있어 구축하는 데 소요시간이 짧다. 도입 시 여러 기술적 이슈를 줄여주는 효과가 있다.
IDC가 최근 전 세계 CIO를 대상으로 설문조사한 결과 상당수 CIO가 분석 어플라이언스를 도입할 계획이 있다고 밝혔다. 많은 CIO는 기존 데이터웨어하우스(DW) 환경 내 어플라이언스 통합을 시도하고 있다. 향후 분석 어플라이언스 도입은 더 확산될 전망이다.
셋째는 전사 아키텍처다. 기업은 빅데이터 분석을 위해 비즈니스 성장에 맞춰 규모를 확장할 수 있는 체계적인 전사 아키텍처를 수립해야 한다. 증가하는 데이터양, 빨라진 데이터 생성속도, 다양해진 데이터 등을 처리하기 위해 △데이터베이스 내 분석 △병렬 처리 △메모리 내 스토리지 등 고사양 분석환경이 필요하다. 비정형 대용량 데이터를 처리하는 하둡(Hadoop) 기술에 관심이 커지는 이유다.
CIO들은 비즈니스 문제를 해결하기 위해 글로벌 표준 아키텍처와 요구사항을 고려하는 경향이 많다. 그러나 특정 글로벌 거버넌스 모델을 사용하면 실제 환경에서 여러 기술 중 일부는 사용할 수 없게 된다. 비즈니스 목표치를 맞추기 위해 IT부서는 전사 아키텍처 어젠다를 현지 수준에 맞춰 이용할 수 있도록 하는 것도 좋은 방법이다.
◇CIO, 빅데이터 분석에는 다양한 체크 필요=빅데이터 분석이 갖고 있는 잠재력을 적극적으로 활용하는 기업은 매우 적다. 이는 빅데이터 분석을 위해 모든 항목을 점검하는 것조차 쉽지 않기 때문이다.
최근 어려운 경제 여건 속에서 진정한 차별화를 꾀하는 기업들이 나타나고 있다. 이러한 기업에게 변화는 필수적이다. CIO는 이러한 상황에서 핵심적 역할을 수행해야 한다. CIO는 효과적인 빅데이터 분석을 위해 다양한 체크 리스트를 살펴야 한다.
우선 미래를 위한 아키텍처가 설계됐는지 봐야 한다. 기업은 클러스터링, 병렬처리, 인메모리 기술로 모든 데이터를 분석, 활용할 수 있도록 하고 있다. 이 과정에서 가용성 보장을 위해 단순히 용량을 추가하는 오류에 빠지지 말아야 한다. 다양한 상황에 대비해 사례별로 여러 모델을 평가할 필요가 있다. 특히 급격한 수요확대에 대응할 수 있는 클라우드, 분석전용 어플라이언스는 물론이고 전통적인 클라이언트서버나 3계층 웹 아키텍처 접근법 등도 고민해야 한다.
‘샌드박스(Sandbox)’ 사고방식이 필요하다. 빅데이터 시대 분석 이슈는 과거와 달리 필요하지 않은 데이터까지 모두 모인다는 것이다. 완전히 새로운 변수와 분석 모델이 요구되는 방대한 비정형 데이터가 존재하는 셈이다. 따라서 분석 모델 개발 시 데이터 발굴 프로세스가 시작되는 ‘샌드박스 멘탈리티(Mentality)’ 방식으로 접근법을 검토해야 한다.
과도하게 고민해서 시간을 버리고 있는지에 대해서도 생각해봐야 한다. 시장에서 주목받는 최신 기술이 나올 때마다 IT부서는 지나치게 숙고하는 경향이 있다. 이는 비즈니스에 즉각적인 영향을 미칠 수 있다. 물론 적절한 검증은 필요하다. 하지만 CIO는 비즈니스 가치 전달에 비해 너무 많은 시간을 검증에 낭비하지 않도록 주의해야 한다.
적절한 팀을 구성했는지도 체크해야 한다. CIO가 자체 IT부서를 평가해 필요한 기술수준과 조직 구조를 검토해야 한다. 필요하다면 현업 부서가 변화를 인식할 수 있도록 내부적인 개혁도 추진해야 한다. 적절한 프로세스 및 거버넌스 체계가 구축된 상태라면 권한 부여도 필요하다. CIO 분석기술 역량 강화와 다른 사업 부문 임원과의 협업도 이뤄져야 한다.
전사적 접근 방식이 고려돼야 한다. 기업은 정보를 사용자가 활용할 수 있도록 다양한 비즈니스인텔리전스(BI) 툴을 접목해 데이터웨어하우스를 구축한다. 그러나 복잡한 분석 기능을 활용하는 데 IT기술 부족으로 프로젝트가 부서 단위 사용에 국한된 ‘사일로(silo-ed)’ 형태로 진행된다. IT와 현업 간 협력이 필요하다. CIO는 프로젝트가 성공할 수 있도록 분석 솔루션 구축을 위한 전사 접근 방식을 도입해야 한다.
마지막으로 적절한 IT투자도 이뤄지고 있는지 확인해야 한다. DW 기술에 기존 투자가 올바르게 이뤄졌다면 이는 미래 보상으로 돌아온다. IT부서에서 정착시킨 데이터 모델과 레퍼런스 아키텍처로 다양한 사업부서에서 활용하는 데이터 정의와 표준을 일관성있게 유지할 수 있다. 데이터 거버넌스에 있어 운영과 분석 간 차이를 없애기 위해 기준정보관리(MDM) 영역에 더 많은 투자가 이뤄져야 한다.
<그림1> 빅데이터 정의
출처 : IDC
<그림2>빅데이터 분석의 잠재적 적용 사례
출처 : IDC
신혜권기자 hkshin@etnews.com
![[CIO BIZ]빅데이터 분석, 이젠 CIO만의 고민 아니다](https://img.etnews.com/photonews/1111/209802_20111118184120_680_0002.jpg)