데이터 스폰서십과 데이터 추적성 확보
수요자 중심의 시장 환경에서 기업들은 치열한 경쟁에 직면하고 있다. 이제 업무 효율화나 비용절감 등 소극적인 방법으로는 경쟁우위를 차지할 수도, 미래를 보장받을 수도 없다. 고객의 욕구를 정확하게 파악하고 새로운 가치를 창출할 수 있는 전략을 구사해 경쟁자가 따라올 수 없는 영역을 개척해야 한다.
이를 위해 고객이나 시장에 대한 분석 데이터뿐 아니라 미래를 예측할 수 있는 통계적인 데이터 활용이 요구된다. 데이터를 활용하려면 데이터 품질이 뒷받침돼야 하는 것은 기본이다.
◇경영진 스폰서십과 비즈니스 참여의 확보=데이터 품질 관리 활동은 최고 경영진의 강력한 스폰서십 아래 IT와 비즈니스 인력들의 데이터 중요성에 대한 의식을 전환해 비즈니스와 IT부서의 협업을 바탕으로 지속적으로 추진할 전사 경영혁신 활동이다.
기업이 데이터 품질관리 활동을 수행하는 유형은 크게 네 가지다. 첫째, 데이터 품질 관리에 대한 인식이 낮아 일상적인 기업 운영에 머무르는 ‘현상 유지형’이다. 현업이 데이터 품질 이슈를 제기할 때마다 IT가 그때그때 배치돼 스크립트, 데이터베이스(DB) 강제수정 등을 통해 근본적인 해결보다는 대증 요법 방식을 취한다. 이런 기업들은 조직 내 품질 이슈를 조사하고, 해결 필요성을 조직 내부에 널리 알리는 ‘데이터 품질 챔피언’을 육성할 필요가 있다.
둘째, 최고정보책임자(CIO)를 중심으로 데이터 관리 필요성을 인지하고 강력하게 IT 조직의 데이터 관리 프로세스 체계 정립 및 시스템화를 추진하는 ‘IT중심형’이다. 이들 기업의 데이터 품질 이슈는 IT 관점에서 해결할 수 있는 데이터 수정, 프로그램의 정비 등에 머무는 때가 많으며, 상당한 성과를 거두는 것도 사실이다. 다만, 이들 기업은 향후 데이터 소비자인 현업 인력의 데이터 현업과 연계된 전사적인 데이터 품질 관리 활동으로 성장시킬 필요가 있다.
셋째, 단위 부서별로 데이터 품질 활동을 추진하는 부서별 데이터 품질관리형이다. 이들 기업은 각종 컴플라이언스 대응, 고객관계관리(CRM)를 위한 고객 데이터의 정비 등이 주요 데이터 품질 활동이다. 이들 기업은 데이터 품질 투자가 부서별로 중복되고, 활동역랑이 분산되는 문제를 해결하기 위해 투자와 노력을 집중해 전사 데이터 품질 관리 활동으로 성숙시키는 노력이 필요하다.
넷째, 경영층이 명확한 방향성을 제시하고, 이에 따른 전사 데이터 품질 관리체계를 확립한 후 IT와 비즈니스의 협업을 통해 강력하게 데이터 품질 관리 활동을 추진하는 전사 데이터 품질관리(DQ)형이다. 전사 DQ형에 속한 기업은 일선 담당자, 관리자, 경영층이 지속적으로 데이터 품질 현황을 파악할 수 있는 데이터 품질 스코어보드의 구축, 데이터 품질 활동으로 인한 비즈니스 관점의 정량·정성적 효과를 조직에서 공유함으로써 데이터 품질 관리 활동을 지속적으로 추진해가는 것이 중요하다.
데이터 품질 관리 활동을 새로 추진하는 경우 데이터 품질과 연관된 조직 내 비즈니스 이슈부터 점검해야 한다. 기업의 전략적 의사결정에 영향을 미치는 정보의 데이터 품질 개선, 각종 컴플라이언스가 요구하는 데이터 품질 요건 확보, 고객 중심의 비즈니스 모델 지원을 위한 단일화된 뷰의 구축, 고객 정보의 정비, 내외부 가치사슬의 통합을 위한 기준정보 정비 등이 과제다.
특히 데이터 품질 활동의 이니셔티브를 IT 내부에서만 찾을 것이 아니라, 비즈니스 프로세스 관련 부서에 오래 근무하고, 비즈니스 프로세스의 데이터 활용 방식 및 영향도를 이해하는 현업의 정보 소비자들로부터 데이터 품질 이슈, 기대효과 등을 수집하고 정리해 조직의 데이터 품질 활동 방향성을 정립해야 한다.
◇현업 관점에서 데이터 흐름 파악해야=국내 모 금융기관은 2005년부터 2007년까지 고객 데이터의 품질 개선을 위해 17번의 캠페인 및 프로세스 개선, 오류 데이터의 정비 작업을 수행했다. 하지만 데이터 품질은 별로 개선되지 않았다. 그 이유는 데이터의 주인 즉, 오너십을 정확하게 정의하지 못했기 때문이다.
이슈가 되는 데이터를 누가 책임지고 관리할 것인지는 예전부터 계속 논의되는 핵심 이슈다. 이 밖에 데이터가 어디서부터 잘못됐으며 그 영향도가 어디까지인지 추적할 수 있는 데이터 흐름 관리 기능 구현도 이슈로 떠오르고 있다. 데이터 오너십을 현업부서와 IT부서로 양분하는 접근법을 그동안 사용해왔지만 최근에는 데이터 정의, 데이터 입력, 데이터 사용 관점에서 역할에 따른 오너십을 부여하려는 논의가 이루어지고 있다.
데이터 정의(data defining)란 데이터의 정의(형식과 규칙), 정보의 확정을 담당하는 역할이며, 데이터 입력(data producing)은 정의에 따라 유효한 정보를 입력하고 정보를 운영하는 역할이다. 데이터 이용(data using)은 정보를 사용하고, 제시한 데이터 요건에 대한 수렴을 요청하고 조치 결과를 요구하는 역할이다.
데이터를 정의하고, 입력한다면 정의 및 입력자(DP:Data Defining & Data Prodcuing), 데이터를 정의하면서 이용한다면 정의 및 이용자(DU:Data Defining &Data Using) 등 다양한 형태로 오너십을 생성하게 된다. 이러한 오너십은 최근 떠오르는 다차원 오너십으로 연결된다. 정의, 입력, 이용의 분류는 최근 일부 금융기관에 적용되기 시작했으며 향후 데이터 오너십 부여 문제 해결의 단초를 제공할 것으로 판단된다.
입력, 정의, 이용에 따른 데이터 오너십 분류가 제대로 작동하기 위해서는 데이터가 생성·변환·삭제되는 데이터 흐름의 시스템화가 필요하다. 그러나 최근까지 데이터 흐름은 IT 관점에서만 관리되고 있는 것이 사실이다. 데이터 흐름의 물리적 형태는 일대일, 일대다, 다대일, 다대다 등 매우 다양하다. 따라서 IT 관점의 데이터 흐름을 완벽하게 파악할 수 없다.
이러한 문제를 해결하기 위해서는 현업 관점에서 데이터의 생성 및 시스템 단위의 흐름을 파악할 수 있어야 한다. 예를 들어 실명번호의 데이터 이슈가 발생했을 때 필요한 정보는 어느 화면에서 입력되는지, 입력된 실명번호는 어떻게 변환 가공되어 최종 사용자에게 도착하는지 등의 정보가 중요하다. 테이블 몇 컬럼별로 누가 관리하고 유지하는지를 파악하는 기존 방식은 데이터 품질 문제를 해결하는 데 한계가 있다.
데이터 오너십과 데이터 흐름에서 완벽한 해답은 현실적으로 존재하지 않는다. 다만, 투입되는 자원과 비용에 비례해 좀 더 상세하고 정교화된 형태로 관리하는 것을 목표로 삼아야 한다. iljung@2e.co.kr
◆ 정일 투이컨설팅 이사는
정일 투이컨설팅 이사는 한국과학기술원 경영정책 석사. 동양그룹 중앙연구소와 올랩컨설팅을 거쳐 2000년부터 투이컨설팅에서 근무하고 있다. 한미은행 EDW 리모델링, 중소기업은행 통합 마케팅시스템(고객정보DW) 구축, SK그룹 DBM 프로젝트, 우리은행 CRMS 구축 모델링 및 ETT, 교보생명 가치혁신(EDW 부문) 등 다수의 프로젝트를 수행했다. DW, ETT, 은행업무, 모델링 분야 전문가다.