데이터품질관리 활성화를 위한 좌담회

국내 기업의 데이터  품질 개선 및 품질 관리 확산을 위한 ‘데이터 품질관리 활성화를 위한 전문가 좌담회’가 한국데이터베이스진흥센터와 전자신문사 공동 주최로 6일 서울 소공동 롯데호텔에서 열렸다.
국내 기업의 데이터 품질 개선 및 품질 관리 확산을 위한 ‘데이터 품질관리 활성화를 위한 전문가 좌담회’가 한국데이터베이스진흥센터와 전자신문사 공동 주최로 6일 서울 소공동 롯데호텔에서 열렸다.

정부와 업계가 소유한 데이터 전반에 대한 체계적이고 장기적 정비가 이뤄져야 한다는 목소리가 높다. 데이터품질이 확보되지 않으면 전산시스템 활용 위축은 물론 조직의 생존이 위협받는 결과가 초래되기 때문이다.

 전자신문은 한국데이터베이스진흥센터와 공동으로 지난 6일 서울 소공동 롯데호텔에서 ‘데이터 품질관리 활성화를 위한 전문가 좌담회’를 개최했다. 국내 기관과 기업의 데이터 품질 관리 현황을 짚어보고 데이터 품질 개선 방안을 모색하기 위해 마련된 이 자리에서 전문가들은 90분간 열띤 토론을 벌였다. 이들은 또 데이터 품질 확보를 위한 정부차원의 대책마련도 촉구했다.

◆참석자

-김인현 사장(투이컨설팅)

-서재화 부행장(기업은행 IT본부장)

-우정민 상무(KTF 정보서비스부문 IT개발실장)

-이상구 교수(서울대학교 컴퓨터공학부)

-이해석 상무(교보생명 정보시스템실)

-조일순 이사(LG카드 정보기술실장)

-주정용 상무(우리금융정보시스템 솔루션1본부장)

※사회: 박승정 팀장(전자신문 편집국 솔루션팀) 

(가나다순)

 ◇사회(박승정 팀장·전자신문 편집국 솔루션팀)=최근 정보시스템의 연계와 통합이 당면 과제로 등장하면서 데이터품질이 이슈가 되고 있다. 먼저 데이터 품질의 중요성과 그 이유를 짚어보자.

 ◇김인현(투이컨설팅 사장)=문제의 하나는 오랜 기간 동안 데이터가 쌓여 데이터의 양이 많아졌다는 것이다. 또 데이터 가운데 원하는 데이터가 많지 않아 데이터의 활용률이 높지 않다는 것이다. 여기에 보유한 데이터에 대한 유지비용이 발생하는데 이를 효과적으로 활용할 수 있는 방안이 확실치 않다.

 ◇서재화(기업은행 부행장)=은행에서 보는 데이터는 크게 두 가지다. 이 가운데 금전관계에 물려있는 데이터는 100% 정확하다. 문제는 금전 외의 데이터로 소홀하게 다뤄지는 게 현실이다. 데이터가 정확치 않아 고객관계관리(CRM)을 통한 결과를 얻은 것 역시 정확하지 않다. 때문에 은행에서 CRM구축은 잘하지만 운용은 안 된다는 평가를 받기도 한다.

 ◇주정용(우리금융정보시스템 상무)=데이터의 중요성은 마케팅에서 드러난다. 요즘은 데이터 분석을 통한 정보를 토대로 마케팅 타깃을 정한다. 고객정보도 과거와 달리 소득, 자녀수, 학교 등 구체적 정보가 조사된다. 과거에는 없었던 이런 데이터로 인해 데이터 품질관리의 필요성은 한층 커졌다.

 ◇사회=데이터 품질 이슈 대두 배경과 중요성을 들어봤다. 데이터 오류에 따른 피해와 정확한 데이터 확보의 어려움도 있을 것이다.

 ◇조일순(LG카드 이사)=카드업종은 카드를 발급할 때 신청서를 내고 간단한 재직증명을 확인하면 카드가 발급된다. 한 달에 10만건의 신규가 발급되는데 각 고객의 현금서비스 한도를 판단할 때 사람이 판단할 수 없다. 또 다양한 상품이나 개발이 쏟아지는데 이를 상품개발팀에서 고민해서 판단할 사항이 아니다. 때문에 카드회사는 데이터를 기반으로 신제품 개발이나 경영계획을 세울 수밖에 없다. 곧 회사의 생존이 걸린 문제다.

 ◇서재화=은행은 카드사와 같은 양질의 정보도 없다. 카드사에서는 카드사용 내역이라든가 DM등이 수시로 가는데 은행은 대부분의 정보를 숨기는 경향이다. 때문에 방카슈랑스를 실시했을 때도 데이터소유를 두고 관련부서 간 대립구도가 벌어졌다. 정보를 어느 쪽에서 갖느냐에 대한 논쟁이다. 은행에서 숫자데이터 말고 고객에 대한 직업이나 주소 등에 폭넓은 데이터를 확보하는 것이 이슈다.

 ◇우정민(KTF 상무)=통신도 다양한 정보를 가지고 있지 않다. 대리점을 통해 영업을 진행하는데 대리점에서 초기데이터를 충실하게 작성하지 않는다. 계좌번호, 주민번호는 정확하더라도 나머지 데이터는 내부에서도 신뢰를 하지 않는다. 또 이를 정제하려는 노력도 없었다. 최근에는 회사 내에서도 같은 데이터를 두고 다른 시각으로 분석하는 경우가 있는데 이것은 결국 데이터의 품질문제다. 이 부분을 어떻게 표준화해서 정리할지에 관심이 많다.

 ◇사회=데이터 품질의 중요성에 대해서는 누구나 공감한다. 그렇다면 데이터 품질관리는 어떻게 해야 하나.

 ◇이상구(서울대학교 교수)=표준화와 관련된 국제회의에 가보면 앞으로 중요한 것은 데이터 품질이라는 얘기가 나온다. ISO에서도 데이터 품질에 대한 중요성을 인정, ‘ISO 8000’ 제정을 준비중이다. 지난해 10월에 발의됐고 지난 10월에 첫 회의를 했다. 목표는 오는 2008년에 이를 제정하는 것이다. 글로벌 SW기업들은 모든 데이터의 기초가 되는 소위 ‘마스터 데이터’에 관심을 갖고 있다. 데이터관리에 우선순위가 있다면 고객, 상품, 유통 등에서 발생하는 마스터데이터를 먼저 관리해야 한다.

 ◇김인현=데이터를 한 곳에 모아 통합하면 품질이 좋아진다는 가정이 있다. 하지만 현실적으로 한곳에 모으는 것이 가능한가 하는 문제가 있다. 제조나 유통은 사업장이 전 세계에 펼쳐있다 보니 어렵다. 삼성전자도 이를 시도하려 했으나 수조원의 비용이 소요될 것이라는 분석이 있었다. 따라서 기본 데이터는 하나에서 공급하되 각 사업장은 별도의 응용 데이터를 관리할 수 있도록 해야 한다.

 ◇이해석(교보생명 상무)=IT가 가진 데이터는 전부 과거의 데이터인데 이를 통해서는 미래를 아는데 한계가 있다. 과거의 실적을 분석해서 이런 자료가 나왔다고 하면 최고경영층의 관심을 얻어내기 어렵다. 최고경영층에게는 미래예측이 가능한 추이정보를 제공하는 게 중요하다.

 ◇주정용=데이터 통합에 어려운 점 가운데 하나는 어느 안쪽 부서에서 안주면 어려움이 있다는 것이다. 때문에 각 조직에서 가진 정책이 명확히 수립돼야 하고 이를 뒷받침할 수 있는 툴과 관리방법이 구축돼야 한다. 또 관리에는 반드시 평가가 따라야 한다. 무엇보다 데이터의 생산이 잘 돼야 한다. 데이터가 생성한 뒤의 얘기를 하는데 데이터가 생성할 때 비즈니스에 맞게 입력돼야 한다.

 ◇우정민=제작년 후반부터 메타관리시스템 구축하고 착수했다. 각 시스템 레벨에서 관리하던 데이터를 모았고 항목 간 룰을 정의했다. 상당한 효과가 있을 것으로 기대한다.

 ◇서재화=기업은행도 메타데이타시스템을 도입 데이터를 어떻게 관리하겠다는 기준과 규정을 만들었다. 또 데이터 아키텍처 부분을 중점적으로 설계했다. 영업점도 이를 이용할 수 있도록 했다. 이것을 제대로 사용하고 이행하느냐를 은행 차원에서 경영전략팀에서 모니터링 한다. 데이터는 변화가 일어나고 변화를 수용하기 위해서는 만들고 해체할 수 있게 해야 한다. 여기에는 기본적으로 ‘마스터데이터’가 있어야 한다.

 ◇조일순=대부분 기업이 차세대 프로젝트 하는데 구축은 한번이고 운용은 7년이다. 때문에 우리는 구축과 유지보수를 두 가지로 본다. CBD, SOA 등으로 개발하는 것도 중요하지만 이를 관리하는 게 더 중요하다. LG카드는 자체적으로 데이터품질관리팀을 운영한다. 품질관리가 제대로 안하면 장애나 승인에 치명적인 영향을 준다. 경영정보팀에서 데이터품질관리 부서도 별도로 두고 있다.

 ◇사회=데이터 품질관리 체계 도입이 쉽지 않은 이유는 무엇인지 점검해 보자.

 ◇김인현=데이터 품질관리에 관한 논의 초기에는 데이터 질이냐 정보 질이냐에 대한 어휘 선택을 놓고 고민했다. 질이라는 것은 기대치와 실제 결과를 차이를 얘기하는 것이다. 데이터 품질은 기록, 분석, 예측, 시행하는 단계가 있다. 기록과 분석은 잘하는데 문제는 예측을 잘하고 더 나아가 실행을 하는 것이 중요하다. 이를 위해서는 데이터에 의한 혁신이 필요하다.

 ◇이상구=국내 데이터의 품질이 떨어지는 것은 ‘빨리빨리’의 문화에서 나온다. 정확하지 않은 것에 대한 문제의식이 결여된 상황에서 나온 결과다. 미국에는 ‘미국 정보품질법(Information Quality Act)’이라는 것이 있다. 이것은 정책입안이나 대외공표 데이터에 대한 질을 확보하라는 의회의 조례다. 2002년 10월 발효 미국 모든 부처가 이 조례에 따라 각 부처의 가이드라인을 만든다. 우리는 아직도 이런 것이 없다.

 ◇이해석=IT분야의 역량은 비즈니스 역량으로 결정된다. 메타데이터관리나 차세대시스템 등을 금융기관이 다 하는데 왜 데이터가 틀릴까 하는 문제가 제기된다. 이유는 여기에 대한 책임을 기존의 IT팀이 가지고 있기 때문이다. 따라서 데이터관리에 대한 책임을 현업으로 이관하는 작업을 하고 있다. 물론 이 책임을 현업으로 넘기느냐 하는 식의 불만도 있다.

 ◇사회=데이터 품질관리 확산을 위해 정부, 산업계, 학계의 역할이 필요한 때다. 품질관리 확산을 위한 역할은 무엇인가.

 ◇조일순=학계의 연구방향이 한쪽으로 쏠린다. SOA 하면 모두 SOA만 한다. 학계에서도 너무 시류를 따라가는 부분만 소개하지 말고 실제 기업이 당면한 문제를 다뤄달라. 또 정부에서는 공개된 정보만이라도 기업이 쉽게 이용할 수 있는 장치를 마련해야 한다.

 ◇이해석=보험회사를 본다면 회사는 고객에 대한 정보를 모르고 고객은 회사의 정보를 안다. 보험사기라는 것도 이 같은 문제에 원인이 있다. 또 기업들은 정부가 이미 가진 정보를 얻기 위해 막대한 비용을 소요한다. 정부가 가진 행정 의료정보를 기업에서 공유할 수 있도록 해달라.

 ◇우정민=데이터 문제가 한국의 독특한 문화에 기인한다. 한국 사람은 기록을 안남기고 싶어한다. 바로 데이터 부족현상으로 이어진다. 등기부등본, 보험, 의료 등에 대한 정보가 공유되면 거짓말 못하고 데이터 품질 업그레이드도 자연히 이뤄진다. 정보는 자산이기 때문에 이용한 만큼 이용료를 지불하면 된다. 엄선해서 공개하고 공유하자.

 ◇이상구=학계에서는 데이터 품질과 관련된 모델이나 비즈니스사례를 연구, 공론화할 필요가 있다. 잘못된 데이터에 대한 드러나지 않는 기회상실비용이나 평가모델척도, 데이터품질성숙도모델과 같은 것 등이다. 정부에서는 미국처럼 정부가 정확한 정보에 대한 사용을 솔선수범해주는 것이 필요하다. 아울러 정부가 IT프로젝트를 발주할 때 데이터 질을 높일 수 있는 예산을 같이 포함할 수 있는 분위기를 만들어야 한다.

 정리=윤대원기자@전자신문, yun1972@etnews.co.kr