[CIO Biz+/핫이슈]DB 품질, 데이터 자산 관리의 첫걸음

#지난 2009년 시스템의 정보 배분에 문제가 생기면서 코스피200 지수에 엄청난 오류가 발생했다. 장 개시 직후부터 10시 30분까지 코스피200 구성종목인 LG화학 시가총액이 잘 못 적용돼 코스피200 지수가 잘못 산출된 것이다. 이는 LG화학과 LG하우시스로 분할 상장된 LG화학의 시가총액의 착오 때문이었다.

#한 은행에서 88만건의 대출 금액이 3일간 0원으로 기록되는 오류가 발생했다. 대출을 받은 고객의 신용등급이 상승하고 신용카드나 대출을 받지 못할 사람들이 혜택을 보게 됐다. 반면 대출 불가능한 사람에게 자금을 집행한 은행은 위험을 감수해야 했다.

#미국 연방수사국(FBI)이 관리한 테러용의자 리스트에 오류가 많은 것으로 나타났다. 법무부 조사 결과, 잘못된 명단은 2만4000여명에 달한다. 확보한 자료 중 35%가 잘못 기재된 셈이다. 9·11 테러 사건 후 FBI가 테러리스트로 지목해 관리한 인물 중 6세 영유아도 포함돼 있다.

이 사례들은 모두 데이터 품질관리가 이뤄지지 않았기 때문에 발생했다. `데이터 품질관리의 경제적 효과 분석 연구` 결과에 따르면 한 해 평균 데이터 오류는 6500만건이고 저품질 데이터로 인한 국가·사회적 피해 비용은 47조원 규모에 이른다.

최근 모바일 서비스의 속도 향상으로 빅 데이터가 등장하면서 정보시스템으로 처리해야 할 업무가 보다 복잡해지고 다양해졌다. 시스템 간 통합과 연계 중요성도 강조된다. 시스템 통합과 연계로 업무 복잡성과 다양성이 증가돼 전산 담당자는 데이터 품질을 유지하기 위해 관리를 고민하기 시작했다. 정보시스템이 아무리 잘 운영된다 해도 데이터 품질에 문제가 있으면 데이터 오류로 잘못된 정책이 수립될 가능성이 많기 때문이다.

◇성숙모형에 따른 데이터 품질관리=사용자가 요구하는 기대수준을 만족시키기 위해 지속적이고 체계적인 데이터 관리가 핵심 이슈로 떠오르고 있다.

데이터 품질관리 성숙모형은 △데이터 품질 기준 △데이터 품질관리 프로세스 △데이터 품질관리 성숙 수준을 기본 축으로 한다. 데이터 품질 기준은 데이터 품질의 다양한 측면을 분류하고 정리해 정확성·일관성·유용성·적시성·접근성·보안성 6개로 정의한다.

데이터 품질관리 프로세스는 6개의 품질 기준을 향상시키기 위해 필요하거나 품질 기준에 영향을 주는 프로세스를 식별해 여덟 가지로 도출한다. 요구사항 관리, 데이터 구조 관리, 데이터 흐름 관리, 데이터베이스 관리, 데이터 활용 관리, 데이터 표준 관리, 데이터 소유권 관리, 사용자 뷰 관리를 포함한다.

8개 프로세스는 6개의 품질 기준과 연관 관계에 따라 상호 연결돼 있다. 데이터 품질관리 성숙 수준은 조직의 데이터 품질관리 발전 단계를 고려해 도입·정형화·통합화·정량화·최적화 5단계로 구분한다.

6개의 품질 기준별로 데이터 품질관리 성숙 단계도 정의했다. 정확성, 일관성, 유용성, 접근성, 적시성, 보안성의 데이터 품질 기준별로 프로세스 품질관리 수준을 점검해, 5단계 성숙수준을 측정하는 것이다.

특정 품질 기준을 향상시키기 위해 어떤 프로세스를 개선해야 하는지, 특정 프로세스를 도입하면 가시적으로 어떤 데이터 품질 개선 효과를 얻을 수 있는지도 알 수 있다. 총체적인 데이터 품질 개선을 위해 6개 기준의 데이터 품질관리 성숙수준을 모두 충족시켜야 한다.

그러나 조직이 속한 환경이나 사용자 관심에 따라 더 중요한 기준이 존재할 수 있다. 데이터 품질관리 수준은 6개 기준별로 모두 점검할 수도 있고 이중 한 두 개 비중 있는 기준만을 측정할 수도 있다.

국내 공공과 민간 기업의 데이터 품질관리 성숙 수준은 아직은 낮은 단계다. 조사결과 평균 1.1레벨로 데이터 품질의 문제점과 필요성을 인지하고 부분적인 데이터 품질활동을 시행하는 단계다.

◇DB진흥원, DB품질인증 제도 시행=한국데이터베이스진흥원은 데이터 품질관리 성숙모형을 기반으로 데이터베이스 품질인증 제도를 시행한다. 정보시스템의 데이터 품질을 확보하기 위해 데이터 자체 품질과 데이터 관리체계 품질, 데이터베이스 보안 체계를 심사·인증하는 제도다.

DB품질인증제도는 △데이터 인증 △데이터 보안 인증 △데이터 관리 인증으로 나눠진다. 데이터 인증은 데이터 자체의 품질을 심사해 인증한다. 데이터 보안 인증은 접근제어, 암호화, 취약점분석, 작업결재 등 데이터베이스 보안 기술요소 전반을 심사한다. 데이터 관리인증은 해당 시스템을 운영 관리하는 조직의 데이터 관리체계 품질을 심사, 인증한다.

데이터 인증은 실버·골드·플래티넘 3개 등급이 있다. 정합 비율에 따라 등급을 부여한다. 데이터 보안 인증은 접근제어(1레벨), 암호화(2레벨), 작업결재(3레벨), 취약점분석(4레벨)의 레벨을 부여한다. 데이터 관리 인증은 도입(1레벨), 정형화(2레벨), 통합화(3레벨), 정량화(4레벨), 최적화(5레벨)의 레벨이 있다. 인증 기간은 데이터 인증과 데이터 보안 인증은 1년이고 데이터 관리 인증은 3년이다. 제도 시행 후 지금까지 24개 시스템에 대해 심사와 인증이 이뤄졌다.

신혜권기자 hkshin@etnews.com