[스마트 강국 DB품질에 달렸다] 2회 데이터 품질 경쟁력 시대

일본 후지쯔 데이터센터 모습
일본 후지쯔 데이터센터 모습

국토부는 최근 전국 3733만필지 토지 · 임야대장과 707만동에 대한 건축물 대장 자료를 전수 수집해 부동산 등기부와 비교 분석했다. 그 결과 토지 · 임야대장의 자체 오류가 약 560만건에 달했다. 토지 · 임야대장이 1910년 일제시대 수기로 작성돼 기재사항 누락 등 각종 오류가 지금까지 전수됐기 때문이다. 국민들은 토지 · 임야대장과 부동산 등기부 간 정보가 일치하지 않아 부동산 거래 시 엄청난 불편을 감수해야 했다.

국가 공공 데이터베이스(DB) 중 하나의 데이터만 잘 못 돼도 사회적으로 엄청난 파장을 일으킨다는 것을 그대로 보여주는 사례다.

스마트폰 확산으로 언제 어디서나 정보에 접근할 수 있게 되면서 공공기관은 물론 기업 등이 저장한 데이터의 품질이 경쟁력을 좌우하는 시대가 됐다.

◇저질 데이터는 국가적 비용 낭비의 원인=국토부의 토지 임야 대장 정비 사업 등에 들어가는 비용은 얼마나 될까. 잘 못된 수치나 내용이 틀린 이른바 `저 품질 데이터`로 한해 46조9000억원에 달하는 막대한 국가적 비용이 낭비되고 있다. 한국DB진흥원 부설 데이터품질관리인증센터의 `데이터품질관리의 경제적 효과 분석 연구` 결과 한해 평균 데이터 오류는 6500만 건이었으며 민간 기업 평균은 430억 건에 달했다.

지난해 공공기관의 공공 정보화 예산 3조억원 중 데이터 품질관리에 들어간 비용은 14.48%인 4549억원 가량이었다. 3만500개 민간 기업의 지난해 평균 정보화 비용 중 12.29%인 46조5309억원이 저질 데이터로 인한 피해를 복구하는데 쓰였다. 이 결과를 합산하면 총 46조 9859억원에 달했다.

박주석 경희대 교수는 “데이터 품질관리에 따른 경제적 효과는 우리나라의 거시 경제는 물론 미시적 관점에서 실질 경제에 엄청난 파급 효과를 가져다 줄 수 있다”고 말했다.

◇왜 데이터 품질 관리가 안 되나=데이터 품질의 중요성은 강조되고 있지만 데이터 품질 관리를 하고 있는 공공기관이나 기업의 수준은 아직도 걸음마 단계다.

데이터 품질과 관련된 사고는 우선 문제점이 쉽게 노출되지 않는다. 이 때문에 중요성에 대한 공감대 형성이 어렵다. 데이터 품질에 관심을 갖는 주된 이유는 데이터에 대한 가치를 인식했을 때이다. 오류 데이터로 인한 피해를 입고서야 품질관리에 나서게 된다.

조성봉 대한주택보증 본부장은 “IT부문에 대한 많은 투자에도 현업 직원들은 실적보고, 대외 자료요청 등 많은 보고서를 작성하면서 자료 불일치로 인한 반복적인 수작업이 발생했다”며 “ 이를 지원키 위한 IT부문의 고충도 커졌다”고 말했다.

특히, 공공기관을 비롯해 기업 내부 담당자들은 자신들이 보유한 데이터의 품질 수준을 매우 불안해하고 있다. 데이터 품질에 대해 당장은 문제가 발생하지 않지만 향후 어떤 문제가 발생할지 장담할 수 없다는 것이다. 최근 공유되고 있는 상당수 데이터가 품질에 대한 잠재적인 위험성을 내포하고 있다. 공공기관 담당자들은 최근 공공 데이터 활용이 급증하면서 데이터 오류에 대한 불안감을 호소하고 있다.

김선호 명지대 교수는 “서울시나 경기도를 비롯해 각 공공기관에 데이터를 공개하라고 하면 다들 품질 문제 때문에 꺼려한다”며 “각 공공기관에 저장된 데이터를 효과적으로 이용하려면 데이터 품질에 대한 법규나 지침을 마련하고 품질 향상 활동을 위한 기간을 줘야 한다”고 말했다.

◇데이터 관리 체계 수립 절실=아무리 좋은 시스템을 구축했더라도 그 안에서 운영하는 데이터가 엉터리이면 아무런 의미가 없다. 전문가들은 데이터에 대한 체계적인 관리체계를 수립하고 운영하지 않으면 근본적인 데이터 품질 향상을 기대할 수 없다고 입을 모은다.

데이터 관리 체계란 조직의 데이터의 정확성과 일관성을 일정한 프로세스에 맞춰 실행하는 것이다. 데이터의 유효성과 데이터의 유용성, 적시성 및 보안성 등을 체계적으로 관리하는 것이다.

교육과학기술부의 국가 R&D 관련 중요 정보 유통을 책임지고 있는 손강렬 한국과학기술정보연구원 정보유통본부 NTIS사업단 박사는 “국가 R&D 지식 포털인 NTIS 담당자 수준에서 품질 관리 활동을 수행했지만 체계화된 시스템이 없어 데이터 구조와 표준, 흐름의 일관성, 변경이력 추적 등 미흡한 사항이 많이 발생했다”며 “이로 인해 신규 서비스 개발과 기존 서비스들의 연관관계를 파악하고 서비스를 고도화하는 게 어려워 많은 노력과 시간을 소비했다”고 설명했다.

손 박사는 “이러한 문제점을 해결하고 NTIS 서비스의 고도화와 데이터 품질을 향상을 위해 데이터 품질관리 체계를 도입했다”며 “NTIS에 맞는 품질관리 체계를 재정립해 지속적으로 품질관리 활동을 하고, 성숙수준을 향상시켜 나갈 수 있도록 했다”고 덧붙였다.

이해석 데이터품질관리포럼 회장은 “한국데이터베이스진흥원 자료에 따르면 금융기업의 데이터 품질관리 성숙수준은 1.3 레벨로 타 산업에 비해서는 높지만, IT 투자비용을 고려할 때 결코 높은 수준이라 할 수 없다”며 “특히 은행권은 바젤II 승인 요건에 데이터 품질관리가 포함돼있지만 문서 위주로만 진행해 금융감독원 등에 지속적인 금융 데이터 품질 정책을 요구해야 한다”고 조언했다.

김인순기자 insoon@etnews.co.kr