[기고]4차 산업혁명 자양분 '데이터', 이대로 방치할 것인가

추리소설 '셜록 홈스'를 집필한 작가 아서 코넌 도일은 말했다. “데이터를 갖기 전에 이론을 세우는 것은 커다란 실수다.”

[기고]4차 산업혁명 자양분 '데이터', 이대로 방치할 것인가

19세기 말에 태어나 20세기 초까지 활동한 도일은 이미 데이터의 중요성을 잘 알고 있었다. 그가 말한 데이터는 현대 사회에서 이야기하는 데이터 개념과 조금 다를 수도 있다. 그러나 '데이터에 기반을 둔 의사결정이 중요하다'는 맥락에서 보면 같다.

데이터의 중요성은 4차 산업혁명 시대가 도래하면서 더욱 커진다. 인공지능(AI), 사물인터넷(IoT), 증강현실(AR), 가상현실(VR), 자율주행자동차 등을 구현하기 위해 24시간, 365일 막대한 양의 데이터가 생성된다. 온라인에서도 마찬가지다.

유튜브에는 매분 400시간 분량의 동영상이 올라오고, 구글에는 360만건 이상의 검색이 이뤄진다. 인스타그램에는 매일 6700만장 이상의 이미지가 새로 등록된다. 그야말로 세상이 데이터로 넘친다.

이 가운데 데이터 양은 더욱 빠르게 급증한다. 시장조사 업체 IDC에 따르면 세계 데이터 양은 매년 30% 증가, 2025년에는 현재보다 10배 늘어난 163제타바이트(ZB)에 이른다.

1ZB는 1조1000억기가바이터(GB)로, 고화질 영화(2GB) 약 5000억편에 해당되는 양이다. 특이할 점은 과거에는 데이터 대부분을 소비자가 생산하던 것에 비해 2025년에는 전체 데이터의 약 60%가 기업에 의해 생성된다는 점이다.

데이터가 4차 산업혁명 시대에 우위를 점하는 자양분으로 떠오르면서 정부기관과 기업은 더 많은 데이터 확보에 나선다.

'데이터는 곧 자산'이라는 말이 낯설지 않은 이유다. 그러나 데이터가 많다고 해서 더 나은 결과를 이뤄 내는 것은 아니다. 데이터 양이 질을 보장하지는 않을 뿐만 아니라 데이터를 쌓아 둔 채 제대로 활용하지 못하는 경우도 많기 때문이다.

데이터의 질을 보장하기 위해서는 어떻게 해야 할까. 무엇보다 중요한 것은 '살아 있는 데이터'를 확보하는 것이다. 데이터가 아무리 많다 하더라도 시의성이 떨어지고 부정확해 유효성을 보장할 수 없다면 분석해서 얻은 내용은 살아 있지 않은, 즉 활용이 불가능한 '죽은 결과물'이다.

살아 있는 데이터 확보만큼이나 분석과 활용 역시 중요하다. 데이터 자체로는 가치를 발휘할 수 없다. 정제하고 분석하는 과정에서 유의미한 정보로 변환한다. 이 정보는 활용이 돼야만 그 가치를 실현한다.

예를 들어 홍수 피해가 잦은 지역에서 수해를 최소화하는 방법을 찾고 있다고 가정해보자. 무작정 지역 내 모든 농지와 주택, 시설물들을 관리할 수 없으므로 우선순위를 파악해야 한다.

먼저 강수량, 수해 취약 구간, 재건축 공사 현장 등 최신 데이터를 디지털화해서 웹 서비스로 모은다. 디지털 지도 위에 표출, 수해 위험도가 큰 곳을 분석한다.

한 발 나아가 지리정보시스템(GIS) 소프트웨어(SW)를 통해 정보를 한눈에 파악하도록 시각화 한다. 이를 기반으로 수해를 예방하고 의사결정자와 시민 간에 정보를 실시간 공유하면 피해 최소화에 큰 도움이 된다.

데이터가 기름이 되는 4차 산업혁명 시대에는 일반 소비자와 정부, 기업에서 어떻게 데이터를 생성 및 관리하고 분석·활용하는지가 성패를 가른다. 보유한 데이터를 어떻게 분석·활용하는지 되돌아보는 것은 주도권 경쟁에서 뒤처지지 않기 위해 더 이상 미룰 수 없는 시급한 과제다.

리차드 윤 한국에스리 사장 ryoon@esrikr.com