정보기술(IT) 발달과 융합으로 사물인터넷(IoT), 클라우드컴퓨팅이 우리 실생활에서 활용되고, 모바일 네트워크 정착으로 수많은 데이터가 생성되면서 더욱 많고 풍부해진 데이터를 실시간으로 얻어서 활용하는 빅데이터 시대가 됐다. 빅데이터를 기업의 마케팅활동에 도입해 고객만족도 제고, 매출 확대 등 의사결정 과정에서 활용하거나, 국가정책 입안 과정에서 정책의사결정 근거로 활용하는 사례들이 속속 발표되고 있는데, 이를 통해서 개인의 삶, 기업 경영, 국가 정책 제고 측면에서 데이터 활용 범위와 가치를 다시 인식하는 계기가 되고 있다.
빅데이터는 사용 가능한 데이터를 파악해 패턴을 분석하고, 다양한 분석기법을 통해서 인사이트를 발견하고, 실무자에서부터 경영진까지 의사결정 과정에 활용하게 된다. 그동안 빅데이터와 관련해 데이터 전처리·데이터 활용을 위한 데이터처리·분석모형 구축·데이터셋 생성·데이터 시각화 등 일련의 분석과정에 필요한 기술과 기능적인 요건에 더욱 관심을 두고 왔었다는 것은 주지의 사실이다. 다시 말하면, 데이터를 어떻게 분석하고 활용하는지 고민보다는 데이터 저장·관리 도구, 데이터 분석도구, 데이터 시각화(Visualization) 도구, 보고서 도구가 어떤 SW와 HW로 구성되는지가 주된 관심사였다. 그 중에서도 빅데이터 분석과 분석결과의 시각화는 기존 방식에서 크게 다른 점이 없어서 통계분석 기법을 활용해서 데이터 분석을 수행하고, 분석된 결과는 그래프 또는 표로 표현하고, 선택적으로 지도에 데이터를 단순 표시하는 형태가 대부분이었다.
기존 데이터 분석 및 시각화 방식으로는 과거보다 더 크고 많은 데이터를 좀 더 쉽게 처리하는 것과 다를 바가 없는데 최근에는 공간정보를 빅데이터에 결합한 공간 빅데이터를 구축해 공간분석을 빅데이터에 접목하는 방법이 시도되고 있다.
공간정보는 지도를 기반으로 표현되는 도형정보와 지질, 토지이용, 도로속성, 각종 시설물(수도, 가스, 전기 등), 교통망 등 속성정보를 포함하고 있어 세상에 존재하는 ‘모든 사물’과 ‘인터넷’을 연결하는 가상공간을 제공한다.
이로써 빅데이터 분석영역에서 기존 통계적 접근방식인 표나 그래프보다 직관적이고 활용가치가 높은 데이터 분석 및 활용방안을 제공해 준다. 공간분석을 통해서 데이터에 공간이라는 차원을 부여하면 단순히 데이터와 데이터 간 상관분석 기법으로는 발견할 수 없었던 새로운 통찰이 가능하게 돼 보다 유의미한 분석결과를 도출해내고 활용할 수 있게 된다.
즉, 기존 빅데이터 분석방식에 버퍼링, 인접분석, Spatial Join 등 다양한 공간분석 기법을 도입, 시간적 흐름을 공간적인 분석방법에 대입해 숨어 있던 데이터의 진실에 다가가서 문제해결 방법을 찾는 계기를 제공할 수 있다. 이러한 사례는 서울시 빅데이터 분석과제에서도 찾아볼 수 있다.
2014년 서울형 빅데이터 공유·활용 플랫폼 구축 사업에서는 서울시 택시정보시스템에서 수집하고 있는 IDTG(Integrated Digital Tachograph, 통합형 디지털운행기록계) 데이터를 공간에 매핑한 후 가공해 생성된 택시 운행정보(승차·하차·승차운행·공차정지 등 상태 정보, 운행거리, 운행시간, 하차위치 등)를 요일별·시간대별·날씨별로 분석해 빈 택시가 많은 곳(지점)을 도출했고 그 결과를 2014년 12월 서울시 열린데이터 광장에 개방해 현재 시범서비스를 운영 중이다. 그 분석과정을 살펴보면, 1300억건의 서울시 택시 운행정보를 150m 단위로 균등 분할된 표준 노드링크(도로 선형정보에 좌회전·우회전·유턴 등의 회전정보와 도로폭·차로 수·도로명 등의 속성정보를 매핑한 공간정보, 국가교통정보센터 관리)에 매핑해 분석함으로써 택시 승차장 후보지와 빈 택시가 많은 곳을 예측할 수 있었다. 또 급정거·급출발·급감속 등의 위험운전 행동 데이터를 공간에 매핑해 교통사고 핫 스폿(공간적 사건들의 분포가 특히 집중된 지역)을 판별, 교통사고 취약지점의 사고원인을 파악하는 한편, 이면도로 음주운전 교통사고 다발지점, 어린이 보행자 교통사고 다발지점, 노인 교통사고 다발지점 등을 일선 경찰서와 초등학교 등에 제공할 수 있게 돼 교통사고 방지대책 수립에 객관적이고 명확한 근거로 활용할 수 있게 됐다. 여기서 서울시는 명확한 분석목적에 따라 빅데이터 플랫폼을 구축하고, 생활 밀착형 교통정보를 빅데이터와 공간분석 기법을 적용해 정책 자료를 확보함으로써 다양한 이해관계자들과 의견을 조율하고, 서울시 정책에 실제로 다양하게 활용하고 있다는 점에서 큰 의의가 있다고 할 것이다.
향후 정보기술 환경은 더욱 다양한 측면으로 분화되고 발전될 것이며 그 중에서도 실세계 모든 사물이 인터넷으로 연결돼 서로 정보를 공유하는 사물인터넷(IoT) 보급과 확산으로 다양한 디지털 정보가 생산될 것으로 기대하고 있다. 사물인터넷 시대에서 데이터 증가는 상상을 초월하는 속도로 가속화되어, 어떤 데이터를 수집하고 저장하고 즉각적으로 분석할 것인지는 가장 먼저 처리해야 해결해야 할 과제기도 하다. 또 공간정보 특성을 더 강한 사물인터넷 기반 빅데이터를 더욱 가치 있게 활용하기 위해서는 GIS가 접목된 빅데이터 기술 확대는 물론이고 빅데이터 분석에 공간분석을 적극 활용하는 노력이 우리가 선택할 수 있는 최적의 전략이 될 것이다.
김학성 웨이버스 대표이사 hskim@wavus.co.kr