빅데이터 분석 효과 높이려면 '숫자' 말고 '이렇게' 보여줘야

이지은 수석 28일 '사례로 보는 빅데이터 열전 2014'에서 방법론 발표

빅데이터 분석 효과 높이려면 '숫자' 말고 '이렇게' 보여줘야

빅데이터 분석 결과물을 효과적으로 알리기 위해서는 숫자 대신에 그림으로 보여주는 `시각화(visualization)를 적절하게 활용해야 한다는 기업 수요가 늘고 있다.

이지은 투이컨설팅 수석은 "시각화는 빠르고 싶고 정확한 데이터 분석 과정을 지원해주는 최고의 방법"이라며 "기업이나 공공기관 등 여러 사용기업에서 빅데이터를 숫자로 말고 그림으로 보여달라는 요구가 높아지고 있다"고 말했다.

이지은 수석은 시각화의 중요성과 관련해, 1954년도 영국에서 일어난 콜레라 질병 사건을 그 사례로 들었다. 당시 500명 이상이 사망했다. 콜레라를 이길 수 있는 백신이 발견되기 30년 전이니 당연히 더 늘어날 확률이 높았다. 이 문제를 해결한 것이 바로 시각화. 500명이란 사망자 숫자만 놓고 보면 의미가 없지만 어디에서 사망했는지를 지도에 그림으로 그려봤더니 새로운 사실을 알게 됐다. 공동으로 사용하는 물에서 문제가 있었던 것이다. 500이라는 숫자만 놓고 보면 답이 안 나오지만 그림을 그려보면 해결책이 나온다는 것.

이 수석은 "데이터를 시각화하는 것이 필요하다"며 시각화의 종류를 알고 거기에 맞도록 그림으로 보여주는 것이 필요하다"고 말했다.

또 다른 사례로 든 것은 `삼천이십이만천오백삼십이 제곱킬로미터 (30,221,532 km)`라는 숫자. 도대체 무엇을 의미하는 것인지 알 수가 없다. 답은 아프리카 대륙의 크기다. 이렇게만 놓고 보면 얼마나 큰 것인지, 작은 것인지를 알 수 없다. 그러나 그림으로 본다고 하면 아시아, 미국 등 주요 18개 국가를 합친 것과 동일한 크기라는 사실에 놀랄 수 밖에 없다는 것이 이 수석의 설명이다.

이 수석은 이 사례에서 `비교`의 중요성을 든다. 바로 분석의 시작은 비교라는 것. 분석을 하기 위해서는 질문을 잘 만들어야 하는데, `어떤 데이터를 비교할 것인지? 데이터를 어떻게 볼 것인지, 분석을 위해 어떤 질문을 할 것인지` 등에 관해 사전에 준비해야 한다고 강조한다.

이 수석이 또 마지막으로 제시한 사례는 대한민국 치킨집 수다. `2만 9095개` 라는 숫자가 주는 것은 `많다, 적다`를 논하기가 쉽지 않다. 이를 점포간 전국 평균반경, 지역별 반경 등 분석 시각화를 통해 보면 쉽게 이해 가능하다.

이 수석은 "분석에 필요한 질문이 무엇인지를 미리 잘 검토하고, 이를 통해 나온 결과를 시각화하게 되면 좀 더 분석도 용이해지고 이해도를 높일 수 있다"고 말했다.

한편 이지은 수석은 오는 8월 28일 `사례로 보는 빅데이터 열전 2014` 세미나에서 빅데이터를 효율적으로 보여줄 수 있는 시각화 방법론에 대해 집중적으로 발표할 예정이다. 멜론, SK텔레콤, 서울대병원, 독일 축구 대표팀 등의 다양한 빅데이터 활용사례와 시각화 방법론에 대해 소개되는 이번 컨퍼런스 정보와 문의는 웹사이트 conference.etnews.com/bigdata 와 conf@etnews.com으로 가능하다.

온라인뉴스팀