"빅데이터 인프라 도입보다 `분석 역량` 먼저 갖춰야"

이정윤 박사(미 오페라솔루션 글로벌 R&D 연구원).
이정윤 박사(미 오페라솔루션 글로벌 R&D 연구원).

“많은 기업이 하둡 기반 빅데이터 처리 인프라를 앞다퉈 준비하고 있지만 축적된 데이터를 어떻게 활용해야 할지는 잘 모르고 있는 실정입니다. 빅데이터 분석에서 가장 중요한 것은 `빅데이터`가 아니라 `분석`입니다.”

21일 대한상공회의소에서 개최된 `R을 활용한 빅데이터 분석` 세미나에서 빅데이터 분석 전문업체인 미국 오페라솔루션의 글로벌R&D연구원인 이정윤 박사는 “기업이 막대한 비용을 들여 인프라를 갖추기 전에 분석 역량부터 갖춰야 한다”고 강조했다.

그는 “많은 기업이 빅데이터 수집 및 분석에 용이한 하둡 기반 인프라를 갖춰놓고는 다음 단계에서 무엇을 어떻게 해야 할지 고민스러워하는 사례가 많다”면서 “인프라를 갖추기 전에 어떤 분석으로 어떤 가치를 찾아낼 것인지 검토가 먼저 이뤄져야 최적의 성과를 낼 수 있다”고 설명했다.

그는 국내 기업을 위해 빅데이터 분석 시 고려해야 할 사항 세 가지를 제시했다. 우선 `빅데이터`가 `많은 수익(big profit)`을 의미하지는 않는다고 강조했다. 예를 들면 페이스북은 구글보다 10배 많은 데이터를 가지고 있지만 수익은 구글보다 훨씬 뒤처져 있다. 빅데이터 분석을 수익으로 연결짓는 것은 성급한 판단이라는 게 이 박사의 주장이다.

두 번째로는 빅데이터 플랫폼 도입 시 투자대비성과(ROI) 분석을 필수적으로 해야 한다. 야후는 하둡 기술을 선도적으로 도입해 내부 전체 서비스에 적용했다. 많은 개발 인력을 충원해 하둡 기반으로 클러스터 시스템 환경을 구현했다. 하지만 ROI 분석에서 동일한 데이터 처리 및 분석 작업에 무려 50배 이상 돈이 더 낭비된 것으로 나타나 오히려 더 큰 손실을 봤다.

마지막으로 그는 데이터 이해 즉, 분석 역량이 무엇보다 중요하다고 강조했다.

이 박사는 “빅데이터의 처리는 중요한 과정일 뿐 데이터 처리를 아무리 빨리 할 수 있다고 하더라도 `분석`으로 적절한 의사결정을 내리는 과정이 뒷받침되지 못하면 무용지물”이라면서 “분석에 대한 통찰력 없이 접근했다가는 빅데이터는 오히려 `양날의 검`이 될 수 있다”고 지적했다.

성현희기자 sunghh@etnews.com