“우리나라 빅데이터 분석은 여전히 단편적 분석에 매몰됐다. 파일럿 수준 프로젝트에서 벗어나 비즈니스 혁신을 위한 빅데이터 분석을 이어가야 한다.”
우리나라 데이터 구루(선구자)로 불리는 이화식 엔코아 대표는 국내 빅데이터 수준을 한 단계 도약해야 할 시기라고 강조했다.
그는 “그동안 소량 데이터만으로 맛보기 정도 파일럿 빅데이터 프로젝트가 난무했다”면서 “비즈니스 혁신이나 경쟁사와 차별화를 위한 빅데이터 분석, 프로젝트는 상대적으로 적었다”고 말했다. 이어 “파일럿에서 다음 단계로 넘어가려면 분석하고자 하는 '식재료(데이터)'부터 달라야 한다”면서 “식재료 종류부터 양, 범위가 아예 다르다”고 덧붙였다. 빅데이터 분석을 위한 대용량 데이터 수집이 전제돼야 함을 강조했다.
이미 일부 기업은 대량 데이터 확보를 위해 그룹사를 주축으로 데이터 통합 프로젝트를 진행한다. 이 대표는 “금융, 통신 등 대기업은 그룹사가 주축이 돼 기업 데이터를 통합, 연계하는 작업을 한다”면서 “데이터 규모 경제를 이루기 위해 기업이 먼저 내부 데이터를 모으는 단계이고 바람직한 방향”이라고 말했다.
대기업 외 중견·중소·스타트업이 데이터를 모으기 쉽지 않다. 이 대표는 양질 공공데이터 개방이 중요함을 지적했다.
그는 “국가에서 데이터를 그냥 잎사귀 정도로 던져주면 낙엽밖에 안 된다”면서 “데이터를 묶고 가공해서 기업이 바로 데이터를 활용하도록 양질 데이터 개방에 집중해야 한다”고 말했다. 이어 “개인정보에 가로막혀 활용 가치가 없는 데이터를 개방해 놓고 '공공 데이터를 개방했다'고 얘기해선 안 된다”면서 “광범위하게 사용 가능한 데이터를 개방해야 공공 데이터 개방 의미가 있다”고 덧붙였다.
이 대표는 이제 빅데이터를 제대로 구현할 환경이 갖춰졌다고 분석했다.
그는 “오픈소스, 클라우드 발전으로 빅데이터 구현 가능한 환경이 마련됐다”면서 “예전처럼 단일 벤더(기술제공업체)에 얽매이지 않고 오픈소스 등을 활용해 누구나 빅데이터 시스템을 구축하는 시대가 열렸다”고 말했다. 이어 “결국 데이터를 다루는 사람의 역량이 중요하다”면서 “빅데이터 주요 기술이 대부분 오픈소스로 공개됐지만 오픈소스를 익숙하게 다루는 사람은 많지 않다. 오픈소스를 자유자재로 다루도록 내실을 다져야 한다”고 덧붙였다.
이 대표는 기업이 '데이터레이크' 시대를 준비해야 할 때라고 강조했다. 데이터레이크는 데이터 종류에 관계없이 모든 데이터를 수집하는 시스템이다. 구성원 누구나 데이터를 검색, 보강한다. 일종의 데이터 공유 환경이다. 빅데이터 시대, 부서 관계 없이 자유롭게 데이터를 활용한다는 점에서 각광받는다. 많은 글로벌 기업이 데이터웨어하우스(DW)를 넘어 데이터레이크를 구축한다.
이 대표는 “데이터레이크는 DW보다 훨씬 큰 개념으로 구축 비용도 상당히 소요된다”면서 “초기 투자가 걱정돼 망설이는 기업이 많다. 클라우드 환경을 접목하면 비용 부담을 줄일 수 있다”고 말했다. 이어 “처음부터 큰 데이터레이크를 만들 필요가 없다”면서 “단계적으로 데이터레이크를 구축해 가능성을 확인 후 점차 넓혀가는 방향으로 추진하면 된다”고 덧붙였다.
김지선기자 river@etnews.com
-
김지선 기자기사 더보기