바야흐로 데이터 시대다. 세계 최대 전자상거래 기업인 중국 알리바바의 마윈 회장은 “정보기술(IT) 시대에는 데이터를 잘 이용하는 기업만이 성공하는 데이터기술(DT) 시대에 적응할 것”이라고 예측했다. 미국 시장조사 기관 가트너는 빅데이터를 21세기 원유로 비유하며 데이터가 미래 경쟁력을 좌우한다고 강조했다.
데이터는 먼 옛날부터 자연 현상의 동작 원리와 만물의 이치를 과학 원리로 설명하고 이해하는데 가장 기본이 되는 자료였다. 물체 이동 거리나 속도를 반복 측정하고, 결과를 바탕으로 우리가 학창 시절에 배운 여러 과학 공식을 만들었다.
20세기에 들어와 각종 데이터를 컴퓨터에 보관, 효율화한다. 빠른 검색과 함께 여러 사람이 동시에 이용하도록 하는 데이터베이스(DB) 관리 기술도 크게 발전했다.
미국 대형 마트에서는 금요일 저녁에 기저귀 진열대 옆에 맥주를 함께 진열, 판매량을 높였다고 한다. 이처럼 데이터 마이닝, 데이터 웨어하우스와 같은 다양한 분석 기법도 등장했다.
최근 빅데이터가 각광 받고 있다. 빅데이터가 데이터 양과 생성 속도, 데이터 형태 측면에서 기존 데이터와는 다르다고 이야기한다. 그렇지만 더 중요한 차이는 이종 데이터 간 결합으로 전혀 예상하지 못한 새로운 가치를 발견하는 데 있다.
지난 2014년 KT는 조류독감 확산 원인이 철새가 아니라 농가 이동 차량이라는 것을 밝혀냈다. 그전처럼 조류 데이터 분석에만 집중했다면 지금도 매년 수백만, 수천만 마리의 조류가 살처분되고 있을지도 모른다.
서울 시내 심야버스 노선 최적화에도 시민 통화 데이터가 활용됐다. 이처럼 조류 데이터와 농가 이동 차량 데이터, 버스 데이터와 통화 데이터가 결합해 새로운 가치를 만들어 낸다.
또 한 가지 빅데이터의 중요한 점은 인공지능(AI) 소프트웨어(SW)의 성능을 높일 수 있는 학습 데이터로 활용된다는 점이다.
예를 들어 AI 기반의 의료영상 분석 SW를 개발하는 뷰노, 루닛과 같은 스타트업이 있다. 이들은 의료 진단 SW의 성능을 높이기 위해 엑스레이 사진이나 컴퓨터단층촬영(CT), 자기공명영상(MRI) 등의 다양한 진단 영상 장비 데이터를 사용한다. 한국전자통신연구원(ETRI)이 개발한 통·번역 애플리케이션(앱) 지니톡의 성능을 높이기 위해 방대한 음성 데이터도 활용됐다.
데이터는 그 자체로 우리의 소중한 자원이자 경쟁력이 될 수 있다. 데이터가 과거에는 과학과 사회 현상 분석 및 이해에 주로 활용됐다. 다가오는 지능정보 사회에서는 데이터가 개인과 기업에는 새로운 가치를 제공한다. 국가 차원에서는 사회·경제 현안 해결에 핵심 수단이 될 것이다.
미래창조과학부는 우리나라가 데이터 강국, 데이터 부국으로 도약할 수 있도록 노력한다. 기술 개발부터 시범 사업, 관련 규제 개선에 이르기까지 다양한 정책을 추진한다.
또 행정자치부, 특허청 등과 함께 민·관 합동 빅데이터 태스크포스(TF)를 운영, 데이터 산업 활성화와 데이터 전문 인력 양성 방안을 집중 논의한다. 민·관이 머리를 맞대고 국내 데이터 산업의 미래 발전 방향을 모색하는 뜻깊은 계기가 될 것으로 기대된다.
앞으로 데이터를 활용해 선도하는 국내 기업이 많이 등장하고 지능정보 산업 전성기를 이룰 수 있도록 함께 노력해 나갈 것을 제안한다.
최재유 미래창조과학부 2차관 choijaey@msip.go.kr