10년 전 논문 준비를 위해 빅데이터 시스템을 설계할 때만 해도 선거에서 이 기술이 적절하게 쓰이리라고는 전혀 예상하지 못했다. 당시에는 의료 건강이나 사회안전 등과 같은 분야에서 빅데이터 기술이 유용할 것이라고만 기대했을 뿐이다. 이번 총선에서 압승을 거둔 정당의 핵심 전략이 이동통신 데이터를 기반으로 하는 유권자의 세대별 취향, 소비 패턴, 생활 동선 등 빅데이터를 활용한 후보자별 맞춤형 전략이었다.
빅데이터라는 용어는 2005년에 미국의 로저 더글러스가 처음으로 오라일리 미디어에서 언급한 이후 4차 산업혁명을 선도해 왔다. 초기 빅데이터는 규모(Volume)·속도(Velocity)·다양성(Variety) 특성에 따라 수많은 데이터를 빠른 속도로 분석해 의미있는 정보를 제공하는 기술로만 소개됐지만 이후 가치(Value)와 시각화(Visualization)가 더해 데이터 가치를 재발견하거나 직관화해 실용 서비스로 확대되고 있다. 빅데이터는 대량의 데이터를 생성하는 사물인터넷(IoT)이나 예측의 인공지능(AI), 통합 클라우드까지 모두를 아우르는 기반 기술이다.
앞에서 설명한 5V에 더해 최근에는 타당성(Validity)과 신뢰성(Veracity)까지도 빅데이터의 또 다른 특성이라 할 수 있다. 타당성은 데이터 활용이 편협되지 않고 정확하게 활용했는지를 고려하는 것이고, 신뢰성은 활용하는 데이터가 과연 신뢰할 만한 것인지를 나타내는 것이다. 빅데이터를 어떻게 활용하는지가 인류의 현재와 미래 운명을 결정하는 중요한 요소가 될 것이다.
최근 유사 이래 전 인류를 공포로 몰아가고 있는 코로나19의 위험성을 가장 먼저 알린 것도 빅데이터를 이용해 AI로 분석·예측한 캐나다 스타트업 '블루닷'이다. 이 회사가 자사 고객에게 중국 우한에서 바이러스가 시작됐다는 경보를 내린 것은 2019년 12월 31일으로, 세계보건기구(WHO)보다 열흘이나 앞섰다고 한다. 과거 에볼라 바이러스(2014년), 지카 바이러스(2016년) 확산도 정확히 빅데이터를 이용해 예측한 것으로 알려져 있다.
그러나 우리는 스위스 국제경영개발원(IMD)이 발표한 '세계 디지털 경쟁력 순위 2019'에 따르면 디지털 경쟁력은 조사 대상 63개국 가운데 10위의 상위권이면서도 '빅데이터 활용 및 분석' 항목은 40위, '국제 경험' 항목은 52위, '은행 및 재정 서비스' 항목은 52위, '공공-민간 부문 파트너십' 항목은 41위 등으로 데이터 공개 및 활용 부문에서 모두 낙후된 상황이었다.
필자가 모 정부 부처의 산하기관에서 공모한 빅데이터와 AI 기술이 포함된 다소 큰 규모의 연구 과제를 심사한 적이 있었다. 그러나 제안된 어떤 컨소시엄에서도 이미 상용화된 비즈니스 인텔리전스와 분석 및 데이터 마이닝 솔루션과 같은 국산 솔루션을 검토한다는 내용은 없었다. 오히려 일부 오픈소스 기반으로 아예 자체 개발을 한다고 하거나 해외 유명 솔루션을 그대로 채택한다는 내용뿐이었다. 국내 소프트웨어(SW) 회사가 어려움을 겪을 수밖에 없는 인식 구조가 그대로 드러나는 것이다.
올해 1월에 개인정보 보호법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률(정보통신망법), 신용정보의 이용 및 보호에 관한 법률(신용정보법) 개정안으로 구성된 이른바 '데이터 3법 개정안'이 국회 본회의를 통과했다. 이것은 우리나라가 데이터 산업 육성 지원을 강화할 수 있는 근간을 마련, AI 시대와 데이터 경제를 선도할 수 있는 제도 기반을 마련했다는 데 의미가 있다. 물론 정보 주체 권리를 보호할 수 있는 조치가 뒤따라야 한다는 지적도 있기는 하지만 빅데이터를 위시한 4차 산업혁명 기술을 활용해 미래 사회에 적극 대응하기 위해 꼭 필요한 것이라 할 수 있다. 영화 '천문'에서 “같은 하늘을 보면서 같은 꿈을 꾸는 것이 중요하다”라며 기술 가치를 일찍이 알아본 세종대왕의 대사가 생각난다. 빅데이터를 위시한 4차 산업혁명을 이끄는 기술을 이용해 '더 나은 세상'을 만들 수 있다는 꿈을 꾸고 싶다.
전상권 한국정보처리학회 부회장 skchun4@gmail.com
-
김현민 기자기사 더보기