데이터 경제의 성공, 축적이 아닌 활용에 달렸다

데이터 경제의 성공, 축적이 아닌 활용에 달렸다

데이터 경제(Data Economy) 시대가 도래하면서 데이터는 기업 비즈니스의 새로운 기회 창출과 더불어 국가경쟁력을 강화할 수 있는 중요한 자산으로 인식되고 있다.

미국⋅유럽연합(EU)⋅중국 등 주요 국가에서는 광범위한 데이터 활용이 미래 혁신산업에서 전략적 경쟁우위를 확보할 수 있는 핵심 수단으로 보고, 데이터 경제를 육성하기 위한 국가 전략을 수립하여 과감하게 추진하고 있다.

주요 국가의 데이터 경제 육성 전략
주요 국가의 데이터 경제 육성 전략

◇데이터 경제 시대에 대비하는 한국…과기부·NIA '빅데이터 플랫폼' 구축

이에 우리나라도 데이터 경제 시대에 대비해 전략적으로 2019년 데이터·AI경제 활성화 계획, 2020년 공공데이터제공 및 이용활성화 기본계획 등을 수립하였고, 이를 근거로 범정부 차원에서 데이터를 적극적으로 개방하고 오랫동안 핵심 데이터를 축적하여 데이터베이스를 구축하였다.

대표적으로 과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 2019년부터 다양한 데이터의 수집과 개방, 유통과 활용을 지원할 수 있는 21개 분야의 빅데이터 플랫폼을 구축했다.

또한, 데이터 이용자가 다양한 플랫폼의 데이터를 쉽게 검색하고 활용할 수 있는 창구로 '통합 데이터 지도'를 운영하고 있다.

◇데이터 경제 성공의 핵심은 '활용'…법제도 진전

그러나 데이터 경제의 성공은 핵심 데이터의 축적을 넘어서 그 활용이 얼마나 포괄적인지가 더욱 중요하다. 구글, 애플 등 플랫폼 기업으로 대표되는 혁신산업의 경쟁우위를 결정하는 것이 바로 데이터의 활용에 달려있기 때문이다.

그간 우리나라는 국가 차원에서 적극적으로 데이터를 공개하고 지속적으로 축적하였음에도 불구하고 법제도 미비로 인해 그 활용이 부족하다는 비판이 일부 제기되어왔다.

이를 해결하기 위해 국회에서는 2020년 1월 데이터 3법을 입법화함으로써, 제도적으로는 개인정보의 활용 확대, 가명정보의 도입, 마이데이터 허용 등 다양한 데이터를 활용해 새로운 비즈니스와 신규산업을 추진할 수 있도록 허용하는 조항을 신설했다. 이에 더해 올해 데이터산업법까지 시행되었다. 즉, 데이터의 활용여건을 획기적으로 개선한 것이다.

이러한 맥락에서 국가 전략 차원의 제도적인 정비가 갖추어진 이후에는 실제 민간영역의 산업현장에서 데이터 활용을 높이기 위한 정부의 후속적인 정책적 실행방안이 더욱 중요하다는 것이 학계의 견해이다. 특히, 공공을 중심으로 데이터 활용을 정책적으로 견인할 수 있도록 정교한 확산 프로그램을 다양하게 모색하는 노력이 실질적인 데이터 활용의 기반조성에 매우 중요할 것이다.

다시 말해 축적된 데이터를 활용하여 사용자 경험을 늘릴 수 있는 구체적인 확산 프로그램을 공공영역에서 적극적으로 견인할 필요성이 있다는 의미이다. 사실 데이터의 가치는 단순히 축적하여 쌓아놓는 것이 아니라, 축적된 데이터로부터 정보를 획득하고, 지식화하여 지혜를 얻는 과정에서 가치를 드러내는 것이다.

◇ 통합 데이터지도 심층 분석…'다양한 사회문제 해결에 기여' 목적

이와 관련, 최근 한국지능정보사회진흥원이 통합 데이터지도의 활용범위를 확대하기 위해 기존의 경진대회 방식을 벗어나 대학들과 협력체계를 구축하고 통합 데이터지도를 활용해 사회문제를 해결할 수 있는 프로그램을 추진한 것은 매우 모범적인 사례로 평가된다.

예를 들어, 한국지능정보사회진흥원과 과학기술정보통신부의 DS플러스 차세대 융합인재 양성 컨소시엄 사업단의 4개 대학(호서대학교, 고려대학교, 서울시립대학교, 충남대학교)이 연계하여 통합 데이터지도에서 제공되는 데이터를 심층적으로 분석하여 다양한 사회문제를 해결하도록 개최한 대회가 대표적인 사례이다.

◇사례1 - STAI 팀 'AED 개수에 따른 커버리지 변화'

이 대회를 통해 도출된 데이터 활용 우수사례를 몇 가지 소개한다. 먼저 대상을 수상한 STAI팀은 정부와 지자체에서 나날이 증가하는 심정지 환자를 방지하기 위해 심정지 방지장치인 AED를 적절히 배치하고 있는지를 분석하고, 지자체의 적정 AED 개수 및 위치선정 후보지를 제안하여 우수한 평가를 받았다. 통합 데이터지도의 급성심정지 발생건수, 지자체별 인구데이터, AED 정보위치 등을 MCLP(Maximal Covering Location Problem) 기법으로 분석해 동대문구를 대상으로 실외 AED 위치의 접근성 향상방안을 도출했다.

사례1. AED 개수에 따른 커버리지 변화
사례1. AED 개수에 따른 커버리지 변화

◇사례2 - 다.만.우 팀 '리뷰 분석에 따른 적정 에어프라이어 제시'

다음으로 최우수상을 수상한 다.만.우 팀은 가전제품 에어프라이어의 상품리뷰를 이용한 제품 키워드 자동분류 서비스 방법을 제안하여 높은 평가를 받았다. 이 팀은 통합 데이터지도의 상품리뷰데이터를 LDA(Latent Dirichlet Allocation) 토픽 모델링 기법으로 분석해 다양한 전자상거래 사이트에서 소비자에게 맞는 최적의 상품을 추천할 수 있는 알고리즘을 제시했다.

사례2. 리뷰 분석에 따른 적정 에어프라이어 제시
사례2. 리뷰 분석에 따른 적정 에어프라이어 제시

◇축적 데이터 활용에 따른 산업적 가능성 확인

이외에도 당뇨 원인 중 하나로 알려진 혈당스파이크의 지역별 편차를 파악하고, CCTV 개수와 범죄율과의 인과성을 분석하는 사례 등도 주목받았는데, 다수의 사회문제 해결사례가 통합 데이터지도를 활용하여 도출될 수 있음을 보여주었다. 즉, 축적된 데이터를 어떻게 효과적으로 활용할 수 있는지에 대한 산업적 가능성을 확인한 대회라고 할 수 있다.

결론적으로 미래경제의 새로운 패러다임으로 평가되는 데이터 경제의 성공은 데이터의 축적을 넘어선 그 활용에 달려있으며, 이를 위해 공공을 중심으로 데이터 활용을 정책적으로 견인할 수 있도록 정교한 확산 프로그램이 다양하게 모색되어야 할 것이다.

금번 한국지능정보사회진흥원과 DS플러스 차세대 융합인재 양성 컨소시엄 사업단의 협력 프로그램은 어떻게 하면 축적된 데이터 활용을 효과적으로 촉진하고 나아가 사회문제를 해결할 수 있는지를 적절히 보여준 사례로 평가된다. 향후에도 공공영역의 데이터 활용을 획기적으로 촉진할 수 있도록 사회적 파급효과가 큰 데이터 활용 프로그램이 지속적으로 추진되길 기대해 본다.

곽정호 호서대학교 빅데이터AI학과 교수