[기고]빅데이터 활용과 개인정보 보호

안혜연 파수닷컴 부사장
안혜연 파수닷컴 부사장

세기의 대결이라 일컬어지며 올해 가장 뜨거운 이슈가 된 이세돌 9단과 알파고의 바둑경기를 모두 기억한다. 인공지능(AI) 컴퓨터로 불리는 알파고는 방대하게 수집된 빅데이터 분석을 기반으로 한다. 빅데이터 활용은 기업은 물론 공공, 통신, 금융, 병원, 유통 등 다양한 산업 분야로 빠르게 확산되고 있다. 연구개발(R&D) 또는 품질 개선을 위해 활용되기도 하고, 새로운 상품 개발과 맞춤형 마케팅을 위해 이용되기도 한다. 정보기술(IT) 트렌드를 주도하는 사물인터넷(IoT), 금융기술(핀테크), AI 등 최신 IT의 공통점은 바로 방대하게 생성된 데이터를 핵심으로 다룬다는 점이다. 최신 IT가 빠르게 성장할수록 빅데이터 시장은 확대될 수밖에 없다.

하지만 이러한 빅데이터 산업의 활성화와 성장을 위해 해결해야 할 과제들이 있다. 바로 개인정보 보호에 대한 이슈다. 최근 개인정보보호법, 정보통신망법, 신용정보보호법 등 관련 법규들은 개인정보가 포함된 빅데이터 활용을 단순히 제한하는 것이 아니다. 비식별화라는 기술을 이용해 빅데이터 활용을 더욱 활성화시켜야 한다는 방향으로 추진된다.

비식별화란 개인정보 일부 또는 전부를 삭제하거나 대체한다. 다른 정보와 결합해도 특정 개인을 식별할 수 없도록 하는 기술 조치다. 개인정보 비식별화 기술은 PPDM(Privacy Preservation in Data Mining)이란 이름으로 이미 2000년 초부터 학문 연구가 활발히 이뤄지고 있는 분야다. 이를 통해 다양한 비식별화 세부 방법론이 학계에 제안된다. 그 가운데 가장 널리 활용되고 있는 방법론으로 익명화나 암호화 등을 통한 가명처리 기법이 있다. 특정 범주나 범위 값으로 일반화시키는 범주화 기법, 임의 잡음 추가 등 노이즈 기법도 포함된다. 비식별화 기술을 적절히 사용할 때 재식별화에 대한 걱정이나 개인정보 유출에 대한 우려 없이 가치 있는 빅데이터 분석 결과를 도출할 수 있다.

업계에는 이러한 빅데이터 분석을 위한 다양한 개인정보 비식별화 솔루션이 존재한다. 하지만 재식별 방지를 위해 지나친 비식별 기술을 적용할 경우에는 데이터의 활용도가 떨어진다. 데이터 활용도를 높이기 위해 비식별 범위를 최소화하면 개인정보의 재식별 위험이 높아진다. 적절한 분석 방안을 제공하는 솔루션이나 컨설팅 서비스는 많이 부족한 현실이다.

빅데이터를 활용한 시장을 더욱 적극 만들고 글로벌 시장에서 앞서기 위해서는 개인정보 비식별화 솔루션을 제공하는 벤더와 빅데이터 활용 기업 간 공동 노력이 필요한 것으로 보인다. 먼저 비식별화 솔루션을 제공하는 벤더는 진행된 연구 결과를 바탕으로 학문으로 제안되는 다양한 방법론을 현실화해 해야 한다. 개인정보는 안전하게 보호하면서 빅데이터의 활용 가치는 높이는 분석 방안에 대한 R&D와 투자가 지속 요구된다. 또 빅데이터를 활용하는 기업과 기관은 전문가 도움으로 분석할 데이터를 파악하고 재식별 위험을 진단한 후 그에 따르는 위험 완화 방안 등을 체계화해 적용해야 할 것이다.

우리가 받아들이든 받아들이지 않든 간에 세상은 빠른 속도로 변화한다. 변화에 따른 문제는 늘 생기기 마련이다. 개인정보 보호와 빅데이터 활용 확산에 논란의 여지는 있다. 두 가지 사안을 모두 만족시키는 최선의 방안을 찾아내기 위한 솔루션 제공 벤더와 빅데이터 활용 업계의 지속된 노력과 협력이 필요하다.

안혜연 파수닷컴 부사장 ahn@fasoo.com