[기고]`비식별화`라는 코끼리

이영환 건국대학교 기술경영학과 ,금융IT학과 교수
이영환 건국대학교 기술경영학과 ,금융IT학과 교수

빅데이터는 세계적으로 미래 신성장동력이자 신산업으로 인식되면서 산업, 경제, 사회 전반에서 활용성이 크게 기대된다. 정부는 여러 가지 빅데이터 활성화 대책을 내놓으면서 생태계 조성에 애쓰고 있다. 하지만 정부 기대와는 달리 빅데이터 생태계는 여전히 열악하다. 여러 이유가 있겠지만 가장 치명적인 것은 아마도 빅데이터 유통이 국내법상 불가능하게 된 구조 때문이다.

빅데이터를 유통산업 관점에서 생각하면 최초 생산자, 중간수집상, 중간가공업자, 정제 세공업자, 상품 제조업체, 최종 소비자 및 재생산업자 등으로 나눌 수 있다. 각 단계마다 빅데이터가 유통돼 부가가치가 발생되면 정부 당국자가 바라는 ‘빅데이터 생태계’가 조성된다.

그런데 우리나라 법체계는 빅데이터가 유통되는 과정에 여러 가지 규제를 규정하고 있다. 가장 심각한 것은 개인정보보호를 위한 비식별화에 관한 규정이다. 우리나라 법은 개인정보 보호와 관련해 매우 꼼꼼하고 세밀하게 보장하고 있다.

개인정보를 보호하는 것은 아무리 강조해도 지나치지 않을 만큼 중요하다. 그 사실 자체를 반대하거나 부정하자는 것은 아니다.

하지만 지난 20여년간 비식별화가 개인 익명성을 보장한다는 믿음에 대해 많은 연구자가 이의를 제기하고 있다. 가장 유명한 케이스로는 대학원생이던 스위니 박사가 1990년대 중반 이름, 소셜시큐리티 번호(우리의 주민번호), 주소 등이 지워진 ‘익명화된’ 주정부 건강보험기록을 조사해 당시 주지사였던 웰드의 건강기록을 적시해낸 사례다.

유사한 케이스로는 2006년에는 뉴욕타임스 기자가 AOL ‘익명화된’ 60만명 고객의 3개월간 검색기록을 조사해 델마 아놀드 할머니가 ‘손가락 저림’ ‘60세 싱글 남자’ 등 검색을 했다는 사실을 찾아냈다.

같은 해 넷플릭스는 추천 알고리즘을 개선하기 위해 약 1억건의 익명화된 영화추천자료를 공개했는데 여기서도 많은 수의 개인을 적시할 수 있다는 것이 증명됐다.

이렇듯 많은 연구가 비식별화된 데이터에서 개인정보를 재식별화할 수 있다는 것을 증명하고 있다. 사실 많은 전문가 사이에는 완벽한 비식별화는 불가능할 뿐더러 점점 더 어려워지고 있다는 공감대가 형성한다.

컴퓨팅 파워의 기하급수적 증가와 빅데이터 도움으로 재식별화 기술이 급속도로 발전하고 있기 때문이다. 이런 점에서 최근에는 비식별화가 효과가 없다는 측과 완벽할 수는 없어도 비식별화가 그런대로 잘 작동하고 있다는 측이 심각한 논쟁을 벌이기도 했다.

비식별화가 완벽할 수 없다는 사실 때문에 세계 각국 정부는 개인정보 보호와 함께 맞물려서 빅데이터 산업 활성화를 동시에 이루려면 어떤 정책을 펴야 할지 심각한 고민에 빠져있다.

그런데 한국정부는 이런 고민에서 동떨어져 있다. 사실 한국의 모든 법은 어찌된 일인지 비식별화가 완벽하다는 대전제 아래 만들어져 있다. 우리나라에는 약 30개에 달하는 법률이 모두 개인정보 침해가 발생하지 않도록 비식별화해 처리해야 한다고 정하고 있다.

비식별화는 재식별화가 절대로 안 되도록 해야 한다. 데이터의 개인정보가 혹시라도 재식별화 되면 범법자다. 비유를 들어서 설명하면 이렇다. 누군가 사진이 있는데 이를 다른 사람에게 제공할 때 아주 잘게 찢어서 알아볼 수 없을 만큼 만들어서 제공하라고 법으로 정한 것이다. 그런데 아무리 잘게 찢어도 이를 붙여서 알아볼 수 있는 재식별 기술이 발달하고 있다.

더욱 심각하게는 현재 기술뿐만 아니라 미래 기술을 포함해서 완벽하게 비식별화한 후 타인에게 제공하지 않으면 범법자가 된다. 완벽한 비식별화가 가능하다는 전제가 있기 때문이다. 이렇듯 완벽할 수가 없는데도 완벽해야 한다는 비이성적인 법을 갖고 있는 우리나라에서 정부가 아무리 빅데이터 활성화 대책을 만들고 또 만들어도 데이터 생태계가 만들어질 수 없다.

영어 관용구 중에 ‘방안의 코끼리’라는 말이 있다. 방안에 들어앉은 코끼리를 외면하고 방안이 답답하다는 문제를 해결할 수는 없다. ‘재식별화가 불가능한 완벽한 비식별화’라는 코끼리를 방안에 놔둔 채 빅데이터 산업이 활성화되고 생태계가 만들어질 수는 없다.

개인정보 보호는 매우 중요하다. 마찬가지로 빅데이터 생태계 조성도 중요하다. 법률적으로 상충하는 두 개 명제를 이성적으로 해결하기 위해 각계각층이 머리를 맞대야 한다.

이영환 건국대학교 금융IT학과 교수 nicklee@konkuk.ac.kr