“공개된 개인정보가 프라이버시 침해 없이 안전하게 처리될 수 있는 기준이 필요합니다. 인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서를 1~2주 안에 발표할 예정입니다.”
고학수 개인정보보호위원회 위원장은 18일 서울 서초구 JW메리어트호텔에서 열린 '한국IT리더스포럼' 조찬회에서 '국민 삶이 풍요롭고 개인정보가 안전한 AI시대'를 주제로 강연했다.
공개된 개인정보는 말 그대로 인터넷에 널려 있는 데이터를 말한다. 거대언어모델(LLM) 개발 핵심 관건인 학습 데이터는 인터넷에서 무료로 구할 수 있는 데이터를 크롤링(crawling)해서 구축한다.
하지만 국내 개인정보보호법상 명확한 규율 체계가 부재한 상황이다. 이에 개인정보위는 이달 내 공개된 개인정보 처리 가이드라인을 발표할 예정이다.
이번 가이드라인은 법적 근거로서 '정당한 이익' 적용의 원칙 기준과 함께 공개된 개인정보 활용 시 적용 가능한 안전조치를 제시한다. 개인정보보호법엔 '정당한 이익을 달성하기 위해 필요한 경우' 개인정보를 수집할 수 있다고 규정하고 있다.
정당한 이익 적용의 기준으론 AI 목적을 최대한 구체적으로 정의하고 웹스크래핑의 불가피성과 편향·차별 방지 필요성 등을 구체화하는 한편 개인정보처리자의 정당한 이익이 정보주체 권리에 명백히 우선하는지 평가할 것을 담을 예정이다.
안전조치는 학습데이터 수집 출처 적합성 검증, 개인정보 유·노출 방지 등 기술적 조치와 AI 프라이버스 레드팀 운영, 학습데이터 수집·이용 기준 정립 등 관리적 조치를 말한다. 또 공개된 정보 수집 시설과 주요 출처 공개, 합리적 범위 내 삭제·처리·정지 등 정보주체 권리도 보장해야 한다. 다만 모든 안전조치 이행을 요구하지 않으며 기업 등이 자율적으로 최적의 조합을 선택해 이행할 수 있다.
고 위원장은 “합리적인 선에서 프라이버시 문제가 생기지 않도록 노력해야 하고, 이를 전제로 공개된 개인정보를 이용할 수 있다”며 “가이드라인은 개인정보 침해 없이 공개된 개인정보를 안전하게 활용하자는 취지”라고 말했다.
개인정보위는 공개된 개인정보 처리를 비롯해 비정형 데이터 가명처리, 생체인식 정보 규율 체계, 합성데이터 활용, 이동형 영상기기 촬영 정보 활용, AI 투명성 확보 등 6대 가이드라인을 발표하고 개인정보 보호 방안을 안내할 계획이다.
고 위원장은 “규정 중심에서 원칙 중심으로 큰 방향성을 잡았다”며 “원칙 중심 규율 체계는 추상적일 수밖에 없어 기업의 불확실성과 국민의 AI 불안감을 최소화하기 위한 관점에서 접근하고 있다”고 말했다.
고 위원장은 또 사전적정성 검토제를 적극 활용해 달라고 당부했다.
이 제도는 새로운 서비스를 기획·개발하려는 사업자가 개인정보위와 함께 개인정보보호법 준수 방안을 사전에 마련하고, 이를 적정하게 적용했다면 추후 사정 변화 등이 없는 한 행정 처분을 면제하는 제도다.
올해 개인정보위 운영 목표로 △국민 생활 밀착분야 선제적 대응 △새로운 유형의 개인정보 침해에 대응한 조사 기반 강화 △공공부문 개인정보 안전망 지속 강화 등을 제시했다.
고 위원장은 “공공부문은 주민등록번호 등 국민의 개인정보를 처리하기 때문에 (개인정보 유출) 사고가 발생하면 대형 사고인 경우가 많다”면서 “공공기관 개인정보 보호수준 평가제를 지난 3월부터 시행하는 등 공공부문 사고 예방에 노력하겠다”고 말했다.
조재학 기자 2jh@etnews.com