인공지능(AI) 기술 개발사들이 모호한 '공개 데이터' 처리 기준 탓에 개발이 지연된다고 목소리를 높였다. 공개 데이터 사용방식의 명확한 기준을 제시해 혼동을 줄여야 한다는 요구다.
1일 업계에 따르면 지난 7월 개인정보보호위원회가 AI 개발·서비스에 이용되는 공개 데이터 처리 기준을 제시했지만, 기술·서비스 개발에 있어 불확실성이 여전하다는 의견이 지속적으로 흘러나오고 있다.
공개 데이터는 위키백과, 블로그, 웹사이트 등 인터넷에서 누구나 합법적으로 접근할 수 있는 데이터다. 챗GPT 등 생성형 AI 개발을 위한 학습 데이터로 쓰인다. 하지만 주소, 고유식별번호 등 여러 개인정보가 포함될 수 있어 개인정보 침해 우려도 존재한다. 개인정보위가 공개 데이터 처리 기준을 제시한 이유다.
기준에 따르면, 개인정보보호법 제15조 제1항 제6호 '개인정보처리자의 정당한 이익을 달성하기 위해 필요한 경우로서 명백하게 정보주체의 권리보다 우선하는 경우'가 공개 데이터 사용의 적법 근거가 될 수 있다. 또한 정당한 이익 조항이 적용되기 위해선 '목적의 정당성', '처리의 필요성', '구체적 이익형량' 등 세 가지 요건을 충족해야 한다.
그러나 AI 기업은 해당 기준의 모호한 표현 등으로 인해 공개 데이터 사용에 대한 불확실성을 지우지 못하는 실정이다.
한 AI 기업 대표는 “법이 제시한 '정당한 이익'에 부합하는 것은 무엇인지 개인보정위가 공개한 기준이 두루뭉술하다”며 “소송 관련 구체적 가이드가 제시되지 않는 한 큰 도움이 되지 못하는 게 현실”이라고 말했다.
공개 데이터 사용에 대한 불확실성은 AI 솔루션·서비스 개발 지연으로 이어진다. 명확한 공개 데이터 처리 기준이 없어 AI 개발 단계에서 법적 침해 요소 등을 검토하는 인허가 과정이 길어지기 때문이다.
AI 솔루션 개발 기업 관계자는 “AI 솔루션 개발 단계마다 법적 침해 여부를 검토하는 인허가 절차가 복잡하게 진행된다”면서 “공개 데이터 처리에 대한 기준이 명확하지 않으니 긴 인허가 기간 탓에 개발이 계속 지연되고 있다”고 하소연했다.
전문가들은 기업 혼동을 줄이기 위해 공개 데이터 처리에 대한 구체적 내용을 담은 법안과 가이드가 필요하다고 지적했다.
한 법률 전문가는 “공개 데이터 처리 기준을 구체화해 법률적 해석 여지를 좁혀야 한다”며 “캐나다 '개인정보 보호 및 전자문서법(PIPEDA)'의 경우, 공개 데이터 중 국가등록부, 법원 기록, 서적·신문 등 간행물에 게재된 데이터를 수집해 이용하는 데에는 동의가 필요하지 않다고 상세히 명시했다”고 설명했다.
최경진 가천대 법과대학 교수(한국인공지능법학회장)는 “개보위가 지난 7월 공개한 기준은 AI 시대에 맞는 안전한 개인정보 처리 방향성을 제시한 첫 걸음으로 해석할 수 있다”며 “조기에 기업들이 혼동하지 않도록 개별 사례를 제시하고 구체적 기준을 확립해야 한다”고 말했다.
개보위 관계자는 “기술·산업 변화 속도가 빠른 AI 시대에 맞는 안전한 개인정보 데이터 처리를 위해선 원칙 기반 규율에 따라 안내서·가드레일 등을 제시하는 것이 적절하다고 본다”며 “데이터 활용 유형이나 세세한 사례를 제시하는 것은 정부가 아닌 개별 개인정보 처리자인 기업·기관의 몫이 될 수밖에 없다”고 설명했다.
현대인 기자 modernman@etnews.com
-
현대인 기자기사 더보기