빅테크 연합 BSA, “AI 학습 데이터 공개 반대”

게티이미지뱅크
게티이미지뱅크

마이크로소프트(MS), 아마존웹서비스(AWS) 등이 속한 글로벌 소프트웨어(SW) 기업 연합체 BSA가 이달 초 한국저작권위원회에 인공지능(AI) 저작권 제도 개선 의견을 전달했다.

이들은 “AI 학습에 이용된 데이터 공개를 반대한다”고 밝혀 국내 저작권 단체와 갈등을 예고했다.

30일 업계에 따르면 문화체육관광부와 한국저작권위원회는 지난달 4일부터 이달 6일까지 'AI 저작권 제도 개선을 위한 국민의견 수렴'을 진행했다. AI 확산에 맞춰 이에 걸맞은 저작권 제도를 마련하는 게 목적이다.

BSA는 국내 저작권단체와 시민단체가 주장하는 'AI 학습에 사용되는 데이터 출처 공개 의무화'에 반대 입장을 밝혔다.

학습 데이터 공개 여부는 AI 및 저작권 산업에서 중요한 쟁점이다. 어느 데이터를 학습에 사용했는지 공개할 경우 저작권자의 권리 침해 이슈가 불거질 수 있기 때문이다.

BSA는 데이터 공개 의무화가 영업 비밀을 노출시키고 AI 투자 의욕을 저해할 수 있다고 주장했다. 또 AI 데이터 학습이 저작권자 이익을 침해하지 않는다고 강조했다.

반면 한국기자협회 등 5개 언론단체는 학습 데이터 공개 의무화를 촉구하는 의견서를 제출한 바 있다. 이들은 AI 기업들이 데이터를 무단 사용해 저작권자 권리를 침해할 가능성이 있다고 반박했다.

AI 학습데이터는 저작권법뿐만 아니라 AI 기본법 후속 조치인 세부 시행령과 지침 등 마련 과정에서도 주요 논의 대상이 될 전망이다.

BSA는 또 '텍스트 및 데이터 마이닝(TDM)' 예외조항을 폭넓게 적용해야 한다고 주장했다.

TDM은 대규모 텍스트와 데이터에서 특정 정보를 추출하는 기술로, 데이터를 학습하고 추출된 정보를 활용하는 과정에서 저작권 문제 발생 소지가 있다.

'TDM 예외조항'은 연구나 과학적 목적을 위해 저작권 보호 콘텐츠를 분석할 때 저작권자 허가 없이 사용할 수 있다는 규정이다.

일본과 싱가포르는 TDM 예외조항 도입했다. 싱가포르는 유료 사용자에게 TDM 예외조항을 적용하며, 무단 복제 행위는 불법으로 규정하고 있다.

국내에서도 TDM 예외조항 도입은 대체로 동의하지만 '상업적 이용'을 비롯한 기준 설정에서는 의견이 엇갈리고 있다.

BSA는 AI 저작권 이슈에 대해서 “정부 정책으로 도입하기보다 창작자, AI 개발자, 배포자가 자발적 논의로 기술 메커니즘을 만들어야 다양한 콘텐츠가 생산·소비된다”고 주장했다.

업계 관계자는 “BSA가 한국 정부에 AI 저작권 정책 방향을 제시한 것은 AI 개발 과정에서 발생할 수 있는 저작권 문제를 해결하고, 법적 안정성을 확보하려는 목적이 크다”면서 “이는 한국 AI 시장 진출을 확대하고, 한국 정부·기업과 협력 강화를 위한 행보로 해석된다”고 말했다.

문화체육관광부와 한국저작권위원회는 수렴한 의견을 바탕으로 AI 저작권 정책 방향을 발표할 예정이다. 이는 향후 저작권법 개정 과정에서도 반영될 전망이다.

해외에서도 저작권 관련 논의가 한창이다. EU는 AI 법에서 학습데이터 내용을 대중에게 공개하도록 규정했다. 미국 하원은 지난 4월 '학습데이터 공개 법안'을 발의했다. 하지만 오픈AI, 마이크로소프트(MS), 구글 등 AI 기업이 이에 반대하는 상황이다.

박두호 기자 walnut_park@etnews.com