“AI 학습 데이터 적법 권한 확보해야”…정부, AI 저작권 활용 기준 제시

발행일 : 2023-12-27 14:29 지면 : 2023-12-28 1면

인공지능(AI) 사업자는 AI 학습을 위한 데이터 확보를 위해 적법하게 이용할 권리를 얻어야 한다는 정부 가이드라인이 나왔다. AI가 결과물을 생성하는 과정에서 수집·이용하는 데이터·저작물에 대한 저작권 갈등이 표출되고 있기 때문이다. 거대언어모델(LLM)은 수백억 개 이상의 매개변수(파라미터)를 갖춰야 하고 이를 학습하기 위해 매우 방대한 데이터가 필요하다.

문화체육관광부는 생성형 AI 사용 시 유의사항, 저작권 등록 등 주요 사항을 정리한 '생성형 AI 저작권 안내서'를 27일 발표했다. 이는 문체부의 '저작권 강국 실현 4대 전략' 일환이다.

안내서에는 AI 사업자와 저작권자, 이용자 등을 대상으로 한 주요 가이드라인이 담겼다. 구체적으로 AI 사업자는 적절한 보상 등의 방법으로 적법한 이용권한을 확보할 필요가 있다. 또한 AI 사업자는 서비스 제공 시 기존 저작물과 동일·유사한 인공지능 산출물이 도출되지 않도록 저작권 침해방지 노력을 해야 한다.

원하는 AI 산출물을 만들기 위해 입력하는 텍스트, 이미지, 오디오 등의 데이터가 타인 저작권을 침해하거나 침해를 유도하지 않도록 유의해야 한다는 내용도 포함됐다. 아울러 '인간의 창작적 개입 없는 AI 산출물'에 대한 저작권 등록은 불가능하다는 내용 등이 실렸다.

SW업계는 이에 대해 반발하고 나섰다.

한국소프트웨어산업협회 산하 초거대AI추진협의회는 이날 해당 안내서에 대해 “학습 데이터에 대해 적법한 권한을 확보할 것을 권고한다”는 문구 삭제를 제언했다.

안내서에서 권고하는 내용에 따르면 방대한 데이터의 이용 목적, 기간, 대가 등을 건건이 협의·계약해야 한다는 의미로 풀이될 수 있다고 협의회는 지적했다. 글로벌 빅테크들이 연이어 새로운 초거대 AI 모델과 서비스를 발표하는 가운데, 이런 절차로는 신속한 기술 개발이 불가능하며 글로벌 경쟁에서 뒤처질 수밖에 없다는 것이 업계 의견이다.

유인촌 문체부 장관은 보상체계와 관련, “AI가 창작물을 만들려면 데이터로 학습을 했을 텐데, 제공된 데이터에 대한 보상은 이뤄져야 한다는 게 개인적인 의견”이라며 “AI 등 시대 변화 속에서 문체부의 우선적 역할은 창작자의 권리를 보호하는 것”이라고 말했다.

권혜미 기자 hyeming@etnews.com