인공지능(AI)이 인간의 창작 영역까지 진출하면서 법적·윤리적 문제가 수면 위로 부상하고 있다. 적법하게 접근만 할 수 있으면 제한 없이 AI가 저작물을 학습할 수 있도록 해야 한다는 찬성 측과 저작권자 권익을 지나치게 해하는 결과가 초래될 수 있다는 반대 의견이 팽팽하다. AI 저작물과 관련한 사회적 논의가 필요하다는 진단이다.
◇우후죽순 생성형 AI 콘텐츠…데이터 학습 논란
콘텐츠 창작을 위한 생성형 AI 도구는 무궁무진하다. △텍스트를 입력하거나 이미지 파일을 업로드하면 그림을 생성하는 '미드저니' △원하는 이미지에 대해 묘사하면 비슷한 이미지를 생성하는 'DALL-E' △이미지를 업로드하면 딥러닝 기술을 활용해 자동으로 채색해 주는 툴 '네이버 웹툰 AI 페인터' △입력한 문장의 문맥을 분석한 뒤, 이어지는 스토리와 대사를 즉석에서 창작하는 '뤼튼' △음악 생성형 AI '포자랩스' 등이다.
디즈니플러스는 오리지널시리즈 '카지노' 제작 당시 디즈니 자체 생성형 AI '디에이징' 기술을 활용, 최민식 배우의 과거 모습을 되살리고 소리를 분리·제작했다. 밀리의서재는 책 내용에 창작을 더해 만든 영상 콘텐츠, 텍스트를 넣으면 다양한 목소리로 읽어주는 AI 오디오북 서비스를 제공했다. 스튜디오지니 드라마 '가우스전자'와 스카이라이프TV 예능프로그램 '강철부대' 삽입곡도 AI가 만들었다. KT알파 쇼핑은 AI가 창작한 음악을 BGM으로 송출한다.
AI가 결과물을 생성하는 과정에서 수집·이용하는 데이터·저작물에 대한 저작권 갈등이 표출되고 있다. 거대언어모델(LLM)은 수백억 개 이상의 매개변수(파라미터)를 갖춰야 하고 이를 학습하기 위해 매우 방대한 데이터가 필요하기 때문이다.
문제는 AI가 창작물을 만들기 위한 데이터 정보분석(AI 학습용 데이터 가공·추출) 과정이 받아들여질 수 있느냐다. 이 지점에서 저작권 논란이 발생한다. AI 창작물이 기존 창작자의 저작권을 침해한 것이 아닌지를 따져야 한다는 지적이다. AI는 데이터마이닝이 핵심인 만큼, AI 학습에 필요한 데이터 저작권 논의가 요구되고 있다.
◇AI 저작권 활용 기준 '갑론을박'
국회에서도 관련 논의가 나오고 있다. 황보승희 무소속 의원은 적법하게 접근한 저작물에 대한 정보분석을 하는 경우 저작물의 복제·전송과 2차적 저작물 작성을 할 수 있도록 하고 복제물에 대해서는 필요 범위 내에서 보관도 가능하도록 하는 내용의 저작권법 일부개정안을 대표 발의했다. 다만 법안 처리는 불투명한 상황이다. 특히 정치권이 총선 모드에 들어가면 법안 처리는 뒷전으로 밀릴 가능성이 크다. 21대 국회에서 통과되지 않으면 자동폐기된다.
정부도 움직이고 있다. 문화체육관광부는 생성형 AI 사용 시 유의사항, 저작권 등록 등 주요 사항을 정리한 '생성형 AI 저작권 안내서'를 지난해 발표했다. 안내서에는 AI 사업자와 저작권자, 이용자 등을 대상으로 한 주요 가이드라인이 담겼다. 구체적으로 AI 사업자는 적절한 보상 등의 방법으로 적법한 이용권한을 확보할 필요가 있다. 또한 AI 사업자는 서비스 제공 시 기존 저작물과 동일·유사한 인공지능 산출물이 도출되지 않도록 저작권 침해방지 노력을 해야 한다.
원하는 AI 산출물을 만들기 위해 입력하는 텍스트, 이미지, 오디오 등의 데이터가 타인 저작권을 침해하거나 침해를 유도하지 않도록 유의해야 한다는 내용도 포함됐다. 아울러 '인간의 창작적 개입 없는 AI 산출물'에 대한 저작권 등록은 불가능하다는 내용 등이 실렸다.
다만 SW업계는 이에 대해 반발하고 있다. 한국소프트웨어산업협회 산하 초거대AI추진협의회는 해당 안내서에 대해 '학습 데이터에 대해 적법한 권한을 확보할 것을 권고한다'는 문구 삭제를 제언했다.
안내서에서 권고하는 내용에 따르면 방대한 데이터의 이용 목적, 기간, 대가 등을 건건이 협의·계약해야 한다는 의미로 풀이될 수 있다고 협의회는 지적했다. 글로벌 빅테크들이 연이어 새로운 초거대 AI 모델과 서비스를 발표하는 가운데, 이런 절차로는 신속한 기술 개발이 불가능하며 글로벌 경쟁에서 뒤처질 수밖에 없다는 것이 업계 의견이다.
권혜미 기자 hyeming@etnews.com