생성형 AI, 우리말 데이터 배운다…“저작권 분쟁 대비해야”

게티이미지
게티이미지

네이버 '하이퍼클로바X', 삼성전자 '삼성 가우스', LG '엑사원 2.0', 카카오 '코GPT 2.0' 등 최근 방대한 양의 한글 데이터 기반 생성형 인공지능(AI) 서비스가 잇따라 공개되면서 저작권 분쟁에 대한 우려도 커지고 있다. AI 학습의 저작권 가이드라인으로 활용할 수 있는 법안이 3년여간 국회에 잠들어 있어 국내에서도 개인과 기관 구별 없는 무분별한 소송전이 벌어질 것이란 전망이다.

최근 AI 업계에 따르면 신신업 단골 문제인 '빠른 기술 늦은 제도' 이슈가 화두로 떠오르고 있다. AI 학계와 기업 할 것 없이 AI 데이터 학습 관련 저작권 관련 법안 및 가이드라인의 필요성을 강조하고 있다. 이와 관련 현재 국회에 계류 중인 '저작권법 전부 개정안(도종환 더불어민주당 의원 2021년 발의)'의 연내 처리 목소리를 높이고 있다.

AI업계의 '저작권법 전부 개정안' 통과 요구는 법안에 있는 저작권 면책 조항에 이유가 있다. AI 학습을 위해 사용하는 데이터에 일부 면책 조항을 부여하고 관련 기준을 제시해야 성능을 키울 수 있기 때문이다. 반면 법안 처리는 불투명한 상황이다. 특히 내년 부터 정치권이 총선 모드에 들어가면 법안 처리는 뒤전으로 밀릴 가능성이 크다. 21대 국회에서 '저작권법 전부 개정안' 통과되지 않으면 자동폐기된다.

김우균 법무법인 세종 변호사는 “국내에는 유럽연합(EU), 영국, 일본 저작권법에 도입된 텍스트·데이터 마이닝(TDM) 면책규정이 국내에 없다”라며 “미국처럼 공정이용(fair use)인지 아닌지로 해결할 수밖에 없는 상황이다”라고 설명했다. 공정이용은 형식적으로는 저작물의 복제 등 저작권 침해행위에 해당하더라도 저작권법의 궁극적인 목적인 '문화의 향상발전'이라는 목표에 비추어 허용되는 행위를 말한다.

AI업계는 기업들이 올해 연달아 선보인 AI 서비스들이 본격적으로 대중과 만나는 내년부터 소송리스크가 터질 것으로 보고 있다. AI 저작권 1호 소송이 등장하고 관련 판례가 나오면 후속 소송전의 속도는 더 빠라질 것이라는 전망도 나온다.

최경진 한국인공지능법학회장(가천대 교수)은 “증거나 개연성 등이 명확해야 소송이 되기 때문에 지식재산(IP)을 보유한 기업보다는 당장 생업에 직격타를 맞는 개인 창작자들 쪽에서 생존을 위한 저작권 침해 소송이 먼저 제기될 가능성이 크다”고 말했다.

해외에선 이미 생성형 AI 개발사를 상대로 한 법적 분쟁이 이어지고 있다.

21일(현지시간) 미국 논픽션 작가연합은 미국 뉴욕주 맨하탄 연방법원에 오픈AI와 MS를 비롯한 관계사의 저작권 침해 행위에 대해 소장을 제출했다. 주요 원고는 베스트셀러 작가인 줄리안 샌튼이다. 샌튼은 자신의 저서 '지구의 끝, 벨지카 어두운 남극으로의 여행'을 오픈AI가 훈련교재로 활용, 수십억달러의 수익을 올렸다고 주장했다.

앞서 9월엔 '왕좌의 게임'의 조지 R.R. 마틴을 포함한 미국 작가조합(Authors Guild)이 오픈AI를 상대로 뉴욕 남부 법원에 집단소송을 제기했다. 지난 7월에는 미국 코미디언이자 작가인 세라 실버먼 등 작가들도 오픈AI와 메타를 상대로 저작권 침해 집단소송을 제기한 바 있다.

이성엽 고려대 교수는 “저작권법 개정이나 가이드라인 마련 등 정부가 혁신의 보폭에 맞춰야 한다”면서도 “섣부르게 규제 논의가 많이 이뤄지고 있는데, 이에 대해서도 신중하게 접근해야 한다”고 말했다.

이어 “저작권을 보호함으로써 창작 의욕을 고취하는 것도 중요하지만, AI 기능과 효용에 필수적인 면책규정도 도입함으로써 AI가 인간에게 유용한 도구 역할을 할 수 있도록 논의를 이어갈 필요가 있다”고 덧붙였다.

권혜미 기자 hyeming@etnews.com