AI 학습 데이터 적정 대가 연구, “쉽지 않네”

사진=로이터연합뉴스
사진=로이터연합뉴스

인공지능(AI) 학습 데이터에 대한 적절한 대가 지급 기준이 필요하다는 목소리가 커지고 있다. 하지만 정작 관련 연구는 시작조차 못하고 있다.

25일 조달청 나라장터에 따르면, 한국저작권위원회는 'AI 학습에 이용되는 어문저작물의 적절한 대가에 관한 연구 용역'을 올해 세 차례 발주했지만 모두 유찰됐다.

해당 연구는 데이터 거래 대가에 대한 협상 기준을 마련해 AI 개발사와 저작권자 간의 이견 차이를 좁히게 될 것이라는 점에서 주목받았다.

연구의 주요 내용은 △통상적인 어문저작물 이용에 대한 실태 파악 △AI 학습의 어문저작물 이용에 대한 기술적 분석 △AI 학습 어문저작물 이용에 대한 사례 조사 △AI 학습 저작물에 적용할 수 있는 적정한 수준의 대가 도출 등이다.

그러나 지난 5월에 올라온 첫 공고는 무응찰, 약 2주 뒤 두 번째 공고는 단독응찰로 유찰됐다.

위원회는 이달 초 사업 금액을 3500만원에서 6000만원으로 두 배 가까이 높인 세 번째 공고를 올렸지만 무응찰로 유찰됐다.

위원회 관계자는 “연구 범위가 방대하고 대내외적으로 선행연구가 많지 않아 발주하기 전부터 난도가 높을 것으로 예상하긴 했지만, 세 번 연속 유찰될 줄은 몰랐다”고 설명했다.

AI 업계에서는 AI 학습데이터와 저작권에 관련된 연구·논의가 조속히 이뤄져야 한다고 입을 모은다.

한 AI 기업 관계자는 “현재 AI 학습데이터 거래에 있어 시장에서 형성된 가격은 없다”면서 “데이터 공급사에서 주로 가격을 결정하는데 가격이 모두 제각각이라 적정 가격에 대한 합의가 어려운 상황”이라고 말했다.

한 콘텐츠 기업 관계자는 “AI 학습용 등으로 데이터를 판매할 때 이 데이터가 얼만큼의 가치가 있는지 몰라 헐값인지 비싼값인지 판단하기 어렵다”고 터놓았다.

최경진 가천대 법과대학 교수 겸 한국인공지능법 학회장은 “AI 생태계와 기존 생태계가 조화를 이루기 위해서는 AI 학습 데이터에 대한 적절한 대가 산정 기준이 필요하다”며 “수익기반·비용기반 접근 등 시나리오 베이스 등의 방식으로 기초연구를 진행해 심층 연구를 위한 토대를 마련해야 한다”고 말했다.

위원회는 지난 21일 유찰된 3번째 용역에 대한 재공고를 발주했으며, 이번 공고도 유찰될 경우 사업을 내년으로 넘기는 것을 고민 중이다.

현대인 기자 modernman@etnews.com

AI