오픈AI·MS “딥시크, 데이터 무단 수집 가능성 ” 주장

딥시크 오픈AI
딥시크 오픈AI

오픈AI와 마이크로소프트가 중국 인공지능(AI) 기업 딥시크가 AI 모델 훈련을 위해 오픈AI 데이터를 무단으로 수집했는지 여부에 대한 조사에 들어갔다.

29일(현지시각) 월스트리트저널(WSJ) 등 외신 보도에 따르면 오픈AI와 마이크로소프트는 딥시크와 관련된 그룹이 오픈AI 데이터를 허가 없이 무단으로 획득했는지에 대한 조사를 진행 중이다.

보도에 따르면 오픈AI는 중국에 기반을 둔 기관이 자사의 AI 도구에서 대량의 데이터를 빼내려고 하는 여러 시도를 목격했다. 이는 '증류'(distillation)라고 불리는 기술적 과정을 통해 이뤄졌다. 증류는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용해 유사한 기능을 개발하는 것이다.

마이크로소프트 보안 연구원도 지난해 가을 딥시크와 관련 있을 것으로 보이는 이들이 오픈AI 애플리케이션 프로그래밍 인터페이스857(API614)를 사용해 대량 데이터를 빼돌리는 것을 관찰했다고 주장했다.

오픈AI는 경쟁사 또는 잠재적 경쟁자가 증류를 통해 기술을 구축하는 것을 허용하지 않고 있다.

오픈AI는 자사의 모델을 증류하려 한다고 의심되는 계정을 금지했고 마이크로소프트와 협력해 배후에 있는 주체를 파악했다고 외신은 전했다.

특히 최근 저비용 고성능 AI 모델을 선보인 딥시크가 자사의 데이터를 무단으로 수집했을 가능성이 있고 서비스 약관을 위반했다는 증거를 검토하고 있다고 덧붙였다.

김지선 기자 river@etnews.com