중국 인공지능(AI) 스타트업 성수AI(Shengshu AI)가 30일(현지시간) 텍스트를 영상으로 생성해주는 AI 시스템 '비두(Vidu)'를 정식 출시했다고 홍콩 사우스차이나모닝포스트(SCMP)가 보도했다.
비두는 챗GPT 개발사인 오픈AI의 영상 생성 AI 모델 '소라(Sora)'의 대항마로 불린다.
비두는 중국어와 영어 텍스트나 이미지를 입력하면 1080픽셀 화질의 4초 또는 8초의 영상으로 생성할 수 있다. 웹사이트와 응용프로그램인터페이스(API)를 통해 이용할 수 있다.
중국 베이징에 본사를 둔 성수AI는 지난해 3월 칭화대 AI 산업 연구소팀이 중심이 돼 설립이 됐다. 올해 2월 오픈AI가 소라를 공개한 지 단 2개월 만에 비두를 공개해 관심을 모았다.
성수AI에 따르면 비두는 30초만에 4초 분량의 영상을 생성할 수 있다. 유사 영상 생성 AI 도구가 비슷한 길이의 영상을 생성하는 데 보다 오랜 시간을 요구하는 것과 비교하면 매우 빠른 점을 내세웠다.
성수AI는 비두가 텍스트나 이미지를 영상으로 변환하는 것에서 나아가 애니메이션이나 콘텐츠 산업에서의 상용화 기반을 마련했다고 밝혔다. 사용자가 실제 사람이나 캐릭터 이미지를 업로드하고 간단한 텍스트 프롬프트를 활용해 사람이나 캐릭터에 생명을 불어넣는다는 것이다.
궁극적으로 AI 도구를 영화 등 기존 산업에 통합하는 것이 목적이라고 강조했다.
중국 언론에 따르면 성수AI 공동창업자이자 최고경영자(CEO)인 탕 지아위는 이번 주 개최된 중국 최대 게임쇼 '차이나조이 2024' 애니메이션, 만화, 게임 분야에서 비두의 응용 프로그램을 시연했다.
또 비두는 AI 기술을 활용해 3차원 단편 애니메이션 '라스트 로봇'을 제작하고, 중국 산서성에 있는 영락궁 벽화 등 문화 유물을 디지털로 복원하는 데도 사용됐다.
중국에는 비두 이외에도 지푸AI(Zhipu AI), '틱톡'의 라이벌로 불리는 콰이쇼우테크놀로지에서 출시한 영상 생성 AI 서비스가 있다.
김명희 기자 noprint@etnews.com
-
김명희 기자기사 더보기