AI 오디오 기업 수퍼톤이 게임과 영화, 애니메이션 등 각종 콘텐츠에서 활용할 수 있는 AI 기반 실시간 음성 변환 서비스 '수퍼톤 시프트(이하 시프트)'의 글로벌 오픈 베타를 시작한다고 15일 밝혔다.
시프트에 탑재된 10개 캐릭터 음성 중 하나를 선택하면, 사용자 목소리가 발화 즉시 캐릭터 목소리로 실시간 송출된다. 콘텐츠 크리에이터나 제작자는 시프트를 콘텐츠 다양성과 완성도를 높이는 창작 도구로 활용 할 수 있다.
시프트는 수퍼톤 공식 홈페이지에서 무료로 다운로드해 사용할 수 있다. 수퍼톤은 오는 6월 26일까지 오픈 베타 기간을 거쳐 올 하반기 중 정식 론칭한다는 계획이다.
시프트는 △자연스러운 음성 발화 스타일 △실시간 수준으로 음성변환 속도 단축 △10초 만에 사용자 목소리를 캐릭터로 커스텀하는 기능 등 높은 기술력과 편의성을 자랑한다.
시프트는 실제 사람 발화에 가깝게 자연스럽고 섬세한 음성을 구현하는 것이 특징이다. 수퍼톤이 자체 개발한 음성합성 파운데이션 모델 '낸시(NANSY, Neural Analysis & Synthesis)'를 기반으로 만든 시프트는 사용자 음성을 음색·발음·음고·강세 등 4개 구성 요소로 빠르게 분석해 사용자와 캐릭터의 목소리를 실시간 변환한다. 이를 통해 기계음은 물론, 외부 노이즈를 없애고 깨끗한 음성을 출력한다.
또 음성을 빠르게 변환시켜 즉각적 의사소통을 지원한다. 수퍼톤은 음성이 출력돼 청자에게 도달하기까지 걸리는 지연 시간을 청자가 인지하지 못하는 수준인 47ms(밀리 세컨드, 1000분의 1초)까지 단축시켰다. 이는 세계적으로도 뛰어난 수준이다.
사용자 편의성도 높였다. 사용자 음성 분석을 위해, 시프트가 제시한 10초 가량 샘플 대본을 읽으면 바로 사용자가 선택한 캐릭터로 음성 변환이 시작된다. 커스커마이징도 가능하다. 시프트는 사용자와 캐릭터 음성 간 혼합 비율이나 감정 표현 정도, 음 높낮이 등 음성 구성 요소 값을 조절할 수 있는 기술 도구를 탑재해 사용자 취향이나 사용 목적에 맞춘 음성을 자유롭게 생성할 수 있다.
이 같은 장점을 활용해 버튜버나 스트리머, 팟캐스터가 개성 있는 목소리로 구독자에게 색다른 청취 경험을 선사하거나 게이머와 코스튬 플레이어가 게임 캐릭터 목소리로 타 이용자와 음성 채팅을 즐기며 게임 몰입감을 높일 수 있다.
이교구 수퍼톤 대표는 “제작사와 크리에이터가 손쉽게 시프트를 사용할 수 있도록 다양한 의견을 수집하는 것이 이번 오픈 베타의 가장 큰 목적”이라며 “정식 출시 버전에는 목소리 샘플을 확대하고 콘텐츠 제작에 유용한 기능들을 추가 탑재하는 등 시프트가 최적의 목소리 목소리 창작 도구로 널리 사용될 수 있도록 노력해 나가겠다”고 말했다.
김명희 기자 noprint@etnews.com
-
김명희 기자기사 더보기