KT가 인간의 감정을 담은 인공지능(AI) 음성합성 콘텐츠를 제작할 수 있는 'AI 보이스 스튜디오'를 출시했다.
AI 보이스 스튜디오는 100개의 AI 목소리를 활용해 즐거움, 침착함, 중립, 슬픔, 화남의 5가지 감정으로 합성할 수 있다. 이 AI 보이스를 활용해서는 영상 등 오디오 합성 콘텐츠를 제작 가능하다.
KT AI 보이스 스튜디오는 국내 최초로 적용된 '감정 더빙' 기술이 탑재돼 있다. 감정 더빙 기능을 활용하면 AI 보이스를 내가 낭독한 감정 그대로 더빙할 수 있어, 생생한 AI 음성을 만들 수 있다. AI 목소리는 한국어, 영어, 중국어, 일본어 4개국어로 '다국어 합성'이 가능하다.
KT는 매력적인 AI 보이스를 제공하기 위해 유명인들의 음성을 AI로 제공하는 '셀럽 AI 보이스'도 선보인다. 첫번째 셀럽 AI 보이스는 가수 윤도현이다. 윤도현의 목소리로 낭독체와 대화체를 제공한다. KT는 '밀리의서재'와 협업해 AI 윤도현의 목소리로 책 '인간관계가 힘들어서 퇴사했습니다'를 오디오북으로 제작했다.
KT AI 보이스 스튜디오의 웹 버전은 월별 AI 보이스 제공량에 따라 프리(무료, 4000자) △베이직(1만2000원, 2만4000자) △프로(4만8000원, 12만자) △프로맥스(12만원, 38만4000자) 로 제공한다. AI 보이스 스튜디오의 API 버전은 kt 클라우드를 통해 월 기본료 10만원에 제공한다.
가수 윤도현은 “ 윤도현 AI 보이스로 생성한 작품의 수익금은 전액 환경단체와 저소득층 아동 지원단체에 기부하겠다”고 말했다.
최준기 KT AI·빅데이터사업본부장은 “KT만의 차별화된 AI 기술로 인간에 가까운 감정을 표현하는 등 AI 목소리의 가치를 향상시켰다”며 “향후 그룹사를 비롯한 다양한 파트너와 협력해 더 혁신적인 AI 보이스 스튜디오 서비스를 지속 출시하겠다”고 말했다.
정예린기자 yeslin@etnews.com