[2020 AI노믹스 산업지도]1인방송도 AI 도입 봇물…24시간 시청자와 소통 '보이스폰트'

[2020 AI노믹스 산업지도]1인방송도 AI 도입 봇물…24시간 시청자와 소통 '보이스폰트'

1인 방송 플랫폼에도 인공지능(AI) 적용이 활발하다. 아프리카TV는 팟캐스트 '팟프리카'에서 AI 음성합성 기술이 적용된 TTS(Text To Speech)를 도입했다. 스튜디오에서 녹음을 하면 추출된 음성을 기반으로 사람과 똑같은 목소리를 내는 '보이스폰트'가 만들어진다. 음색뿐 아니라 독특한 말투, 억양까지 흉내낸다.

아프리카TV 자회사 프릭엔은 지난 9월 TTS 개발 및 활용을 위해 마인즈랩과 손을 잡았다. 마인즈랩은 AI 핵심 알고리즘부터 엔진, 플랫폼 종합서비스를 제공하는 AI 전문기업이다. 특히 마인즈랩 TTS 기술은 딥러닝을 통해 매우 적은 음성 표본으로도 실제 목소리에 가깝게 재현해내는 것이 특징이다. 500개 정도 문장만 녹음해도 대상 목소리를 똑같이 구현해 낼 수 있다.

아프리카TV는 '2019 아프리카TV BJ 대상'에서 캐스터안(안준모) 버전 보이스폰트를 최초 공개했다. 캐스터안은 아프리카TV 파트너 BJ이자, 팟프리카에서 AJ(Audio Jockey)로도 활동 중이다. 음색이 독특해 누구나 캐스터안 음성을 쉽게 구분할 수 있다는 측면이 고려됐다. 새해부터는 다른 AJ 보이스폰트도 추가된 정식 버전이 선보일 예정이다.

음성합성 자체는 새로운 기술이 아니다. 네이버는 이미 지난해 배우 유인나 목소리를 합성해 오디오북과 '클로바'에 구현했다. 보이스폰트는 이 같은 경우를 인터넷 방송인으로 확장한 사례다. 아프리카TV 플랫폼이 보유한 고유 콘텐츠를 AI 기술과 연결했다.

보이스폰트를 활용하면 AJ가 직접 방송을 하는 시간 외에도 다양한 방식으로 시청자와 소통할 수 있다. 직접 녹음하지 않고도 저비용으로 오디오북을 제작하고, 좋아하는 AJ 음성으로 뉴스를 읽어달라고 할 수도 있다. 방송 중에도 시청자에 대한 피드백을 자신의 보이스폰트로 전달할 수 있다.

궁극적으로는 AI AJ가 24시간 쉬지 않고 라디오 방송을 진행하는 콘텐츠도 기대해볼 수 있다. 음악과 토크 중심으로 진행하는 방송이라면 AI가 중간중간 시청자 사연까지 소리 내 읽어주는 방식이다. 현재는 라디오방송 위주로 기술이 적용됐지만 향후 인터넷 영상 방송까지 저변을 넓힌다.

[2020 AI노믹스 산업지도]1인방송도 AI 도입 봇물…24시간 시청자와 소통 '보이스폰트'

컴퓨터비전 딥러닝과 증강현실(AR) 기술이 적용된 '프리캣AR마스크' 서비스도 있다. 좋아하는 BJ 얼굴을 이용자 얼굴과 합성가능한 기술이다. 3분 이내 짧은 영상 콘텐츠를 올리는 아프리카TV '프리캣'을 재미있게 즐기기 위한 기능이다. AR 전문기업 시어스랩이 AR기술을 공급한다.

보이스폰트나 AR마스크 모두 향후 다양한 상품으로 확장될 수 있다. 보이스폰트는 구독경제 형태나 마케팅과 연계한 서비스를 고려할 수 있다. AR마스크는 유료 기능 추가 구입 형태로 수익을 확보할 수 있다. 아프리카TV와 BJ 모두 별풍선 이외 콘텐츠 수익 모델을 다각화할 수 있는 방편이 된다. 아프리카TV는 향후에도 다양한 AI 전문기업과 협업을 통해 콘텐츠와 결합된 서비스를 지속 추가할 계획이다.

김영종 프릭엔 대표는 “일상에서 체감하기 어려운 AI기술을 이용자가 매일 소비하는 콘텐츠 안에서 체험할 수 있다는 측면에서 매력적인 서비스”라며 “다양한 이용자가 참여해 창작 형태를 확대할 수 있는 방안을 고려 중”이라고 말했다.

이형두기자 dudu@etnews.com