과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주최하고, 음성 인식·데이터 전문기업 미디어젠이 주관한 '2021 다화자 TTS(문자음성변환)·감성 TTS 해커톤 대회'에서 '스피커브레이커'팀이 영예의 대상을 안았다. 스피커브레이크팀은 같이 열린 '화자인식' 부문에서도 장려상을 따내며 3관왕에 올라 올해 해커톤 최고의 팀이 됐다.
미디어젠은 지난 8일부터 약 2주간 비대면 온라인 방식으로 '다화자 음성합성 데이터' '감성·발화 스타일별 음성합성 데이터' 2개분야 기술경연을 진행, 주요 수상팀을 선정해 22일 시상했다.
2개부문 통합 대상에 이어 양쪽 모두 모델을 만들어 제출한 'SPAI'팀이 장려상을 수상했다.
참가팀들은 온라인 경연기간 동안 미디어젠이 제공한 음성인식 데이터 세트를 활용해 각분야 과제에 부합하는 데이터 처리·인식 시스템과 모델을 만들어냈다. 온라인으로 진행된 심사에선 제출한 모델 소개와 산출물 설명, 심사 직전 제공한 테스트 데이터를 활용한 최종 결과 등을 근거로 우수팀이 가려졌다.
대상을 받은 '스피커브레이커' 팀 문성우 팀장은 “대회를 치르면서 새로운 TTS를 경험할 수 있어 매우 흥미로웠다”며 “다양한 개발목표와 지향점을 접해 볼 수 있는 기회가 되어 재미있는 경험이었다”고 소감을 밝혔다.
송민규 미디어젠 상무는 “다화자 음성 합성, 감성·발화스타일 음성합성 분야는 기본 베이스 모델과 다른 화자 음성 특성을 반영해 음질을 변화시켜야하는 매우 어려운 기술”이라며 “짧은 훈련 기간에도 매우 높은 수준의 결과가 제출돼 기쁘며 이번 발굴된 기술과 인력이 향후 개인화 서비스를 발전시키는 초석이 되기를 기대한다”고 말했다.
안수민기자 smahn@etnews.com
-
안수민 기자기사 더보기