ETRI, 5개 국어 음성·영어대역 문장DB 배포

다국어 언어음성DB의 역할과 활용
다국어 언어음성DB의 역할과 활용

한국전자통신연구원(ETRI)은 5개 국어 음성 데이터베이스(DB)와 영어대역문장 DB를 국내에서 처음으로 일반에 배포한다고 27일 밝혔다.

ETRI는 태국어, 말레이어, 인도네시아어, 아랍어, 베트남어 대화체 음성 DB 200만 발화를 제공한다. 음성 DB는 최근 인기 있는 인공지능(AI) 스피커, 내비게이션, 사물인터넷(IoT) 등 음성인식 및 번역 소프트웨어(SW)개발에 기초가 되는 자료다.

또 '영어〃태국어', '영어〃말레이어', '영어〃인도네시아어', '영어〃아랍어', '영어〃베트남어' 대화체 대역 문장DB 300만 문장도 배포한다. 태국어, 말레이어, 인도네시아어 자료는 국내 최초로 제공되며 아랍어와 베트남어는 기존 ETRI 자료에 데이터양을 늘려 배포한다.

이 자료를 활용하면 관련 DB 구축 비용을 대폭 절감할 수 있다. 해외 업체로부터 DB를 구입하면 언어 당 1~2억 원 비용이 소요된다. ETRI는 해외 DB 가격 대비 5% 수준에서 정보를 제공할 예정이다.

ETRI는 최대한 많은 사람의 언어 데이터를 얻기 위해 크라우드 소싱 기법을 도입했다. 포인트를 제공해 일반 사용자들의 참여를 유도한 결과 총 2만5000여 명이 발화에 참여했으며 같은 예산으로 기존보다 최대 8배 많은 데이터를 수집할 수 있었다.

정확도도 높다. 이미 외부 감리 업체 측정 결과 99% 이상의 높은 품질을 인증 받았다. 많은 양을 축적한 데이터를 토대로 집단 지성 검증 시스템을 도입한 결과다.

윤승 음성지능연구그룹 박사는 “이번 DB를 활용해 언어음성기술을 개발할 경우, 다양한 외국 신규시장 진출과 경쟁력 강화가 가능할 것”이라고 말했다.

대전=김영준기자 kyj85@etnews.com