ETRI, 4개국 신규 언어음성DB 56만건 배포

이영직 ETRI 책임연구원이 독일·러시아·아랍·베트남4개국어 언어음성DB가 들어있는 DVD를 들어 보이고 있다.
이영직 ETRI 책임연구원이 독일·러시아·아랍·베트남4개국어 언어음성DB가 들어있는 DVD를 들어 보이고 있다.

한국전자통신연구원(ETRI)은 4개국 신규 언어음성DB 56만 문장을 구축, 배포한다고 30일 밝혔다.

이 음성DB는 독일어·러시아어·아랍어·베트남어 대화체 음성DB 36만 문장과 한국어-독일어·한국어-러시아어·한국어-아랍어·한국어-베트남어 대화체 대역문장DB 20만 문장 등 8종이다.

음성인식 및 언어번역 분야 SW 개발이나 음성언어처리 연구용 기초데이터로 사용할 수 있다.

여행이나 관광, 어학 분야에 활용된다. 음성리모컨 제조업체, 외국어 교육업체, 자동통번역 서비스업체, 자동차 및 내비게이션 제조업체, 포털 등이 이용할 것으로 예측했다.

그동안 태블릿PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야에서 음성DB가 활용돼 왔다.

이 DB 배포는 미래창조과학부와 한국정보화진흥원(NIA)이 추진하는 `스마트 모바일용 다국어 언어음성DB 구축사업` 일환으로 진행됐다.

ETRI 측은 이번에 배포하는 8종 DB를 국내 10개 기관에 배포하면 최소 120억원 수입대체 효과를 얻을 수 있을 것으로 예측했다.

ETRI는 현재까지 국내 57개 기관에 247개 DB를 배포했다. 이를 비용으로 환산하면 430억원에 이른다. 삼성전자, LG전자, KT, 네이버, 카카오, 보이스웨어, 쓰리소프트, 인피니티텔레콤, 디오텍, 시리우스소프트, 시스트란 인터내셔널, 솔트룩스 등이 이 음성DB를 받아갔다.

이영직 ETRI 책임연구원이 언어음성DB 중 아랍어 문장을 검토하고 있다.
이영직 ETRI 책임연구원이 언어음성DB 중 아랍어 문장을 검토하고 있다.

ETRI는 그동안 한국어, 영어, 일본어, 중국어를 비롯한 프랑스어, 독일어, 러시아어, 아랍어, 베트남어 음성DB를 구축했다. 현재 배포 중인 DB목록은 총 37개 자료다. 음성 2300시간, 텍스트는 A4 기준 2만8000면이다.

이영직 ETRI 자동통역연구실 책임연구원은 “국가DB 사업에서 요구하는 고품질이고 국가지정 감리업체로부터 품질 합격통지도 받았다”며 “업계 신규시장 창출 및 국제경쟁력 강화에 기여할 것”이라고 말했다.

대전=박희범 과학기술 전문기자 hbpark@etnews.com