<음성정보기술산업 워크숍>기술개요 및 국내외 산업동향

◆김형순 부산대 전자공학과 교수

음성은 가장 자연스런 전달수단으로서 다양한 전달이 가능하며 간단한 입출력장치만으로 화자의 감정정보까지 전달한다. 이는 인간과 기계간 인터페이스에 활용될 수 있다. 음성명령에 의한 제어·정보제공·음성인증 등이 그것이다.

이를 위해서는 음성인식, 음성합성, 화자인식, 음성부호화, 음질개선, 음성변환, 언어인식, 음성처리 기반기술(음성DB 구축, 음성입출력 평가, 언어처리) 등이 다양하게 요구된다.

음성정보기술을 기반으로 하는 학문분야도 전자공학통신·신호처리, 전산학 자연언어처리, 음성학, 언어학, 통계학, 음향물리학, 생리학, 심리학 등 다양하다.

이 산업은 복합적인 학문분야 및 기술이 요구되며 동시에 고부가 기술집약 산업이란 특징을 가진다. 또 벤처기업 주도의 생산구조에 적합하다는 속성을 갖고 있다.

게다가 다양한 응용분야에 파급효과가 커 미래의 전략산업으로 육성돼야 한다. 가전·컴퓨터·정보통신·자동차·기계·유통산업 등에서의 파급효과가 특히 크다.

예를 들어 정보통신분야에서 음성포털서비스(증권정보 등의 전화정보서비스 및 음성다이얼링), 음성타자기, 음성명령, 음성자동정보검색, 자동통역시스템은 물론 신체장애자용 기기제작에도 필수적이다.

향후 전화망의 음성관련 시장규모만도 3년내 350억달러 규모에 이를 정도로 잠재력이 크다.

미국·일본·유럽국가들은 지난 70년대 이후 국가주도로 연구를 통해 기반기술을 확보, 매년 100% 이상의 시장증가세를 보이고 있다. 또 많은 업체들이 음성포털서비스를 진행하고 있고 컴퓨터·PDA·자동차·장난감 등에 음성명령기능을 장착하고 있다. 음성처리 전용칩의 상품화 및 오류율 1% 수준인 화자인증시스템의 상품화도 이뤄지고 있으며 음성기반의 인터넷 검색 표준언어인 VXML(Voice eXtensible Markup Language)로 제정됐으며 마이크로소프트사의 SAPI 5.0이 발표됐다. 우리나라에서는 지난 99년 이후 전문업체들이 등장해 음성브라우저 개발, 음성포털서비스 등을 진행하고 있다. 그러나 음성기술평가연구 등에서 외국 선진업체에 크게 뒤져 있다.