음성정보처리기술은 정부가 선정한 6대의 유망기술 중 하나로 선정한 기술로 디지털신호처리·언어학·음운학·심리학 등의 복합적인 기술들을 바탕으로 하고 있다. 언제 어디서나 사람의 목소리를 기계가 알아듣고 그 언어의 정보를 파악해 컴퓨터나 그 외의 모든 시스템이 그에 합당한 조치를 취한다.
이 같은 음성정보기술은 접목분야도 다양해 시스템과 제품을 쉽고 편리하게 사용할 수 있는 서비스를 제공하는 21세기 정보사회를 선도하는 기술로 자리잡고 있다.
광운대학교 음성정보처리기술연구센터(SITRC: Speech Information Technology Research Center·센터장 김순협 교수)는 이 같은 미래 음성정보기술의 뿌리를 다지기 위해 지난해 12월에 설립된 국내 최초의 대학 연구기관으로 주목받고 있다.
정보통신부에서 주관하는 대학 IT연구센터 육성 지원사업에서 서울대학교·한국정보통신대학교·인제대학교와의 치열한 경쟁을 벌여 선정된 이 센터는 국내 첫번째 음성정보처리기술연구센터로의 의미도 가지고 있다. 음성정보처리기술연구센터는 광운대 김순협 교수를 센터장으로 광운대 강철호·박호종 교수, 숭실대 배병진·이기용 교수, 한양대 강상원·김동우 교수 등 9명의 교수진과 27명의 석박사과정 연구원 4명을 구성원으로 하고 있다. 여기에 업체 연구원(메텔·웹프로텍)이 참여해 산학을 연계한 연구시스템을 구축하고 있다.
특히 이 센터에 참여하는 연구진은 모두 기존에 많은 프로젝트를 공동으로 수행해 우수한 연구결과를 창출한 경험을 가지고 있는 핵심인력들이다.
연구기간은 2001년 12월 1일부터 2005년 11월 30일까지 총 4년으로 매년 정부에서 4억5000만원씩 총 18억원을 지원받게 된다.
이 센터는 이동환경에서 무선단말기를 사용자가 편리하게 사용할 수 있도록 음성제어가 가능한 지능형 정보처리시스템 개발과 그 응용을 통한 산업화를 추진하는 것으로 목표다. 이와 함께 본격적인 시장활성화에 접어든 국내 음성분야에 고급 전문인력을 양성, 배출하는 중요한 과제를 수행하고 있다.
이미 이 센터는 음성인식·음성코딩·발성전환·무선네트워킹 분야에서 국내외 특허등록 출원 54건을 보유하고 있다. 짧은 기간이지만 다양한 프로젝트 실행(40건) 및 산합협동 실적(22건)으로 공동연구를 실제 상품으로 이끌어내기도 했다.
음성정보기술연구센터의 주요 과제는 미래 통신 기반이 되는 이동환경에서의 사용자가 편리하게 사용할 수 있는 지능형 음성정보처리시스템 개발이다.
즉 지능형 무선단말기 개발, 무선음성 단말기를 이용한 증권거래시스템 개발, 무선 음성단말기를 이용한 음성포털시스템 개발이 이 센터의 최종 결과물이 된다.
지능형 무선단말기(PDA)에는 화자인증·음성인식·음성합성 기능이 탑재된다. 화자 증은 무선단말기가 자신의 스케줄관리 전화메모 등의 개인적 성향을 띠므로 자신만이 사용할 수 있도록(또는 등록된 사용자만이 사용할 수 있도록) 등록된 사용자의 목소리를 분석해 무선단말기에 등록된 사람만이 사용 가능하도록 해줌으로써 비밀번호를 음성으로 대신할 수 있게 된다. 음성인식은 무선단말기를 사용할 때 펜으로 눌러서 실행하는 방법을 사용하고 있는데 명령어(일정관리·계산기·알람설정)를 음성으로 대신하고자 하는 기술이다. 따라서 이동중에 펜을 눌러서 실행시키던 것을 음성으로 프로그램을 실행시키고 그에 대한 음성합성으로 들려주면 이동중에도 편리하게 사용할 수 있다.
지능형 무선 음성단말기를 이용한 서비스시스템은 일상의 정보(스포츠·신문·전자상거래·음성메일·기상정보)를 음성으로 이용이 가능하며 이동중에도 대화명음성(예:삼성전자 200주를 15만원에 매수하겠습니다)으로 자유로운 증권거래(매수·매도·시황정보)가 가능한 포털시스템이다.
이를 개발하기 위해 센터는 음성인식·화자인증·음성합성·무선네트워킹 등의 세부기술 개발에 중점을 두고 있다.
제1 세부과제는 이동환경에서 음성·화자인식 기술연구다. 이는 증권거래 음성인식 엔진개발, 음성포털시스템 인식 엔진개발, 잡음채널 왜곡 보상기술 개발, 화자인식 엔진개발 등으로 시스템의 핵심 엔진개발과 배경잡음과 채널왜곡 등을 줄이는 연구다.
제2부 과제는 음성 합성·변환 기술 연구로 음성합성, 변환 알고리듬 연구, 언어처리 연구, 발성변화 연구, 고성능·저용량 음성합성엔진 개발을 통해 사람이 말하는 것처럼 자연스러운 시스템 응답을 들려주기 위한 연구다.
제3부 과제는 무선음성 통신 및 네트워킹 연구다. 전송부호화 기술연구, 음성압축 알고리듬 개발, 무선자원할당 기술연구, 무선접속 프로토콜 최적화 등의 연구를 통해 무선 환경에서의 정보손실 최소화를 통한 시스템의 안정화와 인식률을 보장하기 위한 연구로 제1 세부과제와 연계성을 가지고 있다.
이 같은 과제를 수행하기 위해 이 센터는 음성 데이터베이스를 구축할 수 있는 방음 스튜디오를 갖추고 음성인식·음성합성·화자인증·잡음처리 등의 연구에 필요한 연속음성, 단어 데이터베이스를 자체적으로 구축하고 있다. 또 데이터베이스 작업을 위한 효율적인 음소 분리·분석 작업까지 추진하고 있다.
음성 관련기술에 대한 해외 기술동향을 파악하고 교류하기 위해 루슨트테크놀로지스·CMU 등 음성기술 전문기업은 물론 일본 와세다대학·도쿄대학과도 공동으로 연구를 추진하고 있다.
최근 센터는 전문인력의 배출을 위한 국제 국내 학술교류와 산학협력 세미나 행사를 준비하고 있다. 음성정보기술에 대한 연구에 그치는 것이 아니라 이를 공개하고 업계와 기술을 공유해 본격적인 성장기에 접어든 국내 음성정보산업에 센터의 연구 결과물이 실질적인 도움을 줄 수 있도록 나선다는 계획이다.
<윤대원기자 yun1972@etnews.co.kr>
관련 통계자료 다운로드 지능형 음성인식시스템 개념도