음성 웹 애플리케이션 구축을 위한 보이스 XML
박섭형 지음/한빛미디어 펴냄
바야흐로 XML시대다. 다양한 XML 애플리케이션 가운데 음성 정보를 다룰 수 있는 보이스(Voice) XML이 주목받고 있다.
음성 처리 기술은 컴퓨터에 사람의 말을 알아들을 수 있는 ‘귀’와 사람에게 말을 할 수 있는 ‘입’을 마련해주는 새로운 분야다. 키보드와 마우스를 이용하지 않고 말로 원하는 정보를 검색하고 들을 수 있다는 것은 분명 매력적인 일이 아닐 수 없다.
특히 보이스 XML은 컴퓨터의 ‘귀’와 ‘입’을 인터넷 환경에서 자유롭게 이용할 수 있는 도구를 제공해 준다. 인터넷과 웹이라는 정보통신 시대를 주도하는 기술과 음성 기술을 접목할 수 있는 보이스 XML은 음성 인식과 음성합성 기술을 다루는 여러 관련 기업에 새로운 시장을 제공할 것이다.
보이스 XML을 이해하기 위해서는 웹 기술과 함께 음성 인식이나 합성에 관한 기초적인 지식을 갖고 있어야 한다. 이런 점이 보이스 XML에 쉽게 접근하기 어렵게 만드는 요인이다. 보이스 XML에 관한 책은 현재 전세계적으로 4권 정도만 출간됐을 정도로 제대로 된 자료를 구하는 일이 쉽지 않다.
또한 보이스 XML 자체는 언어와 독립적이지만 음성 합성과 음성 인식에 사용되는 기술은 언어와 매우 밀접한 관련이 있기 때문에 한글 책이 꼭 필요하다고 생각한다. 이런 시점에 우리 글로 된 보이스 XML 책이 출간된 것에 대해서 기쁜 마음을 금할 수 없다.
필자가 학생이었던 시절 새로운 기술을 배우기 위해서는 영어로 쓰여진 원서와 씨름을 해야만 했다. 한글로 된 책이 있었다면 쉽게 공부할 수 있었던 내용도 영어를 번역하면서 읽느라 더 많은 시간을 투자해야만 했다. 전세계에서 쏟아지는 새로운 기술 정보를 영어로만 접해야 하는 우리의 현실에서 새로운 기술을 우리 글로 접한다는 것은 매우 의미 있는 일이다.
이 책은 보이스 XML 기술 자체에 대한 입문서인 동시에 보이스 XML을 사용하여 음성 정보 제공 서비스를 구축하려는 음성 콘텐츠 개발자들이 꼭 공부해야 하는 보이스 XML 프로그래밍 기술서의 성격도 겸하고 있다. 이 책은 보이스 XML이 무엇인지, 왜 만들어졌는지, 어떤 경우에 써야 하는 언어인지를 쉽게 설명하고 있다.
또 보이스 XML 스크립트로 만든 여러 가지 예제들을 함께 수록하였기 때문에 웹 프로그래밍에 익숙하지 않은 CTI(Computer Telephony Integration:컴퓨터와 전화 시스템을 통합해 컴퓨터의 제어 기능을 전화기에 접목시킨 기술) 분야의 엔지니어들도 쉽게 접근할 수 있다. 보이스 XML을 이용하여 음성 정보 시스템을 구축하는 일은 그리 간단한 일이 아니다. 아직까지 생소한 분야이므로 그 선례가 많지 않으며, 음성 인식·합성 기술이 완벽한 단계에 이르지 못했기 때문에 사용자 편의성을 고려하여 시스템을 구축해야 하는 노하우도 필요하다. 따라서 이 책에 실린 많은 예제 프로그램은 웹 또는 CTI 프로그래머에게 좋은 참고가 되리라 생각한다. 또한 음성신호처리 전공자이며 많은 실무 경험을 가지고 있는 저자가 쉽게 풀어낸 음성 인식·합성 기술에 대한 친절한 설명으로 보다 쉽게 이해할 수 있을 것이다.
인터넷, 휴대폰 등이 일반화되고 세계 어느 나라보다 다양한 서비스가 활성화되고 있는 우리나라의 환경에서 볼 때 음성 인터페이스 분야의 주요 기술인 보이스 XML에 관한 좋은 책이 국내에서 발간되었다는 것은 매우 시기 적절하다. 음성 기술 분야 종사자는 물론 일반인들이나 웹 프로그래머들에게도 이 책을 꼭 읽어 보길 권한다.
<이윤근 보이스웨어 기술연구소장(공학박사) yklee@voiceware.co.kr>