W3C, 보이스XML2.0 베타판 발표

 음성으로 컴퓨터와 웹을 사용할 수 있는 시대가 한발짝 더 다가왔다.

 C넷에 따르면 웹의 주요한 표준 그룹인 W3C(World Wide Web Consortium)는 최근 ‘보이스XML 2.0’ 베타판을 발표, 상용화에 한걸음 더 다가섰다.

 ‘보이스XML2.0’은 사람의 음성을 통해 컴퓨터와 인터넷을 사용하는 소위 ‘음성 포털’의 획기적 발전을 가져다 줄 것으로 기대되는 신기술로 W3C의 최종 승인을 눈앞에 두고 있다. W3C 산하 ‘보이스 브라우저 액티비티’가 개발하고 있는 이 기술은 사람의 자연어와 분석어를 사용해서 웹콘텐츠와 애플리케이션을 이용할 수 있도록 하고 있다. 이때문에 운전중이거나 시각장애인들이 웹을 사용할 때 등 여러 방면에 응용할 수 있다.

 이번 베타판 발표와 관련, W3C의 ‘보이스브라우저실무그룹’ 공동 의장 겸 인텔의 고급 휴먼I/O 매니저인 짐 라르손은 “보이스XML 2.0기술이 음성으로 컴퓨터를 작동하는데 있어 획기적 발전을 가져다 줄 것”이라며 “이 기술이 W3C가 추진하고 있는 음성 인터페이스 규격 중 핵심을 이루고 있다”고 말했다.

 실제 W3C는 보이스XML 기술 말고도 ‘SSML’(The Speech Synthesis Markup Language:컴퓨터가 단어를 어떻게 말해야 할지 다루는 기술), ‘SRGS’(The Speech Recognition Grammar Specification:사람이 컴퓨터에 응대해야 하는 단어를 다루는 기술), ‘시맨틱인터프리테이션’(Semantic Interpretation for Speech Recognition:문서를 축약하고 인간 언어를 컴퓨터가 이해할 수 있도록 바꾸는 기술) 같은 음성언어 기술을 연구하고 있다.

 라르손은 “SSML 등은 모두 음성 애플리케이션의 한 면만을 다루고 있다”고 덧붙이며 “음성포털을 진정 가능케 해주는 것은 바로 보이스XML 기술”이라고 강조했다. W3C 말고도 마이크로소프트(MS)·인텔·필립스·시스코시스템스 같은 대형 IT기업들이 설립한 SALT(Speech Application Language Tags)포럼도 W3C와 협력, 음성포털 연구를 진행하고 있다.

 전문가들은 보이스XML이 “음성 포털 시장을 개화하는 데 있어 상당한 모멘텀(원동력)을 제공할 것”이라고 이구동성으로 지적하고 있다.

 하지만 W3C가 ‘보이스XML2.0’을 상용화하는 데 있어 지재권 문제가 난제로 작용하고 있다. 이는 이전 ‘보이스XML1.0’ 버전을 W3C가 개발한 것이 아니라 AT&T·IBM·루슨트·모토로라 등이 설립한 ‘보이스XML포럼’에서 만들었기 때문이다.

 보이스XML포럼은 지난 2000년 5월 연구결과를 W3C에 넘겨 준 바 있다.

 ‘보이스XML포럼’은 랜드(RAND)라는 정책을 실시, 합리적이고 비차별적 조건이라면 회원사들이 지적재산권을 유지할 수 있도록 했다. RAND 정책은 작년에야 로열티를 받지 않는 것으로 수정됐는데 로열티 비과세 문제는 W3C가 작년에도 재천명한 것과 맥을 같이 한다.

 그러나 ‘보이스XML’ 기술은 RAND 조건에서 개발됐기 때문에 이의 코드 개발에 공헌한 일련의 기업들은 W3C의 로열티 비과세 정책에 반발, 상용화 발목을 잡고 있는 것이다.  

 <방은주기자 ejbang@etnews.co.kr>