전화선을 통해 음성을 인식할 수 있는 기술이 개발돼 업계의 관심을 모으고 있다.
미국의 스피치웍스사가 개발한 「신경네트워크기술」은 전화를 통해 구어체 대화를 인식할 수 있는 혁신적인 기술이다.
이 기술이 실생활에서 가장 쉽게 적용될 수 있는 분야가 전화자동응답시스템(ARS)이다. 기존에는 음성인식이 안됐기 때문에 자동응답시스템의 작동은 대개 전화기의 숫자버튼에 의해 이뤄졌다. 「예」면 1번, 「아니오」면 2번을 누르라는 식이다.
하지만 신경네트워크기술이 적용된 자동응답시스템은 이러한 과정을 모두 음성으로 처리하게 해준다. 놀라운 것은 「예」 「아니오」 한 단어만 인식하는 것이 아니라 수십가지의 가능한 대답을 처리할 수 있다는 점이다. 즉 예라는 대답에도 영어에서 「Yep, Yeah, Correct」 등 20여가지의 구어체 단어가 있는데 이를 모두 분석·처리해 인식할 수 있다는 것이다. 더 나아가 응답자의 답변에 따라 컴퓨터의 다음 질문도 달라질 수 있다.
이같은 음성처리는 스피치웍스사가 개발한 「다이얼로그 모듈」에 의해 이뤄진다. 대부분의 음성인식시스템이 이 부분에서 일단 음성신호를 강제적으로 20㎳ 단위로 분할한 후 분석과정을 거치는 데 비해 다이얼로그 모듈은 처음부터 어떤 음소가 연속적인 음성을 자연스럽게 분할할 수 있는지 추측한 후 분할과정에 들어간다. 이러한 방법으로 기존 시스템에 비해 5배 정도의 시간을 절약할 수 있게 된 것이 이 기술의 핵심이다.
이미 스피치웍스의 이 기술은 세계적인 택배회사인 「페더럴익스프레스(FedEX)」나 「E트레이드」 등의 대규모 기업에서도 채택되고 있어 앞으로 자동응답시스템 분야에 혁신을 가져올 것으로 예측되고 있다.
자세한 정보는 스피치웍스사의 홈페이지(http://www.speechworks.com)에서 찾아볼 수 있다.
<구정회기자 jhkoo@etnews.co.kr>