“기술보다 더 중요한 것은 정확한 비즈니스 모델입니다.”
박상규 전자통신연구원(ETRI) 음성언어정보연구부장은 음성인식 기술의 활성화에 필요한 요소를 이같이 지적했다. 음성인식 기술의 인식률보다는 어떤 디바이스와 만났을 때 최적의 시너지를 이끌어낼 수 있을지를 따져봐야 한다는 의미다. 그는 “휴대폰에 음성인식 기술이 도입됐지만, 불편하다고 여겨 아예 쓰지 않는 사람이 대부분”이라며 “음성인식 기술이 꼭 필요한 IT제품을 가려 맞춤형 기술을 개발하는 데 주력해야 한다”고 강조했다. 그렇다고 그가 보는 음성인식기술의 미래는 암울한가. 그렇지 않다. 박 부장은 음성인식기술에 날개를 달아줄 두 번의 기회에 주목했다. 바로 IPTV의 출현과 모바일 디바이스의 지능화다.
그는 TV와 인터넷이 결합한 IPTV에 대해 “IPTV는 속은 인터넷이지만, 겉은 텔레비전”이라며 “이용자들은 TV에서 리모컨 재핑을 하듯 간편하게 콘텐츠를 검색하기를 원하므로 리모컨 등에 음성인식기술을 적용하려는 시도가 나올 것”이라고 내다봤다. 최근 인터넷 검색기능을 강조한 스마트폰도 음성인식기술업계에 호재다. 지난해 11월 동영상을 통해 선보인 구글의 ‘안드로이드폰’의 핵심기술 중 하나도 누앙스(음성 인식)다. 국내에도 삼성의 ‘T옴니아폰’ 등 스마트폰이 이미 출시됐거나 출시를 앞두고 있는 가운데 음성인식기술이 터치스크린과 함께 미래 휴대폰을 이끌 축이라는 주장이다. 기술도 여기에 따라가고 있다. 그는 “현재까지는 인식 언어가 명령어나 고립어 수준에 머물렀지만, 최근에는 문장을 인식하는 기술도 개발 중”이라며 “결국 인간의 목소리를 구현할 수 있는 수준까지 기술은 발전할 것”이라고 예측했다.
그는 “이 기술은 상당한 고용창출효과를 낼 수 있다”며 “음성인식 기술개발인력, 또 이를 여타 디바이스와 컨버전스하는 방법을 연구하는 인력, 그리고 기술의 뼈대가 될 음성DB를 구축하는 인력 등 수많은 지식인력을 필요로 하는 사업이기 때문”이라고 말했다. 이어 “특히 인터넷과 여타 디바이스의 결합이 가속화되는 이른바 유비쿼터스 시대의 도래는 명약관화하므로 향후에는 상당한 부가가치를 내는 시장으로 성장할 수 있다”고 역설했다.
정진욱기자 coolj@