쏟아지는 음성인식 SW

컴퓨터가 말을 알아듣는다.

도스를 사용하던 시절 컴퓨터를 동작시키려면 컴퓨터가 알아듣는 명령어를 일일이 배우고 외워 친절하게 입력해시켜야만 했다. 윈도 환경으로 바뀌면서 명령어를 외우기 위한 노력과 시간은 줄었지만 컴퓨터를 이용하기 위해 감수해야 하는 수고와 번거로움은 지금도 크다.

컴퓨터를 동작시키고 명령을 내리기 위해 현재 이용하고 있는 입력장치는 키보드와 마우스다. 그런데 키보드 자판을 외워야 하는 수고는 그렇다 치더라도 몇 번씩 마우스를 클릭하고 키보드를 두드리는 일은 꽤나 귀찮고 불편한 일이다. 게다가 고정된 자세로 몇 시간씩 모니터를 들여다보며 자판을 두드리는 것은 얼마나 피곤한 일인가.

하지만 머지않아 이런 번거로움 역시 사라질 것이다. 「말을 알아듣는」 친절한 컴퓨터가 등장하고 있기 때문이다.

이런 인간 중심의 컴퓨터를 가능하게 하는 것은 바로 음성인식 기술. 음성인식 기술을 이용, 인간에게 가장 자연스러운 의사소통 수단인 음성을 통해 컴퓨터를 조작할 수 있게 된 것이다.

가장 초보적인 음성인식 소프트웨어는 특정 프로그램을 실행시켜주고 기본적인 명령을 수행해주는 유형이다. 「제트툴바」나 「보이스액세스」 같은 소프트웨어가 대표적인데, 이 소프트웨어를 컴퓨터에 설치하면 마우스를 클릭하지 않아도 워드프로세서나 웹브라우저 같은 응용 프로그램을 음성 명령만으로 실행시킬 수 있다. 「MS 워드」 「넷스케이프」와 같은 음성명령을 통해 응용 프로그램을 조작할 수 있다. 물론 「00 파일을 불러와」 「복사해」 「저장해」와 같은 간단한 기본 명령도 음성으로 해결할 수 있다.

여기에서 좀 더 진보된 것이 음성 받아쓰기 소프트웨어. 키보드를 통해 글자를 처넣지 않아도 마이크를 통해 컴퓨터에 말을 하면 음성을 글자로 바꿔준다. 따라서 음성만으로 문서와 e메일을 작성할 수 있으며 채팅도 할 수 있다. 이런 소프트웨어로는 현재 IBM과 드래곤시스템스 등이 내놓은 제품이 있으며 이들 제품은 영어와 중국어 등을 지원한다. 하지만 L&H코리아가 한글 받아쓰기 소프트웨어를 개발하고 있어 오는 9월쯤엔 한글 받아쓰기도 가능해질 전망이다.

음성인식기술을 통해 인터넷 이용 역시 쉬워질 것이다. 최근 각광받고 있는 「보이스포털」은 음성명령을 통한 인터넷 이용의 대표적인 예다. 「보이스포털」은 이용자가 전화를 건 후 원하는 정보의 키워드를 말하면 해당 정보를 음성으로 들려주는 서비스다. 예를들어 이용자가 「자동차」라고 말하면 음성인식시스템이 자동차를 검색해 내용을 읽어주는 것이다. 미국에서는 이미 텔미네트웍스(http://www.tellme.com), 콱닷컴(http://www.quack.com), 텔서프(http://www.telsurfnetworks.com), 오디오포인트(http://www.myaudiopoint.com) 등에 의해 서비스가 시작됐으며 국내에서도 한국통신 등이 서비스를 준비중이다.

앞으로 음성인식 소프트웨어가 인식할 수 있는 어휘의 수가 늘어나고 연속음성 인식과 자연어 인식까지 가능해지면 음성을 통한 컴퓨터 조작은 더욱 완전해질 것이다.

<김인진기자 ijin@etnews.co.kr>