NHN이 개발한 음성인식 기술을 직접 체험한 결과, 구글 못지않은 수준을 보였다. 음성검색의 핵심은 ‘인식률’이다. NHN 음성검색 서비스의 기술개발 및 실무를 총괄하는 이상호 박사는 현재 네이버 음성검색은 85% 가량의 인식률을 나타냈다고 말했다.
이상호 박사와 함께 아이폰 3GS 두 대를 놓고 직접 실험해 봤다. 실시간 급상승 검색어 등 대부분의 단어는 두 서비스가 모두 정확하게 인식했다. 특정 단어에서는 네이버가 우수성을 보였다. 예를 들어 ‘오백’이라고 말한 뒤 잠시 쉬고 ‘이호’라고 말하자 네이버는 ‘502호’라고 인식한 반면, 구글은 ‘500 2호’라는 결과가 나왔다. 네이버 음성검색이 한글에 대한 이해가 좀 더 높은 대목이다.
검색결과가 나오는 시간은 대략 구글이 2초, 네이버가 2.5초 걸렸다. 네이버는 외부 기술을 이용할 때보다 속도를 절반 이하로 줄였다. 구글이 조금 빠르지만 사용하면서 차이를 느낄 정도는 아니다.
◇연속 음성인식이 기술의 핵심=음성인식은 크게 고립 단어인식, 연속 음성인식, 대화체 인식 기술로 나뉜다. 고립 단어인식 기술은 인식 가능한 단어의 수가 고정돼 있다. ‘학교’ ‘공부’ ‘숙제’ 등의 단어 각각은 알아들어도 ‘학교공부’ ‘학교숙제’ 등의 연속된 단어 조합은 인식하지 못한다.
이를 해결한 기술이 현재 네이버가 사용 중인 연속 음성인식이다. 이 기술은 무한대의 단어 조합도 받아들인다. 대화체 인식 기술은 공상 영화에서 기계와 일상 대화를 나누는 수준으로, 아직 만들어지지 않았다.
국내에서 음성인식 기술은 ETRI에서 먼저 개발됐지만, 처리속도나 인식률에 있어서 네이버가 이를 앞질렀다. 민간 기술기업으로는 디오텍이 인수한 HCI랩의 음성검색 솔루션 정도이며, 해당 솔루션은 고립 단어인식 시스템이다.
이상호 박사는 “지금도 꾸준히 음성 데이터베이스를 유입시키고 모델링을 업데이트하고 있다”며 “자국기업의 자체기술 개발은 거의 세계에서도 유일할 것”이라고 말했다. 일본이나 중국, 러시아도 모두 외산 검색엔진의 음성검색 서비스에 의존한다.
◇네이버 서비스 ‘말’로 이용한다=음성은 손으로 치는 타자에 이어 차세대 입력장치로 각광받는다. HMC투자증권에 따르면 오는 2013년 음성인식 세계시장은 53억달러 규모에 달할 전망이다. 음성검색은 운전 중이거나 추운 겨울 야외에 있을 때처럼 문자 입력이 번거로운 상황은 물론, 노인 등 디지털 소외계층에게도 유용하다.
NHN은 향후 검색뿐 아니라 다양한 서비스에 음성인식 기술을 접목할 예정이다. 당장 도입할 분야는 지도서비스다. 네이버 지도로 길을 찾을 때 음성으로 장소를 찾는 방식이다. 한일 통역 서비스도 나온다. NHN은 올해 안으로 NHN재팬을 통해 일본어 음성검색 서비스도 개발할 계획이다. 한국어와 일본어 음성검색이 완성되면 음성 합성기와 통역 프로그램(기계 번역기)을 덧붙여 통역 서비스를 내놓을 방침이다.
미투데이 글도 음성으로 쓸 수도 있을 전망이다. 현재 개발 중인 네이버톡 메신저나 문자메시지(SMS) 등도 네이버 안에서 음성으로 입력해 사용할 수 있게 된다고 회사 측은 설명했다.
정미나기자 mina@etnews.co.kr