필자는 지난 2000년 음성인식 기술을 앞세워 창업을 처음 했다. 당시 은닉마르코프모형(HMM) 알고리즘 기반의 음성인식 엔진으로 자동응답시스템(ARS) 등 전화망상 시장과 하드웨어(HW) 임베디드 시장을 개척하기 위해 밤낮없이 뛰었다. 그러나 성능의 한계로 세상에 널리 활용되는 기술로 안착시키기에는 부족했다. 20년이 지난 지금 음성인식은 다양한 산업에서 보편화된 인터페이스가 되고 있다. 가정에서도 대부분 인터넷(IP)TV는 음성인식으로 구동된다. 이미 많이 보급된 인공지능(AI) 스피커도 음성인식으로 쉽게 컨트롤된다.
콜센터 분야에서 가장 먼저 음성인식을 도입한 사례는 주소인식 분야다. 스타트업 아이컴시스는 자사 솔루션인 주소봇을 통해 음성인식으로 받아 쓴 주소를 다시 보정해 주며 주소 인식을 보편화하는 데 일조하고 있다. 홈쇼핑·외식배달 콜센터 등에 빠르게 확산되고 있으며, 최근 두 차례 투자를 유치하며 시드라운드를 마쳤다.
센시콘은 장애인을 위한 키오스크에 점자인식 기능과 음성인식 기능을 동시에 구현, 키오스크 시장을 선도하고 있다. 시각장애인들이 화면을 점자로 읽고 음성인식으로 메뉴를 주문할 수 있다. 특히 키오스크 접근성 관련 입법안이 통과할 가능성이 짙어지면서 먼저 특허를 내고 구현을 완료한 센시콘은 시장에서 주목을 받고 있다.
음성인식 원천 기술 스타트업들은 아직도 좋은 전략 투자와 인수합병(M&A) 대상이 되고 있다. 음성인식 스타트업 카르도메 테크놀로지는 현대차로부터 전략 투자를 받았다. 카르도메는 마이크 방향와 소음 등 주변 환경에 따라 인식률 차이를 보이는 음성인식 기능의 한계를 극복한 음성인식 기술을 개발했다. 특히 카르도메 음성인식 기능은 주행 중 소음 등으로 인식률이 떨어질 수밖에 없는 차 안에서 뛰어난 음성 인식률을 보여 준다. 현대차는 카르도메의 음성인식 기술을 자사 모델에 적용, 음성 제어 기술 수준을 끌어올린다는 전략이다.
애플은 풀스트링을 최근 인수했다. 과거 마텔의 인기 완구 '헬로 바비 돌' 시리즈의 토킹 바비 소프트웨어(SW)를 개발한 것으로 유명한 풀스트링은 아마존의 스마트 스피커 '에코' 시리즈에 공통 탑재되는 AI 비서 알렉사, 구글의 안드로이드 운용체계(OS) 및 구글 홈 등에 탑재되는 AI 비서 구글 어시스턴트 등과 협업해 왔다.
시냅틱스도 음성인식 스타트업 커넥선트시스템즈를 인수했다. 커넥선트는 아마존 에코나 구글홈과 같은 AI 스피커를 동작하게 하는 음성인식 기술 전문 스타트업으로, 약 3억달러(3400억원)을 투자해 인수했다. 시냅틱스는 국내 터치 집적회로(IC)로 널리 알려진 회사이고, 스마트폰 화면 위에 손가락으로 터치 입력을 가능케 하는 반도체를 전문으로 개발해 삼성전자 등에 납품하고 있다. 스마트폰을 동작할 때 손과 음성을 동시에 활용할 수 있는 사용자환경(UI)으로 발전시키기 위해 인수를 진행했다.
인수나 전략 투자를 하지 않더라도 자체 역량을 활용해 음성인식 원천 기술을 연구하는 사례도 많다. 네이버가 최근 발표한 NEST는 제한된 데이터 학습만으로도 복잡하고 다양한 장문의 음성 표현을 정확하게 인식하고, 텍스트로 변환한다. 대량의 정제된 데이터를 사전에 학습하지 않고, 예외 상황에 대해서도 높은 음성 인식률을 자랑한다.
전화성 씨엔티테크 대표이사 glory@cntt.co.kr