하이퍼커넥트가 내달 오스트리아 그라츠에서 열리는 '인터스피치 2019'에 참가해 음성인식 분야 AI 연구 성과를 발표한다고 13일 밝혔다.
올해 20회를 맞는 '인터스피치(INTERSPEECH)'는 음성언어처리 분야에서 세계 최고 권위를 인정받고 있는 국제 학회다.
매년 2000명 규모 세계 연구진이 모여 음성인식과 음성합성, 음성통신 관련 연구 성과를 공유한다. 올해 행사는 9월 15일부터 19일까지 오스트리아 그라츠에서 개최된다. 구글, 페이스북, 아마존, 엔비디아, 알리바바 등 글로벌 유수 기업과 대학이 발표자로 나선다.
하이퍼커넥트는 '인터스피치 2019'에서 연구 성과를 발표할 예정이다.
하이퍼커넥트 머신러닝팀은 이번 연구를 통해 모바일 기기에서 음성인식으로 특정 키워드를 검출하는데 '템퍼럴 컨볼루션(Temporal convolution)'을 적용, 기존 최고 성능 모델 대비 음성인식 AI의 키워드 검출 속도를 385배 높이는 동시에 정확도는 0.3% 높이는 성과를 달성했다.
키워드 검출은 사용자의 자연어 발화에서 특정 키워드를 인식해내는 기술이다. “오케이 구글”, “헤이 시리” 등 음성 명령을 실행하는데 흔히 쓰이는 중요 기술 중 하나이다.
하이퍼커넥트는 2016년 머신러닝 기반 실시간 음성 번역 기능을 아자르 앱에 도입한 것을 시작으로, 자체 머신러닝 연구 조직을 갖추고 모바일 딥러닝 분야 연구에 투자해왔다.
서버와 통신 없이 스마트폰 기기 내에서 가볍고 빠르게 구동 가능한 온디바이스 AI를 만드는 데 집중해 지난해 'CVPR 2018'에서 진행된 '저전력 이미지 인식 챌린지(LPIRC)'에서는 국내 기업 최초로 2위에 오르는 성과를 거두기도 했다.
하이퍼커넥트는 기존 이미지·영상 처리 분야에서 쌓아온 기술력을 바탕으로 음성, 텍스트 등으로 AI 연구 분야를 확장해 나간다는 계획이다.
용현택 하이퍼커넥트 CTO는 “음성인식 분야로 AI 연구 도메인을 확장한 후 단기간에 가시적 연구 성과를 달성하고, 이를 세계 최고 권위 학회에서 글로벌 IT기업들과 나란히 공유하는 것”이라면서 “앞으로 영상, 음성, 텍스트 등 다양한 분야에서 최첨단 온디바이스 AI 모델을 연구하고 개선해 세계 사용자들에게 더 많은 가치를 제공할 수 있도록 노력하겠다”라고 말했다.
김시소 게임/인터넷 전문기자 siso@etnews.com