페르미는 자체 고유의 영상 협업 기술 솔루션으로 인공지능(AI) 음성인식 기반의 STT(음성→문자변환) 연동 서비스를 개발했다.
화자가 말하는 음성이 자막으로 실시간으로 표출되는 자동자막표출 영상 협업 서비스를 KOREN에 실증했다.
코로나19 장기화로 언택트 기반의 영상 회의 소프트웨어(SW) 수요 증가에 대응하는 획기적인 솔루션이다.
페르미는 KOREN의 초저지연 인프라를 활용한 중앙 클라우드와 에지 클라우드 역할 분산형 플랫폼을 구성했다. 자동 자막 표출 기능의 저지연 실시간 성능과 다자간 회의에도 높은 음성인식률을 유지할 수 있도록 성능을 검증하고 최적화했다. 음성인식 기반의 새로운 영상 협업 서비스 상용화와 출시가 기대된다.
상용화가 되면 음성인식 기반 자동회의록 생성을 통해 각종 회의 자료를 텍스트로 저장하고, 검색·녹화까지 가능해진다. 영상회의 이후 회의록을 작성해야 하는 사람이 느끼는 업무에 대한 부담을 줄일 수 있어 공공기관, 기업 등 다양한 곳에서 편리하게 사용될 것으로 기대된다.
화자가 말을 하면 곧바로 영상 위에 실시간 자막이 나타나기 때문에 청각장애인의 온라인 교육과 영어 학습에도 유용하게 활용될 전망이다.
코로나19 시대에 언택트 회의와 교육에 적합한 영상협업은 물론이고, 실시간 자막·자동 회의록 제공까지 가능한 서비스는 글로벌 시장 공략도 가능할 것으로 기대된다.
박지성기자 jisung@etnews.com
-
박지성 기자기사 더보기