
액션파워(공동대표 조홍식 이지화)가 기록 관리 AI 서비스 ‘다글로’의 성능을 개선했다고 밝혔다.
이번 성능 개선의 핵심은 크게 세 가지로, 우선, STT(Speech-to-Text) 모델 자체의 크기를 확대해서 음성인식 정확도 자체를 100%에 가깝게 개선했다. 또한, VAD(음성 감지) 기능을 크게 높여서 여러 사람의 대화에서도 목소리를 정확하게 분리해 내며, 숫자와 영어 발음까지 명확하게 표시하도록 함으로써 텍스트 변환에 가독성까지 높인 결과를 도출하게 됐다고 관계자 측은 설명했다.
다글로가 지향하는 궁극적인 가치는 ‘사람이 손대지 않아도 대화와 영상, 음성 기록이 알아서 정리되는 것’이다. 이를 위해 지속적으로 다양한 기술을 적용하면서 사용성을 높이고 있으며, 다른 음성변환 서비스와의 가장 큰 차별점은 멀티모달(Multi-modal) 지원이다. 대표적으로 영상 파일을 업로드하거나 유튜브 링크를 붙여 넣으면, 바로 영상의 음성을 원고로 생성한다.
뿐만 아니라 크롬 확장 프로그램으로 다글로를 설치할 수 있어서, 유튜브 영상을 시청하면서 바로 다글로로 텍스트 변환을 시작할 수 있다. 또한 변환 결과는 일반 문서 파일뿐 아니라 자막 파일로도 바로 다운로드할 수 있으며, 통화 내용을 바로 텍스트로 변환하고 보여주는 기능을 상반기 마지막 업데이트 예정이다.
액션파워 이지화 공동대표(CTO)는 “AI는 인간의 시간과 노력을 아껴준다는 점에서 가치가 있고, 신기하고 재미있는 유행이 아니라 진짜로 사람에게 도움이 되는 기술에만 집중하고 있다”라며 “감당할 수없이 많은 정보와 대화들이 오가는 이 세상에서 다글로가 제공하는 ‘정리’라는 가치는 그래서 중요하다”라고 전했다.
이어서 “이제 액션파워는 개발 막바지 단계인 자체 LLM 상용화에 집중하고 있으며, 지금 다글로는 원고를 생성하고 키워드를 뽑아주고 요약을 해준다”라며 “다글로는 우리 모두의 일상을 위한 진짜 ‘AI assistant(조수)’로 성장 중”이라고 덧붙였다.
전자신문인터넷 서희원 기자 shw@etnews.com