스픽이지랩스코리아가 오픈AI 개발자 컨퍼런스에서 GPT-4o 기반의 실시간 API(Realtime API)를 활용한 '라이브 롤플레이' 기능을 공개했다고 2일 밝혔다.
미국 현지시간으로 1일, 오픈AI는 미국 샌프란시스코에서 개발자 컨퍼런스 '오픈AI 데브데이'를 개최하고 GPT-4o 기반의 '실시간 API'를 발표했다. 실시간 API는 AI가 인간의 말을 인식하는 과정에서 음성을 텍스트로 변환한 후 인지·대응하던 기존 기술과는 달리, 음성과 음성 간 직접적인 상호작용을 가능하게 한다.
이번 컨퍼런스에서 스픽은 오픈AI 실시간 API와 자사 학습 엔진을 결합한 '라이브 롤플레이' 기능을 공개했다. 라이브 롤플레이를 통해 사람과 대화하는 것처럼 빠르고 자연스럽게 반응할 수 있도록 AI 튜터를 고도화했다.
기존 AI 대화 시스템은 여러 단계의 복잡한 처리 과정으로 인해 빠르고 자연스러운 상호작용이 어려웠다. 라이브 롤플레이는 음성 간 직접 상호작용을 통해 사용자에게 실제 원어민과 대화하는 듯한 경험을 받을 수 있다.
라이브 롤플레이는 사용자의 비언어적 요소까지 분석한다. 발화자의 톤·발음·운율 등을 실시간으로 이해하고 즉각적인 피드백을 제공한다.
스픽은 사용자의 언어 능력과 학습 패턴을 분석하는 '지식 그래프 시스템'을 도입해 실시간으로 사용자 언어 능력을 측정할 계획이다. 이를 통해 각 개인의 수준에 맞는 대화 난이도와 적합한 문장 패턴, 어휘를 제시함으로써 학습 효과를 극대화할 예정이다.
라이브 롤플레이는 일부 사용자들을 대상으로 베타 테스트를 진행할 예정이며, 올해 말 정식 출시를 목표로 하고 있다.
정하정 기자 nse033@etnews.com