인공지능 소프트웨어 전문기업 코난테크놀로지(대표 김영섬)가 스마트폰에 자체 개발 STT와 TTS 그리고 LLM이 탑재된 차별화 된 On-Device AI 기술력을 공개했다고 밝혔다.
14일 코난테크놀로지는 공식 유튜브 채널에 '코난 온디바이스'(Konan On-Device)라는 타이틀로 데모 영상을 업로드했다. 코난 온디바이스 데모는 삼성전자의 갤럭시S24 울트라 모델에서 실시했으며, 마이크 버튼을 탭 하여 한국어로 말하면 자동으로 음성이 인식되고(Speech-to-text), 실시간 번역 후 상대방에게 영어 음성으로 제공(Text-to-speech) 된다. 사용자가 말한 내용을 번역하여 상대방 언어의 음성으로 들려주고, 사용자의 언어와 상대방의 언어 번역 결과가 스마트폰 화면에 대화 창으로 표시되는 방식이다. 현재 한국어와 영어 외에도 향후 업데이트를 통해 지원 언어를 추가할 계획이라고 관계자는 설명했다.
음성인식은 기존의 챗GPT에서도 가능했지만 이에 더해 음성합성 기능이 추가됐고, 네트워크 연결 없이 디바이스 자체에서 사람의 말을 인식하고, 상대방 언어로 번역해서 말해주는 과정이 한 번에 AI를 통해 처리되는 게 특징이다. 또한 모바일 기기 자체의 CPU만 사용하기 때문에 저렴한 가격으로 각종 엣지 디바이스에서 효율적으로 이용할 수 있다.
코난테크놀로지 음성 기술의 핵심경쟁력은 고속 실시간 처리에 특화된 구조의 신경망 설계로 인식 결과가 응답지연 없이 즉시 출력(STT) 및 즉시 합성(TTS)된다는 점이다. 제공 형태는 안드로이드 및 리눅스 버전이다. 13개 언어를 AI로 동시통역하는 '코난 챗봇플러스'는 현재 서울지하철 주요 역사 및 롯데백화점, 파라다이스카지노 등에 설치돼 외국어 및 관광객들의 의사소통을 돕고 있다.
실시간 번역에는 코난 LLM이 사용됐다. 온디바이스에 최적화된 '코난 LLM-4B' 모델이 새로 개발 및 탑재됐다. LLM을 통한 즉시 번역으로 온디바이스 생성 AI의 응답성이 개선됐다.
관계자는 “코난 온디바이스는 S24 Qualcomm 스냅드래곤에서 작동되었으며, 저가의 퀄컴 ARM 계열 프로세서도 동작이 가능하다”라며 “스마트폰 외에도 △카메라 △센서 △드론 △웨어러블 △스마트홈 디바이스 등에 적용할 수 있고, 또한 △내비게이션 △자율주행 보조장치와 같은 차량 디바이스에서 음성지시를 통해 운전자를 보조하고 운행을 제어할 수도, 각종 공장과 제조사에서 음성으로 기계를 운영시켜 제품에 지능을 부여할 수도 있으며, 따라서 수많은 하드웨어와의 협업이 기대된다”라고 전했다.
김영섬 코난테크놀로지 대표이사는 “그동안 축적해 온 생성 AI 기술 역량을 결집시켜 각 HW에 최적화된 온디바이스 AI 기술을 구현하고, 다양한 수요처들과 비즈니스 기회를 만들고 매출로 연결시키겠다”라고 소감을 말했다.
한편, 코난테크놀로지는 자체 개발 인공지능 프레임워크 '코난 디트레인'을 이용하여 더 적은 메모리로 계산량은 크게 늘려주는 엣지 모델 또한 지속적으로 개발할 예정이다.
유은정 기자 judy6956@etnews.com