코난테크놀로지, 초거대언어모델(LLM) 자체개발 박차... 국내최초 엔비디아 H100 입고

국내 최초 NVIDIA(엔비디아) H100 8대 발주, 이번주 입고… 자체개발 LLM ‘선두 굳히기’
데이터, 인력 그리고 장비까지… AI 개발 핵심요소 3박자 갖춰, 3분기중 20B 파운데이션 모델확보 목표

코난테크놀로지, 초거대언어모델(LLM) 자체개발 박차... 국내최초 엔비디아 H100 입고

코난테크놀로지(대표이사 김영섬)가 초거대언어모델 자체개발에 박차를 가한다. 엔비디아의 최신 GPU 장비 입고로 국내를 넘어 글로벌 빅테크와 겨룰 수 있는 AI 기술 경쟁력을 갖출 것으로 기대를 모은다.

정부는 AI 일상화를 발표했고 ChatGPT에 대한 민간의 관심 역시 커지는 상황이다. 이에 따라 코난테크놀로지는 생성형 AI 시장에 선도적으로 대응하기 위하여 코난 Large Language Model(LLM)의 개발에 힘을 쏟고 있으며, 2023년 3분기 중 개발을 완료해서 발표하는 것을 목표로 하고 있다.

이를 위해 지난 2월 국내에서 가장 먼저 NVIDIA의 H100 장비 8대를 발주했다. 대량의 데이터와 파라미터 기반의 초거대언어모델의 학습에는 고성능 GPU 서버가 필요하기 때문이며, 4달여간의 기다림 끝에 이번주 입고됐다. 입고 또한 국내 최초다. 이로써 Konan GPT를 개발하는데 걸리는 시간을 크게 단축해 개발 우위에 설 수 있을 것으로 보인다. H100 입고 전에는 미국 클라우드 업체의 H100 인스턴스를 대량으로 리스하여 사용해왔다. 내달 중 13B 파운데이션 모델을 갖추고, H100입고를 계기로 3분기중 20B 파운데이션 모델을 확보하는 것이 코난LLM 개발 타임라인이다.

통상 AI 산업의 핵심 요소는 장비, 인력, 데이터다. 코난테크놀로지는 지난해 120명에서 올해 157명으로 개발인력을 지속적으로 증원 중이다.(3월기준) 확충된 AI 연구 개발인력을 통해 급변하는 기술들에 대응할 태세를 마련했고, 2007년부터 운영한 PulseK AI 분석 서비스를 통해 축적된 약 205억건의 고품질의 한국어 데이터를 갖추고 있다. 특히나 초거대언어모델 구축에 가장 중요한 대량의 한국어 데이터를 보유하고 있다는 점에서 의미를 가진다.

끝으로 이번 H100 입고까지 더해져 인공지능 선두 기업으로서의 행보를 증명했다. 이로써 코난테크놀로지는 Konan GPT와 Konan ChatGPT(가제)를 필두로 한 초거대언어모델 개발에도 박차를 가할 수 있게 됐다. 특히 코난테크놀로지의 LLM은 기존의 ChatGPT와 하이퍼클로바 API에 의존하는 다른 회사와 크게 차별화된다. Konan GPT의 경우 전체 학습 토큰은 1조개 이상, 이 중 한국어 토큰은 5천억 개 이상으로, 한국어 토큰의 경우 국내 빅테크와 겨뤄도 비교우위에 서는 수준이기 때문이다.

김영섬 코난테크놀로지 대표이사는 “차별화 된 환경에서 자체개발 초거대 AI언어모델을 출시하여, 회사의 기밀이나 개인정보 보안 등이 중요한 B2G, B2B시장에 성공적으로 진출하겠다”고 포부를 전했다.

전자신문인터넷 유은정 기자 judy6956@etnews.com