업스테이지가 차세대 거대언어모델(LLM) '솔라 프로(Pro)'의 초기 테스트용 모델인 '솔라 프로 프리뷰' 버전을 11일 공개했다.
솔라 프로는 솔라 LLM 시리즈의 상위 모델로, 올 11월 공식 출시를 앞두고 있다.
업스테이지는 현재 개발 중인 모델을 미리 테스트해 볼 수 있는 프리뷰 버전을 오픈소스로 공개하고, 응용프로그램인터페이스(API) 호출 비용까지 무상 지원할 예정이다. 프리뷰 버전은 영어만 지원하며, 입력 토큰 수도 4096자로 제한된다.
솔라 프로는 220억개 매개변수를 갖춰 기존 '솔라 미니(107억)' 대비 두 배 이상 커지고 성능이 대폭 향상된 버전이다. 깊이확장스케일(DUS) 기술 등 자체 LLM 모델링 방법론을 고도화해 여전히 1개의 그래픽처리장치(GPU)에서 구동이 가능하도록 경량화에 성공했다. GPU 가격 급등과 수급난으로 어려움을 겪는 기업용 AI 시장의 판도를 바꿀 것으로 기대되고 있다.
솔라 프로는 인문학뿐만 아니라 과학·기술·공학·수학(STEM) 종합 지식을 평가하는 'MMLU Pro', 지시 이행 능력을 평가하는 'IFEval' 등 최신 LLM 벤치마크(성능 평가) 지표에서 솔라 미니보다 평균 51% 이상 향상됐다.
이는 마이크로소프트의 '파이-3 미디엄', 메타 '라마 3.1 8B', 미스트랄AI-엔비디아 '네모 12B', 구글 '젬마2 27B' 등 유사 빅테크 모델 성능을 모두 뛰어넘은 수치라는 것이 업스테이지 측 설명이다. 자체 기술로 소형언어모델(sLLM) 분야에서 독보적 성능을 낸 것이다.
김성훈 업스테이지 대표는 “자체 기술로 개발한 세계 최고 수준의 LLM 솔라를 통해 글로벌 AI 시장에 도전장을 내민 후 더욱 강력한 차기 모델을 준비하고 있다”며 “최소 인프라 비용으로 업계 최강 성능을 자랑하는 솔라 프로를 프리뷰 버전을 통해 많이 테스트해보기를 바란다”고 밝혔다.
김명희 기자 noprint@etnews.com