오픈AI, 차세대 생성 AI 'GPT-4' 출시···신뢰성·창의성 향상

게티이미지뱅크
게티이미지뱅크

생성 인공지능(AI) 개발사 오픈AI가 챗GPT에 적용된 초거대 AI 언어 모델(LLM) 'GPT-3.5'를 넘어서는 차세대 모델 'GPT-4'를 출시했다.

GPT-4는 GPT-3.5와 비교해 AI 언어 생성 능력이 15% 개선됐다. 신뢰성이나 창의성 등이 전반적으로 향상됐다.

GPT-4의 다양한 전문적인 시험 결과(자료=오픈AI)
GPT-4의 다양한 전문적인 시험 결과(자료=오픈AI)

오픈AI는 여러 시험 결과를 통해 GPT-4 모델이 “인간 수준의 능력을 보여 줬음을 입증했다”고 밝혔다.

오픈AI에 따르면 GPT-4는 미국 모의 변호사 시험에서는 90번째, 대학 입학 자격시험인 SAT 읽기와 수학시험에서는 각각 93번째와 89번째의 백분위수를 기록했다. SAT 등 주요 시험에서 상위 10%에 해당하는 수치다.

2020년 준결승 기준으로 미국 생물올림피아드시험에서도 GPT-4는 상위 1% 수준을 기록했다. 이전 버전인 GPT-3.5는 하위 30% 성적을 받은 바 있다.

오픈AI는 “평소 대화에서는 GPT-3.5와 차이가 크게 나지 않을 수 있다”면서 “그러나 GPT-4는 더욱 신뢰할 수 있고, 창의적이며, 더 미묘한 명령을 처리할 수 있다”고 평가했다.

회사는 “이전 모델보다 틀린 답이나 주제를 벗어난 답은 적다”면서 “표준화된 많은 시험에서 인간보다 더 좋은 성적을 낼 것”이라고 덧붙였다.

GPT-4의 다양한 MMLU 벤치마크 결과(자료=오픈AI)
GPT-4의 다양한 MMLU 벤치마크 결과(자료=오픈AI)

GPT-4는 다양한 언어 데이터를 학습해 영어 이외의 언어 생성 능력도 향상됐다. 초거대 AI의 자연어 처리 능력을 평가하는 대규모 다중 작업 언어 이해(MMLU) 벤치마크에서 77.0%를 받았다. GPT-3.5의 70.1%보다 높은 수치다.

오픈AI는 GPT-4 모델 학습을 위해 마이크로소프트(MS)의 클라우드 서비스 애저를 이용했다.

MS는 이날 새로운 검색 엔진 '빙'에 GPT-4를 탑재한다고 밝혔다. MS는 2019년부터 오픈AI에 투자를 시작, 최근에는 100억달러(약 13조원)로 추정되는 투자를 발표한 바 있다.

권혜미기자 hyeming@etnews.com