챗GPT에 적용된 초거대 인공지능(AI) 언어 모델(LLM) 'GPT-3.5'를 넘어서는 차세대 모델 'GPT-4'가 등장했다.
전문가들은 기존 GPT-3.5 대비 인식·추론능력 향상, 이미지를 입력으로 인식하는 멀티모달 기능 탑재를 GPT-4의 강점으로 꼽았다. 다만 여전히 윤리 문제 등 근본적인 한계점을 보유하고 있는 것으로 평가했다.
◇“영상도 학습하는 GPT-4…AI 개념적으로 중요한 분기점”
GPT-4는 창의력이 향상됐다. 요구한 질의에 대해 문제를 보다 창의적이고 정확하게 풀 수 있으며, 시나리오 작성·작문 등 능력이 개선됐다. 또 GPT-3.5와 비교해 AI 언어 생성 능력이 15% 개선됐다. 다양한 언어 데이터를 학습해 영어 이외의 언어 생성 능력도 향상됐다.
차경진 한양대 교수는 “한국어 이해력을 비롯해 문제해결능력, 고차원 추론 등 여러 방면에서 단시간에 성능이 향상됐다”며 “논문 초안도 3.5버전에 비해 훨씬 완성도 높게 작성하는 등 글쓰기 능력도 전반적으로 더 좋아졌다”고 평가했다.
멀티모달 기능도 GPT-4의 주목할 개선점으로 여겨진다. GPT4에는 기존 텍스트로 국한된 입·출력에서 이미지를 입력으로 받아 추론할 수 있는 기능이 탑재됐다. 예를 들어 냉장고 내부의 음식을 촬영한 사진으로 가능한 요리를 추천하는 식이다.
장병탁 서울대 교수는 “GPT-4의 가장 중요한 변화 중 하나를 멀티모달 기능 추가로 들고 싶다”며 “AI가 발전하는 데 있어서 텍스타가 아닌 이미지 학습이 실사례에 도입됐다는 것은 개념적으로 매우 중요하다”고 말했다.
◇“GPT-4 한계점은 AI가 인간 닮아가며 생기는 자연스러운 부작용”
오픈AI 개발진은 GPT-4가 여전히 사회적 편견, 환각(Hallucination), 악의적인 프롬프트에 대해 한계점을 보유했다고 진단했다.
장병탁 교수는 “사실 환각이나 혐오 등과 같은 GPT-4의 한계점은 계속 남아있을 확률이 높다”며 “없애는 것은 가능하나, 그럼 AI가 창의성이나 상상력도 없어지는 것”이라고 밝혔다. 이어 “AI가 인간을 닮아가며 생기는 자연스러운 부작용”이라고 덧붙였다.
또 기존 GPT-3.5 대비 음성이나 이미지 등 입력값이 다양화됐고 성능 향상이 있으나 여전히 미흡하게 추론한다는 것이다. 또 최신 정보 결여로 부정확한 답변을 생성한다는 지적이다.
차경진 교수는 “여전히 잘못된 대답을 하는 경우가 있다”면서 “결과물에 올바른 피드백을 계속 하는 등 훈련이 더 필요해보인다”고 전했다.
◇“개인보다 다양한 응용 서비스에 GPT-4 활용 늘어날 것”
개인보다는 다양한 응용 서비스에 GPT-4 활용 늘어날 것으로 보인다. GPT-4를 활용하는 협력업체는 △듀오링고, 칸아카데미 등 학습 플랫폼과 △비마이 아이즈 등 장애도우미 △모건스탠리, 스트라이프 등 금융 △아이슬란드 정부 등 다양하다. 이외에도 에듀테크 기업 스픽이지랩스가 운영하는 AI 음성인식 기반 영어 학습 애플리케이션 '스픽'에도 GPT-4가 적용됐다.
남호성 고려대 교수는 “GPT-4 기술적 수준은 90점에서 95점 수준으로 나아지고 안정화가 개선됐다”며 “더 파급력이 클 부분은 텍스트, 이미지, 음성 관련 서비스와 API 공개, 세세한 비즈니스 모델 확립”이라며 “API 공개로 개발이나 산업적으로 활용할 부분이 많을 것”이라고 설명했다.
하정우 네이버 AI랩 소장은 “일반적인 사용자가 GPT-4를 써 보면 GPT-3.5와 비교해 개선됐다고 많이 체감되진 않을 것”이라며 “GPT-4는 연구적인 임팩트보다는 유료화 시스템과 연계돼 상품화 관점에서 완성도가 높아진 모델”이라고 말했다.
권혜미기자 hyeming@etnews.com, 김명희기자 noprint@etnews.com, 김지선기자 river@etnews.com