[ICT 시사용어] 거대언어모델(LLM)

SK텔레콤 AI 서비스 에이닷용 슈퍼컴퓨터 '타이탄'
SK텔레콤 AI 서비스 에이닷용 슈퍼컴퓨터 '타이탄'

거대언어모델(Large Language Model, LLM)은 대용량의 인간 언어를 이해하고 생성할 수 있도록 훈련된 인공지능(AI) 모델이다. 딥러닝 알고리즘과 통계 모델링을 바탕으로 자연어처리 작업에 활용된다. 주어진 언어 범위 내에서 정해진 패턴이나 구조, 관계를 학습하는 기존 언어모델과 달리 대규모 언어 데이터를 학습해 문장 구조 문법, 의미 등을 파악하고 자연스러운 대화 형태로 상호작용이 가능하다.

국내에서는 대규모언어모델이라고도 불린다. 콘텐츠 패턴을 학습해 추론 결과로 새로운 콘텐츠를 만드는 생성형 AI의 핵심 기본 기술로 손꼽힌다. 오픈AI에서 개발한 '챗GPT'와 구글이 채팅 기반 AI 도구 바드에 적용한 'PaLM', 메타의 'LLaMa' 등이 대표적 사례다.

국내에서도 한국어에 최적화된 다양한 LLM과 응용 서비스 개발이 이뤄지고 있다. 네이버가 선보인 '하이퍼클로바X'는 한국어에 최적화한 국산 LLM이다. 네이버의 대화형 AI 서비스 클로바X와 생성형 AI 검색 큐: 등에 활용됐다. 검색과 광고 등 주력 사업 영역으로 확장이 이뤄지고 있다.

카카오 자회사 카카오브레인도 한국어 특화 초거대 AI 모델 '코GPT'를, LG AI연구원은 자체 초거대 AI '엑사원 2.0'을 공개했다. SK텔레콤은 한국어 기반 자체 LLM '에이닷'에 협력사 모델을 결합한 멀티 LLM 전략을 펼치고 있다. KT와 엔씨소프트도 각각 '믿음'과 '바르코'를 선보이며 경쟁에 뛰어들었다. AI 스타트업 업스테이지는 기업전용 LLM을 커머스 분야 현업에 적용해 주목받고 있다.

박정은 기자 jepark@etnews.com