인텔리콘연구소, 법률 특화 sLLM '코알라' 개발…할루시네이션 방지

인텔리콘연구소, 법률 특화 sLLM '코알라' 개발…할루시네이션 방지

인텔리콘연구소는 한국 법률에 특화된 언어모델(sLLM)인 '코알라(KOALLA, Korean Adaptive Legal Language AI)' 개발에 성공했다고 23일 발표했다.

이번에 개발한 '코알라1.0'은 리걸테크의 다양한 응용 서비스에 적용될 수 있다. 기업이나 로펌의 대용량 문서를 기반으로 하는 생성AI(RAG) 시스템에도 장착이 된다. 기업의 다양한 환경과 요구에 부응하는 온-프레미스(On-Premise) 또는 설치형(Appliance) 방식의 법률특화 생성AI 도입이 가능해진다.

코알라는 메타의 Llama-2를 파인튜닝해 개발됐다. 인텔리콘은 코알라의 성능을 높이기 위해 직접선호최적화(DPO) 기법 외에도 학습 데이터 구성 자체를 최적화하는 데이터 재규격화(Renormalization) 기술을 개발해 추가 학습에 사용했다. 수 백만개의 법률, 판례, 상담자료, 주석자료 등을 기반으로 학습 데이터 규격화 작업을 한 후, 성능향상에 도움이 되는 데이터만을 선별해 재규격화했다.

인텔리콘은 미국의 거대언어모델 API를 이용하는 대신 한국 법률에 특화된 거대언어모델을 직접 적용함으로써 보안 문제를 해결하고 서비스 정확도를 높일 수 있을 것으로 기대했다.

임영익 인텔리콘 대표는 “개발과정에서 모델성능의 본질은 모델 자체가 아니라 데이터에 있다는 결론을 내렸다”며 “앞으로 다른 모델도 활용해 코알라2.0 개발 및 고도화를 진행하고 경량모델 블랜딩(Blending) 기술을 적용해 거대언어모델에 근접시키는 '앙상블 브레인'을 개발할 계획”이라고 말했다.

손지혜 기자 jh@etnews.com