인텔리콘연구소는 한국 법률에 특화된 언어모델(sLLM)인 '코알라(KOALLA, Korean Adaptive Legal Language AI)' 개발에 성공했다고 23일 발표했다.
이번에 개발한 '코알라1.0'은 리걸테크의 다양한 응용 서비스에 적용될 수 있다. 기업이나 로펌의 대용량 문서를 기반으로 하는 생성AI(RAG) 시스템에도 장착이 된다. 기업의 다양한 환경과 요구에 부응하는 온-프레미스(On-Premise) 또는 설치형(Appliance) 방식의 법률특화 생성AI 도입이 가능해진다.
코알라는 메타의 Llama-2를 파인튜닝해 개발됐다. 인텔리콘은 코알라의 성능을 높이기 위해 직접선호최적화(DPO) 기법 외에도 학습 데이터 구성 자체를 최적화하는 데이터 재규격화(Renormalization) 기술을 개발해 추가 학습에 사용했다. 수 백만개의 법률, 판례, 상담자료, 주석자료 등을 기반으로 학습 데이터 규격화 작업을 한 후, 성능향상에 도움이 되는 데이터만을 선별해 재규격화했다.
인텔리콘은 미국의 거대언어모델 API를 이용하는 대신 한국 법률에 특화된 거대언어모델을 직접 적용함으로써 보안 문제를 해결하고 서비스 정확도를 높일 수 있을 것으로 기대했다.
임영익 인텔리콘 대표는 “개발과정에서 모델성능의 본질은 모델 자체가 아니라 데이터에 있다는 결론을 내렸다”며 “앞으로 다른 모델도 활용해 코알라2.0 개발 및 고도화를 진행하고 경량모델 블랜딩(Blending) 기술을 적용해 거대언어모델에 근접시키는 '앙상블 브레인'을 개발할 계획”이라고 말했다.
손지혜 기자 jh@etnews.com
-
손지혜 기자기사 더보기