고려대는 강재우 컴퓨터학과 교수 연구팀이 아이젠사이언스·임페리얼 칼리지런던대(I.C.L)와 공동 개발한 소형언어모델(sLLM, small LLM) Meerkat-7B가 소형언어모델 최초 미국 의사 면허 시험(USMLE)을 통과하는 데 성공했다고 9일 밝혔다.
Meerkat-7B는 복잡한 의료 문제를 해결하는 데 필요한 다단계 추론 능력을 갖춘 의·생명 분야 특화 sLLM 모델이다. Meerkat-7B는 74점이라는 높은 점수로 통과해 성능을 입증했다. 60점이 평균 합격선인 미국 의사 면허 시험에서 기존 최고 sLLM인 MediTron-7B는 52점으로 합격에 실패한 바 있다.
또한 7개의 의료 벤치마크 성능평가에서 GPT-3.5(175B) 모델보다 평균 13% 높은 성능을 보이면서 의료 분야에서의 오픈 소스 모델 개발이 중요한 진전을 이뤘음을 보여줬다.
sLLM은 모델의 매개변수(parameter)를 줄여 비용을 줄이고 미세조정(fine-tuning)으로 정확도를 높인 모델을 의미한다. 매개변수의 경우 OpenAI의 GPT-3.5(ChatGPT)는 1750억 개, 그리고 구글의 'PaLM'은 5400억 개에 달하지만, Meerkat-7B는 70억 개에 불과하다. 이는 PC 한 대에 설치해 활용할 수 있는 크기의 모델이라는 점에서 의의가 있다.
Meerkat-7B와 같은 의생명 특화 언어모델은 병원 내에서는 임상 의사 결정 지원, 비표준화된 의료 차트의 정리와 같은 의료·원무 행정의 효율성을 제고할 수 있다. 제약 회사에서는 특허 분석, 임상 설계, 문서 작성 등의 노동 집약적이고 전문성이 있어야 하는를 지원해 각 분야 전문가의 업무 부담을 경감하는 데도 기여할 수 있다.
강 교수는 “매일 3000편 이상의 연구 논문이 발표되는 의·생명 분야에서 신약 개발에 필요한 새로운 질병 표적 단백질을 식별하고 검증하는 작업은 매우 시간이 소모되는 일”이라며 “이번 성과를 바탕으로 의료 특화 LLM을 활용한 신규 사업모델 또한 준비 중”이라고 말했다.
이지희 기자 easy@etnews.com