브이알크루 3차원 공간 멀티모달 LLM, 글로벌 리더보드에서 1위

브이알크루가 자사 3차원 공간 멀티모달 LLM 모델이 글로벌 3차원 공간 이해 평가지표인 EvalAI의 ScanQA evaluation 리더보드에서 1위를 기록했다고 밝혔다.

브이알크루의 해당 모델은 실내 3차원 공간을 이해할 수 있는 멀티모달 LLM(large language model) 모델로, 약 80억 매개변수를 갖추고 있으며, 포인트 클라우드와 텍스트 입력을 기반으로 실내 공간에 대한 추론, 장면 설명, 질문 응답(QA) 등의 작업을 수행할 수 있도록 구축됐다.

브이알크루의 LLM모델이 SanQA evaluation에서 1위를 기록한 모습. 사진=브이알크루
브이알크루의 LLM모델이 SanQA evaluation에서 1위를 기록한 모습. 사진=브이알크루

ScanQA evaluation 리더보드는 레이저를 쏘아 공간을 스캔하는 LIDAR 기술을 활용해 실내 공간을 3차원 데이터로 수집한 ScanNet에서 텍스트 기반의 질의응답 데이터를 구축하는 벤치마크 데이터셋이다.

해당 리더보드에는 틱톡의 모회사인 바이트댄스(ByteDance)와 상하이 AI연구소 등이 참여하고 있으며, 리더보드를 운영하는 Eval AI는 빅테크 기업과 대학 등 40여개 기관과 파트너십을 맺은 AI 모델 평가 플랫폼이다.

3차원 공간 이해 평가 모습. 사진=브이알크루
3차원 공간 이해 평가 모습. 사진=브이알크루

최성광 브이알크루 대표는 “우리의 일상 생활 속에 AI가 스며들기 위해서는 언어 외에도 주변 공간을 온전히 이해하는 능력이 필수라고 생각한다”며 “이번 기록은 공간을 이해할 수 있는 인공지능 기술을 높은 수준으로 확보했다는 것에 의미가 있다”고 설명했다.

한편, 브이알크루는 고정밀 VPS 기술에 대한 KTL공인 인증을 획득했으며, 글로벌 자동차 기업과 일련의 프로젝트를 진행하며 스크린 속 가상 개체들이 스크린을 넘어 현실로 넘나드는 아나모픽MR™ 작품을 경북도청 로비에 설치했다.

이원지 기자 news21g@etnews.com