인텔리빅스가 17일 중앙대학교와 거대멀티모달모델(LMM-Large Multimodal model) 공동 연구를 위한 협약을 체결했다.
양사는 폐쇄회로텔레비전(CCTV)에 찍힌 안전 관련 영상분석 이벤트를 텍스트 데이터로 전환하는 멀티모달 인공지능(Multimodal AI)를 공동 개발하기로 했다.
인텔리빅스는 멀티모달AI를 활용해 지능형 CCTV에 찍힌 모든 영상을 데이터로 전환하고 언제, 어디에서 어떤 재난·재해가 발생했는지에 대한 빅데이터를 만든다. 또 거대언어모델(LLM)을 활용해 관제일지를 자동으로 작성하고 통계를 분석해 '예방안전' 활동을 할 수 있도록 할 방침이다.
이를 위해 인텔리빅스와 중앙대는 LLM을 기반으로 사전 훈련된 비전 인코더와 연계해, 이미지에 대한 설명을 텍스트로 생성하는 비전-언어 경량화 모델을 만들어 상용화할 계획이다.
나아가 영상(이미지) 데이터와 언어모델을 결합해, 향후 이미지에 대한 질의응답 및 추론 등을 도출한다. 이를 통해 도시 안전은 물론 산업안전, 생활 안전, 교통안전, 재난재해 특성에 대한 시사점을 끌어내 사고예방 대책 마련에 도움을 줄 예정이다.
최은수 인텔리빅스 대표는 “이번 협력을 통해 우리의 비전AI 기술역량을 한 단계 더 높일 수 있을 것으로 기대한다”며 “중앙대와 다양한 분야에서 협력을 통해 기술 혁신을 이뤄나갈 것”이라고 밝혔다.
조재학 기자 2jh@etnews.com
-
조재학 기자기사 더보기