생산되고 소비되는 디지털 미디어의 기록 보존 및 배포를 위한 디지털 아카이브 시스템에 디지털전환 시대 핵심기술 적용은 필수적인 시대의 흐름이다.
2000년대 중반 단순한 전자문서 파일의 기록물 보존 목적으로 기록관리시스템이 구축되었다면, 2010년대 중반 이후는 사진, 오디오, 동영상 등 미디어 콘텐츠 중심의 디지털 아카이브 시스템 구축이 활성화됐다.
2020년대에는 기록의 생산 및 관리에 있어 클라우드, 인공지능(AI) 등 신기술이 적용되기 시작하면서 다양한 유형의 진화된 디지털 아카이브 시스템이 구축되고 있다.
디지털전환 시대의 대표적인 패러다임 중 하나인 자동대화형 AI인 챗GPT 서비스가 2022년 11월 개시되면서 이를 통해 일상 생활에서도 AI 기술을 실체적으로 체감하는 계기가 됐다.
스마트폰, 네비게이션, 챗봇, 자율주행 자동차 등 음성이나 동작을 통해 인지, 예측해 반응하는 고도화된 AI들이 일상 생활과 밀접한 분야에서 발전되고 있는 것이 너무도 당연시 여겨지는 시대다.
이러한 AI는 본질적으로 빅데이터와 학습기반으로 기술 개발이 되어 왔다는 점에서 축적된 기록물의 데이터 관리를 하는 디지털 아카이브와 매우 밀접한 연관성을 찾을 수 있겠다.
AI를 위한 빅데이터 기술, 즉 데이터 기반의 측정, 수집, 축적 기술에서부터 시작해 데이터 전송, 분석 및 해석능력, 데이터로부터 정보와 지식을 창출하는 기술, 통계적 모형화 기술, 미래를 예측하는 기술 등 통계 기반의 과학적 기술이란 측면에서 그 근간이 같은 면이 있다.
결국은 데이터의 인지와 분석, 활용이란 측면에서 디지털 아카이브와 AI의 결합은 마치 운명처럼 예정되어 있지 않았을까?
현재 디지털 아카이브 산업분야에서는 최신 기술을 데이터 아카이빙에 적용하려는 시도가 계속되고 있다. 문서에서 글자를 인식해 추출하는 기술인 광학문자인식(OCR)은 AI 기능과의 결합을 통해 그 정확도가 획기적으로 높아지면서 영상 또는 사진에서 텍스트를 인식해 메타데이터와 분류체계를 자동으로 입력해주는 수준에 이르고 있다.
AI 객체인식을 통해 디지털 콘텐츠 속 인물이나 상황을 정보로 변환해 입력하는 기술도 곧 디지털 아카이브 시스템에 적용될 예정이다. 최근에는 영상 콘텐츠에서 음성추출, 자막생성, 싱크작업, 공백제거, 다국어번역본 자동제작까지 AI 영상 일괄편집 기술을 이용한 좀 더 진화된 영상 아카이브 모델이 설계되고 있다.
이렇듯 디지털전환과 관련해 디지털 기록관리 영역에서 업무 및 기술에 대한 접근방법이 변화하고 있다. 빅데이터와 AI 기능을 탑재해 디지털 미디어 생산·보존·활용 등 전 과정을 자동으로 수행하는 'AI 디지털 아카이브' 개발이 멀지 않은 것으로 보인다.
미래의 기록들은 네트워크를 통해 지능적으로 결합된 거대한 유기적인 데이터 집합체로 진화되고, 모든 기록과 미디어 데이터들은 사람의 손을 거치지 않고 자동으로 획득, 인지, 분류, 정제되어 서비스되는 AI기반 디지털기록의 시대가 올 것으로 예상된다.
언젠가 개인의 평생 기록을 자동으로 저장하고 관리하는 '개인 AI디지털 아카이브' 시대가 올지도 모른다.
이인숙 지미디어 대표 insook@gmediasoft.com