디지털전환이 보편화된 요즘 전자문서 관련 기업은 디지털문서 시장이 확대되고 있음을 인지하고 새로운 가치를 창출하기 위해 노력하고 있다. 이전의 전자문서가 종이문서의 전자화형태로 정보의 저장·보존·열람 등을 주목적으로 했다면 디지털문서는 전자문서의 활용 범위를 넘어 정보분석, 정보탐색 및 발굴, 정보융합, 인공지능(AI) 활용 등 디지털 지향적인 목적으로 활용된다.
디지털문서는 표준화된 형태나 메타데이터를 통해 디지털정보처리에 적합하고, 사용 및 활용 주체가 사람으로 한정되지 않고 다변화될 수 있다. 디지털문서로부터 빅데이터 분석이나 AI 학습용 데이터를 쉽게 추출할 수 있으며, AI는 디지털문서를 쉽게 만들어 낸다. 예를 들어 에듀테크에서는 AI가 스마트 교육 자료를 직접 만들어 낸다. 스마트팜에서 생산 관련 측정 기록을 이용해서 스마트팜을 제어하는 AI 개발 사례도 있다. 디지털트윈에서는 시뮬레이션 결과를 디지털문서 형태로 생산하고, 머신러닝에 활용하기도 한다.
최근 클라우드업계에서는 DevOps(Development/Operations)를 활용한 클라우드 네이티브 개발방식이 대세를 이루고 있다. DevOps는 소프트웨어 개발·운영·조직을 일원화해서 비즈니스 변화에 신속히 대응하고, 운영 효율을 극대화하는 방식이다. DevOps의 혁신적 개념은 곧 데이터 분석이나 머신러닝 분야에도 적용돼 DataOps 및 MLOps와 같은 개념이 만들어졌고, 관련 제품도 출시되고 있다.
이러한 개념의 핵심은 디지털 생산과 더불어 생산된 디지털 자원을 어떻게 효과적으로 관리하고 운영하느냐에 집중하는 것이다. 조만간 디지털문서를 위한 DocOps(Documentation/ Operations)라는 개념이 보편화될 것으로 보인다. DocOps는 디지털문서의 생산, 가공, 지속적 개정, 보관, 협업, 분석 등 업무에 DevOps 개념을 접목한 것이다. 앞으로 디지털문서의 폭발적 증가에 대비하는 프레임워크가 될 것이다.
디지털문서는 디지털 중심 사회에서 핵심적인 역할을 할 것이지만 활용 효과를 극대화하기 위해서는 사회적으로 몇 가지 사항이 전제되어야 한다.
첫째 기업이나 정부에서 생산하는 문서의 형태는 개방형 포맷을 준용, 표준화·구조화되어야 한다. 개방형 마크업언어 기반으로 문서가 표준화·구조화될 때 데이터의 정확도를 더 높일 수 있다.
둘째 디지털문서 유통, 연계, 활용을 위한 인프라가 구축되어야 한다. 이를 위해 전자문서 중계자의 응용프로그램환경(API)을 표준화하여야 하며, 공개된 개방형문서표준(ODF) 기반 문서서식함이나 전자서식 기반의 유통체계 등 인프라도 구축되어야 한다.
셋째 디지털문서 메타데이터의 표준화가 필요하다. 표준화된 메타데이터 라이브러리의 개발과 함께 이를 활용할 수 있도록 지원정책이 필요하다.
우리가 생각하는 것보다 훨씬 더 빠르게 우리 사회는 디지털 중심으로 변화하고 있다. 앞으로 5년 안에 AI와 로봇, IoT 기술을 포함한 신기술은 사람이 만들어 내는 모든 정보보다 더 많은 양의 디지털 정보를 쏟아낼 것으로 보인다. 바로 지금이 다가오는 디지털문서 시대에 대비할 시점이다.
이영곤 국제전자문서학회장(한국공학대 교수) yklee2002@gmail.com