우리나라는 지난 9월 '인공지능(AI) 3대 강국' 도약을 위해 국가 총력전을 선포했다. 민간의 AI 투자를 확대하고, AI시대 인프라와 인재를 확보하는 등 우리 산업과 사회 전반의 AI 전환을 촉진하는 정책도 발표하였다.
AI 3대 강국 되기 위해서는 생성형 AI, 머신러닝, 딥러닝, 자연어처리 등 AI 관련 기술과 함께 디지털 문서와 데이터 관리에 대한 지식을 갖추어야 한다. AI 기술은 문서와 데이터를 대상으로 적용되는 기술로 문서와 데이터가 없으면 무용지물이다. 그렇기에 AI 활용 성과는 그 대상이 되는 문서와 데이터의 양과 품질 그리고 관리 수준에 따라 결정된다.
미국과 중국이 AI의 양대 강국인 데에는 기술 이외에 영어와 중국어로 된 문서와 데이터 물량도 한 몫을 하고 있다. 더하여 문서와 데이터가 AI 기술에서 효율적으로 이용할 수 있도록 체계적으로 조직화되고, 거기에 담긴 정보와 맥락을 파악할 수 있는 메타데이터 등이 정확히 관리된 정보 즉, 정보품질이 우수한 국가가 글로벌 AI 경쟁에서 승리할 것이다.
이런 관점에서 우리나라의 상황은 매우 취약하다. 한글로 된 문서와 데이터의 생산량이 적은 것은 물론이고 디지털문서 관리에 대한 지식 기반도 취약하다. 디지털문서의 관리는 그 속성상 종이문서에 비해 더 전문적인 지식이 필요하다. 종이문서는 정확히 분류, 편철하고 문서관리대장에 등록한 후 정해진 기간동안 보관 후 폐기하면 되었으나 디지털문서는 전통적인 문서관리에 더해 전산시스템의 저장, 접근 및 보안 관리, 메타데이터의 복잡화에 더하여 빠른 기술 변화에 따른 변환, 마이그레이션, 장기보존 등 더 넓은 지식을 필요로 한다. 그런데 모든 문서가 디지털로 작성되는 요즘에 디지털문서관리 교육이 더욱 중요해졌음에도 우리 산업계에서 찾아보기 어렵다. 게다가 다양한 디지털문서관리 전문가 제도가 있는 미국 등 선진국과 달리 우리는 전문가 제도가 없어 많은 기업의 디지털문서가 비전문적으로 관리되고 있는 실정이다.
한편, 우리 산업계에서 디지털문서는 전사자원관리(ERP), 고객관계관리(CRM) 등 업무관리시스템과 전자문서관리시스템(EDMS)에서 시스템별로 생산, 저장 및 관리되는 것이 일반적이다. 그런데 많은 기업에서 기업 전반에 걸친 종합적인 디지털문서 관리체계를 먼저 수립한 후, 이를 모든 시스템에 일관되게 적용하기보다 업무시스템을 도입할 때마다 도입부서에서 개별 시스템에서 제공하는 기능에 따라 서로 다르게 적용하고 있는 실정이다.
기업이 생산하고 보유한 디지털문서와 데이터는 AI 시대에 핵심 자산이다. 이런 산업계 실정에서는 그 활용 역량이 저하될 수밖에 없다. 예를 들어, 기업이 보유한 내부 디지털문서와 데이터를 대상으로 AI 기술을 적용해 보다 신뢰할 수 있는 결과를 얻고자 하는 경우, 기업용 AI 응용프로그램은 범용 AI 프로그램과 달리 기업의 콘텐츠관리시스템 또는 선별된 데이터 소스로부터 정보를 검색하는 '검색 증강 생성(RAG)' 프로세스를 시행할 때 체계적이고 일관된 분류, 메타데이터 등을 제공하기 힘들게 된다.
글로벌 AI 경쟁에서 이겨 AI 3대 강국이 되기 위해서는 디지털문서관리에 대한 산업 교육과 전문가 양성에 대한 적극적인 투자가 필요하다.
조송암 딤스 대표컨설턴트 songahm.cho@gmail.com