정보기술의 비약적 발전으로 디지털 전환은 구호에 그치지 않고 문서 속에 담겨진 수많은 정보가 지혜로 만들어지는 4차산업혁명의 시대로 접어들었다.
모든 것이 연결되고 지능화되는 사회로 진입을 위한 요소 중 기록과 활용이라는 속성을 가진 문서의 활용은 더욱 중요해지고 있다. 따라서 이에 대한 몇 가지 의견을 제시하고자 한다.
문서는 정보를 담고 있는 기록물을 의미하며 기록하고 보관하는 용도로 사용되기 때문에 정확성과 명확성 등이 중요한 부분을 차지하고 있다.
이러한 속성으로 인해 문서는 그의 목적에 따라 적절한 형식과 언어를 사용해야 한다.
문서는 목적에 따라 소통, 보고, 증빙, 활용이라는 역할을 하고 있으며 종이에서 전자적인 매체로 변화하고 있다. 이는 가공적인 측면에서 정형, 비정형의 데이터 형식으로 변환돼 활용이라는 영역으로 다가서고 있는 것을 의미하며 문서 내부에 포함된 문자와 이미지를 효과적으로 추출하는 필터 그리고 OCR등 기술은 인공지능과 빅데이터의 기술을 통해서 성능과 활용성이 높아지고 있다.
최근 우리가 접하는 대부분의 문서 파일 포맷은 개방형 문서 포맷 형태로 되어 있어 특별한 기술적 노하우 없이 문서에 담겨진 데이터를 용이하게 추출 및 활용할 수 있게 됐다.
개방형 문서 포맷 또한 기술 표준으로 세부적인 항목이 공개된 상태이며 구조 역시 데이터 표준인 XML을 따르고 있어 최적화된 문서 포맷이라고 할 수 있다. 그의 따른 예로는 미국의 공공 개방 데이터 다수가 XML 형태로 되어 있다.
XML은 인코딩 등 특징으로 언어 처리가 용이하고 태그 정의를 통하여 활용성이 높은편이다. 또한, 운영체제와 독립적으로 활용이 가능하고 구조화된 특징을 가지고 있다. 문서의 전달, 저장, 공유적인 측면에서 활용 또한 확대되고 있다. 하지만 일부 포맷 및 관련 표준에 대한 이해없이 특정 문서 포맷 형식 때문에 데이터 활용이 어렵다는 인식의 전환 또한 필요하다고 할 수 있다.
이전에 다양한 기업에서 개발한 문서 편집기는 그들만의 독자적인 폐쇄적 포맷을 사용했다. 그러나 이에 대한 대응으로 ODF라는 개방형문서표준 포맷이 발표됐고 다양한 기업에서 자사 문서표준포맷을 개방하기 시작했다. MS의 OOXML은 2008년 국제표준(ISO/IEC29500)이 됐고 한글과컴퓨터의 OWPML 역시 2011년 KS표준(KS X 6101)으로 제정됐다.
또한, 문서 포맷의 의존성을 낮출 수 있는 네이버오피스, 한컴오피스웹 등 클라우드 방식의 문서 편집기도 나타나 여러 문서 포맷과 상호 호환을 지원하고 있기에 특정 포맷에 대한 종속성은 감소했다.
현 정부의 핵심 정책 기조가 디지털 플랫폼 정부이므로 정부 및 민간의 디지털화의 균형을 통해 정보가 효율적으로 유통되는 유기적인 환경 또한 필요하게 됐다.
우리는 우수한 전자정부환경과 문서편집기 생태계, 서비스 플랫폼 등을 갖추고 있다. 이러한 요소를 조합하여 시너지를 낼 수 있는 문서 중심의 데이터 활용에 대한 인식전환과 관련 정책 추진이 필요한 시점이라고 할 수 있다.
이러한 시도야말로 문서를 통해 단순 저장이 아닌 지식과 지혜로 넘어 갈 수 있는 발상의 전환이지 않을까하고 생각해 본다.
문영상 숭실대 정보과학대학원 소프트웨어공학과 겸임교수 ysmoon@ssu.ac.kr