한컴,국가기록원 ‘기술정보은행’구축

한글과컴퓨터(www.haansoft.com,대표 김수진, 이하 한컴)는 국가기록원의 ‘디지털포맷 및 애플리케이션 기술정보은행 프로토타입 개발 프로젝트(이하 기술정보은행)’를 완료했다고 20일 밝혔다.

이는 국내 디지털 기록 분야에서 국내 최초로 구현된 것으로, 디지털 문서 및 기록물과 파일 등의 전자 기록물을 장기 보존하고 열람하는 ‘디지털 도서관’의 초석이 될 기술로 주목받고 있다.

이번에 한컴에 의해 개발 완료된 국가기록원의 기술정보은행은 다양한 종류의 디지털 파일 포맷을 데이터베이스화 해, 마치 디지털 도서관처럼 누구나 쉽게 접근하고 활용할 수 있도록 한 데 의의가 있다. 기술정보은행을 통해 한컴의 HWP 파일은 물론 MS 오피스 파일 등 현존하는 문서파일과 JPG와 같은 이미지파일, 지금은 사용되지 않는 하나워드와 아리랑 같이 기술의 발달에 따라 내용 및 형식 확인이 어려운 옛 문서파일까지 총 400여종의 디지털 문서를 식별할 수 있게 되었다.

사용자는 기술정보은행을 통해 보유한 문서 및 디지털 파일의 오류여부를 검증하며 파일이 보유한 정보를 추출하는 것은 물론, 파일을 열어보기 위해 필요한 관련 소프트웨어 정보 및 관리 메타데이터를 제공받을 수 있게 된다.

특히 이번 프로젝트의 경우 한컴이 지난 20여 년간 ‘아래아한글’ 및 ‘한글과컴퓨터 오피스’와 같은 SW 연구개발 노하우를 살려, 텍스트 추출 기능을 적용한 사례로 각광받고 있다. 단순히 파일의 종류와 정보를 추출하는 수준을 넘어, 디지털 문서 내에 포함된 텍스트를 검색, 색인 기능을 활용해 원하는 문서인지 바로 확인할 수 있어 ‘디지털 도서관’의 역할을 최초로 선보이게 된 것. 향후 정부 기관의 기록관련 부서 및 공기업 등에서 웹의 접근만으로 간단하게 디지털 문서를 장기보존하고 활용할 수 있게 한 것도 이번 프로젝트의 특징이다.

한컴의 김수진 대표는 “한컴이 지난 20여 년간 오피스 분야에서 보유한 기술력을 바탕으로 국내 어느 업체도 선보이지 못했던 디지털 문서 및 파일의 기술정보은행을 선보이게 되었다.”며, “디지털 기술의 발달에 따라 이미 단종된 문서파일의 정보까지 제공하는 기술력을 바탕으로 향후 국내 디지털 문서의 보존과 활용에 큰 기여를 할 수 있을 것으로 기대한다”고 밝혔다.