국가참조표준, 공개SW로 관리한다

한국표준과학연구원(Korea Research Institute of Standards and Science. 이하 KRISS)은 지난 1975년 설립된 국가 측정 표준 기관이다. 이곳은 교정 시험 서비스를 제공하는 한편 중소기업 기술 지원 등 국가 측정 품질을 높이는 역할을 하고 있다. 국가참조표준센터는 2006년 8월 KRISS 원내에 산하단체로 설립된 곳. 참조표준 제정이나 DB 구축과 보급하는 역할을 한다.

국가참조표준, 공개SW로 관리한다

국가참조표준센터가 생긴 이유는 말 그대로 참조표준을 다루기 위한 것. KRISS가 다루는 표준은 측정 표준과 참조 표준 2가지다. 측정 표준은 흔히 말하는 측정을 통해 얻는 표준이다. 이에 비해 참조표준(Standard Reference)은 측정 데이터와 정보 정확도를 과학적으로 분석, 평가해서 공인해 다양한 분야에서 쓸 수 있도록 마련하는 자료다. 중력가속도 같은 경우를 예로 들 수 있다. 몸무게는 어디에서 재도 같지만 중력가속도는 지역에 따라 다르다. 누군가 이를 정확하게 측정해야 한다. 국가참조표준센터가 여러 지역에서의 중력가속도 참조표준은 이것이라는 식으로 알려주면 공인된 과학 기술적 통계로 이용하게 된다.

국가참조표준, 공개SW로 관리한다

알프레스코 아키텍처 구조도

국가참조표준, 공개SW로 관리한다

이를 위해선 많은 측정 데이터를 산출해야 한다. 문제는 측정기구를 이용해 측정 데이터를 얻게 되면 이전까지만 해도 연구자가 자신의 PC에서 관리를 해왔다는 것이다. 그러다 보니 연구자가 퇴직을 하거나 자리를 옮기면 데이터 관리가 안 되는 문제가 발생했다. 공개SW를 활용한 측정데이터 연구협업 시스템 프로젝트가 시작된 가장 큰 이유다.

국가참조표준센터 채균식 센터장(박사)은 측정데이터 연구협업 시스템 구축을 실시한 가장 큰 목적을 “연구부서가 생산한 연구 성과물 데이터 저장과 통합 관리, 연구 성과를 체계적으로 축적하고 관리하기 위한 것”이라고 말한다.

이런 목적에 따라 업체를 선정하고 올해 2∼4월까지 3개월 동안 시스템 구축에 나섰다. 물론 올해는 시범 사업 형태로 시작한 것이다. 우선 국가참조표준센터 내에 있는 데이터센터에서 랩실 단위로 시범 구축 후 운영을 하고 있는 것이다.

이번 구축에서 가장 중점을 둔 건 앞서 설명했듯 2013년까지만 해도 연구자가 개인PC로 관리를 해왔고 지금도 상당수 그렇게 하고 있다는 점에서 벗어나 체계적인 관리를 하기 위함이다. 물론 채 센터장은 “단순하게 데이터만 쌓는다고 되는 게 아니며 이를 위해선 메타데이터가 필요하다”고 말한다. 어떤 데이터인지 언제 누가 생산했는지, 측정기구는 뭘 썼는지 등에 대한 설명이 필요하다는 것이다.

◇ 알프레스코의 가장 큰 장점은 개방성=이를 위해 쓰인 게 바로 알프레스코(Alfresco)다. 알프레스코는 공개SW ECM(Enterprise Content Management) 시스템이다. ECM은 기업 콘텐츠 관리를 말한다. 문서나 이미지, 소스 등 기업에서 발생하는 모든 콘텐츠 생성에서 관리, 배포까지 모든 과정을 관리할 수 있게 해주는 일종의 저장소라고 할 수 있다. 국가참조표준센터가 알프레스코를 택한 이유는 조직 내에서 생산하는 문서나 이미지, 도면, 데이터를 통합 관리하고 저장, 보존하는 환경을 빠르게 구축할 수 있다는 이유에서다. 연구자가 생산한 데이터와 관련 문서를 체계적으로 저장, 관리, 유통할 수 있어 원내 환경에 최적화할 수 있기 때문.

알프레스코는 이를 위한 기본 베이스를 다 갖춘 상태인 데다 마치 구글드라이브처럼 드래그앤드롭이나 FTP, 데스크톱PC 내 특정 폴더와의 동기화 등 다양한 기능을 제공한다.

KRISS 시스템 구성도

알프레스코는 유명 상용 ECM 솔루션인 다큐멘텀(Documentum)을 만든 창업자가 나와서 공개SW로 개발한 것이다. 채 센터장은 “알프레스코의 가장 큰 장점은 역시 개방성”이라고 설명한다. 이용자가 단순하게 설치해서 이용하는 인터페이스도 제공하지만 API가 막강해 이를 활용하면 새로운 UI를 구축할 수도 있다. 보통 외산 솔루션은 국내 실정에 안 맞아서 최적화도 못하고 포기하기 일쑤다. 이에 비해 알프레스코는 손쉽게 최적화 환경을 만들 수 있다.

또 다른 장점은 비용 효용성이다. ECM 솔루션은 죄다 고가다. 다큐멘텀만 해도 라이선스 비용만 1억 원을 호가한다. ECM 솔루션은 보통 대기업이 구축하는데 프로젝트 단위가 5∼10억원은 나가는 이유도 여기에 있다. 물론 알프레스코 역시 엔터프라이즈 버전이 있지만 국가참조표준센터는 비용이 들어가지 않는 공개 배포판인 알프레소 커뮤니티 버전을 이용했다. 당연히 라이선스 비용이 없다. 하지만 앞서 설명했듯 개방성이 뛰어나 원하는 인터페이스, UI를 구축할 수도 있다. 비용이나 원내 최적화에 모두 걸맞은 선택인 셈이다.

채 센터장의 설명 외에도 알프레스코는 ECM 공개 표준을 만족하는 건 물론 문서 관리나 협업 환경, 웹 콘텐츠 관리를 비롯한 모든 모듈을 갖췄고 전 세계 180개국 3,000개 이상 기관이 이용하고 있는 등 높은 신뢰도를 지니고 있기도 하다.

KRISS 시스템은 공개SW를 적극 사용하는 한편 연구자 자문을 통한 한글화까지 진행, 완성도를 높였다.

이런 개방성 덕에 국가참조표준센터는 알프레스코를 이용한 측정데이터 연구협업 시스템을 모두 한글화했다. 알프레스코는 기본적으로 메시지 파일은 따로 분리되어 있는데 이를 한글화한 것이다. 이를 위해 시스템을 구축한 아르고넷과 국가참조표준센터 측 연구자가 도중에 회의를 하면서 업무 환경에 맞게 용어를 통일하는 과정을 거쳤다. 덕분에 별다른 어려움 없이 한글화를 할 수 있었다는 설명이다.

채 센터장은 또 이 시스템에 저장 가능한 데이터 14가지를 정해 KRISS 내 모든 연구성과물을 반영할 수 있도록 했다. 측정 데이터는 물론 이를 위한 장비 관련 정보, 소급성 확보 자료나 장비 불확도 평가 절차나 결과, 측정 데이터를 활용한 논문 자료나 관련 연구 특허 등록에 활용한 자료 등 방대한 구조다.

이런 이종 데이터 저장은 폴더 구조를 이용해서 올리게 된다. 업무 구조에 맞게 폴더 체계를 미리 만들어놓고 이 안에 데이터를 넣을 수 있게 구축한 것. 폴더 자체에 맞는 속성을 부여해서 프로젝트별로 진행을 하게 된다.

◇ 루씬/솔라, 공개SW로 구축한 축적 데이터 검색=측정데이터 연구협업 시스템은 데이터를 체계적으로 축적하는 환경을 만드는 것 외에 당연히 이렇게 쌓은 데이터를 효율적으로 쓸 수 있는 검색 기능도 갖추고 있다. 이를 위해 활용한 것 역시 공개SW인 루씬(Lucence)과 솔라(Solr)다. 루씬은 잘 알려진 것처럼 자바 언어로 이뤄진 고성능 정보 검색 라이브러리다. 루씬은 검색엔진이 아니라 라이브러리지만 루씬을 활용하면 고성능 검색엔진을 구현할 수 있다. 솔라가 루씬과 짝을 이루는 이유도 여기에 있다. 루씬과 솔라를 결합하면 기업용 검색 서버 구축이 가능하다.

물론 루씬을 이용할 경우 한글 같은 2바이트 체계에서 색인을 뽑아내기 어렵다는 단점이 있긴 하다. 하지만 시스템 구축사인 아르고넷의 이수명 연구소장은 루씬/솔라 한국어 형태소 분석기 커뮤니티를 운영 중인 전문가다. 개발자만 4,700명이 넘는 이 커뮤니티를 통한 피드백 등 커뮤니티 인프라를 통해 별다른 문제없이 검색 적용이 가능했다고 한다.

여기에서도 공개SW의 장점을 십분 활용했다. 보통 중요한 데이터는 DB에 저장하지만 알프레스코는 조금 다르다. 솔라에서 색인 혹은 저장까지 할 것인지 정하는 옵션이 있는데 저장을 택하면 빠른 검색이나 구조가 바뀌어도 용이해지는 장점이 있다. DB에 저장하면 스키마가 바뀔 때마다 계속 이에 따른 변경이 필요하지만 솔라에 저장하면 DB 구조는 단순해지고 변화에도 손쉽게 대응할 수 있다는 장점을 취할 수 있다. 이에 따라 파일은 파일 시스템에 저장하고 메타 데이터는 모두 솔라에 두는 구조를 취했다는 설명이다.

이 시스템의 3단계는 KRISS 연구 환경에 맞는 관리 도구다. 여기에도 공개SW가 쓰였다. 시믹스싱크(CmisSync)가 그것. 시믹스 자체는 ECM을 위한 표준 프로토콜이다. 이 프로토콜을 이용하면 알프레스코 뿐 아니라 다큐멘텀 같은 ECM에 모두 접속할 수 있다. 이 중 가장 쓰기 편한 것으로 판단한 시믹스싱크를 채택한 것이다.

다만 채 센터장은 문제점도 하나 발생했다고 말한다. 가끔씩 동기화에 실패한다는 것이다. 동기화에 실패하고 나면 그 다음부턴 계속 동기화가 안 되어 로컬 드라이브에서 작업하던 걸 모두 지운 다음 다시 동기화를 해야 하는 버그가 간혹 발생한다고 한다. 물론 동기화를 안하고 알프레스코에 바로 올릴 수도 있지만 이 문제를 해결하기 위해 아르고넷 측이 별도 동기화 프로그램을 개발 중이라고 한다. 현재 개발 중으로 내년 2∼3월 시스템에 적용할 예정이다.

측정데이터 연구협업 시스템에는 이들 공개SW 외에도 워크플로우 엔진인 액티비티(Activiti)도 사용하고 있다. 액티비티는 아파치재단이 주관하는 공개SW로 이를 이용하면 알프레스코의 워크플로우를 모두 컨트롤할 수 있다.

이 시스템은 지금 시범 운영 중이다. 시범 운영을 진행한 뒤 성과가 있으면 KRISS 원내 전체로 확장할 수도 있다. 다만 채 센터장은 “당초 내년에 표준참조표준센터 내에서 실시할 계획이 있었지만 시범 운영 결과가 아직 나오지 않아 평가 단계인 상황”이라고 말했다. 결과에 따라선 원내 전체로 확산될 수도 있는 셈이다.

※ 이번 공개SW 활용 성공사례는 테크홀릭과 정보통신산업진흥원 공개SW 역량프라자가 공동으로 발굴한 기사(http://www.oss.kr/oss_repository10/567992)다.

전자신문인터넷 테크홀릭팀

이석원기자 techholic@etnews.com