<화요특집-스토리지> 전산재해 복구 솔루션

 저장장치의 다양한 솔루션 중 최근 가장 주목을 끄는 것은 단연 재해복구솔루션이다. 금융권은 물론 인터넷과 통신서비스 기업을 중심으로 대용량 저장장치를 기반으로 한 재해복구솔루션에 대한 관심이 최근 고조되고 있는 것. 전산실 운영담당자들은 24시간 365일 무장애시스템 운영을 위해 RAID기법, 장비의 이중화 등 하드웨어적 보호장치나 소프트웨어적인 보안책을 채택하는 등 많은 노력을 기울이고 있다. 하지만 여기서 말하는 무장애라고 하는 것은 어디까지나 전산실안의 제한적인 의미일 뿐, 지진·화재·수해 등 전산실 운영을 완전히 불능상태로 빠뜨릴 수 있는 천재지변과 같은 각종 재해까지 완벽하게 대비하고 있는 전산센터는 거의 찾아보기 힘든 실정이다.

 금융기관과 기업들이 재해대비책 마련에 소홀한 이유는 최고경영자들이 재해로 인한 시스템운영 중단 가능성을 전혀 인식하지 못하는데다 전산실 고위 담당자들도 치명적인 것이 아니라면 시스템에 미치는 사소한 사고는 무시해도 된다는 생각을 갖고 있기 때문이다.

 재해복구대책이 수익이나 생산성 증대에 아무런 기여도 하지 못하면서 비용만 많이 들어간다는 잘못된 판단도 종합적인 재해대비책에 예산지출을 꺼리는 이유 중 하나다.

 예컨대 인터스팬 네트워크를 통해 연간 6000억달러의 신용카드 거래를 처리하는 M카드사는 최근 하루 시스템 다운으로 무려 16억4000만달러 상당의 거래를 처리하지 못해 고객들로부터 신뢰를 잃어 주식가치가 폭락하고 매출이 줄어드는 등 엄청난 손실을 입었다.

 한 조사기관에 따르면 M카드사뿐만 아니라 대다수 기업들이 재해복구대책을 마련하지 않아 돌이킬 수 없는 막대한 손실을 입은 경험을 갖고 있는 것으로 알려졌다.

 전산재해란 전산시스템에 장애를 일으켜 전산 관련업무에 영향을 미치는 것으로 기업 관점에서는 전산시스템의 기능마비로 인한 기업운영에 가해지는 피해라고 정의할 수 있다.

 그만큼 기업입장에서는 전산시스템을 안전상태로 유지하는 것이 기업운영을 위한 최상의 방법인 셈이다.

 혹시 전산장애가 발생하더라도 그 기간을 최소화해 전산장애가 전산재해로 확대되는 것을 미연에 방지해야 하는 이유가 여기에 있다.

 특히 금융기관에서는 전산시스템의 프로세스 자체가 업무 프로세스화돼 있기 때문에 재해로 전산시스템이 정지되면 사실상의 업무수행이 불가능하다.

 이처럼 전산장애·재해가 기업운영과 사업의 연속성에 치명적인 악영향을 끼칠 수 있음에도 불구하고 이에 대한 대책이 미흡한 것이 우리나라 전산실의 현주소다.

 그나마 다행인 것은 현재 미국 등 선진 금융기관들은 재해대비책의 차원에서 의무적으로 백업센터를 구축하는 가운데 신한은행과 경남은행 등 국내 몇몇 금융기관들과 통신기업들도 재해복구센터 구축을 완료했거나 이를 서두르고 있다는 사실이다.

 이는 IMF 이후 금융·통신업계의 자본유치 과정에서 기업의 중추신경 역할을 하는 정보시스템이 재해에 대한 대책이 전무하다는 지적이 제기되는데다 대만 지진사태를 지켜보면서 재해복구센터 구축의 필요성을 절실하게 인식하기 시작했기 때문으로 풀이된다.

 전산재해대책을 수립하려면 복구범위·복구완성도·복구소요시간 등 3가지 사항을 비용측면을 어느 정도 고려해 복합적으로 연결시킬 필요가 있다.

 복구범위는 과연 어느 정도의 복구가 우선적으로 이뤄져야 기업이 운영되는가에 대한 기준을 정하는 것이며 복구완성도는 완벽한 정보시스템 복구인 핫스탠바이 또는 핫사이트나 웜사이트, 콜드사이트의 개념을 도입한 것이다.

 콜드사이트(Cold Site)방식은 평상시 주기적으로 주요 데이터를 테이프에 백업해 내화금고에 보관하거나 원격지에 소산해뒀다가 재해발생시 복구불능 상태의 시스템운영을 재개할 수 있도록 하는 것.

 웜사이트(Worm Site)방식은 콜드사이트에 비해 발전된 형태로 평상시 주요 데이터를 백업해 내화금고에 보관하거나 원격지에 소산하는 점은 동일하나 로그데이터를 실시간 원격지에 복제해 재해시점까지의 로그데이터를 이용해 주요 데이터의 손실을 방지하는 것.

 핫사이트(Hot Site)방식은 재해복구 방안 중 가장 많은 투자가 필요한데 일반적으로 주요 데이터·시스템과 애플리케이션 환경을 실시간에 원격지에 복제해 재해시 최단시간안에 재해발생시점까지의 데이터를 유실 없이 복구하는 것.

 복구소요시간은 전산재해로부터 복구시간까지 소요되는 시간으로 얼마나 빠르게 정보시스템을 복구하는가에 초점을 맞춘다.

 물론 이 3가지 모두 투자될 비용과 밀접한 관계를 갖고 있다. 이러한 비용과 사업영향분석에서 정량화된 복구비용과의 비교를 통해 현실적이고 시스템적인 전산재해대책을 수립할 수 있는 것이다.

 전문가들은 재해복구시스템을 구축하는 방법으로 동기방식, 비동기방식, 디스크레벨의 비동기방식 등 3가지 방식을 제시한다.

 동기방식은 센터간 거리에 관계없이 양측에 업데이트가 완료돼야만 호스트에서 입출력 종료응답을 받을 수 있기 때문에 거리에 따른 성능저하나 신호지연시간의 한계로 인한 통신거리 제한문제가 발생할 수 있다.

 통신선로의 용량이나 장비의 기능이 향상되더라도 호스트에서는 양측에 업데이트가 돼야 하나의 Write입출력이 처리된다는 근원적인 부담을 없애지 못한다.

 비동기방식은 일부 비동기식 저장장치시스템이 데이터의 정합성을 CPU레벨에 맞춰야 하기 때문에 많은 호스트 자원구비 및 운영에 따른 고가의 구현비용을 감안해야 한다.

 비용문제를 해결한 비동기방식은 거리 ,수행능력, 데이터의 정합성 등의 측면에서 재해복구센터로서 가장 안정적이고 효율적인 구축방법이라고 할 수 있다.

 디스크레벨의 비동기방식은 백업센터의 CPU 없이 비동기방식으로 복제할 수 있다면 재해복구시스템 구축비용을 줄일 수 있는 가장 효과적인 방법이지만 양측에서 따로 업데이트되는 데이터의 정합성을 어떻게 맞추느냐의 문제를 안고 있다.

 대표적인 재해복구솔루션 구축사례로 주목받는 신한은행은 계정계와 정보계를 통합적으로 이중화 운영, 재해에 대한 완벽한 대책을 수립하면서 남대문의 데이터센터를 일산으로 이전하고 남대문 본점의 전산센터를 백업센터로 활용하기로 했다.

 이에 따라 백업센터에 주센터와 동일한 시스템 환경을 구축한 상태에서 트랜잭션 로그를 백업센터로 전송해 3시간의 시차를 두고 주센터와 백업센터가 시스템 이중화를 할 수 있도록 한 것.

 신한은행은 핫사이트방식으로 완전한 시스템 복구체계를 갖추기 위해 EMC 재해복구솔루션인 SRDF(Symmetrix Remote Data Facility)와 저장장치(시메트릭스 5430), 계정계 호스트인 유니시스 메인프레임, 정보계용 HP서버를 도입해 기존의 장비를 남대문 백업센터에 두고 새로 일산 주센터에 설치했다.

 구축된 백업센터와 주센터간에는 전용선인 T3라인 3회선으로 구축했는데 2개 회선은 실시간 로그 전송용도와 테이프 백업라인으로, 나머지 1개 회선은 센터간 업무운영으로 사용하고 있다.

 경남은행도 효성인포메이션시스템과 삼성SDS를 통해 재해복구시스템 구축을 본격화하고 있다.

 백업시스템 구축에 투입된 효성의 HARC(Hitachi Asynchronous Remote Copy)는 기존 비동기방식에서 필요한 호스트자원을 사용하지 않으면서도 CPU의 SDM대신에 디스크레벨인 히타치 7700E에서 복제관리해 거리, 퍼포먼스, 데이터 정합성을 동시에 만족시키는 새로운 기법의 비동기방식 솔루션이다.

 백업센터에 별도의 CPU가 필요하지 않으므로 재해복구센터 구축 비용을 획기적으로 줄일 수 있고 디스크레벨에서 IBM XRC(Extend Remote Copy) 알고리듬으로 데이터 정합성을 구현한다.

 신한은행과 경남은행에 이어 국민은행·한빛은행·주택은행·외환은행 등 국내 대형 시중은행들도 재해복구솔루션 도입을 서두르고 있으며 SK텔레콤과 한솔PCS 등 이동통신업체들도 백업센터를 건립하는 등 전산재해 대책마련에 박차를 가하고 있다.

 이에 따라 최근 주목받는 재해복구솔루션시장을 공략하기 위해 올해 저장장치업체들은 각 사별로 차별화한 솔루션을 내세워 치열한 각축전을 전개할 것으로 예상된다.

김종윤기자 j ykim @etnews.co.kr