IT 인프라가 점점 크고 복잡해지면 그에 비례해 시스템 다운이나 데이터 유실, 개인정보 유출 등 다양한 사고들이 발생하기 쉽다. 일정 수준 이상 규모로 서비스를 운영하며 예산에 여유가 있는 조직들은 이러한 문제를 해결하기 위해 여러 보완 장치를 사용한다. 대표적인 사례는 인프라나 데이터 문제로 생기는 사고로부터 서비스를 빠르게 재개하기 위한 재해복구(DR:Disaster Recovery) 시스템이다.
이상적으로 서비스가 어떤 경우에도 중단되지 않게 하는 무중단 시스템 구축을 목표로 하는 것이 바람직하다. 그러나 무중단, 즉 가용도(Availability) 100%라는 시스템은 현실적으로 구현하기 매우 힘들다.
따라서 기업 입장에선 적절한 수준의 가용도, 복구시간목표(RTO:Recovery Time Object), 복구시점목표(RPO:Recovery Point Objective)와 그에 필요한 비용을 두고 고민할 수밖에 없다. 가용도가 100%가 아닌 이상 서비스 다운 시간의 발생은 불가피하고 이를 얼마나 빨리 RTO 내 복구할 수 있고 얼마나 데이터를 덜 잃는 지(RPO)에 따라 피해 수준이 달라지기 때문이다. 그리고 가용도를 높이기 위해 시스템 이중화 등 장치를 추가하면 비용은 급격하게 상승한다.
클라우드의 멀티 AZ(Availability Zone) 구성으로 가용도를 크게 높일 수 있는 데 왜 DR가 필요하냐고 말하는 사람도 있다. 다시 한번 말하지만 세계 1위 업체의 클라우드를 사용하더라도 장애는 발생한다. 멀티 클라우드를 통해 서비스 다운을 최대한 방지한다고 해도 랜섬웨어의 서버 데이터 삭제를 막을 수는 없다.
말하자면 DR는 시스템 장애나 침해 사고 등으로 인한 피해를 최소화하기 위한 일종의 보험이다. 기존 레거시 인프라를 사용 중 인지 또는 클라우드를 사용 중인지 여부와 관계없이 의미 있는 것이다.
클라우드 시대 이전의 DR는 장비를 설치할 공간, 예비장비 및 소프트웨어(SW), 회선과 백업 솔루션을 모두 준비해야 했다. RPO와 RTO에 따라 다르지만 상당한 비용이 지출되지 않을 수 없었다. 백업 장비를 놓으려면 규모와 관계없이 일단 상면은 계약해야 했고 사용하지 않는 소프트웨어를 설치해서 준비해두려면 그만큼의 비용이 더 들었다.
그러나 클라우드에서는 장비나 회선이 가상화되어 있으므로 별도 계약 없이 원하는 때에 바로 사용할 수 있다. 사용하지 않는 상면에 대한 비용 지출이 없으며 백업 때문에 랙에 장비를 설치해둘 필요도 없다. 몇 시간을 들여 OS를 설치하지 않아도 되고 작성된 템플릿으로부터 서버를 바로 구동할 수 있다.
따라서 클라우드에서 DR는 레거시 인프라부터 신규로 구축하는 클라우드 네이티브 애플리케이션에 이르기까지 모두에게 유용하다. 여기서 중요한 건 데이터이다. 원본 사이트의 데이터가 일정 시간마다 백업되고 있다면 실제 VM(가상머신) 등 인프라를 구성해놓지 않더라도 정해진 구성을 수십분 안에 바로 올릴 수 있다.
아마존웹서비스(AWS)의 클라우드포메이션이나 MS 애저(Azure)의 리소스 템플릿이 이런 역할을 한다. 실제로 운영하기 전 백업 사이트를 미리 구동해놓는다 하더라도 CPU나 메모리를 백업에 필요한 최소 수준으로 낮춰두면 RTO나 RPO는 기존 레거시 DR 수준으로 유지하면서도 비용을 최적화할 수 있다. 더불어 두 개 이상의 CSP(클라우드 서비스 공급자)에 걸쳐 이러한 DR를 구축해두면 벤더 락인(Lock in)을 피하는 동시에 특정 CSP 장애 시의 백업도 되므로 매우 유리하다고 할 수 있다.
최근에는 DR 자체를 클라우드화해 DRaaS(DR as a Service)라는 형태의 서비스로 제공하는 기업도 늘고 있다. 서비스 형태는 조금씩 다르지만 대개 원본 사이트에서 간단한 관리 프로그램만 설치하면 데이터가 DRaaS 기업의 클라우드로 지속적으로 동기화되며 재해 시에는 빠르게 백업 인프라를 전개해 서비스를 재가동할 수 있게 된다.
직접 DR 인프라를 구축하거나 관리하는 수고로부터 해방될 수 있다. 서비스로 사용한 만큼의 요금만 내면 된다. 비용은 조금 높아지겠지만 시간과 노력을 줄일 수 있어 결과적으로는 이득이다.
특히 비용 부담으로 인해 고가의 DR 솔루션 도입을 주저했던 중소기업이라면 클라우드에서의 DR이라는 선택지를 한 번 검토해보길 권하고 싶다. 고객의 높아진 서비스 요구사항, 그리고 복잡해지는 IT 환경을 고려한다면 DR라는 솔루션의 효용은 앞으로 더욱 커질 것이기 때문이다.
<자료제공:클라우드 전문기업 케이아이엔엑스(KINX)> 노규남 CTO bardroh@kinx.net