[Analysis]DR체계, 인터넷 가용성 확보 방안도 포함시켜야

 IT인프라 관점에서 IT서비스의 재해복구(DR) 체계는 크게 △물리적 서버시스템(애플리케이션) △스토리지(데이터) △네트워크 세 부분으로 나눌 수 있다. 최근에는 인터넷 기반의 서비스가 보편화되면서 인터넷 액세스도 중요한 구성요소로 고려해야 한다는 목소리가 높다. 이전에는 기업 방화벽 내 네트워크 이중화로 충분했지만 이젠 기업 외부의 네트워크, 즉 인터넷 가용성도 기업 DR 체계에 포함시켜야 하는 상황이 된 것이다.

 이는 기업 애플리케이션이 인터넷 기반으로 전환되고 글로벌 환경에서 인터넷 망을 통해 업무시스템에 접속하는 환경이 증가하고 있기 때문이다. 클라우드컴퓨팅과 서비스로서소프트웨어(SaaS), 모바일오피스 환경이 확산될수록 기업 IT서비스의 속도와 가용성, DR에서 인터넷 속도와 안정성이 차지하는 비중이 늘어나고 있다.

 ◇통신사 몫이었던 인터넷 접속성도 기업 DR 체계 대상=일반적인 DR시스템은 서버의 물리적 장애 혹은 애플리케이션 장애에 대비해서는 서버 이중화를 구현한다. 상호 클러스터링으로 메인서버(액티브 노드)와 백업서버(스탠바이 노드)를 연결하고, 장애가 감지되면 메인서버에서 백업서버로 실시간 페일오버(업무이관)를 구현해 백업서버에서 서비스가 곧바로 재개되도록 한다.

 서버 클러스터링 구축 비용이 높기 때문에 차선책으로서 스토리지 미러링(데이터 복제 및 백업)이 일반적으로 사용된다. 금융권이나 통신서비스와 같이 무중단 서비스를 요구받고 있는 주요 산업에서는 서버 클러스터링과 스토리지 미러링을 동시에 구현하지만 그렇지 않을 경우 데이터 백업, 나아가 복제 및 실시간 미러링으로 데이터 보호에 주력한다. 장애 발생 이후 서비스 재개에 가장 중요한 자산이자 기반이 데이터라는 인식 때문이다.

 서버나 스토리지에 비해 네트워크는 IT서비스 DR의 기본 요소이긴 하지만 구현 방식이 까다롭지 않아 큰 이슈는 되지 않았다. 보통 통신회선 이중화, 네트워크 스위치(이더넷·SAN 스위치)를 이중화해 접속 장애에 대비한다.

 이전까지 네트워크 측면의 가용성이라고 하면 스위칭 장비, 방화벽, 부하분산(로드밸런싱) 등 데이터센터 내부의 네트워크가 대상이었다. 외부 네트워크에 대한 DR 정책은 서로 다른 통신사의 전용선을 함께 사용해 이중화하는 것이 전부였다.

 하지만 한국씨티은행의 전산장애 사건에서 보듯 네트워크 중단이 거액의 서버 이중화, 디스크 미러링도 무용지물로 만들 수 있다. 네트워크 원천 두절로 메인시스템이 원격지 백업센터에 서비스를 이관받아 재개하라는 통신 자체가 불가능했기 때문이다.

 한 업계 관계자는 “백업센터와 메인센터의 교신이 안 되니 백업센터를 임시 주센터로 사용할 수밖에 없었고 시스템 구성을 위해 서버, 스토리지, DB, 미들웨어 등 각 부문 엔지니어들이 모두 수도권 외곽 백업센터로 집결하기까지 시간도 제법 걸렸다”며 한국씨티은행의 장애 복구가 늦어졌던 배경을 설명했다.

 ◇애플리케이션 운용과 전송 모두 DR 대책 필요=글로벌 IT서비스 환경에서 서비스 가용성과 DR 체계는 데이터센터의 심장부(시스템)와 접속(인터넷) 부문으로 나눠 생각할 수 있다. 어느 쪽이든 중단되어서는 업무가 마비되는 사태를 맞게 된다. 데이터센터 내에 고가의 서버 이중화와 데이터 복제 툴을 구축했다 해도 인터넷이 불통되면 방법이 없다.

 대표적인 사건이 2006년 말 대만에서 발생한 강진이다. 이 지진으로 한국, 싱가포르, 일본 등 아시아 각국을 연결하는 해저 광케이블이 중단됐고 홍콩에 전산센터를 둔 금융기관을 포함해 기업들의 이메일, 전자상거래, 주식거래 등 모든 인터넷 서비스가 사실상 차단됐다.

 또 극심한 트래픽을 발생시켜 분산서비스거부(DDoS)를 일으키는 사이버 공격 또한 기업의 IT서비스를 위협하고 있다. 최근 위키리크스, 이집트 사태에서 보여준 DDoS 공격은 물론이고 2009년 7월 DDoS 공격으로 주요 정부기관과 일부 포털의 서비스가 중단됐다는 점은 IT서비스를 지속적으로 제공하기 위해서는 안정된 외부 인터넷 액세스가 확보돼야 한다는 사실을 잘 보여준다.

 이러한 위협에서 벗어나기 위한 네트워크 차원의 DR 솔루션 중 하나가 GSLB(Global Server Load Balancing)다. 여러 지역에 분산 구축된 데이터센터나 DR센터 중 한 곳에서 장애가 발생하면 상위의 DNS(Domain Name System)에서 서비스가 가능한 센터의 IP로 우회 연결되도록 하는 것이다.

 이를 서비스로 제공받을 수도 있다. 콘텐츠 딜리버리 네트워크(CDN) 서비스가 바로 그것이다.

 CDN 서비스는 시스템에 대한 인터넷 접속 지연이나 장애시 우회 연결시킨다. 또 서비스에 접속하는 인터넷 트래픽을 분산시켜 빠른 속도로 서비스가 제공되도록 한다.

 일반적으로 CDN에서 콘텐츠는 동영상이나 게임, 포털 등 온라인 서비스에서 최종 사용자에게 전달되는 파일 기반의 데이터를 뜻한다. 그러나 기업 ERP마저 웹 기반으로 전환되고 지구 반대편에서 인터넷을 통해 본사 ERP에 접속할 수 있게 되면서 상황이 달라졌다.

 대표적 CDN 서비스업체인 아카마이의 정진우 한국지사장은 “아카마이는 인터넷을 통해 전송되는 모든 데이터를 콘텐츠로 간주하고 있다”고 말했다. 그것이 ERP DB 데이터이건, 애플리케이션 서비스 요청이건 종류를 막론하고 콘텐츠라는 것이다. 아카마이는 자사만의 콘텐츠 인식 가속 기능 때문에 인터넷 기반 일반 업무시스템의 가속과 가용성도 제공 가능하다고 주장한다.

 톰 레이튼 아카마이 최고과학자는 ‘서비스로서네트워크(NaaS)’라는 용어를 사용하고 있다. 통신서비스업체와 겨루는 것이 아니라 주어진 인터넷 회선을 더욱 안정적이고 빠르게 사용할 수 있는 보완재 역할을 한다는 주장이다.

 이 같은 서비스는 기업 IT서비스의 인터넷 의존도가 높아지면서 기업 애플리케이션의 성능에도 기여하고 있다.

 기업 애플리케이션의 성능은 PC 앞에 앉아 작업을 수행하는 최종 사용자의 요청에 응답 화면을 보여주기까지의 속도다. 애플리케이션을 운용하는 서버 시스템이나 스토리지가 제 아무리 고성능이어도 애플리케이션 결과값이 서버에서 사용자의 PC 화면까지 도달하는 데 오랜 시간이 걸린다면 전반적인 애플리케이션 성능평가는 좋은 점수를 받을 수 없다.

박현선기자 hspark@etnews.co.kr