올해 정보기술(IT)업계 주요 화두는 '재난'이었다. 여름 물난리로 서버실 전원 공급이 끊겨 증권사 홈트레이딩시스템(HTS)이 먹통이 되고, 데이터센터에서 화재가 발생하자 전 국민이 쓰는 메신저 서비스가 장애를 빚었다. 재난 상황을 대비하기 위한 재난복구(DR)센터를 마련만 해 놓았지, 정작 제대로 돌아가는 경우가 드물었다.
이런 가운데 지난해 10월 출범한 토스뱅크의 경우 연속되는 재해에도 한 번의 시스템 장애도 빚지 않아 주목받았다. 모기업 토스가 2000만명이 넘는 고객을 대상으로 운영해 온 트래픽 관리와 IT 시스템 기술력을 그대로 계승한 덕분이다. 50여개가 넘는 서비스를 100여개가 넘는 다양한 금융사와 연동하고 협업하며 축적해 온 노하우도 빛을 발했다.
특히 '원앱' 전략을 채택하고 있는 토스그룹은 계열사 서비스 일부에서 장애가 발생하더라도 전체 시스템으로 확산되지 않도록 만전을 기하고 있다. 지난달 진행된 토스그룹 계열사 4개 회사 간 재난대응훈련도 성공적으로 마무리 지으며 기술적으로 차별화된 면모를 보였다.
◇흉내낼 수 없는 토스뱅크 '양자 활성화(Active-Actcive)' 기술
전통 금융사들은 기존 운영하던 주센터에서 파생된 형태로 DR센터를 운영하는 경우가 일반적이다. 형식상 DR센터를 구축한 사례가 많아 갑작스런 재난 발생 시 주센터에서 DR센터로 전환에 어려움을 겪는다.
토스뱅크는 주센터(논현)와 DR센터(김포)를 거의 동일한 자원과 리소스를 들여 '양자 활성화(active-active)' 형태로 운영하는 것이 특징이다. 한 센터가 셧다운 돼도 바로 다른 센터로 모든 서비스가 즉각 이관되고 실행 가능한 태세를 갖추고 있다.
형식상 주센터를 두긴 하지만 실제로는 각각 IDC 1, IDC 2로 부를 정도로 동일한 수준을 유지한다. 평상 시 고객 트래픽도 각 센터에 절반씩 흐를 수 있도록 설계했다.
주센터·DR센터 모두 지진, 홍수, 화재 등 재해나 비상 상황과 관련해 신속한 의사결정 및 복구 작업 진행 체계가 마련돼 있다.
화재 대비를 위해 화재 탐지시설 및 자동소화설비를 구축했다. 내진 설계 적용 기준도 논현센터의 경우 진도 6.0, 김포센터 진도 8.0를 버틸 수 있도록 설계돼 있다. 큰 홍수가 발생해도 문제가 없도록 배수펌프를 구비하고 있으며, 홍수위는 논현센터는 해발 53m, 김포센터는 해발 8m를 견딜 수 있다. 또한 양 센터의 지리적 위치를 30㎞ 이상 떨어트려 놓아 큰 재해 시에도 한 번에 모든 센터가 셧다운 되는 것을 방지하고 있다.
이와 더불어 상시적인 대응 훈련을 통해 실제 상황에 대한 대비를 하고 있다. 토스앱 장애 시에도 토스뱅크를 포함한 타 회사들도 각각의 서비스가 독자적으로 운영될 수 있도록 했다.
토스뱅크가 채택한 양자 활성화 전략은 서비스 안정화 효과가 있지만 비용이 많이 든다는 문제가 있다. 토스뱅크는 토스의 '원앱' 전략으로 절감한 앱 개발 비용을, 이처럼 안정된 서비스로 고객에게 돌려줌으로써 차별화하겠다는 전략을 취하고 있다. 이와 더불어 시중은행 대비 지점 및 창구운영 비용을 아낄 수 있는 인터넷전문은행이라는 점도 시스템 고도화에 집중할 수 있는 요인 중 하나다.
◇'태생이 IT'라 가능한 MSA 시스템…슬림하고 유연하다
IT 서비스 기반 토스뱅크는 시스템 구조상에서도 전통 금융사들과 큰 차이점을 보인다. 전통 금융사들은 굉장히 큰 규모의 모놀리틱 시스템(MA:Monolithic Architecture)을 운영하며 20~30년 전 형태 구조를 그대로 가져가고 있다. 토스뱅크는 각각 서비스별로 쪼개지는 마이크로 서비스 아키텍쳐(MSA:Micro Service Architecture)라는 '슬림'한 형태의 구조를 띄는 것이 특징이다.
안정적인 뱅킹 서비스를 제공하기 위해 토스뱅크는 고객과 계좌 관련 정보 등을 다뤄야 하는 계정계 시스템은 MA를 구축하고, 은행 업무에 필요한 다양한 채널계는 MSA 시스템을 구축하고 있다. MSA 시스템에서 여신, 수신 카드 서비스는 서버와 데이터베이스가 별도로 분리되며, 시스템의 직접적인 참조 대신 HTTP API 등 통신을 통해서만 참조를 진행한다.
통상 MSA 시스템은 MA 시스템에 비해 △각 모듈 간 정보 공유의 단절 문제 △네트워크 간 빈번한 호출에 따른 레이턴시 영향 극대화 등 문제에서 불리하다. 하지만 토스뱅크는 가상화 기술 발전에 따라 물리적 리소스를 유연하게 활용할 수 있게 됨으로써 이와 같은 문제를 여유롭게 해결했다. 동시에 유연한 변경과 새로운 서비스의 배포가 가능하다는 장점을 더해 고객 맞춤형 서비스를 구현했다.
토스뱅크와 시중은행 시스템의 더 큰 차이점은 채널계가 전달자 역할에 그치는 것이 아니라 실제로 수행자 역할을 하고 있다는 점이다. 이는 모놀리틱 시스템인 계정계가 더 커지는 것을 방지하고 테스트 자동화, 서비스 배포 시점의 문제 인지 및 빠른 롤백 등 시스템을 구축하는 결과로 이어지고 있다.
토스뱅크 관계자는 “계정계는 은행 서비스를 빠르게 구축하는 과정에서 아직은 과도기적으로 기존 금융사의 것을 유지하고 있는데, 향후 이 또한 점차 토스뱅크만의 모습으로 구축해 나갈 계획”이라며 “현재 추가되는 서비스는 채널계 서버에 반영해 빠르고 유연하게 대처해 나가고 있다”고 설명했다.
이형두기자 dudu@etnews.com