[기획]박준하 토스뱅크 CTO “5초의 서비스 중단도 용납 못한다”

박준하 토스뱅크 최고기술책임자(CTO).
박준하 토스뱅크 최고기술책임자(CTO).

토스뱅크의 심리스(Seamless) 전략 중에는 이용자들이 표면적으로 인지하기 어려운 부분들이 많다. 예컨대, 대부분 은행들이 자정 무렵 실시하는 20~30분의 전산점검 시간 동안 서비스 공백이 토스뱅크에는 없다. 개발자들이 집요하게 매달린 끝에, 최근까지 존재했던 마지막 '5초' 동안의 서비스 공백마저 지워버렸다.

박준하 토스뱅크 최고기술책임자(CTO)는 “서비스 초기부터 당행 송금과 체크카드 결제는 24시간 내내 끊김 없이 제공해야 한다는 목적의식을 갖고 있었다”며 “단 몇 초에 불과하더라도, 송금·결제 공백이 발생하면 토스뱅크를 떠나는 이용자가 생겨날 수 있다”고 설명했다.

토스뱅크는 매일 약 2분 정도의 전산점검 시간을 둔다. 이 시간 동안에도 당행 송금과 체크카드 결제를 끊김없이 가능하도록 시스템을 구축했다.

하지만 토스뱅크 엔지니어들은 내부 전산상 날짜 전환이 이뤄지는 찰나의 순간에 송금·오류가 발생한다는 것을 최근 우연히 발견했다. 입금 날짜와 출금 날짜가 달라지는 몇 초 사이에만 발생하는 문제였다. 대부분 사람들은 인지하지 못하는 공백이었지만, 엔지니어들이 집요하게 달려들어 결국 문제를 해결해 냈다.

박준하 CTO는 “사소한 부분이라고 할 수도 있지만, 만약 향후 모든 국민이 토스뱅크 계좌를 쓰게 된다면 대한민국은 5초의 송금·결제 공백도 없는 시스템을 갖춘 것이 된다”고 강조했다.

이와 같은 운영 철학은 토스뱅크가 재난 발생 시에도 운영중단 없이 서비스를 원활하게 제공할 수 있는 원동력이다. 지난달 실시한 토스그룹 재난대응훈련이 대표적이다. 서버에 문제가 생겨 토스-토스뱅크 등 각 계열사 간 서버 통신이 단절되더라도 서비스가 정상 작동하는지 여부를 살폈다. '원앱' 구조를 갖고 있는 토스지만, 메인화면의 토스 서비스가 중단되더라도 실제로 토스뱅크나 토스증권으로 이동에 문제가 없는지를 점검한 것이다.

구조상 차이는 서비스 질 차이로도 이어진다. 토스뱅크는 주센터와 DR센터를 '양자 활성화(Active-Active)' 형태로 구축하고 있는데, 이 덕분에 개발자들이 24시간 쉴 새 없이 시스템을 개선하는 것이 가능하다. 시중 은행들처럼 프로젝트 기한을 정해두고 서비스 업데이트 및 점검 시간을 둘 필요가 없다는 것이다.

24시간 서비스를 제공해야 하는 금융 서비스에서 이와 같은 차이는 지속 누적된다. 박 CTO는 이를 'F1 레이싱 경주에서 달리는 자동차의 엔진을 교체하는 작업'에 비유했다. 또 금융기업 역시 스스로 문제를 발견하고 해결할 수 있도록 '기술 내재화'가 매우 중요하다고 역설했다. 실제로 토스뱅크는 일부 유지보수 인력을 제외한 대부분 IT 인력이 내부 개발자다.

박 CTO는 “기존 은행서비스는 텔러 중심 서비스이다 보니 시스템 구조 또한 고착화 될 수밖에 없었다”며 “반면 IT 서비스 회사들은 고객과의 접점 속에 많은 발전을 이뤄왔고, 은행서비스도 고객에게 매우 밀접한 서비스로 커가기 위해서는 IT 서비스에서 해법을 찾아야 한다”고 말했다.

이형두기자 dudu@etnews.com