KT 아현지사 화재로 통신장애가 발생한 지 3일이 지나면서 임시 복구율이 100%에 근접했다. 그러나 통신장애로 인한 고객 불편이 완전히 해소되지 않고 있다.
KT 아현지사 화재는 통신 중요성은 물론, 통신장애가 우리 삶에 미치는 피해가 얼마나 큰지를 여실히 보여줬다. 동시에 통신장애 예방과 신속한 복구를 위한 대비가 필요하다는 과제도 남겼다.
모든 사물이 연결되는 초연결사회로 진입할수록 통신장애 예방과 신속한 복구 중요성은 커진다. 소프트웨어정의네트워크(SDN)와 인공지능(AI) 네트워크 등 첨단 정보통신기술(ICT)이 주목받는 것도 이 때문이다.
◇임시복구에 3일 이상 걸려
KT 아현지사 지하 통신구에 화재가 발생한 것은 지난 24일 11시 12분이다. KT는 화재가 진압된 당일 밤 늦게부터 복구를 시작했다.
사고 하루 후인 25일 오후 6시 기준 인터넷 회선은 97%, 무선은 63% 복구됐다. 26일 오후 8시에는 인터넷 98%, 무선 86%로 복구율이 높아졌다. 사고 사흘 후인 27일 오전 11시 기준 인터넷 복구율은 99%, 무선 96%다.
그러나 복구율은 장비 기준 수치다. 고객이 원활한 서비스를 이용하는지 체감도와는 차이가 있다. 사고 발생 3일째지만 임시복구가 완료되지 않았다. 완전복구에는 시일이 필요할 전망이다.
복구 시간이 3일을 넘긴 것은 백업 체계가 없었던 탓도 있지만 해킹이나 오류 등에 의한 전산시스템 사고가 아닌 화재에 의한 물리적 망 손실로 발생했기 때문이다. 특히 무선은 우회 경로가 없어 복구에 시간이 더 걸렸다.
KT는 많은 엔지니어를 투입, 끊어진 광케이블을 다시 연결하거나 다른 경로로 우회시키고 있다. 네트워크 장비에는 각각 설정값이 있다. 회선을 우회할 경우 노트북으로 설정값을 일일이 확인하고 조정해야 한다. 시간이 많이 걸릴 수밖에 없다.
네트워크 전문가는 “장애가 발생해 선로를 우회해야 하는 경우 지금 통신망 기술로는 많은 인력을 투입해서 일일이 설정값을 확인하는 수밖에 없다”면서 “복구 시간이 길어질수록 이용자 불편이 커질 수밖에 없다”고 설명했다.
◇SDN으로 복구시간 최소화
전문가들은 SDN 확산에 힘을 쏟아야 한다고 강조한다. SDN은 말 그대로 '이용하는 소프트웨어(SW)에 따라 통신장비 성격과 기능이 정의(결정)'된다는 의미다.
가상화 기술로 네트워크에 흐르는 신호(패킷)와 제어(컨트롤) 부문을 분리, 제어 SW를 중앙 컨트롤러에 모아 각 장비를 일괄 관리하는 방식이다. 각 장비에 문제가 발생하거나 수정이 필요할 경우 일일이 장비를 건드리지 않고 중앙에서 SW로 일괄 제어할 수 있다.
시스템 오류가 아닌 KT 아현지사 화재처럼 물리적 사고의 경우에도 복구 시간을 최소화할 수 있다. 거미줄처럼 연결된 망에 SDN이 적용돼 있다면 현장에 나가 일일이 설정값을 확인하지 않아도 된다. 중앙에서 SW로 일괄 세팅을 통해 신속한 우회가 가능하다. 복구 시간을 수일에서 수시간으로 단축할 수 있다는 얘기다.
통신사 관계자는 “SDN이 모든 통신장애를 해결해주는 만병통치약은 아니다”라고 전제하고 “그러나 네트워크에 적용하는 범위가 늘어나면 늘어날수록 장애 대응이 신속해지는 것은 분명하다”고 말했다. 그는 코어 네트워크뿐만 아니라 가입자망까지 SDN 적용 분야가 넓어지고 있다고 덧붙였다.
박성용 쿨클라우드 대표는 “구글이나 페이스북 같은 해외 기업은 이미 데이터센터와 네트워크 분야에 SDN을 상당히 폭넓게 활용하고 있다”면서 “국내에서도 SDN에 관심을 갖고 도입하려는 기업이 늘고 있다”고 말했다.
◇지능형에서 자동형 네트워크로
SDN은 네트워크를 지능형으로 바꿔준다. 운영자가 망 운영과 제어를 신속하고 유연하게 할 수 있도록 해준다. 장애 대응뿐만 아니라 운용 효율성 측면에서 5세대(5G) 이동통신 필수 기술로 손꼽힌다. 일시에 모든 네트워크를 교체할 수 없기 때문에 내용연수가 다 된 장비부터 SDN 장비로 교체해야 한다는 게 전문가 충고다.
과학기술정보통신부는 SDN 중요성을 파악하고 지난해부터 '지능형 초연결망 실증사업'을 하고 있다. KT, SK텔레콤과 SDN 적용 장비와 기술을 개발, 일부 공공기관에 적용했다. 내후년까지 SDN 기술 완성도를 높이고 적용 사례를 민간으로 확대하는 게 목표다.
SDN을 통한 지능화 이후 단계는 인공지능(AI)을 통한 자동화다. 운영자 개입 없이 망 운영과 제어를 네트워크가 자율로 처리하는 'AI 네트워크'다. SK텔레콤과 KT는 AI로 네트워크 장애 원인을 찾고 망을 최적화하는 기술을 개발 중이다.
SDN과 AI 네트워크가 장비 대응과 복구를 위한 기술이라면 장애 예방에는 사물인터넷(IoT)과 빅데이터를 활용해야 한다. IoT는 물리적 문제 발생을 감지하고 상황을 전파한다. KT 아현지사 화재에서도 KT가 통신구 50m마다 설치한 IoT 설비가 화재를 조기 감지, 재난 확산을 막았다.
빅데이터는 IoT와 연동, 사고 발생 가능성을 예측한다. 네트워크 상태와 주변 상황이 평상시와 다른 패턴을 보일 경우, 분석을 통해 사고 발생을 미연에 방지하고 서비스 중단을 예방할 수 있다. '사후대응'을 '사전예방'으로 바꿔준다는 점에서 연구개발이 필요하다.
통신장애를 예방하기 위해선 소방법 등 제도 미흡점을 개선해야 한다. 그러나 제도 개선과 더불어 빅데이터와 IoT, SDN과 AI 등 첨단 기술 투자를 늘리고 적용을 확대해야 통신 장애를 최소화할 수 있다.
안호천 통신방송 전문기자 hcan@etnews.com
-
안호천 기자기사 더보기