[CIO BIZ+]Case Study/포스코그룹 `통합IT관제센터`

경기도 판교에 있는 포스코그룹 통합 IT관제센터 `코맨드센터`의 전문 관제요원들이 관제 업무에 몰두하고 있다.
경기도 판교에 있는 포스코그룹 통합 IT관제센터 `코맨드센터`의 전문 관제요원들이 관제 업무에 몰두하고 있다.

포스코ICT 판교 사옥엔 24시간 불이 켜진 곳이 있다. 7층에 있는 통합 정보기술(IT)관제센터인 `커맨드센터(Command Center)`다. 포스코를 포함한 주요 그룹 계열사의 공장과 사무실 업무를 가능하게 하는 모든 IT 운용 상황을 이곳에서 항시 관제하고 문제가 생기면 즉시 조치한다.

커맨드센터는 `민첩함`을 키워드로 변화의 선봉에 서 있다. 포스코가 올해 추진 중인 포스피아 3.0 프로젝트의 각종 정보시스템 운영을 앞두고 유연하고 빠른 변화를 돕기 위한 만반의 준비를 하고 있었다.

◇데이터센터·계열사·해외 기지 시스템 관제=포스코ICT의 판교 사옥은 건물 곳곳에 스마트워크 개념이 녹아 있다. 벤치마킹 명소로도 꼽히는 이곳에는 개인 지정석이 없다. 층마다 널찍이 마련된 독서와 휴게 공간이 눈길을 끈다.

이 가운데 항상 긴장을 늦추지 못하는 곳이 있다면 바로 커맨드센터다. 포항·광양 등 포스코 4개 지역 데이터센터와 19개 계열사, 베트남·멕시코 등 해외 생산기지 7곳과 해외 가공기지 25곳의 시스템을 관제하고 있다. 사람과 사람, 시스템과 시스템 간 소통 속도를 높이기 위한 영상회의 인프라 등 최신 기술이 집결해 있다.

본래 서울 포스코센터에 자리했던 이 센터는 지난 3월 판교로 옮겨왔다. 첫 탄생 시기는 2005년이다. 이전까지는 경기도 분당, 경북 포항과 전남 광양에 각각 데이터센터가 별도로 있어 관제업무도 따로 수행했다.

자타가 인정하는 이곳의 가장 큰 차별점은 전문 관제요원을 통한 선제 대응력이다. 센터는 크게 관제실, 상황실, 분석실, 운영조직으로 구성돼 있으며 관제실이 바로 이 역할을 한다.

시스템 장애 징후를 비롯해 각종 알림성 징후가 하루 평균 800∼1000개 있지만 이 가운데 75% 이상이 관제실에서 포착 즉시 해결된다. 빠르게 1차 조치를 수행하는 전문 관제요원이 있기 때문이다.

4교대로 근무하는 세 명의 상주 관제요원은 시스템 운용을 맡고 있는 담당자들에게 추가 조치를 요청하지 않고도 장애를 예방하는 역할을 맡는다. 베트남 인력 등도 상주하면서 해외 법인의 요청에 대응한다.

권성주 포스코ICT 차장은 “이 관제센터의 가장 큰 강점은 강력한 1차 조치 대응 체계”라면서 “관제요원이 빠르게 조치해 장애를 예방할 수 있도록 하고 있다”고 설명했다. 통상적 관제센터는 `모니터링`에 그치는 경우가 많지만 실질적인 운영 역량까지 갖추고 빠르게 조치하는 감쪽같은 솜씨를 자랑한다. 분석 역량이 높아 빠르게 문제를 잡아내고 대처할 수 있는 전문가들이다.

포스코ICT는 현재 75%를 넘어선 사전조치 대응 비율을 90%까지 높여갈 계획이다. 권 차장은 “향후 10%가량의 조치만 실제 애플리케이션이나 인프라 운영자에게 전달될 수 있도록 선제 대응 조치를 강화할 것”이라고 말했다.

◇문제 상황 자동 시각화, 시스템이 자동 조치까지=징후 등급에 따라 대응 방식은 다르다. 장애가 발생하면 심각도에 따라 관제 요원이 조치 여부를 판단하고 연락체계에 따라 유선 전화, SMS, 메신저로 내용을 전송한다. 관제요원이 조치하기 어려운 때는 상황실을 오픈한다. 인프라와 애플리케이션 담당자가 순식간에 한 장소에 모인다.

중요한 이상 징후가 포착되면 IT도 스스로 스마트하게 움직인다. 해당 상황을 분석하는 데 필요한 화면을 담당자가 일일이 찾아갈 필요가 없다. 상황에 따라 담당자가 봐야 할 분석물 화면이 자동으로 시각화되기 때문이다. 이 점이 이 관제센터가 가진 두 번째 주요 차별점이다.

권 차장은 “중요한 신호가 뜨면 해당 징후의 상황 분석과 통계 콘텐츠를 자동으로 화면에 표출해 주는 기능을 갖췄다”면서 “하나의 건도 종합적으로 볼 수 있는 역량을 높인 것”이라고 설명했다. 기술 관점뿐만 아니라 사업과 연계된 비즈니스 관점을 연계해서 정보를 표출한다.

14개 상황판 화면을 비롯한 `통합 대시보드`로 정보를 공유하고 메신저로 빠르게 소통하는 것은 기본이다. 전국 사업장이 단일 인터넷프로토콜(IP) 네트워크로 묶여 있어 화면 등 콘텐츠 공유도 빠르다. 음성 경보 시스템과 녹화 시스템 등 모든 상황 대응이 IT로 실시간 공유 및 기록된다. 과거엔 관제로 보는 정보, 상황실에서 접하는 정보, 원격지에서 보는 정보가 다 다르고 별도 시스템으로 운영하다 보니 의사결정 속도도 늦었다.

지난해 한 시간이 넘던 평균 장애 대응 시간을 올 연말까지 45분으로 줄이고 내년 이후 30분 이내로 단축한다는 복안이다. 더 나아가 사람이 하는 1차 대응 조치를 시스템이 자동으로 하도록 할 계획이다.

`1차 조치 자동화`라 불리는 시스템 개발을 진행 중이며 내년 이후 실제 20% 이상의 선제 대응이 자동으로 이뤄질 수 있을 것으로 기대된다. 권 차장은 “정형화되고 예외 사항이 없는 경미한 조치 사항 위주로 자동 조치 비율을 늘려나갈 계획”이라고 강조했다.

◇장애 대응력 노하우 쌓고 모바일로 스마트 관제=내년부터는 `모바일 관제시스템` 운용을 통해 관제실에 있지 않은 요원들도 스마트폰 등 모바일 기기로 정보 공유가 가능하도록 할 계획이다. 올 하반기 시스템을 개발해 내년 말까지 모바일 관제 체계를 갖추고 스마트 기기로 조치까지 가능하도록 해 장애 대응 역량을 높이기로 했다.

장애 조치에 대한 지식 자산 데이터베이스(DB) 체계도 갖춘다. 장애 조치 지식관리(KM) 시스템을 구축해 더욱 능숙하게 장애에 대응할 수 있도록 노하우를 결집한다는 것이다.

권 차장은 “과거엔 상황이 발생할 때마다 새롭게 분석해야 하고 전문 담당자가 대응하지 않으면 시간도 더 걸렸다”면서 “메뉴화된 대응 체계로 장애 조치 역량을 상향 평준화하고 대응 속도도 높일 수 있는 지식 자산을 축적해 시스템 품질을 높여나갈 것”이라고 포부를 밝혔다. 올해 데이터 통합 작업과 시스템 보완 작업을 진행 중이며 내년에 가동한다.

이렇듯 모든 정보를 상호 공유할 수 있는 체계는 이 센터가 민첩함을 위해 갖추고자 한 핵심 인프라다. 모니터링을 더 잘하기 위한 모니터링 관련 시스템 추가 도입도 앞두고 있다. 장애 발생 동향 분석과 더불어 사전 예측까지 강화해 미리 대처할 수 있도록 하기 위해서다.

내년 이후엔 클라우드 보안 관제센터도 문을 연다. 통합 보안 관제 대응 역량을 높이기 위한 것으로 포스코와 각 계열사의 보안 관제를 한곳에서 가능하게 한다. 집중화된 보안 관제 시스템으로 각 계열사 시스템의 보안을 한층 강화하고 효율적으로 방어할 수 있는 체계를 갖추게 된다.

유효정기자 hjyou@etnews.com