슈퍼컴 또 가동 중단

연구개발정보센터(KORDIC)의 슈퍼컴퓨터 2호기인 C90시스템이 순환펌프의 고장으로 지난 24일 오후 3시부터 25일 새벽 1시까지 가동을 중단하는 사태가 또 발생한 것으로 뒤늦게 밝혀졌다.

이는 슈퍼컴 2호기가 도입된 93년 이후 지난 13일 KORDIC 건물 전체의 정전으로 10여시간 가동을 멈춘 이후 내부고장으로 가동을 중단한 사례로는 처음이다.

이날 슈퍼컴의 가동 중단은 신속한 대처로 큰 피해가 발생하지는 않았지만 KORDIC측은 복구반을 편성, 보조 컴퓨터인 SMP로 C90이 하던 작업을 임시로 옮겨 수행했으며, 일부작업은 SMP의 용량부족으로 지연되기도 했다.

KORDIC은 슈퍼컴의 순환펌프가 고장나자 즉시 긴급수리에 들어갔으나 노후정도가 심각, 고칠 수 없다는 판단에 따라 기아그룹의 액화불소모터를 헬리콥터로 공수, 고장 이틀째인 25일 새벽 1시께 긴급수리을 마치고 슈퍼컴 재가동에 들어갔다.

이번 사태의 직접적인 원인은 KORDIC이 보유하고 있는 슈퍼컴의 순환펌프 고장이지만 부대시설인 비상발전기와 무정전시스템(UPS) 등의 노후정도도 심각한 것으로 드러났다.

비상발전기의 경우 비상시 전원을 공급하는 장치로 사용되기보다는 무정전시스템의 전력을 보충해주고 슈퍼컴의 정상적인 다운에만 사용되고 있을 정도로 전압이 불규칙하고 성능이 떨어지며 배터리나 UPS 대부분의 시설 노후화도 심각한 형편이다.

이에 따라 주컴퓨터인 C90과 부대시설의 수명이 5년인 점을 고려할 때 수령 8년째에 이르고 있는 슈퍼컴과 노후된 부대시설의 교체작업이 시급히 이루어져야 할 것으로 지적되고 있다.

슈퍼컴 관련 전문가들은 『지난 13일의 정전으로 인한 슈퍼컴의 가동중단과 마찬가지로 KORDIC측이 충분히 활용가능한 부대시설만 갖췄더라면 불의의 사고에 대비할 수 있었다』며 『노후 시설교체작업이 조속히 진행되어야 향후 이같은 사태가 더이상 발생하지 않을 것』이라고 지적했다.

KORDIC 관계자는 『슈퍼컴 3호기 도입과 2호기 관련 부대시설에 대한 예산이 배정되는 것으로 알고 있다』면서 『국내 유일의 공동활용장비인 슈퍼컴이 다운되는 것에 대한 조속한 대책이 있어야 한다』고 말했다.

한편 슈퍼컴퓨터는 국내 연구소, 대학 등 202개 기관과 초고속 전산망으로 연결돼 있으며 관련 기관의 e메일 등을 책임지고 있는 국가 5대 기간전산망 가운데 하나다.

<대전=박희범기자 hbpark@etnews.co.kr>