RAID(Redundant Array of Independant Disks) 메모리가 각광받을 전망이다. 최근 컴퓨팅 환경이 대형화되면서 기가급 이상의 대용량 메모리 자원을 활용하는 시스템의 증가로 인해 메모리에 장애가 발생할 위험이 높아짐에 따라 이를 간단히 해결할 수 있는 방안에 대한 업계 관계자들의 관심이 크게 늘고 있기 때문이다.
대부분의 업체들이 현재 메모리의 가용성을 높이기 위해 채택하고 있는 메모리는 ECC(Error Checking and Correcting) 메모리. 이는 자동으로 에러를 검색하고 보정해주는 기술로 많은 벤더들이 표준으로 채택할 정도로 범용화된 기술을 의미한다.
그러나 최근에는 메모리 용량이 기하급수적으로 증가함에 따라 ECC 메모리 기술만 가지고는 메모리의 가용성을 보장할 수 없게 됐다. 예를 들어 16Gb의 ECC 메모리를 장착한 시스템의 경우 1년간 50% 가량의 장애율이 발생할 정도다. 이는 메모리 사용량이 급속히 늘면서 다중 비트 에러가 많이 발생하고 있기 때문이다.
ECC 메모리 1Gb 장착 시스템의 경우는 연간 장애율이 3%에 그칠 정도로 미미한 데 반해 대용량 메모리를 장착한 시스템의 경우는 장애율이 급증하고 있는 것이다. 그렇다면 왜 그럴까. 바로 소프트 에러 때문이다.
메모리 장애의 경우 소프트 에러와 하드 에러로 나눌 수 있는데 문제가 되는 것은 주로 소프트 에러에 의해 장애율이 급증하고 있다는 것. 소프트 에러란 메모리에 저장된 자료가 엉뚱하게 바뀌는 경우를 말한다. 하지만 이는 메모리 자체의 결함이 아니기 때문에 에러 자체를 수정하기만 하면 아무런 문제 없이 쓸 수 있다.
소프트 에러는 현재 IA서버 업계 표준 메모리 기술인 ECC 메모리에 의해 모두 감지돼 정정될 수 있다. 메모리 자체의 결함이나 연결부위 이상 및 기타 물리적인 결함에 의해 생겨나는 하드 에러와는 다른 것이다. 그러나 이것도 메모리 용량이 늘어나면 다중 비트 에러의 발생 가능성이 기하급수적으로 증가하게 된다.
이에 따라 대두된 것이 첨단 메모리 보호기술. 현재는 ECC 메모리 방식을 주로 채택하고 있지만 최근에는 하드디스크드라이브(HDD)에서 사용해온 온라인 스페어 메모리·핫 플러그 미러드 메모리·핫 플러그 RAID 메모리 등의 기술이 잇따라 선보이고 있다.
온라인 스페어 메모리 기술은 장애가 발생할 경우 미리 설정해 놓은 여분 메모리 영역으로 자동으로 복구가 이뤄져 서비스가 가능하도록 한 경우며, 핫 플러그 미러드 메모리 기술은 메모리가 마치 거울과 같이 동일한 정보를 두 군데에 저장하고 있다가 첫번째 메모리 영역에 장애가 발생하면 다른 두번째 영역이 자동으로 넘겨받아 중단없이 서비스를 수행하도록 돼 있다.
그러나 핫 플러그 미러드 메모리 기술은 메모리 영역마다 별도의 컨트롤러를 장착해 마치 HDD상에서 RAID5를 구현, 메모리상에서 패리티 정보를 생성해 저장하는 기술로 시스템 운영중에도 장애가 발생한 메모리를 자유롭게 탈착할 수 있다는 점에서 내년 초부터는 서버업계에서 폭넓게 채택될 것으로 전망되는 기술이다.
특히 서버업계에서는 온라인 스페어 메모리·핫 플러그 미러드 메모리·핫 플러그 RAID 메모리 등의 기술이 선보이고 있지만 온라인 스페어 메모리 기술은 시스템 운용중 탈착이 가능하지 않다는, 핫 플러그 미러드 메모리는 메모리 추가비용이 든다는 단점을 보완한 핫 플러그 RAID 메모리 기술이 각광받을 것으로 예상하고 있다.
그렇다고 핫 플러그 RAID 메모리 기술이 금방 주류 기술로 자리매김할 것이라는 얘기는 아니다. 현재 업계에서 채택해 사용하고 있는 온라인 스페어 메모리 기술이 그대 사용되면서 핫 플러그 미러드 메모리 기술이 선별적으로 채택돼 함께 사용되는 단계를 거쳐 핫 플러그 RAID 메모리 기술이 주류로 자리매김할 것이라는 전망이다.
<박승정기자 sjpark@etnews.co.kr>