빅데이터와 진화하는 저장 솔루션

“오픈마켓에 접속해 전날 장바구니에 담아둔 물건을 훑어보고 주문 버튼을 누르려던 순간 연관 상품과 할인 쿠폰이 어김없이 등장한다.”

빅데이터와 진화하는 저장 솔루션

사실 이 똑똑한 마케팅 활동 뒤에는 빅데이터가 있다. 빅데이터 기술이 발전을 거듭하고 있다. 빅데이터 홍수라는 말이 나올 만큼 산업 전반에서 앝 다퉈 도입하는 상황이다. 빅데이터는 우리가 남긴 일종의 발자국이다. 트렌드를 파악할 수 있게 해주고 예측을 하기도 한다. 기업은 수익이 나는 방향으로 사업을 집중할 수 있다. 대규모 전산 시스템을 구축하고 데이터를 관리하는 데 천문학적인 비용을 투자하는 이유도 여기에 있다.

빅데이터와 진화하는 저장 솔루션

◇ 58년 전 1톤 HDD ‘용량은 5MB’=이런 이유로 주목받고 있는 게 바로 저장장치 솔루션이다. 이 중에서도 하드디스크는 사실상 표준화된 기록 장치이자 스토리지 시스템의 근간이다. 데이터를 저장하기 위한 목적으로 하드디스크 외에 뚜렷한 대안을 찾을 수 없는 이유는 명확하다. 폭주하는 데이터를 효과적으로 수집하고 관리할 수 있는 저장장치로 하드디스크만한 게 없기 때문이다.

빅데이터와 진화하는 저장 솔루션

대표적인 소셜미디어 서비스인 페이스북만 봐도 매일 주고받는 사진 수만 해도 무려 20억 장에 달한다. 이런 데이터를 실시간으로 저장하려면 속도와 용량, 비용이라는 3가지 조건을 만족해야 한다. 하드디스크와 함께 오랫동안 공존하며 대량 데이터를 저장하는 역할을 한 저장장치로는 테이프드라이브(Tape Drive)를 빼놓을 수 없다. 다만 용량에 비해 상대적으로 느린 속도는 실시간이라는 키워드와 어울리지 않는다.

빅데이터와 진화하는 저장 솔루션

블루레이드라이브(Bluray Drive)도 있지만 매한가지. 현대 기술의 총아 격인 SSD도 하드디스크를 대적하기엔 여전히 용량 부족이 걸림돌이다. 물론 이런 SSD의 용량 한계를 극복한 솔리드스테이트 하이브리드 드라이브(Solid State Hybrid Drive, 이하 SSHD) 같은 제품이 등장하기도 했다.

빅데이터와 진화하는 저장 솔루션

시스템 증설이 이뤄지는 환경 대부분은 용량 부족 해결을 이유로 꼽는다. 가장 효과적인 저장장치이면서 명확하게 이유를 설명할 수 있는 유일한 제품으로는 아직까지 하드디스크만한 가치를 증명한 제품은 없다. 속도는 물론 활용도 역시 두말할 필요가 없다. 물론 이런 분위기로 기운 건 반세기도 안 됐다.

하드디스크는 58년 이상 진화를 거듭해왔다. 하드디스크의 뿌리이자 태동 격인 라맥350(RAMAC 350)이 처음 공개된 시기는 1956년 9월 4일. 당시에는 가장 앞선 기술이었지만 한계는 너무 명확했다.

초기 제품 용량은 5MB였다. 하지만 방 한 칸을 차지할 만큼 거대한 크기를 자랑했다. 무게 역시 1톤에 근접한 971kg에 달했다. 요즘 하드디스크를 떠올리면 상상도 하기 힘든 형태인 것. 사실상 특별한 용도 외에도 거의 쓰이지 않았지만 이 기술이 이젠 테라바이트에 달하는 용량을 갖춘 저장장치로 진화한 걸 보면 격세지감을 느끼게 된다.

그렇다면 요즘 사용 중인 하드디스크와 가장 근접한 제품이 처음 등장한 건 언제일까. 1980년에 들어와서야 가능해졌다. 씨게이트 ST-506 모델은 방 한 칸에 달하던 크기를 5.25인치로 대폭 축소했고 회전속도는 분당 3,600rpm에 달해 다양한 분야에서의 접목 가능성을 열었다.

이후 수요가 늘어나면서 코너(Conner Peripherals)와 맥스터(Maxtor)가 등장해 저장장치 시장을 키웠다. 이들 업체는 이후 순차적으로 씨게이트에 합병됐다.

어쨌든 이런 과정을 거치면서 하드디스크는 방대한 저장공간과 빠른 성능을 갖춘 효과적 저장장치라는 타이틀을 자연스럽게 거머쥐게 됐다. 하지만 데이터는 하드디스크 발전 속도보다 더 빠르게 늘어나 방대한 공간을 갈구한다. 4K 해상도 멀티미디어 콘텐츠 정도면 충분할 줄 알았던 영상 분야는 더 높은 해상도를 찾는다. 그 결과 저장공간 수요는 기하급수적으로 늘었다. 여기에 소셜네트워크서비스가 등장하면서 단위 시간당 생산되는 데이터의 양은 엄청난 속도로 증가해 저장공간 확대를 재촉하고 있다.

◇ 빅데이터 시대는 저장공간을 원한다=물론 데이터를 쌓기만 하는 건 아니다. 수많은 루트를 통해 수집된 데이터는 다방면에 활용된다. 누적 통계가 다양할수록 예측 가능한 확률에 대한 신뢰도도 높아진다. 주위에서 쉽게 마주치는 CCTV 같은 보안관제 시스템이 대표적인 예다.

이런 이유로 데이터는 이제 황금알을 낳는 노다지로 탈바꿈해 귀한 몸값을 자랑한다. 이젠 정보를 쥐는 자가 세상을 이끈다는 말이 나올 만큼 데이터의 효과적 관리가 중요해졌다. 단적으로 보자면 최근 화두인 빅데이터를 효과적으로 운용하기 위해서라도 저장장치는 어느 때보다 중요하다.

고화질과 고음질로 진화한 멀티미디어 콘텐츠는 인터넷을 통해 실시간으로 PC나 스마트폰으로 전송된다. SNS마다 개인이 주체가 되어서 생산하는 콘텐츠를 전송하는 통로 역할을 하며 소통 창구 역할을 하는 것이다. 디지털 콘텐츠와 가공된 파생상품도 결국 데이터를 기반으로 발전하고 있다. 이렇게 생성된 데이터는 자연스럽게 효율적으로 운영되는 저장공간을 요구한다.

눈치 채지 못하는 사이 데이터 저장 솔루션은 거대해지고 시장이 확대되고 있는 이유가 바로 여기에 있다. 수십억 인구가 인터넷에 접속하는 지금 과거와는 비교할 수 없는 막대한 양의 데이터를 실시간으로 생산하는 시대가 도래한 것이다.

누적된 데이터는 필요에 따라 2차 가공, 새로운 부가가치를 창출하기도 한다. 다시 말해 빅데이터를 기반으로 한 새로운 서비스 등장이 가능해진 것이다. 생활 곳곳에 파고든 다양한 이벤트가 사실은 빅데이터를 기반으로 파생된 결과물이라는 사실을 인지하기도 어려울 만큼 대중화되고 있다.

다만 눈에 보이지 않기 때문에 PC 시장 축소가 곧 하드디스크 입지 축소로 이해되기도 했다. 하지만 시장 축소로 해석하는 건 인식의 오류다. 디지털 시대에 모든 데이터는 어딘가에 보관되어야 한다는 단순한 원리를 망각한 것이다. 하드디스크는 PC라는 비좁은 테두리를 벗어나 빅데이터를 활용하기 위한 기본 플랫폼 역할로 영역을 확대한 것이다.

◇ 빅데이터가 요구하는 미래 저장장치=하드디스크가 PC를 벗어나면서 용도별 사용법에 대해서도 생각해볼 필요가 생겼다. 하드디스크는 언뜻 보면 별다른 차이가 없어 보인다. 하지만 사실은 사용 목적에 따라 설계 단계부터 다르다. 보통 이런 점을 무시하고 NAS처럼 개인이나 기업 내부용으로 구축하는 사설 클라우드나 365일 무중단, 무정전이라는 엄격한 조건을 따지는 CCTV에 쓰이는 DVR(Digital Video Recorder) 시스템에 일반용을 쓰기도 한다. 하지만 이럴 경우 부작용을 예측할 수 없고 사고로 이어질 경우 회복 가능 여부도 확신하기 어렵다. 하드디스크 선택 방법에 대해서 심각하게 고민해볼 필요가 있는 것.

이유는 이들 시스템은 PC용 하드디스크보다 높은 신뢰성을 요구하기 때문이다. 실제로 NAS나 DVR 등에 쓰이는 하드디스크는 기술적으로 다른 환경에서 특별 관리를 받는다. 이런 차이는 결국 저장장치에 대한 안정성, 신뢰도와도 직결된다.

하드디스크는 크게 2가지로 구분할 수 있다. PC에서 지금껏 써왔던 데스크톱 드라이브, 다른 하나는 서버나 데이터센터 등에 사용하는 엔터프라이즈 드라이브가 그것이다. 이 중 365일 24시간 작동 가능성을 염두에 둔 건 엔터프라이즈 드라이브다. 당연히 데스크톱 드라이브보다 요구 조건이 까다롭다.

최근 개인이나 기업이 내부 보안을 이유로 클라우드 시스템을 자체 구축하기도 한다. 24시간 감시하는 CCTV도 이미 일상이다. 하지만 소비자 대부분은 별다른 고민 없이 데스크톱 드라이브를 선택하는 데 주저하지 않는다. 이런 시스템에 엔터프라이즈 드라이브를 쓰면 비용 제약이 너무 크다는 이유에서다.

분명한 건 개인 사용자 패턴에 맞춰 만든 데스크톱 드라이브는 안정성을 담보할 수 없다는 것이다. 비용대비 효과를 기대한다면 데이터 신뢰도를 떨어뜨리면 안 되는 데 이를 간과하는 것이다. 씨게이트의 NAS HDD나 서베일런스(Surveillance) 시리즈, WD의 클라우드 시리즈 등 제조사도 이런 시장 흐름에 맞춘 제품을 선보이고 있다. 엔터프라이즈 드라이브만큼 엄청난 비용을 들이지 않아도 사용 환경에 맞는 수준의 성능과 안정성을 기대할 수 있는 제품인 것. 그 뿐 아니라 사용 환경 변화와 시장 요구는 하드디스크 진화 속도를 더 재촉하고 있다. 앞으로 어떤 제품이 등장할지 예측할 수는 없지만 하드디스크가 추구하는 가치가 제품 사용자의 요구 충족이라는 건 당연할 것이다

영화 ‘월터의 상상은 현실이 된다’에 등장하는 주인공과 같은 삶을 꿈꾼 적이 있는가. 이미 세상은 상상보다 더 빠른 속도로 변화 중이다. 스마트폰은 시간과 장소에 구애받지 않는 세상을 만들고 있다. 이런 온라인 환경에서 빅데이터와 클라우드는 현재를 대변하는 대표적인 트렌드로 막강한 영향력을 발휘한다.

하드디스크는 이런 서비스를 구축하기 위해 가장 기반이 되는 저장장치 시스템의 핵심이자 데이터를 통해 부가가치를 창출하기 위해 갖춰야 할 필수 장비다. 하지만 이런 다양해진 사용 목적을 고려하지 않는 제품 선택이나 이런 인한 부작용, 이를 해결하려는 데이터복구 서비스가 우후죽순처럼 범람하기도 한다. 이 과정에선 누구도 신뢰도를 담보할 수 없다. 씨게이트의 자체 데이터 복구 서비스인 레스큐(+Rescue)처럼 하드디스크 제조사가 사용자 피해를 줄이기 위한 데이터 복구 서비스를 내놓는 이유도 여기에 있다.

빅데이터 시대에 가장 중요한 건 데이터의 가치 실현이다. 이를 위해 올바른 데이터 보관은 선결 과제다. 아무리 좋은 데이터가 우리 곁을 스쳐 간들 이를 적재적소에 보관하고 관리할 수 없다면 데이터는 단순히 트래픽 유발자에 불과하다.

전자신문인터넷 테크홀릭팀

김현동IT칼럼니스트 techholic@etnews.com