상반기 분석 시장에서 큰 인기를 끈 `EMC 그린플럼 유니파이드 애널리틱스 플랫폼(UAP)`은 관계형데이터베이스(RDB)를 하나로 합친 통합 빅데이터 분석 소프트웨어다. 지난해 12월 출시된 이래 제조와 공공 등 여러 분야에서 주목을 받았다.
![[2012 상반기 인기상품]품질우수-EMC 그린플럼 UAP](https://img.etnews.com/cms/uploadfiles/afieldfile/2012/06/26/298396_20120626133004_574_0001.jpg)
EMC 그린플럼 UAP는 빅데이터 분석을 지원하는 업계 유일의 통합 분석 플랫폼이다. EMC 그린플럼 UAP는 △정형 데이터를 위한 `EMC 그린플럼 데이터베이스` △비정형 데이터의 분석 및 처리를 위한 엔터프라이즈 하둡 어플라이언스 `EMC 그린플럼 HD` △데이터 과학팀을 위해 생산성 엔진 및 소셜 네트워크로서의 기능을 담당하고 있는 `EMC 그린플럼 코러스` 등 세 가지 제품으로 구성돼 있다.
EMC 그린플럼 UAP의 핵심은 크게 대용량병렬처리(MPP) 방식의 데이터베이스와 맵R, 그리고 빅데이터 전문가를 들 수 있다. 정형 데이터를 분석하는 `그린플럼 데이터베이스`는 데이터를 분리하는 MPP 방식의 데이터베이스다. 그린플럼 아키텍처 자체가 늘어나는 정형 데이터를 병렬 처리하는 데에 강점이 있는 만큼 속도 면에서 유리하다. 데이터를 공유하지 않기 때문에 데이터베이스간 병목 현상이 생기지 않고 높은 성능을 유지할 수 있다. 필요한 부분만 읽어 들이는 컬럼 데이터베이스도 핵심 기능 중 하나다.
비정형 데이터를 분석하는 `그린플럼 하둡`은 맵R를 기반으로 한다. 일반적인 오픈소스 하둡의 경우 메타데이터를 관리하는 과정에서 장애가 발생하면 전체 파일 접근에 문제가 생길 수 있고 다른 쪽 서버의 파일 시스템을 가져오는 데에도 한계가 있다.
맵R는 이런 문제를 해결한 상용 하둡이다. 아파치 하둡은 자바 기반인 데 비해 맵R는 성능 개선을 위해 자바에 C를 더한 것이 차이점이다. 이와 더불어 EMC 그린플럼 UAP는 비정형 데이터에서 하둡 파일시스템과 RDB로 분배·분석하는 절차를 자동화하는 관리 콘솔을 갖고 있다.
EMC 그린플럼 코러스는 데이터 과학팀이 방대한 데이터세트를 분석하는 데 있어서 지역에 상관없이 새로운 방법으로 서로 협력할 수 있도록 돕는다. 사용자들은 코러스 인터페이스가 제공하는 툴과 데이터를 통해 전사적으로 빅데이터 분석 생산성을 높일 수 있다.
EMC가 2010년 인수한 그린플럼은 대규모 데이터 분석 서비스의 핵심인 데이터 웨어하우징 기술을 보유하고 있다. 그린플럼은 현재 EMC 정보 인프라스트럭처 사업부 산하 데이터 컴퓨팅 제품사업부로 통합돼 다양한 솔루션을 출시하는 등 빅데이터 시장 선점을 위해 박차를 가하고 있다.
EMC는 비정형 데이터의 분석 수요 확산에 따른 발빠른 대응을 위해 EMC 자체의 하둡 배포판을 출시했다. 전통적인 정형 데이터와 비정형 데이터를 통합해 지원하는 업계 유일의 통합 분석 플랫폼을 출시함으로써, 변화하는 시장 수요에 적극적으로 대응하고 있다.