데이터스트림즈, 빅데이터 위한 ETL 솔루션 출시

데이터스트림즈가 하둡 기반 ETL(추출·변환·적재) 솔루션을 기반으로 빅데이터 사업을 본격화 한다.

데이터스트림즈는 ETL(추출·변환·적재) 솔루션 `테라스트림 포 하둡(TeraStream for Hadoop)`을 출시했다고 21일 밝혔다. ETL 솔루션은 데이터베이스관리시스템(DBMS)에 저장된 데이터를 추출·가공처리해 다른 DBMS에 저장하는 역할을 한다. 지금까지 하둡 기반 ETL 솔루션은 인포매티카 등 해외 업체들이 주로 공급해왔다.

테라스트림 포 하둡은 빅데이터 기술인 하둡에 대응할 수 있도록 특화된 제품이다. DBMS에 저장된 데이터와 텍스트파일을 하둡분산파일시스템(HDFS)에 저장하고 분산·가공처리해 다른 DBMS에 저장한다.

편리한 그래픽사용자환경(GUI)을 구현해 효율적으로 맵리듀스(MapReduce) 작업 수행이 가능하다. 맵은 관련 있는 데이터를 묶는 작업으로, 리듀스를 거쳐 중복된 데이터를 없애고 원하는 데이터를 추출할 수 있다. 분산처리가 가능해 속도가 빠른 것도 장점이다.

데이터스트림즈 관계자는 “빅데이터 관련 상용제품을 출시한 것은 이번이 처음”이라며 “국내 공공·금융 시장을 중심으로 제품 보급을 늘려가겠다”고 말했다.

유선일기자 ysi@etnews.com