구글 클라우드, 제한없는 데이터 클라우드 구현 기술 '빅레이크' 등 발표

구글 클라우드, 제한없는 데이터 클라우드 구현 기술 '빅레이크' 등 발표

구글 클라우드는 27일 기업이 데이터와 데이터 워크로드의 한계를 극복하고 도달 범위를 확장할 수 있는 기술을 발표했다.

구글 클라우드는 이날 오전 '데이터 클라우드 서밋' 미디어 온라인 브리핑을 열고 △빅레이크 △스패너 체인지 스트림 △버텍스 AI 워크벤치 △루커용 커넥티드 시트 등 주요 클라우드 혁신 기술을 발표했다.

빅레이크는 데이터 레이크와 데이터 웨어하우스를 통합한 데이터 레이크 스토리지 엔진이다. 데이터 제한을 없애는 빅레이크를 활용하면 기존의 스토리지 형식이나 시스템에 관계 없이 데이터를 분석할 수 있다. 기업은 소스에서 데이터를 복제하거나 이동할 필요 없이 비용 절감과 효율성 향상을 누릴 수 있다.

빅레이크는 기업이 아파치 스파크(Apache Spark)와 같은 오픈소스 처리 엔진을 비롯해, 구글 클라우드 서비스와 파케이(Parquet) 등 오픈파일 형식을 아우르는 API 인터페이스로 세분화된 액세스 제어 역량을 갖출 수 있도록 지원한다.

스패너 체인지 스트림은 구글 클라우드 데이터베이스인 스패너에 새롭게 추가된 기능이다. 데이터베이스에서 삽입, 업데이트, 삭제 등의 변경 사항을 실시간으로 추적할 수 있다. 고객은 스패너에서 빅쿼리로 변경 사항을 쉽게 복제한다. Pub·Sub을 사용해 다운스트림 애플리케이션 동작을 실행시키거나, 컴플라이언스 준수를 위해 구글 클라우드 스토리지에 변경 사항을 저장할 수 있다. 항상 최신 상태의 데이터에 액세스하고 실시간으로 분석을 수행할 수 있다. 최대 99.999% 가용성을 지원한다. 초당 최대 20억건 이상의 요청을 처리하는 스패너는 체인지 스트림 기능의 추가로 한 단계 더 향상된 데이터 처리 역량을 지원할 수 있게 됐다.

김정훈 구글 클라우드 데이터 애널리틱스 스페셜리스트
김정훈 구글 클라우드 데이터 애널리틱스 스페셜리스트

구글 클라우드는 보다 빠른 AI 모델 개발과 손쉬운 유지보수를 지원하는 버텍스 AI 워크벤치를 정식 출시했다. 버텍스 AI 워크벤치는 데이터와 머신러닝 시스템을 단일 인터페이스로 제공한다. 모든 팀이 데이터 분석, 데이터 사이언스, 머신러닝 전반에 걸쳐 공통된 툴셋을 사용할 수 있도록 지원한다.

구글 클라우드는 모델 유지보수 관리를 보다 간소화할 수 있도록 버텍스 AI 모델 레지스트리에 신규 ML옵스(MLOps) 기능을 프리뷰 버전으로 선보였다. 버텍스 AI 모델 레지스트리는 빅쿼리 ML 모델을 포함한 머신러닝 모델의 탐색, 사용 및 관리를 위한 중앙 저장소를 제공한다.

이외에도 통합형 BI 플랫폼인 루커용 커넥티드 시트와 데이터 스튜디오에서 루커 데이터 모델에 접근을 지원하는 기능을 발표했다.

장화진 구글 클라우드 코리아 사장은 “데이터의 양과 유형, 워크로드, 사용자까지 폭발적으로 증가하면서 전통적인 데이터 아키텍처로 데이터가 가진 진정한 가치를 실현하는 것은 어려워졌다”며 “오늘 발표한 데이터 클라우드의 기술 혁신으로 클라우드 환경에서 데이터의 원활한 활용을 지원하고, 고객이 데이터 기반의 비즈니스 가치를 실현해 성공적인 디지털 트랜스포메이션을 추진할 수 있도록 최선을 다할 것”이라고 말했다.

송혜영기자 hybrid@etnews.com