오라클이 '클라우드 데이터 사이언스 플랫폼'을 출시했다. 협력 기반 머신러닝 모델로 데이터 사이언스 수행을 지원한다.
이 플랫폼은 데이터 사이언스 조직이 다루는 주요 기능에 집중한다. △자동 머신러닝(AutoML) 알고리즘 튜닝 △예측형 특징 자동 식별 △모델 성능 평가 △모델 설명 자동화 기능을 통해 최적 데이터세트틀 자동으로 선택한다.
개별 데이터 과학자 업무를 자동화해 개인 생산성을 증대한다. 팀 간 협력을 지원해 데이터 사이언스 프로젝트가 비즈니스 가치로 연결되도록 지원한다. 팀 역량을 지원하는 기능으로 △프로젝트 공유 △모델 카탈로그 제공 △팀 기반 보안 정책 적용·관리 △재생산과 심사 등이 있다.
핵심 솔루션인 '클라우드 인프라스트럭처 데이터 사이언스'는 이용자가 파이선, 텐서플로, 케라스, 주피터 등 다양한 오픈소스 도구를 활용해 머신러닝 모델을 설계·관리하도록 돕는다. 오라클 자율운영 데이터베이스(DB)와 통합된 머신러닝 알고리즘도 활용할 수 있다. 오라클 DB에서 알고리즘과 데이터를 접목, 데이터셋을 준비하고 이동하는 시간을 줄인다.
'클라우데라 하둡' 기능도 제공한다. 클릭 한 번만으로 하둡 클러스터가 지속 운영될 수 있도록 하면서 보안 기능도 실행한다. 오라클 클라우드 SQL은 푸시 다운, 스케일 아웃 프로세스를 통해 데이터 이동을 최소화한다. 특정 인프라를 구축하거나 관리하지 않고도 아파치 스파크를 실행할 수 있다. 단일 윈도에서 모든 스파크 업무 경로를 모니터링한다.
오다인기자 ohdain@etnews.com