데이터스트림즈는 멀티 클라우드 기반 데이터·인공지능(AI) 분석 플랫폼 'TeraONE IDEA 1.1'을 출품했다.
'TeraONE IDEA'는 빅데이터 플랫폼 환경에서 빅데이터 분석을 위한 기계학습과 딥러닝 모델로 개발 전 과정의 프로세스를 통합한 머신러닝작업(MLOps)을 지원하는 분석 플랫폼이다. 플랫폼으로 수집·처리·저장된 빅데이터를 활용하는 방법이다.
MLOps는 머신러닝(ML) 모델과 지속적인 통합과 배포(CICD) 파이프라인을 이용한 관리 기능을 통합했다. 이는 구성원 간 효율적인 협업을 가능하게 하며, 신뢰성 있는 서비스를 제공하는 데 도움을 줄 수 있다.
다양한 과제별로 빅데이터를 직접 분석·가공하지 않고 분석할 수 있는 환경을 따로 제공한다. 보안사고를 미연에 방지하고 과제 특성에 맞는 데이터 도구를 제공해 MLOps를 중심으로 데이터 과학자, DevOps 엔지니어, IT 전문가 등이 시너지 협업을 할 수 있는 도구다.
'TeraONE IDEA'는 데이터스트림즈의 빅데이터 플랫폼 기술을 바탕으로 클러스터 기반의 분석 플랫폼이다. 유연한 확장성을 갖추고 클라우드네이티브 기술 환경을 제공해 애자일(Agile) 모델 개발이 가능하다.
이 솔루션은 개인화된 학습환경을 지원한다. 데이터 환경에 최적화된 샌드박스(sandbox)를 구성해 그룹별로 독립된 학습환경과 모델 개발을 위한 다양한 패키지를 제공한다.
가상화 데이터베이스(DB) 기능도 지원한다. 이기종 분산된 원본 데이터를 카탈로그 기반으로 사전 탐색하고 이기종 소스로부터 데이터를 추출 통합하는 기능을 제공한다. 데이터 증가에 대비해 처리 성능을 확장시켰고, 이기종 분산된 원본 데이터를 복제 구성없이 사용 가능하다. 데이터 접근 권한 관리로 보안성도 확보했다.
또한 분석 모델의 라이프사이클을 관리한다. 평가 단계별 분석 파이프라인 지원과 변경 사항을 신속하게 반영하고, 학습하는 모델의 라이프사이클 관리를 지원한다. 학습을 통해 생성된 모델을 적용하는데 그치지 않고 최적 성능 확보를 위한 평가와 보완 과정으로 지속적인 평가와 재학습으로 모델 성능을 개선한다.
데이터스트림즈는 'TeraONE IDEA'의 국내 레퍼런스를 확보한 뒤 해외법인으로 수출을 진행할 계획이다. 올해에는 클라우드 기반 버전을 출시할 예정이다.
이영상 데이터스트림즈 대표는 “데이터스트림즈는 20여년간 대량의 대이터를 처리하고 데이터 거버넌스라는 전문분야에 집중해 데이터 거버넌스 소프트웨어 제품을 소유하고 있다”며 “기술적 우위를 바탕으로 디지털 전환 트렌드에 대응할 것”이라고 말했다.
박두호 기자 walnut_park@etnews.com