어니컴(대표 지영만)은 빅데이터 전용 데이터 마이닝·기계학습 분석 도구 ‘앵커스’를 출품했다. 빅데이터 기술을 잘 모르는 사용자도 손쉽게 대용량 빅데이터를 분석하도록 지원한다.
제품은 하둡 기반 빅데이터 환경에서 데이터 마이닝과 기계학습 등 분석 기술을 직접 운용한다. 오픈소스 소프트웨어(SW) 기술이 적용됐다. 개발이나 빅데이터 기술 관련 지식이 부족한 데이터 분석가도 쉽게 분석할 수 있는 환경을 제공한다. 기존 비즈니스인텔리전스(BI) 도구를 사용하던 데이터 분석가가 기술적 제약이나 거부감 없이 활용 가능하다. 데이터 마이닝이나 기계학습 등 고급 분석 기술을 이용할 수 있다.
앵커스는 데이터 현황 분석부터 응용, 예측 분석까지 다양한 분석이 필요한 빅데이터 분석 시장 요구를 충족시키기 위해 개발됐다. 기초 통계분석 알고리즘은 물론이고 최근 빅데이터 분석에서 주목받고 있는 데이터 마이닝, 기계 학습, 딥 러닝과 같은 인공지능 기반의 고급 분석 알고리즘을 제공한다. 대용량 빅데이터 처리의 기본인 분산·병렬 처리를 위해 모든 분석 알고리즘을 하둡의 맵리듀스(MapReduce) 구조로 설계했다.
현 버전은 ‘데이터 기초 통계 및 전처리’를 위한 4개 분석 알고리즘, ‘유사·상관·거리 분석’을 위한 4개 알고리즘, ‘분류·군집 분석’을 위한 3개 알고리즘, ‘서비스 기반 분석’을 위한 추천 분석 3개 알고리즘 등 총 4종 14개의 분석 알고리즘을 제공한다. 내년까지 5종 이상 데이터 마이닝과 기계학습 등 기본 분석 알고리즘을 추가한다.
▶운용체계(OS):리눅스 계열
▶오픈소스 기반 대용량 데이터 마이닝·기계학습 분석 도구
▶문의:(070)4620-6018
[지영만 어니컴 대표]
“대부분 빅데이터 기술은 단순한 통계나 집계 위주입니다. 데이터 마이닝과 기계학습을 지원하는 유일한 기술은 아파치 머아웃(apache mahout)뿐입니다. 그나마 개발 지식이 있어야만 사용할 수 있는 라이브러리 기술입니다. 실제로 데이터 분석을 수행하는 개발 지식이 부족한 기획자나 마케터는 빅데이터로부터 데이터 마이닝이나 기계학습과 같은 분석을 수행하기가 매우 어려운 상황입니다.”
지영만 어니컴 대표는 하둡과 같은 분산·병렬 기반 빅데이터 환경에서 직접 분석을 수행키로 했다. 데이터 마이닝과 기계학습 기술을 개발해 기존 문제를 해결하고자 했다. 지 대표는 “개발 지식이 풍부한 사용자뿐만 아니라 실제로 데이터를 분석하는 사람이 손쉽게 데이터를 분석해야 한다”며 “그래픽 위주 사용자환경·사용자경험(UI·UX)을 제공하는 빅데이터 전용 분석도구를 개발했다”고 말했다.
기본적 영업과 마케팅 전략은 오픈소스 배포를 통한 국내외 사용자층 확보다. 기업·기관에 상용 라이선스 판매와 솔루션 유지·운영을 지원한다.
앵커스는 오픈소스 기술로 개발됐다 라이선스 판매와 유지·보수를 통한 수익 창출 모델을 그대로 적용했다. 지 대표는 “온라인 개발 커뮤니티를 운영하며 개발 기술을 홍보하고 관련 매뉴얼과 기술문서를 이미 공개하고 있다”며 “다양한 무료 기술 세미나를 개최했다”고 말했다. 앞으로 국제 학술대회 발표로 해외에 기술을 알린다.
권동준기자 djkwon@etnews.com