국내 스타트업이 인공지능(AI) 데이터 가공 속도를 개선한 플랫폼을 선보였다. AI 산업 활성화에 필수 조건인 데이터 세트 정제 시간이 크게 단축될 것으로 전망된다. 지금까지 대용량 데이터는 인도 등 제3국에서 수작업으로 처리해 왔다.
슈퍼브에이아이(대표 김현수)는 자체 개발한 머신러닝 데이터 플랫폼을 이달 말 출시한다고 밝혔다. 제품명은 '슈퍼브 에이아이 스위트'다. 데이터 가공 및 관리·분석 작업을 한 곳에서 끝낼 수 있는 첫 플랫폼이다. 회사는 삼성, LG, SK, 카카오, 퀄컴 등 국내외 30개 기업이 맡긴 데이터를 AI에 최적화시키는 서비스를 해 왔다.
슈퍼브에이아이는 노하우와 경험을 토대로 기업이 자체로 데이터를 정제할 수 있는 플랫폼을 개발했다. 기업 입장에서는 AI 고도화에 필요한 데이터 세트를 빠르고 쉽게 확보할 수 있다. 김현수 대표는 14일 “미국 실리콘밸리와 서울에 기반을 두고 제품 고도화에 집중할 계획”이라면서 “AI 산업 활성화와 국내 우수 AI 기업의 성장을 돕겠다”고 강조했다.
슈퍼브에이아이는 지난해 4월 설립됐다. 에어비앤비, 미미박스 등을 배출한 미국 실리콘밸리의 대표 액셀러레이터 와이콤비네이터가 키워 낸 스타트업이다. 공동 창업자 5명 가운데 4명이 AI 개발자 출신이다. 와이콤비네이터에서 종잣돈을 투자 받았다. 누적 투자 자금 25억원을 확보했다. 한국정보화진흥원(NIA)의 '한글 OCR 데이터 세트' 작업에도 참가했다. 한글 인식 AI 개발에 필요한 글자체 데이터 세트 500만개 이상을 구축했다.
슈퍼브에이아이가 공개하는 플랫폼은 데이터 가공 속도를 최대 8배 단축시킨다. 사진, 동영상과 같은 비정형 데이터를 AI가 이해하도록 바꾸는 일을 가공 또는 애너테이션이라고 한다. 데이터마다 이름표를 부착하는 애너테이션 작업을 수월하게 하는 기능이 포함됐다.
대용량 데이터는 흔히 외부 협력업체에 맡겨 가공한다. 인도, 중국, 필리핀, 파키스탄 등에 관련 업체가 몰려 있다. 슈퍼브에이아이 스위트는 수작업으로 이뤄지던 애너테이션 업무에 AI를 도입, 반자동화했다. 데이터 세트 품질 제고에도 유리하다. 클라우드 기반으로 플랫폼을 설계했다. 검색 기능을 활용, 원하는 데이터를 손쉽게 찾을 수 있다. 데이터 세트를 맞춤제작하는 것도 가능하다. 대시보드를 통해 가공 작업 전반을 실시간 관리할 수도 있다. 애너테이션 작업의 정확도를 숫자로 보여 주는 AI 검수 스코어를 탑재했다.
분석·시각화 기능도 접목했다. AI를 학습시키기 이전에 데이터 세트 유효성을 검사해 준다. 특정 조건에 부합하는지 등을 미리 알 수 있다. 현재는 이미지, 동영상 데이터 세트 등 분석만 가능하다. 내년 상반기 중에 텍스트, 3차원(3D) 영상, 음성 데이터 세트를 추가할 계획이다.
최종희기자 choijh@etnews.com