카카오, 내부 데이터 개방해 머신러닝 대회연다

카카오가 내부 데이터를 개방, 머신러닝 대회를 연다. 첫 번째 대회로 쇼핑몰 관련 데이터를 1000만건 오픈했다.

카카오는 7일 카카오 아레나를 오픈, 운영에 들어갔다. 아레나는 머신러닝과 관련된 문제해결 대회를 개최할 수 있는 상설 플랫폼이다.

카카오 아레나는 연말까지 다음 쇼핑몰에 등록된 상품 텍스트, 이미지 정보를 활용해 카테고리 분류 정확도를 높이는 대회를 연다. 머신러닝을 활용해 다음 쇼핑에 존재하는 수억개 상품을 대상으로 더 정확한 상품 분류기를 만드는 것이 목표다.

다음쇼핑이 누적한 제목, 브랜드, 이미지피쳐 등 1000만건 데이터와 4000건 이상 대분류, 중분류, 소분류 카테고리 데이터를 활용한다.

대회에서 제공하는 데이터셋은 △카카오 아레나의 쇼핑몰 상품 카테고리 분류 대회 참가 목적 △카카오 아레나를 인용할 경우 학술 목적으로 활용이 가능하다.

국내외를 막론하고 기업이 상설 플랫폼을 통해 머신러닝 대회를 운영하는 것은 처음이다. 카카오 관계자는 “카카오가 보유한 양질 데이터를 문제해결(코딩)에 활용할 수 있게 제공한다”면서 “참가자들간 정보를 공유하는 자리를 제공하고 데이터와 대회 산출물을 공개할 것”이라고 설명했다.

카카오는 아레나 운영으로 자사가 고민하는 문제와 데이터를 제공해 인재 영입과 기술기업으로서 리더십 확보에도 긍정적으로 작용할 것으로 기대했다.

카카오는 지속적으로 인공지능(AI)·머신러닝에 투자 중이다. 9월 사용성을 개선한 스마트스피커 '카카오미니C'를 출시했다.

현대·기아자동차와 공동 개발 중인 프로젝트를 진행 중이다. 내년 상반기 출시될 신차부터 차량 내에서 카카오 AI 기술을 경험할 수 있게 된다.

연말에는 AI생태계 확장을 위해 외부 개발자가 카카오톡 챗봇과 카카오미니용 음성 서비스를 함께 개발할 수 있는 개발 플랫폼인 '카카오i 오픈빌더'를 오픈한다.

카카오 AI 생태계 구조도<사진 카카오>
카카오 AI 생태계 구조도<사진 카카오>

김시소 게임/인터넷 전문기자 siso@etnews.com