#대회를 열어 인공지능(AI) 모델을 고도화한다. 기관과 기업이 보유한 데이터셋을 민간 데이터 과학자와 공유한다. 기관과 기업에는 양질 AI 모델을, 데이터 과학자에게는 실제 데이터를 다뤄볼 경험의 장을 제공한다.
캐글은 기계학습 기반 예측 모델·분석 대회 플랫폼이다. 2010년 미국에서 창립 후 2017년 구글에 인수됐다. 기관과 기업이 데이터와 과제를 등록하면 데이터 과학자가 이를 해결하는 AI 모델을 개발한다. 공유와 협업 정신이 바탕이지만 엄격하게 실력을 겨뤄 포상한다.
한국형 캐글로 불리는 '데이콘'은 2018년 7월 출범했다.
김국진 데이콘 대표는 “해외 캐글을 보고 국내에도 이 같은 플랫폼이 필요하다는 생각에 설립했다”고 말했다. 데이터 공유와 AI 모델 개발에 있어 정부 주도 방식은 한계가 보였다. 시장 수요에 맞는 플랫폼으로 대회 형식이 적합하다고 봤다. 캐글이 정량 평가만 한다면 데이콘은 정량 평가와 함께 정성 평가도 진행한다. 정량 평가에는 자체 개발한 AI 모델 평가 산식을 적용한다.
지난 1년 반 동안 공공과 민간을 아우르는 20여개 프로젝트가 데이콘 플랫폼 위에서 탄생했다. △상점 총 매출 예측 △병원 개·폐업 분류 예측 △아파트 경매 가격·실거래가 예측 △KBO 외국인 투수 스카우팅 최적화 △전력 수요량 예측 △퇴근시간 버스 승차인원 예측 △반도체 박막 두께 분석 △원자력발전소 상태 판단 등 금융과 스포츠, 공공, 교통, 산업을 포괄한다.
가장 최근에는 국방과학연구소(ADD)에서 주최한 '위성 이미지 객체 검출 대회'가 막을 내렸다. 위성 영상은 공간 해상도가 낮아 선박 식별이 어려운데 AI 기술을 활용해 선박 인식 알고리즘을 개발하려는 취지로 개최됐다. 총 348팀이 참가했으며 다음 달 최종 평가를 앞두고 있다.
데이콘에는 현재까지 약 8700명이 참가해 약 1억1000만원 상금을 받았다. 대회에 참가하는 데이터 과학자는 상금과 함께 개인 프로젝트 수행 경험과 수상 실적을 얻는다. 대회를 주최하는 기관과 기업 입장에선 자체적으로 어려웠던 데이터 과학자 채용과 AI 모델 개발 이슈를 동시에 해결하는 이점이 있다. 핀테크 업체인 펀다를 비롯해 직방, KCB, KB금융그룹, 제주테크노파크, 한국인터넷진흥원(KISA), 한국전자통신연구원(ETRI), 한국수력원자력 등이 데이콘을 통해 AI 모델을 개발하거나 시각화했다. 대회는 매월 2~3개꼴로 열리며 현재 대회 개최를 두고 논의 중인 곳은 10여 곳에 달한다.
다음달 1일부터는 김지후 한양대 연구원이 만든 코로나19 데이터셋으로 사회공헌 형식 대회도 연다. 시각화 대회로 정량 평가가 아닌 정성 평가로 우열을 가린다. 이 대회를 통해 창출되는 수익은 전액 기부된다.
김국진 데이콘 대표는 “국내 데이터 산업이 발전하려면 데이터 공유를 비롯해 데이터 과학자 역량이 성장해야 한다”면서 “데이콘을 통해 국내 데이터 과학자에게 경험의 장을 제공하고 기업에는 좋은 AI 알고리즘을 제공하겠다”고 말했다.
오다인기자 ohdain@etnews.com