“데이터 가공 시장은 줄어들지 않을 것입니다. 생성형 인공지능(AI) 기술의 발달로 보다 고도화된 전문지식을 요구하는 데이터 업무가 오히려 늘어날 것입니다.”
김우승 크라우드웍스 대표는 자사의 전문화된 '데이터 라벨링(데이터 정보 입력)' 사업 역량을 바탕으로 AI 사업을 강화, 확대하고 있다고 밝혔다.
시장 초기에 이른바 '디지털 인형 눈알 붙이기' 식의 단순 데이터 라벨링 작업이 있었다면, 거대언어모델(LLM) 등장 이후 현재는 보다 훈련된 인력이 전문지식을 바탕으로 일을 하고 있다.
김 대표는 “기업고객도 AI 모델을 만들기 위해 어떤 데이터를 쌓아야 할지 컨설팅부터 받기 시작하는 경우가 많다”며 “AI 사업과 데이터 사업은 이제 분리할 수가 없는 단계”라고 설명했다. 실제로 크라우드웍스는 AI, 데이터 조직을 통합 운영하고 있다.
김 대표는 크라우드소싱 방식으로 관련 인력을 모집하지만, 전문성을 요구하는 작업의 경우 처음부터 관련 커뮤니티 등을 통해 사람을 선발, 교육하고 있다고 전했다.
김 대표는 “내부에 교육 콘텐츠를 만드는 것을 포함한 교육 사업을 운영하고 있다”며 “라벨링 툴(도구)을 사용 방법을 교육하고, 그 교육을 받은 사람에게 자격을 주고, 일정 레벨 이상이 되는 사람에게만 난이도 높은 데이터 업무에 참여할 수 있다”고 말했다.
작업자를 모집·등록하고, 작업량을 모니터링하고, 검수와 재검수의 반복을 통해 데이터를 구축하는 '워크스테이지' 플랫폼은 타사 대비 고품질의 데이터를 구축할 수 있는 기반이다.
크라우드웍스는 이러한 데이터 구축 역량 위에 AI 기술력을 강화했다. '웍스원'이라는 소형언어모델(sLLM)도 개발했다.
김 대표는 “빅테크 기업에서 경쟁적으로 LLM을 내놓고 있지만, 핵심은 역시 데이터”라며 “기업이 가진 차별점은 보유하고 있는 데이터에서 나오는데, 이를 외부에 공개하지 않는다”고 강조했다.
기업이 공개하지 않은 데이터를 구조화하고 정제해 맞춤형 비즈니스 AI 툴을 만들려는 수요에 크라우드웍스의 기회가 있다는 것이다. 대기업 몇 곳을 제외한다면 데이터 구축부터 AI 모델 구축까지 체계적으로 할 수 있는 기업은 아직 소수라고 김 대표는 평가했다.
크라우드웍스는 자사 역량을 금융사, 대형 광고기획사, 대기업 계열 연구소 등과 협업하며 검증했다. 특히 광고기획사의 내부 데이터를 기반으로 구축된 AI 카피라이팅 생성기, 조선소와 같은 특수한 현장에서 일하는 외국인 근로자를 위한 AI 통역기 등이 고객사로부터 높은 평가를 받았다.
최근에는 국내 스마트팩토리 스타트업 '시즐'과 손잡고 제조 공정에 AI를 도입하는 공동 사업에 착수했다. 제조 현장에 맞는 AI 솔루션을 직접, 주도적으로 개발한다는 데 의의를 뒀다.
김 대표는 “AI 모델을 계속 더 좋아질 것”이라며 “AI 영역이 세분화, 고도화될 수록 산업별 다양한 데이터를 구축한 경험을 가진 크라우드웍스 고유의 가치가 커질 것”이라고 전했다.
김명희 기자 noprint@etnews.com