인공지능(AI) 전문 기업 비투엔(대표 조광원)은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 '2022년 AI 학습용 데이터 구축 사업'에서 8개 컨소시엄의 품질 점검을 완료했다고 15일 밝혔다.
'AI 학습용 데이터 구축 사업'은 AI 연구, 기술, 서비스 개발을 위한 학습용 데이터를 구축하고 누구나 활용할 수 있도록 개방해 AI 산업 활성화에 기여하는 국가 데이터 댐 사업이다.
비투엔은 △이미지 272만건 △텍스트 19만건 △교통 12만건 △음성 1만8000시간 등 AI 학습용 데이터 9종, 474만건의 품질을 점검했다. 음성·자연어, 비전, 헬스케어, 교통, 축산업, 지역 특화, 데이터 고도화 등 광범위한 분야의 학습용 데이터의 품질을 지원, 기술력을 입증했다.
특히 반려견, 반려묘 건강 정보 데이터 과제에서는 '구문 정확성' '통계 다양성' 검사와 더불어 구축된 학습용 데이터의 AI 알고리즘을 활용한 품질 점검 항목인 '모델 유효성'까지 업무 영역을 확장했다.
박순혁 AIX 그룹장은 “AI 학습용 데이터 구축 컨소시엄 내 품질 검사 도구를 확보하고 있지 않은 과제들을 대상으로 품질 검증 서비스와 'SDQ for AI' 도구를 제공하는 등 다양한 형태로 데이터 구축 사업에 참여하고 있다”며 “앞으로도 뛰어난 기술적 역량과 지속적인 연구개발을 바탕으로 디지털 플랫폼 정부에 기여할 것”이라고 말했다.
비투엔은 △방송콘텐츠 대화제 음성인식 데이터(솔트룩스 컨소시엄) △한국어 SNS 데이터 고도화(와이즈넛 컨소시엄) △디스플레이 안구 움직임 영상 데이터(피씨엔 컨소시엄) △반려견, 반려묘 건강정보 데이터(이노그리드 컨소시엄) △산업용 헴프 생육 이미지 및 환경 데이터(데이터헌트 컨소시엄) △전문분야 심층 인터뷰 데이터(솔트룩스 컨소시엄) △의료 음성 데이터(타이거컴퍼니 컨소시엄) △교통수단판별 데이터(모토브 컨소시엄) 등 8개 AI 학습용 데이터 구축 과제에 품질관리 전담 기업으로 참여했다.
안수민기자 smahn@etnews.com
-
안수민 기자기사 더보기