빅데이터·인공지능(AI) 전문기업 비투엔(대표 조광원)은 고품질 AI 학습용 데이터 구축 솔루션 'SDQ for AI'가 'AI 데이터 어노테이션(주석) 구문적 정확성 검사' 용역 사업에서 170여건의 대용량 학습용 데이터에 대한 통합 품질 검사 솔루션으로 2년째 활용되고 있다고 15일 밝혔다.
이 사업은 한국정보통신기술협회(TTA)에서 주관하는 사업으로 구축 결과물에 대한 구문적 정확성 관점에서 구축한 데이터 품질을 검증하는 것을 목표로 한다.
비투엔은 이 사업에서 축적한 경험을 기반으로 AI 학습용 데이터에 대한 품질 진단 컨설팅과 서비스 사업을 본격화할 계획이다. 학습데이터셋 검사를 통해 검증받은 'SDQ for AI' 지원 기능을 AI 알고리즘을 활용한 데이터 유효성 검사 영역까지 확대할 뿐 아니라 데이터 품질 관리 기능의 클라우드 서비스도 출시한다.
'SDQ for AI'는 구문적 정확성과 통계적 다양성에 대한 품질 검사를 지원하는 자동화 도구로 주요 기능은 검사 규칙 자동 생성, 구문적 정확성 검사, 다양성 분석, 종합 결과 리포트 생성 등이 있다.
검사 규칙 자동 생성 기능을 활용하면 자연어, 헬스케어, 자율주행, 농·축수산, 국토환경, 미디어, 안전 등 여러 분야의 다양한 유형의 학습데이터에 대한 특성에 맞는 검사 규칙 생성이 가능하다.
또 복잡한 학습데이터 구조에 대한 검사 규칙을 빠르고 정확하게 생성할 수 있다. 구문적 정확성 검사 기능을 활용해 학습데이터의 파일의 유효성, 구조의 정확성, 값의 유효성 등의 세부 항목에 대한 품질 검사가 가능하다.
'SDQ for AI'는 그래픽사용자환경(GUI)가 적용된 통계 분석 기능으로 누구나 쉽게 데이터 규모 및 분포에 대한 통계 분석이 가능하며 이를 통해 데이터의 규모, 클래스별 분포 등의 정보를 시각화해 직관적 이해를 돕는다.
조광원 비투엔 대표는 “고품질의 AI 학습용 데이터 구축은 정부가 추진 중인 디지털 뉴딜 사업의 성공을 위한 열쇠가 될 것”이라며 “비투엔의 데이터 분석·품질 진단 기술력과 'SDQ for AI' 도구가 밑거름이 되도록 노력하겠다”고 말했다.
안수민기자 smahn@etnews.com
-
안수민 기자기사 더보기