“나라마다 법, 제도가 달라 데이터 수집량에서 차이가 나고 있습니다. 이는 인공지능(AI) 솔루션 성능에도 영향을 미칩니다.”
마리넬라 프로피 SAS 생성형 AI 부문 글로벌 제품 전략 책임자는 18일(현지시간) 미국 라스베이거스에서 열린 'SAS 이노베이트 2024' 인터뷰에서 AI 개발에 필요한 데이터 지원 방안을 설명했다.
프로피는 “연구 결과에 따르면 미국, 중국, 독일에서 전체 데이터의 70%가 수집되고 있다”며 “대부분 나라는 법, 제도나 기술적 한계로 데이터 수집 시스템이 구축돼 있지 않고, 이는 AI 솔루션 성능에 직접적인 영향을 준다”고 말했다.
이어 “국가별 데이터 수집에 격차가 생기는 현상은 SAS에 기회 요인”이라며 “SAS는 100개 이상 국가에 각 언어별 데이터를 지원하고, 국가별 특징을 띄는 데이터도 관리하고 있어 지역별 AI 격차를 줄이는 데 도움을 줄 수 있다”고 덧붙였다.
SAS는 이번 행사에서 'SAS 데이터 메이커'를 출시했다. 규제로 학습이 어려운 민감한 정보를 모아 합성 데이터로 생성해 개인정보 규제를 피하고, 동시에 데이터 부족 문제도 해결해주는 솔루션이다.
SAS 생성형 AI에는 SAS 데이터 메이커 기능이 포함돼 있다.
프로피는 “우리는 다양한 솔루션에서 얻은 데이터와 민감 정보를 결합해 합성 데이터를 생성하고 있다”며 “은행 같은 규제 산업은 데이터 수집에 어려움이 있지만 합성 데이터를 활용하면 데이터 공백 문제를 해결할 수 있다”고 설명했다.
이어 “SAS 데이터 메이커로 규제 산업에서도 생성형 AI에 필요한 데이터 학습을 지원할 수 있어 산업별 AI 격차도 줄일 수 있다”고 덧붙였다.
프로피는 AI 신뢰성도 강조했다. 그는 “고객이 AI 솔루션을 오랫동안 이용하려면 양질의 데이터와 함께 AI 신뢰성이 중요하다”며 “SAS는 이를 위해 '모델카드'와 'AI 거버넌스 자문 서비스'를 제공한다”고 말했다.
모델카드는 AI 모델의 '영양 성분표' 개념으로 여러 지표와 모델 책임자 등 거버넌스 정보가 포함돼 있다. 편향적이거나 비정상적인 AI 모델이 나오지 않게 막는다. AI 거버넌스 자문 서비스는 고객사에 AI와 데이터 활용 방안을 컨설팅해주는 무료 서비스다.
프로피는 “SAS는 6가지 주요 원칙을 세웠고, 모든 AI 관련 서비스는 이 원칙을 어기지 않게 설계돼 있다”며 “고객에게 신뢰를 안겨주는 게 SAS AI 전략의 핵심”이라고 강조했다.
라스베이거스=박두호 기자 walnut_park@etnews.com
마리넬라 프로피 SAS 생성형 AI 책임자