샌즈랩 핵심 서비스인 'malwares.com'은 매일 220만개 이상 위협을 분석하며, 자체 개발한 인공지능(AI) 모델로 프로파일링 정보를 제공한다.
사이버 보안 분야는 AI 기술이 많이 활용되는 분야로 AI 기술 적용 여부는 제공하는 정보 양이 확연히 차이가 난다. 짧은 시간내에 광범위한 분석과 다양한 인사이트 제공을 돕는다.
하나의 위협 인텔리전스 정보를 만들기 위해서는 다양한 분석 기술이 필요하다. 개별 단위에서 정보 신뢰성을 확보해야 전체 분석 정보에 신뢰가 생긴다. 이를 통해서 생성된 '신뢰할 수 있는 데이터셋'을 통해 학습시킨 AI 모델이 신뢰성을 확보할 수 있다.
샌즈랩은 단위 분석 정보 생성 단계에서부터 신뢰성을 확보하기 위해 노력했다. 이를 위해 'AI 학습용 데이터 처리 파이프라인'을 구축했다.
샌즈랩은 데이터 생성 과정부터 분석과 검증, 이를 통한 학습, 재검증, 필터링 과정을 자동화하는 플랫폼을 자체 개발했다. 정보 수집 과정에서 '정제 기능'도 수행해 AI 모델 신뢰성을 높였다.
전 과정을 실시간 모니터링할 수 있는 인터페이스를 만들어 수집, 정제되고 있는 데이터 현황도 파악할 수 있다.
샌즈랩이 구축한 데이터셋은 신기술 개발, 능동적 보안 위협 대응 등에 활용하기 위한 기초 데이터로서 정부에서 큰 비용을 들여 구축하고 개방하여 산업 발전에 기여하고 있다.
샌즈랩은 데이터셋 생성 과정을 TTA에서 공개한 가이드라인 기준에 맞춰 자체 평가를 수행하고 있다. 데이터셋 만드는 과정, 결과 검증 또한 TTA 로부터 검증을 받아왔다. 샌즈랩은 ISO9001 인증도 받았다.
샌즈랩 관계자는“이터셋과 AI 모델에 실시간 검증 파이프라인을 구축해 신뢰도를 검증하고 있다”며 “경쟁사와 비교해 얼마나 잘 탐지하고 있는지, 또 어떤 데이터셋들이 어떻게 필터링 되고 있는지 등을 실시간 제공해 관리의 효율성을 높였다”고 말했다.
박두호 기자 walnut_park@etnews.com
-
박두호 기자기사 더보기