튜닙의 'AI 가드레일 솔루션 패키지'는 인공지능(AI) 시스템의 안전성과 신뢰성을 종합적으로 확보하기 위한 6가지 특화 모델로 구성됐다.
특화 모델은 △AI 시스템의 취약점을 테스트하는 공격모델 '조커(Joker)' △공격 모델에 대응하는 방어모델 '루시(Lucy)' △텍스트의 윤리성과 개인정보 유출을 감지하는 '세인트 패트릭(St. Patrick)' △프롬프트 공격을 실시간 탐지하고 분류하는 '엔젤(Angel)' △법적 리스크를 평가하는 '가디언(Guardian)' △스팸 콘텐츠를 탐지하는 '스패무라이(Spamurai)' 등 6종이다.
각 모델은 특화된 영역에서 상호 보완적 기능을 수행한다.
특히 조커와 루시 모델의 조합은 'AI 레드티밍(Red Timming)' 방식을 통해 AI 시스템의 취약점을 선제적으로 발견하고 보완한다. 실제 공격 상황을 시뮬레이션해 시스템의 방어 능력을 강화하는 선진적인 접근 방식으로, AI 시스템의 보안성을 한 단계 높인다.
엔젤 모델은 거대언어모델(LLM)에 대한 다양한 형태의 프롬프트 공격을 실시간 감지하고, 공격의 강도와 유형을 정확히 분류해 AI 시스템의 안전한 운영을 돕는다. 이는 AI 시스템에 대한 프롬프트 주입 공격과 같은 새로운 형태의 위협에 효과적으로 대응할 수 있게 해준다.
세인트 패트릭 모델은 AI가 생성하는 텍스트의 윤리성을 실시간 검증하며, 개인정보 유출 가능성을 사전 탐지해 데이터 보안을 강화한다.
가디언 모델은 관련 법령에 기반한 준법 감시 기능을 수행, 각종 규제와 법적 요구사항을 준수할 수 있도록 지원한다.
스패무라이 모델은 AI 시스템에서 발생할 수 있는 스팸성 콘텐츠를 실시간 탐지·분류해 서비스의 품질을 유지하고 사용자 경험을 개선한다.
기업·기관은 이 패키지를 통해 AI 시스템에 대한 보안 위협과 윤리적 리스크를 사전 탐지하고 방어하는 체계적 접근 방식을 도입할 수 있다.
현대인 기자 modernman@etnews.com
-
현대인 기자기사 더보기