에임인텔리전스, 앤트로픽 비공개 AI 모델 정밀 진단...AI 보안 기술력 과시

발행일 : 2025-02-26 14:13

국내 최초 AI 서비스 신뢰성 검증 프로세스 자동화

에임인텔리전스, 앤트로픽 비공개 AI 모델 정밀 진단...AI 보안 기술력 과시

AI 보안·검사 테스트 전문기업 에임인텔리전스(대표 유상윤)는 세계적 AI 연구기업 앤트로픽(Anthropic) 비공개 AI 모델을 정밀 진단하며, AI 보안 분야에서 톱티어 기업으로서 입지를 확고히 다졌다고 밝혔다.

앤트로픽의 최신 비공개 AI 모델을 대상으 로 보안 검증을 수행하며 글로벌 AI 보안 시장에서 경쟁력을 입증했다. 메타(Meta)에서 수상 경력을 보유한 이 기업은 레드팀 테스트를 통해 최첨단 AI 모델의 취약점을 철저히 분석했다.

앤트로픽은 최근 AI 보안 강화를 위해 새로운 버그 바운티(Bug Bounty) 프로그램을 발표했다. 에임인텔리전스는 이러한 보안 강화 움직임 속에서 핵심 역할을 담당하며, 최상위 수준 보안 평가를 진행했다. AI 모델의 악용을 방지하기 위한 최신 방어시스템을 점검하고, 사전에 보안 취약점을 찾아내는 데 집중했다.

에임인텔리전스는 앤트로픽이 진행한 버그바운티 프로그램에서 선발돼 참여했다. 이 프로그램에서는 CBRN(화학, 생물학, 방사능, 핵)과 관련한 10개의 금지 질문에 대해 AI 모델이 얼마나 정확하게 대응하는지를 평가했다. 전 세계에서 초청된 해커 중 약 20명만이 2개 이상 문제를 우회하는데 성공했다.

에임인텔리전스는 AI 모델이 내장한 보안 기능을 우회할 수 있는 방법을 탐색하며, 기 존의 방어 체계를 뚫는 새로운 기법을 실험했다. 그 연구 결과는 AI 보안성 강화를 위한 중요한 참고자료로 활용됐다. 앤트로픽은 이를 기반으로 AI 안전성을 높이 기 위한 'Constitutional Classifier' 논문을 발표했다. 해당 논문에서는 AI 모델이 보다 정교하게 위험한 질문을 감지하고 대응하는 방안을 제시하며, 향후 AI 보안 연구의 핵심 자료로 자리 잡았다.

에임인텔리전스 관계자는 “국내 최초로 AI 서비스 신뢰성 검증 프로세스를 자동화했다”면서 “탐지된 취약점 유형을 자동 차단하는 기능을 통해 기업들이 보다 강력한 보안 체계를 구축할 수 있도록 돕겠다”라고 밝혔다.

에임인텔리전스가 새롭게 선보인 'AIM Supervisor'는 AI 보안 점검을 자동화하는 솔루션으로, 기업들이 자사 AI 서비스 신뢰성을 손쉽게 검증할 수 있도록 설계됐다. 특히, 레드팀 공격을 자동으로 수행해 보안 취약점을 사전에 탐지하는 기능이 강점이다. 이를 통해 AI 모델이 실전 환경에서도 안전하게 운영될 수 있도록 지원한다.

AIM Supervisor는 100만개 이상 평가 질문을 자동 생성해, 기존 보안 전문가들이 수작업으로 점검해야 했던 부담을 대폭 줄였다. 이 시스템은 에임인텔리전스의 독자 AI 기술을 활용해 평가 목적, 요구사항, 난이도, 실제 서비스 환경을 반영한 정밀한 검증을 가능하게 한다.

에임인텔리전스는 AI 보안 기술력을 앞세워 국내 주요 기업과 협업을 강화하고 있다. KT LLM817 믿음, SKT AI Care LLM, LG 엑사원 등 국내 대표 AI 기업들이 에임인텔 리전스 보안 점검을 거쳤다. KB국민카드, 우리은행, 분당서울대병원 등 금융·의료 분야에서도 AI 보안 진단과 레드팀 테스트를 진행하며 업계 신뢰를 얻고 있다.

김현민 기자 minkim@etnews.com