KAIST, 딥러닝에 대한 공격 막는 프레임 개발

물체 탐지 시 재학습 과정 없이
적대적 패턴 위장·침입 상황 방어
예측 시간 단축·비용 절감 기대
보안·자율주행 분야 적용 가능

적대적 공격을 방어 프레임으로 막는 과정을 도식화한 이미지.
적대적 공격을 방어 프레임으로 막는 과정을 도식화한 이미지.

한국과학기술원(KAIST·총장 이광형)은 노용만 전기 및 전자공학부 교수팀이 물체를 검출하는 딥러닝 신경망에 대한 적대적 공격을 방어하는 알고리즘을 개발했다고 15일 밝혔다.

딥러닝 신경망 기술은 자율주행과 물체검출 등 다양한 분야에서 핵심기술로 주목받고 있는데 현재 딥러닝 기반 검출 네트워크는 입력 이미지에 적대적 패턴을 주입해 잘못된 예측 결과를 초래하는 식으로 공격할 수 있다. 인위적 패턴이 포함된 물체는 검출되지 않게 하는 적대적 패턴 공격이 가능하다.

딥러닝 기반 모델을 국방이나 의료 및 자율주행 등에 적용할 때 문제가 된다. 국방 감시정찰 분야에서 적군이 적대적 패턴으로 위장·침입하면 검출을 못 하는 경우가 발생할 수 있다.

기존 연구는 추가로 복잡한 모듈이 필요하거나 다시 학습해야 해 실시간 작동하는 알고리즘에 쓰기 어려웠다.

연구팀은 적대적 패턴 공격 원리를 반대로 이용해 학습된 네트워크에 접근하지 않으면서 입력단에서 방어할 수 있는 방어 프레임 기술을 고안했다.

적대적 공격과 정반대로 물체 검출 시 딥러닝 모델이 옳은 예측 결과를 내리도록 하는 것이다. 창과 방패의 싸움처럼 적대적 패턴과 함께 경쟁적으로 학습되며 이 과정을 반복해 모든 적대적 패턴 공격에 높은 방어성능을 지니도록 최적화했다.

연구팀은 입력 이미지 외부에 덧붙이는 방어 프레임을 변화시켜 손쉽게 방어성능을 조절할 수 있음을 확인했다. 개발 방어 프레임은 인리아(INRIA) 검출 벤치마크 데이터셋에서 기존 방어 알고리즘 대비 평균 31.6% 정확도가 향상됐다.

개발 방어 프레임은 실시간 물체 탐지 시 모델 재학습 없이 적대적 패턴 공격을 방어할 수 있으므로 예측 시간 및 비용 절감을 크게 이룰 수 있을 것으로 기대된다.

노용만 교수는 “이번에 개발된 방어 기술은 인공지능(AI) 모델 적용 시 실용적인 적대적 방어를 제시한 것”이라며 “국방 감시정찰, 보안, 자율주행 분야에 적용될 수 있을 것”이라고 말했다.

공동 제1 저자인 유영준, 이홍주 KAIST 전기 및 전자공학부 박사과정 학생 등이 함께 수행한 이번 연구는 영상처리 분야 최고 국제 학술지인 'IEEE 트랜스액션즈 온 이미지 프로세싱'에 지난 1일 자 온라인 게재됐다.

한편 이번 연구는 방위사업청과 국방과학연구소(ADD) 지원으로 KAIST 미래국방 인공지능 특화연구센터에서 수행됐다.

김영준기자 kyj85@etnews.com