[디지털 혁신 지원 첨병 IITP] KAIST, 기계학습 모델 취약여부 파악 기술 구현

손수엘 한국과학기술원(KAIST) 정보보호대학원 교수가 기계학습 모델 보안 취약점을 찾아내는 개발 기술에 대해 설명하고 있다.
손수엘 한국과학기술원(KAIST) 정보보호대학원 교수가 기계학습 모델 보안 취약점을 찾아내는 개발 기술에 대해 설명하고 있다.

보안 분야 디지털 혁신 기술 개발 지원에 힘입어서는 기계학습 모델의 보안 취약점을 찾아낼 수 있는 기술이 나왔다.

손수엘 한국과학기술원(KAIST) 정보보호대학원 교수가 '국가 공공 정보보호 인프라 강화 사업' 일환으로 '기계학습 모델 보안 역기능 취약점 자동 탐지·방어기술'을 이뤘다.

기계학습 모델 자체를 대상으로 삼았다. 갈수록 이용이 확대되는 기계학습 모델의 보안성을 선제 확보하기 위해서다. 기계학습 모델은 의료 진단 인공지능(AI), 사람 얼굴 인식, 신용평가 등 다양하고 중요한 영역에 활용도가 높다.

연구진은 세 가지 공격에 집중했다. 입력 데이터에 작은 노이즈를 더해 결과에 영향을 끼치는 '이베이전 공격', 개인정보 학습 여부를 공격자가 파악하는 '멤버십 추론 공격', 훈련 데이터에 추가 데이터를 더해 의도치 않은 행위를 일으키는 '데이터 포이즈닝'이 대상이다.

이 세 가지 공격을 수행하는 도구, 가칭 '요다'를 만들어 대상이 되는 기계학습 모델의 취약 여부를 파악할 수 있게 했다. 또 도출 취약점에 대한 방어·훈련 기술도 연구 중이다.

연구진은 또 데이터 포이즈닝 기술을 활용, 기계학습 모델의 소유권을 판단하는 '워터마크'를 심는 기술도 연구 중이다.

2020년 4월부터 연구를 시작했는데, 국제학회에 21건 논문을 내놓았다. 16건이 한국정보과학회에서 지정한 국제 최우수 학술대회다. 4년여 기간에 이런 성과는 세계 톱 연구 그룹에서도 쉽지 않은 것으로 여겨진다.

국내 특허 12건, 국제 특허 4건을 출원해 국내 4건이 등록되기도 했고, 정보통신기획평가원(IITP)으로부터 2022년 수행과제 원장상을 받기도 했다.

손수엘 교수는 “보안기술은 선제 투자가 무엇보다 중요한데, 과학기술정보통신부와 IITP 지원으로 기술을 발전시킬 수 있었다”며 “사이버 보안 위협에 대응하는 기술을 충실히 구현, 보안 생태계 활성화에 기여하고자 한다”고 말했다.

김영준 기자 kyj85@etnews.com