2021년부터 현재까지 일어난 개인정보 유출이 8천여 건에 육박하는 것으로 드러났다. 개인정보보호위원회에 따르면 2021년부터 올해 9월까지 민간기업 및 공공기관을 포함한 총 377개 기관에서 개인정보가 유출됐으며, 유출된 개인정보의 총 합은 약 7천7백3십5만 건에 달한다.
개인정보는 흔히 생각하는 연락처, 주민등록번호 외에도 신체적·인적·정신적·사회적·재산적 정보를 아우르는 광범위한 개념이다. 금융 및 의료, 행정 기관과 학교, 여행업계 등 산업 전 분야에서는 개인정보 보호를 위해 다양한 선제적 대응 방안을 모색하고 있다.
그러나 개인정보 수집의 기초가 되는 문서 보안, 특히 문서 내에 포함된 이름이나 별명, 주소, 출생지, 직업과 같이 일정 형태가 없는 비정형 개인정보는 문서 비식별화 솔루션을 사용해도 식별하기 어려워 사람이 직접 확인하고 수기로 가림 처리해야 하는 등 어려움을 겪고 있다.
문서 AI 기업 이파피루스(대표 김정희)는 최근 비정형 개인정보까지 자동으로 정확하게 인식하는 LLM(대규모 언어 모델, Large Language Model) 기반 개인정보 비식별화 솔루션 'AI BlackMarker(에이아이 블랙마커)'를 출시했다.
'AI BlackMarker'는 인공지능을 통해 문서 내 개인정보를 자동으로 찾아 보이지 않게 가리거나 다른 문자로 치환하는 등 비식별 처리하는 솔루션이다.
LLM을 통해 개인정보 처리를 학습한 AI 모델을 적용, 주민등록번호, 전화번호, 이메일과 같이 정형화된 규칙을 가진 개인정보는 물론 성명이나 별명, 주소와 출생지, 직업이나 인적 관계 등 비정형 민감정보까지 빠르고 정확하게 찾아내어 완벽하게 비식별화한다.
사전 설정한 옵션에 따라 다량의 문서 내에 포함된 민감 정보를 자동으로 감지하고 비식별 처리하는 서버 기반 자동 배치 처리 기능으로 대량의 문서도 빠르고 안정적으로 작업할 수 있다. 비식별화 후 기존의 텍스트 정보는 완전 삭제하므로 원본 문서 복구를 통한 유출 시도까지 원천 차단된다.
이파피루스 김정아 부사장은 “'AI BlackMarker'는 비정형 개인정보 처리에 필수적이었던 수기 작업의 번거로움을 대폭 줄이고 정보 유출 위험에 선제적으로 대응할 수 있는 획기적인 솔루션이다. 출시 후 한 달이 채 지나지 않았지만 공공 및 교육 기관, 금융업계 등으로부터 많은 도입 문의를 받고 있다”고 말했다.
'AI BlackMarker'는 이파피루스의 PDF 스트리밍 뷰어인 'StreamDocs(스트림닥스)'와 연계 가능하다. 비식별 처리된 문서를 웹 브라우저에서 다운로드 없이 열람하고, 필요 시 직접 비식별 영역을 추가하거나 수정할 수 있다. 효율적인 작업을 위한 텍스트 검색 기능과 일괄 비식별 처리 기능을 함께 제공한다.
임중권 기자 lim9181@etnews.com
-
임중권 기자기사 더보기