행안부, '보이스피싱 음성분석 모델' 개발…이달말부터 사기범 수사에 활용

제공=행정안전부
제공=행정안전부

행정안전부는 보이스피싱 사기범 검거에 활용할 수 있는 '보이스피싱 음성분석 모델'을 개발했다고 22일 밝혔다. 이달 말부터 음성 감정 등 사기범 수사 과정에 활용한다.

그동안 국내에서는 국립과학수사연구원(이하 국과수)이 러시아와 영국에서 개발한 음성분석 모델을 활용해 보이스피싱 수사를 진행해왔다. 하지만 외국어로 학습된 음성분석 모델 특성상, 한국어를 사용하는 범죄자의 동일인 여부를 판별하는 정확도에 한계가 있었다.

보이스피싱 범죄조직의 특성상 역할(수사관, 검사 등)을 나눠 그룹별로 활동하고 있어, 범죄에 연루된 범죄자들을 군집화하는 기능이 반드시 필요했으나 기존모델에는 이런 기능이 없었다.

행안부 통합데이터분석센터는 국과수와 지난해부터 화자(話者) 구분 정확도 개선과 범죄연루자 그룹화가 가능한 모델 개발을 추진했다. 인공지능학습(AI 딥러닝) 기술로 국내외 약 6000여명에서 추출한 100만개 이상의 외국어와 한국어 음성데이터를 활용했다.

한국어는 약 10만개 이상 일반인 음성데이터와 국과수가 보유 중인 실제 보이스피싱 사기범 음성데이터를 함께 사용했다. 모델 개발 이후 두 차례에 걸쳐 진행된 정확도 검증결과, 범죄자 음성을 정확하게 판별해내는 판독률이 기존 외산 분석모델 대비 약 77% 향상된 것이 확인됐다.

행안부 통합데이터분석센터는 '범죄가담자 그룹화 기능'도 세계 최초로 구현했다고 밝혔다. 범죄자 그룹화는 사건별 범죄자 목소리의 연쇄 비교과정을 거쳐 동일인 확인하고 군집화하는 것이다.

경찰청 발표에 따르면 지난 5년간 국내에서 발생한 보이스피싱 피해 건수는 총 15만 6249건, 피해액은 3조원을 넘어선다. 국민 생활에 심각한 영향을 미치고 있다.

행안부 통합데이터분석센터는 국과수, 경찰청과 협력해 보이스피싱범 수사와 검거 과정에 개발 모델을 적극 활용하고 해외 확산도 추진한다. 국과수는 이 모델을 2월 말부터 보이스피싱 사기범 목소리 감정에 활용한다. 보유 중인 약 1만개의 보이스피싱범 음성데이터를 분석해 범죄조직 그룹화와 이미 검거된 범죄자의 여죄 추궁 등에 사용한다.

경찰청과 모델을 공유해 보이스피싱 범죄 초동수사의 속도와 검거율을 높이는 데 활용한다. 기관사칭, 전세사기 등 다양한 음성관련 범죄 수사 전반에 적용해 나갈 예정이다.

행안부는 개발한 모델을 새로운 행정한류 상품으로 해외 확산에도 추진할 방침이다. 개도국을 포함해 최신 음성 과학수사 기법을 전수받고자 하는 국가에 올 하반기에 이뤄지는 교육과 다양한 국제행사 등을 계기로 모델의 우수성과 확장 가능성을 알려 나갈 계획이다.

한창섭 행안부 차관은 “새로 개발된 보이스피싱 음성분석모델은 데이터 분석으로 사회현안을 해결하는 디지털플랫폼정부의 구체적 성과물”이라며 “데이터기반의 일 잘하는 정부구현을 위해 국민이 필요로 하는 분석과제를 발굴하고, 분석된 결과를 현장에 적극 활용해 나갈 것”이라고 밝혔다.

송혜영기자 hybrid@etnews.com