게임 욕설, AI로 96% 걸러내

사진=게티이미지.
사진=게티이미지.

딥러닝 기술이 게임 내 욕설을 걸러내는 특효약으로 부상하고 있다.

넥슨코리아 어뷰징탐지팀에 따르면 현재 욕설 탐지 시스템은 금칙어 기반 프로세스로 이뤄진다. 금칙어를 지뢰처럼 뿌려놓고 같은 글자가 발견되면 블라인드 처리하는 방식이다. 조용래 넥슨 연구원은 이 같은 방법으로 특정 게임을 10분간 모니터링한 결과, 욕설 231건을 적발했다. 이 가운데 41%가 제재 대상인 것으로 확인됐다.

딥러닝 기술을 적용한 욕설 탐지기에도 같은 게임을 넣고 돌려봤다. 10분 동안 246건 상당 욕설을 잡아냈다. 제재 대상 비율도 96%에 달했다.

금칙어는 기본적 욕설만 막아낼 뿐 빈틈이 많다. 문맥 흐름을 읽을 수 없기 때문이다. 여성을 비하한다는 이유로 '년'이라는 말을 블라인드 처리할 경우 '학년'과 같은 일상적 용어를 쓸 수 없게 된다. 반대로 '씨X'라는 명백한 욕설은 놓치기도 한다. 첫 글자 내 모음 'ㅣ'를 숫자 1로 바꾸면 지뢰밭을 우회할 수 있다. 공격적 표현과 욕설을 구분하는 것도 불가능하다.

결국 욕설 관리자 부담이 커지게 된다. 욕설에 대한 신고가 들어오면 직접 읽고 판단해야 한다. 모든 신고를 관리자가 수동으로 식별한다. 욕설인지 아닌지 헛갈리는 내용부터 잘못 신고한 문구까지 일일이 골라내는 작업이 만만치 않다.

딥러닝은 이런 수고를 덜어준다. 언어를 이해하고 욕설을 스스로 탐지할 수 있다. 딥러닝은 1차 분류 작업을 맡는다. 자동으로 욕설을 한 차례 추려낸 뒤 결과물을 관리자에게 넘기는 구조다.

조 연구원은 자연어 처리 알고리즘에 콘볼루션 신경망(CNN) 모델을 대입하는 테스트도 병행했다. 금칙어 없이 모델이 욕설을 학습할 수 있도록 한 것이다. 판별 정확도는 CNN이 88%, 금칙어 기반 프로세서가 60%로 나타났다. 장단기기억 기술(LSTM)은 70%였다.

CNN은 진화 과정을 거칠 전망이다. CNN 모델링을 고도화하고 데이터 학습 효율을 높일 경우 판별 정확도를 90% 넘게 올릴 수 있다.

온라인이나 모바일게임 내 욕설은 사회적 문제가 된 지 오래다. 욕설을 주고받다 고소, 고발 사건으로 이어진 사례가 매년 늘고 있다. 사이버 명예훼손·모욕죄 발생 건수는 2012년 5684건에서 2013년 6320건, 2014년 8880건으로 급증했다.

조 연구원은 “인공지능은 사람을 대체하지 않고 도와줄 뿐”이라며 “게임 개발, 운영과 데이터 분석, 인공지능 간 협업이 중요하다”고 말했다.

최종희기자 choijh@etnews.com