가짜뉴스, 알고리즘으로 잡는다…KAIST '성과'

가장 덜 퍼진 상태에서 적발 '골든타임' 설계…트위터 등서 효과 입증

사회관계망서비스(SNS)에서 활개 치는 가짜뉴스를 효과적으로 자동 근절하는 알고리즘(전산논리체계)이 국내 연구진에 의해 처음 개발됐다.

KAIST 전산학부 오혜연 교수팀은 독일 막스 플랑크 연구소와 이런 '커브'(CURB)라는 알고리즘을 개발해, 관련 논문이 세계적 전산 학술 행사인 'WSDM 2018'의 발표 작품으로 선정됐다고 24일 밝혔다.

가짜뉴스는 넓은 SNS 공간에 대거 퍼지는 특성 탓에 기자 등 소수의 전문 인력이 수동으로 적발하기가 매우 어렵다.

이 때문에 학계에서는 네티즌이 가짜뉴스를 신고하면 알고리즘이 해당 기사를 팩트체크(사실확인) 기관에 자동 전달하는 집단지성 모델이 대안으로 제시됐지만 이 방안도 구현에 난관이 많다.

ⓒ게티이미지뱅크
ⓒ게티이미지뱅크

네티즌의 가짜뉴스 신고 패턴이 시간에 따라 들쭉날쭉해 알고리즘이 어떤 기준에 따라 특정 기사를 펙트체크 기관에 넘길지를 정의하기가 쉽지 않다.

게다가 집단지성 모델은 가짜뉴스가 어느 수준까지 SNS에 퍼져야만 제대로 작동하는 '사후 약방문'식 약점이 있다.

가짜뉴스가 사람들 사이에서 대폭 돌아 이미 해악이 된 상태에서야 네티즌의 신고가 활발해지기 때문이다.

가령 동네 곳곳에 쓰레기가 마구 쌓여 위생이 나빠져야 주민 신고가 이뤄지고 청소차가 출동하는 상황인 셈이다. 가짜뉴스란 쓰레기를 조기 근절하는 효과가 부족할 수밖에 없다.

이에 따라 오 교수팀은 '확률적 최적 조절법' 등의 수학적 기법을 활용해 실시간으로 접수되는 네티즌 신고가 어느 수준에 이르렀을 때 알고리즘이 행동에 나설지에 관해 기준을 정했다.

이 알고리즘은 특히 가짜뉴스가 가장 덜 퍼진 상태에서 적발할 수 있는 '골든타임'을 포착하도록 설계됐다. 거리가 너무 더러워지기 전에 쓰레기를 치울 적기를 판정할 수 있는 것이다.

논문의 1 저자인 김주연 연구원(KAIST 박사과정생)은 “가짜뉴스를 제대로 찾아내려면 시간이 걸리고 시간을 단축하면 신뢰성이 나빠지는 '트레이드 오프'(상호 모순 관계)가 있었다”며 “이를 극복하고 대중이 가짜뉴스에 노출되는 정도를 최소화했다는 것에 연구의 의의가 있다”고 설명했다.

연구진은 해당 알고리즘으로 영문판 트위터와 중국의 유명 SNS인 웨이보의 데이터를 활용해 실제 가짜뉴스 감시 실험을 한 결과 엉터리 정보를 적기에 잡아내는 효과가 입증됐다고 전했다.

오 교수는 “이번 연구는 외국 데이터로만 했었는데, 알고리즘을 계속 개선해 한국 SNS를 대상으로 실험하는 방안에도 관심이 많다”고 덧붙였다.

오 교수팀은 내년 2월 미국 로스앤젤레스에서 열리는 WSDM 2018 행사에서 커브에 관한 논문을 발표할 예정이다.

최지호기자 jhochoi@etnews.com