대선 양강주자인 이 후보와 윤 후보를 대상으로 진행된 이번 소셜데이터 분석은 정치 빅데이터 분석기관 씨지인사이드의 아이호퍼 플랫폼을 활용했다. 지난해 12월 1일부터 올해 2월 4일까지 인터넷상 언론 뉴스 콘텐츠와 소셜사이트의 콘텐츠를 대상으로 이 후보와 윤 후보의 연관 키워드를 추출하는 방식으로 조사했다.
분석 주제는 △뉴스 채널에서의 후보별 긍정·부정 상위 키워드 △트위터 채널에서의 후보별 긍정·부정 상위 키워드 △블로그(커뮤니티)에서의 후보별 긍정·부정 상위 키워드 △소셜데이터에서의 후보별 인물관계도 상위 키워드 등으로 총 4개다.
언론 뉴스 분석을 위한 이 후보 관련 전체 수집기사는 3만1905건, 윤 후보 관련 전체 수집기사는 3만8017건으로 방송, 전국지, 지방지를 포함해 총 84개의 언론을 대상으로 했다. 커뮤니티 사이트는 7000여개의 블로그와 카페를 대상으로 했으며 이 후보 관련 게시글은 13만8061건, 윤 후보 관련 게시글은 16만4957건이 빅데이터 분석 대상에 포함됐다. 트위터는 이 후보 33만9184건, 윤 후보 23만1239건의 트윗을 기반으로 조사했다.
각 채널 콘텐츠에 달린 리트윗 및 댓글 분석은 매크로 등 조작 가능성으로 인해 분석 대상에서 제외했다. 일부 상시 언급 단어는 배제했다. 각 후보 분석에서 상대 후보의 이름과 '대선' '후보' '선거' 등 단어가 대상이었다. 일부 조사나 단순 서술형 단어 조합도 키워드에서 제외시켰다.
전자신문과 씨지인사이드는 이 후보와 윤 후보의 주요 정책 공약 및 이슈 관련 2차 빅데이터 분석을 추가로 진행한다. 기간은 설 연휴 기간이 끝난 2월 3일부터로 TV토론에서 거론된 주요 키워드와 주요 공약에 대한 긍정·부정 인식 형태도 조사할 예정이다.
조정형기자 jenie@etnews.com
-
조정형 기자기사 더보기