웹사이트 또는 사회관계망서비스(SNS) 등에 나타난 여론, 의견 등 데이터를 분석해 유의미한 정보로 재가공하고 활용하는 빅데이터 기술이다. 감성 분석 기법의 하나로, 오피니언 마이닝이라고도 불린다.
여론 마이닝은 트렌드 파악뿐만 아니라 제품 및 서비스 평가, 미래 예측 등 다양한 분야에서 활용될 수 있다. 정치·사회 등 특정한 사안이 발생했을 때 사람의 생각이 어떻게 변화되는지 또한 실시간 파악이 가능하다.
여론 마이닝은 인터넷 댓글, 카페·블로그에 작성된 글 등 텍스트 형태의 비정형 데이터를 다룬다. 그러나 이 같은 텍스트 데이터는 단어에 따라 의미가 달라지는 경우가 많다. 또 상대적 표현이나 개인의 감정 등이 드러나는 등 정제되지 않은 표현이 많아 분석이 쉽지 않다.
이를 객관적으로 분석하기 위해서는 어휘를 수치화하고, 통계 작업을 거쳐야 한다. 긍정과 부정 어휘를 극성화해서 긍정과 관련된 단어를 +1, 부정과 관련된 단어를 1로 각각 수치화해 긍정도를 계산하는 방법 등이다.
여론 마이닝은 텍스트에 내재된 가치를 구체적으로 분석할 수 있다는 장점이 있다. 상품 만족도를 평점으로만 분석하는 것과 달리 자유롭게 작성된 댓글과 표현을 데이터로 분석하면 긍정적 단어 사용 빈도로 만족도를 측정할 수 있기 때문이다. 또 장단점에 대한 의견을 분석하고, 원인 도출 또한 가능하다.
감성 분석을 활용하면 분석 가능한 데이터 범위가 넓어질 수 있다. 텍스트 데이터뿐만 아니라 음성 데이터에서 발견되는 톤, 템포 등 정보까지 포함해 분석할 수 있기 때문이다.
정예린기자 yeslin@etnews.com