한국언론진흥재단, `빅 카인즈`로 뉴스 빅데이터 활용도 높인다

빅 카인즈 서비스 화면
빅 카인즈 서비스 화면

한국언론진흥재단이 뉴스 빅데이터 분석 시스템 `빅 카인즈(BIG KINDS)`를 공식 출시한다. 기존 카인즈 시스템을 대폭 개선해 뉴스 빅데이터 가치를 극대화한다. 공공 데이터(DB)와 연계해 활용도를 더욱 강화한다. 유료화 모델 도입으로 언론사 저작권 수익 향상에 기여한다.

한국언론진흥재단은 19일부터 빅 카인즈 서비스를 시작한다. 뉴스 콘텐츠 텍스트를 정제해 분석 가능한 데이터로 바꿔준다. 1990년부터 현재까지 축적된 60여개 매체 3000만건 뉴스 콘텐츠를 대상으로 한다.

빅 카인즈 이슈 동향
빅 카인즈 이슈 동향

기존 포털과 카인즈 서비스에서 파악하기 힘든 세부 분석 결과까지 도출 가능하다. 특정 주제를 지역, 기간, 유형 별로 제시한다. `자살`이라는 카테고리로 검색하면 유형으로 `투신자살` 기간으로 `2015년 1월 1일~2015년 12월 31일` 위치로 `한강 OO대교`까지 조회 가능하다. 동명이인도 구분해 조회가 가능해졌다.

빅 카인즈 인용구 검색
빅 카인즈 인용구 검색

전반적 현상 맥락을 입체적으로 보여준다. 현재 발생하는 이슈 히스토리를 제공해 과거와 연계고리를 같이 분석한다. 사안별 다양한 취재원 인용문을 보여준다. 한 인물의 과거 발언을 비교하는 것도 가능하다. 관련 인물, 장소, 기관명 등 주요 이슈별 연관 데이터를 함께 제공한다. 키워드별 기사 추이와 동향으로 특정 주제가 해당 연도에 얼마나 이슈가 됐는지 살펴보는 것도 가능하다. 많이 인용된 취재원 정보를 제공해 해당 분야 전문가가 누군지도 보여준다. 김선형 한국언론진흥재단 신사업개발팀 차장은 “키워드별 세부 검색 기능과 시공간적 네트워크 제시로 이용자가 미처 파악하지 못한 정보, 관계 등 인사이트를 제공 한다”고 설명했다.

빅 카인즈 정보원 발생 추이 분석
빅 카인즈 정보원 발생 추이 분석

연구와 기사작성 등 실제 데이터 활용도 용이해졌다. 데이터를 바로 엑셀로 저장 가능하다. 데이터를 받아 일일이 수동으로 관련 데이터만 추려내 엑셀로 저장해야 하는 불편함을 해소했다. API를 제공해 기사입력기에서 활용이 가능케 했다. 다양한 그래프 시각화 기능을 제공한다. 카드뉴스 등 멀티미디어 기사 생산 시 편의를 제공한다. 김 차장은 “기사마다 프로그래머나 디자이너를 붙이기 어려운 현재 언론사 현실에서 빅 카인즈가 멀티미디어 기사 작성에 도움이 될 것”이라고 강조했다.

키워드별 네트워크 비교
키워드별 네트워크 비교

낙후된 기존 서비스 개편으로 현재 환경에 보조를 맞췄다. 1990년대 서비스 시작 당시 언론 정보 데이터베이스로 큰 반향을 일으켰다. 취재원과 학술자료로서 가치를 인정받았다. 그러나 인터넷과 언론 환경 급변으로 도태 위기에 빠졌다. 수많은 비정형 데이터를 가공해 의미 있는 데이터를 만드는 게 시대적 트렌드가 됐다. 뉴스 콘텐츠가 국민, 정부기관, 기업으로 이어지는 생태계를 마련한다. 김 차장은 “빅데이터 시대가 되니 기사 재활용에 아쉬운 부분이 있었다”며 “뉴스와 달리 댓글, SNS, 블로그 콘텐츠 분석은 이미 활성화됐다”고 지적했다.

워드클라우드 기능
워드클라우드 기능

올해 공공 데이터와 순차적 연계를 추진한다. 뉴스와 공공 데이터 시너지로 가치를 높인다. 수익 모델화로 언론사 저작권 수익에 기여한다. 저작권 사업 일환으로서 다양한 리포트 등 빅데이터 상품을 개발한다. 언론사와 협의를 위해 `뉴스 빅데이터 운영위원회(가칭)` 구성도 검토 중이다. 유료화 방향, 대상, 어뷰징 기사 처리, 온라인 뉴스 구분 등을 논의한다. 김 차장은 “뉴스 콘텐츠 소유와 생산 주체는 언론사”라며 “빅 카인즈 출범이 불법적 요소가 많았던 뉴스 분석 시장을 합법화해 활성화하는 계기가 될 것”이라고 말했다.

오대석기자 ods@etnews.com