[신기술 거래장터]문서 자동 분류

 구조화된 문서 자동 분류 기술=이 기술은 문서 분류시 각 부분별 키워드를 서로 비교, 가중치를 부여해 합치는 방법을 사용했다. 특히 전체 문서가 아닌 문서의 세분화된 요소끼리 비교해 유사성을 계산하며, 특허 문서와 같이 고도로 구조화된 문서에 적용이 용이하다.

또 관련 분야 특허를 이용한 트렌드 마이닝이나 데이터 마이닝 등의 응용에도 활용할 수 있다. 자동화에 따른 객관성 및 정확성의 증대로, 추가적 수요의 증가도 예상된다. 한편, 기존 방법은 문서 전체의 키워드나 특정 부분의 키워드만을 이용해 유사 문서를 검색하는 분류 방법을 적용, 정확한 문서 분류에 걸림돌이 돼 왔다.