ETRI, 인터넷정보 XML가공 SW 개발

 인터넷 사이트에서 필요한 정보만을 추출, 사용자가 원하는 형태의 확장성표기언어(XML) 문서로 가공할 수 있는 소프트웨어 기술이 개발됐다.

 한국전자통신연구원(ETRI·http://www.etri.re.kr) 지식처리연구팀(팀장 윤보현 박사)은 정보통신 선도기반기술개발사업인 ‘국제 표준 ebXML/ebWML 프레임워크기술 개발’ 과제의 일환으로 인터넷에서 원하는 정보만 추출, XML 문서 형태로 자동생성·저장하는 소프트웨어 시스템을 개발했다고 6일 밝혔다.

 포장 담당직원이라는 뜻의 래퍼 기반으로 개발된 이 기술은 인터넷에서 필요한 정보를 추출한 뒤 조합·저장한 XML 웹문서를 실시간으로 업데이트할 수 있다. 특히 에이전트기술과 결합시켜 정보 가공 및 서비스의 통합패키지 구성이 가능한 데다 상품 정보를 추출해 가격비교시스템을 구축하기 위한 모듈로 활용할 수도 있다. 또 자체적인 학습능력을 갖고 있어 표식이 없는 자료, 홈페이지 개편 등으로 배치가 바뀐 자료 등도 정확히 찾아 추출할 수 있는 장점이 있다.

 이에 따라 연구진은 각종 예매사이트·가격비교 인터넷 쇼핑몰·콘텐츠사업자(CP) 등에 유용하게 활용될 것으로 보고 있다.

 윤보현 박사는 “CP 등은 서비스 목적에 부합하는 정보만을 수집해 구축할 수 있고 일반 사용자들은 가독성이 높은 정보를 제공받을 수 있기 때문에 정보 인지와 획득에 드는 비용이 절감될 것”이라며 “XML 문서변환 컴포넌트 기술, 맞춤형 모바일 웹서비스를 위한 기반기술 등으로의 응용도 가능하다”고 말했다.

 <대전=박희범기자 hbpark@etnews.co.kr>