[해외기술동향] HTML.SGML 장점만 모은 차세대 웹언어 "XML"

웹언어 표준화단체인 월드와이드웹컨소시엄(W3C)은 최근 인터넷 표준 문서인 HTML(Hypertext Markup Language)을 개선한 XML(eXtensible Markup Language) 1.0을 정식 인터넷 표준으로 발표했다.

이에 따라 HTML의 새로운 대안으로 떠오르고 있는 XML이 향후 인터넷 관련업계의 주요 관심사로 등장할 전망이다.

XML에 대해 관심이 집중되고 있는 것은 XML이 HTML의 한계를 극복할 수 있다는 점 때문이다. HTML은 여러 버전을 갖고 있어 웹상의 호환성 문제가 제기되고 있으며 또한 HTML 언어 자체가 갖는 한계로 인해 인터넷 사용자가 다이내믹한 웹문서를 만들 수 없는 결점이 있다.

또한 HTML에는 인터넷 사용자의 환경에 맞게 태그를 추가할 수 있는 확장성이 없는 점도 보급의 걸림돌로 지적되고 있다.

이에 반해 XML의 특징은 사용법이 복잡한 SGML(Standard Generalized Markup Language)의 단점을 극복해 HTML과 SGML의 장점만을 취한 웹언어라는 점이다. 특히 XML은 SGML이 가지고 있는 일반화된 마크업(Generalized markup), 복합 구조(Complex Structure), 검증(Validation)의 특성을 그대로 지원하는 한편 사용자에 의한 확장성(Extensibility)을 지원함으로써 웹문서 및 애플리케이션에 쉽게 구현될 수 있다.

XML은 HTML과 같이 태그로 마크업을 사용하지만 HTML과는 달리 개인이 지정할 수 있는 일반화된 마크업을 지원한다. 마크업은 작성되는 전자문서 안에 문서의 내용과 함께 문서의 구조를 함께 명시하는 것으로 일반적으로 원하는 부분의 시작과 끝에 태그 표시를 이용해 지정해 주며 크게 절차적 마크업과 일반화 마크업으로 구별된다.

HTML에서 주로 사용되는 절차적 마크업은 문서를 인쇄하거나 다른 방법으로 표현하기 위해 문서의 배치적 구조를 처리하는 것으로 폰트 등의 문서 형태만을 규정하기 때문에 소프트웨어나 하드웨어의 특성에 크게 좌우되고 서로 호환성이 없다. 그러나 XML에서 적용되는 일반화된 마크업은 문서의 논리적 구조를 분석해 처리함으로써 하드웨어나 소프트웨어의 종류에 영향을 받지 않고 호환성을 유지할 수 있다.

XML은 HTML이 지원하지 않는 여러 번의 중첩된 구조를 지원함으로써 객체 지향적 문서 작업을 할 수 있다. 또한 XML은 문서 구조의 검증이 필요한 애플리케이션에 대해 문법적인 구별을 문서 안에서 제공한다. 따라서 애플리케이션에 어떠한 문서를 적용할 때 그 문서의 오류를 쉽게 판단할 수 있다.

XML은 새로운 태그 세트와 속성을 정의할 수 있는 확장성을 가진다. 웹제작자들은 자신의 편의에 따라 혹은 자신의 데이터를 구분하기 위해 새로운 태그 세트를 임의로 만들 수 있다. 이에 따라 대규모의 문서를 웹으로 만들 때 제작 및 운용에 있어 상당한 애로점이 있는 HTML보다 XML을 이용한 대규모 웹문서가 대거 등장할 것으로 기대된다.

이러한 특징을 가진 XML은 웹문서 제작, 웹브라우저 제작, 푸시 기술, 인트라넷, 엑스트라넷 등에 다양하게 적용될 전망이다.

XML로 만들어진 웹문서는 동적 목차(Dynamic Table of Contents)를 적용할 수 있어 HTML 문서에 비해 정보를 카테고리별로 구분할 수 있으며 XML로 구축한 웹페이지는 인터넷 이용자들에게 정보를 정렬하거나 정보검색 작업을 손쉽게 해 준다.

예를 들어 HTML기반 하에서 만들어진 콘텐츠를 검색할 때 하이퍼링크된 부문을 모두 클릭해야 세부 목차를 검색할 수 있지만 XML기반에서는 클릭하지 않더라고 웹사이트의 세부 목차를 알 수 있다. 또한 단 한번의 클릭으로 웹콘텐츠를 날짜순, 제목순, 중요도 순으로 다양하게 검색할 수 있다.

XML은 개별 사항의 데이터베이스 작업을 웹문서로 수행할 수 있기 때문에 푸시 기술에 쉽게 적용될 수 있다. 현재 뉴스 제공사이트인 포인트캐스트 및 인터넷 신문에서 XML을 이용한 푸시기술을 적용, 주문형 뉴스 서비스를 제공하고 있으며 특히 MS는 채널정의 포맷(CDF)을 이용해 PC로 정보를 보내는 푸시기술에 XML을 보다 확대할 예정이며 넷스케이프는 향후 출시되는 신 버전에서는 XML을 지원할 방침이다.

XML은 수시로 새로운 기능을 추가해 업그레이드 할 필요가 없어 브라우저와의 호환성 문제가 해결되며 어떤 플랫폼에서나 읽을 수 있는 포맷을 제공하기 때문에 특정 회사의 환경에 얽매이지 않는 확장성을 제공한다. 따라서 다이내믹 HTML이나 자바와 혼합 프로그래밍이 가능해 더욱 유연한 브라우저를 만들 수 있다.

특히 XML은 사내의 인트라넷이나 엑스트라넷과 같이 특화된 웹 기술 활용응용분야에 적용될 가능성이 크다. 이는 XML은 특성상 태그 세트를 임의로 만들 수 있어 기업의 제작, 주문, 판매 공정에 일련의 순차적인 작업이 가능하기 때문이다.

이러한 특징을 가진 XML은 향후 2-3년 내 웹페이지 제작자에게 보다 많은 자유를 주고 웹페이지의 내용을 보다 풍성하게 만들어 줄 것으로 예상된다. 앞으로는 개인화된 웹과 개선된 검색 서비스, 푸시기술을 이용한 정보제공 및 복잡한 데이터 구조의 정보들은 모두 XML로 작성될 전망이다.

<정혁준 기자>