<금주의 용어> XML

차세대 인터넷 표준언어XML(eXtensible Markup Language)은 1996년 월드와이드웹컨소시엄(W3C)에서 제안되고 98년 봄 W3C의 권장 규격으로 채택된 차세대 인터넷 표준언어다.

XML은 현재 웹의 표준으로 사용되고 있는 마크업 언어인 HTML(HyperText Markup Language)의 단순한 표현 기능을 극복하고, 기존 복잡하고 어려운 메타언어인 SGML(Standard Generalized Markup Language)의 실용적인 기능만을 모아 단순화한 메타언어로 SGML의 부분집합(subset)이라 할 수 있다.

그러면 마크업 언어란 무엇인가. 마크업은 그 파일이 프린터로 출력되거나 화면에서 어떻게 보여야 할 것인지를 나타내기 위해 특정위치에 삽입되는 일련의 문자들이나 기호들을 말하며, 이런 마크업을 이용해서 문서표현을 다루는 언어가 마크업 언어다.

스펙이 단순하고 사용이 용이한 HTML은 데이터의 화면 표현용으로 만들어졌기 때문에 웹에서의 자동화된 정보처리와 같은 업무에는 잘 맞지 않는다. 이러한 단점을 극복하기 위한 대안으로 등장한 것이 XML이다.

예를 들면, HTML 태그는 문자의 크기나 색깔 등 표현방식에만 치중할 뿐 그 내용을 구분해주는 기능이 없다. 홍길동이 쓴 책을 웹에서 찾고자 할 경우, HTML파일에서는 홍길동이 저자이건 본문 중에 등장하건 간에 홍길동이란 글자가 있는 모든 웹페이지가 검색된다. 하지만 XML파일에서는 저자가 홍길동인 웹페이지만을 찾아낼 수 있다. 이와 같이 저자, 제목, 본문, 전화번호 등 데이터베이스의 테이블처럼 별도의 정의(태그)를 내려 작성할 수 있는 것이 XML이다.

하지만 메타언어인 XML문서 자체는 화면표현과는 아무런 관계가 없다. XML로 작성된 데이터를 화면에 표현하려면 다른 화면 표현용 언어인 XSL(eXtensible Stylesheet Language)을 사용해야 한다.

<조선희기자 shcho@etnews.co.kr>