유니코드, XML과 충돌 우려 있다

 세계의 여러 언어들을 통합적으로 인코딩할 수 있는 유니코드가 XML 등의 인터넷 표준을 사용한 브라우저와 충돌할 수 있다는 우려가 제기됐다.

 인터넷 관련 표준 기구인 ‘월드와이드웹컨소시엄’(W3C)과 유니코드 관련 단체 ‘유니코드컨소시엄’은 최근 발표한 보고서에서 유니코드를 채택한 문서들이 XML, HTML 등을 사용한 브라우저 및 프로그램 등의 작동에 이상을 일으킬 수 있다고 경고했다.

 XML은 디지털 문서나 마크업 언어의 제작을 위해 W3C가 제정한 표준으로 XML 문서 안에 사용되는 문자들은 유니코드 표준을 따른다.

 유니코드와 XML의 충돌은 두 표준의 구성방식이 근본적으로 다르기 때문에 발생한다. 유니코드는 웹페이지의 모든 문자들에 대해 일률적으로 코드를 부여하는 반면 XML 등 웹 표준언어들은 개발자가 하나의 문자나 단어, 페이지에 보다 자유롭게 여러 속성이나 스타일을 부여할 수 있다.

 예를 들어 유니코드는 글자의 어깨나 밑부분에 붙는 ‘첨자’를 표현하기 위해 ‘호환가능한 문자’(comatibility characters)라는 별도의 숫자들을 부여한다. 반면 XML이나 HTML은 먼저 기본 문자를 사용하고 후에 이를 첨자로 변환한다.

 W3C의 마틴 두에스트 국제화 담당자는 “‘호환가능한 문자’들을 사용하는 것은 바람직한 방법이 아니다”라며 “유니코드를 XML과 함께 쓸 때엔 충돌 가능성을 유념해서 조심스럽게 사용해야 한다”고 말했다.

<한세희기자 hahn@etnews.co.kr>