"유니코드"설명회 지상중계

전세계 주요 컴퓨터회사들이 업계표준으로 규정한 만국공통 문자코드 "유니코드" 설명회가 본사 주최로 16일 서울 롯데호텔에서 열렸다. 주제는 지난8월 스위스 국제표준화기구(ISO)가 국제문자부호계(UCS)로 받아들인 최신 "유니코드2.0"과 이를 토대로 지난해 12월7일 공업진흥청이 확정한 "KSC 5700"에 관한 내용이었다. 주요내용을 소개한다.

<편집자주>

<>"유니코드2.0"의 개요(어스무스 프라이택박사/유니코드 컨소시엄)

유니코드 컨소시엄은 91년 만국공통의 문자코드를 제정, 보급하기 위해 창설됐으며 현재 북미.유럽.아시아 등에서 45개 주요기업이 참여하고 있다. 최근 "유니코드2.0"을 출판했으며 국가 단위의 국제기구인 ISO와 공동표준규격 마련 및 개발자 기술지원서비스를 병행하고 있다.

"유니코드2.0"에는 모두 6만5천5백36자(OXOOOO~OXFFFF)의 코드영역이있는데 이 가운데 3만8천8백85자는 주요 국가언어 구현용으로 이미 할당돼있고6천4백자는 사용자 정의 영역(Private Use Area)으로, 2만2백49자는 향후새로 추가될 언어영역(Future Use Area)으로 각각 비워두고 있다. 현재할당된 주요 언어는 아스키(미국표준정보교환코드).그리스어.라틴어.시릴문자.히브리어.타이어.기호문자(Symbols).함수문자(Punctuation).아랍어.가나.

자모(Hangul Jamo).CJK(중.일.한 공통한자)영역.표의문자(한자).한글(HangulSyllables).대용문자(Surrogates) 등이다.

코드할당비율을 보면 한자가 39.89%(2만9백2자)로 가장 많고 그 다음이한글 17.04%(1만1천1백72자), 아스키 및 기호문자 10.39%(6천8백11자)등의순이다.

"유니코드2.0"의 설계원리는 16비트코드를 기본으로 모든 언어의 완전코드화와 코드체계 단일화, 코드의 등가성, 코드간 호환성 등이다.

<>"유니코드"와 서체(이재훈이사/한양시스템)

서체(Font) 제작시 고려돼야할 "유니코드"의 특징으로는 새롭게 개정된코드매핑, 한글 1만1천1백72자의 지원, 다국어서체 호환가능성 등이다.

"한글윈도우95"에서 구현되는 서체는 기존의 트루타입(TTF)과 유니코드규격, 1만1천1백72자의 한글 등이 고려돼야 할 것이다. "한글윈도우95"에서 사용되는 글자수는 영문 1백28자, 기호문자 9백86자, 한글 1만1천1백72자, 한자4천8백88자 등 총 1만7천1백74자나 된다.

현재 한글문자코드로는 기존의 완성형과 조합형 및 "유니코드2.0"기반의 "KSC 5700"등이 있다. 서체의 글리프(Glyph)구성방식으로는 완성자형(Simple), 자소조합형(Composite)등이 있다. 바람직한 한글서체를 개발하기 위해서는서체품질의 향상과 기하급수적으로 증가하는 글리프 데이터의 양을 억제하는방안 등이 강구돼야할 것이다.

"유니코드"용 한글서체 개발시 선결해야 할 문제들로는 "KSC 5700"의 경우자모 및 고어부문의 구현을 비롯, 고어의 자소조합문제 해결과 자소축소분야의 중복부문 제거, 글리프 데이터의 최소화, 한자의 자소조합형화 등이다.

일본의 리코사와 대만의 다이나랩사의 문제해결방법은 좋은 예가 될 것이다.

<>"유니코드"와 "KSC 5700"(강태진이사/한글과컴퓨터)

한글코드는 74년 7비트코드와 8비트 보조코드로 된 "KSC-5601-1974"로 처음제정됐고 82년에는 74년 버전에 16비트 보조코드를 포함시킨 "KSC-5601-1982"가 나왔다. 이어 87년에는 16비트코드를 준수(ISO 2022)하는 완성형 2천3백50자의 "KSC 5601-1987"이 제정됐다. 이 코드는 89년 개정에 이어 92년조합형을 수용하는 "KSC5601-1992"로 발전됐다.

유니코드와 한글코드의 관계를 보면 유니코드 컨소시엄이 91년 "유니코드1.0"을 제정했을 때 우리나라는 여기에 "KSC 5601"의 2천3백50자와 낱자(자모) 94자를 포함시켰다. 93년에는 ISO가 유니코드를 기반으로 "ISO 10646I"을제정했고 우리나라는 완성형자 6천6백56자와 자모 2백40자(일명 첫가끝)를포함시켰다.

95년 미국 실리콘밸리에서 있었던 유니코드 컨소시엄회의에서는 개정되는"유니코드2.0"에 한글완성형 1만1천1백72자를 포함시켰고 이어 8월 스위스 ISO회의에서 이 안이 통과돼 국제문자부호계로 채택됐다.

"유니코드2.0"과 국제문자부호계에 채택된 한글 1만1천1백72자는 모든 현대한글을 표현할수 있고 자소분리가 쉽다는 특징을 가지고 있다. 그러나 미완성 형태의 한글음절 표현이 어렵다는 단점이 있다.

<서현진기자>