<수요기획-뉴스&밀레니엄> Inside.. "한글"이 새롭게 태어난다

 국어정보처리 분야의 대표적인 국책 연구과제로는 문화관광부의 「21세기 세종계획」, 과학기술부의 「STEP2000계획」, 정보통신부의 「우리말 정보처리기술 개발」 등이 있다.

 이 가운데 「21세기 세종계획」은 컴퓨터 활용 및 언어학 수준에서 공통으로 필요한 언어정보 기반을 구축하며, 「STEP2000계획」은 구축된 언어정보 기초를 바탕으로 언어처리 도구 및 응용시스템을 위한 핵심기술을 개발하는 것이다. 또 정통부과제는 기계번역·정보검색 등의 언어처리 응용시스템 개발을 목표로 하고 있다.

 「21세기 세종계획」은 98년부터 2007년까지 10년 동안 국어정보화 발전단계(1998∼2000년), 국어정보화 성숙단계(2001∼2003년), 국어정보화 활성화 단계(2004∼2007년) 등 3단계에 걸쳐 진행되는 한국어 정보처리의 중장기 발전계획이다.

 주관기관은 국립국어연구원으로서 국어 기초 언어 자료베이스 구축, 표준화된 전자사전 구축, 한민족 언어 정보화, 언어정보화 관련 규격 및 도구의 체계적 정리를 목표로 하고 있다. 이 계획은 국어기초자료구축분과, 전자사전개발분과, 한민족언어정보화분과 등 3개의 분과로 진행되며 이와 별도로 전문용어센터, 국어정보화 인력양성, 비표준문자등록센터, 글꼴개발보급센터 등의 조직이 있다.

 총 연구비 35억8000만원이 소요되는 제1단계 국어정보화발전단계에서는 말뭉치 구축과 범용용례추출기 개발, 표본 전자사전 구축, 통합 표본사전 구축, 한글 맞춤법 검색시스템 개발, 남북한 언어비교사전 구축, 1만여 전문용어 데이터베이스 구축, 지능형 형태소분석기 개발, 조사·어미 표본사전 구축, 표준어 규정 검색시스템 개발 등이 진행된다.

 한국전자통신연구원(ETRI)이 주도하고 있는 「우리말 정보처리기술 개발」 과제는 지난 97년부터 2000년까지 모두 4개 분야에 걸쳐 진행되고 있다.

 우선 「실용화를 위한 한영/영한 번역시스템 개발과제」(1999∼2000년)에서는 영어뉴스 프로그램을 한국어로 볼 수 있고, 한국어뉴스 프로그램을 영어로 볼 수 있는 시스템을 개발중이다. 자동번역관련 7개 기업이 공동으로 참여하고 있다.

 「낭독체 음성 타자기 기술 개발과제」(98∼99년)에서는 우리말 낭독체 음성을 구술하고 말다듬기(퇴고)를 거쳐 문서를 생성하는 우리말 음성타자기 기술이 개발된다.

 이를 위해 우리말 형태소 5000어휘에 기반하는 고성능 구술엔진, 범용 음성 명령 인식기, 낭독체 언어처리 도구 등이 개발될 예정이다.

 「내용기반 멀티미디어 정보검색 기술 개발사업」(97∼99년)에서는 멀티미디어 데이터입력 모듈을 비롯해 주석 정보 색인, 주석기반 정보 검색, 특징 정보 색인, 특징 기반 검색, 멀티미디어 데이터 질의·출력 등의 모듈 및 다국어 정보 검색용 전자 사전 등이 개발된다.

 한편 「STEP2000계획」에서 국어정보처리기술과 관련한 부문은 중과제인 「국어 정보처리 기술개발(1997.12∼2000.9)」이다. 이 과제는 지난 97년부터 ETRI가 주관기관이 돼 협동연구기관인 협동한국과학기술원 전문용어언어공학연구센터(KORTERM)와 함께 개발 진행중이다.

 「국어 정보처리 기술개발」 과제의 목표는 한국어 구문·의미 해석을 위한 우리말 개념망 구축, 대용량 국어정보 심층처리 및 품질 관리 기술 개발(KORTERM 담당), 언어처리 기술 응용 문서처리 소프트웨어 개발 등.

 연구 1차연도인 지난해에는 △우리말 개념망 구축, 워크벤치 개발 △문장분석·생성용 전자사전 개발·관리시스템 확장판, 전문용어사전 개발과제 및 전자사전관리시스템, 국어정보처리 품질관리시스템 △구조화 문서 정보교환 및 제시 소프트웨어 개발, 지능형 퇴고 시스템 개발 등이 수행됐다.



온기홍기자