<수요기획-뉴스&밀레니엄> History.. 국어정보처리 연구 발자취

 지난 80년대 초 시작돼 계속 진행중인 국어정보처리기술(자연어처리기술) 연구는 시대순으로 5단계로 나눠 살펴볼 수 있다.

 80년대 초에서 중반까지는 우리나라에 국어정보처리기술 개념이 도입된 시기로 분류할 수 있다. 연구는 80년대 초 한국과학기술원(KAIST)·서울대·인하대 등 대학을 중심으로 시작됐다. 그러나 당시 연구는 자연어처리 자체보다는 인공지능의 한 분야라는 성격이 강했다.

 80년대 중반에서 후반까지는 외국의 기술을 도입, 모방하던 시기였다. 86년 시스템공학센터(SERI)가 일본의 후지쯔와 함께 한일 기계번역 과제를 수행하면서 연구·개발이 활성화하기 시작했다. 또 한국전자통신연구원(ETRI)·SERI·KAIST·서울대 등 대학과 출연연구소를 비롯, 삼성전자 등 민간기업들이 한영/영한 기계번역 시스템을 개발하는 과제를 수행했다.

 90년대 초반에서 중반까지 말뭉치(Corpus)에 대한 연구가 집중됐다. 이 시기에는 또한 한국어 말뭉치 구축에 대한 논의도 시작됐다. 그러나 말뭉치 구축은 실질적으로 90년대 중반부터 시작됐다. 94년경부터는 일한 자동번역 제품들이 쏟아져 나와 5∼6개의 제품이 출시되기도 했다.

 90년대 중반에서 지난해까지는 전산학자와 국어학자들간의 공동연구를 모색하던 시기로 분류된다. 또한 10여개의 벤처기업들이 기계번역 등 언어처리 시장에 뛰어들었으나 기술의 난이도를 극복하지는 못했다.

 올해부터는 ETRI 등에서 그동안의 연구결과를 토대로 한영/영한 자동번역 등의 실용화 과제 수행에 돌입함으로써 새로운 국면을 맞고 있다. 학계에서도 한중/중한 자동번역 시스템을 개발중이다. 현재 이 분야에는 국책연구소에서 40여명의 연구원을 비롯, 대학교수 40여명, 5∼6개의 벤처기업, 그리고 소규모의 그룹을 가진 1∼2개 대기업들이 참여하고 있다.

온기홍기자