문자인식의 현황

"서당개 3년이면 풍월을 읊을 수 있다"는 말이 있다. 이 말은 일정한 장소에 서 반복적으로 들음으로써 글귀를 익힐 수 있다는 가설적인 표현일 것이다.

그러면서당개 10년에 글씨를 익힐 수 있을까? 문자인식에 있어서 우리나라 사람들의 주된 관심은 한글의 인식이다. 한글은 우리 민족 고유의 문자로 세계적인 문자로서 전혀 손색이 없으며 따라서 한글은 우리민족의 우수성을 보여주는 상징으로도 여겨지고 있다.

우리모두가 주지하고 있듯이 한글문자는 14개의 기본자음과 10개의 기본 모음이 모아쓰기 규칙에 따라 조합되어 구성되므로, 비록 기본자소의 개수는 24개이나 문자인식의 기본단위인 문자의 종류는 1만4천개에 달하고 실생활에 주로 이용되는 문자의 수는 1천2백여 글자이다.

한글은 자음과 모음의 조합으로 이루어지는 입체적인 구조를 가지므로 모든 소리를 표현할 수 있으나 인식면에 있어서는 영문자보다 더 어렵다. 영문자 의 경우에는 일차적인 직선 배열로 조합되며 한 자모가 한 문자인데 비하여 , 한글은 이차원적 배열로 조합되고 여러개의 자모로 이루어져 있기 때문에낱자의 분리가 어렵고 변화될 경우의 수가 매우 많으므로 인식 하기가 훨씬어렵다. 또한 자소가 끝나는 점, 굴곡점, 끊어지는 점, 필기체에서 자주 발생하는 교차점들은 자소 인식을 위한 중요한 특징이 되는데 한글에서는 이것의 처리에 어려움이 있다.

국내의 한글 문자인식은 온라인과 오프라인으로 나눌수 있는데 오프라인의 경우를 먼저 고찰해 보자. 적용 방법론으로는 신경망이 많이 쓰였는데 백프로퍼게이션 모델을 기반으로 한 모델을 위주로 연구되었다. 또한 고양이의 눈의 원리를 적용하였다는 네오코그니트론 모델을 기반으로 하였는데, 가장 두드러진 특징으로는 상당한 정도로 왜곡되거나 크기나 위치가 변하여도 어느 정도 제대로 인식하는 능력을 가진 신경망 모델이라는 점이다. 그러나 문자인식에 시간이 오래 걸린다는 단점이 있다.

그외에도 쿨롱 에너지를 이용한다던가 계층적인 구조로 변화 한다던가 또는자음과 모음을 분리하여 인식하고 그것을 통합하는 등의 신경망 기법을 이용한 것이 주류를 이루고 있다. 그러나 이들 연구의 인식률은 70% 에서 95% 정도로 아직도 개선의 여지가 많다. 더군다나 실험에 쓰인 샘플 데이터의 갯수가 너무 적기때문에 일반적인 문자에 대한 인식률은 그보다 훨씬 떨어진다온라인 한글 문자인식의 경우에는 인식률이 오프라인의 경우보다 훨씬 높다. 주된 이유로는 온라인의 경우에는 입력되는 문자의 획의 순서강도 등 동적 인 정보를 이용할 수 있기 때문이다. 이러한 방법은 입체적인 구조를 가지는한글을 보다 정확하게 인식할 수 있게 한다.

미국의경우에는 문자와 숫자를 인식하는 시스템의 상업화가 몇년전 부터 이루어지고 있다. 숫자인식의 경우에는 신경망 이론을 적용한 필기체 우편번호 를 인식하는 시스템이 개발되어 우편물을 자동적으로 분류할 수 있는 체계가 확립되었다. 여기에 쓰인 데이터베이스는 미국 버펄로시의 우체국을 거쳐간 손으로 쓴 9천2백98개의 우편번호인데 99%에 달하는 상당히 정확한 인식률 을 나타내었다.

미국의Nester Wr-iter사가 개발한 문자인식시스템은 개인용 컴퓨터에서 작동하는데 제한없는 필기체 문자를 인식할 수 있는 소프트웨어이다. 인식대상 은 영어의 알파벳, 숫자, 유럽문자, 그리스 문자 등인데 실시간 인식이 가능하다. 이것을 일본어에 적용시켰을 경우에는 간지, 히라가와, 가타가나 등에95%정도의 인식률을 보였다.

필기체문자인식에서 인식률을 직접 대비하는 것은 생각보다는 의미가 적다. 서로 다른 데이터베이스를 사용하기 때문에 직접적인 비교가 불가능 하고 또한 각 시스템마다 고유의 장점을 가지고 있기 때문이다.

보다정확한 문자인식을 위한 노력은 지속되고 있다. 그러나 99% 이상의 인식률은 불가능할 지도 모른다. 그 이유는 어차피 인간도 1백%인식이 불가능 하기 때문이다.