문자인식

발행일 : 1994-09-09 17:43

소프트 웨어의 발전은 인간의 독특한 기능인 문자인식을 컴퓨터를 통하여 구현하는 단계로까지 확장되고 있다.

최근들어 키보드를 대신하여 태블렛이나 스캐너를 이용한 문자인식에 관한 연구가 활발하게 진행되고 있다. 인간은 시각적인 인터페이스를 통하여 문자 정보를 접하게 되며 그 정보는 두뇌를 통하여 무슨 글자인지를 판정한다. 이러한 능력은 인간 두뇌의 학습을 기반으로 한다.

문자나숫자의 인식은 패턴인식의 부분집합으로서 주어진 입력패턴으로 부터 의 특징추출을 통하여 이루어진다. 문자를 인식하는 방법으로는 원형비교 방법 구조적 방법, 그리 비교적 최근들어 이용되기 시작한 신경망에 의한 방법 등이 있다. 그중에서 신경망을 이용한 기법은 학습능력의 덕택으로 가변 적인 입력에 대해서도 상당히 정확한 인식을 가능하게 한다.

문자인식은 대상 문자가 인쇄된 것이냐, 필기된 것이냐에 따라 인쇄체 문자 인식과 필기체 문자인식으로 분류되며, 필기체 문자인식은 다시 문자 영상 정보를 얻는 방법에 따라 온라인 인식과 오프라인 인식으로 나누어진다.

온라인필기체 인식은 사람이 종이위에 펜을 이용하여 글씨를 쓰는 것처럼태블릿 Tablet 이라고 하는 장치위에 철필(Stylus)로 글씨를 쓰는 동안 입력 되는 글씨 획의 위치 및 순서 정보를 이용하여 인식하게 되는 것으로서, 최근에 키보드가 없이도 작동하는 펜 컴퓨터를 개발하기 위해 많이 연구 되고있다. 오프라인 필기체 인식은 종이위에 씌여진 문자 영상을 스캐너나 카메라와 같은 영상 입력장치로 입력하여 인식하게 되는데, 주로 전표의 자동입력용으로많이 쓰인다. 오프라인 인식은 미리 씌여진 글씨를 대상으로 하기 때문에 제한된 정보로 인하여 제대로 인식하지 못할 확률이 높다.

인쇄체문자인식의 경우에는 폰트(font)에 따라 다소 차이가 있으나 상업적 인 문자인식기의 경우에는 98% 이상의 성능을 자랑한다. 특히 지난 10년간 저가격의 영상 스캐너의 보급과 더불어 인쇄체 문자인식에 대한 연구가 꾸준히 진행되고 있는데, 최근 2~3년사이에 스캐너의 가격이 현격히 떨어 졌으며보다 고성능의 스캐너가 출현함에 따라 문자인식을 위한 대중화의 기반이 확충되고 있다.

문자를정확하게 인식하기 위해서는 여러 단계의 처리과정이 필요하다. 우선문자가 스캐너를 통하여 입력되었을 때는 문서영상이 되는데 전처리(Prepro cessing)과정을 거친 후에는 문자영상이 된다. 이것은 문자인식 단계를 거쳐 텍스트 파일이 되며 후처리를 통하여 문자인식이 완료된다.

전처리단계는 형태분석 알고리즘을 적용하기 전에 입력 데이터에 행해 지는작업으로서 문자의 분리, 획 정리, 잡음의 제거, 정규화 등의 단계를 말한다. 특히 잡음제거 단계에서는 입력장치의 오류나 깨끗하지 못한 부분들을 제거하게 된다 . 특히 온라인 문자인식에 있어서는 특징의 분석, 획의 코드화, 곡선의 정합, 합성에 의한 분석 등의 방법이 사용된다.

아직까지문자인식의 상업적인 기반이 그리 넓지는 못하나 문자를 인식할 수있는 상업적인 제품들이 몇개 시판되고 있다. 필자의 기억에 의하면 삼흥 시스템 인식기술, 핸디소프트 등의 회사에서 스캐너를 통하여 입력된 문자를 빠른 속도로 인식할 수 있다고 하는데 인쇄된 폰트의 경우에는 99% 정도의정확도로 인식할 수 있다고 한다. 개인용 컴퓨터에 연결되는 소프트 웨어인경우에는 가격도 50만원대 이내인 것으로 알려져 있다. 따라서 많은 문서들 을 컴퓨터에 입력시켜야 하는 경우에는 문자인식용 소프트웨어의 구입이 훨씬 경제적일 것이다.

문자인식을통한 응용 분야 중의 하나는 정보를 자동적으로 구축하는 자동적 인 데이터베이스의 구축을 들수 있다. 요즈음과 같은 정보화 시대에 매일 수십권씩 쏟아져 나오는 책을 비롯한 수많은 문서들을 문자인식을 통하여 자동 적으로 인식할 수 있다면 사람이 컴퓨터에다 일일이 입력시키는데 드는 막대 한 시간과 인력을 절약할 수 있을 것이다.