출입명부 전산화도 '일사천리'…AI 광학문자판독(OCR) 기술 관심↑

수기문서 등 스캐닝...자동 분류
기술 정확도 높아지며 업무 효율 UP
이파피루스 '텍스트센스' 문의 쇄도
리멤버 '명함관리 앱' 비용절감 효과

게티이미지뱅크
게티이미지뱅크

인공지능(AI) 기반 광학문자판독(OCR) 기술이 전자문서 핵심 기술로 부상했다. 명함 등 인쇄물부터 출입명부 같은 수기 문서까지 전산화를 지원, 사회적 비용을 줄인다.

3일 업계에 따르면 AI OCR 솔루션에 대한 민·관 관심이 최근 크게 증가했다. 기존에 사람이 일일이 수동으로 입력하던 문서를 AI OCR 기술로 자동화하면서 정확도와 효율성이 입증됐기 때문이다.

업계 관계자는 “코로나19 사태 속 각 매장에 작성이 의무화된 출입명부는 양이 방대한 만큼 지방자치단체 인력이 일일이 컴퓨터에 입력할 수 없다”면서 “출입명부를 스캔하는 과정에서 OCR 기술이 이를 전산화하는 것”이라고 말했다.

OCR은 사람이 쓰거나 기계로 인쇄한 문자 영상을 이미지 스캐너로 획득해 기계가 읽을 수 있는 문자로 변환하는 기술이다. 당초 사람이 직접 입력하는 것과 비교해 정확도가 떨어진다는 지적이 있었으나 AI 기술에 힘입어 정확도가 높아졌다.

문의와 도입 사례가 잇따르고 있다. 이파피루스는 지난 6월 출시한 AI OCR 솔루션 '텍스트센스'에 대한 도입 문의가 쇄도하고 있다. '텍스트센스'는 딥러닝 기반 AI 기술을 적용해 대용량 문서 이미지를 해석하는 솔루션이다. 사람이 손으로 썼거나 인쇄한 이미지를 스캔해 문자 데이터로 변환한다. 핵심어 검출 기능을 통해 필요한 정보만 추출할 수 있다. 지속 학습을 통해 쓸수록 문자 인식 정확도가 향상된다. 한국어, 영어, 숫자, 특수기호를 지원하며 이미지 보정, 굴곡 보정, 문서 방향 보정, 문서 영역 자동 추출 등 문서 전처리 과정을 거쳐 문서를 자동으로 분류한다.

이파피루스 관계자는 “출시 이래 '텍스트센스'에 대한 문의와 도입이 꾸준히 늘고 있다”면서 “한 건설사에서는 기존에 보유한 공문과 거래처 코드 등에 '텍스트센스'를 적용, 데이터 추출과 통합 검색, 데이터 자동 입력에 활용하고 있다”고 말했다.

그는 “이외에도 제조사 로봇 프로세스 자동화(RPA) 용도 등으로 폭넓게 활용되고 있다”면서 “기업뿐만 아니라 공공에서도 도입 문의가 많다”고 전했다.

명함 관리 애플리케이션(앱)을 개발하는 리멤버 역시 AI OCR을 통해 정확도를 높이면서 자체 비용은 대폭 줄이는 성과를 거뒀다.

리멤버 관계자는 “창업 초기에는 인력을 대거 투입해 명함을 100% 수기로 입력할 수밖에 없었다”면서 “현재는 AI OCR 기술을 통해 명함 입력 프로세스 대부분을 자동으로 진행하고 있다”고 말했다.

리멤버는 3년 전 네이버 라인에 인수되면서 자체 데이터베이스(DB)와 네이버 OCR 기술을 접목, 고도화 과정을 거쳤다. 리멤버 DB에 들어오는 명함 가운데 동일한 명함은 일대일 매칭을 통해 입력하고, 기존에 동일한 명함이 없는 새로운 명함은 네이버 OCR 기술로 입력하는 방식이다.

AI 기술이 도입되면서 OCR 정확도가 향상, 수기 입력 비율이 전체 입력의 10% 이하로 줄어들었다. 리멤버 관계자는 “AI OCR을 통해 인건비를 비롯한 다양한 비용이 많이 줄었다”고 말했다.

오다인기자 ohdain@etnews.com