[AI 사피엔스 시대]그림에서 문자를 판독...AI 핵심 기술 OCR

빛을 이용해 문자를 판독하는 광학 문자 인식(OCR) 기술이 인공 지능(AI) 핵심 기술로 떠올랐다. OCR는 AI 기술 중 '컴퓨터 비전 기술'의 일종이다. 지금껏 사람이 직접 문자를 보고 디지털 방식으로 입력했던 단순하고 반복적인 업무를 AI가 대신하는 기술이다. 정확도와 속도를 올리는 게 관건이다.

OCR 기술은 책이나 잡지, 신문 등 기존 인쇄 자료 속 문자, 기호 등을 빛에 비춰 반사 광선을 전기 신호로 변환해 컴퓨터에 입력하는 원리로 작동한다. OCR 기술은 스스로 글자 영역과 그림 영역을 구분한다. 편집이 가능한 형태로 바꿔주는 자동 입력 시스템이다. 번역 등으로 응용되기도 한다.

OCR는 문자 위치를 찾는 검출 기술과 문자가 무엇인지 알아내는 인식 기술 등으로 나눠진다. 문자 자동 입력 시스템은 지금까지 많은 기술이 도전해 온 분야다. 최근에는 기술이 발전해 단순 문자 인식뿐만 아니라 사진, 동영상 속의 문자까지 인식하는 방향으로 진화했다.

복잡한 문서, 그림 등을 분석하고 인식하는 건 여전히 기술적 과제다. 어떠한 환경에서도 문자를 찾아내고 분석해야 한다. 이를 보완한 기술로 딥러닝 기반 OCR가 주목받는다.

게티이미지
게티이미지

특히 한글은 가장 큰 도전 과제 중 하나로 거론된다. 한글은 자음과 모음의 조합으로 이뤄졌다. 조합 가능한 글자 수는 1만개가 훌쩍 넘는다. 필기체 문자라면 변이가 상당해 인식률이 크게 떨어진다. 수많은 변이 속에서도 규칙을 찾고 정확하게 문자를 인식해 내는 게 최근 OCR 기술 화두다. AI 기술을 이용해 한층 진화한 OCR 기술은 문맥 정보를 통해 기존 오류를 정정하기도 한다.

OCR 기술이 각광받으면서 많은 기업이 이 분야에 관심을 갖는다. 네이버 클라우드 자회사 네이버비즈니스플랫폼(NBP)은 문자 판독 사업 파트너사를 모집했다. 삼성리서치에서도 OCR 기술 고도화를 위해 연구개발을 이어왔다. 신세계는 이마트 앱 '쓱렌즈'를 선보였다. 쓱렌즈를 이미지에 갖다 대면 브랜드명을 인식해서 상품을 검색해주는 서비스로 OCR 기술이 활용됐다.

시장 조사업체 그랜드뷰 리서치에 따르면 2025년까지 글로벌 OCR 시장은 13억3800만달러 규모로 성장할 전망이다. 2019년에서 2025년 사이 연평균 13.7%의 성장률을 보일 것으로 예측된다. OCR 관련 신생 기업에 대한 투자가 증가하고 다양한 산업에서 OCR 기술 채택 비중이 높아지며 시장 성장을 이끌 것이란 관측이 나온다.

업계 관계자는 “OCR 기술은 업무 효율성을 극대화하는 기술로 부상해 많은 기업이 관심을 보인다”면서 “정확성을 높이면서 시간을 단축하는 게 기술 핵심”이라고 말했다.

박소라기자 srpark@etnews.com