LG화학, 도큐멘트 언더스탠딩으로 문서에 갇힌 데이터 ‘구출’

LG화학 DX부문 손형기 책임
LG화학 DX부문 손형기 책임

LG화학은 석유화학, 첨단소재, 생명과학 사업 및 배터리 전문 자회사 등의 포트폴리오를 가지고 있으며, '글로벌 Top 5 화학회사'로의 도약을 목표로 하고 있다. LG화학 DX 부문은 디지털 혁신을 위해 데이터를 분석하고 모델링하는 업무, RPA 도입 등의 업무를 주도하고 있다.

사람의 업무를 자동화하는 RPA는 다양한 영역에 적용되어 있으며, 특히 AI 기술과 접목되면 그 응용이 무궁무진하다. LG화학은 2019년도부터 RPA를 도입하기 시작했다. 도입 초기에는 글로벌 원재료 시황정보를 수집하고 일일 보고서를 작성하는 업무 등을 RPA로 자동화하며 확산하기 시작했으며, 현재까지 총 350여개 업무를 자동화하고, 총 14,000시간가량을 절감했다. LG화학 DX 부문에서 AI를 담당하는 손형기 책임을 만나봤다.

- RPA 도입 후에도 문서 인식 문제로 어려움을 겪었다고 들었다.
“LG화학은 2019년부터 RPA를 도입해 안정적으로 운영하고 있었지만, 기존의 RPA로는 기술적으로 해결이 어려운 과제들이 존재했다.

2020년도에 DX팀에 교정성적서라는 다양한 종류의 이미지문서를 시스템에 입력해야 하는 업무가 주어졌다. LG화학 전지본부(분사 전)에서는 계측기 교정업체의 교정결과 성적서를 거래처들이 시스템에 직접 업로드를 했는데, 수기로 작성한 문서를 업로드해야 하기 때문에 문서 인식에 어려움이 있었고, 인적 오류가 많이 발생했다. 업체별 양식도 제각각 달랐다.

기존에 사용했던 OCR(Optical character recognition, 광학 문자 인식) 솔루션은 인식률은 높지만, 템플릿을 인식하고 익히기까지 다소 시간이 소요됐다. 업체별로 각기 다른 총 146종의 교정성적서 템플릿 이미지가 있다면, 여기에 있는 데이터를 기존 OCR로 인식할 경우 한 종을 인식하는 데에 2-3일의 시간이 소요된다. 만일 146종을 한 명이 모두 작업을 한다면, 약 14개월의 시간이 필요하게 되는 식이다.

이러한 문제를 해결하기 위해 RPA에 딥러닝 기술을 접목하기로 했다. 146개의 템플릿을 하나 하나모두 인식하는 것이 아니라 도큐멘트 언더스탠딩을 활용해서 문서를 학습시키고 유사한 샘플별로 모델링을 하기 시작했다. 빈도가 높고 샘플이 많아 샘플 수량 확보가 가능한 34종에 대해 먼저 학습을 했다. 딥러닝 기법으로 같은 종류별 샘플 문서를 30-100개 정도 가져다 두고 학습을 하면 추후에 비슷한 종류의 문서까지 무엇인지 자동으로 인식할 수 있게 됐다.

이후 146종의 문서 중 96종까지 도큐멘트 언더스탠딩을 통해 데이터 처리가 가능하게 되었다. 도큐멘트 언더스탠딩 도입 이후 14개월이 소요되던 처리 시간이 약 4개월가량으로 감소했고, 단순 계산으로는 3분의 1 이상의 업무 시간이 절감되는 성과를 얻었다.”

- 덥러닝을 이용한 문서 학습 시스템인 도큐멘트 언더스탠딩의 활용 계획은?
“LG화학은 이후 대규모의 문서의 디지털화 등에 도큐멘트 언더스탠딩을 적극 활용 예정이다. 현재는 물류팀 인보이스 인식 업무에 도큐멘트 언더스탠딩과 자동화를 확대했다.  

물류팀에서는 업체에서 등록한 물류 인보이스 이미지와 포털 내 금액 값을 하나하나 대조해서 작업을 진행해야 한다. 업체나 선사 별로 여러 개의 양식을 가지고 있기 때문에 LG화학 RPA프로젝트 팀은 데이터 준비 과정에서 인식가능한 기준을 정하고, 최대한 많은 양식을 학습해서 활용하는 방법을 추진했다.  

몇 년간의 ERP 데이터에서 인보이스를 일괄적으로 전달받아 분류작업을 진행한 후 약 29종 정도를 학습 데이터로 지정했다. 이는 전체건의 60%정도였으며, 모델링 이후에는 75%정도가 자동화 인식 가능하게 되었다. 그 외 비정형 데이터들도 담당자가 확인을 거친 후 처리할 수 있도록 프로세스를 확립했다.”

손형기 책임은 기업 내 RPA 확산을 위해 현업의 관심과 참여가 무엇보다 중요하다고 강조하며 “샘플데이터를 모으는 것부터 DX팀이 데이터 분류나 테스트를 하면서 생기는 피드백 과정에 현업이 적극 참여한다면, 이상적인 RPA와 도큐멘트 언더스탠딩 플랫폼을 만들 수 있을 것”이라고 말했다. 손 책임은 “이러한 유아이패스(UiPath)의 도큐멘트 언더스탠딩은 쉬운 사용성에 그 강점이 있다.  팀원들이 거의 동시에 100% 다 사용할 수 있을 만큼 쉽고 사용자 친화적이다”라고 덧붙였다.

향후에도 LG화학은 문서에 갇힌 데이터를 인식하여 디지털화하는 과정에 도큐멘트 언더스탠딩을 적극 확대할 계획이다.


류지영 전자신문인터넷 기자 (thankyou@etnews.com)