조선왕조실록도 AI로 자동번역...고전문헌 활용 높인다

시스트란인터내셔널의 직원들이 AI 기계 번역 솔루션을 시연하고 있다. 전자신문DB
시스트란인터내셔널의 직원들이 AI 기계 번역 솔루션을 시연하고 있다. 전자신문DB

정부가 조선왕조실록 고전문헌 번역에 인공지능(AI) 적용 검토에 착수했다. 기존 조선왕조실록 번역문은 상당부분 수정·보완이 필요하다. 승정원일기 적용 모델을 고도화해 조선왕조실록 번역 모델을 만든다.

한국고전번역원은 연내 승정원일기 자동번역 모델을 고도화하고 조선왕조실록 적용 여부를 판단한다고 16일 밝혔다. 사람이 번역하면 수십년 걸리는 시간을 AI로 단축한다. 고전번역 성과물을 빠르게 제공, 한국학 연구 활성화와 고전 소재 다양한 한류 창작산업에 기여한다.

번역원은 지난해 인공신경망 기계번역(NMT:Neural Machine Translation) 기술을 고전 문헌 번역에 활용한 'AI 기반 고전문헌 자동번역시스템'을 구축했다. 시스트란 인터내셔널은 NMT 기술을 활용, 번역원이 제공한 승정원일기 번역본과 원문 간 연관 패턴을 찾아내 모델을 구축했다.

시스템은 아직 초벌 번역 단계 수준이다. 번역원은 지난해 구축한 영조대 35만건 코퍼스(말뭉치)에 인조대와 고종대 코퍼스를 추가해 번역 품질을 높일 계획이다.

AI 기반 자동번역 대상을 조선왕조실록으로 확대하는 방안을 검토한다. 승정원일기 자동번역 모델 생성 성과 바탕으로 조선왕조실록 대상 자동번역 모델을 구축한다. 조선왕조실록 전 왕대(태조∼철종) 대상으로 조선왕조실록 말뭉치를 구축한다. 주제별 코퍼스를 확보, 기존 번역에서 해소하지 못한 부분을 자동번역한다.

고전문헌 번역기간 단축 필요성은 꾸준히 제기됐다. 현재 예산과 인력으로 번역하면 완역까지 수십년 이상 소요된다. 2012년 시작한 조선왕조실록 현대화 작업은 아직 10%가량밖에 달성하지 못했다. 총 574권 가운데 6년간 62권을 분석했다. 이 속도면 100% 달성까지 40년 이상 걸린다. 승정원일기도 1994년부터 번역을 시작했지만 진척률이 20%에 불과하다. 총 2386권 가운데 해마다 40∼50권가량 번역한다. 완역까지 41년 걸린다.

번역원은 AI 기반 고전문헌 자동번역시스템이 고전 완역 시간을 절반으로 낮출 것이라 기대한다. 승정원일기 번역은 1차 번역수준 자동번역시스템이 완성되면 사업기간을 20년 단축하고 예산 320억원을 절감할 것으로 내다봤다.

연구자와 일반인 고전 활용이 활발해진다. 번역원에 따르면 고전문헌 번역 성과물 정보이용률은 연평균 2200만건이다. 해외 이용자수가 연평균 31%로 지속 증가한다. 번역원 관계자는 “한국학 연구 기반으로 활용되던 고전이 드라마·영화·웹툰 등 문화 콘텐츠 분야에서 활발히 사용된다”면서 “빠른 시일 내 번역본이 제공되면 학계뿐 아니라 대중, 콘텐츠 산업 등 다양한 분야에서 활용도가 높아질 것”이라고 말했다.

AI 기반 고전 자동번역 시스템 완성으로 언어지능 관련 시장에서도 경쟁력을 확보한다.

번역원 관계자는 “고전번역 영역에 딥러닝 기반 인공신경망 자동번역 모델을 만드는 것이다”면서 “중국, 일본, 베트남 등 한자문화권에 산적한 한문고전 현대어 번역에 새로운 방향을 제기하게 될 것”이라고 말했다.


[표]주요 고전문헌 번역 진척 상황, 출처: 한국고전번역원

조선왕조실록도 AI로 자동번역...고전문헌 활용 높인다


[전자신문 CIOBIZ]김지선기자 river@etnews.com