삼국사기, 고려사, 조선왕조실록 등 우리가 익히 들어본 우리 역사서 속에는 세계적으로 인정받을 많은 천문 기록이 실려 있다. 혜성, 유성우, 일식, 월식, 금성과 같은 천체에 대한 기록뿐 아니라 오로라, 번개, 황사 등의 다양한 기상 현상도 찾아볼 수 있다.
세종시대 장영실이 등장하는 드라마나 영화에서 보았던 간의, 혼천의, 앙부일구와 같은 천문 관측 기기는 또 얼마나 우수한가. 컴퓨터가 없던 시절에도 나뭇가지를 본뜬 계산법으로 천체 운행에 대한 정밀한 역법 기록을 남기기까지. 우리 선조들은 하늘에 관심이 많았고 이를 수많은 기록으로 남겼다. 이러한 유산들은 국내 고천문 연구뿐만 아니라 국외 천문학자들에게도 근거 문헌으로 유용하게 활용되고 있다. 2017년 과학 학술지 네이처에 외국인 저자가 발표한, 세종실록 기록을 첫 번째 폭발 근거로 활용한 신성 연구는 한국 고천문 기록의 중요성과 활용성을 보여주는 좋은 사례다.
이 많은 기록들은 한문으로 돼 있기에 고문헌을 고천문 연구에 활용하기 위해서는 번역 전문가를 써야 한다. 이는 비단 고천문만이 아니라 '온고지신'을 기반으로 하는 연구 분야가 겪는 제약 사항일 것이다. 연구자뿐만 아니라 한자 세대가 아닌 관련 학과 학생들도 고전에 쉽게 접근할 수 있는 도구가 필요하다. 기존 국내 주요 포털 사이트의 번역 서비스 '파파고'나 '카카오 아이' 그리고 해외 사이트인 구글 번역기는 한자로 이루어진 문장을 문장이 아닌 한 글자씩만 사전 데이터베이스(DB)에서 찾아주거나 한자를 기반으로 하는 중국어로 번역해준다.
이런 필요성에 따라 한국고전번역원의 연구자들과 한국천문연구원의 고천문 연구자들이 손을 잡았다. 최근에 개시한 '한문고전 자동번역' 서비스는 고문헌 속 한문을 한글로 번역해주는 인공지능(AI) 기계학습법에 따른 번역기다. 이 AI 훈장님은 아이러니하게도 가장 옛것과 최신의 정보통신기술(ICT)을 접목해 탄생했다. 한자 문화권 내 중국의 고전을 같은 한자 체계인 현대 중국어로 번역하는 것과 달리 한자와 한글은 전혀 다른 문자 체계임을 감안할 때, 이처럼 유사성이 없는 고문자를 현대 실사용 문자로 번역하게끔 시도한 것은 최초라 할 수 있다.
번역 품질은 초벌 번역 수준으로 전문가가 보았을 때 60~70% 만족도이나, 전체 원문 해독 시간을 단축시켜 준다. 실제 사용 체감은 짧은 문장일수록 정확도가 높은 편이고, 문장이 길거나 복잡한 구조이면 대략 어떤 내용인지 가늠할 수 있는 수준이다. 최근 구글 번역기가 대학원 박사 과정생이라면, 한문고전 자동번역은 유치원을 막 졸업해 이제 정식 배움의 길을 가는 수준이라 할 수 있다. 어쩌면 십수년 전 구글 번역기를 사용하며 손이 많이 가던 기억을 떠올릴 수 있을 것이다. 언젠가는 더 똑똑한 번역기가 되도록 애정을 가지고 지속적으로 학습 데이터를 넓히고 번역 모델을 개선하는 것이 필요하다.
AI라고 해서 바로 전문 번역가들을 대체할 수 있는 것은 아니다. AI 번역기가 초벌 번역을 수행한 후 실제 인력에 의한 전문가 감수를 병행한다면, 아직 번역되지 못하고 쌓여 있는 고문헌의 양을 줄이는 데 일조할 수 있다. 한문고전 자동번역 서비스는 현재 '승정원일기'와 '천문 고전' 40종을 기반으로 학습 데이터가 반영된 상태다. 바라건대 한의학, 기상학, 농학 등 온고지신을 필요로 하는 다양한 학문 분야의 동참을 기대해본다. 그로써 AI 훈장님이 넓어지고 깊어져 오래오래 활약하게 되길 바란다.
서윤경 한국천문연구원 고천문연구센터 박사 ykseo@kasi.re.kr
-
김영준 기자기사 더보기