에버트란이 외국어 번역 시간을 줄이고 품질을 높이기 위해 빅데이터 구축을 추진한다.
에버트란(대표 이청남)은 다국어 번역지원 소프트웨어(SW) `비주얼트란`에 쌓인 데이터베이스(DB)를 활용해 빅데이터 시스템을 만들 계획이라고 31일 밝혔다. 번역된 문장을 DB에 저장해놓은 뒤 필요할 때 불러내 쓸 수 있는 구조를 만들겠다는 것이다.
에버트란은 현재 고객별 DB를 갖고 있다. 이들 DB를 통합해 번역 시 참고자료로 쓸 수 있도록 할 방침이다. 지금까지 번역 작업은 DB 구축이 사실상 불가능했다. 고객이 주문을 맡기면 해당 문서 내 문장을 하나씩 지워가며 빈자리에 번역문을 채워 넣는 방식을 쓰기 때문이다. 그러다 보니 문서 내 유사한 문장이 등장해도 번역 작업을 새로 시작해야 했다.
반면DP 비주얼트란은 문서 종류와 무관하게 작업 도중 실시간으로 DB가 생성돼 유사한 문장에 대한 참고자료를 제공한다. 문서가 10장이라고 하면 뒤로 갈수록 작업 시간을 줄일 수 있는 것이다. 실제 삼성SDS 중국법인이 비주얼트란을 직접 사용해본 결과, 기존 방식 대비 번역 시간은 50% 줄고 품질은 30% 올라갔다.
이청남 에버트란 대표는 “번역문 DB가 없다는 것은 훌륭한 번역문이 모두 버려지고 있다는 의미”라며 “국가적 비효율을 막고 지식을 자산화하겠다는 생각으로 비주얼트란을 개발했다”고 말했다.
비주얼트란은 세계 최초로 언어자원 재활용 시스템을 도입했다. 번역 비용을 절감하고 품질을 높이기 위해서다. `한 번 번역한 문장은 다시 번역하지 않는다`는 목표로 만들어졌다. 2012년에 출시됐고 2014년과 올해 두 차례 업그레이드를 진행했다.
비주얼트란을 실행시키면 모니터 화면 좌측에는 원문이, 우측에는 번역 툴(비주얼트란 메이트)이 등장한다. 번역 툴 속에는 원문 문장이 차례로 나타나 순서대로 빈칸을 메우도록 설계됐다. 구글과 마이크로소프트 등이 갖고 있는 기계 번역기 도움을 받아 먼저 원문을 번역한 뒤 어색한 부분을 고쳐가는 방식으로 작업이 진행된다.
이때 번역 툴 하단에는 DB에 저장된 문장이 뜬다. 번역 대상 문장 대비 유사도가 얼마인지 확률로 보여준다. 이 대표는 “번역 단가는 단어별로 측정되는데 DB를 통해 같은 단어나 문장이 있을 경우 추가로 작업할 필요가 없기 때문에 비용이 절감된다”면서 “DB 규모가 커질수록 번역 비용과 시간이 줄일 수 있다”고 말했다.
최종희기자 choijh@etnews.com