번역SW 황금알 예감

요즘 국내 소프트웨어(SW)업계는 인터넷 붐을 타고 영어나 일본어로 된 문서를 컴퓨터가 한글로 자동번역해 주는 기계번역 SW의 개발과 판매에 열을 올리고 있다.

현재 국내 번역SW시장은 크게 英韓과 日韓 등 2개 분야로 나뉘어 있다. 영한번역 분야에서는 (주)언어공학연구소의 「트래니96」, 한국IBM의 「앙꼬르」, 정소프트의 「워드체인지」 등이 대표적인 제품으로 꼽힌다.

일한번역 분야에서는 유니소프트의 「오경박사」와 「바벨」, 창신컴퓨터의 「코스모 한글가나」를 비롯, 일본에서 개발한 「j, seoul/JK」 등이 있다. 최근 이들 SW는 인터넷 웹브라우저 등 온라인 환경의 문서들을 실시간으로 번역해 주는 기능을 탑재해 가고 있다. A4 크기 문서의 경우 번역 소요시간은 수십 초 정도에 불과하다.

지난해 말 인터넷 붐과 함께 본격 형성된 번역SW시장은 올해 20억원대의 미미한 수준이지만 97년에는 이보다 5백% 가량 신장된 1백억원 규모에 이를 전망이다. 또 98년에는 2백억원 수준으로 확대돼 워드프로세서, 통합슈트 등과 함께 손가락에 꼽히는 황금시장으로 부상할 것으로 점쳐지고 있다.

번역SW는 다른 분야와 달리 컴퓨터와 함께 언어구조에 대한 깊은 이해가 있어야만 개발이 가능한 것이 특징이다. 문화적 특성과 언중의 속성에 대한 이해가 포함돼야 함은 물론이다. 이런 점에서 이 시장은 국내 SW업계나 대학 또는 연구소 등이 한번쯤 도전해 볼 만한 분야로 지목되고 있다.

현재 시장을 주도하고 있는 분야는 영한번역쪽이다. 그만큼 영문 홈페이지가 압도적으로 많기 때문이다. 그러나 제품의 중심이 되는 번역 완성도나 번역률에서는 일한번역쪽이 훨씬 높다. 이는 영어에 비해 일본어가 한글 문법이나 어순에 훨씬 가깝고 한자 혼용이 많기 때문이다.

영한번역SW의 번역 완성도가 낮은 것은 영어의 문법과 어순 구조가 한글과 완전히 다르기 때문이다. 한글과 일본어는 1 대 1 번역이 가능한 데 반해 한글과 영어는 중간에 서로 다른 언어구조를 매개해 주는 필터기능이 필수적이다. 그만큼 SW개발 난이도가 높다고 할 수 있다.

일한번역 분야의 제품을 살펴보면 「오경박사」의 경우 15만 단어를 내장하고 있으며, 초당 8백자의 번역속도를 구현할 수 있다. 개발사인 유니소프트측은 일반 문서의 경우 80%, 비즈니스 계약서 등 정형화된 실용문은 95% 이상의 번역률을 실현할 수 있다고 주장하고 있다. 지난해 말 처음 개발된 이후 현재 버전 1.52가 출시돼 있다. 「오경박사」의 인터넷 버전이 「바벨」이다. 바벨은 현재 「넷스케이프 내비게이터」용이 나와 있다.

「코스모 한글가나」는 지난해 창신컴퓨터가 현대경제사회연구원과 함께 공동개발한 제품으로 일본어 사전과 함께 대규모 전문용어 사전이 내장돼 있어 특히 전문분야 번역에 유리하다. 내비게이터 등 웹브라우저 환경에서 실시간 번역이 가능하다. 창신컴퓨터가 주장하는 번역률은 일반문서나 정형화된 실용문 구분없이 95%.

영한번역 분야에서는 컴퓨터가 아닌 어학 전공자들이 개발한 「트래니96」이 최근 관심을 모으는 제품으로 부상하고 있다. 실제 이 제품을 개발한 서울대 언어공학연구소는 국문과 출신이나 불어, 중국어 등 어학 전공자들이 연구원의 대다수를 차지하고 있다. 「트래니96」은 30단어 이상의 긴 문장과 모든 웹브라우저를 실시간 지원하는 것이 특징이다. 20만 단어가 내장돼 있고 시간당 10만 단어를 번역할 수 있다. 번역률은 97%. 그러나 이는 문법적 틀이 완벽하게 갖춰진 문장에서만 가능한 수치다.

서울대 컴퓨터공학과 김영택 교수팀이 개발한 「앙꼬르」는 원래 OS/2용으로 개발됐던 것을 최근에 윈도95용으로 개량한 제품이다. 다른 제품에 없는 문장다듬기나 긴 문장 자르기 등 독특한 기능이 많다. 이 제품은 또 긴 문장을 15단어 이하로 잘라 번역함으로써 번역 완성도를 높여주고 있는 것도 특징이다. 이밖에 「앙꼬르」는 전문가사전을 내장하고 있으며, 비문법 구조의 문장을 문법에 맞는 문장으로 처리할 수 있는 기능이 있다. 이 제품의 공식적인 번역률은 공개되지 않고 있다.

〈서현진기자〉