네이버 'AI 번역모델'로 코로나 국제 연구 공조

네이버파파고팀·네이버랩스유럽 연구진 개발
일반 번역 넘어 생물·의학 데이터 특화
한국어·불어 등 5개국어→영어로 전환
오픈소스 공유사이트 '깃허브'에 공개

나일라 머리(Naila Murray) 네이버랩스유럽 랩 디렉터가 네이버 AI 기술을 설명하고 있다. 사진=네이버
나일라 머리(Naila Murray) 네이버랩스유럽 랩 디렉터가 네이버 AI 기술을 설명하고 있다. 사진=네이버

네이버 소속 한국과 프랑스 인공지능(AI) 연구진이 생물·의학 정보에 특화한 기계번역(컴퓨터 활용 번역) 모델을 만들었다. 세계 각국이 코로나19 관련 문서와 연구 결과물을 손쉽게 주고받으며 공조하는 발판이 마련됐다.

네이버랩스유럽과 네이버 파파고팀은 코로나19 관련 정보를 정확하게 번역하는 AI 번역 모델을 개발했다. 기존 AI 모델로는 어렵던 생물·의학 분야의 텍스트 번역이 가능해진 것이다. 전문지식이 풍부하고 여러 언어에 능통한 의료인 집단이 코로나19 정보를 번역하는 셈이다.

네이버랩스유럽은 이달부터 해당 모델을 오픈소스 공유사이트 깃허브에 공개하고 사용자 접수를 받는다.

네이버 관계자는 10일 “한국과 프랑스 연구진이 지난해부터 일상언어 AI 번역 기술을 전문 분야 번역으로 고도화하는 작업을 시작했다”면서 “올해 초 코로나19가 확산하며 생물·의학 분야에 해당 모델을 적용한 결과 유의미한 결과를 거뒀다”고 설명했다. 코로나19와 관련된 생물·의학 정보가 정확하고 빠르게 전달되는 데 기여할 것으로 기대된다.

네이버는 해당 기술을 '최첨단 다국어 다중 도메인 인공신경망 기계번역 모델'이라고 소개했다. 한국어, 프랑스어, 독일어, 이탈리아어, 스페인어 등 5개 언어를 영어로 번역할 수 있다. 생물·의학 데이터에 특화한 점이 특징이다.

단일 AI 모델로 여러 언어의 번역이 가능하다. 일반적인 AI 번역은 언어에 따라 여러 AI 모델을 별도로 관리하고 학습시켜야 한다. 네이버랩스유럽과 파파고가 만든 번역기는 단일 AI 모델로 5개 언어를 영어로 바꿀 수 있어 저장 용이성과 안정성을 높였다.

양국 연구진은 생물·의학 분야 빅데이터에 '메디카'라는 태그를 적용해 AI를 학습시켰다. 쉽게 말해서 AI에 생물학·의학 용어와 배경 지식을 가르친 것이다.

네이버 관계자는 “설정을 통해서 일반 번역을 하거나 생물·의학 도메인 태그를 선택해서 전문 분야 번역을 할 수도 있다”면서 “도메인 태그 사용 여부에 따라 같은 문장도 다르게 번역한다”고 말했다.

번역 품질은 현재 성능이 가장 좋은 것으로 평가받고 있는 '이중언어모델'과 유사한 수준이다. 한국어와 이탈리아어처럼 영어에 비해 데이터가 적은 언어 번역에 유용하다.

네이버는 이번 연구가 전문 분야 AI 번역을 진일보시켰다는 의미가 있다고 평가했다. 일반적으로 사용되는 번역 모델은 생물·의학 분야 등 전문 분야 용어의 정확한 번역에 한계가 있다.

네이버랩스유럽은 글로벌 4대 AI 연구소 가운데 한 곳이다. 네이버가 2017년에 인수했다. 프랑스에서 AI를 비롯한 컴퓨터 3차원(3D) 비전, 자연어 처리 등 첨단 기술 분야를 연구하고 있다. 네이버는 지난해 프랑스, 한국, 일본, 베트남을 거점으로 하는 '글로벌 AI 연구벨트' 구상을 공개했다. 구글 등 미국을 중심으로 한 대형 기업과 첨단 기술 분야에서 경쟁하겠다는 의도다.

신중휘 파파고 리더는 “인류가 코로나19라는 단일 주제로 장기간 이야기하는 유례 없는 상황”이라면서 “언어 차를 넘어 원활히 소통할 수 있도록 해당 모델을 개발했다”고 말했다.

신 리더는 “현재 쌓여 가는 코로나19 관련 데이터가 향후 경제, 위기관리, 공중보건 등 다양한 분야에 대한 연구 활동에 활용될 것으로 기대한다”고 덧붙였다.

김시소기자 siso@etnews.com