<전자정보통신 연구계를 움직이는 사람들>(28)언어정보처리

 

 ‘컴퓨터와 인간 사이의 언어 소통 통로를 개척한다.’

 언어정보처리 산업은 컴퓨터가 사람의 일상언어를 이해하고 생성할 수 있도록 함으로써 인간의 지적 활동의 보조자 및 지원도구로 활용하고자 하는 산업이다.

 언어정보산업은 기술적인 특성에 따라 언어처리 기반 기술과 응용기술로 구분할 수 있다. 우선 언어처리 기반 기술은 입력된 텍스트의 형태, 구문, 의미, 구조 등을 자동 추출하거나 문장을 생성하는 기술을 말하며 언어정보처리 응용기술은 이를 기반으로 한 정보검색, 자동번역, 텍스트마이닝 기술 등을 포함한다.

 우리말 정보처리 기술을 다루는 언어정보처리 산업 분야는 단순히 기술 개발뿐만 아니라 우리 문화, 의식과 관련된 국내 정보유통의 핵심 기술이라는 점에서 중요성이 부각된다.

 현재까지 국내 언어정보처리 산업 분야는 아직까지도 실험적인 단계에 머물러 있다고 연구계 관계자들은 평가하고 있으나 국내 자동번역 엔진의 수준은 세계 최고 수준인 일본에 비해 1∼2년 정도 기술 격차를 보이고 있을 뿐이다. 연구계에서는 조만간 이같은 차이를 해소할 것으로 내다보고 있다.

 또 인터넷의 발달로 인해 정보가 폭증하면서 인터넷 검색, 웹을 통한 다국어 번역, 텍스트 관리 등의 중요성이 커짐에 따라 국내 언어정보처리 산업은 지속적인 발전을 거듭할 것으로 기대된다.

 국내 언어정보처리 산업 중에서도 특히 자동기계번역 분야의 역사는 지난 84년 한국전자통신연구원(이하 ETRI)이 국책과제로 일본과 공동으로 개발한 일한 번역기로부터 비롯됐다.

 당시 ETRI 담당 부장을 지냈던 박동인 소장은 현재 언어정보처리 산업 분야에 몸담고 있지 않지만 초기 연구계를 형성하는 데 공헌한 인물로 자주 거론된다.

 이 분야 연구계는 검색엔진, 음성인식처리 등 다양한 산업 분야와 맞물려 있기 때문에 박 소장과 마찬가지로 현재 직접적으로 연구 개발을 수행하고 있지 않더라도 기술 개발에 공헌한 인물이 다수다.

 현재 언어정보처리 연구계는 대학 교수직과 언어처리 솔루션 전문기업 대표를 겸임하고 있는 인물과 ETRI 휴먼정보처리연구부 인맥, 각 기업 연구소장 등이 기술 발전을 견인하고 있다. 또한 지난해 4월 한국소프트웨어산업협회 내에 설립된 언어정보산업협의회(위원장 김영택)에는 자동기계번역 전문업체, 검색엔진 업체, ETRI 등 40여개 업체 및 연구기관이 참여해 활발한 정보 교류 및 공동 연구 작업 등을 수행하고 있다.

 우선 자동 번역 기술을 주축으로 한 이 부문 연구 작업이 초창기부터 서울대, 포항공대 등을 비롯해 각 대학의 언어정보처리 관련 연구소에서 활발히 이루어졌다는 점을 감안할 때 교수와 기업 대표를 겸임하고 있는 연구 인력들이 두드러지는 것은 자연스러운 일이다.

 이같은 사례에 해당되는 인물 중에 서울대학교 컴퓨터공학부 명예교수인 김영택 교수(67)는 단연 자동기계번역 기술 개발 분야의 원로이자 거두로 꼽힌다. 63년 미 콜로라도대 전기공학과를 졸업하고 서울대 전자계산소장, 한국정보과학회장, 한국인지과학회장 등을 두루 거친 김 교수는 98년 서울대 내에 기계번역 솔루션 벤처기업인 엘엔텍을 창립했다.

 김 교수는 서울대 자연언어처리연구실을 통해 IBM의 연구개발 용역을 맡아 개발한 영한번역기 ‘앙꼬르’에 이어 ‘이트란’ ‘스마트란’ 등 속도와 성능이 향상된 영한 번역기 개발을 이끈 주역이다.

 국내는 물론 세계적으로도 영한 기계 번역 분야에서 최고 수준의 기술력을 자부하는 김 교수는 현재 한영 번역기 연구 작업에 또다시 착수, 고희를 바라보는 나이에도 연구 활동의 고삐를 늦추지 않고 있다. 또 언어정보산업협의회 초대 위원장직을 맡아 바쁜 와중에도 웹서버, 컴퓨터지원번역(CAT) 분야에도 뛰어들 채비를 갖추고 있다.

 나라인포테크 대표이자 부산대 정보컴퓨터공학부 교수를 지내고 있는 권혁철 교수(44)는 한국어 맞춤법/문법검사기 개발로 유명하다. 아래아한글을 비롯해 법원도서관, 중앙일보 등 10여곳에서 사용중인 맞춤법검사기는 특히 최근 한글97 최신판에 연동되도록 개발됐다.

 한국어 형태소 분석, 문장분석 등 언어처리 기반기술 개발 부문에서 탁월한 성과를 거두고 있는 권 교수는 일본IBM의 영한 기계번역 시스템 과제, ETRI가 주도한 우리말 기반기술 개발 프로젝트 등에 참여하는 등 이 분야 기술 발전에 꾸준히 기여해왔다.

 현재 차세대 인터넷 정보검색 시스템, 우리말 정보 추출 시스템 개발 등에 여념이 없는 권 교수는 향후 우리나라 사람이라면 누구나 만족할 만한 맞춤법/문법 검사기를 개발하는 것이 희망이다.

 고창수 내추럴어프로치 대표(41)는 언어정보처리 산업 분야 연구 인력으로는 거의 유일하게 고려대에서 국어학을 전공한 국문학도다. 현재 한성대 한국어문학부 교수, 고려대 민족문화연구원 기계번역 연구실 연구책임 교수를 겸임하고 있는 고 교수는 한국어 형태소 분석기, 구문 분석기, 한국어 대화 시스템 개발을 이끌어냈다.

 특히 자질연산 문법에 의한 한국어 형태소 및 구문 분석기 개발로 한국어 정보처리가 다룰 수 있는 솔루션 범위를 확대하는 데 기여한 것으로 평가받고 있다.

 내추럴어프로치에서는 자연어 처리 솔루션 개발에 주력하면서 2002정통부 산업기반 기술 사업의 일환인 ‘ED2002 영어 대화시스템’ 프로젝트에도 참여하고 있다.

 현재 일본에서 연구 중인 최기선 한국과학기술원(KAIST) 교수(46)도 KAIST 전문용어언어공학연구센터 소장으로서 언어학과 전산학의 접목에 큰 공헌을 한 인물로 주저없이 꼽힌다.

 최 교수는 특히 번역 전문용어 정립은 물론 ‘남북언어정보처리 표준화 조직’을 주도하는 등 남북한 정보기술 용어 표준화 연구 작업의 중심에 서 있는 인물로도 잘 알려져 있다.

 또 현재 정보과학회 한국어정보처리연구회와 유니소프트 연구소를 책임지고 있는 이종혁 포항공대 교수도 언어정보처리 기술 발전에 공헌한 인물 중 하나다.

 연구기관 출신 인력을 거론하면서 ETRI를 빼놓을 수 없다. ETRI에서 언어정보처리와 관련된 연구 수행의 요람은 휴먼정보처리연구부다. 휴먼정보처리연구부는 휴먼정보검색연구팀, 지식처리연구팀, 언어처리연구팀 등 3개 팀으로 세분화해 각각 정보검색, 텍스트마이닝, 형태소 분석 및 자동번역 기술 등을 중점적으로 연구하고 있다.

 휴먼정보처리연구부를 이끌고 있는 박상규 부장(44)은 서울대 컴퓨터공학과를 졸업하고 KAIST 전산학과 석·박사, 대림산업 전산실 등을 거쳐 87년부터 현재까지 ETRI에 몸담고 있다. 박 부장은 93년 지능형 에이전트 기술 연구에서부터 다국어 자동번역 기술과제, 정보검색 등 언어정보처리에 관련된 굵직굵직한 프로젝트에 고루 참여하면서 이 분야의 핵심 연구 인력으로 인정받고 있다.

 휴먼정보처리연구부 지식처리팀의 윤보현 팀장(33)은 지난해 1월부터 지식처리팀에서 텍스트마이닝 기술 연구에 집중하고 있다. 윤 팀장은 특히 단순한 정보 검색 차원을 넘어서 정보추출, 개인화 기술, 문서 분류 및 클러스터링 기술 등을 통해 새로운 지식을 발견, 추론하는 텍스트마이닝 분야를 개척하면서 정통부 과제인 ‘모바일 사용자 맞춤 정보 서비스 기술 개발’에 여념이 없다.

 언어처리연구팀을 맡고 있는 최승권 팀장(40)도 영한·한영 텍스트 자동번역 기술 개발, 우리말 정보처리 SW 기술개발 프로젝트 등에 참여했으며 현재 동양 4개국 언어에 대한 번역 메모리 기반의 통합 CAT시스템 개발을 추진하는 등 자동 번역 분야의 전문 연구 인력이다.

 과거 ETRI 출신으로 현재 업계에서 왕성한 활동을 벌이고 있는 박세영 서치캐스트 사장(46)도 언어정보처리 연구의 역사와 궤를 같이 한 인물이다.

 KAIST 전산학과 석사, 프랑스 파리7대학 전산학 박사 등을 거쳐 90년대 초부터 ETRI 지식공학연구실장, 언어정보연구실장, 자연어처리연구실장, 자연어처리연구부장 등을 지낸 박 사장은 특히 정보검색 연구 분야에서 빼놓을 수 없는 인물이다.

 박 사장은 ETRI에 몸담으면서 멀티미디어 정보검색 소프트웨어, 내용기반 멀티미디어 정보검색 기술 개발 등으로 정보 검색을 언어뿐만 아니라 멀티미디어 분야로까지 확대 적용시키는 데 공헌했다. 현재 기업에 속해있는 연구인력 중에는 이경일 시스메타 사장(32)이 눈에 띈다. 이 사장은 유니소프트 기술이사, LG중앙연구소, 현대전자연구소 등을 거쳤으며 꾸준히 일한 번역기 개발에 연구 역량을 모으고 있다.

 대학 재학 시절 94∼95년 일한번역기 ‘오경박사’, 인터넷 실시간 일한 번역기 ‘바벨’ 등의 연구에 참여했으며 지난해 PDA 탑재용 다국어 번역 기술을 개발하기도 한 젊은 인재다.

 이밖에도 채흥석 엘엔아이소프트 연구소장(38)은 95년부터 이 회사 연구소에 몸담으면서 주력 제품인 영한, 한영 기계번역기를 개발했으며 현재 ‘번역 네트워크 개발’이라는 프로젝트명으로 인간과 기계 번역을 결합한 네트워크 시스템을 개발 중이다.

 또 강명주 클릭큐 연구소장(37)도 지난 3년간 연구소를 이끌면서 최근 주목받고 있는 휴먼번역 기술인 CAT시스템을 주도적으로 개발했으며 CAT네트워크 버전, 다국어 버전을 비롯해 이를 확장한 휴먼 번역 기술 개발에 나설 예정이다.

 <김유경기자 yukyung@etnews.co.kr>