<전자정보통신 연구계를 움직이는 사람들>(20)검색엔진

 90년대 중반 웹브라우저의 등장과 함께 인터넷 서비스의 대중화가 급진전되면서 네티즌들의 발길이 가장 많이 닿았던 곳은 단연 검색사이트였다. 웹에서 내가 보고자 하는 사이트를 찾는 일은 검색사이트의 도움 없이는 불가능했기 때문이다.

 당시 가장 대중적인 검색사이트로 주목받았던 야후는 웹사이트를 일일이 검색한 뒤 적당한 디렉터리에 분류해 놓은 것만으로도 그 가치를 인정받았다. 당시에는 웹사이트의 숫자가 현재처럼 엄청나게 많지 않았으므로 좋은 사이트를 엄선해서 적당한 디렉터리로 분류해 보여주는 것만으로도 충분했기 때문이다.

 그러나 웹사이트 숫자가 해를 거듭할수록 기하급수적으로 늘어나면서 이같은 방식은 곧 한계를 드러냈다. 사용자가 찾고자 하는 사이트가 웹에는 분명히 존재함에도 불구하고 검색사이트 분류항목에는 등록되지 않는 경우가 비일비재해졌다. 이 때부터 검색엔진은 자동화·인공지능화의 길을 걷기 시작한다. 일명 검색로봇이라고도 불리는 검색엔진 기술의 시대가 본격적으로 개막된 것이다.

 검색엔진이란 웹사이트를 뒤져서 사용자가 입력한 검색어에 해당되는 사이트를 찾아오는 일종의 인공지능형 SW로 웹검색을 위해서는 필수적인 기술이다. 그러나 언어학·구조학·인공지능학·전산학 등 다양한 인접학문들이 결합돼야 하는 탓에 해당분야를 오랫동안 집중적으로 연구한 이들이 아니면 쉽사리 뛰어들기가 힘든 특성이 있다. 타 분야에 비해 연구자들의 수가 현격히 적으며 대부분이 대학이나 연구소 등에 머물지 않고 산업계에 직접 투신하고 있다는 점도 이색적이다.

 국내 검색엔진분야에서 가장 유명한 이는 이준호 숭실대 교수(38)다. 99년 이후 정보검색에 대한 연구 및 시스템 개발을 수행하는 에이아이디랩을 설립해 테크노2000프로젝트, 인포메드 등을 거쳐 지식발전소의 엠파스와 네이버의 넥서치 등 유명 웹검색사이트에 제공하면서 유명세를 탔다. 현재 서치솔루션을 공동으로 설립해 연구개발을 지원하고 있다.

 그의 검색엔진분야 개발경력은 이미 94년부터 시작됐다. 지난 94년 1월부터 3년 8개월 동안 연구개발정보센터에서 지능형 정보시스템 그룹(Group for Intelligent Information Systems)을 맡아 정보검색시스템 ‘KRISTAL-II’의 개발을 이끌었던 주역이기 때문. 그는 직접적인 연구개발 외에 정보검색과 관련된 50여편 이상의 논문을 정보검색분야의 세계 최대 국제학술회의인 ACM SIGIR 콘퍼런스 등에서 발표했다. 최근에는 정보검색·데이터베이스·정보시스템 등에 관심을 갖고 있으며 특히 정보검색모델, 문서요약, 일본어 및 중국어 검색 등을 집중적으로 연구하고 있다.

 엠파스를 운영하고 있는 지식발전소의 박석봉 사장(37)도 빼놓을 수 없다. 엠파스는 한국생산성본부가 실시하는 국가고객만족도조사(NSCI)에서 3년 연속 검색·포털부문 1위를 달리고 있는 검색사이트. 그는 90년에서 95년까지 나눔기술에 재직하며 한글 프로그래밍 언어인 씨앗과 그룹웨어인 워크플로 등을 개발했던 정통 프로그래머로 지식발전소 설립 후 야후가 장악하고 있는 웹검색서비스 시장에 과감히 도전장을 던졌다. 이준호 교수와 손잡고 엠파스 검색서비스를 선보인 데 이어 최근에는 코난테크놀로지와 엠파스XP를 성공적으로 런칭해 검색엔진분야 연구자로도 명함을 내밀었다.

 엠파스XP 공동개발로 업계에 이름을 알린 코난테크놀로지의 김영섬 사장(42)도 이 분야에서는 베테랑으로 꼽힌다. 지난 89년부터 96년까지 한국전자통신연구원(ETRI)에서 시스템연구로 시작, 94년 자동통역시스템 개발을 기점으로 대화형 음성언어번역시스템과 멀티미디어 정보검색시스템 등을 개발했다. 그리고 이를 바탕으로 지난 99년 검색엔진 전문개발업체인 코난테크놀로지를 설립했다. 현재 한·중·일·영 4개 국어를 지원하는 다국어 정보시스템과 디지털 아카이브 시스템 개발에 매진하고 있다. 이 회사 양승현 이사(35)도 ETRI에서 영한자동번역기를 개발해 상용화했으며 코난테크놀로지에 합류해 멀티미디어 정보검색시스템과 엠파스XP 개발 등에 참여했다.

 박세영 서치캐스트 사장(46)도 이 분야에서는 빠질 수 없는 인물이다. 경북대학교와 한국과학기술원 및 프랑스파리7대학을 거친 정통 학구파 출신으로 ETRI에서 지식공학연구실·언어정보연구실·자연어처리연구실을 이끌며 검색엔진 개발에 핵심적인 기초기술들을 개발했다. 특히 서치캐스트 설립 후 텍스트·자연어 검색엔진인 ‘엑스아르-서버(XR-Server)’를 개발해 인터파크·롯데닷컴·예스24 등 인터넷 쇼핑몰에 납품한 데 이어 자동질의응답시스템인 ‘오토FAQ’를 삼성증권·충북도청에, 이미지 검색엔진인 ‘서치이미지’를 용인시청·정보통신윤리위원회 등에 납품했고 동영상 검색엔진인 ‘크래프트비디오 서치’까지 개발한 바 있다. 현재 정보처리학회 한글공학연구회 부위원장과 국어정보학회 이사 및 남북 언어정보 표준위원회 감사 등을 역임하고 있다.

 윤여걸 코리아와이즈넛 창업자(31)도 언급할 만하다. 그는 국내 정통파 연구인맥은 아니지만 국내에 코리아와이즈넛을 창업해 국내에서도 연구계를 이끌고 있기 때문이다. 그는 자신이 직접 개발에 참여한 가격비교 검색엔진 마이사이몬과 웹검색엔진 와이즈넛을 미국의 시넷과 룩스마트에 각각 성공적으로 매각함으로써 벤처업계의 신화로 떠오른 인물. 마이사이몬은 검색엔진 전용 프로그래밍 언어 ‘V’의 개발 적용을 통해 종전의 가격비교 검색엔진과 질적인 차별화를 꾀했으며 와이즈넛은 1트릴리언(1조)개의 웹페이지를 검색하고 그 결과를 한 눈에 알아볼 수 있게 자동 분류해주는 기술로 웹검색 기술을 한차원 끌어올렸다는 평가를 받은 바 있다. 그는 오직 검색엔진 기술만으로 두 번의 이변을 창조함으로써 검색엔진의 가치를 세계적으로 널리 알렸다는 점에서도 높이 평가된다.

 현재 코리아와이즈넛 연구소장을 맡고 있는 박재득 박사(40)도 웹검색엔진은 물론 기업용 검색솔루션 분야에서 실력을 인정받고 있다. 그는 KAIST 전산학과에서 정보검색 기술과 관련성이 깊은 자연언어처리를 전공한 후 삼성종합기술원과 삼성전자에서 국책연구과제인 영한·한영 기계번역시스템과 국산 DBMS 엔진의 일부 기능 개발을 담당한 바 있다. 한국어 언어처리기술의 기반이 되는 대용량 고품질 표준언어자원 구축사업에 참여해 의미기반 정보검색, 기계번역, 지능형 대화모형 기술개발 등에도 참여했다. 국내 처음으로 표준안에 기반한 형태소 분석기 및 품사태거 성능평가대회를 개최해 관련업계에 기술개발을 촉발시킨 주역이기도 하다.

 윤진섭 쓰리소프트 이사(35)는 한양대 전자계산학과와 삼보컴퓨터를 거치며 11년 동안 전문 개발자로 활동해온 인물이다. 관계형 DB를 사용한 문헌정보 검색시스템, 클라이언트 서버를 이용한 영상 사규검색시스템, 일본어·중국어 형태소해석기, 국방과학기술 분석정보시스템 등 검색엔진 관련개발 프로젝트에 참여했다.

 김원용 소프트와이즈 실장(34)은 한양대학교 전산학과를 졸업하고 한국과학기술원 전산학과에서 석·박사 학위를 취득했으며 98년 삼성SDS 정보기술연구소, 2000년 아이티벤처 연구소장을 거쳐 지난해부터 검색엔진업체인 소트와이즈에서 지식경영실장을 담당하고 있다.

 이밖에도 업계에서는 공기중 에이드텍 사장(37)은 자연어 검색엔진을 개발해 엠파스 등에 공급, 연구계에서도 이름이 높으며 조기욱 전 쓰리소프트 사장(43)은 국내 최초의 한글검색엔진인 ‘인포모어(InfoMore)’와 ‘인포에이스(InfoAce)’ 개발로 이름을 날린 바 있다.

  강승식 국민대학교 교수(38)는 초기 국산 검색엔진 개발에 참여했으며 94년부터 검색엔진 전문업체인 다센(현 우린정보)의 다센21과 한국정보공학의 미래로 등을 개발했다. 94년에서 95년까지 삼성SDS와 1년간 산학협동으로 자동색인기술을 개발했으며 최근에는 심마니와 코리아와이즈넛 및 케이렙 등의 검색엔진 개발에 주도적으로 참여했다. 이밖에 디지탈드림·K4M·다음기술·센트럴에스티·연성정보기술·아이필 등과도 협력한 바 있다.

 강현규 건국대학교 교수(40)는 지난 90년부터 지식정보처리 소프트웨어 과제에서 자연어처리를 기반으로 하는 정보검색기술을 연구하며 텍스트는 물론 새로운 이미지·사운드·동영상 등 멀티미디어 검색을 함께 다루었다. 이 때 개발한 검색엔진을 계몽사 등이 제작하던 백과사전 CD롬 타이틀에 제공했다. 95년부터는 전자도서관을 모델로 하는 웹용 멀티미디어 정보검색 기술개발에 참여했고 99년부터는 차세대 웹문서의 표준으로 부상하고 있는 XML 기반 검색기술을 개발해 업체에 이전하는 등 검색엔진분야 연구를 선도적으로 이끌어왔다. 최근에는 정보검색에서 질의 용어 확장 및 한정을 위한 자동 질의 용어 정련기에 관한 연구를 진행 중이다.

 이근배 포항공대 교수(41)는 지능형 에이전트 및 정보검색기술이 주 연구분야로 휴먼 인터페이스와 한국어 음성 자연어 처리를 접목한 분야에도 관심을 기울이고 있다. 서울대와 UCLA에서 컴퓨터공학과 전산학을 전공했으며 91년부터 포항공대 교수로 재직 중이다.

 검색엔진분야에서도 ETRI의 활약상은 눈부시다. ETRI는 언어처리 관련 3개의 팀으로 언어공학연구부를 구성해 운영해오다 지난해 이를 영상처리 및 바이오인포메틱스 관련 팀을 포함해 휴먼정보처리연구부로 확대, 검색엔진분야에 대한 연구에 더욱 힘을 쏟고 있다. 휴먼정보검색연구팀에서는 의미기반 정보검색·멀티미디어 정보검색 등을, 지식처리연구팀에서는 텍스트마이닝·지식정보검색 등을, 언어처리연구팀에서는 검색의 기반이 되는 형태소 분석·구문분석·다국어 자동번역기술 등을 연구하고 있다.

 ETRI 휴먼정보연구부를 이끌고 있는 박상규 부장(44)은 93년부터 지능형 에이전트 기술 연구를 수행하고 98년부터 다국어 자동번역 기술과제 개발을 이끌었으며 2000년부터 현재까지 다국어 정보검색과 의미기반 정보검색 등의 개발을 책임지고 있다. 특히 에이전트 기술과 정보검색 기술을 접목해 사용자의 복잡한 요구사항을 한번의 질의로 완성시키는 지능형 지식정보검색 기술에 관심이 많다.

 장명길 ETRI 휴먼정보검색연구팀장(38)은 영한 자동번역 시스템, 한국어 구문분석 기술, SGML 에디터, 다국어 교차언어 정보검색 기술, 내용기반 멀티미디어 정보검색 기술 등의 개발에 주도적으로 참여했으며 최근에는 MPEG7 기반 통합 정보검색 기술개발 등을 의욕적으로 추진 중이다.

 <정소영기자 syjung@etnews.co.kr>