심규석 서울대 전기정보공학부 교수는 빅 데이터를 분석하고 처리하기 위한 데이터마이닝과 데이터베이스 분야에서 심도 깊은 연구 활동을 펼쳐왔다. 서울대 전기공학과를 졸업하고 미국 칼리지파크에 있는 메릴랜드 주립대에서 석사와 박사 학위를 받았다. 대학원 시절부터 휴렛 패커드 연구소, 연방준비위원회, IBM 알마든 연구소, 벨 연구소, 마이크로소프트 연구소 등에서 다양한 경험을 쌓았다.
심 교수는 “데이터 중에서 무엇을 원하는지를 표시하면 데이터베이스 시스템은 그 질문(질의) 처리에 가장 최적인 방법을 먼저 찾고 그 방법으로 질의를 처리한다”며 “IBM, 마이크로소프트, 그리고 오라클처럼 상업용 데이터베이스 시스템 회사가 질의 최적화에 대해 아주 많은 연구하는 이유”라고 설명했다.
심 교수가 대학원에서 박사과정을 하던 1990년대 초반에는 객체지향형 모델을 기존의 관계형 데이터베이스 시스템에 접목하려는 시기였다. 데이터웨어하우스 분야가 막 시작하는 때이기도 하다. 새로운 환경에서 질의를 효율적으로 처리하기 위한 새로운 질의 최적화 기술에 대한 여러가지 효율적인 알고리즘을 제안했다. 세계적인 논문을 발표했고 지금까지 질의 처리와 최적화에 대한 연구를 하고 있다.
1990년대 초반에는 데이터 분석 기술은 메인메모리 안에 들어가는 작은 데이터에 대해서만 처리를 할 수 있다. 그래서 많은 양의 데이터에서 함축적으로 숨어 있는 유용한 패턴이나 정보를 찾아내는 데는 어려움이 많았다. 심 교수는 이런 많은 양의 데이터를 빠른 시간 안에 잘 분석할 수 있는 연관규칙, 순차패턴, 분류, 군집화, 아웃라이어 탐지, 유사 이미지 검색 등 여러 가지 데이터마이닝 기술을 개발했다. 최근에는 빅데이터 분석을 위해서 여러 대의 컴퓨터를 연결한 클러스터에서 하둡을 이용한 맵리듀스(MapReduce) 프레임워크에서 효율적으로 데이터분석이나 마이닝이 가능한 분산병렬 알고리즘 연구를 진행 중이다.
심 교수는 서울대에서는 최초로 국내에서는 두 번째로 ACM 석학회원에 선임됐다. ACM은 1947년에 설립된 세계 최대 컴퓨터 분야의 학술 조직이다. 미국 뉴욕시에 본부를 두고 전 세계 약 10만 여명의 회원이 활동하고 있다. 그 중에서도 석학회원은 컴퓨팅과 정보기술 분야에서 뛰어난 업적을 나타낸 1%미만 석학급 회원에게만 주어지는 영예로운 자격이다.
권동준기자 djkwon@etnews.com