[CNET코너]검색엔진에 귀를 달아라

인터넷 공간을 가득 채우고 있는 여러 가지 멀티미디어 파일을 어떻게 하면 효과적으로 검색할 수 있을까.

현재 음악파일이나 동영상 파일을 검색해주는 엔진들이 많이 있지만 이들은 모두 텍스트를 기반으로 한 검색엔진이다. 엘튼 존의 음악파일에 「비틀스 노래」라는 설명을 달아놓으면 어떤 검색엔진이든지 엘튼 존의 음악을 비틀스 노래라고 찾아오게 되는 것이다. 한마디로 기존 검색엔진들은 눈만 있고 귀는 없다.

실리콘밸리의 컴패리소닉(comparisonics.com)이라는 업체는 최근 이러한 단점을 해결한 새로운 개념의 음향검색엔진을 개발했다. 컴패리소닉이 운영하는 파인드사운즈닷컴(findsounds.com)은 다양한 음향정보들을 수천 가지 기본음향들과의 유사성을 기준으로 분류 저장한 다음 이를 검색의 데이터베이스로 활용하는 방식을 사용하고 있다.

그 기본음향에는 동물소리, 새소리, 음악소리, 기계 음, 동전 떨어지는 소리 등 일반적으로 흔히 들을 수 있는 여러 가지 소리들이 각각의 음향코드와 함께 저장되어 있고 이를 바탕으로 다양한 음향들을 비교, 검색하는 것이다.

그러므로 파인드사운즈닷컴에서 「코끼리」를 입력하면 실제 코끼리의 울음소리만 검색되어 나올 뿐 「코끼리 아저씨」 노래는 나오지 않는다. 컴패리소닉 측은 『간혹 트럭 뒷바퀴 헛도는 소리가 코끼리 울음소리로 잘못 섞여 나오는 경우는 있지만 이런 현상은 오히려 음악가들의 예술적 영감을 강화하는 데 도움을 줄 수 있을 것』이라고 설명했다.

파인드사운즈닷컴 측은 또 『웹상의 음향정보들을 거의 실시간으로 분석할 수 있어서 생방송중인 영화나 TV프로그램 등도 검색해 낼 수 있다』고 설명하며 『검색결과를 파일의 용량에 따라 제한할 수도 있어서 모뎀 사용자들도 아무 부담 없이 사용할 수 있게 했다』고 밝혔다.

파인드사운즈닷컴이 이처럼 「귀 달린 검색엔진」이라는 별명을 얻고 있기는 하지만 이 검색엔진이 음향을 구분하는 방법은 역시 시각적인 방법이다. 지구상의 모든 음향은 소리의 고저강약으로 구분할 수 있다는 원리에 착안, 웹상의 음향을 컬러그래프로 재구성한 것이다. 그래프의 진폭은 음의 강약을 나타내며 그래프의 색상으로 주파수(음의 고저)를 표시한다. 이렇게 나타난 그래프를 가지고 검색엔진은 각각의 유사성을 파악하는 것이다.

이렇게 음향정보를 정밀하게 분석하는 기술은 트럭 바퀴소리와 코끼리 울음소리가 비슷하다는 우연성을 찾아내는 재미에만 그치지 않는다. 파인드사운즈닷컴 측은 이러한 기술이 실로 다양한 분야에 응용될 수 있고 엄청난 파급효과가 있다고 주장하고 있다. 우선 워터마킹 기술에 응용할 수 있다. 디지털로 복사된 음향도 파인드사운즈의 컬러그래프로 나타내면 제각각 다른 모양을 갖는다는 것. 오리지널 음향을 기준음향으로 정하고 검색엔진을 돌리면 이와 유사한 순서대로 음향파일이 검색되는데 90∼98% 정도의 유사성을 갖는 파일은 거의 불법 복사된 파일로 보면 틀림없다는 것이다.

또 가정마다 간단한 음향수집기를 부착하면 어떤 라디오 프로그램을 듣는지 어떤 TV프로그램을 보는지 자동으로 알 수 있어서 굳이 여러 조사원이 전화기에 달라붙어서 시청률을 조사하는 번거로움도 줄일 수 있다. 또 이를 동물원에 설치하고 건강한 동물의 울음소리와 비교하면 동물들의 컨디션을 자동으로 점검할 수 있고 기계들이 많은 공장에 설치하면 기계음을 분석해서 설비의 이상유무를 자동으로 파악할 수도 있게 된다.

컴패리소닉 측은 『인터넷이 멀티미디어 환경으로 빠른 속도로 발전하고 있어 텍스트만을 검색하는 서비스는 별 쓸모가 없게 될 것이며 우리가 갖고 있는 음향분석 기술이 각광을 받게 될 것』이라고 말했다.