오늘날 통신기술의 영향은 현대인의 생활에 두루 파급되면서 급격한 디지털혁명을 느끼게 하고 있다. 아날로그 통신방식으로는 꿈도 꿀 수 없었던 각종 데이터의 초고속 전송은 사이버 통신, 전자화폐, 시공을 초월한 종합오락센터의 실현 등을 통해 급격한 생활변화를 예고하게 하고 있다. 이러한 격변속에서 통신사업자들도 새로운 비전을 바탕으로 활로찾기에 나서고 있다.
지난해 7월 구조조정을 단행한 일본의 NTT도 5개 회사로 분리시키는 등 몸집 줄이기와 효율화에 나서고 있다. NTT사이버통신종합연구소는 NTT 본사 차원에서 설치한 3개 종합연구소 가운데 통신망에서의 사용자 인터페이스 기술을 집중 연구하는 대표적 연구소로 꼽힌다.
이 종합연구소의 사이버솔루션연구소는 또 다른 축인 사이버스페이스연구소와 함께 수년내 실용화하게 될 첨단 멀티미디어서비스용 솔루션 개발을 주도하고 있다.
두 연구소는 상호 유기적 관계속에 △음성관련 연구는 물론 △네트워크상의 대용량 미디어 공유기술 △디지털 콘텐츠의 제작, 공유, 저장, 가공에 관한 제반 기술 △멀티미디어 터미널에서 쓰이는 입출력 인터페이스 기술 등 다양한 기술개발에 연구력을 집중하고 있다.
이 연구소는 통신기술의 미래가 음성과 영상 등 다양한 멀티미디어 콘텐츠 개발의 성패에 달려 있다고 보고 이와 관련된 전반적인 연구를 진행해 음성만을 떼내어 연구하는 다른 연구소와 차별성을 보이고 있다.
이 연구소는 일본 제일의 통신사업자인 NTT산하연구소란 명성에 걸맞게 음성인식, 음성합성기술에 대한 연구에서 앞서가고 있다. 인식분야에서는 보이스렉스(VoiceRex)라 하는 일본어 음성인식 SW를 통해 고립단어 인식부터 연속음성 인식까지 다양한 분야에 유연하게 적용할 수 있도록 했으며 응용시스템의 개발이나 유지보수가 용이하도록 자체 API와 SAPI를 모두 제공하고 있다. 이 솔루션은 유닉스, 리눅스, 윈도, 매킨토시 등 다양한 플랫폼을 지원한다.
이 음성인식 엔진을 기반으로 방송뉴스의 자막처리 시스템도 개발됐는데 앵커의 음성을 실시간으로 인식하며 95% 이상의 정확성을 보이고 있다. 방송뉴스 인식에 사용되는 단어 사전의 크기는 2만이며, 단어 퍼플렉서티(perplexity)가 30∼40 범위로 한국어나 영어의 방송뉴스에 비해 크게 낮은 점이 눈에 띄는 점이다.
음성합성 기술도 개발이 상당히 진전돼 화자당 5만개의 합성단위에 해당하는 700MB분량의 합성 데이터베이스를 유지해 최상 질의 합성음을 생성하는 파이널플루언트(Final Fluent) 시스템을 내놓고 있을 정도다.
사이버솔루션 종합연구소의 가장 주목받는 네트워크 인터페이스 기술중 하나로는 넷오피스(NetOffice) 시스템도 빼놓을 수 없다. 다자간 멀티캐스팅이 가능한 영상회의 시스템으로서 참석자 얼굴의 동영상 이미지 외에 3차원 렌더링(음영표현)이 가능한 가상현실 창과 참석자간 공유된 파워포인트 창을 제공한다.
원격교육에 적용하는 예를 보여주는 시연은 선생님과 학생 두 명이 수업 받는 과정을 소개한다. 이는 가상현실 창을 이용해 실험도 실시하고 필요한 경우 관련된 웹사이트를 접속하여 수업후 즉석에서 평가하도록 개발되어 있다. 하나의 모임에 32명이 참석할 수 있도록 한 이 기술은 초당 8프레임의 동영상 품질을 유지, 원격교육 이외에도 원격회의, 사이버 박물관, 사이버 백화점 등 다양한 분야에 적용할 수 있다.
NTT가 개발중인 멀티미디어 인터페이스의 시연기술 가운데 가장 인상적인 것으로는 자체 개발한 디지털 워터마킹 기술로 손꼽힌다. 워터마킹이란 디지털 콘텐츠의 부정이용을 방지하기 위해 디지털 이미지에 육안으로는 알 수 없는 저작권 관련 정보를 수록하는 기술.
NTT의 워터마킹 기술은 부분 편집이나 흑백처리 등에도 숨겨진 정보를 유지하는 것은 물론 JPEG 등의 코딩방식을 적용해도 저작권 정보가 손실되지 않는다. 개발 담당자는 이미지안에 문자 등으로 표시된 저작권 정보는 강제 분리시킬 수 없음을 보여주고 있다. 더욱이 디지털 이미지가 아날로그 신호로 변환되어도 저작권 정보는 유지될 정도로 기술개발이 이뤄졌다.
멀티미디어 콘텐츠에 고유 저작권 정보를 부여하는 방식에 대해서는 표준화 기구인 cIDF(content ID Forum)와 연계해 연구를 진행중이다.
또 하나 소개할 만한 기술성과로는 사이버북(cyber book)을 들 수 있다. 컴퓨터 화면을 통해 인터넷 정보를 검색할 때 사용자들은 종종 잘라지지 않고 끊임없이 연결되는 검색대상 내용의 위 아래 연결형태로 인해 몇페이지까지 왔는지 분간하는 일에 어려움을 느낀다. 이때 창 옆에 있는 스크롤바를 이용해 위 아래로 이동, 검색하나 내용이 매우 많게 되면 검색하는데 불편함을 느낀다.
이를 해소하기 위해 정보를 가상적인 책의 형태로 저장하여 누구나 직관적으로 사용할 수 있게 한 SW가 바로 사이버북이다. 실제 손으로 책을 주루룩 훑어보듯 할 수 있는 것같은 연속 브라우징 기능이나 왼쪽으로 한 장씩 책장넘기듯 넘기는 쪽 단위 검색기능, 원하는 페이지만큼 다수의 쪽을 한번에 건너뛰기 기능 등이 그것이다. 이 사이버북은 실제 책을 펴놓은 상태의 모습이 화면에 나타나면서 오른쪽에서 왼쪽으로 종이넘기듯 책 내용이 실린 텍스트 화면과 페이지가 중앙을 중심으로 좌우로 넘겨진다. 따라서 사용자들은 종이책을 사용할 때 책장이 넘겨지는 모습 그대로를 모니터상에서 구현한 것이란 점을 쉽게 알 수 있다.
NTT연구소는 워터마킹 기법을 사용한 콘텐츠 사용방법, 사용기한, 단말기 제한 등의 다양한 배포조건까지 디지털콘텐츠속에 캡슐화해 삽입하는 콘텐츠보호배포SW까지 개발해 놓고 있다. 독자적으로 개발한 알고리듬에 기반해 다양한 방법으로 사용자에게 지정된 사용기간 및 조회횟수만큼의 콘텐츠 접근을 허락하는 게 특징이다.
이처럼 NTT연구소는 남보다 앞서 미래의 핵심기술인 콘텐츠개발 성과를 도출하면서 착착 연구투자비의 회수를 앞두고 있었다.
<이재구기자 jklee@etnews.co.kr 신재명기자 jmshin@etnews.co.kr 박준 ETRI교환전송기술연구소 책임연구원 junpark@etri.re.kr>