[테마특강] MPEG-4

申在燮

85년 서강대학교 전자공학과 졸업

87년 서강대학교 대학원 전자공학과 석사

87년 삼성종합기술원 입사

87년~현재 삼성종합기술원 전문 연구원, MPEG 한국대표, SC29-Korea 위원, MPEG4 국제표준화위원회 버전 관리그룹 의장

2005년 11월 25일 아침 6시 10분. 『안녕하세요? 상쾌한 아침입니다.』

TV 화면에서 아름다운 아가씨가 아침 인사를 한다. 여느 때와 마찬가지로 김 부장은 잠에서 덜 깬 눈으로 리모컨 하단 버튼을 누르자 화면이 두개로 분할되면서 화면 한쪽에는 어제 일어났던 중요 사건을 요약하여 전해준다. 한참 보다가 김 부장은 TV 화면을 반으로 줄이고 나머지 한 편에 어제의 주식시황을 요청하여 살펴본다.

김 부장이 다른 버튼을 누르자 이번에는 미국에서 공부하고 있는 아들의 얼굴이 화면 한쪽 구석에 나타났다. 영상전화 기능이 TV에 내장된 것이다. 아들과 몇 마디 얘기를 나누고 나서 김 부장은 아침을 먹고 서둘러 자동차에 올랐다.

차내 소형 TV에서도 그날의 뉴스, 주식시황 등이 동시에 서비스된다. 옆에 있는 버튼을 누르자 김 부장에게 메시지를 보냈던 거래처 사람들이 화면에 나타난다. 그 중 한 사람의 얼굴을 손가락으로 살짝 접촉하자 그가 남겨놓은 메시지가 나온다. 며칠 전 주문했던 물건에 하자가 있다는 것이다. 김 부장이 회사로 전화를 걸자 비서의 얼굴이 화면 한쪽에 나타나면서 오늘의 일정이 함께 디스플레이된다. 비서에게 거래처와의 거래 실적을 정리해 놓으라고 지시하고 회사로 향했다.

이같은 상황은 현실성이 떨어지지만 멀지않은 장래에 우리의 주변에서 일상적으로 일어날 수 있는 일들이다. 이처럼 인간 생활의 편리성이 갈수록 현실화하고 있으며 이 기능들을 구현하기 위해 많은 연구가 세계 각국에서 이루어지고 있다. 최근 신문 지상에 자주 소개되는 MPEG(Moving Picture Experts Group)이라는 것도 그중 하나다.

MPEG4란 국제 표준화 위원회(ISO)와 국제 전기 학회(IEC)가 공동으로 설립한 기술 자문 위원회(JTC:Joint Technical Committee) 산하 멀티미디어 관련 부호화 기술의 국제 표준 규격을 제정하는 조직인 SC29(Sub-Committee 29)에서 WG11(Working Group 11)이라는 이름으로 활동하고 있는 동영상 및 관련 오디오 신호 압축 및 복원에 관한 기술 표준조직을 말한다. 이 MPEG 위원회는 91년 디지털 저장 매체용 압축 규격 MPEG1, 94년 디지털 방송용 압축 규격 MPEG2 표준 기술을 개발, 작년 9월에 에미상을 수상하기도 했다. MPEG4의 조직은 그 역할에 따라 몇 가지로 나누어진다. MPEG4에서 규정하는 오디오/비디오 신호를 구성하여 기기들 사이의 적절한 인터페이스와 기본포맷을 통일시키기 위한 작업을 하는 시스템 그룹, 동화상 신호를 최적의 상태로 압축하고 복원하는 기술을 담당하는 비디오 그룹, 그와 관련된 음성이나 오디오 신호를 압축, 복원하는 기술을 개발하고 있는 오디오 그룹 등 3개의 독립된 그룹과 이들이 개발한 기술의 평가를 맡고있는 테스트 그룹, MPEG4의 요구조건들을 수용하고 결정하는 리콰이어먼트(Requirement)그룹 및 기술들을 하드웨어나 소프웨어로 구현할 경우 문제점 등을 검토하는 임플리멘테이션(Implementation)그룹, 다른 표준화 그룹들과의 대화를 위한 관련자(Liaison)그룹 등으로 구성되어 있다.

MPEG1과 MPEG2는 정해진 데이터 처리량에 따라 임의의 크기로 입력되는 동영상과 음성정보를 압축, 생성되는 비트스트림(bitstream)을 전송하면, 수신단에서는 이를 풀어(decoding) 화면이나 스피커로 출력해 시청하는 형태를 취했다. MPEG4가 과거의 표준들과 다른 것은 입력되는 소스(source)의 차이다. 즉, 오디오-비주얼데이터가 화면내 존재하는 특정한 부분의 오브젝트(object) 집합으로 구성이 가능하다는 것이다. 그러므로 하나의 화면은 사람, 자동차, 나무, 하늘, 새, 구름 등과 같은 다양한 비주얼 오브젝트들의 집합으로 이루어질 수 있다. 또 MPEG4에서는 컴퓨터 그래픽스나 3차원 데이터(facial animation)와 같은 합성영상 및 MIDI, TTS(Text-To-Speech) 등과 같은 합성된 음향정보도 함께 처리할 수 있도록 구성되어 있다. 기존의 표준 규격들이 정해진 기술을 반도체 칩으로 꾸며 시스템을 만드는 것을 전제로 했으나 MPEG4는 각각의 기능들을 수행하는 여러개의 도구들을 개발하고 이들을 필요에 따라 마음대로 조합, 원하는 기능을 구현할 수 있도록 자유를 주고 있다. 기능은 대부분 소프트웨어로 구현한다. MPEG4만의 독특한 특징은 시작 당시부터 이동체용 통신 시스템에 응용될 것을 가정해 오류정정 부호화 기술에 많은 노력을 기울이고 있다는 것이다. 다른 어떤 표준에 비해서도 손상된 정보의 복원능력이 매우 높은 기술을 개발하고 있다. 이러한 특징을 바탕으로 시스템 그룹에서는 시스템과 네트워크 사이 데이터의 서비스에 따라 비트스트림의 형태를 조절하는 멀티플렉싱(Multiplexing), 동기화(Synchronizing) 등의 방식을 결정했다. 현재는 비트스트림의 포맷 결정을 위해 다양한 외부그룹(VRML, JAVA, ASF) 등과 협력을 진행하고 있는 중이다.

오디오 그룹은 2K∼64kbps까지 비트레이트(Bitrate) 대역에서 데이터의 효율적인 표현이 가능하도록 패러메트릭 코딩, 켈프(CELP), 주파수 매핑(Time/Frequence mapping)방식 등 3가지의 핵심 부분으로 나누어 기술을 개발하고 있다. 비디오 그룹은 5K~4Mbps 대역까지의 적용을 목적으로 다양한 도구들을 개발하고 있다. 이들은 크게 형상정보 부호화(Shape Information Coding), 움직임 정보 부호화(Motion Information Coding), 텍스처 정보 부호화(Texture Information Coding) 등으로 나누어진다. 형상정보 부호화는 처리하고자 하는 오브젝트의 모양을 가장 효율적으로 묘사하기 위한 방식으로 주변에 있는 화소들의 분포 특성을 이용하여 확률적으로 형상정보의 유무를 결정하는 방식을 채택하고 있다.

움직임 정보 부호화는 일정한 탐색영역을 정해놓고 그 중에서 현재의 특정 블록을 가장 잘 표현해 줄 수 있는 부분을 선택하도록 하는 블록 매칭 알고리즘(BMA)을 채택하고 있다. 텍스처 부호화로는 기존과 마찬가지로 변환부호화(Transform coding)의 일종인 DCT(Discrete Cosine Transform)라는 기술을 사용한다. 특이한 점은 MPEG4가 오브젝트 단위로 코딩이 가능해야 하기 때문에 오브젝트의 경계부분에서는 텍스처 부호화를 위한 특별한 연산인 패딩(Padding)이라는 과정을 거쳐야 한다는 것이다. 물론 오디오, 비디오 모두 광범위한 비트레이트에서 안정된 서비스를 제공하기 위해서는 스케일러블 코딩(scalable coding)방식의 채용이 필수적이라고 볼 수 있다. 이같이 개발된 기술의 주된 응용분야로는 이동체용 멀티미디어 데이터 서비스, 인터넷 서비스, 원격지 의료 및 교육 시스템, 대화형TV(Interactive TV), 대화형 게임기(Interactive Game Machine), 디지털 비디오 디스크(DVD) 등을 예상해 볼 수 있다.

미국, 일본, 유럽 등 선진국 연구기관들은 MPEG1이 시작될 때부터 참여해 활발한 활동을 벌여왔다. 그 중에서도 특히, 방송 및 통신관련 기관들과 종합 전자 메이커들이 두드러진 활동을 해왔다. MPEG4에서는 표준 기술의 성격상 소프트웨어에 강점을 가진 연구기관들이 보다 유리한 입장에서 활동을 할 수 있다. 미국의 마이크로소프트, IBM, TI, GI, AT&T, MCI, 돌비, 모토롤러 및 락웰, UC버클리대학 등이 대표적인 기관이며 오디오/비디오 분야에 약 20여 가지의 기술을 보유하고 있다. 유럽에서는 EPFL, 텔텍, HHI, 하노버대학, 노키아, 필립스, FHG 등이, 일본에서는 마쓰시타, 도시바, NTT, NEC, 히타치, 미쓰비시, 샤프, 소니 등이 대표적인 기관으로 일본, 유럽 모두 비슷하게 15가지 정도의 기술을 보유하고 있는 것으로 분석되고 있다.

국내 기관들의 활동은 91년부터 본격화했다. 초기엔 과학기술원, 전자 4사, ETRI, KBS 등이 참가했으나 참여 시기가 너무 늦어 표준안에 우리 기술을 제안할 기회를 잡을 수가 없었다. 그러다 93년 11월 서울에서 개최된 제25차 MPEG 회합을 계기로 참여 열기가 고조됐다.

이후 MPEG4에 대한 기여활동은 좀더 조직적으로 이루어지기 시작했고 지난해에는 ETRI, LG 반도체, 대우전자, 삼성전자, 삼성 종합기술원, 현대전자 등의 기술 개발자들이 기대이상의 열의와 노력을 보였다. 결과적으로 MPEG4에서는 영역분할 기술, 텍스트투스피치(TTS)기술, CGD(Computational Graceful Degradation), 후처리 필터링 기술, 가변 비트율 오디오 부호화기술(BSAC), 형상화소 보간기술, 스케일러블 형상부호화 기술, 비트량 조절기술, 모양적응 영역분할기술(SARP), AC/DC 예측기술 등과 같이 여러 기관들이 표준기술에 채택된 핵심 기술을 보유하는 열매를 맺게 됐다. 이것은 표준기술을 사용하는 모든 기관에 대해 기술 사용료를 징수할 수 있게 해 줄 뿐 아니라 향후 멀티미디어 관련 사업을 추진할 때에도 기폭제 역할을 하게 될 것으로 믿는다.

앞으로 세계는 제조기술 경쟁에서 원천기술 확보 경쟁으로 변화되어 갈 것이며 그 양상도 보다 심각해 질 것으로 예상된다. 보다 넓은 시장을 창출하기 위해서는 표준기술이 요구될 것이고 이는 세계적으로 유명한 기관들이 모여 함께 기술을 만들고 그 기술 제작에 참여한 기관들에게만 특혜를 주는 방식으로 이루어질 가능성도 점점 높아지고 있다. 그러므로, 서로 다른 성격의 표준화 제정 단체가 요구하는 특성을 잘 파악해 효율적으로 대처할 수 있도록 정부, 업계가 함께 머리를 맞대어 표준화 활동에 참여하는 기관들이 효율적 활동할 수 있도록 방안을 모색해야 한다.