멀티미디어의 주요 내용물인 영상, 음성, 음향등의 데이터를 시청각 특성을 활용하여 압축하면 수십분의 일 이상의 압축률을 얻을 수 있다. 이 높은 압축률은 손실부호화 혹은 손실부호화와 무손실 부호화의 결합에 의하여 얻어진다. 무손실 부호화는 압축률이 낮으나, 복호에 의해 원래 데이터가 완전히 재생 되어야 하는 분야에 쓰인다. 문자, 도형, 컴퓨터의 일반 데이터등은 무손실 부호화를 행하며 영상, 음성, 음향등의 데이터도 필요한 경우 무손실 압축을 한다. 무손실 부호화 방식으로는 DPCM, Run-Length부호화, 엔트로피 부호화등이 있다. 이 세가지는 특성이 다르므로 부호화하고자 하는 데이터의 성질에 따라알맞게 선택해야 한다.
PCM 데이터에 대한차동 부호기로서의 DPCM은 PCM 입력치와 과거 PCM 값들에기초한 PCM 예측치와의 차를 취하는 무손실 부호화로서, 이 DPCM만으로는 데이터의 압축이 얻어지지 않고 통계적 특성만이 변하므로 대개의 경우 다른 종류의 데이터 압축과 결합된다. DPCM에 깔린 철학은 결국 예측가능한 성분 은 복호측에서 자동으로 재생하고 예측 불가능한 성분만을 부호화하여 보내주자는 것이므로, 과거의 값들로부터 현재의 값을 보다 근접하게 예측할 수있을 때 데이터 압축률도 높아진다.
Run-length부호화는 팩시밀리처럼 데이터에 특히 "0"이 많이 발생하는 경우, 혹은 만화영화나 악보처럼 한색이나 음이 긴 구간동안 지속될 때 쓰인다.
이런 경우 값 하나하나를 일일이 표현하는 것보다 어느 값이 얼마나 지속되는지 Run-length 로 표현하는 편이 효율적이다. 따라서 같은 값이 오래 지속 될 수록 데이터 압축률도 높아진다.
엔트로피 부호화의 기본 원리는 데이터 심볼들의 통계적 발생 빈도에 따라 각각의 심볼이나 연속된 심볼을 적절한 길이의 부호로 표현하는 것이다. 데이터 심볼들의 발생확률에 따라 "엔트로피"라고 불리는 심볼당 평균 정보량 이 결정되는데, 엔트로피 부호화의 목표는 심볼당 평균 부호길이가 엔트로피 에 가까이 가도록 하는 것이다.
엔트로피 부호화에는 허프만 부호화, 산술 부호화, LZW부호화가 있다. 허 프만 부호화는 고정길이 부호를 가변길이 부호로 바꾸는 것으로서, 자주 발생하는 심볼에는 짧은 부호를, 드물게 발생하는 심볼에는 긴 부호를 할당하여 평균 부호 길이를 원래 심볼의 고정길이보다 짧게 하는 것이다. 한 예로 영문 텍스트의 경우 압축하지 않은 원문은 보통 ASCII부호로 표현되므로 글자당 7비트를 차지하는데, 이를 허프만 부호화하면 자주 발생하는 ","" e" "s"등은 예를 들어 3비트로, 드물게 발생하는 특수 기호들은 10비트 이상으로 부호화되어 심볼당 평균 4비트 정도로 압축할 수 있다.
산술부호화는 여러 심볼들을 묶은 가변길이 심볼열을 고정길이 부호로 표현 하는 방법인데, 심볼열의 발생확률이 거의 일정하게 유지되도록 묶는다. 특히 이진 데이터에 대한 산술 부호화 방식으로는 IBM이 개발한 Q코더가 유명하다. LZW부호화는 렘펠과 지브의 아이디어를 웰치가 효과적으로 구현한 것으로서 여러 심볼을 묶은 가변길이 심볼열을 가변길이 부호로 표현하는 방법이다. 허프만 부호화와 산술 부호화가 심볼들의 통계를 미리 구하여 이에 따른 부호책을 설계한 후 이를 이용하여 각 심볼을 부호화하는 2단계 방식인데 비해 LZW부호화는 부호화를 해가면서 새로 나오는 심볼열을 사전식으로 부 호책에 기억시켜 다음 심볼의 부호화에 이용하는 "on the fly"방식이다.
무손실 압축의 멀티미디어에의 응용을 살펴보자. 팩시밀리는 흑백의 문서를 주사하면서 이진 데이터열도 바꾼 후, 수평방향으로는 Run-length부호와 허 프만 부호를, 수직방향으로는 DPCM개념을 적용하고 있다. 컴퓨터의 파일 압 축용 프로그램들은 초기에 허프만 부호를 주로 썼으나 지금은 LZW부호를 많이 쓰고 있다. 컴퓨터 영상의 표준 파일 포맷이라 할 수 있는 GIF나 TIFF도L ZW부호를 이용하고 있다. JPEG 정지화 압축표준에서는 화소간에는 DPCM을,양 자화된 변환계수에 대해서는 Run-length 부호와 허프만 부호를 적용하고 있다. JPEG확장 시스템은 산술부호화를 써서 허프만 부호보다 효율을 높였으나복잡성과 특허 문제로 외면당하고 오히려 기본 시스템이 널리 쓰이고 있다.
MPEG영상압축에있어서는 화면간에는 움직임보상 DPCM을, 양자화된 변환계수 에 대해서는 Run-length 부호와 허프만 부호를 적용하고 있다. 또 MPEG음향 압축에 있어서는 제3계층에서 양자화된 음향 표본에 대해 허프만 부호를사용하고 있으나 복잡성이 증가하여 제2계층이 보다 널리 쓰이고 있다.