◆펜티엄4는 기존 펜티엄Ⅲ에 비해 많은 구조적 발전을 이뤘다. 아직 이를 지원하는 애플리케이션이 부족하기 때문에 그 성능을 100% 발휘하지 못하지만 앞으로 애플리케이션의 지원 여부에 따라 사용자의 컴퓨팅환경을 상당히 변화시킬 것으로 예상된다.
인텔이 밝힌 변화는 여러가지가 있지만 그 중 주목할 만한 것은 6가지로 하이퍼 파이프라인 기술, 고속 실행 엔진, 고급 동적 실행, 실행 추적 캐시, 스트리밍 명령 확장, 400㎒ 시스템 버스가 이에 속한다.◆
★하이퍼 파이프라인 기술(Hyper Pipelined Technology)
하이퍼 파이프라인 기술은 인텔이 펜티엄4에서 가장 강조하는 변화 지점이다. 이것은 CPU의 명령을 처리하는 구조인 파이프라인을 기존 펜티엄Ⅲ의 10단계에서 20단계로 확장, 한 번에 처리할 수 있는 명령을 2배로 늘린 것이다.
따라서 하이퍼 파이프라인은 펜티엄Ⅲ보다 더욱 빠른 명령처리가 가능하다. 반면 한꺼번에 몰리는 명령처리를 제대로 처리할 수 있는 분기예측기능이 제대로 되지 않아 하나의 명령처리가 잘못되면 나머지 19개의 명령처리를 다시 해야 하는 문제가 생긴다. 하지만 펜티엄4의 분기예측은 90% 이상의 적중률을 갖고 있기 때문에 분기예측이 실패해 생기는 문제를 감안하더라도 전체적으로는 성능이 높아지게 된다.
★고속 실행 엔진(Rapid Execution Engine)
고속 실행 엔진도 명령실행을 빠르게 만드는 기술이다. 이 기술은 실제 클록주파수의 2분의 1에 해당하는 속도로 하나의 명령을 처리하는 것으로서, 결국 1클록으로 2개의 명령을 처리, 이론적으로 1.5㎓의 CPU가 3㎓ CPU의 처리속도를 내게 된다. 이로 인해 실행에 필요한 대기시간을 줄이고 보다 빠른 명령어를 수행한다.
이 기술은 파이프라인에서 보낸 명령을 받아 처리하는 것으로 하이퍼 파이프라인 기술과 함께 펜티엄4의 성능을 높이는 주요 기술이다.
★고급 동적 실행(Advanced Dynamic Execution)
펜티엄4는 빠른 명령어 실행이 가능한 반면, 위험요소도 많다. 이를 해결하기 위해서는 최적화된 스케줄링이 필요하다. 순차적으로 실행되는 명령어의 경우 큰 문제점은 없지만 비순차적으로 실행되는 명령어의 경우 길어진 파이프라인에 의해 오류발생가능성이 높다. 이 위험요인을 제거하기 위해 실행되는 명령을 효율적으로 통제하는 것이 고급 동적 실행이다.
★실행 추적 캐시(Execution Trace Cache)
이 기술은 명령의 디코딩을 CPU 코어 내부가 아닌 캐시에서 수행하는 것으로 디코딩을 코어 내부에서 실행하던 기존 제품에 비해 부하를 줄여 처리시간을 단축시키는 역할을 한다.
이 기술은 L1과 L2 캐시 모두에 적용되며 특히 초당 48GB의 대역폭을 갖는 L2캐시의 경우 매우 빠른 처리능력을 갖는다. 따라서 펜티엄4는 이 기능을 극대화하기 위해 256KB 용량의 L2캐시를 내장하고 있다.
★스트리밍 명령 확장(Streaming SIMD Extension2)
흔히 SSE2라고 불리는 스트리밍 명령 확장은 멀티미디어 처리 명령인 MMX와 SSE를 확장시킨 것으로 144개의 새로운 유닛을 추가해 멀티미디어 데이터 처리와 부동소수점 연산 처리 성능을 높였다.
기존 SSE·MMX 기술의 2배에 해당하는 128비트 SIMD 정수 연산으로 비디오, 음성, 암호 및 이미지 프로세싱과 관련한 멀티미디어 유닛이 확장됐으며 128비트 SIMD 배정밀 부동소수 연산으로 기하학 및 기타 엔지니어링기술에서 자주 쓰이는 3D 및 각종 수치해석에 대해 FPU 처리능력을 보강한 진보된 처리를 할 수 있게 했다.
★400㎒ 시스템 버스
지금까지 설명한 펜티엄4의 각종 기술이 제대로 성능을 발휘하려면 CPU 내부 데이터 전송속도가 빨라야 한다. 만일 그렇지 않으면 병목현상을 초래한다. 펜티엄4는 내부 시스템 버스가 400㎒로 100㎒로 동작하는 기존 CPU에 비해 속도가 4배, 133㎒로 동작하는 펜티엄Ⅲ에 비해서도 3배나 빨라졌다. 따라서 펜티엄Ⅲ가 초당 1.06GB의 데이터를 처리하는 데 비해 펜티엄4는 초당 3.2GB의 데이터 전송률을 갖는다.
★i850 칩세트★
인텔은 펜티엄4를 지원하기 위한 메인보드 칩세트로 i850 칩세트를 발표했다. 이 칩세트는 크게 82850 메모리컨트롤러허브(MCH)와 82801BA 입출력컨트롤러허브(ICH2)로 구성돼 있다.
이 850 칩세트의 가장 큰 장점으로 볼 수 있는 부분은 바로 CPU와 MCH, 그리고 MCH와 메모리간의 대역폭이 완벽하게 조화된다는 것이다. 이를 표로 정리하면 다음과 같다.
이것은 PC800 RD램을 사용한 경우인데 그동안 시스템 버스와 메모리간의 불균형한 구조를 해소하기 위해 펜티엄4는 초당 3.2GB의 데이터를 전송할 수 있는 400㎒의 시스템 버스를 사용했다.
이밖에 데스크톱 칩세트 중 유일하게 노스·사우스 브릿지 사이에 초당 266MB의 데이터 전송을 지원하는 것도 다른 제품에 비해 경쟁 우위를 갖게 만든다. 이 기술은 인텔과 경쟁관계에 있는 비아에서도 지원할 것이라고 입장을 밝힐 정도다.