返璞归真:酷睿处理器全面解析文章来源:PC Labs 中国实验室作者:其他 2006-11-30在奔腾及其以前的微处理器发展阶段,x86家族处理器的走势是以英特尔为代表,AMD、Cyrix等兼容微处理器厂商紧紧跟随为基本特征的。
这一时期各家处理器厂商的产品彼此兼容,可以共处于同一开放的主板平台,英特尔当时专心设计制造微处理器,在486及更早的时候并不参与配套主板芯片组的开发。
自奔腾时代开始,英特尔开始自主研发与奔腾配套的主板芯片组和相应主板产品,先后推出了Socket 5/Socket 7接口的奔腾主板,但是英特尔的芯片组对AMD和Cyrix等兼容处理器厂商是开放的,奔腾主板同样可以容纳AMD的K5和Cyrix的6x86处理器。
但是英特尔不可能让自己的竞争对手在自己的主板平台上做大,它要在配套平台技术给自己的竞争对手设置障碍。
于是,全新的并且受到专利技术保护的P6微架构出现了……前传:酷睿处理器的前生奔腾Pro1995年问世的奔腾Pro处理器(又称“高能奔腾”)在当时并不受重视,但是从现在的角度看,这可是一颗了不起的处理器,因为它是P6微处理器架构的开创者,打开了x86家族技术发展的新纪元。
此后问世的奔腾II、奔腾III、奔腾M及其低价简化版赛扬、酷睿乃至酷睿2处理器,都是P6微处理器架构的继承者,绵延至今香火不断,并且即将重新占据从服务器、工作站、个人电脑乃以移动电脑的全部应用领域,由此可见奔腾Pro开创的P6架构之经典,技术特征之先进。
奔腾Pro处理器具备三个整数运算单元和一个浮点运算单元,三个整数运算单元可以同时并行执行三条指令,并且当三条指令有冲突时仍可并行执行,相比之下奔腾处理器只能并行执行两条指令,并且两条指令是不能有冲突的。
奔腾Pro的一级缓存容量和奔腾一样,有16KB,其中包括8KB指令高速缓冲存储器和8KB数据高速缓冲存储器。
奔腾Pro的精华在于其核心集成了256KB或者512KB的二级缓存,这一点在现在看来稀松平常,但是在当时可是了不起的杰作,此前所有的人——既包括工程师也包括普通用户,都认为二级缓存应该是主板的标准组成部分之一,从没有人想过可以把二级缓存内置于处理器中。
二级缓存集成在主板上可以使成本降低,用户可以自由配置二级缓存容量的大小,但是主板集成二级缓存的致命缺点就是二级缓存的运行频率和主板外频一致,例如486主板的二级缓存标准运行速度是25MHz/33MHz/66MHz,奔腾主板的二级缓存标准运行频率是60MHz/66MHz。
所以为了提高微处理器的性能,除了改进核心提升工作主频以外,将二级缓存内置于处理器核心使其能保持与处理器主频相同的工作频率也是一个好办法。
奔腾Pro将二级缓存内置于核心,大大提升了处理器的性能。
为了将竞争对手甩开,英特尔为奔腾Pro所采用的架构申请了专利,受到专利技术保护的配套主板平台是AMD等兼容厂商无权享受的,此后的P6微架构处理器和配套平台一直延续了这样的“排外”政策。
奔腾Pro处理器的核心经过特别优化,可以高效处理32位代码,因此它是运行Windows NT的最佳微处理器;但是在运行16位/32位混合代码的Windows 95操作系统时,性能就不如同主频的奔腾MMX了。
所以在当时Windows95操作系统独步天下时,由于奔腾Pro的上述原因以及内置二级缓存的制造成本偏高,价格明显偏贵,因此只局限于服务器工作站应用领域,并没有取代奔腾/奔腾MMX。
奔腾IIP6家族的第二代产品就是奔腾II,其桌面版核心基本架构和奔腾Pro一样,只是为了降低制造成本,将奔腾Pro 内置于核心的二级缓存集成到了奔腾II核心以外的核心电路板上。
奔腾II的这一改进确实降低了制造成本,但是外置的二级缓存运行速度仅有处理器工作主频的一半,性能自然受到影响。
为了让奔腾II的性能超过奔腾Pro,英特尔采用了如下几个手段:第一,提高奔腾II的工作主频;第二,加大奔腾II的一级缓存,从奔腾Pro的16KB增加到32KB;第三,增大二级缓存的容量,从普通奔腾Pro的256KB提升至512KB;第四,加入对MMX指令集的支持;第五,提升奔腾II的外频,从350MHz主频的奔腾II开始,采用100MHz的外频。
奔腾II的这些改进确实起到立竿见影的效果,奔腾II迅速取代了奔腾Pro和奔腾MMX,彻底结束了P5时代。
奔腾II的移动版本直到0.25微米工艺普及以后才出现。
这是因为移动版本处理器体积不能像桌面版那样大,这就意味着二级缓存只能集成于处理器核心,而0.35微米工艺很难满足这一要求,所以移动处理器领域很长时间都是奔腾MMX的天下。
移动版奔腾II处理器的核心架构和奔腾II一样,只不过二级缓存内置于核心,以全速运行,容量大小为256KB。
移动版奔腾II的外频始终被限定在66MHz。
奔腾II处理器是一个庞大的家族,我们一般所说的奔腾II主要面向主流桌面、移动应用和低端服务器市场;奔腾II至强则是专业服务器和高端工作站的首选,低端入门市场则由奔腾II的廉价简化版——赛扬来应对。
和奔腾II 一样,赛扬也隶属于P6家族。
不过和奔腾II相比,赛扬的内部架构更接近于奔腾Pro,这是因为除了最早的赛扬266、赛扬300以外,其他赛扬都带有集成于CPU核心的全速二级缓存。
赛扬的外频很长时间都局限在66MHz,直到奔腾III时代中后期才出现了100MHz外频的赛扬。
奔腾III1999年1月问世的奔腾III处理器是P6家族的第三代产品。
奔腾III家族除了主角奔腾III以外,同样包括至强和赛扬两大分支。
奔腾III历经了三代核心演变,每一代的改进都很大,性能提升也很明显。
最早的奔腾III核心代号为Katmai,其实就是100MHz外频的奔腾II+SSE指令集,后期则推出了133MHz的两款型号,随即让位给Coppermine奔腾III。
Coppermine核心是对P6架构的一次发扬光大,它的改进不仅仅在于采用了0.18微米工艺,而是在核心上大刀阔斧的改进。
Coppermine基本核心设计思路和Katmai奔腾III一致,但是大大扩展了数据通道,是Katmai的四倍。
此外Coppermine奔腾III继承了奔腾Pro/赛扬的优良传统,将二级缓存集成在处理器核心,以和处理器工作主频相当的速度运行,再加上二级缓存数据通道的拓宽(从Katmai的64位拓宽到了256位),缓存延迟时间的缩短,因此同主频下Coppermine的性能明显好于Katmai。
除了L2 Cache外,英特尔还在Coppermine 中增加了填充缓存、总线队列入口和写回式缓冲区,可以避免写入较慢的内存或读入多重内存区域数据时,主存储瓶颈给CPU造成的延迟,在133MHz总线上预读取带宽扩充到680~1000MB/s后,将会有效地解决此类问题。
奔腾III的最后一个核心是Tualatin。
Tualatin采用0.13微米工艺制造,是P6家族值得让人怀念的经典产品。
Tualatin对Coppermine的改进不算太大,最大亮点就是Tualatin采用了四倍Quadword Wide缓存数据总线,而Coppermine是两倍Quadword Wide缓存数据总线。
缓存数据总线越宽,缓存传输率和读写效率就越高,对处理器的性能提升有很大帮助。
Tualatin的桌面版本具有256KB二级缓存,服务器版本和移动版本则具有512KB二级缓存。
移动版本的Tualatin就是奔腾III-M,它是迅驰移动计算技术问世以前,奔腾4时代轻薄笔记本电脑中的王者,是奔腾M处理器的雏形。
奔腾III-M可支持增强的英特尔SpeedStep技术,这种技术能够根据处理器上的应用需求自动切换最佳性能模式和电池优化模式,从而在性能和功耗之间达到最佳平衡。
此外,这种处理器采用了英特尔公司新研制的封装技术,使PC机制造商得以生产出更轻更薄的笔记本产品。
全新的更深度睡眠模式(Deeper Sleep)能够比原来的低能量睡眠模式进一步降低能耗,延长电池使用时间——即使在运行应用程序的时候,也可以达到仅0.2W或者更少的耗电量。
采用奔腾III-M处理器的笔记本至今仍活跃在二手市场,足以轻松应对目前的主流计算需求。
在2003年初问世的迅驰移动计算技术平台中,最引人注目的就是代号为Banias的奔腾M处理器。
与以往英特尔的高调宣传做法不同,英特尔对奔腾M的技术架构不愿多谈,只是强调它是迅驰移动平台的组成部分,设计的出发点就是追求低功耗、低热量、体积小。
但是行家们很快就从英特尔羞答答拿出的奔腾M内部架构资料中看出,奔腾M其实还是P6家族的一员,更确切地说,奔腾M就是以Tualatin奔腾III-M为设计蓝本,同时吸取了NetBurst 架构奔腾4的一些长处而设计出来的“超级奔腾III-M”。
奔腾M的基本核心架构仍然一如P6架构,那就是由整数运算单元、浮点运算单元、一级缓存和二级缓存组成。
吸取了奔腾III由于流水线运算管线过短而带来的主频提升困难的教训,奔腾M加长了流水线运算管线,从奔腾III 的10级增加为12级。
这样做的好处不仅使主频的提升变得容易了很多,同时又不会明显降低处理器在单个时钟周期的指令执行效率。
奔腾M处理器支持增强型英特尔SpeedStep技术的改进版本。
英特尔公司对SpeedStep技术所做的改进包括多电压和频率工作点,它们受到操作系统的动态控制。
由于在这些多频率工作点之间的过渡中包括一个电压过渡,因此电能消耗将会得到优化,降至最低,达到在该频率下进行操作所需要的最小能耗。
新版本与目前的增强型英特尔SpeedStep技术的区别在于多工作频率和电压点。
目前的版本只有两个不同的电压和频率组合。
多中间组合的优势在于其极为优异的性能和能耗比。
高级指令预测是一项崭新的应用技术。
奔腾M使用多个多分支预测器,能够降低系统的整体执行时间,利用更低功率实现更优异的性能。
奔腾M身上所采用的IMVP4是一种电压定位技术。
它与早期版本有所不同,能够实现更精细的间隔尺寸,支持改进了的增强型英特尔SpeedStep技术的中间工作点。
而且它完全由中央处理器支持,不需要芯片组支持。
IMVP4已为支持改进增强型SpeedStep技术进行了优化。
它的电压过渡分辨率更高,使奔腾M处理器睡眠或更深睡眠时电压更低。
它还实现改进的增强型英特尔SpeedStep技术的中间工作点之间的过渡。
Banias奔腾M的二级缓存容量从Tualatin奔腾III-M的512KB提升为1MB。
奔腾M缓存的设计包括更低的静止消耗能量,它降低了处理器整体能耗。
另外在奔腾M处理器里加入了PSI(功率状态指示器),它是奔腾M处理器上的一个管脚,在芯片组与奔腾M处理器核心之间起到沟通作用,自动地向中央处理器电压调节控制器发出信号,从而改变电压调节状态。