十载寒窗英特尔至强处理器历代记 2011-04-11 佚名 IT168 摘要:回顾至强处理器发展的历程,面向双路的产品从最初的至强5000系列到5400系列到最新的至强E7,算下来Intel在双路及四路以上服务器处理器中已经整整更新了10代产品。
2011年4月6日,Intel在北京发布了采用全新命名的至强E7系列,回顾至强处理器发展的历程,面向双路的产品从最初的至强5000系列到5400系列,到Nehalem架构的至强5500、Westmere架构的至强5600;而四路及多路处理器方面,最初的至强7100、六核心的Dunnington至强7400、上一代的Westmere至强7500再到最新的至强E7,算下来Intel在双路及四路以上服务器处理器中已经整整更新了10代产品。
这些产品见证了至强这个品牌一步步走向辉煌,同时这些产品也帮助数以万计的企业获得成功。
今天,我们就来回顾一下最近几年Intel至强的10代产品,为了那些曾经忘却的纪念。
一代、Dempsey核心至强5000系列英特尔公司的“Bensley”平台包括代号为“Dempsey”的双核Xeon DP处理器和代号为“Blackford”的Intel 5000系列芯片组,另外还有一系列的新技术,比如I/O AT技术、FBD内存技术、更新的安全特性等等。
英特尔当时一共发布了8款基于“Dempsey”核心的处理器:Xeon 5080、Xeon 5070、Xeon 5060、Xeon 5063、Xeon 5050、Xeon 5040、Xeon 5030和Xeon 5020。
这些处理器依然采用了NetBurest微架构,它们将会是最后一个采用该微架构的Xeon系列产品。
在Xeon 5000系列处理器中整合了两个完整的NetBurst微架构处理器,并且对于NetBurst 微架构进行了进一步的优化——主要涉及到超管线技术(Hyper Pipelined Technology)和执行追踪缓存(Execution Trace Cache)。
每个处理器拥有独立的2MB二级缓存,其前端总线为1066MHz或者667MHz,可以提供8.5GB/s或者5.3GB/s的传输带宽。
Xeon 5000系列处理器采用了65nm制程,这对于有效的抑制Xeon处理器的发热量具有至关重要的作用。
采用90nm制程的Irwindale核心的单核Xeon处理器TDP在130瓦左右,而Xeon 5000系列双核处理器TDP也只有135瓦甚至更低。
Xeon 5000系列处理器不再采用Socket604封装,改用了FC-LGA6 LGA771封装,可进一步改进处理器的电气性能,更利于功率传导。
这个系列的处理器依然支持超线程技术(Hyper-Threading Technology),这样每个核心可以处理2个线程,每颗双核心处理器可以并行处理4个线程,双路配置的处理器则能可以同时处理8个线程。
另外,这个系列的处理器支持EIST、EM64T、VT、XDbit等技术,对于TM1功能也提供了支持。
二代、Woodcrest核心至强5100基于Woodcrest核心的至强5100英特尔目前已经发布了7款基于Woodcrest核心的Xeon 5100处理器,它们是Xeon 5160、Xeon 5150、Xeon 5148、Xeon 5140、Xeon 5130、Xeon 5120和Xeon 5110。
Xeon 5100系列处理器的主频变化很大,他们没有延续上一代产品的主频,已经发布的处理器中主频最低是1.6GHz,而最高的也只有3.0GHz。
Xeon 5000系列处理器的最低主频为2.5GHz,最高则达到了3.73GHz。
处理器主频的大幅度下降帮助Xeon 5100处理器明显的降低了功耗,在7款处理器中只有5160的TDP为80瓦,5150/5140/5130/5120/5110等五款处理器TDP为65瓦,Xeon 5148的TDP只有40瓦。
Xeon 5100系列处理器(Xeon 5160/5150/5148/5140/5130)增加了对于1333MHz前端总线的支持,该总线实际运行频率为333MHz,可以4倍于其频率的速率传输数据,因此理论上每秒可传输10.66 GB的数据。
而部分低端的处理器(Xeon 5120/5110)则支持1066 MHz前端总线,此时其系统时钟频率为266MHz,带宽为8.5 GB/s。
之前的Xeon 5000系列处理器中则有4款产品采用了1066MHz前端总线,还有4款产品采用了667MHz前端总线。
前端总线的技术并没有明显地的改变,依然利用了分离传输(split-transaction)、延迟应答协议(deferred reply protocol)和地址和数据的源同步传输(Source-Synchronous Transfer,SST)等技术。
从英特尔公布的文档来看,Xeon 5100系列处理器还进一步改进了热量和功率管理能力,它除了支持原有的TM1和EIST技术之外,还增加了对于TM2的支持——它主要增加了调节处理器电压的作用。
另外,双核英特尔Xeon 5100系列处理器也支持EDBit(Execute Disable Bit)功能和英特尔虚拟化技术(Intel VT)。
不过超线程技术并没有应用在Xeon 5100系列处理器上。
三代、代号Clovertown 至强5300系列Quad-core Xeon 5300系列处理器是定位于双路服务器/工作站应用的处理器,代号为Clovertown,它将两个双核核心整合在一个处理器基板上,率先向市场上推出了四核双路处理器。
英特尔首先发布了5款处理器X5355、E5345、E5335、E5320和E5310,随后又陆续发布了L5335、X5365等处理器。
这些处理器均采用了65纳米制程和LGA6封装(LGA771),配置了8MB L2缓存(每颗处理器4MB L2缓存),主频分别为最高达到了3.0GHz。
型号最后一位是“5”的FSB频率为1333MHz,传输带宽可达10.6GB/s,型号最后一位是“0”的FSB频率为1066MHz,传输带宽可达8.5GB/s。
四核Xeon 5300系列的TDP提升到了一个新的水平,X5355/X5365处理器TDP为120瓦,E系列的四款均为80瓦,L系列为50瓦。
双核Xeon 5100系列处理器中,Xeon 5160的TDP为80瓦,Xeon 5148 LV的TDP为40瓦,其余的均为65瓦。
从英特尔公布的这些TDP数据来看,虽然四核处理器是两颗双核处理器的“简单整合”,但是其功率应该并非两个双核处理器的功率之和。
上图显示的是Xeon 5320处理器的基本信息:Intel Xeon 5320处理器,主频为1.86GHz,前端总线频率为1066MHz,每个核心配置有32KB L1数据缓存,32KB L1代码缓存,每个DIE则整合有4MB L2缓存(也就是两个核心共享4MB L2缓存),整个处理器总共具有8MB L2缓存。
总的来说,Xeon 5100所有的特性,Xeon 5300全都具有,最大的改变无非是核心的数量从2个增加到了4个。
但是,毫无疑问的是四核处理器的出现使得计算资源的密度大幅度提升,而功耗基本保持不变,这对于寸土寸金的IDC而言绝对是有重大意义的。
四代、代号Harpertown 至强5400系列Intel严格的按照其“Tick-Tock”战略,在2007年的11月份推出了基于45nm制程的四核处理器,代号Harpertown。
相对于上一代65nm Clovertown核心的产品,Harpertown进一步优化了微架构,添加了功能并且升级了主要规格。
Xeon E5430处理器,2.66GHz,12M缓存,1333MHz FSB,具有适中的性能、功耗及价格从65nm到45nm的转变,不仅仅是当前芯片设计在体积上的缩小。
此类处理器中还增加了许多新的特性,如全新的英特尔SIMD流指令扩展4(SSE4),可通过47条全新指令加快包括视频编码在内的工作负载的处理速度,从而支持高清晰度画质和照片处理,以及重要的HPC和企业应用。
较高端的X5460处理器,后来Intel还发布了频率更高的X5482处理器和上一代Clovertown相比,Harpertown 处理器将2 x 4MB的L2缓存提升到了2 x 6MB L2缓存,每两个核心共享6MB缓存。
Harpertown处理器将不再使用旧的1066MHz FSB,而开始支持更高的1333MHz/1600MHz FSB。
由于采用了45nm High-k制程技术,四核Harpertown 的功耗依然保持同现有的双核大致相当的水平,TDP为80瓦、120瓦和150瓦,并且频率规格也有所提高,最高端的Xeon X5492处理器可以达到3.4GHz,而上一代Xeon X5365只有3.00GHz。
五代、Nehalem核心至强5500系列对于Intel的Tick-Tock战略已经是老生常谈了;从另一方面讲,这标明了Tick-Tock战略的成功之处,一个简单、明晰、有序和易于理解的发展计划,对合作厂商、用户和投资者都是极为有利的。
TIck-Tock战略简而言之就是Intel 处理器在奇数年进行制程转换(Tick),例如2005年的65nm和2007年的45nm,而在偶数年进行处理器的架构更新(Tock),Nehalem架构发布的2008年轮换到了Tock,也就是处理器的架构更新。
Nehalem作为Intel用以取代Penryn微架构的新一代处理器架构,和Penryn相比,Nehalem的微架构并非是全新的,不过,架构上则是一个很大的飞跃:Nehalem采用了直联架构。
除此之外,Nehalem还具有一个鲜明的设计理念,就是采用了可扩展的模块化设计,它将处理器划分为两个部分:Core核心和Uncore非核心(或者叫“核外”),所有产品线的Nehalem处理器,其Core核心部分都是一样的,只是Uncore部分可能不同,以满足Intel对其提出的动态可扩展的要求。
Nehalem满足了这个要求,它的内核具有可扩展的高可伸缩架构。
由于共处在一个Tick-Tock上,因此Nehalem和Penryn都同样属于45nm工艺,从65nm工艺转变到45nm工艺带来的巨大能耗降低已经无法再次重现,因此Nehalem就不再注重于能耗的降低,而是注重于性能的提升,这样的设计理念,带来了处理器架构的巨大变化,这些变化均面向性能的提高,也即是说,我们可以期望Nehalem具有着强大的性能。
六代、Westmere核心至强5600系列双路六核服务器版本和双核客户版本Westmere处理器配置Westmere处理器家族是Nehalem处理器家族的下一代,Nehalem基于45nm制程,Westmere则基于32nm制程,它们都使用了high-κ metal-gate(高K金属栅极)工艺,在微架构上,Westmere就是Nehalem的增强版本。