《CPU完全手册.doc》由会员分享,可在线阅读,更多相关《CPU完全手册.doc(77页珍藏版)》请在三一办公上搜索。
1、CPU完全手册CPU的制作过程详解(源码网,)现在市场上产品丰富,琳琅满目,当你使用着配置了最新款CPU的电脑在互联网上纵横驰骋,在各种程序应用之间操作自如的时候,有没有兴趣去想一想这个头不大、功能不小的CPU是怎么制作出来的呢。在今天的半导体制造业中,计算机中央处理器无疑是受关注程度最高的领域,而这个领域中众所周知的两大巨头,其所遵循的处理器架构均为x86,而另外一家号称信息产业的蓝色巨人的IBM,也拥有强大的处理器设计与制造能力,它们最先发明了应变硅技术,并在90纳米的处理器制造工艺上走在最前列。在今天的文章中,我们将一步一步的为您讲述中央处理器从一堆沙子到一个功能强大的集成电路芯片的全过
2、程。制造CPU的基本原料如果问及CPU的原料是什么,大家都会轻而易举的给出答案是硅。这是不假,但硅又来自哪里呢?其实就是那些最不起眼的沙子。难以想象吧,价格昂贵,结构复杂,功能强大,充满着神秘感的CPU竟然来自那根本一文不值的沙子。当然这中间必然要经历一个复杂的制造过程才行。不过不是随便抓一把沙子就可以做原料的,一定要精挑细选,从中提取出最最纯净的硅原料才行。试想一下,如果用那最最廉价而又储量充足的原料做成CPU,那么成品的质量会怎样,你还能用上像现在这样高性能的处理器吗?除去硅之外,制造CPU还需要一种重要的材料就是金属。目前为止,铝已经成为制作处理器内部配件的主要金属材料,而铜则逐渐被淘汰
3、,这是有一些原因的,在目前的CPU工作电压下,铝的电迁移特性要明显好于铜。所谓电迁移问题,就是指当大量电子流过一段导体时,导体物质原子受电子撞击而离开原有位置,留下空位,空位过多则会导致导体连线断开,而离开原位的原子停留在其它位置,会造成其它地方的短路从而影响芯片的逻辑功能,进而导致芯片无法使用。这就是许多Northwood Pentium 4换上SNDS(北木暴毕综合症)的原因,当发烧友们第一次给Northwood Pentium 4超频就急于求成,大幅提高芯片电压时,严重的电迁移问题导致了CPU的瘫痪。这就是intel首次尝试铜互连技术的经历,它显然需要一些改进。不过另一方面讲,应用铜互连
4、技术可以减小芯片面积,同时由于铜导体的电阻更低,其上电流通过的速度也更快。除了这两样主要的材料之外,在芯片的设计过程中还需要一些种类的化学原料,它们起着不同的作用,这里不再赘述。CPU制造的准备阶段在必备原材料的采集工作完毕之后,这些原材料中的一部分需要进行一些预处理工作。而作为最主要的原料,硅的处理工作至关重要。首先,硅原料要进行化学提纯,这一步骤使其达到可供半导体工业使用的原料级别。而为了使这些硅原料能够满足集成电路制造的加工需要,还必须将其整形,这一步是通过溶化硅原料,然后将液态硅注入大型高温石英容器而完成的。而后,将原料进行高温溶化。中学化学课上我们学到过,许多固体内部原子是晶体结构,
5、硅也是如此。为了达到高性能处理器的要求,整块硅原料必须高度纯净,及单晶硅。然后从高温容器中采用旋转拉伸的方式将硅原料取出,此时一个圆柱体的硅锭就产生了。从目前所使用的工艺来看,硅锭圆形横截面的直径为200毫米。不过现在intel和其它一些公司已经开始使用300毫米直径的硅锭了。在保留硅锭的各种特性不变的情况下增加横截面的面积是具有相当的难度的,不过只要企业肯投入大批资金来研究,还是可以实现的。intel为研制和生产300毫米硅锭而建立的工厂耗费了大约35亿美元,新技术的成功使得intel可以制造复杂程度更高,功能更强大的集成电路芯片。而200毫米硅锭的工厂也耗费了15亿美元。下面就从硅锭的切片
6、开始介绍CPU的制造过程。单晶硅锭在制成硅锭并确保其是一个绝对的圆柱体之后,下一个步骤就是将这个圆柱体硅锭切片,切片越薄,用料越省,自然可以生产的处理器芯片就更多。切片还要镜面精加工的处理来确保表面绝对光滑,之后检查是否有扭曲或其它问题。这一步的质量检验尤为重要,它直接决定了成品CPU的质量。新的切片中要掺入一些物质而使之成为真正的半导体材料,而后在其上刻划代表着各种逻辑功能的晶体管电路。掺入的物质原子进入硅原子之间的空隙,彼此之间发生原子力的作用,从而使得硅原料具有半导体的特性。今天的半导体制造多选择CMOS工艺(互补型金属氧化物半导体)。其中互补一词表示半导体中N型MOS管和P型MOS管之
7、间的交互作用。而N和P在电子工艺中分别代表负极和正极。多数情况下,切片被掺入化学物质而形成P型衬底,在其上刻划的逻辑电路要遵循nMOS电路的特性来设计,这种类型的晶体管空间利用率更高也更加节能。同时在多数情况下,必须尽量限制pMOS型晶体管的出现,因为在制造过程的后期,需要将N型材料植入P型衬底当中,而这一过程会导致pMOS管的形成。在掺入化学物质的工作完成之后,标准的切片就完成了。然后将每一个切片放入高温炉中加热,通过控制加温时间而使得切片表面生成一层二氧化硅膜。通过密切监测温度,空气成分和加温时间,该二氧化硅层的厚度是可以控制的。在intel的90纳米制造工艺中,门氧化物的宽度小到了惊人的
8、5个原子厚度。这一层门电路也是晶体管门电路的一部分,晶体管门电路的作用是控制其间电子的流动,通过对门电压的控制,电子的流动被严格控制,而不论输入输出端口电压的大小。准备工作的最后一道工序是在二氧化硅层上覆盖一个感光层。这一层物质用于同一层中的其它控制应用。这层物质在干燥时具有很好的感光效果,而且在光刻蚀过程结束之后,能够通过化学方法将其溶解并除去。光刻蚀这是目前的CPU制造过程当中工艺非常复杂的一个步骤,为什么这么说呢?光刻蚀过程就是使用一定波长的光在感光层中刻出相应的刻痕,由此改变该处材料的化学特性。这项技术对于所用光的波长要求极为严格,需要使用短波长的紫外线和大曲率的透镜。刻蚀过程还会受到
9、晶圆上的污点的影响。每一步刻蚀都是一个复杂而精细的过程。设计每一步过程的所需要的数据量都可以用10GB的单位来计量,而且制造每块处理器所需要的刻蚀步骤都超过20步(每一步进行一层刻蚀)。而且每一层刻蚀的图纸如果放大许多倍的话,可以和整个纽约市外加郊区范围的地图相比,甚至还要复杂,试想一下,把整个纽约地图缩小到实际面积大小只有100个平方毫米的芯片上,那么这个芯片的结构有多么复杂,可想而知了吧。当这些刻蚀工作全部完成之后,晶圆被翻转过来。短波长光线透过石英模板上镂空的刻痕照射到晶圆的感光层上,然后撤掉光线和模板。通过化学方法除去暴露在外边的感光层物质,而二氧化硅马上在陋空位置的下方生成。 掺杂
10、在残留的感光层物质被去除之后,剩下的就是充满的沟壑的二氧化硅层以及暴露出来的在该层下方的硅层。这一步之后,另一个二氧化硅层制作完成。然后,加入另一个带有感光层的多晶硅层。多晶硅是门电路的另一种类型。由于此处使用到了金属原料(因此称作金属氧化物半导体),多晶硅允许在晶体管队列端口电压起作用之前建立门电路。感光层同时还要被短波长光线透过掩模刻蚀。再经过一部刻蚀,所需的全部门电路就已经基本成型了。然后,要对暴露在外的硅层通过化学方式进行离子轰击,此处的目的是生成N沟道或P沟道。这个掺杂过程创建了全部的晶体管及彼此间的电路连接,没个晶体管都有输入端和输出端,两端之间被称作端口。重复这一过程从这一步起,
11、你将持续添加层级,加入一个二氧化硅层,然后光刻一次。重复这些步骤,然后就出现了一个多层立体架构,这就是你目前使用的处理器的萌芽状态了。在每层之间采用金属涂膜的技术进行层间的导电连接。今天的P4处理器采用了7层金属连接,而Athlon64使用了9层,所使用的层数取决于最初的版图设计,并不直接代表着最终产品的性能差异。接下来的几个星期就需要对晶圆进行一关接一关的测试,包括检测晶圆的电学特性,看是否有逻辑错误,如果有,是在哪一层出现的等等。而后,晶圆上每一个出现问题的芯片单元将被单独测试来确定该芯片有否特殊加工需要。而后,整片的晶圆被切割成一个个独立的处理器芯片单元。在最初测试中,那些检测不合格的单
12、元将被遗弃。这些被切割下来的芯片单元将被采用某种方式进行封装,这样它就可以顺利的插入某种接口规格的主板了。大多数intel和AMD的处理器都会被覆盖一个散热层。在处理器成品完成之后,还要进行全方位的芯片功能检测。这一部会产生不同等级的产品,一些芯片的运行频率相对较高,于是打上高频率产品的名称和编号,而那些运行频率相对较低的芯片则加以改造,打上其它的低频率型号。这就是不同市场定位的处理器。而还有一些处理器可能在芯片功能上有一些不足之处。比如它在缓存功能上有缺陷(这种缺陷足以导致绝大多数的CPU瘫痪),那么它们就会被屏蔽掉一些缓存容量,降低了性能,当然也就降低了产品的售价,这就是Celeron和S
13、empron的由来。在CPU的包装过程完成之后,许多产品还要再进行一次测试来确保先前的制作过程无一疏漏,且产品完全遵照规格所述,没有偏差。更好工作!谈CPU的正确使用保养之道CPU作为电脑的心脏,肩负着繁重的数据处理计算工作。从打开电脑一直到关闭,CPU都会一刻不停地运作,如果一旦不小心将CPU烧毁或损坏,整台电脑也就瘫痪了。因此对它的保养显得尤为重要。目前,为防止CPU烧毁,主流的处理器都具备过热保护功能,当CPU温度过高时会自动关闭电脑或降频。虽然这一功能大大的减少了CPU故障的发生率,但如果长时间让CPU工作在高温的环境下,也将大大缩短处理器的使用寿命。那我们该如何正确使用和保养CPU呢
14、?以下介绍几点经验。一、要重点解决散热问题要保证电脑稳定运行,首先要解决散热问题。高温不仅是CPU的重要杀手,对于所有电子产品而言,工作时产生的高温如果无法快速散掉,将直接影响其使用寿命。我们知道,CPU在工作时间产生的热量是相当可怕的,特别是一些高主频的处理器,工作时产生的热量更是高的惊人。因此,要使CPU更好的为我们服务,散热工夫不可少。CPU的正常工作温度为3565,具体根据不同的CPU和不同的主频而定,因此我们要为处理器选择一款好的散热器。不仅仅要求散热风扇质量要够好,而且要选择散热片材质好的产品。通常情况下,盒装处理器所带的散热器,大都能够满足此款产品散热的要求,但如果你想超频,那么
15、盒带的散热器是绝对无法满足散热需求的,这时需要为CPU选择一款散热性能更好的产品。虽然对CPU超频成为众多玩家的必修功课,但笔者认为如果你的CPU足够用,不建议对处理器进行超频。因为即使你的散热器足够好,超频后的CPU寿命也会减短。另外,我们可以通过测速测温软件来适时检测CPU的温度与风扇的转速,以保证随时了解散热器的工作状态及CPU的温度。另外,我们还要保障机箱内外的空气流通顺畅,保证能够将机箱内部产生的热量及时带出去。散热工作做好了,可以使一部分不明原因的死机减少。二、要选择轻重合适的散热器为了解决CPU散热问题,选择一款好的散热器是必须的。不过我们要选择散热器的时候,也要根据自己电脑的实
16、际情况,购买合适的产品。不要一味的追求散热,而购买那样即大又重的“豪华”产品。这些产品虽然好用,但由于自身具有相当的重量,因此时间长久不但会造成与CPU无法紧密接触,还容易将CPU脆弱的外壳压碎。笔者就曾遇到过这样的故障。一台两年前买的电脑,配置为英特尔奔腾4 2.4C GHz、微星865PE芯片组主板、希捷80GB PATA硬盘、七彩虹R9550显卡。近日主板上自带的6声道声卡无声了,通过检查发现声卡芯片出现了问题。在电脑城买了一块新的四声道的PCI声卡,心想换一个声卡也不需要太高的技术,于是将机箱放倒,拆开机箱,拔下老声卡,换上新买的声卡,拧好螺丝,放正机箱,准备开机后享受一下新声卡带来的
17、“天籁之音”。谁知按下电源开关,电脑加电启动,但显示器却是一张“黑脸”,没有任何显示,太不给“面子”了吧! 回想刚才的操作过程,只是换了一块声卡,并没有进行其他的操作,按道理不应该有硬件的损坏,这样的故障多数是因接触不良导致的。而对于接触不良导致显示器黑屏的故障,一般来讲都集中在CPU、内存和显卡上,应该重点检查一下这些配件的接触情况。于是再次将电脑平放,打开机箱,将CPU散热风扇、显卡散热风扇清洗一番;又将主板上的显卡、内存、声卡、CPU等拔下,用毛刷扫去聚集在主板上各插槽附近的灰尘。然后将这些配件装回主板,开机,显示器上出现了久违的“能源之星”图案。启动一切正常,看来是一起小故障,不足为奇
18、!将所有配件装好后,将机箱直立,嘿!“黑脸”又出现了。再次将电脑放倒,将所有的板卡重新插了一遍,开机,结果电脑一切正常,这是怎么回事呢?经过几次试验,发现只要将电脑放平,电脑就一切正常,而将机箱直立后即出现上述故障。根据故障现象,可以分析出是有地方接触不良,于是将内存拔下,将金手指用橡皮擦一擦,再插回内存插槽;然后将显卡和CPU拔下,用同样的方法进行处理,结果仍然没有解决问题。但CPU上硕大的散热风扇引起了我的注意,当初为了增加散热效果,我选用了铜制的散热片,铜的散热传导性能优异,但密度较大,因此采用铜作散热风扇的重量也比较大,很容易使插槽产生变形,会不会是这个原因呢?由于CPU是垂直安装在主
19、板上,当主板平放时,整个CPU连同散热风扇的重心都在主板上,不会产生其他问题;而如果是立式机箱,主板是垂直放置的,CPU又与主板垂直,因此,CPU及散热风扇的重心并没有落在主板上,长时间的重心向下,加上铜制散热风扇重量较大,很可能使CPU插槽内的簧片长时间变形而引起上述故障。猜测归猜测,还是试试看吧。想到机箱平放时工作正常,直立时即出现死机,有可能是因CPU散热风扇质量较大而引起向下倾斜,与插槽之间不能良好接触。于是,将这个大块头的散热器换下,重新装上CPU盒装自带的散热器后,将电脑直立,通电开机,电脑自检的信息出现在屏幕上,故障排除,看样子确实是因CPU散热风扇质量太大,导致CPU与插槽不能
20、良好接触所致。二、要做好减压和避震工作在做好散热的同时,还要做好对CPU处理器的减压与避震工作。CPU死于散热风扇扣具压力的惨剧时有所闻,主要表现在CPU核心被压毁。因此在安装散热器时,要注意用力均匀,扣具的压力亦要适中,具体的可根据实际需要仔细调整扣具。另外现在风扇的转速可达6000转/分,这时出现了一个共振的问题,长期如此,会造成CPU与散热器之间无法紧密结合、CPU与CPU插座接触不良,解决的办法就是选择正规厂家出产的散热风扇,转速适当,扣具安装须正确。四、勤除灰尘、用好硅脂及其它灰尘要勤清除,不能让其积聚在CPU的表面上,以免造成短路烧毁CPU。硅脂在使用时要涂于CPU表面内核上,薄薄
21、一层就可以,过量会有可能渗到CPU表面和插槽,造成毁坏。硅脂在使用一段时间后会干燥,这时可以除净后再重新涂上硅脂。改良的硅脂更要小心使用,因改良的硅脂通常是以加入碳粉(如铅笔笔芯粉末)和金属粉末,这时的硅脂有了导电的能力,在电脑运行时渗到CPU表面的电容上和插槽后果不堪设想。平时在摆弄CPU时要注意身体上的静电,特别在秋冬季节,消除方法可以是事前洗洗手或双手接触一会儿金属水管之类的导体,以保安全。CPU核心详解核心(Die)又称为内核,是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种C
22、PU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。 为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。 不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium 4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型
23、都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.P、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket 370,Socket A,Socket 478,Socket T,Slot 1、Socket 940等等)、前端总线频率(FSB)等等。因此,核心类型在某种程度上决定了CPU的工作性能。 一
24、般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium 4 1.8A GHz就要比Willamette核心的Pentium 4 1.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期Willamette核心Socket 423接口的Pentium 4的实际性能不如Socket 370接口的Tualatin核心的Pentium III和赛扬,现在的低频Prescott核心Pentium 4的实际性能不如同频的N
25、orthwood核心Pentium 4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。 CPU核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低CPU的生产成本从而最终会降低CPU的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个CPU内部有2个或更多个核心)等。CPU核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的CPU。 Athlon XP的核心类型 Athlon XP有
26、4种不同的核心类型,但都有共同之处:都采用Socket A接口而且都采用PR标称值标注。Palomino 这是最早的Athlon XP的核心,采用0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。Thoroughbred 这是第一种采用0.13um制造工艺的Athlon XP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。Thorton 采用0.13um制造工艺,核心电压1
27、.65V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为333MHz。可以看作是屏蔽了一半二级缓存的Barton。Barton 采用0.13um制造工艺,核心电压1.65V左右,二级缓存为512KB,封装方式采用OPGA,前端总线频率为333MHz和400MHz。新Duron的核心类型AppleBred 采用0.13um制造工艺,核心电压1.5V左右,二级缓存为64KB,封装方式采用OPGA,前端总线频率为266MHz。没有采用PR标称值标注而以实际频率标注,有1.4GHz、1.6GHz和1.8GHz三种。Athlon 64系列CPU的核心类型Clawhammer 采用0.13
28、um制造工艺,核心电压1.5V左右,二级缓存为1MB,封装方式采用mPGA,采用Hyper Transport总线,内置1个128bit的内存控制器。采用Socket 754、Socket 940和Socket 939接口。Newcastle 其与Clawhammer的最主要区别就是二级缓存降为512KB(这也是AMD为了市场需要和加快推广64位CPU而采取的相对低价政策的结果),其它性能基本相同。 Athlon XP的核心类型 Athlon XP有4种不同的核心类型,但都有共同之处:都采用Socket A接口而且都采用PR标称值标注。Palomino 这是最早的Athlon XP的核心,采用
29、0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。Thoroughbred 这是第一种采用0.13um制造工艺的Athlon XP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。目前Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核
30、心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。 桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Prescott核心组成,每个? 目前Intel推出的双核心处理器有Pentium D和Pentium Extreme
31、 Edition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。 桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Pr
32、escott核心组成,每个核心拥有独立的1MB L2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。 MCH协调两颗核心之间的相互调用为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。由于采用Prescott内核,因此Pentium D也支持EM64T技术、XD bit安全技术。值得一提的是,Pent
33、ium D处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?因此为了减少双核心Pentium D架构复杂性,英特尔决定在针对主流市场的Pentium D中取消对Hyper-Threading技术的支持。同出自Intel之手,而且Pentium D和Pentium Extreme Edition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threa
34、ding)技术的支持。Pentium D不能支持超线程技术,而Pentium Extreme Edition则没有这方面的限制。在打开超线程技术的情况下,双核心Pentium Extreme Edition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。前言:受硬件发烧友追捧的Athlon 64处理器在2004年下半年开始改用90nm制程的新核心。目前,90nm K8 Winchester核心已经广泛应用在Socket 939 Athlon 64 3000+、3200+和3500+和Socket 939、754 Sempron处理器系列中。然而Winchester并不能完全取代此
35、前采用130nm制程的Athlon 64处理器核心。之所以这样,里面有诸多原因,其中最大的问题是Winchester核心的频率提升潜力的并不是很理想。与130nm核心相比,尽管它拥有较低的电源消费量及热量,但基于Winchester核心的处理器最大实际工作频率仅仅只有2.2GHz。这也是为什么拥有2.4GHz和2.6GHz核心频率的Athlon 64顶级型号及Athlon 64 FX-55仍然基于采用0.13微米制程的Newcastle和ClawHammer旧核心的原因。然而,AMD宣称将在2005年4月开始停产基于旧制程核心的Athlon 64处理器了。正是在这种情况下,第一款基于Winch
36、ester核心的处理器诞生了!AMD公司的工程师们已经完成了大量工作。他们设计了一个新的90nm Venice核心(E3改进版),它应该会让130nm旧核心成为历史。对新核心寄予的巨大希望是基于这个事实的:AMD开始引入专门对Venice核心使用的新生产标准了。当然,这个新核心并不仅仅只用来取代低频Athlon 64型号的Winchester核心、将新功能性、新特性能引入到了这些处理器之中那么简单,同时也将取代在顶级Athlon 64处理器中使用的Newcastle和ClawHammer核心。而且Venice的到来为更快的Athlon 64处理器型号的发布亮起了绿灯。在不远的将来,AMD预计会
37、发布基于Venice和San Diego核心(San Diego是Venice的改进版,具有更大的L2缓存)的Athlon 64 4200+和Athlon 64 FX-57新处理器。那么新的Venice核心将为Athlon 64 带来多大的新意思呢?这就是本文所要探讨的主要话题!一、Venice核心新在那里?三大新特性!1、Dual Stress Liner(DSL)技术在2004 年末,AMD和IBM联合公布在晶体管工艺领域取得突破。这两家公司的工程师共同开发了一项称为Dual Stress Liner的技术,可以将半导体晶体管的响应速度提高24。其实这技术背后的原理是相当简单的。事实上,D
38、SL很类似于英特尔在90nm生产技术中引入的应变硅技术。我们都知道,晶体管越微细化,运行速度就越高,但同时也会引发泄漏电流增加、开关效率降低,从而导致耗电和发热量的增加。而Dual Stress Liner通过向晶体管的硅层施加应力,同时实现了速度的提高与耗电量的降低。换句话说,DSL能改变硅之间的原子格,从而让晶体管获得更快的响应时间及更低的热量。在一种情况下硅原子是被“拉开”的,而在另一种情况下则是“挤在一起”的,这通过把它们移到一个具有要么伸展,要么压紧的原子格的氮化物封闭层上来实现。与Intel使用的应变硅不同,来自AMD和IBM的DSL能够被用于两种类型的晶体管:NMOS和PMOS(
39、具有n和p通道)而无需使用极难获得的硅锗层,硅锗层会增加成本,并且有可能影响芯片的产量。DSL这种双重性性,让它比英特尔的应变硅更有效:DSL可以将晶体管的响应速度提升24%,而应变硅能提供的最大改进在15-20%。并且更重要的是,AMD和IBM 这项新技术对产量及生产成本并没有任何负面影响。由于在生产时无需使用新的生产方法,所以使用标准生产设备和材料便可迅速展开量产。另外,配合使用硅绝缘膜构造(SOI,绝缘体上硅)与应变硅,还可生产性能更高、耗电更低的晶体管。新的Venice处理器核心是AMD第一款应用Dual Stress Liner技术的桌面处理器。这项新技术与目前的SOI技术共同使用可
40、以让基于Venice的处理器能够达到更高的核心工作时钟频率。AMD工程师们预料,Dual Stress Liner和SOI一起结合可以让Athlon 64处理器的频率潜力有大约16的增长。换句话说,基于Venice的CPU应该拥有达到2.8GHz的标称频率。2、支持SSE3指令集在生产技术转换过程中也引入了一些更具切实意义的东西。我们应该首先指出Venice处理器核心所支持的SIMD指令集有所扩展。目前基于Venice核心上的Athlon 64已经提供对SSE3指令的支持,就象基于象基于Prescott核心的Pentium 4处理器一样。然而,需要提醒你的是SSE3并不是一个完整的指令集,但仅
41、仅只是SSE2指令集的扩展版本。因此,Venice所支持SSE3指令集包括11条新指令:(1)ADDPS,HSUBPS,HADDPD,HSUBPD这几条是优化命令,它们能有效地优化标量向量乘积的计算,可以对程序起到自动优化的作用。这些指令对处理3D图形相当有用。(2)ADDSUBPS,ADDSUBPD,MOVSHDUP,MOVSLDUP,MOVDDUP这几条属于数据处理指令,这些指令可以简化复杂数据的处理过程,由于未来数据处理流量将会越来越大,因此Intel在这里应用的指令集最多、达到了五条。(3)FISTTP这属于数据传输命令,它有利于x87浮点转换成整数,并可以大大提高优化的效率。(4)L
42、DDQU这属于特殊处理命令,这条指令主要针对视频解码,用来提高处理器对处理媒体数据结果的精确性。在P4中SSE3还包括MONITOR、MWAIT两条指令,而在Venice核心中已经被省去了,因为它们只对Hyper-Threading技术起作用。因此,基于Venice核心上的新Athlon 64处理器是目前支持最多SIMD指令集的处理器,包括3DNow!,SSE2和SSE3。从技术上来看,SSE3对于SEE2的改进非常有限,我们不应该期望SSE3指令集能为新Athlon 64带来大幅度的性能提升,而且性能提升也需要有软件支持为前提。尽管Intel在03年夏天就为软件开发者公布了SSE3指令指南,
43、但目前支持SSE3软件的软件寥寥无几,而且都是一些特殊应用程序。3、改良的整合内存控制器每推出一款新Athlon 64处理器核心,AMD工程师都会改良一下它们的整合内存控制器。虽然这可以在一定程度上增加处理器的性能,但更主要的是为了增加内存控制器对不同DIMM模块和不同配置的兼容性。此前基于采用90nm 制程、Winchester核心的 Athlon 64处理器当与4条DDR400 SDRAM内存模块搭配使用时,性能将会受到一定程度是限制。如果在一个基于Winchester 核心的Athlon 64处理器的系统中使用4条单面DDR400 ,那么这些内存模块只能工作在2T默认模式下,这将会这导致
44、使系统性能要比普通水准的性能低几个百分点。如果使用4条双面内存模块装,DDR400 SDRAM将不能工作在它默认工作频率下,工作频率将会自动降到333MHz。AMD工程师们承诺在新的Venice核心中解决这个问题,他们也的确实现了他们的承诺。基于Venice的Athlon 64处理器能够没有任何限制地与四条单面DDR400 SDRAM内存一起运行,并且如果安装了双面DDR400 SDRAM DIMM的话,它们能够以2T时钟工作在400MHz下。除了Venice内存控制器的兼容性得到改进外,内存控制器的性能也有显著的提升。在Venice运行在性能最佳模式时优,我们明显感受到增强型硬件数据预取和更
45、多的写入联合缓存区(4个代替2个)所带来的性能提升。所有这些改进正是基于Venice核心的Athlon 64处理器在同频下能胜过旧核心的原因,并且如果在系统中安装了四条内存模块的话,那性能提升将会更为明显。二、新产品,新的产品阵容线新90nmVenice核心将会应用到AMD所有Socket 939 Athlon 64处理器系列中。如果说此前的Winchester核心只能用于工作频率低于2.2GHz的处理器,那么Venice显然应该有助于改善这种情况。AMD从四月4日开始发布基于Venice核心的Socket 939 Athlon 64了,PR值从3000+到3800+。需要注意的是,3000+
46、,3200+和3500+ CPU型号将取代Winchester核心上的相应型号,而新的Athlon 64 3800+将取代Newcastle核心上的相应产品。 整个核心替换还将包括Athlon 64 4000+,它现在是基于ClawHammer核心的,拥有1MB L2缓存。四月十五日,AMD将开始推出基于San Diego核心的新Athlon 64 4000+处理器,它架构、功能与Venice一样,但拥有更大的L2缓存。下表中列出了基于新旧处理器核心的所有Socket 939 Athlon 64处理器,它们已经上市或短期内将现身:我们可以看到,基于Venice的CPU还有一个更令我们感到惊奇的
47、地方:动态电压。在对处理器内核心封装时,AMD采取了与Intel一样的手法基于Venice的处理器将不会在内核封装上标识电压。不同的CPU可能会有不同的电压:1.35V或1.4V。但不幸的是,我们以后从它的外观上将无法知道处理器的默认核心电压。至于在TDP(散热设计功率)方面,新的Venice核心的发热量看起来似乎与老版核心一样,然而实际上情况却并非如此。这一点已经得到证明:Venice拥有更大的频率提升潜力,这主要是因为优异的散热设计有效控制了热量的产生。基于Venice核心的Athlon 64在2.6GHz频率以下的功耗将只有89W,而只有在工作频率达到2.8GHz时才会达到更高一级TDP
48、标准104W。总而言之,Venice核心除了以上改进之外,它的内核尺寸及晶体管数量仍与Winchester一样。下面还是让我们看看首款采用Venice核心的Athlon 64处理器Athlon 64 3800+。这是Athlon 64处理器家族中新的顶级型号,它将在4月15日之前正式进入零售市场。基于新Venice内核的处理器看起来与它的前辈相差无己。不过,我们仍然可以从编号中辨出谁才最是新者。在处理器封装盖上,如果最后两个字母是“BP”的,就暗示这是最新的Venice核心(E3修正版)。下面是这款处理器在CPU-Z诊断工具所显示出来的相关信息:令人遗憾的是,最新CPU-Z 1.28版本仍然无法识别出Venice核心,但它检测出该核心支持SSE3,并显示了新处理器的ID号:00020FF0h。结语:尽管Venice核心仍然采用与老版核心相类似的内部架构,但从实际的观点上来看,他仍然显著地不同于前辈:Venice核心引入了DSL技术、SSE3指令集,成功拓展Athlon 64处理器频率提升潜力及功能性。因此,即使这个时候AMD决定不大肆宣扬新核心的发布,我们也不能忽视它为Athlon 64处理器家族的进一步发展展现