《芯片体系结构的发展.ppt》由会员分享,可在线阅读,更多相关《芯片体系结构的发展.ppt(35页珍藏版)》请在三一办公上搜索。
1、2023/9/15,1,芯片体系结构的发展,2023/9/15,2,硬件的层次结构,1.芯片级(chip level)2.板卡级(board and card level)3.设备级(equipment level)4.网络级(network level),2023/9/15,3,芯片的种类繁多,1.处理器芯片(processor chip)2.存储器芯片(memory chip)3.主板芯片组(chip set)4.BIOS芯片(rom bios)5.输入输出芯片(I/O chip)6.控制器芯片(controller chip)7.特殊芯片(network chipset,3-D chip
2、,video chip),2023/9/15,4,微处理器体系结构,体系结构是建筑学术语。计算机体系结构指概念性的结构和功能特性。过去,大型主机体系结构(Mainframe Architecture)例如1964年IBM 360,24位。1983年IBM 370-XA,32位。现在,微处理器体系结构(Microprocessor Architecture)。例如1978年Intel 8086,16位。1985年Intel 80386,32位。微体系结构比传统体系结构更丰富。,2023/9/15,5,芯片技术突飞猛进,2023/9/15,6,奔腾的位数,内部寄存器的宽度为32位,这决定了奔腾仍是
3、32位的微处理器,即IA-32体系结构。数据输入输出总线的宽度为64位。存储器地址总线的宽度:,2023/9/15,7,奔腾芯片的体系结构,1.超标量技术(Superscalar)双ALU2.超流水技术(Superpipeline)八级3.哈佛结构:指令Cache和数据Cache4.分支动态预测 5.固化常用指令6.数据总线的拓宽及突发模式7.采用PCI局部总线8.错误检测及校验技术9.电源效率技术 10.支持多重处理,2023/9/15,8,超标量技术,486及以前的芯片,一个时间只能执行一条指令。奔腾芯片始,同时能执行多于一条指令,这称为超标量技术。例如经典奔腾有两条整数指令流水线 U指令
4、流水线:CISC和RISC都执行 V指令流水线:只执行RISC指令还有一条浮点指令流水线(加、乘、除),因此能同时执行多个处理,以空间换取了时间。,2023/9/15,9,超流水线技术,通过细化流水、提高主频,使得在一个时间周期内能完成多个操作,称为超流水线技术。例如每条整数流水线都分为4级(指令预取、译码、执行、写回结果)浮点流水线则分为8级(指令预取、译码、执行、写回结果、两级浮点操作、一级4舍5入并写回结果、一级出错报告),2023/9/15,10,MMX技术,MMX技术指Multi Media Extension即多媒体扩展技术。在体系结构上的改进:1.内部L1高速缓存更大,改善软件运
5、行的特性。2.在处理器的指令系统中,扩展了57条指令,它们是单指令流多数据流(SIMD)的,能加快对视频、音频、图形和动画的循环处理。,2023/9/15,11,SSE技术,在奔腾III中首先出现。SSE是Streaming SIMD Extension的缩写,即流式单指令多数据扩展。在MMX的基础上,又增加了70条新指令,用于图形和声音处理。对高级图像处理、3D、流式音频和视频DVD回放、语音识别特别有用。,2023/9/15,12,NetBurst技术,这是奔腾IV体系结构的核心。20级超流水线技术、增强双精度浮点运算、快速执行引擎和400 MHz系统总线。具有高级传输高速缓存(芯片上的高
6、级缓存,而不是过去的分立的,延时更短)、执行跟踪高速缓存。多媒体单元又有144条新指令增强了性能、SSE-2即流式SIMD扩展2技术和先进的动态执行(同时执行100多条指令)技术。瞬时数据传输速率高达3.2Gbps。,2023/9/15,13,奔腾IV的特殊要求,奔腾IV有特殊的系统要求,例如支持NetBurst 体系结构的芯片组、固位装置和适当的 BIOS支持。奔腾IV要用特殊的主板,即基于Intel 850 AGP芯片组的主板。主板必须符合奔腾IV的电流和电压要求。奔腾IV的封装技术采用 423 针栅格阵列,即采用 Organic Land Grid Array(OLGA)技术。因此要用P
7、GA423 插座。插座上安装了集成的热量延展器(IHS),提供了将热量传导到散热片的途径,以便在处理器工作期间进行散热。,2023/9/15,14,进程与线程,60年代就提出“进程”(process)的概念。操作系统调度进程、分配资源、响应用户的请求。因此,进程既是拥有资源的单位,也是系统调度的单位。80年代又提出“线程”(thread)的概念。它是比进程更小的独立运行单位,一个进程由多个线程组成,让进程仍是拥有资源的单位,但调度单位却是线程。线程的创建与终止都容易而开销也小。Windows NT、OS/2、Unix都是多线程的程序。数据库管理系统和其他应用软件也引入线程而改善性能。,2023
8、/9/15,15,超线程技术的新徽标,Hyper 超Threading 线程HT Technology超线程技术,2023/9/15,16,新徽标的含义,一、支持超线程技术、主频 3.06 GHz 或以上的Intel 奔腾IV 处理器 二、支持超线程技术的Intel 芯片组 三、支持并实现超线程技术的系统 BIOS 四、针对超线程技术优化过的操作系统,2023/9/15,17,Intel的超线程技术,超线程技术,通俗地说就是“一芯二用”。在线程级的层次上实现并行处理。它能最大限度地利用处理器资源,使一个处理器同时运行两个独立的软件线程,使电脑能更高效地工作。,2023/9/15,18,超线程系
9、统的优势,提高多任务环境下的系统响应能力,使用户能够在更少的时间内完成更多的工作。提高当前或未来采用超线程技术的多线程应用的性能。通过扩大高峰负载的性能,为用户带来增值的优势。为IT部门提供灵活性,能在更安全、更可靠和可管理的计算基础设施上运行重要的后台应用,而不会影响用户的正常使用或工作效率。,2023/9/15,19,支持超线程技术的操作系统,针对超线程技术优化过的台式机操作系统包括:Microsoft Windows XP 家用版和专业版、基于 2.4.18 或更高内核版本的 Linux 操作系统。尽管基于 Linux 操作系统的 PC 机可能会满足上述平台要求,能够实现超线程技术,但在
10、近期这些系统将不会具备带有超线程徽标的全新奔腾 IV 处理器。购买基于 Linux 操作系统的 PC 机时,请注意与PC 供应商确认所购 PC 机是否满 足上述平台要求,能否实现超线程技术。,2023/9/15,20,板卡的组成,(1)CPU 行政机构(2)存储器楼堂馆所、广场(3)芯片组交通控制枢纽(4)总线大街小巷、高速公路(5)插槽车站、码头、机场(6)电源设在远郊的发电厂,2023/9/15,21,主板的分类,1.按CPU芯片分类 如486主板、奔腾主板、奔腾IV主板2.按存储器大小分类 如8M主板、16M/32M主板、64M主板3.按主机板规格分类 如AT主板、Baby-AT主板、A
11、TX主板4.按芯片组分类 如TX主板、LX主板、BX主板5.按是否支持PnP分类 如PnP主板、非PnP主板(遗留主板),2023/9/15,22,主板的分类(续),6.按CPU插座分类 如Socket 7主板、Slot 1主板7.按系统总线的带宽分类 如66MHz主板、100MHz主板8.按数据端口分类 如SCSI主板、EDO主板、AGP主板9.按扩展槽分类 如ISA/EISA/MCA/PCI/VL/USB等主板10.按生产厂家分类 如微星主板、青云主板、联想主板等,2023/9/15,23,芯片组的由来,在最初IBM PC的主板上,除微处理器8088、协处理器8087外,还有时钟发生器82
12、84、总线控制器8288、系统定时器8253、中断控制器8259、DMA控制器8237、键盘控制器8255等芯片。1986年Chip and Technologies公司推出革命性的82C206芯片,用它代替多个芯片,开创了芯片组的市场。,2023/9/15,24,INTEL介入芯片组,80286问世后,两年多才出现第一块286主板。80386问世后,也一年多才有第一块386主板。这都不是Intel的速度(以及质量)。于是1989年4月Intel随80486一起推出420芯片组,数月后就有了486主板。1993年Intel在推出奔腾的同时,推出了430 LX芯片组,而且推出了全部完成的奔腾主板
13、。,2023/9/15,25,INTEL芯片组概况,Intel芯片组通常有 两块:北桥和南桥,2023/9/15,26,系统总线的结构,PC总线以其快慢分为不同等级:(1)处理器外部总线:64位宽,66MHz、100MHz,并与存储器及北桥连接(2)AGP(图形加速端口)总线:32位宽,66MHz,与高速显卡及南桥连接(3)PCI(外部设备互连)总线:32位宽,33MHz,并与I/O超级芯片连接(4)ISA(工业标准体系结构)总线:16位宽,8MHz,2023/9/15,27,主板的规格,Baby-AT(1983-1996)Full-Size AT(1984,尺寸太大)LPX(1987由Wes
14、tern Digital设计,半专用)ATX(1995.7由Intel正式颁布,很流行)Micro-ATX(1997.12由Intel颁布)Flex-ATX(1999.3由Intel颁布)NLX(1996.11由Intel颁布)WTX(1998.9,用于中高档服务器)其他,2023/9/15,28,奔腾IV的芯片组,2000年11月Intel发布了支持奔腾IV的850芯片组,北桥为MCH 82850,南桥为ICH2 82801。它们有比较高的整体性能,但价格高,而且它支持的是昂贵的RDRAM、带宽也有问题。最近,2002年9月10日Intel又发布了845芯片组。北桥为MCH 82845,南桥
15、未变。这似乎是退了一步,但是“退一步,进两步”。关于其中的奥妙,本次活动另有同行演讲。,2023/9/15,29,安腾:IA-64的体系结构,1999年10月4日Intel发布了64位的品牌安腾。安腾的核心技术是显性并行指令计算,EPIC即Explicitly Parallel Instruction Computing。超越了CISC与RISC的设计理念,它基于预测、推理、简明并行性等创新特性,实现了更高的指令级并行性。其实,EPIC技术建立在丰满的流水线、寄存器的基础上。安腾有10条流水线、128个整数寄存器、128个浮点寄存器、8个分支寄存器、64个分支预测寄存器。通过优化编译,提前安排
16、装入指令,从而最大限度地减少分支损耗。安腾处理器能同时完成20个操作或交易,从而实现了高端企业级用户所需服务器的一流性能。,2023/9/15,30,安腾的结构,采用一体化的三级高速缓存。靠近CPU的一级高速缓存为32K,分别给数据16K、指令16K。其映射方式是4路成组相联(4-way set associative)。二级高速缓存96K,6路成组相联结构。三级高速缓存为2M或4M,也用4路成组相联结构。成组相联映射既有直接映射(direct mapped)的简单快速,又有全相联映射(fully associative)的冲突概率低、空间利用率高等优点。因此,能使高度并行的流水线全速运行。一
17、体化是指用同样的集成工艺实现,安腾的CPU有2500万个晶体管,而高速缓存用了3亿个。,2023/9/15,31,安腾的纠错与兼容,安腾具有完善的“机器检验体系结构”(MCA)。对于系统总线、高速缓存进行传输的数据都有先进的错误检测、纠正和处理能力。对于机器的运行也有全面的错误记录。纠正错误后,提供通知,使操作平台保留这些数据,以便将来采取保护措施和制定系统维护决策。为了保护投资利益,在硬件上建立了与IA-32指令的二进制兼容性。许多厂商为企业服务器、工作站及技术解决方案开发了优化的软件。这些软件与未来的安腾体系结构也是完全兼容的。,2023/9/15,32,安腾的形象,当年发布奔腾芯片时,英
18、特尔总裁强调:奔腾是因特网芯片(Internet chip),它将改善您对因特网的感受,使互动多媒体更加逼真、更加栩栩如生。但是,现在对安腾的宣传则是:安腾是因特网经济内部的引擎(Itanium is the Engine inside the Internet Economy),2023/9/15,33,安腾已经进入GFLOPS,在超级计算领域,常用FLOPS表示运算的速度,即每秒运算的浮点指令数。当然,它的前面常要冠以K、M、G、T等前缀,成为KFLOPS、MFLOPS、GFLOPS、TFLOPS。事实上,早期克雷巨型机(Cray-1)的运算速度只有160MFLOPS,而今天的安腾已经达到6.4GFLOPS。可见它比Cray-1快了40倍。,2023/9/15,34,INTEL的TFLOPS超级电脑,美国能源部的计算机模拟要求更高速的电脑。它建立了ASCI项目,即Accelerated Strategic Computing Initiative。Intel为此研制了超级电脑,1997年完成。MP LINPACK的记录是1.34 TFLOPS。它采用了9152个奔腾(Pentium Pro)芯片。科学研究需要的计算能力是没有止境的。,2023/9/15,35,谢谢大家,刘瑞挺,