3.1.嵌入式处理器.ppt

上传人:sccc 文档编号:5345114 上传时间:2023-06-28 格式:PPT 页数:65 大小:1.16MB
返回 下载 相关 举报
3.1.嵌入式处理器.ppt_第1页
第1页 / 共65页
3.1.嵌入式处理器.ppt_第2页
第2页 / 共65页
3.1.嵌入式处理器.ppt_第3页
第3页 / 共65页
3.1.嵌入式处理器.ppt_第4页
第4页 / 共65页
3.1.嵌入式处理器.ppt_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《3.1.嵌入式处理器.ppt》由会员分享,可在线阅读,更多相关《3.1.嵌入式处理器.ppt(65页珍藏版)》请在三一办公上搜索。

1、嵌入式处理器,邬惠峰,内容安排,嵌入式处理器体系结构,典型嵌入式处理器,嵌入式处理器开发,多核技术,什么是嵌入式处理器,内容安排,嵌入式处理器体系结构,典型嵌入式处理器,嵌入式处理器开发,多核技术,什么是嵌入式处理器,后PC时代,有一种东西,更加明显地,把整个半导体产业链粘合在一起。这种东西叫做:“用户的真正需求”。衣服的例子,各种SOC,各种OS,技术特点各异的板级设计,不同消费取向的消费者,差异化的产品,通用,定制化,什么是用户的真正需求,产品的生产厂商:挖掘消费者内心需求,向产业链的高端寻求技术的可行性;板级的设计者:进一步抽象各个产品厂家的需求,在更基础的平台上各种嵌入式SoC处理器和

2、嵌入式操作系统选择实现的方案;芯片业者:调研板级设计者的真实需求。,什么样的东西应该集成?什么样的东西应该给予设计者灵活性?什么样的部件应该在SoC内部预留更多的资源?什么样的功能应该由OS去做而不是硬件化?芯片设计者真实的苦恼是不知道自己该设计出什么,而不是自己如何实现这个设计。,嵌入式时代的产业链价值核心,PC时代,Intel与Microsoft最大,核心价值全部掌握在他们的手里,他们对产业链下游具有生杀予夺的权力,PC作为一种产品,其模式非常固定。现在:谁能够找到用户的真正需求,谁将是产业链条中的王者。,嵌入式处理器特点,嵌入式系统的核心部件是各种类型的嵌入式处理器,目前据不完全统计,全

3、世界嵌入式处理器的品种总量已经超过1000多种;流行体系结构有30几个系列,其中8051体系的占有多半。生产8051单片机的半导体厂家有20多个,共350多种衍生产品,仅Philips有近100种。现在几乎每个半导体制造商都生产嵌入式处理器,越来越多的公司有自己的处理器设计部门。,嵌入式处理器的特点,继承了整个PC机时期的技术成就;种类多;面向应用的专用芯片;新技术的不断应用;使用寿命长;低功耗、低电压,内容安排,嵌入式处理器体系结构,典型嵌入式处理器,嵌入式处理器开发,多核技术,什么是嵌入式处理器,嵌入式硬件系统嵌入式处理器各种类型存储器模拟电路及电源接口控制器及接插件,调试接口,核心处理器

4、,外围电路和存储器,外部设备,嵌入式系统的软件结构,软件系统实时操作系统(RTOS)协议栈(Protocol Stack)应用程序(Application),应用程序(Applications),嵌入式软件系统设备驱动(Device Driver)板级支持包(BSP)实时操作系统(RTOS)协议栈(Protocol Stack)应用程序(Application),硬件层,系统软件层,应用层,存储结构 冯诺依曼结构 哈佛结构,指令结构 RISC CISC VILW,体系结构,什么是指令系统,指令一般含义:指明要执行的操作以及操作的对象.指令系统CPU依靠指令来计算和控制系统 CPU在设计时就规定

5、了一系列与其硬件电路相配合的指令系统指令系统指CPU能识别和执行的所有指令集合,指令系统,CISC:Complex Instruction Set Computer RICS:Reduced Instruction Set Computer VLIW:Very Long(Large)Instruction Word,CISC,计算机性能的提高往往是通过增加硬件的复杂性来获得随着集成电路技术(特别是VLSI)的迅速发展,为了软件编程方便和提高程序的运行速度,硬件工程师采用的办法是不断增加可实现复杂功能的指令和多种灵活的编址方式。使硬件越来越复杂,造价也相应提高为实现复杂操作,微处理器除向程序员提

6、供类似各种寄存器和机器指令功能外还通过存于只读存贮器(ROM)中的微程序来实现其极强的功能 分析每一条指令之后执行一系列初级指令运算来完成所需的功能,这种设计的型式被称为复杂指令集计算机(Complex Instruction Set Computer-CISC)结构一般CISC计算机所含的指令数目至少300条以上,有的甚至超过500条日益庞大的指令系统不仅使计算机研制周期变长,而且还有难以调试、难以维护等一些自身无法克服的缺点。比如,IBM公司的大、中型计算机,Intel公司的8086、80286、80386微处理器等。,RISC,采用复杂指令系统的计算机有着较强的处理高级语言的能力,对提高

7、计算机的性能是有益的IBM公司在纽约Yorktown的JhomasI.Wason研究中心于1975年组织力量研究指令系统的合理性问题,因为当时已感到,日趋庞杂的指令系统不但不易实现而且还可能降低系统性能1979年以帕特逊教授为首的一批科学家也开始在美国加州大学伯克莱分校开展这一研究结果表明,CISC存在许多缺点首先在这种计算机中各种指令的使用率相差悬殊:一个典型程序的运算过程所使用的80指令只占一个处理器指令系统的20事实上最频繁使用的指令是取、存和加这些最简单的指令也就是说,机器执行的指令中85左右的都是简单指令,复杂指令甚少,这样-来,长期致力于复杂指令系统的设计,实际上是在设计一种难得在

8、实践中用得上的指令系统的处理器同时复杂的指令系统必然带来结构的复杂性这不但增加了设计的时间与成本还容易造成设计失误尽管VLSI技术现在已达到很高的水平,但也很难把CISC的全部硬件做在一个芯片上,这也妨碍单片计算机的发展在CISC中,许多复杂指令需要极复杂的操作,这类指令多数是某种高级语言的直接翻版,因而通用性差降低被频繁调用的简单指令系统的运行速度针对CISC的这些弊病帕特逊等人提出了精简指令的设想指令系统只包含那些使用频率很高的少量指令提供一些必要的指令以支持操作系统和高级语言按照这个原则发展而成的计算机被称为精简指令集计算机(Reduced Instruction Set Compute

9、r-RISC)结构简称RISC,CISC(复杂指令集计算机)和RISC(精简指令集计算机)是当前CPU的两种架构。它们的区别在于不同的CPU设计理念和方法。早期的CPU全部是CISC架构,它的设计目的是要用最少的机器语言指令来完成所需的计算任务。如对于乘法运算,在CISC架构的CPU上,需要一条指令:MUL ADDRA,ADDRB就可以将ADDRA和ADDRB中的数相乘并将结果储存在ADDRA中。将ADDRA,ADDRB中的数据读入寄存器,相乘和将结果写回内存的操作全部依赖于CPU中设计的逻辑来实现。增加CPU结构的复杂性和对CPU工艺的要求对于编译器的开发十分有利。比如上面的例子,C程序中的

10、a*=b就可以直接编译为一条乘法指令。RISC的理念是使用简单的指令,降低硬件复杂度如上例子,MOV A,ADDRA;MOV B,ADDRB;MUL A,B;STR ADDRA,A。这种架构可以降低CPU的复杂性以及允许在同样的工艺水平下生产出功能更强大的CPU对编译器的设计有更高的要求,CISC和RISC的区别,指令系统:RISC设计者把主要精力放在那些经常使用的指令上,尽量使它们具有简单高效的特色。对不常用的功能,常通过组合指令来完成。因此,在RISC机器上实现特殊功能时,效率可能较低。但可以利用流水技术和超标量技术加以改进和弥补。而CISC计算机的指令系统比较丰富,有专用指令来完成特定的

11、功能。因此,处理特殊任务效率较高。存储器操作:RISC对存储器操作有限制,使控制简单化;而CISC机器的存储器操作指令多,操作直接。程序:RISC汇编语言程序一般需要较大的内存空间,实现特殊功能时程序复杂,不易设计;而CISC汇编语言程序编程相对简单,科学计算及复杂操作的程序社设计相对容易,效率较高。,中断:RISC机器在一条指令执行的适当地方可以响应中断;而CISC机器是在一条指令执行结束后响应中断。CPU:RISCCPU包含有较少的单元电路,因而面积小、功耗低;而CISC CPU包含有丰富的电路单元,因而功能强、面积大、功耗大。设计周期:RISC微处理器结构简单,布局紧凑,设计周期短,且易

12、于采用最新技术;CISC微处理器结构复杂,设计周期长。用户使用:RISC微处理器结构简单,指令规整,性能容易把握,易学易用;CISC微处理器结构复杂,功能强大,实现特殊功能容易。应用范围:由于RISC指令系统的确定与特定的应用领域有关,故RISC机器更适合于专用机;而CISC机器则更适合于通用机。,RISC特点1.有限、简单的指令集2.CPU配备大量的通用寄存器3.强调对指令流水线的优化4.使用等长指令5.寻址方式少,绝不出现存储器间接寻址6.指令集中指令数一般少于100条,指令格式少于4种7.指令功能简单,控制器多采用硬布线方式等。,精简指令系统计算机RISC的指令系统精简了,复杂指令系统计

13、算机CISC的一条指令,在RISC中要用一串指令才能实现,那么,为什么RISC执行程序的速度比CISC还要快呢?,PICPIT 其中:P是执行这个程序所使用的总的时间;I是这个程序所需执行的总的指令条数;CPI是每条指令执行的平均周期数;T是一个周期的时间长度。,程序所执行的总的指令条数I由于RISC的指令都比较简单,CISC中的一条复杂指令所完成的功能在RISC中可能要用几条指令才能实现。对于同一个源程序,分别编译后生成的动态目标代码,显然RISC的要比CISC的多。由于CISC中复杂指令使用的频度很低,程序中使用的绝大多数指令都是与RISC一样的简单指令,因此,实际上的统计结果表明,RIS

14、C的I长度只比CISC的长30至40。,指令平均执行周期数CPI由于CISC一般是用微程序实现的,一条指令往往要用好几个周期才能完成,一些复杂指令所要的周期数就更多。据统计,大多数CISC处理机,指令平均执行周期数CPI在4到6。RISC的大所数指令都是单周期执行的,它们的CPI应该是1。由于RISC中还有LOAD和STORE指令,也还有少数复杂指令,所以,CPI要略大于1。SUN公司的SPARC处理机的CPI为1.3到1.4,SGI公司的MIPS处理机的CPI为1.1到1.2。,一个周期的时间长度TRISC一般采用硬布线逻辑实现,指令要实现的功能都比较简单,所以,RISC的T通常要比CISC

15、的T小。目前使用中RISC处理机的工作主频一般要比CISC处理机高。,RISC的速度要比CISC快3倍左右。其中的关键在于RISC的指令平均执行周期数CPI减小了,这正是RISC设计思想的精华减小CPI是多个方面共同努力的结果在硬件方面,采用硬布线控制逻辑,减少指令和寻址方式的种类,使用固定的指令格式,采用LOAD/STORE结构指令执行过程中设置多级流水线等软件方面强调优化编译技术的作用,流水线,不同功能部件指令并行执行,Decode,Fetch,Execute,从存储器中读取指令,解码指令中用到的寄存器,寄存器读(从寄存器Bank)移位及ALU操作寄存器写(到寄存器Bank),三级最佳流水

16、,该例中用8个时间片执行了6条指令所有的操作都在寄存器中(单周期执行),操作,1 2 3 45 6,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Decode,Execute,Fetch,Decode,Fetch,Fetch,利用并行性是始终贯穿计算机体系结构的思想,网络级并行,多处理器Multi processor,多核Multicore,指令级并行(ILP),网络并行,cluster,distribute,grid每个节点是独立

17、机器,多个CPU,进程并行每个处理器独立memory,多个CPU核每个核心有独立部件,多条指令并行只有特定运算部件是独有的,超标量(Super Scalar)超级流水线(Super Pipeline)超长指令字(VLIW)向量机(Vector Machine)SIMD技术,超标量(Super Scalar)将一条指令分成若干个周期处理以达到多条指令重叠处理,从而提高cpu部件利用率的技术叫做标量流水技术.超级标量是指cpu内一般能有多条流水线,这些流水线能够并行处理在单流水线结构中,指令虽然能够重叠执行,但仍然是顺序的,每个周期只能发射(issue)或退休(retire)一条指令.超级标量结构

18、的cpu支持指令级并行,每个周期可以发射多条指令(2-4条居多).这样,可以使得cpu的IPC(Instruction Per Clock)1,从而提高cpu处理速度.超级标量机能同时对若干条指令进行译码,将可以并行执行的指令送往不同的执行部件,在程序运行期间,由硬件(通常是状态记录部件和调度部件)来完成指令调度.超级标量机主要是借助硬件资源重复(例如有两套译码器和ALU等)来实现空间的并行操作.pentium系列(可能是p-II开始),还有SUN SPARC系列的较高级型号,以及MIPS若干型号等都采用了超级标量技术.,超级流水线(Super Pipeline)超级流水线又叫做深度流水线,它

19、是提高cpu速度通常采取的一种技术。CPU处理指令是通过Clock来驱动的,每个clock完成一级流水线操作。每个周期所做的操作越少,那么需要的时间久越短,时间越短,频率就可以提得越高。所以超级流水线就是将cpu处理指令是得操作进一步细分,增加流水线级数来提高频率。频率高了,当流水线开足马力运行时平均每个周期完成一条指令(单发射情况下),这样cpu处理得速度久提高了。当然,这是理想情况下,一般是流水线级数越多,重叠执行的执行就越多,那么发生竞争冲突得可能性就越大,对流水线性能有一定影响。现在很多cpu都是将超标量和超级流水线技术一起使用,例如pentium IV,流水线达到20级,频率最快已经

20、超过3GHZ,超长指令字(VLIW)超长指令字是由美国Yale大学教授Fisher提出的。它有点类似于超级标量,是一条指令来实现多个操作的并行执行,之所以放到一条指令是为了减少内存访问。通常一条指令多达上百位,有若干操作数,每条指令可以做不同的几种运算。那些指令可以并行执行是由编译器来选择的。通常VLIW机只有一个控制器,每个周期启动一条长指令,长指令被分为几个字段,每个字段控制相应的部件。由于编译器需要考虑数据相关性,避免冲突,并且尽可能利用并行,完成指令调度,所以硬件结构较简单。融合了CISC和RISC的优点,向量机(Vector Machine)平时接触的计算机都是标量机,向量机都是大型

21、计算机,一般用于军事工业,气象预报,以及其他大型科学计算领域普通的计算机所做的计算,例如加减乘除,只能对一组数据进行操作,被称为标量运算。向量运算一般是若干同类型标量运算的循环。向量运算通常是对多组数据成批进行同样运算,所得结果也是一组数据。很多做科学计算的大(巨)型机都是向量机,例如国产银河。,SIMD技术单指令多数据(Single Instruction Multiple Data)简称SIMD。SIMD结构的CPU有多个执行部件,但都在同一个指令部件的控制下。以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第

22、二个操作数;随后才能进行求和运算。在SIMD型CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有操作数进行运算。这个特点使得SIMD特别适合于多媒体应用等数据密集型运算。AMD公司的3D NOW!技术其实质就是SIMD。,存储结构,冯.诺依曼结构(普林斯顿结构)哈佛结构,冯诺依曼体系结构,哈佛体系结构,比较,地址,数据,主存储器MOV r8,#8,CPU,PC,指令,程序存储器,CPU,PC,地址,数据存储器MOV r8,#8,地址,数据,冯诺依曼结构,哈佛结构,内容安排,嵌入式处理器体系结构,典型嵌入式处理器,嵌入式处理器开发,多核技术,什么是嵌入式处理器,嵌入式处理器的种类,嵌入

23、式微处理器(Embedded Microprocessor Unit,EMPU)嵌入式微控制器(Microcontroller Unit,MCU)嵌入式DSP处理器(Embedded Digital Signal Processor,EDSP)嵌入式片上系统(System On Chip,SOC)元件可编程逻辑门阵列(System On Chip,FPGA),MPU,嵌入式微处理器是由通用计算机中的CPU演变而来的。它的特征是具有32位以上的处理器,具有较高的性能价格也相应较高。只保留和嵌入式应用紧密相关的功能硬件,去除其他的冗余功能部分,这样就以最低的功耗和资源实现嵌入式应用的特殊要求。和工

24、业控制计算机相比,嵌入式微处理器具有体积小、重量轻、成本低、可靠性高的优点。目前主要的嵌入式处理器类型有Am186/88、386EX、SC-400、Power PC、68000、MIPS、ARM/StrongARM系列等。,MCU,嵌入式微控制器的典型代表是单片机,从70年代末单片机出现到今天位的电子器件目前在嵌入式设备中仍然有着极其广泛的应用。单片机芯片内部集成ROM/EPROM、RAM、总线、总线逻辑、定时/计数器、看门狗、I/O、串行口、脉宽调制输出、A/D、D/A、Flash RAM、EEPROM等各种必要功能和外设。和嵌入式微处理器相比,微控制器的最大特点是单片化,体积大大减小,从而

25、使功耗和成本下降、可靠性提高。微控制器是目前嵌入式系统工业的主流。微控制器的片上外设资源一般比较丰富,适合于控制,因此称微控制器。比较有代表性的包括8051、MCS-251、MCS-96/196/296、P51XA、C166/167、68K系列以及 MCU 8XC930/931、C540、C541,并且有支持I2C、CAN-Bus、LCD及众多专用MCU和兼容系列。目前MCU占嵌入式系统约70的市场份额。,DSP,DSP处理器是专门用于信号处理的处理器系统结构和指令算法方面进行了特殊设计,具有很高的编译效率和指令的执行速度。在数字滤波、FFT、谱分析等各种仪器上DSP获得了大规模的应用。198

26、2年世界上诞生了首枚DSP芯片。其运算速度比MPU快了几十倍,在语音合成和编码解码器中得到了广泛应用。至80年代中期,随着CMOS(互补金属氧化物半导体,是一种大规模应用于集成电路芯片制造的原料)技术的进步与发展,第二代基于CMOS工艺的DSP芯片应运而生,其存储容量和运算速度都得到成倍提高,成为语音处理、图像硬件处理技术的基础。到80年代后期,DSP的运算速度进一步提高,应用领域也从上述范围扩大到了通信和计算机方面。90年代后,DSP发展到了第五代产品,集成度更高,使用范围也更加广阔。目前最为广泛应用的是TI的TMS320C2000/C5000系列,另外如Intel的MCS-296和Siem

27、ens的TriCore也有各自的应用范围。,SOC,20世纪90年代中期,因使用ASIC(Application-Specific Integrated Circuits)实现芯片组受到启发,萌生应该将完整计算机所有不同的功能块一次直接集成于一颗硅片上的想法。这种芯片,初始起名叫System on a Chip(SoC)如何界定SoC,认识并未统一。但可以归纳如下:SoC应由可设计重用的IP核组成,IP核是具有复杂系统功能的能够独立出售的VLSI块;IP核应采用深亚微米以上工艺技术;SoC中可以有多个MPU、DSP、MCU或其复合的IP核。,FPGA,Field Programmable Ga

28、te Array,元件可编程逻辑门阵列作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。FPGA采用了逻辑单元阵列LCA(Logic Cell Array)这样一个新概念,内部包括可配置逻辑模块CLB(Configurable Logic Block)、输出输入模块IOB(Input Output Block)和内部连线(Interconnect)三个部分。Xilinx 和 Altera 是目前 FPGA 的领导厂商,ARM核MIPS核PowerPC核68K/COLDFIRE核,内容安排,嵌入式处理器体系结构,典型嵌入

29、式处理器,嵌入式处理器开发,多核技术,什么是嵌入式处理器,什么是多核处理器?,两个或多个独立运行的内核集成于同一个处理器上面双核处理器=一个处理器上包含2个内核多核处理器=一个处理器上包含2个或多个内核,为什么要采用多核技术?,最终目标:提升用户的体验,摩尔定律 不断发展和改进处理器的性能最大限度地利用越来越多的晶体管实现最优的价值缩减处理时间,提高计算能力开发平台的新特性和新功能,多核技术的发展,Pentium 4with HT,Dual Xeon Processors,Dual Core,2 Threads1 Package,2 Threads2 Packages,2 Threads1 P

30、ackage,Two independent execution cores in the same processor,几种不同的技术,HT Hyper Threading:2 threads running on the same processor core处理器上的某些资源会被共享使用相同的缓存和运算器DC Dual Core:2 execution cores in the same processor package共享系统总线与双处理器的性能相同DP/MP Dual/Multi-Processing:2 or more processors in the same system只

31、共享系统总线,独立缓存高性能,资源冲突少,双核技术 VS.超线程技术,双核是真正意义上的双处理器 不会发生资源冲突每个线程拥有自己的缓存、寄存器和运算器一个3.2GHz Smithfiled在性能上并非等同于3.2GHz P4 with HT 的2倍HT 使处理器的性能至少提升了1/3 双核的性能相当于2块 non-HT 处理器双核技术与HT技术在性能上的对比Ex 1:两个floating point线程(Smithfield client)每个线程拥有自己的FPU,没有资源冲突尽管性能上没有提升太多,但仍然优于HTEx 2:一个integer线程与一个floating point线程性能大幅度提升没有资源冲突,多核 VS HT,HT与多核不同的是核心资源是共享的,如ALU等.而核心资源在多核平台是独立的当你的多个线程同时有大量计算时,HT平台只能在线程间作切换,多核平台却可平行计算.HT 是 Intel Netburst 架构处理器特有的技术,HT 技术实质上通过增加一组寄存器和指令调度机制实现两个指令入口,模拟出 2 个 CPU,由于共享执行单元、缓存、总线,所以对性能提高很有限,大约提高 20%30%,双核心理论上能够提高接近 100%的性能。,Thank You!,Add your company slogan,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号