《补充ppt课件 中央处理器.ppt》由会员分享,可在线阅读,更多相关《补充ppt课件 中央处理器.ppt(124页珍藏版)》请在三一办公上搜索。
1、计算机组成原理,教材:白中英,计算机组成原理(第四版),科学出版社,课程设计的要求,课程设计:期中测验之后启动,第 16周完成 。选题:课程知识体系内任何知识点实现:建议采用HDL,可以不受此限制,允许自行选择。成果递交:模拟实现(包括试验过程数据)、论文(单独完成),第16周全部完成。组队:允许个人或组队(一般不超过3人),但要明确分工,论文单独完成评分标准:符合知识体系要求,验证通过,达到基本要求,及格;选题有一定难度,中等;论文描述较好,良好;有创新,有理论或实用参考意义,优秀,中央处理器,5.1 CPU的功能和组成 5.7 传统CPU5.2 指令周期 5.8 流水CPU 5.3 时序产
2、生器和控制方式 5.9 RISC CPU5.4 微程序控制器 5.10 多媒体CPU 5.5 微程序设计技术 5.11 中断逻辑5.6 硬布线控制器 5.12 流水技术,5.1 CPU的功能和组成,现代计算机所遵循的仍然是冯.诺依曼的“存储程序、程序控制”思想 程序告诉计算机:应该逐步执行什么操作;在什么地方找到用来操作的数据,结果存到何处等 中央处理器是控制计算机自动完成取出指令和执行指令任务的部件。它是计算机的核心部件,通常简称为CPU(Central Processing Unit),5.1.1 CPU的功能, 指令控制 保证机器按程序规定的顺序取出执行, 操作控制 CPU产生每条指令所
3、对应的操作信号,并把各种操作信号送往相应的部件,从而控制这些部件按指令的要求进行动作, 时间控制 对各种操作的实施时间进行定时, 数据加工 对数据进行算术运算和逻辑运算处理,CPU结构框图,前面( 第二章)已对运算器内容做了详细讨论,本章主要介绍剩余的三个部分内容:内部寄存器 、控制单元、中断系统,5.1.2 CPU的基本组成,控制器完成对整个计算机系统操作的协调与指挥。 (1) 控制机器从内存中取出一条指令,并指出下一条指令在内存中的位置; (2) 对指令进行译码,并产生相应的操作控制信号,送往相应的部件,启动规定的动作; (3) 指挥并控制CPU、内存与输入/输出(I/O)设备之间数据流动
4、的方向 运算器是数据加工处理部件,所进行的全部操作由控制器发出的控制信号指挥 (1)执行所有的算术运算; (2)执行所有的逻辑运算,并进行逻辑测试,5.1.3CPU中的主要寄存器,数据缓冲寄存器(DR)暂时存放由内存读出或写入的指令或数据字指令寄存器(IR)保存当前正在执行的一条指令程序计数器(PC)确定下一条指令的地址地址寄存器(AR)保存当前CPU所访问的内存单元的地址累加寄存器(AC)最常使用的一个通用寄存器状态条件寄存器(PSW)保存由算术和逻辑指令的结果建立的各种条件码,5.1.4 操作控制器与时序产生器,操作控制器在各寄存器之间建立数据通路(传送信息的通路)操作控制器的功能: 就是
5、根据指令操作码和时序信号,产生各种操作控制信号,以便正确地建立数据通路,从而完成取指令和执行指令的控制硬布线控制器微程序控制器时序产生器产生并发出计算机所需要的时序控制信号,5.2 指令周期,读取指令指令地址送入主存地址寄存器读主存,读出内容送入指定的寄存器分析指令按指令规定内容执行指令不同指令的操作步骤数和具体操作内容差异很大检查有无中断请求若无,则转入下一条指令的执行过程,形成下一条指令地址,指令的执行过程,5.2.1 指令周期的基本概念,指令周期: CPU从内存取出一条指令并执行完这条指令的时间总和,CPU周期:又称机器周期(总线周期),CPU访问内存所花的时间较长,因此用CPU从内存读
6、取一条指令字的所需的最短时间来定义,时钟周期: 通常称为节拍脉冲或T周期。一个CPU周期包含若干个时钟周期T,相互关系: 1个指令周期 = 若干个CPU周期 1个CPU周期 = 若干T周期,取指时间执行指令时间,控制单元CU和中断系统指令周期的基本概念,指令周期定义示意,各种指令周期的比较,具有间接周期的指令周期,指令周期 CPU周期 时钟周期,表5-1列出了由6条指令组成的一个简单程序,这6条指令包括RR型指令、 RS型指令;既有算术逻辑指令,又有访内指令,还有程序转移指令,由此可以进一步了解指令的执行周期,MOV指令的指令周期,1. 取指周期,假定表5.1的程序已装入指存,因而在此阶段内,
7、CPU 的动作如下 :,2. 执行指令阶段,5.2.3LAD指令的指令周期,LAD指令的执行周期,STO指令的指令周期,JMP指令的指令周期,JMP指令执行周期,5.2.7 用方框图语言表示指令周期,5.3 时序产生器和控制方式,用二进制码表示的指令和数据都放在内存里,那么CPU是怎样识别出它们是数据还是指令呢?,从时间上来说: 取指令事件发生在指令周期的第一个CPU周期中,即发生在“取指令”阶段,而取数据事件发生在指令周期的后面几个CPU周期中,即发生在“执行指令”阶段。,从空间上来说: 如果取出的代码是指令,那么一定经DR送往指令寄存器IR,如果取出的代码是数据,那么一定送往运算器。,时间
8、控制对计算机来说是非常重要的!,5.3.1时序信号的作用和体制,计算机的协调动作需要时间标志,而且需要采用多级时序体制。而时间标志则用时序信号来体现。 硬布线控制器中,时序信号往往采用主状态周期-节拍电位-节拍脉冲三级体制。主状态周期(指令周期):包含若干个节拍周期,可以用一个触发器的状态持续时间来表示节拍电位(机器周期):表示一个CPU 周期的时间,包含若干个节拍脉冲节拍脉冲(时钟周期):表示较小的时间单位 微程序控制器中,时序信号则一般采用节拍电位-节拍脉冲二级体制。,节拍脉冲,节拍电位1,主状态周期,节拍电位2,主状态周期-节拍电位-节拍脉冲,数据准备好后,以电位的方式送触发器控制信号来
9、到后,用一个脉冲信号把数据装入触发器,数据:电位,控制信号:脉冲,节拍电位-节拍脉冲,IORQ MREQ RD WE T1 T2 T3 T4,IORQ MREQ RD WE T1 T2 T3 T4,MERQ,IORQ,RD,WR,提供频率稳定且电平匹配的方波时钟脉冲信号由石英晶体振荡器组成,产生一组有序的间隔相等或不等的脉冲序列,启动,停机,5.3.2时序信号产生器,启停控制逻辑,节拍脉冲和读写时序译码逻辑,环形脉冲发生器,时钟脉冲源,时序产生器 (1/4),一、 概念1、时序部件:计算机的机内时钟。它用其产生的周期状态,节拍电位及时标脉冲去对指令周期进行时间划分,刻度和标定。2、指令周期:在
10、计算机中从指令的读取到指令的执行完成,执行一条指令所需要的时间,称为指令周期。指令周期通常由若干个CPU周期来表示,CPU周期也称为机器周期。由于CPU内部的操作速度较快,而CPU访问一次内存所花的时间较长,通常用存储周期为基础来规定CPU周期。,时序产生器 (2/4),二、3级时序信号 1、周期 (1)在一个控制阶段内均持续起作用的信号; (2)通常用周期状态寄存器来标志和指明某某周期控制; (3)指令周期可分为取指周期、分析周期、执行周期。 2、节拍 (1)把一个机器周期分成若干个相等的时间段,每一个时间段对应一个电位信号,称节拍电位; (2)一般都以能保证ALU进行一次运算操作作为一拍电
11、位的时间宽度。 3、时标工作脉冲 (1)及时改变标志状态; (2)时标脉冲的宽度一般为节拍电位宽度的1/N,只要能保证所有的触发器都能可靠地,稳定地翻转即可。,时序产生器 (3/4),三、3级时序信号的关系1、一台计算机机内的控制信号一般均由若干个周期状态,若干个节拍电位及若干个时标脉冲这样3级控制时序信号定时完成。2、3级控制时序信号的宽度均成正整数倍同步关系。周期状态之间,节拍电位之间,时标脉冲之间既不容许有重叠交叉,又不容许有空白间隙,应该是能一个接一个地准确连接,一个降落另一个升起而准确切换的同步信号。,时序产生器 (4/4),CPU的控制方式 (1/4),控制器的控制方式:形成控制不
12、同微操作序列的时序控制信号的方法。控制方式的分类:同步控制方式异步控制方式同异步联合控制方式,CPU的控制方式 (2/4),一、同步控制方式1、含义:又称为固定时序控制方式或无应答控制方式。任何指令的执行或指令中每个微操作的执行都受事先安排好的时序信号的控制。2、每个周期状态中产生统一数目的节拍电位及时标工作脉冲。3、以最复杂指令的实现需要为基准。4、优点:设计简单,操作控制容易实现。 缺点:效率低。,CPU的控制方式 (3/4),二、异步控制方式 1、 含义:可变时序控制方式或应答控制方式。执行一条指令需要多少节拍,不作统一的规定,而是根据每条指令的具体情况而定,需要多少,控制器就产生多少时
13、标信号。 2、特点:每一条指令执行完毕后都必须向控制时序部件发回一个回答信号,控制器收到回答信号后,才开始下一条指令的执行。 3、优点:指令的运行效率高; 缺点:控制线路比较复杂。4、异步工作方式一般采用两条定时控制线来实现。我们把这两条线称为“请求”线和“回答”线。当系统中两个部件A和B进行数据交换时,若A发出“请求”信号,则必须有B的“回答”信号进行应答,这次操作才是有效的,否则无效。,CPU的控制方式 (4/4),三、同步,异步联合控制方式 1、含义:同步控制和异步控制相结合的方式即联合控制方式,区别对待不同指令。 2、一般的设计思想是,在功能部件内部采用同步式,而在功能部件之间采用异步
14、式,并且在硬件实现允许的情况下,尽可能多地采用异步控制。,5.3.3控制方式,控制不同操作序列时序信号的方法,1. 同步控制方式已定的指令在执行时所需的CPU周期(机器周期)数和时钟周期数都固定不变。例如采用完全统一的机器周期执行各种不同的指令2. 异步控制方式控制器发出某一操作控制信号后,等待执行部件完成操作后发“回答”信号,再开始新的操作3. 联合控制方式 同步控制和异步控制相结合的方式,CPU周期取指周期,CPU周期取源数,CPU周期取目标数,CPU周期执行周期,P0,P1,P2,W0,W1,完全同步控制方式,W0,W1,Wi,第N条指令,结束应答,W0,W1,Wj,第N+1条指令,结束
15、应答,启动下一条,W0,W1,Wk,第N+2条指令,结束应答,异步控制方式,启动下一条,i、j、k不一定相等,一般采用两条定时控制线:“请求”线和“回答”线,演示,5.4 微程序控制器,微程序控制器同硬布线控制器相比较,具有规整性、灵活性、可维护性等一系列优点它利用软件方法(微程序设计技术)来设计硬件 微程序控制的基本思想就是把操作控制信号编成所谓的“微指令”,存放到一个只读存储器里(控制存储器CM)。当机器运行时,一条又一条地读出这些微指令,从而产生全机所需要的各种操作控制信号,是相应部件执行所规定的操作,5.4.1 微程序控制原理,1. 微命令和微操作,处理器内部可以分为:控制部件和执行部
16、件微命令:控制部件向执行部件发出的控制命令微操作:执行部件接受微命令后所进行的操作(微操作在执行部件中是最基本的操作)微指令:实现一定操作功能的一组微命令微程序:实现一条机器指令功能的微指令序列,指令系统所有指令,指令微程序微程序若干微指令,微指令一组微命令微命令微操作,53,安排微操作的节拍时应注意三点:,1.有些微操作的次序是不容改变的,故安排微操作节拍时必须注意微操作的先后顺序。2.凡是被控制对象不同的微操作,若能在一个节拍内执行,应尽可能安排在一个节拍内,以节省时间。3.如果有些微操作所占的时间不长,应该将它们安排在一个节拍内完成,并且允许这些微操作有先后次序。,54,组合逻辑设计步骤
17、,组合逻辑设计控制单元时,首先根据上述微操作的节拍安排,列出微操作命令时间表,然后写出每一个微操作命令(控制信号)的逻辑表达式,最后根据逻辑表达式画出相应的组合逻辑电路图。,55,微程序设计步骤,微程序设计控制单元的主要任务是编写对应各条机器指令的微程序,具体步骤是首先写出对应机器指令的全部微节拍安排,然后确定微指令格式,最后编写出每条微指令的二进制代码(称作微指令码点)。步骤包括:1.写出对应机器指令的微操作及节拍安排2.确定微指令格式3.编写微指令码点,2. 微指令和微程序,机器指令与微指令,程序,机器指令1,机器指令2,机器指令i,机器指令n,.,微指令2,微指令1,微指令i,微指令n,
18、.,.,微程序,程序计数器PC,地址寄存器AR,缓冲寄存器DR,指令寄存器IR,微地址寄存器AR,微指令寄存器IR,主存储器,控制存储器CM,微命令,地址译码器,地址译码,机器指令级,微指令级,微程序设计中形成后继地址原理图,5.5 微程序设计技术,1.静态微程序设计对应于一台计算机的机器指令只有一组微程序,而且这一组微程序设计好之后,一般无须改变而且也不好改变2.动态微程序设计采用EPROM作为控制存储器,可以通过改变微指令和微程序来改变机器的指令系统采用动态微程序设计,微指令和微程序可以根据需要加以改变,因而可在一台机器上仿真其它机器指令系统,5.6硬布线控制器,硬布线控制器把控制部件看作
19、为产生专门固定时序控制信号的逻辑电路(以使用最少元件和取得最高操作速度为设计目标)硬布线控制的优点:速度较快;缺点:不容易修改添加新功能微程序控制的优点:具有规整性、灵活性、可维护性等;缺点:采用存储程序原理,需要执行多条微指令,速度较慢,5.7传统CPU,M6800CPU是一个比较典型的单总线结构的微处理器M6800CPU是一种8位微处理器,采用单一的5V电源。时钟脉冲采用两相(1,2),主频为1MHz,由外面加入CPU。M6800的CPU主要包括8位的ALU,16位的程序计数器、16位的堆栈指示器和16位的变址寄存器,两个8位的累加器和一个8位的状态条件码寄存器,一个8位的指令寄存器以及指
20、令译码与控制部件(即操作控制器)。此外还有一个8位的数据缓冲寄存器和一个16位的地址缓冲寄存器。ALU部件执行算术运算和逻辑操作,它们包括逻辑“与”、逻辑“或”、逻辑“异或”、求补、比较、加法、减法、十进制调整等。在M6800中,主存地址和外设地址是统一编址的,因此,在65536个地址中有一部分是为外围设备使用的。,传统CPU举例,Intel 8088CPUIntel 8088是一种通用的准16位微处理器,其内部结构为16位,与外部交换的数据为8位。它可以处理16位数据(具有16位运算指令,包括乘除法指令),也可处理8位数据。它有20条地址线,直接寻址能力达到1M字节。CPU 从功能上来说分成
21、总线接口单元BIU和执行单元EU两大部分。BIU负责与存储器和外围设备接口,即8088 CPU与存储器和外围设备之间的信息传送,都是由BIU进行的。EU 部分负责指令的执行。取指部分与执行指令部分是独立并行工作的,在一条指令的执行过程中,可取出下一条(或多条)指令,在指令流队列寄存器中排队。在一条指令执行完以后就可以立即执行下一条指令,减少了CPU为取指令而等待的时间,提高了系统的运行速度。,传统CPU举例,IBM 370CPU32位CPUALU部件按功能不同分为如下三个子部件:(1)定点运算,包括整数计算和有效地址的计算;(2)浮点运算;(3)可变长运算,包括十进制算术运算和字符串操作。为了
22、存放地址和数据,使用了两组独立的可编址寄存器,16个通用寄存器用来存放操作数和运算结果,且可用作变址寄存器。4个浮点寄存器用于浮点运算。数据寄存器DR、地址寄存器AR、指令寄存器IR是标准化的。Intel 80486CPU32位CPU通过采用流水技术,以及微程序控制和硬布线逻辑控制相结合的方式,进一步缩短可变长指令的译码时间,达到基本指令可以在一个时钟周期内完成。,传统CPU举例,486芯片内部包含一个8KB的数据和指令混合性cache,为频繁访问的指令和数据提供快速的内部存储,从而使系统总线有更多的时间用于其他控制。486芯片内部包含了增强性80387协处理器,称为浮点运算部件(FPU)。由
23、于FPU功能扩充,且放在CPU内部,使引线缩短,故速度比80387提高了35倍。486 CPU的内部数据总线宽度为64位,这也是它缩短指令周期的一个原因。而外部数据总线的宽度也可以自动转换。地址信号线扩充到32位,可以处理4GB(232字节)的物理存储空间。如果利用虚拟存储器,其存储空间达64TB(246字节)。,5.8 流水CPU,洗衣房的流水作业三个阶段:1. 水洗(30)2. 烘干(40)3. 熨烫(20),演示,5.8.1 并行处理技术,并行性(Parallelism):在同一时刻或是同一时间间隔内完成两种或两种以上性质相同或不相同的工作同时性(Simultaneity):同一时刻发生
24、的并行性并发性(Concurrency):同一个时间间隔内发生的并行性并行性的等级指令内部并行:微操作之间指令级并行(ILP:Instruction Level Parallel)线程级并行(TLP:Thread Level Parallel )程序级并行系统级并行:分布式系统、多机系统、机群系统,提高并行性的技术途径,时间重叠(Time-interleaving)时间并行多个过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分资源重复(Resource-replication)空间并行通过重复设置资源(尤其是硬件资源),提高性能资源共享(Resource-sharing)使多个任务按
25、一定时间顺序轮流使用同一套硬件设备单机系统中并行性的发展9.1.3指令流水线,部件冗余,分时系统多机系统中并行性的发展9.1.4多机系统耦合度:松散耦合、紧密耦合,5.8.2 流水CPU的结构,指令流水线 IF(Instruction Fetch)取指令阶段ID(Instruction Decode)指令译码阶段EX(Execute)执行运算阶段MEM(Memory Access)存储器访问阶段WB(Write Back)写回结果阶段,WB,流水线的时空图,流水线技术:把一个重复的过程分解为若干个子过程,每个子程序可以与其他子过程同时进行描述流水线的工作,最常用的方法是时间-空间图(时空图)横
26、坐标:表示时间,即各个任务在流水线中所经过的时间纵坐标:表示空间,即流水线的各个子过程,也称为级、段、流水线深度(Stage),非流水计算机的时空图,每4个机器周期才有一个输出结果,流水计算机的时空图,每个机器周期可以输出一个结果,演示,流水线的特点,流水线实际上是把一个功能部件分解成多个独立的子功能部件(一个任务也就分成了几个子任务,每个子任务由一个子功能部件完成),并依靠多个子功能部件并行工作来缩短所有任务的执行时间流水线有助于提高整个程序(所有任务)的吞吐率,但并没有减少每个指令(任务)的执行时间流水线各个功能段所需时间应尽量相等。否则,时间长的功能段将成为流水线的“瓶颈”,会造成流水线
27、的“阻塞”(Stall)流水线开始需要“通过时间” (Fill)和最后需要“排空时间”(Drain)。流水线只有处理连续不断的任务才能发挥其效率,5.8.3 流水线中的主要问题,流水线中存在一些相关(冲突、冒险Hazard,相关、依赖Dependence,竞争Competition)的情况,它使得下一条指令无法在设计的时钟周期内执行。这些相关将降低流水线性能主要有三种类型的相关(冲突)结构相关(资源冲突):当指令重叠执行过程中,硬件资源满足不了指令重叠执行的要求数据相关(数据冲突) :在同时执行的多条指令中,一条指令依赖前一条指令的执行结果(数据)却无法得到控制相关(控制冲突):流水线遇到分支
28、指令或其他改变PC值的指令,1. 资源相关,资源相关是指多条指令进入流水线后,在同一机器时钟周期内争用同一个功能部件所发生的冲突 例:假定一条指令流水线由五段组成,且仅有IF过程和MEM过程需要访问存储器,I1与I4两条指令在时钟4争用存储器资源的相关冲突,2. 数据相关,ADD R1, R2, R3; R2R3R1 SUB R4, R1, R5; R1R5R4 AND R6, R1, R7; R1R7R0,指令发生数据相关冲突,3. 控制相关,控制相关冲突由转移指令(分支指令)引起执行转移指令时,依据转移条件的产生结果可能为顺序取下条指令也可能转移到新的目标地址取指令地址不定,流水线需要暂停
29、、发生断流转移指令主要有:无条件转移指令:跳转、过程调用和返回条件分支指令,【例5】流水线中有三类数据相关冲突:写后读(RAW)相关;读后写(WAR)相关;写后写(WAW)相关 I1: ADD R1, R2, R3;R2R3R1 I2: SUB R4, R1, R5;R1R5R4 I3: STA M(x), R3;R3M(x) I4: ADD R3, R4, R5;R4R5R3 I5: MUL R3, R1, R2;R1R2R3 I6: ADD R3, R4, R5;R4R5R3,RAW,WAR,WAW,指令动态调度策略,简单指令流水线技术的一个主要局限指令顺序发射(in-order issu
30、e)按序发射指令顺序执行(in-order execution)如果一条指令在流水线中,与之相关的指令及其后面的指令都不能进行处理改进指令流水线,只要指令操作数就绪就执行,指令乱序执行(out-of-order execution)指令乱序结束(out-of-order completion),MUL R0, R2, R4ADD R6, R0, R8SUB R7, R3, R1,多指令流出技术,进一步改进指令流水线,实现一个时钟周期发射(流出issue)多条指令超标量(Superscalar)处理器:每个时钟周期发射多条指令(18)超长指令字(VLIW: Very Long Instructi
31、on Word):通过编译器调度无关的多条指令(416)形成一条长指令,每个时钟周期发射一条长指令超级流水线(Super pipelining):将每个功能部件进一步流水化,使得一个功能部件在一个时钟周期中可以处理多条指令(可以简单地理解为很长的流水线),多发射流水线,80486的整数指令流水线,5级指令流水线,每级1个时钟周期 PF指令预取(prefetch) D1指令译码1(decode stage 1)对所有操作码和寻址方式信息进行译码 D2指令译码2(decode stage 2)将操作码扩展为ALU的控制信号,存储器地址计算EX指令执行(execute)完成ALU操作和Cache存取
32、WB回写(write back)更新在EX步骤得到的寄存器数据和状态标志,Pentium的超标量流水线,类似80486的5级流水线,后3级可以在两个流水线同时进行指令预取PF和指令译码D1步骤可以并行取出、译码2条简单指令,然后分别发向U和V流水线在满足指令配对的条件下,Pentium可以每个时钟周期执行完2条指令,Pentium的超标量结构,Pentium III的动态执行结构,5.9 RISC CPU,RISC的三个要素 (1)一个有限的简单的指令集 (2)CPU配备大量的通用寄存器 (3)强调对指令流水线的优化,5.9.1 RISC机器的特点, 等长指令,典型长度是4个字节(32位) 寻
33、址方式少且简单,一般为23种 只有取数指令和存数指令访问存储器 指令数目一般少于100种,指令格式一般少于4种 指令功能简单,控制器多采用硬布线方式 指令的执行时间为一个处理时钟周期 整数寄存器的个数不少于32个 强调通用寄存器资源的优化使用 支持指令流水并强调指令流水的优化使用 RlSC技术的编译程序复杂,RISC与CISC的主要特征对比,5.10 多媒体CPU,5.10.1 多媒体技术的主要问题,媒体(media):传递信息的媒介包括存储信息的实体与传递信息的载体多媒体(multimedia)技术:计算机把各种不同的电子媒质集成起来,统一进行存储、处理和传输多媒体技术:将多媒体信息,经计算
34、机设备获取、编辑、存储等处理后,以多媒体形式表现出来的技术多媒体技术解决的主要问题1.图像与声音的压缩技术2.适应多媒体技术的软件技术3.计算机系统结构方面的技术,计算机体系结构的分类,根据指令流和数据流的并行情况,Flynn1966提出了对所有计算机进行分类的简单模型单指令流、单数据流SISD:单处理器系统单指令流、多数据流SIMD:多媒体指令和向量计算机多指令流、单数据流MISD:尚无商用多指令流、多数据流MIMD:每个处理器取用自己的指令并对自己的数据进行操作。通常使用现有的微处理器实现,SIMD stands for Single Instruction Multiple Data,S
35、IMD指令,SIMD指令是能够同时处理多个数据的指令,用于扩展通用处理器对多媒体数据的处理能力许多应用需要多媒体处理能力桌面应用3D 图形,语音识别,视频/音频解码服务器视频/音频编码,数字图书馆和媒体挖掘,计算机动画,3D建模和着色嵌入系统 3D 图形,视频/音频解码编码,图像处理、信号处理,MMX数据类型,MMX (multimedia extensions),SSE/SSE2/SSE3数据类型,SSE(Streaming SIMD Extensions),SIMD指令饱和运算,a2+b2,a2+b2,a1+b1,a1+b1,a0+b0,a0+b0,SIMD指令乘加运算,SIMD指令比较指
36、令,SIMD指令类型转换,SIMD指令操作模式,SSE指令128位操作模式,SSE指令32位操作模式,1. 引起中断的各种因素 人为设置的中断(访管指令) 程序性事故 硬件故障 I/O设备 外部事件,上述各种中断因素除志愿中断是人为的外,大多数是随机的。通常将能引起中断的各个因素称作中断源。中断源的类型有两种,一类属于不可屏蔽中断,这类中断CPU不能禁止响应,如电源掉电;另一类属于可屏蔽中断,对于可屏蔽中断源的请求,CPU可根据中断源是否被屏蔽来确定是否给予响应,如未屏蔽则能响应;若已屏蔽,CPU不能相应。,补充:CPU中断逻辑,中断系统需要解决的问题,103,中断请求标记和中断判优逻辑1.
37、中断请求标记,104,中断判优逻辑,(1)硬件排队,集中在CPU的排队器,(2)软件排队,中断服务程序入口地址的寻找,1.硬件向量法,来自排队器的输出,中断向量地址表,2. 软件查询法 用软件寻找中断服务程序入口地址的方法叫软件查询法。当查到某一中断源有中断请求时,接着安排一条转移指令,直接指向此中断源的中断服务程序入口地址,机器便能自动进入中断处理。至于各中断源对应的入口地址,则由程序员(或系统)事先确定。这种方法不涉及硬设备,但查询时间较长。计算机可具备软、硬件两种方法寻找入口地址,方便灵活。,中断响应1. 中断响应的条件:中断允许触发器必须为12. 中断响应的时间:当前指令周期结束3.
38、中断隐指令 CPU相应中断后,进入中断周期。在中断周期, CPU要自动完成一系列操作,包括: (1)保护程序断点 (2)寻找中断服务程序入口地址 (3)关中断,保护现场和恢复现场 保护现场应该包括保护程序断点和保护CPU内部各寄存器的现场两个方面。程序断点的现场由中断隐指令完成,各寄存器的内容可在终端服务程序中由用户(或系统)用机器指令编程实现。 恢复现场是指在中断返回前,必须将寄存器的内容恢复到终端处理前的状态,这部分工作也由中断服务程序完成。,中断屏蔽技术1. 多重中断的概念2. 实现多重中断的条件 (1)提前设置“开中断”指令 (2)优先级别高的中断源有权屏蔽优先级别低的中断源3. 屏蔽
39、技术 (1)屏蔽触发器与屏蔽字 (2)屏蔽技术可改变优先等级 (3)屏蔽技术的其他作用4. 多重中断的断点保护,多重中断示意图,假定有A、B、C、D共4个中断源,优先级别为ABCD排序,在分别出现B、C、D、A中断请求后的响应次序如下:,具有屏蔽功能的排队器,如果排队器集中设在CPU内,加上屏蔽条件,就可组成具有屏蔽功能的排队器。显然,对应于每一个中断请求触发器就有一个屏蔽触发器,将所有屏蔽触发器组合在一起,便构成一个屏蔽寄存器,屏蔽寄存器的内容称为屏蔽字。屏蔽字的与中断源优先级别是一一对应的。,114,中断优先级与屏蔽字的关系:表中对应16个中断源的屏蔽字,每个屏蔽字由左向右排序为1、2、3
40、共16位。每个屏蔽字对应的中断源是不同的,如1级中断源的屏蔽字是16个;2级中断源的屏蔽字是从第2位开始共15个等。,第5章习题,1. 在CPU基本模型中,主要有哪些寄存器?2. 区别如下两组概念 指令周期、CPU周期、时钟周期 微命令、微指令、指令3. 什么是计算机体系结构中的并行性,它包括哪两种含义?有哪些提高并行性的基本技术方法?4. 什么是指令流水线技术,它有什么特点?主要有哪些问题影响流水线效率?5. SIMD,MMX和SSE各表示什么含义?6. 说明CPI和MIPS的含义,给出它们的计算公式。,第5章教学要求-1,熟悉CPU的基本模型和主要寄存器的作用理解指令周期、CPU周期(机器周期、总线周期)和时钟周期(T周期)的概念和区别了解CLA、ADD、STA和JMP指令在CPU基本模型的执行过程理解微程序控制器和硬布线控制器的实现特点,了解微命令、微操作、微指令和微程序的概念熟悉并行性的概念和提高并行性的技术途径掌握指令流水线的思想,理解流水CPU的时空图掌握资源相关、数据相关和控制相关的概念,习题与思考,习题与思考,习题与思考,习题与思考,习题与思考,习题与思考,定点运算器组成框图,浮点运算器组成框图,