《第一章计算机系统概述讲解ppt课件.ppt》由会员分享,可在线阅读,更多相关《第一章计算机系统概述讲解ppt课件.ppt(33页珍藏版)》请在三一办公上搜索。
1、计算机体系结构,主讲:余金森,联系QQ:184611704,本课程主要介绍计算机组成与系统结构所涉及的相关概念、理论和技术内容。通过本课程的教学,使学生了解计算机系统的组织结构。掌握计算机软硬件交界面的相互配合与相互弥补思想。了解计算机体系结构中的主要技术和方法。,教学目的和要求:,成绩计算: 平时成绩(30%)期末考试(70%)。,第一讲 计算机系统概述,计算机发展简史IAS通用计算机模型机:冯.诺依曼结构 IBM360系列机:引入兼容性(系列机)概念DEC PDP-8:引入总线结构计算机系统的组成计算机硬件:CPU+MM+I/O计算机软件:系统软件+应用软件计算机层次结构计算机硬件和软件的
2、接口:指令系统计算机软件如何在硬件上执行,什么是计算机?计算机是一种能对数字化信息进行自动、高速运算的通用处理装置。计算机的功能:数据运算、数据存储、数据传送、控制计算机的特点:高速:高速元器件和“存储程序”工作方式带来高速性通用:体现在处理对象和应用领域没有限制准确:精度足够的算术运算带来准确性智能 :逻辑推理能力带智能性,计算机的功能和特点,冯诺依曼结构的主要思想,计算机应由运算器、控制器、存储器、输入设备和输出设备五个基本部件组成。各基本部件的功能是:存储器不仅能存放数据,而且也能存放指令,形式上两者没有区别,但计算机应能区分数据还是指令;控制器应能自动执行指令;运算器应能进行加/减/乘
3、/除四种基本算术运算,并且也能进行一些逻辑运算和附加运算;操作人员可以通过输入设备、输出设备和主机进行通信。内部以二进制表示指令和数据。每条指令由操作码和地址码两部分组成。操作码指出操作类型,地址码指出操作数的地址。由一串指令组成程序。采用“存储程序”工作方式。,有的书上1,2是在一条内的。所以一般称为三大内容,PC主板,CPU插座,内存条,PCI总线插槽,解剖计算机,个人计算机由主机和外设组成,主机中包含多个电路板,每个电路板中有十几个集成电路,每个集成电路中有十几个模块,每个模块中有上千万个单元,每个单元中有十几个门电路,每个门电路实现基本的逻辑运算,所有信息都用二进制编码表示,Hardw
4、are/Software Interface, , EXTop=1,ALUSelA=1,ALUSelB=11,ALUop=add,IorD=1,Read,MemtoReg=1,RegWr=1,.,temp = vk;vk = vk+1;vk+1 = temp;,lw $15, 0($2)lw $16, 4($2)sw $16, 0($2)sw $15, 4($2),1000 1100 0100 1111 0000 0000 0000 00001000 1100 0101 0000 0000 0000 0000 01001010 1100 0101 0000 0000 0000 0000 000
5、01010 1100 0100 1111 0000 0000 0000 0100,Hardware/Software Interface(界面),机器语言由指令代码构成,能被硬件直接执行。,软件和硬件的界面: ISA(Instruction Set Architecture ) 指令集体系结构,软件,硬件,Software,System software(系统软件) - 简化编程过程,使硬件资源被有效利用 操作系统(Operating System):硬件资源管理,用户接口语言处理系统:翻译程序+ Linker, Debug, Loader, etc 翻译程序(Translator)有三类:汇
6、编程序(Assembler):将汇编语言源程序翻译为机器语言目标程序文件。编译程序(Complier):将高级语言源程序翻译为汇编语言或机器语言目标程序文件。解释程序(Interpreter ):将高级语言语句逐条翻译成机器指令并立即执行。不生成目标文件。其他实用程序: 如:磁盘碎片整理程序、备份程序等Application software(应用软件) - 解决具体应用问题/完成具体应用任务各类媒体处理程序:Word/ Image/ Graphics/管理信息系统 (MIS) Game, ,Computer Hierarchy(计算机系统层次),I/O,CPU,Compiler,Operat
7、ing,System,Application,Digital Design,Circuit Design, 上图给出的是计算机系统的层次结构 指令系统(即ISA)是软/硬件的交界面,Instruction Set Architecture,不同用户工作在不同层次,所看到的计算机不一样,最终用户End User,应用程序员Application Programmer,系统管理员System Administrator,系统程序员System Programmer,MM,Assembler,中间阴影部分就是本课程主要内容,处于最核心的部分!,一个典型系统的硬件组成,PC:程序计数器;ALU:算术/
8、逻辑单元;USB:通用串行总线,一个典型程序的转换处理过程,1 #include 23 int main()4 5 printf(hello, worldn);6 ,经典的“ hello.c ”C-源程序,# i n c l u d e n n i n t m a i n ( ) n 104 62 10 10 105 110 116 32 109 97 105 110 40 41 10 123n p r i n t f ( h e l10 32 32 32 32 112 114 105 110 116 102 40 34 104 101 108l o , w o r l d n ) ; n 1
9、08 111 44 32 119 111 114 108 100 92 110 34 41 59 10 125,hello.c的ASCII文本表示,程序的功能是:输出“hello,world”,计算机能够直接识别hello.c源程序吗?,不能,需要转换为机器语言代码! 即:编译,Hello程序的数据流动过程,Hello可执行文件,Red:shell命令行处理Blue:可执行文件加载Cyan:hello程序执行过程,“hello”,“hello,world/n”,“hello,world/n”,所有过程都是在CPU执行指令所产生的控制信号的作用下进行的。,数据经常在各存储部件间传送。故现代计算机
10、大多采用“缓存”技术!,该课程的主要学习内容,信息(指令和数据)在计算机中如何表示?指令系统如何设计?,如何设计总线BUS?,Course Outline,性能评价(Performance measurement)计算机算术(Arithmetic for Computer)数据的表示和运算存储器层次结构(Memory Hierarchies )指令集体系结构(Instruction Set Architecture)CPU设计数据通路 (Data path) 和控制器(Control Unit)流水线技术 (Pipelining)系统总线 (System Buses)输入/输出系统(Input
11、 / Output system),计算机性能评价,制造成本(manufacturing cost)衡量计算机性能的基本指标 响应时间(response time)执行时间(execution Time)、等待时间(latency) throughput (吞吐量)带宽(bandwidth) 计算机性能测量 指令执行速度(MIPS、MFLOPS) 基准程序( Benchmark),计算机性能的基本评价指标,相对性能用执行时间的倒数来表示!,计算机有两种不同的性能 Time to do the task 响应时间(response time)执行时间(execution time)等待时间或时延
12、(latency) Tasks per day, hour, sec, ns. . 吞吐率(throughput)带宽(bandwidth) 基本的性能评价标准是:CPU的执行时间,不同应用场合用户关心的性能不同:要求吞吐率高的场合,例如: 多媒体应用(音/视频播放要流畅)要求响应时间短的场合:例如: 事务处理系统(存/取款的速度要快)要求吞吐率高且响应时间短的场合: ATM、文件服务器、Web服务器等,计算机性能的测量,比较计算机的性能时,用执行时间来衡量完成同样工作量所需时间最短的那台计算机就是性能最好的处理器时间往往被多个程序共享使用,因此,用户感觉到的程序执行时间并不是程序真正的执行时
13、间(从hello程序执行过程可知)通常把用户感觉到的响应时间分成:CPU时间:指CPU真正花在程序执行上的时间。又包括两部分:用户CPU时间:用来运行用户代码的时间系统CPU时间:为了执行用户程序而需要运行操作系统程序的时间其他时间:指等待I/O操作完成或CPU花在其他用户程序的时间系统性能和CPU性能不等价,有一定的区别系统性能(System performance):系统响应时间,与CPU外的其他部分也都有关系CPU性能(CPU performance):用户CPU时间本章主要讨论CPU性能,即:CPU真正用在用户程序执行上的时间问题:用户CPU时间与系统响应时间哪个更长?,CPU执行时间
14、的计算,CPU 执行时间 = CPU时钟周期数 / 程序 X 时钟周期 = CPU时钟周期数 / 程序 时钟频率 = 指令条数 / 程序 X CPI X 时钟周期CPU时钟周期数 / 程序 = 指令条数 / 程序 X CPICPI = CPU时钟周期数 / 程序 指令条数 / 程序 CPI 用来衡量以下各方面的综合结果Instruction Set Architecture(ISA)Implementation of that architectureprogram,CPI:Cycles Per Instruction,Architecture = Instruction Set Arch.
15、+ Organization,Computer Design,Computer Hardware Design Machine Implementation Logic Designers View Processor Architecture Computer OrganizationConstruction Engineer,“建造工程师”考虑用什么材料,如何布线等,例如,是否提供“乘法指令”是ISA设计要考虑的问题; 如何实现乘法指令(用专门的乘法器还是用一个加法器+移位器实现)是组成(Organization)考虑的问题; 如何布线、用什么材料、工艺设计等是计算机实现技术(Techno
16、logy)考虑的问题。,如何计算CPI?,对于某一条特定的指令而言,其CPI是一个确定的值。但是,对于某一类指令、或一个程序、或一台机器而言,其CPI是一个平均值,表示该类指令或该程序或该机器的指令集中每条指令执行时平均需要多少时钟周期。,问题:指令的CPI、机器的CPI、程序的CPI各能反映哪方面的性能? 单靠CPI不能反映CPU的性能!为什么?如:单周期处理器CPI=1,但性能差!,Example1,程序P在机器A上运行需10 s, 机器A的时钟频率为400MHz。 现在要设计一台机器B,希望该程序在B上运行只需6 s. 机器B时钟频率的提高导致了其CPI的增加,使得程序P在机器B上时钟周
17、期数是在机器A上的1.2倍。机器B的时钟频率达到A的多少倍才能使程序P在B上执行速度是A上的10/6=1.67倍?,Answer: CPU时间A = 时钟周期数A / 时钟频率A 时钟周期数A = 10 sec x 400MHz = 4000M个 时钟频率B = 时钟周期数B / CPU时间B = 1.2 x 4000M / 6 sec = 800 MHz,机器B的频率是A的两倍,但机器B的速度并不是A的两倍!,Marketing Metrics (产品宣称指标),MIPS= Instruction Count / Time x106= Clock Rate / CPI x 106Millio
18、n Instructions Per Second因为每条指令执行时间不同,所以MIPS总是一个平均值。 不同机器的指令集不同 程序由不同的指令混合而成 指令使用的频度动态变化 Peak MIPS: (不实用)所以MIPS数不能说明性能的好坏(用下页中的例子来说明)MFLOPS = FP Operations / Time x106Million Floating-point Operations Per Second 与机器相关性大 并不是程序中花时间的部分,选择性能评价程序(Benchmarks),用基准程序来评测计算机的性能基准测试程序是专门用来进行性能评价的一组程序不同用户使用的计算机
19、用不同的基准程序基准程序通过运行实际负载来反映计算机的性能最好的基准程序是用户实际使用的程序或典型的简单程序基准程序的缺陷现象:基准程序的性能与某段短代码密切相关时,会被利用以得到不当的性能评测结果手段:硬件系统设计人员或编译器开发者针对这些代码片段进行特殊的优化,使得执行这段代码的速度非常快例1:Intel Pentium处理器运行SPECint时用了公司内部使用的特殊编译器,使其性能极高例2:矩阵乘法程序SPECmatrix300有99%的时间运行在一行语句上,有些厂商用特殊编译器优化该语句,使性能达VAX11/780的729.8倍!,Successful Benchmark: SPEC,
20、1988年,5家公司( Sun, MIPS, HP, Apollo, DEC )联合提出了Systems Performance Evaluation Committee (SPEC) SPEC给出了一组标准的测试程序、标准输入和测试报告。它们是一些实际的程序,包括 OS calls、 I/O等。版本 89:10 programs = 4 for integer + 6 for FP, 用每个程序的执行时间求出一个综合性能指标 版本92:SPECInt92 (6 integer programs) and SPECfp92 (14 floating point programs) 整数和浮点数
21、单独提供衡量指标:SPECInt92和SPECfp92增加 SPECbase: 禁止使用任何与程序有关的编译优化开关版本95: 8 int + 10fp较新版本: include SPEC HPC96, SPEC JVM98, SPEC WEB99, SPEC OMP2001. SPEC CPU2000,See http:/www.spec.org for more details“benchmarks useful for 3 years”Base machine is changed from VAX-11/780 to Sun SPARC 10/40,如何给出综合评价结果?,Progra
22、m 1: 1 sec on machine A, 10 sec on machine BProgram 2: 1000 sec on A,100 sec on BWhat are your conclusions?,A is 10 times faster than B for program1. B is 10 times faster than A for Program2.,Total execution time是一个综合度量值,可以据此得出结论:B is 1001/110=9.1 times faster than A实际上,必须考虑每个程序在作业中的使用频度,即加权平均,问题:如果
23、用一组基准程序在不同的机器上测出了运行时间,那么如何综合评价机器的性能呢?,先看一个例子:,综合性能评价的方法,可以用以下两种平均值来评价:Arithmetic mean(算术平均):求和后除nGeometric mean(几何平均):求积后开根号n根据算术平均执行时间能得到总平均执行时间根据几何平均执行时间不能得到程序总的执行时间执行时间的规格化(测试机器相对于参考机器的性能):time on reference machine time on measured machine 平均规格化执行时间不能用算术平均来计算,而应该用几何平均program A going from 2 second
24、s to 1 second as important as program B going from 2000 seconds to 1000 seconds. (算术平均值不能反映这一点!),综上所述,算术平均和几何平均各有长处,可灵活使用!,小结,性能的定义:一般用程序的响应时间或系统的吞吐率表示机器或系统整体性能。CPU性能的测量(用户程序的CPU执行时间):一般把程序的响应时间划分成CPU时间和等待时间,CPU时间又分成用户CPU时间和系统CPU时间。因为操作系统对自己所花费的时间进行测量时,不十分准确,所以,对CPU性能的测算一般通过测算用户CPU时间来进行。各种性能指标之间的关系:
25、CPU执行时间=CPU时钟周期数 x 时钟周期时钟周期和时钟频率互为倒数CPU时钟周期数 = 程序指令数 x 每条指令的平均时钟周期数CPIMIPS数在有些情况下不能说明问题,不具有可比性!性能评价程序的选择:采用一组基准测试程序进行综合(算术(加权)平均/几何平均)评测。有些制造商会针对评测程序中频繁出现的语句采用专门的编译器,使评测程序的运行效率大幅提高。因此有时基准评测程序也不能说明问题。对于某种特定的指令集体系结构,提高计算机性能的主要途径有:提高时钟频率(第七章 流水线)优化处理器中数据通路的结构以降低CPI(第六章 单周期/多周期处理器)采用编译优化措施来减少指令条数或降低指令复杂度(第五章 指令系统 ),用一台100MHz处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:,求出:CPI和MIPS。,本章作业,习题1中2(4)、3、4、5、8、10,写在作业本上,要求书写工整、清楚,答题要完整,