windlx系统结构实验报告.doc

上传人:laozhun 文档编号:2389778 上传时间:2023-02-17 格式:DOC 页数:18 大小:572.50KB
返回 下载 相关 举报
windlx系统结构实验报告.doc_第1页
第1页 / 共18页
windlx系统结构实验报告.doc_第2页
第2页 / 共18页
windlx系统结构实验报告.doc_第3页
第3页 / 共18页
windlx系统结构实验报告.doc_第4页
第4页 / 共18页
windlx系统结构实验报告.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《windlx系统结构实验报告.doc》由会员分享,可在线阅读,更多相关《windlx系统结构实验报告.doc(18页珍藏版)》请在三一办公上搜索。

1、湖北经济学院 实验报告书课程名称: 计算机系统结构 题 目: WinDLX模拟器实验 学生姓名: 魏丽敏 专 业: 计算机科学与技术 班 级: 信管计科Q0941 学 号: 091501007 指导老师: 叶雪军 日 期: 2012 年 5 月 4 日实验一 熟悉WinDLX的使用一、实验目的: 熟悉WinDLX的的基本概念和使用,了解各种不同指令在流水线的实际流动情况,对流水线做性能分析,加深对流水线及RISC处理器的理解二、实验平台:WinDLX模拟器可以装入DLX汇编语言程序,然后单步、设置断点或者连续执行该程序。CPU的寄存器、流水线、I/O和存储器都可以使用图形的方式表示出来。模拟器

2、还提供了对流水线操作的统计功能。该模拟器对理解流水线和RISC处理器的特点很有帮助。 WinDLX要求的硬件平台是IBM PC兼容机,WinDLX是一个Windows应用程序,运行于Windows 3.0以上的操作系统。三、 实验内容1. 用WinDLX模拟器执行求阶乘程序fact.s 。执行步骤详见“WinDLX教程”。 这个程序说明浮点指令的使用。该程序从标准输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。2. 用WinDLX模拟器执行程序gcm.s 。 该程序从标准输入读入两个整数,求他们的greatest common

3、 measure,然后将结果写到标准输出。 该程序中调用了input.s中的输入子程序。3. 用WinDLX模拟器执行求素数程序prim.s。 这个程序计算若干个整数的素数。4. 通过上述使用WinDLX,总结WinDLX的特点。四、实验步骤和结果分析:使用WinDLX模拟器,对Fact.s做如下分析:开始模拟之前的准备工作: (1) 通过双击 WinDLX 图标启动WinDLX,将出现一个带有六个图标的主窗口: (2)进行初始化模拟器, 点击File 菜单中的 Reset all 菜单项,弹出一个“Reset DLX”对话框。然后点击窗口中的“确认”按钮即可。(3)在开始模拟之前,至少应装入

4、一个程序到主存。为此,选择File / Load Code or Data,窗口中会列出目录中所有汇编程序。fact.s 计算一个整型值的阶乘; input.s中包含一个子程序,它读标准输入(键盘)并将值存入DLX处理器的通用寄存器R1中。按如下步骤操作,把fact.s和input.s加载入主存。点击 fact.s点击 select 按钮点击 input.s点击 select按钮点击 load按钮得到如下图:弹出一下询问对话框,点击“是”。1. 观察增加浮点运算部件对性能的影响。(1)点击Configuration打开菜单,然后点击Floating Point Stages菜单项,选择如下标准

5、配置: (2)再点击ExecuteRun,输入15点,回车,在弹出的对话框出现消息Trap #0 occurred 表明最后一条指令 trap 0 已经执行, Trap指令中编号“0”没有定义,只是用来终止程序。点击确定。按F5进行查看:关闭上面的对话框,在Statistisc中得到结果如下所示: (4) 修改浮点数一次,参数如下图:修改浮点数后,单击OK,再点击ExecuteRun,输入15点,回车,在弹出的对话框中点击确定。然后在Statistisc中得到结果如下所示:(5) 修改浮点数二次,参数如下图:执行程序,输入点数15,然后在Statistisc中得到结果如下所示:用WinDLX模

6、拟器执行求最大公倍数程序gcm.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。注意:gcm.s中调用了input.s中的输入子程序。load程序时,要两个程序一起装入(都select后再点击load)。如:给出两组数6、3和6、1,分别在main+0x8(add r2, r1, r0)、gcm.loop(seg r3,r1,r2)和result+0xc(trap 0x0)设置断点,采用单步和连续混合执行的方法完成程序,注意中间过程和寄存器的变化情况,然后单击主菜单execute/display dl

7、x-i/o,观察结果。3 2 1 实验源程序见文件gcm.s和input.s结果截图如下:同理,用WinDLX模拟器执行求素数程序prim.s。这个程序计算若干个整数的素数。熟悉WINDLX的运行环境。五、 实验总结:1、 通过本实验我掌握了WinDLX模拟器的基本操作和使用,了解DLX指令集结构及其 特点,更加深入的了解计算机系统流水线的工作过程。2、在这次的实验中,开始时候发觉自己对WinDLX模拟器的很多知识都不理解,对系统结构的理解太少,在做实验过程中才渐渐有了个大概的了解和深入,程序如何进行运行,数据的如何查看,如何计算上让自己反复弄好好几次,不过在反复试验之后最后终于弄明白了,还有

8、观察转移指令在转移成功和转移不成功时候的流水线开销上,也不明白程序是如何模拟转移的,但最后在同学的帮助下,才得以解决,在这让我明白自己对计算机系统结构的认识有待更好的加强。实验二 结构相关一、实验目的:通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。二、 实验平台:WinDLX模拟器可以装入DLX汇编语言程序,然后单步、设置断点或者连续执行该程序。CPU的寄存器、流水线、I/O和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和RISC处理器的特点很有帮助。 WinDLX要求的硬件平台是IBM PC兼容机,WinDLX是一个Win

9、dows应用程序,运行于Windows 3.0以上的操作系统。三、实验内容:1. 用WinDLX模拟器运行程序structure_d.s 。2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比。4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。四、实验步骤和结果分析:1. 用WinDLX模拟器运行程序structure_d.s 。2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。存在结构相关的程序如下:1. LD F0, 0(R2) ADDD F2, F0, F2 ; -

10、A stall is found (an example of how to answer your questions) 2. ADDI R2, R2, #8 ADDI R3, R3, #83. ADDI R3, R3, #8 SUB R5, R4, R24. SUB R5, R4, R2 BNEZ R5,3. 记录由结构相关引起的暂停时钟周期数 9 ,计算暂停时钟周期数占总执行周期数的百分比。9/139=6.475% 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 5.执行之后得到的结果截图如下6.程序分析如下:在执行指令ADDI R2, R2, #8 , ADDI R3,

11、 R3, #8 , SUB R5, R4, R2 ,BNEZ R5, loop 时,实际上是1ADDI R2, R2, #8 ADDI R3, R3, #8 2. ADDI R3, R3, #8 SUB R5, R4, R2 3. SUB R5, R4, R2 BNEZ R5,在这3个步骤中会发生同时访问同一寄存器的现象,必然会导致结构相关的问题。为了避免结构相关,可以考虑采用资源重复的方法,即在流水线机器中设置相互独立的指令存储器和数据存储器,也可以考虑将CACHE分为指令CACHE和数据CACHE。实验三 数据相关一、实验目的:通过本实验,加深对数据相关的理解,掌握如何使用定向技术来减少数

12、据相关带来的暂停。二、 实验平台:WinDLX模拟器可以装入DLX汇编语言程序,然后单步、设置断点或者连续执行该程序。CPU的寄存器、流水线、I/O和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和RISC处理器的特点很有帮助。 WinDLX要求的硬件平台是IBM PC兼容机,WinDLX是一个Windows应用程序,运行于Windows 3.0以上的操作系统。三、实验内容:1. 在不采用定向技术的情况下(通过Configuration菜单中的Enable Forwarding选 项设置),用WinDLX模拟器运行程序data_d.s 。2. 记

13、录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数,计算暂停时 钟周期数占总执行周期数的百分比。3. 在采用定向技术的情况下,用WinDLX模拟器再次运行程序data_d.s。4. 记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数,计算暂停时 钟周期数占总执行周期数的百分比。5. 根据上面记录的数据,计算采用定向技术后性能提高的倍数。四、实验步骤和结果分析:1. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数104以及程序执行的总时钟周期数

14、202,计算暂停时钟周期数占总执行周期数的百分比51.48%。2. 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,128 30 23.44%并计算采用定向技术后性能提高的倍数220/128=1.723. 采用定向技术时运行该程序:从数据中可知程序执行的总时钟周期数202,暂停时钟周期数104,暂停时钟周期数占总执行周期数的百分比51.48%。4. 采用定向技术时运行该程序:从数据中可知,执行的总时钟周期数128,暂停时钟周期数30,暂停时钟周期数占总执行周期数的百分比23.44%。由此可知,运用定向技术,减少了

15、数据相关,缩短了程序的执行周期,性能提高了1.57倍。5. 运行结果截图如下:实验四 指令调度一、实验目的:通过本实验,加深对指令调度的理解,了解指令调度技术对CPU性能改进的好处。二、 实验平台:WinDLX模拟器可以装入DLX汇编语言程序,然后单步、设置断点或者连续执行该程序。CPU的寄存器、流水线、I/O和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和RISC处理器的特点很有帮助。 WinDLX要求的硬件平台是IBM PC兼容机,WinDLX是一个Windows应用程序,运行于Windows 3.0以上的操作系统。三、实验内容:1. 通过

16、Configuration菜单中的“Floating point stages”选项,把除法单元数设 置为3,把加法乘法除法的延迟设置为3个时钟周期。2. 用WinDLX模拟器运行调度前的程序sch-before.s 。记录程序执行过程中各种相 关发生的次数以及程序执行的总时钟周期数。3. 用WinDLX模拟器运行调度后的程序sch-after.s ,记录程序执行过程中各种相关 发生的次数以及程序执行的总时钟周期数。4. 根据记录结果,比较调度前和调度后的性能。5. 论述指令调度对于提高CPU性能的意义。四、实验步骤和结果分析:1、双击WinDLX图标运行WinDLX。装入测试程序之前,先初始

17、化WinDLX模拟器:点击File 菜单中的 Reset all 菜单项,弹出一个“Reset DLX”对话框。然后点击窗口中的“确认”按钮即可。2、选择File / Load Code or Data,按如下步骤操作,可将sch-before.s和input.s这两个程序装入主存:点击sch-before.s点击select按钮点击input.s点击select按钮点击load按钮3、按F7键程序顺序执行观察6个子窗口的情况。4、再选择File / Load Code or Data,按如下步骤操作,可将sch-after.s和input.s这两个程序装入主存:点击sch-after.s点击

18、select按钮点击input.s点击select按钮点击load按钮5、 按F7键程序顺序执行观察6个子窗口的情况。6.指令调度前运行结果图:程序执行的总时钟周期数:250数据相关次数:75结构相关次数:32总相关次数:143实验结果图:7. 执行指令调度后的运行结果图:程序执行的总时钟周期数:248数据相关次数:65结构相关次数:40总相关次数:141可见,经过指令调度后,程序执行的总时钟周期数减少,数据相关次数明显减少,总的相关次数也减少。总体上可以提高CPU的效率,相应减少流水线中的气泡。程序执行顺序,部件的个数都会对程序的执行产生影响,而提高流水线的效率可以通过指令调度来实现,而在代码中出现数据相关是经常出现的,在本例中经常会出现数据相关,如:mult r4,r1,r1;mult r4,r4,r1,通过在两条指令中加入add 指令,可以减少数据相关。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号