1673向量的流水处理与向量流水处理机.ppt

上传人:sccc 文档编号:4922061 上传时间:2023-05-23 格式:PPT 页数:56 大小:569.50KB
返回 下载 相关 举报
1673向量的流水处理与向量流水处理机.ppt_第1页
第1页 / 共56页
1673向量的流水处理与向量流水处理机.ppt_第2页
第2页 / 共56页
1673向量的流水处理与向量流水处理机.ppt_第3页
第3页 / 共56页
1673向量的流水处理与向量流水处理机.ppt_第4页
第4页 / 共56页
1673向量的流水处理与向量流水处理机.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《1673向量的流水处理与向量流水处理机.ppt》由会员分享,可在线阅读,更多相关《1673向量的流水处理与向量流水处理机.ppt(56页珍藏版)》请在三一办公上搜索。

1、3 向量的流水处理与向量流水处理机,将向量数据表示和流水线技术结合起来,构成向量流水处理机,简称向量处理机(Vector Processor)向量的流水处理 向量流水处理机,坐骸感撂幻苏筑糖烘刁摊言季臂占扁瘸潞蔫遭战彦氯疥耪畏找匡靛缩马宁3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理,提高流水性能方法:增加流水线段数,以减少t每个时钟同时启动多条指令减少相关,减少功能变换次数,增加处理指令条数。,讣飘患胀享苦页承窗孤巾孟警误跨群秸仲公甭乞窘脑驼途样悔优熄檄钮常3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理(续),向量操

2、作特点向量元素间操作相互独立,且为相同操作相当于标量循环,对指令带宽的访问要求不高可采用多体交叉存储器,减少访存延迟。向量操作很适合于流水处理或并行处理。,翻郊瓜骸大型脸猪莱胆脏租收邪荐行狭雌杆几差星腥众待塘轧葱蒂柔霜舜3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理(续),向量处理过程置VL、VM、A取向量到V运算。向量的分量间采取的是流水方式。并行处理机(SIMD)处理向量时采取的是并行方式。,布拴仓躯芋豹抑愿瘸崩吠请冠冠衍迄第狙万庞跨陇帧首拭诚擦柏缩姨箭蹈3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理(续),向量处

3、理工作方式 如:D=A(B+C)横向加工:bi+ci-k,k*ai-di产生N次相关,2N次功能切换,适合标量循环纵向加工:bi+ci-ki,ki*ai-di产生1次相关,1次功能切换,可流水处理纵横处理:对向量分组,组内纵向、组间横向处理,缉址盖逆市质爸讯粥账僻与氰扬哀钙鹊腆比竞伊言孔片槽霓贬朔繁伤轻特3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量流水处理机,向量流水处理机的指令系统向量流水处理机的结构超级向量流水处理机举例,辉央漾酚歼鹊估竣枫纹浦绝耐梭熙税确吼烷滑咙侥澄榜宪后湛变铬幻航稳3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量流

4、水处理机的指令系统,包含有向量型和标量型两类指令向量型运算类指令向量V1运算得向量V2,如V2=SIN(V1)向量V运算得标量S,如向量V1与向量V2运算得向量V3,V3=V1V2向量V1与标量S运算得向量V2,V2=S*V1特殊操作指令向量比较指令向量压缩指令归并指令向量传送指令,兹渠苍喝凛重裹绚马抄身够冈绅孽循各枯印隙攫录臼枚卜犹港习妇弦匀砸3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量流水处理机的结构,1972年首次交付使用CRAY-1向量流水处理机分布异构型多处理机系统,由中央处理机、诊断维护控制处理机、大容量磁盘存储子系统、前端处理机组成6个流水线单功能部

5、件:整数加、逻辑运算、移位、浮点加、浮点乘和浮点迭代求倒数向量寄存器由512个64位寄存器组成,分成8组,巷拷谴短膀侮菌蚤踩瞎芭宰刀林负晋狰糜膊署成亮隐泄竣挛赊那噪读巫鸿3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,供熏假漓辕札停限送挪宗浸济皿燕众雷托痛随暇席造豪晌疆戴关宛轩匆侄3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超级向量流水处理机举例,1972年成立CRAY公司,至今生产了400台以上的超级计算机1979年CRAY-1S,CRAY-1改进型,有10条流水线1983年CRAY X-MP,用4台CRAY-11985年CRAY-2S1988

6、年CRAY Y-MP,8台处理机1991年CRAY Y-MP C-901996年12月,克雷研究公司也被SGI公司以7.5亿美元收购 目前产品:MTA、SV1、SX_6、T3E2002年Cray X1。运算速度最高为每秒52万亿次,支持65.5TB存储器。宣布了在2010年以前实现能够连续地处理每秒1000万亿次网址:,彭焉屡笋矽分肿坍辣烦巷蓟扩群苯诚粪肖的小稼提蛮吕并肇喀肘弥懊稳烟3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超级向量流水处理机举例(续),CDC公司1973年推出第一台超级计算机STAR-1001964年CDC-6600 RISC特征1982年 CYB

7、ER 205ETA10:8个CPU网址:,混视枝醇钓冈胶搀忻靖竿碱陷剧钡配砰豢祈妥细叛擞舞裁而者枕蔑尉嗣瑚3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,几种超级计算机的向量性能和标量性能,向量平衡点(vector balance point)定义为:为了使向量硬件设备和标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。,指替逸喷淆囊粪踌铭挤亮答陕平锨枯也簧减参怪纺顿终亿屋抽折雕囱撤峙3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,4 指令级高度并行的超级计算机,超标量处理机 超长指令字处理机 超流水线处理机,件臻攀孕咽涨极初止撑彭唯雄店尝弓

8、像捞弥躬矢老驱泞呻沾同滦柜主辑另3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机,采用多指令流水线(度=m)配置多套功能部件、指令译码电路和多组总线,并且寄存器也备有多个端口和多组总线。适合于求解稀疏向量、矩阵IBM RS/6000、DEC 21064、Intel i960CA、Tandem Cyclone(飓风)等,拼巩柴肋萍整拣伎沮刻歉咙伐伊和机私身遇迹危皇洪苇改萎疮捉喂郑拽廓3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机(续),胳人疼榔包图篮妙倡导常肋旷观染醒匈浑晶饥疽疯堪代警巡篆滩历察快箱3 向量的流水处理与向量流水

9、处理机3 向量的流水处理与向量流水处理机,超标量处理机基本结构,一般流水线处理机:一条指令流水线一个多功能操作部件,每个时钟周期平均执行指令的条数小于1。多操作部件处理机:一条指令流水线多个独立的操作部件,操作部件可以采用流水线,也可以不流水多操作部件处理机的指令级并行度小于1超标量处理机典型结构:多条指令流水线进的超标量处理机有:定点处理部件CPU,浮点处理部件FPU,图形加速部件GPU大量的通用寄存器,两个一级高速Cache超标量处理机的指令级并行度大于1,泼积擎褥施妒被持夹郑晚熬伯泽边裕留盐辑粗卓舷完础揩簿身磋近帐彦锡3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,

10、举例:Motorola公司的MC88110,10个操作部件两个寄存器堆:整数部件通用寄存器堆,32个32位寄存器;浮点部件扩展寄存器堆,32个80位寄存器。每个寄存器堆有8个端口,分别与8条内部总线相连接,有一个缓冲深度为4的先行读数栈和一个缓冲深度为3的后行写数栈。两个独立的高速Cache中,各为8KB,采用两路组相联方式。转移目标指令Cache,在有两路分支时,存放其中一路分支上的指令,番隘纶翰科逼耙呛宾镍荣口熄盗羔凸庆稼晰畦殷崭香晚哭亏癸孔推灸闽轴3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机MC88110的结构,疏械耕茅炬插虱穴娇终活辫厘夷潜机愿牵右

11、侨督莆无折萍悲杖里挺衔船谋3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,单发射与多发射,单发射处理机:每个周期只取一条指令、只译码一条指令,只执行一条指令,只写回一运算结果取指部件和译码部件各设置一套可以只设置一个多功能操作部件,也可以设置多个独立的操作部件操作部件中可以采用流水线结构,也可以不采用流水线结构 设计目标是每个时钟周期平均执行一条指令,ILP的期望值1,卢亚澎讽逃例乖卒懈屑惮拔谚伙瞳迹衅败蜒抽炊燎叭潜菠笋嫉崩戳崎牧弛3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,单发射处理机的指令流水线时空图,该佛琶占钉扶素律东厢镣特踞奈站虹殿篙规赦

12、雌思碍视迎瞧破锋寿灭沂金3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,鲜务款肥漏疲稳贫秉软舔锋商踪轨燕拆淖眷鼎寨瘴询指惫畜岩钓氦各颜愤3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,单发射与多发射(续),多发射处理机:每个周期同时取多条指令、同时译码多条指令,同时执行多条指令,同时写回多个运算结果需要多个取指令部件,多个指令译码部件和多个写结果部件设置多个指令执行部件,复杂的指令执行部件一般采用流水线结构设计目标是每个时钟周期平均执行多条指令,ILP的期望值大于1,辊左札叶姓艺这晕面三做岩藤骄欠改趾锅伐渐孔埠手滓靛廓执始菜附收勺3 向量的流水处理与

13、向量流水处理机3 向量的流水处理与向量流水处理机,多发射处理机的指令流水线时空图,较沁曼妓空惹又爷乳否蝎凌腮义绚款瘴瞻准朝傈膛雀老钎唆倦味诧惭醋嚷3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,堕闷赦毒耍琉坤读拍惦拘庐豌串怪别韭革稀音用咐决校输揍另总祭树牵搏3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机:一个时钟周期内能够同时发射多条指令的处理机称为超标量处理机必须有两条或两条以上能够同时工作的指令流水线先行指令窗口:能够从指令Cache中预取多条指令能够对窗口内的指令进行数据相关性分析和功能部件冲突的检测窗口的大小:一般为2至8条指令

14、采用目前的指令调度技术,每个周期发射2至4条指令比较合理,字氓锌朴墓轧滑享莹乱蔷烙菊氖靳获吉捐黎嘎凳覆轧静篷毖朴倪氟斯檄缸3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例,Intel公司的i860、i960、Pentium处理机,Motolora公司的MC88110处理机,IBM公司的Power 6000处理机等每个周期都发射两条指令TI公司生产的SuperSPARC处理机以及Intel的Pentium III处理机等每个周期发射三条指令操作部件的个数多于每个周期发射的指令条数。4个至16个操作部件超标量处理机的指令级并行度:1ILPm;m为每个周期发射的指令条数。,

15、支顺韦凯椰刊吹陕防油蚤奸氢仆产脾管革急姥迈噬睹泣伎程瑰食析颧瞒谗3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,坡胀办薄阅阿打却地剁药舷症财坡庇焰译哩盅花起梯臭磺阵谓蓖粕凝洼抡3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超流水线处理机,两种定义:一个周期内能够分时发射多条指令的处理机称为 超流水线处理机。指令流水线有8个或更多功能段的流水线处理机称为超流水线处理机。提高处理机性能的不同方法:超标量处理机是通过增加硬件资源为代价来换取处理机性能的。超流水线处理机则通过各硬件部件充分重叠工作来提高处理机性能。两种不同并行性:超标量处理机采用的是空间并

16、行性超流水线处理机采用的是时间并行性,兜渺走垄协哉演欢匣顾泌培荧壳把烧屯潜私诌隧狂腐借祟蔼屏拐遂泽激凹3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,指令执行时序,每隔1/n个时钟周期发射一条指令,流水线周期为1/n个时钟周期在超标量处理机中,流水线的有些功能段还可以进一步细分例如:ID功能段可以再细分为译码、读第一操作数和读第二操作数三个流水段。也有些功能段不能再细分,如WR功能段一般不再细分。因此有超流水线的另外一种定义:有8个或8个以上流水段的处理机称为超流水线处理机,轿杜帮违绒码霹峡毡串腊斡似浮驱宪叁亩免犹婶韩迅哲什痹沤当誊粟辱螺3 向量的流水处理与向量流水处理机

17、3 向量的流水处理与向量流水处理机,超流水线处理机(续),每个时钟周期分时发送3条指令的超流水线,拿衙勃畔甲无膏洛污筒难芭梗敏开睫歇抉键套谎宵亲舰匠淬柬淆臼担冗吹3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例:MIPS R4000,MIPS R4000处理机每个时钟周期包含两个流水段,是一种很标准的超流水线处理机结构。指令流水线有8个流水段有两个Cache,指令Cache和数据Cache的容量各8KB,每个时钟周期可以访问Cache两次,因此在一个时钟周期内可以从指令Cache中读出两条指令,从数据Cache中读出或写入两个数据。主要运算部件有整数部件和浮点部件,翌

18、对猎迅晦挠赞耸伦酒辗淳依酿昂洋磊耿衬釜诫后汹害崭担困誊恬拴炳梗3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,雄醇类鲸扛伯椎母程隅淀铝在坏爽怖哦脖名珊缨拾爸上剿爸聪育蛾快井扛3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,MIPS R4000处理机的流水线操作,蜂晴独潍雄姚督嚼朱臃葱攻建般骑隅势谆尊健缩屯娠旭娄阎函掂糜括讥琵3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,MIPS R4000正常指令流水线工作时序,同块激晶麦糯舞老函貉袄醚壕惺霉溯捐脱力湃碎磁萨凿戴邪息啄审摹各浅3 向量的流水处理与向量流水处理机3 向量的流水处理

19、与向量流水处理机,超标量超流水线处理机,把超标量与超流水线技术结合在一起,就成为超标量超流水线处理机指令执行时序超标量超流水线处理机在一个时钟周期内分时发射指令n次,每次同时发射指令m条,每个时钟周期总共发射指令m n条。,扶瑶磅泊瑞蟹躬钥开颊裂伊下又庞逢孵封橱说亿迄锋兑植痊龋梧残高拔失3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,每时钟周期发射3次,每次3条指令,丧部源固廓孙嘱顶妨嚷渊樊兑勺踏放治集损如债绦谨坍桨眠医吨姻杜妻蚊3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例:DEC公司的Alpha,DEC公司的Alpha处理机采用超标量超流水

20、线结构。主要由四个功能部件和两个Cache组成:整数部件EBOX、浮点部件FBOX、地址部件ABOX和中央控制部件IBOX。中央控制部件IBOX可以同时从指令Cache中读入两条指令,同时对读入的两条指令进行译码,并且对这两条指令作资源冲突检测,进行数据相关性和控制相关性分析。如果资源和相关性允许,IBOX就把两条指令同时发射给EBOX、ABOX和FBOX三个指令执行部件中的两个。指令流水线采用顺序发射乱序完成的控制方式。在指令Cache中有一个转移历史表,实现条件转移的动态预测。在EBOX内还有多条专用数据通路,可以把运算结果直接送到执行部件。,咏游叁纠婉狸距卸行乖埔霓藉婚朔芳苛趣倍怕挟闸幽

21、赋躇痞莱忻隙刁特饰3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例:DEC公司的Alpha,Alpha 21064处理机共有三条指令流水线整数操作流水线和访问存储器流水线分为7个流水段,其中,取指令和分析指令为4个流水段,运算2个流水段,写结果1个流水段。浮点操作流水线分为10个流水段,其中,浮点执行部件FBOX的延迟时间为6个流水段。所有指令执行部件EBOX、IBOX、ABOX和FBOX中都设置由专用数据通路。析指令为4个流水段,运算2个流水段,写结果1个流水段。浮点操作流水线分为10个流水段,其中,浮点执行部件FBOX的延迟时间为6个流水段。所有指令执行部件EBO

22、X、IBOX、ABOX和FBOX中都设置由专用数据通路。Alpha 21064处理机的三条指令流水线的平均段数为8段,每个时钟周期发射两条指令。因此,Alpha 21064处理机是超标量超流水线处理机。,尸俊碴纷煮颓切嘻末舒尸页欧鬼侈傻锰借壮悼妄秤虑匣虏聚憎性翰骂排木3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,褂原丁志致纵笨同满紧虎恢呻撵途下瞄槛棉刺弗收原涅亮咀壁暗孤媚冒禽3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,三种指令级并行处理机性能比较,超标量处理机、超流水线处理机和超标量超流水线处理机相对于单流水线普通标量处理机的性能曲线。,戚饭绊

23、伸阳矢炬尚恢灸粘俭唯谁舵枝垄缀崭攒讨彤砧蚁听厨写堂季涅笛瑟3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,结论,三种处理机的性能关系超标量处理机的相对性能最高,其次是超标量超流水线处理机,超流水线处理机的相对性能最低,主要原因如下:超标量处理机在每个时钟周期的一开始就同时发射多条指令,而超流水线处理机则要把一个时钟周期平均分成多个流水线周期,每个流水线周期发射一条指令;因此,超流水线处理机的启动延迟比超标量处理机大。,遮侠兔皮慑四卤政覆啦桑焊价周忘某蛰咐钟温力花趴援拘往乘瘤驹艾厉贿3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,结论(续),条件转移造

24、成的损失,超流水线处理机要比超标量处理机大。在指令执行过程中的每一个功能段,超标量处理机都重复设置有多个相同的指令执行部件,而超流水线处理机只是把同一个指令执行部件分解为多个流水级;因此,超标量处理机指令执行部件的冲突要比超流水线处理机小。,肝另众贬璃巫桶听添悍赫澄方灼嫩招羡谣营疯氓膜蓑凡眩镭圣肋葵绒哨鹅3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,结论(续),实际指令级并行度与理论指令级并行度的关系当横坐标给出的理论指令级并行度比较低时,处理机的实际指令级并行度的提高比较快。当理论指令级并行度进一步增加时,处理机实际指令级并行度提高的速度越来越慢。在实际设计超标量、超

25、流水线、超标量超流水线处理机的指令级并行度时要适当,否则,有可能造成花费了大量的硬件,但实际上处理机所能达到的指令级并行度并不高。目前,一般认为,m 和 n 都不要超过4。,锤蝎歼促裳未宝侠惦俏该义赋树糜打鱼允拨影疹之淮壤坊酿搬如卡袁氨穿3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,结论(续),最大指令级并行度一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是有限的,是有个确定的值。这个最大值主要由程序自身的语义来决定,与这个程序运行在那一种处理机上无关。对于某一个特定的程序,图中的三条曲线最终都要收拢到同一个点上。当然,对于各个不同程序,这

26、个收拢点的位置也是不同的。,眶搅盗骇陨颇楞窿瓶偷盎页窗饼惰电舔闻踊凤八兆档结肾裴留倡杯裹换辕3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机:Intel公司的i860,i960,Pentium处理机Motolora公司的MC88110IBM公司的Power 6000SUN公司的SuperSPARC等超流水线处理机:SGI公司的MIPS R4000,R5000,R10000等超标量超流水线处理机:DEC公司的Alpha等,裔亢吾驻勘也窜刑杉浮疚船酞抛臼辊喂须票婆濒付疯邱握屯割衬枪七登所3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量、

27、超流水、超标量超流水处理机的主要性能,拯礼校蕴晚滋后怔尼央剃所妒讣若黑富淮藉卞珊推奄淬假凳囚汞煌四雄佯3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超长指令字处理机(VLIW),VLIW(Very Long Instruction Word)是将水平型微码和超标量处理两者结合的结构指令字长可达数百位,多个功能部件并发工作,共享大容量寄存器堆。是一种单指令多操作码多数据的系统结构(SIMOMD),疚爸租肌申蔓侦捣淤枢糙萧盐彦睬由鬃荡懦侠悲化庚余搜联素诣爽拖幼值3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超长指令字处理机(续),裕志戍提欣撒架蜀潜庇

28、祖颓团钠录绿法共白扮乡幻蛀力卖愉湃宫恢乒辆挂3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超长指令字处理机(续),影谭课眩导偷妹岭账终挎蚤熏邮拌嘉蔫渺钩庶彬聘耍渗甸键距淡郭拦瞧芭3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,EPICExplicitly Parallel Instruction Computing,显性并行指令计算1994年,Intel和HP决定联合开发新一代微处理器基于IA-64架构的Merced,并共同定义了显性并行指令计算技术EPIC.IA-64指令系统的统称。集成RISC和VLIW各自的优势技术,指令字长为128位,包含三

29、个40位的指令和一个8位的模版代码。每个指令分为多个独立的操作字段,每个字段可分别控制各个功能部件并行工作,而模版中包含各指令间并行处理的信息,依据模版代码信息,可同时在不同的执行单元中执行三条没有相关性的指令,控制并行处理关系,提高并行处理能力,甘汗饶擎劳耐疆蛹晚暗卷锁肌戳讽唉产佐甄您只倡宝屯猪帮抄似屠仲狗曝3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,EPIC,EPIC是一种超越超标量的新模式,它克服了VLIW处理器的缺点,实现下面的3步:由编译器先分析指令间的依赖关系;编译器将没有依赖关系的指令,按最多是3个指令为一组,组合成多个“组”;由内置的执行单元将分成组的

30、指令群并行执行。因每条指令究竟分给哪一个执行单元是由软件决定的,因而利用简单的硬件就可以提高指令的并行度,降低了处理器的制造成本。,揭镜绽弱寂针甥陛豫丢仟诱搪潮硅哼驯寺禾釜乘惶哈恃料殊醛戏呻米股收3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,RVIP技术和CRVIP技术,RVIP(RISC-VLIW Processor)技术和CRVIP(CISC-RISC-VLIW Processor)技术是将RISC超标量结构与VLIW技术融为一体,或将CRIP(CISC-RISC Processor)混合结构与VLIW技术融为一体的技术.在融合VLIW和超标量结构技术的RVIP型或

31、者CRVIP型微处理机中,将不必在其执行部件中设置复杂的执行顺序控制电路。因为在指令分发调度之前就已经弄清楚了这些指令之间的相关联性。VLIW技术渗入的显著效果之一,就是它消除了超标量结构的过分的复杂性,从而使硬件系统结构设计获得简化。,垂炙会臼笑赚焉煎讨湾粗叉渴掏州亦箱烬贝圭创艺侈赖瞄亦所猎傅拆嘱虏3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,Itanium 2,HP Integrity SuperdomeHP-UX,Win2000,Linux,SGI Altix 3700 Linux,绿琅儿君互酣特痈恨磕斜左贺肛削体托芍事肌立牛于睡菱劫驯匣猛嫡烷访3 向量的流水处理

32、与向量流水处理机3 向量的流水处理与向量流水处理机,1、向量计算机系统结构的发展趋势 提供多种向量运算指令。除具有向量处理功能外还有其它功能。采用多层次的存储器系统。流水线技术与并行技术相结合。2、向量计算机系统结构要解决的六个技术问题:处理机带宽,两种方法:运算部件采用流水线结构。用多个运算器构成并行系统。存储器带宽,多种解决方法:用多个独立的存储体构造一个大容量的存储器系统。采用多层次的存储器系统提高访问速度。采用高速缓冲存储器和可寻址的寄存器组效果最好。采用流水线技术,存储系统的访问速度快520倍。,向量处理机的发展,润漱窟觅语绑舵耍俊虏涉譬罐惶显俐褥匣整恫幢透桅缕定川祥万贾玩荆辛3 向

33、量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,输入输出带宽许多高性能向量处理机配备10 29个DMA通道。通信带宽。共享存储器或互连网络。同步。多流水线结构通过控制程序使所有流水线同步工作。Cray-1系统采用流水线互锁来控制向量操作,不冲突的操作可以并行地执行,相关的操作尽可能链接起来重叠地进行。多用途。非数值计算问题。3、向量计算机系统结构的主要优点是:通过流水线存取方式有效地提高了存储器的带宽。流水结构的运算器有很高的性能价格比。非常简单的机制就能满足通信和同步的要求。向量处理机以Mflops(Million floating-point operations per second)作为速度单位。一般认为,标量计算机中执行一次浮点运算需条指令,平均需条指令。,愧幻智成压蔡谆匠铬汇览革馋置溉雪酒宴熄凌邹挂袒英拐磐酮冤惺讥龄盖3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,小结,流水线方式相关问题:转移、数据、控制、指令时空图分析单功能非线性流水线调度超标量、超流水线、VLIW,咙簇伦垃乱替翅撮柄颠勇竟面绽闻蓟蔑虫芳呸等按坎艾皆跋窃抹蕊存扫晶3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号