《Ti公司DSP芯片特点、技术发展历程和现状及其应用实例分析.docx》由会员分享,可在线阅读,更多相关《Ti公司DSP芯片特点、技术发展历程和现状及其应用实例分析.docx(14页珍藏版)》请在三一办公上搜索。
1、Ti公司DSP芯片特点、技术发展历程和现状及其应用实例分析一、Ti公司DSP芯片特点特点哈佛结构哈佛结构是不同于传统的冯诺曼(Von Neuman结构的并行体系结构,其主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编 址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线,从而使数据的 吞吐率提高了一倍。为了进一步提高运行速度和灵活性MS320系列DSP芯片在基本哈佛结构的基础上作了改进,一是允 许数据存放在程序存储器中,并被算术运算指令直接使用,增强了芯片的灵活性;二是指令存储在高 速缓冲KCache)中,当执
2、行此指令时不需要再从存储器中读取指德,约了一个指令周期的时间。流水线与哈佛结构相关,DSP芯片广泛采用流水线以减少指令执行时间,从而增强了处理器的处理能力。TMS320系列处理器的流水线深度从6级不等。也就是说,处理器可以并行处理条指令,每条指令处于流水线上的不同阶段。专用的硬件乘法器TMS320系列DSP芯片中具有一个专用的硬件乘法器14条指令就能完成一次乘法和一次加法运算,因此,在一个指令周期内可完成乘法运算在通用的微处器中乘法指令是靠一系列加法来实现的,因此,TMS320系列DSP乘法速度远远高于通用微处理器。特别的DSP指令利用DSP的特殊指令可以将多条指令才能完成的功能用一条指令来完
3、成,这样可大大提高运算速度。快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的指令再加上集成电路的优化设计,可使芯片的指令周期在00ms以下。丰富的指令系统TMS320C31-40的汇编语言指令集特别适合于数字信号处理。所有指令占一个机器字长,大部分 指令是单周器的。指令集共1 有3条指令,可以分为六类:数据传送类、二操作数算术类、三操作数算术逻辑类、程序控制类、互锁操作类及并行操作1类条数据传送指令可从存储器中读一个 字装入寄存器将一个字从寄存器中存入存储器中及进行堆栈操操作数指令奄5条,提供整数、浮点、逻辑运算及多精度算术操侑条三操作数指令可以在一个指令周期内完成具有三个操作数的
4、运算,其中两个是源操作数,另一个是目的操作数。程序控制指令共它们影响程序的流向,其中有块重复指探PTB和单指令重复指令PT&除了有标准跳转指令外,还有延迟跳转指令,有些指令具有条件运算功育阮条互锁操作指令主要用来进行多处理器之间的通信。剩下的旨令都是并行操作指令,每条并行指令由两条指令用符号“H”连接,并行操作指令可使“H”前后的两条指令 并行完成。需要注意的是,并不是任意两条指令都可构成并行指令。硬件结构特征1核心CPUTMS320C5X CP的增强功能在提高性能和通用性的同时,保持TM对320C1X和TMS320C2X源代码的兼容性。硬件的改进包括:一3个立累加器缓冲器,附加定标能力,利用
5、附加硬件功能的新指令。新 的控制功能包括:独立的并行逻辑单元U)和一组文本交换寄存器。数据管理方面的改进包括:采 用新的块搬移指令和存储器映像寄存器指令S320C50有28个存储器映像寄存器和6个存储器映像的I/O口。2. 片内ROMTMS320C50拥有2KX16位掩蔽ROM,内部固化了引导程序。该存储器把程序从外部/EPROM串行口或并行I/O 口引导至运行速度较快S欠AM中。这块引导ROM可通过PMST状态寄存器中的MP/MC位从程序存储空间去除。如果该M未选,贝TMS320C50由片外存储器启动执行。3. 片内数据RAMTMS320C50具有1056字的片内RAM,这块RAM可在每个机
6、器周期内访问两次双寻址RAM),只要两次访问不是“写操作。这块存储空间主要用于存储数据,但是如果需要也可用于存储程序和数据。其 配置有两种方式:所有的56字都作为数据存储区,或者将其中的字作为数据存储器512字作为程序存储区。可通过状态寄荏新中的CNF位选择设置。4. 片内程序数据RAMTMS320C50还具有9K字的片内RAMO这一存储区可以由软件设置映射到程序或数据存储空间。程序从 片外存储器引导后,可装入到该存储区全速运行。5. 片内存储器安全TMS320C5 0可以通过可屏蔽选择来保护片内存储器的内容。当相关比特置位时,外部无法访问片内存 储空间。6. 有地址映射的软件等待状态发生器软
7、件等待状态逻辑不需要任何外部硬件就可以实现20C5屿速度较慢的片外存储器和O设备接 口。该电路系统拥郁个等待状态发生器,其中可由用户编程操作的有,2, 3和7状态。7. 并行I/O口TMS320C50共有64K I/O口,其中的16个可映射在数据存储空间。这些口可由或OUT指令寻址。具有存储器映像的/O 口可按存储器的读写方式访问/O 口的访问由IS线选通。增加简单的片外地址译码电路,就可实IMS320C50的I/O 口与外部I/O设备的简单连接。8. 串行I/O口TMS320C5(有两个高速串行口。串行口最快可按机器周期CLKOUT)操作。一个是同步全双工串 行口,发送和接收都有缓冲,分别由
8、可屏蔽外部中断信号控制,数据或按脸方式传输;另一 个串行口为全双工串口,可设置为同步方式,也可设置为时分物址方式,TDM串行口一般用于 多处理机系统。9. 16位硬件定时器16位硬件定时器可由软件进行控制,通过设置相应的状态位,定时器可工作在停止、重启动、复位或 不工作等状态。10. 用户可屏蔽中断TMS320C5(有4个外部中断线片内的中断锁存电路可实现异步中断操作外,还有5个内部中断:1个定时器中断和4个串行口中断。11. JTAG扫描逻辑JTAG扫描逻辑电路用于仿真和测试,采TTAG可实现在线仿真。二、发展历史和现状从1978年出现的第一个单片SP以来,DSP芯片在这20几年来得到了高速
9、发展DSP芯片的应用也越来越广泛,根据其用途可分为通用S型芯片和专用型DSP芯片;按基础特性分为静态P芯片 和一致性)SP芯片;按数据格式分为定点P芯片和浮点)SP芯片。美国德州仪器公司T6xas Instruments简称TI)推出的TMS系列D SP芯片已经成为当今世界上最有影响的DSP芯片2,TI公司在1982年推出第一代)SP芯片TMS3201X,、TMS320C1X系列,随后推出第二何SP芯片TMS320次小、TMS320C2X系列,第三代DSP芯片TMS320C3X系列,第四代DSP芯片 TMS320C4X系 列,第五 代DSP 芯片 TMS320C5X系 列,第六代)SP 芯片
10、TMS320C6X系 列。第一代TMS320系列D SP芯片TMS320C1X是定点DSP芯片,采用二级流水线;第二代TMS320系列D SP芯片TMS320C2X系列是定点)SP芯片,采用三级流水线;第三代TMS320系列D SP芯片TMS320C3X系列芯片是浮点iSP芯片,采用四级流水线;第四代TMS320系列D SP芯片TMS320C4X系列芯片是浮点SP芯片,采用五级流水线; 第五代TMS320系列D SP芯片TMS320C5X系列芯片是定点SP芯片,采用四级流水线;第六代TMS320系列DS P芯片TMS320C6X系列芯是一种新型定点SP芯片,该芯片的内部结构与以前的 DSP芯片
11、不同,内部集成了多个功能单元,可同时执予旨令,运算能力达600MIPS美国AD公司的DSP芯片AD公司的DSP芯片可以分为定点SP芯片和浮点)SP芯片两大类MSP21XX系列为定点DSP芯 片,ADSP21XXX系列为浮点)SP芯片。目前,定点DS P芯片主要有DSP2101/2103/210ASDP2111/2115 ADSP2161/2162/2163/2164/2165/2166及 ADSP2171/2173/2181等 o 浮点 DSP 芯片 主要有 ADSP21000/21020ADSP21060/2106等。AD公司的定点)SP芯片的程序字长为4位,数据字长为6位。运算速度较快,内
12、部具有较为丰富的 硬件资源,一般具有个串行口、1个内部定时器和个以上的外部中断源,此外还提8#位EPROM 程序引导方式。具有一套高效的指令集,如无开销循环、多功能指令、条件执行等。ADSP2101的指令周期奁0ns、60ns和50ns三种,内部有2K字的程序RAM和1K字的数据RAMoADSP2103 与ADSP2101相比,指令周期为00ns工作电压3.3Vo ADSP2105是ADSP2101的简化,指令周期为 72ns,内部的程扇AM为1K字,数据RAM为512字,串行口减为个。ADSP216X系列的指令周期为50ns100ns与其他定点芯片相比,具有较大的内部程序?OM,如 ADSP
13、2161/216内部提供78K的程序ROM, ADSP2162/216内部提供4K程序RO/工作电压翔.3V, 这些芯片的内部数据AM均为512字。而ADSP2165/216除了具有1K字的程序ROM外,还提供J12K 字的程序RAM和4K字的数据RAM,其中,ADSP2166的工作电压为3.3V。ADSP217的指令周期为30ns,速度达33.3MIPS是AD公司DS P芯片中运算速度最快的定点芯片之一。 内部具有2K字的程序RAM和2K字的数据RAMOADSP2173的资源与ADSP2171相同,工作电压为3.3V。目前ADSP的定点DS P芯片中,处理能力最强的当ABSP218OAT&T
14、公司DSP芯片AT&T是第一家推出高性能浮DSP芯片的公司oAT&T公司的DSP芯片包括定点和浮点两大类。 定点DSP芯片中有代表性的主要包DSP16 DSP16A DSP16C DSP1610和DSP1616等。浮点)SP芯片 中比较有代表性的包括SP32 DSP32C和DSP3210等oAT&T定点DSP芯片的程序和数据字长均偈位,有2个精度为36位的累加器1个深度为15字的指 令Cache,支持最多127次的无开销循环DSP16的指令周期为55ns和75ns,累加器长度*6位, 片内有2K字的程序ROM和512字的数据AMODSP16A速度最快的版本为5ns的指令周期片内有12K 字的程
15、序ROM和2K字的数据RAMo DSP16C的指令周期为38.5ns和76.9ns片内存储器资源与SP16A 相同,增加了片内魄odec,此外,还有1个4引脚的JTAG仿真口。,?1610片内有512字的引导ROM 和8K字的双口RAM,支持硬件和软件等待状DSP1616片内有12K字的ROM和2K字的双口RAM,支 持软件等待状态。,?1610和1616提供了仿真接口。DSP32C是 DSP32的增强型,是性能较优的一种浮DSP芯片。其主要特点包括:(1) 80/100 n的指令周期;(2) 地址和数据总线可以在单个指令周期内访问; 片内具有3个512字的RAM块,或2个512字的RAM块加
16、1个4K字的ROM块。可以寻址4M字的 外部存储器;(4) 具有串行和并行/O接口。串行I/O采用双缓冲,支持8/16/24/32立串行数据传输外部微处理 器可以控制DSP32C的8/16位并行口;(5) 采用专用的浮点格式,可在单周期内与E-754浮点格式进行转换;(6) 具有4个40位精度的累加器和2个通用寄存器;(7) 支持无开销循环和硬件等待状态。DSP3210内部具有2个1K字的RAM块和512字的引导ROM,外部寻址空间达G字节,可以用软件编程 产生等待状态,具有串行口、定时器A控制器和一个Motorola和 Intel微处理器兼容白32位 总线接口。Motorola公 司DSP芯
17、片Motorola公司的DSP芯片可分为定点、浮点和专用三种。定点DSP芯片以MC5600Q MC56001 MC56002为代表。程序和数据字长24位,有2个精度为56位 的累加器ASP56001的指令周期为50ns和74ns两种。片内具有512字的程序RAM. 512字的数AM 和512字的数据ROM。三个分开的存储器空间,每个均可寻址字。片内32字的引导程序可以从外 部EPROM装入程序。支持8位异步和824位同步串行I/O接口。并行接口可与外部微处理器接支, 持硬件和软件等待状态产生MC56000是ROM型的DSP芯片,内部具有字的程序ROM。MC56002则 是一个低功耗型芯片,可以
18、在0V5.5V电压范围内工作。浮点DSP芯片以MC96002为代表,采用EEE-754标准浮点格式,累加器精度达位,可支持双精度 浮点数。该芯片的指令周期50/60/74ns片内有3个32位地址总线柜个32位数据总线。内部具 有1K字的程序RAM、1K字的数据RAM和1K字的数据ROM。64字的引导ROM可以从外部位EPROM引 导程序。内部具有10个96位或30个32位基于寄存器的累加器支持无开销循环硬件和软件等待 状态产生。具有三个独立的存储空间,每个空间可寻址。MC56200是 一种基于MC56001 DSP核,适合于自适应滤波的专用定)获芯片,指令周期为7.5ns程序字长和数据字长分别
19、为位和16位。内部的程序和数掘M均为256字,累加器精度为0位。MC56156则是一个在片内集成了过取样D话带Code c模数转换器和锁相环的SP芯片,主要用于蜂 窝电话等通信应用,其指令周期为/50n。除了以上介绍的一些SP芯片之外,还有一些公司的P芯片也较著名。例如EC公司的mPD77C25 mPD77220定点DSP芯片和mPD77240浮点DS P芯片等。三、应用实例正弦信号发生器正弦函数six可表示为指数形式的z变换由此可以得到正弦序列设单位冲击序列经过一系统后,其输出为正弦序列n(k3T)则系统的传递函数为就是正弦序歹Sin (kT)的2变换,即求其极点为妲仙+仙2co5(7) 土
20、_2(8.5)=匚制泌)+尹inyT)由上式可以看出,,:是一对复根,其幅值1相角为3T。幅值为1的极点对应一个数字振荡器,其振荡频率由系数、B和C来决定。因此,设计振荡器主要就在于确定这些系数。(8由瓣Y(Z) - A2yYZ) + BZ2YZ)=CZ-1(Z)设初始值和,求上式轴反变换,得这是个二阶差分方程,其单位冲击响应即为Xk3T)。利用单位冲击函数卜1的性质,即仅当k=1 时, xk 1=1, 代 入 上 式 得:上二 0 0 = Ay-Y十四2 + 0=0* = 1 yl = 4)(0 + Av-l + C=Ck=2 r2=4)P + 0+0=JXl(8-7)3 j3 = 4)2
21、+ 1tj j,用=项y力1十 Byn 2当k2, yk能用yk1和yk2算出,这是一个递归的差分方程正弦波信号发生器的设计与实现根据上述数字振荡器的原理,一个正弦波序列可以通过递归方法得到,B系数一旦确定后,代 入上式就可得到期望频率的正弦序列面根据数字振荡器的原理在S320VC5402计一正弦波信号 发生器,并使用汇编语言完成源程序的编写。设计产生频率为的正弦波二二:三三,为了得到正弦波序列的输出,可以采用定时中断的方法 输出yn,再经过D/A转换和滤波后输出连续的正弦波。设采样率为-.二二二(即通过定时器中断,每隔us产生一个yn),则递归的差分方A = 2 cos= 2 cos 2 7
22、l = 2cos 211 =0.95105852Z 40B = -lC 二 SU10T =sin2jr = sin 2te二 0.58778525229程系数为J为了便于定点DSP处理,我们将所有系数除以然后用16位定点格式表示为x2ls = 79BC2B .x215 = C00022152这便是产生kHz正弦信号的三个系数。由前面的推导也可以看出,(用式产生的正弦波频率只是 一个相对值只有给定了采样频率也就是确定了采样点之间的时间间隔后能最终决定模拟频率。 为了得到精确的采样频率,我们用定时器产生s时间间隔,获得0kHz的采样频率。定时器的初十鬼值计算由下式决定式中clkf为DSP时钟频率,
23、Sf为采样频率。设定时其预分频系数=0则定时器周期寄存器初值PRD=&_1PRD为上本例中,二二1:&|. ,一 二1士.则prd=2499程序设计首先进行初始筋始化包括计算出1和y2,定时器相关寄存器设置然后开放定时器 中断。1.初始化y1和y2SSBXFRCT;置FRCT =1 ,准备进行小数乘法运算ST#INIT_A , AA;将常数入装入变量AAST#INIT_B , BB;将常数B装入变量BBST#INIT_C , CC;将常数C装入变量CCPSHDCC;将变量CC压入堆栈POPDy2;初始化y2=CCLDAA , T;装入入到T寄存器MPYy2 , A;尸2乘系数入,结果放入入寄存
24、器STHA, y1;将寄存器A的高16位存入变量y12.初始化定时器程序STM #10h , TCR;停止定时器STM #2499 , PRD;设置PRD寄存器值为2499 , TINT中断频率为40KHzSTM#20h, TCR;重新装入TIM和PSC,然后启动定时3.中断初始化中断初始化包括设置中断总开关和中断屏蔽寄存器,修改中断向量表的入口地址。中断服务程序代 码片断:LD#0 DP;设置DP页指针SSBXINTM;关闭所有中断LD#vector;读出中断向量(地址vector在中断向量表程序中定义)AND#OFF80h, A;保留PMST的低7位ORPMST, ASTLM A,PMST
25、;设置PMST(其中包括IPTR)RSBXINTM;开所有中断初始化完成后,主程序循环等待定时器中断。当程序进入定时器中断服务程序时,天烦前面的 和y2,计算出新的n,经过D/A转换后,得到一个正弦信号波形。中断服务程序如下:tint:LDBB, T;将系数B装入丁寄存器MPYy2, A; y2乘系数B,结果放入入寄存器LTDy1;将)1装入丁寄存器,同时复制到y2MACAA, A;完成新正弦数据的计算,a寄存器中为;y1*AA+y2*BBSTH A, l, y1;将新数据存入)1,因所有系数都除过2,所以;在保存结果时转移一位,恢复数据正常大小STH A, y0;将新正弦数据存入)0NOPR
26、ETE要获得完整的程序,必须有中断向量表文件和内存定位文件。中断向量表清单如下:,mmregs.ref _ret.ref _c_int00.ref _tint.global vector.sect ”.inttable”interrupte vector table;vector:rs b _c_int00nopnopnmi b_retnopnopsint17b retnopnopsint18b retnopnopsint19b retnopnopsint20b ret.word0,0一sint21b ret.word0, 0sint22.word 01000h.word0, 0, 0sint
27、23.word 0ff80h.word0, 0, 0sint24.word 01000h.word0, 0, 0sint25.word 0ff80h.word0, 0, 0sint26 .word 01000h .word 0, 0, 0 sint27 .word 0ff80h .word 0, 0, 0 sint28 .word 01000h .word 0, 0, 0 sint29 .word 0ff80h .word 0, 0, 0 sint30 .word 01000h .word 0, 0, 0 int0 b retnop nop int1 b retnop nop int2 b r
28、etnop nop tint b _tint nop nopbrint0 b _ret nop nop bxint0 b retnop nop trint b _ret nop nop dmac1 b retnop nop int3 b _ret nop nop hpint b _ret nop nop q26 .word 0ff80h .word 0, 0, 0 q27 .word 01000h .word 0, 0, 0 dmac4 b retnop nop dmac5 b retnop nop q30 .word 0ff80h .word 0,0,0 q31 .word 01000h .
29、word 0,0,0 ;end of interrupte vector table_ret rete内存定位文件清单如下:MEMORYPAGE 0:VEC: origin = 1000h, length = 0ffhPROG: origin = 1100h, length = 8000hPAGE 1:DATA: origin = 080h, length = 0807fhSECTIONS,text PROG PAGE 0,cinit PROG PAGE 0,switch PROG PAGE 0.int_table VEC PAGE 0,data DATA PAGE 1.bss DATA PA
30、GE 1,const DATA PAGE 1.sysmem DATA PAGE 1.stack DATA PAGE 14、观察输出信号波形以及频谱编写完成以上程序后,就可以在CCS集成开发环境下运行,并通过CCS提供的图形显示窗 口观察输出信号波形以及频谱。以上过程分以下几步完成:(1) 启动CCS,新建工程文件,如文件名为sinewave.pjt。选择Project菜单中的Add File to Project选项,将汇编源程序sin.asm、vec_table.asm和连接定位sinewave.cmd文件依次 添加到工程文件中。其中,sin.asm包括初始化代码和中断服务程序,而vec_t
31、albe.asm为中 断向量表。(2) 完成编译、连接,生成.out文件,并装载.out文件到片内存储器。(3) 选择“ViewfGraphfTime/Frequency”,打开图形显示设置窗口。在弹出的对话 框中按图8.3设置,主要修改“Star Address”为y0(y0为生成的正弦波输出变量); “Acquisition Buffer Size”为1,“DSP Data Type”为“16-bit signed integer”。图8.3图形显示窗口参数设置在汇编源程序的中断服务程序(_tint)中的“nop”语句处设置断点。该行前加一红色亮点。选择“DebugAnimate”,运行程
32、序,可观察到输出波形,如图8.4示。图8.4输出正弦波信号波形(5)用右键单击图形显示窗口,并选择“Proporties”项以便修改显示属性。将“DisplayType”项改为“FFTMagnitude”以便显示信号频谱。修改“SamplingRate(Hz) ”项为40000, 然后退出,即可观察到生成的正弦波频谱,如图8.5所示。图8.5输出正弦波信号频谱设计总结:DSP芯片具有的特殊软硬件结构和指令系统,使其能高速处理各种数字信号处理 算法。基于此设计的正弦信号发生器具有速度高、精度高的特点。同时该系统依靠简洁的外 部硬件电路设计和合理的软件程序设计,能够产生幅度和频率可调的高稳定度正弦波。而且 该系统的可扩展性良好,只需要在中断服务程序中改变送往D/A芯片中的采样值,而不改动 任何硬件电路,就可以实现三角波、方波乃至更复杂波形的输出。鉴于DSP不断提高的性价 比,故在传统产品中采用DSP作为主控制器已成为一种趋势。