分布式星载SAR回波仿真的并行化计算研究.docx

上传人:小飞机 文档编号:1667006 上传时间:2022-12-13 格式:DOCX 页数:5 大小:1.92MB
返回 下载 相关 举报
分布式星载SAR回波仿真的并行化计算研究.docx_第1页
第1页 / 共5页
分布式星载SAR回波仿真的并行化计算研究.docx_第2页
第2页 / 共5页
分布式星载SAR回波仿真的并行化计算研究.docx_第3页
第3页 / 共5页
分布式星载SAR回波仿真的并行化计算研究.docx_第4页
第4页 / 共5页
分布式星载SAR回波仿真的并行化计算研究.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《分布式星载SAR回波仿真的并行化计算研究.docx》由会员分享,可在线阅读,更多相关《分布式星载SAR回波仿真的并行化计算研究.docx(5页珍藏版)》请在三一办公上搜索。

1、第18卷第8期 Vol. 18 No. 82006年8月 Aug., 2006分布式星载SAR回波仿真的并行化计算研究王曦爽1,2,黄立胜1,王贞松1(1.中国科学院 计算技术研究所, 北京 100080;2.中国科学院 研究生院, 北京 100080)摘 要:对分布式星载SAR系统地面回波仿真程序并行化算法进行了研究。重点介绍了分布式小卫星SAR系统多星协同工作的仿真策略、各并行节点任务的分配策略和并行节点间大量数据传输的策略。实验证明此并行化算法具有较高的加速性能,具有实际的应用前景。关键词:分布式星载合成孔径雷达;仿真系统;并行算法;地面目标回波数据中图分类号:TP311.1 文献标识码

2、:A 文章编号:1004-731X (2006) 08Research on Parallel Arithmetic of Distribute Space Borne SAR Ground Target SimulationWANG Xi-shuang1 2, HUANG Li-sheng1, WANG Zhen-song1(1.Institute of Computing Technology, Chinese Acadmic of Science, Beijing 100080, China;2.Gruduate School of Chinese Academic of Science

3、, Beijing 100080, China)Abstract:The parallel arithmetic of distribute space borne SAR ground target echo data simulating procedure was examined. The following issues were introduced: the method to simulate the cooperating working mode of distribute space borne SAR system, the policy of allotting ta

4、sks between parallel computing nodes, and the policy of transferring massive-data between computing nodes. The experiment proves that the parallel arithmetic has high speed-up performance.Key words:distribute space borne SAR; simulation system; parallel arithmetic; ground target echo data引 言收稿日期:200

5、5-06-22 修回日期:2005-12-29 作者简介:王曦爽(1977-), 男, 陕西人, 博士生, 研究方向为计算机系统结构设计及实时信号处理;黄立胜(1971-), 男, 广西人, 研究方向为合成孔径雷达成像信号处理、成孔径雷达成像系统模拟;王贞松(1945-), 男, 上海人, 研究员, 博导, 研究方向为数字信号处理、计算机通信。建立小卫星分布式雷达仿真系统,对于研究小卫星分布式雷达系统的概念和理论具有重要的科研意义。而实现小卫星分布式雷达系统的仿真建模,首先需要对小卫星分布式星载SAR目标回波数据进行仿真。星载SAR的回波数据量巨大导致回波数据的仿真工作的计算量巨大,需要耗费大

6、量仿真时间1。文献1提出了一种基于FFT的快速模拟算法生成回波,通过减少插值点的方法降低模拟的计算量,大大降低了仿真时间。但是该算法为了补偿由减少插值点带来的误差问题,提出了一种在插值时增加采样率的方法,这种方法无法生成的高精度的模拟数据。因此为了在较短的时间内得到高精度的回波仿真数据,还需要设计并行仿真系统,采用常规算法进行回波数据的仿真过程。我们选择曙光4000B并行处理机对分布式星载合成孔径雷达系统回波产生过程进行并行化仿真,并给出仿真结果。在实现并行化仿真计算SAR回波数据的研究中,要解决以下三个问题:一、分布式星载SAR一星发射微波,多星接收雷达回波过程和多星发射回波,多星接收回波的

7、并行化计算实现策略;二、在仿真过程中,并行任务的分配策略;三、在仿真过程中,各并行计算节点之间数据的传递策略。1 星载SAR回波仿真的原理在信号空间里,SAR信号经过解调后,假定为天线加权,为发射信号的包络,K是根据脉冲信号带宽和脉冲持续时间求得的线性调频率,是点目标的后向散射系数,合成孔径雷达的点目标扩散响应可写成为2-3 (1)其中()是SAR天线相位中心(APC-Antenna Phase Center)的坐标,()是点目标的坐标,是距离向时间延迟,c是光速,是波长。为SAR天线相位中心与点目标之间距离,计算方法如下: (2)在实际过程中,大量被观测目标都是具有一定体积和形状的分布目标,

8、例如飞机或者舰船等。在工程上,将整个军事目标的雷达散射面划分成若干小单元,每个单元可看成一个具有固定RCS的点目标,然后分别计算其散射系数和回波,并根据现有的结果和资料进行一定修正和计算3。然后叠加起来,得到分布目标的回波: (3)分布目标可以分解成为无数个点目标,而计算无限个点目标的回波是不可能的,根据文献4,一个分辨单元内只需要模拟几个点目标,其回波叠加结果与实际结果相差无几。若分布目标总共分解成L个点目标,回波的表达式又可写成: (4)其中为分布目标回波,为点目标回波。(4)式是计算分布目标回波的基本方法,即分别计算由分布目标分解成的每一个点目标的回波,然后叠加起来,得到总的目标回波。当

9、分布目标分解成的点目标数越多,叠加后的回波就越接近实际值。计算分布目标回波的总计算量见下式: (5)Ctotal1是总的计算量,Cp是一个点目标的计算量,Tw是发射信号时间宽度,Fs是采样频率,Cc是一次复数构成并相加的计算量。由(5)式可见,虽然增加分解的点目标数目越多结果越精密,但随之而来的计算量与分解出的点目标数量呈正比增加,导致大面积的分布目标回波模拟花费大量时间。2 用曙光并行机进行分布式小卫星SAR地面目标回波仿真如上节所述,当需要仿真的地面目标分解的点目标数目增加时,仿真的计算量也呈正比例增加,为实现这样的仿真任务需要占用很大的存储空间,完成大量的计算任务,因此需要使用高性能计算

10、系统作为计算平台。伴随着通信技术和计算机技术的发展,涌现出许多并行计算机系统,为高复杂度的问题求解提供了有力的平台支持。在众多的并行计算系统中,大规模并行处理系统(Massively Parallel Processing system, MPP)由于具有较好的扩展性而得到了广泛的使用。一个MPP系统由一定数量的计算节点组成,每个节点包含一个或多个处理器和自己独立的存储空间,甚至可以由一个对称共享内存多处理系统(Symmetric Multi Processing, SMP)构成一个超节点,节点之间通过高速网络互相连接5。为了实现在MPP系统上完成并行任务,还需要相应的软件编程环境提供编程的机

11、制与接口,目前国际上使用较为广泛的并行编程环境为消息传递接口环境(Message Passing Interface,MPI)。消息传递是目前并行计算机上广泛使用的一种程序设计模式。MPI是基于消息传递编写并行程序的一种用户界面。用户通过调用MPI提供的接口函数实现进程间的消息通信。在这样的软硬件平台下,用户在提交并行运行任务之前,需要申请或指定若干个节点完成此任务,这些节点成为一个分区,待运行的任务就加载在所分配的分区上。由于并行任务是以消息传递机制实现,所以在运行的过程中,各个工作节点之间可能需要进行数据交换,这是并行处理程序需要着重考虑的问题。一般来说,任务需要进行并行化,根据分区的大小

12、分成几个子任务,在执行任务前将每个子任务分别加载到各个节点上,只要任务的分配是合适的,就能使整个程序的数据处理能力成倍的增加。2.1 曙光并行机简介在本论文进行的研究中,我们使用曙光4000B并行刀片机作为仿真平台。曙光4000B刀片机是一台基于消息传递机制的大规模并行计算机系统(MPP)。它由8个SMP超节点组成,每个SMP超节点具有2个超线程技术(HT)的INTEL Xeon2.8G CPU,这两个CPU共享2GB内存和40GB硬盘。8个SMP超节点之间通过千兆以太网连接,对外部网络通过百兆以太网连接。2.2 使用曙光并行机仿真回波的产生过程在这一部分,主要介绍实现分布式小卫星SAR地面回

13、波仿真并行化过程需要解决的三个问题:1.实现分布式小卫星系统一星发射微波,多星接收回波过程(以下统一简称单发多收过程)和多星发射微波,多星接收回波过程(以下统一简称多发多收过程)的解决策略;2.并行节点任务分配的解决策略;3.在仿真结果数据收集过程中,各并行计算节点之间数据的传递策略。(1) 实现单发多收与多发多收过程的策略前面已经介绍了SAR回波仿真的基本原理,它是整个仿真系统的核心,也是需要并行化实现的部分。但是为了实现小卫星系统SAR地面目标回波数据的仿真,还需要向仿真系统传递仿真参数,因此首先确定仿真模块的划分,仿真系统划分为两个基本模块:仿真参数获取模块与点目标回波仿真模块。由仿真参

14、数获取模块获取仿真参数(包括卫星参数与雷达参数)并以发送微波和接收回波的小卫星参数为输入参数调用点目标仿真模块,生成点目标回波仿真数据。由于分布式小卫星SAR系统发送微波的雷达与接收回波的雷达在绝大多数情况下并非同一个,因此仿真参数获取模块在每次仿真时需要向点目标仿真模块提供发射微波的卫星参数以及接收回波的卫星参数。为了实现单发多收的仿真过程,需要建立接收回波的小卫星队列,队列中每个节点包含一个接收回波的小卫星参数。仿真时每次从接收回波的小卫星队列中摘取一个接收回波的小卫星节点,并将发送微波的卫星节点与接收回波的小卫星节点参数提供给点目标仿真模块进行仿真。循环执行该过程直到接收回波的小卫星队列

15、为空。该过程如图1所示。多发多收的仿真过程以单发多收的仿真过程为基本单元,为了实现多发多收仿真过程,需要建立发送微波的小卫星队列,队列中每个节点包含一个发送微波的小卫星参数,每个发送微波小卫星对应一个接收回波的小卫星队列。仿真时,每次从发送微波队列中摘取一个发送卫星节点,以该节图1 单发多收的仿真过程示意图点为发送卫星节点执行一次单发多收的仿真过程,循环执行此过程直到发送卫星队列为空为止。该过程如图2所示。图2 多发多收过程的仿真示意图(2) 生成回波数据的并行仿真策略使用曙光机并行仿真回波数据需要解决的另一个问题是对并行任务的分配问题。在用并行机处理数据时需要关注两个问题,一是平均分配运算任

16、务,使所有并行节点的工作负载基本平衡。这样才能最大的发挥并行程序的性能;二是合理划分并行任务粒度(task granularity)的尺寸大小,获得最大的并行性。使用并行机处理数据时,首先要解决的问题工作负载的平衡问题。合理划分工作任务,使得各个运行节点平均分担运算任务,才能近似同时运算,同时完成任务,最大地发挥并行机的性能。合理划分任务粒度是另一个需要解决的重要问题。通常用R/C的比值作为衡量任务粒度的尺度,其中R代表程序的执行时间,C代表用于通信的开销。在粗粒度(coarse grain)的并行情况下,R/C的比值比较大,每个单位计算只需要少量的通信。在细粒度(fine grain)并行情

17、况下,R/C比值比较小,每个单位计算有很大的通信量和其它的开销6。在粗粒度的并行情况下,并行节点之间额外的通信开销较小,并行程序能够获得较大的加速性能。但是由于任务粒度较大,因此无法完全发掘程序的并行性;在细粒度的并行情况下,每个并行节点可以将一个程序尽可能地分解成能并行执行的小任务,充分发掘程序的并行性。但是由于并行执行的任务数量较多,并行节点之间的通信开销大大增加,降低并行程序的加速性能。SAR地面目标回波仿真的过程是多个点目标回波仿真数据的叠加过程,如公式(4)所示。不同点目标回波产生的过程彼此独立,互不相干;而单个点目标回波仿真的内部过程耦合性较大。因此,如果并行运算粒度大小为一个点目

18、标回波产生的过程,则各个并行节点之间额外的通信开销较小,并行程序可以获得较高的加速比,而且根据需要仿真的点目标个数容易实现各个运算节点仿真任务的负载平衡,但是由于单个点目标仿真过程占用较大的系统资源(如内存资源),因此参与并行运算的节点数量受到限制;如果细化并行运算任务的粒度,深入到单个点目标回波产生过程内部实现并行化,可以增加参与并行运算的节点数目,但是并行节点之间的通信开销大大增加,严重影响并行程序性能,并且不易实现各个运算节点仿真任务的负载平衡。基于对并行任务粒度大小与并行任务负载平衡两个方面问题的考虑,以及SAR地面目标回波产生过程的特点,采用粗粒度并行的策略进行分布式小卫星SAR地面

19、回波仿真的并行化实现:统计需要仿真的点目标个数,将这些点目标的仿真任务平均分配给各个并行计算节点,各个计算节点在仿真完成后将仿真数据进行汇聚收集,生成所有点目标回波的仿真数据。该仿真过程流程如图3所示。图3 并行仿真过程流程图(3) 回波数据的收集策略由于每个并行运算节点都独立生成各自的点目标回波数据,因此在所有并行计算节点仿真结束后,需要将所有运算节点仿真的回波数据收集到并行运算主节点上。由于所有运算节点生成的仿真数据的容量大小均相同(仿真数据的容量大小由仿真生成的回波图像的大小决定,所有并行节点均仿真生成同样大小的回波图像,例如1k1k、16k16k等),因此只要将各个运算节点生成的回波数

20、据进行叠加,就实现了运算节点仿真数据的收集工作。示意图如图4所示。图4 各并行计算节点回波数据的收集过程原理图由于生成的点目标仿真数据容量较大,如果按照图4的方法逐一叠加仿真数据,必然会增加额外的通信时间,影响并行程序的性能。因此选择二路归并法对仿真数据进行收集,算法的原理如图5所示。图5 并行节点使用二路归并算法收集仿真数据原理图我们确保参与并行计算的节点数为2的n次幂,这样可以确保使用二路归并法正确实现数据汇聚,此算法基本原理是:在发送、接收数据的节点集合内,从节点0开始,每个奇数序号的节点都向与自己相邻的偶数序号的节点发送数据,接收数据的节点将该数据与本节点生成的数据相叠加。同时,发送数

21、据的节点将自己从发送、接收数据的节点集合内删除。在下一轮归并时,所有发送、接收数据的节点重复上一轮归并的过程。这样循环直至只剩下一个节点接收数据。使用二路归并法,可以令多个计算节点同时传递数据,增加了通信的并行度,减少并行计算中额外的通信时间,进一步增强并行算法的性能。3 并行仿真计算性能分析与正确性验证为了分析分布式小卫星SAR地面回波仿真并行化算法的性能并验证并行算法的正确性,我们对并行仿真系统进行了实测。我们提供100个待仿真点目标参数,使用单发双收(一颗卫星发射微波,两颗卫星接收回波)模式生成1k1k和4k4k大小的回波图像。3.1 并行算法正确性验证图6是55点阵目标模拟回波结果。两

22、幅回波干涉图基本上是一样的,成像结果几乎看不出差别。定义模拟误差为: (6)计算可以得到图6所示模拟结果Ee=-270dB,远远低于SAR系统噪声要求。图7是55点阵目标的模拟成像结果。 (a) 单机程序模拟的回波 (b) 并行程序模拟的回波图6 55点阵目标模拟回波 (a) 单机程序模拟的成像结 (b) 并行程序模拟的成像结果图7 55点阵的模拟成像结果3.2 并行算法性能分析衡量并行算法的性能主要参考两个指标:并行算法的加速比和加速效率。加速比是单计算节点程序运行的时间与多计算节点并行程序运行时间的比值。该指标用于衡量并行程序的运算速度;而加速效率是加速比与参与并行计算的节点个数的比值。该

23、指标用于衡量在执行并行程序时,每个参与并行运算的处理器的使用效率。并行算法在不同情况下运行时间和并行加速比/加速效率如表1、表2所示。表1 不同情况下并行算法的运算时间计算节点个数 图像仿真时间1k1k /(s) 4k4k/(s)1节点 58.57 s 629.34 s4节点 15.69 s 170.54 s8节点 10.04 s 85.68 s16节点 8.16 s 77.50 s表2 不同情况下并行算法的加速比/加速效率计算节点个数 并行加速比/加速效率1k1k 4k4k4节点 3.73/0.93 3.69/0.928节点 5.88/0.74 7.35/0.9216节点 7.17/0.45

24、 8.12/0.51从表1、表2中的数据看出:使用适当并行计算节点个数情况下具有较高的加速比和加速效率。当使用4个计算节点并行计算时并行程序的加速比大于3.6,加速效率大于0.9;当使用8个计算节点并行计算,并行程序的加速比大于5.3,加速效率大于0.65。图8是根据并行算法的加速比绘制的曲线图。从图8曲线走势可以看出,并行程序的加速比最初随并行运算节点数增加程线性增长趋势,但是随着并行运算节点个数不断增加将趋近一个上限。这是因为并行机的运算资源有限,无法为更多的运算节点分配运算资源,导致加速比随并行计算节点数增加时趋于上限值,甚至由于并行计算节点数目过多导致加速比下降。图8 并行计算节点个数

25、与加速比关系曲线图从以上的分析可以看到,使用并行算法进行分布式小卫星SAR地面目标回波仿真的优越性,它大大缩短了仿真回波数据的生成时间,加快了工程的速度。4 结论本文首先介绍了SAR点目标回波仿真过程的原理,接下来详细介绍了使用曙光大规模并行处理机对分布式小卫星SAR地面目标回波并行仿真算法的实现。在讨论并行仿真算法的实现时,主要讨论了分布式小卫星SAR系统单发多收机制与多发多收机制实现的策略问题、并行仿真算法各运算节点之间的任务分配策略问题以及并行仿真算法各运算节点之间仿真数据的收集策略问题。最后,通过完成一个仿真实例,对并行算法的正确性进行了验证并对仿真性能进行了分析,证明了该并行仿真算法

26、具有较高的加速比,大大提高了系统的仿真时间。参考文献:1 黄立胜, 王贞松, 郑天垚. 基于FFT的快速SAR分布目标回波模拟算法J. 遥感学报, 2004, 8(2): 128-136.2 R Keith Raney, H Runge, Richard Bamler, Ian G.Cumming, Frank H Wong. Precision SAR Processing Using Chirp Scaling J. IEEE Trans (S0196-2892). 1994, 786-798.3 G W Davidson, I G Cumming, M R Ito. A Chirp Sc

27、aling Approach Processing Squint Mode SAR Data J. IEEE Trans (S1076-7924). 1996, 9: 798.4 Giorgio Franceschetti, Maurizio Migliaccio, Daniele Riccio, Gilda Schirinzi. A Synthetic Aperture Radar Raw Signal Simulator J. IEEE Trans (S0196-2892). 1992, 8: 345.5 孙宁晖, 刘宏, 刘文卓, 王川宝, 陆雪琳, 赵维斌. 曙光1000大规模并行计算机系统软件的设计J. 计算机学报, 1997, 20(3): 259-268.6 郑纬民, 汤志忠. 计算机系统结构(第二版)M. 北京: 清华大学出版社, 1998, 100: 237.7 都志辉. 高性能计算并行编程技术MPI并行程序设计M. 北京: 清华大学出版社, 2001, 34: 267.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号