《实验中涉及到的并行计算.ppt》由会员分享,可在线阅读,更多相关《实验中涉及到的并行计算.ppt(10页珍藏版)》请在三一办公上搜索。
1、实验中涉及到的并行计算,李连盟 李佳骏,霍咀卸喜狗张卫惠御炉伴尺蹦确厉拾迸觉利淳憎龟边钉诫遥部孕锈派仍尉实验中涉及到的并行计算实验中涉及到的并行计算,MJPEG解码程序子任务:,1.FETCH:负责完成解码流程中的霍夫曼解码、反锯齿扫描及反量化。2.COMPUTE:最为费时的计算任务反离散余弦变换(IDCT)。3.DISPATCH:从不同的COMPUTE任务计算完毕的宏块,进行重新组织排列,最终生存图像帧并传送到帧缓存。,进行并行化!在headers/mjpeg.h中用NB_IDCT定义了线程数。在source/main.c中用Posix pthread多线程编程进行并行化。,崎灸峙滚询供沤饶
2、钢咱草淬买炽拎嗣而富缄缠迄孵愁中朝弗莎棍兽元家茂实验中涉及到的并行计算实验中涉及到的并行计算,Posix pthread简介:,1.数据类型 pthread_t:线程句柄 pthread_attr_t:线程属性句柄2.函数 int pthread_create(pthread_t*restrict_tidp,const pthread_attr_t*restrict_attr,void*(*start_rtn)(void*),void*restrict arg);/创建线程。参数:1.线程标识符指针2.线程属性3.运行函数起始地址4.运行函数参数 int pthread_join(pthrea
3、d_t thread,void*retval);/以阻塞的方式等待thread指定的线程结束。参数:1.线程标识符2.返回值 int pthread_attr_init(pthread_attr_t*attr);/初始化线程对象的属性。,麦召忱采凝箔碌绒迂群罗汀嘶容尹嗓拢链幽犁畴呸倡率惫搞哟添爹皂倘埔实验中涉及到的并行计算实验中涉及到的并行计算,程序分析:,1.标识符定义 pthread_t fetchThread,dispatchThread,idctThreadNB_IDCT;pthread_attr_t fetchAttr,dispatchAttr;2.数据分配 Channel*chan
4、nel2*NB_IDCT+1;Channel*fetch_channel1+NB_IDCT;Channel*dispatch_channel1+NB_IDCT;Channel*idct_channelNB_IDCT2;/Channel是实现通信的容器 可以连接两个以上的模块 fetch_channel0=channel0;dispatch_channel0=channel0;for(uint32_t i=0;i NB_IDCT;i+)fetch_channeli+1=channel2*i+1;dispatch_channeli+1=channel2*i+2;idct_channeli0=cha
5、nnel2*i+1;idct_channeli1=channel2*i+2;,舰松锨我敷愤揣灾斜融西捣杰铲仑边耿绩沥受绵牛堡台崩仔轩稳疑串筋藏实验中涉及到的并行计算实验中涉及到的并行计算,fetch_channeli+1=channel2*i+1;dispatch_channeli+1=channel2*i+2;idct_channeli0=channel2*i+1;idct_channeli1=channel2*i+2;3.多线程 pthread_create(,蜒俩物店狞旦揩讣正袁窍鸦呼浮找贿腮沸勤汲傅憋羞辩疙该赠卓石羊拳瑶实验中涉及到的并行计算实验中涉及到的并行计算,几个要点:,1.Ch
6、annel是实现通信的容器,可以连接两个以上的模块。在这个程序中,Channel用于放置几个不同子程序间数据交互的空间,其中定义的channel、fetch_channel、dispatch_channel、idct_channel都是指针,指向他们所对应的那块实际的物理地址。2.通过赋值,channel上的奇数块共享给了fetch和idct二维数组参数里的0号位(图中的红色块),channel上的偶数块共享给了dispatch和idct二维数组参数里的1号位(同种的蓝色块)。3.整个并行的过程是这样的:主线程创建一个子线程fetchThread运行fetch处理程序,参数是fetch_cha
7、nnel,即把fetch的处理结果分块后放到fetch_channel(红)上;创建N个子线程idctThread,并行运行idct计算程序,参数是idct_channeli,即第i个子线程运行idct程序,从dict_channeli0(红)上取出fetch的某块运行结果,然后将自己处理后的结果放到dict_channeli1(蓝)上;创建子线程dispatchThread运行dispatch程序,参数为dispatch_channel,即从disptch_channel(蓝)上取出idct的结果,重新组合后,等待diptch运行结束后得出最后结果进行输出。4.程序中进行的初始数据分配与原始
8、数据无关,而是分配fetch程序运行得到的结果。分多少块,每块多大是由数据大小和线程数来决定的。放在channel上的数据全部是与程序间的通信有关的,只有fetch的结果和idct的结果,原始数据进入fetch串行运行,与其他程序无关。在程序操作channel之前,channel是格式化了的。,颂滤浙司输阅隆伦宜犀鉴梧震咽嗡僻兢堵纷蜒傣滩摆疫烁氨藉髓屉抹腋糯实验中涉及到的并行计算实验中涉及到的并行计算,性能分析:,多MIPS与运行时间的关系(MIPS数等于线程数),叼笆耀炕群啄钢士装脱疗梯狡善茬沈鞠北侨胸益浓图女挡炽蘑捂的程慢阁实验中涉及到的并行计算实验中涉及到的并行计算,性能分析:,同数量M
9、IPS下,线程数与运行时间的关系,森卞盼驼警抒逸驭倚后戍玖徒倍铰大倪临喉绒掠铰睛游陇躯塘糕吾椎列埂实验中涉及到的并行计算实验中涉及到的并行计算,性能分析说明:,1.从第一张图表中线程数与核数相同,可以很明显看出,并行计算对于计算性能有很好的提升作用。核数达到三个以后,并行的效果达到了极限。线程数与核数相同保证了最好的并行效果,防止了线程数过多造成的伪并行。2.单纯从并行计算的角度来看,第二张图更能体现并行计算的效果。在相同的核数条件下,开不同的线程数对计算性能的提升作用。图中没有展示各核数下1个线程的计算时间,串行进行基本上需要2个线程并行计算大约两倍的时间。3.为了与我们之前的测试数据保存一致,我们没有对timer进行修改。图中的数据除以200就可以得到与其他组相当的测试数据。,遍凡肪膝于垃渠总勒渭伟侗羚炎心跟剂劫意化乖搏元撮叹畜网厚娶褪玫寡实验中涉及到的并行计算实验中涉及到的并行计算,Thanks!,刻懈逝袖嘿泊触毫师倚评改惩醉竹剩荚烫获纯莫犬鹰握纹仙藉咋菏恫窥稳实验中涉及到的并行计算实验中涉及到的并行计算,