《数学建模论文上海世博会影响力的定量评估1.doc》由会员分享,可在线阅读,更多相关《数学建模论文上海世博会影响力的定量评估1.doc(22页珍藏版)》请在三一办公上搜索。
1、2010年上海世博会影响力的定量评估摘要对于世界来讲,世博是经济、科技、文化界的一次奥林匹克盛宴。对于参展国来讲,世博给他们提供了一个展示社会、经济、文化、科技等各方面的舞台,同时也为其经济发展提供了绝佳的机遇。对于举办国来讲,将会极大的其促进社会的繁荣与进步。上海申办2010年世博会的成功,将会极大的促进上海市经济的发展,同时也将带动居民的消费水平提高。而在世博场馆建设过程中,必然将吸引更多的赞助商和合作伙伴以及国内外的投资商,这些将会使上海市固定资产投资得到增加。而本论文就是抓住上海市居民消费水平和社会固定资产投资这两个侧面进行研究。结合题目,对2010年上海世博会的影响力进行定量评估,首
2、先给出影响力的定义:影响力=(其中2003年到2009年之和表示世博申请成功的固定资产投资总额或居民消费水平的和,模拟2003年到2009年之和就是通过“灰色预测”法模拟出来的2003年到2009年的固定资产投资总额或居民消费水平之和。),显然可以看出公式所得数据的大小就能体现出影响力。为了计算出影响力的大小我们将固定资产投资总额以及居民消费水平设为两个评价标准,并设它们的权重系数都为0.5。为此,我们只需求解出以下两个问题即可。问题一:如何求出固定资产投资总额的影响力。解决方法:对于这个问题,本文采用“灰色预测”,先对1999年到2002年的数据进行模拟递推方程,得到的结果在与1999年到2
3、002年互联网上的数据进行比较,再用平均相对误差和灰色关联度作为评价指标,检测拟合数据的精确度。最后再依据前四个数据得出的方程模拟出2003年到2009年的数据。然后再根据求增量的方法求现实中申博后对固定资产投资额的影响力,运用上面给出的影响力计算公式算出结果为:0.1583。问题二:如何求出人均消费水平的影响力。解决方法:首先应用MATLAB软件对1985-2002年的人均消费水平进行描点,观察它们图像符合指数函数走势。然后我们运用非线性回归中最小二乘法进行函数拟合。然后通过拟合的函数预测2003-2009年的人均消费水平,并与实际数据进行对比,再用我们定义的影响力公式得到结果为0.0221
4、。最后,综合上面两个指标得到上海世博影响力为:0.0902; 关键词:影响力 灰色预测 非线性回归分析 最小二乘法 1问题重述1.1背景资料与条件人类历史上有些大活动可以持续一段时间,可是像“世博会”、“奥运会”这样持续上百年的不多,“世博会”比“奥运会”的历史还要长,世博会是1851年在伦敦举行,到现在156年,现代奥运会是从1896年开始,当然古希腊奥运会的时间会更远些。战后世博会大发展,在很多国家都举行过,世博会的威力逐渐显示出来,它可以推动主办国的经济发展和知名度,加强主办国与世界的合作,更重要的是可以推进人类文明的进步。从世博会的历史进程看,2010年的世博会可能标志着它进入了一个新
5、阶段。因为历届世博会都是在发达国家举行,2010年第一次到了发展中国家,并且2010年世博会的到来与世界发展的大趋势相联系,大家知道,在21世纪刚开始的时候,全球出现了一个可以改变世界面貌的大趋势:就是一批发展中国家的崛起。把这些国家的人口加在一起有33亿,人类历史上什么时候有过占世界人口一半的国家在崛起?没有。和平、发展与合作是时代的潮流,这点是千真万确的。世博会2010年在上海举行绝非偶然,这对国际展览局来说是非常高兴的事,因为这标志着世博运动进入了一个新阶段。作为第一次以“城市”为主题的世博会,上海世博会园区内将设置“城市最佳实践区”,它是世博会发展史上的一个创举,将在全球范围内遴选若干
6、经典城市案例集中展示,还将遴选具有相当实力、较高知名度和良好社会形象的企业参展。世界博览会不仅仅是为了商业性的目的,更为世界各国展示社会、经济、文化、科技各方面的成就以及发展的前景,提供了绝佳的机遇。举办上海世博会将对举办国社会经济的发展起到很大的推动作用,也将对世界各国交流与合作起到巨大的促进作用1.2需要解决的问题 2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。 2
7、基本假设2.1模型一的假设 1、假设影响力的定义公式能够切实反应世博在固定资产投资总额方面的影响; 2、在研究固定资产投资总额所带来的影响力的同时不考虑其他方面带来的影响; 3、假设不考虑国家突然采取一些经济政策或措施对干预上海的经济领域这样所得到的模拟的近似数据就看成是(不考虑申博)经济发展所达到的。2.2模型二的假设1、假设消费水平对于世博外其他因素不做其影响考虑; 2、假设世博影响力是可以通过数值的大小研究,其影响力显然也是相对的;3、不会发生很意外的经济现象,如金融危机等等。3问题分析3.1问题的重要性分析(社会背景)世博是世界博览会的简称。它是由一个国家的政府主办,多个国家或国际组织
8、参加,以展现人类在社会、经济、文化和科技领域所取得的成就的国际性大型展示会。世博不仅能给参展国家带来发展机遇,而且也能给举办国家创造巨大的经济效益和社会效益,扩大举办国的知名度和声誉,促进社会繁荣和进步。2010年上海世博会是上海经济发展的又一历史机遇,对于加速推进上海国际化大都市的建设和建设国际经济、金融、贸易、航运、中心具有积极作用。世博会是通过世博经济对举办国家和城市产生巨大影响。因此,对经济影响力的研究,最大化大其经济效益必然具有重要现实意义。3.2有关方面在这个问题上做过的研究华东师范大学的研究生肖道刚在2008年6月11号写了一篇名为“基于成本-收益理论的上海世博经济影响的研究”。
9、主要是建立了成本收益模型。通过经济学的知识,提出了通过对人力资本的提升和第三产业内部结构的调整使其经济效益最大化。该论文的优点就是建立了成本收益模型,并且结合了大量的经济学知识,使论文内容更加完善,理论基础更强,更有说服力。但也存在一些缺点,该论文中大量使用了别人的数据,可靠性值得商榷,再就是论文中大都是定性研究,缺乏更精确的定量研究。目前大多数人的研究都只停留在表面,缺乏深入而细致尤其是定量方面的研究。3.3问题的思路分析 世博对举办城市价值的阶段性提升从表上可以清楚地看出从申博成功开始,城市价值曲线有一个明显的上升,而且申办成功到展会开始这段时间经济的增长丝毫不亚于展会开始后对经济的增长。
10、所以我们研究世博对经济的影响力可以从申博成功后就开始进行研究。而本论文正是基于这一点对世博影响力进行研究的。而从有经济学的知识中我们可以知道,投资和消费是一个地区或国家经济状况的关键指标。而本论文对于上海市经济影响力的研究正是从投资和消费这两个侧面着手的。而且,我的们对这两个方面用了不同方法进行研究,以下表格就是本论文的基本思路: 3.3.1问题一关于此题的数据已给出1999年至2009年,见下表:横向1到11分别代表1999年到2009年,纵向表示固定资产投资总额(单位:亿元)(图一)如图一明显可以看出从2003年开始固定资产投资总额是急剧增长的,这就是申博成功的影响。下面给出的是1999年
11、到2002年的累加算子与年份的关系(所谓累加算子就是相邻两个消费水平之和,即为累加算子)(图二)(横轴1到4代表1999年2002年,纵轴表示累加算子)从图二中看出是适于用“灰色预测”方法来模拟数据。世博在2002年初成功申请,观察数据,及本题是用少量几个数据模拟多个数据,所以可以采取“灰色预测”法,对1999年至2002年的数据进行模拟,然后得出函数方程,其实际得到的是两个递推关系。但是在这个期间是要对此方程进行检验,看是否满足具有模拟数据的条件。其中对这里的递推关系检验可以采取两个指标:第一就是平均相对误差,也就是用实际的数据减去模拟的数据再除以模拟的数据;第二就是灰色关联度,也就是考虑原
12、始数据及模拟出的数据的一些关系(详见模型的检验)。最后根据已得的递推关系来模拟2003年至2009年的数据。再根据影响力自身的定义来计算(1)(其中2003年到2009年之和表示世博申请成功的固定资产投资总额的和,模拟2003年到2009年之和就是通过“灰色预测”法模拟出来的2003年到2009年的固定资产投资总额之和;)这个计算公式的分子一定是正的,因为上海世博申请成功会带动资产投资加大尽管这样并不能表示2003年至2009年的每年的数据都比模拟的数据大,也就是申博后的投资总额对于模拟的投资总额的增量。结果就是为固定投资总额的影响力。3.3.2问题二世博影响力有着非常丰富的内涵,其表现方式也
13、是多种多样,因此科学合理的给出衡量世博影响力的指标非常关键。建立世博影响力的指标应有足够的理论依据,即理论性。必须从理论上界定它的内涵和实质,否则,将难以全面的衡量世博影响力。世博影响力是用以考察世博对其他方面影响大小进行度量的综合性指标,我们在问题二中选择了人均消费水平这项指标对世博给经济这一侧面产生的影响进行定量的刻画。此题也收集了从1985年到2009年的数据并给出了图三纵向表示居民消费水平(元/人),横向表示年份(图三)(注:从1985年到2009年分别用1到25表示)通过查阅上海统计年鉴,获得了1985年至2009年上海市人均消费水平的数据,先选取1985年到2002年的数据用MAT
14、LAB软件做出图像(图四)R=10301190129816801928200924212842416253436712774286999202 10328 11546 11807 13137;u=log(R);t=1:18;aa=polyfit(t,u,1);a=a(1)b=aa(2)y=polyval(aa,t);plot(t,u,k+,t,y,r)数据的走向大致与指数函数图像吻合,所以我们将数据与指数函数的一般形式进行拟合。通过函数关系式再用MATLAB软件可以算出2003年到2009年的人均消费水平的数值,即预测的上海市人均消费水平数值,将它们与实际人均消费水平的数据进行比较,通过影响力
15、公式:算出的结果就记为人均消费水平的影响力。4符号说明4.1模型一1、表示1999年到2002年的投资总额,;2、表示和中相邻两年的固定资产投资总额的和, 其中;3、表示参数列向量;4、表示预测1999年到2002年的固定资产投资总额,。4.2模型二1、表示1985年到2002年的人均消费水平,=1.18;2、表示2003年到2009年的预测人均消费水平,=1.7;3、表示2003年到2009年的实际人均消费水平,=1.7;4、表示年份,=1.25;5、为号指标的影响指数;6、为号三级指标的实际值;7、为号三级指标的标杆值;8、为二级类指标的影响指数;9、为类指标的三级指标个数;10、为世博影
16、响力指数;11、为类指标的权重。4.3 本文引用数据、资料均真实可靠5模型的建立与求解5.1问题一5.1.1模型的建立;其中是的一次累加生成算子;是的紧邻均值;= ,=;=;此为模型的时间响应式;,;表示“灰色预测”得到的数据,同时也是还原的模拟值。(具体程序详见附录)如果要求的数据,可以通过、求出,只要代入上面的两个递推关系即可。5.1.2模型的求解 5.1.2.1模型得到的方程;模拟数据详细模拟数据见下表:1999年2000年2001年2002年1856.71845.22093.42350.4(表1)单位:(亿元)(图五)表一的数据增长的是平稳的,这也反映了经济增长的一般规律,但是同时也看
17、到了2000年的模拟数据比1999年的要低,若在现实中是不可能的,这也就反映了一个模拟的与实际的误差,所以后面的检验是有必要的。关于2000年的数据的减少可能是由于一般灰色预测的局限性。然后从2000年到2002年数据又可以恢复平稳了。5.1.2.2模型的检验也就是对方程合理性的检验:I、平均相对误差的检验先用原来1999年到2002年的数据减去模拟的数据即得到误差向量,再用误差向量的每个分量原始数据就是各自的相对误差。解得该平均相对误差为:0.11,精度分析为二级;II、灰色关联度的检验计算:=316.13;=922.06;605.93;两项指标都表示该递推关系是可行的。5.1.2.3模型的
18、模拟数据模拟数据只要通过迭代两个递推关系,比如要得到2003年的数据只要2002年的数据即可下面为 2003年到2009年的数据的表格2003年2004年2005年2006年2007年2008年2009年2696.32850.63006.73295.63608.43990.84350.7(表二)(图六)01000200030004000500060001234567固定资产总额系列1系列2(图七)(注:1到7代表2003年到2009年份)图六是上海市固定资产投资总额,是用灰色预测拟合出来的数据所形成的条形图。图七是上海市固定资产投资总额对比图,左边柱子表示的含义与图六相同,右边的柱子是受申博成
19、功影响后每年实际的固定资产投资总额。5.1.2.4固定资产投资总额的影响运用问题分析中的的式(1)计算影响力,结果解得影响力为:0.1583.5.2问题二5.2.1模型的建立和求解世博影响力的指标设计必须比较完整系统的反应世博影响力的状况和趋势,即全面性。从这个方面考虑,我们不能采取单一的指标,而应采取多个指标,从各个侧面加以描述和评价。但经济模型本身就十分庞大以及复杂,从建立模型及解决模型的可行性考虑,在这一模型中,我们将十分繁杂的经济模型简单化了,只从我们认为体现经济水准的重要指标人均消费水平出发,去衡量世博会的举办对经济产生的影响,来体现世博的影响力。世博影响力评价包括三级评价:单项指标
20、影响力评价、分类指标影响力评价、文化影响力综合评价。评价的标杆值(Benchmark)为某项指标的当年最大值或最高水平值。世博影响力评价的基本模型为:CCI = (Ws Cis)/100用MATLAB软件拟合函数的程序:function f=curvefun1(x,tdata) f=x(1)+x(2)*exp(-0.02*x(3)*tdata) tdata=1985:1:2002cdata=1e-03*1030 1190 1298 1680 1928 2009 2421 2842 4162 5343 6712 7742 8699 9202 10328 11546 11807 13137; x0
21、=0.2,0.05,0.05; x=lsqcurvefit (curvefun1,x0,tdata,cdata) f= curvefun1(x,tdata)得到 得出人均消费水平和年份的之间的函数关系式:用拟合出的新函数求解2003年至2009年的人均消费水平,具体数据见下表:5.2.2模型结果的分析及检验年份实际消费水平(元)模拟消费水平(元)现实数据减模拟数据20031424714245220041647017200-730200518396184505420062094419540140420072426021600266020082670222700400220092659524850
22、1745(表三)分析表格数据可得实际消费水平和模拟消费水平大致都成上升趋势,也并不是每年的数据都是实际大于模拟,但是可以看出消费水平还是实际的增长比模拟的增长来得快。但是突然在2009年时突然下降,可能是受了2008年金融危机的影响。用MATLAB软件将预测出来的人均消费水平数据描点绘图(其中横轴表示年份,纵轴表示模拟消费水平)(图八)(其中1到7表示2003年到2009年) 分别计算2003年到2009年实际消费水平之和以及2003年到2009年模拟消费水平之和,算出之间的差值,然后再除以2003年到2009年模拟消费水平之和。也就是在此利用公式(1): 解得的结果:0.0211; 6模型的
23、评价与改进6.1 问题一6.1.1 模型的优点 1、此模型采用“灰色预测”法,较好地解决了少量数据模拟较多数据的 问题。并且对于函数递推关系进行平均相对误差及灰色关联度的精度 检验。各个步骤还是很详细的,简单易懂。 2、建立在精确的数据基础上,比如1999年到2009年的固定资产投资总 额数据,这可以使得减小模型的误差。 3、模型的严谨性很强,数学逻辑性很严谨。6.1.2模型的缺点 1、这是只考虑了单方面的固定资产投资总额,没有顾全多方面的因素, 所以得出的应该是近似值。 2、虽然是运用了灰色预测法,但是得到的平均相对误差及灰色关联度精 度还是不高,不能达到很理想的一级水平。 3、误差分析方面
24、做得还是不够多。6.1.3模型的改进 1、关于误差分析方面可以多加几个评价标准,比如均方差和小误差概率 就可以加进来研究,这样就能使得模型及结果更加具有说服力; 2、找一个可以更好研究影响力的评价标准,使得所得影响力的结果 更加 有意义。 3、模型只单单考虑正面的影响,促进经济的发展等其他;其实如果再考 虑负面影响,比如环境的质量变化情况,然后再综合考虑两方面的因 素,最后对影响力进行评价。 4、由于灰色预测的特点,预测近年的误差是很小的,但是随着时间的推移,误差会越来远大,所以何以找一个弥补的程序会好些,比如等维 灰色递补模型。6.2 问题二6.2.1模型的优点利用非线性回归的方法直接估计模
25、型中的参数,模型的求解可利用MATLAB统计工具箱中的命令进行,比较简单快捷,能很快得出拟合的函数。和剩余标准差仍然可以在通常意义下用于非线性回归模型拟合程度的度量。6.2.2模型的缺点由于经济内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,只能是搜集大量的数据,基于对数据的统计分析去建立模型,只能运用用途非常广泛的一类随机模型统计回归模型。评价线性回归模型拟合程度的统计检验无法直接用于非线性模型。F统计量不能用于非线性模型拟合程度的显著性检验,因为即使误差项服从均值为0的正态分布,也无法从回归残差得到误差方差的一个无偏估计。还有在非线性模型参
26、数估计中,用不同的参数初值进行迭代,可能得到差别很大的结果(它们都是拟合误差平方和的局部极小点),也可能出现收敛速度等问题,因此,合适的初值尤为重要。6.2.3模型的改进由于事先并不能肯定确切的数学模型,通常我们用matlab试算几种模型,然后加以比较,最终选定一个效果较好者。而这一切,我们都可以利用matlab的强大绘图功能,随时分析matlab给出的直观的显示结果。这时我们引入广义线性模型就有必要了,解决用广义线性模型进行数据拟合计算问题,调用它的一般格式为下列三种: (6.2.3.1) (6.2.3.2) (6.2.3.3)(6.2.3.1)式是解广义线性模型问题的最基本的用法。其中,右
27、端的输入数值包括:X,Y为原始数据,X为设计阵,Y是响应变量数值,是响应变量的分布函数名称。左端输出的是回归系数b,它是个列向量,是作为X的各列的线性组合系数而给出的。(6.2.3.2)式可以有更多的灵活性。右端输入的第四项是,它的输入方式可以有3种。(6.2.3.3)式中,增加了输出dev和stats。其中,dev是解向量的总偏差(deviance),它是推广了的残差平方和,它越小说明拟合得越好,这在比较几个不同模型效果好坏时是要用到的。7模型的推广 7.1模型一的推广 现在的各行各业都是要求精确严禁的,所以预测的误差大小成为一些关键所在。1、由于灰色预测本身是具有误差随时间的推移越来越大的
28、特点,我们自由采取措施来使其减小误差,从而使得模型能够更精确解决更多的问题。若用原始经济时间序列建立GM(1,1)模型检验不合格或精度不理想时,要对建立GM(1,1)模型进行残差修正或提高模型的预测精度。修正方法就是建立GM(1,1)的残差模型。这样就能使得GM(1,1)的运用范围更广,解决很多不同领域的问题。2、在实际中,信息处于不断的变化当中,具有很大的随机性,虽然历史信息对预测时刻的具体值有一定的相关性和影响,但与预测时刻更接近的信息对该时刻的预测结果更有价值。鉴于这种情况,可先用已知数列建立的GM(1,1)模型预测一个值,然后补充一个新信息数据到已知数列中,同时去掉最老的一个数据,实序
29、列等维,接着再建立GM(1,1)模型,这样逐个滚动预测,依次递补。直到完成预测目标为止,这样我们再对具体问题进行预测,就可以得到更为精确的结果。通过这种关系就可以运用到更需精确的事业中。7.2模型二的推广回归分析是最常用的统计方法之一,它通过一组试验(或观测)数据研究随机变量之间的相关关系,建立起一个数学模型,以用于预测或控制。而多元线性回归模型是一元线性回归模型的推广,即假定随机变量y的取值依赖于自变量,且有,其中,称为回归系数,是未知参数。为随机误差,假定服从正态分布是未知的。 参数的最小二乘估计其中是估计值,是Y的估计值,是X的转置矩阵,是投影矩阵。称为残差,称为残差的平方和,称为回归平
30、方和。可以证明,是的最好线性无偏估计,且 。对总变差平方和进行分解,有,显然回归模型的假设检验 因变量y与自变量之间是否存在线性关系,需要对假设进行检验,所用的统计量为在成立时,且它们相互独立。因此显著水平为的拒绝域是也可用回归平方和U在总变差平方和S中的比值来度量数据与回归模型的拟合程度,称为对y的复相关系数。R越大,说明对y的线性关系越密切。对给定的显著性水平,当时拒绝,可以认为上述线性相关是显著的。当假设被拒绝时,认为y与全体自变量之间存在一定程度的线性回归关系,但也不排除其中有一些自变量与y并没有密切关系,因此需要对每个自变量检验相应的回归系数是否为零,即对假设进行检验,所用统计量为其
31、中是中相应的对角元素。的显著水平为的拒绝域是置信水平的的置信区间为预测对于给定的自变量取值,因变量y的取值的预测值为的置信水平为的置信区间是其中除了上述统计分析以外,还有一些对线性回归的残差分析,如误差的正态性检验,等方差检验,残差序列的游程检验和Durbin-Watson检验等回归诊断内容,以及自变量的选择等问题。参考文献:1刘则毅等,科学计算技术与MATLAB,北京东黄城根北街16号:科学出版社,2001年.2 WZ工作室,EXCEL函数/图表,北京宣武区:中国铁道出版社,2008.32010年上海统计年鉴,http:/www.stats-4姜启源等,数学模型,北京市西城区:高等教育出版社
32、,2003年.5董震海,精通MATLAB,北京海淀区:电子工业出版社,2007年.附录:a=1856.72 1869.67 1994.73 2187.06;b=;for i=1:3 b(i+1)=a(i)+a(i+1);endb(1)=a(1);bB=-z(2) 1;-z(3) 1;-z(4) 1;Y=a(2);a(3);a(4);d=inv(B)*B)*(B)*Y;de=;f=;e(1)=a(1);for k=1:3 e(k+1)=(a(1)-d(2)/d(1)*exp(-d(1)*k)+d(2)/d(1); f(k+1)=e(k+1)-e(k);endf(1)=a(1);feh=;x=0;
33、for i=1:4 h(i)=abs(a(i)-f(i)/a(i); x=x+h(i);endx=1/4*x;xs=0;for i=1:4 s=s+a(k);ends=1/4*s;sy=0;for i=1:4 y=y+(a(i)-s)2;endy=1/4*y;ysqrt(y)m=0 24.4 -298.7 -663;s=0;for i=1:4 s=s+m(i);ends=1/4*s;sy=0;for i=1:4 y=y+(m(i)-s)2;endy=1/4*y;yo=2696.32850.63006.73295.63608.43990.84350.7;s=0;t=0;p=2452.113084.613542.553925.094458.614829.455273.33;for i=1:7 s=s+o(i); t=t+p(i);end(t-s)/s