气象观测站调整.ppt

上传人:小飞机 文档编号:5362343 上传时间:2023-06-29 格式:PPT 页数:24 大小:326.99KB
返回 下载 相关 举报
气象观测站调整.ppt_第1页
第1页 / 共24页
气象观测站调整.ppt_第2页
第2页 / 共24页
气象观测站调整.ppt_第3页
第3页 / 共24页
气象观测站调整.ppt_第4页
第4页 / 共24页
气象观测站调整.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《气象观测站调整.ppt》由会员分享,可在线阅读,更多相关《气象观测站调整.ppt(24页珍藏版)》请在三一办公上搜索。

1、气象观测站的调整,某地区内有12个气象观测站,位置如下图。,十年来各站测得的年降水量如下表所示:,为了节省开支,想要适当减少气象观测站。问减少哪些观测站可以使所得到的降水量的信息量仍然足够大?,欲解决的问题是,欲达到的目的是站数较少,同时得到的信息量仍足够大。在站数与信息量之间,信息量是主要因素。,1、问题分析:,由于不同站之间年降水量的相关性不仅取决于地理位置的远近,而且取决于地理气象环境的相似性。而该问题的主要依据是降水量信息,而各站的地理位置信息仅作为参考信息。,问题分解成以下几个问题:1)删除哪几个站?2)如何预测被删除站的降水量信息?3)如何度量上述预测值中所包含的降水量信 息是否足

2、够大?,假设:,1)降水量信息反映了各观测站地理气象环境之间的相似性;2)各站每年的降水量视为一个围绕其均值上下波动的正态随机变量;,模型建立与求解:,首先考虑相关系数矩阵。(xgxs.m),A=;R=corrcoef(A),具体计算,R=x1 x2 x3 x4 x5 x6 x71 1.0000-0.2456-0.2206-0.1082-0.3312 0.3481-0.26222-0.2456 1.0000 0.0777-0.3965 0.1085 0.0103 0.17753-0.2206 0.0777 1.0000-0.5031-0.2676 0.4077 0.81264-0.1082-0

3、.3965-0.5031 1.0000 0.3158-0.5567-0.15235-0.3312 0.1085-0.2676 0.3158 1.0000-0.6136-0.09776 0.3481 0.0103 0.4077-0.5567-0.6136 1.0000 0.22367-0.2622 0.1775 0.8126-0.1523-0.0977 0.2236 1.00008 0.0836-0.1697-0.0858 0.1384-0.3156 0.0417-0.32419 0.2928 0.1943 0.1915-0.2029-0.2524 0.4918 0.053110-0.3098

4、0.2421-0.0175-0.2501 0.5817-0.0106-0.067411 0.1587 0.0563 0.3278-0.4201 0.0844 0.6544 0.063512 0.2786-0.3460 0.0111-0.2597-0.2037 0.3631-0.5152,续上表,x8 x9 x10 x11 x121 0.0836 0.2928-0.3098 0.1587 0.27862-0.1697 0.1943 0.2421 0.0563-0.34603-0.0858 0.1915-0.0175 0.3278 0.01114 0.1384-0.2029-0.2501-0.42

5、01-0.25975-0.3156-0.2524 0.5817 0.0844-0.20376 0.0417 0.4918-0.0106 0.6544 0.36317-0.3241 0.0531-0.0674 0.0635-0.51528 1.0000 0.6348-0.5946-0.0762 0.53929 0.6348 1.0000-0.4225 0.4272 0.425910-0.5946-0.4225 1.0000 0.4969 0.002611-0.0762 0.4272 0.4969 1.0000 0.565212 0.5392 0.4259 0.0026 0.5652 1.0000

6、,强相关变量:x3,x7(0.750.81)中度相关变量:当0.5|ij|0.7时,称xi,xj中度相关。中度相关的变量有:x4,x6,x8,x9,x10,x11,x12轻度相关变量:x1,x2,x5显然,强相关变量与中度相关变量应优先考虑被删除。,总结,其次考虑标准差。将各站降水量的标准差列表:,对于标准差较大的站,认为它们包含的信息量比较大。所以应优先考虑删除标准差较小的观测站。因此,考虑删除的站有:D=x4,x6,x7,x8,x10,x11,x12,b=std(A),排序:4 7 1 5 3 6 2,用线性回归方法根据保留站观测数据去预测被删除站的观测值。估计应该在集合D中删除35个变量

7、。其组合数有,对每一种组合用回归方法进行线性拟合,根据剩余方差最小,每一个回归自变量显著为标准选出最佳组合。假定欲删除4个变量。,思考:究竟考虑删除几个观测站呢?,1)考虑删除观测站x4,x7,x10,x12进行回归拟合:x4=f1(x1,x2,x3,x5,x6,x8,x9,x11)x7=f2(x1,x2,x3,x5,x6,x8,x9,x11)x10=f3(x1,x2,x3,x5,x6,x8,x9,x11)x12=f4(x1,x2,x3,x5,x6,x8,x9,x11)其结果见huig2.m,例,2)考虑删除观测站x6,x7,x8,x10进行回归拟合:x6=f1(x1,x2,x3,x4,x5,

8、x9,x11,x12)x7=f2(x1,x2,x3,x4,x5,x9,x11,x12)x8=f3(x1,x2,x3,x4,x5,x9,x11,x12)x10=f4(x1,x2,x3,x4,x5,x9,x11,x12)其结果见huig1.m,b1,bint1,r1,rint1,stats1=regress(Y1,X);,两种情况对比:,当确定删除变量x6,x7,x8,x10的方案后,还可以通过逐步回归方法确定最佳回归方程。stepwise(X,y,inmodel,alfha)(huig11.m),例如输入:X=x1,x2,x3,x4;stepwise(X,y,1,2,3)注意:将得到一个交互式的

9、界面,输出结果:,输出结果:,通过各种情况的比较,得到如下的结果:删除观测站x6,x7,x8,x10,得到四个相对应的回归方程(如前面所示)。四个回归方程的剩余方差分别为:,结果分析:,定义信息损失比率:,计算出删除6,7,8,10四站的信息损失比率分别为:dert=4.02%0.22%25.96%8.85%平均信息损失为:9.76%删除4个站的降水量信息仍保留了约90%,结果比较令人满意。,除了以上分析方法以外是否还有其它统计方法可以分析呢?如主成分分析法、定义信息熵函数等。,思考:,熵(Entropy)是分子热力学中的一个概念,用以描述分子随机运动的无序程度。分子运动越是无序,则熵越大。在

10、信息论中,此概念被用以衡量随机试验得到的信息量的大小。熵越大,信息量越大。,最大熵原理,定义,其中c是常数,pi=PX=xi,i=1,2,n,一般取 c=1.不加任何限制,当pi=1/n时,熵最大。,定义,假设X是连续型随机变量,X的密度函数是p(x),则熵函数定义为:,1、在方差一定的连续型概率分布中,以正态分布的 熵最大;2、对于任何一个基本对称系统,其状态的概率分布应在表征这个系统状态的约束条件下,使这个分布所定义的熵最大;,性质,例,将系统状态限制在有限区间之内时,使熵最大的分布是该区间上的均匀分布。,对气象观测站问题,可以计算在各观测站下的 标准差i的值,定义pi=i/j,或,可以计算当删除某个观测站,信息熵的变化值。即,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号