中国粮食供求模型的构建与粮食安全状况的研究.doc

上传人:laozhun 文档编号:4165543 上传时间:2023-04-08 格式:DOC 页数:34 大小:813.50KB
返回 下载 相关 举报
中国粮食供求模型的构建与粮食安全状况的研究.doc_第1页
第1页 / 共34页
中国粮食供求模型的构建与粮食安全状况的研究.doc_第2页
第2页 / 共34页
中国粮食供求模型的构建与粮食安全状况的研究.doc_第3页
第3页 / 共34页
中国粮食供求模型的构建与粮食安全状况的研究.doc_第4页
第4页 / 共34页
中国粮食供求模型的构建与粮食安全状况的研究.doc_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《中国粮食供求模型的构建与粮食安全状况的研究.doc》由会员分享,可在线阅读,更多相关《中国粮食供求模型的构建与粮食安全状况的研究.doc(34页珍藏版)》请在三一办公上搜索。

1、中国粮食供求模型的构建与粮食安全状况的研究华东师范大学 张月霞、何思远、楼芝兰摘要粮食是人类赖以生存的宝贵资源,是关系国计民生的重要商品。我国是人多地少的发展中国家,要用占世界7的耕地来养活占世界22的人口,因此粮食问题,不仅仅是经济问题,更关乎社会的稳定、国家的长治久安。 本模型在总结有关学者对粮食供需问题研究的基础上,结合现阶段我国粮食消费和生产情况,通过中国统计年鉴以及中国统计局网站搜集数据,分别建立粮食需求和供给模型,并预测未来粮食的供求量,较为系统地分析了粮食供需平衡及粮食安全问题,对我国粮食问题提供借鉴。首先,本文利用逐步回归方法建立线性回归、残差自回归模型与C-D生产函数、残差自

2、回归模型对可能会影响粮食产量的各个因素进行分析,用R软件对结果进行共线性检验与残差分析,再利用聚类分析方法对粮食产量波动原因做深层次分析,最后得到粮食产量回归方程。通过matlab模拟曲线分别预测四个主要影响因素的值,从来得到未来中国粮食产量。然后,通过整合汇总数据对中国粮食需求总量进行分析,分别建立粮食需求高值模型与低值模型,给出未来几年粮食需求预测值,通过比较未来粮食的产量和需求量的大小,结合实际,研究中国粮食安全状况并给出合理化建议。关键字:粮食生产函数 逐步回归 时间序列 残差自回归 多重共线性 聚类分析 粮食需求函数AbstractFood is a valuable resourc

3、e for human survival, and peoples livelihood is related to the important commodities. China is a developing countries, using 7% of the worlds arable land to feed 22 percent of the worlds population, so the food problem, is not only an economic issue, but also have something to do with the social and

4、 countrys long-term stability. The model summary is based on some scholars studies about the food supply and demand, combined with the status of Chinas food consumption and production, through the collection of data by the data from China Statistical Yearbook and China Statistics Bureau Web site , e

5、stablish the food demand and supply models, and predict future food demand and supply, make more systematic analysis of food supply and demand balance and food security, providing some reference for Chinas food problem. First of all, this paper use the stepwise regression method to establish linear

6、regression, residuals from the regression model, the CD production function, residuals from the regression model may affect the grain yield of the various factors were analyzed with R software testing and the results of linear residual analysis, re-use cluster analysis on the reasons for fluctuation

7、s in food production to do in-depth analysis, the final grain yield obtained regression equation. Use Matlab simulation curves to predict four major factors affecting the value, and then calculate Chinas future food production. After that, we get the total number of chinas total grain demand, respec

8、tively established both the low-value and high-value model of food demand and forecast food demand in future years, by comparing the future demand for grain yield and size with reality, study Chinese food security situation and give reasonable suggestions.Key words :Food Production Function 、Stepwis

9、e Regression 、Time Series、 Residuals Auto-Regressive Model、Multicollinearity、Cluster Analysis、Food Demand Function目录摘要1Abstract2一、问题的提出4二、研究现状5三、模型变量的选择5四、符号假定7五、模型建立与求解81、逐步回归81)逐步回归分析的主要思路82)逐步回归分析的主要计算步骤93)基于AIC准则的逐步回归原理102、模型具体建立121)普通线性回归、残差自回归方程模型的建立122)基于C-D生产函数的粮食产量回归分析18六、影响我国粮食产量的外部性因素周期性聚

10、类分析211、聚类分析的原理222、软件运行结果及其分析233、模型结论分析25七、我国粮食未来需求量预测及分析28八、粮食产量预测与需求预测比较结果31九对我国粮食安全问题的思考与建议31参考文献34一、问题的提出“民以食为天”,粮食自古以来就是一件关系国计民生的头等大事。十六大报告明确提出现阶段要“保护和提高粮食综合生产能力”,这是针对我国新时期粮食经济运行的特点和粮食经济所面临的问题提出的要求。首先,中国粮食供求问题的实质在于无法及时根据市场需求变化及时调整生产所造成的结构性、阶段性生产过剩或者不足。也就是缺乏粮食的市场供给能力,而粮食市场供给能力的提高必须以粮食综合生产能力为保障;其次

11、,粮食综合生产能力的高低,直接关系到国家的粮食安全;最后,粮食综合生产能力是综合国力的重要方面。因此,切实保护和提高粮食综合生产能力,无疑就成为目前理论界一项责无旁贷的重要课题。在广泛收集近年来有关粮食生产理论资料的基础上,对粮食综合生产能力影响因素的若干问题进行探索,希望有助于粮食综合生产能力理论研究的进一步深入,进而推动新时期我国粮食生产的持续健康发展。我国是一个有着13亿人口的国家,占世界总人口数的21%,但我国的可耕地面积仅为世界可耕地面积的7%,粮食问题是关系经济安全和国计民生的重大战略问题,任何时候都不能有丝毫的松懈。我国粮食产量在 1998年突破5亿吨大关、人均占有水平达到420

12、公斤后, 粮食耕种面积连年调减, 产量一路走低。 在充分肯定农业结构调整取得成绩的同时,人们必须清醒地认识到,近年来粮食播种面积连年下降,粮食连续减产,粮食安全潜伏一定隐患。导致粮食产量连年下降的重要原因是一些地方对调整农业结构片面理解,大幅压缩粮食种植面积, 造成耕地大量减少。而随着基础建设的扩大、 城市建设的发展、 各种园区的兴起, 耕地还会减少。据国土资源部最新调查显示,中国的耕地面积已从1996年的 19.51亿亩,减少到2002年的18.89亿亩。面对眼前粮价上涨和耕地 减少的新情况,专家指出,从中长期看,由于人口增加,耕地减少,城市化加快,人民生活水平提高,中国粮食需求将呈刚性增长

13、,粮食供求关系将是偏紧的。粮食是关系国计民生的特殊商品,确保粮食安全是中国一项长期的战略任务。为了在更高层次上发展我国的经济,真正实现全民共同富裕的伟大目标,保证粮食安全,解决粮食问题是当务之急。而影响到粮食产量的因素是多方面的。因此,我们提取了农业劳动力、粮食播种面积、化肥施用量这三个对粮食产量有较大影响的因素的时间序列数据来进行分析,希望通过建立一个合适的经济模型来从理论上找出提高粮食产量的方法。二、研究现状自改革开放以来究竟是哪些主要因素影响我国粮食产量,很多学者进行了定量研究。王玉斌等通过对我国19782004粮食产量波动原因发现,要实现粮食生产持续稳定增长的目标,就必须给粮食生产以合

14、理的收益预期,使粮食生产的比较收益与经济作物相比处于相对合理的水平2。谢杰利用1978-2004数据,基于简单线性回归模型发现,影响粮食产量的主要因素是粮食种植面积、成灾面积、化肥用量及政策性因素3。汪旭辉基于DEA模型农业生产效率低下的主要原因是生产要素匹配不合理4。近几年国家减免税收和补贴政策只是引子,因占农户收入比重过小,因此对农户增加投入和提高粮食产量影响甚微(史清华等)5。政府通过粮食补贴等政策无效率,存在规模报酬递减,对农户行为影响不大(李鹏6)。要提高粮食产量,在加大粮食直补的同时不能放弃价格支持,这样才能稳定农民收入,增加粮食产量(赵玉萍7)。 目前国内外学者提出了多种基于统计

15、学原理的粮食产量预测模型,分析这些模型的设计思路,它们大体上可分为二类:一类是气象模型,它侧重于气象波动因素对粮食产量的短期影响;另一类是社会经济模型,它侧重于社会经济发展因素对粮食产量的长期影响。实际上在市场经济环境下粮食生产的不确定因素增多,波动因素不仅是气象因素,还应有市场、政策、技术等因素。如何将上述两类预测模型所考虑的因素和方法综合起来,以提高预测精度,这就是本文提出的粮食产量综合预测模型。三、模型变量的选择粮食综合生产能力是指在一定地区、一定时期和一定的社会经济技术条件下,由各种生产要素综合投入所形成的、能够相对稳定地达到一定水平的粮食产出能力。由于我国长期以来一直采取各种措施努力

16、提高粮食的实际产量 ,并没有像欧美国家采取耕地休耕制度 ,因而我国的粮食综合生产能力可以用粮食实际产量来反映。因而对我国粮食综合生产能力影响因素的分析实际上就是对我国粮食产量影响因素的分析。从理论上讲影响粮食产量的因素很多,这些因素基本上可以分为四类 ,第一类是各种生产要素的投入量,如土地、劳动、化肥、机械、资本等的投入量;第二类是各种农业技术进步;第三类是国家粮食政策、农业生产组织与经营制度;第四类是各种自然灾害。 1、粮食播种面积是解释粮食产量变化的一个关键变量 ,且对粮食产量是一种正向影响。同时,各种自然灾害对粮食产量的影响很,成灾面积可以反映粮食生产中受自然灾害影响的程度,粮食产量与成

17、灾面积是一种负相关关系。现有各种公开出版统计资料中的成灾面积都是农作物总成灾面积,并没有单独反映粮食作物成灾面积的指标,在本研究中假定自然灾害在各种不同作物种类中的分布是均匀的,这样粮食成灾面积可用粮食播种面积占农作物总播种面积的比例乘以农作物总成灾面积得到。 水利是农业的命脉,灌区是命脉中的命脉,灌区成为我国粮食安全保障的重要基地。中国以占全国耕地48%的灌溉面积,生产了占全国总产量75%的粮食和90%的棉花、蔬菜等经济作物。本模型也将有效灌溉面积考虑在影响粮食产量的一个因素。2. 劳动力是粮食生产的主体,也是影响粮食生产的重要因素之一。但是,现有公开出版的统计资料中并没有关于投入粮食生产劳

18、动力人数的数据,目前已有的类似研究中多将农业劳动力数量作为粮食产量的解释变量来建立模型,这样不可避免地导致结果产生偏差。本文将农村人口数作为影响因素。3. 化肥是粮食生产的主要投入要素之一。施肥不仅能提高土壤肥力,而且也是提高作物单位面积产量的重要措施。化肥是农业生产最基础而且是最重要的物质投入。据联合国粮农组织(FAO)统计,化肥在对农作物增产的总份额中约占40%60%。中国能以占世界7%的耕地养活了占世界22%的人口,可以说化肥起到举足轻重的作用。本研究中选择化肥使用量作为衡量化肥投入水平的解释变量。 4. 农业技术进步是影响粮食产量的一个非常重要的因素 ,考虑到农业中的技术进步常常物化在

19、良种、农膜、农药以及农业机械的使用方面 ,而本研究采用的国家农业财政支出是一个非常宽泛的概念 ,能够在很大程度上涵盖农业中的技术进步因素。同时,农村居民收入也影响着农民对于种植上一些设备等的投入,所以也考虑在影响农业技术进步的范围内。5. 农业机械总动力指主要用于农、林、牧、渔业的各种动力机械的动力总和,包括耕作机械、排灌机械、收获机械、农用运输机械、植物保护机械、牧业机械、林业机械、渔业机械和其他农业机械,农业机械化是农业现代化的重要标志。当前,我国正处于从传统农业向现代农业转变的关键时期,加快推进农业机械化和农机工业发展,对于提高农业装备水平、改善农业生产条件、增强农业综合生产能力、拉动农

20、村消费需求等具有重要意义,对提高粮食产量有重要意义。6农业生产资料价格指数,指反映一定时期内农业生产资料价格变动趋势和程度的相对数。农业生产资料价格的变动会影响农民在农业基础设备上的投入,从而对粮食产量有负面影响;同时,农产品生产价格指数是反映一定时期内,农产品生产者出售农产品价格水平变动趋势及幅度的相对数,农产品价格的变动自然会影响农民对于种植的热情等,所以本模型考虑了农业生产资料价格指数和农产品生产价格指数。7. 自1978 年农村经济体制改革以来 ,我国农村实行的是以家庭为基本经营单位的生产组织制度以及与此相联系的按人口平均分配的土地制度 ,这项制度作为农村的一项基本制度将长期保持稳定。

21、早期研究认为 ,中国农业生产提高的动力在改革初期主要来自农村经济体制创新 ,但是 ,这种影响只是一次性的,随着这一制度的普及与稳定,制度创新对于粮食增产的促进作用几乎为零。在对 1978 年后粮食生产的分析中完全可以假设制度因素为一常量。 为消除 1978 年开始的农村制度变革对之影响,本模型不考虑1978年前的全国粮食产量数据。四、符号假定:农村人口数(万人):粮食作物种植面积:生产资料价格指数:农产品生产价格指数:有效灌溉面积:化肥使用量(万吨):农业机械总动力(亿瓦):受灾面积(千公顷):农村居民收入:国家农业财政支出:随机误差:我国年粮食产量(万吨),为被解释变量。五、模型建立与求解1

22、、逐步回归1)逐步回归分析的主要思路 在实际问题中, 人们总是希望从对因变量y有影响的诸多变量中选择一些变量作为自变量, 应用多元回归分析的方法建立“最优”回归方程以便对因变量进行预报或控制。所谓“最优”回归方程, 主要是指希望在回归方程中包含所有对因变量y影响显著的自变量而不包含对y 影响不显著的自变量的回归方程。逐步回归分析正是根据这种原则提出来的一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对y的作用大小, 显著程度大小或者说贡献大小, 由大到小地逐个引入回归方程, 而对那些对y作用不显著的变量可能始终不被引人回归方程。另外, 己被引人回归方程的变量在引入新变量后也可能失去重要

23、性, 而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行F检验, 以保证在引人新变量前回归方程中只含有对y影响显著的变量, 而不显著的变量已被剔除。逐步回归分析的实施过程是每一步都要对已引入回归方程的变量计算其偏回归平方和(即贡献), 然后选一个偏回归平方和最小的变量, 在预先给定的F水平下进行显著性检验, 如果显著则该变量不必从回归方程中剔除, 这时方程中其它的几个变量也都不需要剔除(因为其它的几个变量的偏回归平方和都大于最小的一个更不需要剔除)。相反, 如果不显著, 则该变量要剔除, 然后按偏回归平方和由小到大地依次对方程中其它变量进

24、行F检验。将对y影响不显著的变量全部剔除, 保留的都是显著的。接着再对未引人回归方程中的变量分别计算其偏回归平方和, 并选其中偏回归平方和最大的一个变量, 同样在给定F水平下作显著性检验, 如果显著则将该变量引入回归方程, 这一过程一直继续下去, 直到在回归方程中的变量都不能剔除而又无新变量可以引入时为止, 这时逐步回归过程结束。2)逐步回归分析的主要计算步骤 (1) 确定F检验值 在进行逐步回归计算前要确定检验每个变量是否显著的F检验水平, 以作为引人或剔除变量的标准。检验水平要根据具体问题的实际情况来定。一般地, 为使最终的回归方程中包含较多的变量, 水平不宜取得过高, 即显著水平 不宜太

25、小。F水平还与自由度有关, 因为在逐步回归过程中, 回归方程中所含的变量的个数不断在变化, 因此方差分析中的剩余自由度也总在变化, 为方便起见常按n-k-1计算自由度。n为原始数据观测组数,k为估计可能选人回归方程的变量个数。例如n=15 , 估计可能有23 个变量选入回归方程, 因此取自由度为15-3-111, 查F分布表, 当 0.1, 自由度f1=1,f2=11时, 临界值, 并且在引入变量时, 自由度取f1=1,f2=n-k-2,F检验的临界值记F1, 在剔除变量时自由度取f1=1,f2=n-k-1 , 检验的临界值记F2 , 并要求F1F2, 实际应用中常取F1=F2。 (2) 逐步

26、计算 如果已计算t步(包含t0), 且回归方程中已引入l个变量, 则第t+1步的计算为:(a )计算全部自变量的贡献(偏回归平方和)。 (b)在已引入的自变量中, 检查是否有需要剔除的不显著变量。这就要在已引入的变量中选取具有最小值的一个并计算其F值, 如果, 表示该变量不显著, 应将其从回归方程中剔除, 计算转至(c)。如,则不需要剔除变量, 这时则考虑从未引入的变量中选出具有最大值的一个并计算F值, 如果, 则表示该变量显著, 应将其引人回归方程, 计算转至( c)。如果, 表示已无变量可选入方程, 则逐步计算阶段结束, 计算转人(3)。 (c)剔除或引人一个变量后, 相关系数矩阵进行消去

27、变换, 第t+1步计算结束。其后重复( a)(c )再进行下步计算。 由上所述, 逐步计算的每一步总是先考虑剔除变量, 仅当无剔除时才考虑引入变量。实际计算时, 开头几步可能都是引人变量, 其后的某几步也可能相继地剔除几个变量。当方程中已无变量可剔除, 且又无变量可引入方程时, 第二阶段逐步计算即告结束, 这时转入第三阶段。 (3) 其他计算, 主要是计算回归方程入选变量的系数、复相关系数及残差等统计量。 逐步回归选取变量是逐渐增加的。选取第l个变量时仅要求与前面己选的l-1 个变量配合起来有最小的残差平方和, 因此最终选出的L个重要变量有时可能不是使残差平方和最小的L个, 但大量实际问题计算

28、结果表明, 这L个变量常常就是所有L个变量的组合中具有最小残差平方和的那一个组合, 特别当L不太大时更是如此, 这表明逐步回归是比较有效的方法。 引人回归方程的变量的个数L与各变量贡献的显著性检验中所规定的F检验的临界值F1与F2的取值大小有关。如果希望多选一些变量进人回归方程, 则应适当增大检验水平 值, 即减小F1=F2的值, 特别地,当F1=F2=0时, 则全部变量都将被选入, 这时逐步回归就变为一般的多元线性回归。相反, 如果 取得比较小, 即F1与F2取得比较大时, 则入选的变量个数就要减少。此外, 还要注意, 在实际问题中, 当观测数据样本容量n较小时, 入选变量个数L不宜选得过大

29、, 否则被确定的系数的精度将较差。本模型采用R软件进行数据处理及检验,采用逐步回归的方法,用AIC准则进行检验,挑选出变量使得,使得该种选择组合的AIC值最小。3)基于AIC准则的逐步回归原理赤池信息量准则(Akaike information criterion、简称AIC)是衡量统计模型拟合优良性的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。在一般的情况下,AIC可以表示为:AIC = 2k - 2ln(L),其中:K是参数的数量,L是似然函数。假设条件是模型的误差服从独立正态分布。让n为观察数,R

30、SS为剩余平方和,那么AIC变为: AIC=2k + nln(RSS/n),增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息量准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。本模型采用R软件进行数据处理及检验,采用逐步回归的方法,用AIC准则进行检验,挑选出变量使得,使得该种选择组合的AIC值最小。具体数据:年份X1X2X3X4X5X6X7X8X9X10Y19787901412058799.9103.944965884117550807133.6150.6630476.5197979

31、047119263100.4122.145003.11086.31337.939367160.2174.3333212198079565117234101107.144888.11269.41474.650025191.33149.9532056198179901114958101.7105.944573.81334.9156839786223.4110.2132502198280174113462101.9102.244176.91513.41661.433133270.1120.4935450198380734114047103104.444644.11659.81802.23471330

32、9.8132.8738728198480340112884108.9104444531739.81949.731887355.3141.2940731198580757108845104.8108.644035.91775.82091.344365397.6153.6237911198681141110933101.1106.444225.81930.6229547135423.8184.239151198781626111268107112444031999.32483.642086462.55195.7240298198882365110123116.212344375.92141.526

33、57.550874544.94214.0739408198983164112205118.911544917.22357.12806.746991601.51265.9440755199084138113466105.597.447403.12590.32870.838474686.31307.8444624.3199184620112314102.99847822.12805.12938.955472708.55347.5743529.3199284996110560103.7103.448590.12930.23030.851332784376.0244265.81993853441105

34、09114.1113.448727.93151.93181.748827921.6440.4545648.8199485681109544121.6139.948759.13317.93380.3550461221532.9844510.1199585947110060127.4119.949281.63593.73611.8458241577.74574.9346661.8199685085112548108.4104.250381.63827.93854.7469911926.1700.4350453.519978417711291299.595.551238.53980.74201.65

35、34292090.1766.3949417.119988315311378794.59252295.64083.74520.85014521621154.7651229.5319998203811316195.887.853158.44124.34899.6499802210.31085.7650838.5820008083710846399.196.453820.34146.45257.4546882253.421231.5446217.5220017956310608099.1103.154249.44253.85517.2522152366.41456.7345263.672002782

36、41103891100.599.754354.94339.45793469462475.61580.7645705.7520037685199410101.4104.454014.24411.66038.7545062622.21754.4543069.53200475705101606110.6113.154478.44636.66402.8371062936.42337.646946.95200574544104278108.3101.455029.34766.26839.8388183254.932450.348402.19200673742104958101.5101.255750.5

37、4927.77252.2410913587.04317349804.23200772750105638107.7118.556518.35107.87659489924140.364318.350160.28200872135106793120.3114.158471.7523982193999047615955.552870.9220097128810898697.597.659261.45404.48749.64721451537253.153082.082、模型具体建立1)普通线性回归、残差自回归方程模型的建立下面利用R软件进行逐步回归分析,R程序结果如下: Estimate Std.

38、Error t value Pr(|t|) (Intercept) 9.927e+03 1.553e+04 0.639 0.528769 x1 5.578e-01 1.497e-01 3.727 0.001047 * x2 3.083e-01 9.313e-02 3.311 0.002933 * x3 -8.238e+01 3.187e+01 -2.585 0.016256 * x5 -1.169e+00 2.778e-01 -4.207 0.000312 *x6 8.639e+00 1.039e+00 8.315 1.58e-08 *x8 -1.621e-01 3.673e-02 -4.41

39、4 0.000184 *x10 1.279e+00 3.703e-01 3.454 0.002065 * Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1082 on 24 degrees of freedomMultiple R-squared: 0.9773, Adjusted R-squared: 0.9706 F-statistic: 147.4 on 7 and 24 DF, p-value: |t|) (Intercept) -9.897e+04 1.269e+04 -7.803 2.

40、17e-08 *x1 1.241e+00 9.541e-02 13.010 3.82e-13 *x2 3.144e-01 8.059e-02 3.901 0.000575 *x7 4.511e+00 2.270e-01 19.877 2e-16 *x8 -2.142e-01 4.400e-02 -4.868 4.34e-05 *Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1396 on 27 degrees of freedomMultiple R-squared: 0.9574, Adjust

41、ed R-squared: 0.9511 F-statistic: 151.9 on 4 and 27 DF, p-value: 2.2e-16优化的逐步回归结果分析以上分析可以看出,模型拟合程度非常高,调整后的R方为0.9511。参数X1、X2、X7、X8最终被保留,X1农村人口数(万人)、X2粮食作物种植面积、X7农业机械总动力(亿瓦)对粮食产量有正向影响,符合实际情况, X8受灾面积(千公顷)与粮食产量成负向影响,符合实际情况,所以此次计算机模拟结果可以接受。多重共线性检验多重共线性的定义设回归模型如果矩阵X的列向量存在一组不全为零的数,使,则称其存在完全共线性,如果,则称其存在近似的多

42、重共线性多重共线性的诊断(1) 直观的判断方法.在自变量 的相关系数矩阵中,有某些自变量的相关系数值比较大;.回归系数的符号与专业知识或一般经验相反;.对重要的自变量的回归系数进行t检验,其结果不显著,但是F检验确得到了显著的通过;.如果增加一个变量或删除一个变量,回归系数的估计值发生了很大的变化;.重要变量的回归系数置信区间明显过大。(2) 方差扩大因子法(VIF),定义 其中 是以 为因变量时对其他自变量的复测定系数。一般认为如果最大的 超过10,常常表示存在多重共线性。事实上 这说明 即 .(3) 特征根判定法根据矩阵行列式的性质,矩阵行列式的值等于其特征根的连乘积 。因此,当行列式0时

43、,至少有一个特征根为零,反过来,可以证明矩阵至少有一个特征根近似为零时,X的列向量必存在多重共线性,同样也可证明有多少个特征根近似为零矩阵X就有多少个多重共线性。根据条件数, , 其中为最大的特征根 为其他的特征根,通常认为,没有多重共线性,存在着多重共线性。本模型使用SPSS进行多重共线性检验,使用的是VIF法进行判断。多重共线性的诊断结果由于第一次逐步回归因为可能有多重共线性的影响,接下来用SPSS进行多重共线性检验,得到结果如下:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-98974.82312685.008-7.803.000x11.241.095.81213.010.000.4052.471x2.314.081.2363.901.001.4312.322x74.511.2271.56619.877.000.254

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号