第三章多元线性回归模型及非线性回归模型ppt课件.ppt

资源描述

《第三章多元线性回归模型及非线性回归模型ppt课件.ppt》由会员分享，可在线阅读，更多相关《第三章多元线性回归模型及非线性回归模型ppt课件.ppt（81页珍藏版）》请在三一办公上搜索。

1、多元线性回归模型,计量经济学,第三章,2,引子:中国已成为世界汽车产销第一大国,2009年，为应对国际金融危机、确保经济平稳较快增长，国家出台了一系列促进汽车消费的政策，有效刺激了汽车消费市场，汽车产销呈高增长态势，首次成为世界汽车产销第一大国。2009年，汽车产销分别为1379.1万辆和1364.5万辆，同比增长48.3%和46.15%。是什么因素导致中国汽车数量的增长? 影响中国汽车行业发展的因素并不是单一的，经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境，都会使中国汽车行业面临机遇和挑战。,3,分析中国汽车行业未来的趋势,应具体分析这样一些问题：中国汽车市场发展的

2、状况如何？（用销售量观测）影响中国汽车销量的主要因素是什么？（如收入、价格、费用、道路状况、能源、政策环境等）各种因素对汽车销量影响的性质怎样？（正、负）各种因素影响汽车销量的具体数量关系是什么？所得到的数量结论是否可靠？中国汽车行业今后的发展前景怎样？应当如何制定汽车的产业政策？很明显，只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。,怎样分析多种因素的影响？,4,本章主要讨论: 多元线性回归模型及古典假定多元线性回归模型的估计多元线性回归模型的检验多元线性回归模型的预测,5,第一节多元线性回归模型及古典假定一、多元线性回归模型的意义一

3、般形式：对于有K-1个解释变量的线性回归模型注意：模型中的（j=1,2,-k）是偏回归系数样本容量为n 偏回归系数：控制其它解释量不变的条件下，第j个解释变量的单位变动对被解释变量平均值的影响，即对Y平均值“直接”或“净”的影响。,5,6,多元线性回归中的“线性”指对各个回归系数而言是“线性”的，对变量则可以是线性的，也可以是非线性的例如：生产函数取对数这也是多元线性回归模型，只是这时变量为lnY、lnL、lnK,7,多元总体回归函数条件期望表现形式：将Y的总体条件期望表示为多个解释变量的函数，如:注意：这时Y总体条件期望的轨迹是K维空间的一条线个别值表现形式：引入随机扰动项或表示为

4、,8,多元样本回归函数 Y 的样本条件均值可表示为多个解释变量的函数或回归剩余（残差）：其中,9,二、多元线性回归模型的矩阵表示,多个解释变量的多元线性回归模型的n组样本观测值，可表示为用矩阵表示,9,10,总体回归函数或样本回归函数或其中：都是有n个元素的列向量是有k 个元素的列向量（ k = 解释变量个数 + 1 ）是第一列为1的nk阶解释变量数据矩阵， (截距项可视为解释变量总是取值为1),矩阵表示方式,11,三、多元线性回归中的基本假定,假定1：零均值假定（ i=1，2，-n）或 E（u）=0 假定2和假定3：同方差和无自相关假定：或用方差-协方差矩阵表示

5、为:,（i=j）,(ij),0,12,假定5: 无多重共线性假定 (多元中增加的) 假定各解释变量之间不存在线性关系，或各个解释变量观测值之间线性无关。或解释变量观测值矩阵X的秩为K(注意X为n行K列)。 Ran(X)= k Rak(XX)=k 即 (XX) 可逆假定6:正态性假定,12,假定4：随机扰动项与解释变量不相关,第二节多元线性回归模型的估计,一、普通最小二乘法（OLS）原则：寻求剩余平方和最小的参数估计式即求偏导，并令其为0 其中即,13,14,用矩阵表示的正规方程偏导数因为样本回归函数为两边左乘根据最小二乘原则则正规方程为,15,OLS估计式由正规方程多元回归的OL

6、S估计量为当只有两个解释变量时为：注意：为X、Y的离差,对比,简单线性回归中,16,OLS回归线的数学性质 (与简单线性回归相同),回归线通过样本均值估计值的均值等于实际观测值的均值剩余项的均值为零被解释变量估计值与剩余项不相关解释变量与剩余项不相关（j=1,2,-k）,16,17,二、 OLS估计式的统计性质,1、线性特征是Y的线性函数，因是非随机或取固定值的矩阵 2、无偏特性 (证明见教材P101附录3.1) 3、最小方差特性在所有的线性无偏估计中，OLS估计具有最小方差 (证明见教材P101或附录3.2) 结论：在古典假定下，多元线性回归的 OL

7、S估计式是最佳线性无偏估计式（BLUE）,18,三、 OLS估计的分布性质基本思想：是随机变量，必须确定其分布性质才可能进行区间估计和假设检验是服从正态分布的随机变量，决定了Y也是服从正态分布的随机变量是Y的线性函数，决定了也是服从正态分布的随机变量,19, 的期望 (由无偏性) 的方差和标准误差：可以证明的方差协方差矩阵为（见下页）这里的（其中是矩阵中第 j 行第 j 列的元素）所以（j=1,2,-k）,的期望与方差,20,其中：,(由无偏性),(由同方差性),(由OLS估计式),20,注意是向量,的方差-协方差,21,四、随机扰动项方差的估计,一般未知，可证

8、明多元回归中的无偏估计为：(证明见P103附录3.3) 或表示为将作标准化变换：,21,对比: 一元回归中,22,五、回归系数的区间估计,由于给定，查t分布表的自由度为 n-k 的临界值或或表示为,22,23,第三节多元线性回归模型的检验,一、多元回归的拟合优度检验多重可决系数：在多元回归模型中，由各个解释变量联合起来解释了的Y的变差，在Y的总变差中占的比重，用表示与简单线性回归中可决系数的区别只是不同多元回归中多重可决系数可表示为 (注意:红色字体是与一元回归不同的部分),23,24,多重可决系数的矩阵表示可用代数式表达为特点:多重可决系数是模型中解释变量个数的

9、不减函数，这给对比不同模型的多重可决系数带来缺陷，所以需要修正。,25,修正的可决系数思想：可决系数只涉及变差，没有考虑自由度。如果用自由度去校正所计算的变差，可纠正解释变量个数不同引起的对比困难。回顾: 自由度：统计量的自由度指可自由变化的样本观测值个数，它等于所用样本观测值的个数减去对观测值的约束个数。,26,可决系数的修正方法总变差 TSS 自由度为 n-1 解释了的变差 ESS 自由度为 k-1 剩余平方和 RSS 自由度为 n-k 修正的可决系数为,27,修正的可决系数与可决系数的关系已经导出：注意：可决系数必定非负，但所计算的修正可决系数有可能为负值解决

10、办法：若计算的，规定取值为0,28,28,二、回归方程的显著性检验（F检验）,基本思想：在多元回归中包含多个解释变量，它们与被解释变量是否有显著关系呢？当然可以分别检验各个解释变量对被解释变量影响的显著性。但是我们首先关注的是所有解释变量联合起来对被解释变量影响的显著性, 或整个方程总的联合显著性，需要对方程的总显著性在方差分析的基础上进行F检验。,29,原假设:（所有解释变量联合起来对被解释变量的影响不显著）备择假设: 不全为0建立统计量(可以证明): 给定显著性水平，查F分布表中自由度为 k-1 和 n-k 的临界值，并通过样本观测值计算F值,29,30,如果计算的F值大于临

11、界值，则拒绝，说明回归模型有显著意义，即所有解释变量联合起来对Y确有显著影响。如果计算的F值小于临界值，则不拒绝，说明回归模型没有显著意义，即所有解释变量联合起来对Y没有显著影响。,31,三、各回归系数的假设检验,注意: 在一元回归中F检验与t检验等价, 且 (见教材P87证明)但在多元回归中，F检验显著，不一定每个解释变量都对Y有显著影响。还需要分别检验当其他解释变量保持不变时，各个解释变量X对被解释变量Y是否有显著影响。方法：原假设（j=1,2,k）备择假设统计量t为：,32,给定显著性水平，查t分布表的临界值为如果就不拒绝，而拒绝即认为所对应的解释变量对

12、被解释变量Y的影响不显著。如果就拒绝而不拒绝即认为所对应的解释变量对被解释变量Y的影响是显著的。,对各回归系数假设检验的作法,33,第四节多元线性回归模型的预测,一、被解释变量平均值预测1. Y平均值的点预测方法：将解释变量预测值代入估计的方程：多元回归时：或注意: 预测期的是第一个元素为1的行向量,不是矩阵,也不是列向量,34,2. Y平均值的区间预测,基本思想：（与简单线性回归时相同）由于存在抽样波动，预测的平均值不一定等于真实平均值，还需要对作区间估计。为了对Y作区间预测，必须确定平均值预测值的抽样分布。必须找出与和都有关的统计量, 并要明确其概

13、率分布性质。,34,35,区间预测的具体作法,当未知时，只得用代替，这时,简单线性回归中,(回顾简单线性回归),35,36,多元回归时，与预测的平均值和真实平均值都有关的是二者的偏差：服从正态分布，可证明用代替，可构造 t 统计量,区间预测的具体作法（多元时）,37,或者,服从正态分布，可证明即标准化当用代替时，可构造 t 统计量,37,38,给定显著性水平，查t分布表，得自由度为 n-k的临界值，则或,区间预测的具体作法,39,二、被解释变量个别值预测,基本思想：（与简单线性回归时相同）由于存在随机扰动的影响，Y的平均值并不等于Y的个别值。为了对Y的个别

14、值作区间预测，需要寻找与预测值和个别值有关的统计量，并要明确其概率分布性质。,40,已知剩余项是与预测值和个别值都有关的变量并且已知服从正态分布，且多元回归时可证明当用代替时，对标准化的变量 t 为：,个别值区间预测具体作法,给定显著性水平，查t分布表得自由度为 n-k 的临界值则因此，多元回归时Y的个别值的置信度1-的预测区间的上下限为,41,42,第五节案例分析,研究的目的要求为了研究影响中国税收收入增长的主要原因，分析中央和地方税收收入增长的数量规律，预测中国税收未来的增长趋势，需要建立计量经济模型。研究范围：1978年-2007年全国税收收入理论分析

15、：为了全面反映中国税收增长的全貌，选择包括中央和地方税收的“国家财政收入”中的“各项税收”（简称“税收收入”）作为被解释变量；选择国内生产总值（GDP）作为经济整体增长水平的代表；选择中央和地方“财政支出”作为公共财政需求的代表；选择“商品零售价格指数”作为物价水平的代表。,43,44,45,序列Y、X2、X3、X4的线性图,可以看出Y、X2、X3都是逐年增长的，但增长速率有所变动，而且X4在多数年份呈现出水平波动。说明变量间不一定是线性关系，可探索将模型设定为以下对数模型：注意这里的“商品零售价格指数”,（X4）未取对数。,46,三、估计参数,模型估计的结果为：,(0.6397) (0.13

16、55) (0.1557) (0.0055) t= (-4.4538) (3.0420) (4.2788) (2.0856),F=673.7521 df=30,47,模型检验：,1、经济意义检验：模型估计结果说明，在假定其它变量不变的情况下，当年GDP每增长1%，税收收入会增长0.4123%；当年财政支出每增长1%，平均说来税收收入会增长0.6664%；当年商品零售价格指数上涨一个百分点，平均说来税收收入会增长0.0115%。这与理论分析和经验判断相一致。2、统计检验：拟合优度：，表明样本回归方程较好地拟合了样本观测值。 F检验：对已得到 F =673.7521，给定查表得自由度k-1=

17、3和n-k=26的临界值，因为 F=673.7521 ，说明模型总体上显著，即“国内生产总值”、“财政支出”、“商品零售价格指数”等变量联合起来确实对“税收收入”有显著影响。,47,t 检验,分别针对，给定显著性水平 ,查t分布表得自由度为n-k=21的临界值。由回归结果已知与、、、对应的t值分别为：-4.4538、3.0420、4.2788、2.0856，其绝对值均大于，这说明在显著性水平下，分别都应当拒绝说明当在其它解释变量不变的情况下，解释变量“国内生产总值” 、“财政支出” 、“商品零售价格指数” 分别对被解释变量“税收收入”Y都有显著的影响。,本章小结,1. 多元

18、线性回归模型及其矩阵形式。2. 多元线性回归模型中对随机扰动项u的假定，除了其他基本假定以外，还要求满足无多重共线性假定。3. 多元线性回归模型参数的最小二乘估计量；在基本假定满足的条件下，多元线性回归模型最小二乘估计式是最佳线性无偏估计量。4. 多元线性回归模型中参数区间估计的方法。,49,5. 多重可决系数的意义和计算方法，修正可决系数的作用和方法。6. 对多元线性回归模型中所有解释变量联合显著性的F检验。7. 多元回归分析中，对各个解释变量是否对被解释变量有显著影响的t检验。 8. 利用多元线性回归模型作被解释变量平均值预测与个别值预测的方法。,50,第六节非线性回归模型,一、可线性化

19、模型,二、不可线性化模型,三、回归模型的比较,参考文献,【教学目的及要求】,掌握非线性回归的线性化过程；了解不可线性回归模型的参数估计方法；掌握非线性回归模型参数估计的EViews软件实现；掌握回归模型优劣比较的标准；掌握利用回归模型进行边际分析和弹性分析。,教学目的及要求,1倒数变换模型（双曲函数模型）,设：,即可变换为线性。,模型,应用：平均固定成本曲线、商品成长曲线菲利普斯曲线等,一、可线性化模型,2双对数模型（幂函数模型）,则转换成线性回归模型：,设:,模型,其中：,弹性,3半对数模型模型 y=a+blnx+ (对数函数模型) lny=a+bx+ (指数函数模型),对数函数模型中

20、，,指数函数模型中，,4多项式模型,对于模型,设:,则:,模型转化成多元线性回归模型。,【例1】为了分析某行业的生产成本情况，从该行业中选取了10家企业，表2-10中列出了这些企业总产量Y（吨）和总成本X（万元）的有关资料，试建立该行业的总成本函数和边际成本函数。表2-10 某行业产量与总成本统计资料,根据边际成本的U型曲线理论，总成本函数可以用产量的三次多项式近似表示，即：,设:,EViews的命令操作：GENR X1=XGENR X2=X2GENR X3=X3LS Y C X1 X2 X3,变换即可,对总成本函数求导数，得到边际成本函数的估计式为：,得到总成本函数估计式：,采用：高斯牛顿迭

21、代法1迭代估计法模型,估计过程如下：（1）根据经济理论和所掌握的资料，先确定一组数a0,b0,c0作为参数a,b,c的初始估计值；（2）将模型在点（a0,b0,c0）处展开成泰勒级数，并取一阶近似值；,二、不可线性化模型,（3）作变量变换，转化成线性回归模型,以利用OLS法估计模型，得到参数的第一组估计值,（4）将代入线性回归模型取代参数的上一组估计值，重新变量变换，计算出一组新观察值，进而得到a、b、c的第二组估计值。（5）重复第（4）步，逐次估计，直到第t+1次估计值的估计误差小于事先取定的误差精度时为止。并以第t+1次的计算结果作为参数a、b、c的估计值。,2迭代估计法的EVie

22、ws软件实现,(1) 设定待估参数的初始值方式1：PARAM命令，格式为： PARAM 1 初始值1 2 初始值2 方式2：在工作文件窗口中双击序列C，并在序列窗口中直接输入参数的初始值 (2)估计非线性模型【命令方式】键入命令：NLS 被解释变量=非线性函数表达式,如，对于非线性回归模型y=a(x-b)/(x-c)+，则 NLS Y= C(1)*(X-C(2)/(X-C(3),【菜单方式】（1）在数组窗口中点击ProcsMake Equation；（2）在弹出的方程描述对话框中输入模型具体形式： Y= C(1)*(X-C(2)/(X-C(3)；（3）选择估计方法为最小二乘法后点击O

23、K。,注：可设置最大迭代次数和误差精度，初始值和精度得设定会影响估计结果。,【例2】我国国有工业企业生产函数（例4续）。例4中曾估计出我国国有独立核算工业企业的线性生产函数，现建立C-D（Cobb-Dauglas）生产函数：,（1）转化成线性模型进行估计 lny=lnA+lnL+lnK+键入以下命令： GENRLNY = log(Y)GENRLNL = log(L)GENRLNK = log(K)LS LNY C LNL LNK,得到C-D生产函数的估计式为：操作演示,即:,（2）利用迭代法直接估计非线性模型：输入命令： Param 1 1 2 1 3 1 在主窗口中点击ObjectsN

24、ew Object，并选择Equation；,输入非线性模型的方程表达式：Y=C(1)*LC(2)*KC(3),如果要修改迭代次数或收敛的误差精度,可点击Options按钮进行设置。,点击OK后，系统将自动进行迭代运算并输出估计结果：操作演示,报告迭代了13次后收敛,对应A，,1图形观察分析（1）观察趋势图变量的发展趋势是否一致？解释变量能否反映被解释变量的波动变化情况？变量发展过程中是否有异常点等问题。（2）观察相关图直观地判断两者的相关程度和相关类型。,三、回归模型的比较,2模型估计结果观察分析,（1）回归系数的符号、值的大小。（2）改变模型形式之后是否使判定系数的值明显提高。

25、（3）各个解释变量t检验的显著性。（4）系数的估计误差较小。,在方程窗口点击View Actual,Fitted,Residual Tabe（或Graph），观察：,（1）各期残差是否大都落在的虚线框内；（2）残差分布是否具有某种规律性，即是否存在着系统误差；（3）近期残差的分布情况。注意：当模型侧重于预测，则应关注F,R2, 当模型侧重于因素分析，则应关注t。,3残差分布观察分析,【例3】我国税收预测模型的比较分析。,（1）相关图分析：键入 SCAT X Y (3.1版)，结果如图,（2）估计模型： GENR LNY = Log(Y) GENR LNX = Log(X) GENR

26、 X2 = X2,LS LNY C X （指数函数模型）,LS Y C X X2 （二次函数模型）,LS LNY C LNX （双对数模型）,指数模型的估计结果如下：,R2值,调整的R2值,F统计量的值,二次函数模型的估计结果如下：,R2值,调整的R2值,F统计量的值,双对数模型的估计结果如下：,R2值,调整的R2值,F统计量的值,（3）残差分布分析,指数函数,二次函数,（4）拟合预测分析,对于二次函数模型，在方程窗口中直接点击Forcast按纽，就可以得到其在样本期的拟合预测值，设命名为Y2。而对于指数函数模型，需要先在方程窗口中由Forcast按纽得到lnY的预测值，设命名为LNYF，然后

27、再计算Y的预测值Y1，即： GENR Y1=EXP（LNYF）然后打入命令： PLOT Y Y1 PLOT Y Y2 即可得到模型1、2的拟合预测图（见下图）：,指数函数拟合预测图,二次函数拟合预测图,（5）外推预测调整数据区间和样本区间扩充数据区间： EXPAND 起始期终止期调整样本区间： SMPL 起始期终止期例如：EXPAND 1985 2010 SMPL 1978 2008或直接双击Range或Sample进行设置。输入解释变量X的值方程窗口中点击Forecast按钮进行预测。,参考文献,1.张晓峒.计量经济学软件EViews使用指南.南开大学出版社，20042.信息工程学院网站（精品课程计量经济学参考论文简单回归） 3.JM伍德里奇计量经济学导论中国人民大学出版社，20034.古扎拉蒂.计量经济学基础（第四版）.林少宫译.中国人民大学出版社,20065.易丹辉数据分析与EViews应用，中国统计出版社，20026.高铁梅计量经济分析方法与建模EViews应用及实例，清华大学出版社，2006,81,81,THANKS,第三章结束了！,

展开阅读全文