元线性回归模型.ppt

上传人:小飞机 文档编号:4954535 上传时间:2023-05-25 格式:PPT 页数:49 大小:1.03MB
返回 下载 相关 举报
元线性回归模型.ppt_第1页
第1页 / 共49页
元线性回归模型.ppt_第2页
第2页 / 共49页
元线性回归模型.ppt_第3页
第3页 / 共49页
元线性回归模型.ppt_第4页
第4页 / 共49页
元线性回归模型.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《元线性回归模型.ppt(49页珍藏版)》请在三一办公上搜索。

1、教学大纲要求,本章(第二章)是课程的重要和主要内容 应占理论课时的1/3以上基本要求:一元线性单方程计量经济学模型的基本理论与方法,运用矩阵描述、推导和证明与普通最小二乘法有关的参数估计过程和结论,应用计量经济学软件进行一元线性单方程模型的普通最小二乘估计,独立完成建立线性单方程计量经济学模型的全过程工作。,第二章 一元线性回归模型,2.1 一元线性回归模型概念基础回归是计量经济学的主要工具,一、“回归”一词的历史渊源,Francis GaltonF加尔顿,Karl PearsonK皮尔逊,回归一词最先由F加尔顿(FrancisC,alton)引入,加尔顿的普遍回归定律还被他的朋友K皮尔逊(K

2、artPearson)证实,二、回归的现代释义,一个,解释变量,解释变量,解释变量,应变量,一个或多个,依存关系,已知,估计(或)预测,回归分析是用来研究一个变量【称之为被解释变量(explained Variable)或因变量(dependent Variable)】与另一个或多个变量【称为解释变量(explanatory Variable)或自变量(independent Variable)】之间的非确定性的相关关系.,父辈身高(cm),160165170175,儿辈身高,160,165,170,175,给定,回归线,例1.给定父辈身高的情形下找出儿辈平均身高的变化。,年龄,1011121

3、314,身高,140,150,160,170,给定,回归线,例2.给定年龄的情形下找出平均身高的变化。,例3在经济学中。,个人消费支出,税后 实际个人收入,依赖关系,可估计出边际消费倾向(MPC),即:实际收入每美元价值的变化所引起的消费支出的平均变化,可以知道产品需求对价格变化的实际反应通过这种定价实验能估计出产品需求的价格弹性(即对价格的应变性)从而有助于确定最有利可图的价格,价格,产出,例4,依赖关系,税后个人实际收,40060080010001200,个人消费支出,240,280,310,340,给定,回归线,例2.给定收入的情形下平均个人消费支出的变化。,统计关系与确定性关系,在回归

4、分析中,我们考虑的是一种所谓统计依赖关系 我们主要处理的是随机变量 也就是有着概率分布的变量 例如作物收成对气温、降雨、阳光以及施肥的依赖关系是统计性质的。回归与因果关系 回归分析研究一个变量对另一(些)变量的依赖关系,但它并不一定意味着因果关系。,回归与相关 与回归分析密切相关而在概念上则迥异的,是以测度两个变量之间的线性关联力度为其主要目的的相关分析。在回归分析中,对应变量和解释变量的处理方法存在着不对称性。应变量被当作是统计的,随机的,也就是它有一个概率分布。而解释变量则被看作是(在重复抽样中)取有固定值的。但在相关分析中,我们对称地对待任何(两个)变量;应变量和解释变量之间不加区别。,

5、术语与符号,eksdins,enddns,为了统一符号,从现在起,我们用Y代表因变量,X 代表自变量或解释变量。如果有多个解释变量,我们将用适当的下标,表示各个不同的X(例如,X1,X2,X3等等),综合来看,回归分析一般可以用来:(1)通过已知变量的值来估计因变量的均值。(2)对独立性进行假设检验根据经济理论建立适当的假设。例如,对于需求函数,你可以检验假设:需求的价格弹性为-1.0;即需求曲线具有单一的价格弹性。也就是说,在其他影响需求的因素保持不变的情况下,如果商品的价格上涨1,平均而言,商品的需求量将减少1。(3)通过解释变量的值,对因变量的均值进行预测。上述多个目标的综合,三、线性回

6、归模型的特征,2.1例1凯恩斯绝对收入消费理论的数学描述为y=x 0=dy/dx1 dy/dx y/x计量经济模型为y=x 随机方程参数可用回归分析的方法求得,线性回归模型的特征(线性计量经济学模型的特征)引入随机误差项将变量之间的关系用用一个线性随机方程描述,用随机数学的方法来估计参数,2.1 例2假想一个国家的人口总体由60户家庭组成。我们要研究每周家庭消费支出Y与每周税后或可支配家庭收入X的关系 即知道了家庭的每周收入,要预测每周消费支出的(总体)平均水平,换句话说,表21的每个纵列给出对应于给定收入水平X的消费支出Y的分布;就是说,它给出了以X的给定值为条件的Y的条件分布(condit

7、ional distribution),求:给定X的Y的概率p(Y/X)即Y的条件概率,当X=80美元时,有5个Y值,得到p(Y55/X80)1/5 p(Y60/X80)1/5 p(Y65/X80)1/5 p(Y70/X80)1/5 p(Y75/X80)1/5,同理,p(Y=/X=260)=1/7,?,条件均值(条件期望):对Y的每一条件概率分布,我们能算出它的均值:记做E(Y/X=Xi)简写为E(Y/Xi)并读为“在X取特定Xi值时的Y的期望值”。计算方法:将表2.1中的有关列乘以表2.2中的相应列的条件概率,然后对这些乘积求和便是。如E(Y/80)55(1/5)+60(1/5)+65(1/

8、5)+70(1/5)+75(1/5)=65。这样算得的条件均值列于表22的末行,图21 对不同收入水平的支出的条件分布(表21的数据),虽然每个个别的家庭的消费支出都有变异,但图2.1仍清楚地表明随着收入的增加,消费支出平均地说也在增加。,总体回归曲线,图22 总体回归线(表22的数据),在几何意义上,总体回归曲线就是(当)解释变量取给定值时应变量的条件均值或期望值的轨迹,总体回归函数(PRF)的概念,每一条件均值E(Y/Xi)都是Xi的一个函数,用符号表示:E(Y/Xi)=f(Xi)(2.2.1),(2.2.1)被称为(双变量)总体回归函数(PRF)Population regresion

9、fuction 或简称总体回归(PR)Population regresion,f(Xi)表示解释变量Xi的某个函数,它仅仅表明在给定Xi下Y的分布的(总体)均值与Xi有函数关系。换句话说,它说出Y的均值或平均响应是怎样地随x而变的。,表2.3,E(Y/X=Xi)Y的条件均值,在几何意义上,总体回归曲线就是(当)解释变量取给定值时应变量的条件均值或期望值的轨迹,2、总体回归函数 从以上讨论和图中可以看出,Y的条件均值E(Y|Xi)是Xi 的函数,一般写成如下的函数形式:E(Y|Xi)f(Xi)(2-1)意味着Y依赖于Xi,或称之为Y对X的回归。回归也可简单地定义为:在给定X值的条件下Y值分布的

10、均值。,函数f(Xi)采取什么形式?在特殊情形 下:如果消费支出与收入有线性关系 可假定:PRF E(Y/Xi)是Xi的线性函数,其形式是E(Y/Xi)=1+2Xi(2-2)其中 1和2为未知然而固定的参数,称为回归系数(regression coefficients);1和2也分别称为截距和斜率系数 在回归分析中,我们的兴趣在于估计像(2-2)那样的PRF。就是说,根据对Y和X的观测值估计未知数1和2的值,两种解释 对变量为线性 对参数为线性,3.“线性”一词的含义,Y的条件期望值是Xi的线性函数,比如说,如同(2-2)那样。从几何意义上说回归曲线是一条直线。E(Y/Xi)=1+2+X2i这

11、样的回归函数,由于变量X以幂或指数2出现,就不是线性的,Y的条件期望E(Y/Xi)是诸参数的一个线性函数 E(Y/Xi)=1+2X2i就算是一个线性回归模型 E(Y/Xi)=1+22Xi则不是,表2.3线性回归模型,E(Y/Xi)=1+2Xi兼对参数和变量为线性,是一个线性回归模型(LRM),对参数为线性但对变量X为非线性的E(Y/Xi)=1+2X2i,也是一个LRM,“线性”回归一词总是指对参数为线性的一种回归,E(Y/Xi),随着书的价格增加,图书的需求量平均的减少,三.随机误差项1.PRF的误差设定,对某一个别人,某一个别人对图书的需求却不一定随书的价格增加而减少,在个别个人的购书需求与

12、给定价格水平之间能有什么关系呢?,个别的Yi围绕它的期望值的离差(deviation)表述如下:,ui=YiE(Y/Xi),E(Y/Xi),Yi=E(Y/Xi)ui,离差ui是一个不可观测的可正可负的随机变量ui称为随机干扰(stochastic distmbance)或随机误差(stochastic error)项,代表相同收入水平的所有家庭的平均需求。被称为系统性(systematic)确定性(detenninstic)成分,Yi=E(Y/Xi)ui 的解释,给定X水平,个别个人的需求,可表示为两个成分之和,为随机或非系统性(nonsystematic)成份,ui是所有可能影响Y的、但又未

13、能包括到回归模型中来的、被忽略变量的替代(surrogate)或代理(proxy)变量,假定E(Y/Xi)是对Xi为线性的 Yi=E(Y/Xi)ui可写为 Yi 1+2 Xi ui(2.4.2),某个人的购书需求,线性地依赖于书的价格,干扰项。,例如,给定X1各家庭的消费支出可表达为:Y1451+2(1)u1Y2461+2(1)u2Y3471+2(1)u3(243)Y4481+2(1)u4Y5491+2(1)u5Y6491+2(1)u6Y7491+2(1)u7,Yi=E(Y/Xi)ui两边取期望值,得到 E(Yi/Xi)EE(Y/Xi)+E(ui/Xi)E(Y/Xi)+E(ui/Xi)(2.4

14、.4)因为E(Yi/Xi)就是E(Y/Xi)可推出E(ui/Xi)0(2.4.5)如果E(ui/Xi)=0则 E(Y/Xi)=1+2Xi(2.2.2)和Yi 1+2 Xi ui(242)是等价的。,4、随机干扰项的意义,随机误差项主要受到下列因素的影响1、在解释变量中被忽视的因素的影响 代表了未列入模型中但又影响因变量Y的种种因素2、变量观测值的观测误差的影响 代表了测量误差。在观测过程中,由于主客观原因而引起观察或测量上的差错所造成的误差,导致变量的观测值并不等于其实际的数值。3、模型准确率的设定误差的影响 这是由于在分析和构造模型时,对客观现实的简化而出现的误差,主要是指在模型中所设定的解

15、释变量与被解释变量之间关系不合适,会造成误差 4、其它随机因素的影响 即使模型中包括了所有决定需求量的有关变量,需求量的内在随机性也一定会发生,这是我们无法控制的,产生并设计随机误差项的主要原因:1)理论的含糊性;2)数据的欠缺;3)节省原则。,这里我们的任务就是根据样本提供的信息来估计总体回归函数,四.样本回归函数(SRF)sample regression function,对应于给定的每个Xi只有一个Y值(给定Xi)的每个Y都是从表21的总体中对应于同一Xi的同组Y值随机抽取的。,问题是:我们能从表2-2的样本预测整个总体中对应于选定X的平均每周消费支出Y吗?,图中的回归线称为样本回归线

16、(sample regression lines),一般地说,从N个不同的样本会得到N个不同的SRF,并且这些SRF不大会是一样的,我们能根据样本数据来估计总体回归函数吗?,样本关系式可写为:,读为“Y-帽”(“Yhat或“Ycap)=E(Y/Xi)的估计量=1的估计量,=2的估计量,又称(样本)统计量,是指一个规则或公式或方法,告诉人们怎样用手中样本所提供的信息去估计总体参数,由估计量算出的一个具体的数值,称为估计(值)(estimate),表示(样本)残差(或剩余)(residual)项,在回归分析中的主要目的是根据SRF 来估计PRF,SRF估计出来的PRF充其量也不过是一个近似的结果。,Yi=1+2Xi+ui(2.4.2),SRF只不过是PRF的一个近似 能不能设计一种规则或方法,使得这种近似是一种尽可能“接近”的近似?怎样构造SRF能使尽可能“接近”真实的1,尽可能“接近”真实的2,要点与结论 一,1、线性回归模型的特征2作为回归分析基础的主要概念是总体回归函数(PRF)。3本书研究线性PRF,也就是对未知参数为线性的回归。4为了经验研究的目的,重要的是随机的PRF。在PRF的估计中,随机干扰项ui起着关键性的作用。5PRF是一个理想化的概念。,3333,解释概念总体回归函数样本回归函数线性回归模型随机误差项残差项,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号