《回归分析基本方法:最小二乘法.ppt》由会员分享,可在线阅读,更多相关《回归分析基本方法:最小二乘法.ppt(45页珍藏版)》请在三一办公上搜索。
1、假设检验的基本思想基于小概率原理的反证法,二、假设检验的步骤,1、提出假设,包括原假设和备择假设2、构造相应的检验统计量,确定其分布形式;根据样本数据计算统计量的值;3、确定显著性水平和临界值;4、作出结论。(根据所计算的统计量的值与临界值比较确定是否拒绝原假设),原假设 The Null Hypothesis,1.陈述需要检验的假设例如:H0:=452.原假设用 H0 表示3.总是包含等号“=”(比如=,)4.检验以“假定原假设为真”开始,平均每天上网玩游戏时间不是5小时。,如何设定假设检验?,H0:=5 H1:5,例 题 1,据报导,美国全职教授年薪的数学期望值为68000美元,标准差为5
2、000美元。一个由36名大学全职教授组成的样本表明,平均薪水为72000美元,检验报导的可信性。(显著性水平为0.02),H0,临界值,临界值,/2,/2,样本统计量,拒绝域,拒绝域,非拒绝域,接受域与拒绝域,抽样分布,1-,置信度,(1)H0:=68000 H1;68000(2)检验统计量服从Z分布检验统计量:,(3)=0.02,查正态分布表得:Z=2.04,接受域为(2.04,2.04)结论:拒绝假定。,质检员认为在整个工作流程中平均装盒量符合标准:没有超过368克。随机抽取25盒为样本,均值X=372.5克,标准差s=15 克。试在=0.05的条件下进行检验。给出你的结论。,368 克.
3、,例 题 2,t,0,拒绝H,0,t,0,拒绝H,0,接受域与拒绝域,H0:0 H1:0,H0:0 H1:0,必须显著低于才会拒绝,小的数值与H0不矛盾.,因此不会拒绝 H0,左侧检验,右侧检验,(1)H0:368 H1;368(2)检验统计量服从t分布检验统计量:,(3)=0.05,查t分布表得:t=2.064,接受域为(,2.064)结论:接受原假定。,假设检验中的两类错误检验决策错误,第一类错误弃真错误,后果往往较为严重出现第一类错误的概率为,等于显著性水平第二类错误 存伪错误,出现第二类错误的概率为,检验决策结果,实际情况,实际情况,H0为真,H0为假,决策,H,0,为真,H,0,为假
4、,不拒绝,正确,错误,不拒绝,H,0,置信水平1-,第二类错误,拒绝,错误,正确,拒绝,H,0,第一类错误,检验能力1-,第三章 回归分析的基本方法:最小二乘法,本章重点,经济学理论模型最小二乘法实例应用,2023/9/7,14,中山大学南方学院经济系,本章分析思路,建立经济学的理论模型运用最小二乘法进行参数估计实例运用,2023/9/7,中山大学南方学院经济系,15,回归分析,研究步骤:首先,要确定所研究的问题(因变量),并根据经济理论,找出与该问题相关的、有影响力的经济因素(自变量),并建立因变量与自变量的关系式(经济模型)。,2023/9/7,中山大学南方学院经济系,16,其次,按照科学
5、的方法收集相应变量的实际数据。最后,对所研究的问题作出结论。,2023/9/7,中山大学南方学院经济系,17,第一节 理论模型的建立,简单回归模型 是指两个变量的线性模型,其中一个是因变量,一个是自变量。也称为“二元线性方程”。用数学公式表示就是:,2023/9/7,中山大学南方学院经济系,18,建立x解释y的模型时,面临三个问题:(1)既然两个变量之间没有一个确切的关系,应该如何考虑其他影响Y的因素?(2)Y和X的函数关系是怎样的?(3)怎样知道是否准确测定出了y和x之间的关系(因果性效应)?,2023/9/7,中山大学南方学院经济系,19,20,计量经济学分析的应用:y和x:某一个总体的两
6、个变量感兴趣:用x来解释y,或者说是研究y如何随x而变化如:(Y)大豆的产出与(X)化肥的用量;(Y)工资收入与(X)受教育的年数;(Y)社区的犯罪率与(X)警察的数量。,在自己建立经济模型的过程中,如何取舍解释变量,一定要问个为什么。计量经济学家首先就是要摆事实、讲道理,这是作为计量经济学家必备的素质。1、消费与收入之间的关系;2、产品的销量与产品价格的关系;3、GDP与投资、经济运行的关系。,2023/9/7,中山大学南方学院经济系,21,22,一元回归的术语,自变量(independent variable)解释变量(explanatory variable)控制变量(control v
7、ariable)预测变量(predictor variable)回归元(regressor),因变量(dependent variable)被解释变量(explained variable)响应变量(response variable)被预测变量(predicted variable)回归子(regressand),23,一元回归模型的定义,变量:随机误差项或随机扰动项表示:除X之外其他影响Y的因素,24,随机误差项的产生,一、理论的不确定性(现象的内在随机性)二、模型的简化核心变量与非核心变量忽略影响较小的因素三、数据测量、收集的误差四、模型函数形式设定错误,25,模型表述了Y和X之间的线性
8、关系。简单线性回归模型(Simple linear regression model)又称做两变量或双变量线性回归模型(The two variable regression model):y和x关系式中的斜率参数(slope parameter):截距参数(intercept parameter),26,例1 大豆产出和施肥量,农业研究者对(其他因素不变时)化肥用量如何影响大豆产出量感兴趣。随机误差项包括了:土壤质量、降雨量等因素影响的效果由给出系数度量了在其他条件不变的情况下,施肥量对产出量的影响:yield=fertilizer,假使大豆的产出由以下模型所决定:,27,例2 简单的工资方
9、程,表示一个人的工资水平与他的受教育程度及其他非观测因素的关系:,Wage:工资水平Educ:受教育的年数:(在其他条件不变的情况下)每增加一年教育所获得的工资增长。其他非观测因素线性性显示,不管X的初始值为多少,它的任何一单位变化对Y的影响都是相同的。,28,计量经济分析中的因果性效应与其他条件不变,其他条件不变:包含在随机误差项中的其他所有相关因素均保持固定不变。因果性效应:其他条件不变情况下,一个变量对另一个变量产生的影响。,第二节 实际数据的收集,当我们建立了经济理论上的关系式后,接下来就要从实际中收集数据。Y和X是两个变量,我们要收集有关Y和X的数据,就要对N个研究对象进行观察,从而
10、收集到N组数据,这每一组数据叫做一个“样本”,每个样本有一个对应的Y与X的值。,2023/9/7,中山大学南方学院经济系,29,于是,我们的回归模型就可以表示为:我们用所得到的数据,采用回归分析的方法来对模型中的参数进行估计。这样我们就可以得到参数的估计值。被普遍采用的方法是“最小二乘法”。,2023/9/7,中山大学南方学院经济系,30,第三节 最小二乘法,普通最小二乘估计量(ordinary least squares)OLS估计量,2023/9/7,中山大学南方学院经济系,31,32,(1)OLS残差的平方和最小。数学表述为:,OLS估计量的代数性质,OLS估计值是以使残差和为零的参数估
11、计值来选择的。,即OLS的一阶条件,我们试图找到这样一条直线,它到每一实际落点的距离的总和为最小。由于实际落点到直线的距离有正也有负值,即误差有正值和负值,我们用误差项的平方值来测定其绝对距离。所以我们可以通过全微分来求极值。,2023/9/7,中山大学南方学院经济系,33,我们得出:设一阶导数为零,可得:,2023/9/7,中山大学南方学院经济系,34,2023/9/7,中山大学南方学院经济系,35,然后我们再求二阶偏导:由于二阶偏导大于零,所以我们确信这种所求的结果是最小值。这就是最小二乘法。,2023/9/7,中山大学南方学院经济系,36,一元线性回归模型的假设条件,2023/9/7,中
12、山大学南方学院经济系,37,1.X与Y之间的关系是线性的。2.X是非随机的变量,它的值是确定的。3.误差项的期望为0:E(i)=0。4.对于所有观测值,误差项具有相同的方差,即E(2)=2同方差假定5.随机变量i 之间统计上是独立的,因此对所有的ij,E(i j)=0无序列相关假定6.误差项服从正态分布。假设15:古典线性回归模型的定义,第四节 最小二乘法实用实例,计量经济的回归分析主要是根据经济理论的数学模型和实际的经济数据来计算出符合实际的、可应用经济分析的参数方程。例如:我们估算某个地区的消费函数。根据经济理论,人们的消费额取决于他们的收入,也就是说消费与收入有线性关系,消费是因变量,收
13、入是自变量。收入越多消费也越多,收入越少消费也越少。,2023/9/7,中山大学南方学院经济系,38,用数学模型表示如下:这里,C表示因变量消费额,Y表示可支配收入。按照经济理论,参数系数应该大于零,或者说消费额与可支配收入的正相关的关系。,2023/9/7,中山大学南方学院经济系,39,我们把收集到的数据做成一个散点图。并用回归方法估计出来的回归结果如下(表3-2):C=131.8368+0.8663*Y这个分析的结果告诉我们,当收入等于零时,此人应该靠借大约132元来度日;人均的消费是收入的86.6,也就是说,平均每挣一百元,应该花掉八十六元六角三分钱。,2023/9/7,中山大学南方学院
14、经济系,40,这样,我们先从理论上的经济模型入手,再有采集的实际经济数据,然后用计量经济学的回归分析方法估计出适合于实际数据的数学模型。当然,我们还要对这个估计出来的数学模型进行统计测试,检验其估计参数的合理性和有效性。当其估计参数被测试为合理并且有效时,我们就可以说我们的经济理论被实践证明是正确的。这样,我们也就可以用这个模型来进行经济预测。,2023/9/7,中山大学南方学院经济系,41,以上的例题,我们用的是一个横截面的数据来进行回归分析的,同时我们也可以用时间序列数据来进行分析,分析的方法和步骤也是一样的。如我们分析不同年份的消费与可支配收入的关系。,2023/9/7,中山大学南方学院
15、经济系,42,第五节 最小二乘法,在实际经济研究过程中,我们所面对的理论模型往往有几个或者很多自变量。那么,简单的模型就不够用了。下面我们来简单讨论一下多变量的通用模型。当数据中有一个因变量和K个自变量时,那么我们的回归分析模型就应该是:,2023/9/7,中山大学南方学院经济系,43,这里,i=1,2,n.是估计参数,也就是模型的系数。E是模型的误差项。如果我们用矩阵的方式来表示就是:YXe 如果我们用实际数据来估计一个线性模型YXe,是这个模型中的真实的参数值。,2023/9/7,中山大学南方学院经济系,44,最佳估计值,当估计值满足以下三个条件的时候,我们求出的估计值是最佳的估计值。(1)“线性的”是指YXe这个线性模型;(2)“无偏的”是指E()=。(3)“最好的”是指估计参数的方差会是最小的。只有当这些条件都满足了,我们的估计参数才是最优的。,2023/9/7,中山大学南方学院经济系,45,