计量经济学课件南开大学经济学院张伯伟.ppt

资源描述

《计量经济学课件南开大学经济学院张伯伟.ppt》由会员分享，可在线阅读，更多相关《计量经济学课件南开大学经济学院张伯伟.ppt（68页珍藏版）》请在三一办公上搜索。

1、计量经济学南开大学经济学院张伯伟,引言,一、计量经济学,1、计量经济学（Econometrics）利用数学和统计推断为工具，在经济理论指导下对经济现象进行分析，并对经济理论进行检验和发展的一门学科。其内容涉及经济理论、数理经济、经济统计和数理统计等。2、计量经济学与经济理论经济理论：定性计量经济学：数值估计，检验3、计量经济学与数理经济学数理经济学：以数学形式表述经济理论，不涉及理论的可度量性和经验方面的可论证性。计量经济学：利用数理经济学的数学方程式，并把之改造成适合于经验检验的形式。,4、计量经济学与经济统计学经济统计：经济数据的收集、加工，不利用数据来检验经济理论。计量经济

2、学：以经济统计数据为原始资料进行分析。5、计量经济学与数理统计数理统计：是计量经济学的基本工具，但由于经济数据的特殊性，力量经济学需要特殊的处理方法。,二、计量经济学的方法,基本过程：经济理论理论的数学模型理论的计量经济学模型数据的收集整理计量经济模型的参数估计假设检验预报和预测控制或政策制定,例：检验凯恩斯关于边际消费倾向理论，或利用该理论进行经济控制或经济政策制定。,理论人们的消费支出随收入的增加而增加，但消费支出的增加小于收入的增加。即边际消费倾向MPC大于零而小于1。（定性）建立数学模型假定消费支出Y与收入X之间有如下关系：,其中，Y为消费支出，X为收入，a和b为模

3、型参数。B就是MPC。这里Y为因变量，X为自变量/解释变量。假定两者之间存在先行关系。（在不同情况下，数学模型的形式不一样，也可能是多个方程连立，有多个解释变量）,建立计量经济学模型由于经济变量之间的关系不是确定的（以函数形式准确表达），必须修改数理模型，建立计量模型：,u为误差项，代表了影响变量间非确定关系的其他因素的影响。这是一个线性回归模型。,O,X,Y,斜率为b,数理模型,O,X,Y,斜率为b,计量模型,a,a,数据的收集整理如果1980分析一国的消费情况，要收集该国的总消费支出数据和总收入数据。,(选择、加工）,美国1980-1991年个人消费支出与GDP(10亿美元,1987年

4、不变价格),计量经济模型的参数估计采用回归技术，利用统计数据估计出参数a和b的经验值。,根据估计结果，美国1980-1991年的MPC约为0.72。假设检验以一定的标准，对参数的估计结果进行检验。如果在统计意义上，b小于1，说明结果是可接受的。,预报和预测如果计量模型可以接受，就可用来对因变量进行预测。假定1994年，美国的GDP预计为6万亿美元，则该年的消费支出预计为,控制或政策制定如果希望1994年的消费支出达到4万亿美元，则政府必须通过政策来保证收入水平为：,三、计量经济学的内容,可分为理论和应用两大类。,理论计量经济学：研究适当的方法，来测度有计量经济模型设定的经济关系式。,应

5、用计量经济学：以理论计量经济学为工具，研究经济学或商业中的各领域。,四、计量经济学的应用软件包,有很多种。常用的有：TSP、SPSS、SAS等。,第一章回归分析,一、回归分析分析因变量与解释变量之间的统计依赖关系，目的在于通过后者的已知或设定值去估计或预测前者的均值。假定一个国家的所有家庭的收入（X）和消费支出（Y）统计如下，希望知道家庭消费支出与家庭收入之间的关系：Y=F（X）。,根据每个家庭的收入和支出绘出散点图，大致可看出二者间的关系：在统计意义上，二者成正比。,由对全体居民的收入和支出的调查结果，我们知道处于不同收入阶层的居民有一个平均的支出水平，这一支出水平与收入大致呈线性关系。

6、,图中的这条通过各收入阶层平均支出额的直线，描述了这一依赖关系。我们把这条线称为回归线。,二、统计关系与确定关系在回归分析中，得到因变量与自变量之间的依赖关系是统计依赖关系，而不是确定关系或函数关系。三、回归与因果关系回归分析得到的变量间的统计依赖关系，统计关系式自身不代表任何确定的因果关系。四、计量经济分析使用的数据有三类。（1）时间序列数据。一个时间序列是对一个变量在不同时间取的一组观测结果。这些数据可以按固定的时间间隔收集。收集的数据可以是定量的，也可以是定性的（虚拟变量）。中国1993年1998年的GDP增长率（%）,（2）横截面数据。一个或多个变量在同一时点上收集的数据。199

7、2年实际GDP增长,（3）混合数据。,第二章双变量回归分析,第一节经典正态线性回归模型（CNLRM）,一、基本概念以下表为例。,1、几个概念条件分布（Conditional distribution）：以X取定值为条件的Y的条件分布条件概率（Conditional probability）：给定X的Y的概率，记为P(Y|X)。例如，P(Y=55|X=80)=1/5；P（Y=150|X=260）=1/7。(表)条件期望（conditional Expectation）：给定X的Y的期望值，记为E(Y|X)。例如，E(Y|X=80)=551/5601/5651/5701/5751/565总体

8、回归曲线（Popular Regression Curve）（总体回归曲线的几何意义）：当解释变量给定值时因变量的条件期望值的轨迹。2、总体回归函数（Popular Regression Function，PRFE(Y|Xi)=f(Xi)当PRF的函数形式为线性函数，则有，E(Y|Xi)=1+2Xi其中1和2为未知而固定的参数，称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。3、“线性”的含义“线性”可作两种解释：对变量为线性，对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归（即参数只以它的1次方出现）。,4、PRF的随机设定将个别的Yi围绕其期望

9、值的离差(Deviation)表述如下：ui=Yi-E(Y|Xi)或 Yi=E(Y|Xi)+ui其中ui为随机误差项（Stochastic error）或随机干扰项（Stochastic disturbance）。线性总体回归函数：PRF：Yi=1+2Xi+ui=E(Y|Xi)+ui5、随机干扰项的意义随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是：为什么不把这些变量明显地引进到模型中来，而以随即扰动项来替代？理由是多方面的：（1）理论的含糊性：理论不能完全说明影响因变量的所有影响因素。（2）数据的欠缺：无法获得有关数据。（3）核心变量与周边变量：希望能找到

10、与有较大影响的核心变量的关系。（4）内在随机性：因变量具有内在的随机性。（5）替代变量：用来代替不可观测变量的替代变量选择，造成一定误差。（6）省略原则：研究中尽可能使回归式简单。（7）错误的函数形式：回归式的的选择是主观的。,6、样本回归函数（SRF）由于在大多数情况下，我们只知道变量值得一个样本，要用样本信息的基础上估计PRF。(表）,样本1,样本2,样本回归函数SRF：,在回归分析中，我们用SRF估计PRF。,估计量（Estimator）：一个估计量又称统计量(statistic)，是指一个规则、公式或方法，以用来根据已知的样本所提供的信息去估计总体参数。在应用中，由估计量算出的数值称为

12、|Xi)uj-E(uj|Xj)=E(ui|Xi)(uj|Xj)=0假定6：ui和Xi的协方差为零。即Cov(ui,Xi)=Eui E(ui)Xi E(Xi)=Eui(Xi E(Xi)=E(ui Xi)E(ui)E(Xi）=E(ui Xi)=0假定7：观测次数必须大于待估计的参数个数。假定8：解释变量X的只要有变异性。即一个样本中，Xi不能完全相同。假定9：模型没有设定误差。假定10：没有完全的多重共线性，即解释变量之间没有完全的线性关系。,第二节双变量回归模型：估计,一、普通最小二乘法（Ordinary Least Squares，OLS）基本思路：用样本回归函数估计总体回归函数。以,估计,

13、时，真实值,求解这一最小化问题，根据最大化的一阶条件：,可得到以下正规方程（Normal equation）：,二、参数的估计（点估计）：OLS估计量 1、解上述正规方程组得到估计值：,解出,，可得到估计值。,称为最小二乘估计量（OLS估计）。,2、OLS样本回归线的性质：,三、2 的估计真实方差的估计量：,四、OLS估计的精度或标准误差由于OLS估计是根据一个样本得到的，需要检验估计量的可靠性（reliability)或精密度。在统计学中，一个估计量的精密度由它的标准误（standard error,se)来衡量。,五、OLS 统计量的性质：高斯-马尔柯夫定理在CLRM假定下，在所有线

14、性无偏估计量中，OLS估计量有最小方差，即OLS是BLUE（Best Linear Unbiased Estimator）。,（1）线性：,为Yi的线性函数,（2）无偏性：,为,的无偏估计量。,（3）最小方差性：OLS估计量,在所有线性无偏估计量中，具有最小方差。即,可以证明OLS估计量具有最小方差。,第三节拟合优度检验,拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2。基本思路：因变量Y的变异，能够被X的变异解释的比例越大，则OLS回归线对总体的解释程度就越好。,Xi X,PRF,SRF,Y,总平方和（TSS）：实测的Y值围绕其均值的总变异：,定

15、义判定系数R2：,估计的Y值围绕其均值的总变异,未被解释的围绕回归线的Y值的变异,R2 测度了在Y的总变异中，由回归模型解释的部分所占的比例。R2 越高，回归模型拟合的程度就越好。R2 的性质：（1）非负。（2）0R2 1其它表达方式：,判定系数与相关系数的关系：相关系数：表示两个随机变量之间的相关程度。定义为：,以样本方差和样本协方差估计X、Y的方差和协方差，样本相关系数为：,样本相关系数的平方与判定系数相等，但二者的意义不同。,第四节区间估计,为了判断点估计与真值的接近程度，可以通过构造以估计值为中心的一个区间（随机的），以该区间包括了真值的概率来确定估计值接近真值的把握程度：,一、的置

16、信区间,由于未知，以其估计值代替，,给定置信系数100（1-）%，随机的置信区间将有100（1-）%包含真值2。,二、的置信区间,三、的置信区间,第五节 OLS估计量的显著性检验,根据样本回归得到的总体参数的估计量，随着选取样本的不同观测值而不同；给定样本观测值时，得到的参数也与总体参数的真值不同。因此，必须对估计的参数值是否显著成立，做统计检验，即显著性检验。,一、的显著性检验,原假设 H0：2=0备择假设 H1：2 0,如果有理由认为2不能小于零（不能大于零），则在,2倍t法则,二、的显著性检验,原假设 H0：1=0备择假设 H1：1 0,三、回归方程的的显著性检验：F 检验从方差分析（

17、analysis of variance,ANOVA)的角度，检验回归方程的显著性。根据总离查平方和的分解式：TSS=ESS+RSS，,总离差（TSS)的自由度为(n-1)，回归平方和（ESS)的自由度为1，残差平方和（RSS)的自由度为（n-2)。定义均方差=平方和/自由度，方差分析表（ANOVA/AOV表)为：,双变量回归模型ANOVA表,样本决定系数 R2 能够说明样本的拟和优度。但是我们还需要对总体做出推断，检验总体的线性是否成立。思路：若ESS/RSS 比较大，则X对Y的解释程度就比较高，可以推测总体存在线性。但是ESS/RSS 样本不同而不同，对于给定的样本，利用ESS/RSS 对

18、总体进行推断，必须进行统计检验。,原假设 H0：2=0备择假设 H1：2 0,若H0成立，说明回归方程无显著意义，总体不存在线性；若拒绝H0，则可认为回归方程显著成立，总体存在线性。因此，定义统计量,第六节利用回归方程预测,根据经济理论建立线性回归模型，并利用统计资料对模型参数进行了估计，建立了回归方程。经过显著性检验，判定回归方程能正确反映经济现象时，一个重要目标就是利用回归方程进行预测。,一、均值预测,已知X的一个特定值X0，要预测Y0的条件均值（总体回归线上的对应Y值）E(Y|X0)，,显然，当X0越接近X 的均值，区间就变得越狭窄。,二、个值预测预测给定X的值X0，对应的Y0，仍为

19、BLUE)。,小结：双变量线性回归分析的主要步骤,1、建立回归模型研究某一经济现象，先根据经济理论，选择具有因果关系的两个变量（Y，X)，建立线性回归模型，确定解释变量和被解释变量。如果不明确两个变量是否为线性关系，也可以根据散点图来分析。建立回归模型可以是根据经济理论，也可以根据相同或相似经济现象的历史分析经验来建立回归模型。建立模型时，不仅要考虑理论或经验的依据，同时也要考虑数据的可利用程度。2、收集数据，并经过适当的加工整理，得到适于回归分析的样本数据集。3、估计模型参数。利用样本数据，以OLS得到模型参数的估计值。4、对回归模型和参数估计值进行检验。检验回归结果是否正确反映经济现象，

20、是否与理论相符。包括理论检验和统计检验。经济理论检验：参数的符号，大小是否与理论和实际相符。若不符，寻找原因（数据？模型设定？理论错误？）统计检验：拟和优度检验，估计量、回归方程的显著性检验。,5、预测对于解释变量的特定值，带入回归方程得到因变量的预测值；在给定的置信水平上，得到因变量预测值的置信区间。6、回归结果的表述：,并说明参数的显著水平（）。,以回归分析为工具的实证分析文章的结构,一、研究的来源和基础对研究的经济现象的描述；研究该现象的意义；相同或相似的代表性研究的方法、结论，并作总结评价；本研究的出发点；文章的结构介绍。二、理论分析选择合适的经济理论，利用理论对要研究的经济想象

21、做定性分析，得到大致的结果；建立理论模型。三、建立回归模型根据理论模型，建立合理、可分析的回归模型。回归模型的形式、解释变量的个数和选择，不一定与数理模型完全相同。四、对所使用的数据做出说明数据的来源；数据加工的原因和处理方式；替代数据的说明等。五、回归结果及对结果的分析列出回归的结果（包括参数的估计值和统计检验结果）；结合理论分析回归结果六、结论/总结/应用,第三章多变量回归分析,第一节多变量线性回归模型一、多变量线性回归模型的PRF 如果假定对因变量Y 有k-1个解释变量：X2，X3，Xk，k 变量总体回归函数为：,其中1为常数项，2 2 为解释变量X2 Xk 的系数，u为随机干

22、扰项。总体回归函数PRF给出的是给定解释变量X2 Xk 的值时，Y的期望值：E(Y|X2，X3，Xk)。假定有n组观测值，则可写成矩阵形式：,二、多变量线性回归模型的基本假定,随机干扰项的期望值为0。,同方差性；无序列相关。,无多重共线性，即Xi(i=2,3,k)之间不存在线性关系：,随机干扰项服从正态分布。,三、多变量线性回归模型的SRF,根据残差的平方和最小化的原理，解出参数的估计量。,第二节多变量回归模型的OLS估计,一、参数估计,可得到如下正规方程组：,如果直接用矩阵微分，则,二、的估计量,三、的方差-协方差矩阵,四、OLS估计量的性质：,第三节拟合优度检验：一、判定系数R2

23、：,方差分析表（ANOVA),二、校正的R2：由R2的计算式可看出，R2 随解释变量的增加而可能提高（不可能降低）：,与解释变量X的个数无关，而则可能随着解释变量的增加而减少（至少不会下降），因而，不同的SRF，得到的R2 就可能不同。必须消除这种因素，使R2 即能说明被解释的离差与总离差之间的关系，又能说明自由度的数目。定义校正的样本决定系数：,三、R2 与的性质,第四节显著性检验一、单参数的显著性检验：,如果接受H0，则变量Xi 对因变量没有影响，而接受H1，则说明变量Xi 对因变量有显著影响。,检验的显著性，即在一定显著水平下，是否显著不为0。,检验步骤：,如果根据理论或常识，

24、非负，则可做单侧检验，比较 t 与t。,二、回归的总显著性检验：检验回归系数全部为零的可能性。,方差分析表（ANOVA),显然，R2 越大，F越大，当R2=1时，F无限大。,选择显著水平，计算F统计量的值，与F分布表中的临界值进行比较：,第五节解释变量的选择在回归模型中的解释变量，除非由明确的理论指导或其他原因，在选择上具有一定的主观性，如何正确选择解释变量是非常重要的。一、解释变量的边际贡献分析在建立回归模型时，假定我们顺序引入变量。在建立了Y与X2的回归模型，并进行回归分析后，再加入X2。考虑加入的变量X2是否有贡献：能否再加入后显著提高回归的解释程度ESS或决定系数R2。ESS提高

25、的量称为变量X2的边际贡献。决定一个变量是否引入回归模型，就要先研究它的边际贡献，以正确地建立模型。如果变量的边际贡献较小，说明改变量没有必要加入模型。分析变量的编辑贡献，可以使用方差分析表为工具，根据变量引入前、后的RSS的变化量及其显著性检验（扣除原来引入模型的解释变量的贡献），确定该变量的边际贡献是否显著。一个简单的检验方法，就是对引入新变量后的RSS增量与新的ESS的比值做显著性检验。,可以利用方差分析表来进行分析。设ESS为引入变量前的回归平方和，ESS 为引入m个新变量后，得到的回归平方和，RSS为引入变量后的残差平方和。ANOVA表如下：,在新引入变量的系数为0的原假设下，,把计

26、算出的该统计量的值与显著水平下的临界值进行比较：,引入的新变量的边际贡献显著，则应该把这些变量纳入回归模型，否则这些变量不应引入回归模型做解释变量。,二、逐步回归法如果根据理论，因变量Y与k-1个变量X2，X2，Xk 有因果关系，我们要建立的回归模型要在这些变量中选择正确的解释变量，要根据变量的边际贡献大小，把贡献大的变量纳入回归模型。分析边际贡献并选择变量的过程，实际上是一个逐步回归的过程。首先，分别建立Y与k-1个变量X2，X2，Xk 的回归模型：,回归后，得到各回归方程的平方和,选择其中ESS最大并通过F检验的变量作为首选解释变量，假定是X2。此时可确定一个基本的回归方程：在此基础上

27、进行第二次回归，在剩下的变量中寻找最佳的变量：建立k 2 个回归方程：,回归后，得到各回归方程的平方和：,同样，选择其中ESS最大并通过F检验的变量作为新增解释变量，假定是X3。此时可确定一个基本的回归方程：,重复这一过程，直到所有变量中，边际贡献显著的变量全部引入回归模型中为止，得到最终的回归式：,也可以采用逐步减少边际贡献不显著的变量的方式，逐步回归确定回归模型包括的变量，方法一样。,第六节利用多元回归模型进行预测,对于多元回归模型：,通过回归分析，得到回归方程,后，就可根据给定的解释变量的一组值X0=(1,X20，X30，Xk0)，对因变量Y的值进行估计。,一、个值预测,为Y0及的预测值。,二、区间预测,

展开阅读全文