Eviews的logistic回归分析.ppt

资源描述

《Eviews的logistic回归分析.ppt》由会员分享，可在线阅读，更多相关《Eviews的logistic回归分析.ppt（43页珍藏版）》请在三一办公上搜索。

1、第10章离散因变量和受限因变量模型重点内容：二元选择模型的建立排序选择模型的建立审查回归模型的建立计数模型的建立,一、二元选择模型1.二元选择模型的形式,假设有一个变量yt，它与解释变量xt之间存在线性关系，即yt=1x1t+2x2t+kxkt+t（t=1，2，n）yt与yt之间的关系为 1，当yt0时 yt=0，当yt0时,一、二元选择模型1.二元选择模型的形式,P(yt=1|xt,)=P（yt 0）=P(t-xt)=1-F(-xt)(1-1)P(yt=0|xt,)=P（yt0）=P(t-xt)=F(-xt)(1-2)式1-2中，F为t的连续分布函数，因而将原始的回归模型变成如下形

2、式，yt=1-F(-xt)+t,一、二元选择模型1.二元选择模型的形式,二元选择模型的类型是由分布函数的类型决定，常用的二元选择模型有三种，如下表所示。,一、二元选择模型2.二元选择模型的建立,二元选择模型一般用迭代法求极大似然函数的最大值（线性概率（Tobit）模型除外），由于在模型中因变量的取值只能是1和0，因而估计系数不能解释成解释变量对被解释变量（因变量）的边际影响，但可以从符号上进行分析。当估计系数为正时，表明解释变量越大，被解释变量取值为1的概率越大；当估计系数为负时，表明解释变量越大，被解释变量取值为0的概率越大。,一、二元选择模型2.二元选择模型的建立,在EViews软件的操作

3、中，要建立二元选择模型，需首先选择主菜单栏中的“Object”|“New Object”|“Equation”选项，或者选择“Quick”|“Estimate Equation”选项，打开方程设定对话框，选择“Specification”选项卡。在“Method”的下拉菜单中选择“BINARY Binary choice（logit,probit,extreme value）”估计方法。,一、二元选择模型2.二元选择模型的建立,在“Equation specification”中列出被解释变量、常数项和解释变量。（二元选择模型的估计只能以列表形式将方程中的变量列出，不能输入公式的形式。）在“B

4、inary estimation”中有三个选项，分别是“Probit”、“Logit”、“Extreme value”，用户需选中三种估计方法中的一种。,一、二元选择模型2.二元选择模型的建立,在“Options”选项卡中，可以设置估计算法和迭代限制。,一、二元选择模型2.二元选择模型的建立,Robust Covariances”（稳健标准差）有两个选项:“Huber/White”为用准极大似然函数方法估计标准差，“GLM”为用广义线性模型方法估计标准差。,一、二元选择模型2.二元选择模型的建立,“Optimization algorithm”为“最优化算法”，包括三个运算法则：“Quadra

5、tic Hill Climbing”法则是用对数似然分析二次导数的矩阵；“Newton-Raphson”使用二次导数;“BHHH”使用一次导数来确定迭代更新和协方差矩阵估计。,一、二元选择模型2.二元选择模型的建立,“在“Starting coefficient”中可以指定初始值:“.8 EViews”、“.5 EViews”、“.3 EViews”分别为使用默认值的80%、50%、30%作为初始值；“Zero”为零系数；“User Supplied”为由用户提高数值。,一、二元选择模型3.二元选择模型的分析,二元选择模型的回归结果分析包括：拟合优度检验异方差检验预测和产生残差序列,一、二元

6、选择模型3.二元选择模型的分析,二元选择模型的回归结果分析包括：拟合优度检验包括：H-L（Hosmer-Lemeshow）检验 Andrews检验检验中通过分组对拟合值和实际值进行比较，如果两者间的差别较大，就可断定模型的拟合效果不好；如果两者间的差别很小，就可认为模型的拟合效果较好。,一、二元选择模型3.二元选择模型的分析,二元选择模型的回归结果分析包括：拟合优度检验EViews软件操作中，在建立好的方程对象窗口下选择“View”|“Goodness-of-Fit Test（Hosmer-Lemeshow）”选项，将弹出拟合优度检验的对话框。,一、二元选择模型3.二元选择模型的分析,二元选

7、择模型的回归结果分析包括：拟合优度检验在“Group observations by”区域确定分组变量：当分组变量取值很多时选择“Quantiles”，当分组变量只取少许几个值，选择“Distinct values”。,一、二元选择模型3.二元选择模型的分析,二元选择模型的回归结果分析包括：预测在方程对象工具栏中选择“Proc”|“Forecast（Fitted Probability/Index）”选项，或者选择工具栏中的“Forecast”功能键，弹出预测对话框。,一、二元选择模型3.二元选择模型的分析,二元选择模型的回归结果分析包括：预测“Forecast equation”中输入待预测

8、的方程对象的名称;“Series to forecast”中选择要预测的对象，在默认情况下，预测对象是概率值；“Output”中可以选择输出形式；“Series names”中显示的是生成的预测名称。,一、二元选择模型3.二元选择模型的分析,二元选择模型的回归结果分析包括：产生残差序列通过选择方程工具栏中的“Proc”|“Make Residual Series”选项可以生成三种残差，分别是普通残差（Ordinary）、标准化残差（Standardized）和一般化残差（Generalized）。,二、排序选择模型1.排序选择模型的类型,常见的多元选择模型的类型主要有三种：（1）将供选择的对象

9、按某种标准进行排序，然后从中进行选择。（2）根据对可供选择对象的偏好程度进行分类。（3）在多重选择中没有顺序，决策者可以从中任意进行挑选。（1）、（2）属于排序选择问题。排序是指，在多种选择项中，有一定的顺序或级别。与一般多元选择模型不同的是，排序选择问题需要建立排序选择模型（Ordered Dependent Model）。,二、排序选择模型1.排序选择模型的类型,在排序选择模型中，同样要设定一个指标变量yt，设变量yt有0，1，2，m供m+1个取值种类。yt=1x1t+2x2t+kxkt+t（t=1，2，n）其中，t是独立同分布的随机变量，yt是可以用yt表示的，如下：0，当ytc1 1，

10、当c1 ytc2yt=2，当c2 ytc3 m，当cm yt 根据不同的分布函数F(x)，可以建立不同的模型，常见的有三种：Probit模型，Logit模型和Extreme Value模型。,二、排序选择模型2.排序选择模型的建立,选择主菜单栏中的“Object”|“New Object”|“Equation”选项，或者选择“Quick”|“Estimate Equation”选项，打开方程设定对话框，选择“Specification”选项卡。在“Method”的下拉菜单中选择“ORDERED Ordered choice”估计法。在“Equation Specification”中列出变量名

11、称，然后在“Normal”、“Logist”、“Extreme value”三种误差分布中选择一种。,二、排序选择模型3.排序选择模型的分析,排序选择模型的回归结果分析包括：过程预测产生残差序列,二、排序选择模型3.排序选择模型的分析,排序选择模型的回归结果分析包括：过程在方程对象窗口中选择“View”|“Dependent Variable Frequencies”选项，可对估计样本中的排序因变量计算出频率值，包括按实际值和百分比的频率表和累积频率。在方程对象窗口中选择“View”|“Expectation-Prediction Table”选项，可得到期望预测表。,二、排序选择模型3.排序

12、选择模型的分析,排序选择模型的回归结果分析包括：预测在方程对象工具栏中选择“Proc”|“Make Model”选项，将打开一个包含方程系统的没有标题的模型对象窗口，单击模型窗口工具栏中的“Solve”按钮，在弹出的对话框中选择系统默认值即可，然后单击“确定”按钮。在工作文件中将生成一些序列对象。,二、排序选择模型3.排序选择模型的分析,排序选择模型的回归结果分析包括：预测其中，因变量y的拟合线性指标xt 序列被命名为i_y_0，拟合值落在第一类中的拟合概率被命名为y_0_0的序列中，拟合值落在第二类中的拟合概率被命名为y_1_0的序列中，拟合值落在第三类中的拟合概率被命名为y_2_0的序列中

13、。对于每一个观察值，落在每个种类中的拟合概率之和为1。,二、排序选择模型3.排序选择模型的分析,排序选择模型的回归结果分析包括：产生残差序列选择方程工具栏中的“Proc”|“Make Residual Series”选项，在弹出的对话框中只有一个一般化残差（Generalized）可供选择，在“Name for resid series”中输入名称或按系统默认名称进行设定，然后单击“OK”按钮即可得到一般化残差序列。,三、受限因变量模型,受限因变量是指因变量的观测值是连续的，但不能完全反应总体的实际特征，受到某种限制，因而因变量的观测值是总体特征的一个受到限制的子集。用受限因变量建立的模型被

14、称为受限因变量模型（Limited Dependent Variable Model）。本节主要分析两类受限因变量模型：一类是审查回归模型，一类是截断回归模型。,三、受限因变量模型1、审查回归模型（Censored Regression Model）,考虑下面的指标变量回归模型，yt=1x1t+2x2t+kxkt+t 其中，为比例系数，可以用它表示出y的似然函数，并作为参数与一起被估计；y是指标变量。观测值y与指标变y量的关系可用如下公式表示，0，当yt0时yt=yt，当yt0时从上式可以看出，所有指标变量yt的负值都取0，称这些在0处进行了左截取，也被称为左审查（Left Censored

15、）。因而此模型被称为规范的审查回归模型，也称为Tobit模型。,三、受限因变量模型1、审查回归模型（Censored Regression Model）,有时，可以在任意有限点的左侧和右侧进行截取（审查），即 c t,当yt c t 时yt=yt,当c t yt t 时 t,当 t yt时其中，c t 和 t代表截取点，是常数。如果没有左截取点，可设c t=；如果没有右截取点，可设 t=。规范的Tobit模型是c t=0和 t=的一个特殊例子。,三、受限因变量模型2、审查回归模型的建立,在EViews软件的操作中，要建立排序选择模型，需首先选择主菜单栏中的“Object”|“New Objec

16、t”|“Equation”选项，或者选择“Quick”|“Estimate Equation”选项，打开方程设定对话框，选择“Specification”选项卡。在“Method”的下拉菜单中选择“CENSORED-Censored or truncated data（tobit）”估计法。在“Equation Specification”中列出变量名称，这里不能用公式形式书写方程，只能列出变量。在图审查回归模型设定对话框中的右侧有三种分布（Distribution）可供选择，分别是“Normal”、“Logistic”和“Extreme Value”，从中选择一种作为误差项的分布。,三、受限

17、因变量模型2、审查回归模型的建立,在EViews软件的操作中，要建立排序选择模型，需首先选择主菜单栏中的“Object”|“New Object”|“Equation”选项，或者选择“Quick”|“Estimate Equation”选项，打开方程设定对话框，选择“Specification”选项卡。在“Method”的下拉菜单中选择“CENSORED-Censored or truncated data（tobit）”估计法。在“Equation Specification”中列出变量名称，这里不能用公式形式书写方程，只能列出变量。在图审查回归模型设定对话框中的右侧有三种分布（Distri

18、bution）可供选择，分别是“Normal”、“Logistic”和“Extreme Value”，从中选择一种作为误差项的分布。,三、受限因变量模型2、审查回归模型的建立,“Dependent variable censoring points”区域提供了关于因变量的临界点的基本信息。临界点可以是数值（a number）、序列（a series）、表达式（a series expression）或者是空的（blank）。这里可以分为两种情况：（1）临界点对于所有的个体都是已知的情况（2）临界点只对于具有审查观察值的个体是已知的情况,三、受限因变量模型2、审查回归模型的建立,（1）临界点对于

19、所有的个体都是已知的情况在“Dependent variable censoring points”的左编辑栏（Left）和右编辑栏（Right）中输入临界点的表达式。如果编辑区域出现空白，EViews软件将假定该种类型的观测值没有被审查。在规范的Tobit模型中，左编辑栏（Left）输入0，右编辑栏（Right）为空。因而数据在0值左边审查，在0值右边不被审查。,三、受限因变量模型2、审查回归模型的建立,（2）临界点只对于具有审查观察值的个体是已知的情况假定临界点对于一些个体是未知的，此时可以通过设置0和1的虚拟变量来对数据进行审查。在“Left&Right points”中选中“Zero/

20、one indicator of censoring”命令，然后在编辑栏中输入临界点的指示变量。审查指示变量值为1的观察值需要进行审查处理，审查指示变量值为0的观察值不需进行审查。通过选择方程对象工具栏中的“Proc|Make Residual Series”选项，并从弹出的对话框三种类型的残差中选择一种，就可以得到审查回归模型的残差序列。,三、受限因变量模型3、截断回归模型,截断回归模型的建立方法与审查回归模型的相类似。首先选择主菜单栏中的“Quick”|“Estimate Equation”选项，打开方程设定对话框，在“Method”的下拉菜单中选择“CENSORED-Censored o

21、r truncated data（tobit）”估计法。在弹出对话框的“Equation Specification”中列出变量名称，选择一种误差项的分布形式。然后再选中“Truncated sample”复选框，即可对截断回归模型进行估计。,三、受限因变量模型3、截断回归模型,在EViews软件的操作中，截断估计只能对截断点已知的模型进行估计。如果用指标变量指定截断点，系统会给出错误信息的提示。如果因变量的某些值在截断点之外，系统同样会给出错误信息的提示。并且，软件会自动删除严格等于截断点的观察值。,四、计数模型,当因变量为计数变量，数值较小，取0的个数较多，并且解释变量多为定性变量时，应建

22、立计数模型。所谓的计数变量是指，因变量y表示的是事件发生的数量，是离散的整数。EViews软件提供了多种计数模型的估计方法，有泊松估计法，负二项极大似然估计法和拟极大似然估计法，其中，泊松估计法是比较常用的。,四、计数模型1、泊松模型,泊松模型（Poisson Model）中，每一个观测值yt都来自于参数为m(xt，)的泊松分布，m为指标变量，和自变量有关。当给定xt时，yt的条件密度服从泊松分布，即由泊松分布的特点，可得通过对数似然函数最大化可得到参数的估计值。如果条件均值分布能被正确的指定，并且y的条件分布是泊松分布，则得到的极大似然估计量是一致、有效的，且服从渐进正态分布。,四、计数模

23、型2、负二项式模型,负二项式（Negative Binomial）模型常用来替代泊松模型进行参数估计。负二项式分布的对数似然函数为和2是待估计的参数。当数据过度分散时，用负二项式分布，条件方差大于条件均值，其矩条件为E（yt|xt,）=m（xt,）var（yt|xt,）=m（xt,）1+2 m(xt,)从而，2能测量出条件方差超过条件均值的程度。,四、计数模型3、拟极大似然估计（QML）,拟极大似然估计（QML，Quasi-maximum Likelihood）是在一系列分布假定下实现的比较稳健的估计。当分布被假定错误时，例如因变量是泊松分布却被假定为负二项分布，也能产生一个被正确设定的条件均

24、值参数的一致估计。因而即使残差分布非正态分布，拟极大似然估计也是一致的。,四、计数模型4、计数模型的建立,首先选择主菜单栏中的“Object”|“New Object”|“Equation”选项，或者选择“Quick”|“Estimate Equation”选项，打开方程设定对话框，选择“Specification”选项卡。在“Method”的下拉菜单中选择“COUNT Integer count data”估计法后，将弹出下图所示的对话框。,四、计数模型4、计数模型的建立,在“Equation Specification”文本框中列出被解释变量和解释变量名称。在“Count estimation”中有五种计数模型的估计方法，分别对应的因变量分布是“Poisson（ML and QML）”（泊松分布），“Negative Binomial（ML）”（负二项分布），“Exponential（QML）”（指数分布），“Normal/NLS（QML）”（正态分布）和“Negative Binomial（QML）”（负二项分布）。,本章小结：了解二元选择模型、排序选择模型、审查回归模型、截断回归模型和计数模型的基本原理掌握上述模型的建立方法学会对回归方程进行预测和残差序列的分析,

展开阅读全文