多元线性回归模型检验及stata软件应用.ppt

上传人:小飞机 文档编号:5953588 上传时间:2023-09-08 格式:PPT 页数:48 大小:529.50KB
返回 下载 相关 举报
多元线性回归模型检验及stata软件应用.ppt_第1页
第1页 / 共48页
多元线性回归模型检验及stata软件应用.ppt_第2页
第2页 / 共48页
多元线性回归模型检验及stata软件应用.ppt_第3页
第3页 / 共48页
多元线性回归模型检验及stata软件应用.ppt_第4页
第4页 / 共48页
多元线性回归模型检验及stata软件应用.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《多元线性回归模型检验及stata软件应用.ppt》由会员分享,可在线阅读,更多相关《多元线性回归模型检验及stata软件应用.ppt(48页珍藏版)》请在三一办公上搜索。

1、第四章 多元线性回归模型检验,拟合优度检验方程的显著性检验(总参数的F检验)变量的显著性检验(单参数的t检验)构造置信区间,3.2 拟合优度检验,可决系数与调整的可决系数,由于,=0,所以有:,有意思的是:,条件:模型必须有截距项,2.可决系数,3.调整的可决系数,在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:,其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。,一、方程的显著性检验(F检验),方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成

2、立作出推断。,3.3 统计推断,F检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS,如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。,根据数理统计学中的知识,在原假设H0成立的条件下,统计量,2.检验统计量,p 值检验法,为了方便起见,将F统计量的值记为F0计算 pPF F0称为p 值(pvalue)如果p,则p/2/2,F0落入不能拒绝域,不能拒绝H0,如果p,落入拒绝域,应拒绝H0。准则:当P 值小于显著性水平时,方程在给定显著性水平下是显著的当P 值大于显著性水平时,方程在给

3、定显著性水平下是不显著的。,3.关于拟合优度检验与方程显著性检验的关系,二、变量的显著性检验(t检验),2.检验统计量,(2)t检验统计量,P值检验法(pvalue test),p 值的概念:为了方便,将 t 统计量的值记为 计算 pPtt 0称为p 值(pvalue)通常的计量经济学软件都可自动计算出p 值,如果p,则p/2/2,t0落入拒绝域,应拒绝H0,当P 值小于等于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是显著的;当P 值大于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是不显著的。,4.两类错误,H0 真 H0 伪不拒 H0 对 取

4、伪拒 H0 拒真 对,:拒真。把不应该引入的变量引入模型,导致多列无关变量,造成虽然参数估计值是无偏,但标准差会大。若不想犯第一类错误,则显著水平需要定得小点。,:取伪。把该引入的变量没有引入模型 遗漏变量 造成参数估计量有偏。,三、参数的置信区间,2.的置信区间,对称区间,中心是bk,半径是,如何才能缩小置信区间?,增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。提高样本观测值的分散度,一般情况下,样本观测值越分散,的

5、分母的 的值越大,致使区间缩小。,F值,R2,P值,调整的R2,T 值,p 值,置信区间,系数,回归平方和,残差平方和,总平方和,标准差,Stata 操作,命令行格式:最常用的方法use“d:dataauto.dta”,clear/*打开数据库*/regress y x1 x2 x3菜单格式:Stata8以后开始有菜单选择菜单进行操作后,在命令栏里可以看到命令行格式是如何写的。,Stata 操作,读取数据,用use命令调入数据:dta格式数据use“d:statadataauto.dta”,clear Excel格式数据的读取直接拷贝,粘贴到stata中使用Stat transfer把其它格式

6、的数据转成stata格式的数据读入ASCII格式数据文件:比较麻烦,常见数据格式,Stata 格式:dta文本格式:txtExcel格式:xls其它格式:sas、spss、gauss等,Stata的主要功能,数据管理:data management 统计功能:statistics作图功能:graphics矩阵运算:matrix 程序设计:programming,数据管理,作图功能,统计功能,数据管理,数据读取编辑数据产生或改变变量:gen,egen,保存数据库合并和添加数据:merge,append数据集的重新组织:reshape,调用数据库程序讲解(E:panel),调用数据库程序讲解(E:

7、zhy-apple),相同的变量上下连接,按关键变量横向连接,产生或改变变量,genreplace egen(对gen的扩展,与一些函数结合使用,如mean,count,min,max 等)产生虚拟变量tabulate vid,gen(vdummy)Xi:reg y x1 x2 i.vid 变量的命名:性别:gender 1=female,0=male 不好 female 1=female,0=male,调用数据库程序讲解(E:panel),产生变量,bysort hhid:gen order=_nbysort hhid:gen number=_N _n:是产生排序的数列_N:产生总数,调用数

8、据库程序讲解(E:panel),给数据或变量加注释,Label data“Investment:cfliu 2006”label variable v1 county“label define 与 label values 是一起使用的。而label variable 是单独使用的。另外,比如 有个变量 gender 的值 为 0和1,1表示male 0 表示female。你如果用table gender x1,会发现是按照 0 1来显示分类的。你如果用了.label define gendervalue 0 female 1 male.label values gender genderva

9、lue 在执行table gender x1,则是按照female 和 male来分类的。但 gender 还是原来的变量类型,如原来是数值型,现在还是。虽然list sex 显示为female male,但仍然可以按照 0或1来操作.,调用数据库程序讲解(E:zhy-apple),数据集的重新组织,reshapecollapse,collapse(mean)c,by(t),调用数据库程序讲解(E:panel),The long-long form,The wide-year long-sex form,The wide-wide form,The long-year wide-sex for

10、m,Reshape命令详细解释:包括矩阵转置等,Reshape命令,*From long-long form to long-wide form reshape wide inc,i(hid year)j(sex)string*From long-wide form to long-long form reshape long inc,i(hid year)j(sex)string*From long-long form to wide-long form reshape wide inc,i(hid sex)j(year)*From wide-long form to long-long f

11、orm reshape long inc,i(hid sex)j(year)*From long-wide form to wide-wide form reshape wide minc finc,i(hid)j(year)*From wide-wide form to long-wide form reshape long minc finc,i(hid)j(year)*From wide-long form to wide-wide form reshape wide inc90 inc91,i(hid)j(sex)string*From wide-wide form to wide-l

12、ong form reshape long inc90 inc92,i(hid)j(sex)string:如果变量为字符型,如sex的值为f和m,要把inc变量生成finc和minc,则需要用。,Collapse 命令,产生新的数据集collapse(统计量)变量,by(变量)collapse(mean)price,by(foreign)collapse(mean)mprice=price(sum)sprice=price,by(foreign)table foreign,c(mean price sum price)replace,统计功能,描述统计交叉表格估计,描述统计,Sum xHist

13、ogram,twoway(histogram c,title(消费分析)xlabel(1000(500)6000)bfcolor(gs5)scatter c ytwoway(scatter c y)(qfit c y)twoway(scatter c y)(lfit c y),调用数据库程序讲解(E:panel),作图,表格,Table 可以作四维表格table foreign,c(n price mean price sd price max price min price)rowtable year region gender,c(mean price sd price max price

14、 min price)by(agegroup)rowTabulatetabulate vid,gen(vidumy)tabulate vid gender,table year if(vcode=vcode_n+1|vcode=vcode_n-1)&vcow=0,c(n vcode),do 文件的编写,编写do文件的作用记录你的操作过程减少命令的输入do 文件的编写Stata 中的do file编辑器其它的软件:Textpad,其它一些常用命令,cleardropkeepsumdeslistIf 条件 bysort 变量outreg ereturn list,Outreg 生成像杂志那样的表格

15、,Outreg using 文件名,coefastr p bdec(2)3aster replaceOutreg using 文件名,coefastr se 3aster appendbdec(2):留两位数Coefastr:给系数加星号P:系数下面标P值Se:系数下面标标准误差3aster:加3个星号,1,5,10。,outreg using table1,coefastr p bdec(2)3aster replace,outreg using table1,se bdec(2)3aster replace,ereturn,use d:statadataauto.dta,clearreg

16、mpg price foreignereturn list,产生滞后变量,gen xlagx _n-1bysort code:gen xlagx _n-1,滞后1 期:,滞后2 期:,gen xlag2x _n-2,bysort code:gen xlag2x _n-2,发现重复的ID号和变量,sort idlist if id=id_n+1bysort id score x1 x2 y1 y2:gen n=_NList if n1Duplicates report(variable name)Duplicates list(variable name)Count if id=id_n+1,检查缺失值,nmissing 变量 if npresent 变量 ifnpresent x1 x2 if y=.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号