关于模型回归及STATA运算报告的一些总结及疑问.docx

上传人:牧羊曲112 文档编号:3309743 上传时间:2023-03-12 格式:DOCX 页数:4 大小:38.64KB
返回 下载 相关 举报
关于模型回归及STATA运算报告的一些总结及疑问.docx_第1页
第1页 / 共4页
关于模型回归及STATA运算报告的一些总结及疑问.docx_第2页
第2页 / 共4页
关于模型回归及STATA运算报告的一些总结及疑问.docx_第3页
第3页 / 共4页
关于模型回归及STATA运算报告的一些总结及疑问.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《关于模型回归及STATA运算报告的一些总结及疑问.docx》由会员分享,可在线阅读,更多相关《关于模型回归及STATA运算报告的一些总结及疑问.docx(4页珍藏版)》请在三一办公上搜索。

1、关于模型回归及STATA运算报告的一些总结及疑问注:上面这些是本人经过运算验证和网络收集而整理的,不具权威性,有错误希望有人能指出,共同学习、改进。用蓝色标注的部分尚有疑问,希望有人知道答案的话能回执给本人一下,其他未尽项目,也请帮忙总结,共同分享,不胜感谢! 于浩伟 一、区分标准误和标准差: Std.Err.:,也记为SEx ,=S/ 𝐧,它是样本平均数的标准差,亦称样本平均数的标准误或简称标准误,其中S为样本的标准差,是STATA对应每个系数右方给出的值,它反映了样本平均数的离散程度。标准误越小,说明样本平均数与总体平均数越接近,否则,表明样本平均数比较离散。 ҷ

2、84;称为标准差,Std.:Var(j),= 𝐧是总体方差的开平方,它不同于Sdx =/ n。 𝟏 𝐱𝛍 ,𝐧𝟏标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。标准误越小,那么抽样误差就越小,就表明所抽取的样本能够较好地代表样本。 Root MSE:在相同观测条件下的一组真误差平方中数的平方根。因真误差不易求得,所以通常用最小二乘法求得的观测值改正数来代替真误

3、差。它是观测值与真值偏差的平方和观测次数n比值的平方根。一般不用管这项。 二、一个例子: 打开数据bwght.DATA,并在命令栏中输入下列指令:reg faminc cigs fatheduc motheduc,就会得到如下结果报告: 对STATA运行结果报告中各项目的解释: SS是平方和,它所在列的三个数值分别为回归误差平方和、残差平方和及总体平方和,即分别为Model、Residual和Total相对应的数值。 df为自由度,它在数学中表示能够自由取值的变量个数,如有3个变量x、y、z,但若存在一个约束条件:x+y+z=18,则其自由度为2。在统计学中,自由度指的是计算某一统计量时,取值

4、不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量的个数,或计算某一统计量时用到其它独立统计量的个数。 MS为SS与df的比值,与SS对应,SS是平方和,MS是均方,是指单位自由度的平方和。 它跟SS一样,也是表述数据变动趋势的。一般不用管这一项。 Number of obs:样本数。 F(k, n):F统计量的数值,其中k为约束条件的个数,n=样本数-解释变量个数-1。通常,若无法拒绝原假设,F的值都比较小,接近于0。若可以拒绝原假设时,F检验的值都比较大,本例中F(k, n)=122,说明通过了F检验,即可以拒绝原假设,说明模型整体具有显著性。 注:在回归之后

5、F检验给出的默认值为针对全部解释变量的系数都为0的假设检验的F值,即为模型整体显著性的检验。要想单独检验解释变量X1、X2是否具有显著影响,还要手动输入指令“test X1 X2”或“test (X1=0)( X2=0)”。 Pro F:模型整体F检验所对应的P值。 R2,=SSE/SST,它表明的是模型的拟合优度,且有(1-R2)*SST=SSR。 Adj R-square:根据样本数量和自由度调整后的样本R-Square,考虑了自变量数目的影响,一般也不用管一项。 Root MSE:见一中有关解释。 根据t检验的公式,t= 𝐣𝐚𝐣)(

6、0515; j是而在上面的结果报告中, 𝐣),𝐬𝐞(𝛃coef对应解释变量的系数, j)就是std.Err.对应的数值,两者相除,就得到t检验的数值,也报告中给出的t值,而se(与之对应的概率P|t|;当P时,则可以拒绝原假设,认为模型通过t检验,即认为所检验的变量对模型是有显著影响的。 三、回归模型常见问题及可能的解决方法 自相关:即E(ui|uj) 0,它指模型的误差项之间存在相关性。处理方法为寻找遗漏的显著的解释变量、尝试其它函数形式、差分法、自回归法、移动平均法等。 内生性:即E(u|x) 0,通常指两个或多个变量之间具有相互决定的作用。这里多指模型的随机扰动项与解释变量之间存在相关关系。引起内生性的原因为测量误差或遗漏的某些变量。处理方法是寻找可能遗漏的变量。 注:任何两变量之间在多数情况下都不是单方面的决定作用,而是相互决定的作用。包括解释变量与因变量之间、解释变量之间,以及解释变量与随机扰动项之间,都可能具有内生性。解释变量与随机扰动项之间具有内生性,称为?;解释变量之间具有内生性,又称为具有多重共线性;解释变量与因变量之间具有内生性,又称为?。 异方差:即ei2ej2,它指随机扰动项的方差不相同,因而无法估计参数的方差。 序列相关:常见于时间序列数据,即自相关?。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号