高级统计学ppt课件.ppt_三一办公31ppt.com

资源描述

《高级统计学ppt课件.ppt》由会员分享，可在线阅读，更多相关《高级统计学ppt课件.ppt（120页珍藏版）》请在三一办公上搜索。

1、高级统计学,哈尔滨工业大学管理学院葛虹,高级统计学研究的对象,多指标或多变量数据企业管理：产值、单位成本、原材料消耗、工资、劳动生产率、销售收入、利润、全要素生产率居民家庭消费：家庭收入、家庭人口、阶层、中高档消费品支出等等,必备知识,概率论与数理统计统计学点估计区间估计假设检验,研究内容,简化数据结构（Data Reduction）,箱式数据,平面数据,变换,主成分分析Principle Analysis,因子分析FactorAnalysis,按观测点分类或按变量分组分类比较是一切科学比较的基础和开端对观测点分类:银行发放贷款对各企业财务指标、信用状况进行分析对变量分组:股

2、票市场是宏观经济的晴雨表经济指标与股票市场各种指标间的群组关系,聚类分析,判别分析,Cluster Analysis,Discriminant Analysis,变量间的依存关系+关系的强弱分析寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律：预测、控制,内容提要,教学内容结构,回归分析,One,Two,Three,定性数据建模,聚类分析,判别分析,主成分分析,因子分析,高级统计学,结构方程,预测,回归分析,定性数据建模,分类,聚类分析,判别分析,判别,主成分分析,因子分析,结构方程,关联性分析,综合评价,统计学方法的应用以及内容之间的逻辑关系,应用范围,教学内容,参考书,多

3、元统计分析(第二版) 何晓群编著中国人民大学出版社应用统计陆璇编著清华大学出版社,高级统计学评分,预备知识,随机向量及其分布,随机向量的数字特征,随机向量的样本及其数字特征,多元正态分布,随机向量及其分布,P维随机向量: 联合分布函数: 联合密度函数:,随机向量的数字特征,随机向量的数学期望随机向量的方差阵,随机向量的相关系数阵,随机向量的样本及其数字特征,P维随机向量的一个容量为n的样本：,的样本,的样本,的样本,样本均值,样本离差阵与样本方差阵,样本离差阵,样本方差阵,样本相关系数阵,与的样本相关系数,相关系数阵计算的SPSS实现,多元正态分布,定义1 q维标准正态分布设独立

4、同分布于 ,则称随机向量服从q 维正态分布,记 Y密度函数:,定义2 p 维一般正态分布设，B为实数矩阵，为维实数向量，则是维正态随机向量，记为：其中为非负定阵。,定理 1 若服从，则（1），（2）密度函数：定理2 与分别是和的无偏估计，即,回归分析,回归模型的诊断以及SPSS实现,2,多元回归模型的诊断以及SPSS实现,5,为什么要建立线性模型,一般函数线性化,特殊函数线性化,简单易分析,相关性=线性性,线性模型,一元回归的SPSS实现,观察散点图 Graphs Scatter,点击1,点击2,点击1,点击2,点击3,点击4,点击,执行回归过程 Analy

5、ze Regression Linear,点击1,点击2,点击3,点击4,点击5,点击1,点击2,点击3,点击1,点击5,点击2,点击3,点击4,点击6,点击,点击2,可选,点击1,越靠近1越好,越小越好,模型检验部分,0.05=回归方程显著,0.05=回归系数显著,基本满足正态性假设,模型诊断部分,基本满足独立同分布假设,一元回归模型的建立,观察由n个样本构成的散点图或计算样本相关系数，若呈现明显的相关性，建立数学模型其中是未知参数,需要利用样本对它们进行估计.,散点图（1）,参数的最小二乘估计（1）,模型1 最小二乘解：,矩阵偏导数与样本矩阵表达,模型2 最小二乘解：（1）为y关

6、于x的回归方程（2）称为方程的回归系数( )（3）称为残差，为残差向量（4）称为残差平方和,参数的最小二乘估计（2）,散点图（2）,与的性质,性质1 , 性质2 ，且即的无偏估计是性质3 与相互独立,性质4 若，则于是的置信区间是：,的样本标准差,一元回归模型的显著性,决定系数法 R Square + Adjusted-R Square回归方程的显著性检验方差分析 = F-检验,决定系数法,总平方和分解决定系数,总平方和,回归平方和,残差平方和,df = n-1,df = n-2,df = 1,方差分析法(回归方程的显著性检验),零假设检验统计量,含义？,拒绝域(

7、临界值法)：,回归方程显著,P值法：,P0.05回归方程显著,方差分析表（ANOVA）,Analysis of Variance,回归系数的显著性检验（1）,零假设检验统计量,含义？,拒绝域（临界值法）,常数项显著,P值法,P0.05回归系数显著,回归系数的显著性检验（2）,零假设检验统计量,一元回归模型的诊断,前提假设,等方差性,独立性,正态性,误差的估计,残差与残差图,残差图(独立、等方差),残差图,残差不独立,异方差,检验的正态性（Q-Q图）,的,分位数,理论分位数,样本分位数,Q-Q图(Quantile-Quantile Plot),回归分析过程,经济管理模型,模型线性化,模型中的参

8、数估计,模型与参数的显著性检验,回归模型的诊断,利用模型解释经济管理现象,模型问题,数据问题,估计方法问题,最小二乘法,决定系数 F 检验 t 检验,残差图 P-P图,多元回归模型的建立,模型基本形式：样本表达：矩阵表达：,参数和的估计,参数的最小二乘估计是参数的无偏估计是其中是残差平方和,与的性质,性质1 性质2 即是的无偏估计性质3 与相互独立,性质4 若，则于是的置信区间是：,的第i+1个对角元,性质5 若（1）（2）且与相互独立（3） ,多元回归模型显著性检验（1）,决定系数法方差分析法零假设：检验统计量与其分布： ,含义？,回归系数的显著性

9、检验（2）,零假设检验统计量与其分布：其中是的第j+1个对角元,含义？,多重共线性,什么是多重共线性 p个自变量在某种程度上是线性相关的多重共线性可以造成参数的估计值严重偏离实际值一个解释：的共线性使接近奇异阵,从而使中的对角分量或的方差很大.,随机模拟方法,多重共线性对参数估计影响的例原线性模型：的观测值：正态随机数：由模型得到：回归模型：,多重共线性的判定,方法1 相关系数法若自变量间的相关系数1 ，则相应的两个变量之间有较强的共线性。方法2 方差膨胀系数法（）若是把第j个自变量看作因变量，用其余p-1个变量作线性回归所得到的决定系数，则第j个自变量的方

10、差膨胀系数为：,方法3 检查统计量的显著性. 很大,但没有几个显著的t统计量或 F统计量高度显著,而每个t统计量都不显著.方法4 检查系数的标准差. 如果几个系数的标准差都很高,而且从方程中去掉一个或几个变量会降低剩下几个变量系数的标准差,此时有可能存在多重共线性.,共线性诊断的SPSS实现,点击,点击,原方程:,回归方程:,克服多重共线性的统计方法,逐步回归,岭回归,主成分回归,消除多重共线性,主成分回归,第一步：寻找主成分,第二步：如果第一和第二主成分的累积贡献率超过85%，则建立回归模型,随机模拟例的主成分回归结果,第一主成分的贡献率为0.993 y关于第一主成分的回归模型为：最后的整理

11、结果为：,岭回归,逐步回归,引进变量过程,剔除变量过程,逐步回归的SPSS实现,习题一,方差分析表,33.240,2,9,13.740,参数估计表,constant,x1,x2,B,Std. Error,11.307,-6.591,1.463,4.719,-1.486,t,7.719,回答如下问题,写出回归方程的表达式回归方程是显著的吗？回归系数是显著的吗？回归系数不显著的原因可能是什么？计算决定系数和调整的决定系数总体标准估计误差是多少？临界值：,科研案例,刘小玄. 民营化改制对中国产业效率的效果分析2001年全国普查工业数据分析. 经济研究, 2004,(8):16-26,内容提要,本项

12、研究利用了第二次全国基本单位普查数据（2001年），在全部工业的基础上，考察了最新的民营化发展动态，考察20多年来形成的改制面和所产生的相应绩效效果。按照现行的国家规定的企业产权注册的详细分类指标，我们得以将改制企业从一般公有制或私有制中加以分离，从而能够通过相应的实证模型，来检验不同所有权因素，尤其是改制形式的不同股权类型对于产业效率的影响及程度。主要的发现如下：（1）国有企业（包括传统国有、国有独资企业）,对于效率具有明显的负效率，私营企业、股份制企业和三资企业则都表现为积极地对于效率的正相关推动作用。其中，私营企业推动产业效率的作用最强，三资和股份合作企业其次，再次则是股份企业和集体企业

13、。（2）对于改制企业的不同资本股份来说，个人资本普遍具有最显著的对于效率的正相关的积极效果，法人资本表现为显著性不稳定的正相关作用，集体资本表现与效率不相关的结果，而国家资本则表现出十分显著的负相关效果。（3）对于股份有限、有限责,任和股份合作企业这三种股份企业之间差异的分析表明：股份有限公司的规模效益作用明显小于股份制企业，这是较多的国有产权的消极作用抵消了规模效益的积极作用的结果。相对于股份有限公司，股份合作或有限责任公司的劳动贡献率明显高于资本贡献率，表明这类改制企业在改制后初期主要依靠“劳动推动”或“人力资本推动”来提高企业效率。,产业效率决定因素的估计模型,销售收入,固定资产净值,就

14、业人数,所有权结构变量,规模变量,所有权变量的度量：不同注册类型企业的实收资本占该行业总资本的比重（国有、集体、私营、股份合作、有限公司、股份有限、港澳台合资、港澳台独资、外商合资、外商独资和其他,总共11种产权变量）规模变量的度量：一行业内大型、中型或小型企业的市场份额,影响产业效率的国有因素,因变量,参数估计,(T检验值),截距,2.699,(14.36),LK,0.424,(12.56),LL,0.577,0.566,-0.555,0.801,(16.44),(3.21),(6.93),(-8.37),大型,中型,国有,结论:国有企业对于效率具有明显的负效率,影响产业效率的其他所有制因

15、素股份公司中的不同资本所有权对于效率的作用股份公司中的国家资本所有权对于效率的作用,科研案例对比分析,白晓宇. 上市公司信息披露政策对分析师预测的多重影响研究. 金融研究. 2009, 346(4): 92-112.,摘要,本文选取针对2001 2007 年度年报发布的分析师预测样本, 以深交所信息披露考核结果以及是否按规定发布业绩预告作为衡量上市公司信息披露政策的指标, 分别考察二者对于分析师预测数量及质量的影响。多元回归分析结果表明,上市公司信息披露政策越透明,则跟随其进行预测的分析师数量越多,预测的分歧度越小, 准确度越高。这说明上市公司高水平的信息披露对分析师具有重要作用, 并有利于缓

16、解资本市场的信息不对称问题。本文提示我们,深交所信息披露考核指标以及是否按规定发布业绩预告分别从不同角度体现了上市公司的信息披露政策导向;市场参与者亟待更为全面且公允的信息披露评级指标出台。,变量选择,变量选择,变量选择,上市公司信息披露政策对分析师数量的影响,结果解释,解释变量与被解释变量在考虑了控制变量的前提下,均呈显著正相关关系, 即信息披露政策越透明(信息披露水平越高) ,跟随的分析师(券商)数量越多。所有控制变量的系数均显著,且方向与预期相同。两方程的R2及调整后的R2均达到了30%以上,且方程2解释力略强。,信息披露政策对分析师预测分歧度的影响,解释结果,描述了信息披露政策与分

17、析师预测分歧度的关系,两个回归方程中,解释变量与被解释变量均显著负相关,即上市公司信息披露政策越透明(信息披露水平越高),分析师预测的分歧度越小. 方程1的R2达到了27%,调整后的R2也有26%;而方程2的解释力稍弱,R2和调整后的R2均在12%左右。,信息披露政策对分析师预测准确度的影响,解释结果,描述了信息披露政策与分析师预测准确度的关系,两个回归方程中,解释变量与被解释变量均呈显著负相关,即上市公司信息披露政策越透明(信息披露水平越高),分析师预测的误差越小(准确度越高)。方程1的R2为4%,调整后的R2约3.3%;而方程2的解释力稍弱,R2和调整后的R2分别在2.6%和1.8%左右。,读书报告(研究生网站上下载),至少两篇文献(所学专业)报告内容包括：研究的目的和意义研究内容研究方法模型、变量的选择；模型的估计结果结论参考文献(格式按研究生毕业论文要求),实验报告(用于上机实验),寻找与本专业研究方向有关的数据 (报告中要给出数据,并说明数据的来源)通过对数据的整理建立相关模型并说明：研究的目的和意义研究内容研究方法模型、变量的选择；模型的估计结果结论参考文献(格式按研究生毕业论文要求),

展开阅读全文