《抽样分布参数估计简介假设检验的基本原.ppt》由会员分享,可在线阅读,更多相关《抽样分布参数估计简介假设检验的基本原.ppt(63页珍藏版)》请在三一办公上搜索。
1、,抽样分布参数估计简介假设检验的基本原理,统计推断概述,抽样分布的概念,样本统计量的概率分布称为抽样分布(sampling distribution)样本是通过对总体的随机抽样获得的 样本统计量是随机变量,有一定的概率分布,简单随机样本抽样是完全随机的-总体中的每个个体都有相同的机会被抽中抽样是彼此对立的-每次抽样的结果都不会影响到其他抽样的结果,抽样分布的概念,原总体,样本1,样本2,样本n,新总体,n,统计量,2(chi-square)分布,定义设随机变量X1,X2,Xn彼此独立且都服从标准正态分布 N(0,1),则随机变量,服从自由度为n的2分布,记为,2 分布,2 分布,性质2 分布随
2、机变量的取值范围为(0,)若Y1 2(n),Y2 2(m),且相互独立,则Y1 Y2 2(n m)2 分布为非对称分布,其分布曲线的形状由自由度决定,自由度越大,分布越趋于对称当 n,2(n)N(n,2n),2 分布,2 分布上侧分位数表:附表3(p.277),t 分布,定义设Z N(0,1),Y 2(n),且相互独立,则,服从自由度为n的 t 分布,记为,t 分布,t 分布,性质与标准正态分布相似关于 t=0对称只有一个峰,峰值在t=0分布曲线受自由度影响,自由度越小,离散程度越大当 n,t(n)N(0,1),t 分布,t 分布与正态分布的比较,t 分布,t分布双侧分位数表:附表4(p.27
3、9),F 分布,定义若 X 2(m),Y 2(n),且相互独立,则,服从自由度为m(第一自由度)和n(第二自由度)的 F 分布,记为,F 分布,F 分布,性质F分布随机变量的取值范围为(0,)F分布的分布曲线受两个自由度的影响若F F(m,n),则 1/F F(n,m)若X t(n),则 X2 F(1,n),F 分布,F分布的上侧分位数表:附表5(p.281),正态总体样本平均数的分布,样本平均数的期望和方差设样本来自均数为,方差为 2的总体设样本为简单随机样本,正态总体样本平均数的分布,期望,正态总体样本平均数的分布,方差,标准差,(平均数的标准误),正态总体样本平均数的分布,正态总体样本平
4、均数的分布设样本来自正态总体 N(,2),则样本平均数也服从正态分布,其总体均数为,方差为 2/n。,中心极限定理,无论样本所来自的总体是否服从正态分布,只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。所需的样本含量随原总体的分布而异,但只要样本含量 30,无论原总体是何分布,都足以满足近似的要求。设原总体的期望为,方差为 2,则样本平均数的期望为,方差为 2/n。,正态总体样本方差的 分布,样本方差的期望和方差设样本来自均数为,方差为 2的总体设样本为简单随机样本,正态总体样本方差的 分布,样本方差的分布,参数估计,参数估计的定义以样本统计量对总体参数进行估计基本形式点
5、估计(point estimation)区间估计(interval estimation),参数估计-点估计,以样本统计量作为总体参数的一个估计值,例:,样本观测值,参数估计-点估计,基本方法-构造函数g(x)的方法矩法:用与总体参数相应的样本统计量作为估计值,必要时可对统计量作适当调整最大似然法:用使样本观测值的似然函数达到最大的统计量作为估计值最小二乘法:用使估计误差平方和的统计量作为估计值贝叶斯法:根据贝叶斯理论构造估计量,参数估计-点估计,衡量估计值优劣的指标无偏性:,无偏估计:,有偏估计:,参数估计-点估计,样本方差的期望,s2是2的无偏估计量,参数估计-点估计,抽样方差/标准误:估
6、计值的方差/标准差,样本平均数的抽样方差:,样本方差的抽样方差:,参数估计-点估计,均方误差:,一致性:估计值随着样本的增大而更加接近 真值有效性:抽样方差达到最小的无偏估计充分性:估计函数包含了关于被估参数的全 部信息,参数估计-区间估计,以一定的置信度对参数可能取值范围的估计,1-:置信度(置信水平)t1,t2:置信区间t1、t2:置信限(置信下限、置信上限),求统计量 t1和 t2,使得对于给定的(0 1,常用=0.05和=0.01),有,参数估计-区间估计,正态总体平均数的区间估计,当 2已知,标准正态分布两尾概率分位点,参数估计-区间估计,正态总体平均数的区间估计,当 2未知,参数估
7、计-区间估计,t分布两尾概率分位点,参数估计-区间估计,正态总体方差的区间估计,2分布上尾概率分位点,参数估计-区间估计,/2,/2,1-,假设检验,假设(hypothsis)对总体的某些未知的或不完全知道的性质所提出的待考察的命题 假设检验对假设成立与否做出的推断,假设检验的基本原理,问题的提出 例:某猪场称该场的猪在体重为100kg时的平均背膘厚度为9mm。问题:此说法是否正确?有4种可能性(假设)1)正确:9 2)不正确:9(|9|0)3)不正确:9三对假设:9 vs 9,9 vs 9,假设检验的基本原理,如何回答随机抽取一个样本 计算该样本的平均数 比较样本平均数与9mm 难题 存在抽
8、样误差 当样本平均数与9mm之差达到多大时可否定 9,假设检验的基本原理,解决的思路针对要回答的问题提出一对对立的假设,并对其中的一个进行检验 找到一个样本统计量,它与提出的假设有关,其抽样分布已知根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断,这个过程称为假设检验(hypothesis testing),假设检验的基本原理,小概率事件原理 小概率事件在一次试验中几乎不会发生 如果某事件在一次试验中发生了,我们可认为它不是一个小概率事件 如果在某个假设下应当是小概率的事件在一次试验中发生了,可认为该假设不能成立,假设检验的基本原理,假设检验的基本步骤1)提出一对对立的
9、假设2)构造并计算检验统计量3)确定否定域4)对所作的假设进行推断,假设检验的基本原理,例(续)设由该场随机抽取了10头猪,测得它们在体重为100kg时的平均背膘厚为8.7mm。已知该场猪的背膘厚服从正态分布,总体方差为 2 2.5mm2 1)提出假设原假设(null hypothesis):H0:=9mm备择假设(alternative hypothesis):HA:9mm,假设检验的基本原理,2)构造并计算检验统计量检验统计量:用于检验原假设能否成立的统计量,满足以下条件 必须利用原假设提供的信息 抽样分布已知,假设检验的基本原理,3)确定否定域在检验统计量抽样分布的尾部(1侧或2侧)中划
10、定一小概率区域,一旦计算的检验统计量的实际值落入此区域,就否定原假设,接受备择假设。这个小概率也称为显著性水平,用 表示通常取 5或 1,假设检验的基本原理,若取 5,则,接受域95%,否定域2.5%,1.96,-1.96,否定域:Z 1.96 或 Z 1.96,否定域2.5%,假设检验的基本原理,4)对所作的假设进行推断 差异不显著:在 5水平下,检验统计量的观察值落在接受域中 差异显著:在 5水平下,检验统计量的观察值落在否定域中 差异极显著:在 1水平下,检验统计量的观察值落在否定域中,假设检验的基本原理,z=-3.162-1.96(落入否定域)否定原假设,结论:该场猪的平均背膘厚与9m
11、m差异显著,若取小概率为1%,可得否定域为Z 2.58 或 Z-2.58仍有 z=-3.162-2.58,结论:该场猪的平均背膘厚与9mm差异极显著,假设检验的基本原理,几个相关概念1)双侧检验和单侧检验双侧检验:否定域在检验统计量分布的两尾单侧检验:否定域在检验统计量分布的一侧左侧检验:否定域在检验统计量分布的左侧右侧检验:否定域在检验统计量分布的右侧,假设检验的基本原理,例(续)左侧检验 1)假设:H0:=9,HA:9 2)检验统计量:同双侧检验,z=-3.162 3)否定域:取=0.05 4)推断:,5%,-1.64,z=-3.162-1.64 否定原假设,假设检验的基本原理,例(续)右
12、侧检验 1)假设:H0:=9,HA:9 2)检验统计量:同双侧检验,z=-3.162 3)否定域:取=0.05 4)推断:,5%,1.64,z=-3.162 1.64 接受原假设,假设检验的基本原理,2)相伴概率 P检验统计量观察值以及所有所有比它更为极端的可能值出现的概率之和 双侧检验:P=P(Z 3.162)=0.002 左侧检验:P=P(Z-3.162)=0.999,假设检验的基本原理,-3.162,3.162,-3.162,双侧检验的相伴概率,左侧检验的相伴概率,假设检验的基本原理,相伴概率可用于对假设的统计推断:检验统计量的观察值落在否定域中等价于相伴概率小于显著性水平,即 P 可以
13、用否定域,也可用相伴概率对原假设进行推断 如果检验统计量是连续分布的,用否定域进行推断 如果检验统计量是离散分布的,用相伴概率进行推断,假设检验的基本原理,3)两类错误 任何假设检验的结果都有犯错误的可能一类错误:以真为假-原假设正确但被否定。P(一类错误)=二类错误:以假为真-原假设错误但被接受。P(二类错误)=,一般无法计算!,1,/2,2,/2,假设检验的基本原理,假设分布,真实分布,假设检验的基本原理,假设检验的基本原理,假设检验的基本原理,影响 II 型错误概率大小的因素 显著性水平 样本含量 n 假设分布与真实分布总体平均数之差 两个分布的总体方差,假设检验的基本原理,4)检验功效 一个错误的原假设能够被否定的概率 检验功效 1 II 型错误概率,假设检验的基本原理,几点说明关于假设关于统计推断的结论关于单侧检验的假设假设检验与置信区间的关系,假设检验的基本原理,假设 真实情况 决策 犯错误H0:有效 有效 接受H0 无 否定H0 I 型 无效 接受H0 II型 否定H0 无 H0:无效 有效 接受H0 II型 否定H0 无 无效 接受H0 无 否定H0 I 型,习题,P.59 6,7,