非参数假设检验.ppt

上传人:小飞机 文档编号:6233458 上传时间:2023-10-08 格式:PPT 页数:57 大小:768.50KB
返回 下载 相关 举报
非参数假设检验.ppt_第1页
第1页 / 共57页
非参数假设检验.ppt_第2页
第2页 / 共57页
非参数假设检验.ppt_第3页
第3页 / 共57页
非参数假设检验.ppt_第4页
第4页 / 共57页
非参数假设检验.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《非参数假设检验.ppt》由会员分享,可在线阅读,更多相关《非参数假设检验.ppt(57页珍藏版)》请在三一办公上搜索。

1、第三节 非参数假设检验,一、总体分布函数的假设检验二、独立性假设检验三、两总体分布比较的假设检验,前面已经研究了假设检验的基本思想,并讨论了当总体分布已知时,关于其中未知参数的假设检验问题.,然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设.,问题的背景:,例如,从 1500 到 1931 年的 432 年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这 432 年间共爆发了 299 次战争,具体数据如下:,Poisson分布?,对总体分布进行检验的问题称为分布的拟合检验.,2 检验法是在总体X 的分布未知时,根据来自总体的样本,检验关于总体分布的

2、假设的一种检验方法.,基本思想:,H0:总体 X 的分布函数为 F(x),然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.这种检验通常称作拟合优度检验,它是一种非参数检验.,一、2拟合优度检验,提出原假设:,将总体 X 的取值为 a1,a2,ak.,2.把取值为 ai 的样本值的个数记作 ni,称为实测频数.所有实测频数之和 n1+n2+nk 等于样本容量 n.,H0:P(X=ai)=pi,i=1,2,k.,基本原理和步骤如下:(总体分布取值有限),3.根据所假设的理论分布,可以算出 npi 就是落入 X 取值为 ai 的样本值的理论频数.,它标志着经验分布与理论分

3、布之间的差异的大小.,4.皮尔逊引进如下统计量表示经验分布与理论分布之间的差异:,在理论分布已知的条件下,npi 是常量,实测频数,理论频数,其分布是什么?,Pearson证明了如下定理:,若原假设中的理论分布 F(x)已经完全给定,那么当 n 充分大时,统计量,注:若在 H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.,Fisher证明了如下定理:,若原假设中的理论分布 F(x)中有 r 个未知参数需用相应的最大似然估计来代替,那么当 n 充分大时,统计量,如果根据所给的样本值 x1,x2,.,xn 算得统计量2 的实测值落入拒绝域,则拒绝原假设;否则就认为

4、差异不显著而接受原假设.,分别得拒绝域:,(不需估计参数),(估计r 个参数),查2 分布表可得临界值21-,,使得,根据以上定理,对给定的显著性水平,注:皮尔逊定理是在 n 无限增大时推导出来的,因而使用时要注意 n 要足够大以及 npi 不太小这两个条件.根据计算实践,要求 n 不小于 50 以及 npi 不小于 5.否则应适当合并相邻区间,使 npi 满足此要求.,例1.掷一颗骰子 60 次,结果如下:试在=0.05 水平下检验其是否均匀?,解:这是一个分布的拟合优度检验,记出现点数 i 的概率为 pi,提出假设:,检验的拒绝域为:,现在=0.05,k=6,查表得,由样本,得检验统计量的

5、值:(其中分子中的10是60*1/6),未落入拒绝域,,即认为是均匀的。,例2.试检验每年爆发战争次数分布是否服从泊松分布.,解:这是一个分布的拟合优度检验,提出假设:H0:XP(),按参数为 0.69 的泊松分布,计算事件X=i 的概率 pi,,pi 的估计是,i=0,1,2,3,4,由观察值,得参数的最大似然估计为,将有关计算结果列表如下:,13.91,注:将n 5的组予以合并,即将发生3次及以上次数的组归并为一组.,3,因假设的理论分布中有一个未知参数,即r=1,又 k=4,故自由度为 4-1-1=2.,又=0.05,自由度为 2,查2分布表得:,未落入拒绝域,,检验的拒绝域为:,由样本

6、,得检验统计量的值:,故认为每年发生战争次数 X 服从参数为 0.69 的泊松分布.,将总体 X 的取值范围分成 k 个互不重迭的小区间(或小组),记作 A1,A2,Ak.,2.把落入第 i 个小区间 Ai 的样本值的个数记作 ni,称为实测频数.所有实测频数之和 n1+n2+nk 等于样本容量 n.,H0:P(Ai)=pi,i=1,2,.k.,基本原理和步骤如下:(连续型随机变量总体),3.根据所假设的理论分布,可以算出总体 X 的值落入每个 Ai 的概率 pi,于是 npi 就是落入 Ai 的样本值的理论频数.,它标志着经验分布与理论分布之间的差异的大小.,4.皮尔逊引进如下统计量表示经验

7、分布与理论分布之间的差异:,在理论分布已知的条件下,npi 是常量,实测频数,理论频数,其分布是什么?,Pearson证明了如下定理:,若原假设中的理论分布 F(x)已经完全给定,那么当 n 充分大时,统计量,注2:若在 H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.,注1:定理中的 pi 为,Fisher证明了如下定理:,若原假设中的理论分布 F(x)中有 r 个未知参数需用相应的最大似然估计来代替,那么当 n 充分大时,统计量,如果根据所给的样本值 x1,x2,.,xn 算得统计量2 的实测值落入拒绝域,则拒绝原假设;否则就认为差异不显著而接受原假设.,

8、分别得拒绝域:,(不需估计参数),(估计r 个参数),查2 分布表可得临界值21-,,使得,根据以上定理,对给定的显著性水平,二、列联表的独立性检验,rc的二维列联表:,总体按两个属性 A 和 B 分类,A 有 r 个类:A1 A2,Ar;B 有c个类:B1,B2,Bc.共有 rc 个类.若进行 n 个试验其中所属 Ai 又属Bj 的结果有 nij 个,按矩阵排列,就得到 rc 二维列联表.,H0:P(AiBj)=pij=pi.pj=P(Ai)P(Bj),i=1,2,.r.j=1,2,.c.,提出原假设:,在诸 pij 未知时,检验统计量,其中 是 pij 的最大似然估计.,因此,拒绝域:,H

9、0:属性 A 与 B 独立,等价于,H0为真,例.为研究儿童智力发展与营养的关系,某研究机构调查了1436个儿童,得到下表的数据,试在显著性水平0.05下判断智力发展与营养有无关系.,诸 计算结果-理论频数,检验的拒绝域为:,现在=0.05,(r-1)(c-1)=3,查表得,由样本,得检验统计量的值:,落入拒绝域,认为营养状况对智商有影响。,注:特别当r=c=2时,22 列联表又称为四格表.,此时统计量简化为,拒绝域为,例:在电视收视率调查中,得到性别与收视习惯的列联表如下。试分析性别与收视习惯的相互关系。,习惯 性别 男 女 xi几乎天天看 38 24 62 偶 尔 看 31 7 38 xj

10、 69 31 100H0:性别与收视习惯无关系。H1:性别与收视习惯有关系。,习惯 性别 男 女 xi几乎天天看 a b a+b 偶 尔 看 c d c+d xj a+c b+d n,习惯 性别 男 女 xi几乎天天看 38 24 62 偶 尔 看 31 7 38 xj 69 31 100,参数检验(t-检验,u-检验)1、关于总体均值的检验2、两个总体的均值是否相等(1)独立样本问题(2)配对样本问题,非参数检验(符号检验、秩检验)1、关于总体分布、中位数等特征的检验2、两个总体的分布、中位数是否相等(1)独立样本问题(2)配对样本问题,三、两总体分布比较的假设检验,1 符号检验(Sign

11、Test),符号检验的基本原理,二项分布:n次独立的Bernoulli试验。S+表示成功的次数,S-表示失败的次数(S-=n S+).,提出假设:成功的概率与失败的概率相等,即:p=0.5 S+S-,如果试验了100次,只有一次成功,能否认为成功与失败的概率相同?,问 题,提出假设:成功的概率与失败的概率相等 H0:p=0.5 H1:p 0.5 如果 H0 的假设为真,S+与 S-的数量应该基本相等。取检验统计量 S=minS+,S-如果 S 过小,则 H0 的假设是错误的。,拒绝域的确定:,分位数表见 185 页附表 5。,【例】某企业为比较白班与夜班的生产效率是否有明显差异,随机抽取了两星

12、期进行观察,各日产量比较如表所示。是据此在显著水平 0.05 下判断白班与夜班生产是否存在显著性差异?,表1 白班与夜班产量比较,H 0:FX(x)=FY(x),H1:分布函数不全相等。样本各观测值与总体平均数的差值及其符号列于表1,并由此得 n+=9,n-=4,n=13,s=min n+,n-=n-=4。由 n=13,查 附 表 5,得s0.05(13)=2,s s0.05(13),不能否定H0,表明差异不显著,可以认为白班与夜班生产不存在显著性差异。,1、提出无效假设与备择假设,2、计算差值、确定符号及其个数,3、统计推断,2 秩和检验(Rank Test),方法:将观察值按由小到大的次序

13、排列,编定秩次,求出秩和进行假设检验。,1.秩:指将观察值由小 大按次序排列后所编的次序号。2.秩和:用秩次号代替原始数据后,所得的某些秩之和。3.秩和检验:用统计量秩和进行的检验。,名词解释,H 0:FX(x)=FY(x),H1:分布函数不全相等。两组样本混合后按从小到大排序,计算秩;,检验步骤,2、计算秩,1、提出无效假设与备择假设,计算X 或Y 的样本秩和(选择容量小的样本)作为检验统计量T。,3、计算统计量T,4、统计推断,分位数表见 185 页附表6。,【例】为了比较两种不同规格灯丝制造的灯泡使用寿命,分别从甲、乙两批灯泡中随机抽取若干个灯泡进行寿命试验,测得数据如表所示,试判断这两

14、种灯泡的使用寿命是否有明显的差异。,举例,表 1 灯泡使用寿命,H 0:FX(x)=FY(x),H1:分布函数不全相等。,1、提出无效假设与备择假设,2、计算秩,此例,Y 的秩为1,2,3.5,5.5,7,秩和为:1+2+3.5+5.5+7=19。查附表6 得,t1(5,6)=20,t2(5,6)=40,因为T20,否定H0,表明两个试验处理差异显著。,3、确定统计量T,4、统计推断,提出假设,根据统计调查的目的,提出原假设H0 和备则假设H1,作出决策,抽取样本,检验假设,对差异进行定量的分析,确定其性质(找一检验统计量 T,在 H0 成立下其分布已知.),拒绝还是不能拒绝H0,显著性水平,控制犯第一类错误的概率,小 结,实例分析:,教材86页例,推断两台推力计的推力是否有显著差异。,第 四 章 作 业,习题 4 1、7、9、14、16,作业上交时间:10月30日,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号