《课件假设检验樊桂兰ppt课件.ppt》由会员分享,可在线阅读,更多相关《课件假设检验樊桂兰ppt课件.ppt(32页珍藏版)》请在三一办公上搜索。
1、主讲人:樊桂兰 环化学院 化学1112012年11月25日,假设检验,假设检验在统计方法中的地位,统计方法,描述统计,推断统计,参数估计,假设检验,一、假设检验思想概述,什么是假设?对总体参数的具体数值所做的陈述总体参数包括总体数值、比率、方差等分析之前必须陈述什么是假设检验?先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程逻辑上运用反证法,统计上依据小概率原理,小概率原理,多大概率为小概率?在一次试验中,一个几乎不可能发生的事件的概率在一个问题中,通常是指定一个正数,0 1,认为概率不超过 的事件是在一次试验中不会发生的事件,这个 称为显著性水平(小概率);小
2、概率由研究者事先确定,通常可取=0.01,0.05在一次试验中小概率事件一旦发生,我们就有理由拒绝“假设”,因此显著性水平 越大越易得出有差别的结论,越易推翻原假设。(但也要结合实际,太大也不好),二、假设检验的一般步骤,根据需要提出原(无效)假设 和备择(对立)假设确定适当的统计量确定显著性水平 和临界值及拒绝域根据样本数据计算检验统计量的值(或P值)将检验统计量与临界值比较,做出拒绝或接受原假设的决策,什么是原假设与备择假设?,原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个,而且只有一个成立引例:一种袋装食品,每袋标准重量为100g,为对产量质量
3、进行监测,以分析每袋重量是否符合要求,如果每袋食品重量大于或小于100g,则表明生产过程不正常,必须进行调整。试陈述检验生产过程是否正常的原假设和备择假设?欲收集证据予以证明“生产过程不正常”,所以建立的原假设和备择假设为:,构造统计量(构造参数的置信区间),情形;情形 情形;情形,置信区间,设样本 来自分布函数为(为未知参量)的总体,对于给定的常数(0,1),如果存在两个统计量 与 满足,则称区间 是参数的置信水平为1-的置信区间,和 分别称为置信下限和置信上限,称为置信水平。,在 成立时有以下四种分布,标准正态分布N(0,1)情形A,C中 已知t分布情形A,C中 未知X2分布情形BF分布情
4、形D,三、假设检验的分类,参数假设检验正态总体参数检验;u检验,t检验,x2检验,F检验非正态总体参数检验 非正态总体均值检验的大样本方法,指数总体的参数检验非参数假设检验正态概率纸检验,皮尔逊x2拟合检验,科尔莫格罗夫检验,斯米尔诺夫检验,秩和检验,常见的正态总体参数检验方法,U检验:针对单个正态总体参数(单样本)的检验:(已知)建立统计假设:取检验统计量:在 成立下,对给定的显著性水平,构造小概率事件 使,故拒绝域为根据样本观测值计算出检验统计量U的观测值u,若落在拒绝域内,则拒绝原假设,否则接受,U检验:,针对两个正态总体参数(双样本)的检验(已知)建立统计假设:取检验统计量:在 成立下
5、,对给定的显著性水平,构造小概率事件 使,故拒绝域为根据样本观测值计算出检验统计量U的观测值u,若落在拒绝域内,则拒绝原假设,否则接受.见例1,例2:,U检验引例1,已知某炼铁厂的铁水含碳量(单位:%)在正常状况下服从正态分布N(4.40,0.052),某日测得5炉铁水的含碳量如下:4.43,4.40,4.42,4.30,4.35 如果标准差不变,该日铁水含碳量是否达到标准()?解:根据问题的特点,建立统计假设 因为=0.05已知,取检验统计量 由题意知 计算样本统计量得 给定,查附表得,显然 显然,检验统计量观测值落入接受域,故接受,即认为该日铁水含碳量达到标准。,U检验引例2,设对某门统考
6、课程,两个学校的考生成绩分数分别服从正态分布,现分别从两个学校随机抽取36位考生的成绩,算得平均成绩分别为72分和78分,问在显著性水平0.05下,两个学校考生的平均成绩是否有显著性差异?解:根据题意建立待检验的假设如:选取检验统计量 可知,在 成立时,给定显著性水平,查 附表得 已知,则检验统 计量U的观测值为 故拒绝,即在显著性水平 下,可以认为两个学校考生的平均成绩有显著性差异,T检验:,针对单个正态总体参数(单样本)的检验建立统计假设:显然 已不再是统计量,考虑到 是 的无偏估计,用s代替取检验统计量:在 成立下,对给定的显著性水平,构造小概率事件 使,故拒绝域为 根据样本观测值计算出
7、检验统计量T的观测值t,若落在拒绝域内,则拒绝原假设 否则接受。见例1,T检验:,针对两个正态总体参数(双样本)的检验,又可分两种情况方差 均未知,但建立统计假设:显然 已不再是统计量,但 和 分别是 和 的无偏估计取检验统计量:在 成立下,对给定的显著性水平,构造小概率事件使得,故拒绝域为根据样本观测值计算出检验统计量T的观测值t,若落在拒绝域内,则拒绝原假设,否则接受。见例题2:,T检验:,方差 均未知,但,进行配对检验的情形(做变换,易知 因此样本 可看作来自单个正态总体 的样本,于是检验两总体均值的检验就转换为单个总体在方差未知时的均值的假设检验)建立统计假设:取检验统计量:其中当假设
8、 成立时,故拒绝域为,根据样本观测值计算出检验统计量T的观测值t,若落在拒绝域内,则拒绝原假设,否则接受。见例题3,T检验引例1,一自动车床加工零件的长度服从正态分布,车床正常 时,加工零件的均值为10.5,经过一段时间后,要检验这车床是 否正常工作,为此抽取该车床加工的31个零件,测得数据如下:零件长度/cm 10.1 10.3 10.6 11.2 11.5 11.8 12.0 频数 1 3 7 10 6 3 1 若加工零件的长度标准差不变,问此车床是否正常工作?解:由于 未知,故采用t检验法,建立统计假设:取检验统计量:由题设知:,其中 表示 出现的频数检验统计量T的观测值为在 成立时,给
9、定显著性水平 查附表得 显然,即检验统计量的观测值落在拒绝域。故拒绝,即在显著性水平 下,认为该车床工作不正常。,T检验引例2,某卷烟厂生产甲、乙两种香烟,分别对他们的尼古丁含量(单位:mg)做了6次测定,得样本观测值为:甲:25 28 23 26 29 32;乙:28 23 30 25 21 27.试问这两种香烟的尼古丁含量有无显著性差异(,假定这两种香烟的尼古丁含量都服从正态分布,且方差相等)?解:知两总体方差相等但均未知,检验两总体均值是否相等,建立假设:取检验统计量:其中 已知,由样本计算得,检验统计量T的观测值为:查表得 显然,所以接受,认为两种香烟没有显著性差别,T检验引例3,用自
10、动车床采用新旧两种工艺加工同种零件,测量的加工偏差(单位:)分别为:旧工艺:2.7,2.4,2.5,3.1,2.7,3.5,2.9,2.7,3.5,3.3 新工艺:2.6,2.1,2.7,2.8,2.3,3.1,2.4,2.4,2.7,2.3 设测量值服从正态分布,所得的两个样本相互独立,试问自动车床在新旧两种工艺下的加工精度有无显著性差异?解:由于新旧工艺的方差相等不确定,但样本容量相同,故可采用配对检验 建立统计假设:取检验统计量:且 由样本算得:T的观测值 又由,查表得,故应拒绝拒绝,即新旧工艺对零件的加工精度有显著影响。,X2检验(总体方差 的检验),均值 已知与均值 未知建立统计假设
11、:由于 是 的无偏估计,当 为真时,应在1附近摆动,过大或过小都可认为 不成立,取检验统计量为:假设 成立有 由 分布上侧分位表可查得 与 构造小概率事件 使得 故 的拒绝域为,x2检验例题,根据长期的经验,某工厂生产的铜丝的折断力(单位:N)服从正态分布N(573,62),今从该厂生产的一大批铜丝中随机抽取10个样品,测得折断力结果如下:578,572,570,568,570,572,570,572,596,584 现问:是否可以认为该日生产的铜丝折断力的标准差是6N?解:检验假设:检验统计量的Q=20,给定,查表得 显然 故接受,即认为该日生产的铜丝折断力的标准差是6N。,F检验(两总体方
12、差 的检验),步骤如下:提出假设:(由于 和 分别是 和 的无偏估计,因此,当 成立时,应在1附近摆动,而当此比值较大或较小,原假设 就不成立)故取检验统计量为:在 成立时,对给定的,查F分布上侧分位表可得临界值 与使得故 的拒绝域为,F检验例题,从马克吐温和斯诺特格拉斯的作品各选了8篇和10篇小品文,测得由3个字母组成的单词比例如下表所示:马 0.225,0.262,0.217,0.240,0.230,0.229,0.235,0.217 斯 0.209,0.205,0.196,0.210,0.202,0.207,0.224,0.223,0.220,0.201 设这两组数据都来自正态总体,而且
13、是相互独立 问两个作家所写的小品文中包含有3个字母组成的比例是否有显著性差异?解:先检验两总体方差是否相同,得到两方差相同,转化为t检验的问题,非参数假设检验,秩和检验,步骤如下:求出各对数据的差值建立假设检验H0:差值的总体中位数为零 确定检验水准编秩次并求秩和 依差值绝对值从小到大编秩,有正负号不同的差数中,若有绝对值相等的观测值,则取其平均秩和;对差值为0的对子,舍去不记,相应的总的对子数也要减去其对子数,记为n。分别求正负秩次之和T+和T-,并以绝对值较小者作为统计量T值,如T=min(T+,T-)总秩和=正负之和相加,其和为n(n+1)/2,通过对其计算可以判断T+和T-的计算是否有
14、误查表确定P值范围 当n25时,可查T界值表,T越小则P越小;当n25时,无法查表,可按近似正态分布用u检验法,秩和检验引例,临床某医生研究白癜风病人的白细胞介素IL-6指标在白斑部位与正常部位有无差异,调查资料如表所示:现n=8,查表得,落在界点上P0.05,按 水准拒绝,五、检验的两类错误,第一类错误是原假设H0为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用表示,也称作错误(error)或弃真错误。第二类错误是原假设H0不为真时,检验结果把它当成真而接受了。犯这种错误的概率用表示,也称作错误(error)或取伪错误。假设检验中各种可能结果的概率,假设检验两类错误关系的图示以单侧上限检验为例,设H0:XX0,H1:XX0,从上图可以看出,如果临界值沿水平方向右移,将变小而变大,即若减小错误,就会增大犯错误的机会;如果临界值沿水平方向左移,将变大而变小,即若减小错误,也会增大犯错误的机会。,图(a)XX0H0为真图(b)XX1X0H0为伪,六、正态总体参数假设检验一览表,两个正态总体参数的检验,谢谢欣赏!,