《统计推断原理和步骤.ppt》由会员分享,可在线阅读,更多相关《统计推断原理和步骤.ppt(66页珍藏版)》请在三一办公上搜索。
1、第五章,统计推断原理和步骤,本章主要介绍统计推断的意义、原理,统计推断与抽样分布的关系,统计推断的思路和一般步骤,两尾检验和一尾检验,统计推断可能犯的两类错误及防止方法,生物统计学的一个重要任务是要知道所研究总体的特征值(参数)但是总体特征值一般难以知道:一方面是由于总体很大,即N 大,有时是无限的(无限总体,N),因此不可能逐一调查清楚另一方面,有时所要研究的总体目前并不存在,或者只能说是虚拟存在(总体是虚的),无法进行调查作某一试验时更是如此,但不管是何种类型的总体,我们总是可以通过随机抽样(抽样调查)的方法获得该总体的随机样本通过统计推断来定性或定量地分析所研究总体的特征值统计推断就是用
2、样本的特征值(统计量)在一定的概率保证下推断相应总体的特征值(参数)即:随机抽样 随机样本 随机样本特征值 总体特征值(统计量)(参数),计算,估计,第一节 统计推断的意义和内容,所谓统计推断(statistical inference),就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数实际工作中,一次试验或一次调查所获得的数据资料,通常是一个样本的结果,而我们真正需要知道的是抽取样本的总体特征即:统计分析的结论是针对总体参数而言的,因此,统计推断是科研工作中一个十分重要的工具,对试验设计也有很大的指导意义,统计推断包括:统计假设检验(hypothesis test)参数估计(pa
3、rametric estimation)这样两部分内容,统计假设检验又称显著性检验(significance test)其原理和过程是:对未知的或不完全知道的总体参数提出一些假设(hypothesis 这些假设通常构成完全事件系),然后在某一基本假设的基础上,计算样本的统计量,并分析这一统计量的分布规律最后根据这一统计量作出在一定概率意义下应当接受何种假设的结论,这里有一个定量转化为定性的过程:经计算所得到的统计量一般是呈连续分布的(定量),但最后的检验结论只有两种:接受何种假设(定性)即:存在一个临界值,统计量未达到临界值,应当接受一种假设统计量超过临界值,应当接受另一种假设,参数估计包括两
4、部分内容:参数的点估计(point estimation)参数的区间估计(interval estimation),第二节 统计量的抽样分布与统计推断的关系,前面已经讲过,由样本的统计量组成的总体分布(抽样分布)其参数与原总体的相应参数有着很密切的关系同时抽样的结果还告诉我们,样本统计量与总体相应参数之间存在着一定的抽样误差因此,用样本来推断总体的准确性与抽样误差的大小有关,抽样误差的大小用标准误来衡量,标准误不仅反映了抽样误差的大小,而且反映了样本统计量与总体相应参数间的差异程度也反映了用某个样本统计量来估计总体参数的准确程度,第三节 统计假设检验,一、统计假设检验的基本思路为了说明问题,我
5、们举几个例子进行讨论例1、随机抽取一批小鼠,随机分为两组,一组注射催产素,一组作为对照(即不注射催产素),半小时后检查这两组小鼠的血糖含量,得:注射催产素组为:=106.88 对照组平均值为:=109.17 同时我们也发现,同一组内的小鼠其血糖含量也是不同的两组小鼠的平均血糖含量之间有个差:,那么我们是否可以认为这个差值就是由于催产素注射与否的结果?显然仅凭这一差值-2.29 是不能说明问题的,例2、比较不同日龄(d)正常白化小鼠血浆含N量,得如下一批数据:日龄 血浆含 N 量35d()0.98 0.83 0.94 0.90 0.99 0.92 0.87 0.86 0.8190d()1.00
6、1.08 0.97 0.93 1.03 0.94 1.11 1.10对这两组数据进行计算,得:35d组小鼠的90d组小鼠的发现两组小鼠的血浆含N量有差异:,那么我们能否仅凭这一差异就认为日龄的不同,其血浆含N量就有差异呢?35d的小鼠中也有含N量高的(如0.99 0.98 0.94)90d的小鼠中也有含N量低的(如0.93 0.94)即:同一组内的小鼠其血浆含N量之间也是有差异的,例3、某孵化场宣传说该场孵化的鸡苗成活率为90%,我们能轻易相信吗?是否需要做一个试验?如果试验结果是100羽苗鸡仅成活了88羽(p=0.88),我们就能否定该场的宣传效果吗?如果我们再做一次呢?我们能一直不断地做下
7、去吗?,例4、试验某种治疗鸡白痢病的新药,将其与常规药物相比较,对400羽鸡施用常规药物,康复了340羽(康复率),相应的,对500羽鸡施用新药,有435羽康复了(康复率),我们是否就可以认为新药一定好于常规药物?,以上几个例题提醒我们,有以下几个问题是需要我们加以注意的:a.我们不可能用总体来做试验,各方面的条件不许可我们这样做,也没有必要这样做b.我们只能用样本来做试验,且由于时间、经费、人力等因素的限制,一般同一个试验只能做一次,通过一次试验就希望能得到一个比较可靠的结果c.试验结束以后,用什么来作为检验的对象?那就是样本的平均值:,用样本的平均值来检验总体平均值用两个样本平均值的差异来
8、检验相应两个总体平均值的差异用样本平均值作为检验对象的理由是:1、我们已经证明了 为最小,这说明样本平均值 与各变量 的差异最小,因此 是样本资料最好的代表2、在抽样分布中,我们已经证明了样本平均值 是总体平均值 的无偏估计量,即 的数学期望是,3、中心极限定理告诉我们:样本平均值 服从或近似服从正态分布 上述三点,说明样本平均值 可以作为检验的对象但是我们又不能仅凭样本平均值的大小就贸然下结论,认为试验有效或试验无效我们必须通过检验(test)为什么?,因为任何一次试验都存在误差,即同一组内的观测值都不会完全相同,在正常试验条件下,同一组内的数据之间的差异,一般就是误差每一个观测值都是试验的
9、表观效应,每一个数据都可以分成两个部分,即试验(处理)效应和误差(各种偶然因素引起的差异)同一总体中的个体所受到的各种偶然因素是不等的每一个数据中所包含的偶然因素是独立的就总体而言,这种偶然因素的影响是相互抵消的,用统计学自己的语言来讲,就是:每一个观测值都有自己独立的试验误差,因此,我们有以下公式存在:观测值(表观效应)=处理效应+误差效应 即:进行样本平均,得:同样,两个样本平均值的差异也可以这样分解:,实际上,我们感兴趣的、即我们关心的重点是:我们试验所得到的表观效应主要是由处理效应所引起、还是由抽样误差所引起?应当进行权衡,结合上面的实例:两组小鼠的平均血糖含量之间的差异是否由催产素的
10、注射与否所引起?不同日龄正常白化小鼠血浆含N量的差异是否由于小鼠的日龄不同而引起?实际试验中苗鸡的成活率与孵化场宣传之间的差异是真实差异吗?即孵化场是否真的言过其实了?还是试验时的抽样误差?新药和常规药物之间的差异是否由偶然因素引起?,为了使得这种比较和权衡所得到的结论更可靠、更科学、更合理、更可信、更正确,必须对试验和统计分析提出如下要求:1、合理地进行试验设计,正确地进行试验操作,无误地进行抽样,仔细地进行记录,认真地进行校对,以有效地降低试验误差,尽可能避免系统误差,杜绝人为错误,使样本真正代表总体,对试验效应和试验误差作出无偏的估计2、合理地、正确地分析试验结果,以得出有关总体参数假设
11、的统计推断,二 统计假设检验的一般步骤我们以大样本资料或样本虽小但总体方差为已知的情况(u-test)来说明统计假设检验的一般步骤统计假设检验的基本原理和思路是这样的:首先根据具体的试验目的提出一个假设(hypothesis)(然后在假定这一假设成立(或正确)的前提下进行试验,并取得数据)然后同样在这一假设成立(或正确)的前提下,对这些数据或资料进行统计分析,获得该假设成立(或正确)的概率值,最后根据所获得概率的大小判断所作假设是否成立:a、如果所得概率较大,就表明我们没有足够的理由来否定所作的假设,即我们必须接受这一假设;b、如果所得概率很小,就表示这一假设不大可能成立,应予以否定,从而接受
12、这一假设的对立假设,即接受备择假设上面的a和b必有一条被否定,另一条被接受,尽管所计算的概率值是连续变化的,但我们往往设定一个概率临界值(如p=0.05、p=0.01等等),根据所得概率值是大于p=0.05、还是小于p=0.05来决定所作假设是否成立(或正确)因此,概率值是连续分布的(定量),但假设的接受与否只有两类(定性),这里我们首先复习一下u的概念:在这一式子中,显然 与 的距离越小,u值就越小,查标准正态分布表,得到的概率值越大,表明 出现的概率越大;反之,与 的距离越大,u值就越大,查标准正态分布表,得到的概率值就越小,表明 出现的概率就越小当这一概率小到一定程度时,我们就可以认为这
13、一 似乎不大可能在一次试验中出现,亦即这一 所在总体的平均值与设定总体的平均值不等,即两个总体不是同一个总体,反之,我们就没有理由认为 所在总体与所设定的总体不是同一个总体在统计检验中所设定的、用以作为资料分析和最终判断基础的假设称为无效假设,无效假设又称为解消假设(null hypothesis),用 表示,所谓无效假设可以这样理解:我们的试验是“无效”的,即试验结束以后,所得到的样本平均值并没有“超”出设定的总体范围,即试验后得到的样本平均值其效果不见得好于原定的效果,即样本平均值所在总体与原设定的总体其实是同一个总体,两者的平均值 和 并没有本质的差异,两者之间的差异是由抽样误差引起的无
14、效假设的写法:,无效假设的含义就是:试验后所得到的样本平均值与原设定的已知总体的平均值之间的差异是由误差所引起的即样本平均值所在总体与已知总体是同一总体无效假设在统计分析后有可能被接受,也有可能被否定为了在无效假设被否定后有可以被接受的假设,我们还应当在无效假设设立的同时设立一个后备假设,这一后备假设称为备择假设,用 表示,即 备择假设是无效假设被否定后必须被接受的一个假设(下标 A 是 alternative 之意)备择假设和无效假设是一对对立的假设,两者构成了一个完全事件系在根据所得到的概率值进行判断时:接受了无效假设,就自然摒弃了备择假设否定无效假设的同时,就必须接受备择假设备择假设的含
15、义是:样本所在总体与已知总体不是同一个总体,即:所得样本并不来自于这一已知总体,将两个假设写完全:既可以是,也可以是在设立假设以后,研究样本平均数的抽样分布,分析试验或调查所得样本平均值 出现的概率我们会发现,样本平均值一般不会刚好等于已知总体的平均值,两者之间会有一定的差异,这一差异,有可能是抽样误差,也有可能是真实性差异,对此,我们需要借助概率原理来进行判断,进行这种判断可以从两个角度,即有两种方法:一是假定 是正确的,在此前提下计算 出现的概率值,我们可以通过查表的方式来完成:如果所得 u值出现的概率较大,我们就必须接受如果所得 u值出现的概率较小,我们就应当放弃 而接受 这里的概率大小
16、,以=0.05 和=0.01作为两个临界值,二是在假定 为正确的前提下,对 的抽样划出一个区间,这一区间称为接受区间,这一区间是有一定的概率保证的这一区间之外的部分称为否定区间倘若 落在接受区间内,我们就接受 反之,倘若 落在接受区间外,我们就否定 而接受,下面的是接受区间示意图:,设这一接受区间的概率保证为 95%,由于 而 即将其变换,得:为接受区间,其概率为95%而 和 为否定区间,其概率之和为5%同样,为 99%接受区间而 和 为 1%的否定区间,在 u-test 中以 为 水平上否定无效假设的两个界限以 为 水平上否定无效假设的两个界限,最后,根据小概率事件实际不可能性原理接受或否定
17、无效假设小概率事件实际不可能性原理是指在一次试验中,概率很小的事件实际上是不可能发生的因此当 与 之间的差异其概率小于 时(我们以 作为小概率的第一临界值),就可以认为这不是抽样误差,而是实质性差异,从而否定无效假设,现在我们将假设检验的几个步骤归纳一下:提出假设,进行试验,并计算样本平均数抽样分布的离差 u 值查相关附表,查出所得 u 值出现的概率值,并考察其是否大于预先设定的 值由小概率原理作出接受或否定无效假设的推断,并结合专业知识给出合理、科学的解释需要注意的是,当所得概率小于=0.05 以后,还需根据具体情况继续考察其是否小于=0.01,我们以一个实例来系统地说明假设检验的步骤:某品
18、种正常仔猪每 45min 红细胞沉降速度为(mm)今抽查某猪场 20 头 2月龄仔猪的红细胞沉降速度,得如下数据:22 21 20 18 25 19 21 26 23 2419 21 23 19 18 23 20 22 21 26试问,这批仔猪的红细胞沉降速度是否正常由于该例中已有总体方差,因此虽然样本较小,但应使用 u-test 进行检验,该例的核心问题是希望知道:这批仔猪在红细胞沉降速度这一性状上是否正常或:这批仔猪与正常仔猪在红细胞沉降速度这一性状上是否有所区别或:这批仔猪在红细胞沉降速度这一性状上是否属于这一猪品种因此,需要知道这批仔猪的红细胞平均沉降速度与总体猪之间是否有区别即:应检
19、查样本仔猪群的红细胞沉降速度与总体猪群之间的差异是由抽样误差所引起,还是属于真实性差异,需要注意的是,样本越小,抽样就越要有代表性,否则,所得到的结论就可能发生很大的偏差首先设立无效假设,即设:样本所在的总体仔猪群与原总体无差异 vs:样本所在的总体仔猪群与原总体不是一个总体 即设该假设可以简化为其次在无效假设已设立的基础上,计算样本平均值,并计算 u 值当然我们也可以计算样本的标准差,但这一标准差在本例中不起作用,因此可以不予考虑,经计算,得:查附表1,即标准正态分布的分布函数表,得:u=1.49 的概率为:这一概率值大于 即:因此,我们应当接受无效假设,即接受在接受无效假设的同时,就自动放
20、弃了备择假设这表示这一仔猪样本其血清镁离子是正常的对这一结果我们可以从专业的角度进行合理的解释,下面我们将这一例题系统归置一下:某品种正常2月龄仔猪每45min红细胞沉降速度(mm)为今抽查某猪场20头2月龄仔猪的红细胞沉降速度,得如下数据:22 21 20 18 25 19 21 26 23 24 19 21 23 19 18 23 20 22 21 26试问,这批仔猪的红细胞沉降速度是否正常经计算,得:,设查附表1,u=1.49 的概率为 p=0.14 0.05接受无效假设,即:这批仔猪的红细胞沉降速度属正常范围,该题也可以这样完成:设立无效假设(同前)计算接受区间:由于 处于这一接受区间
21、内,因此,应接受无效假设即:这批仔猪的红细胞沉降速度在正常范围内,接受无效假设时,就说样本平均数与已知总体平均数间差异不显著如果在 水平上否定了无效假设而接受备择假设,我们就说差异显著如果在 水平上否定了无效假设而接受备择假设,就说差异极显著,三、一尾检验和两尾检验从上面的例子我们可以看出,仔猪红细胞沉降速度的样本平均值有可能大于总体平均值,也有可能小于总体平均值即所得 u 值可能会是负值,在左边判断是接受或否定无效假设这 u 值也有可能是正值,在右边判断是接受或否定无效假设这种既要考虑左边否定区,又要考虑右边否定区,即须考虑分布曲线两边(即两尾)的检验称为两尾检验,这是由于事先我们并不知道所
22、得样本平均数是否肯定大于总体平均值,还是肯定小于总体平均值在大多数情况下,一种措施有可能其效应是正向的,也有可能是负向的,即事先我们并不知道抽样或试验的结果会朝向哪个方向,因此我们的备择假设只能是:这里的 HA,既包含了,又包含了这种两尾检验是应用最广泛的一种检验方法,但有的时候,我们的目的非常明确,即所抽样本只可能是大于总体平均值,或只可能是小于总体平均值例如:某种新型饲料添加剂只可能好于常规添加剂某些有毒物质只能对被试动物产生毒害作用,等等这一类试验的数据假设检验其备择假设只有一种情况,即只有一个否定区间(一尾)这样的假设检验就称为一尾检验,一尾检验比两尾检验更容易否定无效假设,因此应用一
23、尾检验必须有非常充分的理由在常用的假设检验中,我们一般总采用两尾检验,而对一尾检验应谨慎使用,两尾检验和一尾检验的比较:,四、假设检验的两类错误在假设检验中,接受或否定无效假设的理论依据是小概率事件的实际不可能性原理因此,所得结论并不是百分之百的正确的事实上,统计假设检验有可能犯两类错误:,如果 是正确的,即 为真,但检验的结论由于差异显著而被我们否定掉了(此时,我们须冒5%下错结论的风险),或由于差异极显著而被我们否定掉了(须冒1%下错结论的风险),因而犯了错,这一类错误就称为型错误,或称 型错误,犯型错误的概率不超过显著水平 值 犯型错误的实质就是把非真实性差异错判为真实性差异,即弃真,如
24、果无效假设 是错误的,即 为假,检验结果却发现差异不显著而被接受,同时摒弃了正确的备择假设 在统计学中,所谓的差异不显著,其真实含义是没有充分的理由否定,但也没有理由接受 但我们所执行的是非此即彼原则,因此,既然差异不显著,就必须接受 这一类错误称为型错误,或称为 型错误,型错误的概率用 表示,这里的差异不显著,有两种含义:一是样本所在总体与已知总体间的确没有差异,样本平均值与已知总体平均值间的差异纯属抽样误差二是样本所在总体与已知总体间有差异,但由于试验误差大而掩盖掉了这种差异型错误就是把真实性差异错判为非真实性差异,即虽然 是假的,但通过检验却被接受了,同时摒弃了真的,这称为存伪,不同 时
25、的 值,在统计推断中,我们作出一个判断,有两个方向的错误可能存在,这说明我们不能绝对地肯定,也不应绝对地否定某一假设因此,有一定的把握,但也有一定的犯错率,这就是统计推断的特点、统计学的概率性特征下面我们用表的形式来说明两类错误与假设的关系 接受 否定无效假设是正确的(为真)(弃真)无效假设是错误的(为假)(存伪),那么如何减小犯两类错误的可能性?1、样本容量 n 固定时,提高显著水平(取较小的 值)可减小 型错误的概率,但可能增大犯 型错误的概率(但)2、样本容量 n、显著水平 固定时,增大 与 的差距,可有效减小犯型错误的概率3、为了同时降低犯两类错误的概率,可取一个适当的显著水平,如取,增大样本容量 n;或减小总体方差;或两者同时进行,4、改进试验技术,合理、科学地安排试验设计,适当增大样本容量,可有效降低犯错的可能性(*),end,