01第一节 显著性检验的基本原理.docx

上传人:牧羊曲112 文档编号:3139462 上传时间:2023-03-11 格式:DOCX 页数:17 大小:44.05KB
返回 下载 相关 举报
01第一节 显著性检验的基本原理.docx_第1页
第1页 / 共17页
01第一节 显著性检验的基本原理.docx_第2页
第2页 / 共17页
01第一节 显著性检验的基本原理.docx_第3页
第3页 / 共17页
01第一节 显著性检验的基本原理.docx_第4页
第4页 / 共17页
01第一节 显著性检验的基本原理.docx_第5页
第5页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《01第一节 显著性检验的基本原理.docx》由会员分享,可在线阅读,更多相关《01第一节 显著性检验的基本原理.docx(17页珍藏版)》请在三一办公上搜索。

1、01第一节 显著性检验的基本原理第一节 显著性检验的基本原理 一、显著性检验的意义 为了便于理解,我们结合一个具体例子来说明显著性检验的意义。随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下: 长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7 经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数个平均数的差值-=9.2头,标准差S2=1.549头。能否仅凭这两=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因

2、为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。由于抽样误差的随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差。对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。 两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往

3、往是无限总体,或者是包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为均数为均数、,试验研究的目的,就是要给,大白猪经产母猪产仔数的总体平、是否相同做出推断。由于总体平作为检验对象,未知,在进行显著性检验时只能以样本平均数、)作为检验对象。 更确切地说,是以2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。 2、样本平均数是总体平均数的无偏估计值,即E=。 3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。 所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平

4、均数是否相同是有其依据的。 由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差的不可避免性。若对样本观测值的数据结构作一简单剖析,就可更清楚地看到这一点。 通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值由两部分组成,即=+。总体平均数反映了总体特征,表示误差。若样本含量为,则可得到个观测值:,,。于是样本平均数=+。说明样本平均数并非总体平均数,它还包含试验误差的成分。 对于接受不同处理的两个样本来说,则有:=这说明两个样本平

5、均数之差也包括了两部分:一部分是两个总体平均),叫做试验的处理效应;另一部分是试)。也就是说样本平均数的差包含有试验误差,它只、是否相同下-)验误差就对总体平均数结论是不可靠的。只有通过显著性检验才能从中提取结论。对主要由处理效应首先对试验样本所在的总体作假设这里假设=或-=0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:-=1.8头是试验误差,处理无效,这种假设称为无效假设:=或-=0。无效假设是被检验的假设,:=或-=0的同时,相。备与,记作通过检验可能被接受,也可能被否定。提出应地提出一对应假设,称为备择假设,记作择假设是在无效假设被否定时准备接受的

6、假设。本例的备择假设是或-:0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数与不相等或之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。 在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率对于上述例子,研究在无效假设成立的前提下,统计量的抽样分布。经统计学研究,得到一个统计量t: 其中=叫做均数差异标准误;、为两样本的含量。 -1)+(-1)的分布。 所得的统计量t服从自由度df=是多少?查附表3,在df=+(-1)=+=18时,两尾概率为0.05=2.878,即: =2.101,两尾概率为0.

7、01的临界t值:P=P+P=0.05 P=P+P=0.01 由于根据两样本数据计算所得的t值为2.426,介于两个临界t值之间,即: t0.052.426t0.01 所以,|t|2.426的概率P介于0.01和0.05之间,即:0.01P0.05。 如图5-1所示,说明无效假设成立的可能性,即试验的表面效应为试验误差的可能性在0.010.05之间。 根据“小概率事件实际不可能性原理”否定或接受无效假设上章曾论及:若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一

8、原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设:=,接受备择假设:,即认为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设接受备择假设:=。 =,试验的表面效应是试验误差的概率在:=,从而接受和:。成立的可能性大,不能被否定,因而也就不能本例中,按所建立的0.010.05之间,小于0.05,故有理由否定可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数不相同。 综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,

9、这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的统计推断是不可忽视的。 三、显著水平与两种类型的错误 在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平,记作。在生物学研究中常取=0.05或=0.01。对于上述例子所用的检验方法来说,若|t|0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“|t|”或不标记符号;若

10、 ,则说明试验的表面效应属于试验误差的概率P在0.010.05之间,:=,与即0.01P0.05,表面效应属于试验误差的可能性较小,应否定接受:,统计学上把这一检验结果表述为:“两个总体平均数差异显著”,在计算所得的t值的右上方标记“*”;若|t| ,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P0.01,表面效应属于试验误差的可能性更小,应否定:=,接受与:,统计学上把这一检验结果表述为:“两个总体平均数右上方标记“*”。 这里可以看到,是否否定无效假设差异极显著”,在计算所得的t值的:=,是用实际计算出的检验统计量t,则在水平上否定。区间和的绝对值与显著水平对应的临界t值:=

11、;若|t|),布密度曲线;右边曲线是它们构成的抽样 为真时,恰恰在成立时的接受域内,这样,实际是从本,经显著性检验却不能否定0总体抽的样,因而犯了型错误。犯型错误的概率用表结合起来才有意义。示。误概率值的大小较难确切估计,它只有与特定的一般与显著水平、原总体的标准差、样本含量、以及相互比较的两样本所属总体平均数之差-等因素有关。在其它因素确定时,值越小,值越大;-越大、越小,值越小。 反之,值越大,值越小;样本含量及由于值的大小与值的大小有关,所以在选用检验的显著水平时应考虑到犯、型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。若一个试验耗费大,可靠性要求高,不允许反复

12、,那么值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到0.1,甚至放宽到0.25。 在提高显著水平,即减小值时,为了减小犯型错误的概率,可适当增大样本含量。因为增大样本含量可使分布的方差2变小,使图5-2左右两曲线变得比较“高”、“瘦”,叠加部分减少,即值变小。我们的愿望是值不越过某个给定值,比如=0.05或0.01的前提下,值越小越好。因为在具体问题中含量的大小。 图5-2中的1-称为检验功效或检验力,也叫把握度。其意义是当两总体确有差别时,按水平能发现它们有差别的能力。例-和相对不变,所以

13、值的大小主要取决于样本如1-=0.9,意味着若两总体确有差别,则理论上平均100次抽样比较中有90次能得出有差别的结论。 两类错误的关系可归纳如下: 表5-1两类错误的关系 客观实际 成立 不成立 否定接受型错误 推断正确 推断正确 型错误 四、双侧检验与单侧检验 在上述显著性检验中,无效假设备择假设中包括了或,即新配套技术的实施使产蛋量有所提高。检验的目的在于推断实施新技术是否提高了产蛋量,这时的否定域在t分布曲线的右尾。在水平上否定域为如图5-4A所示。若无效假设为=,备择假设的否定域为为;t检验计算公式为: 如果不能否定无效假设,可以认为喂高质量的号饲料得失相抵,只有当 达到一定程度而否定了,才能认为喂号饲料可获得更多的收益。 (五)结论不能绝对化。经过显著性检验最终是否否定无效假设则由被研究事物有无本质差异、试验误差的大小及选用显著水平的高低决定的。同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。否定时可能犯型错误,接受时可能犯型错误。尤其在P接近时,下结论应慎重,有时应用重复试验来证明。总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。 此外,报告结论时应列出,由样本算得的检验统计量值,注明是单侧检验还是双侧检验,并写出P值的确切范围,如0.01P0.05,以便读者结合有关资料进行对比分析。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号