《年生物统计学(第4章).ppt》由会员分享,可在线阅读,更多相关《年生物统计学(第4章).ppt(44页珍藏版)》请在三一办公上搜索。
1、第四章:统计推断,一节 抽样误差一、均数的抽样误差与标准误在第一章、第四节、五、中我们学习了总体与样本、抽样的概念。抽样研究的目的就是要样本的资料来推断总体的水平,这叫统计推断(Statistical inference)。是抽样研究,就存在抽样误差,抽样误差是由于样本中每个观察值的不同和差别所致,是抽样研究中不可避免的。关键是在统计推断中如何计算抽样误差,并如何在统计推断的结果中表达抽样误差的影响。,怎样计算抽样的误差呢?由于存在抽样误差,样本均数一般不会正好等于总体的均数,而且所得的各个样本均数之间也不会正好相等。,如果将对各个样本的均数(可看成新的观察值!)求标准差(称为标准误,以便与个
2、体观察值的标准差相区别),则这个新的统计量-标准误,就可以衡量抽样误差的大小:标准误越大,反映抽样误差越大;反之亦然。标准误的定义如下:总体平均数的标准误(参数)为:式中:为总体标准差,N为均数 的个数,n为某抽样样本的含量。样本平均数的标准误(统计数)为:后者是计算标准误的实用公式标准误(抽样误差)的大小与总体的标准差成正比;与样本含量的平方根成反比。,进一步研究样本平均数的分布还可以有新的发现:(见43页)数学上可以证明:样本均数的均数等于总体均数,即:样本均数的方差等于总体方差除以样本容量,即:(3.31)(3.32)如果从正态总体N(,2)进行抽样,其样本均数的总体也服从正态分布,但是
3、构成这个新正态总体的参数为:不论被抽样的总体为何种分布(例如:二项分布、几何级数分布、偏态分布),但只要能计算出均数和方差,且为大样本(n30),其均数的分布就服从正态分布。这一条被称为“中心极限定理”。(43页),进一步研究样本平均数的分布还可以有新的发现:(见43页)数学上可以证明:样本均数的均数等于总体均数,即:样本均数的方差等于总体方差除以样本容量,即:(3.31)(3.32)如果从正态总体N(,2)进行抽样,其样本均数的总体也服从正态分布,但是构成这个新正态总体的参数为:不论被抽样的总体为何种分布(例如:二项分布、几何级数分布、偏态分布),但只要能计算出均数和方差,且为大样本(n30
4、),其均数的分布就服从正态分布。这一条被称为“中心极限定理”。(43页),第三节 假设检验的原理和方法,一、假设检验(Hypothesis test)的概念假设检验又称为显著性检验(Significance test),其意义可用下例来说明。54页例题4.1:某渔场按常规方法所育鲢鱼苗一月龄的平均体长为7.25 cm,标准差为1.58 cm,为了提高鱼苗的质量,现采用一种新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65 cm,试问新的育苗方法有无显著差异?显然,这两个均数的不等有两种可能:由于抽样误差所致;由于新方法的效应所致。如何作出判断,统计学上是通过假设检验来进
5、行的。,假设检验的理论依据有两方面:事件的概率分布;小概率原理。小概率原理指的是:如果统计推断的结果表明“事件(无效假说)”发生概率p很小,例如 p0.05,则我们将这种事件称为“小概率事件”,并可以近似认为:“在这次实验中该事件不会发生”,从而否定“无效假说”,进而认为处理与效应之间“存在因果联系”;反之,如果“事件(无效假说)”发生概率超过p0.05(我们将这种事件称为“非小概率事件”),则近似认为:“在这次实验中该事件还有可能发生”,进而认为处理与效应之间“因果联系”的依据不足。,假设检验的理论依据有两方面:事件的概率分布;小概率原理。小概率原理指的是:如果统计推断的结果表明“事件(无效
6、假说)”发生概率p很小,例如 p0.05,则我们将这种事件称为“小概率事件”,并可以近似认为:“在这次实验中该事件不会发生”,从而否定“无效假说”,进而认为处理与效应之间“存在因果联系”;反之,如果“事件(无效假说)”发生概率超过p0.05(我们将这种事件称为“非小概率事件”),则近似认为:“在这次实验中该事件还有可能发生”,进而认为处理与效应之间“因果联系”的依据不足。,“小概率原理”另外的说法,可以想象如果一个事件(例如“无效假说”)的发生概率很小,那么在只进行一次实验情况下,我们可以说这个事件(无效假说)是“不会发生的”。从一般常识就可以知道,这句话在大多数情况下是正确的,但是它一定有犯
7、错误的时候,因为发生的概率再小也是有可能发生的,如同彩票中奖一样,这就是小概率原理。,假设检验首先要对样本所代表的总体提出假设,有两种统计假设:一种是“检验假设”(Hypothesis under test),或称“无效假设”(Null hypothesis),符号为H0。如本例,假设:新育苗方法与常规方法所育鱼苗一月龄体长相同(即,假设所比较的均数来自同一总体,两个均数的差异仅仅是由于抽样误差所致),无效假设是直接用于检验的假设,是对样本总体来源提出的假设,通常要加上文字进行表达。表达的格式为:假设H0:=0,即新育苗方法与常规方法所育鱼苗一月龄体长相同。另一种是“备择假设”(Alterna
8、tive hypothesis)符号为HA。如本例,假设:新育苗方法与常规方法所育鱼苗一月龄体长不相同(即,假设所比较的均数不是来自同一总体,两者均数的差异不是由于抽样误差所致,而是由于“效应”所致),表达格式为:对HA:0,二、假设检验的一般步骤 提出假设,在进行了无效假设和备择假设之后,要确定一个否定H0的概率标准,这个概率标准称为“显著水平”,记作,是人为规定的小概率界限(根据“小概率事件原理”)。生物统计学中常:取显著水平=0.05 和/或 取显著水平=0.01。选择和计算统计量(检验计算)根据资料性质的不同和不同的分析目的,应当选用不同的统计量,如u、t、F、2等等。例如本例:为大样
9、本(n30)、计量资料,目的在于判断样本均数(7.65 cm)与总体均数(7.25 cm)的差别来源,可选择u值为统计量,并采用相应的u检验的方法计算统计量。根据55/37页公式(3.34):检验计算:,二、假设检验的一般步骤 确定概率的显著水平(取显著水平),算出统计量之后,通常须查找相应的工具表来确定P值。有关的工具表都是按照各种统计量的特殊分布规律编制出来的。如本例查316页附表2 正态离差(u)值表来确定P值。推断:根据316页附表2,=0.05时,u0.05=1.96,2.5321.96,p0.05差异无显著性(NS)小概率事件:P0.05差异有显著性(*)非常小概率事件:P0.01
10、差异有高度显著性(*),确定概率范围并推断是否接受假设(推断),第四节 计量资料样本平均数的假设检验,一、大样本(n30)平均数的假设检验 u 检验,均数的标准正态分布图形,方法提要,根据 u 值表:=0.05时,u0.05=1.96:uu0.05,pu0.01,p0.01,1总体方差已知时的检验(例4.1):2总体方差未知时的检验:两个样本平均数比较的u检验(例4.4),单个样本平均数的u检验,第四节 计量资料样本平均数的假设检验,二、小样本(n30)平均数的假设检验 t 检验,(一)t 分布(t-distribution),1.t 分布 的来源 t 分布是英国Gosset 1908年以笔名
11、“Student”所发表的论文提出的,因此称为学生氏 t 分布,简称t分布。t 分布是用来描述正态资料在小样本条件(n30)下的频数分布规律的数学模型。例如:当抽取的样本尾150尾鲢鱼时(或n30),鱼塘鱼的频数分布可以用正态分布模型来计算,结果与实际情况吻合;如果我们仅抽取了 1 尾鲢鱼,我们则无法计算鱼塘鱼的频数分布(因为无分布模型可言);如果抽取鲢鱼数目介于230尾,计算条件比 1 尾鲢鱼好,但比30尾条件差(用正态分布计算,结果与实际情况不太吻合,误差较大),则可以用 t 分布描述,即 t 分布模型是正态资料从“无分布模型”向“正态分布模型”过渡的一种“过渡性分布模型”,这时用 t 分
12、布模型来计算,结果与实际情况吻合。从数学理论上可以说,t 分布与正态分布的差别是由于样本标准误不是总体标准误的无偏估计所致。,(一)t 分布(t-distribution),(一)t 分布(t-distribution),与总体标准误不同,2 t 分布的概率密度函数,式中伽马函数(z)展开式为:(实数z0)由于 t 分布的概率累计函数计算非常复杂,所以为了省去计算的麻烦,数理学家已经计算好实际需要的各个F(t)值,列于317页的附表3-t值表中。在实际统计工作中是用查表法获取t值。,2 t 分布的概率密度函数,式中伽马函数(z)展开式为:(实数z0)由于 t 分布的概率累计函数计算非常复杂,所
13、以为了省去计算的麻烦,数理学家已经计算好实际需要的各个F(t)值,列于317页的附表3-t值表中。在实际统计工作中是用查表法获取t值。,3t 分布的图象和分布特征,单峰分布,以0为中心,左右两侧对称;随样本含量n大小变化,样本越小(严格说是自由度df=n-1),t值越分散;与标准正态分布(u分布)相比:t 值的分布在中央的比例少于u值分布,在两侧的比例多于u值分布;t 值的分布图形,随样本大小变化;u值的分布则不变化;自由度df越小,t分布与u分布的差别越大;自由度df越大,t分布与u分布的差别越小;当df时,t分布的图形与u分布图形重合;和正态分布一样,t分布曲线与横轴所围成的面积也等于1;
14、t 落于区间-t0.05;+t0.05内的概率为0.95,落于区间-t0.01;+t0.01内的概率为0.99;而t0.05、t0.01叫做置信度为95%和99%的t界值。,3t 分布的图象和分布特征,3t界值表的使用方法,各种自由度下的t界值,可以从317页附表3中查到。从表中可见,在同一自由度df条件下,t值越大,P值越小。附表3中:左侧df为自由度,即为n-1;最上的横行为概率P;表中值为t值。例如:df=的t0.05为1.960,记作t0.05()=1.960;df=的t0.01为2.576,记作t0.01()=2.576。4t分布的用途 用于t检验;参数的区间估计和点估计;(3)用于
15、样本含量的估计。,(二)t 检验方法提要,317,317,317,317,成对数据平均数比较的t检验(见61页例4.9):(n为对子数),二、小样本(n30)平均数的假设检验-t检验 单个样本平均数的t检验(见57页例4.5):,1两样本的总体方差相等(见58页例4.6):计算标准误的方法不同2两样本的总体方差未知,但(见59页例4.7):计算自由度的方法不同3两样本的总体方差未知,且(见60页例4.8):计算标准误、自由度不同,成组数据平均数比较的t检验(见58页-61页):,第五节 样本率的假设检验一、单个样本频率的假设检验 方法提要:,np或nq均30时,(见63页,例4.10):用基本
16、公式 30(np或nq)5时,(见63页,例4.11):用校正公式;np或nq均5时,(本教材没有介绍方法):二、两个样本频率的假设检验 自学(实际工作中常用2检验来代替u检验),第六节 假设检验的合理性和两类错误,一、为什么要进行统计推断?判断因果关系和联系程度按因果逻辑关系,可以将许多科学研究的目的抽象为:发现或证实:某一种“处理”或者“暴露”(因)是否会导致测量结果(果)产生“显著性差别”(因果联系);发现或证实:处理与效应之间存在的数量比例关系。简而言之,就是研究某种因果关系是否成立,以及因果之间的联系程度。统计推断可以用数学的方法对研究结果作出相对合理的因果联系判断,而且这种判断是大
17、家公认的。,二、为什么说统计推断是合理的?统计推断的逻辑学/概率论基础,逻辑学的合理性 有四种常见的判断因果联系的逻辑学方法1求同法:如果被试因素出现在两组或者两组以上的观察对象中,出现的现象只有一种是共同的,那么,这个被试因素(处理)与这种共同现象(效应)之间可能存在因果联系。例如:使用了某种鸡饲料(被试因素)的饲养场,肉鸡出笼的时间都提前(效应)。我们可以怀疑这种鸡饲料是肉鸡体重快速增加的原因之一。,2差异法:如果在含有被试因素的分组(处理组,被试因素常称为“处理”或“分组标志”)中,就出现某一效应;而在不含有该因素的分组(对照组)中,则不出现这种效应(其它条件都相同),那么,这个被试因素
18、与这种效应之间可能存在因果联系。我们在统计学中学到的差异显著性检验(u检验、t检验、2检验、方差分析),都是运用这种逻辑方法。3共变法:如果在同一组观察对象身上,我们进行两种现象的观察:当某一现象(因)发生一定程度的变化时,另一种现象(果)也相应发生一定程度的变化,那么,这两种现象之间可能存在因果联系。我们即将学习的“相关与回归”统计学方法的逻辑基础就是共变法。,4剩余法(排除法):如果已知某一复合现象是另一现象的原因,同时又知道复合现象中的某一部分不是另一现象的原因,那么,前一现象的剩余部分可能与另一现象之间存在因果联系(分解复合现象)。总之:贯穿于我们统计推断的逻辑学方法主要是:差异法和共
19、变法。从逻辑学上来说,这两种方法比求同法、剩余法(排除法)更为科学、严谨,并易于进行。当然,对一组实验对象,我们可以重复使用上述的不同方法,如,求同法和差异法的共用、差异法和共变法的共用等等。,概率论的合理性,由于差异不仅会来自于“处理”,也会来自于“抽样误差”。因此在直接应用逻辑学的“差异法”判断因果联系时,我们会遇到来自“抽样误差”的干扰,无法进行正确的判断。因此,逻辑学的差异法只是给我们提供了一个判断的原理,而这个原理只有在我们排除了“抽样误差”的影响之后才是正确的。统计学上用“假设检验”来判断差异是来自“抽样误差”还是来自“处理差异”。,概率论的合理性,如果仅仅存在抽样误差,样本均数与
20、总体均数的差别就会相对较小,与0(7.25cm)的离差在95%可信区间内;而如果还存在处理所致的差别,样本均数(7.65cm)与总体均数的差别就加大,与0(7.25cm)的离差超出95%可信区间。,例如,如果p0.05(取显著水平=0.05),拒绝差别无效假设H0(即推断“因果关系”成立)100次,其中约有95次是正确的;如果p0.01(取显著水平=0.01),拒绝差别无效假设H0(推断“处理”是“效应”差别的原因)100次,其中有99次是正确的。从而保证了大多数的统计推断是正确的,这就是统计推断在概率论上的合理性。,三、统计推断有什么不足的地方?-假设检验的局限性(两类错误),然而,统计推断
21、并非是100%的正确,我们在使用统计推断时,必须了解它们的不足,即,统计推断还存在两类不可避免的错误:“错误”:弃真错误“错误”:纳伪错误。,第一类错误(又称为错误、弃真错误):即拒绝了实际上成立的H0,如下图。由于抽样的偶然性,本身来源于黄色总体,但观察值集中在较大数值的范围,均数为7.65 cm,计算出较大的u值(u=2.5321.96;p0.05),按所取的显著性水平=0.05,拒绝了无效假设H0,推断新育苗方法与鲢鱼体长增长有“因果联系”。此推断当然是错误的(发生错误的概率仅为5%)。为了使结论更为科学,故通常不说“有因果联系”,而说“有统计学联系”。,第二类错误(又称为错误、纳伪错误
22、):接受实际上不成立的H0,如下图。若样本均数确实来自于不同总体(绿色总体),但由于抽样的偶然性,观察值集中在较小的范围,均数仅为7.55 cm,进入了黄色总体接受区(推算出较小的u值,u=1.901.96),按所选定的显著性水平=0.05,接受了无效假设H0,推断两种育苗方法的差别仅仅是“抽样误差”。此统计推断也当然是错误的。,两类错误的区别和联系:两者的区别是,第一类错误只有在否定H0时才发生,而第二类错误只有在接受H0时才会发生。两者的联系是,在样本相同的情况下,减少第一类错误(将从0.05变为0.01)就会增加第二类错误。反之减少第二类错误(将从0.05变为0.1)就会增加第一类错误。
23、减少犯错误的方法:将不能定的太高或太低,以0.05较为合适:先进行=0.05的检验,发现差别有显著意义之后,再做=0.01的检验(不应该直接做=0.01的检验);尽量减小标准误的数值,方法有:尽量增加样本量、采用合理的实验设计、采用准确的实验技术。,第七节 双尾检验与单尾检验,通常我们做研究的人喜欢p0.05,结果常常令人感到非常可惜。这个时候,有的人就会玩狡猾,采用所谓的“单尾检验”,因为单尾检验的u0.05是1.64,而不是1.96。应用单尾检验,上述的u值(1.70、1.80、1.90)都可以令p0.05。例如“我们已知新药的疗效不可能低于旧药”,故定义H0:0,采用单尾检验。我个人认为采用单尾检验的理由有“狡辩”之嫌。在做生物学研究的数据分析时,最好不要采用它。我个人从来不采用单尾检验。如果一定想要采用,就应该将统计量的数值(例如u值)也在论文中交代出来,不能模棱两可,让别人误会你用的是双尾检验。,第四章作业课,78页:习题4.178页:习题4.278页:习题4.378页:习题4.578页:习题4.6(单样本资料t检验)SPSS/Origin78页:习题4.7(成组资料u检验)79页:习题4.10(配对资料t检验)Excel/Origin,Thats all for today!,Thanks,