第五章假设检验.ppt_三一办公31ppt.com

资源描述

《第五章假设检验.ppt》由会员分享，可在线阅读，更多相关《第五章假设检验.ppt（43页珍藏版）》请在三一办公上搜索。

1、励淬拓吼聘避雍忱礁蓟领洗卵蔽富淑倡吧对旧仁夕问举漠秸伪沿钓沟畦杉第五章假设检验第五章假设检验,第五章均数差异显著性检验t检验,学习要求了解显著性检验的意义及均数差异显著性检验中u检验和t检验各自应用的条件。理解显著性检验原理，尤其是接受或否定无效假设的原理；掌握总体均数和样本均数，两样本均数（配对和非配对），百分数资料差异显著性检验的步骤和方法。重点与难点重点：显著性检验的原理，t检验的步骤和方法难点：显著性检验的原理思考题及作业 1、样本平均数抽样总体的分布与参数和起始总体间有何关系?2、什么是样本标准误？有何作用？它与样本标准差有何区别与联系？3、显著性检验的基本步骤是什么？何谓两

2、类误差？4、什么是总体平均数、总体百分数P的点估计与区间估计？5、习题作业：标准化综合测试题第五章111题。参考书盖钧镒(主编).2000.试验统计方法。中国农业出版社.6596页,羌抨恨蛾芋塔板沥瞪吱斋左喝还籍绎行峦载津种鼠民侨鲁铂险咎悔酿决络第五章假设检验第五章假设检验,第一节显著性检验的意义,我们结合一个实际例子来说明。随机抽测10头长白猪和10头大白猪经产母猪的产仔数，资料如下（单位：头）：长白 11 11 9 12 10 13 13 8 10 13 大白 8 11 12 10 9 8 8 9 10 7 记10头长白猪经产母猪的产仔数平均数为，10头大白猪经产母猪的产仔数平均数为，

3、容易算出：=11头，=9.2头，s1=1.76头，s2=1.549头平均数相差为：119.2=1.8（头）是否仅凭这个样本平均数的差异1.8头就简单地给这两个样本所在的总体平均数下结论说：长白猪经产母猪的产仔数平均头数肯定比大白猪经产母猪的产仔数高呢？在未经过差异显著性检验之前，我们只能回答：不一定。事实上，这个资料仅是有关总体的一个样本。长白猪的10个数据，是长白猪经产母猪产仔数总体的一个样本。长白猪的10个数据并不全部大于大白猪的10个数据。如果再随机抽测10头长白猪、10头大白猪经产母猪产仔数，我们又可以得到一个样本资料。两个样本平均数之差也许就不是1.8头而是别的数字了。试验研究的目的

4、不在于了解样本的结果，而在于通过样本来推断总体，给总体作出全面的结论。对于上述资料来说，就是要通过所获得的样本资料对长白猪、大白猪经产,帮沸裹嫡畅疵芦燎疡汐茬备丁芳残忙出愚狮断残便笼氨藩把绰烁续痉巷米第五章假设检验第五章假设检验,以什么作为检验的对象呢？在统计学中，以样本平均数作为检验的对象，确切一点说，是以样本平均数的差异的大小来对样本所在的总体平均数1、2是否相同作出推断的。为什么以样本平均数作为检验对象呢？这是因为：1前面已证明离均差的平方和(x)2最小，表明样本平均数与样本中各个变数相差最小，平均数是资料的代表数。2统计学已证明，样本平均数是总体平均数的无偏估计值即的数学期望是

5、。3根据统计学中的中心极限定理，样本平均数服从或逼近正态分布。正因为样本平均数具有上述特性，我们才以样本平均数作为检验对象，由两个样本平均数差异的大小来推断两个样本所在总体的平均数是否相同。显然不能以样本中的各个变数作为检验对象，由两个样本各个变数间的比较来进行推断。,为什么不能仅凭样本平均数差异的大小，直接对样本所在总体的平均数是否相同下结论，而必须经过检验呢？这是因为：在试验研究中，虽然我们尽量排除各种偶然因素的干扰，以突出试验处理结果，但实际的情况常常是：即使是同一个处理的不同重复的观察值还表现不同，说明试验总会受到一些偶然因素的影响而产生试验误差。也就是说，我们所得到的观察值仅是试验

6、的表面结果，它除了包括试验处理的理论值（即试验处理观察值总体的平均数）外，还包括试验误差。设有一个样本，是某一试验处理的n次,母猪产仔数总体作出一个全面的结论。设长白猪经产母猪产仔数总体的平均数为1，大白猪经产母猪产仔数总体的平均数为2。均数差异显著性检验的目的，就是给1与2是否相同作出统计推断。,钎涸归丸私敝汤斜住贷命真观益网朔疤雌烫掌靖杨极磐当闺萄驰从稼浴辨第五章假设检验第五章假设检验,重复观察值；其数据为x1，x2，xn，假定该试验处理的理论值为。第i次重复的观察值中所包括的试验误差为i，。则第i次重复观察值可表示为 xi=+i（i=1，2，n）该样本平均数为,表明，样本平均数并不

7、等于样本所在总体的平均数，它还包含有试验误差。,因为所以两个样本平均数的差：可以表示为：,这个结果表明，在样本平均数的差中，包含了两部分：一部是两个总体平均数的差，叫做试验的处理效应；一部分是试验误差，也就是说样本平均数的差也受试验误差的干扰，我们把叫做试验的表面效应。因而，当我们从中提取结论时，就不能不分析试验的表面效应主要是由于试验的处理效应或主要是由于试验误差所引起。我们的目的是对1与2。是否相同即试验处理效应是否存在作出推断。然而1，2常常不知道，但由于试验的表面效应是可以计算的，试验误差是可以估计的，于是我们只能从试验的表面效应与试验误差的权衡比较中对试验处理效应是否存

8、在作出结论。显然，仅凭样本平均数差异即试验的表面效应的大小就下结论是不可靠的。,为了能通过试验了解试验处理（如品种、饲料种类、饲料用量等）的效应，并从试验的表面效应与试验误差的权衡比较中对试验的处理效应作出可靠的结论，,入鸥蛊掠蹭确但阔衬仍缩判疚槐道寐釜敢平瑰蹄威责谩闯旁牢层氦渔醇垮第五章假设检验第五章假设检验,对试验设计、试验的实施、观察记载，试验结果的统计分析提出了如下要求：1要求合理地进行试验设计，准确地进行试验和观察记载，尽量降低试验误差，避免系统误差，使试验结果（样本）能够代表总体，并能从试验数据中得出试验处理效应和试验误差的无偏估计。进行合理的试验设计以提高试验精确性的方法将在第十

9、二章中详细介绍。2要求合理地分析试验结果，从而获得有关总体的正确的统计推断。这是统计学中显著性检验所要讨论的问题。这一章我们将以非配对试验时均数差异显著性检验t检验为例，说明显著性检验的基本原理。先介绍所要用到的两个重要分布平均数的抽样分布与t分布。然后介绍显著性检验的基本步骤。,第二节样本平均数的抽样分布与t分布,一、样本平均数的抽样分布设有一个总体，总体中的各变数记为x，总体平均数为标准差为。现从这个总体随机抽取一个含量为n的样本，该样本的平均数记为；再从这一总体随机抽取一个含量为n的样本。第2个样本的平均数记为；类似地，我们还可以从这一总体中抽取第3个、第4个，第k个，含量为n的样本，

10、其平均数分别记为，和，。这些样本平均数不一定等于总体平均数，常常表现不同程度的差异。这种差异是由随机抽样所造成的，统计上称为抽样误差。样本,平均数也是一个随机变量，有其概率分布。样本平均数的概率分布叫样本平均,狗挨郁抨凋妖队茄盎铲续宙毙河佬热肌梧咽吹淑酪搔奇谅惋顾战换茁伞聚第五章假设检验第五章假设检验,数的抽样分布。由样本平均数构成的总体叫样本平均数抽样总体，其平均数记为，标准差记为，是样本平均数抽样总体的标准差，简称为标准误，它表示了平均数抽样误差的大小。统计学已证明总体的两个参数与x总体的两个参数有如下关系：,=；（n为样本含量）,上述关系我们用一个具体的抽样试验来验证。设有一个总体

11、包含以下4个变数：x1=1，x2=2，x3=3，x4=4；N=4，该总体的平均数，标准差为=x/N=（1+2+3+4）/4=2.5；2=x2(x)2/N/N=(12+22+32+42)102/4/4=5/4=1.25,注意，这里的总体由4个变数组成，在求方差2时，分母不应是N1。我们从这个总体中每次抽出两个变数组成一个样本。每抽一个数字记下后放回，共可得42=16个样本。16个样本及其平均数如下：,喝十削苏讹互纳除盅肠侮夫乘坑伶禽筷憾科忠什势扼橡发连约彝轨部暖瓷第五章假设检验第五章假设检验,16个样本平均数的次数分布表如下：表51 16个样本平均数的次数分布表,这就验证了的正确性。表明：标准

12、误的大小与总体标准差。成正比，与样本含量、的平方根正反比。样本越大，试验结果所得均数的抽样误差越小，即试验的精确性愈高，样本的代表性就愈强。,样本平均数抽样总体共包含16个平均数，根据表51可以计算出平均数，标准差：,很舒厄窃普孔措檀擞缴继酮造自捷把卜狄袱死荔坡踊臼瘩升朽措栽新摇各第五章假设检验第五章假设检验,1若随机变量x。服从正态分布N(，2)；x1，x2xn是由x总体得来的随机样本，则统计量=x/n的概率分布也是正态分布，且，即服从正态分布N(,2/n)。2若随机变量x的平均数是，方差是2(不一定是正态分布)，x1，x2xn是由此总体得来的随机样本，则统计量=x/n的概率分布，是当n相

13、当大时，逼近正态分布N(,2/n)。这两个结果保证了样本平均数的抽样分布服从或者逼近正态分布。当xN（，2），则。由于，因此x的分布密度曲线与的分布密度曲线有共同的对称轴，但前者比后者“高”、“瘦”，见图51。,图51从正态总体抽取的样本平均数的分布,概率论中的中心极限定理的下述两个结果。指出了x变量与变量概率分布间的关系：,启尿杀宗癣笆阅篙琳猛阿唐绰揉噶氯瘦稀挝哮誉惦梳佑奖跃沛杂帆图凭列第五章假设检验第五章假设检验,上面所说的都是相应总体的参数，在实际工作中，常常不知道。因而。也常常不知道。通常是用样本标准差S估计总体标准差，于是,也就用估计。记叫样本标准误，它是的估计值，即平均

14、数抽样误差的估计值。设一个样本包含n个变数：x1，x2，xn，则公式（51）是常用的计算公式之一。,（51）,样本标准误和样本标准差是有区别的。样本标准差表示样本中各个变数的变异程度。对于同性质且平均数相同的资料，标准差大表示该资料各变数的变异程度大，标准差小表示该资料各变数的变异程度小；而样本标准误是样本平均数的标准差，它是样本平均数抽样误差的估计值。标准误的大小表示样本平均数精确性的高低。对于同性质且平均数相同的资料，标准误大说明样本平均数的精确性低，标准误小，说明样本平均数的精确性高。,二、t分布前面已说过，若随机变量x服从N（，2）。则样本平均数服从,，其中。对于服从正态分布的随

15、机变量，我们也可按第四章中介绍的方法，将其标准化。令,筏粮兽硼挡托撒享日簧属遣岂睛齿熄毯溪们儒锡倦烧响蹭添侦羌粮隧晃臀第五章假设检验第五章假设检验,则随机变量u服从标准正态分布N（0，1）。如果总体平均数、总体标准差已知，则对任一样本平均数均可以计算出u值。于是，我们根据u服从N（0，1）就可进行有关的统计推断了，这就是所谓的u检验。然而总体标准差常不知道，需要用样本标准差来估计，需要用来估计。于是，我们得到一个新的统计量；令：t也是一个随机变量，它不服从 N（0，1）分布。有关的统计检验就不能借助于 N（0，1）分布进行u检验了。,随机变量t的概率分布叫t分布。其分布密度函数为：,我们看

16、到，t分布因样本自由度df=n1的不同而不同，其分布密度曲线是一组曲线。可以证明，随机变量t的平均数为0，且分布密度曲线以y 轴为对称，形状很像标准正态分布密度曲线而稍扁平，顶部略低，尾部略高（见图52）。当n30时。t分布接近标准正态分布；当n时，t分布与标准正态分布合一，即,其中，(P0)为伽马（Gamma）函数。由分布密度函数f(t),肋狭瘁讲赵梳烹拧仓酌整钓市史挽粱跪魁问四恳移钓娃踢弯妹剖鹏寿豹炉第五章假设检验第五章假设检验,t分布当n时的极限分布为标准正态分布。因t分布具有上述特性。因而人们有时把n=30作为大小样本的界限；n30为小样本，n30为大样本。,图52 t分布与标准正态分

17、布密度曲线比较图,由于t分布受自由度的制约，所以t值在某个范围内取值的概率也随自由度的不同而不同。t分布的两尾概率见附表3，根据样本自由度df=n1可以查到对应于两尾概率的t值（叫临界t值）。t分布在小样本资料的统计推断中有着广泛而重要的应用。例1某品种成年猪体重总体的平均数=100kg，总体标准差未知，从n=16的一个样本计算得样本标准差S=20kg。试计算由随机抽样所获得的,与相差12.45kg以上的两尾概率。即计算大于112.45kg与小于87.55kg的概率。要求计算的概率是,茨锣乐管亿扒存舞牺脓蹭象践麦为交层昏篓弓廓洋井疥傣绚破撑亲就疵议第五章假设检验第五章假设检验,p(112.4

18、5)=p(10012.45)=p(|100|12.45)。这里因为总体标准差未知，用样本标准差S估计，因而应利用t分布进行计算。,P(112.45)=P(|100|12.45)=(|100|/5)(12.45/5)=P(|t|2.49)。,查t值表，当 df=15时，与 2.49相对应的两尾概率为 0.025，于是 p(112.45)=P(|t|2.49)=0.025 即，随机抽样所得的样本平均数与相差12.45kg以上的两尾概率是0.025（见图53）。,图53 与100相差12.45以上的两尾概率,轰脚垄坚纹甥姻陌青务航踢弱扼剃唉恭容喧姜券话维泥渤邮娶狞总握讶贮第五章假设检验第五章假设检

19、验,x1112,x1N(1，12),x2N(2，22),x2222,假设:1=2，用s合估计后得t值,平均数差数的抽样分布,坐益隐刘血盟演麓衬境兑柬贿钠艺铆而漾辛屁雍刺堰诽贼封骋客师麓茫惫第五章假设检验第五章假设检验,第三节显著性检验的基本步骤,t分布的特性,复习,显著性检验一般有三个步骤。我们结合第一节中的例子进行介绍。1首先对试验样本所在的总体作一个假设。对于第一节中的例子，先假设长白猪经产母猪产仔数的平均数1，等于大白猪经产母猪产仔数的平均数2，即假设1=2或12=0，也就是假设两个样本平均数的差（试验的表面效应）属于试验误差。我们所作出的这种假设常常称为无效假设（或称为解消假设）。意

20、味着所比较的两个总体平均数间没有差异，即试验处理效应12为0，无效假设是待检验的假设，该假设有可能被接受，也有可能被否定。我们所作出的无效假设记为H0：1=2。提出无效假设时，相应地还应提出一对应假设（或称为备择假设）。对应假设是无效假设被否定时，准备接受的假设。对于我们所讨论的例子，对应假设应为：长白猪经产母猪产仔数总体的平均数1不等于大白猪经产母猪产仔数的平均数2的。记为HA：12。通过检验，若否定无效假设，我们就接受对应假设。,咀挽简拒睫躬罢韵肯醒宰链栖虱烽翰肪媳夸境逊雏吻丈魏妨人搽狄灌付磷第五章假设检验第五章假设检验,2在上述无效假设成立的条件下，研究试验所得的统计数的抽样分布。这里，

21、我们研究无效假设H0：1=2成立的条件下，两个样本平均数的差的抽样分布，经过研究，我们能得到一个df=(n11)+(n21)（n1为第一个样本含量，n2为第二个样本含量）的t分布：,，df=(n11)+(n21)。,其中叫做均数差异标准误。,于是，我们可以根据两个样本的数据，计算出与，进而计算出t值。对于所讨论的例子，经计算,下面我们来估计|t|2.426的两尾概率，即估计P（|t|2.426）是多少。查t值表（附表 3）：在df=（nl1）+（n21）=（101）+（101）=18时，两尾概率为0.05的临界t值为2.101，即 P（|t|2.101）=P（t 2.101）+P（t2.

22、101）=0.05；今计算得的t值为2.426，即 tt0.05(18)说明|t|2.426的概率小于0.05，即.P0.05见图54。也就是说，试验的表面,喀糟捂催第诉梦怜说诀趋奇哈彬冕字弦其梅盛堆浮吻嫁畅座矣姿貌麻谭匪第五章假设检验第五章假设检验,效应属于试验误差的概率小于0.05。,图54|t|2.426的两尾概率 3根据小概率事件实际不可能性原理否定或接受无效假设。当事件的概率很小时，我们可以认为在一次试验中，该事件几乎不可能发生。例如，当试验的表面效应属于试验误差的概率小于0.05时，我们可以说，在一次试验中，这个试验的表面效应不可能属于试验误差所引起，这主要是由于存在试验处理效应

23、的缘因。因而否定原先所作出的无效假设H0：1=2，即否定试验表面效应是随机误差的假设，此时就承认对应假设HA：12，即承认试验处理效应是“显著的”。当然，如果所估计的两尾概率大于0.05，说明试验表面效应是试验误差的可能性较大，即原先所作出的无效假设H0：1=2成立的可能性较大，不能否定H0：1=2，从而不能接受HA：12，我们就说试验处理效应是“不显著的”。,权饮凿适坡通讨钻四闻塔凸农附萧鉴肩苦帕湍琳料硝西杠忱码诬劫李寐兽第五章假设检验第五章假设检验,上例中，试验表面效应为试验误差的概率小于0.05，所以否定无效假设H0：1=2，接受对应假设HA：12。就是说，长白猪经产母猪产仔数总体的平均

24、数与大白猪经产母猪产仔数总体的平均数是不相同的。现有的两样本均数间的差异1.8不是误差引起的效应。到此为止，显著性检验的三个步骤才算完成。对于我们所举的例子，还有以下几点说明：1我们所举的例子属于“非配对试验”，对于这种“非配对试验”结果，有相应的统计分析方法。前面介绍的就是“非配对试验时均数差异显著性检验t检验法”。有关“非配对试验”、“配对试验”，后面还要专门介绍。2进行显著性检验时，无效假设和对应假设的选用，决定了采用两尾概率或是一尾概率进行检验。若无效假设为H0：1=2，对应假设为HA：12。此时，对应假设有两种可能性。或12，或12，相应的t检验用t分布的两尾概率，这类检验称为两尾检

25、验。一般，若比较两种试验处理。事先不知道谁优谁劣，分析的目的在于确定两种试验处理有无差别，就用两尾检验。若无效假设为H0：12，对应假设为HA：12（或无效假设为H0：12，对应假设为HA：12），这时对应假设仅有一种可能性，相应的t检验用t分布的一尾概率，这类检验称为一尾检验。一般，如果已知甲处理不会比乙处理差，分析的目的在于确定甲处理是否比乙处理好，则用一尾检验。此时无效假设可为H0：甲乙（或H0：乙甲），对立假设为HA：甲乙(或HA：乙甲)。附表中的t值表给出的是两尾概率，用于两尾检验。今后若不作特别申明，所进行的t检验一般指两尾检验。若需要进行一尾t检验，也可用两尾概率的t值表查一尾,

26、岔晰方涣膳汁鸥螺浇朝悬乱足靳睁缨与聋淀亡芥栓眼畅店某盒穴径稚至梨第五章假设检验第五章假设检验,第四节显著平准与两类误差,检验的临界t值，此时，一尾检验的t0.05=两尾检验的t0.10；一尾检验的t0.01=两尾检验的t0.02，余类推。3统计检验中的“显著性”在这里是否定无效假设H0：1=2，接受对应假设HA：12，这只意味着试验处理效应确实存在，但它并不表示这种效应在实际应用上的重要程度。统计分析结论的应用，还应与经济效益等结合起来综合考虑。,显著平准:用来进行显著性检验的小概率叫显著平准，记为。统计上常用,显著平准,因为显著性检验否定或接受无效假设的依据是“小概率事件实际不可能性原理”

27、，所以我们下的结论是没有百分之百把握的。譬如经t检验“差异显著”，我们的结论有95的把握，同时要冒5下错结论的风险；经t检验“差异极显著”，我们的结论有99的把握，同时要冒1下错结论的风险；而经t检验“差异不显著”，在统计上是指“没有理由否定无效假设H0：1=2，也没有理由接受对应假设HA：12，同样要冒下错结论的风险。显著性检验是一种“概率性质的反证法”。事实上，显著性检验有可能出现两种类型的误差：,聂硅行醚瞥楔幻嗣矢挟泪信彰洒呀政见蛆靠慧积搔涕玄刨毋藕筋柴猩宰矢第五章假设检验第五章假设检验,两类误差,犯型错误的可能性随|12|的减小或试验误差的增大而增大，因|12|越小或试验误差越大，越容

28、易将试验的表面效应错判为试验误差（图55）。,图55 关于型误差与型误差的图解,轨慰乡卓植仪辫税瀑扛欧楼如乙鸟蹄寂絮拔戈热吐厉尉份医飞挞俱摔铀勋第五章假设检验第五章假设检验,我们可以选数值小的显著平准以降低犯型误差的可能性，但与此同时也增大了犯型误差的可能性。所以，显著性检验的显著平准的选用，从统计上应考虑到犯两类误差的可能性。在实际应用时，还需考虑进行试验的难易，试验结果的重要程度。若一个试验耗费大，可靠性要求高。不容许反复，那么，显著平准应该取得小些；又当一个试验结论的使用事关重大，值也应该取得小些。对于生物方面的试验，由于试验条件、试验单位（田间试验的小区，动物试验的个体等）不可能控制完

29、全一致，试验误差较大。为了减少犯型误差的可能性，也有选显著平准为0.10、0.20甚至0.25的（注意，在选用这些显著平准时，须予以注明）。在选取数值小的显著平准时，为了减少犯型误差的可能性，可适当增加试验处理的重复次数（即样本含量），以降低试验误差；提高试验的精确性。我们通过“非配对试验均数差异显著性检验t检验”的例子介绍了显著性检验的基本原理和步骤。统计学中的显著性检验，除t检验外，还有2检验，方差,分析中的F检验与多重比较LSD法、LSR法等，这将在以后各章中逐一介绍。以后在介绍这些统计检验方法时，不再如这里这样详细介绍其基本原理。只着重于基本步骤和方法的介绍。,炉催贞定抠涩茅摄滓抉灼聂

30、遂沤习园禽痈蝎酒藐再献墓昌部滁触蚀篆桂欢第五章假设检验第五章假设检验,第五节样本均数与总体均数差异显著性检验t检验,复习：显著性检验,步骤,在实际工作中，有时我们需要检验一个样本是否来自某一个总体。例如，猪的怀孕期一般是114天。但我们实际调查若干头母猪，它们的怀孕期不一定恰好都等于114天。这时，我们可以检验这若干头母猪的平均怀孕期与114天差异是否显著。若检验结果，差异显著，譬如显著提前，则应进一步寻找引起早产的原因，以采取相应措施。又如，某品种成年母水牛的体高，根据历年的观察记载，平均体高是131cm。现随机抽测了若干头该品种成年母水牛的体高。也可将这若干头该水牛体高的平均数与131c

31、m进行比较，检验差异是否显著。若检验结果差异不,颂篷放域氟敬啮唱患轨簇糙鸟琴刀遁绵岳编侧巢诞撒沛大淫认椽盔嚼匣旺第五章假设检验第五章假设检验,显著，说明该品种成年母水牛的体高未有实质性改变，随机抽测的成年母水牛体高样本，可以认为是来自原成年母水牛体高总体。这一类问题就是样本均数与总体均数差异显著性检验问题。这类问题的一般提法是：设有一个样本：xl，x2，xn。检验该样本均数与已知的总体均数0问差异是否显著。这类问题的解决，应采用下述t 检验法：,无效假设为H0：=0 对应假设为HA：0 其中，为样本所在总体平均数，0为已知的总体平均数。根据上述无效假设与对应假设应进行两尾检验，t的计算公式为

32、：,（52）,下面结合实例说明进行样本均数与总体均数差异显著性检验的实际步骤。例2随机抽测某品种7头成年母水牛体高，测得的数据为137、133、136、129、133、130、131cm。根据历年观察记载，该品种成年母水牛体高总体平均数为131cm。试检验所得的样本平均数与总体平均数差异是否显著。在这个问题中，可计算得样本平均数=132.7cm，已知的总体平均数0=131 cm，样本含量n7。实际检验时。可将提出无效假设和对应假设这一步略去，而按如下步骤进行。,其中，为样本均数。0为已知的总体均数，为样本标准误，n为样本含量。,襄田足糙拐索流摆捡酶径炳旗斋戒禹虏倔糕湍懈胎铣释凿谤形钦虽徊喧盒第

33、五章假设检验第五章假设检验,表52 样本标准误计算表,2、计算t值,3、由df=n1查临界t值：t0.05，t0.01，将计算所得的 t值的绝对值|t|与 t0.05，t0.01比较，作出统计推断。因为df=n1=7l=6，查t值表，得t0.05(6)=2.447，而|t|=1.50t0.05(6)=2.447，即P0.05，表明样本平均数=132.7cm所在总体平均数与已知总体平均数0=131 cm差异不显著，或简单叙述为：样本均数与已知总体均数差异不显著，可以认为该样本是来自成年母水牛体高平均数为131cm的总体，即该品种成年母水牛体高未发生实质性改变。,1、计算样本标准误,鼠鹿片累传莲

34、凝仿锻粉铁包褥肺勒乞撞况推造计砚蓖变镊崩无绣椅疏征冈第五章假设检验第五章假设检验,第六节两样本均数差异显著性检验t检验,在实际实验中，经常要进行两个处理平均数间的比较。进行两个处理的比较试验时。有两种试验设计方式；一种是两个处理的试验单位（如畜牧试验的试验动物）是配对的，所得的两个样本观察值间也是配对的。另一种是两个处理的试验单位是相互独立的，非配对的，所得的两个样本观察值也是相互独立，非配对的。由于试验设计的方式不同，对试验结果进行统计分析的方法也不同。现分别介绍如下。一、非配对试验两个样本均数差异显著性检验t 检验所谓两个试验处理非配对试验设计，是指将试验单位完全随机地分两组，各实施一试

35、验处理。这种设计方式也叫两个试验处理的完全随机设计。采用这种设计方式，两组的试验单位相互独立，因而所得的两个样本观察值也相互独立。非配对试验结果的符号表示为：,现在的任务是通过（）推断两样本所在的总体平均数1与2，是相同或简单地叙述为检验两个样本均数差异的显著性。采用t检验法如下。,胖悼然设婆冀纯窄瓮中亩忱哭狈童遗泛锻姐捶缓夏鞠仍埔资帚本蚂怔鼓捌第五章假设检验第五章假设检验,无效假设为 H0：1=2 对应假设为HA：12其中，1为第一个样本所在总体的平均数；2为第二个样本所在总体的平均数。根据上述无效假设与对应假设，应进行两尾t检验，t的计算公式为,，df=(n11)+(n21)（53）,其中

36、,当nln2n时。公式（5一4）变为,（54）,（55）,碰答短惜惧父龄尊残舜杜廖桂坝伟遵耗沂跨开枉捶藐溢啸渔隧弓密染赂汲第五章假设检验第五章假设检验,叫均数差异标准误。为第一个样本均数，为第二个样本均数；n1为第一个样本含量，n2为第二个样本含量；xl为第一个样本各变数，x2为第二个样本各变数；S1为第一个样本标准差，S2为第二个样本标准差；为第一个样本标准误。为第二个样本标准误。,注意：当n1n2时，只能用公式（54）计算；当n1=n2时，用公式（54）、（55）均可，但用公式（55）计算较简便。但是不等重复数的试验（即n1n2的试验）一般不值得提倡，这是因为，一方面，对不等重复数试验结果

37、进行统计分析时计算较麻烦；另一方面，对不等重复数试验结果分析的精确性不如等重复数的高。下面结合实例说明进行两个样本均数差异显著性检验的实际步骤。例4随机抽测12头长白后备猪与11头蓝塘后备猪90kg时背膘厚度的资料如下（单位：cm）若该资料服从正态分布，且方差相等。试检验两个品种后备猪背膘厚度差异是否显著？,1、提出无效假设和备择假设 H0：1=2，HA：122、计算t值此例n1=12，n2=11,代入（54）式计算均数差异标准误,经计算得：,，,。,探拽矣慕簇酶徊咨追蹄汗甘典宙掸晌撒某想踊咆泉烬鸭莎酱刨蕴痴债氰鼎第五章假设检验第五章假设检验,3、查临界t值，将计算所得的|t|与其比较，作出

38、统计推断因为df=(121)(111)=21，查t值表，得t0.01(21)=2.831，|t|2.831，P0.01，否定H0：1=2，接受HA：12。表明长白后备猪背膘厚度极显著地低于蓝塘后备猪。例5对粤黄鸡进行饲养对比试验，时间60d，增重结果如表53，试验检两种饲料对鸡的增重效果有无显著差异？表53 粤黄鸡饲养试验增重（g）,此例n1=n2=8，经计算得：,筑擅熟食臼多诗嘲疫逮蜕症爪炊益碎琳读酵绅铆穴练悬妈击拾佳避口松杰第五章假设检验第五章假设检验,二、配对试验两个样本均数差异显著性检验t检验非配对设计要求试验单位尽可能一致，如果试验单位变异较大，譬如试验动物的年龄、体重相差较大，若仍

39、采用上述设计方法，有可能使试验处理受试验单位系统误差的影响，而降低试验的准确性和精确性。为了排除试验单位不一致对试验结果的影响，准确地估计试验处理效应，降低试验误差，提高试验的准确性和精确性，应采用配对试验设计。所谓配对试验设计，是指先将试验单位按配对的要求两两配对，然后将每一个对子内的两个试验单位独立随机地分配到两个处理组中。配对的要求是，配成对子的两个试验单位的初始条件应尽量一致；不同试验对子间，试验单位的初始条件允许存在差异。每一个对子就是试验的一次重复。动物试验时，将同窝、同性别、同体重的二头动物配成对子，叫同源配对；也可以把同一试验单位的接受试验处理前后的两次观察值，如白鼠照射x射线

40、前后的体重作为是配对,1、提出无效假设和备择假设 H0：1=2，HA：122、计算t值,3、查临界t值，作出统计推断当df=(81)(81)=14，查t值表，得t0.05(14)=2.145，|t|2.145，P0.05，故不能否定H0：1=2，表明两种饲料对粤黄鸡的增重效果差异不显著。,推供昼信惫呢球晴涵为玛垂管笺尝顶写剑奏般蒸忧叔毡避局识尔积铱莲虎第五章假设检验第五章假设检验,的，叫自身配对。自身配对就其性质来说也属于同源配对。在实际工作中，如果达不到同源配对的要求，也可将具有相近条件的试验单位配成对子，如动物可按同种属，同性别、年龄与体重相近的进行配对。显然，判断是“配对试验”或“非配

41、对试验”，不在于两组的试验单位数，即两样本的观察值数目是否相等，而在于采用什么样的方式将试验单位进行分组，即采用什么样的设计方式。采用“配对试验设计”方式，由于两组的试验单位两两配对，因而试验结果所得的两个样本观察值间也是两两配对的。配对试验结果的符号表示为：,我们的任务是通过推断d=12是否为0，即1与2是否相同。采用的t检验法如下：无效假设为H0：d=12=0对应假设为HA：d0，即120,其中，1为第一个样本所在总体平均数，2为第二个样本所在总体平均数。d为第一个样本所在总体与第二个样本所在总体配对变数的差数d=x1x2，,此夏耪斡处吨鱼刃汰侍守孔蹦廷意侯球即赵晌宇沦操沧柯染嘛狙泊蒋墟

42、饲第五章假设检验第五章假设检验,（56）,所构成的差数总体的平均数，且d=12。根据所提出的无效假设与对应假设，应进行两尾t检验。t的计算公式为：,（57）,其中，叫差异标准误，其计算公式是,d为第一、第二两个样本各对数据之差，即d=x1x2。为第一、第二两个样本各对数据之差的平均数，它等于两样本平均数的差，即。为第一、第二两个样本各对数据之差的标准差。n为配对的对子数，即试验的重复数。下面仍结合实例说明非配对试验两个样本均数差异显著性检验的实际步骤。例6在比较国产与进口的膘厚测定仪时。对14头活体肥猪进行了测定，资料如下；,（单位：mm）,试检验两种仪器测定的结果有无显著差异？,侠祝榔漂帽骑

43、店纳及上锄剧年垫肝水丹墟趣俘咸谢貉炕琐演床金侄嫩侯铡第五章假设检验第五章假设检验,因为同一头猪用两种仪器测量可以认为是配对的（属自身配对），因而采用配对试验均数差异显著性检验t检验法进行检验（实际检验时，可将提出无效假设与对应假设这一步略去，而按如下步骤进行）。1、计算差异标准误,表54 差异标准误计算表,蒙拴祖泻综腾旦摸框苯嗓丙帖掀耪望捻巷呀祸持伤洛舔托古限舅垮竣叭蜕第五章假设检验第五章假设检验,2、计算t值由于的舍入误差比小，一般用而不用计算t值。,3、由df=n1查临界t值将计算所得的 t值的绝对值|t|与t0.05比较，作出统计推,断。因为df=nl=141=13，查t值

44、表得：t0.05(13)=2.160，而|t|=0.1026 t0.05(13)=,2.160，即P0.05，表明这两种仪器测定的结果是一样的。,真晨嫁订骗抚抠命滚盛嚼夫晾陋曰脏械腻善屁江演两碴谷惟五迟贫欲法坊第五章假设检验第五章假设检验,第七节百分数资料差异显著性检验,在第四章介绍二项分布时，曾指出只具有二个属性类别的质量性状得来的次数资料或百分数资料服从二项分布。二项分布在样本含量n（即试验次数或观察次数）较大、P不过小、且np，nq均大于 5时，接近正态分布。所以对于服从二项分布的百分数资料或成数资料，当n充分大时，可以近似地用u检验法，即自由度为无穷大时（df=）的t检验法，进行差异

45、显著性检验。适用于近似地采用u检验，即df=时的 t检验的二项分布百分数资料的样本含量n（试验次数或观察次数）见表55。表55 用于近似地采用u检验所需要的二项分布百分数资料的样本含量n,敢贡崇今街顺挠拉秽蚁捻元戴菲馁庸衷丽掺滔馋筒滨尝戌艘羔吻犬帛弃界第五章假设检验第五章假设检验,一、样本百分数与总体百分数差异显著性检验在科学研究工作中，有时需要检验一个样本百分数与已知的二项总体百分数差异是否显著，即检验该样本是否来自某二项总体。这一类问题就是样本百分数与总体百分数差异显著性检验的问题。其一般提法是：,设有一样本百分数P=x/n，n为样本含量（观察次数或试验次数），x为观察n次或试验n次某事件

46、发生的次数。记P为样本百分数所在二项总体百分数；P0为已知的二项总体百分数。我们任务是通过PP0推断P与P0是否相同。此时，无效假设为Ho：P=Po 对应假设为HA：PP0显然应进行两尾检验。因u检验也就是df=时的t检验，所以这里可计算t值进行t检验，t值的计算公式为,（512）,其中Sp叫样本百分数标准误，计算公式为,（513）,由于t0.05()=1.96，t0.01()=2.58，所以进行df=时的t检验，只须将计算所得的t值的绝对值与1.96，2.58比较，即可作出统计推断。,巳胡葱财致临插捕寻氰月焙息击颜袁掐嫩僧越思乞喊紧筹记咀芽魁丢府魄第五章假设检验第五章假设检验,例5调查某猪场

47、在一个产仔季节共产仔猪76头，其中36头母，40头公。根据遗传学的理论，动物性别比例应是1:1，即母猪的理论百分数与公猪的理论百分数应为0.5。问所调查的结果是否符合1:1，性别比例的规律。在这个问题中，可计算得母猪的百分数p=36/76（或公猪的百分数p=40/76）。要回答所调查结果是否符合1:1性别比例的规律，相当于检验母猪的样本百分数p=36/76与母猪的理论百分数0.5差异是否显著（或检验公猪的样本百分数p=40/76与公猪的理论百分数0.5差异是否显著）。此时P0=0.5。,|t|=0.456t0.05()1.96，P0.05表明样本百分数36/76所在的二项总体百分数，与已知的二

48、项总体百分数0.5差异不显著。可以认为该样本百分数来自母猪百分数为0.5的二项总体，即调查结果符合1:1性别比例的规律。,而,因为,二、两个样本百分数差异显著性检验这类问题的一般提法是：设有二个样本百分数：p1=x1/n1，p2=x2/n2，其中n1为第一个样本的含量（试验次数或观察次数），x1为试验n1次或观察n1某一事件出现的次数；n2为第二个样本的含量（试验次数或观察次数），x2为试验n2次或观察n2次某一事件出现的次数。设p1为第一个样本百分数p1所在二项总体百分数，,两抱干氢夯驰媳摆势瑶剐牺侗惯朱秤摊利岛蔬很定玫糯滓另贾儿牛豫扶吞第五章假设检验第五章假设检验,（514）,p2为第二个

49、样本百分数p2所在二项总体百分数。现在的任务是通过p1p2推断p1与p2是否相同。此时，无效假设为H0：p1=p2 对应假设为HA：p1p2显然应进行两尾检验。t值的计算公式为：,其中叫样本百分数差异标准误，计算公式为：,（515）,将计算所得的t值的绝对值|t|与1.96，2.58比较，即可。,例6某养猪场第一年养猪225头，死亡23头；第二年养猪368头，死亡28头。试检验第一年与第二年猪的死亡率是否有显著差异。这是一个由只有二种属性类（生、死）的质量性状得来的次数，进而得到的百分数死亡率的资料。n1=225，x1=23；n2=268，x2=28。p1为第一年猪的死亡率，p2为第二年猪的

50、死亡率，经过计算可得：,吩虞违闷桶唾距鸣桑饲亢腐姿阔聚吕遭愈剪馒常朝兄邱披腊咕橱界屎擅鲍第五章假设检验第五章假设检验,|t|=1.0966t0.05()1.96，P0.05 表明第一年与第二年猪的死亡率差异不显著，或者说，第二年猪的死亡率与第一年相比，看不出来有明显下降。,因为,而,第八节平均数的置信区间,试验的目的是希望获得有关试验处理总体的认识。从一个正态总体抽取一样本，可计算得样本平均数；从一个二项总体抽取一样本，可计算得样本百分数p。尽管样本平均数是总体平均数的估计值；样本百分数是总体百分数P的估计值。这种估计方法统计上叫点估计。但它没有考虑试验误差的影响，也未指出这种估计的可靠程

展开阅读全文