《适合性检验课件.ppt》由会员分享,可在线阅读,更多相关《适合性检验课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、第七章 次数资料分析 2检验,2检验是次数资料显著性检验的方法。它是通过提出某种假设,用理论次数与观察次数进行比较,从而确定两者的符合程度。,2检验的分类:适合性检验 独立性检验,x2检验的分类,(1)适合性检验用来检验某性状观察次数与该性状的理论比率是否符合。(2)独立性检验 根据次数资料判断两类因子彼此相关或相互独立的假设检验。是次数资料的相关性研究。,71 2统计量与2分布,一、x 检验的意义 1、定义 2、分类二、x 统计量的意义 1、x 值度量A与T偏差程度大小 2、公式三、x分布 1、x 值概率分布 2、特点:、四、连续性矫正,案例:统计某羊场一年所产的876只羔羊中,有公羔428
2、只,母羔448只。问其性别比例是否正常。根据遗传学理论,动物的性别比例是1:1。按1:1的性别比例计算,公、母羔均应为438只。实际观察次数(A)与理论次数(T)存在一定的差异。这是抽样误差,还是本质差异?这取决于其偏离程度。,由于A1T110,A2T210,差数之和为0;为避免正负抵消,可将差数平方后再相加:(AT)2。其值越大,实际观察次数与理论次数相差亦越大,反之则越小。为了弥补基数不同的影响,可先将各差数平方除以相应的理论次数后再相加,以统计量2表示:,2越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。,2分布,2分布的特点:(1)2 0,即
3、2 的取值范围是 0,+)。(2)2 分布是偏斜分布,随df 减少而加剧;当df时,曲线以纵轴为渐近线。(3)df 逐渐增大,曲线趋对称;df=30时,x2 分布近于正态分布。,x2检验的连续性矫正,问题:、什么情况下x2检验需矫正?、如何矫正?、为什么?,2的连续性矫正,当df=1时,计算2 值必须进行矫正,计算公式为:,原因:2分布属于连续型随机变量的概率分布,在对次数资料进行2检验时,计算所得的2值偏大,概率偏低,因此需要矫正。,当df1时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。,第二节 适合性
4、检验,判断实际观察的属性类别分配是否符合已知属 性类别分配理论或学说的假设检验称为适合性 检验。,遗传学上:一对性状杂种后代的分离现象,:;二对性状杂种后代的分离现象是否符合:;动物性别比:。,适合性检验方法,(一)建立假设(二)计算实际x2值(三)查x2值表,作统计判断,x2检验的显著性三个判断标准,1、x2x20.05 P0.05 差异不显著;2、x20.05x2x20.010.01P0.05 差异显著;*3、x2x20.01 P0.01 差异极显著;*,第二节 适合性检验,【例7.1】为了研究山羊毛色的遗传规律,用白 色山羊与黑色山羊进行杂交,结果在260只杂 交子二代中,181只为白色
5、,79只为黑色。问 是否符合孟德尔遗传分离定律。,(一)建立假设H0:子二代分离现象符合3:1的理论比例 HA:子二代分离现象不符合3:1的理论比例,第二节 适合性检验,(二)计算公式,本例的属性类别分类数k=2(包括白色、黑色),则自由度df=k1=21=1,为了减少偏差,必须采用矫正公式:,第二节 适合性检验,(三)计算理论数,根据3:1的理论比例,白色山羊的理论数T1=2603/4=195 黑色山羊的理论数T2=2601/4=65,第二节 适合性检验,(四)计算卡方值,第二节 适合性检验,(五)查临界值,作出统计推断(P139),当自由度df=1时,查得。,由于,故P0.05,不能否定H
6、0,表明实际观察次数与理论次数差异不显著。因此,可以认为白色山羊与黑色山羊的比率符合孟德尔遗传分离定律3:1的理论比例。,第二节 适合性检验,【例7.2】在研究牛的毛色(黑色、红色)和角(无角、有角)这两对相对性状的分离现象时,用黑色无角牛与红色有角牛进行杂交,结果在360头子二代中,黑色无角牛有192头,黑色有角牛有78头,红色无角牛有72头,红色有角牛18头。问这两对性状是否符合孟德尔遗传规律中9:3:3:1的比例。,第二节 适合性检验,(一)建立假设,H0:实际观察次数之比符合9:3:3:1的理论比例HA:实际观察次数之比不符合9:3:3:1的理论比例,第二节 适合性检验,(二)计算公式
7、,本例的属性类别分类数k=4,因此自由度df=k-1=4-1=3,可采用一般公式,第二节 适合性检验,(三)计算理论数,根据9:3:3:1的理论比例,黑色无角牛的理论数 T1=3609/16=202.5 黑色有角牛的理论数 T2=3603/16=67.5 红色无角牛的理论数 T3=3603/16=67.5 红色有角牛的理论数 T4=3601/16=22.5,第二节 适合性检验,(四)计算,表7-3 计算表,第二节 适合性检验,(五)查临界值,作出统计推断(P346),当自由度df=3时,查得。,由于,故P0.05,不能否定H0,表明实际观察次数与理论次数差异不显著。因此,可以认为毛色与角的有无
8、两对性状杂交二代的分离现象符合孟德尔遗传规律中9:3:3:1的理论比例。,第七章 2检验,第三节 独立性检验,独立性检验的意义,根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。,例如:注射某种疫苗预防某种疾病的关系(猪瘟);不同配种(单次配、双重配)与受胎数有关系。,独立性检验与适合性检验的区别:(1)独立性检验的次数资料是按两因子属性类别进行归组。根据两因子属性类别数的不同而构成22、2c、rc列联表(r为行因子的属性类别数,c为列因子的属性类别数)。而适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。(2)适合性检验按已知的属性分类理论或学说计算理论次数。
9、独立性检验在计算理论次数时没有现成的理论或学说可利用,理论次数是在两因子相互独立的假设下进行计算。(3)适合性检验的自由度=属性类别数1。rc列联表的独立性检验中,自由度df=(r1)(c1)。,独立性检验和适合性检验的区别,1、独立性检验无已知的理论比率;2、独立性检验必须安排以因子划分的两 向列联表;3、独立性检验是次数资料相关性的研究;4、适合性检验的自由度df=属性类别数k1,独立性检验中,自由度df=(r1)(c1)。,第三节 独立性检验,独立性检验的方法,(一)列联表的独立性检验,【例7.7】某猪场用80头猪检验某种疫苗是否有 预防效果。结果是注射疫苗的44头中有12头发 病,32
10、头未发病;未注射的36头中有22头发病,14头未发病。问该疫苗是否有预防效果?,第三节 独立性检验,1将资料整理成列联表,表711 22列联表,第三节 独立性检验,2建立假设,H0:发病与否和注射疫苗无关,即二因子相互独立HA:发病与否和注射疫苗有关,即二因子彼此相关,第三节 独立性检验,3计算理论次数,根据假设,二因子相互独立,即注射疫苗与否不影响发病率,也就是注射组与未注射组的发病率应当相同,均应等于总发病率34/80=0.425。,依此可计算出各个理论次数。注射组 理论发病数:T11=440.42518.7 理论未发病数:T12=4418.725.3未注射组 理论发病数:T21=360.
11、42515.3 理论未发病数:T22=3615.320.7,第三节 独立性检验,4计算卡方值,df(c1)(r1)(21)(21)1,由于,故P0.01,否定H0,接 受HA,表明发病率与是否注射疫苗极显著相 关。也就是注射组的发病率极显著低于未注 射组,说明该疫苗是有预防效果的。,第三节 独立性检验,5查临界值,作出统计推断,当自由度df=1时,查得。,第三节 独立性检验,(二)列联表的独立性检验,2c列联表是行因子的属性类别数为2,列因子的属性类别数为c(c3)的列联表。其自由度df=(2-1)(c-1)=(c-1),因为c3,所以自由度大于2,在进行2检验时,不需作连续性矫正。,表712
12、 2c联列表一般形式,下一张,主 页,退 出,上一张,表712 2c 联列表一般形式,其中Aij(i=1,2;j=1,2,c)为实际观察次数。,第三节 独立性检验,【例7.8】在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣四个等级分类,结果见表7-13。问两地水牛体型构成比是否相同?,表713 两地水牛体型分类统计,这是一个24列联表独立性检验的问题。检验步骤如下:1.提出无效假设与备择假设 H0:水牛体型构成比与地区无关,即两地水牛体型构成比相同。HA:水牛体型构成比与地区有关,即两地水牛体型构成比不同。,2.计算各个理论次数,并填在各观察次数后的括号中 计算方法与22表类似,即根据两
13、地水牛体型构成比相同的假设计算。如优等组中,甲地、乙地的理论次数按理论比率20/135计算;良等组中,甲地、乙地的理论次数按理论比率15/135计算;中等、劣等组中,甲地、乙地的理论次数分别按理论比率80/135和20/135计算。,甲地优等组理论次数:T11=9020/135=13.3,乙地优等组理论次数:T21=4520/135=6.7,或T21=2013.3=6.7;其余各个理论次数的计算类似。,3.计算计算2值,4.由自由度df=3查临界2值,作出统计推断 因 为 20.05(3)=7.8 1,而2=7.5820.05,不能否定H0,可以认为甲、乙两地水牛体型构成比基本相同。在进行2c
14、列联表独立性检验时,还可利用下述简化公式(7-7)或(7-8)计算 2:(77),下一张,主 页,退 出,上一张,或(78)(7-7)与(7-8)式的区别在于:(7-7)式利用第一行中的实际观察次数A1j和行总和T1.;(7-8)式利用第二行中的实际观察次数A2j和行总和T2.,计算结果相同。对于例7.7利用(7-8)式计算 2 值得:,第三节 独立性检验,【例7.9】分别统计了A、B两个品种各67头经产母猪的产仔情况,结果见表7-14,问A、B两品种的产仔构成比是否相同?,表714 A、B两个品种产仔数的分类统计,1、提出无效假设与备择假设 H0:A、B两个品种产仔数分级构成比相同。HA:A
15、、B两个品种产仔数分级构成比不同。2、计算2值 用简化公式(77)计算为:,下一张,主 页,退 出,上一张,3、由自由度df(21)(31)2查临界2值,作出统计推断 因为20.05(2)=9.21,2 20.01,P0.01,所以否定H0,接受HA,表明A、B 两品种产仔数构成比差异极显著。需要应用2检验的再分割法来具体确定分级构成比差异在那样的等级。,下一张,主 页,退 出,上一张,4、2检验的再分割法(1)先对两个品种产仔数在9头以下和1012头进行2检验,分割后的情况见表715。,表715 21计算表,利用简化公式(7-7)计算21值为:,下一张,主 页,退 出,上一张,由df1=21
16、=1,查2值表得:20.05(1)=3.841,因为210.05,表明这两个品种的产仔数在9头以下和1012头这两个级别内的比率差异不显著。,利用简化公式(7-7)计算22值为:,表716 22计算表,(2)对产仔数在13头以上组与其他合并组(即9头以下和1012头两个组的合并)进行2检验,分割后见表716。,由df2=2-1=1,查2值表得:20.05(1)=3.84,20.01(1)=6.63,因为2220.01(1),P0.01,表明这两个品种的产仔数在合并组与13头以上组的比率差异极显著。其中B品种产仔数在13 头以上的比率为29/67=42.38%,极显著高于A品种产仔数在13头以上
17、的比率6/67=8.96%。或者说B品种产仔数 在合并组(12头以下)的比率为38/67=56.72%,极显著低于A品种产仔数在合并组(12头以下)的比率61/67=91.04%。,下一张,主 页,退 出,上一张,经分割检验后 df=df1+df2=1+1=2 2=23.25=21+22=2.93+20.458=23.388 2略小于21+22,是由于计算中的舍入误差所致。,下一张,主 页,退 出,上一张,经分割检验后 df=df1+df2=1+1=2 2=23.25=21+22=2.93+20.458=23.388 2略小于21+22,是由于计算中的舍入误差所致。,下一张,主 页,退 出,上
18、一张,第三节 独立性检验,(三)rc列联表的独立性检验,rc表是指行因子的属性类别数为r(r2),列因子的属性类别数为c(c2)的列联表。其一般形式见表7-17。,表717 rc 列联表的一般形式,其中Aij(i=1,2,r;j=1,2,c)为实际观察次数。rc 列 联 表各个理论次数的计算方法与上述(22)、(2c)表适合性检验类似。但一般用简化公式计算2 值,其公式为:,下一张,主 页,退 出,上一张,第三节 独立性检验,【例7.10】对3组奶牛(每组39头)分别喂给不同的饲料,各组发病次数见表7-18。问发病次数的构成比与所喂饲料是否有关?,表718 三组牛的发病次数资料,第三节 独立性
19、检验,1建立假设,H0:发病次数的构成比与饲料种类无关,即二者相互独立HA:发病次数的构成比与饲料种类有关,即二者相互相关,第三节 独立性检验,2计算理论次数,对于理论次数小于5者,将相邻几个组加以合并(见表7-19),合并后的各组的理论次数均大于5。,表719 资料合并结果(注:括号内为理论次数),下一张,主 页,退 出,上一张,第三节 独立性检验,3计算卡方值,利用简化公式进行计算,第三节 独立性检验,4查临界值,作出统计推断,df=(r1)(c1)=(41)(31)=6,查得,由于,故P0.05,接受H0,可以认为奶牛的发病次数的构成比与饲料种类相互独立,即用3种不同的饲料饲喂奶牛,各组奶牛发病次数的构成相同。,