《《假设测验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《假设测验》PPT课件.ppt(64页珍藏版)》请在三一办公上搜索。
1、第5章 假设测验,Tests of Significance,Section 5.1Principle of Significance Tests假设测验的基本原理,一、假设测验的理论基础,某人宣称自由球命中率有80%。命中率有80%的射手,实地投射只有8/20命中率的机会不大。实地投射结果显示投20球中8球。结论:命中率有80%的宣称不可信。命中率有80%的自由球射手投20球命中的次数应服从二项分布B(20,0.8)。命中的次数小于或等于8的概率约为 0.0001。即重复实地投射20球10,000次只中8球以下的情形约只发生一次。,假设宣称的叙述为真(命中率有80%),可推得实验结果发生的可
2、能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。“Prove by Contradiction”小概率原理,一、假设测验的理论基础,例 某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数=300(kg),并从多年种植结果获得其标准差=75(kg),而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m2330kg,即=330,问新品种产量与当地品种产量是否有显著差异?,二、假设测验的步骤,(一)先假设新品种产量与当地品种产量无差异,记作 无效假设或零假设 对立假设或备择假设,二、假设测验的步骤,二、假设测验的步骤,(二)在承
3、认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数=300(kg),标准误=15(kg)。如果新品种的平均产量很接近300 kg,应接受H0。如果新品种的平均产量与300相差很大,应否定H0。但如果试验结果与300不很接近也不相差悬殊,就要借助于概率原理,具体做法有以下两种:,1.计算概率 在假设 为正确的条件下,根据的抽样分布算出获得 330kg的概率,或者说算得出现随机误差 30(kg)的概率:在此,,查附表,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果
4、:30(kg),属于抽样误差的概率小于5%。,二、假设测验的步骤,2.计算接受区和否定区 在假设H0为正确的条件下,根据 的抽样分布划出一个区间,如 在这一区间内则接受H0,如 在这一区间外则否定H0。由于,因此,在 的抽样分布中,落在()区间内的有95%,落在这一区间外的只有5%。,二、假设测验的步骤,如果以5%概率作为接受或否定H0的界限,则上述区间()为接受假设的区域,简称接受区(acceptance region);和 为否定假设的区域,简称否定区(rejection region)。,同理,若以1%作为接受或否定H0的界限,则()为接受区域,和 为否定区域。,二、假设测验的步骤,如上
5、述小麦新品种例,=300,,1.96=29.4(kg)。因之,它的两个2.5%概率的否定区域为 30029.4和 300+29.4,即大于329.4(kg)和小于270.6(kg)的概率只有5。,图 5%显著水平假设测验图示(表示接受区域和否定区域),二、假设测验的步骤,(三)根据“小概率事件实际上不可能发生”原理接受或否定假设,当 由随机误差造成的概率P小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。如P0.05,则称这个差数是显著的。如P0.01,则称这个差数是极显著的。用来测验假设的概率标准5%或1%等,称为显著水平(significance level)。一般以 表示,如
6、=0.05或=0.01。,二、假设测验的步骤,综合上述,统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。(2)规定测验的显著水平 值。(3)在 为正确的假定下,根据平均数()或其他统计数的抽样分布,获得实际差数(如 等)由误差造成的概率(P值)。或者根据已规定概率,如=0.05,划出两个否定区域如:和。(4)将规定的 值和算得的P值相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的推断。,二、假设测验的步骤,如果统计假设为,则备择假设为,在假设测验时所考虑的概率为曲线左边一尾概率和右边一尾概率的总和。这类测验称为两尾测验(two-ta
7、iled test),它具有两个否定区域。,如果统计假设为,则其对应的备择假设必为。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。这类测验称一尾测验(one-tailed test)。一尾测验还有另一种情况,即,,这时否定区域在左边一尾.,三、两尾测验与一尾测验,0,-1.96x,+1.96x,0.95,0.025,0.025,左尾,右尾,否定区,否定区,接受区,双尾测验(two-sided test),三、两尾测验与一尾测验,0.95,0.95,0.05,0.05,1.64,-1.64,H0:0 HA:0,假设:,否定区,H0:0 HA:0,左尾测验,
8、右尾测验,单尾测验(one-sided test),接受区,接受区,三、两尾测验与一尾测验,u 0.05=1.64u 0.01=2.33,单尾测验分位数,双尾测验分位数,u 0.05=1.96u 0.01=2.58,查表时,单尾概率等于双尾概率乘以2,三、两尾测验与一尾测验,第一类错误(type I error),又称弃真错误或 错误;第二类错误(type II error),又称纳伪错误或 错误第一类错误的概率为显著水平 值。第二类错误的概率为 值。,四、假设测验的两类错误,关于两类错误的讨论可总结如下:(1)在样本容量n固定的条件下,提高显著水平(取较小的 值),如从5%变为1%则将增大第
9、二类错误的概率 值。(2)在n和显著水平 相同的条件下,真总体平均数 和假设平均数 的相差(以标准误为单位)愈大,则犯第二类错误的概率 值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水平,如=0.05;或适当增加样本容量。(4)如果显著水平 已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。,四、假设测验的两类错误,Section 5.2 Significance Tests for Means平均数的假设测验,一、t分布,数据来自正态总体N(,2)的假设下,随机样本的均数 服从正态 N(,2/n)标准差未知,用样本标准差s估计 以 标准化后服从标准正态
10、以 标准化后则服从 t 分布 的标准差估计值 又称为 的标准误(standard error of mean,简记为),0,标准正态分布,t 分布自由度9,t 分布自由度2,一、t分布,t 分布图形与正态分布图形相似都具有对称于零、单峰及钟形的特性t 分布图形的散布(spread)比正态分布图形大,t 分布图形的尾端具有较大的概率以 替代 来标准化,使得t分布有较大的变异性。t分布自由度越大图形越接近正态。样本容量越大s估计越可靠,估计值造成的额外变异性越小。,一、t分布,在自由度为 的t分布曲线图下,右方与 左方的面积和为 a,则称 为自由度为 的t分布概率为 a 的双侧临界值。可查表。,0
11、,面积为a/2,面积为a/2,一、t分布,在自由度为 的t分布曲线图下,右方的面积为 a,则称 为自由度为 的t分布概率为 a 的单侧临界值。可查表。,0,面积为a,一、t分布,一、t分布,t 界值表,1.812,2.228,-2.228,t,f(t),=10的t分布图,例1 某春小麦良种的千粒重 34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?,这里总体 为未知,又是小样本,故需用t 测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验
12、。测验步骤为:,二、单个样本平均数的假设测验,H0:34g;对HA:34g。,显著水平=0.05。,测验计算:,查附表,v=7时,t0.05=2.365。现实得|t|0.05。,推断:接受H0:34g,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。,二、单个样本平均数的假设测验,由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。,测验方法,成组数据的平均数比较,成对数据的比较,三、两个样本平均数相比较的假设测验,(一)成组数据的平均数比较,如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平
13、均数作为相互比较的标准。,在两个样本的总体方差 和 为未知,但可假定,而两个样本又为小样本时,用t 测验。,三、两个样本平均数相比较的假设测验,从样本变异算出平均数差数的均方,,其两样本平均数的差数标准误为:,于是有:,由于假设,故,自由度,三、两个样本平均数相比较的假设测验,例2 调查某农场每亩30万苗和35万苗的稻田各5块,得亩产量(单位:kg)于表1,试测验两种密度亩产量的差异显著性。,表1 两种密度的稻田亩产(kg),假设H0:两种密度的总体产量没有差异,即 对,显著水平=0.05,测验计算:=428kg=440kg SS1=1930 SS2=550,故,三、两个样本平均数相比较的假设
14、测验,查附表,v=4+4=8时,t0.05=2.306。现实得|t|=1.080.05。推断:接受假设,两种密度的亩产量没有显著差异。,三、两个样本平均数相比较的假设测验,(二)成对数据的比较,若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。,成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。在分析试验结果时,只要假设两样本的总体差数的平均数,而不必假定两样本的总体方差 和 相同。,三、两个样本平均数相比较
15、的假设测验,设两个样本的观察值分别为x1和 x2,共配成n对,各个对的差数为 d=x1x2,差数的平均数为,则差数平均数的标准误 为:,它具有 v=n1。若假设,则上式改为:,即可测验,三、两个样本平均数相比较的假设测验,例3 选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的饨化病毒效果,表2结果为病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。,表2 A、B两法 处理的病毒在番茄上产生的病痕数,三、两个样本平均数相比较的假设测验,假设:两种处理对饨化病毒无不同效果,即;对。显著水平。
16、,查附表,v=7-1=6时,t0.01=3.707。实得现|t|t0.01,故P0.01。推断:否定,接受,即A、B两法对饨化病毒的效应有极显著差异。,三、两个样本平均数相比较的假设测验,成对数据和成组数据平均数比较的不同:(1)成对数据和成组数据平均数比较所依据的条件不同。前者是假定各个配对的差数来自差数的分布为正态的总体,具有N(0,);而每一配对的两个供试单位是彼此相关的。后者则是假定两个样本皆来自具有共同(或不同)方差的正态总体,而两个样本的各个供试单位都是彼此独立的。(2)在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需
17、严格区别。,三、两个样本平均数相比较的假设测验,Section 5.3 Significance Tests for Proportion 百分数的假设测验,测验某一样本百分数 所属总体百分数与某一理论值或期望值p0的差异显著性。由于样本百分数的标准误 为:,故由,即可测验H0:p=p0。,一、单个样本百分数(成数)的假设测验,例4 以紫花和白花的大豆品种杂交,在F2代共得289株,其中紫花208株,白花81株。如果花色受一对等位基因控制,则根据遗传学原理,F2代紫花株与白花株的分离比率应为31,即紫花理论百分数p=0.75,白花理论百分数q=1p=0.25。问该试验结果是否符合一对等位基因的
18、遗传规律?,一、单个样本百分数(成数)的假设测验,因为实得|u|0.05。,推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数=0.72和p=0.75的相差系随机误差。如果测验H0:p=0.25,结果完全一样。,假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是75%,即H0:p=0.75;对HA:p0.75。显著水平 0.05,作两尾测验,u0.05=1.96。,测验计算:,一、单个样本百分数(成数)的假设测验,测验两个样本百分数和所属总体百分数p1和p2的差异显著性.设两个样本某种属性个体的观察百分数分别为 和,而两样本总体该种属性的个体
19、百分数分别为p1和 p2,则两样本百分数的差数标准差 为:,即可对 H0:p1=p2 作出假设测验。,故由,二、两个样本百分数(成数)的假设测验,例5 调查低洼地小麦378株(n1),其中有锈病株355株(x1),锈病率93.92%();调查高坡地小麦396株(n2),其中有锈病346株(x2),锈病率87.31%()。试测验两块麦田的锈病率有无显著差异?,假设H0:两块麦田的总体锈病率无差别,即 H0:p1=p2;对 HA:p1 p2。取,两尾测验,u0.05=1.96。,测验计算:,二、两个样本百分数(成数)的假设测验,实得|u|u0.05,故P0.05,,推断:否定H0:p1=p2 接受
20、HA:p1 p2,即两块麦田的锈病率有显著差异。,二、两个样本百分数(成数)的假设测验,Section 5.4 Estimating Confidence Interval 区间估计,所谓参数的区间估计,是指在一定的概率保证之下,估计出一个范围或区间以能够覆盖参数。这个区间称置信区间(confidence interval),区间的上、下限称为置信限(confidence limit),区间的长度称为置信距。一般以L1和L2分别表示置信下限和上限。保证该区间能覆盖参数的概率以P=(1)表示,称为置信系数或置信度。,一、什么是区间估计,并有,在总体方差 为未知时,置信区间为:,上式中的 为置信度
21、P=(1)时 t 分布的 t 临界值。,二、单一总体平均数的置信区间,例6 例1已算得某春小麦良种在8个小区的千粒重平均数,。试估计在置信度为95%时该品种的千粒重范围。,由附表查得 v=7时 t0.05=2.365,故有,即,推断:该品种总体千粒重在33.836.6g之间的置信度为95%。在表达时亦可写作 形式,即该品种总体千粒重95%置信度的区间是35.2(2.3650.58)=35.21.4(g),即33.836.6g。,二、单一总体平均数的置信区间,三、两总体平均数差数的置信区间,(一)成组数据,如果两总体方差未知,但相等,即,则 的1-置信区间为:,并有,以上的 为平均数差数标准误,
22、是置信度为1,自由度为 v=n1+n22 时 t 分布的临界值。,例7 试估计例2资料两种密度667m2产量差数在置信度为99%时的置信区间。,在前面已算得:,由附表查得 v=8 时,t0.01=3.355,故有 L1=(428440)(3.35511.136)=49.4,L2=(428440)+(3.35511.136)=25.4(kg)。结果说明,667m2栽30万亩苗的产量可以比667m2栽35万苗的每亩少收49.4kg至每亩多收25.4kg,波动很大。所以这个例子是接受 的.,的。,三、两总体平均数差数的置信区间,(二)成对数据,由,可得 的1-置信区间:,并有,为置信度为1,v=n1
23、时 t 分布的临界 t 值。,其中,三、两总体平均数差数的置信区间,例8 试求例3资料 的99%置信限。,在例3已算得:,并由附表查得 v=6 时 t0.01=3.707,于是有:L1=8.3(3.7071.997)=15.7(个),L2=8.3+(3.7071.997)=0.9(个)。,或写作,以上L1和L2皆为负值,表明A法处理病毒在番茄上产生的病痕数要比B法减小0.915.7个,此估计的置信度为99%。,三、两总体平均数差数的置信区间,(一)单一总体百分数的置信区间,在置信度P=1 下,对总体p置信区间的近似估计为:,并有,以上式中,四、百分数的置信区间,例9 调查100株玉米,得到受玉
24、米螟危害的为20株,即=20/100=0.2或=20。试计算95%置信度的玉米螟危害率置信区间。,故 L1=0.2(1.960.04)=0.1216,L2=0.2+(1.960.04)=0.2784,四、百分数的置信区间,(二)两个二项总体百分数差数的置信区间,在1 的置信度下,p1p2 的置信区间为:,并有,其中,四、百分数的置信区间,例10 例5已测知低洼地小麦的锈病率=93.92%(n1=378),高坡地小麦的锈病率=87.31%(n2=396),它们有显著差异。试按95%置信度估计两地锈病率相差的置信区间。,由附表查得 u0.05=1.96,而,故有 L1=(0.93920.8731)
25、(1.960.02075)=0.0256,L2=(0.93920.8731)+(1.960.02075)=0.1070,即低洼地的锈病率比高坡地高2.5610.70%,此估计的置信度为95%。,四、百分数的置信区间,Section 5.5 Relation between Confidence Interval and Significance Tests 区间估计与假设测验的关系,区间估计亦可用于假设测验。对参数所作假设若恰落在该范围内,则这个假设与参数就没有真实的不同,因而接受 H0;反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定 H0,接受 HA。,例11
26、例1已算得新引入春小麦品种的千粒重,故其95%置信区间的两个置信限为:,L1=35.2(2.3650.58)=33.8(g)L2=35.2+(2.3650.58)=36.6(g),曾经假设,此值落在上述置信区间内,所以不能认为新引入品种与当地原有良种的千粒重有显著差异,即接受。这和例1的结论完全相同。,例12 在例3已求得两种不同处理的病毒,接种在番茄上产生的病痕数的相差,在1 置信度下的区间为(个)。如果假设,则该区间内并不包括0值,所以,两种处理方法是有显著差异的,显著水平是0.05。其结论与例3同。,例13 在例10已求得低洼地小麦锈病率与高坡地小麦锈病率的相差的95%置信区间为:2.56%(p1p2)10.7%。,若假设H0:p1=p2,则该假设在上述置信区间外,故在=0.05水平上否定 H0,接受 HA:p1p2 0。,区间估计与假设测验关系总结为以下几点:,(1)若在1 的置信度下,两个置信限同为正号或同为负号,则否定无效假设,而接受备择假设。(2)若在1 置信度下,两个置信限为异号(一正一负),即其区间包括零值,则无效假设皆被接受。(3)若两个置信限皆为正号,则有一个参数大于另一个参数的结论成立。(4)若两个置信限皆为负号,则有一个参数小于另一个参数的结论成立。,