《第5讲-t检验-课件.ppt》由会员分享,可在线阅读,更多相关《第5讲-t检验-课件.ppt(36页珍藏版)》请在三一办公上搜索。
1、1,统计学的基本问题:样本特征 参数估计总体特征 假设检验参数估计:根据样本统计量的值估计总体参数的值。(均数,置信区间)假设检验:由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。(均数,小概率原理),抽样误差,2,1.可信区间与假设检验的关系,回答的问题不同假设检验用于推断两总体均数有无差别(即质的不同),而可信区间用于推断总体均数在哪个范围(即量的大小)。可信区间亦可用于回答假设检验的问题,3,可信区间比起假设检验还可提供一些其它的信息,如回答有无实际意义等。假设检验得到的值可以精确地说明结论的概率保证,而可信区间却不能严格的提供精确的概率。在做出结论时,最好同时给出假设检验
2、的检验统计量值和p值以及可信区间。,4,2、第 I 类错误和第 II 类错误,假设检验的结果有两种。,(1)当拒绝 H0 时,可能犯错误,可能拒绝了实际上成立的H0,称为 类错误(“弃真”的错误),其概率大小用 a 表示。(2)当不能拒绝 H0 时,也可能犯错误,没有拒绝实际上不成立的H0,这类称为 II 类错误(”存伪”的错误),其概率大小用 表示,值一般不能确切的知道。,5,1,1,0,H0,H1,X1,X2,6,第五章,t 检验,7,主要内容,t分布(第六章第节)单样本均数的检验配对样本均数的检验两独立样本均数的检验两独立样本方差的齐性检验t检验变量代换,第十章,8,第一节 t 分布,当
3、样本含量较大时,其均数的抽样分布将趋于正态分布,如果从正态总体中抽样,英国统计学家W.S.Gosset导出了样本均数的确切分布-t分布。应用条件:正态分布 方差相等(1=2)适用对象:检验总体标准差未知的小样本均数,9,t 统计量,设(X1、X2、Xn)为来自正态分布总体N(,)的样本,则统计量t 服从自由度为(=n-1)的t分布。,10,t,的含义t 值表纵标目:自由度,横标目:概率。p,即曲线下阴影部分的面积;表中的数字:相应的|t|界值,t 值表规律:(1)自由度()一定时,p 越小,t 越大;(2)概率(p)一定时,越大,t 越小;,11,第二节单样本均数的检验,目的:比较一个小样本均
4、数所代表的未知总体的均数与已知总体的均数有无差别。,12,一、小样本均数与已知总体均数比较的t 检验,计算公式:t 统计量:t=自由度:u=n 1,查 t 界值表用,X 0,S/(n)1/2,13,适用条件:(1)已知一个总体均数;(2)可得到一个样本均数及该样本标准误;(3)样本量小于100或小于60;(4)样本来自正态或近似正态总体。,14,例题:p.152,例10-1已知:某地新生婴儿的体重均数3.30kg,现测得某医院25个难产婴儿的平均体重是3.42kg,标准差是0.42kg,问该医院难产婴儿均重是否与当地的新生儿有差别?(1)一个总体均数:3.30kg;(2)一个样本均数:3.42
5、kg;(3)可计算出样本标准误:0.42/5(4)n=25 100;,15,假设检验:建立假设:检验假设:难产儿平均出生体重与一般婴儿平均出生体重相同;备择假设:难产儿平均出生体重与一般婴儿平均出生体重不同;确定显著性水平():0.05,16,计算统计量:t 统计量:t=1.77 确定概率值:n=35,自由度=n 1=34,t0.05,34=2.032 t 1.77,p 0.05 做出推论:p,不是一个小概率事件,故原假设可能成立;接受H0,拒绝H1,可认为:难产儿平均出生体重与一般婴儿平均出生体重差别尚无统计学意义。,17,第三节配对样本均数的检验,配对资料 自身配对:同一对象接受两种方法的
6、处理异体配对:相近实验条件对象配对,分别给予两种不同的处理方法 方法:计算差值的均数计算差值的标准误 P154(10-2)计算检验量查界值表,做出结论,(自由度:对子数 1)Page 154,例10-2,18,表9 15对孪生兄弟的出生体重(kg),后出生者体重,先出生者体重,H0:d0H1:d0,19,例的假设检验,20,二、两个小样本均数比较的 t 检验目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。计算公式及意义:t 统计量:t=自由度:=n1+n2 2,X1 X2,(Sc2(1/n1+1/n2)1/2,21,适用条件:(1)已知/可计算两个样本均数及它们的标准差;(2
7、)两个样本之一的例数少于60;(3)样本都来自正态或近似正态总体;(4)方差齐。,22,例题:p.155,例10-3(1)白血病鼠样本:均数14.64,标准差1.62(mg/g);正常鼠样本:均数12.74,标准差1.33(mg/g);(2)n1=7;n2=7(3)方差齐:1.62/1.33 F0.05/2,6,6=5.82(4)近似正态分布(5)建立假设(6)确定显著性水平():0.05,23,计算统计量:t 统计量:t=2.398;自由度:7+7 2=12表中:t 0.05/2,12=2.179 确定概率值:t t 0.05/2,12,p 0.05;,24,做出推论:因为 p 0.05=,
8、拒绝H0,接受H1:可认为正常鼠和白血病鼠脾脏中平均含量有差别,白血病鼠脾脏中平均含量要高于正常鼠。,25,例题:例7已知:25个心肌梗塞病人血清 脂蛋白与23个正常人血清 脂蛋白均数分别是491.4和672.3mg/100ml,它们的标准差分别是135.8和150.7mg/100ml,问.是否相同?一个样本:均数491.4,标准差138.5(mg/100ml);另一个样本:均数672.3,标准差150.7(mg/100ml);(2)n1=25;n2=23(3)近似正态分布:138.52 491.4;150.72 672.3(4)方差齐:25/23 2,26,假设检验:建立假设:检验假设:心肌
9、梗塞病人血清 脂旦白与正常人血 清 脂旦白均数相同;备择假设:心肌梗塞病人血清 脂旦白与正常人血 清 脂旦白均数不同;确定显著性水平():0.05,27,计算统计量:t 统计量:t=4.34;自由度:25+23 2=46表中:t 0.05(40)=2.021 t 0.05(50)=2.009 t 0.05(46)=?确定概率值:t t 0.05(46),p 0.05;,28,做出推论:因为 p 0.05=,拒绝H0,接受H1:可认为心肌梗塞病人血清 脂旦白与正常人血清 脂旦白均数不同;两样本均数差别有显著性。,29,两样本均数比较的方法,方差相等,t检验 样本数n小 方差不齐,校正 t检验样本
10、数n大:u检验,30,第五节两独立样本方差的齐性检验,检验方法采用F检验,检验两样本方差不等是否由于抽样误差所至。F值的计算公式:F=S12/S22,其中S12 为较大样本方差;S22 为较小样本方差查方差齐性检验用F界值表得F界值 F0.05/2,1,2,用F和F比较,得P值范围作结论:F 接受H0、拒绝H1,两总体方差齐FF P 接受H1、拒绝 H0,两总体方差不齐Page 156,例10-4,31,例10 两组病人服用降压药后的降压效果比较,32,33,34,35,第六节t检验,t值 和 t的计算公式t是两个t界值加权均数,作为比较的t界值。用t值 和 t比较,得P值范围,作结论:t 接受H0,拒绝H1,差异无统计学意义t t P 接受H1,拒绝 H0,差异有统计学意义 Page 157,例10-5,36,作业,Page1611、,下次课,第十一章 方差分析,