基于秩次的非参数检验.ppt

上传人:laozhun 文档编号:2239451 上传时间:2023-02-05 格式:PPT 页数:80 大小:4.76MB
返回 下载 相关 举报
基于秩次的非参数检验.ppt_第1页
第1页 / 共80页
基于秩次的非参数检验.ppt_第2页
第2页 / 共80页
基于秩次的非参数检验.ppt_第3页
第3页 / 共80页
基于秩次的非参数检验.ppt_第4页
第4页 / 共80页
基于秩次的非参数检验.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《基于秩次的非参数检验.ppt》由会员分享,可在线阅读,更多相关《基于秩次的非参数检验.ppt(80页珍藏版)》请在三一办公上搜索。

1、第十章:基于秩次的非参数检验,数据资料,定量资料,数据类型,设计类型,单样本,定性资料,设计类型,两独立样本,配对样本,多独立样本,随机区组,t/Z检验,方差分析,单样本,两、多独立样本,配对样本,等级资料,进入条件,不满足进入条件,秩和检验,四格表,RC列联表,配对RC,x2检验,设计类型,配对四格表,假设检验小结:,变量变换或秩和检验,t 检验,方差不齐,方差齐,t 检验,两独立样本,单、两组定量资料,单样本,配对资料,差值,偏态,正态,对子数,t 检验,随机区组资料的方差分析,正态,方差齐,多独立分组,多组定量资料,随机区组资料,方差分析,P 0.05,多重比较,非正态,或方差不齐,变量

2、变换或秩和检验,1.对于两组二分类22四格表:n 40且所有T5 n 40但有1T5 n 40或有T1,四格表资料假设方法的选择1:,2.RC列联表资料的2检验:,行列表资料假设方法的选择2:,无序资料,有序资料,秩和检验,3.对于配对四格表资料:1.b+c 40 2.b+c 40,配对设计资料的2检验:,4.配对RR列联表资料的2检验:,配对设计资料的2检验:,1.1 非参数检验的基本概念1.2 配对资料的符号秩和检验1.3 两样本比较的秩和检验1.4 多样本总体比较的秩和检验,一、非参数统计的基本概念,描述疼痛程度的资料:无、轻、中、重度 描述疗效的资料:控制、显效、有效、无效,患者和正常

3、人的尿氟值、血铅值。,某病10名患者的潜伏期分别为(天):6,13,5,9,12,10,8,11,8,20实验鼠发癌后的生存日数;不同术式行某肿瘤切除后患者的生存期。,等级,资料分布:,非正态分布,且无适当的数据转换方法;总体分布类型不易确定;不能或未加精确测量,以等级资料形式呈现。,资料特点:,需要一种可不考虑被研究对象为何种分布以及分布是否已知的统计推断方法。此类方法通常不会涉及到研究对象的参数,统计推断是比较分布而不是比较参数。,在总体分布不确定的情况下,如何利用数据包含的信息,进行统计推断?,非参数检验(nonparametric statistics),注意:对于符合参数统计分析者,

4、采用非参数统计分析,会降低检验效能。,非参数检验nonparametric statistics,对总体的分布类型不作任何要求,特点:不受总体参数的影响,比较的是分布或分布位置。适用范围:广,可用于任何类型资料。,一组数据的最基本信息是次序,将数值从大到小排序,给出1、2、3,称为该数据的 秩(rank),每个数值在整个数据中均有相应的位置和次序,即有它的秩。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,非参数统计的基本思想:,秩和检验,第一节单样本和配对资料的符号秩和检验,例10-1 已知某地正常人尿铅含量中位数为2.50umol/L

5、。今在该地随机地抽取16名工人,测定其尿铅含量见下表示,问该厂工人的尿铅含量是否高于当地正常人?,一、单样本设计资料的符号秩和检验,案例分析:,资料类型:单样本设计的定量变量检验方法选择:,差值不服从正态分布,单样本设计的定量变量,对差值进行正态性检验,单样本资料的符号秩和检验即:Wilcoxon符号秩和检验,W=0.809,P=0.0036,(1)建立假设,确定检验水准:H0:Md=0,差值的总体中位数等于0,即该厂工人的尿铅含量与正常人相同;H1:Md0,差值的总体中位数不等于0,即该厂工人的尿铅含量高于正常人。=0.05(单侧),附表 某厂16名工人与当地正常人的尿铅含量比较及编秩,符号

6、秩和检验的基本思想是:,如果该厂工人的尿铅含量与正常人相同的话,那么各观察值与已知总体中位数的差值的总体分布为对称分布,并且以0为中心,即差值的总体中位数为0;也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与负秩和应相差不大,即使有些差别,也只能是一些随机因素造成的、在一定范围内的差别,它们均应接近n(n+1)/4,n为有效对子数。如正、负秩和相差殊,超出抽样误差可解释的范围,则有理由怀疑该假设,从而拒绝H0。,编秩:依差值绝对值的大小从小到大编秩;编秩原则:编秩时遇差值0,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩;符号相反取平均秩次。按差值的正负给秩次

7、加上正负号。.求秩和并确定检验统计量:以T+表示正秩和,T-表示负秩和,T+T-n(n+1)/2取T+和T-中较小者为检验统计量T。,计算检验统计量:,若T 值在上、下界值范围内,则P a;若T值在上、下界值外或等于界值,则P a。,确定P 值的方法:,当5n50,用查表法:查T 界值表(附表9,P483:配对符号秩和检验用),当n50,用正态近似法,即u 检验:,计算u值:,当相同秩次多时,应改用校正公式:,检验步骤:,(1)建立假设,确定检验水准:H0:Md=0,即该厂工人的尿铅含量与正常人同;H1:Md0,即该厂工人的尿铅含量高于正常人。=0.05,(2)计算检验统计量:,求差值:按差值

8、绝对值大小编秩,并按其正负给秩加符号。.求秩和确定检验统计量:T+108,T-28.取T-28.为检验统计量,(3)确定P 值,作出推断结论:,本例n=16,T-28.,查T 界值表双侧P 0.05。在a=0.05水准上,拒绝H0 接受H1,差异有统计学意义,可认为Md不为0,即该厂工人的尿铅含量高于正常人。,例10-2 对11份工业污水测定氟离子浓度(mg/L),每份水样分别采取电极法及分光光度法测定,问就总体而言,这两种方法的测定结果有无差别?,二、配对设计资料的符号秩和检验,案例分析:,资料类型:配对设计的数值变量检验方法选择:,差值不服从正态分布,配对设计的数值变量,对差值分布进行正态

9、性检验,配对资料的符号秩和检验即:Wilcoxon符号秩和检验,W=0.456,P=0.0001,T+=43.5 T-=11.5,数据录入,【电脑实现】SPSS,2.SPSS过程:,3.SPSS结果输出:,检验步骤:,(1)建立假设,确定检验水准:H0:Md=0,即两种方法测定的中位数相同;H1:Md0,即两种方法测定的中位数不同。=0.05,(2)计算检验统计量:,求差值:按差值绝对值大小编秩,并按其正负给秩加符号。.求秩和确定检验统计量:T+43.5,T-11.5.取T-28.为检验统计量,(3)确定P 值,作出推断结论:,本例n=10,T界值=(8,47),因 T-11.5.,得P0.0

10、5。在a=0.05水准上,不能拒绝H0,不能拒绝Md为0,即尚不能认为两法测定结果有差别。,第二节两组独立样本比较的秩和检验,例10-3 用两种药物杀灭钉螺,每批用200-300只活钉螺,用药后清点钉螺的死亡数,计算死亡率(%),问两种药物杀灭钉螺的效果有无差别?,一、定量变量两组独立样本的秩和检验,案例分析:,资料类型:定量变量、成组设计两独立样本检验方法设计:,考察两样本的正态性,成组设计两独立样本,两样本比较的秩和检验Wilcoxon two-sample test,该资料是百分率资料,不服从正态分布,Wilcoxon秩和检验的基本思想是:,假如H0成立,即样本含量分别为n1、n2两样本

11、来自同一总体,或分布相同的两个总体时,则n1 样本的实际秩和(T)和其理论秩和 的差异仅为抽样误差所致,应相差不大。当二者相差殊,超出抽样误差可解释的范围,则有理由怀疑该假设,从而拒绝H0。,编秩原则:将两组数据合并由小到大统一编秩。编秩时遇到相同数据:在不同组时,各取平均秩次,在同一组时,可取其平均秩次,也可顺次编秩 求秩和并确定检验统计量:当两样本量不等时,取样本量小者(n1)的秩和为检验统计量T;当两样本量相等时,可任取一组的秩和为T。,若T 值在上、下界值范围内,则P a;若T值在上、下界值外或等于界值,则P a。,确定P 值的方法:,当n110,n2-n110时,查表法。查T界值表(

12、附表10,P484:两样本比较的秩和检验用),97-173,36-69,确定P 值的方法:,n1或 n2-n1 超出了T 界值表的范围,用正态近似法,即Z 检验法:,N=n1+n2,连续性校正数,即若相持出现较多,如超过25%时,对Z值进行校正:,第 j次相同秩次的个数,检验步骤:,(1)建立假设,确定检验水准:H0:两种药物杀灭钉螺死亡率的总体中位数相等;H1:两种药物杀灭钉螺死亡率的总体中位数不相等。=0.05,(2)计算检验统计量:,两组统一编秩:以实验组的秩次为检验统计,即n1=7,n2-n1=0,T=71.5,(3)确定P 值,作出推断结论:,据n1=7,n2-n1=0,T=71.5

13、,查T 界值表双侧P0.05。在 a=0.05水准上,拒绝H0 接受H1,可认为两种药物杀灭钉螺的效果有差别。由于甲药平均秩次为71.5/7=10.2,乙药的平均秩次为33.5/7=4.8,故可以认为甲药效果优于乙药。,数据录入,【电脑实现】SPSS,2.SPSS过程:,3.SPSS结果输出:,【结果报告】,本例秩和检验结果显示:T=33.5,查T界值表得 P 0.05,按=0.05拒绝H0,接受H1,差异有统计学意义,可认为甲药效果优于乙药。,例10-4 某医科大学营养教研室为了解居民体内核黄素营养状况,于某年夏冬两季收集成年居民口服核黄素4小时的负荷尿,测定体内核黄素含量,试比较夏冬两个季

14、节体内核黄素含量有无差别?,二、有序分类变量两组独立样本的秩和检验,检验步骤:,(1)建立假设,确定检验水准:H0:夏冬两个季节体内核黄素含量的总体中位数相等;H1:夏冬两个季节体内核黄素含量的总体中位数不相等。=0.05,(2)计算检验统计量:,两组统一编秩:求各组秩和:T1=16.510+48.514+74.516=2036 T2=16.522+48.518+74.54=1534 确定检验统计量:T=T1=2036,(3)确定P 值,作出推断结论:,n1=40,用正态分布法计算Z值:,相持数太多,需要校正:,因Z0.05=1.96,故P0.05,按=0.05水准,拒绝H0,接受H1,认为夏

15、冬两季居民体内核黄素含量有差别;且夏组平均秩次为2036/40=50.9,冬组为1534/44=34.8,故可以核黄素的体内含量夏季高于冬季。,数据录入,【电脑实现】SPSS,2.对频数进行加权,3.秩和运算过程,4.SPSS结果输出:,第三节 多组独立样本的秩和检验,例10-5 某医院用3种不同的方法治疗15例胰腺癌患者,治疗后生存月数见下表示,问这三种方法的疗效有无差别?,一、定量变量多组独立样本的秩和检验,案例分析:,资料类型:定量变量、多组样本检验方法设计:,对多样本进行正态性检验,多组设计的独立样本,多样本比较的秩和检验Kruskal-Wallis rank test,生存月数不符合

16、正态分布,计算检验统计量 H 值:,若相同秩次较多,应采用下式计算校正Hc值:,确定 P 值,下结论:,若处理组数k=3,每组ni5,则查H界值表得到P=0.05和 P=0.01时的临界值,后比较,下结论。若处理组数k4,每组ni不小于5,则H值近似地服从2分布,可查2界值表,得到2临界值,后比较,下结论。,检验步骤:,(1)建立假设,确定检验水准:H0:3种方法治疗后患者生存月数的总体中位数相等;H1:3 种方法治疗后患者生存月数的总体中位数不全相等。=0.05,(2)计算检验统计量:,计算检验统计量H 值:,(3)确定P 值,作出推断结论:,因为k=3,各组例数均为5,查表得H界值=5.7

17、8,P0.05。在 a=0.05上,拒绝H0,接受H1,可认为3种方法治疗后胰腺癌患者的生存月数有差别。,3组统一编秩;求各组秩和;,例10-6 某医院用3种方法治疗慢性咽炎,结果如下:问这三种方法的疗效有无差别?,二、有序变量多组独立样本的秩和检验,检验步骤:,(1)建立假设,确定检验水准:H0:3种方法疗效的总体分布相同;H1:3种方法疗效的总体分布不同。=0.05,(2)计算检验统计量:,3组统一编秩:求各组秩和:T1=32.524+96.526+183.572+358.5186=83 182 T2=32.520+96.516+183.524+358.532=18 070 T3=32.5

18、20+96.522+183.514+358.522=13 229,计算检验统计量H 值:,相持数太多,需要校正:,(3)确定P 值,作出推断结论:,因为k=3,各组例数均多于5,查 x2界值表x2界值=5.99,P0.05。在 a=0.05上,拒绝H0,接受H1,可认为3种方法治疗慢性咽炎的效果有差别。,当多个独立样本比较的 Kruskal-Wallis H检验的结果拒绝H0,接受H1 时,只能得出各总体分布位置不同。若想进一步了解到底哪两个组间有差异?还要进一步做两两比较如扩展的 t 检验法。,三、多个独立样本间的多重比较,小 结,非参数检验是不依赖于总体分布类型,也不对总体参数进行推断的一

19、类统计方法。非参数检验适用于 分布类型不明;一端或两端观察值不确切,分布不对称且无法转化为正态分布;方差不齐且无法变换达到方差齐的资料;等级资料。秩和检验是非参数检验的方法之一,其基本原理是原数据转为秩次,比较各组秩和的非参数检验。,不同设计类型的资料其秩和检验的编秩、求秩和、计算统计量、确定P值的方法不同。,应注意编秩时的平均秩次,以及相持较多时统计量的校正。,案例10-1 某研究者欲研究熊去氧胆酸对脂肪肝的发生有无预防作用,将10只雄性大鼠随机分为两组。一组正常喂养,另一组采用正常饲养+熊去氧胆酸喂养,经一段时间后,测其肝脏脂类总量%(w/w),问两组肝脏脂类量有无差别。.,案例分析,法一

20、:某研究者对该资料做了两独立样本的t检验:,结论:按=0.05水准,不拒绝H0,认为 添加熊去氧胆酸对大鼠脂肪肝无预防作用。,法二:另一位研究者采用两独立样本秩和检验,由 n1=5,n2-n1=0,T=39,查T界值表,得出0.01P0.02,对该资料做了两独立样本的t检验:按=0.05水准,拒绝H0,接受H1,认为为添加熊去氧胆酸对大鼠脂肪肝有预防作用。,对于上述两种分析结果,请讨论:,你认为哪位研究者的统计推断是正确的?为什么?从这个案例中,你得到什么启示?,最佳选择题:,1.多样本计量资料比较,当分布类型不清时选()A.t 检验 B.u检验 C.秩和检验 D.2检验,2.以下对非参数检验

21、的描述哪一项是错误的是()A.非参数检验方法不依赖于总体的分布类型 B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数的检验效能低于参数检验 D.一般情况下非参数检验犯第二类错误的概率小于参数检验,3.配对比较的秩和检验的基本思想是:如果检验假设成立,则对样本来说()A正秩和的绝对值小于负秩和的绝对值 B正秩和的绝对值大于负秩和的绝对值 C正秩和的绝对值与负秩和的绝对值不会相差 很大 D正秩和的绝对值与负秩和的绝对值相等,4.在进行成组设计两样本秩和检验时,以下检验假设正确的是()AH0:两样本对应的总体均数相同 BH0:两样本均数相同 CH0:两样本对应的总体分布相同 DH0:两样本

22、的中位数相同,1.符合t 检验条件的数值变量资料如果采用秩和检验,第一类错误的概率往往会增大。2.两独立样本比较的秩和检验中,当相同的数据在同一组时,可以求平均秩次,也可不求平均秩次。3.非参数检验对资料没有严格的要求,所以在进行两组数值变量资料比较时,可直接采用秩和检验。4.配对设计两样本比较的秩和检验,若T 值在界值范围内,则P 值小于相应的概率。,是非题:,简答题:,非参数检验的基本思想是什么?非参数检验和参数检验的主要区别是什么?非参数检验的适用范围有哪些?两组等级资料平均效应的比较为什么不用2检验而应用秩和检验?对于研究目的相同的同一资料,用参数检验和非参数检验结果不一致时,该怎么办?,计算题:某营养实验室随机抽取24只小鼠随机分为两组,一组饲用未强化玉米,一组饲用已强化玉米,观察玉米强化前后干物质可消化系数的差别有无显著意义。,计算题:某营养实验室随机抽取24只小鼠随机分为两组,一组饲用未强化玉米,一组饲用已强化玉米,观察玉米强化前后干物质可消化系数的差别有无显著意义。,THANK YOU!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号