非参卡方检验.ppt

上传人:牧羊曲112 文档编号:6491715 上传时间:2023-11-06 格式:PPT 页数:74 大小:327.50KB
返回 下载 相关 举报
非参卡方检验.ppt_第1页
第1页 / 共74页
非参卡方检验.ppt_第2页
第2页 / 共74页
非参卡方检验.ppt_第3页
第3页 / 共74页
非参卡方检验.ppt_第4页
第4页 / 共74页
非参卡方检验.ppt_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《非参卡方检验.ppt》由会员分享,可在线阅读,更多相关《非参卡方检验.ppt(74页珍藏版)》请在三一办公上搜索。

1、第六讲 非参数检验和卡方检验,非参数的统计分析,主要内容,非参数检验的必要性非参数检验的预备知识SPSS非参数模块介绍两个配对样本的非参数检验两个独立样本的非参数检验多个独立样本的非参数检验多个相关样本的非参数检验,非参数检验与参数检验,参数统计方法:如检验和方差分析特点:假定随机样本来自某种已知的分布的总体对总体分布的参数可估计或检验,非参数检验与参数检验,问题:比较男女红细胞数的差别参数检验步骤建立无效假设H0:u=u0,H1:uu0计算统计量t?p0.05,p0.05,下结论:有统计意义,认为男女红细胞数不同通过比较均数回答两总体是否相同的问题,参数检验的条件,观测值互相独立两样本对应的

2、总体服从正态分布(双变量正态分布)两样本方差齐当条件不满足时方差不齐:t检验非正态:变量变换、稳健方法、非参数法,非参数检验的必要性,问题:总体分布不确定分布呈非正态且无适当数据转换方法不能或未加精确测量:如等级资料,非参数法,参数法条件不满足时的处理方法对参数的分布没有什么要求distribution free不对均数等参数检验,而是检验分布是否相同(构造的统计量)效能可能比较低当数据满足参数法条件时,效能低于参数法不满足参数法条件时,处于“优势”,非参数检验的特点,优点具有较好的稳健性受限条件少:对数据要求不像参数检验那样严格适用范围广:不受总体分布限定缺点检验效率低于参数检验主要是犯第二

3、类错误的可能性加大,非参数检验预备知识,数据分布类型的把握数据的初步描述图象的巨大作用图象总比单个地数据提供了更多的信息可以对整个数据的分布有全面的了解直方图Histogram直观描述,并且和正态曲线比较P-P图和Q-Q图专业的分布描述和检验工具囊括10多个分布,并且分析残差,非参数检验预备知识,顺序统计量:非参数检验的理论基础通过对数据从小到大的排序(即排队),并由数据的大小排序号(排队号)代替原始数据进行统计分析。秩(Rank):排序号(排队号)在统计学上称为秩结(ties):绝对值相等称为结又称同秩,则取平均秩次。,SPSS非参数检验介绍,分布位置检验,检验几个总体是否相同2 Indep

4、endent Samples:两个独立样本的比较K Independent Samples:多个独立样本的比较2 Related Samples:两个配对样本的比较K Related Samples:多个相关样本的比较,分布类型检验,检验某样本是否服从一定总体分布,也称为拟合优度检验分类资料:Chi-SquareBinomial:也可是连续性变量Runs连续性变量1Sample K-S(柯尔莫诺夫-斯米尔诺夫检验)检验:正态分布、均匀分布、二项分布、指数分布,两个配对样本的非参数检验,2 Related SamplesH0:差值的总体中位数Md=0H1:差值的总体中位数Md0基本原理:检验配对

5、数据的差值总体的中心位置是否为0sign符号检验Wilcoxon符号秩和检验,Wilcoxon符号秩和检验,配对设计差值的符号秩和检验,正态近似法:当N50时,T分布逼近均数为?,方差为?的正态分布,故可用u检验,配对样本比较的非参数检验方法,Wilcoxon:符号秩和检验,最常用Sign:符号检验,只利用了正负号,效能较低McNemar:配对卡方检验,只适用于两分类资料,特别适合于自身对照设计Marginal Homogeneity:McNemar法多分类下的扩展,分析实例,例:两种去污配方去污剂除污时间比较,对12份污渍物件分别用新、老两种去污配方去污剂测量去污时间,分析两种去污剂功效有无

6、差别?分析同一样本用两种方法测量是配对设计差值的分布呈正态分布?,独立样本间的比较,2 Independent SamplesMann-Whitney UK Independent SamplesKruskal-Wallis H检验两个或多个独立样本所在总体是否相同界面上基本相同,两个独立样本的非参数检验,2 Independent Samples过程Mann-Whitney U检验:比较两个总体分布的各自中心位置是否相同如两个样本来自相同的总体,则两组数据应相间出现,如来自不同的总体,则会出现一组数据分布比另一组数据高或低的趋势结果同Wilcoxon 秩和检验,实例,独立样本比较的非参数检验

7、方法,两独立样本比较的非参数方法Mann-Whitney U:两样本等级和检验,利用大小次序进行检验Kolmogorov-Smirnov Z:即K-S检验Moses extreme reactions:结果为单侧检验Wald-Wolfowitz runs:游程试验中的一种,多个独立样本比较的非参数检验,独立样本比较的非参数检验方法,Kruskal-Wallis H:最常用Median:中位数检验,统计效能较低Jonckheere-Terpstra:适用于连续性或有序分类资料,有序分类时统计效能高于Kruskal-Wallis H,分析实例,结果解释,多个样本间的两两比较,只能得到各组总的有没有

8、差别的结论得不到两两比较的结果解决办法直接进行两组间的非参数检验(样本量较小时)调整编秩后方差分析,多个相关样本的非参数检验,K Related SamplesFriedman检验区组内进行编秩,再将处理组的各区组秩相加,然后比较处理组的位置是否相同,结果解释,随机区组样本比较的非参数检验,Friedman:最常用,Kendalls W:Kendall的和协系数,表示K个指标间的关联程度Cochrans Q:McNemar的推广,只适用于两分类资料,无序分类变量的统计推断卡方检验,主要内容,统计学回顾拟合问题:样本率与已知总体率的比较相关问题:两个(多个)率或构成比的比较两分类变量间的关联程度

9、的度量一致性检验和配对卡方检验分层的卡方检验,统计学回顾,检验基础,卡方检验原理以卡方分布为基础的一种常用假设检验方法根据样本推断总体的分布与期望分布有无差别推断两个分类变量是否相关联或相互独立H0:观察频数与期望频数无差别,卡方的计算表示观察值与期望值之间的偏离程度,卡方分布,统计学回顾,假设H0:1=2,H1:12,=0.05实际数、观察值(A,actual frequency)为实际的频数数据理论数、期望值(E,expected frequency)是在无效假设成立的前提下计算的频数,分类资料数据录入格式,拟合问题:样本率与已知总体率的比较Chi-square过程,用来检验变量的几个取值

10、所占百分比是否和期望的比例有统计学差异。如在人群中随机抽取样本,来分析四种血型所占的比例是否相同(都是25%),新生儿的出生男女性别比是否为50或检验样本比例与指定比例是否相同该检验与一般所用的卡方检验不同,一般的卡方检验是用crosstable菜单来完成,分布类型检验Chi-square过程,界面说明主对话框:Test Variable List框:指定需要检验的变量Expected Range单选框:设定需检验变量的取值范围,默认为最大值和最小值Expected Values单选框:指定已知总体的各分类构成比,默认各类别构成比相等Exact子对话框:共有近似概率、蒙特卡罗模拟法计算的确切概

11、率和直接计算确切概率三种选择,分析实例,公司人员变动后,经理、监察员、办事员三种职务的比例是否仍为15:5:80比较:观察值和理论值的差别H0:三个职务的构成比例为15:5:80H1:个职务的构成比例不是15:5:80,分布类型检验Chi-square过程,结果解释,分布类型检验Chi-square过程,结果解释:不拒绝H0,相关问题:两个(多个)率或构成比的比较,推断两个或多个分类变量是否相关联或相互独立两个或多个发生率或构成比是否相同Crosstabs过程,Crosstabs过程,Crosstabs过程用于对分类资料和有序分类资料进行统计描述和统计推断。可以产生二维至n维列联表,并计算相应

12、的百分数指标。统计推断包括了常用的X2检验、Kappa值,分层X2(X2M-H)。计算n维列联表的确切概率(Fishers Exact Test)值。,Crosstabs过程详解,界面说明【Rows框】用于选择行列表中的行变量【Columns框】用于选择行列表中的列变量【Layer框】Layer指的是层,如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。,界面说明,【Display clustered bar charts复选框】显示重叠条图。【Suppress table复选框】选中后可禁止在结果中输出行列表。【Exact钮】针对2 2以上的

13、行列表设定计算确切概率的方法,可以是不计算确切概率(Asymptotic only)、蒙特卡罗模拟(Monte Carlo)或确切计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计算默认计算时间限制在5分钟内。可更改默认值。,界面说明,【Statistics钮】用于定义所需计算的统计量。Chi-square复选框:计算x2值,对四格表资料会自动给出校正卡方检验和确切概率法的结果Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数,界面说明,Norminal复选框组:包括一组反映分类资料相关性的指标,有序变量和无

14、序变量均可。Contingency coefficient:即列联系数,其值介于01之间,越大相关性越强;Phi and Cramers V:Phi在四格表x2检验中介于-11之间,在RC表x2检验中介于01之间;Cramers V 则介于01之间,指标绝对值越大相关性越强Lambda:在自变量预测中用于反映应变量预测效果,其值为1时表明自变量预测应变量好,为0时表明自变量对应变量无预测作用Uncertainty coefficient:不确定系数,其值介于01之间,界面说明,Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标。Gamma:介于01之间,当所有观察值集中于左上角和

15、右下角时,其值为1Somersd:由tau-b改进而来,介于-11之间Kendalls tau-b:介于-11之间Kendalls tau-c:由tau-b改进而来,介于-11之间,界面说明,Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例;Kappa复选框:计算Kappa值,即内部一致性系数,介于01之间;Risk复选框:计算比数比OR值、RR值;McNemanr复选框:进行McNemanr检验(一种非参检验),即进行配对卡方的检验;Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量、X2CMH,可在下方输

16、出H0假设的OR值,默认为1。,界面说明,【Cells钮】用于定义列联表单元格中需要计算的指标Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected)Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total)Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)标化后的差值(Standardized,实际数与理论数的差值除理论数),由标准误确立的单元格残差(Adj.Standardized),界面说明,【Format钮】用于选择行变量是升序还是降序排列,分析

17、实例,三种职位类别中是否存在性别比例差别H0:性别和职位类别独立,或不同性别的职位类别构成没有差别H1:性别和职位类别不独立,或不同性别的职位类别构成有差别,结果解释,拒绝H0,认为不同性别的职位类别构成有差别,其他检验方法,连续性校正的卡方检验Continuity CorrectionFishers确切概率法Fishers Exact Test似然比卡方Likelihood Ratio线性相关的卡方值Linear-by-Linear Association,卡方检验对数据要求,非配对22四格表理论数5且n40,用Pearson卡方检验理论数1且n=40,用校正的卡方检验理论数1或n40,用F

18、isher确切概率法检验,两分类变量间关联程度的度量,相对危险度Relative Risk优势比Odds Ratio,分析实例,报纸订阅与邮件回应的相关性,报纸订阅者回应邮件的概率是非订阅者的几倍分析:卡方检验P0.01,报纸订阅与邮件回应有相关性报纸订阅者回应邮件的概率是非订阅者的倍数通过计算RR值解决,结果解释,报纸订阅者的邮件回应率是非订阅者1.668倍,一致性检验与配对卡方检验,配对设计包括同一样本接受不同处理的比较配对的两个受试对象分别给予两种处理,一致性检验与配对卡方检验,资料为配对资料结果是否基本一致:kappa检验Kappa 0.75一致性好0.75Kappa0.4一致性一般K

19、appa 0.4一致性较差结果有无差别:配对卡方检验(McNemanr),分析实例,两位顾问对20个地址的评价是否一致?分析:同一样本由两位顾问评价,为配对设计评价结果是否一致用kappa检验,结果解释,Kappa 0.429,一致性不强,配对卡方检验(McNemanr)分析:评价结果是否相同?,b+c 40,分层卡方检验,22I多层四格表:用Breslow-Day Test检验各层四格表之间是否有交互作用有交互作用:分析每个层的卡方以及OR或RR(分层分析)无交互作用,用Mantel-Haenszel卡方检验,分析实例,3家分店的客户调查寻求帮助与性别间有无联系?分析:检验不同分店层间有无交互作用不同分店层间寻求帮助与性别间有无联系,结果解释,Breslow-Day Test检验不同分店层间无交互作用Cochrans Mantel-Haenszel检验结果:寻求帮助与性别间有联系,去除分店的影响:女性比男性更容易寻求帮助,统计学回顾,RC表(R2且C2):行因素是列因素均为分类变量,可根据研究问题选作Pearson卡方检验行因素和列因素中:一个为分类变量、另一个为有序变量,则根据研究问题选作Kruskal-Wallis test行因素和列因素均为有序变量,可根据研究问题选作Spearman相关分析,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号