《SPSS统计分析非参数检验课件.ppt》由会员分享,可在线阅读,更多相关《SPSS统计分析非参数检验课件.ppt(39页珍藏版)》请在三一办公上搜索。
1、第九章非参数检验,非参数检验,非参数检验是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体的一类假设检验方法,因这些方法一般不涉及总体参数而得名。主要类型:Chi-square test 卡方检验Binomial test二项式检验Runs test 游程检验等等,变量关系的显著性检验类型,假设 m=800,样本1:X1795;S10,m1.96 Se,样本2:X2790;S10,接受区95,拒绝区5,B、卡方计算公式:,一、定类定类尺度:2检验卡方检验是用来检验样本中两个定类变量的关系强度测量结果(卡方值)是否能推断总体。A、2检验的假设:H0:20;H1:20;,
2、C、卡方分布形状,拒绝域,接受域,D、SPSS中卡方检验示例(性别与文化程度)步骤:1)确定双变量总体参数的假设:H0:X20;H1:X2 0;2)确定检验此假设的概率标准:显著度为0.05。3)抽取一个样本容量为1254的随机样本,计算出样本中性别与文化程度的X227.89。4)选择用来检验H0 的分布:X2分布,并根据显著度0.05设立接受域(P0.05)或拒绝域(P0.05);5)观察样本的统计量的概率值是否落在接受域内,从而判断是接受/拒绝原假设。从下表看出,样本统计量X227.89,概率值(Significance)=0.0000.05,落在拒绝域,因此,否定H0;接受总体中X227
3、.89的判断。此判断犯错误的概率)=0.0000.05。,显著性检验结果,卡方值,二、定类定距尺度:F 检验F检验是用来检验样本中一个定类变量和一个定距变量的关系强度测量结果(分组平均数)是否能推断总体。如不同职业的人在收入上是否有差异(即职业分组的平均收入是否不同)。A、F 检验的假设:H0:12 3.k;H1:1 2 3.k;B、F 值计算公式:,C、F分布的形状,接受域,拒绝域,拒绝域,D、SPSS中 F 检验示例(文化程度与收入)步骤:1)确定双变量总体参数的假设:H0:12 3.k;H1:1 2 3.k;2)确定检验此假设的概率标准:显著度为0.05。3)抽取一个样本容量为1254的
4、随机样本,计算出样本中文化程度与收入的 F 6.006。4)选择用来检验H0 的分布:F 分布,并根据显著度0.05设立接受域(P0.05)或拒绝域(P0.05);5)观察样本的统计量的概率值是否落在接受域内,从而判断是接受/拒绝原假设。从下表看出,样本统计量F 6.006。概率值(Significance)=0.0000.05,落在拒绝域,因此,否定H0;拒绝总体中H0:12 3.k 的判断。即由样本可以推断总体,不同的文化程度,收入有差别;文化程度与收入有关。,F值,显著度,三、定距定距尺度相关系数r的显著性检验:t检验t检验也可用来检验样本中一对定距变量的相关系数r在总体上是否有效。其检
5、验的方式与前面的假设检验大同小异。在此我们只略述检验的原假设以及检验结果。A、相关系数检验的原假设:H0:r0;H1:r 0;B、检验结果:检验结果的概率值若小于给定的显著度,如0.05,则推翻原假设,说明两变量总体上有相关。即样本中的相关系数在总体中也有效。,C、SPSS中相关系数 r 的t检验示例:,CorrelateBivariate,显著性检验结果,相关系数,样本量,t检验概率值,四、回归系数B的显著性检验:t 检验样本中的回归公式中计算出的自变量回归系数B在总体中是否有效,需要用t分布来检验。检验步骤同于前述的假设检验。A、原假设:H0:B0;H1:B 0;B、检验结果:检验结果的概
6、率值若小于给定的显著度,如0.05,则推翻原假设,样本中的回归公式可用于说明总体。,C、t分布形状:,拒绝域,拒绝域,回归系数,t 值,t 值的显著度,第五章 参数估计与假设检验,主要内容,第一节 单一样本T检验(One-Sample T Test)第二节 独立样本T检验(Independent-Sample T Test)第三节 配对样本T检验(Paired-Sample T Test),均值比较与均值比较的检验过程,均值比较的概念统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到
7、一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同;又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:均值不相等的两组样本不一定来自均值不同的总体。能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体具有显著性差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。,一、简介 主要用于检验单个变量的均值与假设检验值(给定的常数)之间是否存在差异,也可进行单样本的参数区间估计。二、完全窗口分析 按Analyz
8、eCompare MeansOne-Sample T Test顺序,打开One-Sample T Test主对话框(如图5-1),第一节 单一样本T检验,图5-1 One-Sample T Test主对话框,图5-2 Options对话框,Test Variables框:用于选取需要分析的变量,Test Value:输入已知的总体均值,默认值为0,Confidence Interval:输入置信区间,一般取90、95、99等。,Missing Values:在检验变量中含有缺失值的观测将不被计算。在任何一个变量中含有缺失值的观测都将不被计算,三、例题分析(一)05-1 某校在对一项教学改革措施
9、的评价中,随机抽取了60位学生进行态度调查,他们的10项态度7级量表的态度反应资料见下表:,试构造学生态度得分平均值的98%的置信区间。,(二)以04-7的资料来说明。已知另一地区16-18岁的少年血红蛋白平均值为11.657(g%),检验这一地区16-18岁少年血红蛋白平均值是否与另一地区的平均值相等。1、操作步骤 1)(打开数据文件“04-7血红蛋白.sav”。)按AnalyzeCompare MeansOne Sample T Test顺序,打开主对话框。2)将变量hb选入 Test Variable框。3)在Test Value中输入 11.657,后单击OK。,2、结果分析,表5-1
10、 单个样本统计量,表5-1 是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。,表5-2 单个样本检验,从表5-2可看出,t值为-0.592,自由度为39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95%的置信区间是-0.93790.5134。,(三)为了解某村1300户农民的年收入状况,不重复抽取70户家庭进行调查,得出每户农民年平均收入为4500元,标准差为260元。试求该村每户农民年平均收入95%的置信区间。(四)某商品的零售商要求总代理增加广告费支出,认为如此每星期平均销售量可达20000箱。总代理增加广告费三个月后想了解平均销售情况,随机抽取16家零
11、售店调查,发现每星期平均销售量只有15000箱,标准差为6000箱。假设销售量服从正态分布,试问平均销售量的下降是否因偶然因素所致(0.01)?,一、简介 用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。如果两组样本彼此不独立,应使用配对T检验(Paired-Sample T Test)。如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量,应使用Crosstabs功能。独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametric test)。,第二节 独立样本T检
12、验,两个独立样本之差的抽样分布,两个总体均值之差的检验(12、22 已知),1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和 n230)2.检验统计量为,两个总体均值之差的检验(12、22 未知,大样本),检验统计量为,两个总体均值之差的检验(12、22 未知但相等,小样本),检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等检验统计量,其中:,两个总体均值之差的检验(12、22 未知且不相等,小样本),检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分
13、布两个总体方差未知且不相等12 22检验统计量,方差齐性检验(Levene F方法):计算两组样本的均值计算各个样本与本组均值的平均离差绝对值;利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。在对两独立样本进行T检验时,两组样本方差相等和不等时,计算t值使用的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果,自己选择t检验输出中的结果,得出最后结论。如果推断两总体方差相等,则看方差相等的T检验值和P值;如果推断两总体方差不相等,则看方差不相等的T检验值和P值。,图53 独立样本T检验主对话框,从源变量框中选取要作检验的变量。,为分组变量,只能有一个。,二、完全窗口分析
14、按AnalyzeCompare MeansIndependent-Sample T Test顺序,打开Independent-Sample T Test主对话框(如图5-3),在检验变量中含有缺失值的观测将不被计算。在任何一个变量中含有缺失值的观测都将不被计算,输入置信区间,一般取90、95、99等。,图5-5 Independent-Sample T Test的Options对话框,图54 Define Groups 主对话框,分别输入分组变量的取值条件,如1为男,2为女等。输入分界点值,如体重60公斤等。,三、例题分析(一)05-2 某一个新的制造过程可以增加电池的使用寿命,假设电池使用寿命服从正态分布。在新电池中随机抽15个,而在旧电池中随机抽12个同时测试其使用寿命,资料如下,试求新旧两种电池平均寿命之差的95%的置信区间。新电池(日):18.2,10.4,12.6,18.0,11.7,15.0,24.0,17.6,23.6,24.8,19.3,20.5,19.8,17.1,16.3旧电池(日):12.1,7.5,8.6,13.9,7.8,15.1,17.9,10.6,13.8,14.2,15.3,11.6,