《常用统计参数课件.ppt》由会员分享,可在线阅读,更多相关《常用统计参数课件.ppt(234页珍藏版)》请在三一办公上搜索。
1、,常用统计参数,分享者:何晓燕 12级心理、教育学专业学生,集中量数,差异量数,地位量数,相关系数,第一节集中量 数,集中量数概述,定义: 代表一组数据典型水平或集中趋势的特征量。功能:(1)描述和代表研究对象的一般水平(2)与同质的另一研究对象进行比较研究种类: (1)平均数 (2)中数 (3)众数,大小之中,位置之中,频数之众,算术平均数,加权平均数,几何平均数,调和平均数,一 平均数,(一)算术平均数定义: 所有观测值的总和除以总频数所得的商。(Mean或-X)计算方法:(1)定义式(2)加权式(简捷式)平均数的性质:优缺点适用条件,1.1.2 Mean的计算,1、定义式,有一组测验分数
2、为: 67 80 91 80 76 79 80 76求这组数据的平均数,如果用系数形式怎样快速求出上例的均值?,有一组测验分数为: 67 80 91 80 76 79 80 76求这组数据的平均数,权数或权重,加权式,1.1.2 Mean的计算,2、加权式及变式基本公式:变式 (1)归一化均数 (2)总均数 (3)次数分布表的均数,2.1 归一化均数,某生期中成绩为72分,期末成绩为86分,如果期中期末比重为4:6,请问这个学生的学期成绩为多少?,归一化权重,公式的推导,应用,如果分别按照10、20、25、 25、 20的比例来录取,该优先录取谁呢?,2.2 加权平均数(总体均数),求该年级的
3、平均分,该年级平均分是多少?,解题思路(1)求各组组中值(m)(2)求各组总分(mf)(3)求总分数(mf)(4)求总体的平均分(mf/f),M=80.1,公式演变,2.3 次数分布表的均数,1.1.3 Mean的性质,1、观测值的总和等于算术平均数N倍,即2、各观测值与算术平均数的差(离均差)的总和等于零,即,1.1.3 Mean的性质,3、一组数据中各数与平均数的离差平方和最小,即4、一组数据中每个数都加(减)一个常数C,所得的平均数为原来的平均数加(减)常数C。即,1.1.3 Mean的性质,5、一组数据中每个数都乘(除)一个常数C,所得的平均数为原来的平均数乘(除)常数C。,即6、一组
4、数据由两部分(或几部分)组成,则这组观测值的算术平均数可以由组成部分的算术平均数而求得,即,一 平均数,(二)加权平均数(weighted mean)1、定义: 不同比重数据(或平均数)的平均数(MW).2、计算方法:3、适用条件(1)小组平均求总平均时(2)各个数据的分量不一样时,一 平均数,(三)几何平均数(geometric mean)1、定义: N个数据连乘积的N次方根。(Mg)2、计算方法:3、适用条件: 1)当数据成比率的时候( 如:进步率、增加率、提高率等); 2)有极端数据,分布呈偏态,一 平均数,(四)调和平均数(harmonic mean)1、定义: 一组数据的倒数的算术平
5、均数的倒数。(MH)2、计算方法:3、适用条件 计算平均速度, 如阅读速度、解题速度、识字速度等,二 中数,2.1 定义: 按顺序排列的一组数据中居于中间位置数。(Median或Md)2.2 计算方法:(1)原始数据法(2)次数分布表法,2.2 Md的计算,1、原始数据法,数据个数,中数附近是否有重复数据,无重复数值,有重复数值,奇数法,偶数法,无重复数据奇数法无重复数据偶数法,11 12 15 17 18 19 22 23,3 5 6 7 10,有重复数据时,2 3 5 5 7 7 7 11 13,中数所在区间的精确下限,中数前一位的累加频数,中数的频数,三 众数,3.1 定义: 一组数据中
6、出现次数最多的那个数的数值。(Mode或Mo)3.2 计算方法:(1)观察法(2)公式法(3)经验法3.3 优缺点3.4 适用条件,3.2 Mo的计算,1、观察法,原始数据,次数分布表,f出现最多的数值,f最多的区间的m,3 5 5 7 7 7 11 13,Mo84.5,Mo7,3.2 Mo的计算,2、经验法,Pearson经验法,King插补法,分布正态或近似正态,分布偏态,Pearson经验法,提出者:英国统计学家K.Pearson思想:在分布为正态分布或近似正态分布时,众数近似地等于3倍中数减去2倍均数。公式:,四 平均数、中数与众数的比较,(一)三者关系 三者的大小关系与分布形态有关:
7、(1)正态: MMdMo(2)正偏态: MMdMo(3)负偏态: MMdMo(二)优缺点及适用条件比较,正态分布,MMdMo,偏态分布,正偏态,MMdMo,负偏态,MMdMo,(二)优缺点及适用条件比较,优缺点比较,(二)优缺点及适用条件比较,适用条件,两组分数的分布是否一样?为什么?哪个均数的代表性更好?为什么?,某研究者得到以下两组数据: M 甲组 54 63 72 74 82 88 99 532 76 乙组 67 71 73 76 79 82 84 532 76,第二节差 异 量 数,概述,全距、百分位差、四分位差,平均差,方差与标准差,集中量数与差异量的关系,一 概述,差异量:对一组数
8、据变异性(或离中趋势)进行度 量和描述的统计量。 (1)反映各变量值远离中心值的程度 (2)数据分布的另一个特征 (3)从另一侧面反映集中量数的代表程度 (4)常用的差异量是方差、标准差 (5)不同类型的数据有不同的差异量数,二 全距、百分位差、四分位差,(一)全距(Rang) 1、概念 一组数据中最大值与最小值之差,又叫两极差或极差(R)。是表示一组数据离散程度最简单、最易理解的差异量数。 2、计算(1)原始数据(2)次数分布表,如果数据是连续型,须用精确上下限,3 全距的优缺点,优点 (1)概念清楚 (2)意义明确 (3)计算简单 缺点(1)反应不灵敏(2)易受两极端数值影响(3)受抽样影
9、响大,低效的差异量数,4 全距的适用条件,用于研究的预备阶段,用来检查数据的大概散布范围,确定统计分组。,一 全距、百分位差、四分位差,(二)百分位差(percentile deviation) 1、概念 两个百分位数之差(Pd)。常用值: P90-10:一组数据中间部位80个频数的距离。 P93-7: 一组数据中间部位86个频数的距离。,一 全距、百分位差、四分位差,(二)百分位差(percentile deviation) 2、计算 (1)利用公式分别计算两百分位数 (2)计算两百分位数之差 P90-P10 =,Fb,同步练习,求其百分位差P93-P7,3 百分位差的优缺点,优点 (1)概
10、念清楚 (2)意义明确 (3)较少受两极数据影响 缺点(1)反应不灵敏(2)不适合代数处理(3)受抽样影响大,低效的差异量数,4 百分位差的适用条件,计算频数分布峰态量,一 全距、百分位差、四分位差,(三)四分位差(quartile deviation) 1、概念 按一定顺序排列的中间部位50个频数距离的一半(Q).又叫分半四分位差。,一 全距、百分位差、四分位差,(三)四分位差(quartile deviation) 2、计算(1)根据求中数的公式求出第一个四分位数Q1和第三个四分位数Q3(2)代入公式计算分半四分位差,同步练习,求四分位差,3 四分位差的优缺点,优点 (1)简明易懂 (2)
11、计算简单 (3)较少受两极端数据影响 缺点(1)忽略左右50%的数据(2)不适合代数运算,4 四分位差的适用条件,(1)用中数代表集中量(2)有特大或特小数值(3)个别数值不确切,不清楚(4)顺序数据(等级数据),三 平均差(average deviation),1、概念 一组数据中每个观测值与其算术平均数离差之绝对值的算术平均数(AD或MD)。 2、计算(1)定义式(2)次数分布表,离均差,各组组中值,(1)确定组中值(2)求总体平均分(3)代入公式求平均差,3 平均差的优缺点,优点 (1)意义明确 (2)计算容易 (3)反应灵敏 缺点(1)不适合代数运算,同步练习,四 方差与标准差,1、概
12、念(1)方差(variance) 每个数据与该组数据平均数的离差的平方和的均值,即离均差平方和的平均数。也叫变异数、均方(mean square deviation),S2(样本)2 (总体)(2)标准差(standard deviation) 方差的算术平方根。 S或SD(样本)(总体)意义一群数据的平均距离,标准差大好还是标准差小好?,因问题而异,2 方差与标准差的计算,(1)定义式 (2)原始数据法(3)加权式,2 方差与标准差的计算,(1)定义式,同步练习,计算67、71、73、76、79、82、84的方差与标准差。,2 方差与标准差的计算,()原始数据法,同步练习,1、计算下列数据的
13、M与S。(1)8 10 2 5 8 3 2 2 19 12(2)4 1 3 4 8 8 3 3 4 33、上述两组分数的分布是否相同?为什么?,M: S:,原始数据法公式推导,和方(SS),求总体标准差,M,Mi,2 方差与标准差的计算,(4)方差、标准差的合成,强调:只有在应用同一种观测手段,测量的是同一个特质,只是样本不同时,才能应用此公式合成方差和标准差。,(1)求MtMt=5470/7473.9(2)求离差和d2(3)求S2 + d2(4)代入公式,3 方差、标准差的性质,、一组数据中每个数都加一个常数C,新数据的方差和标准差不变,即、一组数据中每个数都乘一个常数C,新数据的方差是原数
14、据方差的常数平方倍,标准差是原数据标准差的常数绝对值倍?。即, 方差及标准差的优缺点,优点 (1)反应灵敏 (2)严密计算 (3)适用进一步代数处理 (4)受抽样影响小 (5)具有可加性 (6)应用范围广,由样本推断总体差异时是最好估计量缺点(1)不太容易理解(2)易受两极端数值影响(3)有个别数据模糊不清时,无法计算, 方差、标准差的适用条件,(1)在描述一组数据分布时,用算术平均数代表集中量时,用标准差代表差异量;(2)计算其他统计量,如差异系数、相关系数、标准分数等,要用标准差;(3)在统计推断中常用方差。,四 各差异量的比较及关系,四 各差异量的比较及关系,1、中数上下各一个四分位距之
15、间包括的总频数;、算术平均数上下各一个平均差之间包括57.51%的总频数、算术平均数上下各一个标准差之间包括68.26%的总频数、样本数量相当大(N500)时,标准差约为全距的1/6,小样本中,全距与标准差的比率要小些;、当次数分布呈正态时,,S=1.2533AD=1.4826QAD=0.7979S=1.1829QQ=0.6745S=0.8453AD,五 集中量与差异量的关系,(1)多组数据比较时,集中量相等,差异量不 等;或差异量相等,集中量不等,都不能说明 各组分布相同。(2)坐标意义不同,集中量是一个点值,差异量 是一段距离(3)集中量的代表性由差异量决定, 差异量数小,集中量代表性大;
16、 差异量数大,集中量代表性小。,小明在期末考试中,语文排第15名,你能对他此次考试做出评价吗?为什么?,某班平均身高160cm,s=8.2;平均体重60kg,s=3.5。黎明身高170cm,体重65kg,试分析黎明身高体重哪方面在班上更突出?,两个中学生语数外三科总分均为276分,能否说明两人学习水平和能力一样?为什么?,第三节相对量数,概述,相对地位量数,相对差异量数,一 概述,绝对数:总体规模或水平增减变化相对数:从数量上反映两个相互联系的现象对比关系的统计指标。,相对量数,相对地位量数,相对差异量数,百分等级,标准分数,差异系数,原始分数的不足,意义不明确单位不等距不具可比性不具可加性,
17、二 百分等级(percent rank),(一)概念 团体分数高低排序后,计算在某一分数下占多少百分比的量数或这一分数在一百个人中超过多少人。 理解:把全班人数按一百人来算,从他所得的分数来决定他在全班占的地位,分数的百分等级越大,他的等级就越高,相反分数的百分等级越小,他的等级就越低。,二 百分等级(percent rank),(二)计算、原始数据法、次数分布表法,单一分数的PR,每一组的PR,二 百分等级(percent rank),、原始数据法,假设某团体人,求每人的百分等级是多少?,同步练习,某团体共100人,试问第15名的百分等级是多少?若N为50、40、20呢?若N为200、500
18、、1000呢?,名次不变,当总人数减少时,百分等级降低当总人数增加时,百分等级升高(同增共减),求此分布中,得80分的同学在团体中的位置如何?,二 百分等级(percent rank),、次数分布表法()单一分数的PR,回顾,求此分布的和位置上的数是多少,公式推导,X,PR,二 百分等级(percent rank),、次数分布表法()每一组的PR求每组精确上限的PRU每组上限的PR即为前一组下限的PR求中点值,百分位数:已知百分点(),求百分位分数P。百分等级:已知原始分数(X),求百分等级Pr。,二 百分等级(percent rank),(三)应用、建立常模、衡量优劣、比较群体成绩,1、建立
19、常模,、衡量优劣,某生在期末考试中,语文成绩的百分等级是90.3,数学成绩的百分等级是94.6。这一结果说明了什么?,()成绩优良()数学比语文更好,、比较群体成绩,某省高考录取分数线为480分,根据甲乙两地区考生的成绩总分的次数分布表求得: 甲地区: P480=72.4乙地区: P480=84.3请问:哪个地区的高考成绩好些?,27.6%,15.7%,二 百分等级(percent rank),(四)适用条件,()两个或两个以上所测特质不同;()两个或两个以上所测特质相同,但样本间水平相差(?),某生某学科成绩为76分,全班平均分为70分,你知道该生在班上具体什么位置吗?如果该班标准差S3如果
20、该班标准差S12,三 标准分数(standard score),1、概念 以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,又称Z分数。即:以标准差(S)为单位所表示的“原始数据(X)与平均数(M)的偏差”。公式:,三 标准分数(standard score),、实质,把单位不等距和缺乏明确参照点的分数转化成以标准差为单位,以均数为参照点的量表分数。,三 标准分数(standard score),、实质,Z分数通过把每个X值转化为带记号()的数字来确定某分数在分布中的精确位置,(1)记号代表在平均数之上还是之下(2)数字是用标准差数表示分数到平均数的距离。,三 标准分数(stand
21、ard score),、性质(1)Z=0,(2),三 标准分数(standard score),、优点()可比性()可加性()明确性()稳定性,三 标准分数(standard score),、应用()比较单位不同变量的位置()合成不同质数据,三 标准分数(standard score),()比较单位不同变量的位置,某班学生的平均身高为160cm,S=8.2,体重为60kg, S=3.5,某生身高为170cm,体重为62kg。试问:该生的身高和体重哪方面在班上更突出?,三 标准分数(standard score),()合成不同质数据,甲乙两个小学生在一次考试中语数总分均为184,该班成绩见下表。
22、问:两人学习能力是否相同,为什么?,三 标准分数(standard score),()异常值取舍、异常值产生原因属总体的一个体,但离差很大;混入另一总体的某一分数;实验或调查的失误,三 标准分数(standard score),()异常值取舍查表法,有一样本n=35,一原始分数为98,Z分数为2.86。试问:该分数是否是这一样本的异常值?怎样将其舍去?,拉格布斯“舍弃异常值临界值表”,当n=35时,查表Z0.05 =2.82Z=2.86 Z0.05 = 2.82,舍去,三 标准分数(standard score),()异常值取舍正态法将怀疑为异常值的数值转化为Z分数,看其是否小于2.58 .,
23、假设正常人的心率为72次/分,标准差为10次/分,某人的心率为140次/分。试问:这人的心率是否正常?,Z=(140-72)/10=6.8 2.58 ,异常,三 标准分数(standard score),6、不足()原理复杂()使用不便()比较时,分布形态要相同,四 差异系数(coefficient of variation),1、概念 标准差与平均数的百分比,也叫变异系数(CV)。,四 差异系数(coefficient of variation),、应用(1)比较单位不同事物的差异程度(2)比较单位相同,均值相差悬殊的事物(3)判断特殊差异情况,四 差异系数(coefficient of v
24、ariation),(1)比较单位不同事物的差异程度,某幼儿园大班儿童体重平均25公斤,标准差3.7公斤;身高110厘米,标准差6.2厘米。试问该班幼儿体重和身高哪方面差异大些?,四 差异系数(coefficient of variation),(2)比较单位相同,均值相差悬殊的事物,初三甲乙两班数学成绩平均分别为92和71,标准差分别为8.95和7.40,请问哪个班成绩差异程度大一些?,四 差异系数(coefficient of variation),(3)判断特殊差异情况一般CV值常在5%-35%之间;如果CV 35%,可怀疑所求得平均数是否失去意义;如果CV 5%,可怀疑均值和标准差是否
25、计算有误。,儿童品行与家庭教育的关系如何?一个人人智力高低与学业成绩关系如何?人的身高与体重有关吗?,第四节相 关 关 系,一概述,事物间的关系相关量数相关类型相关分析方法,(一)事物的关系,、按数量关系分:函数关系:相关关系:,是现象之间存在的严格的依存关系,关系中某一变量的每一个数值,另一变量都有唯一确定的一个数值与之相对应,且这种关系可以用数学表达式反映,是现象之间确实存在的,而关系数值不固定的相互依存关系。即:两个变量之间不精确、不稳定的变化关系。,函数关系,、是一一对应的确定关系、设两个变量X、Y,Y随着X一起变化,并完全依赖于X,当X取某个数值,Y依据确定的关系取相应的值,则称Y为
26、X函数,记作Y=(X)。、各观测点落在一条线上,相关关系,、变量间关系不能用函数关系精确表达。、一个变量的取值不能由另一个变量唯一确定。、当变量取某个值时,变量的取值可能有几个。、各观测点落在直线周围,(一)事物的关系,、按变化方向分:因果关系:共变关系:相关关系:,一种现象是另一种现象的因,而另一种现象是这种现象的果。,表面上看来有联系的两种事物都与第三种现象有关。这两种事物间关系就叫共变关系。,两种现象在发展变化的方向和大小上有一定的关系,但不能确定哪个是因,哪个是果,且二者并不同时受第三种因素影响。,(二)相关量数,概念:两个变量之间不精确、不稳定的变化关系称为相关关系。理解:()相关是
27、度量和描述两个变量之间关系的一种统计技术;()两个变量数值间不是一一精确对应,牢固稳定;()数据要求至少两个变量,两组数据;()统计学中的相关指具有相关关系的不同现象之间的关系程度。,(三)相关的类型,、按关系的方向分:正相关:负相关:,同向,同增共减,异向,此增彼减,(三)相关的类型,、按关系的程度分:,(三)相关的类型,、按关系的形式分:,(三)相关的类型,、按变量个数分:单相关:复相关:,两个变量间的相关,两个或两个以上变量间的相关。,(四)相关分析方法,图示法,计算法,相关系数表示相关方向和大小的数值,、图示法散点图,散点图:成对变量值在坐标上描点所形成的图形。 散点图通过点的散布形状
28、和疏密程度显示两变量的相关趋势和程度,对原始数据关系做出直观而有效的预测和解释。成对数据越多,散点图提供的信息越准确。信息:)相关的方向:正、负、无 )相关的形态:直线、曲线 )相关大概程度(拟合度):强、弱、完全,正相关,positive correlation,负相关,negative correlation,零相关,、计算法相关系数,1、概念 相关系数(correlation coefficient):用来描述两个变量之间相互变化方向及密切程度的数字特征量。即两列变量间相关程度及方向的数字表现形式。 理解: 1)表示相关关系强度的指标; 2)表示相关关系方向的指标2、符号: 样本间相关r
29、 总体间相关,、计算法相关系数,3、性质 1)取值范围:-11,常用小数形式; 2)的“”表示两变量变化的方向; 3)值的大小表示两变量间关系密切程度。 1,完全相关,越接近1,密切程度越高 0,无相关,即完全独立,零相关;越接近 0,密切程度越低,、计算法相关系数,4、相关的程度,、计算法相关系数,5、相关系数使用注意事项 1)相关系数的值仅仅是一个比值,不代表相关的百分数 2)相关系数不等距,只能比较,不能直接作加减乘除 3)相关不等于因果:相关系数只能描述两个变量间的变化方向及密切程度,并不能揭示二者之间的内在本质联系 4)相关是两个事物或属性间关系的度量,故要求成对数据 5)计算相关系
30、数要求成对数据足够多,一般要求30对以上,、计算法相关系数,5、相关系数使用注意事项 6)用样本推测总体时,须做假设检验 7)不同类型数据,相关方法不同。,、计算法相关系数,6、相关结果的解释,(五)相关的应用,、预测 2、效度检验 3、信度检验 4、理论检验,二积差相关,1、意义 2、适用条件 3、计算 4、检验,(一)意义,积差相关: (Pearson Product Moment Correlation Coefficient, r)当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关称为积差相关。,(二)适用条件,(1)两个变量都是由测量获得的连续性数据;(2)
31、两个变量的总体都是呈正态分布,或接近正态分布,至少是单峰对称分布;(3)必须是成对的数据,而且每对数据之间是相互独立的;(4)两个变量之间呈线性关系;(5)大样本n30。,(三)计算,(1)定义式 (2)计算式,两个变量离差乘积之和的大小能反映两变量之间关系的方向及强弱。协方差(covariance) 两个变量离均差乘积之和的算术平均数。公式:,积矩(线性关系指示器),1、定义式,同步练习,2、计算式一,公式推导,2、计算式二,分子分母同时乘以N,同步练习,计算,(四)检验,查积差相关系数显著性临界值表(附表7),df=n-2rr0.05,相关不显著rr0.05,相关显著rr0.01相关极显著
32、,(五)相关系数的合并,附表8,同步练习,思考(一),现有10名辅导员工作年限与辅导能力评定等级,见下表。试问二者是否有关。,思考(二),现有10人视、听反应时数据见右表。请问视听反应时是否具有一致性。,三等级相关,1、意义 2、适用条件 3、斯皮尔曼相关 4、肯德尔相关,(一)等级相关意义,以等级次序排列或以等级次序表示的两个变量之间的相关,包括斯皮尔曼等级相关和肯德尔相关。,(二)等级相关适用条件,1)多列变量为等级或顺序变量 2)变量为等距或等比变量,但总体为非 正态分布 3)成对变量数目小于30,非参数的相关方法,(三)斯皮尔曼等级相关,、概念,rs或rR,(三)斯皮尔曼等级相关,2、
33、适用条件 1 )两列等级或顺序变量 2)两变量具有线性关系 3)等距或等比数据,但总体为非正态分布 4)n30,(三)斯皮尔曼等级相关,3、计算(一)无重复等级 (二)有重复等级,(三)斯皮尔曼等级相关,3、计算无相同等级,成对等级之差,成对样本容量,同步练习,现有10名辅导员工作年限与辅导能力评定等级,见下表。试问二者是否有关。,同步练习,(1)排序定等级(方向要一致,由小到大或由大到小)(2)求等级差D及其平方D2(3)求等级差平方和 D2(4)代入公式,(三)斯皮尔曼等级相关,3、计算无相同等级,变量等级序数,成对样本容量,同步练习,现有10人视、听反应时数据见右表。请问视听反应时是否具
34、有一致性。,(1)将等距数据转为等级数据排序 定等级(2)求等级序数之积RxRy(3)求等级序数乘积之和RxRy(4)代入公式,公式推导,公式推导,+,(三)斯皮尔曼等级相关,3、计算有相同等级,重复组,重复数,成对等级之差,同步练习,现有10名学生语文、数学成绩见右表。请问语文数学成绩是否相关。,(1)将等距数据转为等级数据排序 定等级(2)求等级序数之差D和D2(3)求D2(4)分别查找两变量相同等级数目 代入公式,(三)斯皮尔曼等级相关,3、计算有相同等级,重复组,重复数,为什么要用修正数C,随相同等级数目增加,R2和 x2逐渐减小,查斯皮尔曼等级相关系数显著性临界 值表(附表9),4
35、斯皮尔曼相关系数的显著性检验,(四)肯德尔等级相关之w系数,、概念,(四)肯德尔等级相关之w系数,2、适用条件,第一种情况是K个评价者对N件事物或N件作品进行等级评定,最小等级序数为1,最大等级序数为N,得到K列从1到N的等级变量资料。,(四)肯德尔等级相关之W系数,3、计算(一)无重复等级 (二)有重复等级,(四)肯德尔等级相关之W系数,3、计算无重复等级,每一个被评事物获得的等级之和,评价者人数,被评事物个数,各被评价事物实际所得等级和之变异,各被评价事物理论所得等级和之变异,W,?,同步练习,0.693,(四)肯德尔等级相关之W系数,3、计算有重复等级,同步练习,0.91,(1)当3N7
36、时: 查肯德尔W系数显著性临界值表(附表10)(2)当N7时,代入公式: df = n - 1 查X2分布表,若算得X2显著,则W也显著,4 肯德尔和谐W系数的显著性检验,(四)肯德尔等级相关之U系数,、概念,(五)肯德尔等级相关之U系数,2、适用条件,四质与量相关,1、意义及适用条件 2、点二列相关 3、二列相关,四质与量相关,(一)点二列相关,、概念及适用条件当两个变量其中一个是正态连续性变量,另一个是真正的二分名义变量,这时,表示这两个变量之间的相关,称为点二列相关(point biserial correlation) 。,(一)点二列相关,2、适用条件及作用,(一)点二列相关,3、计
37、算,二分变量中一项所占的比例,二分变量中另一项所占的比例,与p对应的连续变量的均值,所有连续变量的标准差,同步练习,(1)确定p、q并计算比率(2)计算p、q对应的连续变量的均值(3)计算连续变量的标准差St(4)代入公式,(二)二列相关,、概念及适用条件当两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关(biserial correlation)。适用条件(1)两个变量都是连续变量,且总体呈正态分布,或接近正态分布,至少是单峰对称分布(2)两个变量之间是线性关系(3)二分变量是人为划分的,其分界点应尽量靠近中值。(4)样本容量应大于80。,(二)二列相关,2、作用(1)测验中对项目区分度指标的确认。 (是非题区分度用点二列相关)(2)它与点二列相关的主要区别在于:二分变量是否为正态,没有明确为正态分布的,均用点二列相关。,(二)二列相关,3、计算,与P对应的正态分布的纵线高度,连续变量的均值,同步练习,敬请各位同学批评指正,此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!,