《心理与教育统计学第4章 差异量数.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第4章 差异量数.ppt(68页珍藏版)》请在三一办公上搜索。
1、心理与教育统计学,第4章 差异量数,4.1 全距与百分位数4.2 平均差、方差与标准差4.3 标准差的应用4.4 差异量数的选用,差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数(measures of dispersion)差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。,4.1 全距与百分位数,4.1.1 全距全距(range)又称为两极差,用符号R表示。用最大值(maximum)减去最小值(minimum)得到全距。,(4.1),全距的特点:全距是最粗糙的差异量数,只利用了数据中的极端值;容易受极端值的影响;全距的应用:主要
2、用于对数据作预备性检查,了解数据的大概分布范围;确定统计分组,编制次数分布表。,4.1.2 百分位数,百分位数又称为百分位点,指两量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。P百分位数将所有数据分为两部分,小于该数值的个数与总的个数的比值为P%。,(1)根据原始数据计算百分位数,P50即中数,位于第5号数据和6号数据之间。P10位于第1号数据和第2号数据之间,数值:次序:,参考文献:虞仁和,胡国清,孙振球,&黄正南.(2010).关于百分位数直接计算法的进一步探讨.中国卫生统计,27(3),307-308.,n 表示数据的个数;P 表示百分位数;j 表示整数部分;g 表
3、示小数部分,SPSS计算百分位数的方法:,求累加次数:,Xj表示第j个数据值;,求百分位数:,(4.2),(4.3),数值:次序:,求P10:,j=1;g=0.1,5/7=0.71,精确组限79.584.49,(2)采用次数分布表计算百分位数(P80百分位数),580.8=46.446.4-40=6.46.40.71=4.544.54+79.5=84.04,84.04,采用次数分布表计算百分位数,Pp为所求的第P个百分位数;Lb为百分数所在组的精确下限;fp为百分数所在组的次数;Fp为小于Lb的各组次数的和;N为总次数;i为组距。,(4.4),4.1.3 百分位差,由于全距表示一组数据的离散程
4、度时,受极端数据的影响。可用百分位差表示离散程度,百分位差是指两个百分位数之差。如:P90P10,P93 P7。百分位差不能很好地反应中间数据的分布情况,常作为辅助差异量数,用次数分布表计算百分位差(P90P10),首先计算P10和P90对应的累加次数,5810/100=5.805890/100=52.20,4.1.4 百分等级,某一数值在一组数据中所处的百分位置,称为该数值的百分等级(percentile rank)符号为PR,PR 百分等级;X 给定的原始分数。,(4.5),求73对应的百分等级,利用累加次数分布图求百分等级和百分位数,4.1.5 四分位差,四分位差(quartile de
5、viation),指在一个次数分布中,中间50%的次数的距离的一半。通常用Q来表示。第一四分位:Q1P25第二四分位:Q2P50(中数)第三四分位:Q3P75,四分位差:,其中:,(4.6),用次数分布表计算四分位差,首先计算P25和P75对应的累加次数。,5825/100=14.55875/100=43.5,四分位差与Q1、Q2和Q3之间的关系,优点:四分位差通常与中数联系起来应用。与全距相比,用百分位差表述数据的离散情况稍微好一些。缺点:没有把全部数据考虑在内,其稳定性会差一些。不适合代数运算反应不够灵敏,百分位差的应用,百分位差可以有效地避免极端数据的影响,这种思想常常应用于日常生活中。
6、例如,在跳水比赛中,有7位裁判员,他们会一起对跳水运动员的表现进行打分。虽然裁判本着客观公正的标准去对待每一位运动员,但也难免存在主观判断上偏颇。为了避免主观因素给运动员带来的不公正性,比赛规定:从7名裁判员的分数中先舍去一个最高分和一个最低分,余下5名裁判员的分数相加后,再乘以运动员所跳动作的难度系数,便得出该动作的实得分。,4.2 平均差、方差与标准差,4.2.1 平均差平均差(average deviation)或mean deviation)原始数据与平均数绝对离差的平均值。用符号A.D.或M.D.表示,(1)原始数据计算公式:,(4.7a),式中:A.D.平均差;Xi数据值;平均值;
7、xi 离均差。,5名被试的错觉实验数据如下,求其平均差。,解:n=5,(2)分组数据计算公式:,(4.7b),式中:f各组次数;XC各组的组中值;xc 各组中值与平均数的差。,分组数据计算平均差,(1)计算平均值,(2)计算平均差,4.2.2 方差与标准差,方差(variance)也称变异数、均方。离均差平方后的平均数,是每个数据与该组数据平均数之差乘方后的均值。样本统计量用符号 表示总体参数用符号 表示标准差(standard deviation),方差的平均根。样本统计量用s或SD表示;总体参数用 表示。,(4.8),总体方差:,总体标准差:,式中:总体方差;总体标准差;总体平均值;N 总
8、体的个数;,(4.9),(1)总体方差与标准差公式,(4.10),样本方差:,样本标准差:,式中:样本方差;样本标准差;样本平均值;N 样本的个数;,(4.11),当样本数量非常大时,总体和样本方差的值差不多,本书并未区分总体和样本方差的不同。,(2)样本方差与标准差公式,5名被试的错觉实验数据如下,求其方差和标准差。,(1)平均数:,(2)离均差的平方和:,(3)方差与标准差:,由于:,所以:,(3)根据原始数据算方差:,用原始数据计算方差和标准差公式,方差:,标准差:,原始数据的平方和;原始数据总和的平方;数据个数。,(4.12),(4.13),5名被试的错觉实验数据如下,求其方差和标准差
9、。,(1)求原始数据的平均和:,(2)求原始数据的总和:,方差:,标准差:,(4)次数分布表计算方差,(4.14),各分组区间的组中值;各组区间的次数;总的次数;总的平均值,已知平均值:,(4.15),平均值未知:,直接用次数与组中值计算方差与标准差:,(4.16),(4.17),各分组区间的组中值;各组区间的次数;总的次数;,52名学生数学成绩方差和标准差计算表,(5)总标准差的合成,例4-4 在三个班级进行某项能力研究,三个班测查的平均分数和标准差分别如下,求三个班的总标准差。,平方和:,总体方差:,总平方和=组间平方和+组内平方和,(见P265),总方差;总标准差;各小组的标准差;各小组
10、的数据个数;总平均数;各小组的平均数。,(4.18),(4.19),例4-4 在三个班级进行某项能力研究,三个班测查的平均分数和标准差分别如下,求三个班的总标准差。,(1)计算、,(2)计算、,(3)计算,复习,差异量数,全距,百分位差,平均差,方差,标准差,百分位数,百分等级,四分位差,原始数据,分组数据,原始数据,分组数据,先算平均数,不算平均数,方差的合成,原始数据,分组数据,百分位数,平均差,方差,先算平均数,不算平均数,(6)方差和标准差的性质,(1)如果,则,(6)方差和标准差的性质,(2)如果,则,(6)方差和标准差的性质,(3)如果,则,令,则,由于,所以,(7)方差和标准差的
11、意义,(1)方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述和统计推断分析中最常用的差异量数。(2)标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,适合代数运算等等。,(3)已知一组数据的平均数与标准差后,就可以知道位于平均数上下各若干个标准差内的数据所占的百分比。,切比雪夫定理指出,对于任何一个数据集合,至少有 的数据位于平均数的h个标准差之内。,在正态分布中,平均数上下两个标准差之内的数据占95.45%,三个标准差之内的数据占99.7%,4.3 标准差的应用,4.3.1 差异系数差异系数(cofficient of variation),又称为变异系数、相
12、对标准差等,是标准差与其算术平均数的百分比,它是没有单位的相对差异量数。常以CV表示,(4.20),某样本的标准差;该样本的平均数;,差异系数在心理与教育统计中常应用于:(1)同一团体不同观测值离散程度的比较;(2)不同团体进行同一观测,将他们的观测值进行离散程度的比较。,通过同一个测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(11岁)学生的平均分数为80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?,在应用差异系数比较相对差异大小时,应该注意:(1)测量的数据为等距尺度。(2)观测工具应该具备绝对零,这时应用差异系数进行比较分散程度效果才更好。(
13、3)差异系数只能用于一般的相对差异量的描述,尚无有效的假设检验方法。,标准分数(standard score),又称为基分数或Z分数(Z-score),是原始分数与平均值之差除以标准差所得的商。,原始数据;数据的平均数;标准差。,(4.21),4.3.2 标准分数,某班平均成绩为90分,标准差为3分,甲生得94.2分,乙生得89.1分,求甲、乙两个学生的Z分数各是多少?,标准分数的性质,(1)Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。Z分数乘以标准差即为原始分到平均值的距离。,(2)若原始分数小于平均数,其Z分数为负数;大于平均数,其Z分数为正数;等于平均数,其Z分数为
14、0。,所有原始分数的Z分数的和为0,所有原始分数的Z分数的平均数为0,(3)Z分数的标准差为1,(4)若原始分数呈正态分布,则转换得到的所有Z分数为均值为0、标准差为1的标准正态分布。,标准分数转换对数据分布的基本形状没有影响,标准分布的优点,(1)可比性。不同性质的原始分数,转化为标准分数后可以进行比较。(2)可加性。标准分数为抽象数值。(3)明确性。可以知道该分数在全体分数中的位置。(4)稳定性。假设有两套测量某种能力心理测验,同一个人做,其原始分可能差异较大,但是标准分较为稳定。,标准分数的应用,(1)用于比较不同性质的观测值,在各自数据分布中的相对位置的高低。(2)计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。(3)表示标准测验的分数,例如很多智力量表采用了标准分数表示智力(IQ),由于性质不同,不同学科的原始分数实际上是不能求平均值的。,3.4 差异量数的选用,大多数情况下,用方差和标准差,在一些特殊情况,如严重的偏态,快速了解数据的大致分布范围等用其他变异系数(Q,R)。,思考题:百分等级分数和Z分数在表示数值的地位时有何区别?,谢谢!,