《第四章差异量数ppt课件.ppt》由会员分享,可在线阅读,更多相关《第四章差异量数ppt课件.ppt(61页珍藏版)》请在三一办公上搜索。
1、.,第四章差异量数,.,差异量数,全距,方差,百分位差,四分位差,平均差,标准差,.,第一节全距(range)一、概念与计算公式(一)全距又称两级差,用R表示,用一组数据的最大值减去最小值(二)R=X maxX min二、地位说明数据离散程度的最简单的统计量三、应用主要用于对数据作预备性检查,了解数据的大概散布范围,以便确定如何进行统计分组,.,四、优缺点(一)优点1简单,容易理解2计算简单(二)缺点1最粗糙,不可靠2只是利用了数据中的极端值,其他数据未参与运算过程3如果两极端值有偶然性或属于异常值时,全距不稳定4全距受到取样变动的影响,.,第二节百分位差与四分位差一、百分位数(一)概念百分位
2、数(percentile),又叫百分位分数,用符号Pp表示,指次数分布中相对于某个特定百分点(小p)的原始分数,它表明在次数分布中 小于这个分数的数据个数占数据分布中全部数据个数的一定百分比。如P70 =85,表明将一批数据从小到大排列后,小于85分的数据占该批数据的70%,.,思考:在分组次数分布表中,当我们想求P50 时,如何计算?,.,.,二、百分位差(一)概念指两个百分位数之差,也叫百分位距。常用的百分位距有两种P90 P10, P93 P7(二)地位能较好地反映一组数据的差异程度,但有一定的局限,只作为主要差异量数的辅助量数,.,(三)应用,1、求百分位差,.,2、某招干考试分数如下
3、表,预定取考分居前10%的应考人员进行面试选拔,请划定面试分数线,.,.,三、四分位差(quartile deviation)(一)概念百分位差的一种,又叫四分位距,指第三个四分位数与第一个四分位数之差的一半,即在一个次数分布中,中间50%的次数的距离的一半,用Q表示。,.,(二)由来四分位差的计算,基于两个百分位数,即P25和P75,这两个点值与中数(50%点)一起把整个数据的次数等分为四部分, P25之下占有总次数的四分之一,被称为第一四分位,中数被称为第二四分位, P75被称为第三四分位,.,(三)计算公式,.,.,.,(五)优缺点1优点(1)在两极端数据不清楚时可以应用(2)常与中数联
4、系起来共同应用(3)对数据的离散程度的描述比全距好2缺点(1)没有把全部数据考虑在内,其稳定性会差一些(2)反应不够灵敏(3)不适合进行代数运算,.,四、百分等级分数(一)概念百分等级分数与百分位数相反,它是事先知道分布中的一个原始分数,再求这个原始分数在分布中所处的相对位置百分等级(二)意义百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在分布中相对位置越低,百分等级越大,原始数据在分布中相对位置越高。,.,(三)计算公式,X 即 Pp,.,(四)应用下表所列的考试分数分布中,已知某应试者的考分为82分,问在这次考试中低于该应试者的人数比例,.,第三节平均差、方差、标准
5、差一、平均差(average deviation或mean deviation)(一)概念,平均差(通常用AD或MD表示)指一组数据中,每一个数据与该组数据的平均数之差的绝对值的算数平均数,.,(二)计算公式,.,(三)优缺点,优点1、平均差意义明确,计算容易,反应灵敏2、较好地反映了次数分布的离散程度缺点1、平均差计算时要用绝对值,不适合代数运算,因此在进一步统计分析中应用较少2、属于一种低效差异量数,.,二、方差与标准差,(一)概念,.,(二)计算公式,1、未分组数据的计算,思考:可不可以不计算平均数,只利用原始数据来算方差和标准差呢,.,当两个公式计算的结果有出入时,原始数据计算的结果更
6、精确,.,.,.,.,.,计算该次数分布表的方差和标准差,.,(三)总标准差的合成方差具有可加性的特点,在已知几个小组的方差或标准差的情况下可以计算几个小组联合在一起的总的方差或标准差思路是:总的方差=组内方差之和与组间方差之和,.,组内离均差,组间离均差,.,应用:为了研究噪音对解决数学问题的影响,根据噪音的三种情况(强、中、弱)把被试分为三组,每组4个人,因变量是解决数学问题时产生的错误频数,数据如下表,请计算噪音所产生的总的方差,.,(四)方差与标准差的性质与意义1、方差性质可分解性与可加性2、标准差性质(1)每个观测值都加上一个相同常数C后,计算得到的标准差等于原标准差(2)每个观测值
7、都乘以一个相同常数C,则所得的标准差等于原标准差乘以这个常数(3)每一个观测值都乘以同一个常数C(C0),再加一个常数d,所得的标准差等于原标准差乘以这个常数C。(分组数据时用估计平均数计算标准差的公式),.,3意义(1)方差与标准差是表示一组数据离散程度的最好指标,其值越大,说明数据分布的离散程度越大,该组数据较分散,其值越小,说明数据分布比较集中,离散程度越小。(2)它们是统计描述与统计推断分析中最常用的差异量数。在描述统计部分,只需要标准差就足以说明一组数据的离中趋势,.,4标准差的有点(1)反应灵敏,每个数据取值的变化,方差或标准差都随之变化(2)计算公式严密确定(3)容易计算(4)适
8、合代数运算 93页说标准差不可以进行统计运算,但是94也总结标准差的优点的时候又说适合代数运算,怎么回事?93页所说的标准差不可以进行代数运算是指两个标准差之间不可以进行加减乘除的运算,而不像方差那样具有可加性;94页所说的标准差的优点是指标准差除可以用以描述统计之外,还可以进一步参与到推论统计的运算当中,而平均差、百分位差、四分位差等其他的差异量数则不能参与到推论统计的运算当中,.,(5)受抽样变动影响小,即不同样本的标准差或方差比较稳定(6)简单明了,虽然比其他差异量数稍有不足,但其意义还是较明白的,.,.,二、应用条件(一)同一个团体不同观测值离散程度的比较即同一个团体但是所测得特质不同
9、,例:已知某小学一年级学生的平均体重为25千克,体重的标准差为3.7千克,平均身高为110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?,.,(二)不同团体进行的是同一种类型的观测,但测的是水平相差较大,需要比较观测值的离散程度例:通过一个测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(11岁)学生的平均分数为80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?,.,三、注意事项(一)测量的数据至少是等距数据(二)差异系数只能用于一般的相对差异量的描述,不能做进一步的代数运算,.,.,三、性质(一)Z分数无实际单位,是以平均数为参照点,以标准
10、差为单位的一个相对量(二)一组原始分数转换得到的Z分数可以是正值,也可以是负值,凡小于平均数的原始分数的Z值为负数,大于平均数的原始分数的Z值为正数,等于平均数的原始分数的Z值为零。(三)所有原始分数的Z分数之和为零,Z分数的平均数也为零,.,(四)一组原始数据中,各个Z分数的标准差为1根据标准差性质:原始分数加上或减去一个数,标准差不变;原始分数乘一个数,标准差变为原来的N倍; Z=(Xi -X平均)/S不就是原始分数减去平均数(标准差不变),再乘标准差的倒数吗?(标准差为原来的1/S倍)原来标准差为S 转化Z分数后就是S*(1/S) ,所以是1(五)如果原始分数呈正态分布,那么转换得到Z分
11、数分布叫标准正态分布,以0为平均数,1为标准差,.,四、优缺点(一)优点1、可比性不同性质的成绩,转化为标准正态分数后,相当于处在不同背景下的分数,放在同一背景下去考虑,具有可比性2、可加性标准分数没有具体单位,不同性质的原始分数经转化后可以相加,.,3、明确性知道了某一被试的标准分数,可以知道其百分等级(注意:在心理统计这门课中,我们默认的是样本分布服从正态分布)4、稳定性原始分数转化为标准分数后,标准分数的标准差为1(性质4),保证了不同性质的分数在总分中的权重一样,.,(二)缺点1、计算相对比较繁杂,还有负值和零值,常常还会带有小数2、在进行比较时,还必须满足原始数据的分布形态相同这一条
12、件,.,五、应用(一)比较几个分属性质不同的观测值在各自数据分布中相对位置的高低比如有一人的身高是170厘米,体重是65千克,究竟身高还是体重在各自的分布中较高?设身高Z身高1.70=0.5, Z体重65=1.2,则该人的体重离平均数的距离要比身高离平均数的距离远,即该人在某团体中身高稍微偏高,而体重更偏重些,.,(二)计算不同质的观测值的总和或平均值,来表示在团体中的相对位置不同质的原始观测值因不等距,也没有一致的参照点,因此不能简单地相加或相减,当需要把这些不同质的数据合成时,如果已知这些不同质的观测值的次数分布为正态,这时可采用Z分数来计算不同质的观测值的总和或平均值。比如高考的各科成绩
13、,经转化为Z分数后,可以相加,.,.,(三)经线性转化后,表示标准测验分数经过标准化的教育和心理测验,如果其常模分数分布接近正态分布,为了克服标准分数出现的小数,负数,常常是将其转化成正态标准分数转化公式为Z=aZ+bZ为经过转化后的标准正态分数,a,b为常数,.,(四)整理数据时,常采用三个标准差法则取舍数据,即如果数据值落在平均数加减三个标准差之外,则在整理数据时,可以将这个数据作为异常值舍弃操作方法:利用spss转化为Z分数后,Z值不在-3,3范围内,可以舍弃,.,第五节差异量数的选用如何选用差异量数(一)当样本是随机取样时,s、Q、R的可靠性依次降低(二)当要求计算要容易快捷时, s、
14、Q、R依次变得简单(三)当要求统计量进一步使用时,s远胜于其他差异量数(四)在偏态分布中,Q比s更常用,.,(五)当分布是截尾分布时,只有Q能正确的指出分布的变异性(六)在选用差异量数时,同时应考虑合适的集中量数。差异量数越小,集中量数的代表性则越大差异量数越大,集中量数的代表性则越小要描述一组数据的典型性特点,必须同时使用集中量数和差异量数。一般常用的搭配是:中数和Q或其它百分位差一起平均数和标准差一起(最常用),.,本章课后练习题1、2、3、4(直接回答)6、7、8、9(课堂计算),.,本章随堂练习,.,.,.,此课件下载可自行编辑修改,此课件供参考!部分内容来源于网络,如有侵权请与我联系删除!,