《心理与教育统计学第3章集中量数.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第3章集中量数.ppt(75页珍藏版)》请在三一办公上搜索。
1、心理与教育统计学,第3章 集中量数,3.1 算术平均数3.2 中数3.3 众数3.4 其他集中量数加权平均数几何平均数调和平均数,(1),基础数学知识:,(3),证:,(2),(4),C为常数,注意:,证:,集中趋势(central tendency):指数据分布中大量数据向某方向集中的程度,描述这种特点的统计量称为集中量数。离中趋势:指数据分布中数据彼此分散程度,描述这种特点的统计量称为差异量数。,3.1 算术平均数,算术平均数(arithmetic average)一般简称为平均数(average)或均数、均值(mean)。一般用,或者用表示。算术平均数是最常用的集中量数。,3.1.1 平
2、均数的计算公式,(一)未分组数据计算平均数的方法,(3.1),算术平均数,原始分数的总和,数据的数目,式中:,某项研究在一年级学生中抽取30名样本,测得他们的某项考试分数如下:61,81,63,58,55,78,64,72,72,64,52,65,67,72,70,58,50,80,51,79,81,77,69,86,61,89,50,54,56,65。求他们的平均能力分数。,解:这是求所抽取的30个样本的算术平均数,根据公式(3.1),(二)用估计平均数计算平均数,如果数据的数目以及每个观测数据值都很大时,可以利用估计平均数(an estimated mean)简化计算。(1)设定一个估计平
3、均数,AM。(2)从每个数据中减去AM,使数值变小,计算差值的平均数。(3)最后计算的差值平均数加上估计的平均数。,用估计平均数计算平均数公式:,(3.2),AM为估计平均数,N为数据数目,式中:,令AM为65,表3-1 30名学生的能力分数,(三)使用次数分布表计算平均数,表3-2 100名学生的成绩分数,次数分布表计算平均数的基本公式:,(3.3),Xc 为分组区间的组中值f 为各组次数,表3-3 100名学生的成绩分数,使用第33页原始数据计算:,假设各种的数据分布于组中值附近,即假设各种的平均值等于组中值,但实际情况却不一定这样。次数分布表计算平均值只是一种近似的求平均值的方法。,令,
4、得,代入上3.4式:,i 组距AM 估计平均值,令,得,第一种简化方法:,(3.4),组距i相同,(3.5),令AM=79,注意:等距分组情况下,才能用这种方法,表3-4 100名学生的成绩分数,代入3.4式:,令,得,第二种简化方法:,与组距i无关,(3.6),令AM=79,表3-5 100名学生的成绩分数,由公式 可得,3.1.2 算术平均数的几个重要性质:,(1)在一组数据中,每个变量与平均数之差(称为离均差)的总和等于0.,设,则,所以,证:,(2)在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C,证:,(3)在一组数据中,每一个数据都乘以一个常数C,所得的平
5、均数为原来的平均数乘以C,证:,3.1.3 平均数的意义,算术平均数是“真值”最佳的估计值,证:设,样本,总体,抽样,统计推论,(3.7),所以:,当,时,,所以:,由,得,代入3.7式得:,3.1.4 算术平均数的优缺点,算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、有公式严密确定、简明易懂、适合代数运算等等,因此是一个最常用的集中量。主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。,正态分布的3准则,3.1.5 计算和应用算术平均数的原则,同质性原则:算术平均数只能用于表示同类数据的集中趋势。平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数
6、,也要结合个体的数据。平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。,复习,式中:,3.2 中数,中数(median),又称为中点数,中值。是按顺序排列在一起的一组数据居于中间位置的数。中数是集中量数的一种。符号为Md或Mdn,3.2.1 未分组数据求中数,首先将一组数据按顺序排列(1)数据个数为奇数,则中数为(N+1)/2位置的那个数。(2)数据个数为偶数,则中数为居于中间位置两个数的平均数。,(3.8),求数列6,4,7,12,8 的中数。解:该数列有5个数据n为奇数,(n+1)/2=(5+1)/2=3 第3个数据为7,故Md=7.求数列2,3,5,7
7、,8,10,15,19的中数。解:该数列有8个数据n为偶数,数列中第N/2=4位置的数为7,(N/2+1)=5位置的数为8,故Md=(7+8)/2=7.5,3.2.2 次数分布表计算中数,由次数分布表计算中位数需要用到累积次数分布表。当表中数据的累积方向不同时,计算公式也不同。,表3-6 52名学生数学成绩次数分布表,5/11=0.45,精确组限69.574.49,由下至上累积频数计算公式,公式中:Lb为中位数所在组的精确下限 fb为中位数所在组下限以下的累积频数 n为数据总和 fMd为中位数所在组的频数 i为组距,(39a),由上至下累积频数计算公式,公式中:La为中位数所在组的精确上限 f
8、a为中位数所在组上限以上的累积频数 n为数据总数 fMd为中位数所在组的频数 i为组距,(39b),表3-7 52名学生数学成绩中位数计算表,注意3.9式只适用于连续变量,表3-8 80名员工对部门主管尽职程度调查结果,中数?,3.2.3 中位数的特点及应用,中位数的优点:计算简单;容易理解;不受两端极端数据的影响。中位数的缺点:反应不灵敏;受抽样影响较大;也不适合进一步代数运算。一般用于下列情况:一组数据中有极端数据时;一组数据中有个别数据不确切、不清楚时;快速估计一组数据的代表值。,3.3 众数,众数(mode)又称为范数、密集数、通常数等。指在次数分布中出现次数最多的那个数.用符号Mo表
9、示。,3.3.1 计算众数的方法,1.直接观察求众数A.未分组数据中出现次数最多的数即为众数。求 5,6,2,6,6,8,5,4,5的众数。,B.次数分布表中,频数最多那一组数据的组中值,即为众数。,C.频数分布曲线最高点相对应的横坐标上的一点。,Mo,正偏态分布,Mo,正态分布,A,B,C,D,2.使用公式求众数,皮尔逊经验法 平均数(M)与中数(Md)的距离是平均数(M)与众数(Mo)的距离的三分之一,即:,故:,接近正态的情况下应用,(3.10),金氏插补法,式中:Lb为含众数这一区间的精确下限;fa为高于众数所在组一个组距那一分组区间的次数;fb为低于众数所在组一个组距那一分组区间的次
10、数;i为组距,Lb,fa,fb,次数分布比较偏斜,或者接近正态分布的情况下应用,(3.11),3.3.2 众数的意义与应用,优点:概念简单明了;不受极端值的影响。缺点:受分组的影响;不能灵敏地反映一组数据的变化;不能进行进一步的运算。应用:快速而粗略地寻找一组数据的代表值。一组数据出现不同质情况,用众数代表典型情况;数据分布出现极端数据;当粗略估计次数分布的形态时,可用平均数与众数之差,作为表示次数分布是否偏态的指标。,3.3.3 平均数、中数和众数的关系,三种量数使用条件不同,各有优缺点。有时会导致差异很大的结果。,平均数:23333中 数:16800众 数:14400,表3-9 一个公司发
11、放薪酬情况,高管,中层,工人,在美国,平均每小时的收入是每个月由劳工统计局从商业公司提供的工资单计算而得到的。该局计算付出(给非管理人员)的总工资,再除以工作的总小时数。在经济危机时期,平均每小时收入显著上升。当经济危机结束时,平均每小时的收入常常开始下降。这可能是怎么回事?,复习,中数,累计次数分布表求中数,复习,众数,直接观察;次数分布表;分布曲线;经验公式:皮尔逊经验法,金氏插补法,复习,平均数、中数与众数的关系。正态分布:M=Md=Mo正偏态分布:MMdMo负偏态分布:MMdMo,3.4 其他集中量数,除了算术平均数、中位数和众数以外,有些情况下,必须使用其他一些集中量数。比如,加权平
12、均数、几何平均数和调和平均数。,3.4.1 加权平均数,假设我们班有一位同学平时成绩70分,考试成绩90,总的成绩?,?,加权平均数是不同权重数据的平均数。,Wi为权重Xi为数值,(3.12a),某市广播电视局招聘一名播音员,对A,B两名候选人进行了两项素质测试,两人的两项测试成绩如下表,根据实际需要,广播电视局将面试、综合知识测试的得分按3:2的比例计算两人的总成绩,请问谁将被录用。,wi为权重(比率、百分数)Xi为数据值。,可将3.12a进行变形:,(3.12b),加权平均数可以应用于根据小组平均数计算总的平均数。,ni 各组的人数;各组的平均数。,(3.12c),一个班有30人随机分为5
13、个组,各组的成绩如下:,3.4.2 几何平均数,几何平均数(geometric mean)为N个数据联乘后的N次方根;用符号Mg表示;,N为数据个数;Xi为数据值。,(3.13a),基本公式为:,由于,所以,(3.13b),对数计算公式的推导:,几何平均数的应用,1.直接应用基本公式计算几何平均数(1)数据的变异较大,有极端值(2)心理物理学的等距和等比量表实验,例3-8 有一研究者想研究介于S1与S2两感觉量之间的感觉是多少。他随机选取10名被试,让其调节一个可变的物理刺激,使产生的感觉恰介于S1和S2之间。10名被试的结果为:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0
14、,15.6,18.0。问这10个被试所调节的感觉量的平均值是多少?,求反对数:,解:,2.平均增长率一组数据彼此间的变异较大,几乎按一定的比例关系变化。(1)学习方面的进步率(2)学生或人口增加率的估计(3)教育经费增加率,一列数据分别为X1,X2,X3Xn,则:,按一定的比例关系变化,增加率的定义:,则:,由于,所以,平均增加率:,取对数,(3.14a),(3.14b),有一个学生第一周记住20个英文单词,第二周记住23个,第三周记住26个,第四周记住30个,第五周记住34个,该学生学习记忆单词的平均进步率是多少?,平均增加率为:0.14186,3.4.3 调和平均数,调和平均数(harmo
15、nic mean),在计算中先将各个数据取倒数,又称为倒数平均数。,(3.15),式中:N为数据个数;Xi为变量值。,在心理学实验中,调和平均数一般用于根据不同的工作效率,计算平均工作效率。,有一个学生15分钟学会生词30个,后10分钟学会生词也是30个。问该学生平均每分钟学会多少个生词?,解:两段时间的工作速度分别为,计算的第一步需要计算各个条件(或被试)的工作速度,然后带入公式计算平均工作速度。,SPSS计算,SPSSAnalyze ReportsCase SumariesStatistics:Mean,Median,Harmonic mean,Geometric meanSPSSAnalyze Descriptive StatisticsFrequenciesStatistics:Mean,Median,Mode,Sum,加权平均数1:已知某班50人的平时成绩和考试成绩,平时成绩和考试成绩的权重分别为0.3:0.7,求每个人的最终成绩。,SPSSTransformCompute Varable,谢谢!,