《心理与教育统计学第2章统计图表.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第2章统计图表.ppt(68页珍藏版)》请在三一办公上搜索。
1、心理与教育统计学,第2章 统计图表,2.1 数据的初步整理2.2 次数分布表2.3 次数分布图2.4 计算机绘制统计图表,2.1 数据的初步整理,心理和教育研究中收集的各种原始资料杂乱无章,只有经过整理分析才能从中提取出有用的信息。,6,4,1,12,7,53,6,5,8,11,52,9,7,9,4,108,6,6,7,5,7,样本一,样本二,6,9,2,12,8,43,11,1,10,9,34,5,4,7,3,95,8,10,2,9,3,样本一,样本二,2.1.1 审核,审核是对原始数据进行初步审查与核实不符合要求的数据主要有三种:缺失、可疑、失误。,缺失:指数据不全或缺项未填;例如一份资料
2、中未回答的问题占10以上,或者缺少关键性资料。可疑:指难以辨认或怀疑其真实性的数据;例如,有的被试填答的问卷全部选同一个选项(如全选A或全选B);有的被试填答的结果可以看到是一种规则的排列方式(如A B C D E D B C A B C D E)。失误:指存在明确差错的数据或答案。,在剔除不合格问卷的过程中,注意不能把一些不符合自己主观假设的数据随意去掉。因此这项工作一定要非常慎重。对于个别极端数据是否该剔除,应遵循三个标准差法则。,2.1.2 数据排序,数据排序,就是按照某种标准,对收集到的杂乱无章的数据进行排列。年龄、性别等数值大小升序或降序排列数据排序是整理数据最简单的方法,2.1.3
3、 统计分组,统计分组,根据被研究对象的特征,将所得数据划分到各个组别中去。分组要以被试对象的本质特征为基础。分类标志要明确,要能包括所有数据性质类别:按事物的不同性质进行分类。数量类别:按数值大小进行分类,并排序。,2.1.4 统计表,统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比较和计算。,表2-1 北京市四街道智力落后患者分布,顶线,表线,表号,标题,表注,资料来源:见心理学报1979年第1期103页,选部分引用,底线,数字,统计表的种类,简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。分
4、组表:只按一个标志分组的统计表称为分组表。复合表:按两个或两个以上标志分组的统计表称为复合表。,简单表,表2-2 各校学生数一览表,分组表,表2-3 上海市区男幼儿20米跑步用时,资料来源:引自华东师范大学学报,1985年第2期第30页,复合表,表2-4 不同年级男生和女生的学习成绩,2.1.5 统计图,统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间的数量关系用图形表现,直观、形象地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记忆,印象深刻。,图2-1 某年级数学考试成绩统计,图题,图号,图目,图尺,图形,统计图的种类,条形图:直条图,表示离散型数据资料,以条
5、形的长短表示数量大小。圆形图:饼图,描述间断性资料,显示各部分在整体中所占的比重大小,以及各部分之间的比较。,图2-2 简单条形图,图2-3 分组条形图,图2-4 分段条形图,圆形图,图2-5 某年级数学考试成绩统计,绘制圆形图的步骤,求出各组成部分所占的百分比求出各部分的角度以顺时针方向画出扇形标出不同颜色及百分比,图2-6 某年级数学考试成绩统计,线形图:描述连续性资料,表示两个变量之间的函数关系,某种现象在时间上的发展趋势,或一种现象随另一种现象变化。散点图:也称点图、散布图,用圆点的多少或疏密表示统计资料数量大小以及变化趋势。,例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉
6、记忆再现率的情况。,图2-7 有意义的材料再现率比较线形图,图2-8 0-60个月婴儿身高,图2-9 0-60个月婴儿体重,表2-5 31人的视听反应时(单位:毫秒),图2-10 31人的视、听反应时散点图,茎叶图与箱图,例2-2 下面是100名学生在某项测验中的成绩分数76.0 77.5 82.0 90.5 81.0 85.5 71.0 80.5 92.5 77.088.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.098.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 86.0 81.575.0 84.0 90.0 80
7、.0 86.0 84.5 68.5 71.0 68.0 81.579.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 78.066.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.077.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.573.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.094.0 79.0 80.0 75.5 83
8、.5 82.0 65.0 74.5 80.0 70.5,Frequency Stem&Leaf.00 6.1.00 6.2 1.00 6.5 2.00 6.67 4.00 6.8889 6.00 7.001111 7.00 7.2223333 9.00 7.444455555 9.00 7.666667777 12.00 7.888889999999 13.00 8.0000000011111 11.00 8.22222333333 6.00 8.444455 6.00 8.666777 4.00 8.8899 3.00 9.001 2.00 9.23 1.00 9.4 1.00 9.6 2.
9、00 Extremes(=98)Stem width:10 Each leaf:1 case(s),茎叶图,次数,十位数,个位数,茎宽,每叶的样本数,图2-11 100名学生成绩茎叶图,身高 Stem-and-Leaf Plot Frequency Stem&Leaf 7.00 15.0123334 23.00 15.55555666667788888889999 10.00 16.5555567888 6.00 17.002234 3.00 17.555 5.00 Extremes(=176)Stem width:10 Each leaf:1 case(s),图2-12 学生身高茎叶图,箱图
10、,中数,75%,25%,最大值,最小值,异常值,图2-13 学生分数箱图,2.2 次数分布表,次数分布显示初步整理后一组数据的分布情况。它能使我们对样本情况有个初步的了解为今后进一步分析和研究问题提供很大方便。次数分布表可以分为简单次数分布表、分组次数分布表、累积次数分布表等,2.2.1 简单次数分布表,简单次数分布表是依据每一个分数值在一列数据中出现的次数或总计数资料编制而成的统计表。,表2-6 80名员工对部门主管尽职程度调查结果,态度、兴趣、偏好等测验或调查,2.2.2 分组次数分布表,分组次数分布表,指当数据量很大时,把所有数据先划分为若干分组区间,然后将数据按其数值大小划分到相应的组
11、别内,分别统计各个组别中包括的数据个数,最后用列表形式呈现出来。,例2-2 下面是100名学生在某项测验中的成绩分数76.0 77.5 82.0 90.5 81.0 85.5 71.0 80.5 92.5 77.088.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.098.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 86.0 81.575.0 84.0 90.0 80.0 86.0 84.5 68.5 71.0 68.0 81.579.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 7
12、8.066.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.077.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.573.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.094.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.5,1.求全距R=Xmax-Xmin=98-62=362.决定组距和组数组数:组距:i=全距/组数=R/
13、K=36/12=3,3 列出分组区间,4 登记与计算次数,表2-7 次数分布表的登记表,5 编制次数分布表,表2-8 次数分布表,2.2.3 相对次数分布表,将次数分布表中各组的实际次数转化为相对次数,即用频数比率(fN)或百分比()来表示次数,就可以制成相对次数分布表。,表2-9 相对次数分布表,2.2.4 累加次数分布表,累加次数是把各组的次数由下而上,或由上而下累加在一起。,表2-10 累加次数分布表,可以将次数、相对次数、累加次数等信息列入一张表中。,相对次数fN,累加次数,表2-11 次数分布表,2.2.5 双列次数分布表,双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一
14、个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。,表2-12 31人的视听反应时(单位:毫秒),表2-13 31名学生视、听反应时测验结果,2.2.6 不等距次数分布表,表2-14 1937年美国家庭收入的分布,注:由于四舍五入,百分数加起来不等于100%。来源:现场人口调查。,2.3 次数分布图,在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。绘制次数分布图计算机程序绘制,如EXCEL、SPSS等。,2.3.1 直
15、方图,直方图(histogram)又称为等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。,根据例2-2 作直方图,图2-14 100名学生成绩直方图,60 66 72 78 84 90 96,图2-15 100名学生成绩组织图,2.3.2 次数分布多边形图,次数分布多边形图(frequency polygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。绘制方法:
16、以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。,图2-16 100名学生成绩次数多边形图,图2-17 100名学生成绩次数多边形图,利用次数分布多边图还可以把几组资料放在一起进行比较。但需要注意的是,这时必须把数据的次数换算成百分比。,图2-18 41页数据的次数分布图,图2-19 不正确的比较图,2.3.3 累加次数分布图,60 66 72 78 84 90 96,横轴为分组区间,纵轴为累加次数,图2-20 累加直方图,累加曲线,将累积次数分布图中的横坐标以每一分组区间的精确上限或精确下限表示,纵坐标以累加次数表示,图2-21 累加曲线图,累加曲线
17、可用于判断一组数据的大致分布形态。,图2-22 正态分布数据的累加曲线,图2-23 正偏态数据累加曲线,图2-24 负偏态数据累加曲线,2.3.4 直方图与条形图的区别,1.描述的数据类型不同。条形图描述计数数据,直方图描述分组连续数据。2.标尺分点意义不同。条形图为分类轴,直方图为刻度值。3.图形直观形状不同。条形图有间隔,直方图方块之间没有间隔。,60 66 72 78 84 90 96,4.表示数据的方式不同。条形图用直条的长短或高低表示数据的多少或大小,而直方图用面积表示数据的多少。,面积表示百分数纵坐标=百分数/组距,2.4 计算机绘制统计图表,(1)WORD绘制表格(2)EXCEL绘制条形图-简单条形图、分组条形图、分段条形图、圆形图、线形图、散点图、直方图(3)SPSS绘制直方图、茎叶图、箱图,作业2,各组自行收集数据绘制次数分布表与图(简单、相对、累积均可)要求:数据真实、图表手画报告要求:附原始数据以及说明,谢谢!,