数据的图表描述与特征量.ppt

上传人:牧羊曲112 文档编号:6578755 上传时间:2023-11-14 格式:PPT 页数:61 大小:271.50KB
返回 下载 相关 举报
数据的图表描述与特征量.ppt_第1页
第1页 / 共61页
数据的图表描述与特征量.ppt_第2页
第2页 / 共61页
数据的图表描述与特征量.ppt_第3页
第3页 / 共61页
数据的图表描述与特征量.ppt_第4页
第4页 / 共61页
数据的图表描述与特征量.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《数据的图表描述与特征量.ppt》由会员分享,可在线阅读,更多相关《数据的图表描述与特征量.ppt(61页珍藏版)》请在三一办公上搜索。

1、第二章 数据的图表描述与特征量,第一节 统计资料的表列与图示第二节 常用集中量数第三节 差异量数第四节 地位量数,第一节 统计资料的表列与图示,一、统计资料的分类二、次数分布表三、次数分布图,一、数据的统计分类,1、什么是统计分类2、统计分类应遵循的基本原则,返回,次数分布表,统计表,1、什么是统计分类,所谓统计分类,就是根据被研究对象的特征,依据某一个或某几个标志将对象加以区分,将它们划分到各个不同的类别中去。统计分类是对资料作分析的首要一步。无论是用统计表还是用统计图来整理研究资料,都与统计分类相联系,它们质量的高低取决于统计分类的合理性和有效性。,返回,2、统计分类应遵循的基本原则,1、

2、由研究的目的确定分类的依据。2、每一个分类标志都是“单向的”。分类标志的单向性,是指每一个分类标志都必须是建立在对象的某一种特征上的。满足分类标志单向性的必要条件:(1)每一个分类标志下的类别都是周延的。即该特征所有可能的类别都无一遗漏地被列举出来,所有的对象都能够被划归于该标志下的某一类别之中。(2)每一个分类标志下的类别都是互斥的。即该特征所有类别彼此都不相互包容。属于某一类别的对象,就一定不再属于该特征的其它任何类别。,返回,例,表2-1 某心理学院研究生的情况汇总表,表2-2 某心理学院研究生的情况汇总表),返回,二、统计表,1、统计表的结构以及编制原则和要求2、统计表的种类,返回,1

3、、统计表的结构以及编制原则和要求,编制原则:表的结构要简单明了。一张表只能有一个中心,说明的问题要重点突出;表的层次要清楚,项目、指标的排列要按照逻辑顺序合理安排。1、标题表的名称。写在表的上方。应确切地、简明扼要地说明表的内容。2、表号表的序号。写在标题的左方。若文章中有几张表,则需按它们出现的先后次序编上序号。3、标目表格中对统计数据分类的项目。可分为横标目和纵标目。位于表的左侧者为横标目,因为它与所指明的数字在同一横行。位于表的上端者为纵标目,因为它与所指明的数字在同一纵列。必要时,在横标目和纵标目的上方加上适当的总标目。按标目的内容又可分为主语和谓语。一般横标目为主语,纵标目为谓语。一

4、个设计良好的统计表,循“主语谓语数字”的顺序阅读,可以形成一个通顺的句子。4、线条线条不宜过多。四种基本线条为:顶线、底线、隔开纵标目与数字的横线与隔开横标目与数字的纵线。5、数字表内数字必须准确,一律用阿拉伯字母表示,位次对齐,小数的位数一致,表内不应有空格。暂缺或未记录可用省略号或“”表示,数字若是“0”,则应填写“0”。6、表注不是表的必要组成部分。若确有补充说明的必要,可用简短的小号字写在表的下方。,返回,2、统计表的种类,1、简单表2、分组表3、复合表4、次数分布表,返回,统计图,1、简单表,只列出观察对象的名称、地点、时序或统计指标名称的统计表。例:表1 某班各科期末成绩,返回,2

5、、分组表,只按一个标志分组的统计表。例:表2 上海市区男幼儿20米跑步用时,返回,3、复合表,按两个或两个以上标志分组的统计表。例:表3 某年级操行评定结果,返回,接次数分布表,次数分布表,次数分布表是对杂乱无章的数据进行整理的重要手段。通过次数分布表可以直观地看出各种数据出现的次数,以及分布的状况,数据集中的趋势和差异情况。连续变量的次数分布表的编制步骤:1、求全距:2、决定组数和组距:分组一般以10-15组为宜,10-20组也可以。最常用的组距为1、2、3、5、10等。分组不宜过多或过少。过多则不仅计算麻烦,而且由于组距范围太狭,不易反映整个分布的趋势;分组过少,会将许多不同的事实归在一起

6、,误差较大,容易失去准确性。正态分布的数据可用经验公式计算组数(K):K=1.87(N-1)0.43、决定组限:即规定每组的起止范围。最高组区间内应能包含最大值的数据,最低组区间应能包含最小值的数据。最高组或最低组的下限最好是组距的整数倍。4、登记次数:依次将数据登记到各个相应的组别内。例,关于统计表,关于统计图,返回,次数分布表之例,表4 师大附小二年级80个学生身高实测数值请依据上述资料作出次数分布表,表5 师大附小二年级80个学生身高的次数分布、累积次数分布、累积百分比分布表,表5 师大附小二年级80个学生身高的次数分布、累积次数分布、累积百分比分布表,返回md,方差与标准差,百分位数,

7、四分位差,百分等级,师大附小二年级80个学生身高的次数分布直方图,转到多边图,师大附小二年级80个学生身高的次数分布多边图,返回,返回,三、统计图,1、统计图的结构及其绘制规则2、表示离散变量的统计图 直条图(条形图)圆形图(饼图)3、表示连续变量的统计图 线形图 次数分布图,1、统计图的结构及其绘制规则,1、标题图的名称。应简明扼要,切合图的内容,必要时可注明时间、地点。图题的字体在图中为最大,自左向右写在图的下方。2、图号文章中若有几幅图,则需按其出现的先后次序编上序号,写在图题的左前方。3、标目对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。横轴是基线,一般表示被观察的对象,

8、尺度要等距,自左向右,由小到大,写在横轴的下方。纵轴是尺度线,尺度从0开始,自下而上,从小到大,写在纵轴的左侧,两个轴都要注明单位。4、图形图形线在图中为最粗,而且要清晰。为美观起见,图形的高与宽之比以3比5为宜。在一幅图中若有几个图形线相比较,可以用不同的图形线加以区别。各种图形线的含义可用图例在适当的位置加以标明。5、图注图中若有必须加以解释的地方,可用图注加以说明。文字要简明扼要,字体要小,写在图的下方。,返回,直条图(条形图),直条图是用直条的长短表示统计事项数量的图形。按图形中被比较资料的组数不同,可分为单式和复式两种。,返回,圆形图(饼图),圆形的面积表示一组数据的整体,圆中扇形表

9、示各组成部分所占的比重。各部分的比重一般用百分比表示。绘制圆形图的步骤:1、求各组成部分所占百分比。2、求各组成部分的中心角度数。3、以圆的下半径(或上半径)为基线,按被比事物特定顺序,根据各部分的角度数,以顺时针方向,用量角器将圆形分成几个扇形。4、用不同线条或不同颜色将各扇形加以区别,并在各扇形内用简要文字及百分比加以注明。5、若比较两组性质类似资料的构成比,可绘制直径相同、图中各部分内容排列顺序一致的两个圆相比较。例,返回,饼图之例,返回,线形图,表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。例:,返回,第二节 常用集中量数,一、算术平均数二

10、、中位数三、众数四、加权平均数、几何平均数、调和平均数,算术平均数的概念与性质,一、算术平均数的概念:所有观察值的总和除以总次数所得之商。算术平均数=二、算术平均数的性质:1、数据的量的总和一定等于其算术平均数与数据数目的乘积。2、某一数据与其所属样本的算术平均数之差(离均差)之和一定等于零。3、样本中的每一个数据都加上一个常数之后,它们的平均数就等于原来的平均数加上这一个常数。4、样本中的每一个数据都乘以一个常数之后,它们的平均数就等于原来的平均数乘以这一个常数。5、样本平均数的数学期望就等于其所来自总体的平均数。作为统计量,样本平均数的这一性质又称为“无偏性”。,分组数据求平均数,根据分组

11、数据求算术平均数,方法:各组组中值乘以各组频数,求其和,再除以总频数,即为这组数据算术平均数的近似值。即,优缺点,算术平均数的优缺点及使用条件,一、优点:1、反应灵敏。一组数据中任何一个数值发生或大或小的变化,所计算出来的算术平均数也会随之变大变小,能灵敏地反应出来。2、严密确定。由同一组数据计算出来的算术平均数是同一个值。3、计算简便。只需用简单的四则运算。4、适合代数运算。例如,可以通过几个平均数求它们的总平均数等等。5、受样本变动的影响较小。从同一个总体中随机抽取的容量相同的样本,所计算出的算术平均数与其他集中量指标相比,抽样误差较小。二、缺点:1、易受两极端数值(极大或极小)的影响。2

12、、一组数据中某个数值的大小模糊不清或不够确切时,就无法计算其算术平均数。三、使用条件:1、一组数据中每个数据都比较准确、可靠;2、无极端数值的影响;3、数据是同质的。,中位数,一、概念:中位数是位于依一定大小顺序排列的一组数据中央位置的数值。一般用Md表示。中位数可能是一组数据中的某一个数值,也可能不是这组数据中的某一个数值。二、中位数的计算方法:1、原始数据计算法:若总频数为奇数,就以位于中央的数据作为中位数。若总频数为偶数,则以最中间的两个数据的算术平均数作为中位数。2、次数分布表计算法:三、中位数其实就是第50百分位数。四、中位数的优缺点及使用条件:1、优点:很少受两极端数值的影响,不是

13、每个数据都参加运算,反应不灵敏。2、缺点:不适合作代数运算,与算术平均数相比抽样偏差相对较大。3、适用于以下情形:一组数据中有特大或特小两极端数值时;一组数据中有个别数据不确切、不清楚时;数据资料属于等级性质时。,百分位数,一、概念:百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。一般用Pp表示。二、例如:第70百分位数P70,就是在依从小到大排列的一组数据中小于这数值有70%的频数,大于这个数值有30%的频数。三、在教育与心理测量中,常通过计算某个原始分数所属的百分位数来说明、解释、评价它在团体中所处的位置。四、百分位数的计算方法:,中位数,百分等级,练习,算例练习,百分等级,反

14、过来,利用百分位数的计算公式也可以计算出任意分数在整个分数分布中所处的百分位置,称为该分数的百分等级。记作:PR,应用,练习,百分位数与百分等级在心理测量中的应用 测验等值,测验等值就是通过对考核同一种心理品质的多个测验形式作出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有可比性。,例,测验等值之例 等百分位等值,原理:两个分数,一个在测验形式X 上,另一个在测验形式Y 上,如果这两个分数对于任何一个被试群体都有相同的百分等级,那么这两个分数就被认为是等值的。按照这个原理,寻找与X分数等值的Y分数,只要找到与X分数有相等百分等级的Y分数就可以了。,例,在某种等值设计之下采集得到

15、两测验的分数,并编制成次数分布表如下,如果某生在X测验中得分为60分,则在Y测验中得分为多少分?,众数,一、理论众数与粗略众数 1、理论众数指与频数分布曲线最高点相对应的横坐标上的一点。2、粗略众数指一组数据汇总频数出现最多的那个数。二、众数的计算方法:1、观察法 2、用公式求理论众数的近似值(1)皮尔逊经验法 Mo=3Md-2M(正态条件)(2)金氏插补法(偏态条件)三、优缺点:1、优点:较少受两极端数值的影响,反应不灵敏。2、缺点:受组距变化的影响,组距不同,众数值就可能不同。所以它极不准确、极不稳定。不适合代数运算。受抽样变动较大。,算术平均数、中位数、众数三者的关系,1、当次数分布呈正

16、态时,算术平均数、中位数、众数三者重合为一点。2、当次数分布呈正偏态时,中数居中,平均数与中数距离较近,众数与中数距离较远。3、在负偏态时,,第三节 差异量数,一、方差与标准差二、标准差的应用三、其他差异量数,一、方差与标准差,1、方差与标准差的计算2、方差与标准差的意义,返回,标准差应用,方差与标准差的计算,1、未分组数据求方差与标准差2、分组数据求方差与标准差,返回,算例练习,方差与标准差的意义,1、方差与标准差是表示一组数据离散程度的最好指标。其值越大,说明离散程度越大,其值小说明数据比较集中,是统计描述与统计分析中最常应用的差异量数。2、方差与标准差具备一个良好的差异量数应具备的条件:

17、(1)反应灵敏。(2)计算公式严密确定。(3)容易计算。(4)适合代数运算。(5)受抽样变动的影响较小。(6)简单明了。3、方差具有可加性的特点。它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是统计推论部分常用的统计特征数。4、方差和标准差的缺点是:易受两极端值的影响;有个别数值模糊不清时,无法计算。,返回,二、标准差的应用,1、差异系数2、标准分数3、异常值的取舍,返回,返回,差异系数,标准差的单位与原数据相同,因而有时称它为绝对差异量。但是,当:(1)两个或多个样本所测的特质不同,即单位不同时

18、,(2)即使使用同一种观测工具对同一种特质进行测量,但样本的水平相差较大时。不能用标准差来直接比较离散程度的大小。而应该使用相对差异量数。最常用的相对差异量数就是差异系数,也叫变异系数、相对标准差等。通常用符号CV表示,其计算公式如下:例。,差异系数的应用之一,同一团体不同观测值离散程度的比较:例1、已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?解:通过比较差异系数可知,体重的分散程度比身高的分散程度大。,差异系数的应用之二,对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。例

19、2:通过一个测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(14岁)学生的平均分数为80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?解:答:五年级的测验分数离散程度大。,返回,标准分数(Z分数),1、定义2、计算公式3、性质4、Z分数的应用,返回,标准分数(Z分数的定义),标准分数又称基分数或Z分数,是以标准差为单位表示一个分数在团体中所处的相对位置量数。,返回,计算公式,Z分数的意义:1、它是一个数与平均数之差除以标准差所得的商数,它无实际单位。2、若一个数小于平均数,则Z分数为负数,若一个数的值大于平均数,则Z分数为正数,若一个数的值等于平均数

20、,则Z分数为0。可见,Z分数可以表明原数目在该组数据分布中的位置,故称为相对位置量数。,返回,Z分数的性质,1、在一组数据中所有由原分数转换得出的Z分数之和为零,其Z分数的平均数亦为零。2、一组数据中各Z分数的标准差为1。,返回,Z分数的应用,1、Z分数可用于比较分属性质不同的观测值在各自数据分布中相对位置的高低。2、当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总和或平均值,以示在团体中的相对位置。3、表示标准测验分数。,返回,利用Z分数求总和,利用Z分数求总和,返回,表示标准测验分数,经过标准化的心理与教育测验,如果其常模分数分布接近正态分布,常常转换成正态标准分数。

21、转换公式为式中Z为正态标准分数,a,b为常数,为测验常模的标准差。例如,韦克斯勒制定新的智力量表时用离差智商的概念表示一个人在同龄团体中的相对智力。其中,X为原分数,为某团体(或年龄组)的平均数,S为该年龄组的标准差。,返回,其他几种差异量数,1、全距2、平均差3、四分位差,返回,四分位差,Q表示:在一个次数分配中,中间50%的次数的全距之半。在一组数据中,它的值等于第一四分位点Q1(p25)到第三四分位点Q3(p75)距离的二分之一。这个差异量数能够反映出数据分布中间50%数据的离散情况。,练习,作业一,以下方框中为某班52名学生拼写测验分数,试根据这些数据,制作次数分布表(含累计次数分布)和次数分布直方图、多边形图。,作业二,教材后的练习题。,作业三,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号