心理统计与测量第二章描述统计ppt课件.ppt

上传人:小飞机 文档编号:2026559 上传时间:2023-01-02 格式:PPT 页数:105 大小:2.99MB
返回 下载 相关 举报
心理统计与测量第二章描述统计ppt课件.ppt_第1页
第1页 / 共105页
心理统计与测量第二章描述统计ppt课件.ppt_第2页
第2页 / 共105页
心理统计与测量第二章描述统计ppt课件.ppt_第3页
第3页 / 共105页
心理统计与测量第二章描述统计ppt课件.ppt_第4页
第4页 / 共105页
心理统计与测量第二章描述统计ppt课件.ppt_第5页
第5页 / 共105页
点击查看更多>>
资源描述

《心理统计与测量第二章描述统计ppt课件.ppt》由会员分享,可在线阅读,更多相关《心理统计与测量第二章描述统计ppt课件.ppt(105页珍藏版)》请在三一办公上搜索。

1、第二章 描述统计,Company Logo,2.1 基本概念,(1)描述性研究 科学研究的两个基本过程:提出问题、采用规范的、科学的研究方法回答提出的问题。 心理学研究的两种途径:描述性研究、实验研究 描述性研究(descriptive study)指在自然状态下收集数 据,对现象进行系统描述,以解释可能不被人们注意的某 种模式和联系。 描述性研究是一种简单的研究方法,它将已有的现象、规 律和理论通过自己的理解和验证,给予叙述并解释出来。 它是对各种理论的一般叙述,更多的是解释别人的论证, 但在科学研究中是必不可少的。,Company Logo,(2)描述性统计概念: 描述统计,是统计学中来描

2、绘或总结观察量的基本情况的统计总称。其与推论统计相对应。内容: 研究者可以透过对数据资料的图像化处理,将资料摘要变为图表,以直观了解整体资料分布的情况。通常会使用的工具是频数分布表与图示法,如多边图、直方图、饼图、散点图等。 研究者也可以透过分析数据资料,以了解各变量内的观察值集中与分散的情况。运用的工具有:集中量数,如平均数、中位数、众数、几何平均数、调和平均数。变异量数,如全距、平均差、标准差、相对差、四分差。,Company Logo,数据的次数分配情况,往往会呈现正态分布。为了表示测量数据与正态分布偏离的情况,会使用偏度、峰度这两种统计数据。为了解个别观察值在整体中所占的位置,会需要将

3、观察值转换为相对量数,如百分等级、标准分数、四分位数等。,Company Logo,2.2 数据的收集,资料来源: 心理观察、心理测量、心理实验研究方法: 个案研究、总体研究、抽样研究,Company Logo,2.3 统计表,(1)概念 统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”。统计表是表现数字资料整理结果的最常用的一种表格。统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式。 统计表是用原始数据制成的一种表格。 统计表是集中而有序地体现统计资料的表格,Company Logo,(2)类型 统计表的形

4、式繁简不一,通常按项目的多少,分为单式统计表和复式统计表两种。只对某一个项目的数据进行统计的表格,叫做单式统计表,也叫做简单统计表。统计项目在两个或两个以上的统计表格,叫做复式统计表。 按作用不同:统计调查表、汇总表、分析表。 按分组情况不同:简单表、简单分组表、复合分组表。 简单表:即不经任何分组,仅按时间或单位进行简单排列 的表。 简单分组表:即仅按一个标志进行分组的表。 复合分组表:即按两个或两个以上标志进行层叠分组的表。,Company Logo,Company Logo,Company Logo,表*,注:,Company Logo,2.4 统计图,2.4.1 概念 统计图是指利用几

5、何图形或具体事物的形象和地图等形式来表现社会经济现象数量特征和数量关系的图形 2.4.2类型 常见统计图的有线状图、直条图、饼状图和散点图。 1、线状图是以坐标系中曲线的形状、斜率变化,位置高低等来表现统计资料。 线状图可以形象、直观地显示出事物的变化发展趋势。研究对象中不同的各组可以用不同颜色或线型的线条表示。,Company Logo,2、直条图是在直角坐标系中,用相同宽度长条的不同长短来表示数量资料的多少,还可在同一张图表中用不同颜色或阴影的条形表示研究对象中不同的各组,能直观地进行数量多少的对比。 3、饼状图是以圆形代表研究对象的整体,用以圆心为共同顶点的各个不同扇形显示各组成部分在整

6、体中所占的比例,要注明各扇形所代表的项目的名称(可用图例表示)及其所占百分比。 4、散点图是在坐标系中点出各个分析数据的相关位置,直观地显示出一组数据的分布情况。,Company Logo,2.4.3 统计图的结构,Company Logo,1、图题和图号:图题是说明统计图内容的标题或名称;图号是统计图的编号。 2、图目:也称标目,是指说明纵轴、横轴所代表的类别、时间、地点、单位等方字或数字。 3、图线:指构成统计图的各种线,如:基线、指导线、图示线、破格线等。 4、图尺:也称尺度,是指在统计图中测定指标数值大小的尺度,包括:尺度线、尺度点、尺度数和尺度单位。 5、图形:是据市场调研资料用图示

7、线绘成的曲线、条形或平面、立体图形。 6、图注:是指统计图的注解和说明,包括:图例、资料来源、说明等。 7、其他:指为了增强图示效果而在图形上附加插图、装饰等。,Company Logo,Company Logo,Company Logo,Company Logo,2.5 描述性统计指标,2.5.1描述性统计分析 描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。2.5.2 描述性统计指标 1.标志和指标 (1)标志-说明总体单位特征的名称。 例如以职工为总体单位时,性别、年龄、工资等都是

8、每个职工具有的标志。,Company Logo,标志按其表现形式有品质标志与数量标志两种。 -品质标志表明的是总体单位的属性特征,是不能用数量表示的。例如职工的性别、文化程度等。 -数量标志表明的是总体单位的数量特征,是可以用数量表现的。例如职工的年龄、工资等。标志的具体表现是指在标志名称后面所表明的属性或数值。 -如某职工性别是男,文化程度是大学毕业,这里的“男”、“大学毕业”分别是品质标志“性别”和“文化程度”的属性。 -某职工的年龄是40岁,40岁就是数量标志“年龄”的数值表现,称标志值。,Company Logo,(2)指标 统计指标的简称。 -统计指标是反映总体现象数量特征的概念。

9、例如国内生产总值、居民消费水平等; -统计指标是反映总体现象数量特征的概念和具体数值。 例如l998年我国国内生产总值为79395亿元。 对统计指标涵义的两种理解都可以成立,前一种理解适用于统计理论和统计设计,后一种理解适用于实际统计工作。,Company Logo,2.平均指标 (1)含义:又称统计平均数,用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。 (2)平均指标的特点把总体各单位标志值的差异抽象化了;平均指标是个代表值,代表总体各单位标志值的一般水平。,Company Logo,(3)平均指标的种类 算术平均数、调和平均数、几何平均数、众数

10、和中位数。 前三种平均数是根据总体所有标志值计算的所以称为数值平均数,后两种平均数是根据标志值所处的位置确定的,因此称为位置平均数。,Company Logo,(4)平均指标的作用 主要表现在: -可以反映总体各单位变量分量分布的集中趋势; -可以用来比较同类现象在不同单位发展的一般水平; -用来比较同一单位的同类指标在不同时期的发展状况; -可以用来分析现象之间的依存关系等,Company Logo,(5)具体指标 A 算术平均数 算术平均数是计算平均指标的最常用方法, 是所有数据的总和除以总频数所得的商,简称平均数或均数。 算术平均数有两种形式:即简单算术平均数和加权算术平均数。-简单算术

11、平均数是将各单位的(标志)值直接相加得出(标志)总量数,再除以总体单位数n,eg.p50,教材未明确简单算术平均数的感念,Company Logo,B-加权算术平均数 加权算术平均数是将各组标志值乘以相应的各组单位数(权数)求出各组标志总量,然后将其加总求得总体标志总量,同时把各组单位数或权数相加求出总体单位总量,最后用总体标志量除以总体单位总量。 如果资料已经分组,则不能简单地将各组标志值相加作为总体总量,而应用此法计算其平均数。 eg.P51 各组标志值=组中值 各组别上下限之间的中点数值,以代表各组标志值的一般水平。 组中值=(上限下限)2 缺上限组的组中值=下限(相邻组组距2) 缺下限

12、组的组中值=上限(相邻组组距2),Company Logo,Company Logo,C 调和平均数 调和平均数又称倒数平均数,是变量倒数的算术平均数的倒数。,未分组资料,分组资料,Company Logo,例: 水果甲级每元1公斤,乙级每元1.5公斤,丙级每元2公斤。 问:(1)若各买1公斤,平均每元可买多少公斤?(2)各买6.5公斤,平均每元可买多少公斤?(3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买几公斤?(4)甲乙丙三级各买1元,每元可买几公斤?,Company Logo,3名学生参加一项学习实验,结果如下表:学习任务所用时间相同而学习工作量不同的平均速度:,单位时间工作量,单

13、位时间工作量,Company Logo,D 几何平均数 一列数据中,相邻的两个数据成比例关系(环比),且非常接近一个常数;数列中出现极端值,数据分布偏态; 等距(比较)和等比(比例)量表的数据处理; 此时用算术平均数无法反应集中趋势。-几何平均数是n个变量值连乘积的n次方根。 -几何平均数多用于计算平均比率和平均速度。如:平均利率、平均发展速度、平均合格率等。,Company Logo,类型: -简单几何平均数 简单几何平均数是n个变量值连乘积的n次方根。,Company Logo,例如 生产某产品需连续经过4道工序,根据经验,各道工序的合格率分别为98%、95%、92%、90%,求该产品4道

14、工序的平均合格率,Company Logo,-加权几何平均数 加权几何平均数是统计学中的一种动态平均指标,多是指社会经济现象的同质总体在时间上变动速度的平均数。加权几何平均数是各标志值fi次方的连乘积的次方根。,Company Logo,例如,投资银行某笔投资的年利率是按复利计算的,10年的年利率分配是:第1年至第2年为5%;第3年至第5年为8%;第6年至第8年为10%;第9年至第10年为12%,求平均年利率。,Company Logo,分解: 设本金为一个单位x 则第一年本息 第二年本息 第三年本息 第四年本息 第10年本息 10年平均年本息 10年平均年利息,Company Logo,如果

15、不按复利计算,平均年利率是多少?解:设本金为C,则: 平均年利率=平均利息/本金,5.8%,Company Logo,E 中位数 中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。用Me表示。 从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。,Company Logo,对于未分组的原始资料 首先必须将标志值按大小排序。设排序的结果为: 则中位数就可以按下面的方式确定:,Company Logo,由分组资料确定中位数 由组距数列确定

16、中位数,应先按 的公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。,Company Logo,例如,根据下表的数据,计算50名工人日加工零件数的中位数。 向上累计频数分布由标志值低的组向标志值高的组依次累计频数。 向下累计频数分布由标志值高的组向标志值低的组依次累计频数。,Company Logo,由上表可知,中位数的位置=50/2=25,即中位数在120125这一组,L=120,Sm 1 = 16;U=125,Sm + 1 = 20,fm = 14,d=5,根据中位数公式得:,L,Sm-1,U,Sm+1,Company Logo,Company Logo,缺点:中位数不够灵

17、敏; 优点:中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。,Company Logo,F 众数 众数是指一组数据中出现次数最多的那个数据,一组数据可以有多个众数,也可以没有众数。 众数是由英国统计学家皮尔森首先提出来的。 从分布角度看,众数是具有明显集中趋势的数值。 例如:某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场某季度男皮鞋的销售情况,得到资料如下表:,从表中可以看到,25.5厘米的鞋号销售量最多,如果计算算术平均数,则平均为25.65厘米,而这个号码是没有实际意义的,而直接

18、用25.5厘米作为顾客对男皮鞋所需尺寸的集中趋势既便捷又符合实际。,Company Logo,众数的特点 1、 不受分布数列的极大或极小值的影响,从而增强了众数对分布数列的代表性。 2、当分组数列没有任何一组的次数占多数,也即分布数列中没有明显的集中趋势,而是近似于均匀分布时,则该次数分配数列无众数。 3、缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。,Company Logo,3. 变异指标 又称离散指标/离中指标 A 全距 全距也称为极差,是指总体各单位的两个极端标志值之差,即: R最大标志值最小标志值 因此,全距(R)可反映总体标志值的差异

19、范围。,Company Logo,例:有两个学习小组的统计学开始成绩分别为: 第一组:60,70,80,90,100 第二组:78,79,80,81,82很明显,两个小组的考试成绩平均分都是80分,但是哪一组的分数比较集中呢?如果用全距指标来衡量,则有: R甲1006040(分) R乙82784(分)这说明第一组资料的标志变动度或离中趋势远大于第二组资料的标志变动度。,Company Logo,根据组距计算极差,是测定标志变动度的一种简单方法,但受极端值的影响,因而它往往不能充分反映社会经济现象的离散程度。 在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。在正常生产条件下,全距在一

20、定范围内波动,若全距超过给定的范围,就说明有异常情况出现。因此,利用全距有助于及时发现问题,以便采取措施,保证产品质量。,Company Logo,B 平均差 平均差(Mean Deviation,MD,average deviation)是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志值变动度越大,反之则表示变动度越小。 -在资料未分组的情况下,平均差的计算公式为: 采用标志值对算术平均数的离差绝对值之和,是因为各标志值对算术平均数的离差之代数和等于零。以甲组学生数学成绩为例:甲组:60,70,80,90,100计算平均差

21、如下:,Company Logo,-在资料已分组的情况下,要用加权平均差公式: 例:某厂按月收入水平分组的组距数列如表中前两列,计算平均差。,310-330330-350,Company Logo,解:,310-330330-350,Company Logo,C 标准差 标准差(Standard Deviation)各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。用表示 假设有一组数值 x1, ., xN (皆为实数),其平均值为:此组数值的标准差为:,Company Logo,D方差 方差是各个数据与其算术平均数的离差平方和的平均数,通常以 表示。-对于未经分组整理的原

22、始数据,方差的计算公式为:-对于分组数据,方差的计算公式为:,Company Logo,E 变异系数 变异系数(Coefficient of variation)又称“标准差率”,是标准差与平均数的比值,记为C.V。 当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。,Company Logo,例:已知某良种猪场A种成年母猪平均体重为190kg,标准差为10.5kg,而B种成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那

23、一个体重变异程度大。,A种成年母猪体重的变异系数,B种成年母猪体重的变异系数,Company Logo,例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。 这两组的平均数都是70,但A组的总体标准差为17.08分,B组的总体标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。,Company Logo,F 四分差 四分位差又称内距、也称四分间距(inter-quartile range),是指将各个变量值按大小顺序排列,然后将此数列分成四等份,所得第三个四分位上的值与第一个四分位上

24、的值的差。 Q = Q3 Q1 其中:Q1的位置=(n+1)/4 Q3的位置=3(n+1)/4 四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。,Company Logo,下四分位数Q1的位置为:第5名员工的加班费为下四分位值:50英镑。上四分位数Q3的位置为:第15名员工的加班费为上四分位值:110英镑。四分位差=Q3 Q1=110 - 50=60英镑,Company Logo,(1)与极差(最大值与最小值之差)相比,四分位差不受极值的影响。 (2)由于中位数处于数据的中间位置,因此四分位差的大小在一定程度上也说明了中位数对一组数据的

25、代表程度。 (3)四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。,Company Logo,2.6 集中离散指标与统计图表的SPSS过程,Company Logo,JP127,Company Logo,1.定义变量,1 =男生2=女生,值,值标签,Company Logo,度量标准,名义,Company Logo,小数点 1位,度量标准:度量,Company Logo,数据录入:,Company Logo,数据甄别,分析,描述统计,频率,Company Logo,频率,将变量自左侧移入,统计量,显示频率表格,Company Logo,频率:

26、统计量,Company Logo,数据自动排序,向上累计,15.3 ?,Company Logo,甄别数据:,1定义错误数据所在列,2 编辑,3查找,Company Logo,查找和替换,4 输入查询数据15.3,5 查找下一个,15.3对应样本编号 16,查找16号问卷,更正后保存,Company Logo,作业1:对数据进行总排序,1 数据,2 排序个案,3 排序依据:身高,4 确定,Company Logo,原始数据已经排序,Company Logo,作业2:求全距、平均数、标准差和2.5及97.5的百分位数。 百分位数(Percentile) 百分位数又称百分位分数(percentil

27、e),是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序后,分为100个单位,百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。百分位数用P加下标m(特定百分点)表示。譬如,若P30等于60,则其表明在该次数分布中有30的个案低于60分。,Company Logo,其中,Pm第m百分位数; LPm所在组的组实下限; UPm所在组的组实上限; fPm所在组的次数; Fb小于L的累积次数; Fa大于U的累积次数。,Company Logo,某省某年公务员考试考生分数分布如下表所示,预定取考分居前15的考生进行面试选拔,请划定面试分数线。,

28、向下累计,由高标志值项低标志值累计,向下累计,由低标志值项高标志值累计,标志值由高到低排列,Company Logo,由于预定取考分居前15的考生进行面试,即有85的考生分数低于划定的分数线,由此可知,分数线在7074这一组中。,实际组下限,Company Logo,组限与表述组限和实际组限两种。在教育和心理统计学中,组限也有两种表述方法,上限不在组内,左闭右开;数据连续,数据不连续,实际组下限,Company Logo,回到练习题,Company Logo,点击:统计量,Company Logo,百分位数,2.5 97.5,均值,标准差,范围,Company Logo,结果输出(剪切输出结果

29、,粘贴到需要的位置),Company Logo,作业3 绘制箱图,判断是否存在极端值,图形,旧对话框,箱图,Company Logo,简单,变量:身高,类别轴:性别,确定,Company Logo,没有极端值,Company Logo,图* 箱形图一般图式,Company Logo,箱形图的绘制步骤:1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长。2、画一个矩形盒,两端边的位置分别对应数据批的上下四分位数(Q1和Q3)。在矩形盒内部中位数(Xm)位置画一条线段为中位线。3、在Q3+1.5IQR(四分位间距)和Q11.5IQR处画两条与中位线一样的线段,这

30、两条线段为异常值截断点,称其为内限;在Q3+3IQR和Q13IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。四分位间距=Q3-Q1。.,四分位间距:上四分位数与下四分位数之差,Company Logo,4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。5、用“”标出温和的异常值,用“*”标出极端的异常值。相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。,Compan

31、y Logo,绘制茎叶图,探索 explore,Company Logo,因变量列表:身高,因子列表:性别,统计量,Company Logo,探索 explore:统计量,界外值,Company Logo,输出,5%修整均值就是把排在最前面和最后面5%的数据都删掉,之后再计算的均值,这样就使得均值不容易受均值影响,更能代表总体,Company Logo,Company Logo,茎叶图,Company Logo,茎叶图又称“枝叶图”,由统计学家约翰.托奇.设计它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面

32、,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。 茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。,Company Logo,Company Logo,茎叶图逆时针方向旋转9O度,实际上就是一个带有数字的直方图,Company Logo,作业4 频数分布表和组剧为5的频数分布图,Company Logo,图表,直方图,带正态曲线,Company Logo,直方图,组距为5,Company Logo,作业5 前13名学生分为一班,其余为2班,按班级性别统计全距、平均数和标准差方法:按要求将样本分组,数据,选择个案,Company Logo,数据,Company Logo,Company Logo,1班,2班,Company Logo,作业与上机练习:作业: JP125 第10题 JP127 第17题、18题 JP128 第19题、20题要求:手工和软件兼用,指标手工算,图形软件做(没学的不做)。上机练习:上述所有题目。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号