数据的描述统计分析.ppt

上传人:牧羊曲112 文档编号:6166868 上传时间:2023-10-01 格式:PPT 页数:170 大小:5.01MB
返回 下载 相关 举报
数据的描述统计分析.ppt_第1页
第1页 / 共170页
数据的描述统计分析.ppt_第2页
第2页 / 共170页
数据的描述统计分析.ppt_第3页
第3页 / 共170页
数据的描述统计分析.ppt_第4页
第4页 / 共170页
数据的描述统计分析.ppt_第5页
第5页 / 共170页
点击查看更多>>
资源描述

《数据的描述统计分析.ppt》由会员分享,可在线阅读,更多相关《数据的描述统计分析.ppt(170页珍藏版)》请在三一办公上搜索。

1、2023/10/1,第二讲 数据的描述统计分析,主讲:张杰,2023/10/1,本讲内容,2.1 定性数据的频数分析2.2 定量数据的描述性统计量2.3 数据的图表展示,2023/10/1,本讲参考教材,贾俊平:统计学(第四版),中国人民大学出版社,2011.6叶向:统计数据分析基础教程-基于SPSS和Excel的调查数据分析,中国人民出版社,2010-02于洪彦,刘金星,张洪利:Excel统计分析与决策(第2版),高等教育出版社,2009,08薛薇:统计分析与SPSS的应用(第3版),中国人民大学出版社,2011.1,2023/10/1,2.1 定性数据的频数分析,一、频数分析概述二、单变量

2、的一维频数分析三、双变量的交叉表分析四、多选变量的频数分析,2023/10/1,一、频数分析概述,频数分布分析主要通过频数分布表和饼图、条形图等图形来描述数据分布特征的方法。频数也称“次数”,对总数据按某种标准进行分组(类),统计出各个组(类别)内含个体的个数。我们把各个类别及其相应的频数全部列出来就是“频数分布”。频数分析是所有问卷调查中最广泛使用的分析技巧。因为它的频数分布表的建表方式最简单,分析阅读最容易,是一般大众最能接受的分析结果。普通报纸杂志上对调查结果通常也只是建立频数分布表而已。因为如果使用其他分析方法,读者也不见得能看懂,如何引起共鸣呢?,2023/10/1,基本统计分析往往

3、从频数分析开始,通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。例如,在问卷数据分析中,通常应首先对本次调查的被调查者的状况(基本信息),如被访者的总人数、性别、学历、职业等进行分析和总结。通过这些分析,能够在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差。这些分析可以通过频数分析来实现。,一、频数分析概述,2023/10/1,一、频数分析概述,频数分析的第一个基本任务是编制频数分布表,第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式。频数分析有一维的和二维(交叉)的:先介绍单变量的一维频数分析,包括调查问卷中常用的单选题(定性变量,分类数据)

4、的一维频数分析和填空题(定量变量,数值型数据)的一维频数分析。然后介绍双变量的交叉表分析(二维频数分析)最后介绍调查问卷中常用的多选题(定性变量,分类数据)的频数分析。,2023/10/1,二、单变量的一维频数分析,例1-1 用SPSS实现品牌支持率的一维频数分析。1菜单:“Analyze”-“Descriptive Statistics”-“Frequencies”,打开一维频数分析对话框2确定进行一维频数分析的变量3选择统计分析结果4根据调查报告所需格式,修改频数分布表5将修改过的频数分布表复制到Word文件中,作为调查报告的一部分,2023/10/1,利用SPSS对单选题进行一维频数分析

5、,例1-1 用SPSS实现品牌支持率的一维频数分析。表1-1 品牌支持率的频数分布表,2023/10/1,利用Excel对单选题进行一维频数分析,调查问卷中常用的单选题的一维频数分布表,可以利用Excel的COUNTIF函数实现。COUNTIF(Range,Criteria)计算区域中满足给定条件的单元格的个数温馨提示:更为方便的方法是利用Excel的“数据透视表”。,2023/10/1,利用Excel对单选题进行一维频数分析,例1-2 利用Excel求“品牌倾向”的一维频数分布表。,2023/10/1,在Excel中绘制一维频数分布统计图,有道是:“文不如表,表不如图”,即所谓的“一图胜千言

6、”。取得一维频数分布表后,在分析上,为方便解释,经常将其绘制成柱形图(条形图)或饼图。绘制统计图表是Excel的专长,所绘制的图表比SPSS或SAS统计软件绘制的图表并不差甚至要好。,2023/10/1,在Excel中绘制一维频数分布统计图,例1-4 根据例1-2求得的品牌支持率的频数分布表,绘制品牌支持率的柱形图,2023/10/1,在Excel中绘制一维频数分布统计图,例1-5 根据例1-2求得的品牌支持率的频数分布表,绘制品牌支持率的饼图。,2023/10/1,利用SPSS对填空题进行一维频数分析,前面所有一维频数分布表的例子,其答案都是非连续型的数字数据(分类数据)。但如果碰上如月费、

7、百分制分数、收入、身高等连续型数据(数值型数据),就得先将数据分成几个区间(即数据分组)。在SPSS中,通过重新编码,将数值型数据转换为分类数据(新变量),然后再对新变量求一维频数分布表。,2023/10/1,利用SPSS对填空题进行一维频数分析,例1-6 用SPSS实现手机平均月费的频数分布分析。请问您平均每个月手机的话费约为 元?重新编码生成新变量菜单:“Transform”-“Recode”-“Into Different Variables”Old and New Values:平均月费-月费分组对新变量进行一维频数分析菜单:“Analyze”-“Descriptive Statist

8、ics”-“Frequencies”新变量:月费分组,2023/10/1,利用SPSS对填空题进行一维频数分析,例1-6 用SPSS实现手机平均月费的频数分布分析。,在191名受访大学生中,有119名同学有手机(占62.3%),而有72名同学没有手机。在有手机的119名受访大学生中,平均每月手机话费在2140元的同学最多,约占三分之一(32.8%);有近五分之一(7.6%4.2%5.9%=17.7%)同学的每月手机话费在60元以上。,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计。有某学院2008级2个班136名同学的某门课程的成绩(

9、包括平时成绩、期中成绩和期末成绩,假设这136名同学各个阶段都有成绩)。因为某大学教务系统对学生的最终成绩有规定:“优秀(90分及以上)率最好不超过20,且一定不能超过30,否则成绩无法提交。”因此,登录(录入)学生成绩前,老师们要先统计各个分数段人数的分布情况。,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计首先,要根据学生的平时成绩、期中成绩和期末成绩,计算最终成绩。可利用“条件格式”将不及格(60分以下)的成绩用红色字体标识出来。然后根据最终成绩,统计各个分数段人数的分布情况。这里介绍两种统计各个分数段人数的方法:(1)用COU

10、NTIF函数进行统计;(2)用FREQUENCY函数进行统计。相比用COUNTIF函数,用FREQUENCY函数更方便些,它采用“数组公式”实现。,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计用COUNTIF函数进行统计,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计最终成绩统计图(饼图),2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计用FREQUENCY函数进行统计(采用“数组公式”实现),2023/10/1,三

11、、双变量的交叉表分析,利用SPSS对两个定性变量(两个单选题)进行交叉表分析利用Excel数据透视表实现频数分析交叉表的相关性检验,2023/10/1,双变量的交叉表分析,市场调查或民意调查,经常利用交叉表(又叫列联表)来分析两个分类(定性)变量之间的关系,比如:性别与品牌偏好、教育程度(学历)与使用品牌、收入与是否有数码相机、性别与移动电话类型偏好、地区与移动电话类型偏好,等等。交叉表分析易于理解,便于解释,操作简单,却可以解释比较复杂的现象。交叉表经常用于市场研究,进行市场机会、市场细分分析等。,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,例1-8 分析不同性别(或种族、

12、或居住地区)的美国人对生活方面(幸福感、生活是否充满激情)的认识情况。这个问题可以分解为6个小问题:(1)分析不同性别的美国人对幸福感的认识情况(2)分析不同种族的美国人对幸福感的认识情况(3)分析居住在不同地区的美国人对幸福感的认识情况(4)分析不同性别的美国人对生活是否充满激情的认识情况(5)分析不同种族的美国人对生活是否充满激情的认识情况(6)分析居住在不同地区的美国人对生活是否充满激情的认识情况,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,例1-8 分析不同性别(或种族、或居住地区)的美国人对生活方面(幸福感、生活是否充满激情)的认识情况。1.用SPSS的Crosst

13、abs求交叉表 菜单“Analyze”-“Descriptive Statistics”-“Crosstabs”2.在Excel中修饰交叉表并绘制百分比堆积柱形图3.在Word中撰写交叉表分析报告,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,“性别”与“幸福感”的交叉表,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,男女对幸福感认识的百分比堆积柱形图,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,在Word中撰写交叉表分析报告(男女对幸福感的认识情况)交叉表分析报告,一般包含表格、百分比堆积柱形图(或三维簇状柱形图)和结论(建议)。,此次调查了

14、1517名美国人,其中有1504人对“性别”和“幸福感”这两个单选题都作了回答(占总调查人数的99.1)。关于不同性别的美国人对幸福感认识的交叉表和柱形图如表XX和图XX所示。此次调查的结果显示:受访者中,无论男女,认为“比较幸福”的居最多数(男59.1%,女57.2%),认为“非常幸福”的居中(男32.5%,女30.0%)。此外,就相对程度来看,认为生活幸福(“比较幸福”和“非常幸福”的比例之和)的美国人中,男性比例明显超过女性(91.6%对87.2%),可以看出女性的幸福感低于男性,而感觉“不太幸福”的女性的比例则高于男性。说明女性更渴望生活幸福。,2023/10/1,利用Excel数据透

15、视表实现频数分析,为了解某大学统计学院本科学生对该学院计算机课程教学的看法和意见,设计调查问卷,进行随机抽样调查了85名同学,得到调查数据。根据调查所得数据进行基本统计分析,希望掌握以下几个方面的情况:(1)学生对计算机课程设置的看法。(2)学生对计算机教学方法的看法。(3)学生对计算机选修课程的意见。,2023/10/1,利用Excel数据透视表实现频数分析,利用Excel数据透视表,可以很方便地实现单变量的一维频数分析和双变量的交叉表分析。数据透视表是Excel特色的数据分析功能,只需几步操作,它就能灵活地以多种不同方式展现数据的特征,变换出各种类型的报表,实现对数据背后的信息透视。数据透

16、视表最大的特点是交互性。,2023/10/1,利用Excel数据透视表实现单选题的一维频数分析,例1-9 分析学生对计算机课程设置的看法菜单:“数据”-“数据透视表和数据透视图”学生对计算机课程设置看法的一维频数分布表,2023/10/1,利用Excel数据透视表实现单选题的一维频数分析,例1-9 分析学生对计算机课程设置的看法计算机课程能否满足专业需要的饼图,2023/10/1,利用Excel数据透视表实现两个单选题的交叉表分析,例1-10 分析不同性别的学生对计算机课程设置的看法菜单:“数据”-“数据透视表和数据透视图”男女同学对计算机课程设置的看法,2023/10/1,利用Excel数据

17、透视表实现两个单选题的交叉表分析,例1-10 分析不同性别的学生对计算机课程设置的看法男女同学对计算机课程设置看法柱形图,2023/10/1,利用Excel数据透视表实现两个单选题的交叉表分析,例1-11 分析不同专业方向的学生对计算机课程设置的看法。在例1-10数据透视表汇总结果基础上修改不同专业方向的学生对计算机课程设置的看法,2023/10/1,利用Excel数据透视表实现两个单选题的交叉表分析,例1-11 分析不同专业方向的学生对计算机课程设置的看法。不同专业方向的学生对计算机课程设置看法柱形图,2023/10/1,交叉表的相关性检验,研究交叉表(二维列联表)的一个主要目的是看这两个变

18、量有无相关性。也就是说,在交叉表的基础上作进一步分析,可以得到行变量和列变量之间是否有联系、联系的紧密程度如何等更深层次的信息。交叉表的卡方检验用SPSS进行交叉表的相关性检验用Excel进行交叉表的相关性检验,5.3小节了解即可,2023/10/1,交叉表的卡方检验,例1-12 分析在例1-8的问题(1)中,性别和幸福感是否相关。相关性检验的零假设和备选假设为:H0:性别和幸福感之间无关(即不同性别的美国人在幸福感的分布上没有显著差异,或不同幸福感的美国人在性别的分布上没有显著差异)H1:性别和幸福感之间相关(即不同性别的美国人在幸福感的分布上有显著差异,或不同幸福感的美国人在性别的分布上有

19、显著差异),2023/10/1,用SPSS进行交叉表的相关性检验,菜单:“Analyze”-“Descriptive Statistics”-“Crosstabs”选项:“Statistics”选项中的“Chi-square”,2023/10/1,用SPSS进行交叉表的相关性检验,进行相关性检验后,调查报告中的交叉表就需要增加相应的信息。表59 不同性别的美国人对幸福感的认识情况,相关性检验结果表明,p值为0.021,小于显著性水平0.05,因此拒绝零假设,说明性别和幸福感之间相关(男女两性对幸福感的认识有显著差异),2023/10/1,四、多选变量的频数分析,利用SPSS对多选题进行频数分析

20、利用Excel对多选题进行一维频数分析绘制多选题的一维频数分布统计图,2023/10/1,多选变量的频数分析,调查问卷中经常会存在一定数量的多项选择题(多选题)。多项选择题可以在SPSS和Excel中做成多个内容相同的变量。这些变量称为多选变量。对多选变量进行分析时,不仅希望知道某些选项在第一选、第二选或第三选中分别有多少人选,还希望知道某些选项在多次选择中总共被选择了多少次,这个问题要通过多选变量分析来解决。,2023/10/1,利用SPSS对多选题进行频数分析,在SPSS中有解决多选题的菜单,方法是先将多选题中的若干答案组成一个综合变量(即变量集Set),然后对综合变量的各种取值进行分析。

21、多选题的频数分析在SPSS中是通过“Analyze”-“Multiple Response”菜单实现的。具体子菜单如下:(1)Define Sets:建立多选“二分法”编码变量集或多选“分类法”编码变量集。用一个多选变量集代表多个变量。(2)Frequencies:对多选变量集进行一维频数分析;(3)Crosstabs:对多选变量集与其他多选变量集或与原单选变量进行交叉表分析。,2023/10/1,利用SPSS对多选题进行频数分析,例1-13 用SPSS实现健康状况多选题的一维频数分析hlth1hlth9:“二分法”编码(Dichotomies)菜单:“Analyze”-“Multiple R

22、esponse”-“Define Sets”,建立多选“二分法”编码变量集“$健康”菜单:“Analyze”-“Multiple Response”-“Frequencies”,对多选变量集(“$健康”)进行一维频数分析,2023/10/1,利用SPSS对多选题进行频数分析,例1-13 用SPSS实现健康状况多选题的一维频数分析菜单:“Analyze”-“Multiple Response”-“Define Sets”,建立多选“二分法”编码变量集“$健康”,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-14 撰写有关健康状况多选题的分析报告(1)将多选题一维频数分布表拷贝到

23、Excel中;(2)根据调查报告所需格式,在Excel中修饰多选题一维频数分布表;(3)绘制多选题的一维频数分布条形图;(4)在Word中撰写“健康”状况多选题的一维频数分析报告,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-14 撰写有关健康状况多选题的分析报告表1-5“健康”状况多选题的一维频数分布表,注意:以“回答人数(714人)”为分母,而不是以回答总次数(1108)为分母,按照百分比排名顺序显示更好些,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-14 撰写有关健康状况多选题的分析报告图6-8“健康”状况多选题的一维频数分布条形图,按照百分比排名顺

24、序显示更好些,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-15 用SPSS实现遇到问题多选题的一维频数分析prob1prob4:“分类法”编码(Categories)菜单:“Analyze”-“Multiple Response”-“Define Sets”,建立多选“分类法”编码变量集“$遇到问题”菜单:“Analyze”-“Multiple Response”-“Frequencies”,对多选变量集(“$遇到问题”)进行一维频数分析,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-15 用SPSS实现遇到问题多选题的一维频数分析菜单:“Analyze”

25、-“Multiple Response”-“Define Sets”,建立多选“分类法”编码变量集“$遇到问题”,2023/10/1,利用SPSS对多选题进行一维频数分析,补充:有关遇到问题多选题的分析报告遇到问题多选题的一维频数分布表,2023/10/1,利用SPSS对多选题进行一维频数分析,补充:有关遇到问题多选题的分析报告遇到问题多选题的一维频数分布条形图,2023/10/1,利用Excel对多选题进行一维频数分析,多选题的一维频数分布表,可以利用COUNTIF函数求得。针对多选题的3种不同情况,要分别处理:(1)对于多项限选不排序,并且采用“分类法”编码输入数据的多选题,处理时需要根据

26、多选答案的个数,分几次处理,然后再将其求和。由于是多选,同一受访者可能回答不止一个答案,所以其百分比的求和会超过100。(2)对于多项限选排序,并且采用“分类法”编码输入数据的多选题,处理时需要根据多选答案的频数,分几次处理,然后通过类似例2-15介绍的方法进行加权平均求相对频数。(3)对于采用“二分法”编码输入数据的多选题,在统计频数时,处理时需要根据多选答案的个数,分几次处理,然后再将其汇总。,2023/10/1,利用Excel对多选题进行一维频数分析,多选题的一维频数分布表,可以利用COUNTIF函数求得。,2023/10/1,用COUNTIF函数求限选不排序 多选题的一维频数分布表,例

27、1-16 分析学生对计算机选修课程的意见(求计算机选修课多选题的一维频数分布表)。具体步骤 方法:分3列(次)求频数后,再将其求和(合计)注意:百分比是以“回答人数(总回答人数)”为分母,而不是以“调查人数(总调查人数、样本数)”为分母,2023/10/1,还有一种更为简便的方法:直接用COUNTIF函数求频数(人数),用COUNTIF函数求限选不排序 多选题的一维频数分布表,例1-16 分析学生对计算机选修课程的意见(求计算机选修课多选题的一维频数分布表),按照百分比排名顺序显示更好些,2023/10/1,绘制多选题的一维频数分布统计图,多选题的一维频数分布统计图一般有:条形图或柱形图。如果

28、选项内容比较长,则选用条形图;如果选项内容比较短,则选用柱形图。,按照百分比排名顺序显示更好些,2023/10/1,用COUNTIF函数求不限选多选题的一维频数分布表,例1-17 用Excel实现工作状况多选题的一维频数分析。具体步骤方法:先在问卷数据(隔1行)下面用COUNTIF函数统计后,复制选择性粘贴(“数值”和“转置”)注意:百分比是以“回答人数(总回答人数)”为分母,所以增加一列(work,在AN列),2023/10/1,用COUNTIF函数求不限选多选题的一维频数分布表,例1-17 用Excel实现工作状况多选题的一维频数分析(工作状况多选题的一维频数分布表)。,按照百分比排名顺序

29、显示更好些,2023/10/1,用COUNTIF函数求不限选多选题的一维频数分布表,例1-17 用Excel实现工作状况多选题的一维频数分析(工作状况条形图)。,按照百分比排名顺序显示更好些,2023/10/1,2.2 定量数据的描述性统计量,一、利用SPSS计算描述性统计量二、利用SPSS实现多组均值比较三、利用Excel计算描述性统计量四、利用Excel求量表均值并排名,2023/10/1,描述性统计量,问卷回收后,对于数值型数据(定量数据),通常会以均值、中位数等统计量来描述其集中趋势,也会以标准差、最小值、最大值、极差等统计量来描述其离散程度。最常用的描述统计量是均值和标准差。,202

30、3/10/1,集中趋势:均值,描述数据集中趋势的统计量主要有均值、中位数等。均值(mean):样本值的算术平均值。均值是度量数据集中趋势的常用统计量。在参数估计及假设检验中经常用到。设一组样本数据为,样本量(样本数据的个数)为n,则样本均值用(读作-bar)表示,计算公式为:,2023/10/1,集中趋势:中位数,中位数(median):一组数据排序后处于中间位置上的数。中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。中位数是用中间位置上的数值代表数据的集中趋势,其特点是不易受极端值的影响,所以称中位数比均值稳健(robust)。,2023/1

31、0/1,差异的度量:离散程度,论语有一句话:“不患寡,而患不均”。这是指不怕财富少,而怕分配不公平,使得贫富差距太大。贫富多寡是由集中趋势统计量来描述的,而是否“均”是由离散程度(描述数据散布,即描述集中与分散程度的度量)统计量来描述的。一般来说,数据越分散,离散程度统计量的值越大。,2023/10/1,离散程度:标准差和方差,标准差(standard deviation):样本中各个数值到均值的距离的一种平均。标准差实际上是方差的平方根。方差(variance):各点到均值距离平方的平均。方差由于和数据的量纲不同,因而在实际应用中使用得不如标准差那么普遍。,2023/10/1,数据的标准得分

32、(standard score),两个类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。一班分数的均值和标准差分别为78.53和9.43,而二班的均值和标准差分别为70.19和7.00。那么得到90分的一班的张颖是不是比得到82分的二班的刘小平成绩更好呢?,2023/10/1,数据的标准得分(standard score),怎么比较才能合理呢?虽然这种均值和标准差不同的数据不能够直接比较,但是可以把它们进行标准化,然后再比较标准化后的数据。一个标准化的方法是把原始观测值(亦称得分,score)和均值之差除以标准差;得到的度量称为标准得

33、分(standard score):(x-m)/s(这里m和s为均值和标准差),2023/10/1,数据的标准得分(standard score),在SPSS中求标准得分:如果需要分组(这里按班级分组),则先用菜单Data-Split File,将数据文件按各班分割开;用菜单AnalyzeDescriptive StatisticsDescriptives的“Save standardized values as variables”选项;结果见数据文件中以“z-”为开头的变量。,2023/10/1,一、利用SPSS计算描述性统计量,例2-1 护士工作满意度调查分析。为了了解护士们对工作的满意

34、程度,做了一个调查。包含了100名护士对工作、工资和升职机会的满意程度。这三个方面的评分都是从0到100,分值越大表明满意程度越高。另外,调查数据还根据该护士所在的医院类型,分为3类:私人医院、公立医院和学院医院。(1)根据整个数据和三个方面的满意程度,判断哪一方面是护士们最为满意的?哪一方面是最不满意的?(2)根据离散程度(标准差、最小值、最大值、极差)的描述,判断护士们对哪一方面的满意程度差别最大?(3)从医院类型的数据中可以了解到什么?是否有某一类型的医院在三个方面的满意程度上优于其他医院?,2023/10/1,利用SPSS计算描述性统计量,例2-2 用SPSS实现例2-1中的问题(1)

35、和(2)菜单:AnalyzeDescriptive StatisticsDescriptives 定量变量(数值型数据):工作、工资、升职机会表21 护士们在三个方面的满意度情况,2023/10/1,利用SPSS计算描述性统计量,例2-2 用SPSS实现例7-1中的问题(1)和(2)可利用表72中的均值作柱形图,2023/10/1,SPSS软件进行描述统计分析的步骤,SPSS【Analyze】【Descriptive statistics】【Descriptives】【variables】(选入变量)【Options】(选择需要的描述统计量)【Continue】【OK】(注:使用【Analyz

36、e】【Descriptive statistics】【Explore】(或【Frequencies】)【Statistics】,选择相应的统计量亦可),2023/10/1,二、利用SPSS实现多组均值比较,例2-3 用SPSS实现例2-1中的问题(3)菜单:Analyze-Compare Means-Means分析变量(数值型数据):工作、工资、升职机会分组变量(分类数据):医院类型 表22 不同医院类型的护士们在工作、工资和升职机会的满意度情况,2023/10/1,利用SPSS实现多组均值比较,用SPSS实现例2-1中的问题(3)可利用表75中的均值作柱形图,2023/10/1,三、利用Ex

37、cel求描述性统计量,例2-4 有19691971年美国一家银行的474名雇员数据。对这474名银行雇员数据,可以进行各种统计分析。(1)这家银行男女雇员各多少人?所占的比例是多少?(2)这家银行当前最高年薪、最低年薪、平均年薪各是多少?每年应付给员工多少薪资?这家银行雇员的平均年薪是否高于当时全美的平均年薪3万美元?(3)不同岗位的男女雇员人数各是多少?岗位和性别之间是否相关?(4)不同性别雇员的平均年薪各是多少?是否男性雇员的平均年薪比女性雇员的高?(5)不同岗位雇员的平均年薪各是多少?是否存在显著差异?(6)建立一个以受雇起薪、以前工作经验、工作时间、受教育年限等为自变量,当前年薪为因变

38、量的线性回归模型,2023/10/1,利用Excel求描述性统计量,利用Excel描述统计分析工具求“这家银行当前最高年薪、最低年薪、平均年薪各是多少?每年应付给员工多少薪资?”菜单:“工具”-“数据分析”,选择“描述统计”表2-3 银行雇员的当前年薪情况,2023/10/1,在Excel中将分类数据转化为组中值,问卷上很多有关收入、年龄、消费等数值,会因为牵涉个人隐私或为了方便受访者填写,并不会要求受访者直接填写其数值,而采用勾选某一区间的形式。但在问卷回收后,统计分析人员有时希望计算出平均值。,2023/10/1,在Excel中将分类数据转化为组中值,例2-5 求收入的平均值。请问您整个家

39、庭月收入状况:1、5千元以下2、5千至1万元3、1万至1.5万元4、1.5万至2万元5、2万元以上组中值的算法为请问您整个家庭月收入状况:1、2500元2、7500元3、12500元4、17500元5、22500元,注意:对于只有上限值或只有下限值的类别,其组中值可根据实际情况给定。,2023/10/1,在Excel中将分类数据转化为组中值,例2-5 求收入的平均值。请问您整个家庭月收入状况:1、5千元以下2、5千至1万元3、1万至1.5万元4、1.5万至2万元5、2万元以上用IF函数转化:=IF(B2=1,2500,IF(B2=2,7500,IF(B2=3,12500,IF(B2=4,175

40、00,IF(B2=5,22500,)请问您整个家庭月收入状况:1、2500元2、7500元3、12500元4、17500元5、22500元,2023/10/1,四、利用Excel求量表均值并排名,例2-6“数码相机注重属性”调查问卷处理。Q23请在下列选购数码相机时的注重属性中勾选重要程度,注意:量表答案的排列顺序和强度结构,中性类别最好在中间(P33),2023/10/1,利用Excel求量表均值并排名,例2-6“数码相机注重属性”调查问卷处理。在问卷回收后,出题者也是逐项地分别对其计算出平均值,然后再按其平均值的高低排出顺序,来判断哪几个属性较为让受访者看重。这里介绍3种求各属性(量表)均

41、值的方法。方法1:利用AVERAGE函数求量表均值;方法2:利用描述统计分析工具求量表均值;方法3:利用数据透视表求量表均值。,2023/10/1,利用Excel求量表均值并排名,表2-4 数码相机的注重属性排名结果,按照排名顺序显示更好些,2023/10/1,利用Excel求量表均值并排名,例2-7 分析男女受访者对“数码相机注重属性”排名情况是否相同。(推荐“利用数据透视表”)表2-5 男性、女性以及全体受访者对数码相机注重属性的排名结果,按照某一类型(男)排名顺序显示更好些,2023/10/1,2.3 数据的图表展示,一、Excel制作图表二、SPSS绘制统计图形,2023/10/1,一

42、、Excel制作图表,Excel的图表功能并不逊色于一些专业的图表软件,它不但可以创建条形图、折线图、饼图这样的标准图形,还可以生成较复杂的三维立体图表。Excel提供了许多工具,用户运用它们可以修饰、美化图表,如设置图表标题,修改图表背景色,加入自定义符号,设置字体、字型等 利用Excel的图表向导可以快捷了建立各种类型的图表。,2023/10/1,认识Excel图表,1、图表组成,2023/10/1,认识Excel图表,1、图表术语数据点数据系列 网格线 轴 刻度线与刻度线标志 误差线 图例 图表中的标题,2023/10/1,图表类型,1、嵌入式图表和图表工作表 嵌入式图表是把图表直接插入

43、到数据所在的工作表中,主要用于说明数据与工作表的关系,用图表来说明和解释工作表中的数据.,2023/10/1,图表类型,图表工作表图表与源数据表分开存放,图表放在一个独立的工作表中,图表中的数据存在于另一个独立的工作表中,2023/10/1,图表类型,2、Excel的图表类型Excel2007的标准类型提供包括直线图、面积图、折线图、柱形图等图形种类,大约10多种类型。每种图表类型中又包括多种二维的平面图形和三维的立体图形,2023/10/1,图表类型,2、Excel标准图表类型 面积图 面积图用于显示不同数据系列之间的对比关系,同时也显示各数据系列与整体的比例关系,尤其强调随时间的变化幅度,

44、2023/10/1,图表类型,柱形图柱形图用于表示不同项目之间的比较结果,也可以说明一段时间内的数据变化。,2023/10/1,图表类型,条形图条形图显示了各个项目之间的比较情况,纵轴表示分类,横轴表示值。它主要强调各个值之间的比较,并不太关心时间,2023/10/1,图表类型,折线图 折线图常用于描绘连续数据系列,对于确定数据的发展趋势比较有用。线性图表示数据随时间而产生的变化情况。线性图的分类轴常常是时间,如年、季度、月份、日期等,2023/10/1,图表类型,饼图和圆环图 饼图和圆环图都常用于表示总体与部分比例关系,以直观的图形方式表示出各部分与总体的百分比。饼图只能表示一个数据系列,而

45、圆环图可以包含多个数据系列。,2023/10/1,图表类型,X-Y散点图 X-Y散点图主要用来比较在不均匀时间或测量间隔上的数据变化趋势(如果间隔均匀,应该使用折线图)。,2023/10/1,图表类型,气泡图 气泡图实质上是一种XY散点图。数据标记的大小反映了第三个变量的大小。气泡图的数据应包括三行或三列,将X值放在一行或一列中,并在相邻的行或列中输入对应的Y值,第三行或列数据就表示气泡大小。,2023/10/1,图表的建立,1、图表建立案例【例3.1】某录像带租借店经营以下几种类型的录像带:武打片、爱情片、恐怖片、枪战片、喜剧片,现要统计各类录像带的利润,并以饼图来表示各类录像带的利润比例

46、第一步骤:建立数据表,2023/10/1,图表的建立,步骤二:选择图表类型选择“插入”选项卡,步骤三:在图表组中找到需要的图表,单击它可显示出该类图表中的所有类型,步骤四:如果在图表组中没历找到需要的图表类型,单击“其它类型”可显示出所有图表类型,单击图表组中“其它类型”显示出的图表对话框,2023/10/1,图表的建立,最终建立的饼图,2023/10/1,图表设计,Excel 2007图表功能的改进Excel 2007在图表方面比以前的版本有了较大的改进,简化了图表向导的过程。并为图表提供的“设计”和“布局”功能选项卡,可以轻松完成图表的各种修改,设计出布局合理,内容恰当的高质量图表。能够方

47、便地进行标题,数据系列,图例显示位置,图表中的文字大小等内容进行修改。,2023/10/1,图表布局,应用Excel预定义的图表布局和图表样式设置图表,能够很轻松地创建具有专业外观的图表。应用预定义的图表布局时,会有一组特定的图表元素,如标题(图表标题是说明性的文本,可以自动与坐标轴对齐或在图表顶部居中)、图例、数据表或数据标签(为数据标记提供附加信息的标签,数据标签代表源于数据表单元格的单个数据点或值)按特定的排列顺序在图表中显示,可以从为每种图表类型提供的各种布局中进行选择。,2023/10/1,单击图表,显示出图表工具,单击布局选项卡,“布局”工具,可以设置图表标题,添加数据标签,设置或

48、修改坐标轴,添加图表背景图等,操作非常方便,2023/10/1,图表布局,【例3.2】例3.1建立的图表,没有标题,也没有在饼图中显示出各部分所占的百分比,现在通过图表布局为该图添加标题和数据系列标志。,2023/10/1,图表标题和图表式样,1、图表标题在默认情况下插入的图表没有标题,按指定的图表布局式样设置图表可以给图表添加标题。但有的图表布局式样并没有标题,图6.7中的第四个饼图就是这种情况。在这种情况下,可以通过“图表工具”|“布局”选项卡“标签”组中的“标题”按钮为图表设置标题。2、图表式样Excel 2007为各种类型的图表都提供了许多图表样式,应用这些图表样式可以很快设计出精美的

49、图表来。Excel提供的图表样式中有二维样式,也有三维图形的样式,从黑白到各种彩色图表样式应用尽有。,2023/10/1,图表标题和图表式样,饼图的“图表式样”,激活设计的饼图后,用鼠标指向饼图式样中的某个图形,就会立即看出图表实施该式样后的效果,发现满意的式样后,单击鼠标就可以应用该式样到图表上。,2023/10/1,修改图表类型,对于大多数二维图表(包括嵌入式图表和图表工作表),可以更改整个图表的图表类型以赋予其完全不同的外观,也可以为任何单个数据系列选择另一种图表类型,使图表转换为组合图表。对于气泡图和大多数三维图表,只能更改整个图表的图表类型。【例3.3】下图中的第一个图表是某班期末考

50、试的学生成绩柱形图。由于成绩数据较多,该图显得非常零乱(有太多的“柱子”)。现对该图进行修改,用柱形堆积图来表示各位同学的成绩,如图中的第二个图表所示。,2023/10/1,单击”更改图表类型”,弹出图表对话框,从中选择需要的图表类型,单击图表,显示出”图表工具”,2023/10/1,数据系列操作,1、添加数据系列 在Excel中可以添加图表的数据系列。如果是嵌入式图表,可先在工作表中选定要添加的数据,然后直接将数据拖到嵌入式图表中;如果正在使用图表工作表,可以使用“图表”菜单中的“添加数据”菜单项。,2023/10/1,数据系列操作,案例【例3.4】某酒厂生产的酒主要销售在四川、重庆、山东等

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号