资料分析简单分析.ppt

上传人:牧羊曲112 文档编号:6610440 上传时间:2023-11-17 格式:PPT 页数:89 大小:2.17MB
返回 下载 相关 举报
资料分析简单分析.ppt_第1页
第1页 / 共89页
资料分析简单分析.ppt_第2页
第2页 / 共89页
资料分析简单分析.ppt_第3页
第3页 / 共89页
资料分析简单分析.ppt_第4页
第4页 / 共89页
资料分析简单分析.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《资料分析简单分析.ppt》由会员分享,可在线阅读,更多相关《资料分析简单分析.ppt(89页珍藏版)》请在三一办公上搜索。

1、资料整理资料简单分析比较分析,第6章 资料分析(一),一、资料验收与确认1、资料验收过程中应检查的主要问题被调查资格;资料是否完整清楚;资料是否真实可信;关键问题是否回答;资料是否存在明显的错误与遗漏;有效资料的份数是否达到设计要求。,第一节 资料整理 P358,2、处理方法:接受基本正确的资料;问题较多资料作废;问题较少的资料进行补查。,第一节 资料整理,1、资料编辑过程中应解决的主要问题 错误回答;没有回答;不一致回答;答非所问;不确切不充分回答。2、处理方法此回答作废(回答不正确);用统一标记记录遗漏问题;此问题作废(大部分被调查者回答不正确或遗漏)。,第一节 资料整理,二、资料编辑发现

2、具体问题,资料编码就是用规定数字或字符代表一类或一个问题或答案;资料分类是将资料总体按照一定标志区分为若干组成部分,把总体中具有不同性质的单位分开,把性质相同的单位合在一起,起到划分现象类型、揭示现象内部结构、分析现象之间的依存关系的作用,为进一步运用统计方法分析资料做准备。,三、资料编码与分类,第一节 资料整理,第一节 资料整理,四、资料转换:将资料输入存储计算机,第一节 资料整理,一、单变量分析(一)单变量集中趋势1、众数:总体中各单位在某一标志上出现次数最多的变量值2、中位数:总体中各单位在某一标志上按照大小顺序排列,居于中间位置的变量值,其位置(N+1)/2,N为奇数取中间一个,N为偶

3、数取中间两个。3、平均数:简单算术平均数、加权算术平均数、调和平均数、几何平均数,第二节 资料简单分析,(二)单变量离中趋势1、全距:总体中最大标志值与最小标志值之差。2、平均离差与平均离差系数,比较两个总体的变异程度,如果平均指标水平不同或计量单位不同。不能用平均离差,第二节 资料简单分析,定义:四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意

4、味着中间部分的数据越分散。,第二节 资料简单分析,3、四分位数,4、标准差与标准差系数,第二节 资料简单分析,(三)单变量频数与频率分析频数就是一个变量在各个变量(组)值上取值的个案数,频数占总体单位个数的比就是频率。当前以上频数的合计就是累积频数,当前以上频率的合计就是累积频率。,第二节 资料简单分析,峰度:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为,第二节 资料简单分析,(四)峰度与偏度,

5、第二节 资料简单分析,偏度:偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。,二、多变量分析,(一)多变量统计量分析:根据某一变量进行分组,计算另一变量统计量的分析,第二节 资料简单分析,(二)多变量交叉列联表分析,4个数字分别是:频数、此频数占行总数百分比、占列总数百分比,占总数百分比,第二节 资料简单分析,(三)多

6、变量卡方检验,第二节 资料简单分析,交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。,但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此需要根据变量的性质,选择其他的相关系数,如Kendall等级相关系数、Eta值等。,三、多选项分析,定义:多选项分析是对多选项问题的分析方法。所谓多选项问题,就是一个问题的答案都是顺序变量或名义变量,并且允许选择的答案可以有多种组合。对于多选项问题,分解(编码方案)的方法有两种。,第二节 资料简单分析,1多选项二分法(Multiple Dichotomies Method

7、),这种方法将每个可能的答案设置为一个SPSS变量,变量的取值有两个,分别表示选中或没选中。这种方法的缺点是需要的变量数比较多。比如一道题目有6个选项,则一道多选题目就需要用6个变量来表示。好处是比较简单。,第二节 资料简单分析,2多选项分类法(Multiple Category Method),多选项分类法首先估计多选项问题可能出现的答案个数。比如一个多选题,如果最多有3个答案,那么就设置3个SPSS变量,分别用来存放3个可能的答案。如果某个案的答案只有两个,那么第3个SPSS变量取值为缺失值。,研究问题1 某商场对6种品牌的电视机进行消费者满意度调查,随机调查了20位消费者,让他们选出最满

8、意的3个电视机品牌,收集到相应的数据,如下表所示。试用多选项二分法利用SPSS对该问题进行分析,包括频数分析和交叉列联表分析。,第二节 资料简单分析,20名消费者调查情况,实现步骤,第二节 资料简单分析,Multiple Response Crosstabs,第二节 资料简单分析,研究问题2 上面实现过程是采用多选项二分法,本例采用多选项分类法对该问题进行分析。在本次调查中,每个被调查人最多选择3个品牌,因此有3个变量,用来保存每个被调查人的选择,数据表格如3-12所示。,第二节 资料简单分析,20名消费者调查情况,实现步骤,第二节 资料简单分析,第二节 资料简单分析,第二节 资料简单分析,第

9、三节 均值比较分析,在正态或近似正态分布的计量资料中,经常在使用前一章统计描述过程分析后,还要进行组与组之间平均水平的比较。本章介绍的T检验方法,主要应用在两个样本间比较。如果需要比较两组以上样本均数的差别,这时就不能使用上述的T检验方法作两两间的比较。对于两组以上的均数比较,可以使用方差分析方法。,第三节 均值比较分析,一、Means过程,定义:Means过程是SPSS计算各种基本描述统计量的过程。Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。,第三节 均值比较分析,用户可以指定一个或多个变量作为分组变量。如果分组变量为多个,还应指定

10、这些分组变量之间的层次关系。层次关系可以是同层次的或多层次的。同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按第一分组变量分组,然后对各个分组下的个案按照第二组分组变量进行分组。,第三节 均值比较分析,研究问题 比较不同性别同学的数学成绩平均值和方差。数据如下表所示。,第三节 均值比较分析,实现步骤,第三节 均值比较分析,结果,第三节 均值比较分析,二、单一样本T检验,定义:SPSS单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。,第三节 均值比较分

11、析,研究问题 分析某班级学生的高考数学成绩和全国的平均成绩70之间是否存在显著性差异。数据如表4-1所示。,第三节 均值比较分析,实现步骤,结果和讨论,第三节 均值比较分析,三、两独立样本T检验,定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下。,第三节 均值比较分析,两个样本应是互相独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。样本来自的两个总体应该服从正态分布。,1判断两个总体的方差是否相同,SPSS采用L

12、evene F方法检验两总体方差是否相同。,第三节 均值比较分析,2根据第一步的结果,决定T统计量和自由度计算公式,研究问题 分析A、B两所高校大一学生的高考数学成绩之间是否存在显著性差异。,第三节 均值比较分析,结果和讨论,第三节 均值比较分析,四、两配对样本T检验,定义:两配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。,第三节 均值比较分析,两配对样本T检验的前提要求如下。两个样本应是

13、配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。样本来自的两个总体应服从正态分布。,第三节 均值比较分析,研究问题 研究一个班同学在参加了暑期数学、化学培训班后,学习成绩是否有显著变化。数据如表4-3所示。,第三节 均值比较分析,培训前后的成绩变化,实现步骤,第三节 均值比较分析,结果和讨论,第四节 方差分析,一、方差分析基本概念,方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。方差分析方法在不同领域的各个分析研究中都得到了广泛的应用。从方差入手的研究

14、方法有助于找到事物的内在规律性。,第四节 方差分析,受不同因素的影响,研究所得的数据会不同。造成结果差异的原因可分成两类:一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为随机变量;另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。,第四节 方差分析,在影响教学效果的因素中,就有两类因素:一是人为可控制的变量,如教学的方法、教材的使用;还有一类是随机的变量,如学生接受知识的能力(这里指的是一个普通班级的学生接受知识能力,因此是随机的。在某些情况下,比如将学生按学习水平、能力分成高、中、低几个班级,在这时,学生接受知识的能力是一个控制变量。因此,随机变量和控制变量的划分

15、并不是绝对的,根据分析情况的不同而不同,应区别对待)。,第四节 方差分析,可以对两个普通的班级分别使用两种不同的教学方法,一段时间后进行测试,就可以得到不同教学方法对教学效果的影响。同样,也可以使用不同的教材,分析其对教学效果的影响。,第四节 方差分析,方差分析就是实现上述功能的分析方法。方差分析的基本思想是:通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有显著的变化;如果控制变量的不同水平对结果没有显著的影响,那么结

16、果的变化主要由随机变量起作用,和控制变量关系不大。,第四节 方差分析,根据控制变量的个数,可以将方差分析分成单因素方差分析和多因素方差分析。单因素方差分析的控制变量只有一个(但一个控制变量可以有多个观察水平),多因素方差分析的控制变量有多个。,第四节 方差分析,二、单因素方差分析,定义:单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。例如,培训是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。,第四节 方差分析,单因素方差分析实质上采用了统计推断的方法,由于方差分析有一个比较严格的前提条件,即不同水平下,各总体均值服从方差相同的正态分布,因此方差

17、分析问题就转换成研究不同水平下各个总体的均值是否有显著差异的问题。,研究问题,三组学生的数学成绩,实现步骤,结果和讨论,(1)首先是单因素方差分析的前提检验结果,也就是Homogeneity of variance test,(2)输出的结果文件中第2个表格如下所示。,(3)输出的结果文件中第3个表格如下所示。,三、多因素方差分析,定义:多因素方差分析中的控制变量在两个或两个以上,它的研究目的是要分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响。例如,在本节开始讲述的例子,在获得教学效果的时候,不仅单纯考虑教学方法,还要考虑不同风格教材的影响,因此这是两个

18、控制变量交互作用的效果检验。,第四节 方差分析,多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。因此,它需要将观察变量总的离差平方和分解为3个部分:,第四节 方差分析,多个控制变量单独作用引起的平方和;多个控制变量交互作用引起的离差平方和;其他随机因素引起的离差平方和。,研究问题,三组性别不同学生的数学成绩,实现步骤,结果和讨论,(1)SPSS输出结果文件中的第一部分如下两表所示。,(2)输出的结果文件中第二部分如下表所示。,(3)输出的结果文件中第五部分如下表所示。,四、协方差分析,定义:协方差分析是将

19、那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。,第四节 方差分析,协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间也没有交互影响。,研究问题,三组学生的数学成绩,实现步骤,结果和讨论,小 结,方差分析用于两个及两个以上样本均值差异的显著性检验。方差分析的基本思想是:通过分析研究中不同变量的变异对总变异的贡献大小,确定控制变量对研究变量影响力的大小。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平能够对结果产生显著影响,那么它和随机变量共同作用,必将使结果有显著变化。,单因素方差分析所解决的是一个因素下的多个不同水平之间的相关问题;多因素方差分析的控制变量在两个或两个以上,其主要用于分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响;协方差分析将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更准确地对控制因素进行评价。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号