《SPSS复习知识点及题目.docx》由会员分享,可在线阅读,更多相关《SPSS复习知识点及题目.docx(8页珍藏版)》请在三一办公上搜索。
1、SPSS复习知识点及题目教育统计与测量复习 第一章:概述 1什么是信息? 简单地讲,通过信息,可以告诉我们某件事情,可以使我们增加一定的知识。英语中的信息是“information”,表示信息可以让受者产生某种形式的变化,这种变化可以让受者从认识上的不完全、不理解、不确定变为完全、理解和确定。 信息论的奠基者香农将信息定义为熵的减少,即信息可以消除人们对事物认识的不确定性,并将消除不确定程度的多少作为信息量的量度。 信息的价值因人而异。 所谓有用的信息,因人而异。是否是信息,不是由传者,而是由受者所决定。 2教育信息数量化的特点 表示教育信息的数量与各种物理测量的数量有着明显的不同,在教育信息
2、的统计处理中,应根据教育信息数量化的方法、特点不同,决定对这种信息进行统计处理的具体方法。这是进行教育信息处理的重要关键。 3教育信息数量化的尺度 名义尺度(nominal scale) :名义尺度的数值仅具符号的意义。名义尺度的数字多用于表示不同的数别,它为教育信息的表示,存贮带来了很大的方便。 序数尺度(ordinal scale) :序数尺度的数字多用于表示某些现象的排列顺序,可比较其大小,但不能进行四则运算,所以对这类数字的数值群的处理较多。 距离尺度(interval scale,equal unit scale):距离尺度又称间隔尺度,是指数值间的距离,具有加法性。距离尺度要求具有
3、等价的单位,但不要求确定的零点位置。对距离尺度的数字可以计算算术平均值、计算标准差,求相关系数等各种统计处理。 比例尺度(ratio scale) :比例尺度是一种具有绝对零度的距离尺度值。表示身长、体重的数值是比例尺度值。对比例尺度的数字可进行各种统计处理。 n 4数据的类型 定类数据,是数据的最低级。 定序数据,是数据的中间级。 定距数据,是具有一定单位的实际测量值。 定比数据,是数据的最高等级。 5描述统计 对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。其目的在于将大量零散的、杂乱无序的数字资料进行整理、归纳、减缩、概括,使事物的全貌及其分布特征清晰、明确地显现出
4、来。 例如描述学业考试中全校或班级的考试状况、描述学生的升学率、及格率或优秀率等。 6推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。其目的在于根据已知的情况,在一定概率意义上估计、推断未知的情况。 例如随机抽取某校若干名学生的考试成绩,推断该校学生成绩与全市该类学生考试成绩的差异性。 7教育统计中几个基本概念 随机现象与随机变量 随机现象是一种不确定性现象。如考试、心理测验等。存在随机误差。我们把具有变化规律的表示随机现象各种结果的变量称为随机变量。如学生的身高、体重、性别、智商、成绩等等。随机变量具有离散
5、性、变异性与规律性等特点。 总体和个体 总体:所研究对象的全体称为总体。 个体:组成总体的元素称为个体。在一个总体中,若个体的数目是有限的,则该总体称为有限总体;若个体的数目是无限的,则该总体称为无限总体。 样本:样本是从总体中抽取的作为观察对象的一部分个体。 样本中包含的个体数目称为样本的容量,一般用n表示。样本中个体数目大于30一般称为大样本,等于或小于30称为小样本。 样本上的数字特征是统计量。也就是说,根据实得的数据所计算出的能够描述这组数据各种特征的数量是统计量。 总体上的各种数字特征是参数。也即反映总体上各种特征的数量参数。在进行统计推断时,就是根据样本统计量来推断总体相应的参数。
6、 8常用统计量 集中量数:代表一组数据典型水平或集中趋势的量。常用的集中量有算术平均数、中位数/2的那个数为中位数。2数据个数是偶数的情况。则取序列为第N/2与第+1个这两个数据的均数为中位数)、众数等。 差异量数:代表一组数据离散程度、变异程度的量。常用的差异量指标有全距(一组数中最大值与最小值之差)、四分位距、百分位距、平均差、方差、标准差、差异系数等。 区别:集中量数是指量尺上的一个点,差异量数是量尺上的一段距离 9.相关系数 相关系数:用于描述两个或多个变量间关联程度的量。两变量之间相关密切程度的数字指标-1,1。 方向: 正相关;负相关 ;零相关 0 相关程度: 完全正相关 1;完全
7、负相关 -1;零相关 10教育统计的常见问题类型及统计方法 对采集数据的一般性统计,如频数、频率、均值、方差等; 两个总体之间某类特征数据的差异显著性; 多个总体之间某类特征数据的差异显著性; 一个或多个因素对结果影响的显著性; 两个特征变量数据的相关性大小; 某变量是否服从特定分布; 如何将多个研究对象进行分类; 如何将多个指标描述的对象简化成少量指标描述; 如何将多个不同量纲指标描述的研究对象进行综合排序。 11T检验与方差分析有哪些相同于不同的地方? 相同:都是对组间的差异性进行检验。前提都是:正态性,方差齐次性,独立性 不同:T检验用于比较两组数据之间的差异,T检验属于均值分析,它是用
8、来检验两类母体均值是否相等。均值分析是来考察不同样本之间是否存在差异,而方差分析用于比较多组数据之间的差异,评估不同样本之间的差异是否由某个因素起主要作用。T检验假设:H0: 0=1 H1: 01;方差分析假设:假设:H0: 0=1=H1: 0,1,不全相等。 12SPSS主界面有两个:一个是数据编辑窗口,另一个是SPSS输出窗口。 13变量:变量名是变量的名称,由用户自己来命名,对每一个数据项确立一个变量名;变量类型有数值型、日期型、字符串型等8种类型;变量长度是指设置变量的长度,但当变量为日期型时无效;变量标签是对变量名的进一步描述,变量名不能超过8个字符,但变量标签可以长达120个字符,
9、且可以显示大小写,需要时可以用变量标签对变量名的含义加以解释;变量值标签是对变量的每一个可能取值的进一步描述,当变量是定类或定序变量时非常有用,比如对于文化程度为高中、专科、本科可以用1、2、3来分别代表这3个层次;缺失值用于缺失值的定义,缺失值有系统缺失值和用户缺失值两类;显示宽度表示输入变量的显示宽度,默认为8;对齐方式包括左对齐、中间对齐和右对齐;变量的测试尺度按测量精度可分为定类变量、定序变量和定距变量。 第二章:相关分析 1积差相关分析 当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量间的相关称为积差相关,积差相关又称积矩相关,也称皮尔逊相关。如都呈正态分布的且以
10、百分制表示的语文与数学成绩之间的相关关系可用积差相关来表示它们的变化关系。 2等级相关分析 等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。 n 斯皮尔曼等级相关 当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为等级相关。 根据某种标准对某项成绩所评定的等级,或按某种指标的优劣程度所排列的名次等,均属于等级次序性分数。 n 肯德尔和谐系数 当多个变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度的量,称为肯德尔和谐系数。它常
11、用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。 3二列相关分析 质与量的相关是指一个变量为质,另一个变量为量,这两个变量之间的相关。如智商、学科分数、身高、体重是表现为量的变量,男与女、优与劣、及格与不及格等是表现为质的变量。质与量的相关主要包括二列相关、点二列相关、多系列相关。 n 二列相关 当两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量。如及格与不及格、好与差、通过与没通过等。样本n80。 第三章:参数估计与假设检验 P109116 显著性水平,是指估计总体参数落在某一区间时,可能犯错误的
12、概率。 一般取0.05或0.01。0.95的置信区间是指总体参数落在该区间之内,估计正确的概率为95%,而出现错误的概率为5%。在假设检验中, 还指拒绝虚无假设时可能出现的犯错误的概率水平。%时出现说明连这么小的概率都出现,这个问题是存在的。 第四章:方差分析 1方差分析的三条假设 n 总体分布的正态性。方差分析与Z检验和T检验一样,也要求样本必须来自正态分布的总体。 n 各个实验组的方差齐性。方差分析要求各总体的方差或标准差相同。因此,方差分析前需对各样本的方差做一致性检验,称方差齐性检验,只有满足了方差齐性的条件才可做方差分析。 n 变异具有加可性。方差分析是将事物的总变异分解为各个不同变
13、异来源,分解后的各部分变异是相互独立,相加后又构成总变异。 2如何方差分析的表 第五章:项目分析 1项目分析的目的:求出问卷个别题项的临界比率值CR值,了解题目的分辨度,将未达显著水准的题项删除。 2项目分析的基本步骤: 量表题项的反向计分。 求出量表的总分。 量表总分高低排列。 找出高低分组上下27%处的分数。 依临界分数将观察值在量表中之得分分成高低二组。 以独立样本T检验二组在每个题项的差异。(高分组与低分组) 将T检验结果未达显著性的题项删除。 第六章:因素分析 1因素分析的目的 n 通过寻找或确定几个较少的“假想”因子来反映多个观测变量中蕴含的大部分信息,从而浓缩或化简观测数据。 n
14、 浓缩后的因子代表了数据间的基本结构,通过得到的因子估计值使研究者更方便地掌握数据的本质特质以及因子和观测变量之间的关系。 2用什么方法进行因素分析 1.计算变量间相关矩阵或共变量矩阵。 2.估计因素负荷量。 3.决定转轴方法。 4.决定因素与命名。 1.分析/降维/因子分析 2.将项目分析中鉴别度达显著性的题项选人右边“变量”下的空框中。 3.单击描述,因子分析:描述统计”窗口中勾选“原始分析结果”和“KMO和Bartlett的球形度检验” 4.单击抽取,在“因子分析:抽取”窗口中设置 5单击旋转,在“因子分析:旋转口中设置 6.单击得分,在“因子分析:因子得分”窗口中设置 7.单击选项,在“因子分析:选项”窗口中选择取消小系数等。 第八章:卡方检验 1数据要加权个案 2结果分析