spss复习整理.docx

上传人:小飞机 文档编号:3166036 上传时间:2023-03-11 格式:DOCX 页数:19 大小:44.47KB
返回 下载 相关 举报
spss复习整理.docx_第1页
第1页 / 共19页
spss复习整理.docx_第2页
第2页 / 共19页
spss复习整理.docx_第3页
第3页 / 共19页
spss复习整理.docx_第4页
第4页 / 共19页
spss复习整理.docx_第5页
第5页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《spss复习整理.docx》由会员分享,可在线阅读,更多相关《spss复习整理.docx(19页珍藏版)》请在三一办公上搜索。

1、spss复习整理一、单项选择题:(本大题 小题,1分/每小题,共 分) 1.SPSS的数据文件后缀名是: (A).sav 2.对数据的各种统计处理,SPSS是在下面哪一个选项中进行: (A)数据编辑窗口; 3.在SPSS中,下面哪一个不是SPSS的运行方式 (A)输入运行方式; 4.下面哪一个选项不属于SPSS的数据分析步骤: (D)数据扩展; 5.在SPSS中,下面哪一个选项不属于对变量(列)的描述: (B)变量名称大小; 6.在SPSS的定义中,下面哪一个变量名的定义是错误的: (D)A_BFG_;首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的

2、最后一个字符。SPSS允许用汉字作为变量名。 7.在SPSS的定义中,下面哪一个变量名的定义是错误的: (A)AND; SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY 、 AND 、 NOT 、 OR等。 8.在SPSS数据文件中,下面那一项不属于数据的结构: (D)数据值; 9.在SPSS数据文件中,下面那一项属于数据的内容: (D)数据值; 10. 通常来说,发放了900份问卷,可直接得到的有效问卷有800份,则SPSS所建立的相关数据文件中的行数为 (D)800

3、; 11.下面那一项不属于SPSS的基本变量类型: (D)整数型; 12.当在SPSS数据文件中输入变量为“职工姓名”,则应选择的变量类型是: (B)字符串型; 13.当在SPSS数据文件中输入变量为“职工工资数”,则应选择的变量类型是: (A)数值型; 13.当在SPSS数据文件中输入变量为“公司成立日期”,则应选择的变量类型是: (C)日期型; 14在SPSS的数据结构中,下面那一项不是“缺失数据”的定义: (D)数据不是科学计数法; 15.统计学依据变量的计量尺度将变量分为三类,以下哪一类不属于这三类: (D)科学计数类型; 16.在统计学中,变量“身高”属于计量尺度中的: (A)数值型

4、变量; 身高、优良中差、性别 17.在统计学中,将变量“年龄”分为“老年”、“中年”、“青年”三个取值,分别用1、2、3表示,则变量“年龄”属于计量尺度中的: (B)定序型变量; 18.在统计学中,将变量“性别”分为“男”、“女”、两个取值,分别用1、2表示,则变量“性别”属于计量尺度中的: (C)定类型变量; 19.下面哪一个选项不能被SPSS系统正常打开: (C)文本文件格式; 20. 下面哪一个选项不能被SPSS系统正常打开: (D).exe; 21.在SPSS数据编辑窗口中,需要定义变量的数据结构,以下哪一项不属于变量的数据结构: (D)变量值; 22. 在SPSS数据结构中,下面哪一

5、项不属于数据类型: (D)数值标签型; 23.下面哪一个选项不是SPSS中定义的基本描述统计量: (D)回归函数; 24.下面哪一个选项不是SPSS中定义的基本描述统计量: D)因子; 25.下面那一项刻画了随机变量分布形态的对称性: (D)偏度系数; 26.下面那一项刻画了随机变量分布形态陡缓程度: (D)峰度系数; 27.对于SPSS来说,下面那一项不包括在变量的频数分布内容中: (D)均值; 27.对于SPSS来说,下面那一项不包括在变量的频数分布内容中: (C)标准差; 28.在SPSS中,下面那一项不是频数分析中常用的统计图形: (D)分类图; 29.在SPSS中,当需要对变量进行频

6、数分析时,需要选择下面那一项菜单: (C)分析; 30.在进行数据的统计分析之前,一般需要完成数据的预处理,以下哪一项不属于数据的预处理内容: (B)峰度和偏度处理; 31.在SPSS中,当我需要对原有某个变量的数据进行取对数运算时,应选取下面那一项进行处理: (A)变量计算; 32.在SPSS中,下面那一项不属于数据分组的目的: (D)有利于进行因子分析; 33.对于SPSS中的组距分组,下面那一项是正确的说法: (A)分组数与数据本身特点和数据个数有关; 34.对于SPSS来说,能够快捷找到变量数据的最大值和最小值的数据预处理方法是: (A)排序; 35.对于SPSS来说,能够快捷找到变量

7、数据的异常值的数据预处理方法是: (A)排序; 36.在学生的一张数据表中,有平时分数、实验分数和卷面分数,如使用SPSS计算最终得分,则需要使用SPSS预处理中的: (C)变量计算; 37.在SPSS中,以下哪个选项可以完成如下功能:由收集的整体数据中抽取出年龄大于30的数据: (A)数据选取; 38.下面哪一个选项不是对数据的基本统计分析: (D)实现变量的排序与合并; 39.在SPSS中,当变量是数值型时,则频数分析所用图形为: (A)直方图; 40.在SPSS中,当需要选取出满足某一个条件的所有个案,则使用下面的那一项: (A)个案选择; 41.在SPSS中,均值的计算适合下面那一项:

8、 (A)定距型; 42.现有一批数据为(0,1,2,-2,3,-3,4),则这批数据的极差为: (A)7; 43.以下图是某随机变量的概率密度,请问其峰度是: (B)小于零;右偏大于0;左偏小于0;偏度为0表示对称。 44. 以下图是某随机变量的概率密度,请问其峰度是: (A)大于零; 45. 以下图是某随机变量的概率密度,请问其峰度是: (C)等于零; 46.单因素方差分析的第一步是明确观测变量和控制变量,例如,当分析不同施肥量是否对农产品产量带来显著影响、地域差别是否对妇女生育率有关系和学历对工资的作用关系时,控制变量分别是: (A)施肥量、地域和学历;(B)施肥量、生育率和学历; (C)

9、施肥量、地域和工资;(D) 农产品产量、地域和学历; 47. 单因素方差分析的第一步是明确观测变量和控制变量,例如,当分析不同施肥量是否对农产品产量带来显著影响、地域差别是否对妇女生育率有关系和学历对工资的作用关系时,观测变量分别是: (A)农产品产量、妇女生育率和工资; 48.当需要分析多个随机变量之间的相互影响和关系时,在SPSS中应使用下面哪一个选项: (D)交叉分组下的频数分析; 49.下面那一种情况下,可以使用交叉列联表中来进行卡方分布检验: (A)列联表单元格的全部期望频数都大于6; 50.当需要分析某一个变量的分布情况时,采用下面那一个选项较为合适: (A)频数分析; 51.在统

10、计分析中,描述变量的数据离散程度的基本统计量是: (A)标准差; 52.在统计分析中,描述变量数据分布的中心位置的基本统计量是: (D)均值; 53.在统计分析中,描述变量数据分布的对称程度的基本统计量是: (B)偏度; 54.在统计分析中,描述变量的数据分布的陡峭程度的基本统计量是: (C)峰度; 55.下面那一种说法是正确的: (B)偏度大于零,则数据分布的长尾巴在左边; 56.下图中右下角的问号应选择: 统计方法描述统计推断统计参数估计参数检验非参数检验? (C)参数检验; 57.在得到一批未知其总体分布的数据后,可使用以下哪种方法验证其是否与某个已知理论分布相吻合: (C)参数检验;

11、58. 需要检验一批未知的连续数值型随机单样本是否是正态分布,则需要下面的那一项: (C)标准差检验; 59.已知某一分布是正态分布的随机变量x的均值为m,方差为s2,则将其转换成标准正态分布(即均值为0,标准差为1)的公式是: (x-s)(x-m)(x-m)(x-m)(A);(B);(C);(D); snms260.下面那一项不是两独立样本t检验的前提条件: (D)两个样本的方差必须相等; 61.设待检验两个总体的均值分别为m1、m2,则相关的两独立样本t检验的假设H0是: (A)H0:m1-m2=0; 62.在交叉列联表检验中,行数为6,列数为7,则当变量间独立时所对应卡方分布的自由度是:

12、 自由度=* (A)30; 63.在交叉列联表检验中,当变量间独立时所对应检验统计量的分布是: (A)卡方分布; 64.已知两批独立随机样本都服从正态分布,要检验这两批随机样本的方差是否相同,则需要采用: (A)F检验; 65. .已知两批独立随机样本都服从正态分布,要检验这两批随机样本的均值是否相同,则需要采用: (B)两独立样本t检验; 66. 已知一批独立随机样本服从正态分布,要检验这批随机样本的均值是否与某总体分布的均值相同,则需要采用: (A)单样本t检验; 67.下面那一项不属于假设检验的基本步骤: (B)画出随机样本的直方图; 68.当样本的分布未知,需要利用样本的数据推断出总体

13、分布形态的方法是: (A)非参数检验;(B)参数检验;(C)方差检验;(D)因子分解; 69. 在总体分布未知的情况下,利用样本数据对所假定总体的分布进行显著性检验的方法是: (B)非参数检验; 70.现有两段独立样本数据,欲判断它们之间的分布是否存在显著性差异,则可采用: (B)非参数检验; 71.单样本的总体分布卡方检验属于: (C)非参数检验,用于了解样本的分布是否与某一已知的理论分布吻合; 72. 单样本K-S检验属于: (C)非参数检验,用于了解连续数值型样本的分布是否与某一已知的理论分布吻合; 73. 两配对样本t检验的目的是: (C)推导出来自于两个总体的配对样本的分布是否存在显

14、著性差异; 74.以下是使用SPSS所做的非参数检验的结果图,根据所给图选择正确的一项: : (A)接受假设H0; 75.样本值序列为1011011010011000101010000111,则整段样本值序列的游程数是: (A)17; 75.样本值序列为男男女女女男女女男男男男,则整段样本值序列的游程数是: (A)5; 76.样本值序列为男男男男男男男女女女女女,则整段样本值序列的游程数是: (A)2; 77. 样本值序列为男男男男男男男女女女女女,则整段样本值序列的游程数是: (A)2; 78. 样本值序列为男女男女男女男女男女男男,则整段样本值序列的游程数是: (C)11; 79. 样本值

15、序列为00110111000100100010,则整段样本值序列的游程数是: (C)11; 80. 样本性质下面的那一项可适用于两独立样本的曼-惠特尼U检验: (A)样本秩; 81. 样本性质下面的那一项可适用于两独立样本的K-S检验: (B)样本数值; 82下图是某两独立样本的游程检验示意图,请问图中数据的游程数是: (A)6; 83.K-S检验可用于: (B)非参数检验; 84.下面那一选项是独立样本: (A)分别对两批不同年级的大学生调查他们的学习兴趣; 85.现有一批数据:2.3, 1.2, 3.8, 6, 9,则6的秩是: (C)4, 86. 观察某新开发的饲料对猪的影响:首先不用这

16、个饲料,测量猪在一个月的体重;再在下一个月内使用新饲料喂养同一批猪,测量体重;实验者想知道前后两个月猪的体重的分布是否有差别,则可用以下哪一项进行检验: (C)方差检验; 87. 观察某新的营销手段对商品销售量的影响:首先不用这个营销手段,测量10种商品在一个月的销售量;再在下一个月内使用该新营销手段处理同样这10种商品,测量销售量;实验者想知道这新的营销手段是否对商品的销售量有显著性区别,则可用以下哪一项进行检验(销售量的分布未知): (A) 非参数检验中的两配对样本检验; 88.观察性别是否对书籍种类的购买意愿有差别:随机选择20个男同学,随机选择30个女同学,分别调查他们对书籍的购买意愿

17、,调查者想知道性别对数据种类的购买是否有影响,则可使用(男和女同学购买数据的分布是正态分布): (B) 非参数检验中的两独立样本检验; 89.在假设检验中,秩的概念主要用在下面那一项中: (B)非参数检验; 90.现有一种饲料,使用不同的数量来喂养动物,测量出不同喂养量情况下动物的体重,现欲知道动物的体重是否与不同喂养量有关,则采用下面那一项: (D)方差检验; 91.使用某种肥料对10块玉米田的产量进行实验,分别在每块田内使用0公斤、1公斤、2公斤、3公斤、4公斤、5公斤该肥料,再测量出每种肥料使用量和每块田的产量,当使用方差分析时,下面哪一个说法是正确的: (A)肥料量是控制变量,每块田的

18、产量是观测变量; 92.在制定某商品广告宣传策略时,广告效果可能会受到广告形式、地区规模、选择的栏目、播放的时间段、播放的频率等因素的影响。人们需要研究在影响广告效果的众多因素中,那些因素是主要的,则最适合的分析方法是: (C)多配对样本分析; 93.在方差分析中,共分为4组,每组有30个数据,则检验统计量F服从: (A)自由度为(3,116)的F分布;F(k-1,n-k) 94.现有一批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则1.2的秩是: (A)2; 95现有一批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则1.3的秩是: (B)3; 96现有一批数据:3

19、.2,1.3,4.5,6,0.8,9.8,1.2,则3.2的秩是: (D)4; 97现有一批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则4.5的秩是: (B)5; 98现有一批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则6的秩是: (A)6; 99现有一批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则9.8的秩是: (D)7; 100. 现有一批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则0.8的秩是: (C)1; 101.比较多种促销形式对同样10种商品销售的影响,则需要以下方法: (C)多配对样本的非参数检验; 102.分析不同

20、广告形式、不同地区对产品的销售额影响时,需要使用: (B)多因素方差分析; 103.在多因素方差分析中,下面那一项不会影响观测变量的变动: (A) 各控制变量的独立作用; 104.变量x=(1,2,3),y=(2,4,6),则变量x和y的相关系数是: (A)1; 105.对于变量x和y之间的相关系数,下面哪一个说法是错误的: (D) 当变量之间存在非线性关系时,还可以使用相关系数判断x和y之间的关系; 106.对于回归分析来说,下面那一项不属于回归分析的基本步骤: (C)计算样本数据的峰度; 三、简答题:(请将解答写在试卷上,本大题3小题,10分/每小题,共30分) 1.如下是一份问卷调查表:

21、 被调查者专业: (A)理科;(B)文科;(C)工科;(D)社会科学; 被调查者年级: (A) 1年级;(B) 2年级;(C) 3年级;(D) 4年级; 被调查者性别: (A) 男;(B)女 被调查者年级的月花费量; 被调查者入学日期; 被调查者民族; 请按照SPSS中的要求,分别填写下表中的变量结构: 名称 类型 度量标准 专业 字符串型 定类型变量 年级 字符串型 定序型变量 性别 字符串型 定类型变量 月花费量 数值型 数值型变量 入学日期 日期型 定序型变量 民族 字符串型 定类型变量 注:类型有“数值型”、“字符串型”、“日期型”;度量标准有“数值型变量”、“定序型变量”、“定类型变

22、量”。 2.现有计数数据如下: 低血压(1) 年龄 30岁以下(用1表示) 30-49岁(用2表示) 27 37 血压 正常(2) 48 91 93 高血压(3) 23 51 73 50岁以上(用3表示) 31 请按照SPSS中的要求,分别填写下表中的变量结构: 名称 类型 年龄 数值型 血压 数值型 3.现有计数数据如下: 低血压(1) 年龄 30岁以下(用1表示) 30-49岁(用2表示) 50岁以上(用3表示) 27 37 31 度量标准 定序型变量 数值型变量 血压 正常(2) 48 91 93 高血压(3) 23 51 73 请按照SPSS中的要求,分别填写下表中的数据组织方式: 变

23、量1 变量2 变量3 年龄 血压 合计 1 1 27 1 2 48 1 3 23 2 1 37 2 2 91 2 3 51 3 1 31 3 2 93 3 3 73 注:需填写“变量1”、“变量2”、“变量3”的具体名字。 4.现在SPSS中某一变量的一批数据如下: -1.16;1.43;-0.87;-0.45;-1.79;-1.52;1.01;0.74;0.58;0.01;-0.88;1.52;-0.27;-0.01;1.36;-0.21; 请计算这批数据的均值,方差,标准差:全距,偏度系数,峰度系数 解:均值=-0.03 方差=1.10 标准差=1.05 全距=1.52-=3.31 偏度系

24、数=0.01 峰度系数=-1.19 5.年龄和血压列联表如下: 低血压 年龄 合计 30岁以下 计数 30-49 计数 50岁以上 计数 计数 27 37 31 95 血压 正常 48 91 93 232 高血压 23 51 73 147 98 179 197 474 请根据交叉列联表的卡方检验步骤,判断年龄和血压之间是否是独立无关的。 答:经过血压和年龄的交叉列联表的卡方检验,得出渐进Sig.的值大于0.05,因此年龄和血压之间不独立。 6.请简述单样本t检验的目的、前提和实现步骤。 答:目的:利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值存在显著差异,它是对总体均值的假设检验

25、。检验前提是样本来自的总体应服从或近似服从正态分布。实现步骤:提出原假设选择检验统计量计算检验统计量的观测值和概率P-值给定显著水平a,并作出决策。 7.请简述两独立样本t检验的目的、前提和实现步骤。 答:目的:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。检验前提是:样本来自的总体应服从或近似服从正态分布;两样本相互独立,即从一总体抽取一个样本对另一总体中抽取一个样本没有任何影响,两个样本的量可以不相等。实现步骤:提出原假设选择检验统计量计算检验统计量的观测值和概率P-值给定显著水平a,并作出决策。 8.请简述假设检验的步骤。 答:提出原假设和备择假设选择检验统计量计算检验

26、统计量观测值发生的概率给定显著水平a,并作出决策。 9.下面是某一个参数检验的结果: 问题如下: (1)这是单样本t检验还是两独立样本t检验?两独立样本t检验 (2)请简述F检验的结果;经查看,该检验的F统计量的观测值为0.161,对应概率P-值为0.688,由于概率P-值大于0.05,因此两总体的方差没有显著差异。 (3)请简述检验的结果。两总体均值检验,其中t的观测值为-0.34,对应的双侧概率0.734,由于概率值大于0.05,因此两总体的均值没有显著差异 10.下面是一张有关两种工艺下产品寿命的SPSS表,其中sysm表示使用寿命值,gy表示两组 请用两独立样本的曼-惠特尼方法对这批数

27、据进行检验,判断两组数据的分布是否存在显著性差别(只需要给出曼-惠特尼U统计量的值即可)。 答:U=W-k(k+1)/2=40-8*9/2=4 11.下图左边是SPSS中甲乙两种工艺下某产品寿命的一批数据,请在下图右表中计算出混合排序后的样本数据,各组标记、甲乙工艺的累积频数、累积频率和累积频率的差。(提示:两独立样本的K-S检验)。 经过计算,混合排序后的样本数据分别为646、649、650、651、652、661、662、663、669、672、675、679、682、692、693,各组标记分别为2、2、2、2、2、1、2、2、1、2、1、1、1、1、1,甲工艺累计频数为0、0、0、0、

28、0、1、1、1、2、2、3、4、5、6、7,乙工艺的累计频数为1、2、3、4、5、5、6、7、7、8、8、8、8、8、8,甲工艺累计频率为0、0、0、0、0、0.143、0.143、0.143、0.286、0.286、0.429、0.571、0.714、0.857、1,乙工艺累计频率为0.125、0.25、0.375、0.5、0.625、0.625、0.75、0.875、0.875、1、1、1、1、1、1,累计频率差为0.125、0.25、0.375、0.5、0.625、0.625、0.482、0.607、0.732、0.589、0.714、0.571、0.429、0.286、0.143。 四

29、、叙述和分析题:(本大题 小题, 分/每小题,共 分) 1.请简述利用SPSS进行数据分析的步骤。 SPSS数据的准备SPSS数据的加工整理SPSS数据的分析SPSS分析结果的阅读和理解。 2.现有SPSS数据如下图: 请完成以下任务: 画出该SPSS数据的交叉列联表; 请进行所做交叉列联表的卡方检验; 判断年龄和血压之间是否有关系。 低血压 年龄 1 2 3 27 37 31 a血压 正常 48 91 93 高血压 23 51 73 假设行变量和列变量独立,计算卡方统计量值为9.352,并得出统计量观测值得概率为0.53,大于0.05,因此在原假设的前提下,卡方观测值出现时极有可能的,因此假

30、设成立。 年龄和血压之间相互独立。 3.如下图为四个城市的儿童身高调查表: 使用非参数检验中的多独立样本的Kruskal-Wallis检验,检验多个总体的分布是否存在显著性差异。 请完成如下表: 样本数据 69 70 71 71 71 72 组标记 4 4 2 4 4 1 秩 1 2 4 4 4 7 72 72 73 74 74 75 75 76 76 77 78 78 78 79 2 4 2 2 2 1 3 1 3 3 1 3 3 1 k12Ri-R)。, N(N+1)i=17 7 9 10.5 10.5 12.5 12.5 14.5 14.5 16 18 18 18 20 请计算各组的秩和,平均秩和总平均秩Ri,总平均秩R和检验统计量K-W(注:检验统计量K-W的计算公式是K-W=4.下图是4组数据的销售量,请完成以下工作: 分别计算单因素方差分析概念中的SST(观测变量总离差平方和)、SSA(组间离差平方和)和SSE(组内离差平方和); 计算MSA(平均组间平方和)和MSE(平均组内平方和); 写出F统计量的表达式并计算F值; 答案:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号