Spss统计分析与运用.doc

上传人:仙人指路1688 文档编号:3823597 上传时间:2023-03-23 格式:DOC 页数:24 大小:1.35MB
返回 下载 相关 举报
Spss统计分析与运用.doc_第1页
第1页 / 共24页
Spss统计分析与运用.doc_第2页
第2页 / 共24页
Spss统计分析与运用.doc_第3页
第3页 / 共24页
Spss统计分析与运用.doc_第4页
第4页 / 共24页
Spss统计分析与运用.doc_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《Spss统计分析与运用.doc》由会员分享,可在线阅读,更多相关《Spss统计分析与运用.doc(24页珍藏版)》请在三一办公上搜索。

1、 Spss统计分析与运用班 级2008级会计7班所 属 院 系商学院 会计系任 课 老 师姓 名学 号SPSS统计分析与应用实验一 多因素方差分析一、实验目的:完成练习单因变量多因素方差分析二、 实验内容:研究不同广告形式与不同地区对产品销售额的影响三、实验步骤:如下1、导入数据:x1、x2、x3分别为“广告形式”、 “地区”、 “销售额”。,2、模型设定将“销售额”提入“因变量”,将“广告形式”、“地区”提入固定因子。3、构建类型在交互情况下分别提入x1、x2,在主效应下同时提入x1x2。4、对比更改“对比”中的“对比”选为“无”。5、绘制将“x2”选入“水平轴”,将“x1”选入“单图”,并

2、将两者“添加”到“图”6、两两比较 默认设置保存勾上“未标准化(U)”、“未标准化(N)”和“标准误(T)”7、选项 “OVERALL”提入“显示均值”,勾上“描述统计”和“方差齐性检验”。8、确定,得出结果。四、实验结果及分析:1、原始数据综合信息:系统接受了144个观测量,列出各个因素变量,变量值标签和样本含量。2、从上表可以看出:共分为18个地区,每个地区的广告形式都有报纸、广播、宣传品、体验四种。每个地区的各种广告形式的样本都是一样的,都为2,各种广告形式的均值和标准偏差各不一样。从总计可以看出:(1)报纸在各地区使用最广泛,宣传品使用最少。 (2)报纸在各地使用量差别最小,体验在各地

3、使用量差别最大3、由于Sig=0 小于0.05,说明各组均值在0.05水平上有显著性差异。4、表的左上方标注了因变量,为score,从方差分析的角度来看偏差平方和的分解。两个因素变量的主效应、两个二维交互效应和一个三维交互效应三者的偏差平方和之和为Corrected Model的偏差平方和20094.306,总偏差平方和(Corrected Total)为26169.306,两者之差为误差Error的偏差平方和6075。5、由图可知,销售额与广告、地区之间的交互效应 (1)广播边际均值最高的是地区3,约为90;最低的是地区7,约为50。 (2)宣传品边际均值最高的是地区4,约为76;最低的是地

4、区11,约为41。 (3)体验边际均值最高的是地区4,约为84;最低的是地区17,约为44。(4)报纸边际均值最高的是地区10,约为92;最低的是地区17,约为62。实验二 线性回归分析一、实验目的:完成练习线性回归分析,改进模型,对模型的回归残差进行正态性和独立性检验。二、实验内容:高血压病因线性回归分析,从高血压数据表中建立的血压作为被解释变啦ing,其他变量为解释多变量的线性回归模型并分析。三、实验步骤:1、打开文件,: 2、导出数据:3、将血压提入因变量,年龄及吸烟指数、体重指数选入自变量。4、统计量勾上“估计(e)”模型拟合度、DUBIN-WASTON.”“描述性、5、绘制将depe

5、ndn提入,将*zpred提入。保存如图勾上选项。6、确定,得出结果。四、实验结果及分析:1、全部观测量和观测总量:Descriptive StatisticsMeanStd. DeviationN血压144.437514.3030332吸烟.5313.5070132体重指数3.53484.78275532年龄53.43756.89056322、血压与年龄、吸烟、体重指数的关系数:0.818、0.243、0.659,可以看出血压与年龄和体重指数有显著关系,与吸烟的关系不大。Correlations血压吸烟体重指数年龄Pearson Correlation血压1.000.243.659.818吸

6、烟.2431.000.069-.115体重指数.659.0691.000.621年龄.818-.115.6211.000Sig. (1-tailed)血压.090.000.000吸烟.090.354.266体重指数.000.354.000年龄.000.266.000.N血压32323232吸烟32323232体重指数32323232年龄323232323、当三个变量都进入模型时,如图。Variables Entered/RemovedModelVariables EnteredVariables RemovedMethod1年龄, 吸烟, 体重指数a.Entera. All requested

7、 variables entered.4、模型的拟合优度系数为0.895,反应了显著的线性关系。DW=1.213,说明模型变量序列相关。Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.895a.801.7806.706361.213a. Predictors: (Constant), 年龄, 吸烟, 体重指数b. Dependent Variable: 血压5、模型的设定检验F=37.669,显著水平P接近为零,通过了设定的检验,因变量与自变量之间的线性关系显著。ANOV

8、AbModelSum of SquaresdfMean SquareFSig.1Regression5082.56631694.18937.669.000aResidual1259.3092844.975Total6341.87531a. Predictors: (Constant), 年龄, 吸烟, 体重指数b. Dependent Variable: 血压6、体重指数的T值很小,不能通过变量的显著性检验。CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Co

9、nstant)45.7249.7464.692.000吸烟8.9222.431.3163.670.001体重指数3.1951.995.1751.601.120年龄1.547.228.7456.798.000a. Dependent Variable: 血压7、数据样本中均无奇异值。Residuals StatisticsaMinimumMaximumMeanStd. DeviationNPredicted Value119.5472168.4835144.437512.8044432Std. Predicted Value-1.9441.878.0001.00032Standard Error

10、 of Predicted Value1.6485.9922.245.77532Adjusted Predicted Value118.7923175.4356144.555913.3179032Residual-9.5766413.71040.000006.3736132Std. Residual-1.4282.044.000.95032Stud. Residual-1.4742.206-.0031.01232Deleted Residual-10.2006715.96993-.118407.3454532Stud. Deleted Residual-1.5072.384.0071.0383

11、2Mahal. Distance.90323.7772.9063.98232Cooks Distance.000.395.043.07832Centered Leverage Value.029.767.094.12832a. Dependent Variable: 血压8、从下面的直方图可以看出,样本容量为32,图像为正态分布。实验三 聚类分析一、实验目的:完成练习聚类分析, 并能够对聚类结果给出合理的解释.二、实验内容:通过对各省19-22岁年龄组城市男学生身体形态指标进行聚类,从而对各省身体形态做出合理的评估和归类。三、实验步骤:1、导出数据进行分析。2、将身体指标提入“变量”,省份提入

12、“标准个案”。3、统计量合并进程表4、绘制“树状图”5、方法最近邻元素6、保存默认不变。7、确定,得出结果。四、实验结果及分析:1、数据中给出了样本处理的基本信息,包括赝本总数、含有缺失值的样本数以及百分比等。Case Processing Summarya,bCasesValidMissingTotalNPercentNPercentNPercent28100.00.028100.0a. Squared Euclidean Distance Undefined error #14704 - Cannot open tex b. Single Linkage2、下表为聚类过程表:第一步将距离最

13、近的10号陕西、15号江苏观测量合并为一类为G1,列中群集1=群集2=0出现复聚类的的下一阶段为第二步,进行第二步合并,将7号(吉林)样品并入G1类,群集1=0,群集2=1,形成G2,下一阶段复聚类出现在第6步。第三步将距离最近的6号(辽宁)、8号(黑龙江)合并为G3,群集1=群集2=0。其余合并过程类似。聚类进程中,系数逐渐变大,开始时样品的差异较小,结果时类与类差异较大。Agglomeration ScheduleStageCluster CombinedCoefficientsStage Cluster First AppearsNext StageCluster 1Cluster 2C

14、luster 1Cluster 211015.1790022710.374016368.88000641218.9430055412.9700410667.9743277561.433069811171.50100129251.6130716104161.6915011114221.71010012124111.74711815133131.79000221424281.8260018154141.9931201616242.0819151717292.082160211823242.300014191923262.367180202023272.6751902321122.786017222

15、2133.090211323231233.181222024241253.230230262520213.3680026261203.656242527271194.29626003、下表为聚类归属表,可以看出,根据将样品分为5类的设定,使用最近相邻发得出最后聚类结果,可看出11,17为第三类,其他同理。从图中可以看出: 18号(河南)、12号(宁夏)为第四聚类 8号(黑龙江)、6号(辽宁)为第三聚类10号(陕西)、7号(吉林)为第二聚类10号(陕西)、15号(江苏)为第一聚类 4、从下图可以看出,第七类陕西、黑龙江、内蒙古、天津、江苏、吉林、辽宁、第八类有吉林、辽宁、黑龙江、陕西、江苏、因此

16、我们可以根据这个地方的学生体质所属的类别来判断这个省学生体质在28个省份中的大概位置。* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * * Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 陕西 10 -+-+ 江苏 1

17、5 -+ +-+ 吉林 7 -+ +-+ 辽宁 6 -+ +-+ 黑龙江 8 -+ | +-+ 内蒙古 5 -+ | | 天津 2 -+ | 甘肃 11 -+-+ | 安徽 17 -+ | | 宁夏 12 -+ +-+ 河南 18 -+-+ | 山西 4 -+ | +-+ 浙江 16 -+ | | 湖北 22 -+ | +-+ 上海 14 -+ | | 山东 9 -+ | +-+ 北京 1 -+ | | 河北 3 -+-+ | 新疆 13 -+ | 广东 24 -+-+ | 云南 28 -+ +-+ | 湖南 23 -+ +-+ +-+ 四川 26 -+ +-+ | 贵州 27 -+ | +-+ 广西 25 -+ | | 福建 20 -+-+ | 江西 21 -+ | 青海 19 -+

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号