《数据分析spss作业汇总.docx》由会员分享,可在线阅读,更多相关《数据分析spss作业汇总.docx(15页珍藏版)》请在三一办公上搜索。
1、数据分析方法及软件应用(作业)题目:4、8、13、16题指导教师:学院:交通运输学院姓名:学号:4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同-浓度与温度组合下各做两次试魁,其收率数据如下面计算表所列。试在a=0.05显著性水平下分析(1)给出SPSS数据集的格式(列举前3个样本即可);(2)分析浓度对收率有无显著影响;(3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。I沽度温度收率1111321,110312124121151,31361397141081,41
2、29219102171122101222913233142311名称旗小数标签值爆列浓度数值g0无无82涅度数值80无无8I收率数值80无无8(2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响.步骤:【分析-比较均值-单因素】将收率选入到因变量列表中,将浓度选入到因子框中,确定。输出:夏题分析收率平方和df平均值平方F琪著性群a之39.083219.5425.074.016在群留且内80.875213.851十119.95823显著性水平为0.05,由于概率P值小于显著性水平。,则应拒绝原假设,认为浓度对收率有
3、显著影响。(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。假设,Hoi:浓度对收率无显著影响;Hu2:温度对收率无显著影响;:浓度与温度的交互作用对收率无显著影响。步骤:【分析-般线性模型-单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。输出;主旨NJ效果Wf定因夔数:收率来源第III平方和df平均值平方F著性修正的模型70.456116.4051.553.230裁距2667.04212667.042646.556.000浓度39.083219.5424
4、.737.030SS13.79234:5971.114.382浓度*温度17.58362.931.710,648域49.500124.125嘀2787.00024校正接穗敦119J5823a.R平方=.587(三i整的R平方=.209)第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率P值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度
5、,温度和浓度*温度的概率P值分别为0.030,0.382和0.648浓度:显著性0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:显著性0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度:显著性0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。8、以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,分析它们之间的关系。解释变量采用逐步筛选策略,并做多重共线性、方差齐性和残差的自相
6、关性检验。解答:思路:根据要求采用逐步筛选的解释变量筛选策略,利用回归分析方法建立多元线性回归模型,分析它们之间的关系,并且要求做多重共线性、方差齐性和残差的自相关性检验。(1)步骤:【分析-回归-线性】,X5选入因变量,X2、X4、X6、X8选入自变量,方法选择【逐步】。【统计量】勾选【估计】、【模型拟合度】、【共线性诊断】与Durbin-Waston(U)I0【绘制(T)按钮】,将*ZRESID添加到Y(Y)框中,将*ZPRED添加到X2(X)框中,勾选【正态概率图】,【保存(三)按钮。在预测值与残差中勾选【标准化】选项。选择菜单【分析-相关一双变量】将标准化预测值和标准化残差选入【变量】
7、框,在相关系数中选择SPearman,各项完成后点击【确定】。输出;Mfc已It人/B除模型夔数已翰人境敷已移除方法1投人人年数逐步CWJ:F-toenter的槌率模型s+SETSS著性人均生活费年收入-模型自然4数AIPha(水津)1.000.1576.381.000Gamma(超#).400J7&2.244.031模型的两个参数分别为:1.0和0.4,则具体模型为任+m=1.0+0.4m,虽然残差自相关函数和偏自相关函数绝大多数处于置信区间内,但两函数都具有明显减少趋势,且具有一定的季节性,因此不属于白噪音序列。模型19911992人均生活费年收入-模型THiffl1708.821920.
8、58UCL1887.022274.43LCL1543.631609.99金十封每一他模型,fa测是在所要求的估期圃内的前次非遣漏始,企在其所有TSiffl值的非JS漏值可用的前次期,或是在所要求的T0测期的结束日期皓束,取IK早的日寺。-S-%浦come向*12000 OO-1S0O-L. V 祝W 1000 OO-199219901988 A9* Js19821980-1978-1976974-IS77-Ig70 1961966 12 -1962 I9601950 A J? Jd52日期1991、1992年的预测值与1990年的观测值有较大的增长趋势。从整个数据来看,1950年至1980年这
9、段时期较为平稳的增长,但是1980年之后迅速上升,最后预测值上升较为明显,这与实际趋势基本一致。且1991、1992年预测值分别为1708.82、1920.58o16、结合自己的研究方向、参与项目等,举出一个说明SPSS在交通运输中应用的例子。例子需包含问题说明、数据来源、统计方法、统计结果及其主要结论。解答;问题说明:利用1950年2013年美国么历年定期航班旅客周转量(单位:台亿客公里)历年数据数据,建立几种指数平滑模型,预测2016年美国定期航班旅客周转量“数据来源:从统计看民航(2014)中国民航出版社,2014年11月第一版。年份195019511952195319541955195
10、6195719581959定期航班旅客周转量/亿客公里164.d211.8250.3292.1331.6391.8444.5503506.9585.3年价I960196119621963196419651966196719681969定期航班旅客周转St/亿客公里E25.4640.9704.2810.431.31105.21285.71605.8IH30.7Ztnr3年份197019711972m197419751976197719781979定期航班旅客周转量/亿客公里2131.32155.91453260626212620Al311036404080隼份198019811982198319
11、8419851986198719881989定期航班旅客周轻量/亿客公里3930395041004460472052795800647087436948年份1990199119921993199419951996199719981999定期航疮旅客周整量/亿客公里731471837651.477598199.88491.692bL29655.7964710448.7年饰2000200120022003200420052006200720082009定期航班旅客周林氐亿客公里11109.510144.8ICZlfir410389.611643.712416.912753,813120.51279
12、012570年份2010201120122013定期航班旅客周转fit/亿客公里I299H.713105.413247.513525.2解题思路:首先首先绘制和观察彩电出口量的序列图,通过图形观察和检验寻找规律,然后通过指数平滑模型一简单、HoIT线性趋势、BrOWn线性趋势三个模型进行分析预测,比较选择最佳模型预测2016年亿客公里数。统计结果:美国亿客公里时间序列图如下:1500000000-10000000 00-$000000 00-亿客公里-5D0-1O0QOQ-150QD0.-J? 1992 JsaJ 9-1966 H JswJso-197B 1976 1974Js-1970 18
13、 HW斯:dfference(16)该序列图为平稳序列则可以直接进行建模分析(1)简单指数平滑模型型胱明模型想型模型ID亿客公里模型模型IiW黄料模型JH测缨数数目模型通合度统瓷料Ljung-BoxQ(18)蹄群值数目平程R平方RMSE统It瓷料DFSR著性亿客公里模型0-.417367.91812.51117.0460指敷平滑彳匕模型畲败模型估SET著性亿客公里一模型自然封数Alpha(水津)LOOO.1228.175.000亲公里.税亨一0ODoIo-oDOoo-ODOIOloooo22Z2311111111111IIF1.01.095 OQResidual期模型201420152016亿
14、客公里-模型s三13638.2113752.1613867.06UCL17502.4819474.7921137.62LCL10451.729393.228654.28/t?t每一s模型,TfliM是在所要求的估卦期fSliS圃内的前次非遣漏始36在其所有测值的非遣漏值可用的前次期f-或是在所要求的ffl测期的皓束日期皓束,取较早的畤。(2)HoIT线性趋势指数平滑模型型胱睨明模型颊型模型ID亿客公里模型Holt模型Im瓷料模型JS测境敷数目模型通合度统言十瓷料Ljung-BoxQ(18)蹄群值数目平穗R平方RMSE统言十瓷料DF麓著性亿客公里-模型一O.610417.99015,33616.
15、0500指数平滑4匕模型金败模型估卦SET著性亿客公里-模型自然封敷Alpha(水津).694J185.893,000Gamma(超岁J17.0621.895,063150.-日/日雪莘fBu 10O- 999g9999gJlJJll3SSSS日期蜘3出史甘通8图与Em3E16摸型201420152016亿客公里-模型SWUCL1.CL13940.7817038.1011286.0814300.6318400.8110926.8114680.0819860.9610585.12金十封每一模型,JW潮是在所要求的估2十期SS囿内的前次非遣漏始加在其所有测值的非遣漏值可用的前次期或是在所要求的fH
16、测期的结束日期S束,取IS早的畴PC。(3)BroWn线性趋势指数平滑模型型三明模型颊型模型ID亿客公里模型Brown模型8H料甦殖PACFDU DReiidual模型Tffl燮数数目模型通合度统瓷料Ljung-BoxQ(18)群值数目平程R平方RMSE统瓷料DF著性亿客公里模型0.548402.2321326517.0470指数平滑彳匕模型模型估HSET版著性亿客公里模型J自然封数Alpha值(水津舆超磬).540.05310.109.000期模型201420152016亿客公里-模型JflJffl13775.9314077.6714456.70UCL17291.5719575.762251
17、7.84LCLI10825.41I9827.238779.99斜封每一H模型,fS测是在所要求的估期S圃内的前次非遣漏始,1在其所有f三测值的非遣漏值可用的前次期,或是在所要求的f!Jffl期的皓束日期结束,取较早的畤。结果分析:在三个模型预测分析当中,简单指数模型均方根误差为367.918,HOIT线性趋势指数平滑模型均方根误差为417,990,BroWn线性趋势指数平滑模型均方根误差为402.232,其中简单指数模型均方根误差最小。三个模型残差自相关函数和偏自相关函数图中,简单指数模型均方根完全落在置信区间,HolT和BroWn线性趋势指数平滑模型大部分落在置信区间。综合上述分析,分别观察三个模型的简单指数模型你和效果图,可知简单指数模型你和效果最佳,2016年亿客公里预测值为13867.06。