《spss多元线性回归实例.docx》由会员分享,可在线阅读,更多相关《spss多元线性回归实例.docx(16页珍藏版)》请在三一办公上搜索。
1、SPSS19.0实战之多元线性回来分析(2011-12-0912:19:11)转战标签:分类:软件介绍文化线性向来数据(全国各地区能源消耗量与产掘栏:国泰安数据服务中心的经济探讨数据库.)来源,可点击协会博客数据挖数据预处理包括的内容特别广泛,包括,数据集成和变换,数据归约,数据离散化等。本次实习主要涉及的数据预处理只包括数据消理和描述性数据汇总。的处理。于此我们只对数据做缺失值填充,但是依旧将其统称数据清理.数据导入与定义单击“打开数据文档“,将Xk格式的全国各地区能源消耗量与产量的数据导入SPSS中.如图1-1所示。直揭S三k1.):新建文件夹二SQ0住l三回梗日交晶衍生指标1MS型股本爽
2、期dX6冬至国各地区能源消货量与产量XS组行业曰交易衍生指标1JCls里公司文件XIS普公司文件IMS引公司文件Zds-U月个股回报率文件Rs打开)西硬I:取消建助股本变动文件力$文件名(N):匡函丽藤画文件?型CD:归XCelCMsjxIsxjXsm)U机据婚俺最小化字箝出宽度,存储库检索文件.图1-1导入数据导入过程中,我们须要手动将相应的。单击菜单栏的”将所选的变量改为数值型.如图1.2所示:无定义在益属性已13苗的受信歹应当前变量标签&)无词艮角色委SlIi-I-llI而i-lla-I囱百一日i-EI-I百一里C4哈S消费总孑、煤炭消费量、管炭消费量S原油制费量、:彳油消货量、煤油消费
3、虽、柴油滑货量、燃料*虹海费量、天然与自费量电力消费Si、原煤产量隼炭产量、原油产量燃料油产最、汽油产量、煤油产量、柴油产量、天然气广量、电力产量未标记的值测量级别角色:能源消费总量建以蜀类型:散字宽度题:8I小敢电属性一值标签同格W):j在网格中喻人娱转标费,比可以在医部输入其他值己做的个案他别髀制:30200未标记的IB-从另一个变量.到其他%量自动标及QEZJ取消roI图1-2定义变量数据类型数据清理数据清理包括缺失值的填写和还须耍运用SPSS分析工具来检查各个变量的数据完整性。单击将检杳所输入的数据的缺失值个数以及百分比等”如图1-3所小:图13缺失值分析能源数据缺失值分析结果如表1-
4、1所示:单变址统计缺失极值数目aN均值标准差计数百分比低高能源消费总量309638.506175.9240.001煤炭消309728.997472.2590.002焦炭消理量30874.611053.0080.002原油消费量281177.511282.74426.701汽油消30230.05170.2700.001煤油消2845.4066.18926.704柴油消30392.34300.9790.002燃料油消费量30141.00313.4670.003臼然气消费量3019.5622.0440.002电力消费量30949.64711.6640.003原煤产269125.9712180.689
5、413.302焦炭产量291026.491727.73513.302原油产ft181026.481231.7241240.000燃料油产量2590.72134.150516.703汽油产ft26215.18210.090413.302煤油产唇2048.4462.1301033.300柴油产26448.29420.675413.301气然量自产2029.2849.3911033.303电力产K30954.74675.2300.000技2-1能源消耗量与产量数据缺失值分析表I-I能源消耗量与产世数据缺失值分析SPSS供应了填充缺失值的工具,点击菜的栏“、二“,即可以运用软件供应的几种填充缺失值工具
6、,包括序列均值,接近点中值,接近点中位数等。结合本次实习数据的详细状况,我们不运用SPSS软件供应的替换缺失值工具,主要是手动将缺失值用零值来代替。描述性数据汇总描述性数据汇总技术用来获得数据的典型性质,依据这些统计值,可以初步得到数据的噪声和离群点。中心趋势的Si度值包括:等.离中趋势量度包括,)等.SPSS供应了详尽的数据描述工具,单击菜单栏的将弹出如图2-4所示的对话框,我们将全部变班都选取到,然后在选项中勾选上所希望描述的数据特征,包括均值,标准差,方差,最大最小值等.由*未标箱2.sau【效据柒11IBISPSSStatistics数据编短器文件(D58(EtftE(V)照据)蕤报分
7、析直销)Sl(O)实用程序窗口四都助W“曷瓯/r国n鲍国S三汽油消费量煤油消费量柴油消费量燃料油消费量天然气消费量电力消费量原煤产量127823417748416196512821281624710711446037(3264648454317351.kW,-B=t.E45=113212MM102671061098=JJb小639419312913208145615S4116,250174214C84912691045011405将标准化8分另存为麦量Oi5Jft,S三O煤炭消费最4焦炭消费量保油消费量Q汽油消费量9煤油消费量柴油消费量燃料油做量_手伙K他不目二(0).Bootstrap(B)
8、.离散,好准差(V方差范圉分布巴显示垠序变量列,O字斗II”图1描述性数据汇总微小N值极大值均值标准差方差能源消费总量30911261649638.506175.92438142034.412煤炭消费量30332290019728.997472.25955834651.378焦炭消费量30195461874.611053.0081108824.853原油消费量30055551099.011273.2651621202.562得到如表1-2所示的描述性数据汇总。汽油消镀量3018771230.05170.27028991.746煤油消镀量30026242.3764.8964211.520柴油消费
9、量30271368392.34300.97990588.441燃料油消费St3001574141.00313.46798261.261自然气消费量30110619.5622.044485.947电力消费垃30983004949.64711.664506464.953原煤产量300581427909.1711741.3881.379E8焦炭产量3009202992.281707.9982917256.193原油产2904341637.121085.3791178048.432燃料油产量3049775.60126.79116075.971汽油产3001032186.49208.77143585.1
10、22煤油产30021932.3055.3943068.535柴油产量3001911388.52420.216176581.285自然气产量30016419.5242.3711795.341电力产30972536954.74675.230455935.003有效的N(列表状态)29表1-2描述性数据汇总值,以下的回来分析将运用标所示:跺油消费量孤料油消费量Z天然气消费量Z电力消费量既好1-.7138529652.95687464622-.48280-.10808-.37818-7C6C83.30582-27649-.759691.10331A-.41715-41759-.61407206005.
11、3333041800-.23483-.090966.6492728625-.29290.391537-.29435-.32192-.61496-.754848.28403-30636.22561-495719-.0709621207725827.0569210.64731.19160.532722.276511.49541.31865-.347791.3483712-.50649-38084-79870-4036213-.0406110362-.86130-.1163514-.2616636527-.85631-.69747152.75310.52034.137601.9143916-.1S3
12、94-2253249779.8214117.34646-04788-58594-.0771218.167-.3156969436-.25414193.240284.57057-.231202.8的7420-.19415-37302-.83181-.5201621-1.09454-4138220020-1.19717226837544132.9296576504-.12537-.41950blog.i11sJ,W.crhbuuhWjo2001图1-5我们还可以通过来得到各个变量的众数,均值等,还可以依据这些盘绘制直方图。我们选取个别变量(能源消费总员)的直方图,可以看到我们因变量基本符合正态分布
13、.如图1-6所示:能源伽总g叼Jnas川E1.um3少|图I6能源消筑总量1.2回来分析我们本次忒验主要考察地区与煤炭消费量、焦炭消费St、原油消费量、原煤产盘、焦炭产量、原油产量之间的关系。以下的回来分析所涉及只包括以上几个变盘,弁数设置I.单击菜单栏将弹出如图1-7所示的对话框,将通过选择闪变故和自变ffi:来构批线性【可来模型,因变成:标准化能源消费总额:自变量:标准化煤炭消费量、标准化焦炭消费量、标准化原油消费量、标准化原煤产量、标准化焦炭产量、标准化原油产量。:进入,个案标签运用地名,分析一即W1.S权重为回图1-7.我们选择回来系数中的和其他项中的“”.选中估计可输出回来系数B及其
14、标准误.I值和P值,还有标准化的同来系数bcia。选中模型夏选框:、退出的变出的列表,以及一W有关。如图1-8所示:1011121314151617181920Z原煤产髭原炭产StZi气油产史线性回妇ga年度标织丛地区代码抬地区名称此,能源消费总量s煤炭消费量品,焦炭消贽量&)再费量&Wi三R三品)柴尚im;S蛆料油消费信岳天然气消费量8电力货量W臣煤广量晶焦炭广量及停r量3燃闷油产量魅ifi1831母珏变应IXsat:I-Zslre前源。费总源)IZa箫诵一自丈量:百ZSeOre健园肖费员)亿煤炭消8ZSeore便发酒费醐(鼻炭消ZSeore(S油消费启)亿原由H统计信.方法侬):进入个案标
15、签:I宓地区赢W1.Stgg(Hf):艇补贴(D”更取摘J常助22-.33379-.4222223J05884-.027212433279-.05323图1-8设置回来分析统计里58700-.570443.在设置,我们保存(三)一选琮Bootstrap(B).-.5962659626回归心1.15残差I口,-blg.ifj8m.crbussurro2001,其中的正态概率图是图。同时还须要画出残差图,Y轴选择:ZRESID.X轴选择:ZPRED。如图1-9所示:Z原理产量Z熊岚产量而油产量硼料油产且ZK油产WVWWteWW.VWWWWw土线性回妇Xro1fr.crrDUffo2001图1-10
16、设置选项结果输出与分析O我们来逐一贴出和分析,以及1 .表l3所示,是回来分析过程中输入、移去模型记录。详细方法为:CntCr(进入),入/移去的变量模型输入的变量移去的变量方法1ZSCore(原油产量),ZSeOre(原煤产量),ZSCore(焦炭消费贵),ZSCore(金油消费量),ZSCOre(煤炭消费量),ZSCore(焦炭产量)输入表1-3输入的变fit2 .表1-4所示是,r2.5-刃273 .我们可以看到该模型是拟合优度良好。模型汇总调整R标准估计模卡RR方方的i,:Sig.1.962.925.905.30692707.000农1-4模型汇总3.表1-5所示是模型平方和df均方F
17、1回来25.66064.27745.397残差2.07222.094总计27.732281-5离散分析4.表I-6所示的是,。观测以F的回来值,都是具有统计学意义的。因而,得到的多元线性回来方程:Y=0.008+1.06lx+0.087x2+O.157x3-0.365MO.105xs-0.017x(XI为煤炭消费量,X2为焦炭消费量,X3为原油消费量,X4为原煤产量,X5为原炭产量,XA为原油产量,Y是能源消费总量)系数模型非标准化系数标准系数tSig.B标准误差beta1(常量).008.057.149.883ZSCOreC煤炭消费量)1.061.1261.0718.432.000ZSCor
18、e(焦炭消费量).087.101.088.856.401ZSCore(原油.157消费量).085.1591.848.078ZSCore(原煤产量)-.365.155-.372-2.360.028ZSCore(焦炭产量)-.105.150-.107-.697.493ZSCore(原油产量)-.017.070-.017-.247.807表16向来方程系数5.主要是“,如图I-Il所示:散点图因变量:Zscore(能源消费总量)四川育O回归标准化残差IT市W鳖O古自占X直北市0甯已占山西占ra1oo.WO河G,5Jg同SHiT*il4O山。aIlll0123回归标用痣值刁.CQrr1.CriZhbiJeSh1.ffQ29Cd图I”残差图同时,就是广东省和四川省,这种还有一种如图1-12所示:可以直观地推断残差是否符合正态分布,回门标准化残差的标准PF图因变量:ZSCore(能源消酸总量)0.0020406OB10观测的累秒除率0864201OOOOO留的累枳微率blog.ifc.f11.c11rblJef1.ffo29G图I-I211nkit(P-P)图它的直方图如图1-13所示:直方图.if)a.cofr.cffbueshufo2901回归标准化图I-Brankit(直方)图