《SAS统计分析与应用—人脑老化问题严重性研究.doc》由会员分享,可在线阅读,更多相关《SAS统计分析与应用—人脑老化问题严重性研究.doc(15页珍藏版)》请在三一办公上搜索。
1、SAS 统计分析与应用-人脑老化问题的严重程度研究 姓名:舒敏班级:数学082学号:3080801241目 录摘要2内容2一.理论知识2 二.操作流程3 三.结果分析11 参考文献12 附录13摘 要本文通过SAS软件来研究人脑老龄化的严重程度问题,主要运用“分析家”模块进行主成分分析。为了研究人脑老化问题的严重程度,我们测定不同年龄的60名正常男性10项有关指标的数据(数据表见附录),分别是年龄(AGE),图片记忆(TJ),数字广度记忆(SG),图形顺序记忆(TS),心算位数(XX),心算时间(XS),规定时间内穿孔数(CK),步距(BJ),步行时双下肢夹角(JJ),步速(BS)。然后用SA
2、S软件对以上统计数据用“分析家” 模块做主成分分析计算协方差矩阵的特征值或是计算相关系数矩阵的特征值(Eigenvalue)、上下特征值之差(Difference)、各主成分的方差贡献率(Proportion)以及累积贡献率(Cumulative)、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。系统默认计算相关系数矩阵的特征值和特征向量。 从分析结果数据我们便可以知道人脑老化对以上10种指标的影响,进而便可知道人脑老化问题的严重程度。关键字 SAS 人脑老化 “分析家”模块 主成分分析一.理论知识 1.1 SAS 简介 SAS是是美国SAS软件研究所研制的一套大型集
3、成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据展现功能。尤其是创业产品统计分析系统部分,由于其具有强大的数据分析能力,在数据处理和统计分析领域,被誉为国际上的标准软件和最权威的优秀统计软件包,广泛应用于政府行政管理、科研、教育、生产和金融等不同领域,发挥着重要的作用。SAS系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、因子分析、聚类分析、判别分析等等。此外SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求 1.2主成份分析主成份分析(Principal Components Analysis) 是
4、研究如何将多个变量指标间的问题化为较少的几个新指标问题。这些新的指标是彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。多指标的主成份分析常被用来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。主分量分析还可用于揭示变量间的共线性。 主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标(比如 p 个指标),重新组合成一组新的互不相关的综合指标来代替原来指标。通常数学上的处理就是将原来 p
5、个指标作线性组合,作为新的综合指标。 二.操作流程2.1调用“分析家”模块 选择主菜单Solutions(解决方案)Analysis(分析)Analyst(分析家)。图1图22.2导入Excel数据表1)选择主菜单FileOpen,再打开的对话框中,选择文件类型为Microsoft Excel Spreadsheet,选定“P254.xls”,单击“打开”按钮; 图3图42)打开SAS Import:Spreadsheet Options对话框,在Worksheet/Range下拉列表中选择工作表名称,单机OK按钮,即将Excel导入SAS。图5图62.3使用“分析家”做主成分分析 1)选择菜
6、单Statistics(统计)Multivariate(多元分析)Principal Components(主成分分析)命令,打开Principal Components对话框,在对话框中输入主成分分析的变量;图7图82)单击Statistics(统计按钮),打开Principal Components:Statistics对话框,在“# of components:”右边的框中指定主成分个数,本例取8,单击OK按钮返回;图93)单击Save Date按钮,打开Principal Components:Save Date对话框,选中Create and save scores date,单击O
7、K按钮返回;图104)单击Plots按钮,打开Principal Components:Plots对话框,在Scree Plot(碎石图)选项卡中选中Create scree plot(建立碎石图)复选框。然后在Component Plot(成分图)设置Dimensions:1 to 5,单击OK返回;图11图125)单击OK按钮,得到分析结果。图13三结果分析输出的数字分析结果包括4个部分:简单统计量,相关系数矩阵,相关系数矩阵的特征值以及相关系数矩阵的特征向量。1)图14给出了变量的简单统计量。图中可以看出年龄(AGE),心算位数(XX),步距(BJ)的标准差高出其他变量,说明年龄(AGE
8、)对人脑老化有很大影响,切人脑老化对心算位数(XX),步距(BJ)影响较大。图142)图15给出了各变量之间的相关系数矩阵。可以看出各个指标之间的相关性。图153)图16给出了相关系数矩阵的特征值,上下特征值之差,各主成分的方差贡献率以及累计贡献率,可以看出前6个主成分的累计贡献率为89.50%,超过了85%,因此前6个主成分已经具有足够的方差贡献率,可以很好地概括这组数据了。图164)图17给出了相关系数的特征向量,由最大特征值所对应的特征向量我们可以知道各个主成分的表达式。Prin1=-0.397406age+0.335903tj+0.295883sg+0.234451ts-0.09862
9、2xx+0.149850xs+0.332867ck+0.375340bj+0.414281jj-0.362260bsPrin2=-0.134945age+0.343115tj+0.181476sg+0.033769ts-0.422031xx+0.458032xs+0.224044ck-0.370909bj-0.344191jj+0.368575bsPrin3=0.062870age-0039907tj+0.351138sg+0.545593ts+0.506651xx+0.383360xs-0.394987ck-0.036749bj-0.0926jj+0.102182bsPrin4=0.0738
10、05age+0.202505tj+0.415361sg-0.368171ts+0.588283xx-0.207585xs+0.438550ck-0.222039bj-0.121076jj-0.003793bsPrin5=0.007680age+0.208058tj-0.363747sg-0.512330ts+0.262818xx+0.644855xs-0.155390ck+0.104721bj+0.085025jj-0.186027bsPrin6=-0.018308age+0.630677tj-0.550451sg+0.362997ts+0.247985xx-0.266047xs+0.0489
11、97ck+0.014439bj-0.139980jj+0.112550bs 相关系数的绝对值越大,说明该主成分受该指标的影响就越大。图17参考文献1 汪远征,SAS 统计分析及应用,机械工业出版社,北京,2007附录原始数据表格:AGETJSGTSXXXSCKBJJJBS16179145.14495435.323.9218128143.575114630.663.319118211.673125337.013.082018957.04594730.13.92115966.575105737.142.7222198143.295114630.663.242416953.52104327.644,
12、412519963.57194226.544.4926179143.86395229.243.542715816494232.34.3828187143.98595133.943.03292010141.93584330.794.51301410142.93574532.674.4531198103.735103319.915.71321410143.572124431.924.1233159143.36564228.615.3934157143.945104330.264.3135179142.642112727.794.4536189123.235103825.834.6837198735
13、93825.383.373816874.384113523.344.9939208141.435114630.33.414017872.052123724.564.4941179113.75113523.764.334216983.33591232.112.634320832.52103925.93.7744149142.574104327.033.714518822.67583927.513.9446208102.825104027.063.5447189141.93594327.955.0148208355123724.73.734918851.875103422.544.77501384
14、3.25114533.472.7851167143.58524026.274.3852178142.86573423.935.153108143.43344126.014.045411886.18523725.453.855118142.15404229.682.615687922.1154529.86.6757121074.5582415.957.295810699.5244328.963.5591110128.690124431.152.896012788.78281812.927.436110526.3550158.9611.1462128717583221.834.716314949.
15、42124228.964.0164129535123022.185.41667738.49512920.625.676715863.43563724.655.56814568084028.064.34696728.34222917.024.69701391194413825.833.771159144.5564128.015.067210723.33573824.83.88730765.77103121.275.737420884.11573927.695.675128148.14342819.236.26766736.75352416.637.56789748.224139.448.917913519.5063825.533.24