第十章计算机统计分析.ppt

上传人:sccc 文档编号:4956327 上传时间:2023-05-26 格式:PPT 页数:32 大小:358.01KB
返回 下载 相关 举报
第十章计算机统计分析.ppt_第1页
第1页 / 共32页
第十章计算机统计分析.ppt_第2页
第2页 / 共32页
第十章计算机统计分析.ppt_第3页
第3页 / 共32页
第十章计算机统计分析.ppt_第4页
第4页 / 共32页
第十章计算机统计分析.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《第十章计算机统计分析.ppt》由会员分享,可在线阅读,更多相关《第十章计算机统计分析.ppt(32页珍藏版)》请在三一办公上搜索。

1、第十章 计算机统计分析,第一节 Excel 统计分析,下一张,主 页,退 出,上一张,Excel是一个功能十分强大的电子表格软件,它是微软公司办公软件Office中的一部分。利用它可以方便地进行许多计算工作,画图工作等,也包括常用的一些统计计算。使用这种通用办公软件的最大优点是普及率高,容易得到;其次是使用简单,不用记许多特殊指令;同时它也能复盖常用的统计方法,可满足一般工作时需要。另一方面,与许多著名的统计软件如SAS等相比,它也有一些明显的缺点,例如自动化程度不高,需要掌握一些基本统计公式;功能也不够强,有些统计计算不能做等。,下一张,主 页,退 出,上一张,在本章中,我们假设读者已对Ex

2、cel有一定了解,因此不再介绍Excel的基本用法。主要介绍以下几种统计计算:1.假设检验:包括正态总体的假设检 验,离散分布的假设检验,以及用皮尔逊统计量进行非参数检验。2.方差分析:基本原理和多重比较3.回归分析:包括简单作图。,下一张,主 页,退 出,上一张,一.描述统计及直方图 此分析工具用于生成对输入区域中数据的单变量分析,提供数据趋中性和易变性等有关信息。(一)操作步骤:1用鼠标点击工作表中待分析数据的任一单元格。2选择“工具”菜单的“数据分析”子菜单。3用鼠标双击数据分析工具中的“描述统计”选项。4出现“描述统计”对话框,对话框内各选项的含义,下一张,主 页,退 出,上一张,填写

3、完“描述统计”对话框之后,按“确定”按扭即可。结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值(X),标准误差(S/n),组中值(Medium),众数(Mode),样本标准差(S),样本方差(S2),峰度值,偏度值,极差(Max-Min),最小值(Min),最大值(Max),样本总和,样本个数(n)和一定显著水平下总体均值的置信区间。,下一张,主 页,退 出,上一张,(二)直方图工具 直方图工具,用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数值元素的出现次数。例如,在一个有 50 名学生的班级里,可以通过直方图

4、确定考试成绩的分布情况,它会给出考分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直方图工具对话框中的“接收区域”框中。,下一张,主 页,退 出,上一张,二、常用概率的计算(一)正态分布的概率计算1、正态分布函数NORMDIST:说明:正态分布在模拟现实世界过程和描述随机样本平均值的不确定度时有广泛的用途。函数NORMDIST 返回给定平均值和标准偏差的正态分布的累积函数。同样可以用类“七”中的方法,利用NORMDIST 函数建立正态分布密度函数图,这里不再赘述。.语法:NORMDIST(x,mean,standard_dev,cumulative)X:为需要计算

5、其分布的数值。Mean:分布的算术平均值。Standard_dev:分布的标准偏差。Cumulative:为一逻辑值,指明函数的形式。,下一张,主 页,退 出,上一张,(二)二项分布的概率计算 1、简介:在Excel 中想要计算二项分布的概率分布、累积概率,需要利用Excel 的工作表函数BINOMDIST。函数 BINOMDIST 适用于固定次数的独立实验,实验的结果只包含成功或失败二种情况,且每次实验成功的概率固定不变。例如,已知次品概率的情况下,函数 BINOMDIST 可以计算10 个产品中发现2 个次品的概率。以下例子说明如何在Excel 中计算二项分布的概率,以及如何建立二项分布图

6、表。,下一张,主 页,退 出,上一张,2、结果说明:利用Excel 的BINOMDIST 的函数可以计算出二项分布的概率以及累积概率。BINOMDIST 函数可以带四个参数,各参数的含义分别是:实验成功的次数,实验的总次数,每次实验中成功的概率,是否计算累积概率。第四个参数是一个逻辑值,如果为TRUE,函数 BINOMDIST 返回累积分布函数,如果为FALSE,返回概率密度函数。,下一张,主 页,退 出,上一张,三、t 分布函数TDIST1说明:函数TDIST 返回student 的t 分布数值。T 分布用于小样本数据集合的假设检验。使用此函数可以代替 t 分布的临界值表。2语法:TDIST

7、(x,degrees_freedom,tails)X:为需要计算分布的数字。Degrees_freedom:为表示自由度的整数。Tails:指明返回的分布函数是单尾分布还是双尾分布。如果 tails=1,函数 TDIST 返回单尾分布。如果 tails=2,函数 TDIST 返回双尾分布。3 举例:TDIST(1.96,60,2)=0.054645,下一张,主 页,退 出,上一张,四、正态性的卡方检验(一)简介:卡方检验可以用来判断所观测的样本是否来自某一特定分布的 总体,这种检验亦称为一致性检验。以下例子,已知某样本的相关统计 量和分组频数分布如图附-1 所示,试图用卡方检验判断该样本是否来

8、自一正态总体。,下一张,主 页,退 出,上一张,(二)操作步骤1创建变量名。选定A3:C4 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按 扭即可。2.计算预期正态概率值。如图附-2 表中所示,在D6 单元格输入标志项,在D7:D11 单元格输入公式,分别计算各组的预期正态概率值,在D12 计算累积概率值。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,3.计算预期频数值。如图附-3 所示,在E6 单元格输入标志项,在E7:E11单元格输入公式,分别计算各组的预期频数,在E12 计算累积频数值。,4.计算X2 统计量 如图附

9、-4所示,在F6 单元格输入标志项,在F7:F11分别输入计算公式,分别计算X2 值,在E12 计算X2 平方和,这项就是最后计算出的X2 统计量。在E13 单元格输入标志项“卡方统计量”,为以后的引用作准备。先选中F12、F13 两个单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“尾行”选项,然后点击“确定”按扭即可。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,(三)结果分析:如图附-6 所示,按照以上操作步骤可以得到表中的计算结果。,五、方差分析(一)单因素方差分析 1、简介:单因素方差分析可用于检验两个或两个以上的总体均值相等的假设是否成立。此方

10、法是对双均值检验(如 t-检验)的扩充。检验假定总体是服从正太分布的,总体方差是相等的,并且随机样本是独立的。这种工具试用于完全随机化试验的结果分析。,下一张,主 页,退 出,上一张,例子如图附-7 表中所示,一产品制造商雇佣销售人员向销售商打电话。制造商想比较四种不同电话频率计划的效率,他从销售人员中随机选出32 名,将他们随机分配到4种计划中,在一段时期内记录他们的销售情况已经在表中列出,试问其中是否有一种计划会带来较高的销售水平。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,六、相关与回归分析 1、线性回归分析(一)简介:线性回归分析通

11、过对一组观察值使用“最小二乘法”直线拟合,用来分析单因变量是如何受一个或几个自变量影响的。例子如图附-10 所示,表中是我国1987 年至1997 年的布匹人均产量和人均纱产量,试用线性回归分析的方法分析两组数据之间的关系。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,2、相关系数分析工具(一)简介:此分析工具可用于判断两组数据之间的关系。可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关系数为零

12、)。,第二节 SPSS统计分析,SPSS(Statistics Package for Social Science)是由美国SPSS公司自20世纪80年代开发的大型统计学软件包,是目前世界上最优秀的统计分析软件之一。SPSS最初版本是基于DOS环境的,20世纪9O年代以来,由于MS Windows的普及,SPSS公司于92、93、94年相继推出了基于Windows操作系统的5.0、6.0及6.1版本,随着Windows 95与 Windows NT 3.5以上版本的 32位操作系统的出现,SPSS公司于 95、96、97年推出了SPSS for Windows98/NT的7.0、7.5 8.

13、0版本,1998年12月又推出SPSS 9.0 for Windows 98/NT版本。2000年推出的SPSS 10.0 for Windows是它的最新版本,除了保持以往SPSS的诸多优点外,还汇集了SAS for Windows和STATISTICS for Windows 的长处,因而成为当前世界上最新、最流行、最受欢迎的大型统计软件包。,上一张,下一张,主页,退出,一SPSS的命令类型(一)操作命令 一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。SPSS中数据文件的管理功能基本上都集中在了”file”菜单上,该菜单的组织结构和word极为相似,因此这里我们只介绍

14、比较有特色的几个操作命令:1.新建数据文件 2.打开其他格式的数据文件,上一张,下一张,主页,退出,(二)统计分析命令 SPSS统计分析(Analyze)模块,有13个主命令,52个子命令:1.统计报表(Reports):成行(在线)分层分析(OLAP Cubes)、个案综合分析(Case Summaries)、按行综合统计报表(Report Summaries in Rows)、按列综合统计报表(Report Summaries in Columns)。2.描述性统计分析(Descriptive Statistics):单变量频数分布分析(Frequencies)、描述性分析(Descrip

15、tive)、探索性分析(Explore)、列联表分析(Crosstabs)。3.均数比较分析(Compare Means):平均数分析(Means)、单样本 t检验(One-Sample T Test),独立样本 t检验(IndependentSamples T Test)、配对样本 t检验(Paried-Samples T Test)。单因素方差分析(OneWay ANOVA)。4.一般线性模型(General Linear Model):单变量方差分析(Univariate)、多变量方差分析(Multivariate)、重复测量方差分析(Repeated Measures)、方差分量估计法

16、(Variance Components)。,上一张,下一张,主页,退出,5相关分析(Correlate):双变量相关分析(Bivariate)、偏相关分析(Partial)、距离相关分析(Distances)。6回归分析(Regression):线性回归分析(Linear),曲线参数估计法(Curve Estimation)、二值多元 Logistic回归分析(Binary Logistic)、多项多元 Logistic回归分析(Multinomial Logistic)、概率单位法(Probit)、非线性回归分析(Nonlinear)、权重估计法(Weight Estimation)、二阶

17、段最小二乘回归分析(2-Stage Least Squares)。7对数线性分析(Loglinear):一般对数线性分析(General)、Logit分析(Logit)、模型选择(Model Selection)。8.分类分析(Classify):逐步聚类分析(K-Means Cluster)、系统聚类分析(Hierarchical Cluster)、判别分析(Discriminant)。,上一张,下一张,主页,退出,9数据简化分析(Data Reduction):因子分析(Factor)。10.尺度分析(Scale):可靠性分析(Reliability Analysis)、多维尺度分析(Mu

18、ltidimensional Scaling)。11.非参数检验(Nonparametric Tests):X2检验(Chi-Square)、二项式检验(Binomial)。游程检验(Runs)、单样本哥尔莫格罗夫一斯米尔罗夫检验(KolmogorovSmirnov,1-Sample K-S)、两独立样本非参数检验(2 Independent-Samples)、K项独立样本非参数检验(K Independent Samples)、两相关样本非多数检验(2 Related Samples)、K项相关样本非参数检验(K Related samples)。12生存分析(Survival):寿命表(L

19、ife Tables)、KaplanMeier方法(KaplanMeter)、Cox回归分析(Cox Regression)、Cox w时间一因变量协变量分析(Cox w/TimeDep Cox)。13多重响应分析(Multiple Response):确定多重响应分析的设置(Define Sets)、多重频数分析(Frequencies)、多重列联表分析(Crosstabs)。,上一张,下一张,主页,退出,例101某地 25名健康男子的血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、极差、变异系数C.V、中位数以及P2.5和P97.5。4.40 4.55 5.38 3.8

20、9 4.60 4.47 4.08 4.79 5.30 4.97 3.18 3.97 477 3.37 6.14 3.95 3.56 4.23 3.64 4.34 5.16 4.10 4.31 4.71 5.02,上一张,下一张,主页,退出,1.定义变量:光标对准主画面下的“Variable View”按钮,单击鼠标左键,打开定义变量对话框。变量名(Name)为X;类型(Type)为数值型(Numeric);总宽度(Width)为4;小数位数(Decimals)为2位。其他为默认。2输入数据光标对准主画面下的“Data View”按钮,单击鼠标左键,打开数据编辑窗口。在“X”变量栏里逐个输入上述

21、25个数据。,上一张,下一张,主页,退出,3描述统计 从“Analyze”“Descriptive”“Frequencies”,进入“Frequencies”对话框。将X选入“Variables”框。单击“Statistics”钮进入“Statistics”对话框,选中Mean、Std.deviation、Median复选框,选中“Percentiles”,在其后的方框中输入2.5,单击“Add”;输入975,单击“Add”。单击“continue”按钮,返回“Frequencies”对话框。单击“Charts”按钮,进入“Charts”对话框,选中“Histogram charts”(直方图)。单击“Continue”按钮,返回对话框。单击“OK”,得到结果。得出结果后手工计算出C.V。,上一张,下一张,主页,退出,上一张,下一张,主页,退出,(1)基本描述性统计表,该表依次显示:有效数据25个;缺失0个;平均数4.4752;中数4.4700;标准差0.6925;极差(全距)2.96;最小值3.18;最大值6.14;P2.5=3.1800;P97.5=6.1400。手工计算C.V15.47。,(2)频次分布表,上一张,下一张,主页,退出,(2)带有正态曲线的直方图,上一张,下一张,主页,退出,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号