非参数统计简介课件.ppt

上传人:小飞机 文档编号:1800091 上传时间:2022-12-19 格式:PPT 页数:50 大小:1.24MB
返回 下载 相关 举报
非参数统计简介课件.ppt_第1页
第1页 / 共50页
非参数统计简介课件.ppt_第2页
第2页 / 共50页
非参数统计简介课件.ppt_第3页
第3页 / 共50页
非参数统计简介课件.ppt_第4页
第4页 / 共50页
非参数统计简介课件.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《非参数统计简介课件.ppt》由会员分享,可在线阅读,更多相关《非参数统计简介课件.ppt(50页珍藏版)》请在三一办公上搜索。

1、,非参数统计,目 录,第一章 引言第二章 单样本检验第三章 两样本位置和尺度检验第四章 多样本检验第五章 尺度检验第六章 相关和回归第七章 分布检验和拟合优度检验第八章 列联表第九章 非参数密度估计和非参数回归,第一章 引 言,主要内容,1. 统计的实践2. 非参数统计方法简介 3. 参数统计过程与非参数统计的比较4. 非参数统计的历史5. 必要的准备知识,1. 统计的实践,我们周围的世界,符号和数据就是整个世界。数据繁衍,信息匮乏:观察数据激增,设计数据细分。数据的复杂性和不确定性的特点更为突出。数据分析方法和手段不足。,统计的方法论,就方法论而言,统计分析主要解决两方面的问题: 寻找数据内

2、部差异中共同的特征。 寻找数据之间本质的差异。统计分析的目标是从数据中发现比数据本身更为有用的知识,2. 非参数统计方法简介,参数方法,定义:样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,推断问题就转化为对分布族的若干个未知参数的估计问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。比如:(1)研究保险公司的索赔请求数时,可能假定索赔请求数来自泊松分布P(a);(2)研究化肥对农作物产量的影响效果时,平均意义之下,每测量单元(可能是)产量服从正态分布N(a,b).,一个典型的参数检验过程,1. 总体参数Example:

3、 Population Mean2. 假定数据的形态为 Whole Numbers or Fractions Example: Height in Inches (72, 60.5, 54.7)3. 有很强的假定Example: 正态分布4. 例子: Z Test, t Test, 2 Test,一个例子:,对两组学生进行语法测试,如何比较两组学生的成绩是否存在差异?,非参数检验过程,1.不涉及总体的分布Example: Probability Distributions, Independence2. 数据的形态各异定量数据定序数据Example: Good-Better-Best名义数据E

4、xample: Male-Female,在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本的信息就是次序如果可以把数据点按大小次序排队,每一个具体数目都有它的在整个数据中(从最小的数起)的位置或次序,称为该数据的秩(rank)非参数统计的名字中的“非参数(nonparametric)”意味着其方法不涉及描述总体分布的有关参数;它被称为和分布无关(distributionfree),是因为其推断方法和总体分布无关;不应理解为与所有分布(例如有关秩的分布)无关,非参数方法,3. 参数统计与非参数统计比较,对总体假定较少,有广泛的适用性,结果稳定性较好。1. 假定较少2. 不需要对总

5、体参数的假定3. 与参数结果接近针对几乎所有类型的数据形态。容易计算在计算机盛行之前就已经发展起来。,非参数检验的优点,1.可能会浪费一些信息特别当数据可以使用参数模型的时候。Example: Converting Data From Ratio to Ordinal Scale2.大样本手算相当麻烦3.一些表不易得到,非参数检验的弱点,非参数统计的主要内容,4. 非参数统计的历史,非参数统计的历史,非参数统计的形成主要归功于20世纪40年代50年代化学家F.Wilcoxon等人的工作。Wilcoxon于1945年提出两样本秩和检验,1947年Mann和Whitney二人将结果推广到两组样本量

6、不等的一般情况;Pitman于1948年回答了非参数统计方法相对于参数方法来说的相对效率方面的问题;,非参数统计的历史(续),60年代中后期,Cox和Ferguson最早将非参数方法应用于生存分析。70年代到80年代,非参数统计借助计算机技术和大量计算获得更稳健的估计和预测,以P.J.Huber以及 F.Hampel为代表的统计学家从计算技术的实现角度,为衡量估计量的稳定性提出了新准则。90年代有关非参数统计的研究和应用主要集中在非参数回归和非参数密度估计领域,其中较有代表性的人物是Silverman和J. Fan。,5.必要的基础知识,(1)假设检验(2)顺序统计量(3)秩检验统计量(4)U

7、统计量(5)数据处理,(1) 假设检验回顾,问题: ( a ) 新引进的生产过程是否优于旧过程? (b)几种不同的肥料哪一种更有效? (c)大学生的就业率与城市失业率之间是否存在关系?,内容,(a)假设的真正涵义和作用 (b)如何选择零假设和备择假设 (c)检验的p-值和显著性水平的作用 (d)两类错误 (e)置信区间和假设检验之间的关系,单边检验和双边检验的p值?,顺序统计量,顺序统计量:,基于顺序统计量的统计量:,顺序统计量的分布: 设总体的分布函数F(x),则第r个顺序统计量的分布函数为:,秩检验统计量,无结点秩的定义,例题:某学院本科三年级有9个专业组成,统计每个专业学生每月消费数据如

8、下,求消费数据的秩和顺序统计量的现值: 300 230 208 580 690 200 263 215 520,2.有结数据的秩,设样本 取自总体X的简单随机抽样,将数据排序后,相同的数据点组成一个“结”,称重复数据的个数为结长。例1:3.8 3.2 1.2 1.2 3.4 3.2 3.2解:结长为3。,线性秩统计量,线性符号秩统计量:,线性秩统计量:,正态记分线性秩统计量:,U统计量,核的概念,例:总体期望有无偏估计X1,总体期望是可估的, X1是总体期望的核。,对称核和U统计量的概念,U统计量的特征计算,数据处理,SPSS SAS R S-Plus 直方图盒形图茎叶图Q-Q图,数据处理,数据处理,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号