《统计量及其抽样分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计量及其抽样分布ppt课件.ppt(41页珍藏版)》请在三一办公上搜索。
1、统计量及其抽样分布,假设检验理论,统计方法,描述统计,推断统计,估计理论,概率论,抽样理论,学习目标,1.了解统计量及其分布的几个概念2.了解由正态分布导出的几个重要分布 3.掌握样本均值的分布特征与中心极限定理4.掌握单样本比例的分布特征5.了解两个样本均值之差的分布,了解样本方差的分布,一、 几个重要概念,(一)参数 能够反映统计总体的基本信息的数字特征均称为总体参数。总体分布已知条件下对总体特征数字的统计分析和假设检验; 总体分布未知条件下对总体分布特征及相关数字特征的统计分析和假设检验. 总体参数是一个常数(常常是未知数),它与抽样方法以及样本值是无关的,设X1,X2,Xn为来自正态总
2、体N(, 2), 容量为n的样本, 由样本构造的不含有任何未知参数的函数T (X1,Xn)称为统计量如样本均值和样本方差,(二)统计量,若X1,X2,Xn只能取0或1, 则可构造样本比例统计量,样本统计量的值高度依赖于样本值,因此用样本统计量来推断总体参数的值具有一定的不确定性; 样本统计量的分布具有某种确定的性质,这种性质反映在样本的抽样分布中。,1、统计量的概念,2、次序统计量 把样本X1, X2,Xn由小到大排列,得到X1 X2 Xn ,称之为样本X1, X2,Xn 的次序统计量。 3、充分统计量 不损失信息的统计量通常称为充分统计量,总体中各元素的观察值所形成的分布 分布通常是未知的可
3、以假定它服从某种分布,(一)总体分布,三、关于分布的概念,(二)抽样分布,1. 样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2. 随机变量是 样本统计量样本均值, 样本比例,样本方差等3. 结果来自容量相同的所有可能样本4. 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布的形成过程 (sampling distribution),一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近 总体的分布,(三)样本分布,(四)渐近分布,(五)近似分布,二、由正态分布
4、导出的三个重要分布,(一) 2分布 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来 设随机变量X1, X2, , Xn 相互独立, 且XiN(0,1)。 令 2=X12+X22+Xn2则称 X2 服从自由度为 n 的 2 分布, 记作22(n).,分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为E(2)=n,方差为D(2)=2n(n为自由度) 可加性:若U和V为两个独立的服从2分布的随机变量,U2(n1),V2(n2),则U+V这
5、一随机变量服从自由度为n1+n2的2分布,2分布(性质和特点),c2分布(图示),(二) t-分布 若 XN(0,1), Y2(n),且X与Y相互独立,则称,服从自由度为 n 的 t-分布, 记作tt(n).说明: 当样本容量n 较小时, t-分布与正态分布差异较大, 当样本容量n 较大(n30)时, t-分布与正态分布基本一致。,(三) F-分布 若 Y2(m), Z2(n), 且Y与Z相互独立,则称随机变量X有如下表达式:,服从自由度为 (m ,n) 的F-分布, 记作XF(m, n)。 说明:若 XF(m, n), 则,三、 样本统计量的抽样分布 (一个总体参数推断时),(一) 样本均值
6、的抽样分布(二) 样本比例的抽样分布(三) 样本方差的抽样分布,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础,(一)样本均值的抽样分布,样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布 (例题分析), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布 (例题分析), 计算出各样本的均值,如下表。并给出样本均值的
7、抽样分布,样本均值的数学期望和方差,式中:M为样本数目 为样本均值的均值,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,总体分布,抽样分布,P ( x ),1.0,0,.1,.2,.3,1.5,3.0,4.0,3.5,2.0,2.5,x,比较及结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布, X的数学期望为,方差为2/n。即XN(,2/n),中心极限定理(central limit theorem),
8、从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为,方差为2/n的正态分布,中心极限定理 (central limit theorem),的分布趋于正态分布的过程,抽样分布与总体分布的关系,统计量的标准误 (standard error),样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度以样本均值的抽样分布为例,在重复抽样条件下,样本均值的标准误为,估计的标准误 (standard error of estimation),当计算标准误时涉及的总体参数未
9、知时,用样本统计量代替计算的标准误,称为估计的标准误以样本均值的抽样分布为例,当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为,求样本平均数的概率分布,设某公司1000名职工的人均年奖金为2000元,标准差500元,随机抽取36人作为样本进行调查,问样本的人均年奖金在19002200元之间的概率有多大?,(二)样本比例的抽样分布,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为,(二)样本比例的抽样分布,在重复选取容量为n的样本时,由样本比例的所有可能取值形
10、成的相对频数分布一种理论概率分布当样本容量很大时( ),样本比例的抽样分布可用正态分布近似 推断总体比例的理论基础,样本比例的抽样分布,样本比例的抽样分布(数学期望与方差),样本比例的数学期望样本比例的方差,某商场推销一种洗发水。据统计,本年度购买此种洗发水的有10万人,其中6万是女性。如果按重复随机抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大?,两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差3. 方差为各自的方差之和,(一)两个样本均值之差的抽样分布,四、 样本统计量的抽样分布 (两个总体参数推
11、断时),两个样本均值之差的抽样分布,两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为 方差为各自的方差之和,(二)两个样本比例之差的抽样分布,(三)样本方差的抽样分布,在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为 (n -1) 的2分布,即,两个样本方差比的抽样分布,两个总体都为正态分布,即X1N(1 ,12),X2N(2 ,22 )从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1) 的F分布,即,F分布(图示), 不同自由度的F分布,小 结,理解统计量和分布的几个概念了解三个分布掌握单总体参数推断时样本统计量的分布了解双总体参数推断时样本统计量的分布,