《《均数的抽样误差》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《均数的抽样误差》PPT课件.ppt(9页珍藏版)》请在三一办公上搜索。
1、第四章 均数的抽样误差与t分布,第1节 均数的抽样误差,一、抽样与抽样误差抽样:从总体中随机抽取样本进行研究来推论总体。抽样误差sampling error:由个体变异产生的,抽样造成的样本统计量与总体参数间差异,称。抽样研究中不可避免,但可估计其大小。而系统误差可以避免。统计推断statistical inference:在总体中随机抽取一定数量的观察单位作为样本进行抽样研究,通过样本指标来说明总体特征,这种从样本获取总体信息的过程,称,二、均数的标准误数理统计推论和中心极限定理central limit theorem 表明:(1)从正态总体N(,)中,随机抽取例数为n的样本,样本均数 也
2、服从正态分布;(2)从均数为,标准差为的正态或偏态总体,抽取例数为n的样本,样本均数 的总体均数也为,标准差用 表示。通常将样本统计量的标准差称为标准误standard error,SE,样本均数的标准差即均数标准误standard error of mean,SEM。SE:反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。,均数标准误的计算:为了说明均数的可靠程度,常在均数后面附上标准误的数值(常为标准误的估计值),表示为:,第2节 总体均数的可信区间与t分布,一、大样本资料均数的可信区间从均数为,标准差为的正态总体中,随机抽取许多个样本量为n的样本,则
3、这样本均数近似地以总体均数为中心呈正态分布。故95%的样本均数在 的范围内。故:,因此,总体均数95%的可信区间confidence interval 为::指这个范围内包括总体均数的可能性有95%。用各样本计算得到的可信区间并不是固定不变。若仅知样本均数及标准误的估计值,且样本较小时,用标准误的估计值来代替标准误,误差较大,需要改用t值来推算可信区间。,二、t值与t分布样本均数与总体均数间的差如以均数标准误 的估计值的倍数来表示,此倍数即为t值从正态分布总体中抽取若干个样本含量相同的样本,每个样本各计算一个t值,如抽取的样本很多时,可发现t值的分布是以0为中心,两侧对称的类似正态分布的一种分
4、布。即t distribution。t分布曲线的峰度kurtosis:受n的影响。当n小时,曲线低平;n越大越接近正态分布。即t 分布曲线是随自由度的大小而有规律地变动的。,degree of freedom:=n-1(读:nu)t分布曲线不是一条曲线而是一簇曲线t 分布曲线与横轴间的面积有规律:两侧外部面积为5%及1%的界限的t值常用t0.05()、t0.01()表示自由度趋于时,t分布趋向于均数为0,标准差为1的标准正态分布。一般情况下t分布曲线较正态分布低平,因而t0.05()1.96,t0.01()2.58t值与P值呈反向关系:t越大,则P越小;反之亦然。|t|t0.05(),P0.05,三、小样本资料均数的可信区间小样本时t0.05()和t0.01()与1.96、2.58相差很大,因此计算总体均数95和99可信区间时,要改用:见P39例,