抽样误差与参数估计.ppt

上传人:牧羊曲112 文档编号:5766390 上传时间:2023-08-18 格式:PPT 页数:43 大小:274.50KB
返回 下载 相关 举报
抽样误差与参数估计.ppt_第1页
第1页 / 共43页
抽样误差与参数估计.ppt_第2页
第2页 / 共43页
抽样误差与参数估计.ppt_第3页
第3页 / 共43页
抽样误差与参数估计.ppt_第4页
第4页 / 共43页
抽样误差与参数估计.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《抽样误差与参数估计.ppt》由会员分享,可在线阅读,更多相关《抽样误差与参数估计.ppt(43页珍藏版)》请在三一办公上搜索。

1、抽样误差与参数估计,南方医科大学生物统计系谭旭辉,抽样误差与标准误Sampling error andstandard error,population,sample,sampling,inferring,统计学的分析思路,抽样实验,例7-1:某地区正常成年男子的红细胞计数服从正态分布N(5.00,0.502)(1012/L),随机抽取100份样本,每份样本含有10个个体。,样本1,样本2,样本99,样本3,样本100,正常男子红细胞计数抽样实验结果,抽样误差,通过对研究总体中随机抽取部分有代表性的样本,用统计量(样本均数)来推断总体参数。由于抽样的随机性而造成样本统计量(样本均数)与总体参数

2、(总体均数)间的差别,称为均数的抽样误差。,从总体N(5.00,0.502)中抽样实验结果,各样本均数未必等于总体均数各样本均数之间也存在差异 样本均数的分布也是正态分布样本均数的变异范围较原变量的变异范围大大缩小,样本均数的标准误,统计上,将统计量(如样本均数、样本率等)的标准差称为标准误,用以衡量抽样误差的大小n固定时,标准差越大,标准误越大标准差固定时,n越大,标准误越小 实际工作中,总体标准差常未知,例72:已知某样本=5.03,s=0.52,n=10,试计算标准误。实际工作中,只能根据一份样本计算出一个标准误说明抽样误差的大小,即 估计的可靠程度,例73:2003年,在某地20岁应征

3、男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,计算当地20岁应征男青年身高的标准误。反映了本次调查身高均数171.2cm的抽样误差大小(估计值),样本率的标准误,率的标准误是衡量样本率的离散趋势和率的抽样误差的统计指标。总体:样本:,例1:观察某医院产妇106人,其中行剖腹产者62人,剖腹产率为58.5%,试估计剖腹产率的标准误。,样本均数的分布,原分布为正态分布,则新分布也为正态分布,如原分布为非正态分布,当n足够大时(如n60),新分布也近似正态分布新分布可用样本均数的均数和均数的标准差来描述其特征,其理论值分别为,t分布(t-distribution,studen

4、t distribution,Gosset,1908),t分布特征,单峰分布,以t=0为中点,两侧对称;样本(自由度)越小,t分布曲线峰值越低,t值越分散;随着自由度的增大,t分布接近于标准正态分布,当时,t分布的极限分布是标准正态分布。,图中阴影部分表示t/2,以外尾部面积占总面积的百分比P同一时,t与P呈反向关系当=时,t/2,=u/2当相同时,单侧P与双侧2P对应相同的t界值,如t0.05,=t0.10/2,可(置)信区间Confidence interval,CI,统计推断,参数估计,假设检验,点估计,区间估计,点估计(point estimation):就是用样本指标直接地估计总体指

5、标。总体均数总体率即样本均数和样本率分别是总体均数和总体率的估计值。,区间估计(confidence interval estimation)指用 和 确定一个具有较大置信度的包含总体参数的区间,该区间包含总体均数的概率为1-,称为总体均数的1-可信区间。1-一般取0.95或0.99。,样本统计量,标准误的估计值,总体均数的可信区间1.未知时,按t分布的原理 的概率之和为,或,2.已知时,或 未知但n足够大,n足够大,用样本标准差S来估计,例74:已知某样本的,s=0.52,n=10,试计算该总体正常成年男子平均红细胞计数的95%可信区间。解:v=9,=0.05(双侧),查t界值表,得,例75

6、:试估计2003年当地20岁应征男青年身高总体均数的95%可信区间。解:n=85,大样本时 用 代替,可信区间的解释,从总体中做随机抽样,据每个样本可算得一个可信区间,如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个包括,只有5个不包括。实际工作中,为估计总体均数,我们只做一次抽样,只算得一个可信区间,用以估计 的范围,理论上有95%的可能是正确的(1-),只有5%的可能发生错误。,可信区间两个要素,准确度:反映可信度(1-)的大小。1-越接近1,越准确 如可信度99%比95%准确精确度:反映区间范围宽窄。范围越窄越好 95%可信区间精度优于99%在n确定的情况下,准确

7、度,精确度;在兼顾准确度和精确度时,一般取95%可信区间;在可信度确定的情况下,增加样本例数,可提高精确度;,两样本均数之差的分布与标准误,从两个正态总体 中随机抽样,分别得n1、s1和n2、s2 则:,如果两总体标准差未知,合并方差,两总体均数之差的估计,两总体均数之差1-2的1-可信区间为:大样本时总体均数的可信区间,自由度:,例77:某药治疗流行性乙型脑炎,将72名患者随机分为试验组和对照组,得两组退热天数结果如下,试估计该药是否有效。,1-2 的95%可信区间,即,总体率的区间估计,正态近似法 当n足够大,且样本率p 和(1-p)均不太小,如np和n(1-p)均大于5时,p的抽样分布接

8、近正态分布,按正态分布的原理。求例1中剖腹产率的95%可信区间:(0.585-1.960.048,0.585+1.960.048)即(0.491,0.679),查表法:当不满足正态分布应用条件时,可根据二项分布的原理直接计算概率。阳性数为X的概率,例5-2:某妇幼保健院对当地38例育龄夫妇的筛查中,检出-地中海贫血基因携带者3例,试估计当地-地中海贫血基因总体携带率的95%可信区间。查附表7(P333),X=3,n=38,得221,即该地-地中海贫血基因总体携带率的95%可信区间为2%-21%。注意:附表7只列出了发生数Xn/2(发生率50%)的部分。当Xn/2时,应按n-X值查表,并相应地用100减去查得的数值,即为所求可信区间。,两率之差的分布与标准误,作为两率之差的标准误,如果两总体率未知,则:,两总体率之差的估计,两总体率之差1-2的1-可信区间为:,例7-8,标准差和标准误的比较,(1-)100%参考值范围与可信区间的区别含义 前者指该区间包含了(1-)100%的观察值;后者指该区间包含总体均数的可能性是(1-)100%。计算(双侧)参考值范围可信区间,小 结,标准差和标准误的比较区间估计和医学参考值范围的区别可信区间的涵义,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号