《参数估计基础》PPT课件.ppt

上传人:小飞机 文档编号:5476685 上传时间:2023-07-11 格式:PPT 页数:45 大小:264.50KB
返回 下载 相关 举报
《参数估计基础》PPT课件.ppt_第1页
第1页 / 共45页
《参数估计基础》PPT课件.ppt_第2页
第2页 / 共45页
《参数估计基础》PPT课件.ppt_第3页
第3页 / 共45页
《参数估计基础》PPT课件.ppt_第4页
第4页 / 共45页
《参数估计基础》PPT课件.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《《参数估计基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《参数估计基础》PPT课件.ppt(45页珍藏版)》请在三一办公上搜索。

1、,卫生统计学(第五版),流行病学与卫生统计学教研室,第五章 参数估计基础,第一节 抽样分布与抽样误差第二节 t分布第三节 总体均数及总体概率的估计,抽样研究的目的就是要用样本信息来推断相应总体的特征,这一过程称为统计推断。统计推断包括两方面:参数估计和假设检验 抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差 无倾向性,不可避免。,一、样本均数的抽样误差与抽样分布二、样本频率的抽样误差与抽样分布,(一)均数的抽样误差:,由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数与总体均数之间的差异称为均数

2、的抽样误差。,表示均数抽样误差大小的指标称均数的标准误,简称标准误。也就是样本均数的标准差。,标准误的意义:1、标准差的特点均存在,只是表示均数的标准差。2、表示抽样误差大小。,(二)均数的抽样分布 从总体中随机抽取若干样本,计算出样本均数(标准差),这些样本均数的分布即为均数的抽样分布。是抽样分布的一种。均数的抽样分布有一定的规律。p69:表5-1,抽样实验:假定从13岁女学生身高总体均数,总体标准差 的正态总体中进行随机抽样。,样本均数的分布特点:1.各样本均数未必等于总体均数;2.样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也服从正态分

3、布。,数理统计推理和中心极限定理表明:,1)从正态总体N(,2)中,随机抽取例数为n的多个样本,样本均数服从正态分布;即使是从偏态总体中随机抽样,当n足够大时(如n50),也近似正态分布。,2)从均数为,标准差为的正态或偏态总体中抽取例数为n的样本,样本均数的标准差即标准误为:,用 来表示均数抽样误差的大小。,(标准误的理论值),(标准误的估计值),标准误的大小与的大小成正比,与n成反比,而为定值,说明可以通过增加样本例数来减少标准误,以降低抽样误差。未知,用样本标准差S来估计总体标准差。,例5-1 2000年某研究所随机调查某地健康成年男子27人,得到血红蛋白的均数为125g/L,标准差为1

4、5g/L。试估计该样本均数的抽样误差。,均数的抽样分布:,1.样本均数服从正态分布:,一、样本均数的抽样误差与抽样分布二、样本频率的抽样误差与抽样分布,(一)样本频率的抽样误差:,从同一总体中随机抽出观察单位相等的多个样本,样本率与总体率及各样本率之间都存在差异,这种差异是由于抽样引起的,称为频率的抽样误差。,表示频率的抽样误差大小的指标叫频率的标准误。用 表示。,:总体率,n:样本例数。,例5-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试计算该样本频率的抽样误差。,(二)频率的抽样分布 从总体中随机抽取若干样本,计算出样本频率,这些频

5、率的分布即为频率的抽样分布。也是抽样分布的一种。频率的抽样分布也有一定的规律。p72:表5-3,频率的抽样分布:,第一节 抽样分布与抽样误差第二节 t分布第三节 总体均数及总体概率的估计,一、t分布的概念,服从=n-1的t分布,二、t 分布的图形和t 分布表,t分布曲线特点:1)t分布曲线是单峰分布,它以0为中心,左右对称。2)t分布的形状与样本例数n有关。自由度越小,则 越大,t 值越分散,曲线的峰部越矮,尾部翘的越高。3)当 n时,则S逼近,t分布逼近标准正态分布。t分布不是一条曲线,而是一簇曲线。,正确使用t界值表!,与单侧概率相对应的t值用 表示,与双侧概率相对应的t值用 表示。,由于

6、t分布是以0为中心的对称分布,表中只列出了正值,故查表时,不管t值正负只用绝对值表示。,第一节 抽样分布与抽样误差第二节 t分布第三节 总体均数及总体概率的估计,一、参数估计的概念二、总体均数的估计三、总体概率的估计,一、参数估计的概念,统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。,一、参数估计的概念二、总体均数的估计三、总体概率的估计,二、总体均数的估计,1.点估计:用样本统计量直接作为总体参数的估计值。例如 于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。,,即认为2000年该地所有健康成年男性血红蛋白

7、量的总体均数为125g/L。,2.区间估计:按预先给定的概率(1)估计总体均数的可能范围,该范围就称为总体均数的1置信区间(confidence interval CI)。预先给定的概率(1)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。,置信区间由两个数值即置信限构成,其中最小值称为下限,最大值称为上限。严格讲,置信区间不包括上下限两个端点值。,3、置信区间的计算,(1)已知,按标准正态分布原理计算,通式:(双侧),Z/2为标准正态变量,Z/2相当于按=时及P取,由附表2查的的t界值。,95%的双侧置信区间:99%的双侧置信区间:,(2)未知但样本例数n足够大(n50)时,

8、通式:(双侧),95%的双侧置信区间:99%的双侧置信区间:,例5-4 某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,,试估计该地19岁健康男大学生的身高的95%置信区间。,该市19岁健康男大学生的身高的95%置信区间(171.3,173.1)cm,(3)未知且样本例数n较小时,按t分布原理,通式:,t/2,是按自由度=n-1,由附表2查得的t值。,95%的双侧置信区间:99%的双侧置信区间:,例5-3 已知某地27例健康成年男性血红蛋白量的均数为,标准差S=15g/L,试问该地健康成年男性血红蛋白量的95%和99%置信区间。,本例n=27

9、,S=15,95%CI:,99%CI:,4、置信区间的意义 从总体中进行随机抽样,由样本均数计算置信区间,有1-的可能得到包含总体均数的置信区间。,5、置信区间的两个要素(1)准确度:反映置信度1-的大小,即区间包含 总体均数的概率大小。(2)精度:反映区间的长度。在置信区间确定的情况下,增加样本例数,会减 小 t,和,可减少区间长度,提高精度。,一、参数估计的概念二、总体均数的估计三、总体概率的估计,(一)点估计 例5-2中776名50岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病率的点值估计值,即认为该市所有50岁以上的中老年妇女骨质疏松症的总体患病率约为41.5%。(二)区间估计

10、总体概率的置信区间与样本含量n,阳性频率p的大小有关,可根据n和p的大小选择以下两种方法。,1.正态近似法 当样本含量足够大,且p和1-p不太小即np和n(1-p)均5时,则样本率的分布近似正态分布。公式为:P为样本率,为率的标准误的估计值。,例5-7 用某种仪器检查已确诊的乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。分析:本例样本例数较大,且样本率p不太小,可用正态近似法:,2.查表法(1)按二项分布原理:p接近0或1,n 较小 时,以n 及发生数 x 查附表。p78:例5-5/5-6,例5-5 某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。,注意:此表仅列出Xn/2 的95%置信区间。,例5-6 某医生用某药物治疗31例脑血管梗塞患者,其中25例患者治疗有效,试求该药物治疗脑血管梗塞有效概率的95%置信区间。,(2)按泊松分布原理:p接近0,n 较大时,以发生数 x 查附表7。例:某地抽取10万人,调查得乳腺癌死亡人数 为23人,估计该地乳腺癌死亡率 95%的置 信区间。以x=23查附表7得:()/10万,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号