第七章总体均值估计.ppt

上传人:sccc 文档编号:5297271 上传时间:2023-06-23 格式:PPT 页数:52 大小:622.01KB
返回 下载 相关 举报
第七章总体均值估计.ppt_第1页
第1页 / 共52页
第七章总体均值估计.ppt_第2页
第2页 / 共52页
第七章总体均值估计.ppt_第3页
第3页 / 共52页
第七章总体均值估计.ppt_第4页
第4页 / 共52页
第七章总体均值估计.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第七章总体均值估计.ppt》由会员分享,可在线阅读,更多相关《第七章总体均值估计.ppt(52页珍藏版)》请在三一办公上搜索。

1、第六章抽样调查与总体均值估计,主要内容1、复习点估计2、抽样误差3、区间估计正常值范围4、统计软件应用,参数估计在统计方法中的地位,参数估计的方法,总体均值估计,总体比例估计,可以估计的总体参数,点估计,样本值(点估计),平均,比例,p,X,1、点估计(point estimate):用样本均值数直接作为总体均数的估计值。点估计是用相应样本平均直接作为其总体平均的估计值。样本比例估计总体比例如用 估计、S估计等。其方法虽简单,但未考虑抽样误差的大小。,抽样误差,随机误差是由偶然的原因造成的误差。抽样造成的误差不可避免,但可以控制和估计。如样本量越大则误差越小。,用EXCEL实验,从班级成绩中抽

2、出样本计算平均值,与班级平均值的差异就是误差。,演示无偏估计的意义,用EXCEL对班级成绩多次抽样,计算每次抽样的平均值。计算多次抽样的样本平均值的再平均。发现离总的全班有平均值差异很小。,抽样误差:由于抽样引起的样本统计量与总体参数之间的差异。抽样误差:样本均值估计总体均值时产生的误差。,称为抽样误差,区间估计是按预先给定的概率(1)所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间(confidence interval,CI);预先给定的概率(1)称为可信度或置信度(confidence level),常取95%或99%。可信区间通常由两个数值即可信限/置信限(con

3、fidence limit,CL)构成。其中较小的值称可信下限(lower limit,L),较大的值称可信上限(upper limit,U),一般表示为LU。,用区间表示正常值,估计区间,男女年龄组体重(千克)身高(厘米)体重(千克)身高(厘米)3.5岁13.9-17.695.0-103.113.5-17.294.0-101.84.0岁14.8-18.798.7-107.214.3-18.397.6-105.74.5岁15.7-19.9102.1-111.015.0-19.4100.9-109.35.0岁16.6-21.1105.3-114.515.7-20.4104.0-112.85.5岁

4、17.4-22.3108.4-117.816.5-21.6106.9-116.26.0岁18.4-23.6111.2-121.017.3-22.9109.7-119.67.0岁20.2-26.5116.6-126.819.1-26.0115.1-126.28.0岁22.2-30.0121.6-132.221.4-30.2120.4-132.49.0岁24.3-34.0126.5-137.824.1-35.3125.7-138.710.0岁26.8-38.7131.4-143.627.2-40.9131.5-145.116岁:体重:年龄x2816公斤身高:年龄x677101厘米,正常范围(nor

5、mal range value),在临床医学上成年人血压的正常值范围是:收缩压90-139mmHg,舒张压60-89mmHg;脉压差正常范围是30-40 mmHg。,中国人平均正常血压参考值(mmHg),人的血压正常范围(normal range value),网络搜索,化验的正常值,肝功能化验结果正常值如下:用区间表示ALT(谷丙转氨酶)正常值:男5-40 U/L,女5-35 U/L。AST(谷草转氨酶)正常值:8-40 U/L。AST/ALT(谷草/谷丙)正常值:1.0-2.0。GGT(谷氨酰转移酶)正常值:男 11-50 U/L,女 7-32 U/L。ALP(碱性磷酸酶)正常值:成人40

6、-150 U/L。TBILI(总胆红素)正常值:3.0-20.0 umol/L。DBILI(直接胆红素)正常值:1.7-8.0 umol/L。PT(凝血酶原时间)正常值:11-14秒。,IBILI(间接胆红素)正常值:3.4-13.5 umol/L。PTA(凝血酶原活动度)正常值:80-100。TP(总蛋白)正常值:成人坐立位:64-83 g/L;成人卧位:60-78 g/L。AFP(甲胎蛋白)正常值:50g/L。ALB(白蛋白)正常值:35-52g/L。IgG(免疫球蛋白G)正常值:12.871.35g/L。GLB(球蛋白)正常值:22-38 g/L。IgA(免疫球蛋白A)正常值:2.350

7、.34g/L。ALB/GLB(白球比)正常值:1.3-2.5。IgM(免疫)正常值:1.080.24g/L。GLU(葡萄糖)正常值:3.9-6.1 mmol/L。C3(补体3)正常值:1.140.27g/L。BUN(尿素氮)正常值:2.9-8.2 mmol/L。,C4(补体4)正常值:553109mg/L。CHE(胆碱性酯酶)正常值:5000-12000 U/L。CK(肌酸激酶)正常值:24.0195.0。CHOL(总胆固醇)正常值:3.356.45。TRIG(甘油三酯)正常值:0.481.71。CRE(肌酐)正常值:男 62-115 umol/L,女 53-97umol/L。URIC(尿酸)

8、:男 208-428 umol/L,女155-357umol/L。LDH-L(乳酸脱氢酶)正常值:109245。T淋巴细胞亚群 CD3正常值:0.56-0.76。T淋巴细胞亚群 CD4正常值:0.38-0.52。T淋巴细胞亚群CD5正常值:0.22-0.32。,点估计与区间估计,点估计是一个数值,置信区间提供了更多的变化信息,点估计,置信下限,置信上限,置信区间宽度,区间估计(interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数

9、在7585之间,置信水平是95%,一般公式,所有估计区间的一般公式,点估计(临界值)(标准误差),点估计(2)(标准误差),意义:虽然不能知道某市全体成人脉搏均数的确切数值,但有95%的把握说该市全体成人脉搏均数在73.9次/分-75.1次/分之间,有99%的把握说该市全体成人脉搏均数在 73.7次/分-75.3次/分之间。换句话说,做出该市成人脉搏均数为73.9次/分-75.1次/分的结论,说对的概率是95%,说错的概率是5%;做出该市成人脉搏均数为73.7次/分-75.3次/分的结论,说对的概率是99%,说错的概率是1%。,区间估计的图示,将构造置信区间的步骤重复很多次,置信区间包含总体参

10、数真值的次数所占的比例称为置信水平 表示为(1-为是总体参数未在区间内的比例常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10,置信水平(confidence level),由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数以一定的概率落在这一区间的表述是错误的,置信区间(c

11、onfidence interval),置信区间与置信水平,Intervals and Level of Confidence,Confidence Intervals,Intervals extend from to,(1-)x100%of intervals constructed contain;()x100%do not.,Sampling Distribution of the Mean,x,x1,x2,总体平均的抽样估计,用样本均值,估计总体均值,抽样估计误差为,抽样误差,是无法直接求出得,,因为,是未知的,,换一个思考方法,是已知的,将求,的问题,转换为求,称为极限误差(边际误差

12、),抽样误差的最大限,置信区间的半径。,假若已经求出极限误差,则,展开不等式得,得到了总体均值,估计区间,总体均值=,样本均值,是的无偏估计,设总体的标准差为,由中心极限定理得,服从正态分布,由,得到极限误差,由中心极限定理,用样本标准差s代替查正态分布表得到,可以计算极限误差,用代替时,严格地讲,统计量,服从自由度为n-1的分布,大样本时用正态分布近似计算,统计用的样本一般都 是大样本。大于。服从,EXCEL计算置信区间,影响区间宽度的因素,1.总体数据的离散程度,用 来测度样本容量n,置信水平(1-),影响 z 的大小,总体比例(成功率)的估计,有些社会随机现象中只有两个结果:成功与失败,

13、成功 失败 射击 命中 不中考试 及格 不及格产品 合格 不合格 选举 同意 不同意,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为,比例(proportion),当样本容量很大时,样本比例的抽样分布可用正态分布近似 推断总体比例的理论基础,样本比例的抽样分布,样本比例的数学期望样本比例的方差,样本比例的抽样分布(数学期望与方差),是非标志的标准差,是非标志的平均数为P。,由于标准差有良好的数学性质,相比较而言,它的应用最为广泛。,返回,由中心极限定理知:,例:某厂对一批产品的质量进行检验,抽样取200只,样品优质率85%,计算置信度95%时总体优质率估计区间,有人問皮爾遜他所記得最早的事,他說我不記得那時是幾歲,但是我記得是坐在高椅子上吸吮著大拇指,有人告訴我最好停止吮它,不然被吮的大拇指會變小。我把兩手的大拇指並排看了很久,它們似乎是一樣的,我對自己說:我看不出被吸吮的大拇指比另一個小,我懷疑她是否在騙我。海伦华克指出不盲信权威,要求实证,对于自己对观测数据的意义的解绎深具信心,和怀疑与他的判断不同的人态度是否公平这些就是皮爾遜一生独具的特征。,正常值范围估计与可信区间估计,主要城市平均气温 2009年)单位:摄氏度(),谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号