《应用统计学第四章推断统计.ppt》由会员分享,可在线阅读,更多相关《应用统计学第四章推断统计.ppt(33页珍藏版)》请在三一办公上搜索。
1、,第一节 参数估计 第二节 假设检验,主要内容,第一节 参数估计,一、概念 1、参数估计:在抽样分布及抽样分布的基础上,据样本统计量来推断总体参数的统计方法。,2、估计量:用来估计总体参数的统计量的名称;估计值:计算得到的样本估计量的具体数值,点估计:用样本估计量直接作为总体参数估计值 3、区间估计:在点估计基础上,依照一定的概率保证度 用样本估计值估计出总体参数取值的区间 范围。,4、置信区间:由样本统计量所构造的总体参数的估计区间,用()来表示,即(置信下限,置信上限)。,5、置信水平也称为置信度用 表示 表示置信区间 包括总体参数真值 的概率,记为,则总体参数真值有 的可能性落在置信区间
2、 内。其中 为事先给定的概率值,称为显著性水平。,二、估计量的评选标准,(一)无偏性 样本估计量的均值等于该样本统计量所估计的总体参数的真实值,则称该估计量为无偏估计量。也称为相合性,当样本容量n增加时,如果估计量越来越接近总体参数的真实值,则称这个估计量为一致估计量。,(二)一致性,是指估计量与总体参数的离散程度应该很小,即估计量的方差应该很小,这样才能保证估计量的取值集中在被估计的总体参数的附近,对总体参数的估计和推断更可靠。,(三)有效性,三、均值的区间估计,1、一个总体均值 的置信区间:(1)大样本(n 30)时,总体均值的置信区间为:方差 已知时:方差 未知时:(用 代替)补充:当样
3、本来自非正态总体时,应将样本容量增加到30以上,再进行抽样和区间估计,均值的置信区间同上面推导的大样本(n 30)的情况。,一个总体均值的置信区间,(2)样本来自正态总体 样本容量为小样本即(n 30)时,总体均值的置信区间为:已知时,未知时,,样本来自正态总体,样本容量为小样本即(n 30)总体方差 未知时,总体均值置信区间的求解,例1 现从一批灯泡中随机地取16只,测的其使用寿命(以小时为单位)如下表所示。设灯泡的使用寿命近似地服从正态分布,试求灯泡的平均使用寿命95%的置信区间。解:总体的方差未知,故总体均值的置信区间为:而,经过计算得,又查表得,故所求的置信区间为(1476.8,150
4、3.2)。,例2:某食品生产企业以生产袋装食品为主,每天的产量为8000袋左右,按照规定每袋的重量应为100克,为对产品质量进行监测,企业质检部门从某天生产的一批产品中随机抽取了64袋,测得该样本的均值为105.36克,标准差为10克,试估计该批产品平均重量的置信区间为多少?(置信度为95%)例3:从某公司生产的一批瓶装产品中,随机抽取10罐产品,测得每罐的重量分别为318、320、322、321、321、323、319、320、320、324(克),以95%的置信度求该公司这批产品平均重量的置信区间。(产品重量服从正态分布),四、一个总体方差的区间估计,复习:设 来自正态总体 的样本,分别为
5、样本的均值和方差。则 样本来自正态总体,则总体方差 的置信区间为,五、总体比率的区间估计,由样本比率的抽样分布可以知,当样本容量 足够(一般指不小于30,且 都大于5),样本比率的抽样分布近似正态分布。设总体比率为,则有 对于置信度,P的置信区间为,五、总体比率的区间估计,由样本比率的抽样分布可以知,当样本容量 足够(一般指不小于30,且 都大于5),样本比率的抽样分布近似正态分布。设总体比率为,则有 对于置信度,P的置信区间为,例4:对某种奶粉进行检查,从中随机抽取20袋,测得样本的平均重量为250.8克,标准差为1.25克,已知其重量服从 正态分布,求总体方差在置信度为90%时的置信区间为
6、多少?例5:某城市要估计下岗职工中女性所占的比例,随机抽取了100个职工,其中65人为女性。对于置信度95%,试求该城市下岗职工中女性所占的比例的置信区间为多少?,第二节 假设检验,一、假设检验的基本问题 1、假设检验:在总体的分布函数已知,但参数未知时,先对总体分布中的未知参数(均值、比率、方差)提出假设,利用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。,补充知识:假设检验的原理,例题:某企业用自动打包机打包装食盐,当机器正常工作时,每袋食盐的均值为0.5公斤,标准差为0.015公斤。每天开工后企业都需要检验一次打包机工作是否正常,则企业该如何做?(食盐总量服从正态分布)原理:
7、抽取一定样本测得其重量均值为,然后比较 数值的大小,如果其值较小,则认为打包机工作正常,如果其值较大,则认为打包机工作不正常。大小的判断标准可有临界值 的大小来衡量,其值大的概率为,小的概率为。概率很小的事件在一次试验中几乎是不会发生的,如果发生了则应作出拒绝或者接受假设的判断。,一、假设检验的基本问题,2、两个对立的假设,备择假设(H1):研究者予以支持的假设。表示为总体参数“、”某个给定的数值。,原假设(H0):检验中予以拒绝或者接受的假设,备择假设的对立 假设,检验的目的就是为了收集证据拒绝原假设。表示为总体参数“、”某个给定的数值。,3、两类错误,“弃真”错误:原假设为真时,我们却作出
8、拒绝的错 误决策,称这类为第一类错误。该错误发生的概率为。“取伪”错误:当原假设为假时,我们却接受了原假设,称这类错误为第二类错误。,4、显著性检验和显著性水平,显著性检验:这种只对犯第一类错误的概率加以控制,而不考虑 犯第二类错误的检验问题,称为显著性检验问题。,显著性水平:“弃真”错误发生的概率,是事先给定的概率 值,也是统计量落在拒绝区域的概率。,5、拒绝域:拒绝原假设的统计量所有可能取值组成的集合。,6、检验统计量:据样本观测计算得到的,并据此对原假设和备择假设 做出决策的某个样本统计量,7、假设检验的类型及拒绝域的决定:双侧检验,备择假设为“”,拒区域位于临界值两侧;右侧检验,备择假
9、设为“”,拒区域位于临界值右侧;左侧检验,备择假设为“”,拒区域位于临界值左侧;,8、参数假设检验问题的步骤:,第一步:根据实际问题的要求,提出原假设和备择假设;第二步:给定显著性水平以及样本容量;第三步:确定检验统计量及其分布,并由原假设的内容 确定拒绝域的形式(构建统计量);第四步:由 拒绝|为真=求出拒绝域;第五步;根据样本观测值计算检验统计量的具体值;第六步;作出拒绝还是接受原假设的统计判断。,二、单个总体参数的假设检验,1、一个正态总体均值的假设检验(1)大样本(n30)复习:大样本(n 30),由中心极限定理可知,不论总体服从什么分布 样本均值,则令Z=大样本(n30),已知时,检
10、验统计量为 大样本(n30),未知时,检验统计量为(用S2代替总体方差),例1 某厂生产某种型号的内胎,从长期的生产经验知道其扯断强力服从均值=1380(N/),标准差=50(N/)的正态分布。该厂为提高产品的质量,改变了原来的配方进行现场生产试验。设新配方生产的内胎其扯断强力仍服从正态分布。由于在试验中除配方外,其他条件都保持不变,因此可以认为新配方未改变此型号内胎扯断强力的方差。采用新配方的5 次试验,测得内胎扯断强力为(单位:N/):1450,1460,1360,1430,1420,试问采用新配方,是否能提高内胎的扯断强力?,解:第一步:提出假设 第二步:计算检验统计量 解得,=50,=
11、1380,求得 第三步:确定拒绝域,备择假设为“”,则为右侧检验,拒绝 域为 Z,=0.05,=第四步:由,可知Z,落在拒绝域,拒绝原假设。,(2)小样本(n30)复习:小样本(n30),总体方差 未知,小样本(n30),总体方差 未知,检验统计量小样本(n30),总体方差 已知,检验统计量,例2 某种元件,按照标准其使用寿命不低于1000(小时),现从生产出的一批元件中随机抽取25件,测得其平均寿命为950(小时),样本标准差为100(小时)。假设该种元件寿命服从正态分布,对于置信度95%,试问这批元件是否可以认为合格?解 此问题即要检验 检验统计量 而由已知可得,,,n=25,计算得到 备
12、择假设为“”,则是左侧检验,拒绝域为。查表求得,可知 故拒绝原假设,认为这批元件不合格。,练习,例3:有人说某学院学生平均每天锻炼时间至少为30分钟,随机在该学院抽取100名学生,测得他们每天的平均锻炼时间为31分钟,标准差为12分钟,试在显著性水平为0.05时,检验该人的说法是否可信?例4:某停车场管理员认为,该停车场每辆车平均停车时间不会超过30分钟,现从该停车场随机抽取16辆汽车进行观测,测得平均停车时间为28分钟,标准差为5.3分钟,试在=0.05时,检验该管理人员的说法是否可信?(车辆的停车时间服从正态分布),2、单个正态总体 的方差检验,复习:设 来自正态总体 的样本,分别为样本的
13、均值和方差。则方差的检验统计量为:,3、一个总体比率的假设检验,由样本比率的抽样分布可以知,当样本容量 足够大(一般指不小于30,且 都大于5),样本比率的抽样分布近似正态分布。设总体比率为,则有 比率的检验统计量为,练习,例5:某公司为了分析新产品的电视广告效果,随机访问了100名用户,了解到其中有36人是通过电视广告了解该产品的。试以0.05的显著性水平作出判断,此项调查结果是否支持全部用户有一半以上是通过电视广告了解该产品的假定是否正确?例6:一家制造厂仅当原材料的抗强度方差不超过5时,方予接受材料,今从一批新到的原材料中抽出24个样本,测得方差为7,这个数据能否为制造厂拒绝这批原材料提供充分依据?(=0.05),