《置信区间详细定义及计算.ppt》由会员分享,可在线阅读,更多相关《置信区间详细定义及计算.ppt(39页珍藏版)》请在三一办公上搜索。
1、1,第四节,第七章,置信区间的概念,一、置信区间的概念,二、数学期望的置信区间,三、方差的置信区间,2,一、置信区间的概念,这种形式的估计称为区间估计.,前面,我们讨论了参数点估计.,它是用样本算得的,一个值去估计未知参数.,但是点估计值仅仅是未知参数,的一个近似值,,它没有反映出这个近似值的误差范围,,使用起来把握不大.,范围通常用区间的形式给出的。,较高的可靠程度相信它包含真参数值.,也就是说,我们希望确定一个区间,,使我们能以比,这里所说的“可靠程度”是用概率来度量的,,称为置信概率,置信度或置信水平.,习惯上把置信水平记作,,这里 是一个很小,的正数,称为显著水平。,3,定义7.6,若
2、由总体X的样本 X1,X2,Xn 确定的,则称 为随机区间。,两个统计量,其长度与在数轴上,的位置与样本,有关。,当一旦获得样本值,那么,,都是常数。,为常数区间。,4,定义7.7,若满足,设 是总体X的 一个未知参数,,的置信区间.,(双侧置信区间).,的置信水平(置信度)为,分别称为置信下限和置信上限,为显著水平.,为置信度,,则称区间 是,若存在随机区间,对于给定的,5,置信水平的大小是根据实际需要选定的.,根据一个实际样本,,,使,一个尽可能小的区间,由于正态随机变量广泛存在,,指标服从正态分布,,特别是很多产品的,我们重点研究一个正态总体情形,由给定的置信水平,我们求出,即取置信水平
3、 或 0.95,0.9 等.,例如,通常可取显著水平 等.,数学期望 和方差 的区间估计。,6,设,分别是样本均值和样本方差。,对于任意给定的,,我们的任务是通过样本寻找一,它以1的概率包含总体X的数学期望。,个区间,,7,一、数学期望的置信区间,设,则随机变量,1、已知2时,的置信区间,令,8,令,这就是说随机区间,它以1的概率包含总体 X的数学期望。,由定义可知,此区间即为的置信区间。,9,这就是说随机区间,置信区间也可简记为,它以1的概率包含总体X的数学期望。,由定义可知,此区间即为的置信区间。,其置信度为 1。,置信下限,置信上限,10,若取,查表得,若由一个样本值算得样本均值的观察值
4、,则得到一个区间,我们称其为置信度为0.95的的置信区间。,其含义是:,若反复抽样多次,每个样本值(n=16)按公式,即,确定一个区间。,11,确定一个区间。,在这么多的区间内包含的占0.95,不包含的占0.05。,本题中,属于那些包含的区间的可信,程度为0.95.,或“该区间包含”这一事实的可信程度,注:的置信水平1的置信区间不唯一。,为0.95.,12,由中心极限定理知,,当 n 充分大时,,无论X服从什么,分布,都近似有,的置信区间是总体,的前提下提出的。,均可看作EX的置信区间。,13,例1,设总体X N(,0.09),有一组样本值:12.6,13.4,12.8,13.2,求参数的置信
5、度为0.95的置信区间.,解,的置信区间为,代入样本值算得,12.706,13.294.,得到的一个区间估计为,注:该区间不一定包含.,有 1=0.95,0=0.3,n=4,14,又如,上例中同样给定,可以取标准正态分布上,分位点z0.04 和 z0.01,则又有,则的置信度为0.95的置信区间为,与上一个置信区间比较,同样是,其区间长度不一样,上例,比此例,短。,15,置信区间短表示估计的精度高,,第一个区间为优,(单峰对称的)。,可见,像 N(0,1)分布那样概率密度,的图形是单峰且对称的情况。,当n固定时以,的区间长度为最短,,我们一般选择它。,若以L为区间长度,则,可见L随 n 的增大
6、而减少(给定时),,有时我们嫌置信度0.95偏低或偏高,,也可采用0.99或,0.9.,对于 1 不同的值,,可以得到不同的置信区间。,16,估计在区间 内.,这里有两个要求:,只依赖于样本的界限(构造统计量),可见,对参数 作区间估计,,就是要设法找出两个,一旦有了样本,就把,2.估计的精度要尽可能的高.如要求区间长度,尽可能短,或能体现该要求的其它准则.,1.要求 很大的可能被包含在区间 内,,就是说,概率,即要求估计尽量可靠.,要尽可能大.,可靠度与精度是一对矛盾,,条件下尽可能提高精度.,一般是在保证可靠度的,17,例2,已知某种油漆的干燥时间X(单位:小时),服从正态分布,其中未知,
7、现在抽取,25个样品做试验,,得数据后计算得,取,求的置信区间。,解,所求为,18,例3,中随机地抽查了9人,其高度分别为:,已知幼儿身高,现从56岁的幼儿,115,120,131,115,109,115,115,105,110cm;,19,2、未知2时,的置信区间,当总体X的方差未知时,,容易想到用样本方差 2代替2。,已知,则对给定的,令,查t 分布表,可得,的值。,则的置信度为1 的置信区间为,20,例4,40名旅游者。,解,本题是在2未知的条件下求正态总体参数的,置信区间。,选取统计量为,由公式知的置信区间为,查表,则所求的置信区间为,为了调查某地旅游者的消费额为X,,随机访问了,得平
8、均消费额为,元,样本方差,设,求该地旅游者的平均消费额,的置信区间。,若225,的置信区间为,即,21,例5,用某仪器间接测量温度,重复测量5次得,求温度真值的置信度为 0.99 的置信区间。,解,设为温度的真值,,X表示测量值,通常是一个,正态随机变量,问题是在未知方差的条件下求的置信区间。,由公式,查表,则所求的置信区间为,22,例6,解,本题是在2未知的条件下求正态总体参数的,置信区间。,由公式知的置信区间为,查表,则所求的置信区间为,为了估计一批钢索所能承受的平均张力(单位,kg/cm2),设钢索所能承受的张力X,,分别估计这批钢索所能承受的平均张力,的范围与所能承受的平均张力。,随机
9、选取了9个样本作试验,,即,则钢索所能承受的平均张力为 6650.9 kg/cm2,由试验所得数据得,23,三、方差2的置信区间,下面我们将根据样本找出2 的置信区间,,这在研究,生产的稳定性与精度问题是需要的。,已知总体,我们利用样本方差对2进行估计,,由于不知道S2与,2差多少?,容易看出把,看成随机变量,又能找到,它的概率分布,则问题可以迎刃而解了。,的概率分布是难以计算的,而,对于给定的,24,即,则得到2随机区间,以 的概率包含未知方差2,,这就是2的置信度为,1的置信区间。,25,例1,某自动车床加工零件,抽查16个测得长度(毫米),怎样估计该车床加工零件长度的方差。,解 先求,2
10、的估计值,或,查表,26,所求2的置信度为0.95的 置信区间,所求标准差的置信度为0.95的 置信区间由,得,得,27,例2,为了估计灯泡使用时数(小时)的均值和,解,查表,测试了10个灯泡得,方差2,,若已知灯泡的使用时数为X,,求和2的置信区间。,由公式知的置信区间为,的置信区间为,查表,即,由公式知2的置信区间为,2的置信区间为,28,例3,电动机由于连续工作时间(小时)过长会烧坏,,解,查表,烧坏前连续工作的时间X,得,求和2的置信区间。,今随机地从某种型号的电动机中抽取9台,,测试了它们在,设,由公式知的置信区间为,即,所求2的置信度为0.95的 置信区间,得,29,寻找置信区间的
11、方法,一般是从确定误差限入手.,使得,称 为 与 之间的误差限.,,可以找到一个正数,,只要知道 的概率分布,确定误差限并不难.,我们选取未知参数的某个估计量,,根据置信水平,这个不等式就是我们所求的置信区间.,30,单正态总体的区间估计,31,作业,P294 4 5 6 8 10 12,32,婴儿体重的估计,例4 假定初生婴儿的体重服从正态分布,随机抽取12 名婴儿,测得体重为:(单位:克)3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540 试以 95%的置信度估计初生婴儿的平均体重以及方差.,解 设初生婴儿体重为X 克,则
12、 XN(,2),(1)需估计,而未知 2.,33,作为统计量.,有=,n=,,t0.025(11)=,,即,的置信区间。,(1)需估计,而未知 2.,34,(2)需估计2,而未知,,有 20.025(11)=,20.975(11)=,,35,例5,解,由置信区间的概念,所求的0.99的 置信区间为,在交通工程中需要测定车速(单位 km/h),由以往,2、现在作了150次观测,试问平均测量值的误差在,的经验知道,,即,测量值为X,,测量值的误差在 之间。,1、至少作多少次观测,才能以0.99的可靠性保证平均,之间的概率有多大?,由题意要求,用平均测量值 来估计,其误差,由题意知,36,至少要作8
13、6次观测,,才能以0.99的可靠性保持平均测量,误差在,之间。,即,则钢索所能承受的平均张力为 6650.9 kg/cm2,令,37,例6,设总体X N(,0.09),有一组样本值:12.6,13.4,12.8,13.2,求参数的置信度为0.95的置信区间.,解:有1=0.95,0=0.3,n=4,是的无偏估计量,是优良估计量,且,从而,38,在标准正态分布表中查得上侧分位数,得的置信区间为,Z/2=Z0.025=1.96,39,代入样本值算得,得到的一个区间估计为,12.706,13.294.,注:该区间不一定包含.,总结此例,做了以下工作:,1)根据优良性准则选取统计量来估计参数;,是的优良估计量:无偏、有效、相合.,