《复习研究生应用数.ppt》由会员分享,可在线阅读,更多相关《复习研究生应用数.ppt(50页珍藏版)》请在三一办公上搜索。
1、在前面我们曾经定义过事件的条件概率,同样也可以考虑一个随机变量的条件分布,其条件与另一随机变量的取值有关。,离散型,四 条件分布,连续型,定义,例,其中第一个参数是x的线性函数,第二个参数与x无关,此结论在一些统计问题中很重要。,例1 设 的联合分布密度为,解 关于 的边缘密度为,于是,下面讨论无偏估计方差的下界,达到这个下界的无偏估,量称为优效估计量(最小方差无偏估计)。,定理:罗克拉美不等式(条件见书),罗克拉美不等式,右端为罗克拉美下界,记为,类似:,注:有时能找到无偏估计使它的方差达到这个下界,有时达不到,见书上p60 例和例3.2.5.,正确,正确,假设检验的两类错误,犯第一类错误的
2、概率通常记为 犯第二类错误的概率通常记为,任何检验方法都不能完全排除犯错,假设检验的指导思想是控制犯第一类,误的可能性.理想的检验方法应使犯两类,错误的概率都很小,但在样本容量给定的,情形下,不可能使两者都很小,降低一个,往往使另一个增大.,错误的概率不超过,然后,若有必要,通,过增大样本容量的方法来减少.,1 非正态总体参数的假设检验,设总体 X 服从参数为 p 的(01)分布,即,1(01)分布参数的假设检验,由于,因此由中心极限定理可知,当,成立且样本容量,n充分大时,统计量,服从标准正态分布N(0,1).,=该假设检验问题的拒绝域为,近似地,例1 某种产品在通常情况下次品率为5%.现在
3、从生产出的一批产品中随机地抽取50件进行检验,发现有4件次品.问能否认为这批产品的次品率为5%?(=0.05),解 设这批产品的次品率为 p.,在这批产品中任,任意取一件产品,定义随机变量 X 如下,检验假设,该假设检验问题的拒绝域为,现在,统计量U的值为,=接受假设,=可以认为这批产品的次品率为5%,2.总体均值的假设检验,假设总体X 的均值为,方差为,为 X 的样本,检验假设,由中心极限定理知,当样本容量n充分大时,,近似地服从标准正态分布N(0,1),由于样本方差,为,的无偏估计量,,且样本容量n充分大时,统计量,仍近似地服从标准正态分布N(0,1),=该假设检验问题的拒绝域为,例2 某
4、电器元件的平均电阻一直保持在2.64.改变加工工艺后,测得100个元件的电阻,计算得平均电阻为 2.58,样本标准差为0.04.在显著性水平=0.05下,判断新工艺对此元件的平均电阻有无显著影响.,解 设该电器元件的电阻为X,其均值为,检验假设,拒绝域为,现在,统计量U的值为,=拒绝假设,接受假设,=新工艺对电子元件的平均电阻有显著影响.,3.两个总体均值的假设检验,设总体,和,相互独立,,的样本,是,是 Y 的样本.记,设总体 X的均值为,,方差为,总体 Y的均值为,,方差为,的拒绝域.,由中心极限定理知,当样本容量,和,都充分大时,,近似地服从标准正态分布,由于样本方差,和,分别为,和,的
5、无偏估计量,因此,可以,分别用,和,近似代替,和,,并且当,求假设检验问题,和,近似地服从标准正态分布,,从而当原假设,成立时,,统计量,仍近似地服从标准正态分布.,都充分大时,,统计量U的值应该在零附近摆动,,当,过大时就认为,不成立.,=该假设检验问题的拒绝域为,例3 两台机床加工同一中轴承,现在从他们加工的轴承中分别随机地抽取200根和100根,测量其椭圆度(单位:mm),经计算得,能否认为这两台机床加工的轴承的平均椭圆度是相同的(=0.05),解设这两台机床加工的轴承的椭圆度分别为X,Y,且,检验假设,由于题目给出的两个样本都是大样本,因此该假设检验问题的拒绝域为,现在,=拒绝原假设,
6、即认为这两台机床加工的,轴承的平均椭圆度是不相同的.,2 分布拟合检验,设总体X的实际分布函数为F(x),它是未知的.,为来自总体 X的样本.,根据这个样本来检验总体X的分布函数F(x),是否等于某个给定的分布函数 F0(x),即检验假设,:,注意:若总体 X 为离散型的,则,相当于,总体 X 的分布律为,若总体 X 为连续型的,则,相当于总体 X 的,概率密度为 f(x).,(1)若,中,的分布函数,不含未知参数.,两两互不相交的子集,=在n次试验中,事件 Ai发生的频率为 fi/n,另一方面,当H0为真时,可以根据H0所假设的 X 的分,布函数来计算,选取统计量,来度量样本与H0中所假设的
7、分布的吻合程度,hi是给定的常数。,如果选取,则上述统计量变成,定理1(皮尔逊)当H0为真且n充分大时,统计量,近似服从,分布.,由定理1,若给定显著性水平,则前述假设检验问题的拒绝域为,(2)若H0中X 的的分布函数含有未知参数.,此时,首先在假设下利用样本求出未知参数的最大似然估计,以估计值作为参数值,然后再根据 H0中所假设的 X 的分布函数 F(x)求出 pi的估计值,并在,为真且,充分大时,统计量,定理2(皮尔逊)当,近似服从,分布,其中r是 X的分布函数,F(x)包含的未知参数的个数.,若给定显著性水平,则前述假设检验问题的拒绝域为,注意:运用,检验法检验总体分布,把样本数据进,(
8、1)大样本,通常取,(2)要求各组的理论频数,或,(3)一般数据分成7到14组.有时为了保证各组,行分类时,组数可以少于7组,例1 孟德尔在著名的豌豆杂交实验中,用结黄色圆形种子与结绿色皱形种子的纯种豌豆作为亲本进行杂交,将子一代进行自交得到子二代共556株豌豆,发现其中有四种类型植株,(黄圆)(黄皱)(绿圆)(绿皱),总计,315株,101株 108株,32株 556株,试问这些植株是否符合孟德尔所提出的,的理论比例,解 检验假设,由,由n=556,得,而,计算得,由=0.05,自由度,查,分布表得,=在=0.05下接受,=这些植株是符合孟德尔所提出的,的理论比例,上述置信区间中置信限都是双
9、侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.,例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.,这时,可将置信上限取为+,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.,三、单侧置信区间,于是引入单侧置信区间和置信限的定义:,又若统计量 满足,由于方差 未知,,解:的点估计取为样本均值,选取统计量为,对给定的置信水平,确定分位数,使,即,于是得到 的置信水平为 的单侧置信区间为,将样本值代入得,的置信水平为0.95的单侧置信下限是,1065小时,例5 为估计制造某种产品所需要的单件平均工时(单位:小时),现制造5件,记录每件所需工时如下10.5 11.0 11.2 12.5 12.8假设制造单位产品所需工时,试求平均工时的置信水平为0.95的单侧置信上限.,解 由于,其中,未知,因此,对于给定的,由,分布的上,分位点的定义,存在,使得,而,所以,即,故,的单侧置信区间为,单侧置信上限为,经计算得,由,得,从而可得单侧置信上限,因此,加工这种产品的平均工时不超过12.55小时的可靠程度是95%.,