《统计推断》PPT课件.ppt

上传人:牧羊曲112 文档编号:5568432 上传时间:2023-07-29 格式:PPT 页数:95 大小:419KB
返回 下载 相关 举报
《统计推断》PPT课件.ppt_第1页
第1页 / 共95页
《统计推断》PPT课件.ppt_第2页
第2页 / 共95页
《统计推断》PPT课件.ppt_第3页
第3页 / 共95页
《统计推断》PPT课件.ppt_第4页
第4页 / 共95页
《统计推断》PPT课件.ppt_第5页
第5页 / 共95页
点击查看更多>>
资源描述

《《统计推断》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计推断》PPT课件.ppt(95页珍藏版)》请在三一办公上搜索。

1、第四章统计推断第一节 统计推断的基本概念第二节平均数的假设测验第三节二项资料的百分数假设检验,研究总体和样本的关系可从两个方向进行分析:一是从总体到样本方向抽样分布问题,可称为第方向;二是从样本到总体方向统计推断(statistical inference)问题,可称为第方向,两者互为逆命题.,本章主要讲述第方向。用样本平均数可以估计总体平均数,但样本平均数有误差,所以推断结论并非绝对正确。之间的差异来自两方面:真实差异和抽样误差。需要对其进行判断。,第一节 统计推断的基本概念,一、统计推断 统计推断就是根据抽样分布律和概率理论,用样本统计数推断总体参数。,统计推断包括参数估计(paramet

2、ric estimate)和统计假设测验(hypothesis test)两个方面的内容。统计推断的前提条件:资料来自随机样本、统计数分布律已知。,二、参数估计 指用样本统计数对总体参数作点估计(point estimate)和区间估计(interval estimate)。、点估计就是用样本统计数直接估计相应的总体参数,例如用 估计;用s2估计2等。,、根据抽样分布试验,样本统计数亦是一个随机变数,所以不同的样本会有不同的估计值,即点估计具有一定的偏差,因此有必要估算一个取值范围,使总体参数能够以很高的置信度落在这个区间内,这种用样本统计数在一定的概率保证下估计总体参数所在范围的方法,称为参

3、数的区间估计。,总体参数可能所在的区间称为置信区间(confidence interval)。置信区间的上下限称为置信限(confidence limits)。保证参数在该区间内的概率称为置信系数或置信度(confidence coefficient),以1-表示。,第一节 统计推断的基本概念,其中称为显著水平(significance level):是指用于测验假设的概率标准。农业试验中,一般取0.05和0.01,达到0.05显著水平称为检验对象间差异显著,用表示;达到0.01显著水平称为检验对象间差异极显著,用表示,以式表示为:P(L1L2)=1-式中指总体参数,如:、2、1-2等。L1和

4、L2称为置信限,其中L1称为置信下限;L2称为置信上限。,第一节 统计推断的基本概念,第一节 统计推断的基本概念,三、假设测验,假设检验就是用样本统计数对总体假设的真伪做出检验的概率方法。,第一节 统计推断的基本概念,四、无效假设和备择假设,统计假设分为两类:、无效假设(null hypothesis):用于检验的假设,以其为前提可以计算试验结果出现的概率。指总体参数与其假设值之间无实质性差异,其差异由抽样误差造成。记作:H0。,无效假设的目的:可以从假设的总体里推断其随机抽样平均数的分布,从而可以计算出某一样本平均数指定值出现的概率,即研究总体和样本的关系,进行假设检验。,、备择假设(alt

5、ernative hypothesis):无效假设被否定后必须接受的后备假设。记作:HA注:H0和HA为对立事件,即:P(H0 HA),第一节 统计推断的基本概念,五、小概率原理(小概率事件的实际不可能原理)凡是概率很小的事件在一次试验中实际上是不可能出现的。统计推断是以小概率原理为基础而进行的。小概率的标准即为显著性水平。,第一节 统计推断的基本概念,六、接受区间与否定区间,在假设检验中,抽样分布曲线下接受Ho的区域称为接受区域(region of acce ptance),等于总体参数的置信区间,其置信概率为1-。否定Ho的区域称为否定区域(region of rejectio n),等于

6、总体参数置信区间以外的区域;其概率为显著水平,第一节 统计推断的基本概念,七、假设检验的基本步骤,(1)对样本所属的总体参数提出假设,包括无效假设Ho和备择假设HA。(2)确定显著水平.(3)计算。在Ho正确的前提下,根据统计数的抽样分布计算出所得样本统计数的概率p。(4)统计推断,将实得样本统计数的概率p与确定的显著水平相比较,依据概率大小作出应接受哪种参数假设的检验。(5)对结果进行解释。,第一节 统计推断的基本概念,例4.1:当地小麦品种亩产0公斤,多年种植的标准差公斤;新引进品种经25个小区试验,亩产量330Kg,问两者是否有显著差异?解:、Ho:Kg;HA:0Kg;.0.05、计算u

7、值,、根据.0.05,查表得临界值u0.05=1.96,第一节 统计推断的基本概念,所以,u u0.05,330Kg在抽样分布中的概率p0.05,故否定Ho:Kg;接受 HA:Kg。、差异显著,即330Kg所属的总体平均数与0=300的总体均数间有显著差异,或者说330Kg不属于0=300的总体。说明引进品种产量明显高于当地品种。,第一节 统计推断的基本概念,八、两尾检验和一尾检验,如果否定区域位于抽样分布曲线的两尾,左尾的概率为/2,右尾的概率亦为/2,则称这种假设检验为两尾检验(two-tailed test)。如果否定区域仅在抽样分布曲线的一尾,其概率为,则称这种假设检验为一尾检验(on

8、e-tailed test)。,当显著性水平相同时,一尾检验比两尾检验容易否定Ho,对鉴定差异的显著性较灵敏,其中,否定区域在左尾的称为左尾检验。否定区域在右尾的称为右尾检验,实得u值与临界值u直接比较否定Ho的标准检验方法 显著水平 显著水平(=0.05)(=0.01)两尾检验 u1.96 u2.576 左尾检验 u1.645 u2.326,第一节 统计推断的基本概念,两尾检验和一尾检验的主要区别:(1)两尾检验和一尾检验的的假设不同。(2)两尾检验和一尾检验用以划分两个总体的临界值不同。(3)一尾检验比两尾检验容易否定Ho,鉴定差异显著性的灵敏度较高。,第一节 统计推断的基本概念,九、假设

9、检验的两类错误,第一类错误:如果无效假设Ho为真,但通过检验却否定了它,这种错误称为弃真错误,又称统计错误的第类错误(type I error),其概率为显著水平。,第一节 统计推断的基本概念,第二类错误:如果无效假设Ho为伪,但通过检验确接受了它,这种错误称为取伪错误,又称为统计推断的第二类错误(type II error),其概率以记。,第一节 统计推断的基本概念,第一节 统计推断的基本概念,当用样本平均数总体均数作统计推断时,可能会发生第一类错误或第二类错误,但是两类错误不可能同时发生。第一类错误会对第二类错误产生影响,当显著水平从=0.05 减少到=0.01时,则会增大第二类错误的概率

10、,第一节 统计推断的基本概念,在假设检验中犯第一类错误的概率,其最大值为。,在假设检验中犯第二类错误的概率,其最大值为=1-。,关于两类错误:、样本容量n固定的条件下,提高显著水平(取较小的值),将增大第二类错误的概率值。、在n和相同的条件下,真总体平均值与假设总体平均值0的相差(以标准差为单位)愈大,则犯第二类错误的概率越小。,第一节 统计推断的基本概念,、为了降低犯两类错误的概率,需采用一个较低的显著水平,如=0.05;同时适当增加样本容量,或适当减小总体方差,或两者兼有之。、如果已固定,则改进试验技术和增加样本容量可有效降低犯第二类错误的概率。,第二节平均数的假设测验,一、单个样本平均数

11、的统计推断(一)单个样本平均数的假设检验,这是检验样本均数所属的总体均数与假设的总体均数0是否相等的假设检验。无效假设Ho:=0,0(或者Ho:0,HA:0)。,、u测验 当总体方差2已知或2未知但n30时,用u检验。例4.2:如引进品种与原地方品种比较,因2已知时,故用u检验:,第二节平均数的假设测验,第二节平均数的假设测验,例4.3:抽检了80包方便面,计得净重平均数=65.05(g),s=2.54(g),试检验该方便面净重的总体均数是否显著高于标准0=65(g)?假设 H0:65(g)对HA:65(g)显著水平=0.05 检验计算 虽然总体方差2未知,但是n30为大样本,故可用u检验。,

12、实得u65(g),即该方便面净重的总体均数与标准重量0=65(g)之间无显著差异,因而可以确定包装机工作正常。,第二节平均数的假设测验,、当总体方差2未知,且n30为小样本时,用t检验。,例4.4:随机抽样测定了某小麦品种的千粒重,n=8,观察值为32.7、36.8、35.9、34.6、35.6、37.6、33.4、35.1(g),试检验该小麦品种千粒重的总体均数与假设总体均数0=34(g)之间的差异显著性?,参数假设 Ho:=34g;HA:34g 显著水平=0.05 检验计算 由于总体方差2未知,且n30为小样本,故需用t检验。,df=n-1=8-1=7两尾临界值t0.05=2.3646,统

13、计推断:因p(t2.3646)=0.05,实得t值的概率p(t2.087)0.05,故接受Ho:=34(g),否定HA:34(g),即该小麦品种千粒重总体均数与假设总体均数0=34(g)之间无显著差异。,(二)总体均数的区间估计 当总体方差2已知或2未知但n30时,的1-的置信区间为:,(三)推断总体均数所需的样本容量 由样本均数的抽样分布可知,当n趋近时,必趋近,但是n 的增大必将使人力物力消耗增多,故n不可能很大。,用u替换上式中的u值,即可得推断总体平均数所需的样本容量。,若为 t分布,则:,二、两个样本平均数差数的统计推断(一)假设测验,、成组数据的比较(两个独立总体均数差数(1-2)

14、的假设检验),两个处理完全随机设计,各供试单位彼此独立,不论两处理的样本容量是否相同,所得数据为成组数据,(1)u测验:当两个总体方差12和22已知时,用u测验:,例4.5:某小麦平方米产量的20.4(Kg)2,在其地块内用、两法抽样:A法样点,(11.2Kg,B法8样点,21.4Kg。比较两法每平方米产量是否相等。,解:Ho:1=2,HA:12,0.05122220.4,n1=12,n2=8,|u|U0.05=1.96,所以接受Ho:1=2,两法所取每平方米产量相同,12-0.2属于抽样误差,()t测验 当两个总体方差12和22未知,但可假定1222,用t检验,首先计算两样本均方的加权平均数

15、:,然后计算两样本平均数差数的标准误:,最后计算t值:df=(n1-1)+(n2-1),例4.6 研究矮状素使玉米矮化的效果,测定使用矮壮素小区株,对照区株,试作假设测验。,_重 复 x1(CK)x2(处理)_ 1 170 160 2 270 160 3 180 200 4 250 160 5 270 200 6 290 170 7 270 150 8 230 210 9 170 _ n 9 8 233.3 176.3,解:由于用矮状素处理的玉米株高不可能大于对照的玉米株高,故作一尾检验。参数假设:Ho:21 对HA:21 显著水平=0.01 检验计算:SS1=18400 SS2=3787.5

16、,df=n1+n2-2=9+8-2=15 查t分布表得一尾检验的临界值t0.05=1.753,t0.01=2.6025,统计推断:因为p(t-2.6025)=0.01,实得t值的概率p(t3.05)0.01,故否定Ho:21,接受HA:21,即喷矮状素的玉米株高极显著地矮于对照。,近似t测验:当两个总体方差12和22未知,且1222,用近似t检验因为1222,差数标准误需用两个样本的S12、S22均方分别估计12、22,但所得t值不作准确的t分布,故仅能进行近似的t测验:需计算k和,具有自由度,、成对数据的比较,将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别

17、随机地给与不同处理,所得的观察值为成对数据,设两个样本的观察值分别为:x11,x12,x13,x1nx21,x22,x23,x2n n对观察值为:(x11,x21),(x12,x22),(x13,x23),(x1n,x2n)每对的差数:di=x2i-x1i,差数的平均数和方差为:,差数平均数的标准误:所以:,具有 df=n-1,若H0:d,则:,例4.7:同一番茄叶片分别接种、两种病毒,得病癍数如下。试测验两种处理方法的差异显著性。,解:Ho:d=0,HA:d0=0.01=(-15)+1+(-12)/7=-58/7=-8.3(个)=(-15)2+12+(-12)2=167.43=-8.3/1.

18、997=-4.16,df=n-1=7-1=6时,t0.01=3.707,|t|t0.01,推断:否定Ho:d=0,接受HA:d0,即:A、B两法病毒斑数有极显著差异。,(二)区间估计、两个总体均数差数(1-2)的区间估计,()两个总体方差12和22已知或虽未知但为大样本时(1-2)的置信区间为:,()当两个总体方差12和22未知,但可假定1222,且两个样本又为小样本时(1-2)的置信区间为:,()当两个总体方差12和22未知,且1222时(1-2)的置信区间为:,、成对数据总体差数d的置信限,(三)推断两个总体均数差数所需的样本容量、推断两个独立总体均数差数(1-2)所需的样本容量,、推断两

19、个配对总体差数均数d所需的样本容量 用替换上式中的t值,即可得到假设检验用于推断两个配对总体差数均数d所需的样本容量:,第三节二项资料的百分数假设测验,一、单个样本百分数(成数)的假设测验目的:测验某一样本百分数所属总体百分数与某一理论值或期望值p0的差异显著性。,例4.13:紫花与白花大豆杂交,F2共得289株:紫花208,白花81,测验是否符合一对等位基因的遗传规律?,解:对紫花H0:p=0.75;HA:p0.75,u0.05=1.96=208/289=0.7197|u|u0.05,所以接受H0:p=0.75,即符合一对等位基因的遗传规律,与p之间的差异属随机误差。,也可用次数资料进行测验

20、:np=2890.75=216.75所以:结果同上。,二、两个样本百分数相比较的假设测验目的:测验两个样本百分数和所属总体百分数p1和p2的差异显著性。总体百分数已知时,样本差数标准误:,若 p1=p2=p;q1=q2=q:总体百分数p1、p2未知,在 假设下:,差数标准误:由 可测验Ho.,例4.14:调查两地块小麦锈病,测验锈病率有无差异。n1=378株,x1=355株,=93.92%n2=396株,x2=346株,=87.31%解:H0:p1=p2;HA:p1p2,u0.05=1.96,所以:否定H0:p1=p2,接受HA:p1p2,三、二项样本假设测验时的连续性校正,二项资料是间断性变

21、数,用连续型分布进行测验时会有误差,易发生第一类错误,所以在n30或 时需进行连续性校正。,、单个样本百分数的连续性校正,例4.15:玉米糯非糯F1花粉粒糯:非糯1:1镜检:共20粒,有糯性8粒。测验是否符合p0=0.5解:H0:p=0.5,HA:p0.5 8/200.4,=1-0.4=0.6=8粒;12粒,df=20-1=19时,t0.05=2.093,|t|t0.05,所以接受H0:p=0.5,否定 HA:p0.5即:符合1:1的理论分离比率。,、两个样本百分数相比较的假设测验的连续性校正两个样本百分数:取较大值的 具有x1和n1,取较小值的 具有x2和n2,则:,例4.16:新农药处理2

22、5头棉铃虫,死亡15头;乐果处理24头,死亡9头。测验杀虫效果是否具有显著差异。,解:H0:p1=p2;HA:p1p2,=0.05计算:,df=24+25-2=4745,t0.05=2.014,|tc|t0.05,接受H0:p1=p2;否定 HA:p1p2。即:两种农药杀虫效果无显著差异。,四、区间估计、单个总体百分数p的置信限可按二项分布或正态分布估计,前者根据n和f(某一属性出现的个体数)查表。后者需计算:,例4.17:调查100株玉米,20株受虫害,20/100=0.2或=20株。试计算95置信度的置信区间,解:()查表法:n=100,f=20时,得13,29,即 的置信区间为0.13,0.29。()正态近似计算法:,u0.05=1.96所以:L1=0.2-(1.960.04)=0.1216L2=0.2+(1.960.04)=0.2784,、两个二项总体百分数差数(p1-p2)的置信限 该估计只有在明确两个百分数差数有显著差异时才有意义。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号