我的ppt课件独立性检验原理.ppt

上传人:小飞机 文档编号:3765940 上传时间:2023-03-21 格式:PPT 页数:38 大小:873.01KB
返回 下载 相关 举报
我的ppt课件独立性检验原理.ppt_第1页
第1页 / 共38页
我的ppt课件独立性检验原理.ppt_第2页
第2页 / 共38页
我的ppt课件独立性检验原理.ppt_第3页
第3页 / 共38页
我的ppt课件独立性检验原理.ppt_第4页
第4页 / 共38页
我的ppt课件独立性检验原理.ppt_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《我的ppt课件独立性检验原理.ppt》由会员分享,可在线阅读,更多相关《我的ppt课件独立性检验原理.ppt(38页珍藏版)》请在三一办公上搜索。

1、案,例,:某医疗机构为了了解呼吸道疾病与吸,烟是否有关,进行了一次抽样调查,共调查了,515,个成年人,其中吸烟者,220,人,不吸烟者,295,人。,调查结果,:吸烟的,220,人中有,37,人患呼吸道疾,病,,183,人未患呼吸道疾病;不吸烟的,295,人中,有,21,人患病,,274,人未患病。,根据这些数据,能否断定:患呼吸道疾,病与吸烟有关?,数据整理,患病,未患病,合计,吸烟,不吸烟,合计,37,21,58,183,274,457,220,295,515,问题:判断的标准是什么?,调查结果,:吸烟的,220,人中有,37,人患呼吸道疾,病,,183,人未患呼吸道疾病;不吸烟的,29

2、5,人中,有,21,人患病,,274,人未患病。,吸烟与不吸烟,患病的可能性的大小是否有差异?,频率估计概率,患,病,未患病,合,计(,n,),吸,烟,16.82%,83.18%,100%,(,220,),不吸烟,7.12%,92.88%,100%,(,295,),通过图形直观判断,不患病,比例,患病,比例,解决问题:,直观方法,吸烟的患病率,不吸烟的患病率,37/220,?,16.82%,21/295,?,7.12%,根据统计分析的思想,用频率估计概率,可知,吸烟者与不吸烟者患病的可能性,存在差异。,你能有多大把握认为“患病与吸烟有关”呢?,1.2,独立检验的基本思,想及其初步应用,第一课时

3、,学习目标,?,1.,了解分类变量的定义,?,2.,会画,2x2,列联表和等高条形图,?,3.,了解独立性检验原理,会用独立,性检验原理来判断两个变量之间是,否有关系。,为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机,地调查了,9965,人,得到如下结果,(,单位,:,人,),表,1-7,吸烟与患肺癌,列联表,那么吸烟是否对患肺癌有影响,?,因此,直观上得到结论,:,吸烟者和不吸烟者患肺癌的可能性存在差异。,在不吸烟者中患肺癌的比例是,在吸烟者中患肺癌的比例是,0.54%,2.28%,9965,91,9874,总计,2148,49,2099,吸烟,7817,42,7775,不吸烟,总计,患肺癌

4、,不患肺癌,列联表,:,两个,分类变量的,频数表,探究:,等高条形图,0%,20%,40%,60%,80%,100%,不吸烟,吸烟,不患肺癌,患肺癌,患病比例,不患病比,例,0.54%,2.28%,上面我们通过分析数据和图形,得到的直观印象是“吸,烟和患肺癌有关”。这一直觉来自于观测数据,即样本。,问题是它能够在多大程度上代表总体呢?,能否用数量刻画出有关的程度?,H,0,:,吸烟与患肺癌没有关系,我们假设,看看能推出什么样的结论。,a+b+c+d,b+d,a+c,总计,c+d,d,c,吸烟,a+b,b,a,不吸烟,总计,患肺癌,不患肺癌,为了研究的一般性,在列联表,1-7,中用字母代替数字:

5、,结论:,|ad-bc|,越小,说明吸烟与患肺癌之间关系越弱,;,|ad-bc|,越大,说明吸烟与患肺癌之间关系越强,;,如果”吸烟与患肺癌没有关系”,则在吸烟样本中不,患肺癌的比例应该与不吸烟样本中相应的比例差不多,即,a,c,a,b,c,d,?,?,?,a+b+c+d,b+d,a+c,总计,c+d,d,c,吸烟,a+b,b,a,不吸烟,总计,患肺癌,不患肺癌,?,?,?,?,a,c,d,c,ab,?,?,?,?,0,a,d,b,c,?,?,为了使不同样本容量的数据有统一的评判标准,基于,上述分析,我们构造一个随机变量,若,H,0,成立,即“吸烟与患肺癌没有关系”,则,K,2,应很小,.,由

6、列联表中数据,利用公式(,1,)计算得,K,2,的观测值为:,2,2,(,),(,),(,),(,),(,),n,a,d,b,c,K,a,b,c,d,a,c,b,d,?,?,?,?,?,?,(,1,),2,9,9,6,5,(,7,7,7,5,4,9,4,2,2,0,9,9,),5,6,.,6,3,2,.,7,8,1,7,2,1,4,8,9,8,7,4,9,1,k,?,?,?,?,?,?,其中,n=a+b+c+d,为样本容量,.,在,H,0,成立的情况下,统计学家估算出如下的概率:,2,(,6,.,6,3,5,),0,.,0,1,P,K,?,?,也就是说,在,H,0,成立的情况下,随机变量,K,

7、2,超过,6.635,的概率约为,0.01,,是一个小概率事件,.,现在,K,2,的观测值,为,56.632,,远远大于,6.635,,所以有理由断定,H,0,不成立,,,即认为“吸烟与患肺癌有关系”,5,6,.,6,3,2,k,?,但这种判断会犯错误,犯错误的概率不会超过,0.01,,即,我们有,99,的把握认为“吸烟与患肺癌有关系”,.,利用随机变量,K,2,来确定在多大程度上可以认为,“两个分类变量有关系”的方法称为两个分类,变量的独立性检验,.,独立性检验:,有一个颠扑不破的真理,那就是当,我们不能确定什么是真的时,我们就,应该去探求什么是最可能的。,笛卡尔,能否用数量来刻画“有关”程

8、度,自学指导,1,?,再次阅读课本第,10,页至图,1.2-1,的内容,注意下列问题,?,1.,列联表的画法,?,2.,等高条形图的画法,时间,3,分钟,整理重点内容,不患肺癌,患肺癌,总计,不吸烟,a,b,a+b,吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌,的比例应该与不吸烟者中相应的比例差不多即,(,),(,),0,a,c,a,c,d,c,a,b,a,b,c,d,a,d,b,c,a,d,b,c,a,d,b,c,?,?,?,?,?,?,?,?,?,?,即,因,此,越,小,说,明,吸,烟,与,患,肺,癌,之,间,关,系,越,弱,;

9、,因,此,越,大,说,明,吸,烟,与,患,肺,癌,之,间,关,系,越,强,。,0,H,假,设,:,吸,烟,与,患,肺,癌,没,有,关,系,自学检测,1,_,.,2,_,.,1,之间,类变量,差距很大,就说两个分,和,发现,观察等高条形图,如果,画等高条形图的目的是,d,c,c,b,a,a,?,?,自学检测,2,:,在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机,的情况,:,男乘客晕机的有,24,人,不晕机的有,31,人,;,女乘客晕机,的有,8,人,不晕机的有,26,人,.,请你,根据所给数据画出列联表。,自学指导,2,?,阅读课本第,11,页,-,第,13,页例,1,上方的内容,,注

10、意下列问题:,?,1.,记忆随机变量,K,2,的计算公式。,?,2.,注意,K,2,的大小对相关关系强弱的影响。,?,3.,独立性检验的原理是什么?,?,4.,用自己的话总结用独立性检验原理判断相,关关系的具体过程。,(时间,6,分钟),独立性检验的原理:,首先,假设结论不成立,即,H,:两个分类变量没有关系,(在这种假设下,k,应该很小),其次,由观测数据计算,K,的观测值,k,,,(如果,k,很大,则在一定可信程度上说明,H,不,成立,即两个分类变量之间有关系),最后,根据,k,的值判断假设是否成立,2,临界值表:,10.828,7.879,6.635,5.024,3.841,2.706,

11、2.072,1.323,0.708,0.445,k,0.001,0.005,0.010,0.025,0.05,0.10,0.15,0.5,0.40,0.50,2,(,),P,K,k,?,P,为犯错误的概率,10.828,7.879,6.635,5.024,3.841,2.706,2.072,1.323,0.708,0.445,k,0.001,0.005,0.010,0.025,0.05,0.10,0.15,0.5,0.40,0.50,2,(,),P,K,k,?,(,1,)如果,k,2,10.828,,就有,99.9%,的把握认为“,X,与,Y,有关系”,(,2,)如果,k,2,7.879,,就

12、有,99.5%,的把握认为“,X,与,Y,有关系”,(,3,)如果,k,2,6.635,,就有,99%,的把握认为“,X,与,Y,有关系”;,(,4,)如果,k,2,5.024,,就有,97.5%,的把握认为“,X,与,Y,有关系”,(,5,)如果,k,2,3.841,,就有,95%,的把握认为“,X,与,Y,有关系”;,(,6,)如果,k,2,2.706,,就有,90%,的把握认为“,X,与,Y,有关系”;,(,7,)如果,k,2,2.706,,就认为没有充分的证据显示,“,X,与,Y,有关系”,.,临界值,或者:,k10.828,,表示在犯错的概率不,超过,0.001,的前提下,,X,和,

13、Y,有关系。,用独立性检验思想的步骤,?,1.,列,2x2,列联表,?,2.,假设两个分类变量之间没有关系,?,3.,根据,K,2,的计算公式计算,K,2,?,4.,如果,K,2,k,0,(临界值),下结论:“在推,断错误的概率不超过,P,的前提下,可以判断,两个变量有关系”,或者说“我们有,(,1-P,),x100%,的把握认为两个变量有关,系。,如果,K,2,2.072,,就说“没有足够的证据证,明两个变量有关系”。,练,1,为了考察高中生的性别与是否喜欢数,学课程之间的关系,在某城市的某校高中,生中随即抽取,300,名学生,得到如下列联,表:,由表中数据计算得到,的观测值,。能够,以,9

14、5%,的把握认为高中生的性别与是否喜欢数学课程,之间有关系吗?为什么?,喜欢数学课程,不喜欢数学课程,总计,男,37,85,122,女,35,143,178,总计,72,228,300,2,K,4,.,5,1,4,k,?,2,2,2,(,3.841),0.05,4.514,3.841,P,K,K,k,?,?,?,解:在假设,“,性别与是否喜欢数学之间没有关系,”,的前提下,,K,应该很小,并且,而,的观测值,超过了,,这就意味着,“,性别与是否喜欢数学课程之间有关系,”,这一结论,是错误的可能性约为,0.05,,即有,95%,的把握,认为,“,性别与是否喜欢数学课程之间有关系,”,这一结论只适

15、用于被调查的学校,1.,在吸烟与患肺病这两个分类变量的计算中,下列说法正,确的是(,),A,、若,K,的观测值为,k=6.635,我们有,99%,的把握认为吸烟与患,肺病有关系,那么在,100,个吸烟的人中必有,99,个患肺病,B,、从独立性检验可知有,99%,的把握认为吸烟与患肺病有关,系时,我们说某人吸烟,那么他有,99%,的可能患肺病,C,、从独立性检验可知有,99%,的把握认为吸烟与患肺病有关,系,是指有,1%,的可能性使得推理出现错误,D,、以上三种说法都不对,c,自学检测,3,3,如,果,根,据,性,别,与,是,否,爱,好,运,动,的,列,联,表,得,到,K,2,3.8523.84

16、1,,,所以判断性别与运动有关,,那么这种判断,犯错的可能性不超过,(,),A,2.5%,B,0.5%,C,1%,D,5%,解析:,P,(,K,2,3.841),0.05,,故,“,判断性别与运动有,关,”,出错的可能性为,5%.,答案:,D,5,性别与色盲症列联表,.,色盲,非色盲,总计,男,12,788,800,女,5,995,1000,总计,17,1783,1800,由表中数据计算得,K,2,4.751,,性别与色盲之间是否有,关系?为什么?,解:,因为在假设,“,性别与色盲症没关系,”,的前提下,,事,件,A,K,2,3.841,的概率为,P,(,K,2,3.841),0.05.,而由

17、样本计算得到,K,2,4.751,,即有利于,“,性别与色盲,有关系,”,的小概率事件发生,由独立性检验基本原理可知,,有大约,95%,的把握认为性别与色盲有关系,练习,2.,在某医院,因为患心,脏病而住院的,665,名男性病,人中,有,214,人秃顶;而另,外,772,名不是因为患心脏病,而住院的男性病人中有,175,人秃顶。分别利用图形和独,立性检验方法判断秃顶与患,心脏病是否有关系?,解:根据题目所给数据得到如下列联表,1-13,:,患心脏病,不患心脏,病,总计,秃顶,214,175,389,不秃顶,451,597,1048,总计,665,772,1437,根据联表,1-13,中的数据,

18、得到,所以有,99.9%,的把握认为“秃顶与患心脏病有,假设秃顶和患心脏病之间没有关系,82,.,10,373,.,16,772,665,1048,389,),451,175,597,214,(,1437,2,2,?,?,?,?,?,?,?,?,?,?,k,练,3,为考察高中生的吃零食与是否患胃病之间的,关系,在某城市的某校高中生中随机抽取,300,名学,生,得到如下联表:,患胃病,不患胃病,总计,吃零食,37,85,122,不吃零食,35,143,178,总计,72,228,300,由表中数据计算,K,2,的观测值,k,4.513,。在,多大程度上可以认为高中生的性别与是否喜,欢数学课程之间

19、有关系?为什么?,2,(,3,.,8,4,1,),0,.,0,5,?,?,P,K,而我们所得到的,K,2,的观测值,k,4.513,超过,3.841,,这就意味着“,吃零食与是否患胃病,之间的关系”这一结论错误的可能性约为,0.05,(或小于,0.05,),,即有,95%,(或大于,95%,)的把握认为“吃零食与是否患胃病,之间有关系”。,解:在假设“吃零食与是否患胃病之间没有,关系”的前提下,K,2,应该很小,并且,?,2.,调查某医院某段时间内婴儿出生的时间与,性别的关系,得到下面的数据,.,?,你有多大的把握认为婴儿的性别与出生,时间有关系?,?,你的这种推断犯错的概率有多大?,白天,晚

20、上,合计,男婴,24,31,55,女婴,8,26,34,合计,32,57,89,在研究某种新措施对动物疾病的防治效果问题时,,得到以下数据:,试问新措施对防止动物疾病是否有效?,存活率,死亡率,合计,对照,114,36,150,新措施,132,18,150,合计,246,54,300,练习,关系?,认为性别和休闲方式有,的前提下,超过,能否在犯错误的概率不,的休闲方式是运动。,人主要,视,另外,主要的休闲方式是看电,人,动;男性有,人主要的休闲方式是运,电视,另外,人的主要休闲方式是看,中有,人,女性,人,男性,人,其中女性,调查中共调查了,一次对人们休闲方式的,025,.,0,33,21,2

21、7,43,54,70,124,.,4,练习,在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕,机的情况,:,男乘客晕机的有,24,人,不晕机的有,31,人,;,女乘客晕机的有,8,人,不晕机的有,26,人,.,请你根据所给数据判定,:,在天气恶劣的飞行航程,中,男乘客是否比女乘客更容易晕机,?,【解】,根据题意,列出,2,2,列联表如下:,晕,机,不晕机,总,计,24,31,55,女乘客,8,26,34,总,计,32,57,89,假设在天气恶劣的飞行航程中,,男乘客不比女乘客更容,易晕机,由,公式可得,K,2,的观测值,k,89,?,24,26,31,8,?,2,55,34,32,57,3

22、.6892.706,,故有,90%,的把握认为,“,在天气恶劣的,飞行航程中,男乘客比女乘客更容易晕机,”,变式训练,某单位餐厅的固定餐椅经常有损坏,于是该单位领,导决定在餐厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的,损坏情况作了一个统计,具体数据如下,:,损坏餐,椅数,未损坏餐,椅数,总计,文明标语张贴前,39,157,196,文明标语张贴后,29,167,196,总计,68,324,392,解:根据题中的数据计算:,k,392,?,39,167,157,29,?,2,196,196,68,324,1.78.,因为,1.782.706,,所以我们没有理由说:在餐厅墙壁,上张贴文明标语对减少餐椅损坏数有效果,即效果不,明显,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号