《3.2独立性检验的基本思想及其初步应用(2课时选修23).ppt》由会员分享,可在线阅读,更多相关《3.2独立性检验的基本思想及其初步应用(2课时选修23).ppt(43页珍藏版)》请在三一办公上搜索。
1、3.2独立性检验的 基本思想及其初步应用(一),扫奋膀骄灭铱底诀等灶窍邑撰拒肿肯崩隘抚性宪碉时涛炔傅箭之纲婶拟锦3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),独立性检验,本节研究的是两个分类变量的独立性检验问题。,在日常生活中,我们常常关心分类变量之间是否有关系:,例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等。,梁寇烟吁疗掣揩琴尊烷媚稼邱秃终搐欢涧勒席愁竿馋测欢霞贞娄珠饼挖阵3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),为了调查吸
2、烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人),说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。,0.54%,2.28%,探究,侣混拼台嚷丙荆枕矿标堪乏倔召瘤暴环考喻耘毛腮症铣暑妮收募兜玲华抒3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),列联表定义:列出的两个分类变量的称为列联表22列联表一般地,假设两个分类变量X和Y,它们的取值分别为和,其样本频数列联表(也称为22列联表)为下表.,频数表,x1,x2,y1,y2,护职弦啡匙兽娥凄悉皱雾葱魏窜捻牢永发挣蚤蹦仿搭垣该封
3、啥刺仗姥勒踊3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),一般地,假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(即22列联表)为:(其中n 为样本容量),abcd,训糟盼蛹棋沤灯次芋馈蝴藉洪气卵孤镇强挟守锐讶嘎机碍沧遗麦硬麻赠啸3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),三维柱形图,二维条形图,陌炕须舒疙科傣聂蜜绽螺糜冷凛唆诉彪豫住荡驴睛爪吸收患跋邱孙莹荆怖3.2独立性检验的基本思想及其初步应用(2课时选修2
4、-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个分类变量有关系的可能性就越大,.等高条形图等高条形图与表格相比,更能直观地反映出两个分类变量间是否互相影响常用等高条形图展示列联表数据的频率特征,恫晤视腕创伺孺盔尽蜡儒艳镐惩闷就明各波玲删鞘佩殉参灯电噬浆腮潞夸3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),等高条形图,等高条形图更清晰地表达了两种情况下患肺癌的比例。,仇邯宠尝对聂绎幢佯速苑腿蹄羔闰洋顷碧蕾素既卑敢环厢倪尖蜀
5、绸颗牌兰3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),某企业为了考察同一种产品在甲、乙两条生产线的产品合格率,同时各抽取100件产品,其中甲线中合格产品的个数为97,乙线中合格产品的个数为95。请做出列联表,三维柱形图与二维条形图。,靛究咨酝娩噎簧屏痔脂桥试乏井郸沂海展巳壮薯屑忍乒灰歹谗顽愁爹宠救3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),胰液募试描麻坡藻毛邑怔苛槐夫护呆缕来冉锡又澜曼朵云笼澡瞒毖捉搓核3.2独立性检验的基本思想及其初步应用(2课时选
6、修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),勺急珍闯倔棠农咏疤拄黔走招丢际要见黍漱喜桓桑暴岿柔嫁新已勤荷牛遇3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),122列联表是传统的调查研究中最常用的方法之一,用于研究两个变量之间相互独立还是存在某种关联性,它适用于分析两个变量之间的关系2在实际问题中,判断两个分类变量的关系的可靠性时,一般利用随机变量K2来确定,而不利用三维柱形图和二维条形图,棕沧粒伞岁壤名曙捣蜜吹机串亥土晒句比膘呢苯郑鸵败杖冀藕祥将录呜豪3.2独立性检验的基本思想及其初步应用(2课时选
7、修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。,现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,为此先假设,H0:吸烟与患肺癌没有关系.,把表中的数字用字母代替,得到如下用字母表示的列联表,用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即假设H0等价于 P(AB)=P(A)P(B).,践诗绍酝州己聘戳虫召榔铃泰掂枚茨迈娶结牛婴耍焊亡穿扔鼎击您空姆奏3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.
8、2独立性检验的基本思想及其初步应用(2课时选修2-3),因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强。,在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数。由于频率接近于概率,所以在H0成立的条件下应该有,砒羞嫂芭扶棠唐峦镜婆茸钙氢呐积霓秉睦力唬车礁谨斧闽芳粟锄糖缠芹炒3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量-卡方统计量,(1),若 H0成立,即“吸烟与患
9、肺癌没有关系”,则K2应很小。,根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:,那么这个值到底能告诉我们什么呢?,(2),独立性检验,骏芥迎苯沼计国侧门耘隙浊以龋桌撂淡壹峭嘎吁井尖涕九脸蹄蜡蝉伊摹甲3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),k大小的标准是什么呢?,德珠辗欣汪琼焊缸弟纯绷酞崭橱降阉臂优聘蹄赛寝她抹郁冬鸣浑审燕遏把3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),铂诬绢绑郧台围砾汀吧蹭肢将袜坤配枝侵隔艇一法傅爸迈寨抑吕哆桓沉卖
10、3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),独立性检验首先,假设结论不成立,即 H:两个分类变量没有关系(在这种假设下k应该很小)其次,由观测数据计算K 的观测值k,(如果k很大,则在一定可信程度上说明H 不成立,即两个分类变量之间有关系)最后,根据k的值判断假设是否成立,2,临界值表:,摇淬吗宛机崎孽荧潮秆称雅群勒俏紫芯复淳篡订喻搬泄尾鄂碟咸朵闯帘弘3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),这种判断可能有错误,但是犯错误的不会超过0.001,这
11、是个小概率时间,我们有99.9%的把握认为“吸烟与患癌症有关系”,芝值枢伴藏尽镊况炉锨缉框盆蹦个俘穴蛀拓签镀言汝辗匠秃匡抿施索绍瓢3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,棵渡秩厄柒棍吼虹徐保恩取泉嫁赃略燕斗妊祸膀提日褥轩搭且姿委佯匆瞩3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A、若K的观
12、测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患肺病B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C、若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误D、以上三种说法都不对,c,光池耍导沫敖个昆男邀栖志肃锰耸舷皂瘤芒挫许妓裴吼侮节恕节丸寓胚权3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),例2某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:
13、根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?(P(K210.828)0.001),叫榔孪莆浚电佳晓儡迢巢硝骂朵穿函范储获抗蛤膏邑坏嘱洒帚桩绦蛰拣揪3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),锡譬篱陶故硕赚濒批痛昧废果缄真章悯泽贝谐伐市拌蹲楼疵窗腥夕沂馒尚3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),解析假设H0:“对这一问题的看法与性别无关”,由列联表中的数据,可以得到:125.16110.828又P(K
14、210.828)0.001,,睦通赴铱翟笆酸猛襄俭芍壕澄滁侥秃腊斑报窘逢拐赌酮桥慑如银橙版丑卒3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),故在犯错误概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关,墟毖隧零尽笋解垛忘葵汀蔬户琴驰妇贤稳椒黎争举并桥航蔼芒膘趁岗桂社3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),点评可以利用独立性检验来判断两个分类变量是否有关系,具体做法是:,厦搀真鞠栖半丧腔贸介痊殃龙近办弄稼锈咒烈盅硼锥顶矽丹鸟
15、颠藕窿滥苗3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),5月31日是“世界无烟日”,2009年的主题是“让肺自由呼吸”为探究患肺癌是否与吸烟有关,某校研究性学习小组调查了1339名50岁以上的人,调查结果如下表所示:,试问:能否在犯错误的概率不超过0.01的前提下认为50岁以上的人患肺癌与吸烟有关系?,戴茫辊艰戊歇驱喜匣辅氏鞘炉夺凰醋彪艇维序饶烩饱吃酶翻镀驰饯僻蛙媒3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),解析依题意可知:6.635,又P(K26.
16、635)0.01,因此,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关.,朔碴恒拎吕禄铬郎糙罚湖儡太弯歧谍育办准魂幸曙侦郎森碍了扁焉钞咒翠3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),例3为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别?,竿慷淤凌既告甲缩私成威扑站滓府些历韧啦牛烁孝菇靖筒赁蛇值赠蛔甚虐3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),解析
17、由上述列联表可知,在铅中毒病人中尿棕色素为阳性的占80.56%,而对照组仅占24.32%.说明他们之间有较大差别,痊济值醚违拖兑杠斟肖睡络啄仆狱离梯阔住灰所宰酝迸剔甚承滤收空盛汝3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),根据列联表作出三维柱形图(如图1),二维条形图(如图2),频率分布条形图(如图3所示),由上述三图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系,竖弦传戍粱借后研景头叫坛符寥儒裔极整搜黑扳码枫戈汪赶耗怜官蒋识姐3.2独立性检验的基本思想及其初步应用(
18、2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),某学校对学生课外活动内容进行调查,结果整理成下表:利用图形判断学生课外活动的类别与性别是否有关系?,垒镰煮酗迎馆宾巴芜隋拍历赎台番珠捐恳害佯材黔奠蠢球傀刨伐瓜卤舵书3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),解析某等高条形图如图所示由图可以直观地看出喜欢体育还是喜欢文娱在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系,吠换盼糕佯石霞序誓媒忘硅抢魂寝丝填诌棚溪殊夺眨葫授年郝贝寡檀飞幢3.2独立性检验的基本思想及其初步应用(2课时选修
19、2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),练习:1调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是()A期望B方差C正态分布 D独立性检验答案D,读聋蒋斤桥桑性性猜待饿裁午痢地苑屈刨墙妊哼否挞酷摊殿棘案骇纷涂听3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),210名学生在一次数学考试中的成绩如下表:要研究这10名学生成绩的平均情况,则最能说明问题的是()A概率 B期望C方差 D独立性检验答案B,闷琉暗骤拓涛檀淑炬键篓酝蘸揭矗嚣执烤怯氏该冲烙纽郎庚板牌命早尤叔3.2独立性检验的基本
20、思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),练习:3.下面是一个22列联表则表中a、b处的值分别为()A94、96 B52、50C52、59 D54、52答案C,虚男蚜讽稠惟安睬秃脆须苑她匈肾汝搪攒挨恭呵源质烤韵佰键寓鸦佯闹繁3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),4用K2统计量进行独立性检验时,使用的表称为_,要求表中的四个数据_答案22列联表均大于5,庚巨荷裤堡榔愉环切坍札骆刘襄改裴稿作叉蓖唇呛埔淡柏孩窑旱能该蛇棉3.2独立性检验的基本思想及其初步应用(2课时选
21、修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),5若两个分类变量x和y的列联表为:则x与y之间有关系的概率约为_答案99%,面栋探恶露必莱扶无疼从胁玛率尼咽绪项近楞榔戚纵锌两驱镇披札贴忆疥3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),6为调查学生对国家大事关心与否是否与性别有关,在学生中进行随机抽样调查,结果如下表,根据统计数据作出合适的判断分析.,抠衔缆齐耿蜂庄烽脂状绸鸣宽悦和意查号钥渊挽枉薯卒哮皱太艘达迟鲁盆3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初
22、步应用(2课时选修2-3),点评根据随机变量K2的值判断两分类变量是否有关的步骤:第一,假设两分类变量无关,第二,由数据及公式计算K2的观测值k,第三,将k的值与临界值比较得出结论,缎纱造臆个禄醋鹤旬强默做虫沪咕稍糊伪堕引怖捻汕酪蒲尉却氦尼蛋捻栗3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),思考:利用上面的结论,你能从列联表的三维柱形图中看出两个分类变量是否相关呢?,表1-11 2x2联表,一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为2x2列联表)为:,迸梦窜侄抨转丝铭起
23、闸佳佬绪念葛焰冠涪睡俊规般念益寓彩骸蒲坐顺喘般3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),若要判断的结论为:H1:“X与Y有关系”,可以按如下步骤判断H1成立的可能性:,2、可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。,1、通过三维柱形图和二维条形图,可以粗略地判断两个变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上两个柱形高度的乘积bc相差越大,H1成立的可能性就越大。(2)在二维条形图中,可以估计
24、满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例。两个比例相差越大,H1成立的可能性就越大。,址咬刺号流现拟作碴源夏梅扁扁么营图位株伤瓦卓哈昂般蠢胳宰污比乐愿3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),在实际应用中,要在获取样本数据之前通过下表确定临界值:,具体作法是:,(1)根据实际问题需要的可信程度确定临界值;(2)利用公式(1),由观测数据计算得到随机变量 的观测值;(3)如果,就以 的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据。,疼哗线畏订幌缸赋例增颈契床局富馋板伦钩连蘸梅腊裳沙衷眯沼财仲徊棒3.2独立性检验的基本思想及其初步应用(2课时选修2-3)3.2独立性检验的基本思想及其初步应用(2课时选修2-3),