《独立性检验》教学讲解课件.ppt

上传人:小飞机 文档编号:1293419 上传时间:2022-11-05 格式:PPT 页数:46 大小:698.90KB
返回 下载 相关 举报
《独立性检验》教学讲解课件.ppt_第1页
第1页 / 共46页
《独立性检验》教学讲解课件.ppt_第2页
第2页 / 共46页
《独立性检验》教学讲解课件.ppt_第3页
第3页 / 共46页
《独立性检验》教学讲解课件.ppt_第4页
第4页 / 共46页
《独立性检验》教学讲解课件.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《《独立性检验》教学讲解课件.ppt》由会员分享,可在线阅读,更多相关《《独立性检验》教学讲解课件.ppt(46页珍藏版)》请在三一办公上搜索。

1、118 独立性检验,一、有关概念:,二、独立性检验的简介:,三、检验独立性的方法:,1.定性变量与定量变量:,2.22 列联表:,.频率法:,.等高条形图法:,.卡方检验:,1.卡方检验简述:,3.书写格式:,2.操作步骤及三个细节:,(教学讲解课件),118 独立性检验 一、有关概念:二、独立性检验,概率与统计简述,总 体,样 本,抽样,估计,推断,回归分析,相关分析,分布列及期望,概率,计数,估计,特征值估计,表,式及其他估计,图估计,均值,方差,中数,直方图,茎叶图,频数表,频率表,估计简述,(教学讲解课件),概率与统计简述 总 体样 本抽样估计推断回归分析相关分,方差是各个数据与平均数

2、之差的平方的和的平均数,标准差是方差的算术平方根,定义法:,特征值的求法,(教学讲解课件),方差是各个数据与平均数之差的平方的和的平均数 标准差是方差,特征值的求法,公式法:,定义法:,.数据x,x,x,x的平均值为x,,方差为O,.若数据 的平均值为,方差为,则数据 的,平均值为 ,,方差为,.若数据 的平均值为,方差为,数据 的平均值为,则,(教学讲解课件),特征值的求法 公式法:定义法:.数据x,x,x,公式法:,定义法:,图表法:,注1:在频率分布直方图中,众数:最高矩形的中点的横坐标,中位数:左右两边直方图的面积和 各为0.5的点的横坐标,平均数:每个小矩形面积乘以小矩形 底边中点的

3、横坐标之和,特征值的求法,公式法:定义法:图表法:注1:在频率分布直方图,公式法:,定义法:,图表法:,注2:在茎叶图中如何看数据的稳定性,单峰的稳定性大于多峰的稳定性,越对称稳定性越好,峰越瘦越尖,数据更集中,更稳定 峰越矮越胖,数据越分散,不稳定,特征值的求法,(教学讲解课件),公式法:定义法:图表法:注2:在茎叶图中如何看,特征值估计,对半水平,个体位置,百分比,平均水平,稳定性,稳定性,稳定性,平均水平,聚中(稳定)性特征值:,离散(波动)性特征值:,结构性特征值:,众数,平均数,中位数,方 差,极差,标准差,频率,3原则,(教学讲解课件),特征值估计 中众频频均标极方作特对个体位置百

4、分比平均水平稳定,特征值估计,聚中(稳定)性特征值:,离散(波动)性特征值:,众数,平均数,中位数,方 差,极差,标准差,注:常见的三类估计问题:,,如何估计,已知 ,,已知 ,,,如何估计,已知 ,,,如何估计,(教学讲解课件),特征值估计 聚中(稳定)性特征值:离散(波动)性,结构性特征值的作用,频率:, 3原则:参选修2-3P:7980,数据Yi的取值几乎全部集中在区间(-3, +3)内,数值Yi分布在区间(-, +)内的概率为0.6826,数值Yi分布在区间(-2, +2)内的概率为0.9544,数值Yi分布在区间(-3, +3)内的概率为0.9974,即在正常状态下,可以认为:,而落

5、在该区间之外的可能性不到3,已知某组数据Y1,Y2,Y3,的平均值为,标准差为,则在正常状态下,可以认为:,(教学讲解课件),结构性特征值的作用频率: 3原则:参选修2-3,图 估 计,1.条形图:,2.直方图:,3.频率折线图:,4.密度曲线:,5.茎叶图:,6.扇形图:,频率条形图中,纵坐标是频率,频率直方图中,面积是频率,7.雷达图,(教学讲解课件),图 估 计 1.条形图:2.直方图:3.频率折线图:4.密,概率与统计简述,总 体,样 本,抽样,估计,推断,回归分析,相关分析,分布列及期望,概率,计数,简言之:回归分析就是,确定关系,相关关系,近似(虚拟)成,(教学讲解课件),概率与统

6、计简述 总 体样 本抽样估计推断回归分析相关分,回归分析的三大任务(步骤),1.是否相关的判定:,法2:散点图法,法1:经验法,法3:相关系数 r 法,法5:数表法:,法4:关系式法:,(教学讲解课件),回归分析的三大任务(步骤) 1.是否相关的判定: 法2:散,相关系数 r 衡量变量之间相关程度的指标,(1)计算公式:,(2)性质:,不相关,弱相关,一般相关,强相关,完全相关,?!, |r|1,相关系数 r 衡量变量之间相关程度的指标(1)计算公式:,回归分析的三大任务(步骤),1.是否相关的判定:,2.求回归方程及预报:,法2:散点图法,法1:经验法,法3:相关系数 r 法,法5:数表法:

7、,法4:关系式法:,线性回归,换元法,非线性回归,回归分析的三大任务(步骤) 1.是否相关的判定: 2.求回,S2:故,求线性回归方程的书写格式,S3:即所求回归方程为,S1:由题意得,S4:利用回归方程做出预报,画图求数定相关 二求方程三预报直线必过中心点 先算中心再斜率 代入求得纵截距 小题形法可估算,S2:故 求线性回归方程的书写格式 S3:即所求回归方,回归分析的三大任务(步骤),1.是否相关的判定:,2.求回归方程及预报:,3.拟合效果的判定:,法2:散点图法,法1:经验法,法3:相关系数 r 法,法5:数表法:,法4:关系式法:,线性回归,换元法,非线性回归,法1:散点图法:,法2

8、:残差法:,残差图法:,残差平方和法:,法3:相关指数R2法:,回归分析的三大任务(步骤) 1.是否相关的判定: 2.求回,误差 e (Error),随机(整体)误差,点(个体)误差,残差,偏差,回归差,真实值预报值,预报值均值,真实值均值,误差 e (Error) 随机(整体)误差 点(个体),以残差为纵坐标 以其他指定的量为横坐标的散点图,若残差点比较均匀地落在水平的 带状区域中、说明选用的模型计较合适,若个别样本点的残差比较大 即有异常点存在 需确认是否数据的采集有错误,残差图法,这样的带状区域的宽度越窄 说明模型拟合精度越高 回归方程的预报精度越高,(教学讲解课件),以残差为纵坐标若残

9、差点比较均匀地落在水平的若个别样本点,几种常见的残差分布示意图,图说明具有较好的线性关系,图说明具有相关关系,但模型有待改进,图说明具有相关关系,需加入平方项,图说明具有相关关系,需引入变量,(教学讲解课件),几种常见的残差分布示意图 图说明具有较好的线性,回归模型拟合效果的评判残差法,残差图法:,残差平方和法:, 残差平方和越小,说明拟合效果越好, 称为残差平方和,回归模型拟合效果的评判残差法 残差图法:残差平方和法,相关指数(样本决定系数或判定系数)R2法:,计算公式:,作用:,R2 1,说明回归方程拟合的越好 R20,说明回归方程拟合的越差,在线性回归中恰好有:相关指数R2相关系数r2,

10、R20 ,1,解释变量对预报变量的贡献率,相关指数(样本决定系数或判定系数)R2法:计算公式:作用,118 独立性检验,一、有关概念:,二、独立性检验的简介:,三、检验独立性的方法:,1.定性变量与定量变量:,2.22 列联表:,.频率法:,.等高条形图法:,.卡方检验:,1.卡方检验简述:,3.书写格式:,2.操作步骤及三个细节:,118 独立性检验 一、有关概念:二、独立性检验,概率与统计简述,总 体,样 本,抽样,估计,推断,回归分析,相关分析,分布列及期望,概率,计数,回归分析重在分析两变量是否具有因果关系,相关分析重在分析两变量是否相互影响,(独立性检验),(独立性检验),概率与统计

11、简述 总 体样 本抽样估计推断回归分析相关分,定性变量:,定量变量:,定性变量的取值一定是实数,取值的大小,有特定的含义。不同取值之间的运算也有特定的含义,又名分类变量、属性变量。它们的取值,一定是离散的。不同的取值,表示了个体所属的类别,定量变量: 如长度、重量、速度、温度,定性变量: 如某种产品分为一等品、二等品、三等品; 身份证的编号,定量变量,分类(定性,属性)变量,变量的分类,解释变量,预报(响应)变量,一、有关概念:,1.定性变量与定量变量:,定性变量:定量变量:定性变量的取值一定是实数,取值的大小,2. 22 列联表:,若有两个分类变量X和Y,它们的可能取值分别为x1, x2,和

12、y1, y2,则称其样本频数列联表为22列联表,x1,x2,y2,y1,总计,总计,a,b,d,c,abcd,cd,ab,bd,ac,注1:顾名思义是两个分类变量的频数表的并列与联合,将列联表逆时针旋90转成坐标系,注2:是回归分析的弱化,尽量选用: x与y,注3:要明确:a,b,c,d的位置,尤其是b,c的位置,2. 22 列联表: 若有两个分类变量X和Y,它们的可能取,二、独立性检验的简介:,2.简言之,独立性检验是:,1.详参:,检验两个分类变量是否具有关系的一种统计方法,统计学中“假设检验”的特例,选修2-3P:9097的内容,4.回归分析与独立性检验的区别:,回归分析重在分析两变量是

13、否具有因果关系,独立性检验重在分析两变量是否相互影响,与反证法很类似,S1:先假设两个变量之间独立(没有关系):,S2:然后根据小概率事件原理,检验“假设”是否具有“矛盾”,3.独立性检验的基本思想:,二、独立性检验的简介: 2.简言之,独立性检验是:1.详参,一、有关概念:,二、独立性检验的简介:,三、检验独立性的方法:,.频率法:,注:优点:直观;简便,缺点:粗糙;主观性较强,列表算率三决策,.等高条形图法: :,列表画图三决策,注1:实际上,是频率法的图形化,注2:优点:更加直观;简便,缺点:粗糙;主观性较强,以上方法,详参选修2-3P:9097的内容,一、有关概念:二、独立性检验的简介

14、: 三、检验独立性的方法:,一、有关概念:,二、独立性检验的简介:,三、检验独立性的方法:,.频率法:,.等高条形图法:,.卡方检验:,1.卡方检验简述,3.书写格式,2.操作步骤及三个细节,一、有关概念:二、独立性检验的简介:三、检验独立性的方法:,1.卡方检验简述:,卡方检验是用途非常广泛的一种假设检验方法,卡方检验就是比较样本的实际观测值与理论推断值之间的偏离程度,用卡方值的大小,来推断理论与实际偏离程度,卡方检验的三个主要作用,独立性(关联性)检验:,拟合度(一致性)检验:,构成比(构成比率)检验:,1.卡方检验简述: 卡方检验是用途非常广泛的一种假设检验方,1.卡方检验简述:,2.操

15、作步骤及三个细节:,卡方检验五大步 假设无关列联表 算方查表五决策,参课本选修2-3P:9296,三个细节要留心,查表左右要灵活,算方 b c 要分清,几成把握可信度,决策表述常见三,犯错概率不超过,四个填空是关键,.卡方检验:,1.卡方检验简述: 2.操作步骤及三个细节:卡方检验五大步,1.卡方检验简述:,2.操作步骤及三个细节:,.卡方检验:,3.卡方检验独立性的书写格式:,S1:画出22列联表:(列联表已知时此步可省略),S2:算出观察值K2(k)与临界值k0比较大小:,一表二方比大小 三写概率四决策,S3:写出概率P0=P( K2 = k0),S4:决策:,1.卡方检验简述: 2.操作

16、步骤及三个细节:.卡方检验,x1,x2,y2,y1,总计,总计,a,b,d,c,abcd,cd,ab,bd,ac,卡方检验的书写格式,一表二方比大小 三写概率四决策,S1:画出22列联表:,解:由题意得,(列联表已知时此步可省略),x1 x2y2y1总计 总计 abdcabcd c,卡方检验的书写格式,一表二方比大小 三写概率四决策,S1:画出22列联表:,解:由题意得,(列联表已知时此步可省略),S2:算出观察值 K2(k)与与临界值k0比较大小:,k0,因 K2 ,x1,x2,y2,y1,总计,总计,a,b,d,c,abcd,cd,ab,bd,ac,卡方检验的书写格式 一表二方比大小 三写

17、概率四决策 S,S1:画出22列联表:(列联表已知时此步可省略),S2:算出观察值 K2(k)与临界值k0比较大小:,卡方检验的书写格式,一表二方比大小 三写概率四决策,其中n=abcd,注2:考试时,虽然会给出 K2 计算公式,暂时理解成 K2 = k,注1:K2是一个随机变量,随实测数据变化而变化,k是根据实测数据带入公式算出的一个观察值,但试题中,只有具体的数字,没有a,b,c,d,n,故一定要明确:a,b,c,d,n的含义,尤其是b,c的位置,S1:画出22列联表:(列联表已知时此步可省略) S2:算,S1:画出22列联表:(列联表已知时此步可省略),S2:算出观察值 K2(k)与临界

18、值k0比较大小:,卡方检验的书写格式,一表二方比大小 三写概率四决策,注2:要明确:a,b,c,d,n 在公式中的含义,注1:暂时理解成:观察值 k = K2 ,注3:临界值k0的确定:,(1)临界值k0无指定型:,(2)临界值k0有指定型:,由已知概率P0 , 结合信用度表 换算出 k0 ( P0=P( K2 = k0) ),一般的,用左不用右,S1:画出22列联表:(列联表已知时此步可省略) S2:算,练习1. 确定临界值k0:,(1).临界值k0题中无指定型: 若观察值k6.666 , 则临界值 k0 _,(2).临界值k0题中无指定型: 若观察值k7.890 , 则临界值 k0 _,(

19、3).临界值k0题中有指定型: 若已知概率P00.99 , 则临界值 k0 _,(4).临界值k0题中有指定型: 若已知概率P00.95 , 则临界值 k0 _,6.635,7.879,6.635,3.841,P( K2 k0)k00.50 0.40 0.25,卡方检验的书写格式,一表二方比大小 三写概率四决策,S1:画出22列联表:,解:由题意得,(列联表已知时此步可省略),S2:算出观察值 K2(k)与临界值k0比较大小:,S3:写出概率P0=P( K2 = k0),k0,因 K2 ,而 P0 P( K2 = k0) ,x1,x2,y2,y1,总计,总计,a,b,d,c,abcd,cd,a

20、b,bd,ac,卡方检验的书写格式 一表二方比大小 三写概率四决策 S,S1:画出22列联表:(列联表已知时此步可省略),S2:算出观察值K2(k)与临界值k0比较大小:,卡方检验的书写格式,一表二方比大小 三写概率四决策,S3:写出概率P0=P( K2 = k0),S4:决策:,决策表述常见三 四个填空是关键, 在犯错的概率不超过XX的前提下 可认为X与Y有(无)关 有XX的把握认为X与Y有(无)关 认为X与Y有(无)关的可信度为XX,注1:一般的、若 kk0 ,则推断:X与Y有关 若 kk0 ,则推断:X与Y无关,注2:中的XXP0 ,而中的XX1P0,S1:画出22列联表:(列联表已知时

21、此步可省略) S2:算,(2)(2011年湖南)通过随机询问110名性别不同的大学生 是否爱好某项运动,得到如下的列联表:,由,算得,,参照附表,得到的正确结论是A.在犯错误的概率不超过0.1%的前提下, 认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下, 认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”,【C】,(2)(2011年湖南)通过随机询问110名性别不同的大学生,(3)课本选修2-3P:97 Ex2,通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表

22、:,总 计,总 计,16,28,8,20,72,28,44,36,36,男 生,女 生,读营养说明,不读营养说明,能够以99%的把握认为 性别与读营养说明之间有关系吗?,解:,因 k , 8.416,注意:1.书写格式2.计算到百分位,练习3.卡方检验:,一表二方比大小三写概率四决策,(3)课本选修2-3P:97 Ex2 通过随机询,(3)通过随机询问72名不同性别的大学生在购买食 物时是否看营养说明,得到如下列联表:,总 计,总 计,16,28,8,20,72,28,44,36,36,男 生,女 生,读营养说明,不读营养说明,能够以99%的把握认为 性别与读营养说明之间有关系吗?,解:,因

23、k , 8.416,一表二方比大小三写概率四决策,而P( K2 6.635) =0.010,6.635,有指定用指定,所以能够以99%的把握认为 性别与读营养说明之间有关,(3)通过随机询问72名不同性别的大学生在购买食总 计,(3)通过随机询问72名不同性别的大学生在购买食 物时是否看营养说明,得到如下列联表:,总 计,总 计,16,28,8,20,72,28,44,36,36,男 生,女 生,读营养说明,不读营养说明,能够以99%的把握认为 性别与读营养说明之间有关系吗?,解:,因 k , 8.416,而P( K2 7.879) =0.005,7.879,无指定用左不用,所以能够以99.5

24、%的把握认为 性别与读营养说明之间有关,请问性别和读营养说明之间在多大程度上有关系?,(3)通过随机询问72名不同性别的大学生在购买食总 计,(4)(2013年福建简化)某工厂为了研究工人的 日平均生产量是否与年龄有关规定日平均 生产件数不少于80件者为“生产能手”, 是否有90%的把握、认为“生产能手与工人 所在的年龄组有关”?,而 P ( K2 2.706) =0.10,2.706,解:因 K2 =,所以没有90的把握认为: “生产能手与工人所在的年龄组有关”,(教学讲解课件),(4)(2013年福建简化)某工厂为了研究工人的而 P (,小结 独立性检验,一、有关概念:,二、独立性检验的简

25、介:,三、检验独立性的方法:,1.定性变量与定量变量:,2.22 列联表:,.频率法:,.等高条形图法:,.卡方检验:,1.卡方检验简述:,3.书写格式:,2.操作步骤及三个细节:,(教学讲解课件),小结 独立性检验 一、有关概念:二、独立性检验的简,卡方检验独立性的书写格式,S1:画出22列联表:(列联表已知时此步可省略),S2:算出观察值K2(k)与临界值k0比较大小:,一表二方比大小三写概率四决策,S3:写出概率P0=P( K2 = k0),S4:决策:,(教学讲解课件),卡方检验独立性的书写格式 S1:画出22列联表:(列联表已,针对训练:,预习:,练出好成绩P:433 左下 Ex6,复习与小结,(教学讲解课件),针对训练:预习:练出好成绩P:433 左下 Ex6,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号