《假设检验方差分析.ppt》由会员分享,可在线阅读,更多相关《假设检验方差分析.ppt(61页珍藏版)》请在三一办公上搜索。
1、张振华1234181009 许 良 1234181016,假设检验&方差分析,假设检验,医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次分钟,标准差为5.2次分钟,但是根据医学常识,一般男子的平均脉搏次数为72次分钟,问该山区男子脉搏数与一般男子是否不同?,Easy to answer?,在抽样研究中,由于样本所来自的总体其参数是未知的,只能根据样本统计量对其所来自总体的参数进行估计,如果要比较两个或几个总体的参数是否相同,也只能分别从这些总体中抽取样本,根据这些样本的统计量作出统计推断,以此比较总体参数是否相同。由于存在抽样误差,总体参数与样本统计量并不恰好相同,因此判断
2、两个或多个总体参数是否相同是一件很困难的事情。,如何解决呢?,假设检验来帮你!,假设检验,假设检验的基本思想建设检验的基本概念假设检验的基本步骤假设检验的两类错误及其关系假设检验的应用,假设检验的基本思想,概念:事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立基本思想:小概率反证法思想采用逻辑上的反证法依据统计上的小概率原理小概率原理:指发生概率很小的随机事件在一次试验中是几乎不可能发生的。(小概率指p5%或P1%),假设检验是利用样本的实际资料检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。也称为显著性检验。假设检验是论证抽样推断结果可靠性的一种手段
3、。,抽样误差造成的;本质差异造成的。,假设检验的目的就是判断差别是由哪种原因造成的。,假设检验的基本概念,1原假设和备择假设 原假设:用H0表示,即虚无假设、零假设、无差异假设;备择假设:用H1表示,是原假设被拒绝后替换的假设。若证明为H0为真,则H1为假;H0为假,则H1为真。对于任何一个假设检验问题所有可能的结果都应包含在两个假设之内,非此即彼。,2.检验统计量用于假设检验问题的统计量称为检验统计量。需要考虑因素:总体是否正态分布;大样本还是小样本;总体方差已知还是未知。,3.显著性水平用样本推断H0是否正确,必有犯错误的可能。原假设H0正确,而被我们拒绝,犯这种错误的概率用表示。把称为假
4、设检验中的显著性水平(Significant level),即决策中的风险。显著性水平就是指当原假设正确时人们却把它拒绝了的概率或风险。通常取0.05或=0.01或=0.001,那么,接受原假设时正确的可能性(概率)为:95%,99%,99.9%。,4.接受域与拒绝域接受域:原假设为真时允许范围内的变动,应该接受原假设。拒绝域:当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域便称作拒绝域。,例:0.05时的接受域和拒绝域,5.双侧检验与单侧检验假设检验根据实际的需要可以分为:双侧检验(双尾):指只强调差异而不强调方向性的检验。单侧检验(单尾):强调某一方
5、向性的检验,6.假设检验中的两类错误 假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而假设检验不可能绝对准确,是可能犯错误的。两类错误:错误(I型错误):H0为真时却被拒绝,弃真错误;错误(II型错误):H0为假时却被接受,取伪错误。假设检验中各种可能结果的概率:,假设检验的基本步骤,1、提出原假设和备择假设2、确定适当的检验统计量3、规定显著性水平 4、计算检验统计量的值 5、作出统计决策,总体均值检验,总体均值的假设检验是应用最为广泛的假设检验之一,其检验的基本原理同样适用于其他类型的假设检验。由于已知条件不同,所构造的检验统计量也不同,因此必须搞清统计量的形式及其服从的分
6、布。,u,u,u,u,U检验-用U作为检验统计量的假设检验(2 已知、2 未知大样本),T检验-用t分布的统计量进行假设检验(标准差未知、小样本),假设检验的应用,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),H0:=0.081H1:0.081=0.05n=200临界值(s):,检验统计量:,|=2.831.96拒绝H0,0.081,有证据表明新机床加工的零件的
7、椭圆度与以前有显著差异,决策:,结论:,某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,H0:=1000H1:1000=0.05df=9-1=8临界值(s):,检验统计量:,|=1.751.96接受H0,决策:,在=0.05的水平上接受H0,结论:,有证据表明这天自动包装机工作正常,在=0.05的水平上接受H0,在=0.05的水平上接受H0,在=0.05的水平上接受H0,在=0.05的水平上接受H0,前面的例子你会了吗?,Try
8、 it by yourself!,方差分析,许良1234181016,概况,t检验不再适用【原因】:1.检验程序繁琐(5个均数两两比较,则需进行10次t检验)2.无统一的试验误差(各次比较试验误差不一致,也未能充分利用资料的信息)3.增大了犯 I 型错误的概率,基本原理,F检验,方差分析,多重比较,一、方差分析的基本原理,1.把k个处理的观察值作为一个整体;2.利用总平方和与总自由度的可分解性;3.得出均方(方差);4.利用F检验验证其显著性。,总变异平方和SST,总自由度dfT,处理间平方和SSt,处理内平方和SSe,处理间自由度dft,处理内自由度dfe,SST=SSt+SSe,dfT=d
9、ft+dfe,MST=SST/dfT,MSe=SSe/dfe,MSt=SSt/dft,基本原理,F检验,方差分析,多重比较,二、F检验(附表4),两个自由度df1=dft=k-1 df2=dfe=k(n-1)k为不同处理次数 n为每次处理的观察值【目的】:在于判断处理间的均方是否显 著大于处理内(误差)均方。显著的到底是不同方法的处理,还是误差所致。,二、F检验,【步骤】1.假设;无效假设Ho:u1=u2=u3 备择假设HA:各u不相等或不全相等2.算出试验资料F值;3.查附表4的临界F值;F0.05(df1,df2),F0.01(df1,df2),4.对比两F值;若F0.05 接受Ho,不显
10、著 若F0.05(df1,df2)F0.01(df1,df2),P0.01 接受HA,极显著,基本原理,F检验,方差分析,多重比较,三、方差分析 要点,1.单项分组资料2.两向分组资料-无重复3.两向分组资料-有重复,三、方差分析,【例1】单项分组资料,分析不同类型的海产品食品中 砷含量差异显著性,用工具“加载宏”选项选中“分析工具库”选项,见图1。,用Excel 数据分析”进行方差分析,图1,图2,这时,在“工具”菜单中选中“数据分析”命令。从“数据分析”选 项中选“方差分析:单因素方差分析”选项,见图2。,括取所要分析的数据;分组方式选“行”;输入显著水平;确定输出区域;,图3,图4,图3
11、,分析结果,三、方差分析,【例2】两向分组资料-无重复,3名化验员检测连续10天牛乳酸度 有无差异,用Excel 数据分析”进行方差分析,在“工具”菜单中选中“数据分析”命令。从“数据分析”选 项中选“方差分析:无重复双因素分析”选项,见图1。,图1,图2,括取所要分析的数据;输入显著水平;确定输出区域;见图2,分析结果,图3,【例3】两向分组资料-有重复,三、方差分析,3种食品添加剂 对3种不同配方蛋糕 质量的影响,用Excel 数据分析”进行方差分析,在“工具”菜单中选中“数据分析”命令。从“数据分析”选 项中选“方差分析:可重复双因素分析”选项,见图1。,图2,图1,括取所要分析的数据;
12、输入每样本的行数和显著水平;确定输出区域;见图2。,图3,分析结果,基本原理,F检验,方差分析,多重比较,四、多重比较,对一组试验数据通过平方和与自由度的分解,将所估计的处理间均方与误差均方作比较,F检验,推论处理间有无显著差异(表明试验的总变异主要来源于处理间的变异),哪些数据间有显著差异呢?,多重比较,四、多重比较 要点,1.最小显著差数法(LSD)2.最小显著极差法(LSR)3.多重比较结果的表示方法 4.多重比较方法的选择,q法新复极差法SSR,方法,【例4】,四、多重比较,1.最小显著差数法(LSD)【t检验】,【步骤】(1)列出平均数的多重比较表;即将各处理的平均数从大到小至上而下
13、排列,(2)计算LSD0.05 和 LSD0.01;查附表3(t值表)dfe=15 得t0.05(15)=2.131,t0.01(15)=2.947 从而LSD0.05=1.21;LSD0.01=1.68,n为处理内的重复数n=4,LSDa=ta(dfe)*,其中=0.57,(3)比较,标明结果;差数LSD0.01 极显著*,10个均数差 LSD0.05 和 LSD0.01,=1.21=1.68,四、多重比较,2.最小显著极差法(LSR)【原理】根据极差范围内所包含的处理数K的不同,确定不同的检验尺度。,q法新复极差法SSR,2.最小显著极差法LSR-q法,【步骤】(1)列出平均数的多重比较表
14、;即将各处理的平均数从大到小至上而下排列,(2)计算LSD0.05 和 LSD0.01;,n为处理内的重复数 n=4,附表5-q值表,LSRa,K=qa(dfe,K)*,(3)比较,标明结果;,10个均数差 LSR0.05 和 LSR0.01,2.最小显著极差法LSR-新复极差法(SSR法),SSR法的检验方法和步骤与q法相同唯一不同的是计算最小显著极差时要查的是SSR表(表6),而非q值表不做过多介绍,四、多重比较,3.多重比较结果的表示方法(1)三角形表法简便直观,但篇幅占用较大在科技论文中用的较少,3.多重比较结果的表示方法(2)标记字母法,占用篇幅少在科技论文中常见,四、多重比较,4.多重比较方法的选择LSD法新复极差法q检验法K=2时,取等号K=3时,取小于号 根据试验要求的严格程度选择方法,将一组试验数据总变异的平方和与自由度分解为各变异原因的平方和与自由度,列出方差分析表,计算各项均方及有关均方比做F检验,若F检验显著则对各平均数进行多重比较确定具体哪些处理间存在真实差异,小结,最终应用-正交试验的分析,正交设计助手,张振华&许良,谢谢观赏,参考文献1.王钦德,杨坚.食品试验设计与统计分析.中国农业大学出版社,2003年2月第一版.2.张仲欣,杜双奎.食品试验设计与统计分析.郑州大学出版社,2011,