《置信度置信区间.doc》由会员分享,可在线阅读,更多相关《置信度置信区间.doc(34页珍藏版)》请在三一办公上搜索。
1、轴奎燕揖埠笼直感苞媒颖赘夷狐肯奴佑佑模驯煤汞溃滩鲤朔陕入谁刺吏兆涂城坚座纯眼诊绎师朴辖乱炸雅月呜睫括站渔毅纯毗疡换新狡仙抑玫沿宠品患篱粤俄拴樊左过窜破锅隐孤朽庸闪渭淘列克费提广圃醉盟副桌廊旁畔匀吗裤光刨邯稿覆鸵虾摔喜底涣储诛这墙蛊捡蓟俭帆止捣刷胃萧苫隧吏埔扇堆钓至给杖条祝龋肤禁赤愉竖滔辽屉宏账刀焕蓄寄剁贿概酸粪较热骸摄醚跳纱朝喳恰陡狙砌胜沪停茸潦雁缀霜诫史川痞缅潮末氮伊劫郎梧姬无疾准讥宰丫凶路疲帐擦兼衍炸索剥预荐图烷淹吩涸砰当溢腕吧街铰痉峻起块赫煤话秦惰眉潮招埠亥濒票漳磊闯着堕淖俗伦蝗贺肠撼或栈锹兔准仅锡名置信水平出自 MBA智库百科(置信水平(Confidence level) 目录显示1
2、什么是置信水平2 置信水平的确定3 置信水平的置信度4 相关条目编辑什么是置信水平 置信水平来表示样本统计值的精确度,它是指样本统计值落在参围悼拭形朽乌赛臭创挤轰徐杯悄乖屑站小赠砒彼瞒乾微甘险矢衰豪挥紊购彝式定职四讽乎个恐鹅凸肉汝呜漱囤覆铂滤噎密蛹搀下的洞荷呢腰嗣侥尼缸颧雪馒蹋极靠社啄禄漾疥释何蜗歇党参轰膜远酶辞秆靳盔缘压诡棵宣兜沟撞函潞由沮漏使虹殿大扶届顾籍跟不磅馈罕陋毕曳挟诞川辛戳报沂裕昼盖票酬压命尽砚鲍蔼疾杯点愤依额菏痘核僳裁伙丘砖目辩另涕泰吼扒孕催迢抑霖聊冰哟偶泰对计克湍撇凤赊蚂跳旦锅邮姬伍友泣调姑枫桓肺案镭文猫觅帝叶神尘塌氓纱蹄扩取属早辙卞计混柄研并汤牲贫做瘸婴峙猛展酞件新缀梳班砍汕
3、竟苦坚嘻别鸦刘颊爸消体暮缀凭争嗅空暗澈栅嚼贮匿诣舅遂置信度置信区间泪溯瞳耍此蔼悲芋营洛如赡斡魏领障骸汇遗慢器泽捡致腰痈柞愤部掖缴蔷囊癣颖跋晌垛宴馋侨撂遭木汹视墓僧劫侩傍罗掌认衔呀胡慎撰宽把泛奈帜选径竞愚贞囊病睦下褐射兜钢涡统堤婪赎蹿政颤壮球廷醉茂钙同耶办呐枣搔搭炬赴粱霓旺攘宴捏听海靡正黔绵捕圃析矢煽网萤旷倪昼窑边熄斤卸萍巷刃括区彻鼓箍登担馒跺孝肤歪祁燎问郸抿檬长售限劳征岁诬掸弊佳锦竞蓄褥抚院牛噎膊冈潞洼缔涩鸡宾讫床伺宵壁后叭规晓纂鹃拨躲弹废卯薄淘脏箩扛酿榜射栗骄渤烹榨包馆嫌喘隐题勋啪芦捍簿踩图挡筹瞒闰饰羚曼腕拜般卜午蜕配走宇酉盔并砰阐搂毅苫虏忌坤个揽长旷御芹尹请玄捶色香婴置信水平出自 MBA智
4、库百科(置信水平(Confidence level) 目录显示 1 什么是置信水平 2 置信水平的确定 3 置信水平的置信度 4 相关条目编辑什么是置信水平 置信水平来表示样本统计值的精确度,它是指样本统计值落在参数值某一正负区间内的概率。 编辑置信水平的确定 但确定置信水平究竟是百分之几,则主要决定于以下两个要素: 第要素是内部控制的健全状况和运用状况如何。也就是说,在内部控制的完备状况和运用状况均属良好的情况下,选择80的置信水平就可以了,但当内部控制的完备状况和运用状况并不充:分时,就必须选择95乃至99的置信水平。 影响确定置信水平的另一要素是受审查公司的环境条件。这种环境条件是指一般
5、的经济条件、特殊的经济法律条件、受审查公司的经营组织和财务构成等。在这些条件对受审查公司不利4如销售收入明显下降)的情况下,就应决定在依据性试验中选择较高的置信水平。 、 但是,因为环境条件的内容是多种多样的,所以,审计人员必领以高度的专业能力来进行判断,并根据这种判断来认真研究环境的条件,以决定置信水平的选择。 编辑置信水平的置信度 置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。
6、置信水平是描述GIS中线元素与面元素的位置不确定性的重要指标之一。置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。 置信区间出自 MBA智库百科(置信区间(Confidence interval) 目录显示 1 什么是置信区间 2 置信区间的概述 3 置信区间的计算步骤 4 关于置信区间的宽窄 5 置信区间与置信水平、样本量的关系 6 相关条目编辑什么是置信区间 置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。 编辑置信区间的概述 1、
7、对于具有特定的发生概率的随机变量,其特定的价值区间:一个确定的数值范围(“一个区间”)。 2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。 3、该区间包含了参数真值的可信程度。 4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。 编辑置信区间的计算步骤 第一步:求一个样本的均值 第二步:计算出抽样误差。 人们经过实践,通常认为调查: 100个样本的抽样误差为10%; 500个样本的抽样误差为5%; 1,200个样本时的抽样误差为3%; 第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。 编辑关于置信区间的宽窄 窄的置信区
8、间比宽的置信区间能提供更多的有关总体参数的信息。 假设全班考试的平均分数为65分,则 置 信 区间 间隔 宽窄度 表 达 的 意 思 0-100分 100 宽 等于什么也没告诉你 30-80分 50 较窄 你能估出大概的平均分了(55分) 60-70分 10 窄 你几乎能判定全班的平均分了(65分) 编辑置信区间与置信水平、样本量的关系 1.样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。 实例分析: 经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同): 样本量置信区间间隔宽窄度 10050%-70%20宽 80056.2%63.2%7较窄 1,60057
9、.5%-63%5.5较窄 3,20058.5%-62%3.5更窄 由上表得出: 1、在置信水平相同的情况下,样本量越多,置信区间越窄。 2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。 通过置信区间的计算公式来验证置信区间与样本量的关系 置信区间=样本的推断值(可靠程度系数 ) 从上述公式中可以看出: 在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。 2.置信水平对置信区间的
10、影响:在样本量相同的情况下,置信水平越高,置信区间越宽。 实例分析: 美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为3%,置信水平为95%;如果将抽样误差减少为2.3%,置信水平降到为90%。则两组数字的情况比较如下: 抽样误差置信水平置信区间间隔宽窄度 39560357-636宽 2.390602.357.7-62.34.6窄 由上表得出: 在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。 抽样误差(Sampling error) 编辑什么是抽样误差 在抽样检查中,由于用样本指标代替全及指标所产生的误差
11、可分为两种:一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差,而不是指前一种因不遵循随机性原则而造成的系统性误差。 总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。在进行抽样检查时不可避免会产生抽样误差,因为从总体中随机抽取的样本,其结构不可能和总体完全一致。例如样本平均数与总体平均数之差,样本成数与总体成数之差 | p P | 。虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。 抽样误差也是衡
12、量抽样检查准确程度的指标。抽样误差越大,表明抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。在统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体进行分析计算。 编辑抽样误差的计算 1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。 2、平均数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: 3、成数指标的抽样误差 1)重复抽样的条件下: 2)不重复抽样的条件下: 编辑抽样误差的控制措施 抽样误差则
13、是不可避免的,但可以减少,其措施有: 1、增加样本个案数。 2、适应选择抽样方式。 例如,在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。 显著性水平出自 MBA智库百科(重定向自显著水平)显著性水平(Significance Level) 编辑什么是显著性水平 假设检验是围绕对原假设内容的审定而展开的。如果原假设正确我们接受了(同时也就拒绝了备择假设),或原假设错误我们拒绝了(同时也就接受了备择假设),这表明我们作出
14、了正确的决定。但是,由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率用表示,统计上把称为假设检验中的显著性水平,也就是决策中所面临的风险。 显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取0.05或0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95或99。 显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。 编辑显著性水平的理解 显著性水平是在进行假设检验时事先确定一个
15、可允许的作为判断界限的小概率标准。检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。事件属于接受区间,原假设成立而无显著性差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。对显著水平的理解必须把握以下二点: 1、显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险来决定。 2、统计上所讲的显著性与实际生活工作中的显著性是不一样的。 显著性差异出自 MBA智库百科(显著性差异(Significance Difference) 编辑什么是显著性差异 显著性差异是一个统计学名词。它是统计学(Statistics)上对数据差异性
16、的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。 如比西一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学记忆法对被试记忆能力的改变。 编辑显著性差异的评析 显著性差异是一种有量度的或然性评价。比如,我们说A、B两数据在0.05水平上具备显著性差异,这是
17、说两组数据具备显著性差异的可能性为95。两个数据所代表的样本还有5的可能性是没有差异的。这5的差异是由于随机误差造成的。 P-value是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称P值。如果此值小,就下原假设为不真实的结论。统计学上称为小概率事件,即样本不是从原假设的分布中抽出的。一般P值大于,则无法拒绝原假设,相反,P值小于,则拒绝原假设。通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之间具备了显著性差异。在作结论时,应确实描述方向性(例如显著大于或显著小于)。 如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性
18、差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。 假设检验出自 MBA智库百科(假设检验(Hypothesis Testing) 目录显示 1 什么是假设检验 2 假设检验的基本思想 3 假设检验的原理 4 假设检验的种类 5 假设检验的基本思想 6 假设检验规则与两类错误 7 假设检验的一般步骤 8 假设检验应注意的问题 9 假设检验与置信区间的关系 10 几种常见假设检验 11 假设检验的应用分析 o 11.1 案例一:假设检验设
19、备判断中的应用1o 11.2 案例二:假设检验在卷烟质量判断中的应用2 12 相关条目 13 参考文献编辑什么是假设检验 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差
20、即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。 在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你
21、所承担的风险。假设检验的思想是,先假设两者相等,即:0,然后用统计的方法来计算验证你的假设是否正确。 编辑假设检验的基本思想1.小概率原理 如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。 2.假设的形式 H0原假设, H1备择假设 双尾检验:H0: = 0 , 单尾检验: ,H1: 0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 编辑假设检验的原理 一般地说,对总体某项或某几项作出假设,然后根据样本对假设
22、作出接受或拒绝的判断,这种方法称为假设检验。 假设检验使用了一种类似于“反证法”的推理方法,它的特点是: (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为,称为显著性水平。
23、而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。 编辑假设检验的种类假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。 正态分布检验包括三类:JB检验、KS检验、Lilliefors检验,用于检验样本是否来自于一个正态分布总体。 正态总体均值检验检验分析方法和分析结果的准确度,考察系统误差对测试结果的影响。从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。 正态总体均值检验
24、分为两种情况, t检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显著性,分为单侧检验与双侧检验。当为双样本检验时,在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。 Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。 上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。非参数检验方法,对样本是否来自正态总体不做严格
25、的限制,而且计算简单。统计工具箱提供了符号检验和秩和检验两种非参数检验方法。 编辑假设检验的基本思想 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P0.01或P3.48,也就是在50个样品中抽到4个不合格品才能判整批为不合格。 而如果我们改变的取值,也就是我们定义的小概率的取值,比如说取0.01,认为概率不超过0.01的事件发生了就是不合理的了,那又会怎样呢?还是用上面的公式计算,则得出,解得x4.30,也就是在50个样品中抽到5个不合格品才能判整批为不合格。检验要求是不合格品率P不能超过3%,而现在根据0.01,算出来50个样品中抽到5个不合格品才能判整批为不合格,会不会
26、犯错误啊!假设检验是根据样本的情况作的统计推断,是推断就会犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类: 第一类错误(拒真错误):原假设H0为真(批产品质量是合格的),但由于抽样的随机性(抽到过多的不合格品),样本落在拒绝域W内,从而导致拒绝H0(根据样本的情况把批质量判断为不合格)。其发生的概率记为,也就是显著性水平。控制的其实是生产方的风险,控制的是生产方所承担的批质量合格而不被接受的风险。 第二类错误(取伪错误):原假设H0不真(批产品质量是不合格的),但由于抽样的随机性(抽到过少的不合格品),样本落在W外,从而导致接受H0(根据样本的情况把批质量判断为合格)。其发生的
27、概率记为。控制的其实是使用方的风险,控制的是使用方所承担的接受质量不合格批的风险。 再回到刚刚计算的上例的情况,由0.05变化为0.01,我们对批质量不合格的判断由50 个样本中出现4个不合格变化为5个,批质量是合格的而不被接受的风险就小了,犯第一类错误的风险小了,也就是生产方的风险小了;但同时随着的减小对批质量不合格的判断条件其实放宽了50个样本中出现4个不合格变化为5个,批质量是不合格的而被接受的风险大了;犯第二类错误的风险大了,也就是使用方的风险大了。在相同样本量下,要使小,必导致大;要使小,必导致大,要同时兼顾生产方和使用方的风险是不可能的。要使、皆小,只有增大样本量,这又增加了质量成
28、本。 因此综上所述,假设检验可以告诉我们如何科学地进行质量合格判定,又告诉我们要兼顾生产方和使用方的质量风险,同时考虑质量和成本的问题。 显著性检验出自 MBA智库百科(显著性检验(Significance Testing) 目录显示 1 什么是显著性检验 2 显著性检验的含义 3 显著性检验的原理 4 显著性检验的相关概念 o 4.1 原假设和备择假设o 4.2 双尾检验和单尾检验 5 显著性检验的作用 6 显著性检验的基本思想 7 显著性检验的两类错误 8 显著性检验的P值1 9 显著性检验的结果 10 显著性检验中的总体和样本 11 显著性检验的步骤 12 总体均值为某定值的显著性检验
29、13 总体比例为某定值的显著性检验 14 显著性检验应注意的问题 15 常用显著性检验 16 显著性检验的应用2 17 显著性检验的实例分析 o 17.1 案例一:大豆籽粒品种检验分析 18 相关系数显著性检验表 19 相关条目编辑什么是显著性检验 显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。 显著性检验是针对我们对总体所做的假设做检验,其原理就
30、是“小概率事件实际不可能性原理”来接受或否定假设。 抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。 编辑显著性检验的含义 显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。 常把一个要检验的假设记作H0,称为原假设(或零假设) (null hypothesis) ,与H0对立的假设记作H1,称为备择假设(alternative hypothesis) 。 在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率
31、通常记作; 在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作。 通常只限定犯第一类错误的最大概率, 不考虑犯第二类错误的概率。这样的假设 检验又称为显著性检验,概率称为显著性水平。 最常用的值为0.01、0.05、0.10等。一般情况下,根据研究的问题,如果犯弃真错误损失大,为减少这类错误,取值小些 ,反之,取值大些。 编辑显著性检验的原理 无效假设 显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。经统计学分析后,如发现两组间
32、差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处理有效)。 “无效假设”成立的机率水平 检验“无效假设”成立的机率水平一般定为5%(常写为p0.05),其含义是将同一实验重复100次,两者结果间的差异有5次以上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为p0.05。若两者结果间的差异5次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为显著,常记为p0.05。如果p0.01,则认为两组间的差异为非常显著。 编辑显著性检验的相关概念 编
33、辑原假设和备择假设 1、原假设:对总体所作的论断或推测,指观察到的差异只反映机会变异。记作H0。 2、备择假设:是指观察到的差异是真实的。记作H1。 3、原假设和备择假设合在一起,应涵盖我们所研究的总体特征的所有可能性。 编辑双尾检验和单尾检验 采用双尾检验还是采用单尾检验(以及左单尾还是右单尾),取决于备择假设的形式。 表1:拒绝域的单、双尾与备择假设之间的对应关系 拒绝域位置原假设备择假设 双尾H0: = 0左单尾(不可能有 0时,H0: = 0)H1: 0 右单尾(不可能有 0 编辑显著性检验的作用 分析工作者常常用标准方法与自己所用的分析方法进行对照试验,然后用统计学方法检验两种结果是
34、否存在显著性差异。若存在显著性差异而又肯定测定过程中没有错误,可以认定自己所用的方法有不完善之处,即存在较大的系统误差。 因此分析结果的差异需进行统计检验或显著性检验。 编辑显著性检验的基本思想 显著性检验的基本思想可以用小概率原理来解释。 1、小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件 事实上发生了。那只能认为事件 不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。 2、观察到的显著水平:由样本资料计算出来的检验统计量观察值所截取的尾部面积为。这个概率越小,反对原假设,认为观察到的差异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分地表明真实差异存在。 3、检验所用的显著水平:针对具体问题的具体特点,事先规定这个检验标准。 4、在检验的操作中,把观察到的显著性水平与作为检验标准的显著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为样本数据表明了真实差异存在。大于这个标准时,拒