《假设检验的原理和程序.ppt》由会员分享,可在线阅读,更多相关《假设检验的原理和程序.ppt(33页珍藏版)》请在三一办公上搜索。
1、第八章 假设检验,几个概念:,总体:研究对象的全体。样本:总体中随机抽取的一部分研究对象。统计量:从样本计算出来的统计指标。参数:总体的统计指标叫总体参数。,推论统计,统计推断:用样本信息推论总体特征的过程。包括:参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。,显著性水平,当你或你们用抛硬币做决定时,你觉得它公平吗?(事先不知结果,永远不知道总体)出现什么情况你认为是不公平的?5/54/6 9/1 决定我们能否从抛硬币的情况中得出推论的界限在哪里?,统计学上,经常使用
2、三种水平的概率:0.05、0.01、0.0010.05显著性水平(0.05 significance level)是我们做出“结果不是由于偶然因素造成的”这一结论的最低要求。也称5%显著性水平。水平,=0.05,=0.01,假设检验:1、原因2、目的3、原理4、过程(步骤)5、结果,第一节 假设检验的原理和程序,1、假设检验的原因,由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,不同。因此,X1、X2 不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性。(2)分别所代表的总体均数不同。差别有显著性。,2、
3、假设检验的目的,3、假设检验的原理/思想,反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。概率论:事件的发生不是绝对的,只是可能性大小而已。,判断是由于何种原因造成的不同,以做出决策。,4、假设检验的一般步骤,(1)首先对总体的参数特征做出某种假设;(2)根据待检验的假设推导待检验统计量的分布;(3)选择检验的显著性水平和推翻假设的临界区;(4)计算待检验的统计量的实验值;(5)根据待检验的统计量的实验值和概率分布理论做出结论。,例1:某学校一个班(n=64)进行比奈智力测验,结果平均得分为110,已知比奈测验的
4、常模0=100,0=16,问该班智力水平(不是这一次测验结果)是否确实与常模水平有差异。,一、提出假设虚无(无差、零)假设H0:1=0 研究(备择)假设为H1:10 这种“反证法”是统计推论的一个重要特点。,二、确定被检验统计量的样本分布 由于总体分布为正态、方差已知,所以样本平均数为正态分布。其平均数为100,标准误为16/8=2三、选择检验的显著性水平和临界区 选择a=0.05,临界值为1.96四、计算统计量:Z=(110-100)/2=5五、结论,5、假设检验的结果,接受检验假设拒绝检验假设正确理解结论的概率性(都隐含着犯错误的可能性)。,单侧还是双侧?,例1中提到的假设H0:1=0和H
5、1:10 只关心1和0是否有差异,并不关心1比0大还是小,所以这时在0两侧都需要一个临界点,临界点以外的区域为H0的拒绝区。这种只强调差异而不强调方向性的检验叫双侧检验。,单侧检验(单尾检验),如果临界区位于一段,则为单侧检验。提假设时是有方向的。如:H0:10 H1:10通常适用于检验某一参数是否“大于”或“优于”、“快于”以及“小于”、“劣于”、“慢于”一类的问题。,第二节 两个样本均数差异检验独立样本t 检验(spss)目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。计算公式及意义:Z 统计量/t 统计量 两种检验的条件与上节同。只是标准误的计算稍微复杂(要考虑样本是相
6、关还是独立的)。实际上,笼统上讲,大样本时一般用z检验;小样本时一般用t检验.,一、Z检验独立样本时:Z=(X1-X2)-(1-2)(s12/n1+s22/n2)大部分情况下研究变量的总体s 都是未知的,必须用 s 的估计值。那么,什么可以作为 s 的估计值?,样本标准差,Sx1-x2=S12/(n1-1)+S22/(n2-1)此时的检验与t检验十分类似 t=(X1-X2)-(1-2)S12/(n1-1)+S22/(n2-1)Df=n1+n2-2,例题 有应用心理学专业学生考察儿童观察力有无性别差异,于是收集数据进行计算和检验。已知:男孩样本:均数37.6,标准差22.5;女孩样本:均数38.
7、8,标准差25.8;(2)n1=375;n2=367,假设检验:建立假设:检验假设:男/女幼儿在这个问卷上的得分均数相同;备择假设:男/女幼儿在这个问卷上的得分均数不同;确定显著性水平():0.05,计算统计量:Z 统计量:Z=0.67;确定概率值:Z 0.05;做出推论:因为 p 0.05,不能拒绝H0:不能认为。,两个样本相关时的检验,(重复测量一批被试)例题:某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(标准差=16),结果平均智商为106,一年后在对这些儿童施测,结果成绩为110,一直两次测验结果的相关系数为0.74,问能否说随着年龄增长和一年的教育,儿童智商有了显著提高。,二、
8、两个小样本均数比较的 t 检验目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。计算公式及意义:t 统计量:自由度:n1+n2 2,适用条件:(1)已知/可计算两个样本均数及它们的标准差;(2)两个样本之一的容量少于30或50;(3)样本来自正态或近似正态总体;(4)方差齐。,t=(X1-X2)-(1-2)S12/(n1-1)+S22/(n2-1)Df=n1+n2-2,独立样本例题,已知:高二男生期末成绩:均数491.4,标准差138.5;高二女生期末成绩:均数672.3,标准差150.7(2)n1=25;n2=23(3)近似正态分布:(4)方差齐:25/23 2,假设检验:建
9、立假设:检验假设:高二的男生与女生总体成绩相同;备择假设:高二的男生与女生总体成绩不同;确定显著性水平():0.05,计算统计量:t 统计量:t=4.34;自由度:(n1-1)+(n2-1)=25+23 2=46表中:t 0.05(40)=2.021 t 0.05(50)=2.009 t 0.05(46)=?确定概率值:t t 0.05(46),p 0.05;,t 分布表与正态分布表不同,1.正态分布表是对一个分布(即正态分布)的描述。而t-分布表其实描述了几个不同的 t 分布。2.对于每一个不同自由度,都存在一个不同的t分布(即使当 df 变大时,差别实际上变得很小).表中的每一行都对应于不同的 t-分布。3.表中没有足够的空间列出对应于每个可能的 t-分数的概率.t分布表中列出的只是最常用的临界区域的t-分数(即,对应于那些最常用的 alpha 水平).t分布表也是分为单尾和双尾临界t值。,做出推论:因为 p 0.05,拒绝H0,接受H1:高二的男生与女生总体成绩不同。,相关样本 t 检验什么是相关样本?对同一批被试的重复测量(如治疗前后)或用不同方法测量;或者被试是配对的 总之,一对观察对象之间除了处理因素/研究因素之外,其它因素基本齐同。目的:判断不同的处理是否有差别,公式:244-246页 自由度:对子数-1适用条件:两组配对计量资料。记住:247页表格!,