假设检验的计算1-单总体.ppt

上传人:小飞机 文档编号:6549947 上传时间:2023-11-11 格式:PPT 页数:72 大小:1.15MB
返回 下载 相关 举报
假设检验的计算1-单总体.ppt_第1页
第1页 / 共72页
假设检验的计算1-单总体.ppt_第2页
第2页 / 共72页
假设检验的计算1-单总体.ppt_第3页
第3页 / 共72页
假设检验的计算1-单总体.ppt_第4页
第4页 / 共72页
假设检验的计算1-单总体.ppt_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《假设检验的计算1-单总体.ppt》由会员分享,可在线阅读,更多相关《假设检验的计算1-单总体.ppt(72页珍藏版)》请在三一办公上搜索。

1、1,第八讲:单总体的假设检验,2,单总体假设检验的分类,3,一、基本知识,4,1、建立假设:陈述原/零/虚无假设 H0和研究/备择假设 H1,一般我们把实际被检验的假设称为零假设(用符号H0来表示),并用这与备择假设(H1)相对比.一般来讲,零假设总是假设几个组之间不存在差异,或几个变量之没有关系,而备择假设则假设它们之间存在正相关或负相关的关系.实际上,研究者一般都预期零假设是错误的,应予以否定,并据此而接受备择的H1.但为了计算概率分布,在操作过程中,却必须先把H0看作正确的.如果我们能证明H0是正确的可能性很少,那么就可以据此顨 排除抽样误差的说法,百认为H1”可能”是对的。检验假设的基

2、本原则是直接检验H0,因而间接地检验H1,目的是排除抽样误差的可能性。,5,2、选择显著性水平和否定域,P153所谓否定域(CR),就是抽样分布内一端或两端的小区域,如果样本的统计值在此区域范围内,则否定原假设。我们可以指定否定域在抽样分布的一端,也可以是两端。究竟是一端还是两端,则要视研究假设(H1)的性质而定。,6,与否定域相关连的统计学概念是显著度(level of significance),表示否定域在整个抽样分布中所占的比例,也即表示样本的统计值落在否定域内的机会。显著度(P)的大小,视研究的需要而定,但在当前的社会学研究中,一般是以p0.05作为准则.当然,显著度愈小,便 愈难否

3、定原假设,也即愈难证明研究假设/备择假设是对的.,7,3.一端检验与二端检验,在何种情况下选择一端检验还是二端检验?取决于是否可以确定研究假设(H1)的方向.如果H1能定出方向,如,则为一端检验.如果H1定不出方向,如,则样本的统计值落在抽样分布的右端或左端的可能性是相同的,因而要用二端检验.如果所选定的显著度相同的,二端检验比一端检验更难否定原假设/虚无假设.所以,要求成立研究假设时最好是尽可能清楚.,8,9,4、两种错误(type和type),当我们以样本的统计值来检验假设时,最后的结果无论是否定还是接受,都可能犯错误.第一种错误(弃真的错误):是指否定H0,但实际上H0是正确的概率.第二

4、种错误(纳伪的错误):是指接受H0,但实际上H0是错误的概率。这两种错误是成反比的,是对立的。,10,11,5、两种检验的角度:参数检验与非参数检验,(1)参数检验(Z、T、F)要求总体具备一些条件:正态分布;定距测量层次;方差齐性等(2)非参数检验(X2)总体分布不易确定(也就是不知道是不是正态分布);分布呈非正态而无适当的数据转换方法;等级资料;一段或两段无确定数据等(比如一段的数据是50,是一个开区间)但由于非参数检验不理会总体的情况,在推论时就较为困难,准确性也会因此而影响。因此,在总体确实具备某些条件时,参数检验要比非参数检验法好。,12,二、检验的基本步骤,1.建立假设:陈述原假设

5、 H0和研究假设 H12.选择显著性水平 和否定域3.求抽样分布4.计算检验统计量5.做判断,13,三、单个总体均值和比例的假设检验,(一)单个总体均值的检验(二)单个总体比例的检验,14,(一)单个总体均值的检验,15,1.大样本总体均值检验(两端),1.假定条件:总体服从正态分布2.原假设为:H0:M=M0;研究假设为:H1:M M03.使用 z 统计量(通常n100),Z检验,N(0,1),16,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为M0=0.081mm,总体标准差为s=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到

6、的椭圆度均值为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),例题1,17,例题1(计算结果),H0:M=0.081H1:M 0.081=0.05n=200临界值|1.96,检验统计量:,决策:,结论:,拒绝H0,接受H1。,从总体上看,在0.05的显著性水平上,新机床加工的零件的椭圆度与以前有显著差异,解:,18,大样本总体均值假设检验(一端),1.假定条件:总体服从正态分布2.研究假设有符号3.使用 z 统计量,19,大样本总体均值的假设检验(一端),左侧:H0:0 H1:0,右侧:H0:0 H1:0,20,某批发商欲从生产厂家购进一批灯泡,根据合同规定,

7、灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(0.05),例题2,21,H0:1000H1:1000=0.05n=100临界值 1.65,检验统计量:,在=0.05的水平上拒绝H0,因此,从总体来看,在0.05的显著性水平上,这批灯泡的使用寿命低于1000小时,决策:,结论:,例题2(计算结果),解:,22,2、小样本单总体均值的两端 t 检验,1.假定条件总体为正态分布2.使用t 统计量(t的分布形态决取于自由度。Df=n-1),23,已知初婚年龄服从正态分布,根据

8、9个人抽样调查得到x=23.5,s=3,是否可以认为该地区初婚年龄已经超过20岁。,24,(二)单个总体比例的检验,25,1.大样本单总体比例的检验,假定条件有两类结果总体服从二项分布比例检验的 z 统计量,P0为假设的总体比例 为样本中计算出来的比例,26,某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(=0.05),例题4,27,例题4(计算结果),H0:p=0.3H1:p 0.3=0.05n=200临界值(Z):,检验统计量:,在=0.05的水平上接受H0,从总体来看,研究者的估计可信,决策:,结论:,解:,28

9、,2.小样本总体比例的两端检验,29,单均值和单比例假设检验的spss应用,30,31,32,上图即调查了2239人,文化程度平均为3.48,标准差为1.010,标准误是0.021。下图是t检验的结果,即在假设总体文化程度为3的情况下,计算t值为22.536,自由度为2238,两端t检验的概率P小于0.001,所以可以否定虚无假设,也就是可以认为流动农民的文化程度不是3。样本均值与假定的总体均值之间的差为 0.481,样本均值与虚无假设的差的95%的置信区间为0.44,0.52。因为总体均值95%的置信区间=均值1.96标准误,可以推测总体的95%的置信区间是3.481.960.021,即,3

10、3,四、两总体的假设检验,(一)均值差异的假设检验(二)比例差异的假设检验,34,(一)均值差异的假设检验,35,1、大样本的z检验,研究两个随机样本的均值的差异1、假定条件随机抽样总体服从正态分布两个总体的标准差是相等的如果样本的个案数比较大,n1+n2100,采用Z检验,36,例题3,调查甲乙两地农民每年家庭请客送礼情况发现,甲地调查了132户,平均每家送礼57元,标准差为11元,;乙地调查了118户,平均每户为52元,标准差为14元。在0.05的显著性水平下,甲乙两地农民送礼的平均支出是否相等?,37,解:H0:x1=x2H1:x1x2=0.05n=250临界值|Z(0.05)|1.65

11、,决策:在0.05的显著性水平上,拒绝H0,接受H1结论:从总体上来看,甲乙两地在送礼的平均支出上存在显著性差异,38,2、两个均值的小样本比较,如果样本较小,n1+n2100则用t检验Df=n1+n2-2,39,例题,为了测量一项新教学法是否有效,假设某班从学生中随机抽取了两个样本,一个作为实验组(n1=15),另一个作为控制组(n2=15),对实验组的同学采用新教学法进行辅导,而控制组不参加.经过一段时间之后,两组学生在一次测验中的成绩如下:实验组同学的平均成绩为85分,标准差为13分,控制组学生的平均成绩为75分,标准差为17分,那么在a=0.05的显著性水平下,是否可以确定这种新教学方

12、法可以提高学生的成绩?,40,3、两个配对样本的T检验前后两次调查同一总体所得的样本,前面讲的都是两个相互独立的样本通常用于试验组和控制组的调查中,前后两期的数据是属于同一个样本,两个是相关样本,而不是相互独立的样本,Xd表示样本差异的均值Sd样本差异的标准差,41,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减轻8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表,在 a=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?:,42,43,解:H0:m1 m2 8.5 H1:m1 m2 8.5 a=0.05

13、df=10-1=9,查附表5,-t0.05(9)=-1.833,因为tt0.05,,在接受域中,不能否定虚无假设,44,解:H0:m1 m2 8.5 H1:m1 m2 8.5 a=0.05 df=10-1=9,查附表5,t0.05(9)=1.833,因为tt0.05,,在否定域中,可以否定虚无假设,有证据表明该俱乐部的宣称是可信的.,45,4、两个百分比的差异,如果要检查两个比例(或百分比)在总体中是否有差异,若样本数较大,两个随机样本比例或百分比差的抽样分布接近正态分布,可用Z检验,选择的检验统计量为:,46,例5:比较一个城镇和一个农村地区的小家庭的比例是否相等,在城市调查了150户,小家

14、庭的比例为0.82,农村地区调查了200户,小家庭的比例为0.51,在0.01的显著度下,两个地区的小家庭的比例是否存在显著性差异?,47,解:(1)虚无假设:H0:P1=p2;研究假设:H1:P1p2(2)已知显著性水平a=0.05,因研究方向不确定,所以采用两端检验,查表得Z临界值=1.96(3)根据调查已知:P1=0.82,P2=0.51,n1=150 n2=200,所以,48,代入公式得:,49,与0.01显著性水平的取值进行比较,发现此数值属于否定域范围内,因此否定原假设(两者不存在差异),而接受研究假设(城镇地区小家庭的比例和农村地区存在差异),显然,城镇地区小家庭的比例高于农村地

15、区。,50,均值差异比较与检验的spss的应用,对均值的比较和检验主要在compare means模块中.1.means过程是对指定变量的分组综合描述统计,包括均值方差中位数最大值和最小值等统计量的计算,即当观测量按一个分类变量分组时,means过程可以对其进行分组计算,比较各组均值的大小.如要计算男性和女性的平均月收入.用means过程求若干组的描述统计量,目的在于比较,但是各组之间的均值差异是否真的存在,则需要进行检验,ANOVA(方差分析法)可以提供检验结果,51,2.T检验过程独立样本的T检验(independent-samples t test)是用两个不相关样本的均值来估计两个总体

16、的均值是否相等的检验方法.(样本一定来自两个不相关总体)配对样本的t检验(paired-sample t test)是通过两个相关或配对样本两次测量结果的比较来检验两个总体的差异是否显著,这种相关或配对样本常常来自实验前后被观测的样本或者跟踪调查的样本等.,52,3.one-way ANOVA过程单因素方差分析用于检验多个独立的均值差异是否显著,如检验三个减肥计划体重下降的效果是否相同,进而判断哪一种训练计划效果更好,或者三个训练计划哪两个之间的差异最显著。,53,Means 过程,1、建立数据文件数据文件至少要求有一个连续变量(定距变量)、一个定类变量,对描述的连续变量进行基本的描述统计,而

17、定类变量用来分组。2。Analyze-compare meansmeans,54,55,两个分类变量放在均放在第一层,56,57,58,两个分类变量放在不同层,59,60,61,62,独立样本的t检验(independent-sample t test),独立样本的t检验,要求被检验的两个样本相互独立,没有匹配关系。检验的目的是比较两个样本均值的大小,并对其进行假设检验,确定两个样本的均值是否在存在统计上显著差异,即确定两个样本分属的两个总体的均值是否存在差异。检验之前,要用f检验对两个样本乾地方差齐性(即等方差)的检验,确认两个总体的方差是否相同后,用t检验法对这两个样本的均值进行检验。,6

18、3,方差齐性检验,64,Analyzecompare meansindependent-samples T Test,65,66,67,方差齐性检验,方差不相等,68,配对样本的t检验(paired-samples t test),要求被比较的两个样本有配对关系,指的是对同一样本的某个变量进行前后两次测试所获得的两组数据,或是对在一些重要指标上个案两两匹配成对的两个不同样本进行测试所获得的两组数据。配对样本的特点:样本之间是独立的,彼此存在较强的相关关系。均值配对是比较常见的例子。如学生期中和期末成绩的比较。,69,analyzecompare meanspaired-samples T Test,70,71,72,说明流动人口的月平均伙食支出与月平均居住支出有较大关系,两个变量差的均值,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号