抽样分布及总体平均数的推断.ppt

上传人:牧羊曲112 文档编号:6164172 上传时间:2023-10-01 格式:PPT 页数:69 大小:992.50KB
返回 下载 相关 举报
抽样分布及总体平均数的推断.ppt_第1页
第1页 / 共69页
抽样分布及总体平均数的推断.ppt_第2页
第2页 / 共69页
抽样分布及总体平均数的推断.ppt_第3页
第3页 / 共69页
抽样分布及总体平均数的推断.ppt_第4页
第4页 / 共69页
抽样分布及总体平均数的推断.ppt_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《抽样分布及总体平均数的推断.ppt》由会员分享,可在线阅读,更多相关《抽样分布及总体平均数的推断.ppt(69页珍藏版)》请在三一办公上搜索。

1、第六章,抽样分布及总体平均数的推断,第一节 抽样分布,区分三种不同性质的分布:总体分布:总体内个体数值的频数分布样本分布:样本内个体数值的频数分布抽样分布:某一种统计量的概率分布,一、抽样分布的概念,抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。抽样分布是一个理论的概率分布,是统计推断的依据。,二、平均数抽样分布的几个定理,从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。,容量为n的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的平方根。,(81),(82),从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。虽然总体

2、不呈正态分布,如果样本容量较大,反映总体和的样本平均数的抽样分布,也接近于正态分布。,三、标准误及其计算,某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。,平均数标准误的计算,(1)总体正态,已知(不管样本容量大小),或总体非正态,已知,大样本平均数的标准误为:,平均数标准误的计算,(2)总体正态,未知(不管样本容量大小),或总体非正态,未知,大样本平均数标准误的估计值为,(8),四、平均数离差统计量的分布,由样本的平均数对总体平均

3、数进行估计,首先要了解平均数离差统计量的分布,才能根据一定的概率,由样本的平均数对总体的平均数做出估计。,1.总体正态,已知(不管样本容量大小),或总体非正态,已知,大样本,平均数离差的的抽样分布呈正态分布,(84),2.总体正态,未知(不管样本容量大小),或总体非正态,未知,大样本,平均数离差的的抽样分布呈t分布,(85),t分布的特点,形状与正态分布曲线相似t分布曲线随自由度不同而有一簇曲线自由度的计算:,自由度是指能够独立变化的数据个数。,查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。,3.总体未知,大样本时的近似处理,样本容量增大后,平均数的抽样分布接近于正

4、态分布,可用正态分布近似处理:,(86),第二节 总体平均数的估计,一、总体参数估计的基本原理,根据样本统计量对相应总体参数所作的估计叫作总体参数估计。总体参数估计分为点估计和区间估计。由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。,1.点估计,良好的点估计量应具备的条件:无偏性 如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。有效性 当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。,一致性当样本容量无限增大时,估计量的值能越来越接近它所估计的

5、总体参数值,这种估计是总体参数一致性估计量。充分性一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。,2.区间估计,以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。,二总体平均数的区间估计,1总体平均数区间估计的基本步骤根据样本的数据,计算样本的平均数和标准差;计算平均数抽样分布的标准误;确定置信概率或显著性水平;根据样本平均数的抽样分布确定查何种统计表;计算置信区间;解释总体平均数的置信区间。,2平均数区间估计的

6、计算,总体正态,已知(不管样本容量大小),或总体非正态,已知,大样本平均数离差的的抽样分布呈正态,平均数的置信区间为:,(91),例题1:某小学10岁全体女童身高历年来标准差为6.25厘米,现从该校随机抽27名10岁女童,测得平均身高为134.2厘米,试估计该校10岁全体女童平均身高的95和99置信区间。,解:10岁女童的身高假定是从正态总体中抽出的随机样本,并已知总体标准差为=6.25。无论样本容量大小,一切样本平均数的标准分数呈正态分布。于是可用正态分布来估计该校10岁女童身高总体平均数95和99的置信区间。,其标准误为,当0.95时,1.96因此,该校10岁女童平均身高95的置信区间为:

7、,当0.99时,2.58因此,该校10岁女童平均身高99的置信区间为:,总体正态,未知(不管样本容量大小),或总体非正态,未知,大样本,平均数离差的抽样分布为t分布,平均数的置信区间为:,(92),例题2:从某小学三年级随机抽取12名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试估计该校三年级学生阅读能力总体平均数95和99的置信区间。,解:12名学生阅读能力的得分假定是从正态总体中抽出的随机样本,而总体标准差未知,样本的容量较小(=1230),在此条件下,样本平均数与总体平均数离差统计量服从呈t分布。于是需用t分布来估计该校三年级学生阅读能力

8、总体平均数95和99的置信区间。,由原始数据计算出样本统计量为,当0.95时,,因此,该校三年级学生阅读能力得分95的置信区间为:,当0.99时,,因此,该校三年级学生阅读能力得分99的置信区间为:,总体正态,未知,大样本,平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:,(93),例题3:从某年高考中随机抽取102份作文试卷,算得平均分数为26,标准差为1.5,试估计全部考生作文成绩95和99的置信区间。,解:学生高考分数假定是从正态总体中抽出的随机样本,而总体的标准差未知,样本平均数与总体平均数离差统计量呈t分布。但是由于样本容量较大(n=12030),t分布接近于正态分布,

9、因此可用正态分布近似处理。,其标准误为,当0.95时,1.96因此,该年全部考生作文成绩95的置信区间为:,当0.99时,2.58因此,该年全部考生作文成绩99的置信区间为:,总体非正态,小样本,不能进行参数估计,即不能根据样本分布对总体平均数进行估计。,第三节 假设检验的基本原理,利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。,一、假设,假设检验一般有两互相对立的假设。H0:零假设,或称原假设、虚无假设(null hypothesis)、解消假设;是要检验的对象之间没有差异的假设。H1:备择假设(alternative hypothesis),或称

10、研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。,进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。,二、小概率事件,样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。,当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的

11、。,三、显著性水平,统计学中把拒绝零假设的概率称为显著性水平,用表示。显著性水平也是进行统计推断时,可能犯错误的概率。常用的显著性水平有两个:0.05 和 0.01。,在抽样分布曲线上,显著性水平既可以放在曲线的一端(单侧检验),也可以分在曲线的两端(双侧检验)。,图91 正态抽样分布上0.05的三种不同位置,四、假设检验中的两类错误及其控制,对于总体参数的假设检验,有可能犯两种类型的错误,即错误和错误。,表91 假设检验中的两类错误,为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显著性水平而对错误进行控制,如0.05或0.01。对错误,则一方面使样本容量增大,另一方面采用合

12、理的检验形式(即单侧检验或双侧检验)来使误差得到控制。,在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,被分散在概率分布曲线的两端,因此称为双侧检验。双侧检验的假设形式为:H0:0,H1:0,凡是检验大于或小于某一特定条件的假设检验,是在概率分布曲线的一端,因此称为单侧检验。单侧检验的假设形式为:H0:0,H1:0或者 H0:0,H1:0,第四节 总体平均数的显著性检验,总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行的显著性检验。若检验的结果差异显著,可以认为该样本不是来自当前的总体,而来自另一个、与当前总体存在显著差异的总体。即,该样本与当前的总体不一致。,一、总

13、体平均数显著性检验的原理,检验的思路是:假定研究样本是从平均数为的总体随机抽取的,而目标总体的平均数为0,检验与0之间是否存在差异。如果差异显著,可以认为研究样本的总体不是平均数为0的总体,也就是说,研究样本不是来自平均数为0的总体。,二、总体平均数显著性检验的步骤,一个完整的假设检验过程,一般经过四个主要步骤:提出假设选择检验统计量并计算统计量的值确定显著性水平做出统计结论,.提出假设,即根据研究假设提出相应的统计检验的假设。双侧检验的假设形式为:H0:0,H1:0单侧检验的假设形式为:H0:0,H1:0(左侧检验)或者 H0:0,H1:0(右侧检验),选择检验统计量并计算结果,直接应用原始

14、数据检验假设是有困难的,必须借助于根据样本构造出来的统计量,而且针对不同的条件,需要选择不同的检验统计量。各种检验统计量的计算公式都是针对特定条件的,学习中一定要注意把条件与统计量计算公式联系起来。,确定显著性水平,在假设检验中有可能会犯错误。如果零假设是正确的,却把它当成错误的加以拒绝,就会犯错误。表示做出统计结论时犯错误的概率,称为显著性水平。显著性水平一般为0.05和0.01。,做出统计结论,根据已确定的显著性水平,查统计量的分布表,找到该显著性水平时统计量的临界值,并以计算得到的统计量值与查表得到的临界值比较,根据统计决断规则做出拒绝或接受零假设的决定。,三、平均数显著性检验的几种情形

15、,总体为正态,总体标准差已知平均数的抽样分布服从正态分布,以为检验统计量,其计算公式为:,例:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?,检验步骤,.提出假设 H0:0,H1:0或 H0:66,H1:66.选择检验统计量并计算统计量的值学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。总体标准差已知,样本统计量的抽样分布服从正态,以Z为检验统计量,计算,.确定显著性水平和检验形式显著性水平为=0.05,双侧检验.

16、做出统计结论查表得Z=1.96,而计算得到的Z=1.09|Z|,则概率P0.05差异不显著,应在0.05显著性水平接受零假设结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致,没有显著差异。,表101 双侧Z检验统计决断规则,表102 单侧Z检验统计决断规则,-3.94,例2:某市高中入学考试数学平均分数为68分,标准差为8.6。其中某所中学参加此次考试的46名学生的平均分数为63。过去的资料表明,该校数学成绩低于全市平均水平,问此次考试该校数学平均分数是否仍显著低于全市的平均分数?,总体为正态,总体标准差未知,样本容量小于30,平均数的抽样分布服从t分布,以t为检验统计量,计算公式为:,表

17、103 双侧t检验统计决断规则,表104 单侧t检验统计决断规则,t2.266,例:某区初三英语统一测验平均分数为65,该区某校20份试卷的平均分数为69.8,标准差为9.234。问该校初三年级英语平均分数与全区是否一样?,t3.365,例:某校上一届初一学生自学能力平均分数为38,这一届初一24个学生自学能力平均分数为42,标准差为5.7,假定这一届初一学生的学习条件与上一届相同,试问这一届初一学生的自学能力是否高于上一届?,总体标准差未知,样本容量大于30,平均数的抽样分布服从t分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z代替t近似处理,计算公式为:,-2.11,例5:某年高考某市数学平均分数为60,现从参加此次考试的文科学生中,随机抽取94份试卷,算得平均分数为58,标准差为9.2,问文科学生的数学成绩与全市考生是否相同?,总体非正态,小样本,不能对总体平均数进行显著性检验。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号