41统计量和抽样分布.ppt

上传人:sccc 文档编号:6070122 上传时间:2023-09-19 格式:PPT 页数:35 大小:1.82MB
返回 下载 相关 举报
41统计量和抽样分布.ppt_第1页
第1页 / 共35页
41统计量和抽样分布.ppt_第2页
第2页 / 共35页
41统计量和抽样分布.ppt_第3页
第3页 / 共35页
41统计量和抽样分布.ppt_第4页
第4页 / 共35页
41统计量和抽样分布.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《41统计量和抽样分布.ppt》由会员分享,可在线阅读,更多相关《41统计量和抽样分布.ppt(35页珍藏版)》请在三一办公上搜索。

1、从本章起转入课程的第二部分,数理统计,数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.,第四章、抽样分布,引言,从本章节开始,,我们将讲述数理统计的基本内容.,理统计作为一门学科诞生于19世纪末20世纪初,,有广泛应用的一个数学分支,,它以概率论为基础,,据试验划观察得到的数据,,来研究随机现象,,研究对象的客观规律性作出合理的估计和判断.,大量随机现象必然呈现出它们的规律性,,故理论上只,要对随机现象进行足够多次观察,,则研究对象的规律,数,是具,根,以便对,由于,必就一定能清楚地呈现出来,,但实际上人们常常无法,对所研究的对象的全体(或总体),进行观察,,而只能抽,取

2、其中的部分(或样本),数据.,数理统计的任务包括:,限的数据资料;,究,,从而对研究对象的性质、特点,,作出合理的推断,此即所谓的统计推断问题,,本课程主要讲述统计推断,的基本内容.,进行观察或试验以获得有限的,怎样有效地收集、,整理有,由于学时有限,课程的的这部分内容我们只介绍理论部分,即抽样分布。至于具体的方法,学生可以自己推导并学会处理问题。,4.1 统计量,一、总体与样本,一个统计问题总有它明确的研究对象.,1.总体,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,总体,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况

3、.这时,每个个体具有的数量指标的全体就是总体.,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.,这样,总体就可以用一个随机变量及其分布来描述.,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批灯泡的寿命,总体,寿命X可用一概率分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,

4、那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.,2.样本的数学描述,样本是随机变量.,抽到哪5辆是随机的,容量为n的样本可以看作n维随机向量.,样本的双重含义:泛指一次抽样结果,是一个n维向量,称为样本的一个观测值。,n维随机向量;指某次具体抽样结果,但是,一旦取定一组样本,得到的是n个具体的数,称为样本的一次观察值,简称样本观测

5、值.,2.独立性:X1,X2,Xn是相互独立的随机变量.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,代表性:X1,X2,Xn中每一个与所考察的总 体有相同的分布.,定义1 设总体X具有分布函数,为简单的随机样本,简称样本。,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.,3.总体、样本、样本值的关系,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,统计是从手中

6、已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,分组数据统计表和频率直方图,通过观察或试验得到的样本值,,一般是杂乱无章的,,需要进行整理才能从总体上呈现其统计规律性,,组数据统计表或频率直方图是两种常用的整理方法.,1.,分组数据表:,若样本值较多时,,组,,分组的组数应与样本容量相适应.,分组太少,,难以反映出分布的特征,,分组太多,,则由于样本取,值的随机性而使分布显得杂乱.,因此,,分,可将其分成若干,则,分组时,,确定,分组数(或组距)应以突出分布的特征并

7、冲淡样本的,随机波动性为原则.,区间所含的样本值个数称为该,区间的组频数.,组频数与总的样本容量之比称为组,2.,频率直方图:,频率直方图能直观地表示出组频,率的分布.,其步骤如下:,(1),频率.,(2),并,且小区间不包含右端点):,(3),组频率,及,求组频数,(4),为宽作小矩形,,所有小矩形合在一起就构成了频率,直方图.,例1,从某厂生产的某种零件中随机抽取120个,测得,列出分组表,并作频率,直方图.,解,先从这120个样,本值中找出最小值,190,取,将区间,等分成11个小区间,组距,例1,从某厂生产的某种零件中随机抽取120个,测得,列出分组表,并作频率,直方图.,解,得到分组

8、表及频,从直方图的形状,可以粗略地认为该种零件的质量,率直方图.,服从正态分布,其数学期望在209附近.,经验分布函数,定义2,可按大小次序排列成,若,因而函数,注:,样本的频率直方图可以形象地描述总体的概率,分布的大致形态,,而经验分布函数则可以用来描述,总体分布函数的大致形状.,有下列结论(格里汶科,1933):,对于上述经验分布函数,由此结果,,对于任一实数,从而在实际中可当作,来使用.,这就是由样本推断总体其可行性,的最基本的理论依据.,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,二、统计量和抽样分布,1.统

9、计量,定义2 设是来自总体X的一个样 本,是一个连续函数,如果 中不包含任何未知参数,则称 是 的一个统计量。,例如,,未知.,为总体的一个样,令,本,,但,不是该样本的统计量,,因其含有总体分布中的未知,参数,注:,这个随机向量的函数,,用大写字母,,如:,等;,但是,,统计量就是一个具,统计量是,体的实数值,,用小写字母,如:,等.,2.几个常见统计量,样本均值,样本方差,它反映了总体均值的信息,它反映了总体方差的信息,样本标准差:,修正样本方差:,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k阶矩的信息,它反映了总体k阶中心矩的信息,补充说明,为样本的偏差平方和,,可将其变形

10、如下:,称,从而,例2,某厂实行计件工资制,为及时了解情况,随机,抽取30名工人,调查各自在一周内加工的零件数,其样本均值,它反映了该厂工人周工资的一般水平.,为:,所以样本方差为,由于,样本标准差为,例3,设我们获得了如下三个样本:,样本,样本,样本,明显可见它们的“分,散”程度是不同的:,这一直觉可以用样本方差来表示.,这三个样本的均,值都是 5,即,而样本容量,易得,例3,设我们获得了如下三个样本:,样本,样本,样本,易得,同理易得,由此可见,这与直觉是一致的.,由于样本方差的量纲与样本的量纲不一致,故常用,样本标准差表示分散程度,易求出,易求出,同样有,因此,常用,去估计,计.,例3,设我们获得了如下三个样本:,样本,样本,样本,分位数,对给定的实数,(1),(2),例如,,标准正态分布的上侧分位数和双侧分位数,分位数,例如,,标准正态分布的上侧分位数和双侧分位数,分别如下图:,分位数的性质:,通常,,直接求解分位数是很困难的,,对常用的统计,分布,,可利用附录中给出的分布函数值表来得到分,位数的值.,例4,设,求标准正态分布的水平 0.05 的上,侧分位数和双侧分位数.,解,由于,查标准正态分布函数值表可得,而水平 0.05 的双侧分位数为,它满足:,查标准正态分布函数值表可得,今后,注:,分位数与双侧分位数.,标准正态概率密度为偶函数,所以若,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号