《浙大概率论与数理统计课件第六章样本及抽样分布.ppt》由会员分享,可在线阅读,更多相关《浙大概率论与数理统计课件第六章样本及抽样分布.ppt(41页珍藏版)》请在三一办公上搜索。
1、第六章、样本及抽样分布,第一节:随机样本第二节:抽样分布,2022/11/11,1,引言,随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。,概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。,但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。,2022/11/11,2,例如:,某公路上行驶车辆的速度服从什么分布是未知的;,电视机的使用寿命服从什么分布是未知的;,产品是否合格服从两点分布,但参数合格率p是未知的;,数理统计的任务则是以概率论为基础,根
2、据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。,2022/11/11,3,从第本章开始,我们学习数理统计的基础知识。主要有参数估计、假设检验、方差分析、回归分析等内容.本章主要介绍数理统计的一些基本术语、基本概念、重要的统计量及其分布,它们是后面各章的基础。,学习的基本内容,2022/11/11,4,第一节 随机样本,总体和样本小结,2022/11/11,5,一、总体与样本,一个统计问题总有它明确的研究对象.,1、总体与个体,研究对象的全体称为总体,,总体,总体中所包含的个体的个数称为总体的容量.,总体中每个成员称为个体,总体,有限总体,无限总体,2022/11/11,6,因此
3、在理论上可以把总体与概率分布等同起来.,我们关心的是总体中的个体的某项指标(如人的身高、灯泡的寿命,汽车的耗油量) .,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性 . 从而可以把这种数量指标看作一个随机变量X ,因此随机变量X的分布就是该数量指标在总体中的分布.,总体就可以用一个随机变量及其分布来描述.,2022/11/11,7,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批灯泡的寿命,总体,寿命 X 可用一概率(指数)分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体. 如说总体X或总
4、体F(x) .,2022/11/11,8,类似地,在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.,统计中,总体这个概念的要旨是:总体就是一个随机变量(向量)或一个概率分布.,2022/11/11,9,2、样本,总体中抽出若干个体而成的集体,称为样本。样本中所含个体的个数,称为样本容量。,从国产轿车中抽5辆进行耗油量试验,样本容量为5,抽到哪5辆是随机的,2022/11/11,10,一旦取定一组样本X1, ,Xn ,得到n个具体的数 (x1,x2,xn),称为样本的一
5、次观察值,简称样本值 .,最常用的一种抽样叫作“简单随机抽样”,其特点:,1. 代表性: X1,X2,Xn中每一个与所考察的总体有 相同的分布.,2. 独立性: X1,X2,Xn是相互独立的随机变量.,注1:所谓样本就是n个与总体同分布的随机变量。,注2,2022/11/11,11,定义:,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,Xn表示.,2022/11/11,12,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,=F(x1) F(x2) F(xn),若总体
6、的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为,其简单随机样本的联合概率密度函数为,=f(x1) f(x2) f(xn),2022/11/11,13,事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.,3. 总体、样本、样本值的关系,2022/11/11,14,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是
7、联系二者的桥梁,2022/11/11,15,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,统计量及其分布,如何对样本进行加工?,2022/11/11,16,第二节 抽样分布,统计量与经验分布函数统计三大抽样分布几个重要的抽样分布定理小结,2022/11/11,17,1. 统计量,不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.,一、统计量与经验分布函数,2022/11/11,18,例,解:,2022/11/11,19,请注意 :,(1)统计量是一个随机变量。,2022/11/11,20,么么么么方面,
8、Sds绝对是假的,几个常见统计量,样本平均值,它反映了总体均值的信息,样本方差,它反映了总体方差的信息,样本标准差,2022/11/11,22,它反映了总体k 阶矩的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k 阶中心矩的信息,2022/11/11,23,统计量的观察值,2022/11/11,24,请注意 :,2022/11/11,25,2. 经验分布函数,2022/11/11,26,2022/11/11,27,二、统计三大抽样分布,记为,分布,1、,定义: 设 相互独立, 都服从正态分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布.,分布是由正态分
9、布派生出来的一种分布.,c2 分布,2022/11/11,28,分布的密度函数为,来定义.,其中伽玛函数 通过积分,2022/11/11,29,1. 设 相互独立, 都服从正态分布,则,这个性质叫 分布的可加性.,3若,近似正态分布N(0,1).,(应用中心极限定理可得 ),2设 且X1,X2相互独立,,2022/11/11,30,E(X)=n, D(X)=2n.,2022/11/11,31,2022/11/11,32,2022/11/11,33,由定义可见,,3、F分布,F(n2,n1),2022/11/11,34,即它的数学期望并不依赖于第一自由度n1.,1.F分布的数学期望为:,若n22
10、,若FF(n1,n2), F的概率密度为,2022/11/11,35,n取不同值时样本均值 的分布,请注意 :,2022/11/11,36,定理 2 (样本方差的分布),n取不同值时 的分布,2022/11/11,37,定理 3 (样本均值的分布),2022/11/11,38,定理 4 (两总体样本均值差、样本方差比的分布),分别是,2022/11/11,39,六、小结,在这一节中我们学习了统计量的概念 , 几个重要的统计量及其分布 ,即抽样分布. 要求大家熟练地掌握它们 .,2022/11/11,40,常用的统计量,样本平均值,样本方差,样本标准差,样本k阶原点矩,样本k阶中心矩,2022/11/11,41,