概率论与数理统计第六章.ppt

上传人:sccc 文档编号:5136169 上传时间:2023-06-07 格式:PPT 页数:62 大小:1.11MB
返回 下载 相关 举报
概率论与数理统计第六章.ppt_第1页
第1页 / 共62页
概率论与数理统计第六章.ppt_第2页
第2页 / 共62页
概率论与数理统计第六章.ppt_第3页
第3页 / 共62页
概率论与数理统计第六章.ppt_第4页
第4页 / 共62页
概率论与数理统计第六章.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《概率论与数理统计第六章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第六章.ppt(62页珍藏版)》请在三一办公上搜索。

1、概率论与数理统计,计算机科学学院 裘国永,第六章 样本及抽样分布,引言随机样本抽样分布,本章转入课程的第二部分,数理统计,引言,数理统计是以概率论的理论为基础、通过试验所得数据来研究随机现象的一门数学分支,应用广泛,内容丰富。,概率论是数理统计的理论基础,数理统计是概率论的重要应用。,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科。,数理统计学是一门

2、应用性很强的学科。它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议。,例如:目前地震预测研究有3种不同的思路:地震地质。地震统计。对过去已发生的地震,运用数理统计方法,从中发现地震发生的规律,特别是时间序列的规律,根据过去以推测未来。此法把地震问题归结为数学问题。因需要对大量地震资料作统计,研究的区域往往过大,所以判定地震的地点有困难,而且外推常常不准确。地震前兆。,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。,由于大量随机现象必然呈现出它的规律性,因而从理论上讲

3、,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来。,但客观上只允许我们对随机现象进行,次数不多的观察试验,也就是说,我们获得的只是局部观察资料。,在概率论中所研究的随机变量,它的分布都是假设已知的,在这一前提下去研究它的性质、特点和规律性,例如求出它的数字特征,讨论随机变量函数的分布,介绍常用的各种分布等。,而在数理统计中的随机变量,它的分布是未知的,或者不完全知道,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布作出种种判断。,现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法。因此,数理统计中

4、的方法和支持这些方法的相应理论是相当丰富的,概括起来可以归纳成两大类:参数估计根据数据,用一些方法对分布的未知参数进行估计。假设检验根据数据,用一些方法对分布的未知参数进行检验。它们构成了统计推断的两种基本形式。这两种推断渗透到了数理统计的每个分支。,6.1 随机样本,总体和样本,在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。,数理统计方法具有“部分推断整体”的特征。,实际上,我们真正关心的并不是研究对象本身,而是其某项数量指标。比如某家工厂的一种产品的使用寿命这样一项数量指标。,1.总体,对研究

5、对象上的某项数量指标进行观察。试验的全部可能的观察值称为总体。这些值不一定各不相同(可能重复),数目上也不一定有限。每一个可能的观察值称为个体。总体中所包含的个体的个数称为总体的容量。,总体,有限总体,无限总体,例6.1 研究某地区N个农户的年收入。,总体指他们的年收入的N个数字。,例6.2 用一把尺子去量一个物体的长度。,总体应该理解为一切所有可能的测量值的全体。,一般,我们所研究的总体的某项数量指标X是一个随机变量,其取值在客观上有一定的分布。因此,对总体的研究,就是对相应的随机变量X的研究。,今后,我们称X的分布函数和数字特征分别为总体的分布函数和数字特征,并不再区分总体与相应的随机变量

6、X。对总体的称呼:总体,总体X与总体F。,2.总体的分布,在例6.l中,若农户年收入以万元计,假定N户中收入X为以下几种取值:0.5,0.8,l,1.2和1.5。取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里n1+n2+n3+n4+n5=N)。,例6.3(例6.l续),则总体X的分布为离散型分布,其分布律为:,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示。,寿命 X 可用指数分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体。如说总体X或总体F(x)。,寿命总体是指数分布总体,类似地,在研究某地区中

7、学生的营养状况时,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示。,总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本。样本中所包含的个体数目称为样本容量。,3.样本,从国产轿车中抽5辆进行耗油量试验,样本容量为5,当n次观察一经完成,得到n个具体的数 x1,x2,xn,称为样本X1,Xn的一次观察值,简称样本值。,1.代表性:X1,X2,Xn中每一个与所考察的

8、总体有 相同的分布。,2.独立性:X1,X2,Xn是相互独立的随机变量。,对总体X在相同的条件下,进行n次重复、独立观察,其结果依次记为X1,X2,Xn,这样得到的随机变量X1,X2,Xn是来自总体X的一个简单随机样本,与总体随机变量具有相同的分布。n是样本的容量。,这种抽样,叫作“简单随机抽样”,其特点:,对有限总体,采用放回抽样可得简单随机样本,但放回抽样使用起来不方便,当个体总数N比要得到的样本的容量n大得多时,在实际中可将不放回抽样近似当作放回抽样来处理。,对无限总体,因抽取一个个体不影响它的分布,所以总是采用不放回抽样。,定义 设X是具有分布函数F的随机变量,若X1,X2,Xn是具有

9、同一分布函数的、相互独立的随机变量,则称X1,X2,Xn为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本,它们的观察值x1,x2,xn称为样本值,又称为X的n个独立的观察值。,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本。,既然样本 X1,X2,Xn 被看作随机变量,自然就需要研究它们的分布。,4.样本的分布,=F(x1)F(x2)F(xn),若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为,其简单随机样本的联合概率密度函数为,=f(x1)f(x2)f(xn)

10、,假设某大城市居民的收入服从正态分布 N(,2),其概率密度函数为:,例6.4,设X1,X2,Xn是来自总体的一个样本.则 Xi N(,2),i1,2,n。于是样本 X1,X2,Xn的联合概率密度为,总 体 X,样本X1,X2,Xn,样本值x1,x2,xn,随机抽样 获得样本,完成试验 获得数据,整理加工 统计推断,统计 工作,4.总体、样本、样本值的关系,事实上我们抽样后得到的资料都是具体的、确定的值。如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本。我们只能观察到随机变量取的值而见不到随机变量。,统计是从手中已有的资料样本值,去推断总体的情况-总体分布F(

11、x)的性质。,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体。,样本是联系二者的桥梁,6.2 抽样分布,统计量与经验分布函数统计三大抽样分布正态总体的样本均值 和样本方差的分布,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来。,1.统计量,这种不含任何未知参数的样本的函数称为统计量。它是完全由样本决定的量。,一、统计量与经验分布函数,定义 设X1,Xn 是来自总体X的一个样本,g(X1,Xn)是X1,Xn的函数,若g中不含未知参数,则称g(X1,Xn)是总体X的一个统计量。,设x1

12、,xn 是样本X1,Xn的一个观察值,则g(x1,xn)是统计量g(X1,Xn)的观察值。,例:设X1,Xn 是总体X的一个样本,XN(m,s2),令T=X1-,若为已知的,则T为统计量;若未知,T就不是统计量。,几个常用的统计量及其观察值:,1.样本均值,2.样本方差,样本标准差,它反映了总体均值的信息,它反映了总体方差的信息,3.样本k阶原点矩,4.样本k阶中心矩,它反映了总体k 阶矩的信息,它反映了总体k 阶中心矩的信息,统计量的观察值,结论:若总体X的k阶原点矩,存在,由辛钦大数定理,当n趋于时,证明:辛钦定理 及依概率收敛的序列的性质。,第七章矩估计法的理论根据,经验分布函数是与总体

13、X的分布函数F(x)相应的统计量。,设X1,X2,Xn,是总体F的一个样本,令S(x)表示X1,X2,Xn中不大于x的随机变量的个数。定义经验分布函数Fn(x)为:,对于一个样本值 x1,x2,xn,经验分布函数Fn(x)的观察值仍记为Fn(x)。,2.经验分布函数,例6.5 设总体F具有一个样本值1,2,3,则经验分布函数F3(x)的观察值为,例6.6 若样本值为1,1,2,则经验分布函数F3(x)的观察值为,一般地,设x1,x2,xn,是总体F的一个容量为n的样本值,要求经验分布函数的观察值.首先将 x1,x2,xn,按由小到大的顺序排列,并重新编号,设为x(1)x(2)x(n),则经验分

14、布函数Fn(x)的观察值为,对不同的样本值,得到的经验分布函数不同。但当样本容量较大时,经验分布函数Fn(x)是总体分布函数F(x)的良好近似。,统计量的分布称为抽样分布。数理统计中常用到来自正态总体的三个分布:2分布、t 分布和F分布。,1.定义 设X1,X2,Xn相互独立,都服从正态分布N(0,1),则称随机变量:所服从的分布为自由度为 n 的2分布。,二、三大抽样分布,记为,2 分布,2.2 分布的密度函数 f(y)曲线,3.分位点 设X 2(n),若对于:01,存在 满足则称 为2(n)分布的上分位点。,4.性质设X1,X2,Xn,是来自正态总体N(,2)的一个样本,则,当n=25时,

15、通过查表1)求P 234.382的值;2)若 P 2b=0.975,求b的值。,b.分布可加性 若X 2(n1),Y 2(n2),X,Y相互独立,则 X+Y 2(n1+n2)。,c.期望与方差 若X 2(n),则E(X)=n,D(X)=2n。,d若X 2(n),则当n充分大时,近似正态分布N(0,1)。,定义 若XN(0,1),Y2(n),X与Y独立,则,t(n)称为自由度为n的t 分布。,t 分布,t(n)的概率密度为,2.性质,分位点 设tt(n),若对:00,满足Pt t(n)=,则称t(n)为 t(n)的上分位点。,注:,定义 若U 2(n1),V2(n2),U,V独立,则,称为第一自

16、由度为n1,第二自由度为n2的F分布。,F 分布,注:若FF(n1,n2),则1/FF(n2,n1)。,F分布的概率密度函数,若FF(n1,n2),F的概率密度为,2.F分布的分位点对于:00,满足PFF(n1,n2)=,则称F(n1,n2)为F(n1,n2)的上分位点;,注:,三、正态总体的样本均值和样本方差的分布,定理 1(样本均值的分布),定理 2(样本方差的分布),(1)相互独立,证明:,且U与V独立,根据 t 分布的定义,定理 3(样本方差比的分布及样本均值差的分布),(2)当 时,例6.8 设总体XN(10,32),X1,Xn是它的一个样本,(1)写出Z所服从的分布;(2)求PZ11。,解:因为Xi N(10,32),所以,那么,例6.9 设X1,X10是取自N(0,0.32)的样本,求,解:由题意知,那么,通过查表可得其值为0.1。,例6.10 设X1,Xn是取自N(,2)的样本,求样本方差S2的期望与方差。,解:因为,所以,作业P147:4,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号