高等数学概率总体与样本.ppt

上传人:小飞机 文档编号:6358276 上传时间:2023-10-20 格式:PPT 页数:20 大小:321.49KB
返回 下载 相关 举报
高等数学概率总体与样本.ppt_第1页
第1页 / 共20页
高等数学概率总体与样本.ppt_第2页
第2页 / 共20页
高等数学概率总体与样本.ppt_第3页
第3页 / 共20页
高等数学概率总体与样本.ppt_第4页
第4页 / 共20页
高等数学概率总体与样本.ppt_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《高等数学概率总体与样本.ppt》由会员分享,可在线阅读,更多相关《高等数学概率总体与样本.ppt(20页珍藏版)》请在三一办公上搜索。

1、第七章第一节 总体与样本,在统计学中,将我们研究对象的全体称为总体,而把组成总体的每个基本单位称为个体.例如:我们想要研究一家工厂的某种产品的废品率.这种产品的全体就是我们的总体,而每件产品则是个体.,一、总体,本节主要介绍几个数理统计中的基本概念,实际上,我们真正关心的并不是总体或个体的本身,而是其某项数量指标.比如某家工厂的一种产品的使用寿命这样一项数量指标.因此,我们应该把总体理解为那些研究对象上的某项数量指标的全体,而直接用一个随机变量X表示。为了评价一家工厂的某种产品的质量的好坏,通常的做法是从它的全部产品中随机地抽取一些样品,在统计学上称为样本.同上道理,我们实际是把样本理解为样品

2、上的数量指标.因此,今后当我们说到总体和样本时,既指研究对象又指它们的某项数量指标.,说明,研究某地区N个农户的年收人.在这里,总体既指这N个农户,又指我们关心的数量指标他们的年收入的N个数字.如果我们从这N个农户中随机地抽出n个农户作为调查对象,那么,这n个农户以及我们关心的数量指标他们的年收入这n个数字就是样本.,在上面的例子中,总体是很直观的,是看得见摸得着的.但是客观情况并不总是这样.,例1,注意,用一把尺子去量一个物体的长度.假定n次测量值为X1,X2,Xn 显然,在这个问题中,我们把测量值 X1,X2,Xn看成了样本,但是,总体是什么呢?,例2,事实上,这里没有一个现实存在的个体的

3、集合可以作为我们的总体.可是,我们可以这样考虑,既然n个测量值X1,X2,Xn是样本,那么总体就应该理解为一切所有可能的测量值的全体.,分析:,这种类型的总体的例子不胜枚举.例如:为研究某种安眠药的药效,让n个病人同时服用此药,记录下他们各自服药后的睡眠时间比未服药时延长的小时数.X1,X2,Xn这些数字就是样本.什么是总体呢?设想让某个地区或某个国家,甚至全世界所有患失眠症的病人都服用此药,他们所增加的睡眠时间的小时数的全体,就是该问题中的总体.,对一个总体,如果我们用X表示它的数量指标,那么X的值对不同的个体取不同的值.因此,如果我们随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.

4、所以X是一个随机变量!既然总体是随机变量X,自然就有其概率分布.我们把X的分布称为总体的分布.总体的特性是由总体分布来刻画的.因此,我们常把总体和总体分布视为同义语.,二、总体的分布,例l中,若农户年收入以万元计,假定N户中收入X为以下几种取值:0.5,0.8,l,1.2和1.5.取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里n1+n2+n3+n4+n5=N).则总体X的分布为离散型分布,其分布律为:,例3(例l续),例2中,假定物体的真正长度为(未知).一般说来测量值X,也就是我们的总体,取附近值的概率要大一些,而离愈远的值被取到的概率就小一些.如果测量过程没有系统性误差,那

5、么X取大于和小于的概率也会相等.在这样的情况下,人们往往认为X服从均值为的正态分布.假定其方差为2,则2反映了测量的精度.于是,总体X的分布为N(,2).记为XN(,2).,例4(例2续),这里有一个问题,即物体长度的测量值总是在它的真正长度的附近,它根本不可能取到负值.而正态变量取值在(-,+)上,那么怎么可以认为测量值X服从正态分布呢?回答这个问题,有两方面的理由.,(1)在前面讲过,对于XN(,2).P-3X+3=0.9974.即X落在区间(-3,+3)之外的概率不超过0.003,即这个概率是非常小的.显然X落在(-4,+4)之外的概率也就更小了.,说明,比如,假定物体长度=10厘米,测

6、量误差约为0.01厘米,则2=0.012.这时(-3,+3)=(9.9997,10.0003).于是测量值落在这个区间之外的概率最多只有0.003,可以忽略不计.可见,用正态分布N(10,0.012)去描述测量值X是适当的.完全可以认为它根本不可能取到负值.(2)另外,正态分布取值范围是无限区间(-,+),这样还可以解决规定测量值取值范围上的困难.,如若不然,我们需要用一个定义在有限区间(a,b)取值的随机变量来描述测量值X.那么a和b到底应取什么值,测量者事先很难确定.再退一步,即使我们能够确定出a和b,却仍很难找出一个定义在(a,b)上的非均匀分布能够用来恰当地描述测量值.与其这样,还不如

7、我们干脆就把取值区间放大到(-,+),并采用正态分布去描述测量值.这样既简化了问题又不致引起较大的误差,思考一下看:,如果总体所包含的个体数量是有限的,则称该总体为有限总体.有限总体的分布显然是离散型的,如例3.如果总体所包含的个体数量是无限的,则称该总体为无限总体.无限总体的分布可以是连续型的,如例4,也可以是离散型的.,三、有限总体与无限总体,在数理统计中,研究有限总体比较困难.因为它的分布是离散型的,且分布律与总体所含个体数量有关系.,说明,所以,通常在总体所含个体数量比较大时,我们就把它近似地视为无限总体,并且用连续型分布去逼近总体的分布,这样便于做进一步的统计分析.,例,研究某大城市

8、年龄在1岁到10岁之间儿童的身高.显然,不管这个城市规模有多大,在这个年龄段的儿童数量总是有限的.因此,这个总体X只能是有限总体.总体分布也只能是离散型分布.,然而,为了便于处理问题,我们可以把它近似地看成一个无限总体,并且通常用正态分布来逼近这个总体的分布.当城市比较大,儿童数量比较多时,这种逼近所带来的误差,从应用观点来看,可以忽略不计.,四、样本的二重性,(1)假设X1,X2,Xn是从总体X中抽取的样本,在一次具体的观测或试验中,它们是一批测量值,是一些已得到的数.这就是说,样本具有数的属性,(2)另一方面,由于在具体的试验或观测中,受到各种随机因素的影响,在不同的观测中样本取值可能不同

9、.因此,当脱离开特定的具体试验或观测时,我们并不知道样本X1,X2,Xn的具体取值到底是多少,因此,可以把它们看成随机变量.样本就具有随机变量的属性.,样本X1,X2,Xn既可被看成数又可被看成随机变量,这就是所谓 样本的二重性.,需要特别强调的是,以后凡是我们离开具体的一次观测或试验来谈及样本X1,X2,Xn 时,它们总是被看成随机变量.,注意,在前面测量物体长度的例子中,如果我们是在完全相同的条件下,独立地测量了n次,把这n次测量结果,即样本记为 X1,X2,Xn.那么我们完全有理由认为,这些样本相互独立且有相同分布;其分布与总体分布N(,2)相同,例(例2续),五、随机样本,推广到一般情

10、况,如果我们在相同条件下对总体X进行n次重复的独立观测,那么就可以认为所获得的样本X1,X2,Xn是n个独立的且与总体X同样分布的随机变量.,在统计文献中,通常称:这样的样本随机样本,简称为样本.n 样本大小或样本容量或样本数.X1,X2,Xn 一组样本或一个样本(这是把X1,X2,Xn看成一个整体),或 n个样本.,名词,既然样本 X1,X2,Xn 被看作随机变量,自然就需要研究它们的分布,六、样本的分布,假设总体X具有概率密度 f(x),则由于样本 X1,X2,Xn 是相互独立且与X同分布,于是它们的联合概率密度为,假设某大城市居民的收入服从正态分布 N(,2),其概率密度函数为:,例5,现从中随机抽取一组样本 X1,X2,Xn.因为它们相互独立,且都与总体同分布,即:Xi N(,2),i1,2,n.于是样本 X1,X2,Xn 的联合概率密度为,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号