概率第七章样本分布090511下.ppt

上传人:小飞机 文档编号:4999213 上传时间:2023-05-28 格式:PPT 页数:37 大小:2.64MB
返回 下载 相关 举报
概率第七章样本分布090511下.ppt_第1页
第1页 / 共37页
概率第七章样本分布090511下.ppt_第2页
第2页 / 共37页
概率第七章样本分布090511下.ppt_第3页
第3页 / 共37页
概率第七章样本分布090511下.ppt_第4页
第4页 / 共37页
概率第七章样本分布090511下.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《概率第七章样本分布090511下.ppt》由会员分享,可在线阅读,更多相关《概率第七章样本分布090511下.ppt(37页珍藏版)》请在三一办公上搜索。

1、第七章样本分布,组成总体的每一个元素即总体的每个数量指标,可以看作随机变量 X 的某个取值。,研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,,X 的分布函数和数字特征称为总体的分布函数和数字特征,一.总体和样本,总体,个体,例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体.,它是一个随机变量(或多维随机变量)记为X,样本 从总体中抽取的部分个体,称 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实现,用 表示样本,n 称为样本容量,样本空间 样本所有可能取值的集合,在进行抽样时,样本的选取是随机的,即总体中每个,实际中,如总体样数很大,而抽

2、取的样本容量相对小,,简单随机样本:进行重复抽样所得的随机样本.,个体都有同等机会被选入样本。抽样通常有两种方式:,一种是不重复抽样,另一种是重复抽样。,如果总体单位数是无限的,抽取有限个不影响总体的,分布(此时重复抽取与不重复抽取没有多大区别)。,即可认为总体为无限的.,.(现在我们只研究简单随机样本),简单随机样本具有以下两个性质:,(2)代表性:即 中的每一个都与,(1)独立性:即 中,各个随机变量,的取值互不影响,这时,我们称 是相互,独立的随机变量,总体 有相同的概率分布,相同分布的随机变量离散型的具有相同的概率分布律,连续型的具有相同的概率密度,所以期望与方差全相同,样本容量为n的

3、样本是n个相互独立且与总体有相同分布,记为,是n元随机变量 的一个样本观测值,,记为,构成的一个n元随机,变量,一个容量为n的样本-,(1)指一个n元随机变量。,从这个角度来说,,(2)指某一次抽样的具体数值。,从这个角度来说,,统计量定义:,都是统计量,3统计量,统计量一般是样本 的连续函数,由于,样本 是随机变量,因而它的函数也是随机变量。,如:,二样本分布函数,在实际统计工作中,数据的处理形式为表和图。,统计表有简单表和分组表;统计图有频数(率)图,,频率直方图和累计频率直方图。,1.分组数据的统计表和频数直方图,简单表就是依出现的先后次序或按其数值大小列成表格,,一般用处不大。,如果数

4、据较多,可分成若干组,按各组数值大小列成表格,或制图,例1.观察新生女婴儿的体重(它是一个连续型随机变量),取170号按顺序测得体重如表7-1.,此表是体重按出生顺序排序.单位为克(g),分组数据的频数分布表,分组时一般采取等区间分组,区间长度称为组距.,制作分组数据表的步骤:,(1)从数据找出最大值M与最小值L,并求出它们的差.,这里:L=1800,M=4280,M-L=2480,(2)决定分组的界限。一般采用包含区域(L,M),的稍宽区域(a,b)为分组的界限。,这里取:a=1700,b=4300,L,M a,b,(3)决定组距(用D表示)和组数(用k表示),它们之间的关系,为D=(b-a

5、)/k,取组数时常常按照一定的经验法则,一般,来说,决定组数应使每组至少有个4、5个数据,当数据很,多时,只要可以反映分布的趋势,也可以每组很多数据。,这里:取k=13,D=(b-a)/k=(4300-1700)/13=200,其中落到各组的数据个数称为组频数。,例2 将例1中前20个新生婴儿体重按大小顺序列成一简单,统计表,如下表所示。,2,5,8,3,2,组频数,3750,3450,3150,2850,2550,组中值,3600-3900,3300-3600,3000-3300,2700-3000,2400-2700,组限,5,4,3,2,1,分组编号,若进一步把20个数据分成5组(每组不

6、包括上限)。试给出分组数据的频数分布表。,解:,这里取:a=2400,b=3900,要分5个组,,组距=(b-a)/5=(3900-2400)/5=300,画频率分布直方图的步骤:,1.求b-a,3.将数据分组,5.画频率分布直方图,4.列频率分布表,图中小长方体的面积等于对应的频率,各小长方体的面积之和等于1,频率直方图和累计频率直方图,组频率:是指组频数与样本容量的比值。,累积频率:相应一些组频率累加起来的和。,2.决定组距与组数,2,5,8,3,2,组频数,3750,3450,3150,2850,2550,组中值,3600-3900,3300-3600,3000-3300,2700-30

7、00,2400-2700,组限,5,4,3,2,1,分组编号,100,90,65,25,10,累积频率,10,25,40,15,10,组频率,累积频率直方图,其上某区间上的长方形面积约等于同底的曲顶梯形面积.,(只适用于连续型随机变量),故各长方形的顶点连成的曲线可近似模拟概率密度.,经验分布函数,根据观察结果来确定总体分布函数是数理统计的重要,问题之一,为此我们引进经验分布函数的概念.,组观察值,即对X进行n次独立重复观察,测得一组观察值.,对任一实数x,用vn(x)表示事件X x出现的频数,即小于等于x的观测值xi 的个数.,设函数,(i=1,2,.,n),显然 是随机变量,将对总体X的一

8、次观察作为一次试验,记A=X x,则:,X的分布函数F(x)=P(X x),=P(A)=p.,将对总体X的一次观察作为一次试验,记A=X x,则:,于是,对总体X的n次观察相当于n重贝努里试验,vn(x)表示事件Xx出现的频数,即n重贝努里试验中事件,X x发生的次数,故有vn(x)B(n,F(x),根据贝努里大数定律,p=P(A)=F(x),vn(x)表示事件X x出现的频数,X的分布函数F(x)=P(X x),=P(A)=p.,这表明,当样本容量n充分大时,可用总体X的函数,来近似表示X的分布函数,所以称 为X的经验分布函数.,顺序排列:,的一条阶梯曲线。,对任一实数x,vn(x)表示事件

9、X x出现的频数,则:,若观察值不重复,则每一跃度为,将它们从小到大排列为:,-402=22.5=2.5=2.533.24,其样本分布函数为:,1 2 3 4 5 6 7 8 9 10,三样本分布的数字特征,即样本分布的某些特征的数字,经常用它估计总体的,样本平均数,定义:对于样本,对某些具体的样本值,其样本平均数是,数字特征。,(1)不考虑分组时:,(加权平均值),(2)考虑分组时,例:例7.2中20个新生女婴儿的平均体重是?,2样本方差,及,分别为样本方差和样本标准差,由定义有,,解:,在具体计算样本方差时常用此式,或,证:,使用以下公式:,=112736.84,例:,解:,3.样本方差和样本平均数的简算公式.,则,(对分组数据也适用,可令,解:,令,a=3150,c=300,由上表得,的计算比直接计算样本平均数和方差要简便的多,则,4.几个常用统计量的分布,(1),(2),证明:(1)因,则取,由Th7.1知,的期望,方差,从而,这里只给出推论的证明:,它是数理统计中最重要的几个常用的统计量的分布之一.,回顾定理4.4,证明:,也相互独立,且,由定理4.1,分布的定义,则,则它们之和,它是数理统计中最重要的几个常用的统计量的分布之一.,回顾定理4.4,分布的定义,(1),则:,注意:,分别是样本平均数和标准差,则,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号