《估计总体的分布.ppt》由会员分享,可在线阅读,更多相关《估计总体的分布.ppt(18页珍藏版)》请在三一办公上搜索。
1、5 用样本估计总体 5.1 估计总体的分布,学会用样本的频率分布估计总体.会根据样本数据画出频率分布直方图及频率分布折线图.,从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看作是总体),我们就可以直接从中分析总体的各种信息.如人口普查得到的数据较为全面,从中可以很好地反映对象的重要信息.但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征.一般的,总体分布是指总体中个体所占比例.,如何通过样本来估计总体的分布情况呢?,这就需要我们先将样本的分布情况表示出来.,
2、例 1895年,在英国伦敦有106块男性头盖骨被挖掘出.经考证,这些头盖骨的主人死于16651666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm),请你估计在16651666年之间,英国男性头盖骨宽度的分布情况.,解:如果把总体看作是16651666年之间的英国男性头盖骨的宽度,那么我们就是通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成表:,从表格中,我们就能估计出总体大致的分布情况了,如在16651666年之间,英国男性头盖骨宽度主要在136149mm之
3、间,135mm以下以及140mm以上所占的比例相对较小等.但是,这些关于分布情况的描述仍不够形象.,为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组,再画频数分布直方图,用图中矩形的高度来反映频数.,我们也可以用区间上矩形的面积来反映频率,得到下图.,讨论,(1)头盖骨的宽度位于哪个区间的数据最多?(2)头盖骨的宽度位于140145 mm的频率约是多少?(3)头盖骨的宽度小于140 mm的频率约是多少?(4)头盖骨的宽度位于137142 mm的频率约是多少?,140145,43.4%,28.3%,0.041653/5+0.086852/5=0.298 4,即29.84%,从频率分
4、布表可以看出该样本宽度在140mm145mm之间的头盖骨所占的频率为43.4%,宽度在137mm142mm之间的头盖骨所占的频率为29.8%,由此估计,在1665年1666年之间,英国男性头盖骨宽度在140mm145mm之间的约为43.4%,宽度在137mm142mm之间的约为29.8%图中所有小矩形的面积之和,也就是头盖骨的宽度落在各宽度区间的频率之和,等于1.当样本容量较大时,样本中落在每个区间上的样本数的频率会稳定于总体的相应区间内取值的概率,因此,我们可以用样本的频率分布去估计总体的分布.另外,当样本量增大时.用样本的频率分布去估计总体的分布就越精确.,制作频率分布表的一般步骤:(1)
5、计算极差,确定组距和组数.在确定组距和组数时,要根据极极差的大小,数据的多少,选择恰当的组距,使表格不至于太长或太短;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组为闭区间;(3)计算频数、频率,列出频率分布表.说明:组距与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的都少,常分成512组.在实际操作中,一般要求各组的组距相等.为方便起见,组距的选取力求“取整”.组数=极差/组距.如果极差不利于分组(如不能被组数整除),可适当增大样本所对应的区间,如在左、右两端各增加适当范围.,频数分布直方图:列出频数分布表后,建立直角坐标系,在横轴上确定组距的
6、长,在纵轴上截取单位长度表示频率与组距的比1.以组距为宽,各组的频率(即)与组距(即)的比为高(即)做小矩形,所的图形即为频数分布直方图.频数分布直方图的优点是能直观地体现数据个数的分布规律及分布总体势态,一般是中间高、两端地、左右对称的“峰”状结构.缺点是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.说明:频数分布直方图以面积的形式反映了数据落在各个小组的频率的大小,各个小矩形面积的总和等于1.,在频率直方图中,按照分组原则,再在左右两边各加一个区间,从所得的各个区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得
7、到一条折线我们称之为频率折线图,有时用它来评估总体的分情况.,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线,总体在区间 内取值的概率,总体密度曲线,根据上图可得这100名学生中体重在56.5,64.5的学生人数是()A.20 B.30 C.40 D.50,1为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图如下:,C,0.03,0.05,0.07,54.5,58.5,62.5,66.5,70.5,74.5,2400,2700,3000,3300,3600,3900,X 体重,y,0.001,2、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:.,0.3,学会用样本的频率分布估计总体.会根据样本数据画出频率分布直方图及频率分布折线图.作业:习题1-5,1,行动与不满足是进步的第一必需品.,