用样本的数字特征估计整体的数字特征.ppt

上传人:牧羊曲112 文档编号:4932727 上传时间:2023-05-24 格式:PPT 页数:29 大小:837.50KB
返回 下载 相关 举报
用样本的数字特征估计整体的数字特征.ppt_第1页
第1页 / 共29页
用样本的数字特征估计整体的数字特征.ppt_第2页
第2页 / 共29页
用样本的数字特征估计整体的数字特征.ppt_第3页
第3页 / 共29页
用样本的数字特征估计整体的数字特征.ppt_第4页
第4页 / 共29页
用样本的数字特征估计整体的数字特征.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《用样本的数字特征估计整体的数字特征.ppt》由会员分享,可在线阅读,更多相关《用样本的数字特征估计整体的数字特征.ppt(29页珍藏版)》请在三一办公上搜索。

1、1.对一个未知总体,我们已经学过的用样本分布估计总体分布的方法有哪些?,2.它们各有什么优缺点?,频率分布表和频率分布直方图能够很容易表示大量数据,非常直观地表明其分布形状,使我们能够看到许多隐藏在数据后的信息,但是,损失了一些样本数据的信息,不能保留原有数据。茎叶图由所有样本数据组成,没有损失任何样本信息,可以在抽样过程中随时记录,但是,只能适用于样本容量较小时。,3.对于样本容量较大的样本,为了从整体上更好地把握总体规律,我们该如何处理呢?,用样本的数字特征估计总体的数字特征,2、中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.,1、

2、众数 在一组数据中,出现次数最多的数据叫做这一组数据的众数.,1、求下列各组数据的众数,(1)、1,2,3,3,3,5,5,8,8,8,9,9,众数是:3和8,(2)、1,2,3,3,3,5,5,8,8,9,9,众数是:3,2、求下列各组数据的中位数,(1)、1,2,3,3,3,4,6,8,8,8,9,9,(2)1,2,3,3,3,4,8,8,8,9,9,中位数是:5,中位数是:4,二、众数、中位数、平均数与频率分布直方图的关系,例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们得知这一组样本数据的,100位居民2007年的月均用水量(单位:t),3.1 2.5 2.0 2.0 1

3、.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2

4、.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,众数=2.3(t)中位数=2.0(t)平均数=2.0(t),思考1:如何从频率分布直方图中估计众数、中位数、平均数?,思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,思考:小长方形面积、对应这个组的频率、

5、这个组占的比例的关系。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,2.25,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:中位数左边的数据个数与右边的数据个数是相等的。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积和=0.49,后四个小矩形的面积和=0.26,2.02,归纳总结得:在样本中,有50的个体小于或等于中位数,也有50

6、的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表50个单位,它们的分界线与x轴交点的横坐标就是中位数。中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标。,思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?,答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原

7、始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:在频率分布直方图中,各个组的平均数如何找?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.25

8、,提示:与小长方形面积的比例有关吗?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,2.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.25,总结归纳得:平均数是频率分布直方图的“重心”,是直方图的平衡点。先找出每个小长方形的“重心”,即每小组的平均数,再按比例算出直方图的平均数。平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和。,三种数字特征的优缺点,标准差

9、,有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:,如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?,标准差,标准差是样本数据到平均数的一种平均距离.它用来描述样本数据的离散程度.在实际应用中,标准差常被理解为稳定性.,1、平均距离,1、标准差:,2.方差,从数学角度考虑,有时也可以用标准差的平方 方差来替代标准差作为测量数据分散程度的工具。,在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般采用标准差,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的,如何求总体的标准差和平均数?-通常采

10、用样本的平均数和标准差去估计总体的平均数与标准差,只要样本的代表性好,这样做就是合理的.,有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲:,乙:,如果你是教练,你应当如何对这次射击作出评价?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,甲乙的平均成绩相同,就需要观察它的离散程度,用计算器可算出甲,乙两人的的成绩的标准差,由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.,上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.,例1:画出下列四组样本数据的直方图,说明

11、它们的异同点.,(1),(2),(3),(4),(1),(2),(3),(4),例2:甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm),甲,乙,从生产的零件内径的尺寸来看,谁生产的质量较高?,X甲25.401,X乙25.406,s甲0.037,S乙0.068,X甲25.401 X乙25.406s甲0.037 S乙0.068,从样本平均数看,甲生产的零件内径比乙更接近内径标准,但是差异很小;从样本标准差看,由于s甲S乙,因此甲生产的零件内径比乙的稳定程度高很多。于是,可以作出判断,甲生产的零件的质量比乙的高一些。,1.用样本的数字特征估计总体的数字特征分两类:a.用样本平均数估计总体平均数。b.用样本标准差估计总体标准差。样本容量越大,估计就越精确。2.平均数对数据有“取齐”的作用,代表一组数据的平均水平。3.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。,小结,谢谢,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号