《用样本的频率分布估计总体分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《用样本的频率分布估计总体分布ppt课件.ppt(34页珍藏版)》请在三一办公上搜索。
1、2.2 总体分布的估计,统计的基本思想方法:,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.,统计的核心问题:,如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:,一类是如何从总体中抽取样本?,另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.,问题,某班40名同学在一次测验中的成绩如下: 73 69 77 66 84 78 48 78 73 85 98 81 52 96 73 65 85 79 100 63 88 57 99 71 79 83 67 78 75 74 71 89 76 74 50 62 9
2、2 87 77 64现在我想弄清这些同学的成绩分布情况,该怎么办?,各分点比所给数据多取一位小数的原因是:为了使数据不落在分点上,从而明确它们究竟属于哪一组。,学生分数分布表(频率分布表),学生分数分布统计图(频率分布直方图),用样本估计总体,用样本估计总体(两种): 一种是:用样本的频率分布估计总体的分布。 另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。,用样本的频率分布估计总体分布一 频率分布图和频率分布直方图频率分布折线图和总体密度曲线三 茎叶图(stem-and-leaf display),探究:我国是世界上严重缺水的 国家之一,城市缺水问题较为突出。某市政府为了节约
3、用水,计划在 本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的按平价收费,超过 a的按议价收费。如果希望大部分居民的 日常生活不受影响,那么标准a定为多少比较合理?你认为,为了较为合理地确定出这个标准,需要做什么工作?,根据这些数据你能得出用水量其他信息吗?,表22 100位居民月均用水量的 频率分布表 分组 频数累计 频数 频率 0 , 0.5) 4 0.04 0.5 , 1) 8 0.08 1 , 1.5) 15 0.15 1.5 , 2) 22 0.22 2 , 2.5) 25 0.25 2.5 , 3) 14 0.14 3 , 3.5) 6 0.06 3.5
4、 , 4) 4 0.04 4 , 4.5) 2 0.02 合计 100 1.00,注:小长方形的面积组距频率/组距频率 各长方形的面积总和等于1。,1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、 将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出频率分布表.(学生填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。,例.从规定尺寸为25.40mm的一堆产品中任取 100件,测得尺寸如下: 2
5、5.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.4725.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.4025.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.4925.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.2725.43 25.54 25.39 25.45 25.43 25.40
6、 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.3225.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.37 25.47 25.39 25.42 25.47 25.38 25.39,样本的频率分
7、布表示形式有: 频率分布表和频率分布直方图,一、计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。,二、决定组距与组数(将数据分组),组距:指每个小组的两个端点的距离,组距=极差/组数,列出频率分布表、画频率分布直方图的方法,极差为:25.56 25.24=0.32,三.决定分点 可以令分点比数据多1位小数,并且把第1小组的起点稍微减少一点,组数:将数据分组,当数据在100个以内时, 按数据多少分成512组,四.列出频率分布表,五.画频率分布直方图,注意:直方图的纵轴表示频率与组距的比值,,8.3,频率分布直方图如下:,小长方形的面积=?,频率分布直方图如下:,小长方形的面积总和
8、=?,频率分布直方图如下:,月均用水量最多的在那个区间?,频率分布直方图如下:,请大家阅读第68页,直方图有那些优点和缺点?,练 习,1.有一个容量为50的样本数据的分组的频数如下:,12.5, 15.5) 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根据频率分布直方图估计,数据落在15.5, 24.5)的百分比是多少?,某校对初二年级60名15岁女学生的身高做了测量,结果如下(单位:cm): 154
9、 159 175 159 156 149 162 166 159 156 166 160 164 155 157 146 161 158 158 153 158 154 158 163 153 153 162 162 151 154 165 164 151 146 151 158 160 165 158 163 162 161 154 165 162 162 159 157 149 164 149 159 153列出频率分布表,绘出频率分布直方图。,例题,已知一组数据如下:21 23 25 27 29 25 28 30 2924 25 27 26 22 24 25 26 28填写下面的频率分布
10、表,绘出频率分布直方图。,练习一,红星养猪场400头猪的质量频率分布直方图如图,其中数据不在分点上。按图回答:1)质量在 组里的猪最多,有 头。2)质量在60.5kg以上的猪有 头。3)这400头猪的总质量约 kg,平均质量约是 kg。,4000.4=160,55.560.5,400(0.2+0.08+0.02)=120,23240,23240400=58.1,练习二,想一想,频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,图2.22 100位居民的月均用水量的频率分布折线图,利用样本频率分布对总体分布进行相应估计,(3)当样本容量无限增大,组距无限缩小,那
11、么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线。,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线能够很好的反映总体在各个范围内的百分比,能构提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。?思考一下图中阴影部分的面积表示什么?,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39,(1)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39,茎叶图,甲,乙,012345,2 55 41 6 1 6 7 94 9 0,84 6 36 83 8 9 1,注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数,再见!,