用样本的数字特征估计总体的数字特征zhm.ppt

上传人:小飞机 文档编号:4987307 上传时间:2023-05-27 格式:PPT 页数:34 大小:426KB
返回 下载 相关 举报
用样本的数字特征估计总体的数字特征zhm.ppt_第1页
第1页 / 共34页
用样本的数字特征估计总体的数字特征zhm.ppt_第2页
第2页 / 共34页
用样本的数字特征估计总体的数字特征zhm.ppt_第3页
第3页 / 共34页
用样本的数字特征估计总体的数字特征zhm.ppt_第4页
第4页 / 共34页
用样本的数字特征估计总体的数字特征zhm.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《用样本的数字特征估计总体的数字特征zhm.ppt》由会员分享,可在线阅读,更多相关《用样本的数字特征估计总体的数字特征zhm.ppt(34页珍藏版)》请在三一办公上搜索。

1、(一)众数、中位数、平均数,2.2.2 用样本的数字特征估计总体的数字特征,一 众数、中位数、平均数的概念,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数:一组数据的算术平均数,即,问题1:众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?,平均数:反映所有数据的平均水平,众数:反映的往往是局部较集中的数据信息,中位数:是位置型数,反映处于中间部位的 数据信息,1、求下列各组数据的众数,(1)、1,2,3,3,3,5,5,8

2、,8,8,9,9,众数是:3和8,(2)、1,2,3,3,3,5,5,8,8,9,9,众数是:3,2、求下列各组数据的中位数,(1)、1,2,3,3,3,4,6,8,8,8,9,9,(2)1,2,3,3,3,4,8,8,8,9,9,中位数是:5,中位数是:4,3、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,分别求这些运动员成绩的众数,中位数与平均数。,解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;,答:17名

3、运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米)。,这组数据的平均数是,二、众数、中位数、平均数与频率分布直方图的关系,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,如何在频率分布直方图中估计众数,可将众数看作直方图中面积最大长方形的“中心”,众数:2.25,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩

4、形的面积和=0.49,后四个小矩形的面积和=0.26,2.02,如何在频率分布直方图中估计中位数,0.010.5=0.02,在样本中中位数的左右各有50%的样本数,条形面积各为0.5,所以反映在直方图中位数左右的面积相等.,,,中位数,),可将中位数看作整个直方图面积的“中心”,思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?,答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位

5、数估计值往往与样本的实际中位数值不一致.,如何在频率分布直方图中估计平均数,=2.02,=2.02,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,可将平均数看作整个直方图面积的“重心”,思考:1.如何从频率分布直方图中估计众数、中位数、平均数?,估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.,2.三种数字的优缺点1 众数 体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法可观地反应总体特征2

6、 中位数 是样本数据的所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的忽视,有时也会成为缺点3 平均数 由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数,中位数不具有的性质,因此,平均数受数据中极端值影响较大,使平均数在估计中时可靠性降低,思考:3、样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?,答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。对极端值不敏感有利的例子:例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)

7、时,用抗极端数据强的中位数表示数据的中心值更准确。,缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:,很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.,例1、下表是七位评委给某参赛选手的打分,总分为10分,你认为如何计算这位选手的最后得分才较为合理?,提问:1、电视里评委是怎样给选手打分的?2、为什么

8、这么做?直接取中位数和众数的值不好么?,三、众数、中位数、平均数的简单应用,例2 某工厂人员及工资构成如下:,(1)指出这个问题中周工资的众数、中位数、平均数,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,课堂练习,1.若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是_2.如果两组数x1,x2,xn和y1,y2,yn的样本平均数分别是x和y,那么一组数x1+y1,x

9、2+y2,xn+yn的平均数是_,课堂练习,3.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为()A.4 B.5 C.6 D.74.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.abcB.bca C.cabD.cba,B,D,课堂练习,5.下图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为()7 9 8 4 4 6 4 7 9 3 A.84 B.85 C.86D.87,B,

10、方差与标准差,(二),情境一;,甲.乙两名射击队员,在进行的十次射击中成绩分别是:甲:10;9;8;10;8;8;10;10;9.5;7.5乙:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9.5,试问二人谁发挥的水平较稳定?,分析:甲的平均成绩是9环.乙的平均成绩也是9环.,一.实例引入,情境二:,某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下:(单位cm),甲:31 32 35 37 33 30 32 31 30 29,乙:53 16 54 13 66 16 13 11 16 62,问:,哪种玉米苗长得高?,哪种玉米苗长得齐?,怎么办呢?,甲,37(最大

11、值),29(最小值),8,乙,66(最大值),11(最小值),55,极 差,甲:31 32 35 37 33 30 32 31 30 29,乙:53 16 54 13 66 16 13 11 16 62,极差:,一组数据的最大值与最小值的差,极差越大,数据越分散,越不稳定,极差越小,数据越集中,越稳定,极差体现了数据的离散程度,离散程度,为了对两人射击水平的稳定程度,玉米生长的高度差异以及钢筋质量优劣做个合理的评价,这里我们引入了一个新的概念,方差和标准差.,设一组样本数据,其平均数为,则,称s2为这个样本的方差,,称为这个样本的标准差,分别称为样本方差、样本标准差,它的算术平方根,x1,x2

12、,xn,样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。,例1.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1),解:,.,所以这组数据的方差为5.5,标准差为2.3.见课本76-77页,练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:,1、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;4、乙队很少不失球。,全对,例2:甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm),试根据这组数据估计哪一种水稻品种的产量比较稳定,解:,1、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为_;,2、已知数据 的方差为2,则求数据 的方差。,9.5,0.016,三.当堂反馈,思考一下:,如果数据,的平均数为,,方差为,(1)新数据,的平均数为,,方差仍为,(2)新数据,的平均数为,,方差为,(3)新数据,的平均数为,,方差为,,则,方差的运算性质:,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号