《用样本数字特征分布估计总体数字特征.ppt》由会员分享,可在线阅读,更多相关《用样本数字特征分布估计总体数字特征.ppt(29页珍藏版)》请在三一办公上搜索。
1、2.2.2用样本的数字特征估计总体的数字特征,在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?,问题,为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。用样本的数字特征估计总体的数字特征。,1、众数 在一组数据中,出现次数最多的数据叫做这一组数据的众数.,2、中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.,甲在一次射击比赛中的得分如下:(单位:环
2、).7,8,6,8,6,5,9,10,7,5,则他命中的平均数是_,中位数是 众数是_,2.某次数学试卷得分抽样中得到:90分的有3个人,80分的有10人,70分的有5人,60分的有2人,则这次抽样的平均分为_.,7.1,77分,练习,7,5,6,7,8,众数:若有两个或两个以上的数据出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数。,中位数:唯一确定的。不受极端值的影响,仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即存在一些错误信息时,应该用抗极端性很强的中位数表示数据的中心值。,平均数:任何一个样本数据的改变都会引起平均数的改变。,如何从频率
3、分布直方图中估计众数?如图:,2.25,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,思考:频率分布直方图中估计的众数与原始数据中的众数2.3不同,为什么?,在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。,讨论:众数估计总体情况有什么优缺点?,能够体现样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。,如何从频率分布直方图中估计中位数?,前四个小矩形的面积和=0.49,2.02,后四个小矩形的面积和=0.26,分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于
4、或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。,总结:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数。,注:图中的数据是小矩形的面积即频率,上图中,设中位数为x,则,思考:2.02这个中位数的估计值,与样本数据的中位数2.0不同,为什么?,从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。,思考:中位数不受少数极端值的影响,这在某些情 况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?,考察100位居民的月均用水量表中的数据,如果把最后一个数据错写成22,并不会对样本
5、中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。,对极端值不敏感有利的例子:,某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。,对极端值不敏感有弊的例子:,如何从频率分布直方图中估计平均数?,注:图中的数据是小矩形的面积即频率,平均数等于频率分布直方图
6、中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,2.02,应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.,练习,课本P74 练习,三种数字特征的优缺点,探究,一个企业中,有职工的人数很多,他们的月收入是两千左右,然后有少数人员是经理以上层次的人,他们的月收入是三万左右。如果是你老板,去招聘时,回答有关工资待遇方面的问题,你更愿意用哪个数字特征来回答这个问题呢?如果你是应聘者,你更愿意希望老板是用哪个特征数字来回答?,平均数向我们提供了样本数据的重要信息,但是,有时它也会影响我们
7、,使我们对总体作出片面判断。平均数反映数据的集中趋势,但是,只有平均数还难以概况样本数据的实际状态。当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征。这时,我们引进了一个概念:标准差!,标准差,有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:,如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?,标准差,标准差是样本数据到平均数的一种平均距离.它用来描述样本数据的离散程度.在实际应用中,标准差常被理解为稳定性.,1、平均距离,标准差,标准差是样本数据到平均数的一种平均距离.它用来描述样本数据的离散程度.在实际应
8、用中,标准差常被理解为稳定性.,规律:标准差越大,大则a越大,数据的离散程度越大;反之,数据的离散程度越小.,计算标准差的算法:,1、算出样本数据的平均数2、算出每个样本数据与样本平均数的差3、算出,这n个数的平均数,即为样本方差4、算出方差的算术平均值,即为样本标准差s。,注意:,1、标准差、方差的取值范围:当标准差,方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性。2、因为方差与原始数据的单位不同,且平方后可能增大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般采用标准差。,例1:画出下列四组样本数据的直方图,说明它们的异同点
9、.,(1),(2),(3),(4),例2:甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm),甲,乙,从生产的零件内径的尺寸来看,谁生产的质量较高?,X甲25.401,X乙25.406,s甲0.037,S乙0.068,从样本平均数看,甲生产的零件内径比乙更接近内径标准,但是差异很小;从样本标准差看,由于s甲S乙,因此甲生产的零件内径比乙的稳定程度高很多。于是,可以作出判断,甲生产的零件的质量比乙的高一些。,X甲25.401 X乙25.406s甲0.037 S乙0.068,拓展,1、若 的平均数是,则 平
10、均数为2、数据 与数据 的方差相等。3、若 的方差为,则 的方差为。4、若 的方差为,则 的方差为,1、对划艇运动员甲乙二人在相同的条件下进行了6次测试,测得他们最大速度的数据如下:甲:27,38,30,37,35,31;乙:33,29,38,34,28,36根据以上数据,试判断他们谁更优秀。2、若数据 的平均数为,方差为,则 的平均数和方差分别为:(),乙比甲更稳定,所以乙比甲更优秀,练习,课本P79 练习,解:依题意计算可得 x1=900 x2=900 s123.8 s2 42.6,甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定.,解:(1)平均重量约为496.86 g,标准差约为6.55,1.用样本的数字特征估计总体的数字特征分两类:a.用样本平均数估计总体平均数。b.用样本标准差估计总体标准差。样本容量越大,估计就越精确。2.平均数对数据有“取齐”的作用,代表一组数据的平均水平。3.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。,小结,