平均数、标准差与变异系数.ppt

上传人:小飞机 文档编号:5972738 上传时间:2023-09-09 格式:PPT 页数:50 大小:543.50KB
返回 下载 相关 举报
平均数、标准差与变异系数.ppt_第1页
第1页 / 共50页
平均数、标准差与变异系数.ppt_第2页
第2页 / 共50页
平均数、标准差与变异系数.ppt_第3页
第3页 / 共50页
平均数、标准差与变异系数.ppt_第4页
第4页 / 共50页
平均数、标准差与变异系数.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《平均数、标准差与变异系数.ppt》由会员分享,可在线阅读,更多相关《平均数、标准差与变异系数.ppt(50页珍藏版)》请在三一办公上搜索。

1、第三章 平均数、标准差与变异系数,第一节 平均数,下一张,主 页,退 出,上一张,平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有:算术平均数(arithmetic mean)中位数(median)众数(mode)几何平均数(geometric mean)调和平均数(harmonic mean),下一张,主 页,退 出,上一张,一、算术平均数 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法 主要用于样本含量n30以下、未经分组资料平均数的计算

2、。,下一张,主 页,退 出,上一张,设某一资料包含n个观测值:x1、x2、xn,则样本平均数可通过下式计算:(3-1)其中,为总和符号;表示从第一个观测值x1累加到第n个观测值xn。当 在意义上已明确时,可简写为x,(3-1)式可改写为:,下一张,主 页,退 出,上一张,【例3.1】某种10瓶饮用水的重量分别为500、520、535、560、585、600、480、510、505、490(g),求其平均数。由于 x=500+520+535+560+58+600+480+510+505+49=5285,n=10,下一张,主 页,退 出,上一张,得:即10瓶饮用水的平均重量为528.5 g。(二)

3、加权法 对于样本含量 n30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:(3-2),下一张,主 页,退 出,上一张,式中:第 i 组的组中值;第 i 组的次数;分组数 第 i 组的次数 fi 是权衡第 i 组组中值 xi在资料中所占比重大小的数量,因此将 fi 称为是 xi 的“权”,加权法也由此而得名。【例3.2】将100棵苹果树次年的产量(单位:kg)资料整理成次数分布表如下,求其加权数平均数。,下一张,主 页,退 出,上一张,表31 100棵苹果树次年的产量次数分布表,下一张,主 页,退 出,上一张,利用(32)式得:即这100棵苹果树次年的产量为45

4、.2kg。计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。,下一张,主 页,退 出,上一张,【例3.3】某牛群有黑白花奶牛1500头,其平均体重为750kg,而另一牛群有黑白花奶牛1200头,平均体重为725kg,如果将这两个牛群混合在一起,其混合后平均体重为多少?此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即,下一张,主 页,退 出,上一张,即两个牛群混合后平均体重为738.89 kg。(三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零。或简写成,

5、下一张,主 页,退 出,上一张,2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。(xi-)2(xi-a)2(常数a)或简写为:对于总体而言,通常用表示总体平均数,有限总体的平均数为:(3-3)式中,N表示总体所包含的个体数。,下一张,主 页,退 出,上一张,二、中位数 将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。,下一张,主 页,退 出,上一张,(一)未分组资料中位数的计算方法

6、 对于未分组资料,先将各观测值由小到大依次排列。,下一张,主 页,退 出,上一张,1、当观测值个数n为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数:Md=2、当观测值个数n为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数,即:(3-4),下一张,主 页,退 出,上一张,【例3.4】观察得9只西农莎能奶山羊的妊娠天数为 144、145、147、149、150、151、153、156、157,求其中位数。此例 n=9,为奇数,则:Md=150(天)即西农莎能奶山羊妊娠天数的中位数为150天。,下一张,主 页,退 出,上一张,【例3.5】某水果不易保存,观察得1

7、0只水果仔犬发现症状到腐烂变质分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。此例n=10,为偶数,则:(天)即10只水果仔犬发现症状到腐烂变质的中位数为11.5天。(二)已分组资料中位数的计算方法,下一张,主 页,退 出,上一张,若资料已分组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为:(35)式中:L 中位数所在组的下限;i 组距;f 中位数所在组的次数;n 总次数;c 小于中数所在组的累加次数。,下一张,主 页,退 出,上一张,【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表如表32所示,求中位数。表32 68头母牛

8、从分娩到第一次发情间隔时间 次数分布表,下一张,主 页,退 出,上一张,由表32可见:i=15,n=68,因而中位数只能在累加头数为36所对应的“5771”这一组,于是可确定L=57,f=20,c=16,代入公式(35)得:(天)即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。,下一张,主 页,退 出,上一张,三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数,记为G。它主要应用于生产动态分析,畜禽疾病及药物效价的统计分析。如动物生产中增长率,抗体的滴度,药物的效价,疾病的潜伏期等,或当资料中的观察值呈几何级数变化趋势,或计算平均增长率,平均比率等时用几何平均数

9、比用算术平均数更能代表其平均水平。其计算公式如下:(3-6),下一张,主 页,退 出,上一张,为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即(3-7)【例3.7】某波尔山羊群19972000年各年度的存栏数见表33,试求其年平均增长率。,下一张,主 页,退 出,上一张,表33 某波尔山羊群各年度存栏数与增长率,下一张,主 页,退 出,上一张,利用(37)式求年平均增长率 G=lg-11/3(-0.368-0.3980.602)=lg-1(-0.456)=0.3501 即年平均增长率为0.3501或35.01%。,下一张,主 页,退 出,上一张,四、众

10、数 资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M0。如表2-3所列的50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数为22天。又如【例3.6】所列出的次数分布表中,5771这一组次数最多,其组中值为64天,则该资料的众数为64天。,下一张,主 页,退 出,上一张,五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为H,即(38)调和平均数主要用于反映群体不同阶段的平均增长率或不同规模的平均规模。如平均速度、平均增长速度,动物身高的增长,每多少天增长多快,植物生长速度等,下一张,主 页,退 出,上一张,【例3.8】某保种牛群不

11、同世代牛群保种的规模分别为:0世代200头,1世代220头,2世代210头;3世代190头,4世代210头,试求其平均规模。利用(39)式求平均规模:(头)即保种群平均规模为208.33头。,下一张,主 页,退 出,上一张,第二节 标准差(stand deviation),一、标准差的意义 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。,下一张,主 页,退 出,上一张,全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并

12、不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。,下一张,主 页,退 出,上一张,为了 准 确 地 表示样本内各个观测值的变异程度,人们 首 先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(),称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和 为零,即()=0,因 而 不 能 用离均差之和()来 表 示 资料中所有观测值的总偏离程度。,下一张,主 页,退 出,上一张,为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值

13、个数 n 求得平均绝对离差,即|/n。虽然平均绝对离差可以表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。,下一张,主 页,退 出,上一张,我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先将各 个离 均差平方,即()2,再求 离均差平方和,即,简称平方和,记为SS;由 于 离差平方和 常 随 样 本 大 小 而 改 变,为 了 消 除 样 本大小 的 影 响,用平方和 除 以 样 本 大 小,即,求出离均差平方和的平均数;,下一张,主 页,退 出,上一张,为了使所得的统计量是相应总体参数的无偏估计量,统计学证明,

14、在求离均差平方和的平均数时,分母不用样本含量n,而用自由度 n-1,于是,我们 采 用统计量 表示资料的变异程度。统计量 称 为 均 方(mean square缩写为MS),又称样本方差,记为S2,即 S2=(39),下一张,主 页,退 出,上一张,相应的总体参数叫 总体方差,记为2。对于有限总体而言,2的计算公式为:(310),下一张,主 页,退 出,上一张,由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差 S2 的平方根叫做样本标准差,记为S,即:(3-11

15、),下一张,主 页,退 出,上一张,由于 所以(3-11)式可改写为:(3-12),下一张,主 页,退 出,上一张,相应的总体参数叫总体标准差,记为。对于有限总体而言,的计算公式为:(3-13)在统计学中,常用样本标准差S估计总体标准差。,下一张,主 页,退 出,上一张,二、标准差的计算方法(一)直接法 对于未分组或小样本资料,可直接利用(311)或(3-12)式来计算标准差。,下一张,主 页,退 出,上一张,【例3.9】计算10种面包用面粉量:450,450,500,500,500,550,550,550,600,600,650(g)的标准差。此例n=10,经计算得:x=5400,x2=29

16、55000,代入(312)式得:(g)即10种面包用面粉量的标准差 为65.828g。,下一张,主 页,退 出,上一张,(二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为:(314)式中,f为各组次数;x为各组的组中值;f=n为总次数。,下一张,主 页,退 出,上一张,【例3.10】利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。将表3-4中的f、fx、代入(314)式得:(g)即某纯系蛋鸡200枚蛋重的标准差为3.5524g。,下一张,主 页,退 出,上一张,表34 某纯系蛋鸡200枚蛋重资料次数分布 及标准差计算表,下一张

17、,主 页,退 出,上一张,三、标准差的特性(一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。(二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。(三)当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。,下一张,主 页,退 出,上一张,(四)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(S)范围内;约有95.43%的观测值在平均数左右两倍标准差(2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(3S)范围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计

18、标准差。,下一张,主 页,退 出,上一张,第三节 变异系数,当资料所带单位不同或单位虽相同但平均数相差较大时,不能直接用标准差比较各样本资料的变异程度大小。变异系数是衡量资料中各观测值变异程度的另一个统计量。标准差与平均数的比值称为 变异系数,记为CV。(coefficient of variation)变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。,下一张,主 页,退 出,上一张,变异系数的计算公式为:(315),下一张,主 页,退 出,上一张,赞皇大枣果皮厚、角质层厚测量结果,【例3.11】已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而

19、大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较其变异程度的大小。由于,长白成年母猪体重的变异系数:大约克成年母猪体重的变异系数:所以,长白成年母猪体重的变异程度大于大约克成年母猪。,下一张,主 页,退 出,上一张,注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,变异数与变异系数,变异数:具有度量变异程度功用(能)的统计量统称变异数。主包括:全距(极差)方差 标准差 变异系数,可疑值、极端值和异常值,当对同一样品进行多次重复测定时,常发现一组分析数据中某一两个测定值比其他测定值明显地偏大或偏小,我们将其视为可疑值。可疑值可能是测定值随机波动的极端表现,即极端值(包括极大和极小值),它们虽然明显地偏离多数测定值,但仍处于统计上所允许的误差范围之内,与多数测定值属于同一总体。当然有些可疑值可能与多数测定值并非属于同一总体内,这样的可疑值称为异常值。样本异常值是指样本中的个别值,其数值明显偏离它所在样本的其余观测值。,下一张,主 页,退 出,上一张,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号