试验资料的整理.ppt

上传人:小飞机 文档编号:6025110 上传时间:2023-09-16 格式:PPT 页数:41 大小:648.50KB
返回 下载 相关 举报
试验资料的整理.ppt_第1页
第1页 / 共41页
试验资料的整理.ppt_第2页
第2页 / 共41页
试验资料的整理.ppt_第3页
第3页 / 共41页
试验资料的整理.ppt_第4页
第4页 / 共41页
试验资料的整理.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《试验资料的整理.ppt》由会员分享,可在线阅读,更多相关《试验资料的整理.ppt(41页珍藏版)》请在三一办公上搜索。

1、第三章 试验资料的整理,从次数分布表或次数分布图中,可以看出一个资料变数的分布特点,即集中性和离散性。集中性是指资料中的各观察值总是以某数值为中心分布;离散性是指资料中各观察值的离散、变异程度。但是从次数分布表和次数分布图中只能看出一个大致趋势,且不能以此做统计处理。,3.4 资料的描述,因此,为了使资料得到完整的描述,还需要从中概括出一些能够反映资料特征的数量指标,这些数量指标称为试验资料的特征数。,表示集中性的特征数有算术平均数、几何平均数、众数、中数。,表示离散性的特征数有极差、方差、标准差和变异系数。,一、平均数(mean),平均数是统计学中最常用的统计数,表示资料中观测值的中心位置,

2、作为资料的代表与另一资料相比较。主要有算术平均数、中位数、众数、几何平均数等。,加权法,一、算术平均数(arithmetic mean,),直接法,2、算术平均数的基本性质,性质1 样本各个观察值与平均数之差的和为零,即离均差之和为零;,*,证明:,性质2 样本各观察值与平均数之差的平方和为最小,即离均差的平方和最小。,证明:,将资料中所有观测值从小到大依次排列,位于中间位置的观测值,称为中位数,简称中数,记作Md。,(二)中位数,对于未分组资料,先将观测值由小到大依次排列。,(1)当观测值个数为奇数时,(n+1)/2位置的观测值为中位数,即:,(2)当观测值个数为偶数时,n/2和n/2+1位

3、置的两个观测值之和的1/2为中位数,即:,资料中出现次数最多的那个数或次数最多一组的组中值称为众数,记为Mo。表3.5所列的100株大豆单株节数的次数分布表中,17出现的次数最多,则该资料的众数为17。表3.3所列的100株小麦株高的的次数分布表中,这一组的次数最多,其组中值为90cm,则该资料的众数为90cm。,(三)众数,(四)几何平均数,n个观测值相乘之积开n次方所得数值,称为几何平均数,记作G。,或,几何平均数常用于表示某现象的平均发展速度,如计算若干天内,某种植物株高、根长、生长重或某种昆虫繁殖,每天各为上天的平均倍数等,用几何平均数能比算术平均数更准确地反映实际情况。,调查某麦田百

4、株上蚜虫发生情况如表3.8。,例3.6,试求百株蚜虫平均每天繁殖量各为上天的多少倍?,3.09,2.38,1.54,1.27,每天繁殖量为上天的倍数,即百株麦蚜在4天中,平均每天繁殖量各为上天的1.95倍。我们可以验证:6月27日百株麦蚜为110头,4天后为1101.954=1590(头),与7月1日实际虫数相符。如若用算术平均数计算就不会符合了。这说明此类问题用几何平均数计算更为确。,平均数作为数量资料的代表值,其代表性的强弱,取决于资料内各观察值变异程度的大小。例如有A、B两组数据:,3.5 变异数,B组 10、110、50、90、40,A组 60、58、60、61、61,虽然两组的平均数

5、都是60,但两组数据的变异程度有很大不同。所以只用平均数表示资料特征是不够的,为了更全面地描述一个数量资料,还必须有一个度量其变异程度的特征数。,60,60,度量一个数量资料的变异程度的特征数叫变异数。,最常用的变异数有:,极差;,方差;,标准差;,变异系数,1.极差,极差(R)是表示资料中各观测值变异程度大小最简便的统计数。但计算极差时,只用资料中的最大值和最小值,因而极差不能准确表达资料中全部观测值的变异程度。当资料很多而又要迅速对资料的变异程度作出判断时,可利用极差。,设一样本有n个观测值:。为了准确描述样本内各观测值的变异程度,人们首先想到以平均数为标准,求各个观测值与平均数的差,即离

6、均差。,2、方差,但由于离均差之和为零,不可能把离均差之和作为描述样本内所有观测值总变异程度的统计数。,离均差大,变异就大,反之变异就小。,将每个离均差平方,进而求得离均差的平方和,简称平方和,记作 SS,用来反映资料所有观测值的总变异程度。,由于平方和常随样本容量n而改变,为了消除样本容量的影响,用平方和除以样本容量n,即,求出离均差平方和的平均数;为了使所得的统计数是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本容量n,而用自由度n-1。,用统计数 表示资料所有观测值的总变异程度。,统计数 称为均方(缩写为 MS),又称样本方差,记为s2,即,2.方差,相应

7、的总体参数叫总体方差,记为2。对于含有N个个体的有限总体而言,2的计算公式为:,样本方差s2是总体方差2的无偏估计值。,无偏估计值:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数的相应参数的无偏估计值。,例:有一个有限总体,3,4,5,从中抽样,n=2,所有可能样本为几个?,共9个样本,某一统计数?,平均数,样本方差的平均数:,可求得4,为20.6667,0.8165。现以n2作独立的放回抽样,总共得N2=9个样本:,有一个N=3的近似正态总体,具有变量3,4,5,根据表的资料可得:,样本平均数 的平均数:,样本方差的平均数:,样本标准差的平均数:,无偏估计:在

8、统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为相应参数的无偏估计。,虽然方差全面的反映了其变异度,但是由于采用了平方的形式,度量单位也随之平方,另外平方使数值量也增大了,与实际变异度有相当差距。为此,把方差开平方还原,就得到一个新的变异数-标准差。,3.标准差,简写为:,或:,统计学上把样本方差 S2 的平方根叫做样本标准差,记为S,即:,自由度,前式中,根号里面分母n-1 称为离均差平方和的自由度,简称为自由度,记为d=n-1。其统计意义是指在计算离均差平方和时,能够自由变动的离均差的个数。在计算离均差平方和时,n 个离均差受到 这一条件的约束,能自由变动的离

9、均差的个数是n-1。,一般,在计算离均差平方和时,若约束条件为k个,则其自由度 d=n-k。,当n-1个离均差确定了,第 n个离均差也就随之而定了,不能再任意变动。,如n=5,前四个离均差2,1,0,-1,那么由于离均差受,第五个离均差肯定是-2。,1、直接法 对小样本(n30)和未经分组的资料,直接利用下式计算标准差。,标准差的计算,有5株大麦单株粒重资料如下:3、7、6、4、5,N5,试计算标准差(单位g),例 3.7,对于大样本(n30)且已分组的资料,可在次数分布表的基础上采用加权法计算标准差,计算公式为:,2、加权法,其中,f为第i组的次数;x为第i组的组中值;n为样本观测值的总个数

10、。,例3.6,由表3.3 计算100株小麦株高的标准差。,即100株小麦的株高标准差为544(cm)。,标准差带有与样本资料相同的度量单位,不能用来比较度量单位不同、或者度量单位相同但平均数不同的两个或多个样本资料的变异程度的大小。需引入另一个度量资料变异程度的统计数,使其既能反映样本资料的变异性,又能解决度量单位及平均数不同的问题。,4.变异系数,变异系数正是这样的统计数。,变异系数是一个不带单位的纯数,可用以比较两个或多个样本资料变异程度的大小。,变异系数是样本标准差与样本平均数的比值,以百分数形式表示,计算公式为:,例3.8,A品种小麦株高的整齐度好于B品种。,问两个小麦品种株高整齐度哪个比较好?,A小麦品种 CV=9.02/95100=9.5,B小麦品种 CV8.0575100=11.3,1.离散性和集中性?众数和中数?2 表示离散性和集中性的特征数有哪些?3 平均数的意义是什么?算术平均数有哪两个重要特征?(证明过程也要掌握)4 变异数的意义是什么?,习 题,5.教材习题:3.33.6,6.思考题:,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号