田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt

上传人:牧羊曲112 文档编号:2096597 上传时间:2023-01-09 格式:PPT 页数:29 大小:3.63MB
返回 下载 相关 举报
田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt_第1页
第1页 / 共29页
田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt_第2页
第2页 / 共29页
田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt_第3页
第3页 / 共29页
田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt_第4页
第4页 / 共29页
田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt》由会员分享,可在线阅读,更多相关《田间试验统计第三章次数分布和平均数、变异数分解ppt课件.ppt(29页珍藏版)》请在三一办公上搜索。

1、第三章 次数分布和平均数、变异数,第一节 总体及其样本,第二节 次数分布,第三节 平均数,第四节 变异数,第一节 总体与样本,1.数据的变异和趋中性,数据(data)在科学试验或调查过程中,对研究对象的某些特征、特性进行观察记载得到的数字资料的总称。,数据是千差万别,各不相同,这就是数据的变异性,也是数据的最基本特征。,数据除了变异的特征外,还具有趋中性,即一组数据中数字位于平均数附近的分布较多,离平均数越远,分布越少。,2.变数和变量,变数(variable)生物个体具有变异性的特征、特性。如作物的株高、抽穗期、穗粒数、产量,植株的害虫头数、发病率等。,变数的某一具体数值称为变量(varia

2、te)或观测值(observed value),用英文大写字母表示,并附下角码。如有一个变数,用y表示,yi 表示某一具体观测值;如有多个变数,可分别用X、Y、Z等表示。,变数,连续性变数是指观测值在一定范围内可以取任何一个数值,这些观测值一般是通过测量或称量的方法获得的。如作物的株高、穗长、粒重、产量等。,离散性变数是指观测值只能取0或正整数的变数,其观测值一般通过观察和计数的方法获得的。如昆虫的头数、病菌的个数、作物的穗粒数和穗数等。,连续性变数(continuous variable),离散性变数(discontinuous or discrete variable),3.总体和样本,总

3、体(population or universe)根据研究目的而确定的,具有共同性质的个体所组成的集团,或者说是整个研究对象中每个个体某一变数所有观测值的总称。,按总体中的个体数目可分为:,总体中每一个个体称为总体单位。总体中的个体数目 称为总体单位数或总体容量,常用大写 N 表示。,根据总体全体观测值算出的总体特征数称为参数(parameter)。参数常用希腊字母表示。如总体平均数,方差2,标准差 等。,总体往往比较大,了解总体是很困难的,通常是从总体中抽出一部分有代表性的个体或观测值来调查,这一部分个体或观测值称为样本(sample)。,3.总体和样本,样本中的个体数称为样本单位数或样本容

4、量。样本容量用小写字母 n 表示。n30为大样本,n30为小样本。根据样本所有观测值计算出的样本特征数称为统计数或统计量(statastic)。样本统计数常用英文字母表示。例如样本平均数,方差S2,标准差S等。,第二节 次数分布,试验资料的性质,农业试验中所得的数据,因所研究的性状、特 性不同而有不同的性质,一般可以分为两大类:,一、数量性状资料,1、离散型或间断型随机变数:,(由计数或测量方式得到),是指用计数方法获得的数据,如基本苗数、分蘖数等,其各观测值必须以整数表示。,指由称量、度量或测量等方法取得到的数据,其各个数据并不限于整数。如粒重、株高等。,2、连续型随机变数:,二、质量性状资

5、料,(指能观察而不能量测的性状),1、按性状的属性把样本个体分为若干类,数出 各类个体的数目;这类资料有时换算为百分 率或数。如调查300株碗豆的花色,其中紫 花植株数为220株,白花植株为80株。,2、给予每类性状以相当数量的方法:如小麦种 子芒的有无,可令有芒种子为1,无芒种子 为0;等等。这种资料可按间断型变数处理。,一、数量性状资料,(由计数或测量方式得到),这类资料通常可用两种方法取得数据:,次数分布,从一个总体随机抽取n个个体进行调查,得到n个观测值,不同数值(或区间)的个体数目不尽相同,这些次数将会按一定规律分配给不同的数值(或区间),这种分布情况叫次数分布。把次数分布以表的形式

6、列出来,得次数分布表。以图的形式绘出来,得次数分布图。,间断性变数资料的整理,1、若变数可取值个数不多时以自然单位进行分组,例如,因为取值个数只有15、16、17、18、19和20等六种,所以以自然单位分组。,第二节 次数分布,第二节 次数分布,连续性变数资料的整理 它的整理方法有以下4个步骤:,1.求极差;,2.确定组数和组距;,3.选定组中值和组限;,4.数据归组。,第二节 次数分布,以课本p.38的表3.4为例说明。,R=Max(x)-Min(x)=254-75=179,组数:拟分为12组组距=1791214.915,连续性变数资料的整理 它的整理方法有以下5个步骤:,1.求极差;,2.

7、确定组数和组距;,3.选定组中值和组限;,4.数据归组。,第二节 次数分布,以课本p.38的表3.4为例说明。,R=Max(x)-Min(x)=254-75=179,组数:拟分为12组组距=1791214.915,(用打“正”字的方法,计算出应归入各组的观察值个数。),2,7,1,次数,140,2、若变数可取值个数太多,则可按取值大小,从小 到大相邻若干个值合为一组的方法进行整理(一般 要求组距相等)。(课本p.37表3.3),第二节 次数分布,1.方柱形图,2.多边形图;,3.条形图;,4.饼图;,次数分布图,适用于表示连续性变数的次数分布;,以课本p.39的表3.6的分布为例说明。,1.方

8、柱形图,2.多边形图,3.条形图;,4.饼图;,次数分布图,适用于表示连续性变数的次数分布;,适用于表示连续性变数的次数分布;,以课本p.39的表3.6的分布为例说明。,1.方柱形图,2.多边形图,3.条形图,4.饼图,次数分布图,适用于表示连续性变数的次数分布;,适用于表示连续性变数的次数分布;,适用于表示间断性和属性变数的资料;,以课本p.37的表3.3的分布为例说明。,1.方柱形图,2.多边形图,3.条形图,4.饼图,次数分布图,适用于表示连续性变数的次数分布;,适用于表示连续性变数的次数分布;,适用于表示间断性和属性变数的资料;,以课本p.37的表3.3的分布为例说明。,适用于表示间断

9、性和属性变数的资料;,以课本p.39的表3.7的分布为例说明。,第三节 平均数,平均数的意义和种类,算术平均数:,平均数(average or mean)是数据的代表值,表示资料中观测值的中心位置。,中(位)数(median):,众数(mode):,几何平均数(geometric mean):,所有观测值的总和除以观测值 数目所得的商。,将资料所有观测值排序后,居于中间位置的那个观测值的值(或,当观测值数目为偶数时,那两个观测值的和之半)。,资料中最常见的一数,或次数分布表中次数最多的那组的组中值。,n个观测值的乘积的n次方根。,其中以算术平均数最为常用。,将资料所有观测值排序后,居于中间位置

10、的那个观测值的值(或,当观测值数目为偶数时,那两个观测值的和之半)。,资料中最常见的一数,或次数分布表中次数最多的那组的组中值。,将资料所有观测值排序后,居于中间位置的那个观测值的值(或,当观测值数目为偶数时,那两个观测值的和之半)。,算术平均数所有观测值的总和除以观察 值数目所得的商。,算术平均数的作用:,1.衡量一组数据的中心位置或一般水平。,2.作为一组数据的代表值与其他数据作比较。,某观测值的离均差,资料中所有观测值的离均差之和为0。,离均差的两个重要特性:,资料中所有观测值的离均差平方之和最小。,对于任意实数 有关系:,该观测值与整个资料的平均数之间的差。,证明:记 则有,算术平均数

11、的局限性:,平均数是最具有代表数据资料整体水平的数值,但不同数据资料,其平均数的代表性是不一样的,因此单用平均数还不足以很好地表达一组数据的主要特征。例如下面的两组人,平均年龄都是25岁,能说两组都是青年人吗?,24岁,26岁,25岁,25岁,49岁,1岁,第四节 变异数,极差(range)一组数据的最大值与最小值之差。即:R=Max(y)-Min(y),上例中:第一组数据的极差为:R1=26-24=2 第二组数据的极差为:R2=49-1=48 可见第二组人的年龄变异大的多,存在问题:极差只考虑了数据中的两个极端值,而且极端值往往是数据中最不可靠的观测值 因此,利用极差来表示数据资料的变异具有

12、明显的局限性,为了解决资料中所有观测值的离均差正负抵消的问题,采用先平方后再相加的办法。,数据资料的变异取决于观测值的离散程度,这自然会联想到所有观测值离均差的大小,如果把这些差值加在一起,数值大就说明这组数据离散程度大,听起来似乎比较合理,但是我们由平均数的第一个性质知道:,用什么特征数来表示数据资料的变异大小比较合理呢?,第四节 变异数,上例中:第一组数据的平方和为:SS1=(24-25)2+(25-25)2+(26-25)2=2 第二组数据的平方和为:SS2=(1-25)2+(25-25)2+(49-25)2=1152,当两组资料中观测值的数目不等时,用平方和来表示数据资料的变异性是否有

13、局限性呢?,例如现在有2个组,一班为1组(25人),二班为1组(22人),以身高作为考查指标,用SS来比较哪个组身高的离散程度大,若哪个组身高的离散程度大就发给哪个组每人一张电影票。试问,是一班同学有意见还是二班同学有意见?,因此必需消除样本容量对离均差平方和的影响,这就需要引入另外一个特征数-方差,计算公式:,样本方差(sample variance):,另外:n-1称为样本方差的自由度(degree of freedom,df or DF or),二)方差,总体方差(population variance):,第四节 变异数,因为大多数情况下 根据平均数的第二个重要特性:所以用 来估计 老

14、是偏小。而样本方差是用于无偏估计总体方差的,所以在计算样本方差时用样本的SS除以n-1,来进行矫正。这在统计学上也得到了证明。那么为什么是除以n-1,而不是除以n-2或n-3等其它数?,df=n-k 例如有这样一组数据:2,4,6,8,其平均数等于5,那么这4个数中只3个数值可以自由变动,若2变成4,4变成9,6变成1,那么最后一个数只能是6,否则平均数就不等于5了,这里的限制条件只有一个,就是平均数。因此df=n-1=4-1=3,1、总体标准差(Population SD):,2、样本标准差(Sample SD):,方差的限制性:在计算SS时由于对离均差进行了平方,所以它的单位是 原来数据单

15、位的平方,在实践上难以解释,有没有其它 方法来弥补方差在度量数据资料变异大小时存的不足呢?,三)标准差,第四节 变异数,4、方差和标准差的功能,(1)方差和标准差的值均大于零,(2)资料中各观测值都加上或减去一个常数a,方差和标准差不变,(3)资料中各观测值都乘以或除以一个常数a,方差增加或减少a2倍,标 准差增加或减少a倍,3、方差和标准差的特性,方差和标准差是表示数据资料最常用的变异数,在统计分析中通常用 方差来估计和比较变异大小,用标准差作为度量变异的标准单位,但是用标准差来表示数据资料的变异性仍有其局限性,在日常生活中 我们很容易体验到,如果你到一个商店去购物,你花950元购买一件标价

16、为1000元的商品和花50元购买一件标价为100元的物品,你的感受有何不同?950,1000(s=35.36)与 50,100(s=35.36),调查一组人的身高,得又调查他们的体重,得 能认为体高的变异10cm比体重的变异4kg大吗?事实上这批人体重的变异比体高的变异大一些,因此当不同数据资料的平均数不相等或单位不一致,又 需要比较它们的变异大小时,就必需引入另外一个特征 数-变异系数,第四节 变异数,上例中:第1组数据,得 第2组数据,得,虽然两组数据的 s 都等于35.355,但不能认为两组数据的变异程度相同。第2组变异大。,四)变异系数(Coefficient of Variation,记为C.V.),第四节 变异数,定义:是指数据资料的标准差与其平均数之比,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号