平均数和标准差.ppt

上传人:小飞机 文档编号:5972741 上传时间:2023-09-09 格式:PPT 页数:23 大小:421KB
返回 下载 相关 举报
平均数和标准差.ppt_第1页
第1页 / 共23页
平均数和标准差.ppt_第2页
第2页 / 共23页
平均数和标准差.ppt_第3页
第3页 / 共23页
平均数和标准差.ppt_第4页
第4页 / 共23页
平均数和标准差.ppt_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《平均数和标准差.ppt》由会员分享,可在线阅读,更多相关《平均数和标准差.ppt(23页珍藏版)》请在三一办公上搜索。

1、2023/9/9,1,第二章平均数和标准差,2023/9/9,2,2.1 总体及其样本,总体(population):具有相同性质的个体组成的集团。无限总体(infinite population):总体中包含的个体数目有无穷多个,这种总体称为无限总体。,2023/9/9,3,有限总体(finite population):总体中包含的个体数目有限,这种总体称为有限总体。观察值(observation):每一个体的某一个性状、特性的测定数值叫做观察值。变数(variable):观察值集合起来,称为变数。,2023/9/9,4,变量(variate):变数中每一成员称为变量。例如:测定8个人的身

2、高,得到以下数据:160、167、175、180、158、169、173、170、,观察值,变数,参数(parameter):由总体的全部观察值而算得的总体特征数,如总体平均数,称为参数,。,2023/9/9,5,样本(sample):从总体中抽出的一部分个体的集合。统计数(statistic):测定样本中的各个体而得到的样本特征数,如平均数。估计值(estimate):统计数是总体相应参数的估计值。随机样本(random sample):从总体中随机抽取的样本。样本容量(sample size):样本中包含的个体数,用n表示。,2023/9/9,6,2.2 平均数,2.2.1 平均数的意义和

3、种类,2.2.2 算术平均数的计算方法,2023/9/9,7,2.2.1 平均数的意义和种类,一、平均数的意义平均数(average)指在一组数据中所有数据之和再除以数据的个数。平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。1、算术平均数(arithmetic mean):一个数量资料中各个观察值的总和除以观察值的个数所得的商,记作,2023/9/9,8,2、中数(median):将资料内所有观察值从大到小排列,居中间位置的观察值称为中数,记作Md例如:1、2、3、4、5中数是3 1

4、、2、3、4、5、6中数是:(3+4)/2=3.5,2023/9/9,9,2.2.2 算术平均数的计算方法,1、直接以观察值进行计算,2、若样本较大,且已分组,可采用加权法计算算术平均数,即以组中值代表该组出现的观察值以计算平均数。,2023/9/9,10,利用140行水稻产量资料计算每行平均产量,若采用直接法进行计算,平均数等于157.47。因此,两者的结果十分接近。,2023/9/9,11,2.2.4 总体平均数,总体平均数用来表示,其计算公式为:,从公式中可以看出,除非是有限总体,否则总体平均数是无法通过计算得到的。,2023/9/9,12,2.3 变异数,2.3.1 极差,2.3.2

5、方差,2023/9/9,13,代表值只是反映了数值资料的一个方面集中程度的特征,资料的另一方面和的特征是变异程度。请看下面的例子:A组资料:3、4、5、6、7 平均数为:5B组资料:1、3、5、7、9 平均数仍为:5这里的平均数5对于A组资料的代表性好?还是对于B组资料的代表性好?,2023/9/9,14,明确了数据的集中程度(平均数)是远远不够的,还需要进一步说明数据的变异程度。只有通过变异程度的描述,才知道代表值的代表性。表示数据变异特征的数值叫变异数。常用的变异数有:极差、方差、标准差、变异系数等。,2023/9/9,15,2.3.1 极差,极差(range),又称全距,记为R,是资料中

6、最大值与最小值之差。例如:A组资料的极差RA734B组资料的极差RB918极差的计算简单,但是它只是两个极端数据决定的,没有地方充分利用资料的全部信息,而且易于受到资料中不正常的极端值的影响。所以用它来代表整个样本的变异度是有缺陷的。,2023/9/9,16,2.3.2 方差,由于算术平均数的可信度比较高,我们设想用观察值与算术平均数之间的差异来度量一组观察值的变异性,但是这又遇到 的困难。为了解决这一矛盾,将离均差平方后再相加就不再为0。从这个式子知道 愈大,则资料的变异程度也就愈大。称为离均差的平方和(简称平方和),记为SS(Sum Of Square)。,2023/9/9,17,样本的平

7、方和为,总体的平方和为,由于各个样本所包含的观察值数目不同,为便于比较,用观察值数目除平方和,得到平均平方和,简称均方(mean square)或方差(variance)。样本均方用s2表示,定义为:,它是总体方差(2)无偏估计值。,2023/9/9,18,2.3.3 标准差,一、标准差的定义标准差是方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。样本标准差的计算公式为:,总体标准差用表示:,2023/9/9,19,二、自由度的意义自由度(degree of freedom)最早是一个物理学上的名词,它表示一个质点在空间运动的自由程度。统计学借此来反映一批变量的约束条件。

8、例如一个有5个观察值的样本,因为受到统计数的约束,在5个离均差中,只有4个数值可以在一定范围内自由变动取值,而第五个离均差必须满足 这一限制条件。,2023/9/9,20,自由度记作df,具体数值用表示一般,样本自由度等于观察值个数(n)减去约束条件的个数(k),即(df)n k。,2023/9/9,21,2023/9/9,22,标准差(sd,standarddeviation)和标准误(se or sem,standard error of mean)完全独立重复试验也就是biological repeat 测试结果用se表示误差大小,而technique repeat用sd表示误差大小.举

9、个例子可能就更清楚,比如简单的测定某种细胞的生长量,每个生长周期平行处理3个,这3个平行处理的误差反映的是某一个特点生长周期及测定时的误差为technique repeat,而不同生长周期的同样处理的测定结果就是biological repeat.,2023/9/9,23,平均值和标准误是衡量平均值的波动范围,而平均值和标准差是衡量原始数据的波动范围,如果你是比较2组间的数据有没有差异,比如生物实验中常用的空白组和给药组的话,因为标准误比标准差要小,那么用平均值和标准误组合一般好看点,也常被文献来用(但注意:此时平均值和标准差也可以标示,但如上所述,表述的目的就不一样了);如果是药物浓度曲线检测的话,或者是一般用Mean和SD多点,因为反应的是某一时间可能的药物实时浓度的范围,而一般不用显示你MEAN波动范围的MEAN和SE,因为没意义,综上来说1.用SD不会错,2.生化实验比较2组差异一般用SE,但也有用SD的,以中国作者居多.3.看你的目的.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号