数据的描述性分析 (2).ppt

上传人:牧羊曲112 文档编号:6296738 上传时间:2023-10-14 格式:PPT 页数:46 大小:816KB
返回 下载 相关 举报
数据的描述性分析 (2).ppt_第1页
第1页 / 共46页
数据的描述性分析 (2).ppt_第2页
第2页 / 共46页
数据的描述性分析 (2).ppt_第3页
第3页 / 共46页
数据的描述性分析 (2).ppt_第4页
第4页 / 共46页
数据的描述性分析 (2).ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《数据的描述性分析 (2).ppt》由会员分享,可在线阅读,更多相关《数据的描述性分析 (2).ppt(46页珍藏版)》请在三一办公上搜索。

1、南京财经大学统计学系,第四章 数据的描述性分析,本章内容,第一节 集中趋势的描述第二节 离散程度的描述第三节 分布的偏态与峰度,集中趋势的描述,一、数值平均数1.算术平均数2.调和平均数3.几何平均数,第一节 集中趋势的描述,二、位置平均数1.中位数2.众数,对比,离散程度的描述,一、绝对指标1.极差与四分位差2.平均差3.标准差与方差二、相对指标离散系数,第二节 离散程度的描述,数据标准化,是非标志标准差,分布的偏态与峰度,一、原点矩二、中心矩,第三节 分布的偏态与峰度,三、分布的偏态四、分布的峰度,集中趋势,集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中

2、心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。,算术平均数,算术平均数是总体中各个体的某个数量标志的总和与个体总数的比值,一般用符号 表示。,简单算术平均数加权算术平均数算术平均数的数学性质,简单算术平均数,加权算术平均数,权数,算术平均数的数学性质,权数,次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量值小的一方。可见,次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。,权数,次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量

3、值小的一方。可见,次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。,调和平均数,调和平均数(Harmonic mean)是各变量值倒数的算术平均数的倒数。由于它是根据变量值倒数计算的,所以又称作倒数平均数,通常用 表示。,简单调和平均数加权调和平均数调和平均数是算术平均数的变形,简单调和平均数,加权调和平均数,调和平均数是算术平均数的变形,几何平均数,几何平均数是n个变量值连乘积的n次方根。几何平均数是计算平均比率和平均速度最适用的一种方法。通常用 表示。,简单几何平均数加权几何平均数,简单几何平均数,加权几何平均数,注意:不能直接平均增长速度,中位数,中位数是一组数据按大

4、小顺序排列后,处于中间位置的那个变量值,通常用 表示。其定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值:一半数值小于中位数,另一半数值大于中位数。中位数是一个位置代表值,因此它不受极端变量值的影响。,由未分组数据确定中位数由单项数列确定中位数由组距数列确定中位数,分位数,由未分组数据确定中位数,对未分组数据资料,需先将各变量值按大小顺序排列,并按公式 确定中位数的位置。,当一个序列中的项数为奇数时,则处于序列中间位置的变量值就是中位数。例:7、6、8、2、3 当一个序列的项数是偶数时,则应取中间两个数的中点值作为中位数,即取中间两个变量值的平均数为中位数。例:2、5、7、8、

5、11、12,由单项数列确定中位数,先计算各组的累计次数,再按公式 确定中位数的位置,并对照累计次数确定中位数。,由组距数列确定中位数,下限公式:,上限公式:,分位数,三个数值可以将变量数列划分为项数相等的四部分,这三个数值就定义为四分位数。十分位数和百分位数分别是将变量数列十等分和一百等分的数值。,众数,众数是一组数据中出现次数最多的那个变量值,通常用 表示。,由未分组数据确定众数由单项数列确定众数由组距数列确定众数,由未分组数据确定众数,例1:7、6、8、2、3例2:7、6、8、2、3、4、3、2、3例3:7、6、8、2、3、4、3、2、3、2,由单项数列确定众数,由组距数列确定众数,下限公

6、式:,上限公式:,对比,1.众数、中位数和算术平均数的关系,2.众数、中位数和算术平均数的特点与应用场合,极差与四分位差,极差也叫全距,是一组数据的最大值与最小值之离差,即:,四分位差是指第三四分位数与第一四分位数之差,也称为内距或四分间距,计算公式为:,平均差,平均差也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用 表示。,简单式平均差加权式平均差,简单式平均差,加权式平均差,标准差与方差,标准差又称均方差,它是各单位变量值与其平均数离差平方的平均数的方根,通常用 表示。它是测度数据离散程度的最主要方法。方差是各变量值与其算术平均数离差平方和的平均数,即是标准差的平方,用 表示总

7、体的方差;用 表示样本的方差。,总体与样本标准差,简单式标准差 加权式标准差,简单式标准差,加权式标准差,总体与样本标准差,简单式,加权式,总体,样本,数据标准化,标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数。设标准化数值为z,则有:,离散系数,对于平均数不等或计量单位不同的不同组别的变量值,是不能直接用离散程度的绝对指标比较其离散程度的。为了消除变量平均数不等和计量单位不同对离散程度测度值的影响,需要计算离散程度的相对指标,即离散系数,其一般公式是:,是非标志标准差,是一个比率,它表示具有某种特征的个体的数量占总体中个体总数的比重,即总体成数。是非标志的平均数为:是非标志的标准差为:,原点矩,一般式,一阶原点矩,中心矩,一般式,二阶中心矩,偏态,偏态是对分布偏斜方向和程度的测度。变量分组后,总体中各个体在不同的分组变量值下分布并不均匀对称,而呈现出偏斜的分布状况,统计上将其称为偏态分布。,偏态系数 的数值一般在0与3之间,越接近0,分布的偏斜度越小;越接近3,分布的偏斜度越大。,例题,例题,峰度,峰度是分布集中趋势高峰的形状。在变量数列的分布特征中,常常以正态分布为标准,观察变量数列分布曲线顶峰的尖平程度,统计上称之为峰度。,正态分布的峰度系数为0,当0时为尖峰分布,当0时为平顶分布。,例题,例题,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号