第四章统计数据的描述课件.ppt

上传人:牧羊曲112 文档编号:3946855 上传时间:2023-03-28 格式:PPT 页数:60 大小:3.89MB
返回 下载 相关 举报
第四章统计数据的描述课件.ppt_第1页
第1页 / 共60页
第四章统计数据的描述课件.ppt_第2页
第2页 / 共60页
第四章统计数据的描述课件.ppt_第3页
第3页 / 共60页
第四章统计数据的描述课件.ppt_第4页
第4页 / 共60页
第四章统计数据的描述课件.ppt_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《第四章统计数据的描述课件.ppt》由会员分享,可在线阅读,更多相关《第四章统计数据的描述课件.ppt(60页珍藏版)》请在三一办公上搜索。

1、第四章 统计数据的描述,第一节 分布集中趋势的描述,一、众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数,众数(不惟一性),无众数原始数据:10 5 9 12 6 8,一个众数原始数据:6 5 9 8 5 5,多于一个众数原始数据:25 28 28 36 42 42,排序后处于中间位置上的值,不受极端值的影响3.各变量值与中位数的离差绝对值之和最小,即,二、中位数(median)(一)中位数的概念,原始数据:,分组数据:,(二)中位数的位置,中位数的求法(9个数据的算例),【例】9个家庭的人均月收入数据原始数据:1500 75

2、0 780 1080 850 960 2000 1250 1630排 序:750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9,中位数 1080,中位数的求法(10个数据的算例),【例】:10个家庭的人均月收入数据排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10,三、四分位数(quartile)(一)四分位数的概念1.将一组数据(排序后)四等分的数据,2.不受极端值的影响,原始数据:,分组数据:,(二)四分位数的位置,四分位数的求

3、法(9个数据的算例),【例】:9个家庭的人均月收入数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排 序:750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9,四分位数的求法(10个数据的算例),【例】:10个家庭的人均月收入数据排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10,统计函数QUARTILE,四、均值(mean)(一)均值的概念集中趋势的最常用测度值一组数据的均衡点所在(重

4、心)易受极端值的影响,(二)均值的算法1、简单均值(simple mean)设一组数据为:x1,x2,xn,总体均值,样本均值,2、加权均值(weighted mean)设一组数据为:x1,x2,xn相应的频数为:f1,f2,fk,总体均值,样本均值,单变量分组,组距式分组,加权均值计算表,加权均值(例题分析),(三)均值的数学性质1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,五、几何平均数(geometric mean)1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为,5.可看作是均值的一种变形,几何平均数的求法(

5、例题分析),【例】一位投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率,几何平均:,六、切尾均值(trimed mean)1.去掉大小两端的若干数值后计算中间数据的均值2.在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用3.计算公式为,n 表示观察值的个数;表示切尾系数,,切尾均值(例题分析),【例】某次比赛共有11名评委,对某位歌手的给分分别是:,经整理得到顺序统计量值为,去掉一个最高分和一个最低分,取1/11,众数、中位数和均值的关系,众数、中位数、均值的特点

6、和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,一、极差二、内距三、方差和标准差四、离散系数,第二节 分布离散程度的测度,一、极差(range)一组数据的最大值与最小值之差离散程度的最简单测度值极差越大,说明离散程度越大易受极端值影响未考虑数据的分布,R=max(xi)-min(xi),计算公式为,二、内距(Inter-Quartile Range,IQR)1.也称四分位差2.上四分位数与下四分位数之差内 距=QU QL反映了中间50%数据的离散程度不受极端值的影响可用

7、于衡量中位数的代表性,三、方差与标准差(Variance and Standard deviation)(一)方差与标准差的概念1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差可用于衡量均值的代表性大小,(二)总体方差和标准差的计算公式,未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,1.总体方差的计算公式,2.总体标准差的计算公式,(三)样本方差和标准差的计算公式,未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,1、样本方差的计算公式,2、

8、样本标准差的计算公式,单变量分组的样本方差和标准差,注:在分组数据里n=fi,注解:样本方差自由度(degree of freedom),一组数据中可以自由取值的数据的个数 当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值(举例)2.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,S=262.85,四、离散系数(coefficient of variation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响

9、4.用于对不同组别数据离散程度的比较5.计算公式为,离散系数(例题分析),【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,离散系数(例题分析),结论:计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,第三节 偏态与峰度的度量,一、偏态及其测度二、峰度及其测度,一、偏态及其测度,(一)偏态的概念1.统计学家Pearson于1895年首次提出 2.数据分布偏斜程度的测度,数据分布的不对称性称为偏态。3.偏态系数=0为对称分布 偏态系数0为右偏分布 偏态系数0为左偏分布,二、偏态系数(skewness coefficient),1.

10、根据原始数据计算,2.根据分组数据计算,二、峰度及其测度,(一)峰度的概念1.统计学家Pearson于1905年首次提出2.数据分布的平峰或尖峰程度的测度(与标准正态分布比较)。3.峰度系数=0为峰度适中(标准正态分布)峰度系数0为尖峰分布,(二)峰度系数(kurtosis coefficient),1.根据原始数据计算,2.根据分组数据计算,偏态系数和峰度系数(例题分析),结论:偏态系数为正值,右偏分布。,结论:峰度系数为负值,说明电脑销售量为平峰分布,第四节 茎叶图与箱线图一、茎叶图二、箱线图,用于显示未分组的原始数值型数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的

11、高位数值作树茎,低位数字作树叶树叶上只保留一位数字茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息,一、茎叶图(stem-and-leaf display),茎叶图(例题分析),茎叶图(扩展的茎叶图),二、箱线图(box plot),用于显示未分组的原始数值型数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成箱线图的绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,

12、再将两个极值点与箱子相连接,箱线图(箱线图的构成),箱线图(例题分析),分布的形状与箱线图,不同分布的箱线图,未分组数据多批数据箱线图(例题分析),【例】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征,未分组数据多批数据箱线图(例题分析),8门课程考试成绩的箱线图,11名学生8门课程考试成绩的箱线图,min-max,25%-75%,median value,45,55,65,75,85,95,105,学生1,学生2,学生3,学生4,学生5,学生6,学生7,学生8,学生9,学生10,学生11,未分组数据多批数据箱线图(例题分析),人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号