第3章:数据的初步统计分析.ppt

上传人:laozhun 文档编号:2901830 上传时间:2023-03-01 格式:PPT 页数:26 大小:697KB
返回 下载 相关 举报
第3章:数据的初步统计分析.ppt_第1页
第1页 / 共26页
第3章:数据的初步统计分析.ppt_第2页
第2页 / 共26页
第3章:数据的初步统计分析.ppt_第3页
第3页 / 共26页
第3章:数据的初步统计分析.ppt_第4页
第4页 / 共26页
第3章:数据的初步统计分析.ppt_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《第3章:数据的初步统计分析.ppt》由会员分享,可在线阅读,更多相关《第3章:数据的初步统计分析.ppt(26页珍藏版)》请在三一办公上搜索。

1、1,第三章 统计数据的初步分析第一节:统计特征数一、集中趋势的测度集中趋势描述统计数据分布的集中度和分布中心,通常用以下统计特征数来测度:均值(mean):是描述统计数据分布集中度最常用的统计特征数。几何平均数(geometric mean):适合于诸如指数、百分比和增长速度的平均。中位数(median):把统计数据按从小到大的顺序排列后,其位置处于中间的观测值。众数(mode):在一系列统计数据当中频率出现最高的数值。,2,L表示中位数(众数)所在组的下限;n表示总频数;fc表示中位数所在组前所有各组的累积频数;fm表示中位数所在组的频数;h表示中位数所在所的组距;1表示众数所在组频数减紧邻

2、众数组的前一组频数的差值;2表示众数所在组频数减紧邻众数组的后一组频数的差值。,3,调和平均数(reciprocal mean):也称倒数平均数,它是对变量的倒数求平均,然后再取倒数而得到的平均数。有两种计算形式:简单调和平均数和加权调和平均数。简单调和平均数:加权调和平均:,4,例1:2005年中国南方某城镇2800户家庭的平均每一劳动力年收入的频数分布情况如下表所示,请计算其均值、中位和众数。解:均值:中位数众数,5,例2:1950年我国总人口为5.5亿,1985年达到了10.5亿,共计增长了1.9倍。(1)测算1950-1985年,我国平均每5年的人口增长速度;(2)测算1950-197

3、5年,我国平均每5年的人口增长速度;(3)如果1975-1985年期间不实行计划生育政策,请测算1985年我国的人口总数解:MG=(1.1141.077 1.096 1.144 1.144 1.0681.089)1/7=1.096 9.6%MG=(1.1141.077 1.096 1.144 1.144)1/5=1.1096 10.9%P=92420(1.109)2=113590(万人),计划生育是国策,6,例3:东方信托投资公司某笔投资的年收益率是按复利计算的,该笔投资的年收益情况如下表所示,请测算该笔投资25年的平均年收益率。解:用几何平均数求该笔投资的年收益率 XG=(103%)1(10

4、4%)4(108%)8(110%)10(115%)2(1/25)=(7.6504)(1/25)=108.48%则:该笔投资的年平均收益率为8.48%,诚信是发展之本,7,例4:德国奔驰汽车公司某年1-12月份生产的平均成本和总成本如下,请测算 奔驰S600轿车(1)该公司汽车的月平均生产量;(2)该公司某年汽车的平均生产成本。解:(1)34,45,57,35,56,47,87,34,54,60,56,45(2)41.9885(万元),8,二、离中趋势的测度全距(range):又称极差,是统计数据中最大值与最小值之差。R=X(Maximum)-X(Minimum)四分位差(quartile de

5、viation):用来反映观测值在中位数周围的集中情况。四分位差越大,统计数据的离散程度也越大。平均差:指全部数据与平均数之差的绝对值的算术平均值。标准差(standard deviation):它是测度统计数据离散程度最常用的统计特征数。变差系数:通常用来测度计量单位不同的统计数据的离散程度。,9,三、偏斜度和峰度的测度偏斜度(Skewness):是表征随机变量频数分布不对称程度的统计特征数。当偏斜度等于0时,呈现对称分布当偏斜度大于0时,呈现正偏态分布当偏斜度小于0时,呈现负偏态分布峰度(Kurtosis):描述统计分布所呈现的尖顶或平坦程度的统计特征数。当峰度等于0时,呈现正态分布当峰度

6、大于0时,呈现顶尖峰分布当峰度小于0时,呈现平坦分布当峰度接近于-2.2时,分布曲线趋向一条水平线,10,四、中位数、众数和算术平均数关系K.Pearson研究发现中位数、众数、算术平均数与频数分布之间存在如下特定关系:当算术平均数大于中位数且大于众数时,频数分布呈现右偏态;当算术平均数小于中位数且小于众数时,频数分布呈现左偏态;当频数分布的偏斜度不很明显时,中位数、众数和算术平均数存在如下关系:中位数总是位于众数与算术平均数中间,中位数(Xe)与众数(Xo)之距离约为算术平均数(X)与中位数(Xe)之距离的2倍,即为:Xe-Xo=2(X-Xe)Xe=(Xo+2X)/3 X=(3Xe-Xo)/

7、2 Xo=3Xe-2X,Xo,Xe,X,X,Xe,Xo,11,频数分布的偏斜程度可以用下公式来测定:Sk=(X-Xo)/Sk=3(X-Xe)/X为算术平均数;Xo 为众数;Xe为中位数;为标准差当Sk等于零时,频数分布为对称分布;当Sk大于零时,频数分布为正偏态分布;当Sk小于零时,频数分布为负偏态分布。例5:通过对大众汽车公司员工月收入的抽样调查,发现该公司员工月收入的众数为3340元,中位数为3800元。如果该公司员工月收入的频数分布的偏斜度不是很明显,且得到员工收入标准差为800,请测算大众汽车公司员工月收入的算术平均数,并判断其频数分布的形态特征,进而计算其偏斜度Sk。解:X=(3Xe

8、-Xo)/2=(3*3800-3340)/2=4030(元)因为算术平均数大于中位数且大于众数 所以可判断该频数分布呈现正偏态 Sk=(X-Xo)/=(4030-3340)/800=0.8625(正偏态),我最忧虑是增加农民收入,12,第二节:统计数据的整理例:2006年上海某大学管理学院博士研究生报考人数为200人,英语成绩统计如下表所示,请计算相关的统计特征量,并把这些统计数据整理成统计图表。,13,14,表2:200个学生英语成绩的统计特征量分析N Valid 200Mean 75.6300 Std.Error of Mean.6875 Median 76.5000a Mode 68.0

9、0b Std.Deviation 9.7224 Variance 94.5257 Skewness-1.033 Std.Error of Skewness.172 Kurtosis 2.499 Std.Error of Kurtosis.342 Range 60.00 Minimum 35.00 Maximum 95.00 Sum 15126.00 Percentiles 10 64.0000c 20 68.1250 30 71.1429 40 74.1111 50 76.5000 60 79.2000 70 81.6250 80 84.0000 90 86.5000,a Calculated

10、 from grouped data.b Multiple modes exist.The smallest value is shownc Percentiles are calculated from grouped data.,15,16,17,18,19,20,21,22,23,图9:200名学生英语成绩带线型的频数分布直方图(histograms),24,第三节:几种典型的统计分布曲线二项分布(Binomial Distribution)如果随机变量X表示n重Bernoulli试验中“成功”事件发生的次数,且有如下分布:则称随机变量服从于二项分布,记为:XB(n,p)E(X)=np;

11、D(X)=np(1-p)两点分布如果随机变量X有如下分布:P(X=1)=p,P(X=0)=1-p则称随机变量X服从两点分布,记为:XB(1,p)E(X)=p;D(X)=p(1-p)泊松分布(Poisson Distribution)当n比较大时(如大于30),p值比较小时(如小于0.1),二项分布接近于泊松分布。如果随机变量X的概率为:则:X服从泊松分布。E(X)=,D(X)=,(k=0,1,2,),25,例:假设MWP公司生产的手机产品不合格率为0.005,试求400台手机中恰有0、1、2、3台手机不合格的概率各是多少?解:n很大,p又很小,故手机不合格的台数X服从泊松分布,=nP=400*0.005=2P(X=0)=0.13534;P(X=1)=0.27067;P(X=2)=0.27067;P(X=3)=0.18045;均匀分布(Uniform Distribution)1/(b-a)a x b如果随机变量X的概率密度函数为:f(x)=0 其他则随机变量X服从a,b区间上的均匀分布。E(X)=(a+b)/2,D(X)=(b-a)2/12正态分布(Normal Distribution)如果随机变量X的概率密度凼数为:则称随机变量X服从正态分布,记为:XN(,2)E(X)=;D(X)=2,26,当=0,=1时,称概率密度涵数为则随机变量X服从标准正态分布,记为:XN(0,1),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号