二讲集中趋势和离散趋势计量资料的统计描述.ppt

上传人:小飞机 文档编号:5029535 上传时间:2023-05-30 格式:PPT 页数:43 大小:1.13MB
返回 下载 相关 举报
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第1页
第1页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第2页
第2页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第3页
第3页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第4页
第4页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《二讲集中趋势和离散趋势计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《二讲集中趋势和离散趋势计量资料的统计描述.ppt(43页珍藏版)》请在三一办公上搜索。

1、第二讲集中趋势和离散趋势(计量资料的统计描述),王晓莉,2,基本内容,3,计量资料的统计描述,描述什么?描述的对象:计量资料,群体,4,5,群体特征的描述:一般先有一个变量,然后会有一系列的变量值,这些变量值就是一个群体。针对这样一个群体,你想知道什么?(共性与特性,有群体就有变异)同样是计量资料,但其特点又各不相同(分布问题:正态与非正态,计算均数时也不同),主要内容,频数表集中趋势离散趋势正态分布正常值范围估计,7,原始资料(变量与变量值,资料性质),一.频 数 表,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。频数表(频数分布):表示各组及它们对应

2、的组频数的表格称为频数表或频数分布。,1998年100名18岁健康女大学生身高的频数分布,10,11,频数分布的特征:集中趋势与离散趋势,12,二、集中趋势(集中位置的描述),一般用平均值来描述。平均值是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心。,13,1.算术均数2.几何均数3.中位数,几种常用的平均值:,14,1.算术均数(均数),意义:一组性质相同的观察值在数量上的平均水平。表示(总体)X(样本)特征:(X-X)=0 估计误差之和为0。应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义。,例题:100名18岁女大学生身高均数的计算直

3、接法、间接法、计算机结果:163.48cm,16,有8份抗体血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。,17,2.几何均数,意义:N个数值的乘积开N次方即为这N 个数的几何均数。表示:G=-1 X n 计算:应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。,18,3.中位数、百份位数,意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。表示:M、PX计算:应用:偏

4、态资料,开口资料,19,三、离散趋势(离散程度的描述),描述一组数据参差不齐的程度,20,21,常用指标,全距四分位数间距方差标准差变异系数,22,1.全距、四分位数间距R:最大最小值之差。Q:上四分位数(P75)Qu与下四分位数Ql(P25)之差,中间包含了全部观察值的一半。,23,2.标准差,相关概念(公式表示):离均差、离均差平方和 方差(2 S2)标准差的符号:S 标准差的意义:全面反映了一组观察值的变异程度。(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好),24,标准差的计算(公式):例题:100名18岁女大学生身高标准差的计算 结果:3.79 cm 标准差的应用

5、:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围,25,3.变异系数,意义:标准差与均数之比用百分数表示。符号:CV计算:CV=(S/X)100%无单位应用:单位不同的多组数据比较 均数相差悬殊的多组资料,26,四、正态分布,什么是分布?1、图形2、特征3、面积,27,1998年100名18岁健康女大学生身高的频数分布,28,1、正态分布的图形,29,正态分布,30,2、正态分布的特征,均数处最高;均数为中心对称;2个参数 N(,):决定图形的形状和位置 曲线下的面积有一定规律。,31,32,正态分布的特殊形式:,标准正态分布N(0,1);标准正态变换(变换公式);例题

6、:一次统计测验的平均分是72,标准差是15,求60分、93分、72分的标准分数。上例中,身高为160cm女大学生的标准分是多少?,33,34,3、曲线下面积,横轴上曲线下的面积为1曲线下,横轴上对称于u的面积相等,从-到;1个标准差位置的面积,95%面积下的标准差,99%面积下的标准差95%,99%的面积公式:z 与所对应的面积P成反比。,特点:,35,定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。(正态分布的应用),五、(医学)正常值范围,37,单双侧:根据指标的实际用途,有的指标有上下界值,过高过低均属异常;某些指标过高为异

7、常,只需确定上限;某些指标过低为异常,只需确定下限。估计的方法:1、正态分布法2、百分位数法,1.正态分布法应用条件:正态分布或近似正态分布资料 计算(双侧)95%正常值(医学参考值)范围公式:(x1.96S,x1.96S),例如:某校女大学生身高的95%正常值范围(163.841.963.79,163.841.963.79)即(156.41 cm,171.27 cm),39,已知:x=119.95cm,s=4.72cm.试问:(1)估计该地7岁男童身高在110cm以下者 占该地7岁男童的百分比。(2)估计该地7岁男童身高在身高在130cm 以上者占该地7岁男童的百分比。(3)估计该地7岁男童

8、身高在107.77cm到 132.13cm之间的占该地7岁男童的百分 比。,例题:某市1982年100名7岁男童的身高,40,2.百分位数法,P19例题应用条件:偏态分布资料 计算公式:双侧界值:P 2.5 P 97.5 单侧 上界:P 95 单侧 下界:P 5,41,小结习题:1.各观察值加同“1”后:A.均数不变,标准差改变 B.均数改变,标准差不变C.二者均不变 D.均改变2.用均数和标准差可全面描述:A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布3.正态分布曲线下,从均数u 到u+1.96的面积为;A.95%B.45%C.97.5%D.47.5%,42,P22 1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,问95%的人身高在什么范围内。估计在该研究中有%多少的男孩平均身高在138与154之间?又有多少在130到162之间?,43,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号