二章计量资料的统计描述.ppt

上传人:sccc 文档编号:5341339 上传时间:2023-06-27 格式:PPT 页数:44 大小:557.55KB
返回 下载 相关 举报
二章计量资料的统计描述.ppt_第1页
第1页 / 共44页
二章计量资料的统计描述.ppt_第2页
第2页 / 共44页
二章计量资料的统计描述.ppt_第3页
第3页 / 共44页
二章计量资料的统计描述.ppt_第4页
第4页 / 共44页
二章计量资料的统计描述.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《二章计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《二章计量资料的统计描述.ppt(44页珍藏版)》请在三一办公上搜索。

1、第二章 计量资料的统计描述(1),2012级硕士研究生医学统计学,军事预防医学系卫生统计学教研室 张玉海,一、频数表(frequency table)对于一组数据,要了解它的分布范围、数量最集中的区间以及分布的形态,可以通过编制频数表来实现。,第一节 频数分布,例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。,1求极差(range):极差也称全距,即最大值(maximum)和最小值(minimum)之差,记作R。,2确定组距(i):组段数通常取组 10-15组,3写组段:组下限(L):每个组段的起点组上限(U)

2、:每个组段的终点,-第1组段 2.30 第2组段 2.60 第3组段 2.90 第12组段 5.605.90-,4分组段划记并统计频数,逐一划记,101名正常成年女子的血清总胆固醇频数分布,二、频数分布图,三、频数表和频数分布图用途,1描述频数分布的类型(1)对称分布:若各组段的频数以频数最多的组段为中心左右两侧大体对称,就认为该资料是对称分布,(2)偏态分布:右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。,(2)偏态分布:左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。,2描述频数分布的特征,变异的范围:2.305.90(mmol/L)数据分

3、布的集中位置,数据主要集中在3.504.70(mmol/L)之间,尤以组段的人数3.804.10(mmol/L)最多,且左右基本对称。,3便于发现一些特大或特小的可疑值,4便于进一步做统计分析和处理,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。,常用的平均数有:算术均数(mean)几何均数(geometric mean)中位数(median),第二节 集中趋势的描述,一、算术均数(mean)简称均数,可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。,适用条件:算数均数适用于对称分布,特别是正态分布资料。,算术均数的计算方法,(

4、1)直接计算法,例 用直接法计算101名正常成年女子的血清总胆固醇的均数。,(2)加权法(利用频数表),二、几何均数(geometric mean),用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。,适用条件:适用于成等比级数的资料,特别是对数正态分布资料(一种右偏态分布)。,几何均数的计算方法,(1)直接计算法,例 某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为:10,20,40,40,160,求几何均数。,例 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表,求其平均抗体滴度。,(2)加权

5、法(频数表资料),三、中位数与百分位数,例:大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60平均存活天数?,(一)中位数(median)是将n个变量值从小到大排列,位置居于中间的那个变量值。,适用条件:,1.适用于各种分布类型的资料2.特别适合大样本偏态分布资料或者一端或两端无确切数值的资料。,中位数的计算,n为奇数时,n为偶数时,例 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。,本例n=7,为奇数,例 8名患者食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。,本例n=8,为偶数,(二)百分位数(percentile),

6、百分位数是一种位置指标,用 PX 来表示。一个百分位数 PX 将全部变量值分为两部分,在全部变量值中(不包含 PX),有 X%的变量值比它小,有(100-X)%变量值比它大。,当 为整数时:,当 为带有小数位时:,1计算方法,设有n个原始数据从小到大排列,第X百分位数的一种近似计算公式为:,(1)第5百分数:n=120,为整数:,例 对某医院120名细菌性痢疾治愈者的住院天数统计,试求第5百分位数和第99百分位数。,住院天数:,序号:,(2)第99百分位数:,住院天数:,序号:,带有小数,故取整后trunc(118.8)=118,2.离散变量百分位数 例 产后出血的产妇中平均有几次人工流产史?

7、,第三节 离散趋势的描述,描述数据变异大小的常用统计指标:极差四分位数间距方差与标准差变异系数,一、极差(Range)即一组变量值的最大值与最小值之差。,例 三组同龄男孩的身高值(cm),二、四分位数间距(Quartile Range),四分位数(quartile)就是把全部变量值分为四部分的分位数。,QR=,四分位间距:,例 已知=67.7,=39.2,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。,四分位数间距可以看成居中的一半变量值的极差(数据两端各去除了25%的数据)。可表示为 QR=28.5(39.267.7)天。,样本方差,三、方差与标准差,1.方差(variance)也称均方

8、差,反映一组数据的平均离散水平。,总体方差,2.标准差(standard deviation,SD),样本标准差,总体标准差,样本标准差的公式还可以写成:,利用频数表计算样本标准差的公式为:,例 计算例2-1方法中101名正常成年女子的血清总胆固醇的标准差。,1.直接计算法,2.频数表法,四、变异系数(coefficient of variation,CV),主要用途:1.观察值度量单位不同时变异大小的比较,如身高与体重变异程度的比较;2.均数相差较大时,如儿童身高与成人身高变异程度的比较;,例某地7岁男孩身高的均数为123.10cm,标准差为4.71cm;体重均数为22.59kg,标准差为2.26kg,比较其变异度?,身高,体重,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号