三常用卫生统计学方法课件.ppt

上传人:小飞机 文档编号:1805171 上传时间:2022-12-19 格式:PPT 页数:87 大小:1.60MB
返回 下载 相关 举报
三常用卫生统计学方法课件.ppt_第1页
第1页 / 共87页
三常用卫生统计学方法课件.ppt_第2页
第2页 / 共87页
三常用卫生统计学方法课件.ppt_第3页
第3页 / 共87页
三常用卫生统计学方法课件.ppt_第4页
第4页 / 共87页
三常用卫生统计学方法课件.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《三常用卫生统计学方法课件.ppt》由会员分享,可在线阅读,更多相关《三常用卫生统计学方法课件.ppt(87页珍藏版)》请在三一办公上搜索。

1、01,卫生统计学概述,2022/12/19,CONTENTS,2022/12/19,变量值,观察值,定性,定量,一、卫生统计学的基本概念,变量:对每个观察单位的某项特征进行测定和观察,这种观察单位的特征称为变量。,2022/12/19,01,计量资料,用度量衡的方法测量每个观察单位的某项研究指标量的大小,所得的数据称为数值变量。,02,计数资料,将全体观察单位按某种性质或类别进行分组,然后清点各组中的例数,这样得到的数据称为计数资料,亦称为分类变量。,03,等级资料,将全体观察单位按某种性质的不同程度分为若干组,分别清点各组中的例数,这种数据资料称为等级资料。,统计资料,一、卫生统计学的基本概

2、念,描述计量资料常用统计方法:平均数、标准差等; 统计分析方法:u检验、t检验、方差分析等。,计数资料常用统计指标:率、构成比等;统计分析方法:u检验、2检验等。,计数资料常用统计指标:率、构成比等;统计分析方法:秩和检验、2检验等。,2022/12/19,是从总体中随机抽取有代表性的一部分观察单位,用样本信息去推断总体特征。,样本,根据研究目的确定的同质的观察单位的某个变量值的全体。,总体,一、卫生统计学的基本概念,2022/12/19,特点:不可避免,但可控制在一定范围。,即使消除了系统误差,控制了随机测量误差,样本统计量和总体参数之间仍存在差别,这种由随机抽样引起的样本指标与总体指标的差

3、异,由于某种必然因素所致,具有一定的方向性。,偶然机遇所致,无方向性,对同一样品多次测定,结果有高有低。,抽样误差,系统误差,误差,2022/12/19,一、卫生统计学的基本概念,特点:不是偶然造成,观察结果一贯性的偏高或偏低。,避免方法:1)通过周密的研究设计2)调查或测量过程中的质量控制,随机测量误差,特点:由于个体变异造成,抽样机遇所致。客观存在,不可避免。但可估计大小,也可增加样本含量使其减小。,是指一次试验结果计算得到的样本率。,频率(样本),描述随机事件发生的可能性大小的数值。事件A的概率记为P(A),随机事件的概率P取值在01之间。,概率(总体),一、卫生统计学的基本概念,02,

4、计量资料的统计描述,2022/12/19,(一)集中趋势(Central tendency) 的描述,平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。,2022/12/19,应 用对称分布资料,尤其是正态分布资料,2022/12/19,常用平均数 2. 几何均数 (geometric mean)表示符号(G),应 用 对数正态分布资料,变量值呈倍数关系,2022/12/19,常用平均数 3. 中位数 (median)表示符号(M),2022/12/19,(二)离散趋势 (tendency of dispersion),描述变量值的离散趋势用变

5、异指标,全距 常用变异指标 四分位数间距方差和标准差 变异系数,2022/12/19,常用变异指标 1. 全距 (range, 简记为R), R = 最大值 最小值反映变量值的变异范围各种类型资料都可应用,但只作 参考资料,2022/12/19,2022/12/19,2022/12/19,标准差用途: 1. 表示同质变量值的离散程度; 2. 在多组资料均数相近、度量单位相同的条件下表示观察值的变异度大小; 3. 与均数结合描述正态分布的特征和估计医学参考值范围; 4. 与样本含量(n)结合,计算标准误,2022/12/19,用途:1) 比较多组单位不同资料的变异度2)比较多组均数相差较大资料的

6、变度,常用变异指标3. 变异系数 (coefficient of variation, 简记为CV) 定义 CV = s / X100%,2022/12/19,(三) 正态分布和参考值范围的估计 正态分布的概念和特征 正态分布是以均数为中心呈对称的钟型分布,频数(人数),125 129 133 137 141 145 149 153 157 161身高 (cm),f,120名12岁健康男孩身高的频数分布,Normal distribution curve,2022/12/19,正态分布的特征有:1) 正态分布曲线在均数处最高2) 正态分布以均数为中心,左右对称且逐渐减少3) 正态分布曲线的两个

7、参数和, 记作N (, 2)4) 正态曲线在1处各有一个拐点,2022/12/19,正态曲线下的面积分布规律 1 占正态曲线下面积的 68.27% 1.96 占正态曲线下面积的 95.00% 2.58 占正态曲线下面积的 99.00% 若n100,则可用 X 代替,用 s 代替。,-,-2.58 -1.96 -1 +1 +1.96 +2.58,2.5%,0.5%,2022/12/19, 正态分布的应用估计变量值的频数分布制定医学临床参考值,常 用 U 值 表- 正常值范围 双侧 单侧- 90 % 1.645 1.282 95 % 1.960 1.645 99 % 2.576 2.326-,95

8、% 双侧参考值: 1.96S99% 双侧参考值: 2.58S 95% 单侧参考值: - 1.64S , + 1.64S,_,_,_,_,2022/12/19,3) 百分位数法: 用于偏态分布资料 双侧参考值(= 0.05) P2.5 P97.5 单侧参考值(= 0.05) P5 或 P95,2022/12/19,03,计量资料的统计推断,2022/12/19,一、均数的抽样误差和标准误 (一)均数的抽样误差概念:由于抽样造成的样本均数与总体均数的差异或各样本均数之差异。表示方法:标准误(Standard error)标准误为样本均数的标准差,是说明样本均数抽样误差的大小的指标,反映了样本均数与

9、总体均数的差异。,2022/12/19,2022/12/19,2022/12/19,特征以0为中心,左右对称t-分布曲线的形状与自由度有关,-4 -3 -2 -1 0 +1 +2 +3 +4,f(t) = (-) / , = (u-d), = 5, = 1,-,-,自由度分别为1、5、的t-分布,2022/12/19,二、总体均数可信区间的估计点估计(point estimation)用样本均数作为总体均数的估计值区间估计(interval estimation)按一定的概率估计总 体均数所在范围,亦称总体均数的可信区间,2022/12/19,总体均数区间估计的方法:当n足够大(如100)时,

10、 X的平均数 接近正 态分布总体均数95%可信区间: 1.96 s 总体均数99%可信区间: 2.58 s,-,-,-,-,2022/12/19,总体均数区间估计的方法: 2) 当样本含量n较小时, X的平均数 接近t-分布 总体均数95%可信区间:t0.05, s 总体均数99%可信区间:t0.01, s,-,-,-,-,2022/12/19,三、假设检验的基本原理 概念:假设检验是用来判断样本统计量与总体参数的差异是由抽样误差引起,还是本质差异造成的统计推断方法。(一)假设检验的基本思想小概率事件不可能原理: 小概率事件在一次试验中基本不可能发生。反证法思想:先对总体的参数或分布作出某种假

11、设,再用适当的统计方法确定假设成立的可能性大小。推断此假设成立或不成立。,2022/12/19,抽样误差所致 P0.05 (来自同一总体) ? 假设检验回答 环境条件影响 P0.05 (来自不同总体),两均数不等,2022/12/19,(二)假设检验的基本步骤1) 建立检验假设,确定检验水准H0(无效假设):假设两组或多组资料的总体均数 相等。= 0 或1= 2 = 3H1(备择假设): 0 (双侧检验) 0 或 0 (单侧检验) (检验水准) :通常取 =0.05,2022/12/19,2) 选定检验方法,计算检验统计量 根据资料类型及统计推断的目的选用合适的检验方法计算出统计量( t值、u

12、值、2值等 )。3) 确定P值 ,作出推断结论 根据自由度,查不同统计量的界值表( t值表、2值表等),确定现有统计量的概率P值,2022/12/19,确定P值 : 当: t 0.05 (差异无统计学意义) t 0.01() t t 0.05() 0.01 按所取检验水准不拒绝H0 P 按所取检验水准拒绝H0,2022/12/19,(三)假设检验时应注意的问题 保证比较的样本间有较好的均衡性和可比性; 选用的假设检验方法应符合其应用条件; 正确理解差别有无显著性的统计意义; 结论不能绝对化; 报告结论时应列出统计量值,注明单侧或双 侧检验,写出P值的确切范围。,2022/12/19,2022/

13、12/19,例1、根据大量调查,已知健康成年男子脉搏数为72次/分。某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.5次/分。能否据此认为山区成年男子的脉搏数高于一般?,2022/12/19,1、H0:=0, H1:0, =0.05,2、 -0 74.2-72 t = = = 1.692 S 6.5/,3、自由度 = n1 = 25-1=24,查t值表(单侧) 得t0.05(24)= 1.711。 t = 1.6920.054、在=0.05水准上,接受H0,不能认为该山区成年男子的脉搏数高于一般。,2022/12/19,2022/12/19,n为对子数,20

14、22/12/19,x1 - x2 t = (n1-1) s12+(n2-1) s22 1 1 ( + ) n1+ n2-2 n1 n2,2022/12/19,2022/12/19,04,分类资料的统计描述,2022/12/19,一、常用相对数相对数:计数资料常用的统计指标, 又称相对指标(Relation number),2022/12/19,常用相对数 (一) 率 (Rate),* 频率指标,表示某现象发生的频率和强度* 计算公式: 实际发生某现象的观察数 率= K 可能发生某现象的观察单位总数 ( K为比例基数,可为100%或1000等),2022/12/19,(二) 构成比(Consti

15、tuent ratio),* 又称构成指标,表示某一事物内部各 组成部分所占的比重或分布。 * 计算公式: 某一事物各组成部分的个体数 构成比 = 100% 同一事物各组成部分的个体总数,2022/12/19,(三)相对比 (Relative ratio),* 表示两个有联系的指标(绝对数,相对数 或平均数)之比,说明对比水平。* 计算公式: A 指标 相对比 = (或 100%) B 指标 1)对比指标:两个有关同类指标之比,如两地 肿瘤死亡比 2)关系指标:两个有关非同类指标之比,如每 千人病床数,2022/12/19,二、应用相对数应注意的问题:1. 不要把构成比当作率分析(最容易混淆)

16、 - 年龄组(岁) 人口数 癌肿病人数 构成比(%) 患病率(%)- 30 633000 19 1.3 3.0 30- 570000 171 11.4 30.0 40- 374000 486 32.6 129.9 50- 143000 574 38.5 401.4 60- 30250 242 16.2 800.0- 合 计 1750250 1492 100.0 85.2-,2022/12/19,二、应用相对数应注意的问题: 2. 计算相对数的分母不宜太小- 治疗数 有效数 总体率95%可信区间- 2 1 1 99 % 4 2 7 93 % 50 25 36 65 % 500 250 45 54

17、 % 5000 2500 49 51 %- 可见,当n足够大时,相对数才稳定。,2022/12/19,二、应用相对数应注意的问题: 3. 率或构成比的比较应注意可比性 1)研究对象是否同质(方法、时间、种族、地区、环境等) 2)其它影响因素(年龄、性别)在各组的内部构成是否相同 3)同地区不同时期资料对比时, 应注意客观条件是否一致 4. 对观察单位数不等的几个率不能直接相加 求其平均率 5. 对样本率(或构成比)的比较应作假设检验,2022/12/19,三、率的标准化法,(一)标准化法的意义和基本思想意义-在比较率时,如果比较的两组资料其内部构成 不同,且影响到比较结果,就不能直接进行比较,

18、需要进行标准化处理后,消除由于内部构成不同对结果造成的影响,才能进行比较。标准化法-就是采用统一的标准对内部构成不同的各 组频率进行调整和对比的方法。标准化率-采用统一的标准调整后计算的率,2022/12/19,(二)标准化方法选择(根据已知资料类型)直接法:已有被观察人群中各组的率资料。间接法:仅有各组的观察单位数和总率,没有各组率的资料。(三)标准选择1、选择一个有代表性的、内部构成相对稳定的较大人群为标准;2、将比较的两组资料各对应组观察数合并作为标准;3、在比较的两组中任选一组内部构成做标准。,2022/12/19,(四)标化率的计算-直接法,例 1998年某社区甲乙两企业高血压患病率

19、(%)的普查结果 甲 企 业 乙 企 业 年龄 人口数 构成比 患病人数 患病率 人口数 构成比 患病人数 患病率(1) (2) (3) (4) (5) (6) (7) (8) (9)30 935 37.99 10 1.1 680 34.64 4 0.640 849 34.50 86 10.1 405 20.63 29 7.250 420 17.07 141 33.6 333 16.96 91 27.360 150 6.10 98 65.3 292 14.88 158 54.170 107 4.35 74 69.2 253 12.89 163 64.4 合计 2461 100.00 409 1

20、6.6 1963 100.00 445 22.6,2022/12/19,问题:甲企业各年龄高血压患病率都高于乙企业,合计患病率则乙企业高于甲企业。 原因:两个企业人口数在年龄构成上不同。甲企业60岁以下人口构成比高于乙企业,60岁以上正好相反,因此乙企业高血压合计患病率高是因为高年龄人口数多的缘故。解决方法:需要将两企业的年龄构成标准化,计算标准化高血压患病率,然后再进行比较。注意的是:1)选择的“标准人口”不同,计算的标准化率不同。2)标准化率只是为了进行合理比较而计算的一个指标,它并不反映实际水平。,2022/12/19,例 1998年某社区甲乙两企业标准化高血压患病率(%)的计算 甲 企

21、 业 乙 企 业 年龄 标准人口 原患病率 预期患病人数 原患病率 预期患病人数(1) (2) (3) (4)=(2)(3) (5) (6)=(2)(5)30 1615 1.1 17.8 0.6 9.740 1254 10.1 126.7 7.2 90.350 753 33.6 253.0 27.3 205.6 60 442 65.3 288.6 54.1 239.170 360 69.2 249.1 64.4 231.8合计 4424 16.6 935.2 22.6 776.5 甲企业标准化高血压患病率=935.2/4424100%=21.1%乙企业标准经高血压患病率=776.5/44241

22、00%=17.6%结果表明:甲企业标准化高血压患病率高于乙企业。,2022/12/19,05,分类资料的统计推断,2022/12/19,一、率的抽样误差和总体率的估计(一) 率的抽样误差与标准误由抽样造成的样本率与总体率的差别称为率的抽样误差(p - ;p为样本率, 为总体率)。率的标准误:表示率的抽样误差大小的统计指标。 计算公式:,(p为 的估计值; Sp 为p的估计值。),2022/12/19,(二) 总体率的可信区间估计正态近似法: 当总体率 未知时,若np 5 和 n (1-p) 5,则总体率 (1- ) 可信区间为: p U sp = p - U sp p + U sp即:总体率9

23、5%可信区间为 p 1.96 sp 总体率99%可信区间为 p 2.58 sp,2022/12/19,二、率的U-检验(一)样本率与总体率比较目的:推断样本率所代表的总体率 与某总体率 0 是否相等( 0 常为理论值或长期积累的经验值)。条件:n0 5 和 n (1 - 0 ) 5公式:,2022/12/19,2022/12/19,A 为实际值 T 为理论值,2022/12/19,3. 2检验的种类(1)四格表资料的 2检验 目的:用于两个样本率或构成比的比较,推断两个样本所代表的总体率(或总体构成比)是否相等。,2022/12/19,2022/12/19,2022/12/19,(3)行 列表

24、资料的 2 检验 目的:用于多个样本率(或构成比)的比较, 推断样本所代表的几个总体率(或总 体构成比)之间有无差别。 基本公式: 专用公式:,A 2 2 = n ( - 1) nR nC,2022/12/19,行 列表资料 2 检验的注意事项: 当有 1 / 5 及以上格子的 T 5, 或有一个格子 T 1时,应将资料合理合并,或增大样本含量重新观察以增加理论频数T; 当推断结论为拒绝 H0 时,是认为各总体率(或总体构成比)不等或不全相等,即只能认为其中至少有两个总体率(或总体构成比)不等,而不能确定任意两个总体率(总体构成比)不等。,2022/12/19,06,统计分析结果的表达,202

25、2/12/19,一、统计表,(一)列表的原则:1.重点突出,简单明了2.主次分明,层次清楚,(二) 统计表的基本格式,2022/12/19,统计表的基本格式 表号 标题横标目名称纵 标 目 合 计横标目合 计,2022/12/19,2022/12/19,复合表:按两个或两个以上特征或标志分组。,2022/12/19,二、统计图,(一)统计图的基本格式:,2022/12/19,(二)统计图的种类1线图(Line graph) 用于比较连续性资料,表示某事物在时间上的发展变化或某现象随另一现象变迁的情况,分为普通线图及半对数线图,也有单式及复式之分。,2022/12/19,普通线图,2022/12

26、/19,半对数线图(Semilogarithmic line graph),2022/12/19,表示事物(所研究指标)的发展速度,2022/12/19,2直方图(Histogram)适用于表示连续性资料的频数分布,各矩形面积总和为总频数。,2022/12/19,3条图(Bar graph)用于比较性质相似而相互独立的资料(间断性资料),有单式及复式条图。,某年某地几种主要疾病死亡专率,2022/12/19,2022/12/19,正确,错误,纵轴尺度起点必须为零示意,2022/12/19,4构成图 用于构成比的资料,比较各构成部分的比重, 有圆形图及百分直条图。,2022/12/19,圆形图(Pie graph),2022/12/19,百分条形图(Percent bar graph),2022/12/19,5散点图(Scatter diagram)用于双变量资料,表示两种现象之间的相互关系。,2022/12/19,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号