现场调查资料的数据分析与表达.ppt

上传人:小飞机 文档编号:4986227 上传时间:2023-05-27 格式:PPT 页数:42 大小:619.50KB
返回 下载 相关 举报
现场调查资料的数据分析与表达.ppt_第1页
第1页 / 共42页
现场调查资料的数据分析与表达.ppt_第2页
第2页 / 共42页
现场调查资料的数据分析与表达.ppt_第3页
第3页 / 共42页
现场调查资料的数据分析与表达.ppt_第4页
第4页 / 共42页
现场调查资料的数据分析与表达.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《现场调查资料的数据分析与表达.ppt》由会员分享,可在线阅读,更多相关《现场调查资料的数据分析与表达.ppt(42页珍藏版)》请在三一办公上搜索。

1、现场调查资料的数据分析与表达,毛广运环境与公共卫生学院,目的与要求,掌握数据处理的基本原则统计方法选择的基本思路各种常用统计方法的前提适用条件熟悉统计描述和统计推断统计图和统计表了解统计报告,提纲,数据处理的一般原则与基本内容统计方法选择的基本思路常见调查研究方法资料的统计分析调查资料统计分析结果的表达,知识回顾,第一节,数据处理的一般原则与基本内容,数据处理方法的变迁,数据处理,数据处理定义:对数据的采集、存储、检索、加工、变换和传输。基本目的:从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。组成数据管理(约占全部工作量的60%-80%)

2、数据分析(约占全部工作量的20%-40%),数据处理的一般原则与基本内容,数据库设计数据录入数据管理数据审核异常(缺失)值的处理,统计整理:根据研究目的对原始数据进行科学的分类、汇总和显示;使之系统化、条理化、直观生动和反映总体的数量特征和规律。数据分析统计方法的选择统计描述与统计推断,数据库设计,变量(研究指标)识别变量:用于数据管理的变量,如ID分析变量:根据研究目的而定、需进行数据分析反应变量:反应疗效/观察结果变化情况的变量解释变量:分组(类)变量或协变量数据:变量的测量值空白数据库事先设计、用于容纳具体数据的容器,多为二维结构常由Epidata、Excel等专用软件设计,数据整理的内

3、容,数据审核(非常重要),定义对搜集到的资料进行认真的审查和核实目的确保资料符合要求、完整、准确无误方法逻辑审核(手工或计算机检查,以避免逻辑错误,如男性怀孕等)计算审核(多为计算机检查,如白细胞总量=酸+碱+淋巴细胞),离群数据的处理,离群数据严重偏离群体平均水平的数据,多为错误(如DBP=880mmHg),少量为异常的真实值可严重掩盖事实真相或扭曲两者间的关系处理原则手工处理:正态分布:3|均数标准差|偏态分布:99.5%或0.5%软件处理箱式图:距箱体底线或顶线距离超过箱体高度1.53倍者,缺失数据的处理,缺失值部分研究指标记录不完整,导致其值缺失后果:导致研究效率的下降数据的常见缺失机

4、制完全随机缺失:缺失资料与完整资料的特征无显著性差异非随机缺失:缺失资料与完整资料的特征存在显著性差异,常见处理措施直接剔除:适用于缺失量极少且为完全随机缺失单独列为一类:适用于缺失量较大,且难以合理填补者缺失值填补:均数替代中位数替代最后观察值结转回归算法多重填补法,统计方法前提条件的检查与描述,统计学最难以掌握之处数据分析人员最应该首先掌握的技能熟悉各种统计方法的前提适用条件合理选择最合适的统计方法,第二节,统计方法选择的基本思路,统计方法选择的核心要素,研究目的组间差异显著性检验?优效性检验?等效性检验?非劣效性检验?相互关系相关与回归、关联性分析(OR、RR、AR)、其它设计类型完全随

5、机设计?配对设计?随机区组设计?数据类型计量资料?分类资料?等级资料?分布特征正态分布?对数正态分布?其它偏态分布?,统计方法选择总结,统计方法选择总结(续),统计方法选择总结(续),常见统计分析的错误,普查还是抽样调查?普查无统计推断随机抽样还是非随机抽样?非随机抽样不能使用普通的统计推断方法资料类型误认未能满足所选择统计的前提适用条件单因素ANOVA代替重复测量资料的方差分析,第三节,常见调查研究方法资料的统计分析,横断面研究,定义研究某一特定时点(时期)、特定范围内人群中的有关变量(因素)与疾病或健康状况的关系资料既不反映既往又不反映将来数据处理资料审核、查漏补缺、去除重复记录等三间分布

6、:时间分布、地区分布、人间分布统计描述:均数、标准差、95%CI、率、构成比等统计推断:单一变量组间比较、两(多)变量间关系分析,队列研究的原理,由“因”索“果”,队列研究资料的数据分析,资料审核与数据管理统计描述研究对象构成、随访次数、随访间隔、结局及失访情况等分组(研究组别、年龄、性别等)整理随访期间的结局(发生率/死亡率)情况计算组间比较的RR、AR、PAR(归因危险度百分比)、PARP(人群归因危险度百分比)统计推断推断暴露因素与结局是否有关,病例对照研究的原理,由“果”索“因”,病例对照研究资料的数据分析,资料审核与数据管理统计描述研究对象的一般特征等组间均衡性比较不均衡:分层分析计

7、算组间比较的OR非匹配资料不分层分析:OR=ad/bc分层分析:合并OR=ORi、95%CI合并OR、2值、P值匹配资料:单元格中的数字乃为对数统计推断推断暴露因素与疾病是否具有统计学关联,干预性研究的原理(附加内容),干预性研究资料的统计分析(附加内容),资料审核与数据管理统计描述研究对象的一般特征组间均衡性比较:反映随机化分组效果随访次数、随访间隔、结局及失访情况等各组随访期间的结局(疗效)情况统计推断推断某干预措施是否有效,干预性研究资料的统计分析(附加内容),研究设计平行对照交叉设计析因设计具体方法:并非传统的显著性检验,而是使用区间假设检验的方法,提出以临床意义的差异来进行假设检验优

8、效性检验:试验药物的反应优于对照组(阳性或安慰剂对照)等效性检验:各处理间差异的大小在临床上并无重要性非劣效性检验:试验药的反应在临床意义上不差于(非劣于)对照药?,两(多)因素分析,两因素相关分析回归分析多因素多元线性回归分析、多元Logistic回归分析、协方差分析、生存分析、多元非线性回归分析、典型相关分析、多元方差分析等主成分分析、因子分析、判别分析、聚类分析等统计预测、综合评价等,第四节,统计分析结果的表达,统计分析指标,计量资料均数标准差、中位数(四分位数间距)等计数资料阳性例数(%)、OR/RR、95%CI等级资料阳性例数(%)、OR/RR、95%CI,统计表,四大核心要素标题线

9、条标目横标目纵标目数据备注(并非必不可少的要素)分类:简单表和复合表,统计图,定义:使用点、线、面等几何图形来形象化的描述数据的特征核心要素标题标目刻度纵轴从0开始?算术尺度还是对数尺度?纵横轴比例5:7或7:5图例(并非必不可少的核心要素),统计图的种类,直条图:纵轴从0开始圆图或百分条图线图普遍线图半对数线图直方图:纵轴从0开始箱式图散点图统计地图,统计推断结果的表达与解释,注意事项多次重复假设检验使用t检验处理3组或以上间均数比较使用单因素ANOVA处理重复测量设计资料P值的表达统计意义与实际意义并不一致应结合专业知识下结论,同时给出均数(率)差的95%CI,统计推断结果的表达与解释,注

10、意事项关联与因果关联并不等于因果关系,所谓的关联只是意味着两者可能有也可能没有因果关系(混杂因素)可信区间与假设检验,可信区间和假设检验,区别可信区间主要推断量的大小即总体均数多大假设检验主要推断质的不同即总体参数间是否相同联系可信区间同样可以回答假设检验的问题可信区间如包含了H0,则按水准,不拒绝H0,否则拒绝H0,接受H1可信区间可以比假设检验提供更多的信息,可信区间和假设检验,可信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义上图中,可信区间(1)(3)均不包含H0,意味着相应的差异具有统计学意义,(4)与(5)均无统计学意义(1)还提示差异具有实际意义;(2)提示可能具有实际意义;(3)提示实际意义不大;(4)提示样本量不足。(5)属于可以接受原假设的情况。,可信区间和假设检验,可信区间不能完全代替假设检验 可信区间必须预先规定一个概率即检验水准,不知道以外概率的情况,故相对比较机械假设检验则可以获得一个确切的概率P值,相对比较灵活完整的统计推断应该是区间估计假设检验,谢谢大家,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号