统计学方法概述.ppt

上传人:小飞机 文档编号:6373793 上传时间:2023-10-21 格式:PPT 页数:65 大小:327KB
返回 下载 相关 举报
统计学方法概述.ppt_第1页
第1页 / 共65页
统计学方法概述.ppt_第2页
第2页 / 共65页
统计学方法概述.ppt_第3页
第3页 / 共65页
统计学方法概述.ppt_第4页
第4页 / 共65页
统计学方法概述.ppt_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《统计学方法概述.ppt》由会员分享,可在线阅读,更多相关《统计学方法概述.ppt(65页珍藏版)》请在三一办公上搜索。

1、2023/10/21,1,第七章,人群健康研究的统计学方法,2023/10/21,2,“统计”一词,对一般人来说并不陌生。在报刊上常见用来说明我们工作、事业成绩的数字、表、图,称为统计数字、统计表和统计图。在西方,统计学(statistics)一词,源出于state(国家、情况),专指有关“国情”的学问,最初多用于文字记叙,后发展为数量比较,随着概率论思想与方法的引入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。,1.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?2用A,B两种药物分别治疗同病

2、患者各50人,如果A药的治愈率(60%)高于B药(50%),证明A药的疗效优于B药。这种说法对吗?为什么?,思考题,2023/10/21,4,医学统计学的主要研究内容,1、统计学设计(1)内容:临床试验设计、实验室研究设计、调查研究设计等。(2)目的:控制和缩小随机误差,消除系统误差;节约样本含量;尽可能多地获取有关信息,达到高效低耗的目的。2、统计分布 事物所表现的数量特征是千差万别的,其所呈现的分布规律是进行统计学推断的基础和根据。3、各种统计量(或称统计指标)的性质、特点及其分布规律4、统计分析方法(包括各种数学模型)尤其是随着计算机的普及和发展,多因素分析方法发展很快。,2023/10

3、/21,5,如何学习医学统计学,1、掌握基本概念、基本原理和基本方法。培养统计思维能力。2、掌握常用统计分析方法。对统计公式,要求了解其用途、适用条件和注意事项。切忌死记硬背,关键是灵活运用。3、重视习题课。联系实际,紧密结合专业知识,多做练习题。,2023/10/21,6,例:治疗某病的新疗法新法:(100例)有效20例,有效率20%;旧法:(100例)有效15例,有效率15%;这两个百分数就是统计描述指标,现在的问题是,这两种疗法的有效率会稳定不变吗?如果说不会,是什么原因?那么,两种疗法的真实有效率会是多少?我们能根据统计描述(20%与15%)就去正式采用还有较大副作用的新疗法?对这样的

4、差异问题,你能再凭直觉去作“否定”?在作任何回答之前,必须判断20%与15%之间的差别是真实的差异,或是仅仅由于“机遇”所致。这里,统计推断可提供帮助。学过统计学,将会了解不仅可判断新疗法是否较好?而且,如果判断它是较好,还能估计判断是错误的可能性有多大。,2023/10/21,7,统计分析是科研工作中的一种有力工具。它从科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。需要运用统计方法的场合而不去运用它可能造成不应有的缺陷或得出错误的结论。,2023/10/21,8,例:北京某医院某大夫使用“乌贝散”(乌

5、贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%。那么如果别的医院,其它大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?显然,不一定恰为94.4%,那么是多少呢?比它高还是比它低?这就是一个求可信区间的问题。,2023/10/21,9,例:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此药的78疗效有待探讨。这就要求设立具有可比性的对照组。,202

6、3/10/21,10,再譬如,用某药治某病,治一例有效,能说100有效吗?治疗二例有效,能说明100有效吗?治十例,其中九例有效,能说90有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。,2023/10/21,11,一些现象既有规律性又有随机性,肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性,而绝非每个吸烟的人都会患肺癌,这体现了随机性;再如,一般来说,白种人身材比黄种人要高些,这就是规律性,但对于具体的一个白人和一个黄种人,就很难说谁高谁矮了,这体现随机性。,2023/10/21

7、,12,第一节 统计学方法概述,一、统计学的意义统计学是运用数理统计的原理和方法,研究数据资料的搜集、整理、分析与推断的科学,是认识社会和自然现象客观规律的数量特征的重要工具。医学统计学 是认识医学现象数量特征的重要工具,是运用数理统计的原理和方法,结合医学实际,来研究医学科研的实验设计和数据处理的一门科学。“医学统计学是处理医学资料中的同质性(homogeneity)和变异性(variation)的科学与艺术”,2023/10/21,13,二、统计学中的几个基本概念,(一)同质与变异(二)总体与样本(三)参数与统计量(四)误差(五)概率,2023/10/21,14,(一)同质与变异 homo

8、geneity and variation,同质:指观察单位(研究个体)间被研究指标的影响因素相同。个体:即观察单位,是统计研究中的最基本单位。变量:观察单位的研究特征变量值:变量的观察结果变异:指同质的个体之间的差异。,2023/10/21,15,同质与变异的例子,例1 调查2008年淄博市7岁男童的身高和体重同质:2008年、淄博市、7岁男童变异:身高和体重各不相同例2 研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同,2023/10/21,16,120名正常成年男子红细胞计数值(1012/L),最大值=6.18,最小值=3.29,极差=2.89 算术均数=4.72,标准差

9、=0.57,2023/10/21,17,2023/10/21,18,(二)总体与样本 population and sample,总体:根据研究目的所确定的同质观察单位某项变量值的集合(全体)。分有限总体与无限总体,样本:从总体中随机抽取的部分观察单位变量值的集合。,2023/10/21,19,随机抽样 random sampling,为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。,2023/10/21,20,(三)参数与统计量 parameter and statistic,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定

10、的常数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。,2023/10/21,21,(四)误差 error,误差:泛指实验数据的实测值与真实值之差,1 系统误差2 随机测量误差3抽样误差,2023/10/21,22,系统误差 systematic error,在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。,2023/10/21,23,2随机测量误差

11、(random error of measurement)或称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机地变化。随机测量误差服从正态分布,可以用概率统计方法处理。,2023/10/21,24,3抽样误差(sampling error)我们从同一总体中随机抽取若干个例数相同的样本,其样本统计量之间会有所不同。这种由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异,统计上称为抽样误差。抽样误差在医学生物实验中最主要的来源是个体的变异。所以这是一种难以控制的、不可避免的误差。但抽样误差是有一定规律的。,2023/10/21

12、,25,(五)概率probability,确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。,随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:随机性;规律性:每次发生的可能性的大小是确定的。,概率:随机事件发生的可能性大小,用大写的P表示;取值0,1。,2023/10/21,26,必然事件 P=1 不可能事件 P=0 随机事件 0 P 1 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,

13、小概率事件,2023/10/21,27,样本的实际发生率称为频率。设在相同条件下,独立重复进行N次试验,事件A出现n次,则事件A出现的频率为f=n/N。频率与概率间的关系:概率是参数,频率是统计量;频率总是围绕概率上下波动;样本含量n越大,波动幅度越小,频率越接近概率。,频率 frequency,2023/10/21,28,三 统计资料的类型,(一)数值变量资料(二)分类变量资料(三)变量间转化,2023/10/21,29,观察单位observations个体individuals,变量variables,numerical variable data 数值变量资料,Categorical v

14、ariable data 分类变量资料,Units;elements,2023/10/21,30,(一)数值变量资料 numerical variable data,用定量 方法测定观察单位(个体)某项指标数值的大小,所得的资料,称数值变量资料。也叫定量资料Quantitative data或计量资料,特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/L);资料之间具连续性。,2023/10/21,31,(二)分类变量资料categorical variable data,将观察单位按某种属性或类别分组,然后清点各组的观察单位数,所得的资

15、料称分类变量资料也叫定性资料(Qualitative data),特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女),2023/10/21,32,1、无序分类(unordered categories),各类别之间有性质上的不同,而无程度上的差别。二项分类 如临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。多项分类 调查某人群的血型分布,按照、四型分组。清点所得该人群的各血型组的人数是计数资料;,2023/10/21,33,2、有序分类资料(ordinal category data),各类别之间有性质上的差别

16、,且排列有序,给人以“半定量”的概念,所以也叫等级资料 Rank data。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。尿蛋白:,+,+,2023/10/21,34,实例数据1,2023/10/21,35,实例数据2,2023/10/21,36,(三)变量间的转化,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,数值变量资料,等级资料,分类变量资料,2023/10/21,37,又如在计量诊断中,将某些阳性体征根据确诊病人的概率赋予分数,分数的多少代表量的大小,这样原来的

17、计数资料就转化为计量资料。由于计量资料可以得到较多的信息,所以凡能计量的,尽量采用计量资料。,2023/10/21,38,统计资料的几种类型:,2023/10/21,39,四、统计工作的基本步骤,(一)统计设计:包括调查、实验设计。(二)收集资料:取得准确可靠的原始资料(三)整理资料:对资料进行核查、改错,系统化、条理化(四)分析资料:统计描述、统计推断,2023/10/21,40,(一)统计设计 statistical design,统计设计是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。,1.调查设计:survey design客观描述研究总体,不对研究总体施加任何干预,目

18、的在于摸清某一事物的水平和分布状态。,2023/10/21,41,(1)实验研究设计:以动物或生物材料为研究对象,在研究过程中对研究对象施加干预。(2)临床试验设计:以人为研究对象,在研究过程中施加干预。,2.实验设计:experiment design,2023/10/21,42,统计设计的内容:,1.研究目的和假说。2.研究总体、研究对象、观察单位。3.是否施加干预,如何施加干预?4.需搜集那些资料,如何搜集?5.设置观察指标。6.资料的整理和汇总,计算有关统计量。7.控制误差。8.预期结果。9.时间和经费的安排等。,2023/10/21,43,研究设计的几个关键问题:,1.如何进行抽样?

19、如何安排干预措施?随机化原则:随机抽样和随机分配。,2.要达到研究目的应抽取多少观察单位?重复原则:确定样本含量。,2023/10/21,44,3.如何在诸多影响因素中,分离出研 究因素对实验结果的效应?对照原则:在对比组中,除研究因素外,其它影响实验结果的非研究因素都尽可能相同。,实验设计,2023/10/21,49,(二)搜集资料(collection of data),根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。,医疗卫生工作中的统计资料主要来自:,1.统计报表。2.医疗卫生工作记录。3.专题调查或实验研究。,2023/10/21,50,1、统计报表 如出生死亡

20、报告、疫情报告、医院工作报表等都是国家规定的,由医疗卫生机构定期逐级上报,提供居民健康和医疗卫生机构的各种数字,这些报表为各级卫生机构制定卫生工作计划、评价卫生工作和预测今后的工作提供重要依据,也为卫生管理研究提供了大量的原始资料;2、医疗卫生工作记录 如病历、医学检查记录等,这些资料都是进行医学研究的宝贵原始资料,必需很好开发利用,但许多医疗卫生机构忽视它,不认真填写,漏填、误填严重,以致不能很好利用,因此加强这方面的资料管理工作是很重要的;3、专题调查或实验 这是开展医学科研的主要资料来源,比上述2种经常性资料容易控制,可以得到较好的原始资料。如糖尿病、高血压的调查。,2023/10/21

21、,51,统计资料的要求,1、资料完整、准确和及时2、资料有足够的数量3、资料的代表性及可比性代表性:是指在抽样研究中样本对总体的代表性 随机化原则:总体中每个对象都有同等机会被抽取。可比性:是指在进行统计比较时,对比的各组之间,除观察问题或实验因素不同外,其它一切条件都要求尽量一致。,2023/10/21,52,(三)整理资料sorting of data,将原始数据净化、系统化和条理化,为下一步的计算和分析打好基础的过程。,1.审核:对原始数据的检查、核对和纠正错误等。,2.分组:根据研究目的将原始数据合理分组质量分组 即按事物的性质或类型分组,适用于计数及等级资料。如按性别、职业分组数量分

22、组 即按变量值的大小来分组,适用于计量资料。,3.汇总 整理成统计表,可用计算机汇总,2023/10/21,53,(四)分析资料(analysis of data),是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,做出科学合理的解释。,目的是在描述数据特征的基础上,阐明事物的内在联系和规律性。,2023/10/21,54,1.统计描述:statistical description选用恰当的统计指标,合适的统计表和统计图,对资料的数量特征及其分布规律进行测定和描述。,2023/10/21,55,(1)参数估计:estimation of parameters 如何由样本统计量推断

23、总体参数。,(2)假设检验:test of hypothesis 如何由样本差异来推断总体之间是否存在差异。,2.统计推断:statistical inference 如何在一定的可信程度下由样本信息 推断总体特征。,2023/10/21,56,如何学习统计学,循序渐进认真完成各部分习题,2023/10/21,57,复习思考题,总体误差分类概率统计资料的类型统计工作的基本步骤,2023/10/21,58,统计中所说的样本是指:A.随意从总体中抽取出的部分个体B.依照研究者要求从总体中抽取出有意义的部分个体C.按照随机原则抽取总体中有代表性的部分个体D.依照研究者要求从总体中抽取的部分个体E.按

24、分布的顺序抽取部分个体统计中所说的总体是指:A.随意想象的研究对象的全体B.根据研究目的确定的研究对象某项观察值的的全体C.根据时间来划分的研究对象的全体D.根据地区来划分的研究对象的全体E.根据人群来划分的研究对象的全体,C,B,2023/10/21,59,总体的要求是:A.大量的 B.同质的 C.随机的 D.固定的 E.对称的样本指标值与总体指标值之差主要是指:A.随机测量误差 B.关系误差 C.容许误差 D.抽样误差 E.系统误差由于各种偶然的因素影响,造成同一对象多次测定的结果不完全一致,往往是有的稍高,有的稍低,这种差异是:A.系统误差 B.随机测量误差 C.抽样误差 D.偏倚误差

25、E.标准误差,B,D,B,2023/10/21,60,抽样误差是指:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数以及各样本统计量之差D.样本统计量值和样本统计量值之差E.总体参数值和总体参数值之差统计学上说的系统误差、测量误差和抽样误差三种误差,在实际工作中有:A.三种误差都不可避免B.系统误差和抽样误差不可避免C.系统误差和测量误差不可避免D.测量误差和抽样误差不可避免E.三种误差都可避免,C,D,2023/10/21,61,抽样误差是由:A.计算引起 B.测量引起 C.抽样引起D.采样结果不准确引起E.试剂,仪器未经校正引起某事件发生的概率为1,即意味着

26、:A.某事件发生的可能性为1B.某事件可能发生C.某事件可能不发生D.某事件必然不发生E.某事件必然发生,C,E,2023/10/21,62,某事件发生概率为0,即意味着:A.某事件发生的可能性为100B.某事件可能发生C.某事件可能不发生D.某事件必然不发生E.某事件必然发生随机事件概率值应是:A.1 B.0 C.01 D.0.5 E.110,D,C,2023/10/21,63,A.仪器不准确 B.观测条件的影响 C.操作方法不规范 D.标准不统一 E.观察对象个体差异1可导致随机测量误差是:2引起抽样误差是:A.概率,其符号为 B.标准差,其符号为SC.值在0-1之间 D.值在0-0.01

27、之间E.值在之间1某事件发生可能性大小的数值称为:2随机事件出现的概率都在:,B,E,A,C,2023/10/21,64,A.由于仪器未校准,试剂未经校正等造成B.样本含量过大C.由于个体差异造成D.由于各种影响测量和读数的偶然因素造成E.由于样本含量太少造成1系统误差是:2抽样误差是:3随机测量误差是:,A,C,D,2023/10/21,65,统计工作的前提与基础是:A.计划与设计 B.收集资料 C.整理资料 D.校对资料 E.分析资料统计工作四个基本步骤是:A.统计设计,收集资料,整理资料和分析资料B.收集日常生活资料,报告卡片,分析资料,总结C.收集统计报表,日常医疗工作资料,分析资料,描述资料D.收集专门内容报告卡片,进行整理,分析资料,核对资料E.收集病历,日常医疗工作资料,分析资料,归组,A,A,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号