《医学统计学 第一章 绪论 课件.ppt》由会员分享,可在线阅读,更多相关《医学统计学 第一章 绪论 课件.ppt(62页珍藏版)》请在三一办公上搜索。
1、2023/3/26,1,医学统计学,授课人:卢曲琴Email:,2023/3/26,2,医学统计学授课计划,总课时 32课时理论课:16课时实验课:16课时,成绩平时:20%考试:80%,2023/3/26,3,第一章 绪 论,2023/3/26,4,如今医生使用的血压计是希皮奥内里瓦-罗奇(意大利科学家)在1896年发明的。,2023/3/26,5,设计以下关键问题:,(1)应检查多少台仪器?(2)在每个仪器上应检查多少人?(3)自动一起与人工仪器测量的顺序问题?(4)在问卷中应收集什么样的数据?(5)数据应如何记录以便为今后的电脑计算提供方便?(6)应如何检查已进入电脑中数据的准确性?(7
2、)应用什么指标去考察研究结果?,2023/3/26,6,两种方法测量的平均舒张压及两种方法的差值,C与D的差异是不是某种意义上的“客观存在”的差异?,问题的设计与回答依赖于医学统计学!,2023/3/26,7,统计学(statistics)是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。,“A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”(Websters Internation
3、al Dictionary)。,(一)统计学的定义,2023/3/26,8,根据研究领域和研究对象,统计学又分为:数理 统计、经济统计、生物统计、医学统计、卫生统计 医学统计学(Medical Statistics):用统计学的原理 和方法研究生物医学中的问题的学科。卫生统计学(Health Statistics)生物统计学(Biostatistics),(二)什么是医学统计学?,2023/3/26,9,2023/3/26,10,(一)医学统计学的基本内容,2023/3/26,11,1.采用统计学方法,发现不确定现象背后隐藏的规律 相同父母所生的子女为什么身高、体重各不相同?同一个教室的学生的
4、学习成绩为什么各有千秋?采用同样的药物治疗某病患者疗效为什么会有差异?变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性。,(二)学统计学的重要性,2023/3/26,12,2023/3/26,12,2.用统计学思维方式考虑有关医学研究中的问题,某文献报道:用某种中草药治疗玫瑰糠疹,有效率为78%,平均疗程为3周左右。问此药治疗玫瑰糠疹的确有效吗?,玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到3周左右有些患者也会自愈。,要求设立具有可比性的对照组,2023/3/26,13,3.保证你的研究论文能通过统计学审查,统计知识的运用,撰写论文:报告自己观
5、察或实验的研究结果。,阅读论文:吸收新知识,了解学术进展。,研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。,2023/3/26,14,“良好愿望的医学”(well-meaning medicine)转入“以证据为基础的医学”(evidence-based medicine,EBM)需要有统计学方法的支持。全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。,“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”。-F.Yates,M.J.R.Healy,4.获得循证医学证据的主要
6、手段,2023/3/26,15,(三)医学统计思维进化和历史成就,一些重要的临床试验 英国临床医学研究理事会(1946年):链霉素治疗肺结核的临床试验,2023/3/26,16,链霉素治疗肺结核疗效的临床试验,从1530岁肺双侧进行性肺结核患者(总体)中抽取107例患者(样本),随机分为两组,试验组55例接受链霉素加卧床休息的治疗,对照组52例用常规治疗(单纯卧床休息)。6个月后,患者的X-光片分别由两位放射学家和一位临床学家独立评价,结果见下:,试验组生存率为93%(51/55)对照组生存率为73%(37/51),P0.05,结果试验组的存活率和放射学改善均优于对照组。,2023/3/26,
7、17,美国(1954年):评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎的效果(干预试验、现场试验;样本:180万儿童;花费:500多万美元。随机化分组,最后约有1/4参与者得到了随机化。这项试验最终肯定了索尔克疫苗的效果),2023/3/26,18,德国(1960年代初),药物酞胺哌啶酮(Thalidomide,又称反应停)事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过病例对照研究和干预研究发现危险因素是反应停)。美国从这一事件促使有关法律文件的产生,FDA为临床试验规定了一整套制度,使之成为确定药物疗效验的标准方法。,历史成就:John Graunt、William Farr(
8、寿命表);John Snow(霍乱发生原因);Doll 和Hill(吸烟与肺癌),2023/3/26,19,我国在医学统计学领域中的贡献,1061年的在本草纲目第一次提到对照试验:“为评价人参的效果,需寻两人,令其中一人服食人参并奔跑,另一人未服人参也令其奔跑.未服人参者很快就气喘吁吁.”1948年,郭祖超教授编著的医学与生物统计方法,是我国第一部医学统计方法的教科书.,2023/3/26,20,(四)工作生活中常见的统计学问题,体育彩票能否中(大)奖?(概率的大小)政治人物的支持度,民意测验(抽样调查)一月份的CPI(7.1)(相对数)不同民族智商测量、税收标准(均数)中国的轿车生产是否与G
9、DP、城镇居民人均可支配收入、城镇居民家庭恩格尔系数、私人载客汽车拥有量、公路里程等都有密切关系?如果有关系,它们之间是种什么关系?关系强度如何?(相关与回归),2023/3/26,21,(五)医学工作中常见的统计学问题,案例 1:,我的红细胞数比其他同事都低,我是病了吗?,案例 2:,某医生用某药治疗胃溃疡病出血患者107例,有效101例,有效率为94.4%。如果别的医生也用同样的药来治疗胃溃疡病出血患者,其有效率也一定是94.4%吗?,案例 3:,对某地2530岁妇女进行一项研究发现:在服用口服避孕药者中,宫颈癌年发病率为6/10万,而未服用者为3/10万。据此认为服用口服避孕药是引起宫颈
10、癌的危险因素,此结论正确吗?,2023/3/26,22,2023/3/26,23,总体(population):根据研究目的确定的同质观察单位的全体,更严格的说,是同质的所有观察单位某种观察值(变量值)的集合。,样本(sample):是从总体中随机抽取部分观察单位,其实 测值的集合。(代表性),1.总体和样本,2023/3/26,24,调查某地2002年正常成年男子的红细胞数的正常值范围,高血压患者无时间、空间限制,例如:一个国家的所有成年人;所有的肺结核患者,2023/3/26,25,例如:长沙市2002年正常成年男子中随机抽取 200名,其红细胞数构成一个样本,2023/3/26,26,案
11、件分析:2003年中国45岁以上者的血清总胆固醇含量的调查研究,研究目的:了解特定研究对象的血清胆固醇含量研究对象:2003年中国45岁以上人群,总体,样本,(随机)抽样,全体2003年中国45岁以上人群(其血清总胆固醇含量),全体2003年中国45岁以上人群随机抽取部分人群,其血清总胆固醇含量,2023/3/26,27,抽样研究的意义?,抽样研究最终的目的是要通过样本来推断总体的信息,是一种“以点代面,窥一斑而见全豹”的研究总体的方法,故抽样研究相对于直接对总体进行研究效率更高,甚至有时对总体的研究只能通过抽样研究来进行,如灯炮的寿命研究。,2023/3/26,28,2.参数和统计量para
12、meter and statistic,(随机)抽样,2023/3/26,29,3.同质和变异homogeneity and variation,同质:就是指研究对象具有相同的特征。同质是一个范畴,是纳入和排除对象的标准。,变异:同质个体的变量值的差异。,严格地讲,同质是指被研究指标的影响因素相同。对不同质个体的分析是没有意义的。,2023/3/26,30,案例分析:2003年中国45岁以上者的血清总胆固醇含量的调查研究,研究目的:了解特定研究对象的血清胆固醇含量研究对象:2003年中国45岁以上人群 同质:,变异:,2003年、中国、45岁以上。,研究对象的血清总胆固醇含量。,2023/3/
13、26,31,案件分析:比较两种不同的治疗方法(西药和中药)对高血压的控制情况,研究目的:比较不同治疗方法控制高血压的疗效实验因素:药物研究对象:根据研究目的确定的高血压病人实验效应或指标:血压 同质:,年龄、病史、高血压类型、情绪等。,变异:,控制高血压药物的疗效。,2023/3/26,32,4.变量及变量值variable and value of variable,变 量:反映观察对象特征或属性的量。变量值:变量的观察结果或测量值。,定量变量 quantitative variable/数值变量 numerical variable,定性变量 qualitative variable/分类
14、变量 categorical variable,2023/3/26,33,变量及变量值示意图,身高,体重,肺活量,性别,42.5,41.6,40.6,140.2,141.6,142.6,女,男,男,1100,1540,1423,2005年南昌市小学生体检资料,变量,变量值,2023/3/26,34,5.误 差(error),误差:对被观察对象的某指标进行观察,观察值与实际的真值之间的差别。,系统误差,过失误差,随机误差,误 差,偏差(bias),2023/3/26,35,过失误差:由研究者的偶然失误造成的。要杜绝!系统误差(systematic error):由仪器或人为因素造成的,具有方向性
15、,可用准确度描述。要尽量避免此类误差!随机误差(random error):在抽样研究中,因抽样造成的样本统计量与样本统计量、样本统计量与总体参数之间的差别。实验过程中,重复测量获得的实际值并不能稳定在某一固定值,而是无方向地围绕某一值波动。不能避免但可通过增加样本含量得以控制。,2023/3/26,36,误差示意图,随机误差,系统误差,2023/3/26,37,6.概率及小概率事件probability and small probability event,概率:描述随机事件发生可能性大小的度量,常用P(0P1)表示.小概率事件:P0.05或P0.01的随机事件。,2023/3/26,38
16、,小概率事件无处不在!有喜有忧,航班发生空难机动车发生车祸彩票中大奖妇女怀上多胞胎,小概率事件的经验判断准则 一次随机试验,小概率事件是不可能发生的。,2023/3/26,39,2023/3/26,40,统计资料的类型,数值变量无序分类变量有序分类变量,分类变量,计量资料,计数资料,等级资料,2023/3/26,41,1)计量资料(measurement data):通过测定每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。,例如:身高、体重,住院天数,类型:连续型和离散型,2023/3/26,42,2)计数资料:将观察单位按某种属性或类别分组计数,然
17、后汇总各组的观察单位个数而得到的资料。其变量值是定性的,表现为互不相容的属性或类别。,二分类:如性别、生死、疾病有无;多分类:如A、B、O、AB血型。,类型:离散型,2023/3/26,43,3)等级资料:将观察单位按某种属性的不同程度或等级顺序分组计数,然后汇总各组观察单位个数而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。例如:观察用某药治疗某病患者的疗效,以每名患者为观察单位,结果可分为治愈、显效、好转、无效四级。,类型:离散型,2023/3/26,44,不同类型资料间的转换,资料的类型可以转换 计 量 等 级 计 数在对原有资料作转换后,在统计分析时要注意统计方法的选择
18、和结果的解释。,2023/3/26,45,资料类型的转换,2005年南昌市小学生体重资料,意义:,有利于选择合适的统计分析方法,2023/3/26,46,1、某地一批人的血红蛋白值资料比色 法测得的具体值(如135g/L),为 何类资料?根据测得值进行分类如“贫血”),为何类资料?,试区分以下资料属于哪种类型?,2023/3/26,47,观察对象 抗体滴度 目测判断 免疫效果 抗体水平 1 1:40+有效 2 1:60+有效 3 1:320+有效 4 1:20-无效 为何类资料?为何类资料?为何类资料?,2.某疫苗皮下注射免疫结果,2023/3/26,48,3.数据类型的相互转换,如年龄(岁)
19、,为何类资料?转换为“未成年、成人”,是何类资料?再转换为“婴幼儿、青年、中年、老年”则又是何类资料?如治疗效果分类“无效、好转、显效、痊愈”为何类资料?分别给予编码0,1,2,3后又为何类资料?,2023/3/26,49,2023/3/26,50,背景、目的、方法、内容、经费预算,收集数据,统计调查、实验,整理数据,整理、清理、核实、查对,分析数据,统计描述统计推断,统计设计,2023/3/26,51,统计设计(design)是最关键的一步,是对整个研究过程的总设想或总安排,是最关键的一步,也是最重要的一步。搞好设计应具备以下条件 1.具有丰富的专业知识和水平 2.纵阅大量的参考文献 3.选
20、准研究课题 4.组成多学科专家队伍,2023/3/26,52,观察性研究设计:又称调查研究设计。旨在客观地描述研究总体,不对研究对象施加任何干预措施。,实验性研究设计:根据研究目的人为地对实验对象设置干预措施,通过对实验结果的分析评价其效果。,设计方案时应考虑:分析目的、研究对象分析指标、观察单位、检测内容和方法如何获取资料、怎样整理计算如何控制误差、组织实施等,统计设计分为,2023/3/26,53,收集资料_是最基础的一步,(1)资料来源第一手资料 经常性:统计报表(死亡登记、疫情 报告等),工作记录(病历、化验);一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如数据银行、全
21、国、全省卫生统计资料。,(2)资料要求 完整:观察单位及观察项目完整。观察单位:最基本的获取 数据的单元。可以是一个体,亦可以是一个单位、家庭、地区 准确:即真实、可靠。真实是统计学的灵魂。及时:即时限性。如人口普查规定调查开始日期和截止日期。,2023/3/26,54,整理资料,整理资料即原始数据的条理化、系统化的过程。所采取的手段合理化分组,目的实现专业目标。质分组:按事物的属性或性质分组分类变量;量分组:按数据的大小数值变量。,2023/3/26,55,(1)统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。(2)统计推断:用样本信息推断总体特征:参数估计,假设检验
22、。,分析资料,2023/3/26,56,案 例,研究2006年某地7岁男孩的身高情况,设计,明确调查目的和确定研究指标,确定研究对象和观察单位,选择调查方法,选择调查方式,设计调查表,样本含量的估计,资料的搜集,资料的整理,资料的分析,2023/3/26,57,假定该地有10万名7岁男孩研究目的:研究2006年某地7岁男孩的身高情况研究对象:2006年该地的10万个7岁男孩观察单位:研究对象中的每个7岁男孩观察指标:身高调查方法:普查或抽样调查调查表格:体检表调查方式:体检(直接观察法)样本含量:从某地随机抽取的200名7岁男孩资料搜集:小学生例行体格检查或专题调查研究资料整理:核对数据并录入
23、电脑资料分析:计算平均身高和身高的标准差。,2023/3/26,58,首先,一定要掌握好三基,即基本知识、基本概念和基本方法。其次,要逐步培养统计的思维方法,始终牢记概率、抽样和变异的存在。最后,要注意掌握每种统计方法的实际应用和应用条件。最关键的,还是要训练对实际问题进行深入分析和培养实际处理各类资料的能力。,六、如何学习医学统计学,2023/3/26,59,学医学统计学应注意的问题:,正确选用统计学方法(1)资料类型不同统计学方法不同(2)设计类型不同统计学方法不同(3)研究目的不同统计学方法不同,不管公式来源、推导,只要求了解其意义、用途和应用条件。举例:1)看电视,知道开、关就行。2)
24、牛吃的是草,挤出来的是牛奶。数据 结果,2023/3/26,60,课后练习:一、欲了解某地20002004年新生儿生长发育状况,为该地新生儿卫生保健提供依据。1、研究人员感兴趣的总体是什么?2、研究人员对总体的什么特征感兴趣,能否从专业的角度出发选择一些适当的指标对总体的这些特征加以描述?3、假设用你所选择的指标进行资料收集,给出这些资料所属的类型。,2023/3/26,61,二、1976年某单位报告了果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅的均数为0.116mg/L,血铅均数为1.81mg/L,服药20天后再测,尿铅均数降为0.087mg/L,血铅均数降为0.73mg/L。说明果胶具有较好的驱铅作用。1、这个研究中涉及了几个总体?2、给出相应的样本;3、上述文字中的数据的统计学意义是什么?4、该研究所涉及的资料类型是什么?,2023/3/26,62,预 习:,第3章 计量资料的统计描述,