医学统计学--绪论 课件.ppt

上传人:牧羊曲112 文档编号:3906384 上传时间:2023-03-26 格式:PPT 页数:71 大小:4.74MB
返回 下载 相关 举报
医学统计学--绪论 课件.ppt_第1页
第1页 / 共71页
医学统计学--绪论 课件.ppt_第2页
第2页 / 共71页
医学统计学--绪论 课件.ppt_第3页
第3页 / 共71页
医学统计学--绪论 课件.ppt_第4页
第4页 / 共71页
医学统计学--绪论 课件.ppt_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《医学统计学--绪论 课件.ppt》由会员分享,可在线阅读,更多相关《医学统计学--绪论 课件.ppt(71页珍藏版)》请在三一办公上搜索。

1、1,2012年11月7日,中南大学公共卫生学院流行病与卫生统计学系,医学统计学,主讲人:颜 艳 教授,(国家精品课程),2,讲 授 内 容,3,第十一章 多因素试验资料的方差分析第十二章 重复测量设计资料的方差分析第十五章 多元线性回归分析第十六章 logistic回归分析第十七章 生存分析第十八章 判别分析第十九章 聚类分析第二十三章 常用综合评价方法,讲 授 内 容,高级统计方法,4,1.自备作业本,考试卷面成绩90分,课外 作业10分,考试前交作业,不交作业者 不准参加考试。2.自备计算器,如有兴趣,可自学统计软件 SPSS(教材32章)。,学 习 要 求,5,1.客观方面:生物医学研究

2、领域,实验或观察结果往往是不确定现象(变异性)。描述不确定现象、通过重复观察发现不确定现象背后隐藏的统计学规律是统计方法的显著特征。,2.主观方面:近期目标:研究生论文需求 远期目标:科研需求、晋级需求(论文需求),为什么要学一点统计学?,6,第一章 绪 论,7,一、医学统计学的意义二、统计学中的几个基本概念三、统计资料的类型四、医学统计工作的基本步骤五、学习医学统计学应注意的问题,主要内容,8,一、医学统计学的意义,9,统计学是关于批量数据资料收集、分析、解释与表达的普遍原理和方法。,Statistics:“a science dealing with the collection,anal

3、ysis,interpretation and presentation of masses of numerical data”-Webster 国际大辞典,(一)统计学与医学,1.统计学定义,10,医学统计学(medical statistics)用统计学理论和方法研究生物医学问题的一门学科。,医学统计学的主要研究对象是人,涉及到伦理学等诸多特殊问题,又有别于其他统计学。,2.医学统计学定义,11,现代医学是重“证据”的医学(evidence based medicine,EBM)。医学统计知识是医学知识的组成部分;医学统计方法是医学科研的基本方法;医学统计结果是所有医学科学研究最重要的证

4、据之一。,3.医学统计学的作用,12,4.统计学著名历史人物其人其事,13,(1)数学神童 Gauss(17771855),14,德国数学神童高斯在孩童时就能够快速计算出“1+2+3+100=5050”的答案。他对统计的主要贡献除了正态分布(normal distribution)外,还有算术均数、几何均数、二项分布理论和最小二乘法等。,15,其实,在Gauss 之前就有人发现了正态分布,但只有他很快将之应用于天文学研究,并使其应用价值广为人知,故正态分布又称高斯分布(Gaussian distribution)。,16,(2)从酿酒师到统计主管,Gosset(1876-1937),17,18

5、99年Gosset在英国都柏林一酿酒公司做酿酒师,在对小样本进行质量控制的研究中发现了t 分布,其论文1908年以Student为笔名发表。自此开创了小样本统计的新纪元。,18,非常有趣的是,Gosset的数学欠佳,因而不能自己解决 t 检验的理论和应用问题,其最后的完善,是由Fisher,Neyman 和E Pearson 先后完成的。正如后人评价的那样:“Gosset提出实际问题,Fisher 和 E Pearson 将其转成统计问题,Neyman用数学解决问题”。,19,(3)医院统计与卫生管理统计的先驱 F.Nightingale(1820-1910),20,1854年9月南丁格尔出任

6、土耳其英国总医院的女护士总管。鉴于医院没有任何医疗统计,登记也十分简单,仅仅记载下某年某日一个人死亡了。因而,她紧急提议建立医院的医疗统计室。她认为图表是她发明的一种表达形式。,21,1858年她当选英国皇家统计学会会员,为该学会最早的女会员。1860年,第四届国际统计大会议题之一就是“南丁格尔小姐的医院统计标准化计划”,会上报告了她的论文“医院统计学”。1862年,维多利亚出版社出版了她的著作医院统计与医院规划。,22,(4)把统计作为“披荆斩棘”工具的人类学家Galton,F.Galton,23,Galton是达尔文的表兄弟,人类学家,早年学医,曾在剑桥大学念书。尽管他的数学不是很好,但在

7、人类学和优生学研究中萌发的统计学思想,对生物统计的发展产生了深远影响,如“回归”、双变量正态分布的概念等。,“回归”这个词是由FrancilsGalton 1889年提出来的,他在研究祖先与后代身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们的父母的平均身高高Galton把这种后代的身高向中间值靠近的趋势称为“回归现象”,24,25,Regression 释意,26,当人类科学的探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计学工具可以为其开辟一条前进的通道。,F Galto

8、n(1822-1911),27,伦理学问题弱相关问题健康影响因素,5.医学统计学面临的挑战,28,数学是统计学的基础之一专业知识是统计学的重要应用背景,医学统计学是一门应用学科,学习医学统计学不一定要具备高深的数学知识。,(二)统计学与数学,29,使用机器:现在的统计计算工作,已完全可以依靠计算器(calculator)、办公软件(如Excel)和统计专用软件(如SAS、SPSS)完成。,不能完全依赖机器:目前尚没有指导研究人员正确选择统计方法的计算机专家系统,若在各种计算结果中“各取所需”,将会导致统计方法和统计结果的大量误用。,(三)统计学与数值运算,30,1.变异的描述 在自然状态下,任

9、何两个患者或两个研究群体间都存在差异。这种在自然状态下测量结果的差异,统计上称为变异(variation)。,(四)统计学的应用,31,表1-1 120名正常成年男子红细胞计数值(1012/L),32,变异的范围:3.26.2有明显的统计分布规律,4.75.0的人数最多,33,变异导致我们对医学实验(观察)结果判断的不确定性。当变异存在时,同样条件下的重复实验(观察),结果不会完全相同。医生和医学研究人员必须学会用概率的眼光看待生命现象中的因果联系。,34,2.观察对比 早期的观察对比主要是比较不同总体统计指标的差异(地区、人群、时间)。,35,观察对比是病因流行病学最常用的方法。1960年英

10、国医生Doll,Hill等发现吸烟与肺癌有关。强关联:相对危险度RR=1.66/0.07=23.7,36,举例:红楼梦作者考证,37,3.红楼梦作者考证,38,(五)医学论文中的统计 写论文,报告自己观察或实验的研究结果读论文,吸收新知识,了解学术进展必须具备一定的统计学知识,国内外医学杂志对来稿都有统计学要求或统计学指导,39,二、统计学中的几个基本概念,(2)变量(variable):研究单位的研究特征。例如:研究7岁 男孩身高的正常值范围 变量:身高,40,二、统计学中的几个基本概念,(3)变量值(value of variable):变量的观察结果。例如:研究7岁正常男孩身高 变量值:

11、测得的身高值(120.2cm,118.6cm,121.8cm,)研究某人群性别构成 变量值:男、女。,41,二、统计学中的几个基本概念,2.同质和变异(1)同质(homogeneity):根据研究目的给研究单位确定的相同性质。如研究长沙市2011年7岁男孩身高的正常值范围?同质:同长沙市、同7岁、同男孩、同无影响身高的疾病。,42,二、统计学中的几个基本概念,(2)变异(variation)变异(variation):同质研究单位中变量值间的差异。,43,二、统计学中的几个基本概念,3.总体和样本(1)总体(population):是根据研究目的确定的同质研究单位的全体。更确切地说是同质研究单

12、位某种变量值的集合。,44,二、统计学中的几个基本概念,例如:调查某地2010年7岁正常女童的身高 总体:该地2010年全体7岁正常女童的身高值,有限总体(finite population):明确规定了空间、时间、人群范围内有限个观察单位。例如:调查某地2010年正常成年男子的红细胞数的正常值范围。,45,二、统计学中的几个基本概念,无限总体(infinite population):研究单位数是无限的或总体的概念是设想的或抽象的。例如:研究保列治治疗慢性前列腺增生症的疗效。总体的同质基础:慢性前列腺增生症患者该总体应包括用该药治疗的所有前列腺增生症患者的治疗结果,没有时间和空间范围的限制,

13、其观察单位的全体数只是理论上存在的。昆虫总数、空气、水,46,(2)样本(Sample):是从总体中随机抽取部分观察单位,其实测值的集合。,二、统计学中的几个基本概念,47,二、统计学中的几个基本概念,注意:随机抽样(无主观性)样本含量(sample size):样本中包含的研究单位数。例如:某药治疗高血压患者30名 样本含量(n)为30,48,二、统计学中的几个基本概念,4.参数和统计量(1)参数(parameter):根据总体个体 值统计计算出来的描述总体的特征量。一般用希腊字母表示(2)统计量(statistic):根据样本个体值统计计算出来的描述样本的特征量。一般用拉丁字母表示,49,

14、二、统计学中的几个基本概念,总体参数一般是不知道的(统计学的魅力)统计学抽样研究的目的就是:样本统计量总体参数,50,参数与统计量示意图。,51,二、统计学中的几个基本概念,5.误差(error)是指实际观察值与观察真值之差、样本指标与总体指标之差。,52,二、统计学中的几个基本概念,(1)系统误差(systematic error):由于仪器未校正、测量者感官的某种障碍、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。例如:测量血糖,有斑氏法和葡萄糖氧化法,斑氏法的测量结果偏高易受体内还原性物质的影响。,这类误差可以通过实验设计和技术措施

15、来消除或使之减少。,53,二、统计学中的几个基本概念,(2)非系统误差(nonsystematic error):由于研究者偶然失误而造成的误差。例如:仪器失灵、抄错数据、点错小数点、写错单位等,亦称过失误差(gross error)这类误差应当通过认真检查核对予以清除,否则将会影响研究结果的准确性。,54,二、统计学中的几个基本概念,(3)抽样误差(sampling error):由于抽样所造成的样本统计量与总体参数的差别。例如:m=120.0cm n=100 N=5万=118.6cm特点:1)不可避免性 2)有统计规律性,55,二、统计学中的几个基本概念,6.频率、概率和小概率事件(1)频

16、率(relative frequency):一次随机试验有几种可能结果,在重复进行试验时,个别结果看来是偶然发生的,但当重复试验次数相当多时,将显现某种规律性。例如,投掷一枚硬币,结果不外乎出现“正面”与“反面”两种,现在,我们看一掷币模拟试验:,56,二、统计学中的几个基本概念,实验者 投掷次数 出现“正面”次数 频率学生1 1 1 1.0000学生2 2 0 0.0000学生3 3 2 0.6667学生4 4 3 0.7500学生5 5 3 0.6000学生6 6 2 0.4000学生7 7 4 0.5714 Buffon 4040 2048 0.5069K.Pearson 12000 6

17、019 0.5016K.Pearson 24000 12012 0.5005,57,二、统计学中的几个基本概念,可见,在相同条件下重复试验,试验结果为“正面”或“反面”虽不能事先断定,但我们知道试验的所有可能结果只有两种。在重复多次后,出现“正面”或“反面”这个结果的比例称之为频率。,58,二、统计学中的几个基本概念,(2)概率(probability)概率是度量随机事件发生可能性大小的一个数值。设在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。当n逐渐增大时,频率f/n趋向于一个常数,则称该常数为随机事件A的概率,可记为 P(A),简记为P。0P(A)

18、1,59,二、统计学中的几个基本概念,0 P(A)1 随机事件 P(A)=1 必然事件 P(A)=0 不可能事件。,60,二、统计学中的几个基本概念,频率是就样本而言的,而概率从总体的意义上说的,m/n是概率 P(A)的估计值。试验次数越多,估计越可靠。,61,二、统计学中的几个基本概念,(3)小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将 称为小概率事件,通常认为小概率事件在一次试验中不可能发生。,62,三、统计资料的类型,63,三、统计资料的类型,1.数值变量与计量资料(1)数值变量(numerical variable):变量值是定量的,表现为数值 大小,一般有

19、度量衡单位。如:身高(cm)、体重(kg)、血压(pa)。(2)计量资料(measurement data):对己确定的观察单位的某项指标(变量)进行测量所得到的一组数据,即一群变量值。如:长沙市06年7岁男孩身高值(120.2cm,118.6cm,121.8cm),64,三、统计资料的类型,(1)无序分类变量(unordered categories variable):变量值是定性的,有类别。特点:类别是客观存在的,各类无秩序,可任意排列;类与 类之间界限清楚,(理论上)不会错判。如:性别:男、女。血型:O、A、B、AB。(2)计数资料(enumeration data):一群个体按无序分

20、类变量的 类别清点每类有多少个个体,即分类个体数。如:卫生统计学教研室教师性别构成:男:6,女:7。某人群血型构成:O:20 A:35 B:30 AB:10,2.无序分类变量与计数资料,65,三、统计资料的类型,3.有序分类变量与等级资料 1)有序分类变量(ordinal categories variable):变量值是定 性的、分等级。特点:等级是主观划分的,各级没有大小但有秩序,必须从低到高或由高到低;级和级之间界限模糊,可能错判。如:疗效:无效、好转、显效、治愈。血清反应:、+、+、+2)等级资料(ranked data):一群个体按有序分类变量的级别清 点每级有多少个个体,即分级个体

21、数。如:某地某人群EB病毒抗体反应:65+:2+:2+:,66,5.变量类型的转化:,根据需要,上述三种资料类型可相互转换。计量资料转换为计数资料毕竟要损失部分信息,只是为了按专业习惯计算有关统计指标才使用。,三、统计资料的类型,67,1.设计 2.搜集资料 3.整理资料 4.分析资料,1.设计(关键的一步)有统计学设计与专业设计之分。研究者最为关心的问题:如何进行抽样?如何安排设计所规定的干预措施或称处理(treatment)?要达到研究目的应抽取多少个观察单位?如何在诸多的影响因素中,分离出研究因素对结果的效应?即如何设置对照。这也正是实验设计的三个基本原则所要回答的问题。,2.搜集资料:

22、即取得准确可靠的原始资料。统计资料的主要来源:统计报表:如传染病报表、职业病报表、湘雅医院 有:年报表、季 报表、月报表、日报表。经常性工作记录:如经常性的卫生监测记录,健康检 查记录,病历记录等 专题调查或实验 统计年鉴和统计数据专辑。可在各种相关出版物中查 阅。搜集资料要做到准确、完整、可靠、及时。,3.整理资料,即对资料进行清理、修正错误并加以存储。任务是净化原始数据,使其系统化,条理化。调查的原始记录或者实验的原始记录或者是计算机的录入过程,常常会有错误出现,所以必须经过反复地检查和核对,在核对时要注意对资料的合理性进行检查,如:男性患者的调查表中不应该出现妇科疾病,初生婴儿的体重不应

23、大于10kg.,4.分析资料:即把经过统计整理的资料,作一系列统 计描述和统计推断,阐明事物的规律性。统计分析包括:统计描述:指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述。统计推断:指如何抽样,以及如何由样本信息推断总体特征问题。包括参数估计和假设检验两个方面。,四、医学统计工作的基本步骤,68,.一定要掌握好三基,即基本知识、基本概念和基本方法。本教材有大量的公式,对于统计公式只要求了解其意义、用途和应用条件,不必深究其数学推导。举例:1)看电视,知道开、关就行。2)牛吃的是草,吐出来的是牛奶。数据 结果,五、学习此门课程的方法与建议,69,.要注意掌握每种统计方法的实际应用和应用条件。能正确选用统计学方法(1)资料类型不同统计学方法不同(2)设计类型不同统计学方法不同(3)研究目的不同统计学方法不同 最关键的,还是要训练对实际问题进行深入分析和培养实际处理各类资料的能力。,五、学习此门课程的方法与建议,70,.要逐步培养统计的思维方法 抽样研究抽样误差结论具有概率性 医学专业知识解释,五、学习此门课程的方法与建议,71,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号