《医学统计学课件绪论.ppt》由会员分享,可在线阅读,更多相关《医学统计学课件绪论.ppt(30页珍藏版)》请在三一办公上搜索。
1、绪 论,一.什么是统计学(Statistics)The discipline concerned with the treatment of numerical data derived from groups of individuals(P.Armitage).关于处理数据的学科。The science and art of dealing with variation in data through collection,classification and analysis in such a way as to obtain reliable results(JM Last).通过收
2、集、分类和分析,处理数据变异性的科学与艺术,旨在取得可靠的结果。,卫生统计学(Medical Statistics)数理统计学在医药卫生领域中的应用。为什么学习医学统计学?(1)医学研究的需要;(2)更新医学知识的需要;(3)处理自身工作和研究的数据。,二.基本概念,同质:同类个体具有共性。变异:同类个体间的差异,如身高、体重,1.同质与变异,总体(population):打算研究的全部个体 大同小异样本(sample):总体中,具有代表性的一部分。随机化(randomization):使样本具有代表性的重要方法。,2.总体与样本,随机(Random),随机事件:在一次试验中可能发生,也可能不
3、发生的事件。在试验之前,无人知道发生还是不发生。经大量试验,这类事件是有一定规律的。,3.概率与频率,度量随机事件发生的可能性大小。A:随机事件;P(A):随机事件A发生的概率;P(A)=1,事件A一定发生;P(A)=0,事件A绝对不发生。,如果:观察次数:n(足够大);事件A的发生数:m;那么:事件A发生的概率P(A)m/n(频率或相对频率),概率的估计 频率,必然事件 P=1随机事件 0 P 1不可能事件 P=0 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,小概率事件,Certain,Impossible,0.5,0,1,频率与概率间的关系 1
4、.样本频率总是围绕概率上下波动 2.样本含量n越大,波动幅度越小,频率越接近概率。,4.参数与统计量,参数:定量反映总体的某个性质;通常用希腊字母表示,如,常常未知统计量:定量反映样本的某个性质;通常用拉丁字母表示,如 s,p,5.误差(Error)测量值=真值+随机误差+非随机误差 Xi=i+i 1随机误差(随机抽样误差):影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析。2系统误差 受确定因素影响,大小变化有方向性。3非系统误差(过失误差)研究者偶然失误而造成的误差。,偏差(bias),6.准确度与可靠度,准确度(accuracy)或真实性(validity):观察值与真值的接
5、近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。可靠度(reliabiliy)也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。,三、统计工作的基本步骤,1.研究设计2.收集数据3.整理数据4.数据分析,四、学习目的与方法,(1)统计思维享用一生 事件的不确定性概率 由样本推断总体,结论的不确定性有可能犯错误 统计学任务限定犯错误概率的大小,在此前提下,作决策,(2)理解概念是首位 如:研究设计的原则 确定样本量的依据 参数估计的精度 决策的两类错误,(3)重在理解和解释结
6、果 通过计算,体验统计概念和思想 正确理解、解释和表达计算结果,5.数据类型,观察单位observations个体individuals,变量variables,Quantitative data 计量资料,Qualitative data计数资料,Units;elements,(1)计量资料,用仪器、工具等测量(measure)方法获得的数据,即为计量资料(Measurement data),也叫定量数据(Quantitative data)。,特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/L)。,(2)计数资料,按某种属性分类,然
7、后清点每类的数据,称计数资料(Count data)或(Enumeration data),也叫定性数据(Qualitative data)。,特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)。,(3)等级资料 Rank data,半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料(Ordinal category data)。癌症分期:早、中、晚;药物疗效:治愈、好转、无效、死亡;尿蛋白:,+,+及以上,实例数据 1,实例数据 2,4.变量类型的转化,只能由高级向低级转化,不能作相反方向的转化 连续型有序分类二值离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,计量资料,等级资料,计数资料,本章重点内容,统计学常用基本概念 数据的分类,谢 谢,