统计讲课.ppt

上传人:sccc 文档编号:5444359 上传时间:2023-07-07 格式:PPT 页数:43 大小:1.11MB
返回 下载 相关 举报
统计讲课.ppt_第1页
第1页 / 共43页
统计讲课.ppt_第2页
第2页 / 共43页
统计讲课.ppt_第3页
第3页 / 共43页
统计讲课.ppt_第4页
第4页 / 共43页
统计讲课.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《统计讲课.ppt》由会员分享,可在线阅读,更多相关《统计讲课.ppt(43页珍藏版)》请在三一办公上搜索。

1、1/35,统 计 学,独立样本T检验Logistic回归ROC曲线,2/35,独立样本T检验,18例冠心病患者及16例健康人的血脂,分别为X1和X2,问两组人群的血脂水平有无不同。,计量资料的统计描述,统计推断,3/35,计量资料的统计描述,集中趋势的描述 离散趋势的描述,4/35,集中趋势的描述,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:1、算术均数(均数):可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。适用于对称分布,特别是正态分布资料。2、几何均数:可用于反映一组经对数转换后呈对称分布或正态分布的变量

2、值在数量上的平均水平。3、中位数 与百分位:数是将每个变量值从小到大排列,位置居于中间的那个变量值。4、众数:数组观察值中出现频率最高的那个观察值,5/35,常用统计指标:极差、四分位数间距、方差、标准差和变异系数。,离散趋势的描述,6/35,方差与标准差,方差,反映一组数据的平均离散水平。标准差是方差的正平方根 说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差。,7/35,统计推断,在大多数情况下,研究者并不知道总体的参数,而是在总体中随机抽取一定数量观察单位作为样本进行抽样研究,通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断 样

3、本统计量 相应总体参数 统计推断包括:参数估计 和 假设检验,样本性质与总体性质是否一致,即比较统计量与参数,一致时如何用样本估计总体,8/35,参数估计,用样本指标值推断总体指标值(参数),9/35,判断题,有95%可能性落在可信区间内?95%的可信区间包含了?,10/35,可信区间确切含义,从正态分布的总体中随机抽取个样本,可以计算得到个样本均数、标准差及可信区间,1时,在计算得的个可信区间中,平均有个可信区间包含了总体均数,而另外个不包括可信区间用于说明量的大小,即推断总体均数的范围,11/35,判断题,有95%可能性落在可信区间内95%的可信区间包含了,由此可见,确切含义:如果能够进行

4、重复抽样实验,平均有100(1)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1但在实际中,只能根据一次实验结果估计可信区间,根据小概率事件不太可能在一次实验中发生的原理,该结论错误的概率小于0.05或0.01,12/35,问题,心脏生化标志物水平升高和(或)降低超过参考值上限99百分位值,13/35,心脏生化标志物水平升高和(或)降低超过参考值上限99百分位值,14/35,对于偏态分布或未知分布的资料,正常值范围的确定常用百分位数法,参考值范围是基于一定可信度(99%)而建立的的,即它最多仅能包含95%或99%的“正常”个体 这一正常上限值来自99%的正常人测定数据,故非常可信

5、,15/35,小概率事件在一次统计抽样中不大可能发生。,假设检验的基本思想,否定小概率事件的原理,不针对大概率事件,16/35,假设检验的基本步骤,1、建立假设检验,确定检验水平H0:无效假设 样本均数=总体均数H1:备择假设 样本均数总体均数:确定检验水准2、选定检验方法,计算检验统计量3、确定P值,作出推断结论4、根据统计推断结果,结合相应的专业知 识,给出一个专业的结论。,17/35,P 0.05含义:(代表曲线下面积)如果H0成立,出现现有样本(样本所代表的总体相同时所抽出的样本)均数的可能性小于0.05,即为小概率事件,故拒绝H0假设,接受H1,认为存在差异。,P含义:从H0规定的总

6、体随机抽样,其检验统计量大于或小于现有样本统计量的概率,所有检验统计量都是在H0成立的条件下计算出来的,18/35,从问题的对立面H0出发,间接判定要解决的问题H1是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于预先规定的概率值(=0.05),就是小概率事件。根据小概率事件原理:小概率事件在一次抽样中发生的可能性很小,如果发生,则有理由怀疑原假设H0,认为其对立面H1成立。P,拒绝H0,接受H1P,不拒绝H0,19/35,20/35,Logistic回归,优势比OR(odds可信区间,胃癌术后复发,21/35,logistic回归为概率型非线性回归模型,是研究二分类

7、变量,如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等与一些影响因素(x)之间关系的一种多变量分析方法。可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。,二分类Logistic回归,22/35,模型参数的意义,常数项 表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数 表示自变量 改变一个单位时logitP 的改变量。,23/35,流行病学衡量危险因素作用大小的比数比例指标。计算公式为:,优势比OR(odds ratio),24/35,某医生观察30例胃癌术后复发情况,以术后是否复发为因变量,拟选年龄、胃切除、

8、家族遗传、营养状况、术后化疗为自变量,筛选胃癌复发的危险因素。,25/35,因变量,自变量,26/35,以step3最为结果,最终入选3个变量,家族遗传和术后化疗p小于0.05,有统计学意义优势比OR(EXP():有家族遗传者术后复发优势为无家族遗传者的39.513倍,95%可信区间(2.001,780.122)手术后化疗者复发优势为术后化疗者的53.282倍,95%可信区间(1.807,1571.395),27/35,28/35,研究目的是确立经超声测量颈总动脉内-中膜厚度值,用ROC曲线确定颈总动脉IMT最适的临界值。,29/35,1.适用范围,2.涉及参数,30/35,ROC(Recei

9、ver Operating Characteristic)曲线,用于二分类判别效果的分析与评价,一般自变量为连续变量,因变量为二分类变量。,31/35,基本原理是:通过判断点的移动,获得多组灵敏度和误判率,以灵敏度为纵轴,以误判率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大,判断价值越高。灵敏度:就是把实际为真值的判断为真值的概率。特异度:就是把实际为假值的判断为假值的概率。误判率:就是把实际为假值的判断为真值的概率,其值等于1-特异度。,32/35,曲线下面积(AUC),cut-off值,敏感性,特异性是必须交待的。AUC的取值是介于0.5和1之间的,不可能低于0.5ROC曲线下

10、的面积值在1.0和0.5之间。在AUC0.5的情况下,AUC越接近于1,说明诊断效果越好。AUC在0.50.7时有较低准确性,AUC在0.70.9时有一定准确性,AUC在0.9以上时有较高准确性。AUC0.5时,说明诊断方法完全不起作用,无诊断价值。AUC0.5不符合真实情况,在实际中极少出现。,33/35,利用ROC曲线确定诊断分界点cut-off值,1、直接从曲线上获得,离reference line(即对角线)最远的点就是最佳工作点。2、把正确诊断指数即约登指数最大的点定为最佳工作点:正确诊断指数(约登指数)=敏感度+特异度-1=敏感度-(1-特异度),即结果中最后两列之差。,34/35,在本结果中,当诊断点定为19.5时,正确诊断指数为0.745-0.152=0.593,最大。,35/35,谢谢!,36/35,37/35,38/35,39/35,40/35,41/35,附属超链接,42/35,t检验,One-Samples T Test:进行样本均数与已知总体均数的比较。Independent-Samples T Test:进行两独立样本均数的比较,即两组资料的t检验。Paired-Samples T Test:进行配对资料的均数比较,即配对t检验。,43/35,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号