临床统计学介绍.ppt

上传人:小飞机 文档编号:4939831 上传时间:2023-05-24 格式:PPT 页数:42 大小:299.99KB
返回 下载 相关 举报
临床统计学介绍.ppt_第1页
第1页 / 共42页
临床统计学介绍.ppt_第2页
第2页 / 共42页
临床统计学介绍.ppt_第3页
第3页 / 共42页
临床统计学介绍.ppt_第4页
第4页 / 共42页
临床统计学介绍.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《临床统计学介绍.ppt》由会员分享,可在线阅读,更多相关《临床统计学介绍.ppt(42页珍藏版)》请在三一办公上搜索。

1、临床统计学介绍,为什么要做统计分析?,统计分析的目的是应用样本 资料的信息,作出有关研究总体的有效推测。应用概要性指标描述样本资料来实现。这些概要性指标保留了足够的信息 去估计研究总体的特征。,关于总体的临床研究问题,在发展中国家,人工喂养相比母乳喂养能否增加母亲为HIV阳性的婴儿生存率?如何建立一个心脏搭桥手术后生存率模型?病人的特征能否预测术后生存率?相比内科治疗,搭桥手术后1,3,5年的生存率能否改善?局部治疗小肝癌能否代替外科手术切除?根治术后应用大剂量的干扰素能否降低肝癌复发率?,今天的主题,总体,样本和个体资料的类型:Continuous vs.categorical如何描述资料?

2、统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验评价,总体,样本和个体,“Aristotle maintained that women have fewer teeth than men;although he was twice married,it never occurred to him to verify this statement by examining his wives mouths.”-Sir Bertrand Russell,The Impact of Science on Society,1952.“It is a capi

3、tal mistake to theorize before you have data.”-Sir Arthur Conan Doyle,Scandal in Bohemia.,总体,样本和个体,And,for another viewpoint:“If your experiment needs statistics,you ought to have done a better experiment.”Ernest Rutherford.The bench science perspective:you can control all the variables!Clinicians,h

4、owever,know better human variation is large,and often inexplicable.Statistics help us describe it and generalize at least enough to improve our ability to practice medicine.,总体,样本和个体,Aristotle 推测了一个女性总体(比较男性总体).他实际上手头就有一个包含2个女人的样本,他能对这个样本中的2个个体进行数牙。The population is the collection of all people abou

5、t whom you would like to ask a research question.This might be a fairly clear-cut easily defined set of people:“What proportion of people 65 or older in the US today have Alzheimers disease?”Or it might be a more hypothetical group:“How much of a reduction in symptomatic days could a person expect i

6、f treated with a new antiviral for flu?”,总体,样本和个体,实际上,我们不可能去研究总体中的每一个对象。所以,我们研究一个样本,并将其推广到整个人群。样本量 是样本中个体 的数目(而不是对每个研究对象的测量指标数目!)好的研究设计能帮助我们得到一个 代表性好的样本。好的统计分析能帮助我们获得关于总体问题的答案。,例子:HCC的裸鼠转移模型,*2个水平:裸鼠 细胞,今天的主题,总体,样本和个体资料的类型:Continuous vs.categorical如何描述资料?统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验

7、评价,数据类型,计量资料 Quantitative:“how much?”连续的变量:年龄,体重,身高,血压 实际数值:家庭的子女数,住院天数分类资料 Categorical:“what type?”等级变量:肿瘤分期(I,II,III);好 中 差名义变量:男/女;健康/生病;ABO血型,数据类型数据类型的转换,计量数据可转换成分类数据:normal(value)vs.abnormal;“young,middle-aged,old”将连续变量转换成等级变量减少了资料的信息量,从而造成统计学检验的敏感度或把握度下降,今天的主题,总体,样本和个体资料的类型:Continuous vs.categ

8、orical如何描述资料?统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验评价,Notes:vertical axis can be count or percentin the above example,counts do not add to 74 individuals can have multiple risk factorstabular presentation may be more parsimonious for such data,N=74,分类资料的统计描述,计数百分比,分类数据的统计描述,构成比率比例 vs 率标化,下面是一

9、组年龄数据(11例)21,32,34,34,42,44,46,48,52,56,64年龄是一个计量的变量,所以如果用条图就不合适。我们更感兴趣的是年龄分布的一些特征:年龄分别的中心点在哪里?如平均数年龄的变异又是如何?是不是有些数据跟绝大部分数据差得很多(outliers)借助视觉工具帮助我们回答这些问题.,定量数据的统计描述,计量数据的统计描述,图表1.Stem and Leaf plot2.Histogram3.Boxplot数字1.Location-mean,median,mode.2.Spread-range,variance,standard deviation,percentile

10、3.Shape-skewness*例外:生存资料的描述,We could group the data and tally the frequencies:But why“hide”the details?Instead,well use the 10s place as stems and the units as leaves:,20:X30:XXX40:XXXX50:XX60:X,2*|13*|2444*|24685*|266*|4,Stem and Leaf Diagram,stem&leaf plotFor small datasets,Examples,平均数方差,中位数百分位数,

11、outlier,今天的主题,总体,样本和个体资料的类型:Continuous vs.categorical如何描述资料?统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验评价,集中趋势,算术平均数:几何平均数中位数,平均数和中位数比较,Mean is sensitive to a few very large(or small)values-“outliers”Median is“resistant”to outliersMean is attractive mathematically50%of sample is above the median,5

12、0%of sample is below the median.,离散趋势,Variation is important!,离散趋势,方差标准差百分位数:IQR=Q.75-Q.25,今天的主题,总体,样本和个体资料的类型:Continuous vs.categorical如何描述资料?统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验评价,标准误和95%可信区间,描述样本:平均数,标准差?总体:为了估计总体的平均数,需要计算标准误标准误标准差/样本量总体均数的95CI:样本的平均数1.96*标准误,论文中常用,标准差 vs均数的标准误(when do y

13、ou use one,but not the other?),标准差用于描述:量化样本均数周围的变异.当确定两个样本是否来自于同一总体时,标准差是一个重要的统计量。Central limit theorem;“同一总体中的样本均数呈正态分布”样本均数的标准误用于样本均数估计总体的均数。标准误是一个重要的统计量,用于计算样本均数的可信度,取决于标准差和样本量。但实际上两者并不独立,当样本量增加时,标准差往往减少。,正态分布(basis of statistical inference for many populations),Mean=median=mode.all=same value in

14、 the distribution remember:68.3%of data is between-1.00 s.d.and+1.00 s.d.95.0%“-1.96 s.d.and+1.96 s.d.95.5%“-2.00 s.d.and+2.00 s.d.99.7%“-3.00 s.d.and+3.00 s.d.,今天的主题,总体,样本和个体资料的类型:Continuous vs.categorical如何描述资料?统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验评价,推断性统计,推广结论:样本总体评价证据的强度比较预测,计量资料的统计方法,列联

15、表分析,列,*四格表是全一致,Make predictions:回归分析,应变量:一般定量变量 线性分析等级或名义变量Logistic 回归时间变量 Cox回归,Descriptive epidemiology:pattern of occurrencePrevalence of HIV+and community Mosquito index,r=.83 r-squared=.92*p.001 p.001*,201510 5 0,0 2 4 6 8 10 12 14 16 18 20 22,Index of community mosquito infestation,HIV+,今天的主题,

16、总体,样本和个体资料的类型:Continuous vs.categorical如何描述资料?统计量 和图测量集中趋势和离散趋势标准误和95%可信区间根据数据选择合适的统计方法诊断试验评价,诊断试验评价,试验的设计,诊断试验的设计,诊断试验的评价,敏感度a/a+c特异度d/b+d阳性预测值a/a+b阴性预测值d/c+d,阳性拟然比敏感度/1特异度阴性拟然比1敏感度/特异度,医学论文中通常报道哪些?,大多数研究报道平均数(正态)或中位数(非正态)有些研究报道标准差和/或标准误。Be careful!有时会看到图中有一个error bar,could be either.如果资料非正态(偏态,多峰,

17、尾巴很长或很短等),往往报道中位数和百分位数,而不是均数和标准差.写文章时一定有根主线研究所要回答的问题:Do you want to ask about the average or typical person?Or do you want to figure out how unusual your patient might be?,通常的流行病学(科学的)途径,1.确定一个问题:clinical suspicion;case series;review of medical literature2.组织一个假设(asking the right question);good hypo

18、theses are:Specific,Measurable,and Plausible3.检验假设(assumptions vs.type of data)4.再验证 always Question the VALIDITY of the result(s):Chance;Bias;and Causality,结论的准确性,Chance:role of random error in outcome measure(s)(p-value;power of the study and the confidence interval)-largely determined by sample sizeBias:role of systematic error in outcome measure(s)Selection bias-subjects not representativInformation bias-error(s)in subject data/classificationConfounding-3rd variable(causal)assoc.w/both X and Y,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号