《常用统计分析方法介绍与实例解析分析解析课件.ppt》由会员分享,可在线阅读,更多相关《常用统计分析方法介绍与实例解析分析解析课件.ppt(55页珍藏版)》请在三一办公上搜索。
1、常用推断性统计分析方法介绍,及其实例解析,浙江省疾病预防控制中心,何,凡,Tel:0571-87115148;13777843290,Email:,1,2,基本概念变量类型,常用推断性统计分析,1.,两组之间比较定性资料,2.,两组之间比较等级资料,3.,两组之间比较定量资料,4.,两组以上资料,(,无序多分类,),的比较定性资料,5.,两组以上资料,(,无序多分类,),的比较等级资料,6.,两组以上资料,(,无序多分类,),的比较定量资料,7.,两等级变量关系的分析,8.,等级变量与定量变量之间的关系分析,9.,两定量变量关系的分析,10.,多选题分析,11.Logisitic,回归分析,目
2、,录,基本概念变量类型,1,、定性变量:,?,最常见的是分类变量或名义变量;,如职业:工人、农民、民工、商人、学生等,此为多,分类变量;最简单和最常用的分类变量是二分类变量,,如性别:男、女,某种疾病:有、无,某种结局:出现、,未出现等。,3,?,有序变量或等级变量,与分类变量不同,各种可能的“取值”中自然地存在,着次序,如问卷调查中对某件事情的满意程度:非常不,满意、有点满意、满意、很满意、非常满意;临床体检,或实验室检验常用、来表示测,量结果;再如护理与康复,,2004,,,3,(,1,):,54-55,,,临床教学中培养护生观察能力的方法探讨,作者选用了,讲座、教学查房和案例教学三种方法
3、,提高护生观察能,力的作用变量为:很有帮助、有帮助、一般。,4,2,、定量变量:分两种离散型和连续型,?,离散型:只能取整数值,如一年中的手术病人数,一年里,的新生儿数,细菌菌落数等;,?,连续型:可以取实数中的任何数值,如血压、身高、体重,等,可以在实数的一定范围内连续取值;有一些测量值,,如红细胞计数,虽然以“个”为单位时只能取连续值,但,其数值很大,当以“千”或“万”为单位时,却可取小数,值,故通常把这类变量也作为连续型变量处理。,5,?,有时为了数据分析的方便,可以将一种类型的变,量转化为另一种类型。但只能由高级向低级转化,即,连续型有序分类二分类。,实例:,如护理与康复,2004,,
4、,3,(,1,):,3-4,,全子宫切除术后最佳,下床活动时间与肛门排气时间关系的探讨,作者把肛门排气时间分为三个,等级(,24h,,,25,30h,,,30h,),然后再进行分析。,6,常用推断性统计分析方法,7,?,两组之间比较定性资料,(,1,)二分类资料,I,成组设计:所用统计方法为,四格表,2,检验,。,8,实例,2,:血压与冠心病患病之间的关系,结,局,血,压,患病,未患病,血压偏高,19,61,血压正常,20,465,实例,1,:两种药物治疗某种疾病的疗效比较,疗效,药物,种类,治愈,未治愈,药物,A,30,10,药物,B,11,49,9,10,II,配对设计:,对一组样品同时用
5、两种检测方法对其进行检,测,每种检测方法检测结果都分为阳性和阴性,数出两种检,测方法同时判定为阳性、阴性的样品数以及它们检测结果不,一致的样品数,将结果表示成配对四格表的资料格式。所用,统计方法为配对四格表,2,检验。,11,实例,1,:两种探针同时检测的结果,P,探针检测结果,生物探针,检测结果,+,+,40,4,3,39,实例,1,中,两种检测方法不知何者为优,任何一种方法检测,的结果都有假阳性和假阴性,比较它们检测结果不一致的,两个频数,无论差别有无统计学意义,都不能说明两种检,测方法何者为优,缺乏“金标准”,因而没有必要做统计,分析。,实例,2,属于隐含金标准的配对四格表资料,若甲培养
6、基培养出阳性结果,,而乙却培养出阴性结果,表明甲优于乙,这种阳性结果为真阳性,此,时值得做统计分析。实例,3,则可以明确地判定试验检测方法的优劣。配对,四格表的,2,检验可用McNemar,2,检验,以检测结果不一致部分差别是否,具有统计学意义。当然也可用,Kappa,检验法检验两种检测方法的检测结,果是否具有一致性。,12,实例,2,:两种培养基对同一批痰液标本,同时培养的结果,乙培养基,甲培养基,36,34,0,135,实例,3,:两种检测方法对同一组受试者检测的结果,金标准,试验方法,31,4,3,30,估计值,P,值,卡方,34.0000,5.51121E-09,校正卡方,32.029
7、4,1.51856E-08,估计值,P,值,卡方,0.1429,0.705457,校正卡方,0.0000,1.000000,结果,结果,13,(,2,)无序多分类资料:所用方法为,2,C,表的,2,检验。,14,实例,1,:某地城市和农村已婚妇女避孕方法比较,避孕方法,地区,节育器,服避孕药,避孕套,其它,城市,153,33,165,40,农村,320,75,43,18,SPSS,数据格式,可以采用两组有序变量资料的,Wilcoxon,秩和检验,15,?,两组之间比较等级资料,干预,过去三个月您抽烟吗,U Value,P,Value,从不,很少,有时,经常,前,4648,461,345,291
8、,-2.8851,0.0039,后,3163,297,181,164,合计,7811,758,526,455,16,17,可以选用的方法有成组设计的,t,检验、,u,检验、单样本,t,检验(,与总体作比较,实际上此时因素也为二分类)、配对,t,检验、,非参数,Wilcoxon,检验、符号检验、符号秩和检验等。,18,参数检验与非参数检验的区别?,通常参数检验的检验效能要高于非参数检验,但当参数检验的条件(正,态性、方差齐性)得不到满足、开口资料、等级资料或资料的总体分布,未知时,可以使用非参数检验的方法进行分析。,成组设计和配对设计的区别?,配对设计是按照一些非实验因素将受试对象配成对子,给予
9、每对中的个,体以不同的处理,配对的条件一般为年龄、性别、体重,。其优点是,在同一对的试验对象间取得均衡,从而提高试验的效率。通常分为自身,配对设计(某中措施作用于同一个体或两种措施作用于同一个体)和非,自身配对设计两种。,?,两组之间比较定量资料,(,1,)成组设计的,t,检验,设计类型为成组设计,且因素变量为,二分类变量,分析前需要先对资料的正态性和方差齐性进行检,验(这是很多参数检验的前提条件)。,19,例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,,8,周后记录各鼠体重,增加量(克),问两组动物的增重是否有差别?(此处正态性和方差齐,性检验略)。,利用,SPSS,进行分析,数据文件及格式见“
10、成组设计,t,检验,.sav,”,,,SPSS,菜单操作为:分析比较均值独立样本,T,检验,结果见下页,Independent Samples T,est,.015,.905,1.891,17,.076,1.911,13.082,.078,Eq,ual variances assu,med,Eq,ual variances not assumed,体重增加量,F,Si,g,.,Levene,s Test fo,r,Eq,uality of,Va,ri,a,nces,t,df,Si,g,.(2-tailed,),t-test for Eq,uality of Mea,ns,方差齐性检验的分析结果
11、,,P,值(,Sig,),0.9050.05,,,表明方差齐性,t,检验分析结果,,P,值(,Sig,),0.0760.05,,表明两组动物增加的重,量无差异(无统计学意义)。,当方差齐性时,看第一行的结果(,t,1.891,,,P,0.076,),当方差不齐,时,看第二行的结果(,t,1.911,,,P,0.078,),20,(,2,)成组设计的,u,检验,当样本量较大时,两组之间均数的比较,可以用,u,检验,其在,SPSS,中的实现过程同,t,检验,此处略。,(,3,)单样本,t,检验;,21,例:通过以往大规模调查,已知某地婴儿出生体重均数为,3.30kg,,今测得,某地一组婴儿的出生体
12、重,问该地婴儿出生体重是否与一般婴儿出生体重不同?,利用,SPSS,进行分析,数据文件及格式见“单样本,t,检验,.sav,”,,,SPSS,菜单操,作为:分析比较均值单样本,T,检验,One-Sample T,est,-1.232,11,.244,婴儿体重,t,df,Si,g,.(2-tailed),Te,st Va,lue=3.30,(,4,)配对,t,检验,22,例:用某药治疗,10,例高血压病人,测得治疗前后各病人的舒张压,,问该药是否有降低舒张压的作用?,利用,SPSS,进行分析,数据文件及格式见“配对,t,检验,.sav,”,,,SPSS,菜,单操作为:分析比较均值配对样本,T,检
13、验,结果见下页,Paired S,amples T,est,9.700,12.347,2.484,9,.035,治疗前,-,治疗后,Pa,ir 1,Mean,Std.Devi,a,ti,o,n,Pa,ired Differences,t,df,Si,g,.,(2-tai,l,ed),23,(,5,)非参数,Wilcoxon,秩和检验,,适用于成组设计资料。,24,例:测得某病的健康人,12,人和患者,10,人的某指标值,,问两组之间该指标值是否有差异?,25,(,1,)二分类,:,所用方法为,R,2,表的,2,检验。,如几种药物的疗效(有效、无效)比较;不同职业人群某病发,生率的比较等等。,2
14、6,实例,三种药物治疗某种疾病的疗效比较,疗效,药物,种类,治愈,未治愈,药物,A,30,10,药物,B,11,49,药物,C,50,20,?,两组以上资料(无序多分类)的比较定性资料,27,(,2,)多分类,:,所用方法为,R,C,表的,2,检验。,28,实例,1,:某医院三年间四种甲状腺疾病在,四季中发病人数的分布情况,季,节,甲状腺,病分类,春,夏,秋,冬,甲亢,411,451,294,284,亚甲炎,249,329,331,204,甲低,60,61,59,52,甲状腺肿瘤,45,50,46,40,实例,2,:心律失常种类与心肌梗塞部位关系的调查结果,部位,心律失,常种类,下壁,前壁,后
15、壁,心内膜下,窦性过缓,8,7,2,1,被动心律,1,1,0,0,房室阻滞,6,3,1,1,束支阻滞,1,16,1,0,实例,2,中小于,5,的理论频数的格子数超过了总格子数的,1/5,,,若选用一般的,2,检验公式计算,将增大犯假阳性错误的概率,,故此处应选用Fishers精确检验法。,29,30,31,此时资料属于单向有序的,R,C,表资料,可以使用秩和检验、,Ridit,分析和,Logistic,回归的方法分析。,32,实例:三种药物治疗某病患者疗效的观察结果,药物,种类,疗效,治愈,显效,好转,无效,药物,A,15,49,31,5,药物,B,4,9,50,22,药物,C,1,15,45
16、,24,?,两组以上资料(无序多分类)的比较等级资料,Kruskal-Wallis Test:,使用,SPSS,分析实例,2,资料,数据格,式见右侧截图。,菜单操作为:分析非参数检验,旧对话框,K,个独立样本,注意:例数必须先进行加权操作,T,est Statistics,a,b,61.146,2,.000,Chi,-,Square,df,Asymp.Si,g,.,疗效,Krus,k,al,Wallis,Tes,t,a.,Grouping,Var,iable:,药,物,b.,33,当多组之间比较时,可以选用的方法有单因素方差分析、配伍,组设计的方差分析(属两因素方差分析,其与二分类的配对,t,
17、检验相对应)、非参数,Kruskal-Wallis,检验及非参数,Friedman,检验等。,34,(,1,)单因素方差分析,例:某医生为研究一种四类降糖新药的疗效,以统一的纳入标,准和排除标准选择了,60,名,2,型糖尿病患者,按完全随机设计方案将,患者分为三组进行双盲临床试验。其中,将糖新药高剂量组,21,人、,低剂量组,19,人、对照组,20,人。对照组用公认的降糖药物,治疗,4,周,后测得其餐后,2,小时血糖的下降值。问治疗,4,周后,餐后,2,小时血糖,下降值的三组总体平均水平是否不同?(此处正态性和方差齐性,检验略)。,利用,SPSS,进行分析,数据文件及格式见“单因素方差分,析.
18、sav”,,SPSS,菜单操作为:分析比较均值单因素,Anova,?,两组以上资料(无序多分类)的比较定量资料,截图二:两两比较对话,框,常用的有,LSD,、,S-,N-K,、,Bonferroni,、,Duncan,、,Dunnett,方,法。,35,截图一:方差,同质性检验,Test of Homogeneity of Variances,血,糖,下,降,值,.1,77,2,5,7,.8,38,Lev,ene Statistic,d,f1,d,f2,Sig.,ANOVA,血,糖,下,降,值,1,76.76,5,2,8,8.3,82,5.53,7,.0,06,9,09.87,2,5,7,1,
19、5.9,63,1,08,6.6,3,7,5,9,Between,Grou,ps,With,in Gro,up,s,Total,Sum of Sq,uares,d,f,Mean Sq,uare,F,Sig.,方差齐性检验结果:,P0.05,方差齐,方差分析结果,,F=5.537,P=0.0060.05,,说明三组之间总体平均水平不同。,因而进一步用,Dunnett,法作多个试验组与一个对照组间的比较(见下页)。,36,Multiple Comparisons,Dep,en,den,t Variab,le:,血,糖,下,降,值,3.39,5,2*,1.26,5,0,.0,10,.8,62,5.92
20、,8,3.76,5,2*,1.24,8,3,.0,04,1.26,6,6.26,5,-3.3,95,2*,1.26,5,0,.0,10,-5.9,28,-.86,2,.3,70,0,1.28,0,0,.7,74,-2.1,93,2.93,3,-3.7,65,2*,1.24,8,3,.0,04,-6.2,65,-1.2,66,-.37,00,1.28,0,0,.7,74,-2.9,33,2.19,3,3.39,5,2*,1.26,5,0,.0,29,.2,75,6.51,6,3.76,5,2*,1.24,8,3,.0,11,.6,86,6.84,4,-3.3,95,2*,1.26,5,0,.0,
21、29,-6.5,16,-.27,5,.3,70,0,1.28,0,0,1.00,0,-2.7,87,3.52,7,-3.7,65,2*,1.24,8,3,.0,11,-6.8,44,-.68,6,-.37,00,1.28,0,0,1.00,0,-3.5,27,2.78,7,3.76,5,2*,1.24,8,3,.0,07,.9,34,6.59,7,.3,70,0,1.28,0,0,.9,41,-2.5,33,3.27,3,(J),组,别,低,剂,量,组,对,照,组,高,剂,量,组,对,照,组,高,剂,量,组,低,剂,量,组,低,剂,量,组,对,照,组,高,剂,量,组,对,照,组,高,剂,量,组
22、,低,剂,量,组,对,照,组,对,照,组,(I),组,别,高,剂,量,组,低,剂,量,组,对,照,组,高,剂,量,组,低,剂,量,组,对,照,组,高,剂,量,组,低,剂,量,组,LSD,Bo,nferro,ni,Du,nn,ett t(2,-sid,ed,),a,Mean,Differen,ce(I-J),Std.Erro,r,Sig.,Lower Bo,un,d,Up,per Bo,un,d,9,5%Co,n,fid,ence Interval,The,mean difference is,significant at,the.05 level.,*.,Dunnett t-tests tre
23、at one group as,a control,and compare all other,groups against it.,a.,37,(,2,)非参数,Kruskal-Wallis,检验,例:仍以上述资料为例,假设此时资料不符合正态性或方差,齐性的要求,我们使用非参数,Kruskal-Wallis,检验进行分析。,SPSS,菜单操作为:分析非参数检验旧对话框,K,个独立样,本,38,I,当两变量属性不同时,称这样的列联表资料为双向有序且,属性不同的,R,C,列联表资料。,39,两等级变量关系的分析,实例,1,:地方性甲状腺肿患者各年龄组疗效的观察结果,疗效,年龄,(岁),治愈,显效
24、,好转,无效,11,35,1,1,3,20,32,8,9,2,30,17,13,12,2,40,15,10,8,2,50,10,11,23,5,此时,根据分析目的的不同,可以选用不同的分析方法。,40,(,1,)只关心各年龄组患者治疗结果之间的差别是否有统计学,意义,此时可将其视为单向有序的,R,C,列联表资料,可以选用,的统计方法有秩和检验、,Ridit,分析或,Logistic,回归分析等。,(,2,)希望考察年龄与疗效之间是否存在线性相关关系,此时,可以选用处理定性资料的相关分析方法,通常采用,Spearman,秩相关分析方法(见下页)。,(,3,)若两个有序变量之间的相关关系有统计学意
25、义,希望进,一步知道两者之间的变化关系是呈直线关系还是呈某种曲线关,系,此时宜选用线性趋势检验。,(,4,)若仅希望考察,R,C,表各行上频数分布是否相同,此时可,以选用一般的卡方检验或Fishers精确检验法。,利用,SPSS,进行,Spearman,相关分析,分析 相关 双变量,41,Correlations,1.000,.416*,.,.000,219,219,.416*,1.000,.000,.,219,219,Co,rrela,ti,o,n Coefficie,nt,Si,g,.(2-taile,d),N,Co,rrela,ti,o,n Coefficie,nt,Si,g,.(2-t
26、aile,d),N,年龄,疗效,Sp,earman,s,rho,年龄,疗效,C,or,relation,is,significant at,t,he 0.01 level(2-tailed).,*.,数据,格式,分析结果,相关分,析对话,框,II,当两变量属性相同时,称这样的列联表资料为双向有序,且属性相同的,R,C,列联表资料。,42,实例,1,:,446,例流行性出血热病情转化情况,最后定型,早期,分度,轻型,中型,重型,轻型,111,21,1,中型,5,163,20,重型,0,1,124,实例,2,:,100,例脑肿瘤患者的临床诊断与,CT,诊断的结果,CT,诊断结果,临床诊断结果,检出
27、,疑似,未检出,检出,60,4,2,疑似,4,12,3,未检出,3,3,9,左侧两组资料都希,望回答两种方法结果,是否具有一致性的问,题,这其实是配对四,格表资料的扩展,只,不过,在处理配对四,格表资料时,人们更,关心两种检测方法的,检测结果不一致部分,的数量之间的差别是,否具有统计学意义,,而在处理此类资料时,,更关心的是两种检测,方法检测结果之间是,否具有一致性,常用,一致性检验(或称,Kappa,检验)方法。,43,44,此时可以使用,Spearman,相关分析或用有序变量的,Logistic,回归分析方法进行分析。如研究收入水平对一个人自感健康状,况(很好、好、一般、不好、很不好)的影
28、响。在,SPSS,中的,分析过程同上,此处不再详细介绍。,45,?,等级变量与定量变量之间的关系分析,?,两定量变量之间的关系分析,可以做相关分析或回归分析,分析两个变量之间的相关性或,依赖性。,小结,?,资料类型:,定性(无序多分类、二分类,),等级(有序),定量,?,分析方法:,卡方检验:定性,T,检验:两组,定量,方差分析:,=,三组,定量,Wilcoxon,:两组,等级、定量,Kruskal-wallis,:,=,三组,等级、定量,相关分析:等级(,kendall,),非正态、定量(,spearman,),正态、定量:,pearson,相关分析,46,多选题的两种形式:,47,?,多选
29、题分析,第一种形式:,您认为健康的生活方式包括哪些内容:,a.,戒烟、限酒,b.,平衡膳食,c.,心胸开阔,d.,多吃保健品、营养品,e.,控制体重,f.,多吃多睡,g.,经常运动,h.,不知道,第二种形式:,对公众进行流感或人禽流感预防和控制等方面最主要的,宣传形式(限选三种),_,a.,报纸,b.,杂志,c.,电视,d.,广播,e.,网络,f.,发放宣传材料,g.,社区宣传栏,/,墙报,/,街头标语,h.,社区咨询,48,49,Logistic,回归分析,?,Logistic,回归是适用于反应变量(即因变量)为分类变量的,回归分析,近年来在许多研究领域得到了广泛的应用。,?,Logisti
30、c,归按照反应变量的类型可分为:,?,两分类反应变量的,Logistic,回归,;,?,多分类有序反应变量的,Logistic,回归,;,?,多分类无序反应变量的,Logistic,回归。,?,Logistic,回归按照研究设计的类型可分为:,?,非条件,Logistic,回归,即研究对象未经匹配,;,?,1:1,的条件,Logistic,回归,即研究对象按,1:1,进行匹配,;,?,1:m,或,m:n,的条件,Logistic,回归,即研究对象按,1:m,或,m:n,进行匹配。,51,单因素,52,多因素,53,单因素分析结果,多因素分析结果,?,条件,Logistic,回归分析(,n:m,的个体匹配设计),54,危险因素,人数,%,OR,95%CI,病例,对照,病例,对照,收玉米,8,14,27,25,1.3,0.31-5.6,收黄豆,16,13,52,23,3.6,1.4-9.6,种麦,23,47,82,83,0.89,0.17-4.7,某市恙虫病发病危险因素病例对照研究结果,55,