医学医学统计学第2讲-计量资料统计描述课件.ppt

上传人:牧羊曲112 文档编号:3808070 上传时间:2023-03-22 格式:PPT 页数:57 大小:2.53MB
返回 下载 相关 举报
医学医学统计学第2讲-计量资料统计描述课件.ppt_第1页
第1页 / 共57页
医学医学统计学第2讲-计量资料统计描述课件.ppt_第2页
第2页 / 共57页
医学医学统计学第2讲-计量资料统计描述课件.ppt_第3页
第3页 / 共57页
医学医学统计学第2讲-计量资料统计描述课件.ppt_第4页
第4页 / 共57页
医学医学统计学第2讲-计量资料统计描述课件.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《医学医学统计学第2讲-计量资料统计描述课件.ppt》由会员分享,可在线阅读,更多相关《医学医学统计学第2讲-计量资料统计描述课件.ppt(57页珍藏版)》请在三一办公上搜索。

1、?,个体变异,是同质观察对象间表现出的差异。,?,变异是生物体在一种或多种、已知或未知,的不可控因素作用下所产生的综合反映。,?,就,每个观察单位,而言,其观察指标的变异,是不可预测的,或者说是随机的,(random),。,?,就,总体,而言,个体变异是有规律的。,变异规律的体现:,分布,(distribution),?,何为分布,?,熊猫分布在温暖多雨的山区,尤以中,国西南部,刀鱼分布在长江下游水域,长寿村的由来,统计描述,统计描述,(,descriptive statistics,),统计分析,统计推断,(inferential statistics),统计描述:,用统计指标、统计表、统计

2、图,等方法对资料的数量特征及其分布规律,进行测定和描述。,频数,:当汇总大量的原始数据时,,把数据按类型分组,其中每个组的,数据个数,称为该组的频数。,频数表(频数分布),:表示各组及,它们对应的组频数的表格称为频数,表或频数分布。,频数分布表,某市,1997,年,12,岁男童,120,人的身高,(cm),142.3,156.6,142.7,145.7,138.2,141.6,142.5,130.5,134.5,148.8,134.4,148.8,137.9,151.3,140.8,149.8,145.2,141.8,146.8,135.1,150.3,133.1,142.7,143.9,15

3、1.1,144,145.4,146.2,143.3,156.3,141.9,140.7,141.2,141.5,148.8,140.1,150.6,139.5,146.4,143.8,143.5,139.2,144.7,139.3,141.9,147.8,140.5,138.9,134.7,147.3,138.1,140.2,137.4,145.1,145.8,147.9,150.8,144.5,137.1,147.1,142.9,134.9,143.6,142.3,125.9,132.7,152.9,147.9,141.8,141.4,140.9,141.4,160.9,154.2,137.

4、9,139.9,149.7,147.5,136.9,148.1,134.7,138.5,138.9,137.7,138.5,139.6,143.5,142.9,129.4,142.5,141.2,148.9,154,147.7,152.3,146.6,132.1,145.9,146.7,144,135.5,144.4,143.4,137.4,143.6,150,143.3,146.5,149,142.1,140.2,145.4,142.4,148.9,146.7,139.2,139.6,142.4,138.7,139.9,(,1,)求,极差,(,range,):即最大值与最小值之差,又称为,全

5、距。,本例极差:,R,=160.9,125.9=35,(,cm,),(,2,),决定,组数,、,组段,和,组距,:根据研究目的和样本含量,n,确定。组距,=,极差,/,组数,通常分,8-15,个组,为方便计,,组距常取整数或一位小数。,本例,i,=R/10,=35/10=3.54。,列出组段:第一组段的,下限略小于最小值,,最后一个组,段,上限必须包含最大值,,其它组段上限值忽略。,(,3,),划记计数,:用划记法将所有数据归纳到各组段,得,到各组段的频数。,频数表的编制步骤,1997,年某市,120,名,12,岁男童身高的频数分布,组,段,频,数,频,率,百分率,124,1,0.0083,0

6、.83,128,2,0.0167,1.67,132,10,0.0833,8.33,136,22,0.1834,18.34,140,37,0.3083,30.83,144,26,0.2167,21.67,148,15,0.125,12.5,152,4,0.0333,3.33,156,2,0.0167,1.67,160,1,0.0083,0.83,合,计,120,1,100,某市,120,名,12,岁男童身高的频数分布,124,132,140,148,156,164,0,10,20,30,40,频数表的分布特征,集中趋势,(central tendency):,变量值集中位,置。本例在组段“,14

7、0,”。,集中趋势指标,离散趋势,(tendency of dispersion):,变量值,围绕集中位置的分布情况。本例,132,148,,共有,114,人,占,95,;离“中心”位置越远,频数越,小;且围绕“中心”左右对称。,离散趋势指标,120,名,7,岁男童身高的频数分布图,124,132,140,148,156,164,0,10,20,30,40,人,数,身高,(cm),239,人发汞含量的频数分布,70,3,5,7,9,11,13,15,17,19,21,10,20,30,40,50,60,0,1,发汞含量,(,?,mol/kg),人,数,某市,892,名老年人生存质量自评分频数分

8、布,0,10,20,30,40,50,60,70,80,90,100,100,200,3,0,0,0,400,自评分,人,数,102,名黑色素瘤患者的生存时间频数分布,0,5,10,15,20,25,30,35,40,45,0,1,0,2,0,3,0,4,0,生存时间,(,月,),人,数,某地某年,10000,例死亡者年龄分布,0,10,20,30,4,0,50,60,70,80,0,1000,2000,3000,4000,死亡年龄,(,岁,),人,数,频数分布的类型,对称分布,F,r,e,q,u,e,n,c,y,v,ar5,1,2,3,4,5,6,7,8,9,0,2,4,6,偏态分布,正偏态

9、,负偏态,F,r,e,q,u,e,n,c,y,v,ar5,1,2,3,4,5,6,7,8,9,0,2,4,6,8,F,r,e,q,u,e,n,c,y,v,ar6,1,2,3,4,5,6,7,8,9,1,0,0,5,1,0,长尾向,右,延伸,长尾向,左,延伸,频数分布表的用途,揭示资料的分布类型,看出频数分布的两个重要特征,集中趋势,离散趋势,便于发现某些特大或特小的可疑值,便于进一步计算指标和统计分析处理,集中趋势指标,1.,算术均数,:,简称均数,是用得最多的统计,描述指标。,总体均数,样本均数,x,计算方法:,直接法:,例,:,10,名七岁儿童体重,(kg),分别为:,17.3,,,18.

10、0,,,19.4,,,20.6,,,21.2,,,21.8,,,22.5,,,23.2,,,24.0,,,25.5,,求平均体重,x,17.3+18+25.5,10,21.35(kg),n,X,X,X,X,X,n,?,?,?,?,?,?,3,2,1,n,X,i,?,?,加权法:,x,f,1,x,1,+,f,2,x,2,+,f,3,x,3,+,f,n,x,n,f,1,+,f,2,+,f,3,+,f,n,?,fx,?,f,权数,均数的特性,?,各观察值与均数之差(离均差)的总和等于零,,即,,,?,各观察值的离均差平方和最小,即,,,均数是一组观察值最理想的代表。,),(,),(,),(,2,2,

11、X,a,a,X,X,X,?,?,?,?,?,?,均数的应用:,均数能全面反映全部观察值的,平均数量水平,应用甚广,最适于,对称分布资料,特别是正态分布资,料,对于偏态资料,均数不能较好,地反映其集中趋势。,2.,几何均数,计算方法:,G=,n,n,2,1,x,x,x,?,?,或者,G=,),lg,(,lg,1,n,x,?,?,直接法:,加权法:,?,f,lg,x,?,f,G=,lg,-1,例,:,5,人的血清滴度为,1:10,,,1:20,,,1:40,,,1:80,,,1:160,,求平均滴,度?,G=,5,160,80,40,20,10,?,?,?,?,=40,故平均滴度为,1:40,。,

12、例,:某医院预防保健科用流脑疫苗为,75,名儿童进行免,疫接种后,抗体滴度测定结果见下表,求平均滴度。,抗体滴度,滴度倒数,x,lgx,频数,f,flgx,1:4,4,0.6021,4,2.4084,1:8,8,0.9031,9,8.1279,1:16,16,1.2041,21,25.2861,1:32,32,1.5051,20,30.1020,1:64,64,1.8062,12,21.6744,1:128,128,2.1072,5,10.5360,1:256,256,2.4082,4,9.6328,合计,75,107.7676,75,名儿童的平均抗体滴度计算表,1,107.7676,lg,(

13、,),27.35,75,G,?,?,?,75,名儿童进行流脑疫苗免疫接种后,,平均抗体滴度为,1:27.35,几何均数的应用:,1.,等比资料,如抗体平均滴度,2.,对数正态分布资料,Remember!,使用几何均数时的,注意点,:,1),观察值不能有,0,。,2),观察值不能同时有正值和负值。若全,为负值,在计算时先把负号去掉,得出,结果再加上负号。,Be careful!,3.,中位数和百分位数,中位数,指将一组观察值从小到大按顺序排列,,位次居中的观察值,常用,M,表示。反映一批观察,值在,位次,上的平均水平。,百分位数,是一个位置指标,以,P,x,表示,一个,P,x,将,总体或样本的全

14、部观察值分为两部分。理论上有,x,的观察值比它小,有,(100-x)%,的观察值比它大,,而,P,50,就是中位数,因此,中位数也是一个特定的,百分位数。,适合各种类型的资料。尤其适合于,偏态分布的资料;,资料的一端或两端有不确定数值,(开口资料);,资料分布不明等。,中位数和百分位数的适用条件:,中位数计算方法:,当,n,为奇数时,,M,),2,1,n,(,?,x,当,n,为偶数时,,M,2,),2,1,n,(,),2,n,(,?,?,?,?,?,?,?,?,x,x,例,:某病患者,5,人,其潜伏期分别为,2,,,3,,,5,,,8,,,20,,求中位数?,n=5,,,M,x,3,=5(,天

15、,),例,:,8,名新生儿身长,(cm),依次为,50,,,51,,,52,,,53,,,54,,,56,,,55,,,58,,求中位数?,n=8,,,M,(,x,4,x,5,)/2=(53+54)/2=53.5(cm),对于频数表资料,:,?,?,x,L,x,i,P,L,n,x%,f,f,?,?,?,?,?,f,x,为,P,x,所在组频数,i,为组距,f,L,为,小于,L,各组段,的累计,频数,M,P,50,L,为,P,x,所在组,的下限值,组段,(,1,),划,记,(,2,),频数,,f,(,3,),累计频数,?,f,(,4,),累计频率,(%),0.5,3,3,1.9,(,0,1.9,)

16、,0.6,正,9,12,7.5,(,1.9,7.5,),0.7,正正,12,24,15.0,(,7.5,15.0,),0.8,正正,13,37,23.1,(,15.2,23.1,),0.9,正正正,17,54,33.8,(,23.1,33.8,),1.0,正正正,18,72,45.0,(,33.8,45.0,),1.1,正正正正,20,92,57.5,(,45.0,57.5,),1.2,正正正,18,110,68.8,(,57.5,68.8,),1.3,正正正,17,127,79.4,(,68.8,79.4,),1.4,正正,13,140,87.5,(,79.4,87.5,),1.5,正,9,

17、149,93.1,(,87.5,93.1,),1.6,正,8,157,98.1,(,93.1,98.1,),1.7,1.8,合计,3,160,100.0,(,98.1,100,),160,中位数,1.1+0.1x(160 x50%,72)/20,1.14,组段,(,1,),划,记,(,2,),频数,,f,(,3,),累计频数,?,f,(,4,),累计频率,(%),0.5,3,3,1.9,(,0,1.9,),0.6,正,9,12,7.5,(,1.9,7.5,),0.7,正正,12,24,15.0,(,7.5,15.0,),0.8,正正,13,37,23.1,(,15.2,23.1,),0.9,正

18、正正,17,54,33.8,(,23.1,33.8,),1.0,正正正,18,72,45.0,(,33.8,45.0,),1.1,正正正正,20,92,57.5,(,45.0,57.5,),1.2,正正正,18,110,68.8,(,57.5,68.8,),1.3,正正正,17,127,79.4,(,68.8,79.4,),1.4,正正,13,140,87.5,(,79.4,87.5,),1.5,正,9,149,93.1,(,87.5,93.1,),1.6,正,8,157,98.1,(,93.1,98.1,),1.7,1.8,合计,3,160,100.0,(,98.1,100,),160,P,

19、25,0.9+0.1x(160 x25%,37)/17,0.92,P,75,1.3+0.1x(160 x75%,110)/17,1.36,中位数的应用:,中位数常用于描述偏态资料的集,中趋势,它和均数、几何均数不,同的是,不是由全部观察值的数,据综合得到,而只受居中变量波,动的影响。,INT(,nx%,nx%),?,INT(,nx%,nx%),?,百分位数的计算,?,直接法,?,当,时,,。,?,当,时,,。,INT(nx%),INT(nx%),1,2,x,P,(,x,x,),/,?,?,?,INT(nx%),1,x,P,x,?,?,举例,?,例,根据表,2.1,资料求某地区,434,名少数民

20、族,已婚妇女现有子女数的第,80%,位数。,?,本例,,n=434,,,434,80%=347.2,,,,按式,?,(,人,),。,4,348,1,347,80,?,?,?,?,x,x,P,INT(,nx%,nx%),?,INT(nx%),1,x,P,x,?,?,?,频数表法,x,L,X,x,i,P,L,(,nx%,f,),f,?,?,?,?,百分位数的应用:,百分位数用于描述某个观察序列在某百分,位置上的水平。常用于确定参考值范围,,亦称正常值范围。,正常值范围指特定健康状况的人群的解剖、,生理、生化等各种数据的波动范围。,常用,95,范围,平均数,平均数,算术,均数,几何均数,中位数,加权

21、均数,众数,组别,均数,甲组,26,29,30,31,34,30,乙组,24,27,30,33,36,30,丙组,26,28,30,33,36,30,例:三组同性别、同年龄儿童的体重(,kg),如下,试分,析该三组资料的异同。,离散趋势指标,1.,全距,(range)(,极差,),优点:简单方便,缺点:除了最大、最小值,不能反应组内其,他数据的变异。,两样本例数相差悬殊时,不适用全距,比较变异度。,R=max-min,2.,四分位数间距:,P,75,上四分位数,P,25,下四分位数,Q,U,Q,L,0%,20%,40%,60%,80%,100%,0,P,100,(max),P,75,P,50,

22、(,中位数,),P,25,P,0,(min),P,x,组段,(,1,),划,记,(,2,),频数,,f,(,3,),累计频数,?,f,(,4,),累计百分率,0.5,3,3,1.9,(,0,1.9,),0.6,正,9,12,7.5,(,1.9,7.5,),0.7,正正,12,24,15.0,(,7.5,15.0,),0.8,正正,13,37,23.1,(,15.2,23.1,),0.9,正正正,17,54,33.8,(,23.1,33.8,),1.0,正正正,18,72,45.0,(,33.8,45.0,),1.1,正正正正,20,92,57.5,(,45.0,57.5,),1.2,正正正,1

23、8,110,68.8,(,57.5,68.8,),1.3,正正正,17,127,79.4,(,68.8,79.4,),1.4,正正,13,140,87.5,(,79.4,87.5,),1.5,正,9,149,93.1,(,87.5,93.1,),1.6,正,8,157,98.1,(,93.1,98.1,),1.7,1.8,合计,3,160,100.0,(,98.1,100,),160,P,25,0.9+0.1x(160 x25%,37)/17,0.92,P,75,1.3+0.1x(160 x75%,110)/17,1.36,Q,1.36-0.92,0.44,3.,方差和标准差:,(,X,-,)

24、,离均差,?,平方和,2,SS,N,?,2,=,总体方差,?,?,?,?,2,2,2,2,1,1,X,X,X,X,n,S,n,n,?,?,?,?,?,?,?,?,样本方差,自由度,?,?,?,?,?,2,2,2,1,1,X,X,X,X,n,S,n,n,?,?,?,?,?,?,?,?,样本标准差,标准差,(,standard deviation,)即方差的正平方,根;其单位与原变量,X,的单位相同。,?,?,2,X,N,?,?,?,?,?,总体标准差,?,?,2,2,1,fX,fX,n,s,n,?,?,?,?,?,加权法:,?,例:设甲、乙、丙三人,采每人的耳垂,血,然后红细胞计数,每人数,5,

25、个计数盘,,得结果如下(万,/mm3,),盘编号,甲,乙,丙,甲,2,乙,2,丙,2,1,440,480,490,193600,230400,240100,2,460,490,495,211600,240100,245025,3,500,500,500,250000,250000,250000,4,540,510,505,291600,260100,255025,5,560,520,510,313600,270400,260100,合计,2500,2500,2500,1260400,1251000,1250250,标准差,50.99,15.81,7.91,?,?,2,2,2,1260400,2

26、500,/,5,50.99,1,5,1,X,X,n,S,n,?,?,?,?,?,?,?,?,甲的标准差,标准差的用途:,表示观察值的离散度。,(,越大说明围绕均数,越离散,反之说明较集中在均数周围,均数代表性越,好,),结合均数描述正态分布特征。,计算标准误、变异系数等。,估计正常值范围,4.,变异系数:,比较单位不同的多组资料的变异度,比较均数相差悬殊的多组资料的变异度,100%,S,CV,X,?,?,均数,标准差,变异系数,青年男子,身高,170 cm,6 cm,3.5,体重,60 kg,7 kg,11.7,平均数与变异度的关系,?,它们都是定量资料统计描述的两个指标,,分别描述集中趋势与

27、离散趋势,?,分布越集中,变异度越小,平均数代表,性就越好;反之,变异度大,代表性就,越差。,集中趋势指标的正确应用,?,算数均数:,适用于单峰对称分布资料;,?,几何均数:,适合于作对数变换后单峰对称分布资料;,?,中位数和百分位数:,适用于任何分布的资料;,?,中位数和百分位数在样本含量较少时不稳定,越靠,两端越不稳定;,?,中位数在抗极端值的影响方面,比均数具有较好的,稳定性,但不如均数精确。,?,因此,当资料适合计算均数或几何均数时,不宜用,中位数表示其平均水平。,?,不同质的资料应考虑分别计算平均数。,离散趋势指标的正确应用,?,极差,不稳定,不灵敏,?,标准差,的基本内容是离均差,

28、它显示一组变量值,与其均数的间距,故标准差直接地、概括地、平,均地描述了变量值的离散程度。,?,在同质的前提下,标准差大表示变量值的离散程,度大,即变量值的分布分散、不整齐、波动较大;,反之,标准差小表示变量值的离散程度小,即变,量值的分布集中、整齐、波动较小。,?,变异系数,派生于标准差,其应用价值在于排除了,平均水平的影响,并消除了单位。,平均数与变异度,?,均数标准差,(,min,max,),?,中位数四分位数间距,(,min,max,),?,变异度小,则均数代表性好!,?,变异度大,数据分散,则均数代表性差!,?,平均数所表示的集中性与变异度所表示的离,散性,从两个不同的角度阐明计量资料的特,征!,总结,?,每个观察指标均有其特定的变异规律;,?,描述变异:,图形描述:,?,直方图(频数表),统计量描述,?,平均数:均数、几何均数、中位数,?,变异度:标准差、四分位数间距、变异系数、极差,?,不同分布的指标,用不同的统计量描述;,?,用平均数与变异度共同描述。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号