《第十章统计表与统计图StatisticalTableampStatisticalGraph.ppt》由会员分享,可在线阅读,更多相关《第十章统计表与统计图StatisticalTableampStatisticalGraph.ppt(54页珍藏版)》请在三一办公上搜索。
1、第十章 统计表与统计图Statistical Table&Statistical Graph,统计表(statistical table)是表达统计分析结果中数据和统计指标的表格形式;统计图(statistical graph)是用点、线、面等各种几何图形来形象化表达统计数据。,第一节 统计表,一、统计表的意义与制作原则1统计表的意义 统计表用简明的表格形式,有条理地罗列数据 和统计量,方便阅读、比较和计算。2制表原则:重点突出、层次清楚 3制表的基本要求,(1)标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。(2)标目:分别用横标目和纵标目说明表格每行和每列数字的意义,
2、注意标明指标的单位。,(3)线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。,(4)数字:用阿拉伯数字表示。无数字用“”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。(5)备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。,二、统计表的种类,例10-1 表10-1列出某地进行喷昔洛韦软膏治疗颜面单纯疱疹与阿昔洛韦软膏比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。,
3、1.简单表 统计表的主语只有一个层次,表10-1 某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较,如何完成喷昔洛韦软膏治疗颜面单纯疱疹疗效的比较分析?,2.组合表 统计表的主语有两个以上层次,例10-2 某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表10-2。该表属组合表。,表10-2 某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析,请分别指出城乡25组的发生率和构成比。,三、编制统计表的注意事项,例10-3 某地进行冠心病危险因素研究时,调查了居民的心理得分值与其它冠心病有关因素,结果列成表10-3。,表10-3 不同心理分值的冠心病危
4、险因素水平比较,问 题,将太多的内容放在一个表里,特别是将两种不同类型资料(计量资料和计数资料)的统计量放在同一表中。互不相容的内容分别占了不同的列,导致表中有许多空格。纵横标目倒置。内容较多,层次复杂,表格中数据罗列无条理,较难读懂。,表10-4 某年某地居民不同心理分值的冠心病危险因素水平比较(XS),处理办法:将该表资料分别制成两个统计表,见表10-4和表10-5。,表10-5 某年某地居民不同心理分值的冠心病危险因素水平比较,第二节 统计图,1统计图的意义:统计图将统计数据形象化,让读者更易于领会统计资料的核心内容,易于做分析比较,并且可以给读者留下深刻的印象。,2统计图的种类:根据资
5、料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图和统计地图等,还有在数据探索性分析中应用的茎叶图、残差图、箱式图,序贯分析的检验区域图,判别分析的类别分布图,聚类分析的谱系图等特殊分析图等。,3统计图制作的一般原则,(1)根据资料性质和分析目的正确选用适当的统计图。(2)必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题一般 放在图的下方。,(3)统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。(4)统计
6、图用不同线条和颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。,二、常用统计图,1直条图(bar chart)2圆图(pie chart)和百分比条图(percent bar chart)3线图(line graph)4直方图(histogram)5统计地图(statistical map)6其他特殊分析图 箱式图(box plot)茎叶图(stem-leaf plot)误差条图(error bar chart),1直条图(bar chart),用相同宽度的直条长短表示相互独立的某统计指标值的大小。直条图按直条是横放还是竖放分卧式和立式两种,按对象
7、的分组是单层次和两层次分单式和复式两种。,例10-4 图10-1显示某地某年主要死因死亡率资料,不同死因是相互独立的不连续指标,因此用直条图。该图只按死因分类,为单式立式直条图。,图10-1 某年某地主要死因的死亡率(/10万),直条图的纵轴尺度起点必须为零示意图,2圆图和百分比条图,圆图(pie chart)是以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。百分比条图(percent bar chart)是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。圆图和百分比条图适合描述分类变量的构成比资料。,例10-5 某年某地进行婴儿死亡原因的调查
8、,根据城市婴儿死因的构成资料绘制成图10-2。从图10-2可见出生窒息是婴儿死亡的首位死因,出生窒息、早产和肺炎头三位死因占总死亡的60.3%,是婴儿死亡防治的重点。,图10-2 某年某地城市婴儿死因构成比,例10-6 图10-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,鼻咽癌和肝癌构成减少,肺癌明显增加。,百分比条图特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。,图10-3 20世纪70年代和80年代某地7常见恶性肿瘤发病构成比较,3线图
9、(line graph),线图是用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变量变化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。普通线图:横轴和纵轴都是算术尺度。半对数线图:横轴是算术尺度,纵轴是对数尺度,特别适宜作不同指标变化速度的比较。,例10-7 图10-4是根据19902000年某沿海城市甲状腺功能亢进(甲亢)发病率资料绘制的普通线图。图10-4可看出在1995年开始食盐加碘后,甲亢发病率有一突增高峰,1999年以后又逐渐下降的趋势。,图10-4 19902000年某沿海城市甲状腺功能亢进发病率变化趋势,例10-8 调查某地1997年2001年两种与性传
10、播有关疾病艾滋病和梅毒的发病率变化趋势,资料分别绘制成普通线图和半对数线图。普通线图显示梅毒的增长幅度较大,但半对数线图则显示艾滋病的增长速度更快。,图10-5 19972001年某地艾滋病和梅毒发病率的变化趋势(a)纵轴为算术尺度;(b)纵轴为对数尺度。,注意:,普通线图的纵轴一般以0点作起点,否则需作特殊标记或说明,以防给读者错误印象。标记直线的连接点时要注意,如测定值是在某时间段或数值段的,应标记在段的中点;如测定值是在某时点或确定值的,标记在相应时点或数值上。,4直方图(histogram),以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适合表示数值变量的频数分布。直方图
11、的横轴尺度是数值变量值,纵轴是频数。注意如各组的组距不等时,要折合成等距后再绘图,即将频数除以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。另一种表示数值变量资料频数分布的方式是将各组段观察频数除以总观察频数得到各组段的频率,以各组段频率除以组距得到的频率密度作为直方图高度,绘制的直方图称为频率直方图,它以各直方面积表示各组频率,其面积的总和为1。,例10-9 1997年某地共报告乙型病毒性脑炎104例,其年龄分布如表10-6。,图10-6 1997年某地乙型病毒性脑膜炎病例的年龄分布,5统计地图(statistical map),统计地图是用不同的颜色和花纹表示统计量的值在地理分布
12、上的变化,适宜描述研究指标的地理分布。,例10-10 2003年广东省发生了某急性传染病的流行,图10-7描述了该急性传染病发病数在广东省的分布情况。,图10-7 2003年广东省某急性传染病发病数的地理分布 图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区,6其他特殊分析图 在探索性数据分析中,一些特殊的统计图对于发现数据分布特征有着重要的意义。这里介绍常用的箱式图、茎叶图和误差条图。,箱式图(box plot),使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别
13、是除异常值外的最小值和最大值。另外标记可能的异常值。,显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。,例10-11 某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图10-8。图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。,图10-8 某地不同类型化妆品厂车间粉尘数分布箱式图,茎叶图(stem-leaf plot)将数据分离成两部分:整数部分和尾数部分,整数部分形成图的茎,尾数部分形成图的叶。茎叶图的排列方式与频数表有些相似,每行由一个整数的茎和若干叶构成。左边是茎的数值,茎宽一般标在图的下方。右边是叶,图显示每个叶的尾数数值,同样在图的下
14、方标示每个叶代表几个实际观察值。茎叶图可以非常直观地显示数据的分布范围和形态,近年非常流行。,例10-12 利用第二章例2-1的数据绘制茎叶图,结果为图10-9。图中茎的宽度为1,即观察值的整数位。每个叶代表1个观察值,显示的尾数即观察值的第一位小数。从图可以看出血清总胆固醇的分布范围从2.3到5.7,基本近似正态分布。而且可以查看每个观察值的取值情况。,误差条图(error bar chart),例10-13 利用第四章例4-2的数据绘制误差条图,结果显示为图10-10。从图示可见安慰剂组的低密度脂蛋白平均值高于所有不同剂量的新药组,而大剂量新药组的低密度脂蛋白平均值低于低剂量组和中剂量组,差异有统计学意义。,练习题P231一、最佳选择题全做三、计算分析题 第1题,谢谢大家!,