《定量资料统计描述和正态分布.ppt》由会员分享,可在线阅读,更多相关《定量资料统计描述和正态分布.ppt(41页珍藏版)》请在三一办公上搜索。
1、第二讲 定量资料统计描述、正态分布,(第二章),第一节 频数分布,一、频数分布表频数表:将分组标志和相应的频数列表,即为频数分布表,简称频数表。,认识频数表,下限(lower limit):每个组段的起点称为该组的下限。上限(upper limit):每个组段的终点称为该组的上限。,频数分布图 直方图:适合描述连续型资料的频数分布。,三、频数分布表和频数分布图用途1.描述频数分布类型:对称分布:集中位置在中间。左右两侧频数基本对称。偏态分布:右偏态分布和左偏态分布2.描述频数分布的特征:集中趋势和离散趋势3.便于发现资料中的特大或特小的离群值4.便于进一步的分析和处理,第二节 集中趋势描述,集
2、中趋势(平均水平)大多数观察值所在的中心位置。常用的有算术平均数、几何均数、中位数,一、算术均数算术均数简称均数(mean),描述一组同质资料的平均水平。总体均数:样本均数:,2.频数表法:适用于样本量较大的计量资料。,计算方法1.直接计算法:适用于样本量较小的计量资料。,均数的应用:均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。极端值(outlier),二、几何均数(geometric mean)计算方法 1.直接法:适用于样本量较小的计量资料。或,2.加权法:适用于样本量较大的计量资料,如频数表资料。,几何均数的应用注意事项 1)常用于等比资料或对数正态分布资料,如血
3、清抗体滴度、细菌计数等。2)观察值中若有0或负值,则不宜直接使用几何均数。3)观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。,三、中位数与百分位数1.中位数(median):是将一组观察值按大小顺序排列后,位次居中的观察值。当 为奇数时 当 为偶数时,2.百分位数(percentage):是指将观察值从小到大排列后处于第x百分位置上的数值,是位置指标。,2.百分位数(percentage):是指将观察值从小到大排列后处于第x百分位置上的数值,是位置指标。,中位数应用:1.中位数可用于各种分布的资料。2.中位数不受极端值的影响,因此,实际工作中主要用于:
4、(1)偏态分布或不明确分布资料(2)端点无确切值的资料(3)有特大或特小值的资料,第三节 离散趋势的描述,是指计量资料的所有观察值与中心位置的偏离程度。主要有极差、四分位间距、方差、标准差、变异系数,公式:R=Mix-Min 性质:R大(小)变异度大(小),一、极差(全距)(range),应用:适用于任何分布的计量资料(端点无确切值者除外)优点:简单明了,应用广泛,如用于说明传染病、食物中毒等的最短、最长潜伏期等。,二、四分位数间距(quartile range)记为Q,Q=Q3-Q1 Q 越大,说明数据的变异越大应用:适用于任何分布的计量资料,计 算结果较稳定,尤其适用于大样本偏态分布资料。
5、,三、方差与标准差方差(variance):也称为均方差(1)总体方差:(2)样本方差:方差越大说明数据的变异越大,标准差(standard deviation)方差是用取平方后的单位来表示的,如果原始数据用毫米汞柱表示,则方差就是毫米汞柱的平方。在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度。,计算公式(1)总体标准差:(2)样本标准差:直接法:或,应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。,变异系数(coefficient of variation,简记为CV),又称为离散系数(coeff
6、icient of dispersion)计算方法:,四、变异系数,应用:a.比较度量衡单位不同的多组资料的变异程度。b.比较均数相差悬殊的多组 资料 的变异程度(如舒张压和收缩压;儿童身高与成人身高)。,第四节 正态分布,某地正常成年男子红细胞数的分布情况,正态分布 简记为N(,2),1.正态分布的概率密度函数:,2正态分布特点正态分布密度函数曲线在横轴上方,以均数为中心左右对称,两端靠近X轴,但不与之相交。正态分布曲线在横轴上方均数处最高。正态分布有两个参数,即位置参数和变异参数。,当固定后,增大,曲线沿横轴向右移动。减小,曲线沿横轴向左移动。当固定后,越大,曲线的形状越“矮胖”,表示数据
7、分布越分散;越小,曲线的形状越“瘦高”,表示数据分布越集中。,曲线下面积的分布规律 在(-,+)内的面积约为68.27%;在(-1.96,+1.96)内约为95.00%;在(-2.58,+2.58)内约为99.00%.,标准正态分布 简记为N(0,1),总体均数为0、标准差为1的正态分布。1.标准正态分布的概率密度函数:,标准正态分布曲线下面积(1)(和已知)(2)(和未知)以0为中心,左右两侧曲线下对称于0的区间面积相等。,第五节 医学参考值范围 医学参考值(reference value)也称正常值,指绝大多数正常人的人体形态、功能和代谢产物等各种生理、生化、免疫等各种指标常数。由于存在个体差异,常用正常值的波动范围来判定正常和异常。,1.正态分布法应用:正态分布或近似正态分布或经变量变换服从正态分布。,表2.5 参考值范围所对应的正态分布区间,2.百分位数法应用:适用于任何分布,特别是偏态分布的资料。,表2.5 参考值范围所对应的百分位数,