《医学统计学第3讲正态分布.ppt》由会员分享,可在线阅读,更多相关《医学统计学第3讲正态分布.ppt(33页珍藏版)》请在三一办公上搜索。
1、对称分布 非对称分布 倍数变化 集中趋势 均数 中位数 几何均数 离散趋势 标准差 四分位数间距 对数标准差 变异系数,定量资料的描述,分布特点,单峰,钟形以均数为中心,两侧对称尾端不与横轴相交均数位置,标准差形状曲线下面积分布有特殊规律,正态分布,第三章 正态分布,又称为高斯分布,是以均数为中心,呈对称的钟形分布,是最常见、最重要的一种连续型分布。,随机变量的概率分布,随机变量的概念:即变量,按一定的概率可以在一个特定数据集中取值的变量,通常指医学研究中研究对象具有的某种特征。概率分布是指确定一个随机变量取给定值或属于一给定集合的概率的函数。统计学上,分布函数F(X)即总体中个体值小于或等于
2、X的观察值的比例。密度函数f(X)离散型随机变量:f(x)=P(X)连续性变量:,1.正态分布的图形,近似正态曲线,-x,2.71828,3.14159,正态分布的密度函数,即正态曲线的方程,因此,正态分布曲线是一簇曲线,标准正态分布,-u+,均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。,对于任意一个服从正态分布N(,2)的随机变量,可作如下的标准化变换,也称u变换。,标准正态分布的密度函数:,标准正态离差,2.正态分布的特征,N(,2),N(0,1),单峰分布;高峰在均数处;以均数为中心,均数两侧完全对称。正态分布有两个参数(parameter),即位置参数(均数)和变异度
3、参数(标准差)。有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。正态曲线下的面积分布有一定的规律。,方差相等、均数不等的正态分布图示,均数相等、方差不等的正态分布图示,1,X轴与正态曲线所夹面积恒等于1。对称区域面积相等。,S(-,-X),S(+X,)S(-,-X),正态曲线下面积分布规律,S(-x1,-x2),-x1-x2+x2+x1,S(-x1,-x2)=S(+x1,+x2),对称区域面积相等,-1,1,-1.96,1.96,68.27%,95.00%,正态曲线下面积分布规律,标准正态曲线下面积分布规律,0,-1,1,-1.96,1.96,68.27%,95.00%,双侧u,双
4、侧u0.05=1.96,双侧u0.01=2.58,正态分布的应用,估计频数分布制定参考值范围质量控制统计分析方法的基础,正态分布的应用,估计频数分布,例:=1.14mmol/L,S=0.298mmol/L,试估计该地正常女子血清甘油三脂在1.10 mmol/L以下者占正常女子血清甘油三脂总人数的百分比。,计算标准离差,查表得(-0.14)=0.444344.43,即该地正常女子血清甘油三脂在1.10mmol/L以下者,估计占总人数的44.43%。,44.43,例:已知某年某市120名5岁女孩身高 S=5.86cm,现预估计该市某年身高界于104.0108.0cm范围内的5岁女孩所占比例及120
5、名5岁女孩中身高界于104.0108.0cm范围内的人数。,计算标准离差:,(u1)=(-1.05)=0.1469,(u2)=(-0.37)=0.3557,查表得:,S=(u1)-(u2)=0.3557-0.1469=0.2088=20.88%,故估计该市某年身高界于104.0108.0cm范围内的5岁女孩所占比例为20.88,在此范围内的人数为12020.8825名。,划分正异常,制定参考值范围,参考值范围又称正常值范围,医学上是指绝大多数正常人的某指标值所在的范围。,参考值范围的意义,1.从“正常人”总体中抽样:明确研究总体 2.控制检测误差 3.判断是否需要分组(如性别、年龄)确定 4.
6、根据专业知识决定单侧还是双侧 5.选择百分界值 6.确定可疑范围,制定步骤,正常人,病人,假阳性,假阴性,正常人与病人的数据分布重叠示意图(单侧),正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图(单侧),正常人,病人,假阳性率,假阴性率,病人,正常人与病人的数据分布重叠示意图(双侧),估计方法,正态分布法 对数正态分布法百分位数法,双侧100(1-)%正常值范围:单侧100(1-)%正常值范围:,双侧95%正常值范围:单侧95%正常值范围:,正态分布法,百分位数法,双侧95%正常值范围:P2.5P97.5 单侧95%正常值范围:P5(下限)适用于偏态分布资料,(4.52,6.25),正态分布与近似正态分布实例,200名正常成人血铅含量的分布,百分位数法实例,某市239名正常人发汞值的频数分布,百分位数法实例,