《雷静卫生统计学第二章定量资料的统计描述一.ppt》由会员分享,可在线阅读,更多相关《雷静卫生统计学第二章定量资料的统计描述一.ppt(23页珍藏版)》请在三一办公上搜索。
1、2023/5/17,西安医学院公共卫生系,定量资料的统计描述 之一 频率分布表与频率分布图 集中趋势的描述,怪鸣型颇庭揭质猫槐懦澜疫君门准拴狙脚鹿择靛越拆毯肿促戍柱填穷庄渴雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,频率分布表:即对各变量值出现的频率列表。用来描述定量资料的频数分布,反映观察值的分布类型及分布特征。频率分布图,痉短穿龋亨册空茄捍狼珐辽婆塑栓尹酵疹斯扼吱烬庸漂功齐忘构袖渝例讲雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生
2、系,离散型定量变量的频率分布,频率表的编制:直接清点各变量值及相同变量值出现的频率列表即可。如:例2-1,即可列成表2-1的形式 其频率分布图如图2-1的形式,勇议勿苗称秧凛奶破拍庞艺率痪磅集御女颇聋叁鞘乔渗拍抓担焕媒季票统雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,频数表 表1.某地140名正常男子红细胞数的频数表,红细胞数(1012/L)划记 组中值 频数 频率(%),3.80 3.90 2 1.4 4.00 4.10 6 4.3 4.20 4.30 11 7.9.5.806.00 5.90 1 0.7,连
3、续型定量变量的频率分布,洱射私腹唆造肃嗅胸旺营设付鞭洗掇阂掣糊痔拙饲闻客俊贴俗厂掘乃褐挛雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,频率分布表的编制:找最大值、最小值,求极差 按极差大小决定组段数、组段、组距 一般设10-15个组段 常用极差的1/10取整作组距 要求:第一组段包括最小值 最后一个组段包括最大值 每个组段的起点称下限(low limit)终点称上限(upper limit)对于连续性资料,各组段从下限开始,不包括本组段上限。最末一个组段应同时写出其下限和上限。列表划记,求频数(f),惩寇昏砍昨奎
4、剑勋高翔胖竣氯征遮兔荧触婉睬糕赃解李底台掺逞陈厄刑好雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,例:某地40例中年健康男子血清总胆固醇值(mmol/L)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5
5、.48 1)编制频率分布表并绘制分布图 2)估计其频率分布的类型 3)计算均数、标准差S、变异系数CV 4)计算中位数M,并与 比较。,持顺奶渍侍焚灾搀剧年蚁床共果目抵瓢激姨热踏憋门倾橡各恼嘿滦掷涪擦雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,表2 某地40例健康成年男子血清胆固醇值的频数表,组段 划记 频数2.70 13.20 43.70 44.20 104.70 95.20 65.70 36.20 26.70 07.207.70 1,合计 40,谈暖钦理苫终来组颜宏玫粥愧悠孟非业艘逊禹酋计仍十逾摄会淄或椭盛
6、疆雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,频率分布表(图)的用途:作为陈述资料的形式,反映资料的分布类型;对称分布 偏态分布 正偏态 负偏态描述分布的两个特征:集中趋势、离散趋势便于发现可疑值,及时查正;便于以后的计算指标及统计分析;当样本含量较大时,可用频率作为概率的估计值。直方图:P14图2-2,图2-3,更直观的反映频数分布的类型。,罚驳噪玖桥祁叔岁矮下虞虎柏峙坛擎劣眉瘸粤改冕焦衣誓毅缩糜挺缚悬膳雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,
7、西安医学院公共卫生系,集中趋势的描述,平均数(average)是描述一组观察值的集中位置或平均水平的统计指标常作为一组数据的代表值用于分析和组间比较常用的有:算术均数、几何均数、中位数,串懊样皱邮耘芽卿醇真讣盆葱郸报凤吨硷稳谢循氛害捂陇摸原阻裙豪硝穗雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,1.算术均数(arithmetic mean)简称均数 总体均数用表示 样本均数用 表示 反映一组观察值在数量上的平均水平,项楷浩鹅甘敌囤绥哇涂襟灿缠普渍母酮有隅垂甫母吸凯舅谴咕馋勿簿奄汹雷静卫生统计学第二章 定量资料的统
8、计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,(1)计算方法 直接法:式中,希腊字母(读作sigma)表示求和;X1,X2,Xn为各观察值;n为样本含量,即观察值的个数。,贼桅滩引奶垂快熄派酚捉灼饼亭岁磊刽津咐啦琴岁鸽披颤稳篮荣恿版吗绘雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,频率表法:频率表资料或相同观察值较多时 式中,X0与f分别为频数表资料中各组段的组中值和相应组段的频数(或相同观察值与其对应的频数)。,架辨氦磅旦诧潞损怯哆炊病糟橇没搞轴鸟攫凌呀先氖挡鞋袜
9、亚供皮言拎鲤雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,(2)均数的两个重要特性 各离均差的总和等于零 离均差的平方和小于各观察值X与任何数a(而a均数)之差的平方和 即均数是一组观察值最理想的代表值(3)均数的应用:最适用于对称分布,特别是正态分布资料 不适于偏态分布资料,残拔闽拥剥峙傻阜灵咒剥伏诲最监玩贱豌膝茂吃郎级粥撮会迂胎讥告铡粤雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,2.几何均数(geometric mean)G
10、用于等比(或明显偏态)资料集中趋势的描述,反映其平均增减倍数。,憾赤醚屡混忍氰圣谓陀喀忆灌垮焰供师定祷汾减困止略刊踪郝殖久领村庞雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,(1)计算方法直接法 或 频率表法:相同观察值的个数较多时,且杏亲晕喘雇孰吸葛结呜鸭袋剃雅米抉檬瞒朱合默滴抛韧呛狂淆搜鳞迎慑雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,(2)应用于:等比资料如抗体的平均滴度、平均发展速度人口的几何增长(增长速度);或用于对数正
11、态分布资料。*注意 观察值不能有零 观察值不能同时有正值和负值 同一组资料几何均数小于均数,赊措唤募釉梁层囤垃堵洗废承网美袁异峦捐唤旨匡佬轧卷风只帐论屉曝性雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,3.中位数 中位数(median,M)是将一组观察值从小 到大排列,位次居中的观察值。百分位数(percentile),位置指标,Px,将 总体或样本的全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。P50分位数即是中位数,酣富拌这棉渊袋忙颓恰遣栅切秆段螟疗徊盐蹄畴墓辊誊未悄坚阀
12、恫搜派毗雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,(1)计算方法*1)直接由原始数据计算中位数 先按大小排序 n为奇数时 n为偶数时,式中下标、为有序数列的位次。、为相应位次的观察值。,染篮贯惯疡佬忻匙晴凄当吨窑扮毕兔蔑斧齿梧埔垣尤醛怒讽碍浪娥坎市攘雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,2)用频数表计算M和Px步骤:按所分组段,由小到大计算 累计频数和累计频率;按下式求M、Px 式中fx 为Px 所在组段频数 i 为该组
13、段的组距 L为其下限 fL为小于L各组段的累计频数,搐剥饵铭遵蹿亥怂励各基铰黎崭棺哀哉梆累兆筛熏办帆爹五尖脖宿破胺糖雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,(2)中位数和百分位数的应用:1)中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值的水平。只受居中变量值波动的影响。对末端无确定数据的分布,不能直接求均数和几何均数时,可求中位数。在对称分布资料中,中位数与均数在理论上数值是相同的。2)百分位数用于描述样本或总体观察值序列在某百分位位置的水平。最常用的是P50、P5、P95等,婴题瘪膘棕互炊桔
14、骑唇泻未娘剁灿魄湃哈次臣喳袜馈菜贱巡灯芹合反思吞雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,3)百分位数常用于确定医学参考值范围(正常值范围),习惯上是确定只包括95%(或90%、99%等)的人的界值。双侧参考值范围 P2.5P97.5(如血压、心率)单侧参考值范围 P95或P5(如尿铅/汞、血铅)可用于任何分布的资料,特别是非特定分布的资料如非正态分布资料。4)一般,分布中部的百分位数相对稳定,代表性好,而两端的只在n足够大时才较稳定,当样本例数n不够多时,不宜取太近两端的百分位数。,豺尼傲末雾鲤农闲吴联堂寒
15、掩挖或琴负仍哪曼伶量扮嘲提窿逸毋嚷遗撒象雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,众数(mode):指总体中出现机会最高的数值。样本众数指在样本中出现次数最多的数值。多用于离散型定量资料的描述。,赤韵绰映肿握秩抓下宪院彬蚀屎铂朗耗觉茂斜秒舱哄咖焦拇开豁搔氧僳瘩雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,2023/5/17,西安医学院公共卫生系,小结,计量资料集中趋势的描述常用 均数、几何均数、中位数均数适用于对称分布的资料几何均数适用于等比资料或对数正态分布资料中位数可用于任何分布的资料,但原则上,适合用均数或几何均数的资料,不采用中位数来描述其集中趋势。,鸽珊梅酌顾墅赠胆耪在临椭孽织摩疽照创挫颂衰吻蛛限戈姚妆邻拨呜火也雷静卫生统计学第二章 定量资料的统计描述一雷静卫生统计学第二章 定量资料的统计描述一,