《数值变量的统计推断课件.ppt》由会员分享,可在线阅读,更多相关《数值变量的统计推断课件.ppt(86页珍藏版)》请在三一办公上搜索。
1、第十五章 数值变量的统计推断,2023年3月21日星期二,2,回顾上一章内容:,集中趋势指标:算术均数、中位数、几何均数离散趋势指标:全距、四分位数间距、方差、标准差、变异系数正态分布:概念、特征、面积规律、应用医学参考值估计:步骤、估计方法,计量资料的统计描述:,2023年3月21日星期二,3,均数的抽样误差与标准误总体均数的估计假设检验的基本原理与步骤t检验与u检验方差分析两类错误假设及假设检验的注意事项,本次讲授内容,2023年3月21日星期二,4,统计推断(Statistical inference):用样本信息推论总体特征的过程。即采用样本统计量 对相应总体参数 所做的非确定性的推估
2、。主要包括:参数估计 假设检验,第一节 均数的抽样误差与标准误,2023年3月21日星期二,5,第一节 均数的抽样误差与标准误,参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。方法:均数的参数估计、均数u检验、均数t检验,1,2,100,n=30 x1=156.7,n=30 x2=158.1,n=30 x100=156.6,13岁女学生身高,第一节 均数的抽样误差与标准误,从正态总体N(155.4,5.32)抽样得到100个样本均数的频数分布,100个样本平均数的频数分
3、布图(直方图),理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为,样本均数的标准差为。,抽样分布,抽样分布示意图,一.抽样误差:由于抽样而引起的样本均数与总体均数之间、样本均数与样本均数之间的差异称为抽样误差。特点:不可避免!可以计算或估计其大小。,2023年3月21日星期二,11,通过增加样本含量n来降低抽样误差。,某一个样本的标准差,该样本的个体例数,二.标准误(standard error,SE)及其计算即样本均数的标准差,可用于衡量抽样误差的大小。,因通常未知,用S来估计。计算标准误采用下式:,第一节 均数
4、的抽样误差与标准误,2023年3月21日星期二,4个抽样实验结果比较,2023年3月21日星期二,13,标准误的特点:当样本例数n一定时,标准误与标准差呈正比;当标准差一定时,标准误与样本含量n的平方根呈反比。意义:反映样本均数间离散程度。反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。,第一节 均数的抽样误差与标准误,2023年3月21日星期二,14,例15-1:某地150名3岁女孩平均身高为92.8CM,标准差为4.6CM,求其标准误。,未知S 代替,第一节 均数的抽样误差与标准误,2023年3月21日星期二,15,三.标准误的应用反映样本均数的可靠性,衡
5、量抽样误差大小估计总体均数的可信区间用于假设检验,第一节 均数的抽样误差与标准误,2023年3月21日星期二,16,区别:标准误 标准差定义反映抽样误差 反映个体变异公式用途总体均数可信区间 医学参考值范围进行统计学检验 计算标准误、CV联系:当n一定时标准差大,标准误也大,补充内容:标准误与标准差的区别与联系,第一节 均数的抽样误差与标准误,2023年3月21日星期二,17,第二节 总体均数的估计,随机变量xN(,2),标准正态分布 N(0,12),抽 样,样本均数 N(,2/n),标准正态分布 N(0,12),未知 S 代替,u变换,Student t分布自由度:n-1,t 变换,2023
6、年3月21日星期二,18,标准误,t值,总体为N的m个样本(样本大小为n)的 t 值,t 分布,图15-1 自由度分别为1、5、的t分布,标准正态分布,2023年3月21日星期二,20,t 分布的图形与特征以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t 值越分散,t分布曲线的峰部越矮而尾部翘得越高;说明尾部面积(概率P)就越大;与u分布曲线相比,t 分布低平;自由度逐渐增大时,t 分布逐渐逼近u 分布(标准正态分布);当趋于时,逼近,t 分布即为u分布。,t 分布,2023年3月21日星期二,21,附表 t 界值表(228页),2023年3
7、月21日星期二,23,如左图所示,图中的阴影部分表示 以外尾部面积占总面积的百分数,即概率。如查表单侧,表示从正态总体作样本例数n为11的随机抽样,其t值服从=n-1=11-1=10的t分布。,1.812,理论上:v=10,单=0.05,则有:一般表示:,t 分布,2023年3月21日星期二,24,如图所示:相同自由度下,双侧P值为单侧P值得两倍。t界值表中,,2.228,-2.228,t 分布,2023年3月21日星期二,25,参数估计:用样本均数估计总体均数。,参数的估计,点值估计:由样本统计量 直接估计总体参数,区间估计:获得一个可信区间(confidence interval,CI)由
8、样本数据估计得到的、100(1)可能包含未知总体参数的一个范围值。,第二节 总体均数的估计,2023年3月21日星期二,26,1、点(值)估计:用相应样本统计量直接作为总体参数的估计值。即用 估计 其方法虽简单,但未考虑抽样误差的大小,一、可信区间的概念,2023年3月21日星期二,27,2、区间估计概念:按照预先给定的概率(可信度)估计的未知总体参数的范围。可信区间(confidence interval,CI)是根据一定的可信度估计得到的区间。,一、可信区间的概念,2023年3月21日星期二,28,总体均数的可信区间(1)已知,按 u 分布,95%和99%可信区间:(2)未知,且n 较小,
9、按t分布(3)未知但n足够大,按 u 分布,二、总体均数可信区的计算,2023年3月21日星期二,29,二、总体均数可信区的计算,例15-2 随机抽取某地10名男孩出生体重,测得其平均体重为3.21kg,标准差S为0.47kg,试估计该地男孩出生体重的总体均数的95%置信区间。,2023年3月21日星期二,30,2023年3月21日星期二,31,95%的可信区间表示:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间不包括总体均数。对于一次估计的可信区间,可能有95%的正确率,但仍有5%的可信区间估计错误。,三、可信区间的涵义,模拟抽样成年男子红细胞数
10、100次的95%可信区间示意图,*,*,*,*,*,*,2023年3月21日星期二,33,四、总体均数可信区间与参考值范围的区别,第三节 假设检验的基本原理与步骤,一、假设检验(Hypothesis Testing)的基本原理,例15.4:根据大量调查,已知一般健康成年男子的脉博均数为72次/min,某医生在某山区随机调查100名健康男子,得其脉搏均数为76.2次/min,标准差为4.0次/min。能否认为该山区的健康成年男子脉搏均数高于一般成年男子脉搏均数?,2023年3月21日星期二,35,n=100,已知总体一般成年男性脉搏,未知总体山区成年男子脉搏,?,2023年3月21日星期二,36
11、,差异的原因:(1)由于抽样误差造成的.(实际上=0,但由于抽样误差 不能很好代表0)(2)可能由于地区等环境因素的影响,样本所代表的总体与已知总体确实不同:0,下面我们用一例说明这个原则:两个盒子,各装有100个球.,小概率事件在一次试验中不会发生.,将盒子密封,现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?,我们不妨先假设:这个盒子里有99个白球.,现在我们从中随机摸出一个球,发现是,此时你如何判断这个假设是否成立呢?,假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件.,小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设.,小概率反证法.,
12、小概率事件在一次试验中不会发生.,2023年3月21日星期二,41,假设检验的基本步骤,1.建立假设,确定检验水准2.选定检验统计方法,计算检验统计量3.确定P值,作出推断结论,无效假设(null hypothesis),记为H0,又称原假设,表示目前的差异是由于抽样误差引起的。备择假设(alternative hypothesis),记为H1,又称对立假设,表示目前的差异是主要由于本质上的差别引起。两个假设既有联系又互相独立,应该包括两种(也是所有)可能的判断。要做出抉择。,1、建立检验假设,确定检验水准,1、建立检验假设,确定检验水准,2023年3月21日星期二,43,(1)根据专业知识
13、事先不知道会出现什么结果 双侧 事先知道只能出现某种结果 单侧 如:难产儿的出生体重与一般婴儿出生体重大-单侧 一般预实验有探索性质,对结果的考虑思路应宽些,多双侧(2)问题的提法 如:可否据此认为该山区成年男子的脉搏数高于一般成年男子的脉搏均数?*通常用双侧(除非有充足的理由选用单侧之外,一般选用保守的双侧较稳妥),单、双侧检验的选择:,2023年3月21日星期二,44,检验水准(size of a test)亦称显著性水准(significance level),用表示,在实际工作中常取0.05。意义:假设检验时,根据研究的目的或要求预先规定的概率值,是判定小概率事件发生的标准(H0)或阈
14、值;亦是允许结果出现第一类错误的概率。取值并非一成不变,可根据研究目的给予不同设置。,1.建立假设,确定检验水准,2023年3月21日星期二,45,注意:H0,H1和的确定,以及单双侧检验的选择,都应结合研究设计,在未获得样本结果之前决定,而不要受样本结果的影响。假设检验是针对总体而不是针对样本。,1.建立假设,确定检验水准,2023年3月21日星期二,46,要根据研究设计的类型和统计推断的目的选用不同的检验方法,如:两样本均数的比较用t检验,两样本率的比较用卡方检验 所有检验统计量都是在H0成立的前提条件下计算的。,2、选定检验方法,计算检验统计量,2023年3月21日星期二,47,P值是指
15、在H0所规定的总体作随机抽样,获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。例如 求得t=10.5,v=99,=0.05,P是在=0的前 提条件下随机抽样,得到 t-10.5和t10.5的概率,-10.5,10.5,P,P,3、确定P值,作出推断结论,2023年3月21日星期二,48,假 设 检 验,2023年3月21日星期二,49,如何下结论?P0.05,按=0.05检验水准,不拒绝H0,差异无统计学意义(差异无显著性),尚不能认为不同或不等。P0.05,按=0.05检验水准,拒绝H0,接受H1,差异有统计学意义(差异有显著性),可以认为不同或不等。推断结论=统计结论+专业
16、结论。统计结论只说明有无统计学意义(statistical significance),而不能说明专业上的差异大小。它必须同专业结论有机结合,才能得出恰如其分、符合客观实际的最终结论。,3、确定P值,作出推断结论,2023年3月21日星期二,50,注意:不拒绝H0不等于接受H0,因为此时证据不足。可暂时“接受”它,或“阴性待诊”。推断结论时,对H0只能说:拒绝或不拒绝;对H1只能说:接受H1。正确理解结论的概率性(都隐含着犯错误的可能性)。,3、确定P值,作出推断结论,2023年3月21日星期二,51,第四节 t 检验与u检验,样本均数与总体均数比较(单样本u检验、t 检验)配对设计的差值均数
17、与总体均数0的比较(配对样本t 检验)完全随机设计的两个样本均数的比较(两样本u检验、t 检验),2023年3月21日星期二,52,第四节 t 检验与u检验,t 检验应用条件:总体标准差未知且n较小时(n100),2023年3月21日星期二,53,即样本均数代表的未知总体均数和已知总体均数0的比较 已知的总体均数:一般为理论值、标准值或经过大量观察所得的稳定值,一、样本均数与总体均数的比较,2023年3月21日星期二,54,计算检验统计量u值或t值,一、样本均数与总体均数的比较,2023年3月21日星期二,55,例15-5:某市某年抽查了150名2岁男孩的体重,得平均体重为11.18kg,标准
18、差为1.23kg.而同期全国九城市大量调查得同龄男孩的平均体重为11kg.问该市2岁男孩的平均体重与全国的同期水平有无差别?,一、样本均数与总体均数的比较,解题思路:0 11kg一个已知总体,一个大样本 单样本u检验根据题目问题和专业知识双侧检验,2023年3月21日星期二,56,(1)建立假设、确定检验水准,H0:=0H1:0=0.05,一、样本均数与总体均数的比较,2023年3月21日星期二,57,(2)选定检验方法,计算检验统计量,已知,一、样本均数与总体均数的比较,(3)确定P值和做出推断结论 本例u=1.792,查u界值表,u0.05/2=1.96.u=1.7920.05 故在=0.
19、05的水准,不拒绝H0,差别没有统计学意义。专业的结论:尚不能认为该市2岁男孩的平均体重与全国的同期水平不同。,例15.6 15例长期服用某种避孕药的妇女,其血清胆固醇含量的均数为6.5mmol/L,标准差为0.7mmol/L,一般健康妇女血清胆固醇含量的均数为4.4mmol/L,问长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇女有无差别?,2023年3月21日星期二,60,(1)建立假设、确定检验水准,H0:=0H1:0=0.05,一、样本均数与总体均数的比较,2023年3月21日星期二,61,(2)选定检验方法,计算检验统计量,已知,一、样本均数与总体均数的比较,2023年3月
20、21日星期二,62,(3)确定P值,作出推断结论查t界值表 t0.05/2,14=2.145,P,t,0.05,2.145,P,11.667,P0.05,按=0.05检验水准,拒绝H0,接受H1;可认为长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇女的差别有统计学意义,服用该种避孕药的妇女其血清胆固醇含量的均数高于一般健康妇女.,一、样本均数与总体均数的比较,2023年3月21日星期二,63,假阴性,假阳性,第六节 I类错误和II类错误,2023年3月21日星期二,64,类错误与类错误的关系(以单侧检验为例),不拒绝H0,假设检验的结果 拒绝H0,2023年3月21日星期二,65,
21、I类错误和II类错误 类错误-拒绝了成立的无效假设H0所犯的错误称为类错误(“弃真”)。其概率大小用表示。常称之为检验水准 类错误-接受了不成立的无效假设H0所犯的错误称为类错误(“存伪”),其概率大小用表示。,2023年3月21日星期二,66,是预先规定允许犯I型错误概率的最大值,由研究者确定,可取单尾亦可取双尾。II类错误的概率大小用 表示,值需要估算。1 称检验效能(power of a test),过去称把握度。意义是当两总体确有差别,按检验水准所能检出其差异的能力。通常要求达到0.8以上。样本含量固定前提下,愈小,愈大;愈大,愈小。若要同时减小和,唯一方法是增加样本含量n。,I类错误
22、和II类错误,2023年3月21日星期二,67,若重点减少(如一般假设检验),一般取=0.05;若重点减少(如方差齐性检验,正态性检验等),一般取=0.10或0.20甚至更高。拒绝H0,只可能犯I类错误,不可能犯II类错误;“接受”H0,只可能犯II类错误,不可能犯I类错误。,I类错误和II类错误,2023年3月21日星期二,68,二、配对设计的差值均数与总体均数0的比较,常见的配对设计主要有以下情形:异体配对:将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。(目的是比较不同方法之间的差异)自身配对:同一受试对象处理前后或不同部位测定值的比较。(目的是判断此处理有无作用)
23、自身配对:同一受试对象(或样品)分别接受两种不同方法的处理。(目的是比较不同方法之间的差异),例15.7 按性别相同、年龄相近、病情相近把16例某病患者配成8对,每对分别给予A药和B药治疗,现测得治疗后的血沉(mm/h)结果如下,问:不同药物治疗后病人血沉水平是否有差异?表15-3 不同药物治疗后某病患者的血沉值(mm/h),二、配对设计的差值均数与总体均数0的比较,2023年3月21日星期二,70,自身配对举例:表1 克矽平治疗前后血清粘蛋白(mg/L),2023年3月21日星期二,71,表2 A、B两法乳腺癌检出率比较,自身配对举例,2023年3月21日星期二,72,配对t检验的基本原理:
24、假设两种处理的效应相同,即1=2,则1-2=0,即可看成是差值的样本均数所代表的未知总体均数d 与已知总体均数0=0的比较,此时,我们可套用前述t检验的公式。,二、配对设计的差值均数与总体均数0的比较,2023年3月21日星期二,73,H0:d=0 H1:d 0=0.05,(1)建立假设、确定检验水准,(2)选定检验方法,计算检验统计量,二、配对样本t检验,2023年3月21日星期二,74,确定P值,做出推断结论 自由度n-18-17,查表2,t界值表,t0.05/2,72.365,t0.01/2,73.499。今t=4.582t0.01/2,7,故P0.01,故按0.05水准,拒绝H0,接受
25、H1,差异有统计学意义;可以认为不同药物治疗后病人血沉水平不同。,二、配对样本t检验,2023年3月21日星期二,75,三、完全随机设计的两个样本均数的比较,或将受试对象随机分到两个处理组;比较两种处理是否有差别;从2个总体中随机抽取两个样本;比较某一指标在不同特征人群中是否相等;目的是推断2个总体均数是否相等;比较的两个样本含量相等时抽样误差最小,适用条件:1、正态性 2、方差齐性,(一)U检验,当两样本含量均较大,如均大于100,例15-8 某医师为研究血清胆固醇水平与职业的关系,得调查资料如表15-4,问两种职业的血清胆固醇水平是否不同?表15-4 两种职业的血清胆固醇水平,2023年3
26、月21日星期二,78,建立假设,确定检验水准 H0:12,H1:12,0.05,(一)U检验,选择检验方法,计算检验统计量,2023年3月21日星期二,80,确定P值,判断结果 查U界值表,u0.01/22.58,今2.58 4.448,故P0.01,故按0.05水准,拒绝H0,接受H1,可认为教师的血清胆固醇水平高于工人。,2023年3月21日星期二,81,三、两样本t检验,例15.9 某医师分别抽取原发性高血压病人25例和脑卒中病人27例,测定其尿酸的含量,结果见表15-5.问原发性高血压病人和脑卒中病人的尿酸含量有无差别?表15-5 原发性高血压病人与脑卒中病人的尿酸含量(mmol/L),2023年3月21日星期二,83,建立假设,确定检验水准 H0:12,H1:12,0.05 选择检验方法,计算检验统计量t值,三、两样本t检验,2023年3月21日星期二,84,三、两样本t检验,2023年3月21日星期二,85,确定P值,做出推断结论 v=(n1-1)+(n2-1)=50,查t界值表,t0.05/2,502.009,今t=0.973 t0.05/2,50,故P0.05,故按0.05水准,不拒绝H0,尚不能认为原发性高血压病人和脑卒中病人的尿酸含量不同。,三、两样本t检验,SPSS软件,谢谢,