卫生统计学资料(精心整理).docx

上传人:李司机 文档编号:6825716 上传时间:2024-02-26 格式:DOCX 页数:65 大小:168.82KB
返回 下载 相关 举报
卫生统计学资料(精心整理).docx_第1页
第1页 / 共65页
卫生统计学资料(精心整理).docx_第2页
第2页 / 共65页
卫生统计学资料(精心整理).docx_第3页
第3页 / 共65页
卫生统计学资料(精心整理).docx_第4页
第4页 / 共65页
卫生统计学资料(精心整理).docx_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《卫生统计学资料(精心整理).docx》由会员分享,可在线阅读,更多相关《卫生统计学资料(精心整理).docx(65页珍藏版)》请在三一办公上搜索。

1、卫生统计学资料(精心整理)统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(l-),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资

2、料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。2频率分布表(图)的用途:描述资料的分布类型;描述分布的集中趋势和离散趋势;便于发现一些特大和特小的可疑值;便于进一步的统计分析和处理;当样本含量足够大时,以频率作为概率的估计值。3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图

3、一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。标准差的应用:表示变量分布的离散程度;结合均数计算变异系数、描述对称分布资料;结合样本含量计算标准误。定

4、性资料的统计描述1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。2常用相对数类型:频率型、强度型和相对比型指标。指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生频率两个有关联的指标A和B之比计算公式一壁型生题空LXk可能发生某事件的个体数某事件叁生电挣整Xk观察人日数总计A/B有无量纲无有可有、可无取值范围0zlJ可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的近似值表示相对于B的一个单位,A有多少个单位A和B可以是绝对数、相对数和平均数A和B的量纲可相

5、同也可不同A和B互不包含相对比:A、B两指标可以是绝对数、相对数或平均数。最常见的相对比是人口学中的男女性别比,流行病学中的相对危险度RR=P1PO也是相对比指标。3应用相对数应该注意:防止概念混淆,避免以比代率的错误现象;(2)计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;正确的计算频率(或强度)指标的合计值。当分组的资料需要合并起来估计频率(或强度)时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;频率型指标的解释要紧扣总体和属性;相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部

6、结构是否一致、对比不同时期资料应注意客观条件是否相同;正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验。4医学人口统计资料主要来源为日常工作记录(报告单、卡、册)、统计报表、人口调查(普查和抽样调查)。5描述人口学特征的常用指标一般有人口总数和反映人口学基本特征的某些指标。人口学的基本特征包括性别、年龄、文化、职业等,最常用来描述人口结构的是性别和年龄。人口学特征指标:老年人口系数、少儿人口系数、负担系数、老少比、性别比。6有关生育的常用指标有出生率、生育率和人口再生产指标。测量生育水平的统计指标:粗出生率、总生育率、年龄别

7、生育率、总和生育率。测量人口再生育的统计指标:自然增长率、粗再生率和净再生率。7常用的死亡统计指标有:粗死亡率、年龄别死亡率、婴儿死亡率、新生儿死亡率、围生儿死亡率、死因别死亡率、某病病死率和死因构成等。8疾病统计资料主要来源于:疾病报告和报表材料、医疗卫生工作记录、疾病专题调查资料。9标准化:两个率或多个率之间进行比较时,为消除内部构成不同的影响,采用统一的标准,对两组或多组资料进行校正(调整),计算得到标准化率后再做比较的方法,称为。其目的是统一内部构成,消除混杂因素,是资料具有可比性。应用标准化法的注意事项:1标准化法的应用范围很广。当某个分类变量在两组中分布不同时,这两个分类变量就成为

8、两组频率比较的混杂因素,标准化的目的是消除混杂因素。2标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比较的资料间的相对水平。3标准化法实质是找一个标准,使两组得意在一个共同的平台上进行比较。选择不同的标准,算出的标准化率也会不同,比较的结果也未必相同,因此报告比较结果时必须说明所选用的标准和理由两样本标准化率是样本值,存在抽样误差。比较两样本标准化率,当样本含量较小时,还应作假设检验。10常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(I)绝对增长量:是说明事物在一定时期增长的绝对值,可分为:累计增长量(报告期指标与基线期指标之差)和逐年

9、增长量(报告期指标与前一期指标之差)O(2)发展速度与增长速度:均为相对比,说明事物在一定时期的变化,可计算定基比(即报告期指标与基线期指标的比:ana)和环比(报告期指标与其前一期指标之比:an/an-1)o增长速度表示的是净增长速度,增长速度=发展速度(3)平均发展速度与平均增长速度:用于概括某现象在一段时期中的平均后变化。平均发展速度是发展速度的几何平均数,平均发展速度,平均增长速度=平均发展速度-IO0%。11统计表和统计图是描述资料特征、呈现统计分析结果的重要工具。统计表结构标题、标目、线条、数字和备注。12常用统计图用途:条图:适用于相互独立的资料(资料有明确分组、不连续);百分条

10、图、圆图适用于构成比资料;线图适用于连续性资料,表达事物的动态变化(绝对差值);半对数线图适用于连续性资料,表达事物的发展速度(相对比);直方图用于描述连续变量的频数分布;散点图适用于双变量资料,用点的排列趋势和密集度表示两变量的相关关系。常用概率分布1正态分布(连续型随机变量的概率分布)(1)正态概率密度曲线特点:关于x=对称;在x=处取得该概率密度函数的最大值,在x=u。处有拐点;曲线下面积为1;正态分布有两个参数:位置参数(决定曲线在横轴上的位置)和变异参数。(决定曲线的形状);1.64o面积为90%,L96面积为95%,2.58o面积为99%。(2)Z变换与标准正态分布:对于任意一个服

11、从正态分布N(,2)的随机变量,可作Z变:Z=O,变换后的Z值仍然服从正态分布,且其总体均数为0、总体标准差为1,称此为标准正态分布,用N(0,1)表示。(Z)为标准正态分布Z变量的累积面积,-8玲Z的面积,即下侧累计面积。(3)正态分布的应用:确定医学参考值范围:是指特定的“正常人群(排除了对所研究的指标有影响的的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在范围,习惯用该人群的95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。方法:a百分位数法:适用于任何分布类型的资料;b正态分布法。质量控制图:如果某一波动仅仅由个体差异或随机测

12、量误差所致,那么观察结果服从正态分布。控制图共有7条水平线,中心线位于总体均数四处,警戒限位于吐2。处,控制限位于3处,此外还有两条位于处。(4)确定医学参考值的步骤:从正常人总体中抽样,明确研究总体;用统一和准确的方法测定相应的指标;根据不同的用途选定适当的百分界限,常用95%;根据此指标的实际意义,决定单侧范围还是双侧范围;根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。2二项分布:(1)是一种离散型随机变量的分布类型。如果每个观察对象阳性结果的发生概率为71,阴性结果的发生概率为(l-n);而且每个观察对象的结果是相互对立的,那么,重复观察n个人,发生阳性结果的人数

13、X的概率分布为而二项分布,n!f*xCx记作B(n,)O二项分布的概率函数P(X)=nn-X,(l-)n-x,=X!(一X)!适用条件:每次实验只有两种互斥的结果;各次实验互相独立;发生成功事件的概率恒定。分布特征:二项分布的特征由二项分布的参数11以及观察的次数n决定。图形分布特征:二项分布图的高峰在=rm处或附近;=0.5时,图形对称;TlWO.5时,分布不对称,且对同一n,n离0.5愈远,对称性愈差。对于同一n,随着n的增大,分布趋于对称。当n玲8时,只要n不太靠近0或1(特别是当rm和n(l-n)均大于5时),二项分布趋于对称。二项分布的均数和标准差:若X服从二项分布B(n,冗),则X

14、的总体均数为=nn,总体方差为2=nnX(l-n),总体标准差为。(1力);若将出现阳性结果的频率记为:P=E7(17)则样本率P的总体均数为HP=TI,总体方差为。口=,总体标准差为OPn,OP是频率P的标准差,又称频率的标准误,反映阳性频率的抽样误差大小。累积概率计算:二项分布出现阳性的次数至多为k次的概率为:P(Xk)2X!(X)!叱(1一“)1=X=O出现阳性的次数至少为k次的概率为:Px(n-X)!zr1,rjnx(Xk)=x=*o3Poisson分布:是一种离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。一般记作PS),人是P

15、oiSSOn分布的唯一参数。总体均数为入=rm。前提条件:互斥、独立、恒定。x概率函数为:P(X)=e-X!,X为观察单位内稀有事件的发生次数,e=2.71828n(增加样本含量可以减少样本误差)。3标准差与标准误的区别与联系:区别:标准差S():意义:描述个体观察值变异程度的大小。标准差小,均数对一组观察值得代表性好;应用:与X结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;与n的关系:n越大,S越趋于稳定;标准误(X):意义:描述样本均数变异程度及抽样误差的大小。标准误小,用样本均数推断总体均数的可靠性大;应用于X结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验

16、;与n的关系:n越大,SX越小。S联系:都是描述变异程度的指标;由si=”可知,si与S成正比。n一定时,S越大,SX越大。t=与4t分布:当X服从均数为口的正态分布时,统计量S/V”服从自由度为v=n-l的t分布,是小样本总体均数的区间估计及假设检验的理论基础。(2)t分布的图形特征:t值得分布于自由度有关。t分布只有一个参数即V。特征:单峰分布,以O为中心,左右对称;V越小,t值越分散,曲线的峰部越矮,尾部越高;随着V逐渐增大,t分布逐渐接近标准正态分布;当V趋向8时,t分布趋近标准正态分布,故标准正态分布是t分布的特例;t分布是一簇曲线。(3)t界值表:在自由度相同时,I值越大,t分布的

17、尾部概率越小;在t临界值相同时,双侧尾部面积概率为单侧尾部面积概率的两倍。5参数估计:包括点估计和区间估计。置信区间的两个要素:准确度:反映置信度l-的大小,及区间包括总体均数的理论概率的大小,愈接近1越好;精密度:即区间的宽度,区间越窄越好,如样本含量不变,将置信度由95%提高到99%,则置信区间由窄变宽,估计的精度下降。6总体均数及总体概率的区间估计:1体均数的置信区间:t分布法和正态近似法1.t分布法:当。未知且n较小时,总体均数的双侧(l-)置信区间为Xa2fvsX;单侧(Xm,vS*,8)或(-o,X+ta,vS);11.正态近似法:当。已知时,总体均数11的双侧(l-)置信区间为X

18、Za2*oX;单侧(X-Zafvxfo)或(_8,X+ZafvX);当o未知但n足够大时(n50),t分布近似服从标准正态分布,总体均数的双侧(l-a)置信区间为:XZa2*s*,单侧(X-Za*SX,)或(心,+ZafvSX)总体概率的置信区间:对于二项分布的样本资料,可根据样本含量n和样本频率P的大小,选用查表法(n50,特别是P很接近0或100%时)或正态近似法估计总体概率n的(La)置信区间。正态近似法:当n足够大,且np及n(l-p)均大于5时,p的抽样分布近似正态分布,总体概率n的双侧(I-CI)置信区间等于PZ2sp7医学参考值范围与总体均数的置信区间的区别:参考值范围意义:绝大

19、多数人某项指标的数值范围;计算:正态分布双侧XZa/2*s;单侧(X-ZaS,8)或(-,+ZS)偏峰分布PX-P100-X;单侧(PX,8)或(-oo,PiOO-X)应用:判断某项指标正常与否总体均数的置信区间:意义:按一定的置信度估计总体均数所在范围;计算:正态分布O未知:双侧Xt2,vs,单侧(X-t*S*,8)或(-8,X+m*s);已知:双侧XZ2*,单侧(X-ZafvXt00)或(-oo,X+Zarvx);正态分布或偏峰分布:未知但n足够大:双侧XZ2S,单侧(-Za,vSX,8)或(-8,X+ZafVSX)应用:估计总体均数所在范围。假设检验1假设检验的过程:建立检验假设,确定检

20、验水准3计算统计量3确定P值并与给定的a比较1做出推断结论。2假设检验的基本逻辑:在HO成立的条件下(处理因素不起作用),计算统计量和P值,把不太可能出现假阳性当作不可能出现假阳性,从而拒绝H0,接受Hl(处理因素起作用)。3假设检验的两类错误:I型和11型错误。(见名解)实际情况统计推断拒绝H0,有差异不拒绝HO,无差异HO成立,无差异第I类错误(假阳性),概率=正确,概率=l-Hl成立,有差异正确,该概率=I-B第11类错误(假阴性),概率邛4t检验:应用条件:随机样本:来自正态分布总体;均数比较时,要求两总体方差相等(方差齐性)。单样本资料的t检验:实际上是推断该样本来自的总体均数日与已

21、知的某一总体均数有无差别。检验假设:HO:=,Hl:;前提条件:样本来自正态总体;计算公1-人t=式:sNn;自由V=n-lo配对设计资料的t检验:配对资料的分析着眼与每一对中两个观察值之差,这些差值构成一组资料,用t检验推断差值总体均数是否为Oo检验假设:HO:d=O,Hl:dO;前提条件:差值服从正态分布;计算公彳“d-0dt=*式S7SdNnSjn.自由度v=n-1(n是对子数)。两独立样本资料的t检验:两样本均数的比较。检验假设:HO:i=2,Hl:i2;前提条件:两样本服从正态分布,且具有方差齐性;计算公式:X-X1.Ai人2s%-X,SL-L代表两样本均数之差的标准误,SilS 壮

22、吟)SE为两样本联合估计的方差,(11-l)s(n2-l)SjE卜LXJ+-2-82)11+n2-2n1+n2-2.自由度丫=1+2-2。5尸检验:前提条件:两小样本来自正态总体且方差不等。方差不齐,可采用的处理方式有:尸检验,基于秩次的非参数检验和数据变换。非正态分布,方差不齐:基于秩次的非参数检验和数据变换。检验假设:HO:i=2fH1:1/2;计算公式:(S泊JV=XA度“1-12-16两组独立样本资料的方差齐性检验:两组正态分布随机样本判断其总体方差是否齐同:22 :a 22。= 21 :00FS:(较大)当Ho成立时,检验统计量,2(较小),当F3时,方差不齐。7大样本资料的Z检验(

23、U检验):前提条件:样本足够大;两独立样本资料的Z检验:假定从两个正态总体(或非正态)总体随机抽取含量为nl和n2的样本,总体均数和方差分别2202,n2均较大时,两样本均数的和与差的分布也服从(或近似服从)正态分布,立时,这个统计量服从标准正态分布。 t检验与Z检验的比较:两样本均数比较的t检验适用条件为:样本含量小,两样本独立,来自正态总体,且两总体方差相等。Z检验是大样本情况下的t检验的近似,用于两总体方差已知,或总体方差未知但样本含量较大(nl60且n260)的两样本均数的比较。样本量较大时,两种检验方法都可用。 8假设检验与区间估计的关系:置信区间具有假设检验的主要功能:在CX水准上

24、可回答差别有无统计学意义;置信区间可提供假设检验没有提供的信息:根据置信区间上、下限的数值大小可判断差别是否具有实际意义;假设检验可提供确切的P值,置信区间只能在预先确定的置信度100(l-)%水平上进行推断,没有精确的概率值,且有可能增大11类错误;置信区间推断量的大小,即推断总体均数范围;假设检验推断质的大小即推断总体均数是否存在不同。只有把置信区间和假设检验结合起来,互相补充才是对问题比较的完整分析。9假设检验的注意事项:根据研究目的、设计类型、变量类型及样本大小选择恰当的统计分析方法;权衡两类错误的危害以确定a的大小;正确理解P值的意义:P值很小时拒绝H0,接受H1,不能把很小的P值误

25、解为总体参数间差异很大。拒绝HO只是说差异不为0,P值小只是说犯一类错误的机会远小于aoP与a本质相同,都为概率,P是根据当前实验计算的概率,a是预先给定的概率,为检验水准,是定义了的小概率上限。实验设计1根据研究者是否认为地设置处理因素,即是否给予干预措施,可将医学研究分为调查研究和实验研究两类。1调查研究:又称观察性研究或非实验性研究,确切的说应是非随机化对比研究。它对研究对象不施加任何干预措施,是在完全自然状态下对研究对象的特征进行观察、记录,并对观察结果进行描述和对比研究。2实验研究:又称干预性研究,是对研究对象人为给予干预措施的研究。2实验设计的基本要素:受试对象、处理因素、实验效应

26、。1受试对象:是处理因素作用的客体,根据受试对象不同,实验可以分为三类:动物实验、临床试验、现场试验。2处理因素:是研究者根据研究目的而施加的特定的实验措施,又称为受试因素。3实验效应:是处理因素作用下,受试对象的反应或结局,它通过观察指标来体现。选择观察指标时,应当注意:a客观性:客观指标具有较好的真实性和可靠性;b精确性:包括准确度和精密度两层含义。准确度指观察值与真值的接近程度,主要受系统误差的影响。精密度指相同条件下对同一对象的同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。C灵敏性和特异性:指标的灵敏度反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应

27、更好地显示出来;指标的特异度反映其鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。3实验设计的基本原则:对照、随机化和重复。对照的形式:安慰剂对照:目的:在于克服研究者、受试对象等由心理因素导致的偏倚。空白对照:即对照组不接受任何处理,在动物实验和实验方法研究中最常见,常用于评价测量方法的准确度,评价实验是否处于正常状态等。实验对照;标准对照:用现有标准方法或常规方法作为对照;自身对照:对照与实验在同一受试对象身上进行。a随机化体现在三方面:随机抽样:总体中每一个体都有相同机会被抽到样本中来;随机分配:每个受试对象被分配到各组的机会相等,保证大量难以控制的非处理因素在对比组间尽可能均衡,

28、以提高组间的可比性;实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。b在实验设计中常通过随机数来实现随机化。获得随机数的常用方法有:随机数字表和计算机的伪随机数发生器。随机数字表常用于抽样研究及随机分组。C常用的两种随机化分组的方法:完全随机化和分层随机化(配对随机化和区组随机化可看成是分层随机化的实际应用)。重复包括三种情形:整个实验的重复;用多个受试对象进行重复;同一受试对象的重复观察。重复的主要作用:估计变异的大小;降低变异大小。4常用的实验设计方案:完全随机设计(CompIeteIyrandomizeddesign):又称简单随机设计,是最为常见的一种考

29、察单因素两水平或多水平效应的实验设计的方法,它是采用完全随机分组的方法将同质的受试对象分配到各处理组,观察其实验效应。配对设计(paireddesign):是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同的处理组。据以配对的因素应为可能影响实验结果的主要混杂因素。配对设计主要有以下情形:将两个条件相同或相近的受试对象配成对子,通过随机化,使对子内个体分别接受两种不同的处理;同一受试对象的两个部分配成对子,分别速记地接受两种不同的处理;自身前后配对,即同一受试对象,接受某种处理之前和接受该处理后视为配对。交叉设计(crossoverdesign):是-一种特殊的自身对照设计

30、,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。基本前提:个处理方式不能相互影响,即受试对象在接受第二种处理时,不能有前一种处理的剩余效应。优点:节约样本含量;能够控制个体差异和时间对处理因素的影响,故效率较高;在临床试验中,每个受试对象均接受了各种处理,均等的考虑了每个患者的利益。进行交叉设计应注意:尽可能采用盲法,以提高受试对象的依从性,避免偏倚;不宜用于具有自愈倾向或病程较短的疾病研究。在慢性病观察过程中,应尽量保持条件的可比性。随机区组设计:又称单位设计、配伍组设计,实际上是配对设计的扩展。通常是将受试对象按性质相同或相近分为b个区组(或称单位组

31、、配伍组),再将每个区组中的k个受试对象随机分配到k个处理组。设计应遵循“区组间差别越大越好,区组内差别越小越好的原则。(5)析因设计(factorialdesign):a是将两个或多个处理因素的个水平进行组合,对各种可能的组合都进行实验,从而探讨个处理因素的主效应以及个处理因素间的交互效应,又称完全交叉分组实验设计。所谓交互作用是指两个或多个处理因素间的效应互不独立,当某一因素取不同水平时,另一个或多个因素的效应相应的发生变化。两因素间的交互作用为一阶交互作用,三因素间交互作用为二阶交互作用。b当观察k个处理因素,每个因素均有m个水平时,共有mk种组合,简记为mk析因设计。C可获得三方面的信

32、息:各因素不同水平的效应;各因素间的交互作用;通过比较寻求最佳组合。5样本含量的估算:确定样本含量的原则:在保证研究结论有一定可靠性的前提下,估算最少需要多少受试对象。假设检验所需样本含量取决于四个要素:1第一类错误概率的大小:越小,所需样本量越大;第二类错误概率B或检验功效(I-B)的大小:第二类错误的概率越小,检验功效越大,所需样本含量越多;容许误差6:即两总体参数的的差值,8越大,所需样本含量越小;总体标准差。和总体概率n:越大,所需样本含量越多;总体概率n越接近50%,变异性越大,所需样本含量越多。方差分析1基本思想:把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各部

33、分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。2应用条件:各样本是相互独立的随机样本;各样本来自正态总体;各处理组总体方差相等,即方差齐性。3任何设计方案的SS总和V总算法均相同,即在不考虑数据按任何方向分组的情况下,将所有数据看成一个整体计算,即SS总=(N-I)S2,v=N-Io几种设计方案中SS总和V总的分解:设计方案SS总的分解V总完全随机设计SS总=SS组间+SS组内V总=V组间+v组内随机区组设计SS总=SS处理+SS区组+SS误差V总=V处理+v区组+v误差析因设计SS总=SS处理+SS误差V总=V处理+v误差=(SSA+SSB+SSAB)+SS误差=(vA+

34、vB+vAB)+v误差重复测量设计(两因素)SS总=SS受试对象间+SS受试对象内V总:V受试对象间+v受试对象内=(SS处理+SS个体间误差)+=(v处理+v个体间误差)+(SS时间+SS处理与时间交互+SS个体内误差)(v时间+v处理与时间交互+v个体内误差)4重复测量资料和随机区组设计资料的区别:同一受试对象在不同时间点的数据高度相关;重复测量资料中的处理因素在受试对象(看成区组)间为随机分配,但受试对象(看成区组)内的各时间点是固定的,不能随机分配。随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受的处理各不相同。5重复测量资料方差分析的前

35、提条件:各样本是相互独立的随机样本;各样本来自正态总体;各处理组总体方差相等,即方差齐性;需满足协方差阵的球形性或复合对称性。6多各样本均数的两两比较方法:未计划的每两个均数的事后比较,常用SNK-q检验;计划好的某些均数间的两两比较,常用DUnnett-t检验;BonfeITOni法和sidak法适用于所有的两两比较。方差分析后不能作两两比较的t检验的原因:会增加犯一类错误的概率。如果比较次数为k,每次检验水准为,则犯一类错误的累积概率为I-(l-)k,高于原有的a07数据变换的目的:使各组达到方差齐性;使资料转换为正态分布,以满足方差分析和t检验的应用条件。通常情况下,一种适当的函数转换可

36、使上述两个目的同时达到。曲线直线化。常用于曲线拟合。常用的数据变换有对数变换、平方根变换、平方根反正弦变换。8方差分析中的F检验是单侧检验的原因:方差分析中检验统计量F的计算通常是用某部分的均方(如处理因素、交互效应等)除以误差的均方,其中分母误差部分尽含随机因素作用,分子某部分的均方含有相应处理因素或交互作用的效应,而且还含有随机因素的作用,因此得F值从理论上应1,不会小于1,所以方差分析中F检验是单侧检验。X2检验Ik2检验用途:常用于分类变量资料的统计推断,主要用途包括:单样本分布的拟合优度;比较两个或多个独立样本频率分布;比较配对设计两样本频率和两频率分布;推断两个变量或特征之间有无关

37、联性。2X2检验的理论基础是2分布和拟合优度检验。X2分布是一种连续型随机变量的概率分布,按分布的密度函数可给出自由度=1,2,3,.的一簇分布曲线。X2分布形状完全依赖于自由度V的大小,当vl时,随着V的增加,曲线逐渐趋于对称;当自由度V趋于8时,X2分布逼近正态分布。拟合优度检验是根据样本的频率分布检验其总体分布是否等于给定的理论分布。3X2检验的基本思想是:用统计量度量实际频数和理论频数之间的偏离程y(Ai-Ti)2度,永远是正值,X2检验统计量的基本公式是:2=f=T:,v=k-l-s,S是用样本估计量代替总体参数的个数。若假设成立,则各格子的实际频数与理论频数相差不应该很大,因而算出

38、的X2值也不会很大,即出现较大X2值的概率P很小。若P,则认为A与T的差别已超出了抽样误差允许的范围,拒绝H0。若P,不拒绝H0。4独立样本22列联表资料的X2检验:HO:两总体率相等;Hl:两总体率不等。.(4一7)2ln40且Tmin5,/二乙T,(ad-bc)2n2=(+b)(c+d)(+c)(b+d),V=LYl(If-0.5)22n40且1TV5,校正公式:X一二乙丁,(ad-bc-n2)2nr2=(+6)(c+d)(G+c)(b+d),v=i:3nV40或TV1,或P=CX时,FiSher精确概率法。5独立样本RC列联表资料的*检验:(多个独立样本率、独立样本频率分布的比较)H0:

39、多个总体率相等;H1:多个总体率不等。(y-)/=11jnRmczv=(R-I)(C-I)要求:理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理论频数小于1,否则可能会产生偏性。如果不满足此要求,处理方法有:增加样本含量(首选);结合专业知识考虑是否可以将该格所在行或列与别的行和列合并,要根据样本特性来确定,但会损失信息;改用RC表FiSher精确概率法,可以用计算机软件实现。RC列联表的分割:多个实验组间的两两比较:分析目的为k个实验组间,任两个率均进行比较时,须进行次独立的四格表检验,再加上总的行X列表资料的X检(*)+1验,共21次检验假设。故检验水准。用下式估计:A!()=2!(-2)!,k为样本率的个数。实验组与同一个对照组的比较:分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。其检验水准。用下式估计:o=2(Al).6配对设计资料的X2检验:配对2x2列联表资料的X2检验(两种处理方法阳性率的比较):H0:两总体阳性率相等;H1:两总体阳性率不等。y(4-T)2(b-c)21当b+c40时,X2三b-t-C,v=l;当b+c50,用Z检验。注意事项:编秩时遇差值为O舍去,n随之减小;遇有差值的绝对值相等,符号相同,仍按顺序编秩;符号不同,取其平均秩次;(2)T+T-=n(

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号