《医学统计学名词解释(2).docx》由会员分享,可在线阅读,更多相关《医学统计学名词解释(2).docx(10页珍藏版)》请在三一办公上搜索。
1、医学统计学名词解释1. 总体:是根据研究目的确定的同质研究对象所有观察单位某变量的集合。 2. 样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分称为样本。 3. 变异:同一性质的事物,其观察值之间的差异。 4. 概率:是指某事件出现可能性大小的度量,以符号P表示。 5. 医学参考值范围:又称正常值范围。指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围 6. 正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。 7. 可比性:是指对研究结果有影响的非处理因素
2、在各处理组之间尽可能相同或相近。 8. 抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。 9. 标准误:表示样本均数间变异程度。 10. 率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。 11. 可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率包含总体参数。 12. I型错误:拒绝了实际撒谎能够成立的H0,这类“弃真”的错误称为I型错误。 13. II型错误:接受了实际撒谎能够不成立的H0,这类“存伪”的错误称为II型错误。 14. 参数检验:是一种
3、要求样本来自总体分布型是已知的,在这种假设的基础上,对总体参数进行统计推断的假设检验。 15. 非参数检验:是一种不依赖总体分布类型,也不对总体参数进行统计推断的假设检验。 16. 秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。 17. 直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。相关系数没有单位,取值范围是-1=r=1,r的绝对值越大表明两变量的关系越密切。 18. 完全负相关:这是一种极为特殊的负相关关系,从散点图上可以看出,由x与y构成的散点完全分布在一条直线上,x增加,y相应减少,算得的相关系数r=
4、-1。 19. 正相关:它是说明具有直线关系的两个变量间,存在有正的相关方向,即当x增加时,y有相应增大的趋势,所算得的相关系数r为正值。 20. 等级相关:是对等级数据作相关分析,它又称为秩相关,是一种非参数统计方法。 21. 随机抽样:是指按照随机化的原则,从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 22. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡单位。如某一患者的身高等。 23. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。如调查某地某时的男、女性人口数 24. 等级资料:将观察单位按
5、测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料,一批肾病患者尿蛋白含量的测定结果分为 +、+、+等。 25. 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 26. 频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P= m/n。 27. 随机误差:又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。
6、随机误差可以通过统计处理来估计。 28. 系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 29. 随机变量:是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 30. 参数:是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计
7、未知的总体参数 31. 统计量:是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 32. 频数表用来表示一批数据各观察值或在不同取值区间的出现的频繁程度。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,20 个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 33. 平均数:简称均数,常作为一组数据的代表值,用于分析和进行组间比较,包括算术平均数、几何平均数,中位数等 34. .算术均数:描述一组数据在数量上的平均水平。总体均数用表
8、示,样本均数用X 表示。 35. 几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 36. 中位数:估计总体指标值。参数估计有两种方法:点估计和区间估计。 44. 假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。 45. 检验效能:1- 称为检验效能,它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。 46. 检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准,记为 。 47. 率:又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:发生某现象的观察单
9、位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率、千分率等。 48. 构成比:又称构成指标,说明某一事物内部各组成部分所占的比重或分布。计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。 49. .比:又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。计算公式为:A/B ,表示方式有:倍数或分数等。 50. 率的标准化:是为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成的影响。 51. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,
10、只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法 52. 参数统计:通常要求样本来自总体分布型是已知的,在这种假设的基础上,对总体参数进行估计和检验,称为参数统计 53. 秩次:变量值按照从小到大顺序所编的秩序号称为秩次。 54. 秩和:各组秩次的合计称为秩和,是非参数检验的基本统计量。 55. 直线回归建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。 56. 回归系数:即直线的斜率(slope),
11、在直线回归方程中用b 表示,b 的统计意义为X每增一个单位时,Y平均改变b 个单位。 57. 相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。 58. 相对数:为了使技术资料具有可比性,取原始的两个资料之比所得的指标统称为相对数,常用有率,构成比,相对比 59. 参数估计:指由样本指标值估计总体指标,是统计推断的一个重要内容 60. 点估计:用样本统计量直接作为总体参数的估计值 61. 区间估计:又称可信区间,按预先给定的的概率估计未知总体均数的可能范围 62. 统计推断:在总体中随机抽取一定数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特征,这一过程
12、称 63. 小概率事件:在统计学上,习惯将P0.05或P0.01称之,表示该事件在一次抽样试验中发生的可能性很小 64. P值:从H0所规定的总体中作随机抽样,获得大于及等于现有样本统计量值的概率 65. 直方图:用直条矩形面积代表各组频数,个矩形面积总和代表各组频数的总和 66. 67. 68. 正态分布的特征:a正态分布以均值u为中心,左右对称。X取值范围理论上没有边界,x离u越远,函数越接近于0,但是不会等于0 b在正态分布中,曲线面积集中在以均值u为中心的中心部位,离中心越远,曲线越接近于x轴,曲线下面积越少,超过一定范围以外的面积可以忽略 c所有正态分布曲线在u左右的相同倍数的标准差
13、范围内面积相同,并在u6范围内的面积约为68.3%,在u+1.966范围内约为95%,在u+2.586范围为99% d正态分布完全由u和6,。U是位置参数,决定分布曲线在横轴的偏移位置,6是变异参数,决定分布曲线的形态 69. 医学参考值的制定方法:a选择足够数量的正常人作为参考样本 b对选定的正常人进行准确的测定 c决定去单侧范围还是双侧范围 d选择适当的百分范围 e估计参考值范围的界限 70. T检验中的注意事项和条件:a有严密的抽样设计 b选用检验方法必须符合其使用条件 c假设检验的结论不能绝对化 d单侧检验和双侧检验 e正确理解p值与差别有无统计意义f假设检验与可信区间的关系 71.
14、方差分析基本思想及使用条件:基本思想;将全部观察值的总变异按影响实验结果的诸多因素分解为若干变异,构造出反应各部分变异作用的统计量,之后构造假设试验统计量f,实现对总体均数的推断 使用条件:a各样本相互独立的随机样本 b各样本均来自正态分布总体c各总体方差相等 72. 卡方检验的注意事项:a、在应用X2检验时,一般规定,若有1/5的理想频数小于5,其结论的可靠性将存疑b、RC卡方检验有统计学意义,并不等于任意两组之间都有统计学意义,要继续做RC分割的卡方检验,才能得出任意两组间有无统计学的结论b、有些RC数资料不能用X2检验 73. 线性相关分析的注意事项:a分析两个变量之间有无相关关系可首先
15、绘制散点图,散点图呈现出直线趋势时,再计算相关系数和做假设检验 b相关关系的计算只适用于两个变量都服从正态分布的情形,如资料不符合正态分布,应先通过变量交换,使之正太化,再根据变换值计算相关系数 c依据公式计算出的相关系数仅是样本相关系数,它是总体相关系数的是个估计值,与总体相关系数之间存在着抽样误差,要判断两个事物之间有无相关和相关的密切程度,必须作假设检验 d相关分析是用相关关系来描述两个变量相互关系的密切程度和方向,而两个事物之间的关系既可以是依存因果关系,也可以是相互伴随的数量关系 74. 相对数使用注意的问题:a不要把构成比与率混淆b使用相对数时分母不宜过小c要注意资料的可比性d要注
16、意使用率的标准化e要考虑存在抽样误差 75. 线性回归的应用:a分析两个变量之间是否存在线性依存关系 b利用回归方程对因变量Y进行估计,必要时可作区间估计 c利用回归方程进行统计控制,实际就是利用回归方程进行逆运算,通过控制自变量X取值来限定因变量Y在一定范围内波动 76. 线性回归分析的注意事项:a只有两个内在联系的放在一起进行回归分析才是有意义的 b做回归分析时,如果两个内在联系的变量之间存在一种依存因果的关系,那么应该以因变量X,以结果变量Y。如果变量之间因果关系难以确定,则应以易于测定、较为稳定或变异较小者为X c在回归分析中,因变量是一个服从正态分布的随机变量,自变量可以是随机变量,
17、也可以是给定的量。如不服从正态分布,应先进行变量的交换使变量复合条件 d使用回归方程计算估计值时,不要轻易把估计值的范围扩大到建立方程时的自变量的取值范围之外 77. 线性相关与回归的区别、联系:区别:a相关系数的计算只适用于两个变量都服从正态分布的情况,而在线性回归分析中,因变量是随机变量,自变量可以是随机变量,也可以是给定变量 b线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依赖关系,是单向的 联系:a方向一致,对一组数据都能同时计算b和r,他们的符号一致 b假设检验等价,对同一样本b和r的假设检验得到的t值相等,即tr=tb。用回归解释相关,回归平方和越接近总平均和
18、则y2越接近1,回归效果越好 78. 非参数检验的概率及优缺点:采用符号和等级排列来代替数据的分析方法,不依赖于总体分布的具体形式的统计方法 优点:a适用于任何分布的资料b不受总体方差一致的限制c可用于等级资料的统计分析d有些问题本身没有使用的参数检验方法二非参数检验则恰能处理 缺点:由于它没有充分利用原始数据中所提供的信息故检验效能处理,其效果有一定的近似值 79. 相关系数的特征:a、r的绝对值为1的机会极少 b常见r值介于-1和1之间 c、r值为正,表示正相关,r为0,既无直线相关,r为负,表示负相关,r为1,表示完全相关 80. 非参数检验的使用条件:a总体分布为偏态,或位置分布形式的
19、未知计量资料 b 等级资料 c 个别数据偏大或某一短无确定的数值 d 各组离散程度相差悬殊,即各总体方差不齐 81. 医学统计的工作内容有:实验设计,收集资料,整理资料,分析资料 82. 医学统计资料一般分为:计数资料,计量资料,等级分组资料 83. 抽样的特征:代表性,随机性,可靠性,可比性 84. 集中趋势与离散趋势的指标有哪些:集:算术平均数,集合均数,中位数 离:极差,四分位间距,方差,标准差,变异系数,离均差平方和 85. 设计类型:完全随机设计,配对设计,交叉设计,随机区组设计,析因设计 86. 计算标准差有何用途:a用于表示观察值的变异程度,b用于对变量值的分布情况进行估计,c计算变异系数d实验室的质量控制 87. 试验设计的要素:a处理因素,b受试对象,c实验效应 88. T值的应用范围:计量资料,正态分布,单因素分析,总体方差相同,两均数比较,设计合理条件齐全可比 89. 常用的统计图:条图,线图,半对数线图,直方图,圆图,百分条图,散点图等 90. 统计表的结构:标题,标目,线条,数字,和备注 91. 统计图的结构:标题,图域,标目,图例,刻度