医学统计学 名词解释 名解 复习资料.docx

上传人:小飞机 文档编号:3340184 上传时间:2023-03-12 格式:DOCX 页数:10 大小:42.26KB
返回 下载 相关 举报
医学统计学 名词解释 名解 复习资料.docx_第1页
第1页 / 共10页
医学统计学 名词解释 名解 复习资料.docx_第2页
第2页 / 共10页
医学统计学 名词解释 名解 复习资料.docx_第3页
第3页 / 共10页
医学统计学 名词解释 名解 复习资料.docx_第4页
第4页 / 共10页
医学统计学 名词解释 名解 复习资料.docx_第5页
第5页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《医学统计学 名词解释 名解 复习资料.docx》由会员分享,可在线阅读,更多相关《医学统计学 名词解释 名解 复习资料.docx(10页珍藏版)》请在三一办公上搜索。

1、医学统计学 名词解释 名解 复习资料1. 总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限总体(infinite population)。 2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3. 样本(sample):从总体中随机抽取的部分个体。 4. 样本含量(sample size):样本中所包含的个体数。 5. 变量(variable):观察对象个体的特征或测量的结果。由于个

2、体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称为变量值或观察值(observation)。根据变量的取值特性,分为数值变量和分类变量。 6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。 7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 分类变量(categorical variable):或称定性变量,其取值是

3、定性的,表现为互不相容的类别或或属性,有两种情况: 1)无序分类(unordered categories):包括二项分类,如上述“性别”变量,表现为互相对立的结果;多项分类,如上述“血型”变量,表现为互不相容的多类结果。 2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。 等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。 8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避

4、免的,可用标准误描述其大小。 10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差 。 11. 可信区间(confidence interval, CI):按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度1-的可信区间,又称置信区间。 12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95和99,故常用95和99的可信区间。 13. 变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异(individual v

5、ariation)。 14. 组间变异(variation between group):用各组均数与总均数的离均差平方和表示 SS组间=ni(xi-x)2i组间=k-1,k为实验分组数,组间均方为MS组间=SS组间/( k-1) 15. 组内变异(variation within group):用各组均数与总均数的离均差平方和表示 SS组内=(xij-xi)2=(ni-1)si2,各组自由度为ni-1,则组内自由度为组内=N-k,组内均方为MS组内=SS组内/( N-k) iji16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列

6、的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。 17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n为奇数时,M=X(n+1)/2;当n为偶数时,M=Xn/2+ Xn/2+1/2。 18. 百分位数(percentile):是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px。 19. 变异系数

7、(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。CV=s/X100%, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 20. 统计表(statistical table):统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。 21. 频率(relative frequency):在n次随机试验中,事件A发生了m次,则比值 f=mA发生的试验次数=称为事件A在n次试验中出现的频率(relative freq

8、uency)。m称为出现的频数n试验的总次数(frequency)。 在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。 22. 概率(probability):在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 描述随机事件发生的可能性大小的数值,常用P来表示。 23. 统计量(statistic):由样本所算出的统计指标或特征值。 24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向

9、的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母表示,而样本相关系数用r表示,取值范围均为-1, 1。 = a+bX的系数b称为回归系数,25. 回归系数(regression coefficient):直线回归方程Y也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%

10、、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。 27. 正偏态和负偏态分布:频数分布可分为对称分布和非对称分布两种类型。非对称分布又称为偏态分布,是指观察值偏离中央的分布。当尾部偏向数轴正侧(或右侧)时,称正偏态(或右偏态)分布,如人体中一些重金属元素的分布等。反之,尾部偏向数轴负侧(或左侧)时,则称为负偏态(或左偏态)分布。 28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目

11、的是通过样本的信息判断总体的特征,这一过程称为统计推断。 29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差X称为标准误。 第 1 页 共 3 页 30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计(point estimation)和区间估计(interval estimation)。 31. 点估计(point estimation):直接用样本统计量作为对应的总体参数的估计值。 32. 区间估计(interval estimation):按

12、一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度1-的可信区间(confidence interval, CI),又称置信区间。这种估计方法称为区间估计。 33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。 34.类错误(typeerror):统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为型错误或第一类错误,型错误的概率用表示。 35.类错误(typeerror):统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为

13、型错误或第二类错误,型错误的概率用表示。 36. 检验效能(power of a test):又称把握度,即两总体确有差别,按水准能发现它们有差别的能力。 37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。 参数检验:假定比较数据服从某分布,通过参数的估计量(x, s)对比较总体的参数()作检验,统计上称为参数法检验(parametric test)。如t、u检验、方差分析。 38. 非参数检验:适用于任意分布(distribution free)的统计方法,这种方法称为非参数统计。这种假设检验方法,比较的是分布而不是参数,故称为非参数检

14、验。 非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验(nonparametric test). 39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为: 率=实际发生某现象的观察单位数比例基数(K) 可能发生某现象的观察单位总数40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为: 构成比=某一组成部分的观察单位数100% 同一事物内各组成部

15、分的观察单位总数41. 比(ratio):又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B。 统计学:运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。 总体:大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本:来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可

16、用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间,又称可信区间。 参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法、百分位数法,参考值范围用于判断某项指标是否正常 置信区间 揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法、二项分布法。置信区间估计总体参数所

17、在范围 参数统计 非参数统计是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异:对于同质的各观察单位,其某变量值之间的差异 同质:研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数:又称Pearson积差相关系数,是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数:描述总体特征的统计指标。 统计量:描述样本特征的统计指标。 实验设计的基本原则 对照 (control) 对受试对象不施加处

18、理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication) 相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象;同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误 真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用 a 表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误 真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用 b

19、 表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标 是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 第 2 页 共 3 页 平均数指标 用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数;几何均数;中位数;众数 单纯抽样 将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中 系统抽样 又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。 最常用的方法是等距抽样 分层抽样 先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误差最大。 整群抽样 先将总体分成若干“群”,从中随机抽取几个群,抽取群内的所有观察单位组成调查样本。“群”的确定与研究目的无关。为减少抽样误差,需多抽几个“群”。 第 3 页 共 3 页

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号