医学应用统计分析第二章变量数据和数据库课件.ppt

上传人:牧羊曲112 文档编号:2155484 上传时间:2023-01-20 格式:PPT 页数:26 大小:411.50KB
返回 下载 相关 举报
医学应用统计分析第二章变量数据和数据库课件.ppt_第1页
第1页 / 共26页
医学应用统计分析第二章变量数据和数据库课件.ppt_第2页
第2页 / 共26页
医学应用统计分析第二章变量数据和数据库课件.ppt_第3页
第3页 / 共26页
医学应用统计分析第二章变量数据和数据库课件.ppt_第4页
第4页 / 共26页
医学应用统计分析第二章变量数据和数据库课件.ppt_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《医学应用统计分析第二章变量数据和数据库课件.ppt》由会员分享,可在线阅读,更多相关《医学应用统计分析第二章变量数据和数据库课件.ppt(26页珍藏版)》请在三一办公上搜索。

1、第二章 变量 数据 数据库,主讲老师:暨南大学 陈青山,暨南大学医学院,统计数据是实施统计分析的前提和基础,常以数据库的方式呈现。数据库由不同观察对象的观察指标(变量)及其相应的数据值组成。掌握变量、数据和数据库的基本知识,正确区分变量、数据类型有利于正确选择统计方法并实施统计分析。,第一节 变量,一、变量的类型(一)分类变量(categorical variable)又称定性变量(qualitative variable),是指用定性方法确定的、说明观察单位某项属性特征或类别的指标。根据分类变量的项数和项数间等级程度差异分为:二项分类变量多项无序分类变量多项有序分类变量,(二)数值变量(nu

2、merical variable)又称定量变量(quantitative variable),是指用定量方法测定的、具有数值大小(高低或多少)的指标,变量值一般有度量衡单位,可以带小数点,如身高、体重、血压等。,二、变量的转换降级转换:数值变量多项有序分类变量多项无序分类变量二项分类变量。降级转换不断丧失变量本身藴藏的数据信息,导致统计分析过程中假阴性结果的增加。逆向转换即升级转换,实际应用中不可行,不建议采用。,第二节 数据,数据(data)是描述研究指标数值大小或属性特征的观察值。按变量的类型不同分为:数值变量数据分类变量数据按照数据呈现方式不同分为:数据库数据频数表数据,一、数据库数据(

3、database data),慨念:根据一定的研究目的确定的、用二维数据库(bivariate-table data)方式逐一有序记录的、可供统计软件或程序分析的、不同观察对象的各个观察指标的全部观察值。,第一行属于观察指标;其余每一行代表一个观察对象(即孕妇)的所有观察指标值;每一列代表某项观察指标所有观察对象的观察值。,要求:数据库数据能够直接应用相关统计软件进行计算分析。数据库的数据值全部用阿拉伯数字表示,必要时应在适当位置附加批注。,二、频数表数据(frequency-table data),概念:将研究对象的某一指标按其数值大小分组或属性特征分类,清点各组或各类观察单位出现的个数(即

4、频数)。种类:分类变量的频数表数据数值变量的频数表数据,三、数据库数据与频数表数据的转换,数据库数据可以转换为频数表数据数值变量相当于数值变量向多项有序分类变量(或多项无序分类变量)转换,常常会损失一些数据库数据的信息分类变量一般不会损失信息;频数表数据可转换为数据库数据,仅限于分类变量。,数据库数据转换为频数表数据有:单一变量转换:只有一个变量的转换;双变量转换:同时针对两个变量的转换,包括两个分类变量转换、两个数值变量转换、一个数值变量与一个分类变量转换。多个变量的转换:针对两个变量的转换,较为复杂也不常应用。,(一)实例,(二)实例分析,例2-1中的数据是含有多个变量的数据库数据。不同血

5、型人数的多少,属于单一分类变量转换的单一变量频数表数据;不同血型人群贫血程度的高低,是血型和贫血程度两个分类变量转换的双变量频数表数据。,(三)软件计算,第三节 数据库(databases),数据库即存放数据的“仓库”,是将不同研究对象不同观测指标的观察结果逐一有序记录的二维表格。,一、数据库的结构,数据库主要由变量名(字段名或指标名)和变量值(指标值)组成。变量名(variable name),即指标名,又称字段名,是观察指标的名称,可用中文或英文。变量值(variable value),数据库中观察指标数值大小或特征属性的阿拉伯数字。变量值的种类:数值数字、分类数字。,二、建立数据库的方法

6、,由于软件不同,建立数据库的方法各有不同,常见的建库软件有SAS、SPSS、Excel、Epidata等。(见教材或实习内容),三、不同软件数据库文件的导入导出,不同软件的数据库文件可以相互转换,即导入或导出。本内容以Excel数据库为基础,简单介绍SAS与SPSS的导入导出方法。(见教材或实习内容),四、统计数据库的要求,(一)目的性统计数据库供统计分析之用,包含不同观察对象的不同观察指标和指标值,那么收集哪些观察对象?收集哪些观察指标?全部由分析目的决定,所以统计数据库的建立要依据研究目的而定。,(二)有效性统计数据库的数据一般要用统计软件分析,那么统计软件一定要正确识别数据库,无误地调用数据库的数据值,表现为统计数据库的有效性。(三)易读性数据库中各个研究对象的各个观察指标及其观察值应该清晰明了、一目了然,甚至需要分析的内容也能从数据库中直接读出。,谢 谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号