《数据质量控制.ppt》由会员分享,可在线阅读,更多相关《数据质量控制.ppt(23页珍藏版)》请在三一办公上搜索。
1、数据的质量控制,Naila Baig AnsariAga Khan大学社区卫生科学学院研究员巴勒斯坦 卡拉奇xhlbudd(dxy)译,作者简介,教育背景 2001年于Age Khan大学获理学硕士学位(流行病学)研究课题:照料与喂养实践以及它们与居住在卡拉奇无主空房的小孩发育迟缓的关系1989年于美国弗吉尼亚州威廉斯堡 William and Mary学院获管理学学士学位,学习目标,知道科研研究不同阶段数据质量保证和控制的必需步骤弄清楚引导试验与预试验的区别知道设计数据搜集手段的重要性知道如何使用审计追踪来管理数据以及检查已录入的数据库的方法,行为目标,知道质量保证和质量控制的区别以及它们实
2、现的途径知道引导试验和预试验的目的知道数据搜集手段如何设计,如何编码知道用审计追踪来管理数据能够检查数据库中的错误并纠正它们,数据的质量控制,质量保证在搜集数据之前确保数据质量的行为质量控制在研究过程中监控和维持数据质量数据管理在研究过程中处使用和处理数据,质量保证的步骤,阐明研究假设阐明研究假设的检测方法的设计,即提出一种研究草案选择或者准备特定的方法手段制定数据搜集和处理的程序,即制定操作手册工作人员的培训以及工作人员素质的保证素质有保证的工作人员,预试验,引导研究数据搜集以及方法和程序的处理,质量保证:程序的标准化,为什么标准化非常重要?为了使整个研究的数据搜集过程达到最高程度的统一和标
3、准化制订操作手册的准备工作每个数据搜集手段过程的执行过程的详细描述。(比如说BP)一个问题接着一个问题的访问方法,质量保证:工作人员的培训,目标是让每一位员工熟悉他(她)所负责的问题的程序工作人员执行特定程序的培训证明,质量保证:预试验和引导试验,预试验包括对一个样品用特定的程序进行评估以检测是否在大问题引导试验研究过程的正式排练再现与参与者尽可能相类似的样品的整体操作流程,预试验和引导试验的结果,用于评估的问卷预试验问题的流程敏感问题的提出参数的近似分类让访问者弄清连续发问的程序引导试验除了上面的内容,还有程序的流程,质量保证:数据管理,设计数据搜集方法列出要问的问题,问题的顺序,问题的措词
4、,问题答案的分类,跳跃性的发问方式搜集并记录原始数据,而不是经过处理加工的数据(比如说“年龄”)密码本:问卷与输入电脑的数据的联系,代码本范例,质量保证:代码本的使用,变量名由超过8个的字母或数字组成,第一个字符应当是字母问题编号与描述结合(如q3age)含义:变量含义的简洁描述SPSS软件能够在输出结果中整合变量标记并显示它,质量保证:代码本的使用,代码尝试并运用数字代码预先决定无应答,数值丢失的代码不方便问的问题或者不适用的问题(比如说怀孕的结果)问题已经提出但是没有得到应答(比如说工资的问题)被访问者回答“不知道”,质量控制,对工作人员明显偏离预定草案的程序和行为进行监测策略包括:工作人
5、员的密切观察选择所有的访问并随机抽取一个样本进行回顾正在进行的研究的领域的监督在办公室进行编辑(包含编码)用统计学方法从长远的角度评估每位观察者、访问者和技术人员的表现,数据管理:审计追踪,研究者必须能够从每一个信息追溯到原始文件原始文件和数据库中的ID所有数据的改正必须记录并且加以解释所有对数据库的修改必须用命令文件加以记录所有分析结果必须用一个命令文件记录下来审计的目的是:不至于犯错误,浪费时间和丢失信息进行外部审计(修正),数据管理:数据的处理,数据的录入使用专业的数据录入程序如EpiData准备完成代码本检查问卷是否有明显的矛盾或者遗漏,数据管理:数据的处理,防止错误创建与你的问卷类似
6、的数据录入表在录入数据之前定义有效的参数由两个不同的操作员输入两套数据对内容进行对比以找出不同之处(EpiInfo)对两种文件的错误进行纠正并进行新的比较,数据的首次检查,找出错误,使用一个有序的命令为你的数据增加变量和值标志找寻错误数据代码本的输出、变量的总体观察、合适数据的简单概率表将创建的代码本与原始的代码本相比较,观测标志信息是否是正确的。检查产生的摘要和频率表,看看是否有参数的不合规定或不适当的最小和最大值。(比如说,年龄为250岁,男性怀孕,23岁女子的儿子年龄为19岁)随机选取10或者至少40的问卷并将它们输入到新文件中以计算错误的概率,错误纠正记录,如果发现了错误在一个命令文件
7、(SPSS句法文件)中进行纠正,这样能够完整地记录对数据库的改变如果在双重录入后比较文件时发现错误如果你在对两个录入文件进行比较和校正后停止这一步,你就可以对已经录入的数据进行直接改正。,错误纠正记录,将过程分为差别明显且明确阐述的步骤,并且使你一步到另外一步的记录保持连贯档案一旦你对原始数据作了最真实的记录,记得在一个安全的地方作一个备份,而用原来的记录来进行下一步工作。,分析,确保你使用了正确的数据库建议创建一些用于分析的命令文件,这些命令文件的最初几个能够读取数据库错误和矛盾的后期发现,备份和归档,备份每天都要执行当数据破坏或者丢失的时候,可以恢复它们改变你的数据的数据库和命令文件,书面记录如协议,记录本和其他记录信息归档在工程进行过程中,进行一次或者几次目的是在更长的一段时间里保护数据和文档,甚至可能让其他的研究人员得到这些信息,