《量化资料的整理与分析.ppt》由会员分享,可在线阅读,更多相关《量化资料的整理与分析.ppt(30页珍藏版)》请在三一办公上搜索。
1、量化资料的整理与分析,社会研究方法,主要内容,一、数据整理(一)初步整理(二)统计整理二、统计分析(一)统计分析初步,初步整理,初步整理主要是检查原始资料的真实性和准确性,纠正其中的差错,有时还包括编码。主要内容:审核 复查 编码 登录 清理,审核,审核:对原始问卷资料进行校对和订正基本要求:1、准确性 资料中的数据是准确的,符合 事实和逻辑。逻辑检查和经验检查 2、完整性 所有调查项目的资料是否完备 无缺 3、真实性 检查资料的来源 被调查者提供的资料是否真 实 4、一致性 问卷的填答方式要一致,废卷判断,有1/3的问题应答未答个人背景资料没有回答问卷不是由被调查者填答用来检验真实性问题的回
2、答证明被调查者的回答是不真实的,并且经过复查后确实如此存在很多逻辑错误,审核的方法,实地审核 在调查现场进行 1、访问员完成调查后,重复某些重要、有矛 盾的问题 2、每天问卷上交前,对每一份问卷进行复核 3、组长负责实地审核,并抽查问卷 小组审核 以访问小组为单位由组长或督导负责,小组 成员交互检查问卷质量 主要任务:检查问卷内容 检查访问员的工作,审核的方法,全面审核(集中审核)资料收集工作基本结束后进行 形式:全卷审查 系统审查 主要工作:检查问卷的答案是否确切、一致和 完整 决定问卷的取舍 汇总访问员和被访者的意见 可进行编码,复查,复查:在问卷调查全部结束以后,对样本中的一部分个 案进
3、行第二次调查,以检查第一次调查的质量方法:随机抽取样本中的5%10%,由其他访问员重 新进行调查注意:在调查时收集有关样本的基本信息,编码和录入,编码 即将问卷中的文字答案转换成数字,并输入到计 算机 可以在编码的同时对问卷进行审核录入 把原始数据输入到计算机中储存起来,或者登录 在表格上 有些重大项目还要进行两次输入,数据清理,幅度纠错 幅度错误:编码值超过了编码的范围与幅度 方法:以SPSS为例,执行计算变量频率分布(frequency)的命令,如果发现错误,再执行 查找(find)命令,即可发现发生错误的问卷 编号,然后查找原始问卷,根据问卷上的答案 进行修改。,数据清理,逻辑纠错 逻辑
4、错误:在一份问卷上前后两个或多个有关联的 问题,回答的结果出现了明显的矛盾,不 符合日常经验生活。方法:对于定类、定序或定距变量,可以采用列 联表进行检查,若发现问题可按照幅度纠错的 方法进行改正。对于定比变量可以在SPSS上建立新变量,分 析两个变量中存在的逻辑错误,然后运用逻辑 纠错的方法加以纠正,统计整理,统计整理是在初步整理的基础上进行的,主要是运用统计方法简化资料,在对资料分类(组)和汇总的基础上,是资料更加系统化和条理化。主要方法:统计分类(组)统计表 统计图,分类和分组,分类和分组都是根据研究对象的某些特征将其区分为不同的种类或组别。分类适用于全部数据分组适用于测量层次较高的数据
5、,分类和分组,分类及其意义 现象分类法:根据事物的外部特征或外在联系进行 分类的方法 本质分类法:根据事物的本质特征或内部联系进行 分类的方法,又称科学分类法 研究者要力求从现象分类过渡到本质分类,分类和分组,分类标志 是指一个概念或变量下类别的标志(值),是对概念的指示或标示 品质标志分类 反映事物的属性或性质差异 数量标志分类 反映事物的数量差异,一般根据研究需要规定数 量界限,频率和频率统计,频数统计是计算一组数据中不同取值的个案次数分布频率统计是计算一组数据中不同取值的频数相对于总数的比率分布对样本较大的定比数据进行分组统计 单值分组法(标志值范围小),频数和频率统计,组距分组法(标志
6、值范围大)起点数值(最小数值)称为下限 终点数值(最大数值)称为下限“上限不在内”原则,统计表,统计表的结构,统计表,统计表的类型 简单表:对总体不经任何分组的统计结果 分组表:也称次数分布表,是对同一总体按某一 指标或变量进行分组以后的统计结果 复合表:也称交互分类表或列联表,是对同一总 体将两个或三个指标或变量结合起来分组 的统计结果,统计表,统计表,统计表的制作 标题既简洁又确切 纵栏标题和横行标题要准确反映变量取值的含义 数据资料注明计量单位 一般的频数分布表列出合计栏,复合表根据需要 列出统计值 线条简单,左右不封口,表头与表身以线条隔 开;表内不用竖横线;表最上下面的横线可稍粗 小
7、数点对齐,数字精确一致;相同的数值也要写 出;无数字以“”代替,暂缺以“”代替,统计图,统计图:根据统计数字,用几何图形、事物形象和地图等绘制的各种图形。条形图:以桩柱的长短或高低表示事物和现象的大小多少,统计图,2.圆形图(饼状图):显示各部分在总体中所占的比重以及各部分进行比较,统计图,3.折线图(曲线图):通过上下变化的曲线反映变量随时间变化的过程或发展趋势,统计图,4.直方图:以矩形的面积表示组距次数分布的图形,(次数折线图),统计图,5.线性图:描述某一变量随着另一连续或近似连续变量发生的变化,统计分析初步,集中数量分析 用一个典型值或代表值反映一组数据的一般水平或 平均状况,表明多
8、个事物的某一数量属性在一定时间、地点和条件下的共同性质常用方法:算术平均数 中位数 众数,集中数量分析,算术平均数 它是一组数据之和除以这组数据之项数 平均数(Mean)一般以M表示 对数据利用率最高,但易受极端数值影响 由分组资料求算术平均数 单值分组资料:组距分组资料:,集中数量分析,中位数 简称Md,是指处于一组按大小顺组排列的数据的中间位置的那个数值 对数据的利用效率最低基本步骤:将数据按照大小或高低排列 计算累计次数 计算中位数的位置,即n+1/2 在原始数据和单值分组资料中可通过观察 找到中位数的位置由组距分组资料求中位数,集中数量分析,众数 一组数据中重复出现最多的值(Mode),简称 Mo 在组距分组资料中,次数最多一组的组中值极为 众数 数据相差悬殊,众数可以很好反映,