《《传播研究方法》第七讲.ppt》由会员分享,可在线阅读,更多相关《《传播研究方法》第七讲.ppt(61页珍藏版)》请在三一办公上搜索。
1、传播研究方法,第七讲:抽样的逻辑,中国青年政治学院 赵菁 2015年10月29日,一、指标/指数(Index)和量表(Scale),相同点:都是对变量的序列测量(ordinal measures)都是对变量的复合测量(composite measures)不同点按赋值的不同加以区分:指标:简单对各题项(items)得分加总(各题项的权重都是1);量表:对不同的题项赋予不同的权重(反映概念的重要性或程度的差别),二、指标(Index)的建构,选择可能的项目表面效度、单一维度【聚合效度】考察其经验关系项目间经验相关将多个选项结合成指标并赋值相同权重处理缺损资料(missing data)5种方法鉴
2、定指标内在鉴定、外在鉴定,三、量表的建构,李克特量表(Likert scaling)1930s,by Rensis Likert使用标准化的回答分类【非常同意、同意、不同意、非常不同意】,并以此决定不同项目的相对强度。对某人的态度进行定序测量总加量表的一种:一个人在量表中的得分由 加总而成。例:一个人际关系量表,三、量表的建构,李克特量表(Likert scaling)赋予各类别的分值是随意的,并不表示该测量为定距或定比测量。该量表优势:简便性该量表劣势:1)量表项目的不同组合却可能带来相同的总分;2)“反应定势”也是潜在威胁。,三、量表的建构,瑟斯通量表(Thurstone scales)1
3、920s,by Louis Thurstone,method of equal-appearing intervals,斯通等距量表量表逻辑:比较判断。我们可以辨认每一个被评价的概念是否有“最常见的反应”。如果很多人都认为这两个事物不同,那么对于这两者“最常见的反应”也将彼此远离。应用很少,三、量表的建构,鲍嘎德社会距离量表(Bogardus social distance scale)判断种族、群体之间的社会距离。要求一个群体的成员确定她/他愿意与目标群体保持多远的距离。1920s,by Emory Bogardus量表逻辑:如果某人愿意接受某种强度的项目,那么他/她就应该愿意接受该项目之前
4、的所有项目;受访者一旦反对某个项目,则对比该项目更困难的项目也会持反对态度。着眼于社会多数团体间的社会距离。,假设有来自德国的交换生,对于如下情境请给出你的第一反应,选择是或不是:他/她作为访客在你的学校住一个星期;作为全职学生在你的学校读书;和你选了相同的几门课,一同上课;在班级里和你同桌,与你一起学习、考试;和你住在同一楼层的寝室;作为同性室友一起居住;作为异性和你约会。,研究者希望研究大一新生对于从德国和尼日利亚来的交换生的社会距离,希望发现学生会认为从非洲来的交换生心里距离更远,还是从欧洲来的交换生心理距离更远。询问大一新生如下问题:,鲍嘎德社会距离量表举例,新生报告感觉舒适度百分比
5、尼日利亚 德国访客 100%100%成为全职学生 98%100%同一个班级 95%98%在一起学习 82%88%同一个公寓楼层 71%83%同一间寝室 50%76%约会 42%64%,你愿意让黑人:生活在你的国家吗?生活在你的社区吗?住在你们那条街吗?做你的邻居吗?同你的子女结婚吗?请在你愿意的问题的方框那里打一个号。,鲍嘎德社会距离量表举例,局限性:我们对一组陈述具有单维性的假设是有局限性的。单维的领域往往很难找到。,三、量表的建构,语意差异量表(Semantic differential)1950s,间接手段测量某人对于某概念、物体或他人的感觉。受访者被要求根据两个相反意义的形容词来评判某
6、事。三个主要的意义类别:评价(好-坏);能力(强-弱);行为(积极-消极)例:评估新开设的音乐欣赏课的效果,请阅读如下成对的形容词,将最接近你第一印象的描述标记在空白空间内。答案没有正确与否之分。,你对于离婚感受如何?不好的 好的安静的 吵闹的简单的 复杂的现代的 传统的快速的 缓慢的公平的 不公平的,语义差异量表举例,三、量表的建构,哥特曼量表(Guttman scaling)在数据收集之后评估数据;1940s,by Louis Guttman测量一系列【3-20个】指标或项目【yes/no;present/absent】,认为其中存在分等级的逻辑关系;将结果放入哥特曼量表中,考察项目之间是
7、否形成某种模式与其逻辑关系相对应。注意:要考察所有可能的项目结合方式【例:小女孩是否知道她的年龄、她家的电话号码;三个当地政府官员;一共8种可能性】哥特曼量表图示分析(scalogram analysis):检验项目间是否存在等级关系。【例:小女孩知道自己的年龄比知道电话号码简单;知道电话号码比说出三个当地政府官员名字简单。三个变量间存在等级关系】存在等级关系称作:scaled;不存在等级关系称作:nonscalable/errors,哥特曼量表举例,Crozat(1998)研究公众对多种政治抗议形式的反应。他检查了1974-1990年间在英国、德国、意大利、荷兰和美国所做的公众对于政治抗议形
8、式的接受度调查数据,发现公众接受形成了一个哥特曼量表。那些接受最激烈政治抗议形式(如罢工、静坐)的人几乎也会接受更加温和的抗议形式(如请愿、示威等)。,本讲概要,引言非概率抽样概率抽样的逻辑和理论,一、引言几个例子,宿舍突击卫生检查期中教学检查电视台路边采访天安门警卫查身份证国家人口普查/社会经济普查,一、引言为什么抽样?,研究项目的资源有限,不可能对总体进行调查(特例:10年一次的人口普查);抽样可以使研究的质量有所改进【集中使用资源,聘用训练有素的工作人员,降低非抽样偏倚(如,无回答偏倚、测量误差、录入误差等)】。,一、引言政治民意调查,2004年美国总统大选,各个民意测验机构尽管存在差异
9、,但均一致认为双方势均力敌,以致难以预料输赢。猜想:这些民意调查专家访问了多少受访者,使其对大约1.15亿选民的行为预测的误差不超过两个百分点?,2004总统大选前夕所预测的民意调查结果,2004总统大选前夕所预测的民意调查结果,2004总统大选前夕所预测的民意调查结果,“911”前后布什支持率,一、引言观察与抽样,政治民意测验,以及社会研究的其他形式,都以观察为基础。社会研究的首要问题是决定观察什么、不观察什么。抽样,就是选择观察对象的过程。如果想从样本推论到更大的总体,就需要概率抽样(Probability Sampling),它涉及到随机抽样(Random Selection)的概念。,
10、一、引言抽样简史,阿尔夫兰登(Alf Landon)OR 罗斯福(Franklin Rooselvelt)?从1920年到1932年的大选,Literary Digest依托从电话簿及车牌登记名单中所选出的访问对象,询问其在即将到来的总统大选中会投票给谁,均准确地预测了大选结果。1936年,LD进行了最具雄心的民意测验:以同样的方式将选票寄给全美1000万选民,最后收到200万人的反馈:结果显示有57%的人支持共和党候选人阿尔夫兰登。但是,两周后的投票结果显示,罗斯福以历史上最大的优势,61%的得票率,连任美国总统。,问题1:回收率低;问题2:抽样方式排除了穷人,一、引言抽样简史,托马斯杜威(
11、Thomas Dewey)OR 哈利杜鲁门(Harry Truman)?与LD相反,1936年,乔治盖洛普(George Gallup)以配额抽样(Quota sampling)的方法,准确地预测了罗斯福将击败兰登;之后准确地预测了1940、1944年的总统当选人。但以同样的方法,1948年,盖洛普错误地预测纽约市长杜威能击败当时在位的杜鲁门而当选总统。问题1:样本不具代表性。配额抽样要求研究者必须对总体情况有所了解,但二战促成了大量农村人口涌入城市,很大程度上改变了1940年人口普查资料显示的人口特征。问题2:取样偏倚【无回答问题的处理】,一、引言两种抽样方法,非概率抽样(Nonprobab
12、ility Sampling)多为质化研究采用概率抽样(Probability Sampling)从一份名单中选出“随机样本”,样本代表总体;是社会科学研究中选取大型和具代表性样本的主要方式,为量化研究所采用。,二、非概率抽样(Nonprobability Sampling),无法选择概率样本时(如无法获得总体名单),可以进行非概率抽样。基于研究者的主观判断,以手头进行的研究所要达到的特定目标为判断的依据。样本不具有代表性,不可推论总体,二、非概率抽样(Nonprobability Sampling),7种非概率抽样:偶遇样本/方便样本/就近法(Haphazard,Accidental,or
13、Convenience Sampling)目的/判断抽样(Purposive or Judgmental Sampling)配额抽样(Quota Sampling)滚雪球抽样(Snowball Sampling)反常案例研究/极端案例抽样(Deviant Case Sampling)序贯抽样(Sequential Sampling)理论抽样(Theoretical Sampling),二、非概率样本,偶遇样本/方便样本/就近法(Haphazard,Accidental,or Convenience Sampling)1)电视台拦下路人做访问、碰到谁就访问谁;2)报社要求读者从报纸上剪下问卷填好
14、寄回;3)寻找志愿者访问是一种极其冒险的抽样方法。只有在研究目的是要了解在某特定时间内通过抽样地点的路人的一些特征,或采取更少冒险性的抽样方法不可能时,才具合理性。要非常谨慎做推论,且应提醒读者注意这种方法的危险性。例:马杰伟:酒吧工厂:南中国城市文化研究,江苏人民出版社2006年版。“第二部分 酒吧工厂现场日志”,便利样本:田野选择,寻找落脚点 参与式研究,最困难的起步点,是找到合适的场地,以及得到有关单位的主管批准进入现场。马杰伟有两个朋友在东莞开设玩具厂十多年,其中一间集善玩具厂规模较大,员工一千多人,是我们的首选。,民族志要进入生活现场,但那个现场并非你个人的场所。别人有别人的生活和工
15、作,接受你,双方也“难受”,无端来一个陌生人,走入你的办公室,闯进你公司的商业网,参与你的董事会议,就算想一想也烦 下班后,老板之一的李太派司机到酒店接马杰伟。回港途中,李太在闲谈间轻轻顺带一句:“我们几个老板商量过,觉得你在工厂收集收据,可能不太方便,真的不好意思”,第十章:工厂的劳动人生,便利样本:访谈对象,来自某一成员的介绍是民族志学者进入一个群体的最佳门票。社区成员也许对民族志学者个人或者他的工作不感兴趣。一个中间人或者“媒人”帮助者(facilitator)能够为其打开门户。这个帮助者应该在该群体中有着相当的信用度。该中间人与社区的关系越密切越好。在研究的初始阶段,该群体对于中间人的
16、信任会延伸至民族志学者的信任【晕轮效应】。田野作业者总是无法找到提供介绍的最佳人选,而只得顺应于身边可供利用的资源。,二、非概率样本,目的/判断抽样(Purposive or judgmental sampling)依据研究者对研究目的的判断(如:总体、其组成部分、研究目的)来选择适当的抽样方法。常为实地研究者所采用。民族志学者依赖他们的判断,基于研究问题,来选择该亚文化或单位中最适合的人群。马杰伟:时尚志,复旦大学出版社2012年版。“第一部分 北京时尚产业笔记”,判断取样:研究案例的选择,第一次在北京看见“时尚大厦”站立在城市的心脏能够地带,直觉立刻告诉我她对城市文化的意义。个人化的疏离城
17、市中,她或可被视为一个时尚图腾,生产身份归属,制造想象社群,并且接驳境外的文化资源,为中国的城市一族缔造幻象。回想起来我几乎是第一眼直视“时尚大厦”的那一刻,就决意要走进去看个究竟。而在往后的几年,城市高楼中的这一座大楼,真的经常出现在我对城市文化的思考之中。时尚志:2.2图腾,二、非概率样本,配额抽样(Quota sampling)从建立描述总体特征的矩阵或表格开始。一旦建立起矩阵,矩阵中每一个格子(cell)就有了相应的比例。研究者根据研究目的的不同从不同的格子中选择样本并收集资料。代表每一个格子出现的人,按照这些格子相对于总体的比例,给予加权。缺陷:配额的框架必须精确,为什么配额样本仍为
18、非概率样本?,配额样本与概率样本、特别是分层样本有许多相似之处,但是在一个重要的方面却不相同:配额样本中(类别内/格子内)个体的选择是目标取样,而非按照随机原则抽取。例:告诉调查员,在某一邻里地区选取的被调查人数中,白人和黑人各多少,或男性和女性各多少。但是,配额样本是由调查员选择的。每当调查员在遇到拒绝接受调查的情况时,或找不到户中任何人的时候,只是简单选取另外一个人/一户人进行调查而已。因此,调查员总是可以得到要求的调查数,但是总体中那些难于联系到的被调查人的比例却可能会被低估。,二、非概率样本,滚雪球抽样(Snowball sampling)先收集目标群体少数成员的资料,然后再向这些成员
19、询问有关信息,找出他们认识的其他总体成员。即,根据既有研究对象的建议找出其他研究对象的过程。如此,样本会随着受访者不断提出别人的名字,而像“雪球”一样越滚越大。在特定总体的成员难以找到时(如社会边缘群体、松散的组织成员),滚雪球抽样是最适合采取的一种抽样方法。常用语探索性研究。,滚雪球抽样举例:友谊关系网图,二、非概率样本,反常案例研究/极端案例抽样(Deviant Case Sampling)研究者选取与主导范式/特征不同的案例进行研究,目的是通过考察主体范式之外的案例,更多的认识社会生活。是一种特殊的目的样本。例:对中产阶级家庭孩子的辍学研究,二、非概率样本,序贯抽样(Sequential
20、 Sampling)目的抽样:研究者尽可能发现相关的案例;序贯抽样:研究者持续收集样本,直到穷尽案例的多样性,或信息不可能再丰富为止。要求研究者持续评估所有案例。例:研究者打算对60位70岁以上、失去配偶超过10年的寡妇进行深度访谈。此时,根据序贯抽样之目的,再对另外20位生活经历、社会背景、世界观与之前60位没有多大差别的寡妇进行访谈就是没有必要的。,二、非概率样本,理论抽样(Theoretical Sampling)样本(如人、情景、事件、时间段等)来自于扎根理论(Grounded theory)。研究者基于想提出的新洞察来选择样本。例:田野调查者在工作日对一群人在某一地点进行参与观察。理
21、论上,研究者想知道这些人在非工作日/其他地点是否有相同的行为,此时,就可能将这群人在其他时间段(如周末或晚上)的行为纳入样本中。,表:非概率抽样的类型,三、概率抽样的逻辑和理论,当研究者试图精确地、统计性地描述大型总体时,就要用到概率抽样(probability sampling)。如果所有总体中的成员在所有方面人口特征、态度、经历、行为等都相同,那么就无需进行仔细的抽样了。在这个同质性极高的总体中,一个个案就足以成为整个总体的样本。但是,构成人类总体的个体之间天然地在各个方面都有所差别。要对总体进行有用的描述,从该总体中抽样出来的样本必须包含总体的各种差异特征。抽样误差(sampling e
22、rror):与抽样相关的误差。,100个人的总体,样本旨在反映大规模总体的特征。假设由100人组成的小总体。,一个方便的样本:易得但没有代表性,三、概率抽样的逻辑和理论,代表性(Representativeness)当选出的样本的各种集合特征大体接近于总体的集合特征时,样本就具有代表性。样本不需再每一方面都具有代表性,代表性只需局限于与研究的实质性需要相关的特征。概率抽样的基本原则:总体中的每一单位都有一个已知的、非零的被包含在样本中的概率,尽管对于总体的所有单位而言,选择的概率并非总是相同的。EPSEM(Equal probability of selection method):在这种样本
23、设计中,总体中的每个成员都具有相等的被选进样本的机会。概率抽样的独特优点:虽无法完美地代表总体,但能避免各种偏见;能够估计样本的精确度及代表性。,三、概率抽样的逻辑和理论,随机选择(Random Selection)获得代表性样本的核心步骤。随机并非偶然,而是一种非常仔细的特别的程序,能确保每一样本单位的选择都独立于其他单位的选择。独立:总体中的任何一个成员的选择都不会对总体中任何其他正在被选择的成员的选择的可能性产生影响。例如:投掷硬币以随机数表或电脑程序完成。随机选择的优点此过程可以避免研究者自觉或不自觉的偏见;符合概率理论,提供了估计总体参数和抽样误差的基础。,三、概率抽样的逻辑和理论一
24、些基本概念,总体(Population):我们感兴趣的、试图概括的群体或集合体。如:美国人要素(Element):构成总体的单位,也是样本所包含的内容。在一个既定研究中,要素与分析单位往往是相同的。要素用于抽样,分析单位用于资料分析。样本率(sampling ratio):样本个案数和总体之比,即n/N.例:总体包含50,000人,研究者从中抽取150人作为样本,则样本率为,150/50000=0.003 or 3%,三、概率抽样的逻辑和理论一些基本概念,样本框(Sampling Frame)“总体”是个抽象的概念。样本框:用于抽样的总体列表。如果样本能够代表总体,则其样本框必须包含所有(或几
25、乎所有)的总体成员。例:对某正式组织的研究【成员名单即为样本框】,三、概率抽样的逻辑和理论一些基本概念,样本框(Sampling Frame)注意1:样本框与总体不匹配固定电话号码簿:并不包含新近申请而尚未列入的用户,也不包含不愿意列名的用户。阶级偏差:穷人、流浪人群没有办法申请固定电话;有钱人可能有一部以上的固定电话。【1936年LD的民意调查】街道图:都市社区中,违章建筑不会出现注意2:经过正确抽样所得的样本信息,只适合于描述构成样本框的要素组成的总体,不能扩展。,三、概率抽样的逻辑和理论一些基本概念,参数(parameter):对总体中某变量的概括性描述。统计值(statistic):对
26、样本中的变量的概括描述,并被用来估测总体参数。,三、概率抽样的逻辑和理论一些基本概念,抽样单位(sampling unit)抽样过程中的基本单元。在简单随机抽样中,抽样单位是个体(individuals);在群集(cluster sampling)抽样中,抽样单位是由个体组成的群集。层级(stratum):样本的一个子集。层级的划分通常是研究所关心的某一变量为依据。同一层级中的个案,就该变量而言,是同一的(homogeneous)。,拥有0-9美元的10人总体,总体平均值:(0+1+2+3+4+5+6+7+8+9)/10=4.5美元,抽样分布,1样本时的抽样分布,每次抽1个样本,对总体进行10
27、次随机抽样;图中10个点代表10个可以估计总体的“样本”平均值;点的分布称为“抽样分布”;显然,只选择一个样本的抽样很不理想,错失4.5美元这个真正平均值的可能性太大了。,3样本时的抽样分布,4样本时的抽样分布,5样本时的抽样分布,6样本时的抽样分布,每增加一次样本容量,估计平均值的抽样分布就都有一些改进。所选择的样本量越大,根据样本的值来估测总体参数就越准确。,抽样结果可能的分布范围,假设研究州立大学的学生对校方拟实行的一套学生管理条例的态度。研究总体为20,000名该校注册学生,随机从中抽取100名学生为样本以估计总体的情况。假设学生中有一半赞成,一半反对(研究者预先并不知道这一情况)。,
28、三种假设的抽样所产生的结果,对学生名册上的每一个学生予以编号,使用随机数表选出其中的100位,询问其对于校规的态度。其中:48位学生赞同,52位不赞同;以相同的方法选出另外100个样本。结果:51%赞同;在第三组样本中,有52位学生持赞同态度。,抽样分布,如果扩大抽样数量,我们会发现,虽然抽样结果分布在一个相当大的范围内,但是大部分的抽样结果都出现在图中的50%附近。,抽样误差(Sampling Error),标准误:某抽样设计的期望误差程度;指出抽样结果集中在总体参数附近多大的范围内。其中一种测量方法:P、Q:二项变量的总体参数值60%的学生赞成校规而 40%的学生反对,则P=60%,Q=6
29、0%N:每组样本包含的样本量【如n=100】S:标准误,抽样误差(Sampling Error),一定比例的样本估计值会落在总体参数值的某个增量内,一个标准误为一个增加单位。大约34%的样本估计值会落在大于总体参数值一个标准误的范围内;另外34%的样本估计值会落在小于总体参数值一个标准误的范围内。标准误5%:有34%的样本估计值会落在50%-55%的范围内,另有34%的样本估计值会在50%-45%范围内。总体而言,大概有68%的样本统计会集中在与参数值相差正负5%的范围内。,置信水平(Confident Level)和置信区间(Confident Interval),置信水平:总体参数落在一既定置信区间的估测概率。例如:我们有95%的信心说35%-45%的投票者会支持候选人A。置信区间:估测总体参数值的范围。例如:我们有95%的信心保证样本统计值会落在与参数值相距正负5%的范围内。置信区间扩大时,置信水平也会增加。几乎所有样本估计值(99.9%)都会落在与真实值相距三个标准误的范围内。,