《抽样设计》PPT课件.ppt

上传人:小飞机 文档编号:5515582 上传时间:2023-07-15 格式:PPT 页数:126 大小:2.71MB
返回 下载 相关 举报
《抽样设计》PPT课件.ppt_第1页
第1页 / 共126页
《抽样设计》PPT课件.ppt_第2页
第2页 / 共126页
《抽样设计》PPT课件.ppt_第3页
第3页 / 共126页
《抽样设计》PPT课件.ppt_第4页
第4页 / 共126页
《抽样设计》PPT课件.ppt_第5页
第5页 / 共126页
点击查看更多>>
资源描述

《《抽样设计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《抽样设计》PPT课件.ppt(126页珍藏版)》请在三一办公上搜索。

1、第三章 抽样设计,案例1 1936年,美国总统选举前夕,两家民意测验机构就谁将当选总统进行民意调查。,调查结果是:共和党候选人Landon将以压倒多数的票数当选总统。,文学文摘杂志耗资50万,发放1000万份问卷,回收200万份。,盖洛普(Gallup)美国舆论研究所抽了3000个选民,预测结果是:,先来看一个例子!,调查结果是:Roosevelt的得票率为54,当选为总统!,文学文摘失败的主要原因是:他们按照电话簿发放问卷,而当时安装了电话的都是比较富有的人,因此,他们所调查的结果仅代表了比较富有的人的意见,样本缺乏代表性。由这个例子可以看出,科学地设计抽样方法很重要!,收视率是指:收视人数

2、除以整个市场电视人口数的百分比(如:收视率2,意味着100个人中有2个人收看)收视率影响广告商愿意花多少钱来买某节目的广告,以及该节目播不播下去。,案例2:电视收视率调查,收视率在中国,央视索福瑞公司AGB尼尔森公司,尼尔森公司2008春晚收视率调查,总体:4.24亿收视人群样本:全国14省市14,000户家庭(装有个人收视记录仪)标志:某一时段是否在看春晚节目指标:全国家庭收视率71.8%央视索福瑞调查结果春晚收视率为96.5%,央视索福瑞CSM公司,CSM在全国建立了9个省网、67个单独城市调查站,样本总规模达到18,500户2008年春晚播出时,对全国406个区县进行了3个多小时的电话调

3、查。共访问成功2063个家庭,其中1899个家庭收看了春晚,加权推算出全国有96.5%的家庭收看了央视春晚。,北京奥运会开幕式收视率,央视索福瑞:68.8%家庭AGB尼尔森:86.8%家庭,第三章 抽样设计,第一节 市场调查的基本类型第二节 抽样调查的基本程序第三节 抽样调查方法第四节 确定样本容量第五节 抽样误差,第一节 市场调查的基本类型,一、全面调查,第一节 市场调查的基本类型,为了掌握被研究对象的基本情况,收集全面、准确的调查资料,对调查对象的全部单位进行的逐一的、无遗漏的专门调查。也称普查。,1、含义,案例:第三次全国人口普查,第三次全国人口普查,从1979年底成立国务院人口普查领导

4、小组开始,到1985年11月正式结束,历时约六年。共花费人民币4亿元,其中包括联合国资助1560万美元。投入了518万普查员,109万普查指导员,13万编码员,5000余名计算机工作人员,并得到1000多万基层干部群众的配合。此次普查规定人口登记的标准时间为1982年7月1日零时,全国各地都是在此时同时开展调查工作,并在10天以内完成调查登记工作。所调查的项目包括:姓名、与户主关系、性别、年龄、民族、文化程度。,第一节 市场调查的基本类型,(1)调查资料的准确性和标准化程度较高,(2)适合了解市场的基本情况和调查总体的特征,(3)花费的人财物和时间较多,2、特点,第一节 市场调查的基本类型,二

5、、抽样调查,引例:假设有若干个白豆子和若干个黑豆子混装在一只桶里。请问你如何以最快的速度知晓桶里的白豆子和黑豆子各有多少呢?,第一节 市场调查的基本类型,日期10.3011.211.1311.1311.2311.2311.3411.34选举结果,主办机构New York Times(纽约时报)Reuter(路透社)Harris Poll(哈里斯民意测验)ABC(美国广播公司)NBC(国家广播公司)USA Today(今日美国报)Gallup(盖洛普公司),克林顿5449515251515149,多尔3541393938383840,佩罗特98979999,其他22122222,候选人得票百分比

6、,案例:美国1996年大选,调查研究总体:美国全体选民调查访问样本:2000名选民,(11月5日公布),第一节 市场调查的基本类型,抽样调查是采用一定的组织形式、按照一定的程序从所研究对象的全体(总体)中抽取一部分个体(样本)进行调查,用所获取的数据对总体的一定目标量作出推断。,1.什么是抽样调查,返回本章,2.抽样调查的种类,随机抽样,是按概率原则,从总体中抽取一定数目的单位作为样本进行观察。非随机抽样,是从方便出发或根据研究者主观判断来抽取样本。(简单易行,尤适用于探索性研究),3.抽样调查的几个基本概念,总体与样本总体(Population),是所要调查的全体,其中每个被调查对象叫个体。

7、样本(Sample),是总体的一部分,是从总体中抽选出来所要直接观察的全部个体。如:从某省总数为10万人的大学生总体中按照一定方式抽取出1000名大学生进行调查,这1000名大学生就是构成总体的一个样本。(从一个总体中可以抽取出若干个不同的样本),课堂讨论,为了了解统计学专业本科毕业生的就业情况,我们调查了某地区30名2010年毕业的统计学专业本科生实习期满后的月薪情况。什么是总体?什么是样本?芜湖电视台想了解生活频道栏目在芜湖的收视率情况,于是委托某市场咨询公司进行一次电话调查。该项调查的总体是什么?该项调查的样本是什么?,总体指标与样本指标,总体指标是根据总体中各标志值计算的,用于反映总体

8、数量特征的定量指标,也称全及指标或总体参数。,样本指标是根据样本中各标志值计算的,用来估计和判断总体数量特征的随机性指标,也称为抽样指标。,返回本章,3.抽样调查的几个基本概念,大样本与小样本根据抽样调查中所抽选样本容量不同而划分的。当样本数目大于30时,称为大样本;当样本数目小于30时,称为小样本。,3.抽样调查的几个基本概念,重复抽样与不重复抽样重复抽样,又称回置抽样(有放回抽样),是一种在总体中允许重复抽取样本单位的抽选方法。抽样过程中总体个体数始终相同。不重复抽样,又称不回置抽样(无放回抽样),即先被抽选的个体不再放回到总体中去,任何个体一经抽出就不会再有第二次被抽取的可能性。抽样过程

9、中,总体个体数逐渐减少。,3.抽样调查的几个基本概念,抽样框与抽样单元抽样框,指供抽样所用的所有调查单位的详细名单抽样框有两类:(1)从一个调查单位总体中抽取样本,可称为一次性抽样框。(2)抽样工作要经过两个或更多阶段才能完成,各阶段有不同的抽样框。如:从某所大学全体学生中直接抽取200名学生作为样本该校全体学生的名单 从某一所大学所有班级中抽取3个班级作为样本该校所有班级的名单抽样单元,为了便于抽样,通常把总体划分为有限个互不重迭又穷尽的部分,每个部分称为一个抽样单元。,3.抽样调查的几个基本概念,4.抽样调查的适用范围,无法全面调查的情况,如全国性城市居民住房面积的调查。不必要进行全面调查

10、的情况,如产品质量的检测。需要快速得到调查结果,如节令市场的状况调查。在经费、人力、物力和时间有限的情况下开展的调查。对全面调查进行验证。对某种总体进行假设性检验,也常用抽样调查来检验判断这种假设的真伪。,第二节 抽样调查的基本程序,第二节 抽样调查的基本程序,对总体的范围与界限做明确的规定,清楚地说明研究对象的人口统计学特征(时间、地点、年龄范围、收入范围、性别等)。,例:2010年6月,上海市18-35岁青年,一、界定调查总体,第二节 抽样调查的基本程序,宠物食品,一个定义明确的总体包含以下几个方面:,抽样单位是什么?(家庭、个人)什么条件指定包括在内?(人口统计特征、使用情况、认知)时间

11、限制如何,要获取的信息属于哪一段时间?空间限制如何,包括哪些地区?,第二节 抽样调查的基本程序,依据已明确界定的总体范围,收集总体中所有样本单位的名单,建立供抽样使用的抽样框。准确的抽样框原则:1、完整性总体中的每一个元素都必须包含在名单中2、不重复性每一个元素都只对应于名单中的一个号码,问:为了解重庆市中学生的饮料消费情况,需要从全市500所中学中抽取10所中学,再从每所抽中的中学中抽取3个班级,最后从每个抽中的班级中抽取10名中学生。需要选择哪些抽样框?答:分别收集三个不同层次的抽样框:全市500所中学的名单、每所抽中的中学里所有班级的名单、每个抽中的班级中所有学生的名单。,二、选择抽样框

12、,以合理的成本选择误差最小的抽样框,第二节 抽样调查的基本程序,课堂小练习,请确定下面这些可能的抽样框。1、网球运动员 2、养狗的人 3、宝马车的拥有者,依据研究目的的要求、各种抽样方法的特点,以及其他限制因素决定采用哪种抽样方法。,三、确定抽样方法,考虑调查精确度的要求、总体性质、抽样方法和人力、财力等客观条件确定样本的大小。其原则是:“代价小,代表性高。”,四、决定样本大小,第二节 抽样调查的基本程序,在上述几个步骤的基础上,严格按照所选定的抽样方法和数量,从抽样框中抽取一个个的样本单位,构成样本。,五、抽取样本,如何确定替代受访者:舍弃、过多抽样、再抽样,第二节 抽样调查的基本程序,对样

13、本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于样本与总体偏差过大而导致失误。,六、评估样本正误,其基本方法是:将可得到的总体资料(如人口普查资料),与样本中的同类指标进行对比。通常使用两个或两个以上的标准。,第二节 抽样调查的基本程序,第三节 抽样调查方法,按每个同学的学号进行抓阄按全班同学的寝室进行抓阄分为男生和女生两组,每组各5张,再采取抓阄的形式给今天到得最早的十个同学给十个我认识的同学,第三节 抽样调查的方法,十张电影票的故事,一、概率抽样,按照概率原理进行抽样,使总体中的每个样本单位都有一个已知的、非零机会被选入样本中,从而避免抽样过程的人为误差。又叫随机抽样。,第三

14、节 抽样调查的方法,非概率抽样:无法估计个体被选中的概率。,第三节 抽样调查的方法,(一)简单随机抽样,1、含义,从总体中不加任何分组、排队,完全按照随机原则抽取样本单位的抽样方法。又称纯随机抽样、简单任意抽样。,抓阄彩票,(1)乱数表法 在乱数表中任意选定一行或一列的数字作为开始数,接着可从上而下,或从左至右,或一定间隔(隔行或隔列)顺序取数,凡编号范围内的数字号码即为被抽取的样本个体号码。如果不是重复抽样,碰上重复数字应舍掉直到抽足预定样本数目为止。,例如:有如下数字:13、45、65、36、22、24、31、43、61、52、55、16、23、14、25。每隔两位取一个数字,即可得到:6

15、5、24、61、16、25。,2、操作办法,(一)简单随机抽样,(2)抽签法:对各样本单位编号,制作同等规格、不同编号的卡片,充分混匀后随机抽取卡片,所抽取卡片的编号对应的样本单位即组成样本。适合于规模较小的总体。,第三节 抽样调查的方法,(3)摇号法:使用专门的机器对事先编号的各样本单位进行选择。适合于规模较大的总体。,(一)简单随机抽样,3、简单随机抽样的优缺点,(1)优点直观明了易估计总体指标适合与其他抽样方法结合使用,第三节 抽样调查的方法,(2)缺点需要所有样本单位的完整列表对于分散的大规模总体,实施抽样困难忽略总体已有的信息,抽样误差大,4、简单随机抽样方法的适用性,总体数量较小易

16、获得所有样本单位的完整列表样本单位之间差异程度较小或难以分组总体在空间范围内较为集中采用电子技术辅助调查的方法时,如CATI,第三节 抽样调查的方法,(二)系统抽样,1、含义,系统抽样:将各样本单位按某标志值的大小进行排序,按照时间或空间上的相等间隔来抽取样本。又称等距抽样、机械抽样。,按有关标志排序:比简单随机抽样更具代表性,按无关标志排序:等同于简单随机抽样,第三节 抽样调查的方法,2、操作办法,将所有样本单位按某种标志排列,并连续编号;计算抽样距离:K=N/n;(遇小数四舍五入)在第一段抽样距离内,完全随机地抽取一个号码,设其所在位置的序号是 k;自 k 开始,每隔 K 个样本单位抽取一

17、个,即所抽取的样本单位所在位置的编号依次为:k,k+K,k+2K,。k+(n-1)K,第三节 抽样调查的方法,1 2 3 4 5 6 7 8 9 10,11 12 13 14 15 16 17 18 19 20,21 22 23 24 25 26 27 28 29 30,31 32 33 34 35 36 37 38 39 40,41 42 43 44 45 46 47 48 49 50,51 52 53 54 55 56 57 58 59 60,61 62 63 64 65 66 67 68 69 70,71 72 73 74 75 76 77 78 79 80,N=90,n=10,则:K=

18、90/10=9;设k=6,81 82 83 84 85 86 87 88 89 90,第三节 抽样调查的方法,某城市有私营企业5989个,拟定样本量为100个,进行企业营销状况调查。请问如何使用系统抽样方法进行抽样?,练习,练习,某城市有私营企业5989个,拟定样本量为100个,进行企业营销状况调查。请问如何使用系统抽样方法进行抽样?,1、按照5898个私营企业的年销售额(或职工人数、利润总额等)进行排序;2、计算抽样距离:K=5989/100=59.89,约等于60;3、采用简单随机方法在160号中抽取一个号码作为第一个样本单位,如28;4、以序号28为起点,依照抽样距离确定所抽取的其他样本

19、单位编号为:88,148,208,。,直到抽足100个样本单位为止。,第三节 抽样调查的方法,3、系统抽样的优缺点,(1)优点直观明了,简单易行样本有较好的代表性适合与其他抽样方法结合使用,第三节 抽样调查的方法,3、系统抽样的优缺点,(2)缺点需要所有样本单位的完整列表需要了解排序后总体的周期性变化,队列赶场天,第三节 抽样调查的方法,4、系统抽样的适用性,总体数量较小易获得所有样本单位的完整列表时能够按某一有关标志进行排序对总体有足够的了解总体的差异程度较大时,第三节 抽样调查的方法,(三)分层抽样,1、含义,分层抽样:将所有样本单位按某一有关标志,分成相互排斥的不同类型,在各类中独立、随

20、机抽取样本。又称类型抽样,分层随机抽样。,第三节 抽样调查的方法,行业区域市场消费者,2、操作办法,确定分层的标志,如年龄、收入、职业;将总体(N)分成若干个互不重叠的部分(N1,N2,N3,。),每一部分为一层;根据样本量(n)大小,确定各层应抽取的样本量(n1,n2,n3,。);采用简单随机抽样或系统抽样的方法,从各层中抽取样本。,第三节 抽样调查的方法,子样本,n140,n2120,n340,N=20000,子总体,N14000,N212000,N34000,n=200,分层等比例抽样,ni/n=Ni/N,第三节 抽样调查的方法,分层等比例抽样,ni/n=Ni/N,练习,某地调查商业网点

21、销售情况。该地区有商业网点20000个,计划抽取样本200个。按企业规模分层,大型商店1500个,中型商店8500个,小型商店10000个。采用分层比例抽样法,应从各层选取多少个样本单位?,第三节 抽样调查的方法,答案,大型商店应选取样本数 n大=(1500/20000)*200=15(个)中型商店应选取样本数 n中=(8500/20000)*200=85(个)小型商店应选取样本数 n小=(10000/20000)*200=100(个),第三节 抽样调查的方法,分层等比例抽样,ni/n=Ni/N,N=20000,子样本,n160,n2120,n320,n=200,分层非等比例抽样(分层最佳抽样

22、),考虑各层在总体中比例、重要性、层内标准差计算抽取比例,ni/n=Ni*Si/Ni*Si,N14000,N212000,N34000,子总体,第三节 抽样调查的方法,S1300,S2200,S3100,练习,某机构要调查城市居民家用电器的潜在需求,这种商品的消费量与居民家庭收入水平相关。已知某城市有100万户家庭,且居民的收入水平差异较大,其中高收入家庭15万户,中等收入家庭65万户,低收入家庭20万户。本次调查拟抽取1000个家庭作为样本。请问:(1)该机构宜采取何种抽样方法?(2)这1000个数量的样本是如何构成的?,第三节 抽样调查的方法,练习,调研背景同前。在该城市中,高、中、低收入

23、家庭的标准差估计值分别为 S高=300,S中=200,S低=50 本次调查拟抽取1000个家庭作为样本。请问:(1)该机构宜采取何种抽样方法?(2)这1000个数量的样本是如何构成的?(3)以上两种方法有什么不同?,第三节 抽样调查的方法,3、分层抽样的优缺点,(1)优点样本具有很好的代表性便于了解总体内不同类别的情况便于组织实施和汇总数据,第三节 抽样调查的方法,3、分层抽样的优缺点,(2)缺点需要对总体有深入了解不易确定分层的依据必须事先已知各层的大小难以获得每个层次的抽样框,第三节 抽样调查的方法,4、分层抽样的适用性,适用于数量较大的总体总体各类别较明显(适合分类)层间差异大,层内差异

24、小,第三节 抽样调查的方法,(四)整群抽样,1、含义,整群抽样:将总体分为 S 个互不重叠的相似子群,从这 S 个群中随机抽取若干群,对选中的群内各样本单位进行普查。,第三节 抽样调查的方法,样本单位扩大后的简单随机抽样,2、操作办法,确定分群的标准(如行政区划、班级);将总体(N)分成 S 个互不重叠的群;根据样本量(n)确定抽取的群数;采用简单随机抽样或系统抽样的方法,从 S 群中抽取确定的群数;对所抽取群的样本单位进行普查,第三节 抽样调查的方法,N=900,n=300,a d e f b g i h i d f c h i c b c a h g d h i a c b d b a e

25、 i h e g c。,c b g i h i d f c b c a h g d h i a c b d b a e i h e g。,i d e i h i d f h i c b e h i a c b d h e。,第三节 抽样调查的方法,整群抽样,c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c。,e e e e e e e e e e e e e e e e e e e e e e e e。,h h h h h h h h h h h h h h h。,C,D,F,G,A,I,分层抽样,第三节 抽样调查的

26、方法,通信公司将对某大学学生的通信消费状况进行调查,样本数量为800个。公司对该大学的学生情况不太了解,而且很难得到所有大学生的人员清单。但他们通过努力,获得了该学校所有班级的名单。为此,研究人员拟采用何种抽样方法?其步骤是?,练习,第三节 抽样调查的方法,答案,采取整群抽样法。其步骤是:1、对该大学的学生以班级分成若干群;2、随机抽取20个班级(群);3、获取被抽取班级的人员清单;4、对该20个班级进行普查,获得最终样本。,第三节 抽样调查的方法,3、整群抽样的优缺点,(1)优点在组织实施上简单易行,易于调查管理节省人力、财力和时间,(2)缺点样本的代表性差,第三节 抽样调查的方法,4、整群

27、抽样的适用性,难以获得完整的抽样框时群间差异小,群内个体差异大时调查时间紧、经费少样本分布地区范围广、规模大的总体,第三节 抽样调查的方法,思考:分层抽样与整群抽样的适用范围有何不同?为什么?当群间同质性高,群内异质性高时,适合于采用整群抽样的方法当群间异质性高,群内同质性高时,则适于采用分层抽样的方法分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。,课堂练习:,某中学有4800名学生,分为4个年级,80个班,现在要抽取480名学生进行学生身体健康状况调查,运用简单随机抽样、系统抽样、分层抽样和整群抽样的方法分别如何抽取样本?,(五)多阶段抽样,

28、1、含义,根据样本单位之间的隶属关系,把抽样过程分为几个阶段进行。又称多阶段整群抽样、分段抽样。,第三节 抽样调查的方法,2、操作步骤,从总体中随机抽取若干大群(子群);再从这几个大群内抽取几个小群,这样一层层抽下来,直至抽到最基本的样本单位为止。,例,第三节 抽样调查的方法,3、多阶段抽样的优缺点,(1)优点便于组织和实施节省人力、财力和时间抽样技术灵活多样抽样框获取的难度小,(2)缺点累积抽样误差大,调查精确度低,第三节 抽样调查的方法,4、多阶段抽样的适用性,总体规模特别大样本单位的地区分布范围特别广当总体隶属关系、机构特征比较明显时,第三节 抽样调查的方法,案 例,某市有24000名教

29、师,分布在全市10个区的200所学校中。现要抽取一个由1200名教师组成的样本,了解他们的住房需求。如果按照三阶段抽样的方法,有以下各种不同的抽样选择。请评价以下哪个方案为优?,第三节 抽样调查的方法,第三节 抽样调查的方法,案 例,案例小结,B 如果又已知各抽样阶段子总体的差异程度如果区与区之间差别很大,则所抽的区的规模就要大一些,如方案1;反之,则小一点;如果区与区之间差别不大,而在每一个区中,不同学校差别很大,则减小第一阶段的抽样规模,加大第二阶段的抽样规模,如方案2;如区与区之间差别不大,且学校与学校之间差别也不大,则尽量加大第三阶段的抽样规模,相应减小第一、第二阶段的抽样规模,如方案

30、8或9。,第三节 抽样调查的方法,A 如果考虑样本具有较好的代表性一般来说,样本覆盖的面越大,样本的代表性越好。则方案3最好,依次递减,方案9最差;方案1、2居中;,D 综合考虑抽样误差和调查成本 相对增加开头阶段的样本数,适当减少最后阶段的样本数。也就是说,在人力、经费和时间允许的情况下,可选择方案4、5。,C 考虑研究者所拥有的人力和经费抽的区和学校越多,意味着所需的人力、经费和时间就越多。从这个方面考虑,则方案9最好,依次递减,方案3最差。,第三节 抽样调查的方法,二、非概率抽样,依据研究者的主观愿望、判断、是否便利等因素来抽取样本。,第三节 抽样调查的方法,(一)方便抽样,1、含义,方

31、便抽样:研究者根据自己方便的形式抽取样本。又称偶遇抽样。例如,向街头行人询问物价的评价、在食堂调查大学生的月消费支出、在运动场向运动的人调查运动时间、在柜台访问顾客、利用客户名单进行调查以及在报纸上通过登函件进行调查等。,街头拦访车友汽车顾客满意度调查,第三节 抽样调查的方法,2、方便抽样的优缺点,优点:简便易行、快速、费用低,缺点:样本代表性差,第三节 抽样调查的方法,3、方便抽样的适用性,探索性调查同质性强的总体时效性要求较高的调查流动性大的总体,第三节 抽样调查的方法,(二)判断抽样,1、含义,判断抽样:根据主观分析来选择、确定符合研究目标的样本。又称主观抽样、目的抽样。例如,调查客户评

32、价可以重点调查核心客户的评价。对全国城市家庭平均消费支出的调查应该选择3口之家。市场调查中,常用的典型调查、重点调查均属于此类抽样调查。,第三节 抽样调查的方法,2、判断抽样的优缺点,优点:充分发挥研究人员的主观能动性 简便易行,缺点:受主观影响大 依赖研究人员的工作经验和判断能力,第三节 抽样调查的方法,3、判断抽样的适用性,较大总体中某个容易辨认的次级集合研究人员对总体情况比较熟悉对总体中某类问题的研究,第三节 抽样调查的方法,(三)配额抽样,1、含义,配额抽样:根据某种标志分组,然后用判断抽样或方便抽样的方法抽取样本,并使拥有某种特征的样本单位比例与其在总体中的比例一致。又称定额抽样。,

33、分层随机抽样分层判断抽样美国总统大选,第三节 抽样调查的方法,只要类型划分详细,那么同一类型中的每个个体都是同质的,因而无需采用随机抽样。,只要类型划分合理,且分配给各类型的名额符合总体中各类人员的分布,那么样本就可以准确地反映总体。,配额抽样的假设,第三节 抽样调查的方法,(1)独立控制的配额抽样:这种方法只对具有某种特征的样本数规定配额,而对具有两种或两种以上特性的样本数则不作规定。,例1:控制特性为年龄、性别、收入三种,已经确定样本总数为360,按独立控制的配额抽样,则可列成如下三表:,2、分类,(三)配额抽样,(A),(B),(C),对独立控制的配额抽样的评价,具有调查员选择余地大、简

34、便易行、费用少等优点。但有时存在选择样本容易偏向某一类型而忽视其他类型的缺点。例如,问收入时偏向问男士。调查不够深入。,(2)相互交叉控制配额抽样,含义:又称为非独立控制配额。与独立控制配额抽样比较,不同在于样本要求同时具有交叉控制特征。规定被调查对象必须同时具有两种或两种以上特性并分配相应的调查数额。,相互交叉控制配额抽样方式的工作程序,1)确定控制特性。调查者可事先根据调查的目的和对象情况,确定调查对象的控制特性,作为总体的划分类别标准,如采用年龄、性别、收入、文化程度等作为消费者调查的控制特征。2)根据控制特征对总体进行分层,以各层个体数占总体的个体数计算出各层占被调查总体的比例。3)进

35、行配额分配,确定每层的调查样本数量。各类样本配额比例以各类单位在总体中所占比例为基础计算,然后再进行调整确定。4)由调查人员选择样本进行调查。在各层抽样数目确定后,调查者就在确定的样本配额限度内按要求任意选择样本进行调查。,课堂练习:某工厂有3000名工人,男工占30,女工70,30岁以下的60,3040岁的30,40岁以上的10,问如何采用相互交叉控制配额抽样的方法抽取一个规模为300人的样本?,1)在配额分配过程中能兼顾各种类别,所以能做到调查面较广。2)调查的样本具有交叉的属性,所以样本的代表性较强,调查较深入。,相互交叉控制配额抽样方式的评价,配额抽样与分层随机抽样的比较,相似:都要事

36、先对总体中所有单位按其属性、特征分类;然后,按各个控制特性,分配样本额。区别:分层随机抽样是按随机原则在各层内抽取样本,而配额抽样则是由调查者在配额内主观判断选取样本。,配额抽样与判断抽样的比较,抽取样本的方式不同。配额抽样是从总体各个控制特性层次中抽取若干样本;而判断抽样是从总体某一个层次中抽取若干符合条件要求的典型样本。抽样样本本质要求不同。配额抽样注重“数量”的分配;判断抽样则注重“性质”的分配。抽样方法不同。配额抽样方法(如相互控制配额)比较复杂精密;判断抽样方法简单易行。,3、配额抽样的优缺点,优点:简便易行,快速,费用节省,调查结果可靠,应用性广,缺点:选择样本时易产生主观误差,4

37、、配额抽样的适用性,对总体有一定的了解,第三节 抽样调查的方法,(四)滚雪球抽样,1、含义,滚雪球抽样:在调查时,要求受访者提供其他回答者的名单。又称推荐抽样。,第三节 抽样调查的方法,滚雪球抽样示意图,第三节 抽样调查的方法,2、滚雪球抽样的适用性,不清楚总体状况难以获得抽样框,或抽样框中的样本数量有限样本单位之间有一定联系,并愿意提供这种关系,驴友需求调查某化妆品用户调查,第三节 抽样调查的方法,方便易行多用于探索性研究,或研究总体边界不清由于时间或经费等客观因素制约,无法实施概率抽样时样本的代表性取决于研究者的认识能力、判断力、责任心及科学态度抽样误差不可计量,第三节 抽样调查的方法,小

38、结非概率抽样,思考如何选择抽样方法,研究性质对抽样误差的要求程度抽样误差与非抽样误差的相对大小总体差异性的大小经费、时间、抽样框获得性等的考虑不同方法的灵活使用,第三节 抽样调查的方法,思考:,某大学进行学生上网情况调查,如何抽样?,第四节 确定样本容量,第四节 确定样本容量,一、样本容量,样本所含个体数量的多少。,总体越大,样本容量越大吗?样本容量最少需要满足多少数量?从统计意义上看,选择多少样本容量比较合适?成本因素如何在确定样本容量时得到体现?,第四节 确定样本容量,样本容量并不总与总体大小有关系,置信水平95%置信区间3%总体差异性较大,第四节 确定样本容量,第四节 确定样本容量,资料

39、分析上的要求大样本(30以上),年龄,收入,35岁以下,35-45岁,10000元以下,10000元以上,合计,8,2,10,15,14,2,5,10,12,45岁以上,第四节 确定样本容量,样本容量与抽样误差成反比(研究要求)与总体差异性成正比,公式说明:e 样本的精确度,即抽样误差,反映样本统计值与总体参数值之间的差异。精确度高,则e小;反之则e大。(sigma)总体的标准差,反映总体变量值分散的程度。k 可信度系数(可信度即样本对总体的代表性程度)。当可信度=99%,k=2.58;当可信度=95%,k=1.96。,第四节 确定样本容量,第四节 确定样本容量,确定样本容量须综合考虑其他客观

40、要求,调查经费,时间,样本接触难度,二、确定样本容量的常见方法,取决于研究人员对样本代表性强弱的主观判断,以及调研经费预算样本一般取总体的5%10%考虑废卷因素,追加10%的补充样本,(一)非概率抽样,第四节 确定样本容量,第四节 确定样本容量,若总体差异性较小:小型调查:样本数 n50 大型调查:样本数 n100若总体差异性较大:小型调查:样本数 n400 大型调查:样本数 n1000,(二)概率抽样,第四节 确定样本容量,取决于研究精度、总体差异性和样本代表性考虑经费、时间等因素考虑废卷因素,追加10%的补充样本,例:,某地区居民有10000户,其年收入水平的标准差是200元。若拟采取抽样

41、调查获知其年平均消费水平,要求以95%的可信度推断总体,其允许误差范围是15元。调研经费为15000元,调研成本单价为20元。则样本容量为:,n1=(k*/e)2=(1.96*200/15)2=683(户),第四节 确定样本容量,n2=15000/20=750(户),n3=10000*10%=1000(户),概率抽样,非概率抽样,1.定性因素(1)决策的重要性(2)调查类型(3)变量个数(4)数据分析的性质(5)同类调查所用的样本量(6)发生率(出现率)(7)完成率(回收率)(8)时间经费限制,三、确定样本容量的影响因素,2.定量因素(1)总体的差异程度(2)允许误差的大小(3)调查结果的可靠

42、程度(4)采用的抽样方法,第四节 确定样本容量,第五节 抽样误差,市场调查误差,第五节 抽样误差,第五节 抽样误差,1、调查误差:由于调查设计、收集、统计、汇总等产生的误差,2、代表性误差:由于样本结构与总体结构不一致产生的误差(只有抽样调查才有),一、相关概念,第五节 抽样误差,2.1、系统性误差:在抽样过程中因违反随机抽样原则或抽样方式不妥造成的误差(如抽样框误差,无回答误差,调查人员误差,受访者误差),2.2、偶然误差:由于样本不能完全代表总体所产生的误差(只有概率抽样才有),第五节 抽样误差,2.2.1、实际误差:样本统计值与总体实际值之间的实际偏差,、平均误差:各种可能被抽中的样本统

43、计值与总体参数值的可能相差的范围。它反映了样本代表性的大小。,第五节 抽样误差,第五节 抽样误差,总体的差异性程度样本容量抽样方式,二、抽样误差的影响因素,思考与练习,总体 样本 抽样框 抽样误差 抽样调查 概率抽样 非概率抽样 简单随机抽样 系统抽样 分层抽样 整群抽样 方便抽样 判断抽样 配额抽样 参考抽样 样本容量,一、术语解释,第七章 抽样设计,思考与练习,1、在市场调研中为什么要进行抽样调查?2、如何理解抽样调查的优缺点?3、简述抽样设计的步骤。4、简述简单随机抽样方法的优缺点。5、分层抽样和整群抽样有什么区别?6、为什么说拦截访问属于非概率抽样调查方法?7、简述在确定样本容量时应考虑的影响因素。,二、思考题,第七章 抽样设计,本章结束,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号