《营销调研内容知识与方法.docx》由会员分享,可在线阅读,更多相关《营销调研内容知识与方法.docx(65页珍藏版)》请在三一办公上搜索。
1、七、资料的基础分析:描述统计七、资料的基础分析:描述统计 资料搜集起来以后,市场营销研究的重点应该转向资料的整理与分析。资料的整理过程包括编辑检查和修正搜集到的资料;编码给每个问题的答案配上数字或符号,为列表和统计分析作准备;列表把相似的数据放在一起来,列表既是资料整理的一个环节,也具有对资料进行初步分析的作用。 (一)资料的整理 1编辑 编辑是对资料进行筛选,即发现并剔除搜集起来的营销研究资料中的“水份”,选用真正有用的资料。编辑通常分实地编辑和办公室编辑两步进行。 (1)实地编辑 实地编辑是初步编辑,其主要任务是发现资料中非常明显的遗漏和错误,帮助控制和管理实地调查队伍,及时调整调研方向、
2、程序,帮助消除误解及有关特殊问题的处理。它应在问卷或其它的资料收集形式实施后尽快执行,以便问卷能在资料收集人员解散之前得到校正。这种初步审核可由现场主管执行。 实地编辑对资料检查的项目主要有以下几项:完整性;清楚性;内容的一致性;明确性,即答案的意义是否明确和单位的统一性。 (2)办公室编辑 办公室编辑在实地编辑之后。其主要任务是更完整、确切地审查和校正弄回的全部资料。这工作要求由那些对调研目的和过程有透彻了解,且具有敏锐洞察力者来进行。为了保证资料的一致性,最好由一个人来处理所有的材料。若出于时间长度的考虑而认为其不可行,该工作可被分割。但是,这个分割必须是每名审核员各分配若干份问卷,对每一
3、份问卷从头审到尾,而不是分段把关、流水作业,尽管后者可能有提高审核效率的一面,但绝对不利于贯彻一致性原则,因而是不可取的。 审核工作的重点 对于回收上来的问卷,主要存在的问题是:不完全回答,明显的错误答案,由于被访人缺乏兴趣而作的搪塞回答。办公室编辑的重点就放在这三类问题的查找、区分和处理上。 不完整的答卷分为三种情况,第一种是大面积的无回答,或相当多的问题无回答,对此应宣布为废卷。第二种是个别问题无回答,应为有效问卷,所遗空白待后续工作采取补救措施。第三种是相当多的问卷对同一个问题(群)无回答,仍作为有效问卷。这种“无回答”固然会对整个项目的资料分析工作造成一定的影响,但是反过来也让调研组织
4、者和问卷设计者思考如下问题:为什么相当多的被调查者对这一问题(群)采取了“无回答”的方式?是否是这个问题(群)用词含混不清让他们无法理解,还是该问题(群)太具敏感性或威胁性使他们不愿意回答,亦或是根本就无法给此问题(群)找到现成的答案? 明显的错误答案是指那些前后不一致的答案,或其他答非所问的答案。这种错误到了办公室编辑阶段很少存在,但一旦发现就不好处理。除了能够根据全卷的答案内在逻辑联系对某些前后不一致的地方进行修正外,其他情况只好按“不详值”对待。 有些被调查者对问题的回答反映出他显然对所提问题缺乏兴趣。例如有人对连续30个7点量表都选择了“7”的答案。或者有人不按答案要求,在问卷上随笔一
5、勾,一笔带过了若干个问题。如果这种乏兴回答仅属个别问卷,当彻底抛弃。倘若这种乏兴回答的答卷有一定的数目,且集中出现在同一个问题群上,就应该把这些问卷作为一个相对独立的子样本看待,在资料分析时给予适当注意。 对于最后判定按“不详值”处理的答案,审核员要用记号笔明确注明“不详值”字样或其代码。 对次级资料的审核 对于次级资料,可以根据其来源出处再划分成直接整理的资料和多次整理的资料。在审核时应根据资料所注来源出处对之进行区别对待。确认为直接整理的次级资料,可以直接为调研所用。而对于多次整理的次级资料,只能是间接参考,即顺着它的来源去寻求直接整理的次级资料。 2编码 (1).定义 编码就是对一个问题
6、的不同回答进行分组和确定数字代码的过程。大多数问卷中的大多数问题是封闭式的,并且已预先编码。这意味对调查中一组问题的不同数字编码已被确定。全部封闭式问题都是事情编码。如表7-1的问卷中的第一题,在每种答案的左边都有一个数字代码为制定的编码。封闭式问题中编码的难题是对多选题如何编码。它的方法是将每一回答指定为次级变量,用“1表示收放着选择了该答案,用”0“表示未选择。 (2)事后编码 开放试问题与封闭式问题不同。它只能在资料收集好之后,再根据受访者的答复内容来决定类别的指定号码,亦即只适宜利用事后编码。 对于开放式的问题的事后编码,它所依据的不应该仅是答案的文字,更重要的是这些文字所能反映出来的
7、被调查者的思想认识。这项工作可以遵循下述步骤进行。 列出答案。所有答案都一一列出。在大型调研中,这项工作可以作为编辑过程的一部分或单独的一个部分完成。 将所有有意义的答案列成频数分布表。 确定可以接受的分组数。此时主要是从调研目的出发,考虑分组的标准是否能紧密结合调研目的。 根据拟定的分组数,对列在第(2)步整理出来的答案分布表中的答案进行挑选归并。在符合调研目的的前提下,保留频数多的答案,然后把频数较少的答案尽可能归并成含义相近的几组。对那些或含义相距甚远,或者虽然含义相近但合起来频数仍不够多的,最后一并以“其他”来概括,作为一组。 这一步可以由一个以上的编码员分别来作。然后凑到一起进行核对
8、、讨论,最终形成一致的分组意见。 为所确定的分组选择正式的描述词汇。 根据分组结果制订编码规则。 对全部回收问卷(的该开放式问题答案)进行编码。 例:表7-1所是问卷中,其开放试问题是,您为什么选择该品牌? 研究者翻阅所有受访者的答复后,将原因意义列出,而后归并成6类,并指定号码(表7-2,7-3)。 3资料的计算机处理之编码明细单 目前,资料分析工作越来越多地应用到了相关软件,而在用计算机处理资料时,面临的第一个问题是如何准确的录入资料。这要求把文字资料传化成数码形式的数据,为此,须制定一套规则即编码明细单。它有利于减少在数据转录过程中产生大量的录入错误。 编码明细单是一份说明问卷中各个问题
9、(即变量)及其答案,与计算机数据文件中的字段、数码位数及数码之间一一对应关系的文件。有了编码明细单,就可以很方便地录入资料了。我们可以从表7-1的问卷(片段)、编码明细单来展示这种对应关系(表7-4)。 在制订编码明细表时,需要注意以下几个问题: (1)所有的资料都必须转换成数值,不允许使用字母或其他字符。 (2)每一个数值码占据一列。要为每个变量留出足够的列数。 (3)对无信息的答案赋予标准代码。例如可以用“8”表示不知道”,“9”表示“无回答”,“0”表示“不适合”。 (4)对一条记录所占据的第一行第一个字段都要安排被调查人序号码。 (二)列表 把调查资料按照一定的目的,用表格的形式展现出
10、来,即是资料的列表。列表的基本方法就是计数变量值的出现次数。如果仅计数一个变量的不同数值的出现次数,这种列表就是单向列表。如果同时计数两个或多个变量的不同数值联合出现的次数,这种列表就是交叉列表。 现代商务调研和其他社会经济调研往往至少涉及到数十个变量、数百个样本单位,其列表任务相当之繁重,一般都需借助于计算机手段才能在有限的时间内完成。 1单因素列表 最基本的单因素列表是单向频次表。表75中列出了这种表的一个例子。单向频次表显示了对每一问题做出每种可能回答的人的数量。表7-5表明,有114人(占48)说他们会选择亚贸广场,有146人(487)说他们会选择中南商场,有10人(占33)说他们不知
11、道选择哪一家商场。电脑输出资料将会显示出调查中每一问题的单向频次表。在大多数情况下,这份表是调查分析人员首先看到的统计结果的概括。 表7-5单项频次表(数据为虚构) (1)关于百分比的基数 在使用单向频次表时需要解决的一个问题是选择百分比的基数。有三种选择: 全部被调查者人数。如果有300人参加了某项调查,并决定利用所有参加者作为计算百分比的基数,每张单向频次表的百分比都将以300作为基数。 需回答具体问题的人数。在大部分问卷中,不是所有的人都回答全部的问题。例如一项调查的问题4也许会问调查者是否有狗或猫,其中回答有的有200人,而问题5和6是专门问这200人的。在这种情况,用200作为计算百
12、分比的基数较为恰当。 做出回答的人数。在单向频次表中计算百分比的另外一个基数是回答了特定问题的人数。如300人问及某个特定问题,但28人表示“不知道”或没有回答,则要以272作为百分比的基数。 一般来说,需回答问题的人数被作为制表中计算百分比的基数。但也许在一些特殊场合,使用其他的基数会更合适。 (2)为具有多种答案的单向频次表选定基数 对某些问题,被调查者可有多种回答。例如,某问题要求被访者列出所有记忆中的商场的名称,多数人会列举不止一家商场。因此,将回答列表时,答案的数量会超过被访者人数。如果200名被调查者中,平均每位列出3家商场,则200名被调查者会给出600个答案。问题是,频次表中的
13、百分比应根据被调查者的人数还是众多答案的数量?表7-6给出了用两种方法计算百分比的例子。在市场调查中,一般的算法是以被调查者的人数为基数计算百分比,因为我们对给出特定答案的人的数量更感兴趣。 表7-6以调查者的总数和实际答案总数为基数计算有多种答案的问题的百分比(数据为虚构) 2多因素列表 交叉分组表可能是分析的下一步骤,它们是一种易理解且有效的分析工具。许多市场调查,或许可说是绝大多数,在分析上都只进行到交叉分组表。这种方法的基本思想是,结合对其他问题的回答来考对某一问题的答案。表7-7列出了一个简单的交叉分组表,从中可以考察那些愿意在不同商场购物的消费者与其年龄间的关系。这个交叉分组表列出
14、了频次和百分比,而且百分比是以列为基数统计的。 表7-7简单交叉分组列表(数据虚构) 关于交叉分组表的建立和计算百分比,有许多因素应该考虑,其中一些较重要的因素总结如下: 前面关于合适的百分比基数的选择及多种答案的百分比计算的讨论适用于所有的交叉分组表。 在交叉分组表中,可以为每一单元计算三种不同的百分比:列、行、总的百分比。列百分比是以列总和为计算基数的,行百分比以行总和为基数,而总的百分比以表的总和为基数。 建立交叉分组表的通常做法是设计一个表,在这张表中,各列列出各种不同因素,如人口统计和生活方式特征,它们可以作为各行所列因素如心理、行为或意愿的预测指标。在表中,百分比通常以列总计为基数
15、进行计算。采用这种方法可以简单比较各种关系,如心理、行为或意愿数据与性别或年龄之间的关系。问题可能是,不同年龄段的人在某些要考察的方面有什么不同?表7-7显示了这种表的一个例子。 交叉分组表为总结和分析调查结果提供了一种有效而易懂的方法。然而,假如不进行仔细设计的话,它也很容易由于计算机输出的大量数据而造成混乱。设计交叉分组表时必须牢记调研目标和事先的基本假设。某项调查的结果可能产生无数个交叉分组表。这表明,分析人员必须加以判断,从所有可能的交叉分组表中选择适合于调研目标的表格形式。大量的电子制表软件(Lotus123、Excel)和几乎所有的统计软件包(SAS、SPSS、SYSTAT、STA
16、TISTICA)都能够生成交叉分组表。下一部分我们将讨2检验,这种检验可以用来判断在一特定的交叉分组表中得出的结果是否与我们预期的有显著性差异。换句话说,男性回答的模式和女性有重大差别吗?利用这个统计程序可以判断两组之间调查结果的差异是由于偶然因素造成的,还是反映了实际存在的真正差异。 (三)资料的分析与解释 1分析与解释概述 在市场营销研究过程的所有活动中,对研究者的技能要求最高的是资料的分析与解释。一般来讲,事实本身是没有用处的,一个人在一天中可能会搜集到对他本人并无用处的许多事实。资料只有经过比较和分析才有用。 分析是以某种有意义的形式或次序把收集的资料重新展现出来。分析实际上是回答下面
17、的问题:“每组资料里有些什么信息?”分析是分别检查每组资料,以找出其内涵的关键信息,并以有意义的形式表示出来。 解释是在资料分析的基础上找出信息之间或手中信息与其它已知信息的联系。解释的主要目的是从所收集的资料中获得结论。它是把分析过的资料变成跟研究目的有关的有用信息,以使收集的资料能为研究目的服务。 2分析与解释之间的相互依赖性 资料的分析与解释是相互联系,相互依赖的。无论是资料的分析还是资料的解释,任何一个方面的工作开展得不好,都会影响到研究结果的有效性以及对资料的充分利用。 假设某大型日用化工厂,每个季度要在全国的50个主要的大百货商场作一次库存检查。表7-8是该厂A牌老产品和B牌新产品
18、在过去4个季度里销售量的变化。 公司的营业部经理从上面资料发现,A牌销售量的下降与B牌销售量的上升有着惊人的吻合,因此作出结论,A牌产品的顾客转向了B牌,并建议这个时刻将A牌牙膏退出市场。 表7-8两种产品销售量的比较 然而实际上发生的是,有两个竞争对手大力推销他们的与A牌类似的产品以防止他们的顾客转到B牌上来。这样,尽管A牌老产品的市场由于新产品推出而下降了一些,但其销售量的下降主要是由于其它公司的促销活动引起的。 表7-8的资料表明,A牌的销售量在下降而B牌的销售量在上升,这种分析是正确的,但解释是错误的,因为上面两组资料被不适当地联系到一起。如果调查市场上该产品的总销量以及仔细研究竞争对
19、手的活动,发现市场上该产品的需求量在大幅度上升,而竞争对手的促销活动也在不断加强。那么A牌销售下降的真实原因也许是它的促销措施不得力,而不是由于B牌产品的进入。 前面的例子表明分析适当时,解释不一定适当。实际上,分析和解释中任何一个不适当都会影响到研究结果的正确性。 2资料的解释 上面对分析与解释进行了定义。分析是把每组数据以某种形式重新组合起来以便从中发现有用的信息, 解释是在分析的基础上进行的,即把已经分析过的资料与其它的一些现存资料放在一起,通过比较,得到与研究目的有关的信息。如从各种分散资料中归纳出结论,然后根据结论提出各种备选的市场营销的方案。 在解释资料时尽管没有一个统一的模式可循
20、,但下面两个方面是必须注意的:一是要理解归纳的和演绎的推理方法;二是要保证形成结论时的客观性。 (l)归纳推理方法在市场营销研究中的应用 归纳推理的方法是,首先产生一系个别的前提,然后把这些前提与其它前提结合在一起,以形成结论。这些个别的前提可以从观察、实验、调查中获得。 在归纳方法中,任何结论都是基于从调查、实验或观察中得出的证据。市场营销研究中通过对大量个体(或样本)的研究得出一般性结论的方法使用的就是归纳法。 (2)演绎方法在市场营销研究中的应用 演绎推理过程包括一系列的语句,其中最后一句是结论,它是从前几句逻辑地推理出来的。结论的正确性取决于前提的正确性。然而在管理方面的应用中,演绎方
21、法的大前提常是不很可靠的。因此尽管演绎推理方法可用在市场营销中,但必须明白其使用的前提(或由归纳得出的结论)常常是较脆弱的,不能作为作经营决策的唯一参考依据。 归纳法和演绎常是相互作用的。演绎方法中的前提常是从归纳推理中得出的。比如通过归纳推理得出结论“春天是旅游旺季”可以作为演绎推理的前提,因为这个归纳结论是通过观察数年来每年各季节旅游人数而得出的。 在使用推理方法时,要建立适当的证据,使从这些证据推导出的结论更富有逻辑性。这种逻辑过程不仅对研究者是明显的,对任何其它人也应是明显的。演绎推理方法中的前提必须是有效的,而在归纳推理方法中的前提则需要充分的依据。 3分析解释的客观性评价 研究者进
22、行研究时的客观态度对资料的收集是非常重要的,这种对客观性的要求在对资料的解释中更重要。由于研究者控制着要解释的资料。他们可能会把那些跟他们预计结果相侼的资料搁在一边。 理想的研究课题要求研究者始终保持完全客观的态度。但在实际生活中,这是难以完全办到的。要求研究者必须绝对客观,否则研究就不该进行。这种想法是不实际的,因为研究者对研究结果没有自己的意见或没有个人兴趣是不可能的。但要求研究者把这些个人兴趣放在第二位是可能的,也是必需的,因为研究不是为证明某一观点而进行,研究的目的在于客观地调查某个情形的所有方面。 八、市场营销研究中的统计推断与方差分析八、市场营销研究中的统计推断与方差分析 市场营销
23、中的统计推断与方差分析是通过统计分析技术,对数据本身所包含的隐性事物本质及其规律进行深入研究的方法。这些方法较多地以数学理论为基础,通过定量分析,为市场营销提供相对更为理性客观的决策依据。本部分主要介绍几类常见的统计分析方法,如假设检验、参数检验、非参数检验和方差分析等。 (一)假设检验的概念 假设检验是指先对总体提出某项假设,然后利用从总体中抽样所得的样本值来检验所提的假设是否正确,从而做出接受或拒绝的决策。 一般而言,市场调研所面对的总体总是庞大而复杂的,即使是观察力很强的调研人员也难以保证自己的推断准确无误。再加之市场环境中不确定性因素很多,给市场分析带来更大的难度,这就需要在市场分析中
24、运用假设检验的推断,使营销决策尽可能合理。 1研究假设 研究假设的目的是保证通过市场调研获得的资料能满足研究目标的要求。因此研究假设的工件是在研究目标确定以后进行的,一旦研究目标确定,就要针对市场上出现的各种可能情况形成一些合适的假设。例如某企业在分析上季度销售收入显著增长时总结了以下几点: (1)CI战略(CorporateImage)的导入改善了企业形象,导致新客户有很大增加。 (2)SP战略(SalesPromotion)的适时运用刺激了消费者的购买欲望,导致销售量显著增长。 (3)国家刺激内需的政策起了很大的作用。 (4)不排除其它偶然因素在起作用。 这实际上是对企业销售收入增加提出的
25、几种假设,是对“为什么上季度销售收入会显著增长?”这一研究目标的几种揣测,这些假设是否正确还有待下一步的假设检验,但一旦假设得到证实,则可作为经验予以推广;如果仅是偶然因素在起作用,则需立即改变企业的营销策略,以使企业销售收入稳定增长。 假设的形成并不是凭想象产生的,它是在市场调研的基础上,通过对研究资料的粗步分析后得出的结论。假设可以是对研究资料的一种陈述性假设,如上例;也可以用于陈述某个行动的不同方案。 研究者可以调查每一个假设方案,通过对各类信息的仔细分析和假设检验,确定一个最优的开发方案。 2假设检验的原理 当研究假设形成以后,就进入假设检验阶段,如何利用样本值对一个具体的假设进行检验
26、,一般借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实践问题中经常采用的所谓实际推断原理:小概率事件在一次实验中几乎是不可能发生的。如果小概率事件在一次试验中居然发生了,则有理由首先怀疑原假设的真实性,从而拒绝原假设。 当然,从理论上看,小概率事件也有可能发生,只是发生的概率小而已,但是从假设检验的基本思想看,这就可能导致I、II两类错误,第I类错误也叫“弃真”,第II类错误也叫“取伪”。所谓“弃真”,顾名思义,就是原假设实际上是正确的,却被当成错误拒绝了。而“取伪”则相反,本来原假设是错误的,却被当成正确的内容接受了。无论是“弃真”还是“取伪”,在现实中无法避免的,这就是我们通常
27、所说的“次策失误”。当然,我们可以通过增加样本容量的办法来减少犯两类错误的概率,这就要求我们在进行市场调研时应尽可能详尽地把握原始资料。 3假设检验的步骤 假设检验一般应遵循以下五个步骤: (1)根据实际情况提出原假设H0和备择假设H1; (2)选择合适的检验统计量; (3)根据样本观察值计算出检验统计量的观察值; (4)选定显著性水平a,并根据相应统计量的统计分布表查出相应的临界值; (5)根据统计观察值和临界值,作出接受或拒绝H0的假设(二)参数检验 前面我们简单介绍了假设检验的基本概念.基本原理.和基本步骤,从这节开始,重点介绍几类市场营销中常用的检验方法:参数检验法.非参数检验法.和方
28、差分析。本处具体介绍参数检验。 参数检验是在已知总体分布的条件下对一些主要的参数(如均值、百分数、方差等)进行的检验。检验时一般都假设总体服从正态分布。参数检验包括对平均值的检验和对百分数的检验。 1对平均值的检验 对平均值的检验是根据样本均值及标准差来判断总体均值的一种方法。通常采用Z检验法和t检验法。Z检验法选用于总体方差已知的平均值检验,而t检验法则适用于总体方差未知以及在小样本情况下的平均值检验。下面我们分单个正态总体和两个正态总体来介绍平均值检验。 (1)单个正态总体的平均值检验 如某冰箱厂为国内一大型冰箱生产基地,产品质量一直比较稳定,返修率为1.1。但近年来却不断听到消费者抱怨,
29、为了解近年该厂生产冰箱质量情况,随机对其国内36家专卖店及大中型商场专卖柜台中的其中400台冰箱的的返修率进行了调查,结果发现其样本均值为1.14,又由同类产品的经验知其标准差为0.2,是否可由调查结果判定近年来企业生产的冰箱出现了质量问题? 即认为该厂冰箱出现了一定的问题,一定有系统性因素在起作用,必须尽快查明原因;与此同时,要更加注重售后服务,及时修复已出现质量问题的出厂冰箱,避免因顾客抱怨造成不良舆论而影响企业声誉。 (2)两个总体的平均值检验 例如,某企业为提高产品质量,对部分职工进行了第一期培训.为了解培训效果,特从经过培训的职工的未经过培训的职工中各随机地抽取10名,记录其月产量,
30、有关数据见表81。假设这两组职工的实际产量均近似地服从正态分布,且知其标准差分别为s1140,s2170。 现要求判断培训对职工产量提高有无显著性影响。 这里标准差s1、s2均已知,可采用Z检验法。 第一步:建立假设 H0:m1=m2,即培训对职工产量提高无显著性影响 H1:m1m2,即培训对职工产量提高有显著性影响 第二步:选择检验统计量: 第三步:选定显著性水平a0.05,查正态分布表得: ZaZ0.051.645 第四步:作出判断。 由于ZZ0.05,所以拒绝H0,接受H1,即至少有95的把握认为培训对职工产量的提高有显著性影响,培训效果显著,达到了预期目的。在不考虑其它条件的情况下,对
31、企业管理人员而言,这些信息已足够支持他作出决策。这个案例说明,对企业职工进行有效的培训,有利于提高职工队伍的科学文化技术水平和经营管理水平,促进劳动生产率的提高,从而增强企业的市场竞争能力。 当然,并非所有的培训都一定有效,这就要求管理者在每期培训结束后都要定性、定量地对培训的效果进行总结性的评估,及时发现问题,总结经验,使企业永远处于良性发展的轨道。 上述的Z检验法适用于方差已知的情形;若方差未知时,可改用样本标准差S代替s,实行t检验。 2百分数检验 (1)对总体百分数的检验 对总体百分数的检验一般采用Z检验法,选用统计量为: 下面我们通过一个例题来分析一下Z检验法在百分数检验中的应用。
32、M企业拟进行新产品开发。为了解市场需求情况,随机地对1000名消费者进行了市场调查,发现其中有18的消费者表示愿意购买新产品。根据其它资料显示,新产品投入市场后,市场占用率必须超过15才能保证获利。假定表示愿意购买新产品的18的消费者在新产品投入市场后将全部成为现实的消费者。问M企业应否开发这个新产品。 从这个案例我们可以看出,取样大小直接影响着结论的可靠性。一般而言,样本量越小,随机性越大。因此,要想使作出的判断更加准确,就应尽量保证样本容量的数量。这就要求市场调研人员取样时,一是必须讲究科学的方法,二是必须有耐心,在有限的资金情况下,尽量扩大调查范围,把握尽可能详尽的第一手资料。另外,样本
33、值代替不了总体值。从本题看,样本百分为18(市场占有率),总体百分数为15(市场占有率),但不能仅凭此即作出开发新产品的判断,因为调查结果(即18的市场占有率)大于目标要求(15以上的市场占有率),也有可能纯属调查中的随机误差造成的,因此是否开发新产品,必须做进一步的假设检验。 (2)样本百分数之间差别的检验 上例中,如果被调查的1000名消费者中有300来自高、中收入阶层,其中16的人表示愿意购买新产品;700名来自低收入阶层,其中14有人表示愿意购买新品。是否可以由此认为高、中收入阶层比低收入阶层更愿意购买产品呢? (三)非参数检验 前面几节所讨论的假设检验问题,都是假设总体X的分布类型为
34、已知,其中仅含有限个未知参数,我们只是对这些未知参数进行检验。但是,在许多实际问题中,总体分布的类型往往不知道,这就需要引进另一些统计方法,要求这些方法不依赖于总体分布的具体形式,这些方法被称为非参数检验。 非参数检验的方法很多,在此主要介绍市场营销中较常用的三类方法:c2检验、魏氏检验法和麦氏检验法。 1c2检验 c2检验是非参数检验法中最常用的方法之一,主要用于对独立样本身或不同独立样本之间不同因素的差别进行检验。 (1)对单个独立样本的c2检验 对单个独立样本进行检验时,可选用统计量: 例如,某厂生产一种新型山地车,特推出美观轻便型、经济耐用型和速度型三种款型,为了解用户对三种款型有无显
35、著性偏好,特在若干大城市随机调查了600名消费者,结果表示愿意选择美观轻便型的246人,愿意选择经济耐用型的152人,愿意选择速度型的202人。问能否根据上面的调查结果判断三种款型中有一种受欢迎程度显著地高于其它两种? 这是一个适度检验问题。采用c2检验法: H0:三种款型受欢迎程度一样 H1:三种款型受欢迎程度存在显著性差异 选择检验统计量: 所以拒绝H0,接受H1,即认为三种款型受欢迎程度存在显著性差异,也就是说美观轻便型受欢迎程度明显高于其它两类。这说明,随着人们物质文化生活水平的提高,人们把对美的追求提高到了一定的档次;同时在繁闹的大都市,“轻便省力”也是人们首选的一个考虑因素。针对这
36、种情况,该企业应着重在城市开发“美观轻便型”产品。 (2)多个独立样本的c2检验 对多个独立样本进行检验适用统计量: 下面我们看一个例题。某大学在市民中开展了一项调研活动,拟探究市民文化水平与收入水平之间是否存在着联系。从市民中随机抽取了2764人进行观察,获得资料如表82。问能否根据调查结果判断市民文化水平与收入水平之间存在着联系? 所以拒绝H0,接受H1,即认为市民文化水平与收入水平之间存在着联系。一般认为,市民文化水平高,其收入水平相应也高一些。 2魏氏(Wilcoxon)检验 前面介绍的c2检验法主要用于对独立样本的非参数检;而魏氏(Wilcoxon)检验法则主要选用于两个有联系样本的
37、比较。如M企业在实施降价策略前后企业主要产品市场占有率的变化就构成了一对有联系的观察值,那么我们能否通过对这些观察值的分析来判断降价策略是否有效呢?可以考虑用魏氏检验法。 魏氏检验法的基本思想是首先求出对样本观察值的差值,并按其绝对值大小进行排列,剔除其差值为0的样本,最小者等级为1,依此类推。如果顺序排列中有几个差值的绝对值相等,则取其平均值作为这几个差值的等级。然后恢复其原来的正负号,再分别将正负符号的等级相加,用 代表正的等级和, 代表负的等级和。选择其中较小的等级和作为检验统计量 。其拒绝域为: 例,其企业为调动生产工人的生产积极性,提高产品产量,普遍增加了生产工人的工资。但有人却提出
38、异议,认为工资属保健性因素,普遍提高工资并不会导致产品产量较大幅度的增加。为验证此说,企业随机抽取了10名工人,比较其涨薪前后的产量水平,得到有关资料如表83。问能否由样本资料判断增加工资对产量提高有显著性影响? 用魏氏检验法进行检验。 H0:普遍提高工人工资后,产量有显著性增长 H1:普遍提高工人工资后,产量无显著性增长 所以拒绝H0,接受H1,即至少有95的把握认为普遍提高工人的工资并不会导致产量显著性增加。这个案例说明,保健性因素,如工资奖励、劳保福利、人群关系等,只能预防职工不满,使职工安于工作,不能起到激励员工的作用而要激发职工的生产积极性,则需重视工作本身,从内部条件着手,如使工作
39、富有挑战性,使人有成就感、提升感。 上面我们讨论的魏氏检验法主要是在小样本(n25),则需采用Z检验。 3麦氏(McNehmar)检验 麦氏检验选用于同一样本在两种不同情况下的比较。比如某企业拟系统地导入CS战略 (CustomerSatisfaction)以提升企业形象,为比较导入前后顾客满意程度有无显著性变化,企业特地对同一组顾客(同一样本,200人)作了前后两次市场调研,调查结果见表84。现在我们能否从这些统计数据判断企业导入CS战略前后顾客满意程度有了显著性变化? 所以拒绝H0,接受H1,即认为CS战略导入后,顾客满意程度有了显著性提高。 (四)方差分析 方差分析是比较若干总体均值是否
40、相同时最常用的统计方法。在方差分析中,我们将那些影响实验指标的条件称为因素,而将因素所处的条件称为水平。如果所研究的问题只涉及一个影响因素,则称这样的方差分析为单因素分析;如果所研究的问题涉及多个影响因素,则称为多因素分析。以下我们着重讨论单因素方差分析和双因素方差分析在市场营销中的具体 1单因素方差分析 单因素方差分析只检验一个变量的影响。例如某服装公司拟通过市场调研检验不同年龄的消费者对该公司生产的T牌休闲服购买量有无显著性差异,以决定是否细分市场。于是选择了一组调查对象,将调查对象按年龄因素分为老(A1)、中(A2)、青(A3)三个水平。随机调查了该公司下辖的五个专卖店在某一段时间内不同
41、年龄消费者的购买情况,获得资料如表85。 问不同年龄组对T牌休闲服的购买量有无显著性差异?应否细分市场? 因为该题只涉及一个变量:年龄,我们可以采取单因素方差分析法进行检验。 H0:不同年龄组对T牌休闲服的购买量无显著性影响 H1:不同年龄组对T牌休闲服的购买量有显著性影响 第一步:计算各专卖店销售量总离差平方和(QT);各专卖店销售量之间的离差,即组内离差平方和(QE);各专卖店对不同年龄组销售量之间的离差,即组内离差平方和(QA)。 总离差平方和(QT)是实验的总误差,反映数据波动的程度;组内离差平方和(QE)是在水平下,样本值与样本均值之间的差异,这是由随机误差引起的所以QE又称为误差平
42、方和;组内离差平方和(QA)是各水平下样本均值与总体均值之间的差异,这是各水平以及随机误差引起的,反映由因素A的水平变动而产生的误差,即系统误差。可见,方差分析其实质就是要将总误差中的随机误差和系统误差加以分离,赋予它们数量表示,并将二者在一定的条件下加以比较,如差异不大则认为系统误差对指标的影响不大;反之,如系统误差较随机误差大得多,则说明所考察条件的影响大得多。 有关总离差平方和、组内离差平方和和组间离差平方和的计算公式如下: 第二步:选择检验统计量F: 第三步:将以上计算结果列成方差分析表86 表86方差分析表 这说明不同年龄组对T牌休闲服的购买量有一定的影响,但显著性不强,因此对厂家而
43、言,如果单从年龄因素考虑的话,没有必要细分市场。 2双因素方差分析 前面介绍的单因素方差分析法只考察了一个变量的影响,但在许多实际问题中,往往不能只考察单一因素各水平下的影响,而必须同时考察几种因素的影响作用,比如前面我们已经验证没年龄的消费者对T牌休闲服的购买量存在一定的影响(不显著),事实上除年龄这个因素外,其它因素诸如消费者收入水平、消费者偏好、交通便利情况等也会对销售量产生影响,甚至是显著性影响。假如人们再将前面15家专卖店按交通便利情况分成5组,每组3家进行考察,则除年龄因素外,交通便利情况也构成了影响销售量的一大因素,必须考虑用双因素方差分析进行检验。 双因素方差分析法与单因素方差
44、分析法在某些方面虽然存在着本质的区别,但其基本思想和基本方法大致相同。这里我们把年龄因素设为A因素,交通便利情况设为B因素,则有关计算如下: 第一步:建立假设 H01:年龄因素(A因素)对T牌休闲服的购买量有显著性影响 H02:交通因素(B因素)对T牌休闲服的购买量有显著性影响 九.市场调研中的相关分析与回归分析九.市场调研中的相关分析与回归分析 在研究具有相互关联的事件上,我们通常借助于相关分析和回归分析这两种统计方法,度量变量之间关联程度的方法叫相关分析。如果考虑的是两个变量之间关系时,称为简单相关;如果讨论一个变量与两个或多个其他变量的关系时,就称为复相关或偏相关,而回归分析则是根据已知
45、的一个或一个以上变量(自变量)的值来估计另一个变量(因变量)的值,并且算出估计的误差。 尽管这两种方法在现实使用时可以互相替代,但仍然存在不同,相关分析只是测定变量之间的相关程度。它考虑的是随机变量之间的共同变动,而不必区分自变量和因变量,而回归分析是希望得出一个有关各个变量之间联系的数字表达式,其中只有目标变量因变量假设为随机变动,而自变量均为已知常数,正如探讨变量之间关联度不必推导出一个方程,我们也可以在不考虑变量关联度情况下做回归分析。一般而言,两种方法是混合使用的,统称为相关回归分析,下面我们将分别介绍这两种方法。 (一)相关分析(1) 1简单相关 探讨变量Xi,Yi间的相关关系时,可
46、以先做出散点图(ScatterDiagram),以数标轴上的点代表Xi,Yi的一对观察值,这可以直观地考察变量之间联系程度,且有助于选择合适的估计模型。 对两个变量X,Y之间的简单相关,需要事先作出如下假设: 两个变量均为随机变量,一个样本观察值同时包括X,Y的值。 两个变量为联合正态分布。即在任何其中一个变量的观察值不变时另一个变量呈正态分布。 如果两个变量X,Y的测定值为(X1,Y1),(X2,Y2)(Xn,Yn),变量X,Y的平均数以 , 来表示,即: (i=1,2n) 经计算r在-1与+1之间变化。若X,Y完全正相关,一单位X的增加引得Y增加一单位,此时r=+1,反之,若X增加一单位导致Y减少一单位,两者完全负相关时,r=-1,有关情况如下表(9-1)。 表9-1 R=1完全正相关 0R1 正相关 R=0不相关 -1R0 负