批发分销商销售状况及策略研究分析.docx

上传人:小飞机 文档编号:1982027 上传时间:2022-12-29 格式:DOCX 页数:49 大小:543.22KB
返回 下载 相关 举报
批发分销商销售状况及策略研究分析.docx_第1页
第1页 / 共49页
批发分销商销售状况及策略研究分析.docx_第2页
第2页 / 共49页
批发分销商销售状况及策略研究分析.docx_第3页
第3页 / 共49页
批发分销商销售状况及策略研究分析.docx_第4页
第4页 / 共49页
批发分销商销售状况及策略研究分析.docx_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《批发分销商销售状况及策略研究分析.docx》由会员分享,可在线阅读,更多相关《批发分销商销售状况及策略研究分析.docx(49页珍藏版)》请在三一办公上搜索。

1、批发分销商销售状况及策略研究摘 要本文针对批发分销商销售状况及策略的研究,使用描述统计、方差分析、判别分析等方法,分别构建描述统计对比分析模型、双因素方差分析模型、两总体距离判别模型、多总体距离判别模型,并利用Excel、Matlab等软件编程处理数据,得出了该批发分销商销售状况、影响因素以及有利的经营策略。针对问题一要求,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,以及批发商目前经营状况的评价。本文首先通过Excel对数据资料做基本的描述统计以及相关关系分析,可得出数据资料的基本分布状况以及变量之间的相关程度,再通过最描述统计结果的对比分析得出该分销商目前经营状况的评价。针对

2、问题二要求,需分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著影响六大类商品的销售额,并最终找到影响六大类商品销售的主要因素。首先在Excel中对数据进行处理,再分别对销售途径和销售区域做无交互作用的双因素因素分析和交互作用的双因素分析,然后通过Matlab编程算出方差分析结果,分析后得出影响六大类商品销售的主要因素。针对问题三要求,需建立销售区域和销售途径的判别模型,并分析影响销售区域和销售途径的主要商品类别。其中销售途径可采用两总体距离判别方法得出销售途径的判别模型,并通过Matlab计算判别系数得出影响销售途径的商品类别;而销售区域可采用多总体的距离判别法建立销售区域的判别

3、模型,并通过逐个剔除商品类别因素的方法计算误判率,用过Matlab计算得出判别系数和误判率,得出影响销售区域的主要商品类别,并综合分析得出批发销售商提供智慧的经营销售策略。本文最后还对模型进行了误差分析、评价和推广,并针对问题二中的方差分析所需的条件进行齐性检验,通过非参数检验对模型进行改进,使结果更准确。关键词:批发商销售策略;描述统计;方差分析;判别分析;Matlab 1 问题的重述一、背景知识1总背景介绍批发分销商是指向制造商或经销单位购进商品,供给其他单位(如零售商)进行转卖或供给制造商进行加工制造产品的中间商。批发商的客户一般是销售公司或者大型零售商,不同的客户对批发商的需求不同,导

4、致了批发商在不同客户不同销售区域和途径的条件下会有不同的进货组合。2问题的产生随着市场的竞争的愈加激烈,批发分销商商需要更有效率的经营销售策略,但是经营策略需要对日常收集的数据进行大量分析和总结,但数据量多繁杂,无法直观地了解到想要的信息。3已有的对策数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。它是在一定的选题下,集分析方案的设计、资料的搜集

5、和整理而展开的研究活动。系统、完善的资料是统计分析的必要条件。将数据挖掘或多元统计的技术应用于商业领域,利用企业所积累的资料,透过相关变量的分析,找出顾客区隔、消费行为、业务成本与效率等对企业极为重要的资讯,为企业管理提供决策支持,从而提高企业经营的竞争力和商业智慧。二、相关资料1Wholesale customers data(B题附件)。三、要解决的问题1问题一 对该数据资料作描述统计,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,最终给出该批发分销商的目前经营状况的评价。2问题二 分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著的影响六大类商品的销售额,最终找

6、到影响六大类商品销售的主要因素。3问题三 利用数据分析方法通过分别建立销售区域和销售途径的判别模型,分别找出影响销售区域的主要商品类别,影响销售途径的主要商品类别,最终为批发销售商提供智慧的经营销售策略。2 问题的分析一、问题的总分析 本文题为批发分销商销售状况的研究,即通过对该分销商历史销售数据的分析和研究,得出该分销商的经营状况、影响因素以及有利于经营销售的策略。该问题属于数理统计的内容,可采用描述统计、方差分析、判别分析的方法进行研究,整体框图如图1表示:图1 整体框图二、对具体问题的分析1对问题一的分析问题一要求对该数据资料作描述统计,给出该数据资料的基本分布状况、变量之间的相关程度或

7、关联程度,最终给出该批发分销商的目前经营状况的评价。根据要求主要通过描述统计的方法对数据进行分析。首先通过Excel对数据资料做基本的描述统计以及相关关系分析,可得出数据资料的基本分布状况以及变量之间的相关程度,再通过最描述统计结果的分析得出该分销商目前经营状况的评价。2对问题二的分析问题要求分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著的影响六大类商品的销售额,最终找到影响六大类商品销售的主要因素。可通过无交互作用的双因素因素分析和交互作用的双因素分析,找到影响六大类商品销售的主要因素。 3对问题三的分析问题三要求利用数据分析方法通过分别建立销售区域和销售途径的判别模型,分别

8、找出影响销售途径和销售区域的主要商品类别,最终为批发销售商提供智慧的经营销售策略。其中销售途径可可采用两总体距离判别方法得出销售途径的判别模型,并通过所得线性判别函数中定影响销售途径的商品类别;而销售区域可采用多总体的距离判别法建立销售区域的判别模型,并通过逐个剔除商品类别因素的方法计算误判率,得出影响销售区域的主要商品类别。并通过对上述判别模型和影响因素的研究,综合分析得出批发销售商提供智慧的经营销售策略。3 模型的假设1假设六大类商品商品销售额相互独立; 2假设模型中,三总体协方差矩阵差异可以忽略,并且不会造成显著误差4 名词解释与符号说明一、名词解释1描述统计:是通过图表或数学方法,对数

9、据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。12数据分析方法:数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。2二、主要符号说明序号符号符号说明1平均值2方差3标准差4相关系数5偏度6峰度7水平对指标的效应8水平对指标的效应9水平与对指标的交互效应10n维向量x与总体G的马氏距离11总体的协方差矩阵12回带误判率5 模型的建立与求解一、问题一

10、的分析与求解1对问题的分析问题要求对该数据资料作描述统计,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,最终给出该批发分销商的目前经营状况的评价。我们利用Excel自带的数据分析功能对数据进行进行处理,并对结果进行对比分析,得出经营状况的评价。2对问题的求解模型 描述统计对比分析模型 模型的准备描述统计是将收集到的数据用一些概括性的统计量以及图形、图表加以描述,它将数据本身包含的信息加以总结、概括、浓缩、简化,使问题变得更加清晰、简单、易于理解。通过试验和观察得到数据。这些数据是带有随机性的数据.为统计分析目的,数据被分为定性(有序的和名义的)数据和定量(计量和计数的)数据。本文

11、中将保鲜品、乳制品、杂货产品、冷冻开支、洗涤剂和纸制品、熟食产品、销售途径以及销售区域作为8组数据进行描述统计和相关性分析。 模型的建立平均 它是数据集中趋势的度量,反映了数据的平均水平。其优点是能反映每个数据的作用,缺点是易受数据中极端值的影响。方差 样本均值是总体均值的无偏估计。标准差 标准差是方差的平方根,方差与标准差越大,意味着数据的分散程度越大;相反,方差与标准差越小,意味着数据的分散程度越小,也即向平均值的集中程度越高。方差与标准差度量了数据的离散程度。中位数 中位数以其排列位置来描述集中趋势,比中位数大(小)的数据各占整个数据的一半。其优点是不受个别极端值的影响,具有稳健性,缺点

12、是缺乏敏感性。众数众数是指在数据中出现次数最多的数据值,是衡量定性数据集中位置的重要量度。偏度偏度和峰度是刻画数据分布形态的两个统计量,它们与数据的矩有关。数据的矩分为原点矩和中心矩。k阶原点矩k阶中心矩偏度的计算公式为偏度是描述样本数据对称性的统计量。关于均值对称的数据,其偏度为0,数据的右侧较左侧更为扩展,偏度为正,反之,数据的左侧较右侧更为扩展,偏度为负。峰度的计算公式为峰度是以正态分布为标准,来描述数据向分布尾端散布的趋势。近似于正态的分布,其峰度接近于0。尖峰式分布(峰度为负),标准正态分布(峰度为0),扁平式分布(峰度为正)。标准误差标准误差一般用来判定该组测量数据的可靠性,在数学

13、上它的值等于测量值误差的平方和的平均值的平方根。标准误差在正态分布中表现出正态分布曲线的陡峭程度,标准误差越大,曲线越平坦,反之,曲线越陡峭。相关系数相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。 模型的求解调用Excel描述统计功能,对数据进行描述统计结果如表1和表2表1 描述统计结果表描述统计量ChannelRegionFreshMilkGroceryFrozenDetergentsPaperDelicassen平均1.3227272.543一八一八一

14、八12000.35796.2667951.2773071.9322881.493一五24.87标准误差0.0223一三0.036911991602.9377351.8457453.0455231.4375227.2985一三4.4433中位数13850436274755.5一五26816.5965.5众数133366119620624259一八834标准差0.4680520.77427244912647.337380.3779503.1634854.6734767.8542820.106方差0.2190720.5994978261.6E+0854469967903101042356785322

15、7324367952997峰度-1.42746-0.10011083511.5364124.669420.9146754.6892819.00946170.6949偏度0.760951-1.283626932.56一三234.0537553.5874295.9079863.63一八5111.一五一五9区域121121487344392777608444082447940最小值1135532533最大值23112一五17349892780608694082747943求和58211195280一三125503573498562一三516501267857670943观测数440440440440

16、440440440440最大(1)23112一五17349892780608694082747943最小(1)1135532533置信度(95.0%)0.0438550.0725461761一八5.003691.51一三890.4077454.8631446.7286264.2324表2 相关系数统计表相关系数ChannelRegionFreshMilkGroceryFrozenDetergentsPaperDelicassenChannel1.00Region0.061.00Fresh-0.170.061.00Milk0.460.030.101.00Grocery0.610.01-0.010

17、.731.00Frozen-0.20-0.020.350.12-0.041.00Detergents_Paper0.640.00-0.100.660.92-0.一三1.00Delicassen0.060.050.240.410.210.390.071.00由表1可知主要的销售途径是1,主要的销售区域(中位数和众数)是3。保鲜品(FRESH)平均开支为12000,是几种产品中均开支最高的,说明该供货商的主要输出开支为保鲜品;杂货产品(GROCERY)平均开支7951.277,是销量第二的产品种类。每个种类的产品标准差都很高,说明离散程度很高,可以看出不同地区不同渠道对各类产品的需求较强的随机性;

18、峰度都为正,说明跟正态分布类似,比正态分布扁平。偏度较低,大体类似中高两边低的平衡状态分布。其中熟食产品(DELICATESSEN)的峰度和偏度都超高,这类产品与正态分布近似度低,尾部散布的趋势较明显,分布较为平均。由表2可知销售途径(CHANNEL)与乳制品(MILK)、杂货产品(GROCERY)、洗涤剂和纸制品(DETERGENTS&PAPER)相关性较强,说明不同的销售途径会影响上述三种产品的批发量,而保鲜品(FRESH)、冷冻开支(FROZEN)与销售途径基本无关;销售区域(REGION)与各个品种的相关性都很弱;保鲜品(FRESH)与冷冻开支(FROZEN)相关性较强,冷冻成本提高时

19、批发商有可能减少保鲜品的批发量以减少保鲜成本;乳制品(MILK)与杂货产品(GROCERY)、洗涤剂和纸制品(DETERGENTS&PAPER)、熟食产品(DELICATESSEN)有较强的正相关性说明这些产品具有相似特点;杂货产品(GROCERY)与洗涤剂和纸制品(DETERGENTS&PAPER)相关性特别高,因为这两类为生活必需品。总之,该批发商经营状况为:主要销售途径是1,主要销售区域为3,主要销售产品类型为保鲜品和杂货产品,各种产品的需求具有随机性和离散性,销售途径对乳制品和生活用品的影响较大,而保鲜品与冷冻等保鲜支出的成本有关。该批发商可能是某超市或者商场的经销商,产品的种类较多,

20、量也比较大,分布也较平均。二、问题二的分析与求解1对问题的分析问题要求分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著的影响六大类商品的销售额,最终找到影响六大类商品销售的主要因素。设销售途径为因素A,销售区域为因素B,因素A有两个水平,因素B有三个水平,在Excel中对数据进行处理后,分别做无交互作用的双因素因素分析和交互作用的双因素分析,然后通过Matlab编程计算,得出因素A,因素B,A和B交互作用检验的p值,将其与给定的显著性水平进行比较,。再分析比较三个检验的p值的大小找到影响六大类商品销售的主要因素。2对问题的求解模型 双因素方差分析模型 模型的准备双因素方差3分析需

21、考虑两个因素对所关心的指标的影响,两个因素分别为A,B,他们分别取r,s,个不同的水平,记为和将在水平组合下的试验结果看成随机变量,考虑因素A,B,对指标的影响是否显著,仍然假定在水平组合下的指标服从正态分布,并假设各个水平组合下的指标方差相同。双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系,无交互作用的双因素方差分析其结果与对每个因素分别进行单因素方差分析的结果相同;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。 模型的建立设取个水平,取个水平,在水平组合服从正态分布,。又设水平组合

22、下做了个试验,所得结果记作,且相互独立。将分解为其中是总均值,是水平对指标的效应,是水平对指标的效应,是水平与对指标的交互效应。所以可建立如下模型原假设为无交互影响的双因素方差分析因为无交互影响,所以=0,于是记其中为总平方和,为因素A的平方和,为因素B的平方和,反应了试验的随机误差,而且满足当成立时,当成立时,检验规则为交互作用的双因素方差分析记 其中为总平方和,为因素A的平方和,为因素B的平方和,为误差平方和,为交互作用的平方和,而且满足当成立时,根据此统计量,可以检验 模型的求解将销售途径看做因素A,将销售区域看做因素B,则因素A有两个水平,因素B有三个水平,,然后分析这两个因素及其交互

23、作用是否会显著的影响六大类商品的销售额,在Excel中对数据进行处理后通过Matlab(见附录程序1)编程做方差分析可得保鲜品的结果如图2,图2 保鲜品两因素及其交互作用的方差分析结果通过整理可得到六大类商品销售额方差分析的结果如表3表3 六大类商品两因素及其交互作用的方差分析结果销售途径销售区域交互作用FProbFFProbFFProbF保鲜品9.50.00221.640.19610.50.609乳制品59.9801.050.3520.080.9275杂货产品147.4100.730.48340.590.5527冷冻开支12.050.00060.980.37441.850.一五82洗涤剂和纸

24、制品191.401.280.27791.540.2146熟食产品0.890.3460.620.53670.一三0.8767通过比观察表3,可以得到影响保鲜品销售额的主要因素是销售途径;影响乳制品销售额的主要因素是销售途径;影响杂货产品销售额的主要因素是销售途径;影响冷冻开支销售额的主要因素是销售途径;影响洗涤剂和纸制品销售额的主要因素是销售途径;销售途径,销售区域,以及里面或者之间的交互作用都不是是影响熟食产品销售额的主要因素。三、问题三的分析与求解1对问题的分析问题要求利用数据分析方法通过分别建立销售区域和销售途径的判别模型,分别找出影响销售途径和销售区域的主要商品类别,最终为批发销售商提供

25、智慧的经营销售策略。其中销售途径可分为途径1和2,可采用两总体距离判别方法得出销售途径的判别模型,并通过所得线性判别函数中的判别系数,来确定影响销售途径的商品类别;而销售区域可分为区域1、区域2以及区域3,可采用多总体的距离判别法建立销售区域的判别模型,并通过逐个剔除商品类别因素的方法计算误判率,得出影响销售区域的主要商品类别。并通过对上述判别模型和影响因素的研究,综合分析得出批发销售商提供智慧的经营销售策略。2对问题的求解模型 销售途径判别模型两总体距离判别法 模型的准备定义 马氏距离:马氏距离是由印度统计学家马哈拉诺比斯(PC Mahalanobis)提出的,由于马氏距离具有统计意义,在距

26、离判别分析时经常应用马氏距离。一个向量到一个总体的马氏距离: 设是取自均值向量为,协方差矩阵为的总体G的一个行向量,则称为n维向量x与总体G的马氏距离。计算总体的协方差矩阵:由于实际问题中只能得到两个样本的协方差矩阵、,因此当两个总体协方差矩阵相等时如何确定总体的协方差矩阵的方法如下:;其中,分别为两个样本的容量。回代误判率:设、为两个总体和是分别来自,的训练样本,以全体训练样本作为个新样品,逐个代入已建立的判别准则中判别其归属,这个过程称为回判。若属于的样品被误判为属于的个数为个,属于的样品被误判为属于的个数为个,则误判率估计为: 模型的建立先考虑两个总体的情况,设有两个协差阵相同的维正态总

27、体和,对给定的样本Y,判别一个样本Y到底是来自哪一个总体,一个最直观的想法是计算Y到两个总体的距离。我们用马氏距离来指定判别规则,有:;令;当,y不考虑分类;因此有;当和S已知时, 是一个已知的p维向量,W(y)是y的线性函数,称为线性判别函数。a称为判别系数。用线性判别函数进行判别分析非常直观,使用起来最方便,在实际中的应用也最广泛。由于实际问题中只能得到两个样本的协方差矩阵,因此当两个总体协方差矩阵相等时如何确定总体的协方差矩阵的方法如下:;其中分别为两个样本的容量。故判别模型的建立过程如下:分别计算各组的离差矩阵;计算总体的协方差矩阵计算类的均值;计算判别函数的系数;判别函数的常数项生成

28、判别函数,进行回代误判;代入待测样本,判类。模型的求解本题中每个样本可看做一个6维向量, ;分别表示FRESH:保鲜品;MILK: 乳制品; GROCERY: 杂货产品;FROZEN: 冷冻开支;DETERGENTS_PAPER: 洗涤剂和纸制品;DELICATESSEN: 熟食产品;根据附表中的数据,在Excel中对按照销售途径1,2进行数据的分类,利用MATLAB软件编程(见附录程序2)求得判别函数的系数常数项为;即最后的线性判别函数模型为: 回代检验得出误判率,模型判别准确度较高可以接受。结果分析:观察判别函数的系数可知,对应系数的绝对值分别为0.1050,0.3079相比其他系数较大,

29、说明对应的杂货产品(GROCERY)、洗涤剂和纸制品(DETERGENTS&PAPER)对销售途径影响较为明显,尤其是洗涤剂和纸制品对销售途径的判别起到决定性作用。模型 销售区域判别模型多总体距离判别法 模型的建立多总体的距离判别法:设有个元总体,分别有均值向量和协方差阵,对任给的m元样品Y,判断它来自哪个总体, 计算Y到k个总体的马氏距离,比较后,把X判归给距离最小的那个总体,若则检验的总体协方差矩阵相等,则: 上式中的第一项与i无关,舍去,得一个等价的函数:将上式整理得:令则距离判别法的判别函数为判别规则为:则 模型的求解根据本题中附表中的数据在Excel中销售区域分为1,2,3三类。利用

30、MATLAB软件编程(见附录程序3)求得三类样本的判别函数系数分别为: 常数项分别为0.7823,1.0381,0.9一五6。故 判断规则:,则;i=1,2,3。回代误判率p=0.1750,判别模型准确度较高,可以接受。由于多样本判别模型无法直接得出线性判别函数,为了找出影响销售区域的主要因素,考虑利用误判率比较的方式侧面分析六大影响因素对销售区域的影响。主要步骤如下:依次剔除因素求出新的5维向量误判率,比较的大小变化:剔除因素FRESH:;回代计算误判率;剔除因素MILK:;回代计算误判率;以此类推共得6种误判率;比较与的大小:;表示剔除因素后,误判率降低,判别模型更加精确,同样表示剔除的因

31、素i对整体的分类不但没有推进作用,反而加大了判别的模糊性,理应剔除;表示剔除因素后,误判率增大,判别模型精确度降低,表示剔除因素i之后整体分类不再明显,即提出的因素i是影响分类的主要因素;表示剔除因素后误判率不变,即该因素对分类几乎没有影响。针对附表中的数据,利用MATLAB软件编程求解结果如下:(见附录程序4)回代误判率比较表4表4 回代误判比较表0.17050.17050.17050.17050.17050.17050.1705结果分析:由表格数据,逐个去除因素后回代误判率不变,表明区域销售几乎不受任何销售产品因素的影响,这也与问题一通过相关系数法分析得出的结论相呼应。综合上述对销售途径和

32、销售区域分类影响因素的分析,我们建议该经销商注意加大冷冻产品与洗涤剂纸制品销售途径的研究与开拓,因为这两个因素与销售途径的相关性最大;而销售区域与这六类因素无明显关系,可能是因为销售区域的消费水平或者销售对象较为相似,因此在确定营销策略的时候,不用过多考虑销售区域的划分。6 误差分析1问题二在无交互作用的双因素方差分析中,我们考虑的理想化,比如在研究销售途径时,不仅控制销售区域这一因素,还需要控制其他题目中没有考虑的因素是没有影响的。显然其他因素是不可避免的,所以会对结果造成误差。2问题三判别模型对于落在附近的样本点,按照此判别法虽可进行判断,但误判的可能性较大。7 模型的评价与推广一、模型的

33、优点 1问题一中用Excel进行描述统计方便快捷;2问题二模型通过Matlab 编程可以直接算出各因素和交互作用是否对六大类商品销售额是否显著影响,不用进行重复复杂的计算;对于双因素方差分析模型,有些指标不满足方差的齐效性,我们在模型的改进中采用了非参数检验去分析各因素的显著性;3问题三基于马氏距离法建立判别模型使判别相比一般的欧氏距离更加准确,因为马氏距离不受量纲的影响,且考虑到了数据之间的关系,排除变量之间的相关性干扰。二、模型的缺点1问题二中方差分析模型有很多假定条件,我们采用方差分析时有些条件忽略了。在最后模型改进的时候,我们运用非参数检验进行了销售途径和销售区域显著性分析,但由于非参

34、数检验的局限性,没能进行交互作用的显著性分析。2问题三判别模型使用马氏距离夸大了变化微小的变量的作用。三、模型的推广1描述统计对比分析模型可用Excel简便的描述统计工具进行推广,应用于所有需要基础统计量的领域;2双因素方差分析模型对于问题二的双因素方差分析模型研究两个因素及其交互作用对六大类商品销售额的显著影响,我们可以考虑其他的因素,进行多因素方差分析,为销售商提供更加有效的经营决策,本模型能推广到社会经济生活的很多方面;3判别分析模型该判别模型对于数据判别的精度较高,故可以广泛应用于销售分析中未知数据的或者丢失数据寻找以及归类,根据判别函数可以清晰得出相关因素权重大小,故该模型还可用于销

35、售分析中重要商品类型的挖掘,为商家经营策略的制定提供简便高效的依据。8 模型的改进在问题二中,问题要求分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著的影响六大类商品的销售额,最终找到影响六大类商品销售的主要因素。所以我们建立了无交互作用的双因素方差分析和有交互作用的双因素方差分析,从而找出了影响六大类商品销售的主要因素,然而做方差分析需要满足一定的假设条件:1各处理条件下的样本是随机的;2各处理条件下的样本是相互独立的;3各处理条件下的样本分别来自正态总体;4各处理条件下的样本方差相同,即具有齐效性。所以现在对数据运用SPSS软件进行正态性检验和方差齐性检验。运用SPSS软件对

36、六大类商品销售额进行Kolmogorov-Smirnov检验,可得到结果如图3图3 假设检验汇总从图2可以看出六大类商品的销售额都不服从正态分布在SPSS软件中对销售途径和销售区域分组下的数据分别进行方差齐性检验得到结果如表5,表6。表5 销售区域的方差齐性检验Levene 统计量df1df2显著性保鲜品10.73114380.001乳制品39.07214380.000杂货产品98.04214380.000冷冻开支26.90914380.000洗涤剂和纸制品149.06714380.000熟食产品.03614380.849表6 销售区域的方差齐性检验Levene 统计量df1df2显著性保鲜品

37、2.26924370.105乳制品0.一八224370.834杂货产品0.12524370.883冷冻开支4.00724370.019洗涤剂和纸制品1.98124370.一三9熟食产品1.51624370.221从表5、表6可以看出对于销售途径因素,可知乳制品、杂货产品、冷冻开支以及洗涤剂和纸制品都不通过方差齐性检验;对于销售区域因素,可知冷冻开支不通过方差齐性检验。所以可通过对数据进行Boxcox变换,使其符合正态分布,再对数据进行对数变换,倒数变换,开方变换等后进行方差齐性检验,也发现不是所有的样本方差都相同,即不具有齐效性,所以采用非参数检验。两个独立样本的比较用秩和检验,即销售途径因素

38、用秩和检验;用多个样本的比较用Kruskal-Wallis检验。即销售区域因素用Kruskal-Wallis检验。1.秩和检验法秩和检验法也叫Mann-Whitney-Wilcoxon检验,简称M-W-W检验,也称Mann-Whitney U检验。通过SPSS检验结果如表7表7 Mann-Whitney U检验保鲜品乳制品杂货产品冷冻开支洗涤剂和纸制品熟食产品Mann-Whitney U16493.0005122.5002635.00014984.0001667.00016848.500Wilcoxon W26646.00049673.50047一八6.00025一三7.000462一八.00

39、06一三99.500Z-3.741-12.859-14.854-4.951-一五.630-3.456渐近显著性(双侧)0.0000.0000.0000.0000.0000.0012.Kruskal-Wallis检验Kruskal-Wallis检验是利用秩平均建立检验统计量,检验多个独立总体的分布是否存在显著差异。通过SPSS检验结果如表8表8 Kruskal-Wallis检验保鲜品乳制品杂货产品冷冻开支洗涤剂和纸制品熟食产品卡方1.0691.4613.2022.8590.4530.233df222222渐近显著性0.5860.4820.2020.2390.7970.890a. Kruskal

40、Wallis 检验b. 分组变量: 销售区域由于非参数检验的局限性不能处理交互作用,在这里不做检验。从表7、表8可以看出影响六大类商品销售的主要因素都是销售途径。参考文献1 百度百科.描述统计. xbaike.baidux/view/334065.htm;20一三.04.2 百度百科.数据分析. xbaike.baidux;2014.07.3 司守奎.孙玺菁.数学建模算法与应用M.国防工业出版社.2011.8.4 姜启源.谢金星.叶俊.数学模型(第三版)M.高等教育出版社.2003.8. 5 陈桂明.戚红雨.潘伟. MATLAB数理统计M.科学出版社. 2002.6 范金城.梅长林.数据分析

41、M .科学出版社.2002.附录程序1 Q=30624 7209 4897 一八711 763 287611686 2一五4 6824 3527 592 6979670 2280 2112 520 402 34725203 11487 9490 5065 284 6854583 685 2216 469 954 一八1956 891 5226 一三83 5 一三286373 780 950 878 288 285一五37 3748 5838 一八59 3381 806一八567 一八95 一三93 一八01 244 21007291 1012 2062 1291 240 17753317 66

42、02 6861 一三29 3961 12一五2806 10765 一五538 一三74 5828 2388一八044 1475 2046 2532 一三0 1一五84一五5 367 一三90 2306 86 一三014755 899 一三82 1765 56 7495396 7503 10646 91 4167 2395041 11一五 2856 7496 256 3757274 659 1499 784 70 65912680 3243 4一五7 660 761 7864042 2204 一五63 2286 263 689一八69 577 572 950 4762 2038656 2746

43、2501 6845 694 9802344 10678 3828 1439 一五66 49025962 1780 3838 638 284 834964 4984 3316 937 409 7一五603 2703 3833 4260 325 2563一八38 6380 2824 12一八 1216 2958635 820 3047 2312 4一五 225一八692 3838 593 4634 28 12一五7363 475 585 1112 72 21647493 2567 3779 5243 828 225322096 3575 7041 11422 343 256424929 一八01 2475 2216 412 1047一八226 659 2914 3752

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号