《专题讲座数据分析与管理.ppt》由会员分享,可在线阅读,更多相关《专题讲座数据分析与管理.ppt(43页珍藏版)》请在三一办公上搜索。
1、1,数据分析与管理专题讲座 几个应用案例,制作人:魏瑜2010.05,2,主要内容,1.分层分组与管理2.理解条件概率3.精度与效益4.试验设计与质量改进5.误差分析与需求不确定分析6.原假设与备择假设的选择,3,1.1分层分组与管理,4,1.2分层分组与管理,5,1.3分层分组与管理(Excel),6,2 理解条件概率,据调查某地区居民的肝癌发病率为0.0004,记“该地区居民患肝癌”为事件B。现用甲胎蛋白法检查:若呈阴性,表明不患肝癌,若呈阳性,表明患肝癌。由于技术和操作不完善以及种种特殊原因,是肝癌者未必检出阳性,不是患者也有可能呈阳性反应。据多次实验统计,患肝癌检验为阳性的概率为0.9
2、9,未患病但检验为阳性的概率为0.05.现某人体检出甲胎蛋白阳性,问他患肝癌的概率是多少?若医生根据其他症状怀疑某人有病,这人真有病的概率为0.4,若检验结果再为阳性,此时该人真有病的概率为多少?(参见茆诗松,周纪芗编著概率论与数理统计中国统计出版社47-48页),7,3 精度与效益,某厂生产一磅的罐装咖啡。自动包装线上大量数据表明,每罐重量是服从标准差为0.1磅的正态分布。为了使得每罐咖啡少于1磅的罐头不多于10%,应把自动包装线控制的均值调节到什么位置上?若每日可产2000罐咖啡,每磅咖啡的成本价是50元,新的包装机的单价是10万元,其包装的产品的标准差是0.025磅,问是否该购买新机器?
3、(参见茆诗松,周纪芗编著概率论与数理统计中国统计出版社108-109页),8,4 试验设计与质量改进实验案例利用正交试验设计改进多媒体教室使用效果,4.1 试验指标的选取4.2 试验因素的选取4.3 因子水平选取4.4 正交试验表的选取4.5 按照正交表控制各因子的水平测量试验指标值4.6 分析试验数据4.7 结论,9,4.1试验指标的选取,选取学生对多媒体教室视觉的满意度作为试验指标。,10,4.2试验因素的选取,通过问卷调查的形式了解到影响我院多媒体教室光环境的因素主要有以下因素:(1)看不清楚银幕上文字和图像;(2)教师看不清讲义和学生的表情,不能便于键盘等设备的操作;(3)室内光线不能
4、够满足学生书写的需要;(4)有眩光存在;(5)教室内光线不均匀,黑板没有局部照明;(6)坐在两侧和后面的同学感觉较差。,11,4.3试验因素的选取,考虑到以上因素,根据前人的研究,并依据实践经验和实验所具备的条件,我们选取以下5种因素作为影响多媒体教室光环境满意度的主要因素。A、影响多媒体教室光强度的状态;B、课件色彩的对比;C、课件字体的大小;D、黑板局部照明的强度;E、座位的位置。,12,4.4因子水平选取(白天),13,4.4因子水平选取(晚上),14,4.5正交试验表的选取,一个5因素4水平正交试验 L16(45)正交表,15,4.5试验结果(白天),16,4.6试验结果分析表,为了便
5、于计算,把统计出来的白天状况下学生对多媒体教室光环境的满意度列在表3的右边,做成一个新的表6,这张表便于对满意度进行分析计算。同时为了便于研究,用每一行的满意度减去140,把结果写在表6内。K1这一行的5个数,分别是因素A,B,C,D,E的第一水平所在的实验中对应的满意度(减去140以后)之和,比如对于因素A(第一列),它的第一水平安排在第1,2,3,4号实验中,对应的满意度(减去140以后)分别为1,35,58,85,其和为179,记在K1这一行的得第一列中;K4这一行的五个数,分别是因素A,B,C,D,E的第四水平所在的实验中对应的满意度(减去140以后)之和。k1,k2,k3,k4 这4
6、行的5个数,分别是K1,K2,K3,K4这4行的5个数除以4所得的结果,也就是各水平所对应的平均值。同一列中,k1,k2,k3,k4这四个数中的最大值减去最小值所得的差叫做极差。一般地说,各列的极差是不同的,这说明各因素的水平改变时对实验指标的影响是不同的。极差越大,说明这个因素的水平改变时对实验指标的影响越大。极差最大的那一列,则那个因素的水平改变时对实验指标的影响就最大,那个因素就是我们要考虑的主要因素。,17,4.6试验结果分析,从以上分析可以得出结论:在白天的状况下,各因素对实验指标(满意度)的影响按大小来说应当是:C(课件字体的大小)B(课件色彩的对比)E(座位的位置)A(影响多媒体
7、教室光强度的状态)D(黑板局部照明的强度);最好的方案应当是C4B2E3 A4D3,即C4:课件字体的大小,第4水平,28号字体;B2:课件色彩的对比,第2水平,蓝底白字;E3:座位的位置,第3水平,中间;A4:影响多媒体教室光强度的状态,第4水平,窗帘全部放下,开最后一排灯;D3:黑板局部照明的强度,第3水平,23.1Lx;,18,4.6试验结果分析,可以看出来,这里分析出来的最好方案在已经做过的16次试验中没有出现,与它比较接近的是第13号试验。在第13次试验中只有座位的位置和黑板局部照明的强度不是处在最好水平,而且座位的位置和黑板局部照明的强度对满意度的影响是5个因素中最小的两个。从实际
8、做出的结果来看,第13号试验中的满意度是234,是16次试验中最高的,这也说明我们找出的最好方案是符合实际的。,19,4.7结论,利用试验设计原理,采用正交试验等方式,可以以尽量少的试验次数得到满意的试验效果。,20,5 误差分析与需求不确定分析,5.1 需求不确定分类5.2 公司概况5.3 数据特点5.4 数据间的关系及其模拟5.5 模拟误差分析5.6 需求不确定性的主要成因及对策分析,21,5.1需求不确定分类,对于供应链中的一个实体来说,它面临着两方面的不确定性:需求不确定性和供应的不确定性。其中,供应的不确定性包括运作的不确定性和衔接的不确定性,而需求不确定性则包括市场的不确定性和衔接
9、的不确定性。即不论是供应或是需求的过程中,都存在着由于供应链上下游节点间的管理和信息不畅等衔接性因素引起的不确定性,即衔接的不确定性。例如,由于货物短缺,下游企业间可能会存在短缺博弈,而上游企业看不到顾客的真实需求,从而造成需求不确定性增加,这是由于信息不畅引起的不确定性增加。而不合适的定期总量数量折扣策略会引起财务期末需求的剧烈波动,这是因为上游企业的管理不善引起的不确定性增加。HLee等2总结了供应链中牛鞭效应的主要成因和对策,见表1。这些不确定性的因素都是属于供应链上下游节点间的衔接因素。,22,牛鞭效应的成因及相应对策,资料来源:H Lee,P Padmanabhan,S Whang.
10、Information distortion in a supply chain:the bullwhip effectJ Management Science,1997,43:546-558,23,5.2 公司概况,该公司的滚筒洗衣机在全国的洗衣机市场中占有一席之地,公司规定零售商运货量中的80%必须付现金开票,所以大部分的运货量是为了满足本月和下月的零售,这是本文模型的基础。公司在全国共有约1500个零售点,在每个零售点,都有销售人员帮助促销,并在每月月初将上月实际销量通过Access传给公司ERP系统。公司掌握洗衣机的最终零售量数据,且直接将洗衣机运送到全国各个零售点,没有通过分销商、批
11、发商等中间环节来销售洗衣机,所以在共享需求信息和减少供应链的流通环节这方面做的较好,因而牛鞭效应不是特别的大。其零售量(Retail)和运货量(Delivery)序列如图1所示:,24,5.3 图一:运货量和零售量数据特点,25,5.3 图二:数据特点长期趋势,26,5.3图三:数据特点各月季节比率,27,5.3 运货量数据特点,从图中可以看出该公司洗衣机需求量有着明显的季节变动和逐年上升的趋势,且运货量的波动程度大于零售量,其中运货量的标准差为10197.31台,零售量的标准差为8102.93台,两者之比为1.26,可见存在着长鞭效应。该品牌洗衣机的零售量基本呈线性上升趋势,运货量数据的趋势
12、也类似,28,5.4数据间的关系及其模拟,因为绝大部分的运货量是为了满足本月和下月的零售,所以如果没有其它因素的影响,可以用本月和下月的零售量来拟合当月的运货量,即可以采用以下模型来拟合运货量。采用最小二乘法估计参数,发现其中第37和64号数据为异常值,标准化残差分别为3.166和3.193,残差分别为7984和8058台。采用时间序列分解法预测值代入,对其进行一系列检验,发现扰动项具有较强的一阶自相关,采用Cochrance-Orcutt迭代法估计其扰动项的一阶自相关系数值,并利用广义差分变换消除一阶自相关影响,可以获得很好的估计方程。(参见工业工程与管理2009.05),29,5.4数据间
13、的关系及其模拟,估计相应参数得到相应模型为 其中 R2=0.853;Rj2=0.849;DW=2.236;F=198.004;VIF=1.742。该方程和每个回归系数都通过了显著性检验(显著性水平低于0.001),方差膨大因子VIF也不大,未发现明显异常值,且通过了DW检验。,30,5.5 模拟误差分析,31,5.5 模拟误差分析,32,5.6需求不确定性的主要成因及对策分析,需求预测不准和短缺博弈 数量折扣策略 临时性突发因素,33,需求预测不准和短缺博弈,通过进一步分析以上现象可以发现,在零售旺季到来的前一个月,正是零售商向生产商运货的高峰。而在每个零售旺季到来之前,零售商都害怕因缺货而损
14、失市场,所以零售商都订购并运走更多的产品。所以在每年的1、5、10和12月的零售旺季到来之前的1、4、9月,实际运货量比理论的运货量要高许多,而之后的2、5、7、10和11月则因为前面的库存剩余,实际运货量又比理论运货量要低。即造成每年的1、4、9月实际运货量高于理论的运货量,而2、5、7、10和11月实际运货量低于理论的运货量。此部分的原因可以归结为零售商对旺季的需求预测不准和短缺博弈造成的。,34,需求预测不准和短缺博弈(续),站在公司的角度,需要采取一定的措施协助零售商进行预测。可以通过提高相互之间的信息共享和利用程度、与零售商进行合作预测等方法来减少零售商的预测误差,降低其需求的不确定
15、性。同时,公司单纯依靠订单来运货的行为也导致了零售商在旺季的博弈行为,增加了运货量的波动程度。公司除了需要提高与零售商之间的信息共享程度以消除零售商的顾虑之外,还可以采用历史数据分配法对产品进行更为合理的分配。历史数据分配法4是指当出现供应不足时,因为供应商已经知道零售商的订单是夸大的需求量,所以不以当前订单数量为分配依据,而以过往定购情况作为依据进行分配。在这样的分配制度下,零售商单方面的放大自己的订单就变的没有意义,而且使得零售商不得不以一种诚信的态度与供应商进行合作,达到双方共赢的目的,同时也达到了降低供应商的需求不确定性、弱化牛鞭效应的目的。,35,数量折扣策略,通过对销售数据的分析,
16、可以发现1、2和12月的拟合误差的标准差特别大,说明除了为满足当月及下月的零售以外,还有某些因素影响着这几个月的运货量。公司在每年年末对各个零售点的一年的开票量进行统计,超过一定数量则给予不同程度的返点折扣,即采用定期总量折扣的方式来鼓励零售商多订货。这样,如果零售商该年度运货总量没有达到但接近相应的折扣点,为拿到相应的返点,则会在年底多运货,反之,如果零售总量已经达到相应的折扣点,则为了保证次年能达到相应的折扣点,就会故意少运货,而这样的行为又会影响到1月和2月的运货量,这样就造成公司的12月、1月和2月的运货量极不稳定。,36,数量折扣策略(续),造成这种现象的原因可以归结为数量折扣策略问
17、题,这种折扣策略在给公司带来了一定的收益的同时,也使得需求变得极不稳定。在每年年末的时候,公司的运货量的波动总是比拟合运货量的波动程度大,这种由于折扣策略而产生的订购峰值出现在财务水平线末端的情况称为“曲棍球棒现象”4。为了消除这一现象,公司可以采取滚动的总量折扣策略。例如,公司可以向零售商提供以过去12个月的订购量的总和作为基础的价格折扣。这样可以避免零售商的订货量在年末出现较大波动,在一定程度上可以减弱“曲棍球棒现象”。,37,临时性突发因素,同样经过咨询公司预测及其他相关人员分析得知,2005年1月的运货量临时增加是因为公司为抢占市场而让利消费者的促销缘故。2007年5月,公司对大部分机
18、型的洗衣机价格进行了上调,零售商提前得到了消息,所以4月份大量提前运货,造成4月的运货量大增。而因为涨价,5、6月零售量反而比以往还低,造成大量洗衣机积压在零售商处,使得5、6两月的运货量很低,人为地使得本来就已是“旺季更旺,淡季更淡”的现象更加明显。从削弱需求不确定的角度出发,公司不应该让下游零售商提前知道调价信息。而且如果公司在该行业占有一定的优势(本文中的公司即具有这一点),不怕市场份额被竞争者抢占,则应该在淡季进行促销来减弱由于季节性因素引起的需求波动,也可以采取天天低价策略来避免价格的波动引起的需求不确定性。,38,5.7 结语,总之,因为下游厂商的售出量中已包含了市场的不确定性,所
19、以,若能得到下游厂商的实际售出量,即可将其作为自变量,供应商的需求量作为因变量,然后借鉴本文作一因果回归模型。通过对该模型的模拟误差进行分析,就可以将供应商所面临的需求不确定性中来自于与下游厂商衔接的部分显现出来。而这部分需求不确定性往往都是可以通过供应商自身单方面努力就可在短期内有效降低的。本文数据来源于实际,而且广义差分模型具有一定的稳健性(鲁棒性,robustness)。期望本文能起到抛砖引玉的作用,能为寻找适用面较广的有效降低需求不确定性的方法提供一种思路。同时本文所采用的方法简单、明了、易于模仿,希望能为其它公司所借鉴。,39,6.原假设与备择假设的选择例题,【例】某电子元件批量生产
20、的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(0.05),单侧检验,40,6.原假设与备择假设的选择例题,H0:1200H1:1200=0.05n=100临界值(s):,检验统计量:,在=0.05的水平上不能拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时H0:1200,决策:,结论:,41,6.原假设与备择假设的选择例题,H0:1200H1:1200=0.05n=100临界值(s):,检验统计量:,在=0.05的水平上不能拒绝H0,即不能认为该厂生产的元件寿命显著地低于1200小时H0:1200,决策:,结论:,42,6.原假设与备择假设的选择,因为假设检验只控制了第一类错误的概率,没有控制第二类错误的概率,所以拒绝原假设是比较有把握的,故将想要验证的结果放到备择假设中;其实假设检验倾向于保护原假设,故将传统认为正确的放在原假设这样做还可以减少犯第二类错误的概率;等号包含在原假设中 因为整个过程都是在假设原假设是正确的前提下计算相应小概率事件发生与否的。,43,谢 谢!,