决策理论与方法第五章多属性决策、多目标及序贯决策ppt课件.pptx

资源描述

《决策理论与方法第五章多属性决策、多目标及序贯决策ppt课件.pptx》由会员分享，可在线阅读，更多相关《决策理论与方法第五章多属性决策、多目标及序贯决策ppt课件.pptx（57页珍藏版）》请在三一办公上搜索。

1、2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,1/61,多属性决策分析多目标决策,什么是多目标决策问题？(例如购买衣服时，款式、价格、颜色、质量等可能都是决策目标)。多目标决策问题的特点：决策问题的目标多于一个；多个目标间不可公度(non-commensurable)，即各目标没有统一的衡量标准，难以比较；各目标之间存在矛盾。一般将决策变量离散、决策方案有限的多目标决策问题称为多属性(Multi-attribute)决策问题；而将决策变量连续、有无限决策方案的多目标决策问题称为多目标(Multi-objective)决策问题。两者又可以统称为多准则(Multi-crite

2、rion)决策问题。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,2/61,多属性决策分析相关术语,属性(Attribute)：备选方案的特征、品质或性能参数 (如描述服装的款式、颜色、布料、质量、价格) ，也称为指标。指标体系(Index Systems)：一系列互相联系、互相补充的指标所组成的统一整体。指标体系往往由多层组成(习惯上称为一级指标、二级指标等)，层次结构分为树状结构和网状结构，其中以树状结构最常用。,一级指标,总目标,二级指标,三级指标,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,3/61,多属性决策分析相关术语,目标(Obje

3、ctive)：决策人的愿望或决策人所希望达到的、努力的方向(如物美价廉)。在多目标决策中，目标是求极值的对象，是需要优化的函数式。目的(Goal)：在特定时间、空间状态下，决策人的期望，是目标的具体数值表现。目标和目的常混用。准则(Criterion)：判断的标准或度量事物价值的原则及检验事物合意性的规则，兼指属性和目标。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,4/61,多属性决策分析求解过程,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,5/61,多属性决策分析目标与属性,在多目标决策中，决策目标常用目标集、目标递阶分层结构以及属性集描述；

4、目标递阶分层结构的最下层目标要用一个或多个属性来描述；不同的方案对应的各属性值存在差异，也就导致目标实现的差异，因此可借此来评价方案的优劣；替代属性：某些目标无法用属性值直接度量时，需要使用替代属性对目标进行度量。如师资队伍的质量可以用学历结构、职称结构、专业结构、科研能力等替代属性来衡量。(寻找“替代属性/替代变量”在科学研究中是非常重要的),2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,6/61,多属性决策分析目标与属性,属性选择的要求：每个属性是可测和可理解的；属性集是最小完备集：既要能够描述决策问题的所有(重要)方面，又不能有冗余；属性的测量值是可运算的；属性集内

5、的各属性相互独立、可分解。但在实际决策中，上述要求很难达到，这也正是我们开展决策理论与方法研究的动力源。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,7/61,多属性决策分析目标与属性,例：某流域水资源项目建设目标(指标体系)及属性,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,8/61,多属性决策分析问题的符号表示,MA=X表示方案集，X=x1, x2, , xmA表示属性集，A=a1,a2,an表示状态集，=1, 2, , kV表示值集，所有可能取值的集合:V，分布函数，确定各状态发生的可能性f:XAV，目标函数，确定各方案对应的属性值,202

6、2年11月8日7时20分,决策理论与方法-随机决策理论与方法,9/61,多属性决策分析问题的符号表示,例：给定自然状态的多属性决策问题,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,10/61,多属性决策分析属性值预处理,剩下的问题是我们如何评价方案的优劣。属性值预处理的目标是规范化各属性值，使其能够真正体现方案优劣的实际价值。属性值类型：效益型指标：属性值越大越好；成本型指标：属性值越小越好；中性指标：属性值取某一个恰当的值最优，过大、过小都不合适。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,11/61,多属性决策分析属性值预处理,预处理主要有

7、两项任务：非量纲化：通过某种方法消除量纲的选用对决策或评价结果的影响。归一化：不同属性的属性值取值范围存在很大差别，为了真实反映各属性值的价值，需要将属性值统一变换到0,1区间上以消除属性取值范围的差异对决策或评价结果的影响。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,12/61,多属性决策分析属性值预处理,设fi(a)为方案i的a属性值，记fmax=max(fi(a)， fmin=min(fi(a)线性变换效益型。变换z:fi(a)zi(a)定义为：zi(a)=fi(a)/fmax；成本型。变换z:fi(a)zi(a)定义为：zi(a)=1-fi(a)/fmax；

8、或者变换z:fi(a)zi(a)定义为：zi(a)=fmin/fi(a)。标准0-1变换效益型。 zi(a)= (fi(a)-fmin)/(fmax-fmin)；成本型。 zi(a)= (fmax-fi(a)/(fmax-fmin)。向量规范化：zi(a)=fi(a)/(ifin(a)1/n(n可以取1或2)。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,13/61,多属性决策分析属性值预处理,线性变换,标准0-1变换,向量变换,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,14/61,多属性决策分析属性值预处理,中性属性(最优值为给定区间)规范化

9、策略,zi(a)=(1)fi(a)f0，0(2)f0fi(a)f1，1-(f1-fi(a)/(f1-f0)(3)f1fi(a)f2，1(4)f2fi(a)f0，1-(fi(a)-f2)/(f0-f2)(5)fi(a)f0，0,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,15/61,多属性决策分析属性值预处理,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,16/61,多属性决策分析属性值预处理,异常(outlier)处理。对同一个属性a，若各方案的值差异极大或某方案的值相对其他方案出现明显的偏离，如按一般方法规范化，在评价时该属性的影响将被不恰当地放

10、大（如前例中的论著一项，方案5的值是14，显著大于其他4个方案）。因此需要采用特别方法处理，处理方法有很多，下面介绍一种常用方法。设定一个转换后的期望值（均值）：M(0.50.75)作变换z：fi(a)zi(a)，zi(a)=(fi(a)-E)(1-M)/(fmax-E)+M其中E为当前属性值的均值；fmax为当前属性值的最大值,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,17/61,多属性决策分析属性值预处理,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,18/61,多属性决策分析属性值预处理,专家评分范围差异的处理。当一组专家对若干方案进行评价

11、时，由于习惯不同，各自的评分范围可能存在较大差异，需要进行规范化处理。映射区间定义：M0,M*定义映射z：fi(a)zi(a)，zi(a)=M0+(M*-M0)(fi(a)-fmin)/(fmax-fmin)一般取M0=0，M*=1。对应标准0-1转换。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,19/61,多属性决策分析属性值预处理,两个不同专家对方案1-5评价结果(百分制)如下表。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,20/61,多属性决策分析权重确定,当决策者面对多个目标时，存在目标的重要性不同的问题，这就需要引入权(Weight

12、)的概念加以解决。权是目标重要性的数量化表示，它的作用有：决策人对目标的重视程度；各目标属性值的差异程度；各目标属性值的可靠程度。权重确定方法：两两比较法。对不同目标的重要性进行两两比较，形成一个判断矩阵。但判断矩阵存在两方面的一致性问题：(1)a1/a2=3, a2/a3=2 a1/a3=6? (2)不同专家间的一致性问题a2(1)/a3(1)=2 a2(2)/a3(2)=2?,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,21/61,多属性决策分析权重确定,判断矩阵的构造假设属性ai的权记为wi，则wij=wi/wj为判断矩阵A的第i行第j列元素。A=wijnn在实际

13、决策中，wi是未知的，需要借助专家的评价。我们用专家的评价结果aij=ai/aj代替wij。aij=ai/aj的取值如下：=1：同等重要=3：目标i略重要于目标j=5：目标i比目标j重要(相当重要)=7：目标i比目标j明显重要=9：目标i相对目标j绝对重要=2,4,6,8：上述两个相邻判断的中间值,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,22/61,多属性决策分析权重确定,最小二乘法确定权重。由于用aij代替wij，两者之间可能存在误差ij=(wjaij-wi)。利用最小二乘法，得到下列二次规划方程： Min ijij2=ij(wjaij-wi)2St: iwi=1

14、，wi0(i=1,2,n)利用拉格朗日法可将该优化问题转为求解下列方程组：,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,23/61,多属性决策分析权重确定,Matlab求解：Function weight(A)D=diag(diag(A*A)+1)-A-A;n=length(A);Row1=ones(n,1);Col1=ones(1,n);D=D Row1;Col1 0;B=zeros(n,1);B=B;1;W=inv(D)*B,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,24/61,多属性决策分析权重确定,特征向量法：因为AW=nW，n为A的最

15、大特征值。当判断矩阵A的估计存在误差时，则A中元素值的变化带来最大特征值的变化，记此时的最大特征值为max，则AW=maxW，W为A关于最大特征值max的特征向量，对W进行归一化处理即得到权重向量。Matlab函数：V,D=eig(A)，返回的V为特征向量矩阵；D为特征值矩阵。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,25/61,多属性决策分析权重确定,Satty近似算法：A中每行元素连乘并开n次方，记为wi*；求权重：wi=wi*/iwi*；A中每列元素求和：Sj=iaij；计算最大特征值max=iwiSi判断矩阵A的一致性检验一致性指标CI(Consistenc

16、y Index)：CI=|max-n|/(n-1)随机指标RI(Random Index)：用随机方法构造判断矩阵，经过500次以上的重复计算，求出一致性指标并加以平均得到。一致性比率CR(Consistency Ratio)：CR=CI/RI。CR0.1，一致性好；CR0.1，一致性差。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,26/61,多属性决策分析权重确定,例：设判断矩阵为A ，求权重。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,27/61,多属性决策分析决策方法,一般加权和法将属性表值cij规范化，得zij；i=1m; j=1n。

17、确定各指标的权重系数，wj；j=1n。计算各方案的综合指标Ci=jwjzij。最后根据Ci大小排出各方案的优劣。一般加权和法的使用条件（实际上很难满足）指标体系为树状结构；每个属性的边际价值是线性的(优劣与属性值大小成正比)；任意两个指标的相互价值都是独立的；属性间的完全可补偿性：一个方案的某属性无论多差都可用其他属性来补偿（一个方案优于另一个方案并不要求在所有属性上都优）。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,28/61,多属性决策分析决策方法,AHP法(层次分析法，Satty)：在实际决策中并不是所有指标的值都是容易测量的，但不同方案的这些指标的优劣性是可以

18、比较的。Satty提出了一种层次分析法(Analytic Hierarchy Process)来解决此类问题。构造关于指标权重的判断矩阵，求出各指标的权重wj，并检验判断矩阵的一致性；构造每个方案关于各指标优劣性的判断矩阵，从而得到各方案关于该指标的规范化属性值zij；（如果方案关于该指标的值是可测的，则不需要构造此指标的判断矩阵）计算各方案的综合指标Ci=jwjzij。根据Ci的优劣确定方案的优劣。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,29/61,多属性决策分析决策方法,根据下图所描述的指标体系，如果完全使用AHP法进行决策，需要构造多少个判断矩阵？( ),1

19、6,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,30/61,多属性决策分析决策方法,加权和与加权积的综合决策法：加权和要求指标具有线性可加（可补偿）性，但在实际决策中有些指标之间是不可补偿的，此时方案关于这类指标的优劣可用加权积法。例如，设方案的优劣可由四个一级指标A, B, C, D评判，其中A, B满足可加性，C, D满足可加性，但A、B与C、D间不满足可加性，则可用下面的加权和与加权积的综合决策法确定各方案的优劣：(wAzA+wBzB)(wCzC+wDzD),2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,31/61,多属性决策分析决策方法,逼

20、近理想解排序方法(Technique for Order Preference by Similarity to Ideal Solution, TOPSIS)：借助多属性问题的理想解和负理想解给方案集X中的各方案排序。在多属性决策中，每个属性都有一个最优值，也有一个最差值。取所有属性的最优值构造一个虚拟方案x*，同时取所有属性的最差值构造另一个虚拟方案x0，则称x*为理想解，x0为负理想解。TOPSIS法就是将各实际方案与理想解和负理想解进行比较，离理想解越近、离负理想解越远的方案越好。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,32/61,多属性决策分析决策方法,

21、TOPSIS法求解步骤用向量规范法求得规范决策矩阵：zij=cij/(icij)1/2确定各属性的权重系数W=w1,w2,wn确定理想解和负理想解：zj*=maxi(zij)(效益型属性)或mini(zij)(成本型属性)zj0=mini(zij)(效益型属性)或maxi(zij)(成本型属性)计算各方案到理想解和负理想解的加权距离di*=(j(wjzij-wjzj*)2)1/2di0=(j(wjzij-wjzj0)2)1/2计算综合评价指标Ci=di0/(di0+di*)按Ci的大小对各方案排序，Ci越大方案越优，否则越劣。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法

22、,33/61,多属性决策分析决策方法,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,34/61,多属性决策分析决策方法,TOPSIS法的边界问题,x*,x0,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,35/61,多属性决策分析决策方法,级别高于关系的构造由决策人设定各属性的权重系数W=w1,w2,wn；对给定的两个方案xi和xk进行和谐性检验：(设每个属性都是效益型指标）属性集分类：J+(xi,xk)=j|j1,n, (xi)j(xk)j； J=(xi,xk)= j|j1,n, (xi)j=(xk)j； J-(xi,xk) =j|j1,n, (x

23、i)j(xk)j；计算和谐指数：,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,36/61,多属性决策分析决策方法,和谐性检验：选定0.51，若Iik1, Iik，则通过和谐性检验。越大，决策者承担的风险越小。非不和谐性检验：这里的不和谐性是指当两个方案的某个属性值的差异常大时还能够用其他属性加以补偿（即所谓完全补偿性）。非不和谐性则只承认部分补偿。因此ELECTRE方法由决策人给每个属性j设定一个阈值dj，当(xk)j-(xi)jdj时，则不再接受其他属性的补偿，决策人不再承认xiOxk。确定级别高于关系： Iik1, Iik，且对所有j，有(xk)j-(xi)jdj

24、，则xiOxk。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,37/61,多属性决策分析决策方法,级别高于关系图的绘制将每个方案用平面上的一个点代替；若xiOxk，则以xi为起点，以xk为终点绘制一条有向弧；重复绘制所有的级别高于关系，得到级别高于关系图。级别高于关系图是决策的依据，具体排序办法请参阅相关资料。在此基础上发展起来的决策方法有ELECTRE-法, 法，法，法，TRI法；PROMETHEE-法, 法等。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,38/61,多目标决策分析问题描述,多目标决策问题是指决策变量连续、存在无数决策方案的多

25、准则决策问题。其一般形式为：决策规则：DRf1(x), f2(x), fn(x)x表示一种方案，且xX=xRN|gk(x)0, k=1,2,m, x0问题共包含n个目标，每个目标可能受N个属性影响，所有属性必须满足一定的约束条件（共计m+N个约束）。多目标决策分析就是根据给定的决策规则（体现了决策人的偏好）从可行方案集X中找出最佳调和解xC。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,39/61,多目标决策分析决策方法,多目标决策问题主要使用多目标规划方法进行求解。DEA方法(Data Envelopment Analysis)：在多目标决策分析中，除多目标优化问题外

26、，还有一类多目标评价问题：对于多个同质的管理系统(决策单元)，如果已知各系统投入和产出，如何评价这些系统的优劣，或者说相对有效性？问题描述：设有n个决策单元，每个决策单元都有m种资源投入，第j个决策单元第i种投入指标的投入量记为xij0(已知)；每个决策单元均有p种产出，第j个决策单元第r种产出量记为yrj0(已知)。vi 、ur分别表示第i种投入指标和第r种产出指标的权系数，需要通过建模得到。如何评价这n个决策单元的相对有效性？,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,40/61,多目标决策分析决策方法,C2R(Charnes, Cooper, Rhodes)模型

27、(第一个DEA模型)对每一个决策单元j，都定义一个效率评价指标：hj称为效率指标，可通过对权系数取值的选择使hj1。评价第j0个决策单元有效性的C2R模型为：,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,41/61,多目标决策分析决策方法,模型转化：将分式规划转变成线性规划。令则分式规划转变为下列形式：,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,42/61,多目标决策分析决策方法,有效性分析：若线性规划的最优解0，0满足条件则决策单元j0为弱DEA有效。若00， 00也成立，则决策单元为DEA有效。,2022年11月8日7时20分,决策理论

28、与方法-随机决策理论与方法,43/61,序贯决策分析问题描述,序贯决策是一类多阶段决策问题，前一阶段的决策结果对后一阶段决策直至最终决策产生影响，整个决策问题的求解需要采取多次行动才能完成。将贝叶斯决策分析方法应用于不同的决策阶段，并根据各阶段之间的关系可以获得多阶段决策问题的解。动态规划和马尔可夫决策是两类重要的多阶段决策方法。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,44/61,序贯决策分析多阶段决策,经过相互衔接、相互关联的若干阶段决策才能完成的决策任务称为多阶段决策。决策分析的关键：划分决策阶段、确定各阶段状态变量、寻找各阶段之间的关系；采用从后向前的逆序归

29、纳法进行决策分析。决策方法：根据问题不同，可选用贝叶斯决策分析方法、多属性决策方法或多目标决策方法。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,45/61,序贯决策分析贝叶斯方法,例：某公司计划购买一种新产品专利，购置费1万元。若购置了专利，可选择三种生产规模：大批量生产(a1)，中批量生产(a2)，小批量生产(a3)。市场销售状态为：畅销1,0.6;一般2,0.3;滞销3,0.1。根据历年资料统计分析，新产品进入市场的销售收益矩阵如左下表。为了准确掌握市场动向，公司可投入0.5万元开展试销。根据统计表明，产品欢迎度和销售状态之间的关系如右下表。试帮助该企业做如下决策

30、：是否购买专利？(已知如果不购买专利，1万元的投资收益为1.1万元)购买专利后是否试销？如何确定该公司的批量生产计划？,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,46/61,序贯决策分析贝叶斯方法,解：这是一个三阶段决策问题。第一阶段确定是否购买专利，第二阶段确定是否试销，第三阶段确定批量生产计划。决策过程采取逆序归纳法，即先从第三阶段开始。试销：计算后验概率及各批量生产计划的收益，得：试销的期望收益为：0.44*3.406+0.39*2.620+0.17*1.53=2.7805,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,47/61,序贯决策

31、分析贝叶斯方法,不试销：结论：,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,48/61,序贯决策分析Markov法,有一类序贯决策问题，其状态随着时间变化而随机变化，决策的任务就是根据当前状态预测其未来某一时刻的状态，如销售状态预测、股价预测等。下面介绍一种Markov决策方法分析求解此类问题。虽然Markov过程是很严格的，实际管理问题并不能总是满足其条件，但往往将其看作近似Markov过程也能得到很好的结果。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,49/61,序贯决策分析Markov法,链及其状态集：设m为随机变量(如股价)，称随机变量

32、序列m|m=1,2,.为链，称由m的全体状态构成的有限集为该链的状态集(如上涨、持平、下跌)，记为N=N1,N2,.,Nn。Markov链：设链m|m=1,2,.，其状态为N=N1,N2,.,Nn。若对于任意正整数k及i(1), i(2), . ,i(k), i(k+1)n，条件概率等式：pk+1=Ni(k+1)|1=Ni(1),.,k=Ni(k)=pk+1=Ni(k+1)|k=Ni(k)成立，则称链m|m=1,2,.为Markov链。说明：Markov链的特点是随机变量在第k+1时刻出现某状态的概率仅取决于其在第k时刻的状态，而与k时刻之前的任何时刻的状态无关，即无后效性。,2022年11月

33、8日7时20分,决策理论与方法-随机决策理论与方法,50/61,序贯决策分析Markov法,例：如果股价状态(u:上涨；e:持平；d:下跌)的变化序列构成Markov链，则根据下列两个序列：udeedu, duddeu预测下一个交易日为上涨的概率相同。齐次Markov链：设m|m=1,2,.，其状态为N=N1,N2,.,Nn。对于任意正整数i,j,以及s,t,k，条件概率等式ps+k=Nj|s=Ni=pt+k=Nj|t=Ni成立，则称此Markov链为齐次Markov链。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,51/61,序贯决策分析Markov法,状态转移概率及

34、转移概率矩阵：设齐次Markov链m|m=1,2,.，状态为N=N1,N2,.,Nn。称pij=ps+1=Nj|s=Ni为随机变量从状态Ni到Nj的转移概率(即s时刻为Ni状态时，s+1时刻为Nj状态的概率)。称对应的矩阵P=(pij)nn为转移概率矩阵。显然有：pij0; jpij=1。k步转移概率及k步转移概率矩阵：设齐次Markov链m|m=1,2,.，其状态为N=N1,N2,.,Nn。称pij(k)=ps+k=Nj|s=Ni为随机变量从状态Ni经k步转移到Nj的转移概率(即s时刻为Ni状态时，s+k时刻为Nj状态的概率)。称对应的矩阵P(k)=(pij(k)nn为k步转移概率矩阵。显然

35、有：pij(k)0; jpij(k)=1。可以证明：P(k)=Pk,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,52/61,序贯决策分析Markov法,基于Markov过程的预测：设随机变量遵从齐次Markov过程，状态转移概率矩阵为P，且第k时刻随机变量的各状态N1,N2,.,Nn的概率分布为u(k)=(u1(k), u2(k), . ,un(k)T，则第s时刻(sk)随机变量的各状态的概率分布为：u(s)=(Ps-k)Tu(k)特别地，若k=0(初始状态)，则有u(s)=(Ps)Tu(0),2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,53/6

36、1,序贯决策分析Markov法,稳定状态概率：设有齐次Markov链m|m=1,2,.，状态为N=N1,N2,.,Nn。若对一切状态Ni，存在不依赖于i的常数j，对于状态Nj，恒有：limkpij(k)=j，则称该齐次Markov链具有遍历性。j称为状态Nj的稳定状态概率；=(1, 2, ., n)T称为稳定状态概率向量。若转移矩阵P为正规矩阵(即存在正整数k使得Pk0)，则对应的Markov链具有遍历性，且该Markov链的随机变量各状态最终收敛于某个与初始状态完全无关的稳定状态，稳定状态概率向量满足：PT=。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,54/61,

37、序贯决策分析Markov法,例：某厂家生产商品A，为了与同类产品B、C的竞争，厂家可采用下列经营策略： (1)发放有奖债券；(2)投放广告；(3)优质售后服务。统计表明，三种经营策略带来的市场占有率转移矩阵分别为：P1=0.95 0.025 0.025; 0.10 0.80 0.10; 0.10 0.15 0.75P2=0.90 0.05 0.05; 0.15 0.75 0.10; 0.10 0.15 0.75P3=0.90 0.05 0.05; 0.10 0.80 0.10; 0.15 0.15 0.70三种方案实施的成本分别为150万元、40万元、30万元。该类商品的市场总容量为1000万

38、件，每销售1件产品可获利1元。为保证在今后长期经验中获取最大利润，企业该采用什么样的经营策略？,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,55/61,序贯决策分析Markov法,解：这是一个长期经营策略问题，可通过计算市场占有率(Markov过程的随机变量)的稳定状态概率向量来确定企业的经营策略。经计算，采取三种经营策略后A、B、C三种商品的市场占有率分别稳定在如下状态：经营策略1：A=0.667, B=0.190, C=0.143经营策略2：A=0.559, B=0.235, C=0.206经营策略3：A=0.545, B=0.273, C=0.182采取不同经营策

39、略时该厂家的收益如下：经营策略1：0.667*1000-150=517万元经营策略2：0.559*1000-40=519万元经营策略3：0.545*1000-30=515万元。结论：采用经营策略2，即投放广告。,2022年11月8日7时20分,决策理论与方法-随机决策理论与方法,56/61,序贯决策分析Markov法,例：某种商品的销售有畅销和滞销两种状态，畅销时可获年利润100万元，滞销时可获年利润30万元。以一年为一期，设不采取广告策略与采取广告策略的销售状态转移矩阵为P1=0.8 0.2; 0.4 0.6P2=0.9 0.1; 0.7 0.3每年广告费为15万元，假定上一年为畅销。为保证今后3年获得的利润和最大，应该采取什么策略？,2022年11月8日7时20分,决策理论与方法,57/61,序贯决策分析Markov法,解：这是一个短期经营决策问题，可通过计算3年的期望利润总和来确定企业的经营策略。初始状态：u(0)=(1,0)T，收益矩阵F=(100, 30)。不投放广告：F总=F*(P1+P12+P13)T*u(0)=244.56万元投放广告：F总=F*(P2+P22+P23)T*u(0)-3*15=230.92万元结论：不采取广告策略。,

展开阅读全文