第十一章 决策论 1.决策过程:1)确定目标;2)建立可行方案;3)方案的评价和选择;4)方案实施 由于决策信息不足,决策者无法知道各自然状态发生的任何信息,因此决策的结果往往取决于决策者的主观态度。
不同的心理、不同的冒险精神的人可以选用不同的方法。
1)乐观法决策(最大最大准则):从每个策略行取最大值,再从列中再取最大。
Max---max策略。
2)悲观法决策(华尔德准则,最大最小准则):从每个策略行取最小值,再从列中再取最大。
Min---max策略。
3)折中法决策(郝威茨准则,乐观系数法):用折中系数α算出每个策略的折中值,再选最大的。
max策略 max min max{|(1)}i i ij ij h h a a αα=+− 4)等可能性决策(拉普拉斯准则):以全部状态的期望损益值作为决策依据,比折中法更好。
缺点是认为各种状态的概率相等,不大现实。
12111max{...}j j mj j j ja a a n n n +++∑∑∑ 5)最小后悔值法:后悔值矩阵中采用Max---min策略 从每个状态(列)找出最大值;用这个最大值减去该列每个策略的效益值,得到后悔值表;在后悔值表中选择每一行中的最大值加入右列;从所有最大后悔值中选择最小的。
3.风险型决策 1)最大期望收益准则:根据各事件发生的概率,计算每一个策略的期望收益值,并从中选择最大的期望收益值。
2)最小期望损失准则(后悔值):首先构造后悔值矩阵,然后分别计算不同策略的期望机会损失,从中选择最小的一个。
3)全情报价值EVPI(Expected value of perfect information):计算出如果获得这项情报而使决策者的期望收益提高的数额,这个数额称为完全情报的期望值,如果它大于采集情报所花的费用,则采集这一情报是有价值的,否则就得不偿失,因此把EVPI作为采集情报费用的上限。
2)按最大期望收益准则公司应该选择方案1a ,期望收益为32万元。
3)假定情报指出销路好,公司就选取2a 策略,可获利75万,假定情况指出销路一般,公司就选取1a 策略,可获利40万,假定情报是销路差,公司选择3a 策略,获利0万。
由于在获取全情报之前无法确切知道情报内容,故只能算出期望收益0.3*75+0.5*40+0.2*0=42.5万。
4)可知全情报会使期望收益增加,即EVPI=42.5-32=10.5万。
5)只要获得全情报的花费不超过10.5万,就值得去获取全情报。
4)贝叶斯决策 全概率公式:1()()(|)ni i i P B P A P B A ==∑ 贝叶斯公式:1()()(|)(|)()()(|)k k k k n i i i P A B P A P B A P A B P B P A P B A ===∑ 1、已知类条件概率密度参数表达式和先验概率。
2、利用贝叶斯公式转换成后验概率。
3、根据后验概率大小进行决策分类。
例:公司委托某市场机构进行相关市场调查。
为了了解该机构的可靠性,对其以往的调查记录进行分析,得到有关数据表如下,表中数据的意义是:当实际结果为销路好时,调查结果也是销路好的条件概率为'11(|)0.7P s s =,调查结果是销路一般的条件概率为'21(|)0.2P s s =,调查结果为销路差的条件概率为'31(|)0.1P s s =。
其余类推。
进行市场首先计算出各种调查结果出现的概率 ''''1111212313()()(|)()(|)()(|)0.3*0.70.5*0.150.2*0.10.305P s P s P s s P s P s s P s P s s =++=++= ''''2121222323()()(|)()(|)()(|)0.3*0.20.5*0.700.2*0.20.45P s P s P s s P s P s s P s P s s =++=++= ''''2131232333()()(|)()(|)()(|)0.3*0.10.5*0.150.2*0.70.245P s P s P s s P s P s s P s P s s =++=++= 由贝叶斯公式1()()(|)(|)()()(|)k k k k n i i i P A B P A P B A P A B P B P A P B A ===∑计算出后验概率'(|)j i P s s '(|)j iP s s 销路好'1s (0.3) 销路一般'2s (0.5) 销路差'3s (0.2) 销路好1s 0.689 0.133 0.122 销路一般2s 0.246 0.778 0.306 销路差3s 0.065 0.089 0.572 表:市场调查后的后验概率表 123()0.689*600.246*400.065*(30)49.23()0.689*750.246*350.065*(50)57.035()0.689*500.246*200.065*039.37E a E a E a =++−==++−==++= 应选择2a 如果市场调查的结果是销路一般,各方案的期望值为: 123()0.133*600.778*400.089*(30)36.43()0.133*750.778*350.089*(50)32.755()0.133*500.778*200.089*022.21E a E a E a =++−==++−==++= 应选择1a 如果市场调查的结果是销路差,各方案的期望值为: 123()0.122*600.306*400.572*(30) 2.40()0.122*750.306*350.572*(50)8.74()0.122*500.306*200.572*012.22E a E a E a =++−==++−=−=++= 应选择3a 根据后验概率进行决策的期望利润为: 0.305*57.035+0.45*36.43+0.345*12.22=36.783万元 仅根据先验信息进行决策时的期望利润为32万,进行市场调查科增加期望利润,也就是市场调查所获得的补充信息的价值为36.783-32=4.783万元,大于进行市场调查的费用,因而委托调查机构进行市场调查是合算的. 1211122122*122221121122(1)(1)()()a p a p a p a p a a p a a a a +−=+−−=+−+当*p p =两方案无差异,*p p >方案1s 优于2s 即12s s >,当*p p <,方案2s 优于1s ,即21s s <(灵敏度分析) 5.马尔科夫决策 例3 某地区有甲、乙、丙三家公司,过去的历史资料表明,这三家公司某产品的市场占有率分别为50%,30%和20% 。
不久前,丙公司制定了一项把甲、乙两公司的顾客吸引到本公司来的销售和服务措施。
设三家公司的销售和服务是以季度为单位考虑的。
市场调查表明,在丙公司新的经营方针的影响下,顾客的转移概率矩阵为: 使用马尔科夫分析方法研究此销售问题,并分别求出三家公司在第一、二季度各拥有的市场占有率和最终的市场占有率。
解:设随机变量Xt=1,2,3(t =1,2,3)分别表示顾客在t季度购买甲、乙和丙公司的产品,显然{Xt}是一个有限状态的马尔科夫链。
已知P(X0=1)=0.5, P(X0=2)=0.3, P(X0=3)=0.2,又已知马尔科夫链的一步转移概率矩阵,于是第一季度的销售份额为 即第一季度甲、乙、丙三公司占有市场的销售份额分别为39%,30%和31%。
再求第二季度的销售份额,有 即第二季度三家公司占有市场的销售份额分别为31.9%,29.4%和38.7%。
设π1 ,π2 ,π3为马尔科夫链处于状态1,2,3的稳态概率,由于P是一个标准概率矩阵,因此有 解得π =( π1 ,π2 ,π3 )=(0.1765,0.2353,0.5882)故甲、乙、丙三家公司最终将分别占有18%,23%和59%的市场销售份额。
定理:设P是标准概率矩阵,则必存在非零向量π = (π1 ,π2 , ・・・, πn)使得π P= π,称π为P的平衡向量。
如果进一步满足:π1+ π2+ ・・・+ πn=1 称此πj为状态sj 的稳态(平衡)概率。
P的这一特性在实用中有重要的价值。
通常在市场预测中,所讨论的用户转移概率矩阵就属于标准概率矩阵,它可以通过几步转移达到稳定(平衡)状态。
在这种情况下,各厂家的用户占有率不再发生变化,此时的π称为最终用户的占有率P向量。
例4 考虑例3的销售问题。
为了对付下降的销售趋势,甲公司考虑两种对付的策略: 第一种策略是保留策略,即力图保留原有顾客的较大百分比,并对连续两期购货的顾客给予优惠价格,可使其保留率提高到85%,新的转移概率矩阵为 第二种策略是争取策略,即甲公司通过广告宣传或跟踪服务来争取另外两家公司的顾客,新的转移概率矩阵为 试问: (1)分别求出在甲公司的保留策略和争取策略下,三家公司最终分别占有市场的份额;(2)若实际这两种策略的代价相当,甲公司应采取哪一种策略? 解: (1)在保留策略下,有 解得π = (π1 ,π2 ,π3 ) = (0.316, 0.263, 0.421),即在保留策略下,三家公司最终将各占31.6%, 26.3%和42.1%的市场份额。
同理可以求得在争取策略下的市场占有份额,三家公司最终将各占33.3%, 22.2%和44.5%的市场份额。
(2)在保留策略下甲公司将占31.6%的市场份额,而在争取策略下将占33.3%的市场份额,故甲公司应采取争取策略。
。