第十六章随机决策分析方法人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判定和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个差不多特点:后果的不确定性和后果的效用. 所谓后果的不确定性,要紧是由于问题的随机性,使得问会显现什么状态是不确定的,因此计策人做出的某种决策以后会显现什么后果也是不确定的.而效用是后果价值的量化,由于不确定性,不管决策人采纳什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同.因而,同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情形下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用.只有如此,人们才能比较各种策略的优劣,依照自己的喜好来选择最佳的决策方案. 在决策分析中,后果的不确定性和关于后果给予的效用是两个关键性的问题.为此,关于状态的不确定性要紧用主观概率来表示,而后果的效用则用效用理论来研究.16.1 随机性决策问题的差不多概念16.1.1 主观概率 随机性决策问题的后果的不确定性,要紧是由状态的不确定性所引起的.状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的. 主观概率是决策人进行决策分析的依据,尽管他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率.那个地点仅给出主观概率所服从的差不多假设(或称公理系统):(1)设Ω为一非空集合,其元素能够是某种试验或观看的结果,也能够是自然的状态.将这些元素记作抽象的点ω,因而有{}.ωΩ= (2)设F 是Ω中的一些子集A 所构成的集合,F 满足下列条件: 1)F Ω∈2)假如A F ∈,则\A A F =Ω∈;3)假如可列多个n A F ∈,1,2,,n =则它们的并集1n n A F ∞=∈.(3)设()()P A A F ∈是定义在F 上的实值集函数,假如它满足下列条件,就称为F 上的(主观或客观)概率测度,或简称概率,这些条件是1)关于每个A F ∈,有0()1;P A ≤≤2)()1;P Ω=3)假如可列多个n A F ∈(1,2,)n =,i j A A ⋂=∅()i j ≠,则11()().n n n n P A P A ∞∞===∑那个地点称点ω为差不多事件, F 中的集A 称为事件, F 是全体事件的集合, ()P A 称为事件A 的(主观或客观)概率,三元总体(,,)F P Ω称为(主观或客观)概率空间.设定主观概率的方法要紧有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等[3.4].16.1.2 效用函数在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.因此,在研究后果的效用时要充分考虑后果的不确定性.设决策人在选择某一行动时,决策问题可能的n 个后果为12,,,;n C C C 后果i C 可能发生的概率分别是(1,2,,),i p i n =且11.ni i p ==∑用P 表示所有后果的概率分布,并记1122(,;,;;,)n n P p C p C p C =则称P 为展望.所有展望构成的集合记为P ,能够验证P 关于凸线性组合是封闭的,即假如12,,P P P ∈而且01,λ≤≤则有12(1)P P P λλ+-∈.关于任意两个展望12,P P P ∈,都存在一定的优先关系,即关于决策人能够认为1P 优于2P ,或1P 与2P 无差异,或1P 不优于2P 三种情形,将这三种关系分别记为1212,P P P P 和21.P P .这种优先关系反映了决策人对各种后果的偏好程度.定义16.1 设()u P 是定义在展望P 上的实值函数,且满足 (1)它和在P 上的优先关系一致,即假如关于所有12,P P P ∈,有12,P P 当且仅当12()()u P u P ≥;(2)它在P 上是线性的,即假如12,P P P ∈,而且01,λ≤≤则1212((1))()(1)(),u P P u P u P λλλλ+-=+-那么称()u P 是定义在展望P 上的效用函数.假如1122(,;,;;,)n n P p C p C p C P =∈,则()u P 确实是表示以概率i p 选择(1,2,,)i C i n =的期望效用.效用是决策人在有风险的情形下对后果的偏好的量化,因此,其中包含有决策人关于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.假如所研究的事件是确定的事件,并不受自然状态的阻碍,类似地能够定义一个效用来表示决策人对确定事件的各种后果的偏好程度.关于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.定义16.2 设X 为所有确定事件的后果x 的集合, ()u x 是定义在X 上的实值函数,假如关于任意的12,x x X ∈有12()()u x u x ≥,当且仅当12.x x ,则称()u x 是定义在X 上的序数效用函数. 基数效用和序数效用的要紧区别是:基数效用在正线性变换下是唯独的,而序数效用在保序变换下是唯独的. 正线性变换: ()()(0)u P u P αβα=+>.保序变换:()(())u x f u x =,对任意,x X f ∈为严格的单调增加函数.16.2 效用函数理论16.2.1 效用与风险的关系实际中专门多的决策问题都涉及经济效益,关于这类问题,在后果不确定的情形下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一样是不同的,通常可分为三种态度,即厌恶型、中立型和喜好型.假设决策人面对一种风险的情形有1/2的机会得不到任何盈利,也有1/2的机会盈利2a 元,即他的期望盈利为a 元.假如决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.假如决策人认为这和不冒任何风险的另一行为盈利a 元等价,则对待风险的态度是中立型的.这三种不同的态度能够反映在效用函数上确实是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.图16-1 三种不同的效用函数曲线由图16-1(a)是风险厌恶型的效用函数,即有[]123121()()()()22x x u x u x ux u +=+<;由图16-1(b )是风险中立型的效用函数,即有[]123121()()()()22x x u x u x u x u +=+=;由图16-1(c )是风险喜好型的效用函数,即有[]123121()()()()22x x u x u x u x u +=+>;实际中,专门多的情形效用函数的曲线呈S 型,即在后果的范畴内,决策人对待风险的态度往往会从厌恶风险改变为喜好风险.如图16-2.图16-2(a )反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变.图16-2(b )反映了决策人的财产随着从缺失到盈利的增加,对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.16.2.2 缺失函数与风险函数有的时候不要效用函数,而是用缺失函数来做决策分析.记缺失函数为(,)l x a ,它表时示一个决策问题当状态为x ,决策人的行动为a 时所产生的后果使决策人所受的缺失.缺失函数能够为正,也能够为负,它反映决策人获得的利益,后果效用越大,则缺失越小.由此能够用效用函数来定义缺失函数,即令(,)(,)l x a u x a =-实际中,在有些问题上为了使缺失函数总是为非负的,也能够定义缺失函数为(,)supsup (,)(,).x X a Al x a u x a u x a ∈∈=-在效用理论中,我们说明了期望效用能够合理的表示在风险情形下决策人的偏好,因此,期望缺失也必定是决策人在风险情形下遭受缺失的一个正确测度.16.2.3 随机函数与效用函数随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情形下制定决策的方法,称为随机优势法.假设问题的效用函数为()u x ,其自变量x 表示财宝(为一随机变量)。
实际中的问题总是有[],x a b ∈,且()u x 在[],a b 上有界,关于这种效用函数能够分为以下几类:1. 递增效用函数实际中,一样要求财宝的效用函数()u x 是[],x a b ∈的非递减函数,即意味着当财宝增 加时,它的效用总可不能减少.通常是随着x 的增加()u x 是严格递增的,而且是有界的.为此,我们假设:(1) 关于任意[]12,,x x a b ∈,当12x x <时有12()()u x u x <; (2) ()u x 在[],a b 上连续,且有界,即存在0M >使()u x M ≤; (3) ()u x 在[],a b 上一次可微,且在(,)a b 内有'0()u x M <≤.记此类效用函数为1U ,即{}1''0U u u u u =>和在[a,b]上连续有界,且在(a,b)内这中类型的效用函数仅能反映出财宝与风险的关系,但不能反映出决策人对待风险的态度.因此1U 中既可包含厌恶的效用函数,也可包含喜好风险和风险中立的效用函数.为此,还能够进一步分类.2. 递增的凹效用函数这种效用函数是递增的,故设1()u x U ∈,而且是严格凹的,即()u x 在[],a b 上具有二 阶连续有界的导数.记为[]{}''''21|,,,0.U u u U u C a b u =∈∈<且在(a,b)内实际中常用的2U 类函数有幂函数:[](),,(0,0);cu x x x a b c a -=-∈>>对数函数:[]()ln ,,(0,);u x x x a b =∈⊂+∞ 指数函数:(),[,)(0).cxu x ex a c -=-∈+∞>依照风险和效用函数的关系,当',''u u 存在,且'0u ≠时,定义对待风险态度的局部测度为'''()(),()u x r x u x =-即()r x 是效用函数()u x 的曲率测度,能够证明:假如()0r x >,则决策人的财产为x 时,他是厌恶风险的.假如()0r x =,则决策人的财产x 时,他是风险中立的.假如()0r x <,则决策人财产为x 时,他是追求风险的,而且()r x 愈大,他愈厌恶(或追求)风险.3. 递增的厌恶风险的效用函数实际中,多数决策人对小额盈亏的态度是随着财宝的积存而变化的,他们的财宝积存 愈多,对小额盈亏所冒风险的厌恶程度愈小.因此,我们假设()r x 是x 的非递增的函数,则能够得到一类效用函数,记为[]{}'32|,(),,()0,U u u U r x a b x =∈≤在上连续可微有界,且r即3U 是2U 的一个子类.由于当'()0r x ≤时,()r x 是非递增的。