当前位置:文档之家› 不确定型决策问题与风险型决策问题

不确定型决策问题与风险型决策问题

第四章贝叶斯分析Bayesean Analysis§4.0引言一、决策问题的表格表示——损失矩阵对无观察(No-data)问题 a=δ(损失):a1…a j…a mπ(θ1)l11lj1lm1…π(θi )li1lij…π(θn )lm1lnm或π(θ1)…π(θi)…π(θn)a 1l11li1ln1…aj l ij…a m lm1lmn损失矩阵直观、运算方便二、决策原则通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。

本章在介绍贝叶斯分析以前先介绍芙他决策原则。

三、决策问题的分类:1.不确定型(非确定型)自然状态不确定,且各种状态的概率无法估计.2.风险型自然状态不确定,但各种状态的概率可以估计.四、按状态优于:l ij ≤likI, 且至少对某个i严格不等式成立, 则称行动aj按状态优于ak§4.1 不确定型决策问题一、极小化极大(wald)原则(法则、准则) a1a2a4minj maxil (θi, aj) 或maxjminiuij例:各行动最大损失: 13 16 12 14其中损失最小的损失对应于行动a3.采用该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对.二、极小化极小minj minil (θi, aj) 或maxjmaxiuij例:各行动最小损失: 4 1 7 2其中损失最小的是行动a2.采用该原则者极端冒险,是乐观主义者,认为总能撞大运。

三、Hurwitz准则上两法的折衷,取乐观系数入minj [λminil (θi, aj)+(1-λ〕maxil (θi, aj)]例如λ=0.5时λmini lij: 2 0.5 3.5 1(1-λ〕maxi lij: 6.5 8 6 7两者之和: 8.5 8.5 9.5 8其中损失最小的是:行动a4四、等概率准则(Laplace)用i∑l ij来评价行动a j的优劣选minji∑l ij上例:i∑l ij : 33 34 36 35 其中行动a1的损失最小五、后梅值极小化极大准则(svage-Niehans)定义后梅值sij =lij-minklik其中mink lik为自然状态为θi时采取不同行动时的最小损失.构成后梅值(机会成本)矩阵 S={sij }m n⨯,使后梅值极小化极大,即:min max j i s ij例:损失矩阵同上, 后梅值矩阵为:3 1 0 23 0 8 11 4 0 20 3 2 4各种行动的最大后梅值为: 3 4 8 4其中行动a1 的最大后梅值最小,所以按后梅值极小化极大准则应采取行动1.六、Krelle准则:使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则.七、莫尔诺(Molnor)对理想决策准则的要求(1954)1.能把方案或行动排居完全序;2.优劣次序与行动及状态的编号无关;3.若行动ak 按状态优于aj,则应有ak优于aj;4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。

§4.2 风险型决策问题的决策原则一、最大可能值准则令π(θk )=maxπ(θi)选ar 使 l(θk,ar)=minjl(θk,aj)例:π(θi )a1a2a3θ10.27 6.56θ20.5345θ30.3410π(θ2) 概率最大, 各行动损失为 3 4 5∴应选行动a1二、贝叶斯原则使期望损失极小:minj {i∑l(θi , a j) π(θi) }上例中,各行动的期望损失分别为 4.1 3.6 3.7, 对应于a2的期望损失3.6最小∴应选a2.三、贝努利原则损失函数取后果效用的负值,再用Bayes原则求最优行动.四、E—V(均值—方差)准则若Eπlij ≤Eπlik且σσj k≤则aj优于ak通常不存在这样的aj上例中:a 1a2a3E 4.1 3.6 3.7V(σ2) 2.29 3.79 5.967不存在符合E—V准则的行动, 这时可采用f(μ,σ)的值来判断(μ为效益型后果的期望)μ-ασf( μ,σ)=μ-ασ2μ-α(μ2+σ2)f越大越优.五、不完全信息情况下的决策原则(Hodges-Lehmann原则)状态概率分布不可靠时, 可采用:φ(aj )=λuijii∑⋅π + miniuiji=1,2,… ,m j=1,2,…,nφ越大越优.§4.3贝叶斯定理一、条件概率1.A、B为随机试验E中的两个事件 P(A|B)=P(AB)/P(B)由全概率公式: A j j=1,2,…,n 是样本空间的一个划分, P(B)=j∑P(B|A j )P(A j )得Bayes 公式P(A i |B)=P(B|A i )·P(A i )/P(B) = P(B|A i )·P(A i )/j∑P(B|A j )P(A j )2. 对Θ,Χ两个随机变量 ·条件概率密度f(θ| x)=f(x |θ)f(θ)/f(x) ·在主观概率论中π(θ| x)=f(x |θ)π(θ)/m(x) 其中:π(θ)是θ的先验概率密度函数f(x |θ)是θ出现时,x 的条件概率密度,又称似然函数. m(x)是x 的边缘密度, 或称预测密度. m(x)=Θ⎰f(x |θ)π(θ) d θ或i∑p(x|θi )π(θi )π(θ|x)是观察值为x 的后验概率密度。

例:A 坛中白球30%黑球70% B 坛中白球70%黑球30%两坛外形相同,从中任取一坛,作放回摸球12次,其中白球4次,黑球8次,求所取为A 坛的概率.解:设观察值4白8黑事件为x ,记取A 坛为 θ1, 取B 坛为θ2 在未作观察时,先验概率p(θ1)=p(θ2)=0.5 则在作观察后,后验概率 P(θ1|x)=p(x|θ1)p(θ1)p(x|θ1)p(θ1)+p(x|θ2)p(θ2) =034.×078.×0.5(034.×078.×0.5+074.×038.×0.5)=074.(074.×034.)=0.24010.2482=0.967显然, 通过试验、观察、可修正先验分布.§4.4 贝叶斯分析的正规型与扩展型一、正规型分析由Baysean 原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则δπ,使贝叶斯风险r(π, δπ)=inf δ∈∆r(π,δ(x))其中:r(π,δ(x))= E πR(θ,δ(x)) =E π[E x θ l(θ,δ(x)) =θ⎰x⎰l(θ,δ(x)) f(x |θ)dx π(θ) d θ (1)据(1)式,选δπ使r(π,δ)达到极小,这就是正规型的贝叶斯分析。

在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。

实际上可用下法:二、扩展型贝叶斯分析(Extensive Form Analysis)在(1)式中因l(θ,δ)>-∞,f(x |θ),π(θ)均为有限值。

∴由Fubini 定理,积分次序可换 即r(π,δ(x))= θ⎰x⎰l(θ,δ(x)) f(x |θ)dx π(θ) d θ=x⎰θ⎰l(θ,δ(x)) f(x |θ)π(θ) d θdx (2)显然,要使(2)式达到极小,应当对每个x ∈X ,选择δ, 使 θ⎰l(θ,δ(x)) f(x |θ)π(θ) d θ (2’)为极小∵δ(x)=a ∴若对给定的x,选a ,使 θ⎰l(θ,δ(x)) f(x |θ)π(θ) d θ 为极小亦即,使1m x ()θ⎰l(θ,a) f(x |θ)π(θ) d θ=θ⎰l(θi ,a) π(θi |x) d θ 或θi ∈∑Θl(θi ,a)p(θi |x) (3) 达极小,即可使(1)式为极小. ·结论:对每个x ,选择行动a ,使之对给定x 时θ的后验分布π(θ|x)的期望损失为极小,即可求得贝叶斯规则。

这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫formal Bayesean Rule ——Raiffa Sehlaifer,1961年提出。

·Note·使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则; ·扩展型比正规型更直观,也容易计算,故更常用; ·许多分析人员只承认扩型,理由是:i ,π(θ|x)描述了试验后的θ的分布,比π(θ)更客观,因此,只要损失函数是由效用理论导出的(即考虑了DMer 的价值判断、风险偏好),在评价行动a 的优劣时就应当用后验期望损失。

ii, r(π,δ)是根据π(θ)求出的,而用先验分布π(θ)来确定行动a 并不一定适当。

从根本上讲,这种观点是正确的。

·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视具体问题,据计算方便而定。

·已经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决策规则同样成立。

使所有x上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。

三、例(先看无观察问题)农民选择作物问题,设某地旱年θ1占60%,正常年景θ2占40%; a1种植耐旱作物a2种不耐旱作物,后果矩阵为:a 1a 2θ120 0θ260 100决策人的效用函数 u(y)=10865.(1-e y-002.)解:i令:l(y)=1-u(y)ii,作决策树:a 1a 2πθ()1πθ()1πθ()260 .81 .19y u l20 .38 .620 0 1100 1 0iii, 在无观察时, R=l, r=11=∑nl(θi ,a)π(θi )r(π, a 1)=l(θ1,a 1)π(θ1)+l(θ2,a 1)π(θ2) =0.62 ×0.6+0.19 ×0.4 =0.448r(π, a 2)= l(θ1,a 2)π(θ1)+l(θ2,a 2)π(θ2) =1.0 ×0.6+0 ×0.4 =0.6风险r 小者优, ∴δ=a 1,是贝叶斯规则, 即贝叶斯行动.即应选择耐旱作物。

四、例(续上)设气象预报的准确性是0.8,即p(x 1|θ1)=0.8 p(x 2|θ2)=0.8 其中,x 1预报干旱 x 2预报正常年景则 m(x 1)=p(x 1|θ1)π(θ1)+p(x 1|θ2)π(θ2) =0.8 ×0.6+0.2 ×0.4=0.56 m(x 2)=0.44π(θ1|x 1)=p(x 1|θ1)π(θ1)m(x 1) =0.8 ×0.6/0.56=0.86 π(θ1|x 2)=p(x 2|θ1)π(θ1)m(x 2) =0.2 ×0.6/0.44=0.27 π(θ2|x 1)=0.14 π(θ2|x 2)=0.73 1. 正规型分析①策略δ1: a 1= δ1(x 1) a 2=δ1(x 2)r(π, δ1)=i∑j∑l (θi ,δ1(x j ))p(x j |θi )π(θi )4-7= l (θ1,a 1)p(x 1|θ1)π(θ1)+l (θ1,a 2)p(x 2|θ1)π(θ1) + l (θ2,a 1)p(x 1|θ2)π(θ2)+l (θ2,a 2)p(x 2|θ2)π(θ2)=0.62×0.8×0.6+1.0 ×0.2×0.6+0.19 ×0.2×0.4+0.0× 0.8×0.4 =0.4328②策略δ2: a 1=δ2(x 2) a 2=δ2(x 1) r(π, δ2)=i∑j∑l (θi ,δ2 (x j ))p(x j |θi )π(θi )= l (θ1,a 1)p(x 2|θ1)π(θ1)+l (θ1,a 2)p(x 1|θ1)π(θ1) + l (θ2,a 1)p(x 2|θ2)π(θ2)+l (θ2,a 2)p(x 1|θ2)π(θ2) = 0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8× 0.4+0.0×0.8× 0.4 =0.6152③策略δ3: a 1= δ3(x 1) a 1=δ3(x 2) r(π, δ3)=0.45④策略δ4: a 2=δ4(x 1) a 2=δ4(x 2) r(π, δ4)=0.6∵r(π, δ1) <r(π, δ3) <r(π, δ4) <r(π, δ2) ∴ δ1δ3δ4δ2 δ1是贝叶斯行动。

相关主题