当前位置:文档之家› 决策理论与方法第三章效用函数.pptx

决策理论与方法第三章效用函数.pptx

第三章 效用函数
第一节 效用的定义和公理系统
一、引言
·为什么要引入效用
决策问题的特点:自然状态不确定——以概率表示;
后果价值待定:以效用度量。
1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数 值度量;
2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的 价值因人而异。
且复合不会破坏原有的优劣关系 ◦ 偏好的有界性:展望的优劣是相对的,没有无
限优的展望,也不存在无限劣的展望。
理性行为公理认为合乎理性的决策人在进 行价值判断时一定能满足这些公理。(实 际决策中是否存在某种悖论呢?)
2021年1月9日10时55分
Allais悖论
抽奖a1
1.0
50万元
抽奖a2
0.89 0.10 0.01 决策A
Hicks对效用函数的基数性和序数性的比喻:如果知 道两个人的身高,那么我们可以把高个儿排在第一 位;如果不知道他俩的身高也没关系,让他们比一 下就可以了。
2021年1月9日10时55分
第二节 效用函数的构造
一、估计效用函数值的方法 概率当量法(Von Neumann, Morgenstern,N-M法):设决
例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个 人,身无分文时的100元,与已有10000元再增加100元的作用不同, 这是钱的边际价值问题。
例2:
礼品a1
1.0
10万元
抽奖a2
0.5
25万元
0.5
0元
在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望 收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不 同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人 的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?
决策的目标就是使期望效用极大化。
二、效用基本概念及符号 ◦ 严格序>:a>b表示a优于b。满足传递性和非对称性。 ◦ 无差异~:a~b表示a与b无差异。满足自反性、对称性和 传递性。 ◦ 弱序≥:a≥b表示a不劣于b。满足可比性、传递性、与无 差异~的一致性和严格优于的一致性。 ◦ 展望(prospect)(可能的前景):各种后果(r种)及后果出 现的概率的组合,记为:Pj=<p1(j),c1;p2(j),c2;…;pr(j),cr>, (j=1,2,…,m; m为行动的可能种数)
2021年1月9日10时55分
*偏好次序是决策人的个性与价值观的反映,与决策人所 处的社会、经济地位,文化素养,心理和生理(身体)状态 有关。
* 除风险偏好之外,还有时间偏好。
而效用(Utility)就是偏好的量化,是数(实值函数).
Daniel Bernoulli 在1738年指出:
若一个人面临从给定行动集(风险性展望集)中作选择的 决策问题,如果他知道与给定行动有关的将来的自然状态, 且这些状态出现的概率已知或可以估计,则他应选择对各 种可能后果的偏好的期望值最高的行动。
1.0
C1
p
C2
若 C1 ( p, C2 ; (1 p), C)3
1-p
C3
则称 确定性后果 为抽奖的确定当量
效用的定义
◦ 若展望空间上的实值函数u对于展望空间P
的任意两个展望P1、P2,有P1≥P2 当且仅当
u(P1)≥u(P2),则称u为效用函数
三、效用存在性公理(理性行为公理)
◦ 连通性:任意两个展望的优劣都是可比的 ◦ 传递性:展望的优劣满足传递性 ◦ 复合保序性:展望的优劣关系是可以复合的,
◦ 对展望空间中的任意展望P1、P2,P1>P2 当且仅 当 u(P1)>u(P2)
◦ u(P1+(1-)P2)= u(P1)+(1-)u(P2) (复合展望的 效用等于展望效用的复合)
◦ 对满足上述条件的实值函数u1, u2, 必有 u1(Pi)=bu2(Pi)+c, 其中b, c∈R1,b>0。(任意两 个决策人的效用是线性相关的)
2021年1月9日10时55分
◦ 复合展望:当无法确定采取某个行动时, 可随机选择一种行动,设选择行动aj的概率 为qj。则决策的展望就是一种复合展望,记 为P=<q1, P1; q2, P2;…;qm,Pm>。所有展望 (包括简单展望和复合展望)构成展望空 间。
2021年1月9日10时55分
抽奖(lottery)与确定当量
◦ 则效用函数u(P)为(基数)效用函数
2021年1月9日10时55分
四、效用函数—基数性和序数性
前述定义的效用是一种基数效用,不仅能够反映决 策者的偏好次序,还能够反映决策者的偏好强度。
但在实际决策中,有时只需要偏好次序而不一定需 要知道偏好强度就可以决策。此时只需要序数效用 就可以了。有关序数效用的应用在多属性决策中介 绍。
50万元 250万元 0元
抽奖b1 抽奖b2
0.11 0.89
50万元 0万元
0.10 0.90
决策B
250万元 0元
实际上决策B是在决策A的基础上同时减去了89% 的机会获得分
效用的公理化定义:在上述公理系统中, 若展望空间上存在实值函数u,有:
到如下的无差异关系:cij~<pij,c*;1-pij,c0> ◦ 测得后果cij的效用值为:
u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij
2021年1月9日10时55分
确定当量法(修正N-M法): ◦ 设u(c*)=1, u(c0)=0; ◦ 建立简单展望<p,c*;1-p,c0>,p为0-1间的给定值,如 p=0.5 ◦ 反复向决策人提问,改变cij得到如下的无差异关系: cij~<p,c*;1-p,c0> ◦ 测得后果cij的效用值为: u(cij)=p*u(c*)+(1-p)*u(c0)=pij
策系统的自然状态集Θ={1,…, n}、行动集A={a1, …,am}、 后果集C={cij=c(ai,j)},最优后果为c*=max {cij},最劣后
果为c0=min {cij}。则对于任意后果cij的效用值u(cij),可按 以下步骤获得: ◦ 设u(c*)=1, u(c0)=0; ◦ 建立简单展望<p,c*;1-p,c0>,p可调 ◦ 反复向决策人提问,改变可调概率p,使得当p=pij时得
相关主题