01第一章导论习题讲解
一个工人给一个老板干活,工资标准是100元.工人可以选 择是否偷懒,老板则选择是否克扣工资.假设工人不偷懒 有相当于50元的负效用,老板想克扣工资则总有借口扣掉 60元工资,工人不偷懒老板有150元产出,而工人偷懒时老 板只有80元产出,但老板在支付工资之前无法知道实际产 出,这些情况是双方都知道的.请问 (1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类 型?用得益矩阵或扩展形表示该博弈并作简单分析. (2)如果老板无法看出工人是否偷懒,博弈属于哪种类型? 用得益矩阵或扩展形表示并简单分析.
(1)正确.因为单人博弈只有一个博弈方,因此不可能存在 博弈方之间行为和利益的交互作用和制约,因此实际上就是个人 最优化决策,与存在博弈方之间行为和利益交互作用和制约的典 型博弈问题有本质的区别. (2)前半句错误,后半句正确.博弈方的策略空间不一定是 数量空间,因为博弈方的策略除了可以是数量水平(如产量,价格 等)以外,也可以是各种定性的行为取舎和方向选择,甚至也可能 是各种函数或者其他更复杂的内容.但 一 个博弈的结果必须是 数量或者可以数量化,因为博弈分析只能以数量关系的比较为基 础. (3)错误.结论恰恰相反,也就是囚徒的困境博弈中两囚徒 之所以处于困境,根源正是因为两囚徒很在乎坐牢的绝对时间 长短.此外,我们一开始就假设两囚徒都是理性经济人,而理 性经济人都是以自身的(绝对)利益,而不是相对利益为决策目 标的.
你正在考虑是否投资100万元开设一家饭店.假设惰况是这 样的:你决定开,则o.35的概率你将收益300万元(包括 投资),而o.65的概率你将全部亏损掉;如果你不开,则 你能保住本钱但也不会有利润.请你(a)用得益矩阵和扩 展形表示该博弈.(b)如果你是风险中性的,你会怎祥选 择?(c)如果成功概率降到o.3,你怎样选择?(d)如果你是 风险规避的,且期望得益的折扣系数为o.9,你的策略选 择是什么?(e)如果你是风险偏好的,期望得益折算系数 为1.2,你的选择又是什么? (a)根据问题的假设,该博弈的 得益矩阵和扩展形表示分别 如下:
2.博弈有哪些分类方法,有哪些主要的类型 首先可根据博弈方的行为逻辑,是否允许存在有约束力协议分为 非合作博弈和合作博弈两大类. 其次可以根据博弈方的理性层次,分为完全理性博弈和有限 理性博弈两大类,有限理性博弈就是进化博弈. 第三是可以根据博弈过程分为静态博弈,动态博弈和重复博 弈二大类. 第四是根据博弈问题的信息结构,根据博弈方是否都有关于 得益和博弈过程的充分信息,分为完全信息静态博弈,不完全信 息静态博弈,完全旦完美信息动态博弈,完全但不完美信息动态 博弈和不完全信息动态博弈几类. 第五是根据得益的特征分为零和博弈,常和博弈和变和博弈. 第六是根据博弈中博弈方的数量,可将博弈分为单人博弈, 两人博弈和多入博弈. 第七是根据博弈方策略的数量,分为有限博弈和无限博弈 两类.
其实,根据该得益矩阵不难得到与上 述动态博弈同样的结论, 仍然是工人会选择偷懒和老板会选择 克扣.这个博弈实际上与囚 徒的困境是相似的.
(1)由于老板在决定是否克扣工资前可以完全清楚工人是 否偷懒,因此这是一个动态博弈,而且是一个完全信息 的动态博弈.此外,出于双方都有关于得益的充分信息, 因此这是一个完全且完美信息的动态博弈,该博弈用扩 展形表示如下:
1.判断下列论述是否正确,并作简单分桥. (1)单人博弈就是个人最优化决策,与典型的博弈问题有本质 区别. (2)博弈方的策略空间必须是数量空间,博弈的结果必须是数 量或者能够数量化. (3)囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到 较理想的结果,是因为两囚徒都不在乎坐牢时间长短本 身,只在乎不能比对方坐牢的时间更长. (4)因为零和博弈中博弈方之间的关系都是竞争性的,对立 的,因此零和博弈就是非合作博弃. (5)凡是博弈方的选择,行为有先后次序的一定是动态博弃. (6)多人博弈中的"破坏者"会对所有博弈方的利益产生不利 影响. (7)合作博弈就是博弈方采取相互合作态度的博弈.
根据上述得益情况可以看出,在该博弈中 偷懒对工人总是有利的,克扣对老板也总 是有利的,因此在双方都只考虑自己的利 益最大化的情况下,该博弈的通常结果应 该是工人偷懒和老板克扣. (2)由于老板在决定是否克扣工资之前 无法清楚工人是否偷懒,因此该博弈可以 看作静态博弃.由于双方仍然都有关于得 益的充分信息,因此是一个完全信息的静 态博弈.该博弈用得益矩阵34;的内在根源是什么?举出现实中囚徒的 困境的 具体例子. "囚徒的困境"的内在根源是在个体之间存在行为和利益相互 制约的博弈结构中,以个体理性和个体选择为基础的分散决 策方式,无法有效地协调各方面的利益,并实现整体,个体 利益共同的最优.简单地说,"囚徒的困境"问题都是个体 理性与集体理性的矛盾引起的. 现实中"囚徒的困境"类型的问题是很多的.例如厂商 之间的 价格战,恶性的广告竞争,初等,中等教育中的应试教育等, 其实都 是"囚徒的困境"博奔的表现形式.
(4)错误.虽然零和博弈中博弈方的利益确实是对立的,但 非合作博弃的含义并不是博弈方之间的关系是竞争性的,对立 的,而是指博弈方是以个体理性,个体利益最大化为行为的逻 辑和依据,是指博弈中不能包含有约束力的协议o (5)错误.其实并不是所有选择,行为有先后次序的博弈 问题都是动态博奔.例如两个厂商先后确定自己的产量,但只 要后确定产量的厂商在定产之前不知道另一厂商定的产量是多 少,就是静态博弈问题而非动态博弈问题o (6)错误.多人博弈中的.破坏者"对博弈方的利益是否 有影响和影响方向是不确定的.事实上,正是团为这种不确定 性才被视为"破坏者".这种"破坏者"实质上是指对博弈分 析造成破坏,而不是对博弈方的利益造成破坏,因此肯定会受 到不利影响的是博弈分析者而不是博弈方; (7)不正确.合作博弈在博弈论中专门指博弈方之间可以 达成和运用有约束力协议限制行为选择的博弈问题,与博弈方 的态度是否合作无关.
4.对于教材中三个厂商离散产量的古诺模型,你认为三个 厂商或其中部分厂商可以采取哪些措施方法争取实现更大的 利益. 第一种有用的措施是改变三个厂商分散决策的局面,通过订 立有强制性,约束力的协议,限制各自的产量,把总产量控 制在垄断产量10单位的水平,以维持较高的价格11和实现最 大利润的目的.这时候实际上是把非合作博弈问题转化成了 合作博弈问题.这种措施需要三个厂商之间能够协调立场, 达成可靠的协议,事实上就是建立一种紧密的联盟关系.这 种措施的奏效当然是有条件的,包括国家法律政策的许可和 厂商的协调能力等. 第二种措施或办法是其中的一个或两个厂商吞并,收购 其他厂商,从而减少厂商的数量,降低决策的分散程度.这 种方法同样能够有效控制总产量和实现最大利润:当然,这 种措施是否能够成功也取决于政策,市场等多方面的因素和 环境条件,如果缺乏条件或成本太高就不一定可行.
�