当前位置:文档之家› 《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。

前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。

但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。

本章将介绍一种新的博弈问题描述方式—扩展式博弈。

从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。

在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。

6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。

一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。

[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。

其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。

]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。

对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。

从上述定义可以看到:如果要用扩展式博弈对一个博弈问题进行建模(或者描述),那么除了要说明博弈问题所涉及的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。

【例6-1】 考察一个“新产品开发博弈”。

试用扩展式博弈对两个企业都知道市场需求且企业同时决策的博弈情形,即完全信息静态的“新产品开发博弈”进行建模。

⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎩⎨⎧⎩⎨⎧。

为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润企业需求小元开发,获利润企业万元不开发,获利润企业需求大元资金投入)开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图解:文字描述如下:根据定义6-1,完全信息静态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2;(2)两个企业同时行动,即同时选择产量;(3)每个企业行动时有两种选择—“开发”和“不开发”,并且每个企业行动时不知道对方的选择1; (4)两个企业的支付如图1-1所示。

1 注意,虽然此时每个企业都不知道对方的选择,但用扩展式博弈进行建模时仍然假设参与人都同时看到了图1-1所示的投入-产出图,即图1-1对两个企业来说为共同知识。

⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎩⎨⎧⎩⎨⎧。

为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润企业需求小元开发,获利润企业万元不开发,获利润企业需求大元资金投入)开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图【例6-2】 继续考察“新产品开发博弈”。

试用扩展式博弈对两个企业都知道市场需求且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形,即完全信息动态的“新产品开发博弈”进行建模。

解:文字描述如下:根据定义6-1,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2; (2)企业1先行动,企业2后行动;(3)企业1行动时有两种选择—“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择—“开发”和“不开发”,但企业2行动时已经知道企业1的行动; (4)两个企业的支付仍然有如图1-1所示。

上述两个例子中,用文字描述的方法给出了博弈问题的扩展式描述。

对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。

但可以想象,如果遇到的是更为复杂的博弈问题,如参与人人数大于2,每个参与人可以多次行动且每次行动时可供选择的行动方案不同等,文字描述所给出的模型就会显得繁冗拖沓,极不直观,因此 需要寻找一种简便易行的扩展式博弈的描述方式。

下面就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式—博弈树。

所谓博弈树,就是由结和有向枝构成的“有向树”。

图6-1给出的是当市场需求为大时,完全信息动态的“新产品开发博弈”的博弈树。

在图6-1所示的博弈树中,最上端的一个点1x (用空心圆表示)表示博弈的开始,将“企业1”标示在点1x 上,表示博弈开始于企业1的选择。

企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。

若企业1选择“开发”,则博弈从点1x 达到2x (用实心圆表示);若企业1选择“不开发”,则博弈从点1x 达到点3x (用实心圆表示)。

点2x (或3x )上标有“企业2”,表示企业2在博弈到达点2x (或3x )时,即企业1选择“开发”(或“不开发”)后,再进行选择;企业2的行动也有“开发”和“不开发”,同样分别用标有“开发”和“不开发”的有向枝表示。

若企业2选择“开发”,则博弈从点2x (或3x )达到点4x (或6x )(都用实心圆表示);若企业2选择“不开发”,则博弈从点2x (或3x )达到点5x (或7x )(都用实心圆表示)。

由于企业2选择后博弈结束,因此点4x 、5x 、6x 和7x 都表示博弈的结束。

在点4x 、5x 、6x 和7x 旁标有支付向量,表示博弈达到该点时企业的所得。

其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得1。

图6-1中,点1x 、2x 、3x 、4x 、5x 、6x 和7x 称为博弈树的结(node ),其中标有参与人(即企业)的结1x 、2x 和3x 称为决策结(decision node ),表示参与人在此选择行动;标有支付向量的结4x 、5x 、6x 和7x 表示博弈结束,称为终点结(terminal node )。

在决策结中,决策结1x 表示博弈的开始,亦称为博弈树的初始结或根(root )。

结与结的连线称为博弈树的枝(branch ),表示博弈从枝的一个结达到另一个结参与人需要选择的行动。

例如,博弈从决策结1x 达到2x ,需要企业1选择行动“开发”,所以在连接1x 和2x 的枝上标有行动“开发”。

在博弈树中,枝是有向的,表示博弈只能从枝的一个结达到另一个结。

例如,在连接1x 和3x 的枝上,标有行动“不开发”,表示当企业1选择“不开发”时,博弈从1x 达到3x ,因此连接1x 到3x 的枝的方向是从1x 指向3x 。

1 一般情形下,支付向量中数字的顺序与博弈树中参与人的行动顺序相对应。

通过以上介绍,再考察图6-1中的博弈树,可以得到这样的信息: (1)博弈中的参与人是企业1和企业2; (2)博弈中企业1先选择,企业2后选择;(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”; (4)博弈中企业的支付。

也就是说,除了“企业2行动时是否观测到企业1的选择”这一点暂时无法从图6-1中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素)都可以从图6-1中得到。

如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。

下面探讨如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来。

在完全信息动态的“新产品开发博弈”中,企业2决策时企业1已经做出选择,此时企业2面临的决策情形无非只有以下两种: 第一种:企业2知道企业1的选择; 第二种:企业2不知道企业1的选择。

对于第一种情形,企业2知道企业1的选择,即知道企业1选择“开发”还是“不开发”,因此企业2知道博弈是从1x 到了2x 还是从1x 到了3x 。

这就意味着当轮到企业2决策时,他知道自己是在点2x 上还是在点3x 上。

对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从1x 到了2x 还是从1x 到了3x 。

因此,当轮到企业2决策时,他不知道自己是在点2x 上还是在点3x 上。

所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”。

为了将“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”这一点说清楚,需要引入“信息集”(information set )的概念。

在博弈树中,参与人i 的一个信息集(用i I 表示)是参与人i 决策结的一个集合,它满足以下条件: (1)i I 中的每个决策结都是参与人i 的决策结;(2)当博弈到达信息集i I (即博弈到达i I 中某个决策结)时,参与人i 知道自己是在信息集i I 中的决策结上,但不知道自己究竟在i I 中哪个决策结上。

因此,参与人i 的信息集i I 可以用来描述当轮到参与人i 行动时他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。

例如,在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动,那么在如图6-1所示的博弈中当企业2行动时就只知道博弈要么到达点2x ,要么到达点3x ,但具体在哪一点上,企业2不清楚。

也就是说,企业2只知道自己位于决策结集合23{,}x x 上,但不知道位于23{,}x x 中哪一个决策结上。

在这种情况下,23{,}x x 就是企业2的一个信息集。

如果假设企业2行动时知道企业1的行动,那么在如图6-1所示的博弈中,当企业2行动时就知道博弈是到达了点2x ,还是到达了点3x 。

相关主题