当前位置:文档之家› 关于定价的博弈论模型

关于定价的博弈论模型

CH13 关于定价的博弈论模型分析寡头市场的最大困难在于策略问题。

在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。

博弈论就是用以研究策略选择的一种主要的工具。

一、基本概念在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。

1.博弈的三要素任何一个博弈都必须具备三个要素: (1)博弈的参与者参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。

(2)策略策略是博弈参与者的行动规则。

在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。

(3)支付(payoffs )支付是参与者的最终受益。

支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。

2. 符号两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,)]A B A B G S S U a b U a b其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。

二、Nash 均衡市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。

也就是说***(,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ***(,)(,)B B U a b U a b '≥ 对于所有B b S '∈对纳什均衡的理解设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。

那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。

否则,它就不是一个纳什均衡。

三、一个例子两个厂商(A 和B )决定自己花多少钱用于做广告。

每个厂商可以选择较高的预算(H )或较低的预算(L )。

1.博弈的扩展式表述图13.12.博弈的策略式(规范式)表述表13.13.占优策略和Nash 均衡从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。

由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。

因此,该博弈的均衡是(L ,L )。

请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

四、混合策略Nash 均衡上面的博弈存在唯一的Nash 均衡,但是并非所有博弈都是如此。

在下图所示的猜谜博弈中,没有上述意义上的Nash 均衡存在;而在“性别之战”博弈中,存在两个Nash 均衡。

儿童B H(正面) T(反面) 儿童AH(正面)T(反面)表13.2 猜谜博弈表13.3 “性别之战”Nash 均衡不存在的一个主要原因是参与人的策略较少,缺乏灵活性。

在以下两种情况下,参与者的潜在策略数无穷大,就可以保证博弈至少存在一个均衡:(1)参与者的策略是某一区间内的连续变量(比如厂商对产量或价格的选择);(2)参与者使用混合策略——以一定的概率选择某种概率。

相应地,以概率1选择某种行动的策略叫做“纯策略”。

下面,我们来求解“猜谜博弈”的混合策略Nash 均衡。

Suppose that the players decide to randomize amongst his strategies and play a mixed strategy. Player A could flip a coin and play H with probability r and T with probability 1-r , and player B flip a coin and play H with probability s and T with probability 1-s.Given these probabilities, the outcomes of the game occur with the following probabilities: H-H , rs ; H-T, r (1-s ); T-H, (1-r )s ; T-T,(1-r )(1-s ). Player A ’s expected utility is then given by ()(1)(1)(1)(1)(1)(1)(1)(1)A E u rs r s r s r s =+--+--+-- 42212(21)21rs r s r s s =--+=--+Oviously, A ’s optimal choice of r depends on B ’s probability, s. If 12s <, utility is maximized by choosing 0r =. If 12s >, A should opt for 1r =. And when 12s =, A ’s expected utility is 0 no matter what value of r is choosen. A ’s best response function is0, 12()1, 12[0,1], 12if s r s if s if s <⎧⎪=>⎨⎪=⎩For player B, expected utility is given by()(1)(1)(1)(1)(1)(1)(1)(1) (4221)2(12)(12)B E u rs r s r s r s rs r s s r r =-+-+-+---=---+=---Now, when 12r >, B ’s expected utility is maximized by choosing 0s =. If 12r <, A should opt for 1s =. And when 12r =, A ’s expected utility is independent of what s is choosen. B ’s best response function is1, 12()0, 12[0,1], 12if r s r if r if r <⎧⎪=>⎨⎪=⎩r1sNash equilibria are shown in the figure by the intersections of optimal response curves for A and B.Or, we can get the equilibrium through the FOC()1420 2A E u s s r ∂=-=⇒=∂ ()1420 2B E u r r s ∂=-=⇒=∂对上式的理解:在给定参与人B 采用混合战略() (1-)s H s T +的情况下,如果混合战略() (1-)r H r T +是参与人A 的最优选择,必有()()A A Eu H Eu T =。

同样的,在给定参与人A 采用混合战略() (1-)r H r T +的情况下,如果混合战略() (1-)s H s T +是参与人B 的最优选择,必有()()B B Eu H Eu T =。

这样,混合策略Nash 均衡就可以由以下两式得到()()()()A A B BEu H Eu T Eu H Eu T =⎧⎨=⎩即1(1)(1)(1)1(1)(1)1(1)1(1)(1)s s s s r r r r ⨯+-⨯-=-⨯+⨯-⎧⎨-⨯+⨯-=⨯+-⨯-⎩这样很容易就可以得到上面的混合策略Nash 均衡。

四、囚徒困境囚徒B囚徒A表13.3 囚徒困境抵赖is a dominated strategy. A rational player would therefore never 抵赖. This solves the game since every player will 坦白. Notice that I don't have to know anything about the other player.囚徒困境:个人理性与集体理性之间的矛盾。

This result highlights the value of commitment in the Prisoner's dilemma – commitment consists of credibly playing strategy 抵赖.囚徒困境的广泛应用:军备竞赛、卡特尔、公共品的供给。

五、动态博弈参与人A首先行动,参与人B在观察到参与人A的行动以后,再行动。

相对于动态博弈,参与者同时行动,或者虽然行动上又先后,但是后行动者不能观察到先行动者的选择的博弈叫做静态博弈。

1. 扩展式表述图13.22.策略式表述表13.4请注意企业B的策略和策略空间。

策略是对行动规则的完备描述,由于在参与者A选择以后,参与者B可能面临两种情况——参与者A选择了H或者选择了L,因此,参与者B的策略就要分别描述这两种情况下自己的行动选择。

以策略(L,H)为例,它表示如果参与人A选择了L,那么参与人B就选择L,如果参与人A选择了H,那么参与人B也选择H。

3. 均衡(1)Nash均衡根据表13.4的策略式表述,该博弈一共有3个纯策略Nash均衡:[L, (L, L)]、[L, (L, H)]和[H, (H,L)]。

其中,[L, (L, H)]和[H, (H,L)]并不合理。

以[H, (H,L)]为例,参与人A之所以选择H,是因为他相信如果自己选择了L,参与人B将选择H。

但是很明显,参与人B的这一“威胁”并不可信。

因为一旦参与人A真的选择了L,对参与人B来说,最有选择是L而不是H。

策略组合[L, (L, H)]同样存在这一问题。

只有[L, (L, L)]是唯一合理的均衡。

因此,Nash均衡不能剔除动态博弈中的不可信威胁。

为了得到更为合理的均衡,我们需要更强的均衡概念。

(2)子博弈精炼(完备)均衡(Subgame Perfect Equilibrium)定义:一个扩展式博弈的子博弈由单个决策结x和该决策结的所有后续结(包括终点结)组成,它不能切割原博弈的信息集。

相关主题