当前位置:文档之家› 博弈论基本模型

博弈论基本模型


U : Z R n , U ( z ) (u1 ( z ),u 2 ( z ), , u n ( z )), z Z
5. 信息集与信息集分割 信息集由同一个局中人、在相同的时点上的具有相同信息 的决策节点组成。用 I ik (i 0,1,2, , n, k 0,1,2, , ri )表示局中 人i的第k个信息集。它满足 I (1) ik ( 表示空集); (2)从博弈起始点到任一终点的路径至多与 I ik 交一点 (描写同一信息集中的节点处于同一时点上); (3)从 I ik 中的任一节点出发,局中人i可能选择的行动集 合都相同(因为局中人在同一信息集的不同节点上具有相 同的信息)。 在博弈树上,将属于同一信息集的节点用虚线框在一起。 称 I i {I i1 , I i 2 , ,I ir } 为局中人 i( 0,1,2, , n) 的信息集类(在数 学上,称以集合为元素的集合为类)。 称 I {I 0 , I1 , I 2 , ,I n } 为信息集分割。
为什么学习?
从学习中获得心灵的提高,获得心灵的享受。 学习,其实就为自己创造一个美丽的心灵世界的过程。 有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些“无用”的知识,你怎么驾驭哪些实用的知识呢? “世人只知有用之用,而不知无用只用”。 很多人30岁后就不再读书,到60岁还是30年前的思维;很多人感 慨“现在一读书就头痛”;农村现在不要为生存而挣扎了,那做 什么呢?“我不打牌又做什么呢?” 每个人都生活在现实的物质世界和心灵的精神世界中,但很多人 只知现实世界的繁华,却不知心灵世界的清新和高远。行万里路、 读万卷书,就是为追求心灵世界。这些年我深刻体会到:生活的 基础是衣食住行,但生活的重点在于文化和精神。我不知道文化 有什么用,我只知道一个人没有了文化还有什么用呢? 教师的功能:催化剂(使学生更快速更深入地学习) 大医医心:能医心者,才是大医。
4.局中人所能选择的行动;
5. 局中人在选择行动时所了解的信息。 6.局中人的支付。
构造博弈模型所需要的要素
1.局中人集合

N 0,1,2,, n ,称 N 为局中人或参与人集合。N 中元素称为参与人或局 中人。参与人不专指人,它泛指参与博弈活动的政府、企业、地区、国家、 个人……等决策主体。通常用“0”表示虚拟局中人,它的行为是以确定的 概率分布进行随机选择, i 1,2, , n 表示实际参与人。

例1.1 考虑按以下步骤进行的博弈活动。 第1步 局中人1从字母T,H中选一个; 第2步 局中人2不知第1步的选择,再从H,T中选一字母; 第3步 局中人知道1,2两步的选择,又从T,H中选一字母; 第4步 局中人2不知第3步的选择,但知1,2两步的选择,最后 从T,H中选一字母,博弈结束。按照每步选择的结果,每个局 中人各得一笔报酬(略)。 该博弈的局中人集合 N {1,2.} 该博弈的信息集合分别为I {I1 , I 2 } ,其中 I1 {I11, I12 , I13,I14 , I15}, I 2 {I 21, I 22 , I 23,I 24 , I 25} 。
3.博弈树
对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1 所示(见p2上的例子)。
旺 盛
I ① 01
疲软

进 入② 容 许 不 进 容 许 进 入② 抵 制

不 进
图1-1 市场进入博弈树
4. 支付向量 博弈树中终点Z下面的向量 u (u1,u 2 , , u n ) 称为支付向 i( 1,2, , n) 个分量表示博弈结束于Z时,局中 量,它的第 人i所得的支付。支付可表示参与人的某种收益或损失。本书 中的支付指收益、效用、利润等。正式地,支付向量是终点 集合Z到n维向量集合R n 的映射。
第1章 博弈论基本模型
(Game Theory)
华侨大学商学院
什么是学习?
学习的三个层次(大学之道,在明明德,在亲民,在止于至善)
专业学习:谋职、谋生(身无长物、何以生存)。 事理学习:明白事理、懂得分析生活中的很多问题。(崔琦: 明白这个世界是一个什么样子,这很重要)。一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好。但这只是像一个盲人一样在生活,“春天 来了,但我却看不到” 。(明明德) 人生学习:充实人生、提高人生的境界、把学习融入人的生活 中。人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习。一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活。看看很多人下班后 在做什么?打牌、或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味。 (身体在成长、心灵也在成长吗?)(新民) 仰望星空
T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①
I11
H ② T H ① I15 T ② H T ② I 25 H T H ② H
I 21
I13
H T ② T H ② T
① I14 H
I 23
I 24
H T
图1-2
信息集可以告诉我们以下4点 1.在一个信息集上应由哪个参与人选择行动。 2.从一个信息集出发,局中人可能选择哪些行动。 3.局中人在一个信息集上选择行动时已知道了哪些信息。 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息 集的博弈历程。 完美信息博弈 如果G的每个信息集都是单点信息集。表明博弈的每个参与人 在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈。 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈
2.行动集合
称参与人 i N在博弈中所有可能选择的行动构成的集合 A i 为局中人i的行 动集合。 A i中的元素 a i 称为局中人i 的行动。 局中人的行动集合可能是有限集,也可能是无限集。如果博弈活动中每个 局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称 该博弈为有限博弈。
博弈论的创立与发展
第三阶段:大发展期(20世纪50’s—90’s)。非合作博弈以及合作博弈的理论获得了 空前的发展。 纳什(Nash,1950)——n人非合作博弈及提出博弈均衡的定义 塔克(A Tucker)——提出“囚徒困境”(prisoner’s dilemma)模型 泽尔腾(Selten,1965)——提出精练子博弈纳什均衡概念,并把这一概念引入到了 动态分析之中 海萨尼(J.Harsnyi,1967~1986)——提出贝叶斯纳什均衡概念,并把这一概念引入 不完全信息博弈模型研究 泽尔腾(Selten ,1975),克瑞普斯(Kreps,1982)和威尔森(Wilson,1982)。 弗得伯格(Fudenberg,1991)和泰勒尔(Tirole,1991)研究了精练贝叶斯纳什均衡, 解决动态不完全信息博弈。泽尔腾定义了“颤抖手均衡”(trembling hand equilibrium); 克瑞普斯和威尔森定义了“序贯均衡”(Sequential equilibrium)并提出了著名的“信誉” 问题模型;弗得伯格和泰勒尔给出了“精练贝叶斯均衡”的正式定义。 颤抖手均衡>序贯均衡>精练贝叶斯均衡(但在许多情况下,三个概念是一致的) 博弈论近期发展:除了博弈论与信息经济学的结合外,还出现了新的理论与应用分 支诸如博弈学习理论、进化(演化)博弈论、博弈论与新制度经济学、博弈论与行为科学、 博弈论与实验经济学、博弈论与组织管理的结合。
囚徒困境(Prisoner’s dilemma)
博弈论的创立与发展
1、博弈论思想最早产生于我国古代
2000多年前的春秋时期孙武在《孙子兵法》中论述的军事思想和治 国策略,就蕴育了丰富和深刻的博弈论思想。 田忌赛马:齐威王的上、中、下马分别优于大将田忌的上、中、下, 但田忌上马、中马分别优于齐威王的中、下马。比赛规则:每次双方各 出三匹马,一对一比赛三场,第一场的输方要赔一千金给赢方。 齐 田忌策略: 田 结 果: 齐 谋士孙膑 策略: 田 结 果: 上马 ∨ 上马 中马 ∨ 中马 下马 ∨ 下马
静态扩展型博弈的例子
例1.2 两个参与人同时从字母T,H中选择一个,博弈结束时 两个参与人各得一笔支付,该博弈的博弈树如图1-3所示。 练习:写出剪刀-石头-布的博弈树。
T ② T H 图1-3 ①
I11
H ② T H
I 21
囚徒困境问题:p11 例1.6 完全信息:博弈各方对各个节点的 支付都很明了. 完美信息:博弈各方对博弈进行的路 径都很明了,完美信息这一概念只用 于动态博弈。
1.1 有限扩展型博弈模型
博弈模型的构建 应用博弈论方法分析研究问题,首先要构造出博弈模型来,因 而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这 些要素进行严格、准确的刻画后,形成博弈模型。 将博弈活动构造成博弈模型,需要了解以下6个方面的情况:
1.局中人;
2.外生事件的概率分布; 3.局中人选择行动的次序;
田忌将军每次输掉三千金 上马 ∨ 下马 中马 ∧ 上马 下马 ∧ 中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2、博弈论的发展阶段 第一阶段:萌芽期(20世纪40年代前)。利益冲突的研究是分散和初 步的、带有很大程度的随意性。 孙子兵法:古诺(Cournot,1883)—古诺的“双寡头垄断”模型;艾 奇 沃 思 (F.Y.Edgeworth , 1925)——“ 双 寡 头 等 分 市 场 ” ; 霍 特 林 (H.Hotelling,1929)——产品差异而引起的“价格竞争”模型;斯塔克 尔伯格(H.V.Stackelberg,1934)——“领导——跟随(leader—follower)” 模 型 ; 斯 威 齐 (P.M.Sweezy , 1939)——“ 折 弯 的 需 求 曲 线 (Kinky Demand Curve)”模型等等。 第二阶段:创立期(20世纪40年代)。博弈论首次系统地被引入经济 学。 1944年冯· 诺依曼(Von.Neuman)和摩根斯坦恩(Morgen Stlern)合作 出版了《对策论与经济行为》,从而奠定了合作博弈的理论与方法。
相关主题