当前位置:文档之家› 博弈论教案设计

博弈论教案设计


主思考能力,
结 地拿了 1 个饼吃起来。庞涓未吃完两个饼,孙膑已经吃完 1 个 也 为 下 次 课
束 饼,孙膑第二次拿了 2 个饼,此时桌上已经没有饼了。最后, 做铺垫。
孙膑吃了 3 个饼,而庞涓吃了 2 个饼。
请大家回去后思考这个案例与我们前面所介绍的博弈又有
什么区别,下次课我们将通过该案例向大家介绍博弈论的分类。

教学内容
教学思想

引入案例——囚犯困境(Prisoner's Dilemma),先给学生讲
从学生
如下案例:
感兴趣的案
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入 例引入,可以
罪。他们每一个人都被单独囚禁,并单独进行审讯,即双方无 引 起 学 生 的
法互通信息。警方向这两名嫌疑犯交待量刑原则如下:
白。
这就是我们将在以后要学习的博弈论。
简单了解什么是博弈论
在激发
博弈论(Game Theory),也称对策论,是描述和研究行为 了 学 生 学 习
者之间策略相互依存和相互作用的一种决策理论。它是现代数 兴趣之后,给
学的一个新分支,博弈论的应用领域十分广泛,在经济学、政 出“博弈论”
治科学(国内的以及国际的)、军事战略问题、进化生物学以及 的定义,并有
坦白)这一对策略组合下的博弈状态,就是一种均衡状态。一
般地说,由博弈中的所有参与者的占优策略组合所构成的均衡
就是占优策略均衡。
我们可以在支付矩阵图中用划横线的方法来寻找占优策略
在介绍
均衡。具体做法如下:先看甲的策略选择,当乙选择坦白策略 时,教师在黑
时,甲会选择坦白策略,得报酬-5,则我们在报酬-5 下划一横 板 上 一 步 步
1. 在支付矩阵中找出处于均衡状态的最佳策略组合 2. 掌握两类均衡的相互关系
掌握占优策略均衡与纳什均衡的内在联系和区别
1.采用情景教学法和案例教学法,以教师的讲授为主 2.通过对比教学引导学生掌握占优策略均衡和纳什均衡的相互关系
3.结合生动有趣的案例分析和简单示意图帮助学生了解博弈分析过程
本课程主要授课对象是大学一年级学生
论乙选择坦白还是不坦白,甲都会选择坦白。于是,我们说,
坦白策略是甲的占优策略,类似的分析对于乙也是适用的。因
为,不管甲选择坦白策略还是不坦白策略,乙都会选择坦白策
略,所以,坦白策略也是乙的占优策略。因此,我们给出占优
策略的定义:无论其他参与者采取什么策略,某参与者的唯一
的最优策略就是他的占优策略。在我们分析的例子中,(坦白,
2
10
0
案例,运用对

0 01 2
芭蕾
比分析法,引 导学生与“囚
显然,男生没有占优策略,男生的最优策略随女生的策略 徒困境”相对
的变化而变化。类似地,对于女生的策略选择而言,女生也没 比,得出两种
有占优策略。尽管如此,我们仍可以注意到,对于(足球,足 均衡的差异。
球)策略组合而言,只要男生选择了足球,女生就不会改变对
当代的计算机科学等领域都已成为重要的研究和分析工具。此 意 识 地 向 学
外,它还与会计学、统计学、数学基础、社会心理学以及诸如 生 传 达 学 习
认识论与伦理学等哲学分支有重要联系。
博弈论的意
生活中每个人如同棋手,其每一个行为如同在一张看不见 义,让大家重
的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制, 视 对 博 弈 论
所以在这个博弈里有两个纳什均衡:(足球,足球),(芭蕾,芭
蕾)。
占优策略均衡与纳什均衡比较
占优策略均衡要求任何一个参与者对于其他参与者的任何
最后,教
策略选择来说,其最优策略都是唯一的。而纳什均衡只要求任 师 进 行 归 纳
何一个参与者在其他参与者的最优策略选择给定的条件下,其 总结,得出最

选择的策略也是最优的。所以,占优策略均衡一定是纳什均衡, 后结论。再通
博弈论教案设计
课题 课型 教材 分析 总体 目标
教学 内容
教学 目标
重点 难点 教学 方法 授课 对象
实 际 讲 授 过 程
博弈论
新授
课时 20 分钟
本节课的理论主要来源于《西方经济学》第七章,第四节《寡头厂商之间的博
弈:博弈论初步》,本节初步介绍了博弈论的相关基础知识。此外,结合《博弈论的
诡计》一书,引入了相关案例分析。
负。每一个参与者所得到的支付都是所有参与者各自所选择的 培 养 学 生 严
策略的共同作用的结果。
谨的学习态
如案例“囚犯困境”中所述:
度,同时也使
参与者:甲、乙
学生对博弈
策略:坦白、不坦白
论有更加深
支付:判刑年数
入的了解。
占优策略均衡(Dominant Strategy)
通过对“囚犯困境”的分析,我们得到这样一个结论:无
线;当乙选择不坦白策略时,甲仍会选择坦白策略,得报酬-1, 进行板书,引
则我们在报酬-1 下划一横线。类似地,再看乙的策略选择,甲 导 学 生 寻 找
选择坦白或是不坦白时,乙都会选择坦白策略,则我们分别在 占 优 策 略 均
相应的乙的报酬-5 和报酬-1 下各划一条横线。最后,矩阵图中 衡,并掌握相

唯一的两个数字都被划上横线的那一格报酬组合(-5,-5)所对 关方法。
应的(坦白,坦白)的策略组合就是该博弈的占优策略均衡。
际讲

讲授
坦 白 不坦白
授新
坦 白 -5 -5 -1 -7
过 课甲
-7 -1 -2 -2
不坦白

纳什均衡(Nash Equilibrium)
在一个博弈中,只要每一个参与者都具有占优策略,那么, 通 过 生
该博弈就一定存在占优策略均衡。但是需要指出的是,在有的 活 中 常 见 的
博弈中,并不存在占优策略,仍可以达到博弈均衡。
事例引出纳
案例:性别战(Battle of Sexes)
什均衡的概
一男一女谈恋爱,男的偏好足球,女的喜欢芭蕾,但他们 念。
宁愿在一起,不愿分开。下表所列为收益。

足球 芭蕾
通过该
足球
由于本课程属于基础课程范畴,目的在于通过掌握博弈论的理论体系,拓展学
生的思维,为微观经济学、管理学、会计学等后续课程的学习奠定基础。
1. 博弈论的相关概念
2. 占优策略均衡 3. 纳什均衡 4. 占优策略均衡与纳什均衡的比较
1. 对博弈论有初步认识,激发学生的兴趣,扩展思维 2. 让学生掌握占优策略均衡和纳什均衡的基本原理 3. 使学生明确区分占优策略均衡和纳什均衡
足球的选择;同样,只要女生选择了足球,男生也不会改变对
足球的选择。从这个意义上讲,策略组合(足球,足球)也达
到了一种均衡状态。由此,我们给出纳什均衡的定义:在一个
纳什均衡里,任何一个参与者都不会改变自己的最优策略,如
果其他参与者均不改变各自的最优策略。在这个例子中,给定
一方看足球,另一方也会去;给定一方看芭蕾,另一方也会去。
人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研 的学习。
究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统
讲 化为一门科学。换句话说,就是研究个体如何在错综复杂的相
授 互影响中得出最合理的策略。事实上,博弈论正是衍生于古老
新 的游戏或曰博弈如象棋、扑克等。
在介绍
课 博弈论的相关概念
博弈论理论
课 如图 1 的支付矩阵
穿于后面的

理论讲解中,
坦 白 不坦白
也为教学节
坦白 甲
不坦白
-5 -5 -1 -7 -7 -1 -2 -2
约了时间。 简单向
图1
学生介绍支
这两个囚犯之间的博弈过程如下:先考虑囚犯甲的选择。 付 矩 阵 图 的
甲要决定自己的选择,他必须要先考虑乙的选择,即甲是在考 具体含义。
虑了乙的选择的前提下来决定自己的选择。那么,甲一定是这
样思考的:
1. 如果乙选择坦白,则甲选择坦白,会判 5 年;选择不坦白,
会判 7 年。于是甲选择坦白。(因为 5<7)
2. 如果乙选择不坦白,则甲选择坦白,会判 坦白。(因为 1<2)
得出结论:无论乙选择坦白还是不坦白,甲都会选择坦白。
同理,在分析乙的选择时,我们也会得到类似结论。但当
我们仔细分析,不难发现:如果两人都选择不坦白(即合作),
则可以获得最好的结局(即只判 2 年)。但由于他们之间不能互
通信息,所以每一方都担心由于对方坦白而自己不坦白时自己
所遭受到的重判(即对方坦白判 1 年,自己不坦白判 7 年)。在
这种情况下,每个囚犯从自己的利益考虑,最后的选择都是坦

后,所有参与者都没有动机想再变了。
我们看下面这个案例:一天,鬼谷子想试一试孙膑与庞涓
留下思
的智力。鬼谷子拿出 5 个饼,放在桌子上,让他们两人去吃。 考题,可以培
鬼谷子说:每人一次最多拿两个饼,并且拿的饼全部吃完后才 养 学 生 的 自
课 堂
能再拿。鬼谷子说完后,庞涓急切地拿了 2 个饼,而孙膑从容
基本要素:参与者(Players)、策略(Strategies)、支付(Payoffs) 之前,向学生
在每一个博弈中,都至少有两个参与者,每一个参与者都 讲 解 博 弈 论
有一组可选择的策略。作为博弈的结局,每个参与者都得到各 的 相 关 概 念
自的报酬,即各自得到一笔支付,其支付可以为正,也可以为 术语,有助于
注意力,从生
1. 如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑 动 形 象 的 案
1 年;不坦白者从重处理,判刑 7 年。
例中,让学生
导 2. 如果两人都坦白,则每人各判刑 5 年。
相关主题