当前位置:文档之家› 《博弈论基础》课程期末论文(秋冬)

《博弈论基础》课程期末论文(秋冬)

诚信考试沉着应考杜绝违纪《博弈论基础》课程期末考试试卷开课学院:公共管理学院,考试形式:开卷,允许带___________入场考试时间:所需时间:2周考生姓名: __学号:专业: ___写在前面的话:1、由于信息不对称,成绩取决于您所传递的学识与才能,而不是您实际所拥有的真实状况。

因此,希望您至少在某些题目上有出色的表现。

2、要求您独立完成所有题目,您的答案(主要指论述题)与其他同学如有明显雷同,纯属相互抄袭,绝非巧合。

3、本试卷题目的难度一定足以充分展示您的才能,希望您能够尽可能完成所有的题目,以便最大限度地显示您的水平,无愧于您作为浙大学子的盛誉。

4、所有答案的总字数不得少于5000字,也尽量不要超过20000字。

5、每题20分,共100分,如果您在某些题目上有突出的表现,也可以额外加分(总分小于100分的前提下)。

6、希望您和任课老师博弈的均衡结局是:您竭尽全力并出色地完成了所有的题目,迫使老师不得不给您一个高分。

7、一律使用打印稿,在4月11日晚上上交打印稿的同时,能够把电子稿通过电子邮件(地址:jwh0422@)发送到任课教师的邮箱。

1、完全信息静态博弈参与人B参与人A UD的不同均衡结果(如智猪博弈,斗鸡博弈,囚犯困境,性别战,监督博弈等)。

(对不同模型要有相应的分析或阐述,不能举上课和教材中已经举过的例子。

)例1:假设:在一家企业里,上司给A、B二人布置了一件任务,要求他们共同完成。

同时假设:①上司只看最终结果而不管两人实际付出的工作;②A比B更有能力(即耗费相同精力可以创造更大效益),而且老板是知道这一点的。

若二人通过合作出色地完成了任务,老板会发6000元奖金,A 得4000,B得2000;若一人偷懒另一人勉强完成任务,只注重结果的老板会发3000元奖金,A得2000,B得1000;若两人均偷懒,则A扣除600元奖金, B扣除300元。

此外,选择工作会耗费相当于1500元奖金的精力。

则二人的收益矩阵如下:分析同智猪博弈,选择偷懒为B的严格优势战略,从而博弈结果会是A工作,B偷懒。

这就是我们平时所说的“搭便车”现象了。

这样的结果解释了为何能力更大的人总是被大家期望去承担更多的义务,而且他们也通常会这样做。

毕竟,他们占有了更多的资源。

对于某个领域的新手来说,应该学会如何借助平台上已有的资源和经验,而不是仅凭自己的力量去单打独斗,这样才能获得更快更好的发展。

在智猪博弈里,利用他人的努力来为自己谋求利益的人是最大的受益人,因为他不必付出什么劳动就能获得利益。

在博弈过程中,可以考虑如何让对手心甘情愿地按照自己的期望去行动。

但从总体看来,如果所有人都报这样的心态去行动,整个社会的收益必然会受到损害,发展进度也会减慢甚至倒退回去。

对于一个企业的管理者或是引领社会发展的带头人来说,应该注意多关注一下每个人付出的努力和由于他的付出给整个企业或社会而带来的收益,尽可能地实现按贡献分配,同时结合按劳分配,使得多劳者多得,贡献大者多得。

才能优化社会资源,推动整体的发展。

例2:假设:老师和学生都是理性人,二者在决策的过程中不会考虑道德成本,而且只要老师监考尽职,学生舞弊行为一定被发现。

构建矩阵。

假设以下参数:①监考老师认真监考的成本 B1(考前清理考场,考中巡视,留意学生,发现舞弊现象的后期处理,恶化与学生关系);认真监考的收益 A1(学校的奖励,目前还没有)。

②不认真监考的成本 C2(被巡视发现批评,通报,纪律处分),监考老师不认真监考的收益 R2(更多的闲暇时间支配;聊天,看报纸,发短信等,学生及格率提高,博得学生喜欢)。

③学生诚信考试的收益 C1。

④学生舞弊考试的收益 G2(舞弊及格后不用重修,有资格评选奖学金,竞选部长,简历光彩);学生舞弊的成本 M(取消该门成绩或者更为严重的惩罚)。

基于以上的参数,得出以下矩阵(第一个数字代表老师,第二个数字代表学生):纳什均衡解的确定:此博弈非纯策略纳什均衡,它是一个混合策略意义上的纳什均衡。

学生舞弊的概率(设为 P)和监考老师不认真监考的概率(设为 Q)的确定:①在 p,q 的条件下,老师获得的效用为:UT=(1- P)(A1- B1)(1- Q)+(A1- B1)(1- Q)P+(A1+R2)Q(1- P)+(R2- C2)PQ=A1 - C + B1Q + R2Q - A1QP - QPC2得到 P=(B1+R2)/(R2+C2)所以老师的效用最大时,学生作弊的概率为:P*=(B1+R2)/(R2+C2)②在 P,Q 概率的条件下,学生获得的效用为:US=C1(1- P)(1- Q)- M(1- Q)P+C1Q(1- P)+(C1+G2)QP=C1- C1P- MP+MPQ+C1PQ+G2PQ得到 Q*=(M+C1)/(C1+G2+M)所以学生的效用最大时,老师监考不利的概率为:Q*=(M+C1)/(C1+G2+M)均衡意义:通过对上述均衡的推导,我们一定程度可以解释为什么高校会有那么频繁的作弊现象。

①由于学生的作弊概率与老师认真监考的成本 B1 和不认真监考的收益 R2 成正比,与老师认真监考的收益A1 和不认真监考的成本 C2 成反比,而在现实学校生活中,老师认真监考的收益很小,甚至得不到学校任何奖励,而不认真监考的成本也很小,惩罚实际上都流于形式了,在上述两种背景下,P 会变的很大。

再加上老师监考时很无聊,会使得 B1 很大,这样不认真监考,一定程度可以提高自己所教学生的成绩,这样老师额外的 R2 会更大,在上述背景下,P 会变大。

因此在当前对监考老师的奖惩制度以及老师的全程负责制度会使得 P 变的很大,这样层出不穷的作弊现象出现也就不足为奇了。

②老师不认真监考的概率 Q 与 GI 和 M成正比,而对于大多数舞弊者来说,他们诚信考试所获得的收益是很小很小的,又因为当前对作弊惩罚措施比较弱,使得 M 比较小,这样 Q 就比较小:又 Q 与G2 成反比,而在学校的制度中,将考试不及格与奖学金的评选,社团部长的竞选资格等联系在一起,就使得 G2 非常大,这样使得 Q 比较小。

因此在对学生不及格的一些过重惩罚措施和对舞弊者惩罚的过轻处理,使得老师不认真监考的概率很小,这样就为学生作弊创造了条件。

例3:“石头、剪子、布”的博弈记得在课上,老师讲过,两个人在玩“石头、剪子、布”的游戏时,如果A说出要出“石头”,那么B会出什么?我做如下分析:博弈模型如下:从纯理性角度来看,如果双方都知道该规则,且都想获胜。

那么,A说了自己出石头,B就必然出布;但A考虑到B的想法,又会改出剪刀;B猜到A想到了自己原来的想法,就会出石头;……如此下去,双方不可能出同一种手势,游戏也就会成为一个无法找到均衡点的死循环了。

这个博弈是一次性的零和博弈,因为我们会把提示信息纳入考虑范围,因此采用混合策略并不是最佳选择。

A说自己要出石头,B做出决定首先要考虑信息的真实性。

信息真实,则应该出布;信息虚假,A的目的应该是让自己出布,A自己要出剪刀,所以B应该出石头。

不管信息是怎么样的,出剪刀的比例是最小的。

在一个利益相反的博弈中,博弈方要做的是保护好自己的信息,假若透露,那么是真实的可能性应该小于虚假性的可能性。

因此B出石头的可能性就比出其他手势的可能性的要大。

况且,石头最容易变换成其他手势,便于见机行事,临时改变。

如果我是那个说要出“石头”的A,实际上会出什么是要根据具体情况来定的。

如果是教小孩子学游戏规则,肯定会出石头;如果是想不计信誉损坏地赢得对方,就会猜想对方可能推导到哪里,之后多推一步赢得比赛。

不过,对方可能推导到哪里是难以估计的,所以随意出一个手势或者就按原说法出石头可能反而会有更大的胜算。

我认为,“言语”必然是能够在利益对立的博弈中起作用的。

通过言语,博弈的双方可以传达许多信息。

在“石头、剪子、布”的博弈中,如果A可以使得B相信自己一定会出石头,那么B就会选择出布,而A此时只需改出剪刀就可以轻易地赢得比赛。

但是,A的信誉度在B的心中,恐怕再难以恢复了。

对于A,长久来看,这可能是一个更大的损失。

除了使对方相信自己,言语还可以威胁对方不战而败,从而不费吹灰之力便赢得比赛;而叙述(甚至编造)对方亲友的灾难,用其他事物诱惑对方分散注意力等,也可以降低对方的战斗力。

但是,这些做法都已经带有了恶性竞争的因子,长此以往,对社会积极公开的发展是极为不利的。

例4:人民公社化中的利益分配问题。

暂且研究两人之间的利益分配对比问题。

假设:总量为2a,c为参与劳动的体力消耗。

在这个博弈中,两人都偷懒为均衡点,这是典型的多劳不多得的博弈,即类似于智猪博弈。

历史的教训告诉我们,这样的分配方式是万分可怕的,最终的结果就是起初大家有粮食吃,有劳动的积极性;随着时间的推移,劳动积极性下降,粮食供应量下降,最终什么都没有了。

这样的博弈是对多劳者的歧视,虽然没有歧视就是不公平,但是歧视的对象的错误就是更大的不公平。

这种状态下的利益分配是完全不合理的,最终导致新生的政权处于崩溃的边缘。

这样的教训是惨痛的。

2、游戏规则与游戏结局举3个实例说明“游戏的规则决定了游戏的结局”,然后再举3个实例说明“游戏的规则未必能够决定游戏的结局”,然后对在什么条件下“游戏的规则决定了游戏的结局”提出您自己的看法。

游戏与规则我们知道,游戏,是生活中一种常见的博弈。

但是,常常人们只是去体现游戏带给我们的快乐,但是很少有人却想到去了解游戏背后的规则。

因为,有些游戏是游戏的规则决定了游戏的结局,当然也存在着有些游戏的规则并不能决定游戏的结局。

首先看游戏规则并不能决定游戏的结局,这个主要是根据博弈双方智力水平有关。

比如说,我们知道,在国外流行一种棋,叫做tic -tac-toe,翻译过来叫做圈叉棋。

也就是在3*3的9个方格子,先下者画圈,后下者画叉,每人可以在任意没有对方棋子的封闭方格里下一次,看谁先连成一行(一列,斜线)3个就判胜。

这个游戏,就是博弈的以一种,由于最初始的规则定义,如果下棋的双方智商足够高,那么,最终的结果一定是和棋。

但是,如果有一方不能很好的考虑游戏规则的前提下,那么就可能带来不同的结局。

我们先考虑先手,先手有两种下法:胜率最大的走法和最稳固的走法。

也就是说,先手一定不会输,最差的结果是和棋,也有可能回赢。

我们看看胜率最大的走法:一开始走角格胜率最大(威胁最大)。

若对方不走中心格,你一定可以走成“双二”。

分两种情况: 1、对方走边格,不妨设他走了第一列第二行,你走第三列第一行,对方只能走第二列第一行,你再走第三列第三行即可以必杀。

2、对方走角格,不妨设他走了第一列第三行,你走第三列第一行,对方只能走第二列第一行,你再走第三列第三行即可以必杀。

当然,这种情况是建立在对方第一步不在中心各的情况下,也就是说,这不是必胜的游戏,同时也就证明了,这个规则并不能决定游戏的结局。

相关主题