博弈论与信息经济学课程论文设计博弈论课程学习及其在中国股市中的借鉴意义课程名称:博弈论与信息经济学课程编号:212030107任课教师:姓名:学号:20142103专业:农业经济管理专业学习时间:2015年03月至2015年05月博弈论在中国股市中的借鉴意义摘要:本文在博弈论课程学校的基础上,归纳博弈论相关理论和重要经典案例。
运用博弈论思想,结合经典案例“囚徒困境”和“智猪博弈”分析中国股市中机构投资者以及机构投资者与散户之间的博弈,得出相关的均衡解或占有策略,以期能够对股市中相关投资主体的投资有所帮助。
关键词:完全信息静态博弈;完全信息动态博弈;纳什均衡;占优策略;囚徒困境;智猪博弈一、理论相关理论学习综述(一)博弈论概述博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。
其中局中人、策略和收益是最基本要素。
局中人、行动和结果被统称为博弈规则。
参与者:一个博弈至少有两个或者以上的参与人。
行动集合与策略:每一参与人当采取行动时他可以选择的行动全体是他的行动集合。
一个策略是一个参与人在博弈开始前的一整套行动计划。
参与人是有选择余地的。
规则与时序:规则是指博弈对参与人如何采取行动作出的规定。
时序是规定参与人采取行动的先后次序。
报酬函数:报酬函数给出了一个参与人在所有参与人取定策略时每一策略组合下对应的报酬。
每一个参与人都有自己的一个报酬函数。
基本特点:一个参与人的报酬并不仅是自己行动和策略的函数,也是其他参与人行动和策略的函数。
基本假定和行为动机:每一个参与人是理性的,每一个参与人追求自己报酬最大化(效用最大化)。
(文明的经济人)基本博弈类型:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,合作博弈。
(二)完全信息静态博弈完全信息静态博弈中各博弈方同时决策,且所有博弈方对博弈中的各种情况下的策略及其得益都完全了解的。
1.囚徒窘境与优势策略经典案例一:囚徒困境优势策略(占优策略):对于某个参与人来说,如果存在一个策略,其对手取任一个策略,该策略都是最好的应对。
2.纳什均衡纳什均衡指的是在给定竞争对手的选择行为后,博弈方选择了它所能选择的最好的策略(或采取了它所能采取的最好的行动)。
在二人博弈中,记Si为参与者i的策略空间,πi为其报酬函数。
如果存在一对策略,(s*1,s*2),s*i∈Si,i=1,2,使得每个参与者的报酬都有π1(s*1,s*2)≥π1(s1,s*2),π2 (s*1,s*2)≥π2 (s*1,s2)∀si∈Si i=1,2那么,策略对(s*1,s*2),便是该博弈的一个纳什均衡。
在纳什均衡下,谁都没有动机独自偏离该状态。
关于纳什均衡的一些结论:(1)优势策略及优势策略均衡不一定存在。
(2)纯策略空间内不一定有解,即不一定存在纳什均衡。
(3)但在混合策略空间中一定存在纳什均衡。
(纳什其人)(4)纳什均衡不一定唯一。
经典案例二:性别之战从性别之战中可以看到,不存在优势策略。
存在两个纳什均衡。
实际中需要的协调机制。
经典案例三:智猪博弈(三)完全信息动态博弈完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。
经典案例一:麦当劳1和汉堡王2的博弈该案例求解可使用倒退归纳法,即从动态博弈的最后阶段的决策结开始,找到该结行动人的最优行动,把最优行动导致的报酬向量前移至该决策结,抹去该决策结的全部下枝。
对最后阶段的所有决策结都照此办理。
如此,整个博弈可以减少一个阶段,对这个缩短了一个阶段的新博弈重复上述步骤,最终可以把博弈简化到初始决策结处。
此时,找出第一行动人的最优行动。
从初始决策结开始最优行动接最优行动一直到某个终点结,这就是要求的子博弈完美均衡路径,再配上其他非均衡路径上的最优行动就得到了该博弈的子博弈完美均衡。
1.子博弈完美均衡麦当劳策略:进入、不进入。
汉堡王策略:(无论对手进入与否都反击);(对手进入则不反击,对手不进入则反击)(对手进入则反击,对手不进入则不反击);(无论对手进入与否都不反击)。
子博弈完美均衡是下面策略对:[进入,(无论对手进入与否都不反击)]如果一个策略对(组合)在任何一个子博弈上都是一个纳什均衡,那么,这就是一个子博弈完美均衡。
2.空头威胁与承诺空头威胁指的是在动态博弈中的初始阶段发誓如果对手在博弈中如此做那么一定要采取某种对抗行为;但由于自己是理性人,到头来权衡利害关系后改变了主意的一种行为。
(纸老虎)承诺是指在动态博弈中的初始阶段发誓如果对手如此做那么一定要采取某种对抗行为;同时付出某种代价,使得自己面临这样一种境地,如果真的出现了那种情况自己不履行诺言的报酬比不上履行诺言的报酬。
该案例中为了阻止麦当劳1的进入可采取空头威胁:如果你进入,我一定要反击。
另外,汉堡王2也可承诺:事先修建一个备用大厨房,申明对方进入就启用展开反击。
二、博弈论在股市中应用股市投资作为投资理财的一种方式,对于优化居民储蓄结构,实现由财物安全到财务自由的过程都有极为重要的意义。
从1990年上海证券交易所挂牌开始,中国股票市场历经廿年,面临着从诞生到成长和发展的现实问题,而在这一过程中已使股票市场成为政府、上市公司、投资者、证券商等不同利益主体博弈的场所。
各方为获得自己的效用最大化,必然要观察各方的行为策略来制定自己的行动步骤。
上述主体之间的行为就是一种博弈行为,通过实现各自效用的最大化来进行博弈。
在众多市场主体中,机构投资者和个人投资者是两大重要主体。
因此,本文将结合博弈论中两大经典博弈,即囚徒困境和智猪博弈来分析两大主体及其之间的博弈问题。
(一)机构投资者之间的“囚徒困境”1.机构投资者在公司上市问题上的博弈理论机构投资者是进行金融意义上投资行为的非个人化、也即职业化和社会化的团体或机构。
它包括用自有资金或通过各种金融工具所筹资金并在金融市场对债权性工具进行投资的非个人化机构。
机构投资者具有信息成本较低、风险分散合理、规模效益较高、监督力量较强的经济特征,诚信原则、勤勉原则等法律特征。
2006年至今,机构投资者进入快速发展时期,初步形成了以证券投资基金为主,证券公司、信托公司、保险公司、合格境外机构投资者、社保基金、企业年金等其他机构投资者相结合的多元化格局。
随着我国机构投资者数量的不断扩大、投资规模的增加以及整体质量的提高,证券市场投资主体的机构化日益明显。
形成以机构投资者为主的投资主体结构,将会发挥其市场“稳定器”的功能;并且机构投资的导向陛和集中性有利于资源的合理配置;机构投资者也不断地推动证券市场的金融创新;机构投资者参与公司治理是一种更高层次上的管理行为。
近年来,我国证券市场规模不断壮大,由于基金业的快速发展、QFI的准入以及社保基金、企业年金等机构投资者进入证券市场的数量不断增加,我国证券市场的投资者结构发生了巨大变化。
市场投资主体的变化正在引发证券市场投资理念和盈利模式的深刻变化,短线投机为主的市场正在成为过去,价值投资和价值发现逐渐成为市场投资的主流。
我们重点分析一下在公司上市问题上机构投资者之间的博弈,这个过程可以理解为“囚徒困境”。
“囚徒困境”的大意是说:警方拘捕了两个犯罪嫌疑人(记为局中人1和2)分别关押审讯。
告知:若都坦白,各判刑八年;若都抵赖,各判刑一年(或因证据不足);若一人坦白一人抵赖,坦白者放出,不坦白者判行为十年。
这里囚徒1, 2可以理解为机构投资者1, 2。
“坦白”理解为机构投资者欺骗上市;“抵赖”理解为投资者不欺骗,支付矩阵为:对该博弈中的两个博弈方来讲,各自都有两种可能的策略,但各方的得益不仅取决于自己的策略选择,也取决于另一方的对应选择。
因为如果机构1选择不欺骗,那么机构2就可以选择欺骗上市,这样机构2就可以从中得到较大受益,这样机构1考虑到机构2的可能的选择后,也会选择欺骗上市。
这样可知对机构1,2个体来讲,最优的选择是都欺骗(-8,-8),而不是都不欺骗(一1,-1)。
而这样的假设是合理的,因为公司上市后可以带来相对于未上市的公司更好的融资等一系列好处,当一个公司不具备上市条件时,由于猜想其他公司会欺骗上市导致自己未能上市而遭受损失时也会采取欺骗的手段。
那为什么上市以后所获取的利润也不是最大的呢?因为由于都是欺骗导致了整个股票市场运行不良,近而整体收益都减少。
这样,两个上市公司都以自己的最大利益为目标,结果是无法实现最大利益甚至较大利益。
还可以看出将追求个人利益的动机变为实现社会最大利益的手段的“看不见的手”并不总是存在的。
2.对于机构投资者之间的分析“囚徒困境”反映了一个很深刻的问题,就是个体理性与集体理性的矛盾。
因为个体为了自己的利益最大,而不愿意改变决策,导致整体利益最小,并且受到了一定的损失。
博弈通常是建立在行为理性基础上的“非合作博弈”,即对弈各方按各自最优决策行事,以达到个体效益的最大。
但是由于很多时候采取了非合作的方式,或者没有制定一个共同遵守的规则来约束博弈行为,个体理性往往并不一定会达到自己的预期目标。
如果政府这个“看得见的手”能够发挥很好的作用的话,使之达到帕累托最优者之最好不过的了,但是对政府来说,过多运用政策,会使投资者无所适从,另外也极大损伤了政府的自身的形象。
出政策越多,政府付出成本也越大。
一方面出政策要付代价;另一方面,指数居高不下也要承受损失。
同时政府在加强对上市公司的监管的同时又存在着政府利益可能会产生对于政府官员的寻租现象,滋生腐败。
而且中国股市最大问题在于信誉问题,由于上市公司业绩不佳导致股民对股市失去信心,那么现在在即将上市的投资公司之间也存在着信誉问题,如果每个投资公司都相信其他公司不会欺骗上市,那么他们也不会选择欺骗上市了。
这个信誉怎么建立?不妨考虑一下重复博弈问题,这是因为,一方面重复博弈使机构投资者为了长远利益舍弃眼前利益而讲究信用,任何短期的机会主义行为都是微不足道的,他们有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义行为。
另一方面,重复博弈将使自己不讲信用的本性暂时收藏起来,为相当长时间内合作准备了可能性。
政府应该想办法创建一种重复博弈的环境,然后剩下的就让市场自己去完成,即该留给市场做的就让市场去做。
(二)庄家与散户之间的“智猪博弈”1.庄家散户之间的博弈理论庄家这个名字是我们非常熟悉的字眼,但要给它准确的定义却不容易。
因为人类的赌博行为远远早于和广泛于股市,所以实际上庄家一词来源于赌博活动中的借用。
在各种赌博的活动中,庄家的含义为:利用资金、筹码等各种有利因素,影响和操纵赌局过程或结果的个人或团体。