博弈论与社会选择中的理性第一讲个体理性决策与博弈论经济学的两个基本观念:理性(rationality)与折中权衡(trade-off)什么意义上,我们可以运用理性选择理论,实现什么目的?描述或解释人类行为,进行机制设计的基础行为者(决策者、博弈者)对所处场景的主观认知:物我两分;形式系统及其解释有界理性:理论性概念与经验性概念:Craig定理社会物理学:个体理性决策、博弈论与社会选择,机制设计社会科学的两大基石:博弈论与社会选择博弈论的两个互补观念:协调性与稳定性(稳健性)作为描述性理论的as if解释:图灵实验描述性与规范性之间的不协调个体理性决策阿罗:“方法论个人主义的当代形式是博弈论”,“所有解释都必须以个人之间的行动和对行动的回应的方式进行”(Arrow, 1994, p5, p1)。
“我们研究的模型假设每个决策者在如下意义上是理性的,他知道他的可选择对象,形成关于任何未知事物的预期,具备清晰的偏好,在某些优化过程后深思熟虑地选择他的行为”(Osborne & Rubinstein, 1994, p4)。
选择、偏好、效用选择:一致性(consistency),弱显示偏好公理偏好:完全性:不能不选择传递性:RAxM∈∀A=∈A,y}:{,(xRy)xRAG⌝=A∈∀∈{y,}):A(yPx,Rational Fool :tie-breaking 布里丹的驴子“全局理性”:How to decide … how to decide to how decide rationallyHerbert Simon:“bounded rationality”;满意原则(秘书问题),是一种进化出来的能力而非计算的结果选择规则如果假设一个决策者对所有备选方案都是无差异的,那么任何行为都可以被理性化。
但是,理论的强度越弱,预见性也越差。
满足连续性的偏好可以被一个效用函数所表示。
偏好和效用反映了行为主体的主观性判断。
利己主义、利他主义与妒忌型人格可以被区分开。
不确定环境(行动与结果之间的对应关系)下的决策个体知识的划分(partition)刻画:非幻觉性;如果你知道某事,那么你知道你知道某事;如果你不知道某事,那么你知道自己不知道某事风险、不确定性、无知两类模型,决策者在两类模型中都是在彩票中进行选择。
概率(probability)模型定义的彩票是彩金的概率分布,适用于描述客观未知(objective unknowns)情形,即奈特所谓的风险(risk)和(Anscombe & Aumann ,1963)中的轮盘(roulette)彩票;状态变量(state-variable)模型中彩票是从可能状态集到彩金集的函数,适用于主观未知,即奈特所谓的不确定性(uncertainty)和(Anscombe & Aumann ,1963)中赛马(horse)彩票。
Allais Paradox :设{}0,1,12=X (单位为百万美圆),令[][]09.0121.01+=l ,[][]089.0111.02+=l ,[]13=l ,[][][]01.0189.0121.04++=l 。
许多人的偏好为21Rl l 和43Rl l 。
简单的计算表明违反了严格替代性公理。
Ellsberg paradox :有两个缸,第一个里面放50个红球和50个黑球,第二个里面放100个数目不详的红球黑球。
任意取一个球,让人猜测如下哪种情形发生以予奖励:第一个缸中的红球(1R );第一个缸中的黑球(1B );第二个缸中的红球(2R );第二个缸中的黑球(2B )。
经验观察是许多人的偏好为)2()2()1()1(B I R P B I R 。
根据替代性公理,应该有))2(5.0)2(5.0())1(5.0)1(5.0(B R P B R ++;)2()1(R P R 似乎揭示出在主观信念上)2()1(R p R p >,)2()1(B P B 又揭示出)2()1(B p B p >。
但显而易见))2(5.0)2(5.0())1(5.0)1(5.0(B R I B R ++,并且5.0)2()2()1()1(=+=+B p R p B p R p ,因为球从两个缸中取出的概率是一样的。
同时也揭示出人们的决策有模糊性回避的倾向,相对而言他们宁肯通过抛一枚硬币(概率是客观的)打赌而不愿通过球赛(概率是主观的)打赌。
个体理性决策:在信念下最大化预期效用;不使用(弱)劣策略荷兰赌(Dutch book )与“无套利”(no-arbitrage )最简单情形,a c b a解概念博弈论与个体理性决策的区别:博弈论的核心在于确定策略不确定性,零概率事件和不可能事件,博弈树完全信息、完美记忆物理结构:博弈的技术限制下的刻画知识结构:博弈者理性与关于物理结构的知识及高阶知识豪尔绍尼转换:没有无知展开型与策略型、斯坦克博格展开形式正规型策略表示:简约型与半简约型,代理人型策略表示策略型足够的理由:策略是事前的。
博弈的等价形式解概念:行动方案与信念系统自我实施(self-enforcing)的行动方案与自我实现的预见(self-fulfilling prophecy)劣策略重复删除、可理性化解、相关均衡与纳什均衡事前交流(pre-play communication):如果博弈者事前讨论如何玩这个游戏,那么它一定是纳什均衡,要不就会至少有一个人有动力偏离这种玩法;自我实现的预言自我实现的预言:如果大家都知道一个理论预言游戏应该怎么玩,那它一定预言的是纳什均衡;焦点(focal point)解释:“如果一个博弈有一种明显的玩法(从博弈结构本身或它的设定得出),那么博弈者们会知道其他博弈者正在干什么”,所谓均衡,就是大家都知道的明显的玩法。
信息价值:知道的越多越好?精炼与筛选(焦点)策略稳定解一般性质博弈论中的悖论与不可能性纽卡姆悖论囚徒困境:杜比定理连锁店悖论蜈蚣博弈粗心司机绞刑(不可预见的测验)悖论均衡化过程:演绎的知识与互动知识的刻画互动知识:子非鱼,安知鱼之乐?子非我,安知我不知鱼之乐?普遍知识共同模型:Common knowledge about game rule, common theory, common model对人类行为的合理描述:理论模型中的博弈者、研究者的理论模型与客观观察者眼中的现实。
共同语言:鲁宾斯坦与女儿以为自己是老鼠的精神病患者脏脸夫人不忠丈夫自我相关:梵学家与女儿“无知”、逻辑全知普遍先验、无交易命题信封测验打赌投机认同不一致双侦探股市交易为什么发生是否存在“炒股宝典”均衡化过程:进化的公孔雀的漂亮尾巴主观博弈经典博弈论利用对手的无知得利将计就计特洛依木马计遗憾与后悔随机选择、混合策略与多重均衡不完全性定理纳什均衡作为元解概念第二讲社会选择理论多数规则:梅定理孔多塞陪审团定理雷-泰勒定理一个社会福利函数是多数投票型的,当且仅当它满足匿名性,目标中性和正反映性。
匿名性保证不会出现某一个人的意愿受到特别重视,也就是一人一票没有特权;目标中性指在合法的和技术可行的范围内,所有社会目标都受到同样待遇;正反应性表明,如果原来社会喜欢甲胜过乙,现在有至少一个原来喜欢乙的人转而喜欢甲,那么社会还应喜欢甲。
这三条都是直觉上很合理的标准,而多数投票是唯一满足它们的。
阿罗可能性定理不存在同时满足如下四个基本公理的理性的社会选择函数:1)个人偏好的无限制性,即对一个社会可能存在的所有状态,任何逻辑上可能的个人偏好都不应当先验地被排除;2)弱帕累托原则,3)非相关目标独立性,即关于一对社会目标的社会偏好序不受其它目标偏好序变化的影响;4)社会偏好的非独裁性。
Gibbard-Satterthwaite操纵定理特权的灾难森的帕雷托自由不可能性定理假设一个二人社会由好色的张三与拘谨的李四组成,他们面对着那本有名的《查特莱夫人的情人》。
好色的张三希望由李四来读这本书,但相比谁也不读它而言,他宁肯自己来读它;而拘谨的李四则希望最好大家都不读这本书,但相对张三读来说,还不如他自己来读。
如此则有下面的矩阵:来说,(c,d)好于(a,b);对张三来说,(b,d)好于(a,c)。
显然李四选择不读,张三选择读,这个结果d帕累托劣于a。
正如缪勒所指出的,上述矩阵类似于博弈论中著名的囚徒困境。
正义理论豪尔绍尼的功利主义社会福利函数罗尔斯的辞典式最小规则机制设计理论所罗门王可以向其中任一母亲(姑且称其为安娜)提问孩子是不是她的。
如果安娜说不是她的,那么孩子给另一个女人(可称其为贝莎),博弈结束。
如果安娜说孩子是她的,那么所罗门王可以接着问贝莎是否反对。
如果贝莎不反对,则孩子归安娜,博弈结束。
如果贝莎反对,则所罗门就要她提出一个赌注,然后向安娜收取罚金。
比较罚金和赌注,如果罚金高于赌注,则孩子给安娜,她只须交给所罗门王赌注那么多钱,而贝莎要交给他罚金的钱;如果罚金比赌注低,则孩子给贝莎,她给所罗门王赌注的钱,安娜的罚金也归他。
可以很容易地推出(重复剔除劣策略),在安娜是真母亲的情形下,她的策略是说孩子是她的,然后贝莎不反对。
因为她反对的结果只会导致她要多交钱,因为安娜为了得到孩子并避免白白给出罚金,必然会真实地根据孩子对她的价值拿出罚金;在安娜是假母亲的情形下,她的策略是承认孩子不是她的,因为如果她说孩子是她的,贝莎必然会反对,并且贝莎为了得到孩子并少付钱,一定会真实出价,而安娜只有出高出孩子对她的真正价值的钱才会得到孩子,可这就不合乎她的偏好了。
当然,在假母亲具有妒忌型效用函数时,上述机制就无效了。
她可以出很多钱得到一个并不物有所值的东西,只因为这样损害了别人。
这种损人不利己的行为,相信大家都知道是很让人头痛的(这是我们说机制设计“几乎”完美解决这个问题的原因)。
相反,如果她再有钱,只要是一个正常的利己主义者,而机制设计者又是依法办事的,那么问题依然好办。