关于考试作弊中的博弈分析
蔡於期
又到了期末,对于我们学生来说,又要开始应对各门的考试了。
学校的图书馆、教室等地方的复习的身影越来越多,但是,也有一些人没有复习,他们现在想的是找各种学霸,以便在期末考试的时候能抱上“大腿”(即考试作弊)。
如果能抱上“大腿”,考试就没有压力了。
其实,抱“大腿”这种行为蕴含着许多的博弈论的知识,我们可以通过对其的探讨,来了解博弈论的知识在我们生活中的应用,了解博弈论并非是高不可攀的东西,它就在我们的身边。
关键词:考试作弊;智猪博弈(“搭便车”);进化博弈;不可置信威胁
一、智猪博弈(“搭便车”)
其实,不管是考试作弊还是什么作弊,我们都知道这是不好的行为,因为它造成了不公平,而它的不公平性从博弈论的角度看,主要是因为它是一种会造成坏影响的“搭便车”的行为。
我们可以假设有两个平时关系比较好的同学,分别是A和B。
A是平时认真学习的乖学生,而B则相反,平时只知道玩,成绩很差。
现在到了期末,B就要求A在考试时“帮助”B,即考试作弊。
这时A有两个选择,帮助或者不帮助。
当A选择不帮助时,就会被别人说是“小气”,同时影响自己和B的要好关系,这对A来说是一笔损失。
当A选择帮助B作弊时,A心理面难免会有不满,因为B可以“坐享其成”,而且A帮助B作弊也要冒着被学校处罚的风险。
对于B来说,也有两个选择,作弊或者不作弊,这里B除非有重大变故,否则的话会选择作弊。
当然,也不排除B良心发现,不想作弊了。
所以我们可以得出如下的得益矩阵:
表1. 考试作弊得益矩阵
从上面的得益矩阵我们看出,经过博弈的分析,不管A同学内心愿意还是不愿意,最终都会选择帮助B来考试作弊,因为这样是最优的策略。
所以A同学就得在考试前的期末复习期间像个勤奋的“大猪”,早出晚归,来往奔波于自习室和宿舍之间,而B同学就只需像“智猪博弈”里面的“小猪”在槽边安心等待享受成果就行了。
所以,帮助别人考试作弊往往会使自己成为一只辛苦的“大猪”,而让别人安享成果,这样不仅对自己不公平,对于其
他没作弊的人也不公平,因为有时候别人辛苦学习的考试成绩还不如不学习的,这对于还是靠成绩吃饭的我们来说明显就不公平了。
二、进化博弈
上述的智猪博弈是两人之间考试作弊的情况,而在现实生活中,我们常常会发现多人联合考试作弊的情况发生,即他们在考试前就约定好了固定的座位,以便在考试时能够共享答案。
这个固定的座位圈的参与者当然是人越多越好,以便答案有更高的参考性。
而在这里我们为了分析方便,假设只有5个人,他们都是有限理性的,这5个人依次围坐成一个圆圈,如下图1所示,并且在考试时5个人自然是不能全部的相互进行互动,即一个人只能看到他相邻位置上的两个人的答案,如1只能看到2和5两个人的答案,但是,他们都能够马上对
上一阶段的博弈结果进行总结修正。
现在,有一道很难的判断题摆在他们面前,每个人都不是特别确定这道题的正确的对错情况。
而因为他们都是理性的,所以在开始时每个人既可能认为该题是对的,也可能认为它是错的。
既然每个人都是有限理性的,那么在初次选择对错的时候,各人既可能选择是对的,也可能选择是错的。
因此初次的可能结果一共有52=32种。
这32种情况中包括全部选择是对的,也包括全部选择是错的。
图2给出了部分的情况。
由此,我们根据5人的初次选择情况来讨论最优反应动态所进行的策略调整规则。
我们先构建如图3的一个得益矩阵
表2. 协调博弈
于是,我们假设其中一名同学i , 0
,1,2)(2=-t x i i 数量:的两个邻居选择是错的 则有
所以,同学i 在t+1时期会选择错的选项。
由于x i (t)只能取0、1、2三个整数,因此上述反应规则实际上就是,如果在t 时期同学i 的两个相连位置上的同学中只要有一个选择了对的选项,那么同学i 在t+1时期就会选择对的选项;如果相连的两个同学都没有选择对的选项,那么在t+1的时期同学i 就会选择错的那个选项。
经过多轮的分析,我们可以得出,处了所以人都选择错的选项外,其余的各种情况下最优反应动态都收敛于选择对的选项的稳定状态,即使出现少数的偏离情况,最终也会回归到对的选项上。
所以在上述的协调博弈中,对的选项就是一个进化稳定策略,而错的选项不是进化稳定策略。
上面的分析,用通俗的话来讲,就是当你看到和别人的答案不同时而你又不能确定时,如果你看到了有两个以上的人是同一答案,你也就会倾向于选择该答案。
其实我们大多数人
2
,1,0)(=t x i i 数量:的两个邻居选择是对的时,选择错时,选择对;当当选择错的选项的得益:选择对的选项的得益:61/22)(61/22)(60)](2[0)(49)](2[50)(<>⨯-+⨯⨯-+⨯t x t x t x t x t x t x i i i i i i
都有过这样的经历,当然不一定是考试作弊当中。
三、不可置信威胁
不管是以何种方式来进行考试作弊,都是学校所不能够容忍的,所以,学校方面就会出台一系列的措施来预防、制止和处罚考试作弊。
学校声称,如果学生考试作弊被抓到,将会受到严厉的处罚,比如该科的考试成绩为零,并且受到记过的处分,考试作弊情节严重的将会受到留校察看乃至退学处理。
那么学校这些对学生的威胁措施有多大的可信度呢?
我们知道,威胁的可信度取决于作出威胁者实施该威胁的决心和最后的实际行动,因为理性的人只相信实际行动。
而威胁者是否真正的实施该威胁,则要考虑到实施威胁的实际成本的大小,如果成本过高,则就不会实施该威胁。
这里我们以最严厉的处罚措施--退学处理为例来讨论。
对于一个学生来说,因为考试作弊而被学校强制退学是非常严厉和残酷的,所以,这就意味着学生在考试作弊的时候要冒着非常大的风险。
而对于学校来说,让考试作弊的学生退学,也是要承担着非常大的压力的,这些压力来自学生本人及他们的家长,社会舆论等等,很明显,这些对学校的声誉也是会造成会不好的影响的。
于是,我们可以构建如下表3的得益矩阵。
表3
通过上面的得益矩阵,我们可以看出,一般学校是不会选择让考试作弊的学生作退学处理的,相反它会采取别的一些稍微轻一点的措施,比如说记过处分等。
正因为如此,学校一直都没有过对考试作弊的学生让其退学的先例,所以学校如果对学生做出这样的威胁,那将是不可置信的威胁,即所谓的“空洞威胁”。
但是,如果学校的考试作弊之风太甚,学校铁了心要采用强硬的手段治理,并且真的对一些情节恶劣的学生做出退学处理的话,那么这种威胁就变为可置信的了。
当然了,上面所说的措施,不管轻的还是严厉的,都要以严格执行监考为前提,即一旦学生作弊,老师就会抓并且能够抓到上报。
如果这个环节没有做好的话,即使是那些很轻微的处罚措施都将会变成不可置信的威胁。
四、结语
通过上面的分析,我们可以看到考试作弊当中含有许多博弈论的知识,而笔者在这里以这个为例来介绍博弈论的知识,只不过是因为它跟我们的生活很接近,能让我们对博弈论的知识有更深入的了解,而不是说鼓励大家运用博弈论的知识来帮助自己考试作弊,不管怎么说,考试作弊永远都是不对的,不管有什么样的理由。