从达尔文到芒格(附录三、四)附录三概率从1654年开始,布莱士·帕斯卡(Blaise Pascal)和皮埃尔·费马(Pierre Fermat)在相互来往的信件中发展了概率论中的基本原理。
定义试验是进行观察的过程。
例如:连续掷两次同一枚硬币,观察结果如何。
可能的结果是指试验可能产生的结果。
某个试验中所有可能产生的结果被称之为“样本空间”。
连续掷两次同一枚硬币的试验会产生4种可能的结果:两次都是正面朝上,两次都是背面朝上,第一次正面朝上、第二次反面朝上,以及第一次反面朝上、第二次正面朝上。
事件是指某个试验中一系列可能产生的结果。
简单事件指:观察至少出现一次正面朝上的结果。
这一事件由两次正面都朝上,第一次正面朝上、第二次反面朝上,以及第一次反面朝上、第二次正面朝上这三种可能的结果所组成。
复合事件指由两个或更多个别事件所组成的事件。
独立事件——如果B 事件发生与否皆不影响A 事件发生的概率,称A 事件与B 事件为独立事件。
A事件:观察投掷一枚硬币时正面朝上的情况。
B事件:观察投掷另外一枚硬币时背面朝上的情况。
掷每个硬币都属于独立事件,因为第一个硬币的投掷结果不会影响到投掷第二个硬币的结果,第一个硬币的投掷结果也不会告诉我们投掷第二个硬币时会产生怎样的结果。
互斥事件——A事件和B事件属于互斥事件,则意味着A、B事件不可能同时发生,也就是说这两个事件之间沒有共同的元素。
只投掷一枚硬币。
会有两个事件:正面朝上,以及背面朝上。
看到了正面朝上意味着排除了看到背面朝上的可能性。
如果两个事件之间至少存在一个相同的结果,则这两个事件为非互斥事件。
掷出一颗骰子。
A事件:看到掷出四点。
B事件:看到掷出了偶数。
因为偶数包括了2、4、6,因此这两个事件之间有一个结果是相同的。
概率——介于0-1之间的数值,用来衡量某一事件发生的可能性。
若概率为1,则表明这一事件肯定会发生。
若概率为零,则意味着这一事件肯定不会发生。
算术平均数——一系列结果的算术平均数通常被称之为这些结果的平均值。
为了获得1、8、6、4、7这几个数值的平均数,我们先把这些数字加总,得到26,然后除以5,得到5.2。
变异性(Variability)显示了结果与算术平均数之间的离散程度。
期望是指,如果我们进行大量的试验,我们所希望观察到的结果的平均数。
也被称之为期望值,指经过概率加权之后所有可能的结果的总和。
总体——结果、目标、事件等的总数。
这是一个由至少拥有一个共同特征的样本所组成的群体。
样本——从被研究的总体中随机抽取的一个代表,目的是为了对总体得出一个结论。
样本规模越大,对概率的预测就越准确。
但应该注意到,关键是样本的绝对规模(比如说,接受询问的人的数量),而不是样本占总体中的百分比。
从整个美国人口中随机抽取的3000人较从一所大学中抽取的40人更具预言性。
随机抽样调查是指,总体中每个个体被选中的机会相等。
我们如何判断一个事件的概率?概率法则告诉我们,在大量的试验中可能会出现什么情况。
这意味着我们应能对长期内将发生什么情况做出合理的预期,但我们无法对一起特定事件的结果做出预测。
由三种方法可以衡量概率:逻辑法,相对频率,以及主观概率。
逻辑法如果我们知道可能发生的结果的具体数量,或者所有结果出现的可能性都是均等的,那么我们就可以用逻辑法来衡量概率了。
例如,在机遇游戏中,通过将我们希望看到的结果的数量除以所有可能出现的结果的数量,我们就得到了想要的概率。
如果我们所要分析的情形其结果出现的可能性是均等的,那么我们才能使用这一定义。
投掷一枚硬币,正面朝上的概率是多少?我们希望看到的结果出现的次数为1次,且这一结果出现的可能性是均等的,而所有可能出现的结果的数量为2 (一个为正面朝上,一个为反面朝上),那么所要知道的概率就是1/2,或50%。
相对频率法当一个试验可以重复多次进行时,概率就是该事件之相对频率(Relative Frequency)之极限。
在多数情况下,我们不知道这一事件的概率。
为什么?因为我们不知道所有的结果。
因此,我们必须通过试验,或者找到有关这一事件过去发生频率的具有代表性的信息,来试着预测这一事件在长期内可能出现的相对频率。
所谓的具有代表性的信息是指,这些信息必须以过去大量独立试验中所得的相对频率,或者在相同条件下对参考类的观察为基础。
这里的参考类指的是,结果的分布是已知的,或者是可以做出合理预测的。
我们研究的参考类越多,正确预测概率的机会就越大。
进行一项试验,以测出掷出正面朝上的可能性有多大。
连续掷一枚硬币1000次,并观察结果。
如果你看到有400次是正面朝上,那么掷出正面朝上的相对频率即为正面朝上(发生的事件)的次数除以投掷的总次数(即试验的总次数),为400/1000。
如果掷2000次,然后观察结果。
如果有900次正面朝上,则相对频率为900/2000。
掷的次数越多,发生这一事件的理论概率与相对频率之间的差距就会越小。
在这个案例中,掷出正面朝上的相对频率将朝1/2靠拢。
出现损失的频率有多少?按时间顺序,这些损失是如何分布的?程度如何?保险公司就是使用相对频率来解答这些问题的。
他们是根据对承保事件发生可能性的预测来设定保费的。
如果他们假定历史可以代表未来,那么他们便会试着通过观察一些特定事件之前的发生频率来算出某一特定事件的相对频率。
假设房子着火的概率为0.3%。
这意味着保险公司发现,历史数据,以及其它一些大量有关房屋的指标(比如,参考类是“在某一区域50年来的火灾数据”)显示,过去这个地区每1000套房子中有3套房子会着火。
这一概率也意味着,假定引起火灾的因素没有改变,我们可以做出合理的预测,认为未来房子发生火灾的概率也保持不变。
一家保险公司知道,每年有一定比例的保户会遇到意外。
他们不知道这会是哪些保户,但通过给许多个人提供保险,他们分散了这一风险。
虽然很难预测单个保户的出险概率,但如果把个体放在规模巨大的总体中,那么出险概率是可以预测的。
但保险商必须确保承保的事件都是独立事件,且一个事件的发生,或者多个独立事件的同时发生不会给更多的保户带来影响,从而使保险商避免在同一时间支付巨额赔偿。
例如,一家给某一街区内的许多建筑物提供火灾险的保险公司可能会因为发生一起特大火灾而面临破产的威胁。
主观概率如果某项试验无法重复进行,或者当不存在具有代表性的历史相对频率或可比数据时,那么此时的概率就是我们对某一事件发生可能性的主观预测。
我们必须使用一切可以使用的信息来做出主观评估,或者做出个人预测。
但我们并不是随意给事件安排一个数字了事。
这些主观概率必须符合概率法则。
纽约尼克斯队(New York Knicks)的一名支持者可能会说:“我相信纽约尼克斯队赢得下一场比赛的概率为90%,因为他们现在的状态一直很好。
”概率法则如果两个事件是独立事件(一个事件的发生不会影响到另外一个事件的发生概率),那么这两个事件同时发生的概率就是它们各自发生概率的乘积。
即:A事件和B事件同时发生的概率=P(A)×P(B)。
一家公司拥有两条独立的生产线。
在第一条生产线上,出现次品的概率为5%,第二条生产线上产出次品的概率为3%。
如果我们从这两条生产线上各取出一件产品,两个产品都是次品的概率有多大?答案为0.15%(即0.05×0.03)。
如果这些事件属于相关事件,那么这一法则就会有所改变。
在许多情况下,某个事件的概率依赖于另外一个事件的发生。
不同的事件之间经常是通过某一方式联系在一起的,因此,如果一个事件的发生会增加或降低其它事件的发生概率。
例如,如果我们掷骰子,A事件:掷出一个偶数,B事件:掷出一个小于4的点数,然后鉴于我们已经知道B事件已经发生,A 事件的概率就是1/3。
这被称之为条件概率,或者说一个事件的发生概率由其它事件的发生所决定。
条件概率适用于相关事件。
由B事件所确定的A事件的条件概率是1/3,因为我们知道B事件的结果可能为1、2、3,而只有2才是A事件。
在一个有两个孩子的家庭中,如果知道至少有一个是男孩,那么这个家庭的两个孩子都是男孩的概率有多大?问:这个家庭中的两个孩子的性别排列有几种可能性?都是男孩,大的是男孩小的是一个女孩,大的是女孩小的是男孩,以及都是男孩。
因为我们已经知道“至少有一个是男孩”,我们可以排除“两个都是女孩”的这一情况。
因此,这一概率为1/3,或33%。
在一个有两个孩子的家庭中,如果知道第一个出生的是男孩,那么两个都是男孩的概率有多大?这个家庭中两个孩子的性别排列可能为:都是男孩,大的是男孩小的是一个女孩,大的是女孩小的是男孩,以及都是男孩。
因为我们已经知道大一点的是男孩,因此我们可以排除“大的是女孩小的是男孩”以及“两个都是女孩”的情况。
最终得出概率为50%。
在条件概率中,有一个问题让许多数学教授们伤透了脑筋,它就是“三门问题”(Monty Hall Dilemma,也称蒙特霍问题)。
专栏作家玛莉莲·莎凡(Marilyn vos Savant)问了下面这个问题(Parade的杂志,1990年,9月9日,第13页):“假设你在一个电视节目上,主持人要求你在三个门中选择一个。
其中一个门后面是车,剩下的两个门后面是羊。
你选了一个门,记为1号门。
而这时知道门后面有什么的主持人打开了另外一扇门,记为3号门,里面是一头羊。
然后他会问你‘你想选择2号门嘛?’你是否应该改变你的选择呢?”你会怎样回答?假设我们可以随时调整我们的选择。
对可能出现的结果列出表格,看看改变选择会让你得到多少种结果。
门1 门2 门3车羊羊羊车羊羊羊车假设你选了门1。
按照车子分别位于三扇门背后,以及你是否改变自己的选择,看一下最终的结果会怎么样。
车子所在的门主持人打开门你改变了原来的选择你没有改变选择1 2 输赢2 3 赢输3 2 赢输2/3 1/3 不管车子在哪扇门后面,我们都应该改变我们最初的选择,因为这么做的话我们获胜的概率有2/3。
这一问题的关键是,我们知道在这个游戏中,主持人知道每扇门后面都有什么,并且他只会打开背后是羊的那扇门。
当两个事件是互斥事件(指不可能同时发生的事件)时,那么发生这两个事件的概率为这两个事件各自发生概率之和。
即:发生A事件或者B事件的概率=P(A)+P(B)。
如果拿一颗骰子掷一次,掷出2点或者4点的概率有多少?可能的结果有6中,而这两个事件(掷出2点和掷出4点)没有任何共性。
我们不可能同时用一颗骰子掷出2点和4点。
掷出2点的概率有多少?是1/6。
掷出4点的概率是多少?也是1/6。
因此,我们掷出2点或者4点的概率为1/6+1/6=33%。
有时候用排除法可以更为容易地计算出所要的概率。
一个事件不会发生的概率为1减去该事件发生的概率。
如果A事件可能发生的概率为30%,那么该事件不会发生的概率为70%,因为除了发生A事件外,剩下的都是“不会发生A事件”。