当前位置:文档之家› 技术扩散模型

技术扩散模型

技术扩散模型 一、贝叶斯模型 (一)、提出理论

托马斯•贝叶斯(Thomas Bayes) ,英国数学家.1702年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1763年4月7日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献.1763年发表了这方面的论著,对于现代概率论和数理统计都有很重要的作用。贝叶斯的另一著作《机会的学说概论》发表于1758年。贝叶斯所采用的许多术语被沿用至今。

(二)、模型的主要内容及假设

贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。 贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。

贝叶斯推理的问题是条件概率推理问题,这一领域的探讨对揭示人们对概率信息的认知加工过程与规律、指导人们进行有效的学习和判断决策都具有十分重要的理论意义和实践意义。

贝叶斯决策法是最常见的以期望为标准的分析方法。它是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。 贝叶斯定理也称贝叶斯推理,早在18世纪,英国学者贝叶斯(1702~1761)曾提出计算条件概率的公式用来解决如下一类问题:假设H[,1],H[,2]„互斥且构成一个完全事件,已知它们的概率P(H[,i],i=1,2,„,现观察到某事件A与H[,1],H[,2]„相伴随而出现,且已知条件概率P(A/H[,i]),求P(H[,i]/A)。 1、重点 是一种以动态模型为研究对象的时间序列预测方法,在做统计推断时,一般模式是:

先验信息+总体分布信息+样本信息→后验分布信息 可以看出贝叶斯模型不仅利用了前期的数据信息,还加入了决策者的经验和判断等信息,并将客观因素和主观因素结合起来,对异常情况的发生具有较多的灵活性。这里以美国1960—2005年的出口额数据为例,探讨贝叶斯统计预测方法的应用。 贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想是:

已知类条件概率密度参数表达式和先验概率 利用贝叶斯公式转换成后验概率 根据后验概率大小进行决策分类

(三)、 工具 1、贝叶斯公式(发表于1763年):

可以解释为: 设D1,D2,„„,Dn为样本空间S的一个划分,如果以P(Di)表示事件Di发生的概率,且P(Di)>0(i=1,2,„,n)。对于任一事件x,P(x)>0,则有

2、贝叶斯法则,是关于随机事件A和B的条件概率和边缘概率的。

其中L(A|B)是在B发生的情况下A发生的可能性。 在贝叶斯法则中,每个名词都有约定俗成的名称: Pr(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。

Pr(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。

Pr(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。 Pr(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。 Bayes法则可表述为:

后验概率 = (相似度 * 先验概率)/标准化常量 也就是说,后验概率与先验概率和相似度的乘积成正比。 另外,比例Pr(B|A)/Pr(B)也有时被称作标准相似度(standardised likelihood),Bayes法则可表述为:

后验概率 = 标准相似度 * 先验概率

(四)、结论 贝叶斯决策属于风险型决策,决策者虽不能控制客观因素的变化,但却可掌握其变化的可能状况及各状况的分布概率,并利用期望值即未来可能出现的平均状况作为决策准则。由于决策者对客观因素变化状况的描述不确定,所以在决策时会给决策者带来风险。

但是完全确定的情况在现实中几乎不存在,贝叶斯决策不是使决策问题完全无风险,而是通过其他途径增加信息量使决策中的风险减小。由此可以看出,贝叶斯决策是一种比较实际可行的方法。

贝叶斯(Bayes)提出了先验概率和后验概率的概念:可以根据新的信息对先验概率加以修改从而得出后验概率。因此,贝叶斯理论被用于将新信息结合到分析当中。

(五)、后续 自1950年代以来,贝叶斯理论和贝叶斯概率通过考克斯定理, Jaynes的最大熵原理以及荷兰书论证得到了广泛的应用。在很多应用中,贝叶斯方法更为普适,也似乎较频率概率能得出更好的结果。贝叶斯因子也和奥卡姆剃刀一起使用。数学应用请参看贝叶斯推论和贝叶斯定理。

有些人将贝叶斯推论视为科学方法的一种应用,因为通过贝叶斯推论来更新概率要求从对于不同假设的初始信任度出发,采集新的信息(例如通过做试验),然后根据新的信息调整原有的信念。调整原有的信念可以意味着(更加接近)接受或者推翻初始的假设。

贝叶斯技术最近被应用于垃圾邮件的过滤上。贝叶斯垃圾邮件过滤器采用电子邮件的一个参考集合来定义什么最初被认为是垃圾邮件。定义了参考之后,过滤器使用参考中的特点来将新的邮件判定为垃圾邮件或有效邮件。新电子邮件作为新的信息出现,并且如果用户在垃圾邮件和有效邮 件的判定中发现错误,这个新的信息会更新初始参考集合中的信息,以期将来的判定可以更为精确。

二、博弈模型

(一)、提出理论

在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。

(二)、模型的主要内容及假设

博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈。

1、“囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠诚,则背叛者将无罪释放(收益为T);坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为RSP)。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益TRPS>>>R小于他选择背叛得到的收益T;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 SP

可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同 时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。

自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

说明,还有其他的动力学机制激励一般所认为的自私的个体认识到合作的重要性。为了揭示这种潜在的演化机制,有人提出了“针锋相对”演化规则,采用“去输存赢”策略,改进囚徒困境中的两难结局。

2、“雪堆”博弈模型 “雪堆”博弈又称为“鹰鸽”博弈或者“小鸡”博弈(Chicken Game),是另一类两人对称博弈模型,描述了两个人相遇时是彼此合作共同受益,还是彼此欺骗来相互报复。它揭示了个体理性和群体理性的矛盾对立。可以这样来描述雪堆博弈:在一个风雪交加的夜晚,两人相向而来,被一个雪堆所阻,假设铲除这个雪堆使道路通畅需要的代价为c, 如果道路通畅则带给每个人的好处量化为b。如果两人一齐动手铲雪,则他们的收益为;如果只有一人铲雪,虽然两个人都可以回家,但是背叛者逃避了劳动,它的收益为,而合作者的收益为;如果两人都选择不合作,两人都被雪堆挡住而无法回家,他们的收益都为。这里假设收益参数满足下面的条件:TR。雪堆模型与囚徒困境不同的是,遇到背叛者时合作者的收益高于双方相互背叛的收益。因此,一个人的最佳策略取决于对手的策略:如果对手选择合作,他的最佳策略是背叛;反过来,如果对手选择背叛,那么他的最佳策略是合作。这样合作在系统中不会消亡,而与囚徒困境相比,合作更容易在雪堆博弈中涌现。 /2Rbc=−Tb=Sbc=−0P=SP>>>

说明,还有其他的动力学机制激励一般所认为的自私的个体认识到合作的重要性。为了揭示这种潜在的演化机制,有人提出了“针锋相对”演化规则,采用“去输存赢”策略,改进囚徒困境中的两难结局。

3、“雪堆”博弈模型 “雪堆”博弈又称为“鹰鸽”博弈或者“小鸡”博弈(Chicken Game),是另一类两人对称博弈模型,描述了两个人相遇时是彼此合作共同受益,还是彼此欺骗来相互报复。它揭示了个体理性和群体理性的矛盾对立。可以这样来描述雪堆博弈:在一个风雪交加的夜晚,两人相向而来,被一个雪堆所阻,假设铲除这个雪堆使道路通畅需要的代价为c, 如果道路通畅则带给每个人的好处量化为b。如果两人一齐动手铲雪,则他们的收益为;如果只有一人铲雪,虽然两个人都可以回家,但是背叛者逃避了劳动,它的收益为,而合作者的收益为;如果两人都选择不合作,两人都被雪堆挡住而无法回家,他们的收益都为。这里假设收益参数满足下面的条件:TR。雪堆模型与囚徒困境不同的是,遇到背叛者时合作者的收益高于双方相互背叛的收益。因此,一个人的最佳策略取决于对手的策略:如果对手选择合作,他的最佳策略是背叛;反过来,如果对手选择背叛,那么他的最佳策

相关主题