概率论与数理统计在数学建模中的应用
——国 冰
。 第一节 概率模型 一、初等概率模型 初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型
等三类问题: 1、复合系统工作的可靠性问题的数学模型 设某种机器的工作系统由N个部件组成,各部件之间是串联的,即只要有一个部件失灵,整个系统就不能正常工作.为了提高系统的可靠性,在每个部件上都装有主要元件的备用件及自动投入装置(即当所使用元件损坏时,备用元件可自动替代之而开始工作)明显地,备用件越多,整个系统正常工作的可靠性就越大. 但是,备用件过多势必导至整个系统的成本、重量和体积相应增大,工作精度也会降低. 因此,配置的最优化问题便被提出来了:在某些限制性条件之下,如何确定各部件的备用件数量,使整个系统的工作可靠性最大? 这是一个整体系统的可靠性问题.我们假设第i个部件上装有ix个备用件(1,2,,)iN,此时该部件正常工作的概率为()ipx,那么整个系统正常工作的可靠度便可用
1()niippx (9.1)
来表示. 又设第i个部件上的每个备用件的费用为iC,重量为iW,并要求总费用不超过C,总重量不超过W,则问题的数学模型便写成为
1max()niippx (9.2) 11..,1,2,NiiiNiiiicxcstwxcxNiN
问题的目标函数为非线性的,决策变量取整数,属于非线性整数规划问题。 2、传染病流行估计的数学模型 问题分析和模型假设 本世纪初,瘟疫还经常在世界的某些地方流行。被传染的人数与哪些因素有关?如何预报传染病高潮的到来?为什么同一地区一种传染病每次流行时,被传染的人数大致不变?科学家们建立了数学模型来描述传染病的蔓延过程,以便对这些问题做出回答。 这里不是从医学角度探讨每一种瘟疫的传染机理,而是利用概率论的知识讨论传染病的蔓延过程。 假定人群中有病人或更确切地说是带菌者,也有健康人,即可能感染者,任何两人之间的接触是随机的,当健康人与病人接触时健康人是否被感染也是随机的. 问题在于一旦掌握了随机规律,那么如何去估计平均每天有多少健康人被感染,这种估计的准确性有多大? 给出以下假设 (1)设人群只分病人和健康人两类,病人数和健康人数分别记为i和s,总数n不变,即 isn (9.3) (2)人群中任何二人的接触是相互独立的,具有相同概率p,每人每天平均与m人接触; (3) 当健康人与一病人接触时,健康人被感染的概率为。 模型建立求解 由假设(2)知道一个健康人每天接触的人数服从(1,)bnp,且平均值是m,则 (1)mnp 于是 (1)mpn (9.4) 又设一健康人被一名指定病人接触并感染的概率为1p,则由假设3及(9 .4)式得
11mppn
(9.5)
那么一健康人每天被感染的概率2p为
211(1)1(1)1iimppn (9.6)
由于健康人被感染的人数服从2(,)bsp,其平均值为 22()spnip (9.7) 标准差为
2222(1)()(1)sppnipp (9.8) 注意,通常,1nmn,取(9.6)式右端展开式的前两项,有
21(1)mimipnn (9.9)
最后得到 ()minin (9.10)
22
1()()pnminipmini
(9.11)
(9.10)式给出了健康人每天平均被感染的人数与n、i、m、的关系,(9.11)式为变异系数,可看作对平均值的相对误差的度量。
二、随机性决策模型 所谓行为决策理论,就是用行为科学的观点和方法,对决策活动进行描述,解释和预测的一种理论。 它以人的决策行为作为基本要素,以自然科学的实证方法作为主要手段,归纳出一套建立在经验证据基础上的理论观点,拓展了决策论的研究范围。 合理的决策必须具备三个条件: (1)目标合理; (2)决策结果满足预定目标的要求; (3)决策本身符合效率、满意、有限合理、经济性的原则。 所谓风险型决策是指在作出决策时,往往有某些随机性的因素影响,而决策者对于这些因素的了解不足,但是对各种因素发生的概率已知或者可估算出来,因此这种决策存在一定的风险. ① 风险决策模型的基本要素 决策者——进行决策的个人、委员会或某个组织.在问题比较重大和严肃时,通常应以后者形式出现. 方案或策略——参谋人员为决策者提供的各种可行计划和谋略. 如渔民要决定出海打鱼与否便是两个方案或称两个策略. 准则——衡量所选方案正确性的标准.作为风险型决策,采用的比较多的准则是期望效益值准则,也即根据每个方案的数学期望值作出判断.对收益讲,期望效益值越大的方案越好;反之对于损失来讲,期望效益值越小的方案越好. 事件或状态——不为决策者可控制的客观存在的且将发生的自然状态称为状态(事件),如下小雨,下大雨和下暴雨即为三个事件或称三种状态,均为人所不可控因素. 结果——某事件(状态)发生带来的收益或损失值. ② 风险决策方法 利用树形图法表示决策过程具有直观简便的特点,将其称为决策树的方法. 充分利用灵敏度分析(即优化后分析)方法对决策结果作进一步的推广和分析. 决策树一般都是自上而下的来生成的。 选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。 从根到叶子节点都有一条路径,这条路径就是一条“规则”。 决策树可以是二叉的,也可以是多叉的。 对每个节点的衡量: 1) 通过该节点的记录数 2) 如果是叶子节点的话,分类的路径 3) 对叶子节点正确分类的比例。 有些规则的效果可以比其他的一些规则要好。 决策树对于常规统计方法的优点。 构造好的决策树的关键在于如何选择好的逻辑判断或属性。对于同样一组例子,可以有很多决策树能符合这组例子。人们研究出,一般情况下或具有较大概率地说,树越小则树的预测能力越强。要构造尽可能小的决策树,关键在于选择恰当的逻辑判断或属性。由于构造最小的树是NP-难问题,因此只能采取用启发式策略选择好的逻辑判断或属性。下面我们利用一个例题来说明如何来建立风险决策模型。 例1、天龙服装厂设计了一款新式女装准备推向全国。如果直接大批量生产与销售,主观估计成功与失败的概率各为0.5,其分别的获利为1200万元与-500万元,如取消生产销售计划,则损失设计与准备费用40万元。为稳妥起见,可先小批量生产试销,试销的投入需45万元。据历史资料与专家估计,试销成功与失败的概率分别为0.6与0.4,又据过去情况,大批生产销售为成功的例子中,试销成功的占84%,大批生产销售失败的事例中,试销成功的占36%。试根据以上数据,通过建立决策树模型按期望值准则确定最优决策。 解答:本题显然是要考核风险性决策模型的建立能力。按照这类模型的建立思路,我们有: 问题分析与模型假设 1. 问题涉及直接大批量生产与销售、取消生产销售计划和小批量试销售这样三个决策方案的取舍,在每种方案下又分为成功或失败两种结果; 2. 决策目标在表面上看是获利大小,实际上是要决定试销与否; 3. 尚需注意后面几句话:“大批生产销售为成功的例子中,试销成功的占84%,大批生产销售失败的事例中,试销成功的占36%”,这意味着要计算两个概率,其一是当试销成功时,大批量销售成功与失败的概率;其二是试销失败情况下,大批量销售成功与失败的概率,这意味着要利用贝叶斯概率公式; 4. 设定以下变量 A--试销成功,则A--试销失败; B--大量销售成功,则B--大量销售失败。 模型建立求解 1.先来计算两个概率,注意到,36.0)/(,6.0)(,84.0)/(BAPBPBAP代入
贝叶斯概率公式 )()/()()/()()/()/(BPBAPBPBAPBPBAPABP ,78.04.036.06.084.06.084.0 从而.22.0)/(ABP即当试销成功时,大批量销售成功与失败的概率分别为0.78和0.22. 同理可以算出在试销失败情况下,大批量销售成功与失败的概率分别为0.22和0.78. 2. 以试销与否作为决策思路,先画一方块“囗”称为决策结点,由决策结点向右引出若干条直线表示不同的策略(方案)称为策略分枝,策略分枝的右端画一个圆圈“○”称为状态结点,由它引出表示不同状态及其发生的概率的分枝称为概率分枝,最后在概率分枝的终点画“△”符号表示这一分枝的最终结果的效益值(期望值),正值表收益,负值表示损失.本例对应的决策树如图(见图-2):
试销 -45万 成功0.6 失败0.4 不试销 大量销售
大量销售 大量销售
取消销售
取消销售 取消销售
成功0.78 成功0.22 成功0.5 失败0.78
失败0.22
失败0.5 1200万
-500万 -40万
1200万
-500万 -40万
1200万
-500万 -40万 图--2