当前位置:
文档之家› 第二章 专家系统及其在医学的应用
第二章 专家系统及其在医学的应用
1.贝叶斯模型 1)事件及其相互关系 必然事件:在一定条件下必须出观的现 象 不可能事件:在一定条件下必然不出现 的现象。 随机事件:在一定条件下,可能出现也 可能不出现以现象叫。
“两事件A,B中至少有一个出现”也是一 事件,称此事件为A,B的和,记作AUB; 事件“A1,A2,A3,….An中至少有一出现 称为Al,A2…An的和,记为Al UA2…Un。 若“n个事件A1,A2,A3,….An都出现也 是—事件,则称为A1,A2…,An的交, 记作 A1∩A2∩…∩A n。
显然其症侯为B=B13B23B33B42B51B61B73 ,则 其P(Hj|B)(j=l,2,3,4)的大小可通过公式3-1算 得。
其中,P(B|Hj)=P(B13B23B33B42B51B61B73 |Hj) =P(B13 | Hj) P(B23 | Hj) P(B33 | Hj) P(B42 | Hj) P(B51 | Hj) P(B61 | Hj) P(B73 | Hj) (j=l,2,3) P(B|H1) =9.45×10-8 P(H1)P(B|H1)=0.351×9.45× 10-8 =3.695× 10-8 同理P(H2) P(B|H2) =5.53 × 10-5 P(H3) P(B|H3) =1.136 × 10-4
第二章 专家系统及其在医学的应用
临床诊断环节:是运用已有的医学知识对疾病的 表现进行辩证分析,得出符合逻辑的结论的过 程。其基本环节如下: 收集资料一综合分析、推理,作出诊断。 传统的疾病诊断:其综合分析、推理除了各种疾 病出现的概率只能从过去的历史资料中得来以 外,还主要依据医生的个人经验。 计量诊断:与传统的疾病诊断基本环节一致,但 其分析、推理不是凭经验,而是用一种定量的 推理模式代替,再根据—定的法则作出合理的 临床判断。称之为计算机辅助诊断。
得: P(H1|B)=0.02% P(H2|B)=32.2% P(H3|B)=67.76% 所以:诊断为阑尾炎穿孔(H3).
2、最大似然诊断模型
在前述过程中,如果假定各疾病发生的先验概率 是等同的,此时公式3-1可以简化。 P(Hj|A)的相对大小完全取决于条件概率P(A|Hj) 的相对大小,分母部分总是一致的。 这个结果表明,在先验概率相同的假设基础上, 计量决策诊断的基本判别依据,可以转化为 P(A|Hj)。 这种以条件概率 P(A|Hj)为判别依据的模式为 似然诊断模型。临床的实用中常常把似然诊断 模型进一步简化为评分法。
于是, LG1 = 0.83×(10.08)×0.54×0.83×0.79×(1-0.01)=0.27 LG2=0.83×(1-0.01) ×0.17×0.33×0.83× (1-0.01)=0.04 LG3=0.29×(1-0.18) ×0.01×0.99×0.24× (1-0.35)=0.0005 比较上面三个似然函数的大小,最大函数 为LG1,因而可以判断患者所得的病名 属于G1类:大脑前,中动脉支配区域出 血。
逐步问诊过程与基本结构
逐步问诊基本结构: 识别部分 判定部分 提问选择部分
如何选择提问:基本原则是遵循临床医 师的选挥原则,同时考虑医师问诊的习 惯,当分析结果提示某种疾病的可能性 较大时,就选择最有利于进一步肯定或 否定此可能的征候指标。 何时停止问诊作出结论:一般可采用阈 值限定法。即先给定一个阈值Q,对于第 一步,若P1(Hj|B1)<Q(j=l,2,…n)就继 续问诊,若存在H,使P1(Hj|B1)>Q就停 止问诊,并诊断为患疾病Hj。
判断实验结果 在验证实验结果时除了上述47例外,还利用了 原来没有考虑的脑干出血3例,脑干栓塞1例, 其结果见表2-8,由表可知:病理诊断为G1类 计24例,计量诊断符合20例,病理诊断为G2类 计6例,计量诊断符合4例;病理诊断为G3类计 17例,计量诊断符合16例。 若将病理诊断G1与G2合并后分为出血类 (G1+G2)和栓塞类(G3)二大类,则病理诊断 G1+G2类计30例计量诊断符合28例;栓塞17例 中符合16例;同时,3例脑于出血全部符合, 只有l例脑于栓塞误分在G1类中。
用贝叶斯模型建立专家系统的具体步骤: (1)进行选择列出疾病的各个方面的症状, 并把由各个症状所反映的互不相容的疾 病情况分别以不同的数据结构表示之。 (2) (2)收集资料统计已确诊的病例,并用程序 计算出事先概率和条件概率。 (3)确定诊断即是在已知症状的前提下,通 过运算得各种病的可能性是多少。
举例二:中风部位诊断。
– 基础资料:在因中风造成死亡的病例中选择 发作后24小时仍处于昏迷状态的47例为对象 (62岁-87岁)。 方法:在中风即刻到24小时内患者所表现的 症状中选择六项症状进行研究:
S1:呕吐 S2:陈施氏呼吸 S3:发作后血压上升到200mmHg以上 S4:单侧麻痹 S5:对光反射减弱或消失 S6:心房颤动
计算机辅助诊断: 利用机器模仿医生的智能。
利用机器模仿人类的智能即人工智能。 工智能技术在医学上的典型应用:是专家系统。 专家系统的实质就是让计算机系统代替 专家为患者诊断,换句话说就是利用机 器模仿人类专家的智能。 常用医学专家系统模型:
–基于统计学原理(Bayes) –基于模糊数学原理 –基于人工神经网络
计算机专家诊断系统的一般诊断过程是 (1)要求输入足够多的病例统计资料; (2)选用一定数学模型,确定参数和诊断(运 算)规则; (3)编制程序; (4)将诊断程序输入计算机; (5)将患者症状、体征、检查等资料用输入 计算机; (6)经运算后,屏幕显示出诊断报告并打印 出诊断结果。
2.1 基于统计模型的计算机辅助诊断
式(3-1)称为贝叶斯定理。 这里H1,H2,…Hi分别表示j种互斥的疾病; A为用于这些疾病鉴别诊断的某一临床表现或 检验结果的组合(症候); 式中P(Hj)为各疾病发生的先验概率,表示医生 在具体诊断某患者前所掌握的疾病Hi的发病情 况。 P(A|Hj)为在已知疾病Hi条件下,各症状A出现 的“条件概率”,即某临床症候A的可能性, 它可以通过收集足够数量的病例容易地得到。 P(Hj|A)称为后验概率,表示在患者症状A出 现时,患疾病Hi的可能性。
4)应用举例一、 如对某地区1207位阑尾炎 思考的资料统计为表3—1。按慢性阑尾炎、 急性阑尾炎、阑尾炎穿孔三类统计症候频 率(腹痛开始部位、恶心呕吐、大便、体温、 体征及体检结果)。
– 若已知慢性阑尾炎H1、急性阑尾炎H2、阑尾 炎穿孔H3发生的先验概率分别为: P(H1)=0.391 P(H2)=0.493 P(H3)=0.116 –现有一阑尾炎患者、开始上腹痛,之后呕吐, 腹泻,人院体温37℃.全身腹肌紧张,压痛, WBC(白细胞)数达19350。
对于两个或更多个症状存在的情况,仍 可用贝叶斯(Bayes)公式计算。在各个症 状彼此独立前提下,则各个症状同时出 现的概率是各自单独出现时其概率的乘 积。因此假设各症状互相独立,贝问题:
(1)模型中j种疾病互斥,先验概率之和要为l(即要 构成一个完整的疾病群)。 (2)先验概率的确定。参考文献报道和历史资料 统计频率作为近似估计。 (3)条件概率的确定。 (4)用于鉴别诊断的症候指标是互相独立无关的。 (5)当计算出各后验概率P(Hj|A)后,作为临床判 断的依据只有当P(Hj|A)(j=l,2,…,n)间差 距达五倍以上时方可下结论,或是当某一后验 概率值达0.85才下结论。
贝叶斯逐步问诊模型就是仿效这种过程, 进行逐步提问和逐步分析的计量诊断模 型。
贝叶斯逐步问诊模型的特点是把第K-1步 的验后概率作为第K步的先验概率,逐次 递推。其公式的一般形式为:
其中Bk =B1u1B2u2…Bkuk. 。当k=1时,有P0(Hj|B0) B B k 1 P =P(Hj) 与贝叶斯公式相比,这里的Pk-1(Hj|Bk-1)就相当于 “先验概率”,但在第k-1步公式中的Pk-1(Hj|Bk-1) 又是验 后概率 。贝叶 斯逐步 向诊模 型就是 以Pk(Hj|Bk-1)为“桥梁”进行递推的。 1
专家诊断系统程序一般为四个模块。
(1)输入模块。输入模块包括编码、查错、人机对 话; (2)辩证模块。辩证模块包括分类、建立判别树、 确定相关强度、综合评判;组方模块包括分类、 交错症侯评判、组方; (3)随症加减模块。随症加减模块包括分类、建立 。随症加减模块包括分类、建立 子模块、子模块管理; (4)汉字输出模拟。汉字输出模拟包括建立汉字 代码、汉字数据文件及汉字输出程序的数字模 型采用“加权求和”和“浮动阈值”法。
–
– 诊断疾病分类:
G1:大脑前、中动脉支配区域的出血与下丘脑出 血 G2:小脑出血与蛛网膜下腔出血 G3:大脑中动脉支配区域的栓塞
– 诊断表编制步骤:
对47例病人按G1,G2,G3三类分组,计算出各组 内每一症状出现的频率。由于标本数不太多,所 以症状出现率为。时以0.01表示,出现率为1时 以0.99表示。 某患者出现的症状为S1,S3,S4,S5,而S2和S6 症状没有出现,根据表2-7可分别计算出该患者 分属三类的似然函数。
3、贝叶斯专家诊断系统设计实现 贝叶斯模型与传统医生诊断的差异
–贝叶斯条件概率决策诊断模型及最大似然诊 断模型使用时必须预先知道所规定的全部征 候表现,然后再进行综合分析、判断。 –临床医师的诊断过程常是根据已掌握的病人 的临床表现,结合自己的知识与经验进行分 析、判断和逐步问诊、检查后再分析及再判 断,直至有足够把握作出结论。
2)概率与频率 可用—个小于或等于1的正数P(A)来表示 事件A出现的可能性,较大的可能性用较 大的数字来标志,较小的就用较小的数 字。这样P(A)就称为事件A的概率。 当概率值不易求出时我们往往取频率作 为概率的近似值,频率的概念比较简单 可以很方便地求出。
3)贝叶斯定理 有时除了要知道事件的概率P(A)外,还需 要知道在“事件B已出现”的条件下,事件 A出现的条件概率P(A|B)。例如,我们 需要知道在某疾病B发生条件下,症状A出 现的概率时就要计算条件概率P(A|B)。