当前位置:文档之家› (生物信息学课件)第9讲生物信息学的计算机、统计学及数学基础

(生物信息学课件)第9讲生物信息学的计算机、统计学及数学基础

模式识别主要有两种方法:
根据对象的统计特征进行识别, 根据对象的结构特征进行识别
反馈
环境
学习
知识库
执行
机器学习系统的基本结构
4、数据库技术及数据挖掘
数据库技术
数据仓库 虚拟数据库技术(Virtual Database,简称 VDB)
数据挖掘(data mining)
又称作数据库中的知识发现 (Knowledge Discovery in Database),它是从数据库或数据仓库中发现并提 取隐藏在其中的信息的一种新技术,它能自动分析数 据,对它们进行归纳性推理和联想,寻找数据间内在 的某些关联,从中发掘出潜在的、对信息预测和决策 行为起着十分重要作用的模式
标准的BP网由三层神经元组成:输入层、隐 藏层和输出层
隐藏层






反向传播神经网络结构示意
6、专家系统
专家系统(Expert System)是一种基于知识 的智能系统,它将领域专家的经验用一定的知 识表示方法表示出来,并放入知识库中,供推 理机使用
知识库是专家系统的第一重要组成部分,知识 库中的知识通常分为两类:
1、数学统计方法
生物活动常常以大量、重复的形式出现,既受 到内在因素的制约,又受到外界环境的随机干 扰。因此概率论和数学统计是现代生物学研究 中一种常用的分析方法
数据统计、因素分析、多元回归分析是生物学 研究必备的工具
隐马尔科夫模型(Hidden Markov Models)在 序列分析方面有着重要的应用。与隐马尔科夫 模型相关的技术是马尔科夫链(Markov Chain)
数据挖掘过程一般分为4个基本步骤:数据选择、数据 转换、数据挖掘和结果分析
5、人工神经网络技术
人工神经网络(Artificial Neural Network, 简称ANN)是通过模拟神经元的特性,以及脑 的大规模并行结构信息的分布式和并行处理等 机制建立的一种数学模型
在生物信息学中,使用得最多的是反向传播神 经网络(Back Propagation Neural Network, 简称BP网)。BP网被认为是稳定性和鲁棒性较 强的人工神经网络之一,而且属于有监督学习 的网络模型。
一类领域的事实性知识或广泛公用的知识 另一类是启发性知识,是该领域专家在长期研究和
实践过程中积累起来的经验总结
知识获取方式大致上可以分为两种:
一种是由知识工程师向领域专家询问有关知识,经 过整理编辑后将知识转换成计算机表示形式,送入 知识库
另一种是针对大量数据进行机器学习,分析、总结 和抽取出有用的新知识,这是更高层次的知识获取 方式。
专家系统的另一个重要部分是推理机,由它来 控制和协调整个系统,并根椐当前输入的数据 和知识,按一定的推理策略,去解决当前的问 题,推导出结论
领域专家 用 户
AI专家
使用界面 知识库
知识获取 推 理 机 解释机构
知识库
数据学基础
主讲: 王元茂
一、所用的方法和技术汇总
1、数学统计方法 2、动态规划方法 3、机器学习与模式识别技术 4、数据库技术及数据挖掘 5、人工神经网络技术 6、专家系统 7、分子模型化技术 8、量子力学和分子力学计算 9、生物分子的计算机模拟 10、因特网(Internet)技术
机器学习
机器学习是模拟人类的学习过程,以计算机为工具 获取知识、积累经验
1、遗传算法采用随机搜索方法,具有自适应能力和便于 并行计算
2、神经网络的理论是基于人脑的结构,其目的是揭示一 个系统是如何向环境学习的,这一种方法被称为联接主义。
模式识别
模式识别是机器学习的一个主要任务。模式是对感 兴趣客体定量的或者结构的描述,而模式识别就是 利用计算机对客体进行鉴别,将相同或者相似的客 体归入同种类别中
2、动态规划方法
动态规划(Dynamic Programming) 是一种解决多阶段决策过程的最优化方 法或复杂空间的优化搜索方法
动态规划解决问题的基本过程是:将一 个问题的全局解分解为局部解,逆序递 推求出局部最优解,随着执行过程的推 进,“局部”逐渐接近“全局”,最终 获得全局最优解
3、机器学习与模式识别技术
相关主题