当前位置:
文档之家› 三利用聚类算法的结果分析蛋白质互作网络
三利用聚类算法的结果分析蛋白质互作网络
三
利用聚类算法的结果分析蛋白质互作网络
研究对象:酵母蛋白质互作网络。2617个节点。11855个互作。连通子图是 2375个节点。 利用P值方法预测76个未知蛋白质的功能。
我们的方法:同样的网络,利用small community的理论,寻找这个网络中的 蛋白质功能模块。 已知节点
未知节点
已知community 未知community 利用2种预测算法对未知节点进行功能预测. 预测了其中56个未知蛋白质的功能. 与以前的预测互补.
3 Markov clustering. 2002年. Enright等 提出.将一个网络的邻 接矩阵转换为一个随机矩阵。然后重复如下步骤进行聚类: Expansion。 Inflation。
4 Density-perriphery based clustering .由Altaf-UI-Amin等于 2006年提出。这是一种贪心算法。一个cluster进行增长,以 达到一个密度值,这个值位于一个特定的阈值之上。 5 Molecular Complex Detection.由Bader和Hogue于2003年提 出。是首个对互作进行聚类的算法。也是从一个种子节点进行 贪心增长。Mcode对每个节点以这个节点的“k-core”邻居的 密度赋予权值。赋值最高的节点作为种子。邻居节点基于其权 值被加入。 6 Spectral Clustering
二
生物学蛋白质功能注释
01表示METABOLISM。 01.01表示 amino acid metabolism。即更多的分级表示更加细化的功能分类。
一个蛋白质可以具有一种功能。也可以具有多个功能。例如: YAL003w这个蛋白质只具有一种功能:12.04.02。 YAL009w具有三种功能:10.03.02,42.10和 43.01.03.09。
对另外的酵母中的3个蛋白质互作网络进行聚类分析. 结果还在整理中.
ቤተ መጻሕፍቲ ባይዱ
谢谢!
姓名:詹科 导师:李昂生 研究员 研究方向:复杂网络
摘要
• • • 生物信息学聚类算法介绍 生物学蛋白质功能注释 利用聚类算法的结果分析蛋白质互作网络
一 生物信息学聚类算法介绍
高通量的生物学实验产生大量的蛋白质互作数据. 如何从从这些实验数据 中挖掘有用的信息以给生物学实验提供线索? 已经存在的方法之一是对网络进行聚类分析. 存在6种生物信息学聚类算法: 1 Network Blast。既可以对多个网络进行比对,也可以对单个网络进行聚类. 算法控制一个cluster包含的最大节点数是15。最后由程序筛选以删除高度重 合的clusters。 2 Clique Finder。 2006年由Adamcsek等提出。