当前位置:
文档之家› 生物信息学原理与方法-第九讲 蛋白质序列分析与预测
生物信息学原理与方法-第九讲 蛋白质序列分析与预测
1-15PepSea -由Protana, Denmark提供的从肽质谱和肽序列识别 蛋白质。
1-16PeptideSearch -由EMBL Heidelberg提供的肽质谱识别工具。
1-17ProteinProspector -由UCSF提供的多种质谱分析工具。
1-18PROWL -由Rockefeller和NY Universities提供蛋白质化学性 质及质谱仪资源。
1-4 PeptIdent –以肽指纹数据识别蛋白质、等电点、实验测定的分子量、 以Swiss-Prot中所有蛋白质的理论肽来比较使用者指定的肽质谱,提 供数据库的注释。
1-5 TagIdent以等电点、分子量和序列特征识别蛋白质,并检出与所给等 电点和分子量最接近的蛋白质序列列表。
1-6 FindMod –预测可能的蛋白质翻译后修饰及肽中单个氨基酸可能被 取代。将实验测定的肽质谱与指定的Swiss-Prot序列中的理论肽或用 户输入的序列作比较,质谱的差异以作出更佳的蛋白质特征描述。
结构。
6-6SOSUI -预测跨膜区。 6-7TMAP – 基于多序列比对的跨膜区预测。 6-8TMHMM -预测蛋白质的跨膜螺旋。 6-9TMpred -预测蛋白质的跨膜区及蛋白质方向。 6-10TopPred 2 -膜蛋白的空间结构预测。
7.Primary structure analysis 一级结构分析
1-11PeptideCutter –由所提供的蛋白质序列来预测可能的蛋 白酶剪切位点或化学剪切位点。
1-12IsotopIdent –预测肽、蛋白质、多核苷酸或化学组成的 理论同位分布
1-13PepMAPPER-由英中的UMIST提供的肽质谱分析工具。
1-14Mascot –由Matrix Science Ltd.,提供的序列搜索、MS/MS 离子及肽质谱识别。
1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨 基酸或两氨基酸突变。
1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。
2.DNA -> Protein 将DNA序列 翻译成蛋白质序列
2-1Translate - 将DNA序列翻译成蛋白质序列。
2-2Transeq – 使用EMBOSS 软件包将DNA序列翻译 成蛋白质序列。
7-112ZIP -亮氨酸拉链的预测。 7-12PESTfind –PEST区域的预测。 7-13HLA_Bind –预测MHC type I (HLA) peptide binding。 7-14SYFPEITHI -预测MHC type I and II peptide binding。 7-15ProtScale –氨基酸比例图(疏水性及其相关参数等) 7-16Drawhca –蛋白质序列疏水性聚类分析HCA (Hydrophobic
6.Topology prediction 空间结构预测
6-1PSORT – 预测蛋白质次细胞的位置。 6-2TargetP -预测蛋白质次细胞的位置。 6-3DAS -利用Dense Alignment Surface法预测原核
生物的跨膜区。
6-4HMMTOP -预测蛋白质的跨膜螺旋及空间结构。 6-5PredictProtein -预测蛋白质的跨膜螺旋及空间
1.Protein identification and characterization 蛋白质识别与特证描述
1-1 AACompIdent - 以氨基酸组织识别蛋白质
1-2 AACompSim -比较Swiss-Port条目与其他条目的差异
1-3 MultiIdent -以等电点、分子量、氨基酸组成、序列特征及肽指纹数 据识别蛋白质。
8. Secondary structure prediction 二级结构预测
8-1 AGADIR – 预测肽链螺旋结构算法。 8-2 APSSP –高级蛋白质二级结构预测服务器。 8-3 GOR – Garnier1996年开发的蛋白质二级结构预测。 8-4 HNN – 神经网络方法预测蛋白质二级结构。 8-5 Jpred –趋同法预测蛋白质二级结构。 8-6 JUFO –神经网络法从序列预测蛋白质二级结构。 8-7 nnPredict -蛋白质二级结构预测。 8-8 PredictProtein -蛋白质二级结构预测。 8-9 Prof –利用Cascaded Multiple Classifiers进行蛋白质
7-1ProtParam -蛋白质序列的物化性质分析(氨基酸、原子组 成、等电点….等)
7-2Compute pI/Mw -以Swiss-Prot或TrEMBL条目或用户的序 列计算理论的等电点和分子量。
7-3MW, pI, Titration curve –计算等电点及组成并可见其滴 定曲线图。
DNA序列搜索。 4-5 Pfam HMM search-在Washington University及Sanger Centre对Pfam数据库
进行搜索。
4-6 FingerPRINTScan - 对PRINTS 数据库进行蛋白质指纹搜索。 4-7 FPAT - 蛋白质数据库中的表达搜索。 4-8 PRATT - EBI 及ExPASy的识别蛋白质保守模式 4-9 PPSEARCH - EBI的对PROSITE进行序列搜索。 4-10 PROSITE scan – PBIL的对PROSITE进行序列搜索。 4-11 PATTINPROT - 在PBIL搜索一段蛋白质序列或蛋白质数据库中的模式。 4-12 SMART – EMBL的简单分子结构研究工具。 4-13 TEIRESIAS - IBM的从不匹配的(unaligned)蛋白质或DNA序列生成蛋白
Cluster Analysis)点阵图 7-17Protein Colourer –给氨基酸序列着色工具 7-18Three To One –将三码的氨基酸序列转换成一码氨基酸序
列工具。
7-19Colorseq –将所选择的蛋白质序列以红色突出。 7-20HelixWheel / HelixDraw –用蛋白质片段表示环状螺旋结构 7-21 RandSeq –随机蛋白质序列生成器
6.Topology prediction 空间结构预测 7.Primary structure analysis 一级结构分析 8. Secondary structure prediction 二级结构预测 9.Tertiary structure 三级结构预测 10. Sequence alignment 序列比对(已讲) 11. Biological text analysis 生物学文本分析(不讲)
4.Pattern and profile searches 模式的搜索
4-1 InterPro Scan - 在PROSITE, Pfam, PRINTS及其他家族和功能域数据库中集 成检索。
4-2 ScanProsite - 对PROSITE或Swiss-Prot 和TrEMBL的模式序列进行搜索。 4-3 MotifScan - 对蛋白质模式数据库中的序列(包括PROSITE)进行搜索。 4-4 Frame-ProfileScan -对蛋白质模式数据库中的序列(包括PROSITE)进行短的
7-4REP –搜索蛋白质重复片段。 7-5REPRO –检测蛋白质序列的重复片段。 7-6 Radar -检测蛋白质序列的重复片段。 7-7SAPS –蛋白质序列的统计学分析。 7-8Coils –蛋白质的卷曲预测。 7-9Paircoil –蛋白质两级卷曲螺旋预测。 7-10Multicoil –蛋白质两级或三级卷曲螺旋预测。
2-3Graphical Codon Usage Analyser –以图形方式显 示密码子偏向性
2-4BCM search launcher – 以六种框架翻译DNA序 列
2-5Backtranslation – 将蛋白质序列翻译成DNA序列
2-6Genewise – 比较蛋白质序列与基因组的DNA序 列,允许内含子和读框错误
质模式。
4-14 Hits – 蛋白质序列与motifs的关系。
5.Post-translational modification prediction 翻译后修饰预测
5-1 ChloroP - 叶绿体转换肽的预测。 5-2 LipoP - Gram阴性细菌脂蛋白质和信号肽的预测 5-3 MITOPROT – 预测线粒体的目标序列。 5-4 PATS –预测apicoplast的目标序列 5-5 PlasMit- 预测Plasmodium falciparum的线粒体转换肽 5-6 Predotar –预测线粒体和质体的目标序列 5-7 PTS1 –预测peroxisomal targeting signal 1 containing proteins 5-8 SignalP – 预测信号肽剪工切位点。 5-9 NetOGlyc – 预测哺乳动物粘蛋白的糖化位点。 5-10NetNGlyc – 预测人类N型蛋白质糖化位点。 5-11DictyOGlyc – 预测粘菌O型蛋白质糖化位点。 5-12YinOYang - 真核生物蛋白质序列的O-beta-GlcNAc的粘附位点。 5-13big-PI Predictor -预测GPI的修饰位点 5-14DGPI - 预测GPI的锚合点和剪刀切位点(鏡像站)。 5-15NetPhos - 预测真核生物蛋白质上Ser, Thr 及 Tyr phosphorylation位点。 5-16NetPicoRNA - 预测picornaviral proteins上蛋白质剪切位点。 5-17NMT –预测N-terminal N-myristoylation 5-18Sulfinator – 预测酪胺酸硫化位置。 5-19 SUMOplot – 预测SUMO蛋白质附着位置。
3-1 BLAST 3-2 Bic ultra -Smith/Waterman序列搜索 3-3MPsrch - EBI的Smith/Waterman序列比对。 3-4DeCypher – Smith/Waterman序列搜索 3-5Fasta3 – EBI的FASTA version 3 3-6FDF - Smith/Waterman序列搜索 3-7PropSearch –使用氨基酸组成来进行结构同源搜索。