第十章 药物生物信息学
第五节 常用生物软件
一,Primer Premier5.0
Primer Premier5.0是由加拿大的 Premier公司开发的专业用于PCR或测序 引物以及杂交探针的设计,评估的软件 可以进行引物设计窗口,酶切分析,基 元分析(Motif)
二,DNAStar
可以进行ORF的寻找,酶切位点分析, 同源序列比对等分析
生物信息学就是在上述背景下发展起来 的综合应用生物学,数学,物理学,信 息学,计算机科学等诸多学科的理论方 法的崭新交叉学科,它研究的材料是生 物学数据库,而采用的方法则是从计算 机技术衍生而来的 基因组学和生物信息学的研究也改变了 新药开发的思路和模式
对基因组计划产生的核酸序列分析一方 面可以从本质上认识疾病尤其是遗传疾 病的发生原因,为这些疾病的诊断,预 防和治疗奠定基础 这些核酸序列本身就是丰富的药物资源, 其中蕴藏着大量目前尚不明了的基因, 这些基因及其产物可以作为潜在的药物 或者药物靶点而开发 药物生物信息学正是在在这种背景和思 路下应运而生的
Heller用基因芯片来检测类风湿关节炎病 理组织和正常组织基因表达的差异 发现了已知的100多个与类风湿关节炎致 病有关的基因表达差异 发现编码IL-6和另外几个金属蛋白酶(包 括金属弹性蛋白酶)的基因表达得到增 强 弹性蛋白酶可以破坏胶原纤维和组织基 底膜层,就为治疗该病提供了新的药物 靶标
第二节 核酸序列数据库
6. 生物芯片
生物芯片的实质就是在一个不大的基质 载体上,有序地排列了固定在某一位置 的可寻址的识别分子,与待检测的物质 结合或反应是在同一条见下进行的 常见的芯片有基因芯片和蛋白质芯片 基因芯片应用在新药研究中,据计算, 传统的药物筛选方法每个样本需要花4美 元,而用芯片技术只需要花40美分
基因芯片测序原理
八,TRRD
真核生物转录调控数据库 网址:www.bionet.nsc.ru/trrd
九, COMPEL
此数据库收集了脊椎动物在转录调节区 的调节元件信息 网址:www.gene-regulation.
十, CUTG
密码子使用频度表(CUTG),是通过 Genbank中DNA序列统计出来的 网址:www.kazusa.or.jp/codon
4. 计算机辅助药物设计
以前药物的发现是通过偶然的途径或定 向筛选,但这不可避免地带有盲目性或 工作量巨大,据统计,平均筛选1.5~2 万个化合物才能发现一个新药,历时 10~12年 现在药物研究的主要方向是合理药物设 计,它是根据生命科学研究中所揭示的 药物作用靶点,在参考天然化合物结构 和其配基的基础上,设计合理的药物分 子,由于设计目的明确,可以大大减少 所筛选的化合物的数目
第十章
药物生物信息学
第一节 药物生物信息学概论
一,概念
生物信息学随着人类基因组计划的全面 开展和深入而出现的一门新兴的学科 2004年2月已经有170多个生物的基因组 被测定,核苷酸数目达到200亿 对这些数据进行处理分析就必须发展新 的分析理论,方法,技术和工具,所以 必须依赖款对蛋白质电泳条带进行定量分析 的软件
四,Winplas
一款质粒作图软件
五,Oligo6.0
引物和探针的设计,质粒作图
六, VectorNTI
序列组装和质粒作图
七,DNAMAN
质粒作图软件
SARS冠状病毒的基因组序列和其他冠状 病毒的基因组序列进行多序列比对,发 现SARS冠状病毒是一种新的冠状病毒突 变体 对11个SARA冠状病毒基因组进行多序 列比对分析,发现测序结果几乎完全相 同,说明在测序这段时间内,该病毒没 有发生较大的转型
根据SARS病毒的生活史,推断 SARS3CL蛋白酶在SARS病毒结构基因 成熟过程中起重要作用 抑制该酶可以影响病毒的增殖和扩增 在一级结构的基础上预测了三级结构, 而且为半胱氨酸蛋白酶 设计了19种半胱氨酸蛋白酶抑制剂类药 物进行测试,发现6种可能对SARS有效
六,NRL-3D数据库
包含在PIR数据库中,从蛋白质结构数据 库PDB中提取出来的序列构成的数据库 库 网址为: /pir/nrl3d.html
第五节 蛋白质结构数据库
除了生物序列数据库外,生物大分子的 三维结构数据库是另一类重要的分子生 物学数据库 蛋白质空间结构数据库是随着X射线晶体 衍射分子结构测定技术出现而出现的数 据库 PDB是一个重要的蛋白质结构数据库, 在蛋白质序列数据库诞生之前的20世纪 70年代就已经问世 PDB数据库网址为:/pdb
药物生物信息学就是综合应用药学, 生命科学,数学,计算机等等学科 的理论和方法,对伴随基因组计划 产生的生物信息进行整理和分析, 并应用于药物的设计和开发,以达 到合理药物设计目的的一门交叉学 科
二,药物生物信息学研究和应 用的范围
1. 核酸序列分析
1)基因结构分析 对原核生物的操纵子,包括启动子和及其上游序 列,终止字和衰减子等;对真核生物的分析, 有内含子,重复序列,启动子和增强子等分析 等 2)核酸序列组装 用鸟枪法测序cDNA获得了大量的短的片段,一 般不超过400bp,称为序列表达标签(EST), 它们都是mRNA的一部分,所以可以通过数据 库中的EST的分类和整合,获得潜在的全长的 cDNA
五,TrEMBL数据库
翻译的EMBL,是1996年创建并增补到 SWISSPROT数据库中 序列是一些免疫球蛋白和T细胞受体,少 T 于8个氨基酸的碎片,合成的序列,具有 8 专利的序列和不能编码真正蛋白的密码 子 网址为: ftp:///pub/database/trembl
二,PIR数据库
PIR是国际上最大的公共蛋白质序列数据 库,是一个全面的,经过注释的,非冗 余的蛋白质序列数据库.所有的序列都 经过整理,超过99%的序列已经按蛋白 质家族分类,一半以上还按蛋白质超家 族进行了分类 数据库网址为:
三,PROSITE数据库
Genbank,EMBL和DDBJ是国际上 三大主要核酸序列数据库 目前这三个数据中心各自收集世界 各国有关实验室和测序机构发布的 序列数据 通过计算机网络每天都将新发现的 或更新过的数据进行交换,以保证 这三个数据库序列信息的完整性
一,Genbank
Genbank数据库是20世纪80年代初由美 国国家健康研究院(NIH)委托洛斯阿拉 莫斯(Los Alomos)国家实验室建立 后移交给国家生物技术信息中心 (NCBI),隶属于NIH下设的国家医学 图书馆(NLM) NCBI的网址为: Genbank的网址为: /Genbank
一,GDB
由美国Johns Hopkins大学于1990建立, 是重要的人类基因组数据库,现在由加 拿大儿童医院生物信息中心负责管理, 网址为: GDB数据库用表格的方式给出基因结构 数据库,包括基因单位,PCR位点,细 胞遗传标记,重复片段等
二,Unigene
人类基因组中的序列只有3%可以编码蛋 白质,因此转录图谱可以把基因组中能 够编码的部分集中起来,因此是一种重 要的数据资源 Unigene是通过计算机程序对Genbank中 的数据进行适当的处理,以便研究基因 的 转 录 图 谱 . 其 网 址 为 : /Unigene
5. 计算机辅助疫苗设计
对于一个已知序列的蛋白抗原,单纯通过实验 的方法鉴定表位常须合成大量的交叠肽,或裂 解成小肽通过多肽结合试验筛选测定,但都费 时费力 如果能先对表位进行预测,使待选多肽范围缩 小,再通过实验的方法进行验证,往往能够取 得事半功倍的效果 近些年来,随着实验技术的发展,使得越来越 多的抗原表位得以鉴定,并建立了相应的数据 库,使得抗原表位表位预测的效果不断提高
第六节 蛋白质结构分类数据库
PDB数据库中虽然有几千套数据,但其 中许多突变体的结构,以及高度同源结 构,蛋白质折叠模式是有限的,最著名 的结构分类数据库是英国研究小组建立 的,分别是SCOP和CATH SCCP: /scop. CATH: /bsm/cath
五,AceDB
线虫基因组数据库 网址为: /Software/Acedb
六,dbEST
是EST数据库 网址是:/dbEST
七,TRANSFAC
关于转录因子及其结合位点的数据库 网址为:http://transfac.gdf.de/Transfac
2. 蛋白质序列分析
蛋白质序列分析包括蛋白质的组成和性 质分析 如分子量,等电点,亲水性和疏水性分 析)蛋白质二级结构和三级结构的预测
3. 生物信息学软件
现代药物开发特别是生物技术药物的开 发,少不了用分子生物学的手段研究问 题,解决问题 涉及到分子生物学实验,常常需要生物 信息软件的帮助 对核酸和蛋白质序列分析,蛋白质高级 结构分析,蛋白质组研究图谱的处理, 蛋白质,核酸三维结构的显示,文件格 式转换(Seqverter)等
EMBL和Genbank无论是序列的本身, 还是对序列的注释,两者的内容完 全相同,只是格式有所区别而已, 因此进行数据库检索时,只须检索 一个即可
第三节 基因组与功能基因组数 据库
随着许多生物的基因组被测序,特别是 人类基因组计划的完成后,科学家们已 经开始研究功能基因组学 在mRNA水平上观察基因表达的图谱 (转录组)和蛋白质水平观察基因表达 的图谱(蛋白质组) 基因组与功能基因组数据库也就开始建 立
三,SGD
酵母基因组数据库,是已完成基因组测 序的啤酒酵母基因组数据库 网址: /Saccharomyces
四,TDB
包括DNA和蛋白质序列,基因表达,细 胞功能以及蛋白质家族信息等.并收录 人,植物,微生物等分类信息 网址为:/tdb/tdb.html
第四节 蛋白质序列数据库
一,SWISS-PROT数据库
该数据库力图提供高水平的数据注释信 息,包括对蛋白质功能,结构域的结构, 蛋白质翻译后的修饰,突变体的描述. 其目标是提供禁垦恩更详尽的,很少冗 余的数据,而且数据库中的连接可以直 结链接到其它资源上 数据库的网址为: /swissprot.