药物虚拟筛选-分子对接
给药无效
1. X-射线晶体结构 2. 搜寻数据库
3. 生物测试: 高选择性, 高活性( Ki = 0.1 nM)
抗SARS冠状病毒药物的设计 ——基于SARS-CoV 3CL蛋白酶的虚拟筛选
严重急性呼吸道综合征
病原体——SARS冠状病毒
SARS-Cov 感染宿主细胞起重要作用的结构蛋白
• E蛋白(small envelope protein,小信封蛋白) • S蛋白(spike glycoprotein,刺突糖蛋白) • M蛋白(membrane protein,膜蛋白) • N蛋白(nucleocapsid protein,核衣壳蛋白) • 多聚酶(polymerase)
键相互作用能。
AUTODOCK 也是常用的分子对接软件包之一,由Scripps 的 Olson 科研小组开发。它采用模拟退火和遗传算法寻找受体和配
体最佳的结合位置,用半经验的结合自由能方法来评价两者之间
的匹配情况。为了加快计算速度,AUTODOCK 采用了格点对接 的方法,格点上保存的是探针原子和受体之间的相互作用能,包
第四节 虚拟筛选
定义
虚拟筛选(virtual screening, VS) 也称计算机筛选,即在进行生物活性筛选之前,在计 算机上对化合物分子进行预筛选,以降低实际筛选化合物 数目,同时提高先导化合物发现效率。
虚拟筛选的意义
筛选的对象
化合物数据库
优势
虚拟的
实际存在的
不消耗样品,降低筛选成本 考虑化合物分子的药动学性质和毒性,增加筛选的内涵
[例] 美普他酚双配体衍生物与AChE的对接研究
阿尔茨海默症(Alzheimer’s Disease,AD)与乙酰胆碱 (ACh)水平降低和对乙酰胆碱酯酶AChE诱导的β-淀粉样蛋白
(Aβ)聚集有关
治疗AD 的药靶: 乙酰胆碱酯酶(AChE)和β-淀粉样蛋白 AChE抑制剂:美普他酚(Meptazinol) 研究发现Aβ的聚集与AChE上的外周阴离子位点(PAS)有关
括了范德华相互作用能、静电作用能和氢键相互作用能等。在
AUTODOCK3.0 以前,只能实现单个配体和受体分子之间的对 接,但目前的版本(AUTODOCK4.0)已经能实现对数据库对接
筛选的功能。
• 除此之外,还有一些常用的对接筛选程序,比 如FlexX、GOLD、Affinity 等,它们都各自 开发出一套相应的对接筛选策略、打分函数, 使得对接筛选的应用越来越广泛。
• 类3C蛋白酶(3C like proteinase, 3CL)
3CL蛋白酶作为抗SARS药物筛选靶点的优点
• 在冠状病毒复制过程中起着重要作用 • 有许多已知抑制剂,便于迅速开发 • 较易表达,有利于加紧研究
• 有较高的同源性,可用同源法模建三维结构模型
步骤1. 同源模建
(1) 3CL蛋白酶序列(GenBank)与各类冠状病毒蛋白酶序列(PDB) 作序列分析和同源性分析(BLAST程序)
结果
(1)所建模型与TGEV Mpro 晶体结构基本重叠 (2)3CL蛋白酶的折叠方式与TGEV Mpro相同,结合 口袋的结构以及空间特征几乎一样
3CL蛋白酶结构与Mpro蛋白酶晶 体结构的重叠图
3CL蛋白酶的缎带模型
步骤2. 分析酶-配体作用模型
• 两种蛋白酶的结合部位(Sybyl 6.8 / MOLCAD程序) 中,小分 子C能以同样的方式与两种酶的结合口袋契合
人冠状病毒;鼠科肝炎病毒;猪传染性腹泻病毒;猫传染性腹膜
炎病毒;禽传染性支气管炎病毒;猪冠状病毒;传染性胃肠炎 病毒 (2) 传染性胃肠炎病毒(TGEV)的蛋白酶Mpro与3CL蛋白酶有极高
的同源性,特别在底物结合口袋(活性部位)
(3) 以TGEV Mpro的X-射线晶体结构为模板,模建3CL蛋白酶三维 结构(Sybyl 6.8 / SiteID程序)
Xie Q et al. J. Med. Chem. 2008,51(7):2027
美普他酚双配体类似物的设计
• 在美普他酚分子中通过引入不同长度连接链,希望使另一个配体 能与PAS相互作用
合成n=2-12的多个美普他酚双配体类似物,发现n=9的AChE抑制活性最强 (IC50=3.9nM), 比美普他酚高2万倍,同时对AChE诱导的Aβ聚集具有明
算机)ACD数据库、MDDR数据库、SPECS数据库、中国天然产物数据库
(CNPD)和国家药物筛选中心内部样品库——共数十万个化合物 (1) DOCK 4.0作初筛, 选出得分高的前1000个化合物; (2)用Cscore软件和AutoDock 3.0软件作评价,从每个数据库中挑选出 100个得分最高的化合物 结果:共找到300个可能具有抗SARS冠状病毒潜力的候选化合物
(五) 成功实例
人碳酸酐酶与其抑制剂复合物
• 2002 年Grunberg 等采用基于分子对接的 虚拟筛选方法成功地找到了多种人碳酸酐酶 (humancarbonic anhydrase)的抑制剂。 在整个设计过程中,他们采用了多次初筛的 办法将Maybridge 数据库(61 186 个分子) 和LeadQuest 数据库(37 841 个分子)进 行过滤。首先利用Lipinski 的“5 规则”将 数据库缩小为5 904 个;然后利用FlexS 与 已知抑制剂进行相似性筛选,得到了100 个 候选化合物;最后将这100 个分子利用 FlexX 程序进行对接筛选,从中挑选出13 个进行生物活性测试,结果7 个分子的IC50 值达到了微摩尔级别。见图。
确定带电残基的质子化状态
去除不重要的小分子
3、确定靶点的配体结合口袋 靶点分子为复合物
为配体为中心的5-7Å 区域内的氨基酸残基
靶点分子不是复合物
根据同源蛋白或 定点变突的数据确定
实验数据未知
利用软件搜寻
(二) 小分子数据库的预处理
小分子数据库的来源
商用化合物数据库
公司或研究机构自有数据库
设计的虚拟化合物库
常用的数据库有MDL数据库、SPECS数据库和 CNPD(Chinese Natural Product Database)数据库
小分子数据库的预处理 1、3D结构转化 2、电荷分配 3、原子及键的检查
4、结构优化
(三) 分子对接
• 概念: 将配体分子放置到受体 大分子的活性位点中,预测小 分子与受体结合构象及作用能 的过程。是基于受体分子结构
抗艾滋病药物的发现——虚拟筛选
艾滋病病毒, 人类免疫缺陷病毒 human immunodeficiency virus, HIV
1.HIV-1蛋白酶(HIV-PR), 所催化的水解反应在艾滋病病毒导入人体细胞 过程中起着重要的作用 2.高效的HIV-PR抑制剂为治疗艾滋病的有效药物
3.肽类HIV-PR抑制剂生物性质不稳定,吸收性差,易被代谢分解,因此口服
• 目的:从小分子数据库中发现 合适的化合物作为受体大分子 的配体。从整体上考虑配体与 受体结合的效果。
虚拟筛选的核心。
• 关键环节:配体结合构象的优化
构象优化的算法
系统搜索 片段生长法 构象搜索法 随机搜索 蒙特卡罗法 模拟退火 遗传算法
构象库方法
禁忌搜索法
确定性搜索 分子动力学模拟
(四) 打分函数
基于
结构
虚拟
筛选
一般
流程
图
建立大量化合物的三维结构数据库
将库中的分子逐一与靶标分子进行 “对接”(docking)
优化小分子化合物的取向及构象等 找到小分子化合物与靶标大分子作 用的最佳构象 计算其相互作用及结合能 完成所有分子的对接计算 找出与靶标分子结合的最佳分子
对接方法尚需解决的问题
•溶剂化效应 •分子的柔性
• 起源:受体-配体的锁和钥匙模型
配体
受体
复合物
对接—— 受体和配基之间通过能量匹配和空间匹配而 相互识别形成分子复合物,并预测复合物结构的操作 过程
基于分子对接的筛选方法
基于一个靶点(酶、受体、离子通道、核酸等)的三维结构,常常采用分子对接
的虚拟筛选方法从小分子数据库中找到能与之匹配的候选化合物。所谓分子对接 是基于两个或多个分子之间通过几何匹配和能量匹配相互识别的过程,即在药物 分子和靶酶产生药效的反应过程中,两个分子先充分接近,然后采取合适的取向,
步骤4 药理测试
(1)用病毒3CL蛋白酶分子水平筛选模型筛选候选化合物——发现了7个 具有高活性的化合物 (2)在P3实验室中作SARS病毒感染细胞水平的测试,发现5-HT受体拮 抗剂( 肉桂硫胺,Cinanserin)有明显的抗SARS病毒感染和保护细 胞的作用 (3)申请专利,以CADD作结构优化
分子对接筛选常用的软件
DOCK 是应用比较广泛的对接软件之一,由Kuntz 等设计开发。它能自动模拟 配体在受体活性位点的作用情况,并记录下最佳的相互作用方式。而且该软件能 对配体的三维数据库进行搜索,因此被广泛用于基于受体结构的对接筛选。 在DOCK 中,活性位点的确定是通过软件包中的sphgen 程序来完成,它通过 在受体表面所有的凹陷区形成负像,并对这些负像进行聚类分析,用户则从中挑 选出所需要的一类作为活性区域的位置。在生成负像的基础上,就可以进行配体 分子和受体活性口袋之间的匹配,配体分子也采用一组球集来表示,并且DOCK 进行对接时,配体可以是刚性的,也可以设定为柔性。 在对接结束后,DOCK 程序则采用自带的打分函数对配体-受体之间的匹配情况 进行评价,其中包括原子接触得分和能量得分。所谓接触原子是指在一定距离之 内的原子(一般定义为4.5 Å ),如果配体和受体之间存在这个距离内的原子, 则认为产生碰撞,作为罚分从总得分中扣除;能量得分主要来自配体和受体间非
虚拟筛选的效率
例:蛋白酪氨酸磷酸酯酶1B (PTP1B)抑制剂的发现 经虚拟筛选,再作生物学测试, 虚拟筛选的命中率比随机的高 通量筛选提高1,700倍