精确对接和虚拟筛选工具eHiTS简介
分子对接是计算机辅助药物设计(CADD)的重要方法之一,其本质是配体和受体之间的识别过程。
eHiTS就为我们提供了这样一个进行分子对接研究的平台。
可以用来帮助我们研究配体和受体的相互作用模式和进行高通量虚拟筛选工作。
来自于加拿大SimBioSys公司的eHiTS是一款精确快速柔性对接软件。
其具有以下优点:
使用简单—自动预处理、自动考虑质子化状态等
速度很快—特殊算法和极强的并行化能力
结果精确—系统搜索算法和基于蛋白家族打分函数
可操控性—用户可以自己训练打分函数
目前eHiTS已经被Pfizer, Roche, Sanofi Aventis, Boehringer, Harvard Medicine, Berkeley等知名的制药企业和高校广泛使用。
一、成功应用案例
1. Petra等人用eHiTS对NCI数据库进行虚拟高通量筛选发现了3种新的醛酮还原酶1C1抑制剂
醛酮酸还原酶1C1是治疗多种癌症的一个重要靶点,Petra等用eHiTS对NCI数据库中的“Diversity set”数据库进行了高通量虚拟筛选。
将排名前50的小分子拿去测活,发现有3个小分子对于醛酮酸还原酶1C1具有较好的抑制活性,IC50值在微摩尔量级。
左边这张表就是获得三个有抑制活性小分子,及其IC50值;右边这张图是其中抑制活性最好的小分子NSC292213与受体的相互作用模式,其中洋红色的是晶体结构中的抑制剂,而亮蓝色的是筛选得到的有抑制活性的小分子,可以发现,NSC292213与晶体结构中的抑制剂的结合模式还是比较类似的。
Ref: Molecular and Cellular Endocrinology, 2009, 301, 245-250
2. Stephen等用eHiTS对虚拟肽库进行高通量筛选发现了新的脱氧核糖核酸酶1抑制肽
除了进行小分子抑制剂的筛选,eHiTS还可以用来
研究小肽抑制剂。
Stephen等就用eHiTS建立一套基于受
体的自动筛选虚拟肽库方法。
他们首先建立一个虚拟的
肽库,然后用eHiTS将这些虚拟库中小肽对接到受体,
将打分最高的由8个AA组成的小肽进行测活,发现其
对脱氧核糖核酸酶1具有很好的抑制活性,Ki值为0.16
微摩尔。
这张图是得到的抑制肽与脱氧核糖核酸酶1的
相互作用模式,其中红色是筛到的小肽,蓝色是受体。
Ref: Proteins: Structure, Function, and Bioinformatics, 2009,
76, 3, Pages 693 – 705 (IF: 3.26)
二、eHiTS 的精确度、富集能力和速度验证
我们知道一款对接软件的性能主要由精确度、富集能力和速度三方面决定,以下将从这三方面来介绍eHiTS 。
(一)精确度验证——能否找出正确的配体与受体的结合模式
2010 J. Comput. Chem.评价eHiTS 是最好的对接软件之一。
(二)富集能力验证——区分活性和非活性化合物能力
对接了1586个复合物晶体结构 92% 的打分最高构象RMSD < 2 Å
对接了69个复合物晶体结构
59个RMSD < 1.5 Å,eHiTS 表现最好
Ref :J. Med. Chem. 2004, 47. 558-565.
针对六个蛋白家族做了富集能力测试:
COX2, Estrogen Receptor, Thrombin, Gelatinase ,P38 Kinase, Neuraminidase
eHiTS 的富集能力始终表现的非常好和最稳定
(三)速度验证
三、eHiTS 的构象搜索算法和打分函数
eHiTS 通过系统搜索算法和基于蛋白家族binding site 的打分函数为我们提供了一个精确快速的分子对接研究平台。
可帮助我们研究配体和受体的相互作用模式和进行高通量虚拟筛选。
下面分别对eHiTS 的搜索算法和打分函数进行介绍: (一)构象搜索算法—系统搜索算法
如何既快速又全面获得对接中的构象一直是分子对接的难点之一,eHiTS 采用其独特的系统搜索算法很好地解决了该难点。
构象搜索的流程:
I .拆分:将配体拆分为刚性片段和柔性连接链
II .对接:将每个刚性片段分别对接到结合口袋中的所有位置
III .Pose 匹配,找出所有匹配活性口袋化学特征的构象,并进行重新连接成配体
IV .优化,对获得配体的构象进行局部的能量优化
V .评价,对获得的结果进行打分排序
第一步:eHiTS 将配体拆分为刚性片段和柔性的连接链,比如上边的这张图,其中红色的虚线方框就是拆
分得到的刚性片段,这里总共有三个刚性片段。
eHiTS 提供了不同的对接模式,以方便用户根据自己化合物库的大小进行选择;平均对接一个配体的时间在十几秒到几分钟之间。
eHiTS 具有超强的并行化能力,可以大大加快计算的速度。
第二步:eHiTS将得到的这些刚性片段分别对接到结合口袋中的所有位置
第三步:eHiTS将得到的构象与活性口袋化学特征进行一个快速匹配,并重新连接成配体
第四步:eHiTS对得到的配体构象进行局部能量优化,包括像形状的匹配、能量的匹配以及小分子内部的构象应变能
最后,对获得的结果进行打分排序,这需要用到打分函数eHiTS_Score。
eHiTS的搜索算法采用的系统搜索算法,搜索的构象可以覆盖到体系的任意势能面上,因此它得到的构象是非常全面和系统的;另外由于是将配体拆分成刚性片段和柔性链,这样大大提高了搜索构象的速度;而且也解决一些由于大的空间位阻而对接不到受体活性口袋中的问题。
(二)打分函数—eHiTS_Scroe
●打分函数的获得
eHiTS打分函数eHiTS_Score集合了经验的和知识的打分函数,是基于蛋白家族的打分函数,下面对打分函数的获得进行具体介绍:
首先从PDB库中收集了13,000复合物PDB,这里挑选的受体要最大程度的覆盖当前研究比较多的蛋白家族,配体要尽可能的具有多样性;然后进行聚类为500个家族,当然这个的分类并不是生物学上的关于蛋白家族的分类,而是根据受体活性口袋进行分类,即具有相似的活性口袋会被分到同一个家族。
然后对每个家族进行训练、优化打分函数,最后得到对应不同家族的打分函数。
eHiTS_Score综合考虑了统计和实验的打分函数,同时它将PDB文件里面温度因子项也考虑进来;并且可以很方便与其他的对接软件和评价工具进行联用。
●eHiTS_Score的打分项
eHiTS_Score的打分项包括两大部分:一个是表面点特征项,一个是补充的打分项。
如果配体和受体的表面点特征项相匹配的话会得到正分,如果不匹配的话会被罚分。
I.表面点特征项,总共23项:主要考虑的是金属相互作用、氢键受体、氢键供体、疏水相互作用、π-π堆积力等化学特征,评价配体和受体的化学特征的匹配情况。
II.补充的打分项,总共7项:包括空间位置、结合的深度、溶剂化作用等,评价配体和受体空间形状的匹配。
●eHiTS_tune—自定义打分函数
eHiTS_Score为我们提供了对打分函数进行自定义的工具eHiTS_tune。
用户可以针对自己所研究的蛋白体系来对打分函数进行重新的训练,包括像对接准确性的训练和富集能力的训练,从而得到专门针对自己研究蛋白体系的打分函数,这会使您得到更好的对接准确性和提高eHiTS的高通量筛选能力。
四、其他独特性能——高度自动化,容易使用
●eHiTS可在一次对接过程中考虑配体和受体所有可能的质子化状态
●自动修正PDB文件里面的一些格式错误
●会对提交的文件进行自动的预处理,包括去水,加氢等,不需要任何的手动预处理
●提供了一个进行可视化操作的工具CheVi,可以实现对接过程的可视化操作以及结果的查看、分
析
●可以考虑元素周期表里面的所有金属离子
因此,eHiTS在具有很好的精确度和很快速度的同时,也是一款非常易用的对接软件。