化学信息学
Property Calculation page
• 这是一类网络工具,用于计算理化性质, 并有着子结构检索与类比功能。
• • • • • • Data for General, Organic, and Physical Chemistry / i.F & M College; ii.Colby College Data Search for Species by Chemical Formula / NIST Dielectric Constants / ASI Instruments Inc. Chemical and Physical Properties Webliography / LSU Properties of 200 linear macromolecules and small molecules / ATHAS
• 分子极性表面积(PSA)指分子中极性原子表面 的总和,通过计算极性原子O, N, OH和NH的范德 华 表面积得到的。是一个描述与分子被动传输通 过膜相关的概念,它可以预测人体肠吸收、 Caco-2单层渗透性和血-脑屏障渗透。 • PSA越大,极性越大,难于过膜;对上千个口服 非CNS药物的PSA最高阈120Å2,超过该值难以 吸收; • 透血脑屏障,PSA<60-70Å2
• “There are known knowns; there are things we know that we know. There are known unknowns; that is to say, there are things that we now know we don’t know. But there are also unknown unknowns; there are things we do not know we don’t know.” • — Donald Rumsfeld
LeadHopper
• combines 2D (ECFP6) and 3D(ROCS) methods for compound similarity searches。 • 基于形状相似性的虚拟筛选工具
RocsOverlay&RocsDock
1 2 ROCS is a powerful virtual screening tool which can rapidly identify potentially active compounds with a similar shape to a known lead compound. (ROCS是一款基于结构相似性的虚拟筛选工具) ROCS is a fast shape comparison application,It uses a Gaussian function to represent the molecular volume (利用高斯函数计算呈现分子体积) ROCS alignments have a number of applications: 3D QSAR, SAR analysis, understanding of scaffold diversity. ( ROCS 有许多应用模块,包括3D-QSAR, SAR analysis,添加分子柔性) provides 3D overlays of multiple input query molecules (提供3D分子比对和对接)
Known Unknowns
• 情况或者结果已知是可能的,但是是否能 实现还是个未知数。从化学信息学的角度, 就是有些内容我们知道如何计算,但是这 些内容的效用尚不可知,迄今为止,这些 Known Unknowns内容是化学信息学各方 法中最多的组成部分。
1 Polar Surface Area
Hale Waihona Puke known knownsknown knowns:molecular weight, ligand binding efficiency, and substructure searching……
1 分子量与原子数目
• Molecular Weight and Atom Counts.:the link between MW and oral Absorption • “Lipinski’s landmark publication correlating increased MW and atom counts with increased risk of clinical failure,primarily due to low oral absorption.” • “hard ceiling” of 500 Da • Exception:protein-protein interactions and peptidergic,natural products • 分子量大的化合物,功能基团多,增加了与受体结合的机会和强度, 但是 分子量大不利于药物的透膜与吸收(当化合物的分子量接近磷脂 分子量时,穿越细胞膜的磷脂双脂层在能量上市不利的,以至降低了 吸收性和过模型) • 分子量大的化合物可能含有易被代谢的基团和毒性结构,不适宜作为 先导物
1 分子量与原子数目
• 同样的一组化合物经HTS后(活性构象,结 构类比,通道选择,限制性HT-ADME), 约90%的化合物能够有潜在活性,并按照从 高到低排序。如果用500D规则,也许其中 只有50%的化合物能够符合,但是容易得到 “bonafide leads”(友善的先导化合物)
2 Ligand Efficiency
• ——Leeson, P.D.; Springthorpe, B. The influence of drug-like concepts on decision-making in medicinal chemistry. Nat. Rev. Drug Discovery 2007, 6 (11), 881–890;
• Accelrys的Pipeline Pilot是业界领先的基于流程化 (Protocals)的计算模拟及信息管理平台,已在国际上众 多学术机构及超过300家的企业得到了广泛应用。它集成 了大量的功能组件,能够实现工作流程的构建和共享,完 成复杂应用环境下的高效率资源整合,用于计算分子的大 用于计算分子的大 部分理化性质与配体效率。 部分理化性质与配体效率 • Pipeline Pilot不仅能让研究人员用更方便和更有效的方式 来整合并应用那些复杂难学的计算模拟和信息管理工具, 而且能让实验科学家用更简洁和更友好的方式了解、掌握 并应用理论与模拟计算的最新成果 。
Cheminformatic Tools for Medicinal Chemists
——Less experiments,better results, is that true?
Cheminformatics
• 化学信息学是近年来出现的将化学和信息科学融 合成为最新研究前沿的交叉学科, 涵盖了理论计 算、新算法发展、新知识和新化学实体的发现以 及化学虚拟现实等领域。可以广义的被定义为利 用化学信息揭示化学性质与结构之间的关系,从 药物发现的角度,化学信息学的一些准则可以应 用在早期的研究步骤(例如构效关系的研究与毒 性的预测)
• 配体效率是将化合物的活性在分子大小的尺度上加以表征, 是优化过程中监测化合物的活性、物化性质和成药性程度 的一个指标。the binding energy ∆G 由以下几部分决定: ∆G =-RT.lnKd = 1.37 pKd ∆G ∆G除以非氢原子数,得出每个原子的自由能贡献即配体效 率,用下式表示 LE = ∆G/N非氢原子 • 配体效率是衡量苗头物或先导物以及优化的化合物的质量 的参数,表征化合物的活性效率。 • LE指配体(苗头、先导物、优化物等)中每个原子对结合能 的贡献,在选取先导物和优化过程中是个有用的指标。
Accelrys
• Accelrys是一流的药物研发解决方案提供者, 为药物化学家提供强大的研究工具。涵盖了 基因组学、蛋白质组学研究到药物靶点确认 和结构解析,基于靶点的先导化合物发现, 基于活性化合物结构的先导化合物优化,先 导物ADME/T性质预测等领域。能够帮助科 学家显著提高的效率。
Pipeline Pilot
Cheminformatics Tools
• 化学信息学工具通过数据挖掘和分析,以 及结构表征和优化,帮助研究者在现代研 究方法中(如组合化学与HTS)提取大量 有用信息,促进药物研发进程。 ——
Cheminformatic Journals
• The Journal of Cheminformatics • The Journal of Computer-Aided Molecular Design • Molecular Bioinformatics • QSAR and Combinatorial Science • The Journal of Chemical Information and Modeling
已有15000篇化学信息学的研究论文 在最近五年发表
雅培科学家常用的化学信息学工具模块
• • • • • • • • • • • • • Pipeline Pilot 理化性质与配体效率 Property Calculation page 理化性质 Leadhopper2D/3D 相似检索 RocsOverlay 3D 分子叠合 DrugGuru 寻找生物电子等排 RcosDock 基于分子结构的3D对 基于分子结构的 对 PyMol 作图使分子可视化
(子结构检索) 子结构检索) • 子结构检索可以帮助得到一系列含有相同骨架的 结构,将共有结构提取出来,进行子结构检索, 来获得更多的相似结构。这些结构以及它们的活 性数据对于建立QSAR模型十分有用。 • 子结构检索致力于解决两方面问题之一:其一, 还有哪些分子含有相同子结构(从已知 从已知SAR找出 从已知 找出 有潜在活性的分子) 有潜在活性的分子 其二,哪些分子不含有任何 子结构(排除含有“问题子结构”的分子 排除含有“ 排除含有 问题子结构”的分子)。 • 由于是子结构检索, 查到的 机会多,结果准确性差 因此还可以对子结构进一步的定义提高查准率。