当前位置:文档之家› 化学信息学论文

化学信息学论文

化合物的结构与活性关系的模型与预测08## ### ########摘要:查阅一篇有机分子合成与生物活性测试方面的文献。

本文使用ChembioOffice、Gaussian 、HyperChem 、SPSS等软件,构建文献中每个化合物模型,搜寻最低能量构象并进行几何优化。

在优化好的结构的基础上计算描述子。

利用逐步回归选择描述子,建立线性模型。

根据模型,设计具有潜在高活性的新化合物,并预测其活性。

关键词:活性;模型;线性一、实验准备1.1文献查找与化合物的确定查阅Journal of Medicinal Chemistry中的相关文献,本文所研究的化合物来自参考文献①。

本文所选化合物共19个,具有相同的骨架结构,各化合物之间具有较好的可比性。

化合物的骨架结果如图1-1-1所示:图1-1-1各化合物的生物活性如图1-1-2所示:图1-1-2图1-1-2根据R基的不同,分别组成下列19个化合物,各化合物结构如图1、17、18、20-35所示:1 1718 2021 22 2324 25 2627 2829 3031 3233 3435观察以上19个化合物,可见各化合物所含原子数目较少,结构简单且不含有金属离子,无电荷,有明确的IC50值。

运用软件进行各分子的模拟及计算时,比较简便,适合进行本次的论文练习,确定使用以上化合物。

1.2 主要应用软件介绍1.2.1 ChembioOffice②ChembioOffice 是由CambridgeSoft开发的综合性科学应用软件包。

利用ChemBioOffice 可以方便的进行化学生物结构绘图、分子模型及仿真;可以将化合物名称直接转为结构图;也可以对已知结构的化合物命名,给出正确的化合物名称。

本次论文运用了ChembioOffice的其中两个模块:ChemDraw模块- 化学结构绘图软件,是各论文期刊指定的格式。

Chem3D模块- 提供工作站级的3D分子轮廓图及分子轨道特性分析,并和数种量子化学软件结合在一起。

由于Chem3D提供完整的界面及功能,已成为分子仿真分析最佳的前端开发环境。

1.2.2 Gaussian 03③Gaussian 03是一个功能强大的量子化学综合软件包。

其可执行程序可在不同型号的大型计算机,超级计算机,工作站和个人计算机上运行,并相应有不同的版本。

高斯功能:过渡态能量和结构、键和反应能量、分子轨道、原子电荷和电势、振动频率、红外和拉曼光谱、核磁性质、极化率和超极化率、热力学性质、反应路径,计算可以对体系的基态或激发态执行。

可以预测周期体系的能量,结构和分子轨道。

因此,Gaussian可以作为功能强大的工具,用于研究许多化学领域的课题,例如取代基的影响,化学反应机理,势能曲面和激发能等等。

1.2.3 HyperChem④HyperChem是一款以高质量,灵活易操作而闻名的分子模拟软件。

通过利用3D 对量子化学计算,分子力学及动力学进行模拟动画,HyperChem 为提供比其它Windows 软件更多的模拟工具。

1.2.4 SPSS⑤SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件,现在由IBM公司开发。

应用于自然科学、技术科学、社会科学的各个领域。

SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全,是世界上应用最广泛的专业统计软件。

二、实验步骤2.1 分子结构优化用ChemDraw画出分子结构图。

在Chem3D中先对分子进行MM2-Minimize Energy能量最小化处理;然后对各个可转动化学键进行Dihedral Driver-Single Angle Plot转动,选取能量最低点;接着进行MM2-Molecular Dynamisc动力学模拟;重复以上操作至分子能量最低,以获得分子的稳定的三维结构。

2.2 Gaussian运算优化完成后,在Chem3D的Calculations-Gaussian Interface 选项中进行Minimize (Energy&Geometry)运算。

在确认运算正常结束后,可进行下一步的提取电荷,前线轨道能量的参数。

本文选取Molecular Volume、链接取代基的原子的电荷和、取代基第一个原子电荷和、取代基总电荷、HOMO、次HOMO、LOMO、次LOMO以及HOMO-LOMO等9个数据为描述子,如图2-2-1所示:2.3 其他描述子的运算用Chem3D中的Calculations-Compute Properties、HyperChem等计算出其他相关参数共24个。

包括:Mol Refractivity、Partition Coefficient、Balaban Index、Cluster Count、Molecular Topological Index 、Num Rotatable Bonds、Polar Surface Area、Angstroms Squared、Radius、Shape Attribute、Shape Coefficient、Sum Of Degrees、Sum Of Valence Degrees、Topological Diameter、Total Connectivity、Total Valence Connectivity、Wiener Index、Approx、Grid、Volume、Hydration Energy、Log P、Relractivity、Polarizability、Mass。

2.4 数据的初步整理将以上运算所得的33个参数进行整理,并将所获得的参数整理制作成Excell表格。

三、实验数据的处理3.1 用SPSS进行相关性分析将整理好的34个描述子导入SPSS,计算它们之间的相关性。

将分析结果中相关性的绝对值大于0.8的两个描述子保留一个,以此对34个描述子进行取舍,共舍去Mol Refractivity、Cluster Count、Molecular Topological Index等17个描述子。

得到不显著相关的描述子17个,如图3-1-1所示:图3-1-13.2 用逐步回归(stepwise)进行变量选择选取因变量为IC50(即VAR00001),其余16个描述子为自变量,用逐步回归法进行运算,适当调整F值。

当F值进入2.25,删除2.00时,得到3个描述子,如表3-2-1所示:表3-2-1选择Model 3作为本论文的构建模型,该模型的R²如表3-2-2所示:表3-2-2R²>0.5,具有一定的预测性,可以建模。

表3-2-3F=9.642线性方程的常数如表3-2-4所示:表3-2-4得逐步回归模型的方程为:IC50=4.857*VAR00017-(7.348E-5)* VAR00013 -2327.850* VAR00008-248.571 (1)n=19,R²=0.590,F=9.642VAR00008即LOMOVAR00013即Balaban IndexVAR00017即Polar Surface Area3.3 留一法交叉验证对建立的线性模型进行留一法交叉验证。

新建一个SPSS文件,将每个化合物的IC50和前面得到的模型的三个描述子导入。

依次删掉每一个化合物的相关数据,用剩下的化合物的数据建立linear的模型,得到新的4个常数,得到一个心得一元线性方程。

将删除的化合物的三个描述子的数值对应带入相应的新方程,得到一个预测IC5O值。

如图3-3-1所示:图3-3-1图3-3-1中,BO为常数项,BI为LOMO的系数,B2为Balaban Index的系数,B3为Polar Surface Area的系数。

以交叉验证系数Q ²作为评价模型预测能力的标准。

其中yi:文献IC50值yi^:留一法算出值计算得Q²=0.594076626>0.5,该模型建立完毕。

四、高活性化合物的设计与预测根据所得模型,结合参考文献的数据,在图1-1-1所示化合物的基础上,修改R基,设计一个新的化合物。

如图4-1所示:图4-1利用ChembioOffice、Gaussian软件计算得LOMO、Balaban Index、Polar Surface Area 三个描述子分别为-0.01518、889239、76.04,代人方程(1)计算得IC50=90.75076128(nM),可见预测设计的新化合物具有良好的活性。

五、结论本文使用ChembioOffice、Gaussian 、HyperChem 、SPSS等软件,构建了19个化合物的模型,计算最低能量构象并进行几何优化。

在优化好的结构的基础上,应用分子力学(MM2)、逐步回归法、留一法、建立了一个拟合质量较高,预测性较好的分子活性预测方程。

本文选用LOMO、Balaban Index、Polar Surface Area三个描述子,建立出具有良好预测性的线性模型,并根据该模型设计了一个具有良好活性的新化合物,结果令人满意。

六、参考文献:①. Discovery of (2,4-Dihydroxy-5-isopropylphenyl)-[5-(4-methylpiperazin-1-ylmethyl)-1,3-dihydroisoindol-2-yl]methanone (AT13387), a Novel Inhibitor of the Molecular Chaperone Hsp90 by Fragment Based Drug Design†;January 15, 2010②.百度百科ChembioOffice词条/view/2669842.htm③.百度百科Gaussian词条/view/1015898.htm④.百度百科HyperChem词条/view/1513785.htm⑤.百度百科SPSS词条/view/130328.htm。

相关主题