1.什么是化学信息学?化学信息学是化学领域中近几年发展起来的一个新的分支,是建立在多学科基础上的交叉学科,利用计算机技术和计算机网络技术,对化学信息进行表示,管理,分析,模拟和传播,以实现化学信息的提取,转化与共享,揭示化学信息的实质与内在联系,促进化学学科的知识创新。
化学信息学是一门应用信息学方法来解决化学问题的学科。
20世纪中后期,伴随着计算机技术的发展,化学家开始意识到,多年来所积累的大量信息,只有通过计算机技术才能让科学界容易获得和处理,换言之,这些信息必须通过数据库的形式存在,才能为科学界所用。
这一新领域出现以后,没有一个恰当的名称。
活跃在这个领域的化学家总是说他们在“化学信息”领域工作。
然而,因为这一名称难以将处理化学文献的工作和发展计算机方法来处理化学信息的研究分别开来。
所以,一些化学家就称之为“计算机化学”,以强调采用计算机技术来处理化学信息工作的重要性。
2.化学信息如何分类?化学信息学的研究内容的包含范围,不同的学者有不同阐述。
缪强认为包括以下六个方面:“化学、化工文献学;化学知识体系的计算机表示、管理与网络传输;化学图形学;化学信息的解析与处理;化学知识的计算机推演;化学教育与教学的现代技术与远程信息资源”。
徐筱杰认为化学信息学内容包括:“化学信息的组织、管理、检索和使用;分子结构的编码、描述、三维结构的构建;化学信息的加工、处理及深化;计算组合化学;化学体系中信息的交换及传递;分子的物理化学性质预测”。
邵学广等人认为化学信息学的研究内容主要包括:“利用计算机技术和计算机网络技术对化学信息进行表示和管理;利用计算机网络技术对化学信息进行收集、传播和共享;化学体系的计算机模拟或建模;利用计算机技术对复杂的化学信息进行解析,以快捷方便的方式最大限度地提取和利用有用信息”。
3.通过网络了解国外有哪些分子模拟及化工模拟软件,并指出每个软件的优缺点以及应用领域。
(1)GROMACSGROMACS是用于研究生物分子体系的分子动力学程序包。
它可以用分子动力学、随机动力学或者路径积分方法模拟溶液或晶体中的任意分子,进行分子能量的最小化,分析构象等。
它的模拟程序包包含GROMACS力场(蛋白质、核苷酸、糖等),研究的范围可以包括玻璃和液晶、到聚合物、晶体和生物分子溶液。
GROMACS是一个功能强大的分子动力学的模拟软件,其在模拟大量分子系统的牛顿运动方面具有极大的优势。
优点:(1) GROMACS进行了大量的算法的优化,使其计算功能更强大。
例如:在计算矩阵的逆时,算法的内循环会根据自身系统的特点自动选择由C语言或Fortran来编译。
GROMACS中对Altivec loops的计算,无论是在Linux还是MacOSX.系统上,它都要比其它软件快3-10倍,而且GROMACS提高计算速度的同时也保证了计算精度。
(2) GROMACS具有友好的用户界面,拓扑文件和参数文件都以文档的形式给出。
在程序运行过程中,并不用输入脚本注释语言。
所有GROMACS的操作都是通过简单的命令行操作进行的。
而且运行的过程是分步的,随时可以检查模拟的正确性和可行性,可以减少时间上的浪费。
(3) GRMACS操作简单,功能丰富,而且对于初学者来说易于上手。
而且可以通过详细的免费使用手册,用户可以得到更多的信息。
(4) 在模拟运行的过程中,GROMACS会不断报告用户程序的运算速度和进程。
(5) GROMACS具有良好的兼容性。
输入文件和输出的轨迹文件的格式都是独立于硬件的。
(6) GROMACS能通过二进制文件来写入坐标,这样就提供了一个压缩性很强的轨迹数据存储方法,压缩方式的精度可以由用户来选择。
(7) GROMACS还为轨迹分析提供了大量的辅助工具,用户不必再为常规分析编写任何程序。
GROMACS还提供了轨迹的可视程序,而且许多可视化工具都可以显示。
(8) GROMACS允许并行运算,使用标准的MPI通讯。
(9) GROMACS程序包中包括各种常见的蛋白质和核酸的拓扑结构。
包括20种标准的氨基酸以及其变异体,4种核苷和4种脱氧核苷,以及糖类和脂类。
GROMACS的运行过程,主要由一系列的文件和命令组成。
GROMACS一般的模拟过程可以分成以下三个阶段:(1) 前处理过程:生成模拟对象的坐标文件、拓扑结构文件以及平衡参数及其外力作用参数等文件。
(2) 模拟过程:首先要对系统进行能量最小化,避免结构的不合理而在模拟中出现错误;然后是对系统升温过程,先给系统的各个原子以Boltzmen分布初速度,再模拟较短的时间以达到初步的平衡;最后进行真正的分子动力学模拟,即平衡过程。
此过程一般时间步长为1fs,运行时间在ns量级,以保证模拟系统尽可能找到势能的最低点。
当然,对于其他的操作,如施加外力(模拟AFM加力)需要在平衡之后进行。
在MD模拟的过程中,用户可以运用配套的可视化软件,如VMD等随时观测模拟的过程及系统的状态。
(3) 后处理过程:MD模拟结束后,GROMACS会产生一系列文件,如.pdo文件(受力分析文件)、.trr文件(模拟过程结果文件)、.edr文件(能量文件)等。
同时,GROMACS 本身还提供了多种分析程序,可以对这些文件进行分析,可以得到分子体系的各种信息。
缺点:(1)结果可靠性差,重复性难,高档次分析工具欠缺,分析工具中bug多,并行通信量大(2)GROMACS力场对生物大分子,蛋白质的应用,较amber和charmm力场准确度差对螺旋结构的模拟效果不是很好,螺旋很容易散掉. 所以很难用在应用上.不能确定是因为力场还是因为蛋白本身构象转换(2)NAMDNAMD(NAnoscale Molecular Dynamics)是用于在大规模并行计算机上快速模拟大分子体系的并行分子动力学代码。
NAMD用经验力场,如Amber,CHARMM和Dreiding,通过数值求解运动方程计算原子轨迹。
1. 软件所能模拟的体系的尺度,如微观,介观或跨尺度等微观。
是众多md 软件中并行处理最好的,可以支持几千个cpu 运算。
在单机上速度也很快。
模拟体系常为为10,000-1,000,000 个原子。
2. 软件所属的类型,如MD,DPD,DFT,MC,量化,或交叉等全原子md,有文献上也用它做过cgmd。
3. 软件能研究的相关领域,使用者的背景最好是?使用的力场有charmm,x-plor,amber 等,适合模拟蛋白质,核酸,细胞膜等体系。
也可进行团簇和CNT 系统的模拟软件原理经典,操作简单。
但需要对体系的性质足够了解。
4. 软件中主要涉及的理论方法范畴经典的md,以及用多种方法计算自由能和SMD模拟。
数据分析时候一般很少涉及复杂的热力学和统计热力学的原理,但知道一些最好。
5.软件主要包含的处理工具namd 是计算部分,本身不能建模和数据分析(unix 的哲学kiss)。
但vmd 同namd 系出同门,已同namd 实现无逢链接。
vmd 的tcl 脚本一定要搞懂,别的就不多介绍了。
[2]6.与此软件密切相关的软件vmd,及其他数据统计分析软件(excel,OOo-calc 等足够了)(3)AmberAmber是著名的分子动力学软件,用于蛋白质、核酸、糖等生物大分子的计算模拟。
Amber也指一种经验力场(empirical force fields)。
力场和代码是分开的,一些软件中包含amber力场, 而其他的力场也包含在此amber的软件中。
AMBER提供两部分内容:用于模拟生物分子的一组分子力学力场(无版权限制,也用于其它一些模拟程序中);分子模拟程序软件包,包含源代码和演示。
AMBER主要程序Leap:用于准备分子系统坐标和参数文件,有两个程序:xleap:X-windows版本的leap,带GUI图形界面tleap:文本界面的LeapAntechamber:用于生成少见小分子力学参数文件的。
有的时候一些小分子Leap程序不认识,需要加载其力学参数,这些力学参数文件就要antechamber生成Sander:MD数据产生程序,即MD模拟程序,被称做AMBER的大脑程序。
Ptraj:MD模拟轨迹分析程序。
(4)Simsci PRO/IISimsci PRO/II 流程模拟程序,广泛地应用于化学过程的严格的质量和能量平衡。
SIMSCI公司是工业应用软件和相关服务的主要提供商。
这些软件被广泛的应用在石油、石化、工业化工以及工程和制造相关专业。
SIMSCI设计的软件产品可以降低用户的成本、提高效益、提高产品质量、增强管理决策。
PRO/II适用于:油/气加工、炼油、化工、化学、工程和建筑、聚合物、精细化工/制药等行业,主要用来模拟设计新工艺、评估改变的装置配置、改进现有装置、依据环境规则进行评估和证明、消除装置工艺瓶颈、优化和改进装置产量和效益等。
(5)Aspen PlusAspen Plus是一个生产装置设计、稳态模拟和优化的大型通用流程模拟系统。
Aspen Plus是大型通用流程模拟系统,源于美国能源部七十年代后期在麻省理工学院(MIT)组织的会战,开发新型第三代流程模拟软件。
该项目称为“过程工程的先进系统”(Advanced System for Process Engineering,简称ASPEN),并于1981年底完成。
1982年为了将其商品化,成立了AspenTech公司,并称之为Aspen Plus。
该软件经过20多年来不断地改进、扩充和提高,已先后推出了十多个版本,成为举世公认的标准大型流程模拟软件,应用案例数以百万计。
1)产品具有完备的物性数据库物性模型和数据是得到精确可靠的模拟结果的关键。
人们普遍认为AspenPlus 具有最适用于工业、且最完备的物性系统。
许多公司为了使其物性计算方法标准化而采用Aspen Plus 的物性系统,并与其自身的工程计算软件相结合。
Aspen Plus 数据库包括将近6000 种纯组分的物性数据1. 纯组分数据库,包括将近6000 种化合物的参数。
2. 电解质水溶液数据库,包括约900 种离子和分子溶质估算电解质物性所需的参数。
3. 固体数据库,包括约3314 种固体的固体模型参数。
4. Henry 常数库,包括水溶液中61 种化合物的Henry 常数参数。
5. 二元交互作用参数库,包括Ridlich-Kwong Soave、Peng Robinson、Lee Kesler Plocker、BWR Lee Starling,以及Hayden O’Connel l状态方程的二元交互作用参数约40,000 多个,涉及5,000 种双元混合物。
6. PURE10 数据库,包括1727 种纯化物的物性数据,这是基于美国化工学会开发的DIPPR 物性数据库的比较完整的数据库。