当前位置:
文档之家› 北京大学 化学信息学 course(1)
北京大学 化学信息学 course(1)
h
22
SMILE标记示例
C Methane C1CCCCC1 cyclohexane
O water
c1ccccc1 benzene
CC ethane
CO methanol
OC methanol
N[C@@H](C)C(=O)O
CCO ethanol
CC(=O)C O=C=O
acetone carbon dioxide
Sybyl Line Notation (SLN)(Tripos)
5
3
O
NH2
6
12 11
13
1
HO
CH
4
CH2
OH
89
ROSDAL
1O-2=3O,2-4-5N,4-6-7=-127,10-13O
SLN
OHC(=O)CH(NH2)CH2C[1]=CHCH =C(OH)CH=CH@1
WLN
QVYZ1R DQ
Ethene C=C Formaldehyde C=O Hydrogen Cyanide C#N Butadiene C=CC=C
h
25
分支 – 将支链放在括号中
branch : '(' <chain> ')' | '(' <chain> <branch> ')' | '(' <branch> <chain> ')' | '(' <chain> <branch>
h
10
h
11
Human Alcohol Dehydrogenase (Adh1A)
分类: Oxidoreductase
简介: Molecule: Class I Alcohol Dehydrogenase 1, Subunit; Chain: A, B; Engineered: Yes
实验方法 : X-ray Diffraction
h
37
ClogP的计算使用片断加和法 =(片断值+校正项) 片断值基于实验值,与片断的类型有关,如:极性基团、 卤素、离子、不饱和键 校正项描述不同片断间的相互作用,如:氢键等
h
38
/
h
39
/
h
40
分子结构信息的计算机存储和表达
大写的字母表示非芳香体系
示例:
Cl
Hydrochloric acid
S
H2S
[Fe++] Iron(II)cation
h
24
Bond - 语法
bond : <empty> | '-' | '=' | '#' | ‘.‘ ;
single | double | triple | disconnection
示例
h
44
benzene
WLViewer 3D
0
12 12 0 0 0 0 0 0 0 0 0
1.1202 0.0003 0.0002 C 0 0 0 0 0 0
1.8030 1.1835 -0.0005 C 0 0 0 0 0 0
3.1691 1.1839 -0.0004 C 0 0 0 0 0 0
Nicholas J. Hrib, Norton P. Peet "Chemoinformatics: are we exploiting these new science?“
Drug Discovery Today 5 (11): 483-485, Nov. 2000
h
9
名词解释 - Cheminformatics
Wiswesser Line Notation (WLN) (Dialog)
Simplified Molecular Input Line System (SMILES/SMARTS) – (Daylight)
Representation of Structure Diagram Arranged Linearly (ROSDAL) - (Beilstein)
键型(芳香环)
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O H2N C H
OH
h
17
分子结构信息表达的内容
原子 原子间的连接
键型(芳香环)
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O
+
H3N C H O
21
11
32
41
22
21
51
61
41
41
71
61
8 2 12 1
72
91
8 1 10 2
9 2 11 1 13 1
10 1 12 2
11 2
71
10 1
h
43
MDL Connection Table
数据交换的事实标准 衍生文件格式
Molfile (single molecule) SDfile (set of molecules and data) RGfile (Markush structure) Rxnfile (single reaction) RDfile (set of reactions with data)
L-alanine
h
23
Atoms – 语法
atom : '[' <mass> symbol <chiral> <hcount> <sign<charge>> ']‘
双字母原子符号: Br (Upper/lower case) 原子的预定义价键:
B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1), Cl(1), Br(1), I(1)
化学信息学: …结合化学合成、生物筛选及数据挖掘技术
指导药物发现和开发,… 用于合理的设计具有 类药性质的化合物,…构建用于虚拟高通量筛选 的智能化合物库,…研究以往的数据知道先导化 合物的优化
Cheminformatics: Intelligent Drug Discovery
May 28- 30, 2003 Philadelphia PA
h
28
双键构型的表示 - ‘/’ ‘\’
F/C=C/F
F/C=C\F
h
29
手性表示 - @ or @@
从旋光中心沿字符串顺序观察, 逆时针为@,顺时针为@@
N[C@](C)(F)C(=O)O
h
30
氢原子表示
显式表示氢原子的四种情况: 1. 带电荷的氢, 如:质子 [H+] 2. 与其它氢相连的氢, 如:氢气 [H][H] 3. 氢桥 4. 同位素,如:重水, [2H]O[2H]
h
18
分子结构信息表达的内容
原子 原子间的连接
键型(芳香环)
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O H 2N 14 C H
OH
h
19
h
20
分子结构一维表示法 (Line Notation)
简介:
使用字符串表示分子结构
现有的几种表示法
3D-coordinates for atoms
OH
CH2 O H2N C H
OH
h
15
分子结构信息表达的内容
原子 原子间的连接
键型
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O H2N C H
OH
h
16
分子结构信息表达的内容
原子 原子间的连接
h
31
芳香性
N1ccccc1 N1=CC=CC=C1
C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C1
h
32
一些例子
[O-][n+]1ccccc1 pyridine-N-oxide
O[C@H]1CCCC[C@H]1O cis-resorcinol
CC(C)NCC(O)COc1cccc2ccccc12 Propranolol – a beta-blocker
分子结构二维表示法
连接表 (Connection Table) 邻接矩阵 (Adjacency Table)
h
41
连接表 (Connection Table)
简介:计算机系统中主流结构表示方法 类型
“内部” CTs (内存)
程序处理
“外部” CTs (磁盘文件)
文件存储 数据交换
3.8522 0.0006 -0.0007 C 0 0 0 0 0 0
<chain> ')'
SMILES: CCCC(C(=O)O)CCC
h
26
环定义 - 合环键用数字标出
h
27
其它定义
• 非连接关系 (disconnections):
• 同位素表示:
SMILES: [Na+].[O-]c1ccccc1
specified inside brackets. SMILES: [13CH4]
h
4
相关名词辨析
/content/c hemoinformatics_gloss.asp
h