当前位置:
文档之家› 药物及生物活性小分子发现与分子设计课件
药物及生物活性小分子发现与分子设计课件
15
-4.329105882 4.856611016
16
-4.315410702 4.48602273
17
-4.748260105 4.821008953
……
……
……
a2 6.568394002 6.417589941 6.662162587 6.386047615 5.880153979 5.78062749 5.757473315 6.427766956 ……
学习交流PPT
6
SwissTargetPrediction
——用于生物活性小分子靶点预测
• 结合3D和2D相似性得到预测分数:
• 3D相似阈值:s’1>0.65 ;2D相似阈值:s’2>0.3
• 正则化:s1=(s’1-0.65)/(1-0.65) ,s2=(s’2-0.3)/(1-0.3)
• 靶点预测分数(逻辑回归):f(s1, s2)=(1+exp[-a0-a1s1-a2s2])-1
• 指纹描述分子:
• 分子指纹是一个多“位(bit)”的编码, 每一位代表着某种预定义的子结构;
• 如果该子结构在某分子中存在;其分 子指纹的对应位就是1,否则就是0;
…… ……
7
(=S)
8
C(=)
9
=N()
10 C()=()
…… thioaldehyde
thioketone imine
hydrazone
• 谷本(Tanimoto)系数定量:
11 C()=()C(=)() Semicarbazone
• Tanimoto系数介于[0, 1]之间;
…… ……
……
• 如果A和B完全相同,交集等于并集, 值为1;如果没有任何关联,交集为空,
Tanimoto系数公式
值为0;
• 对于分子指纹进行按位计算。
s’2=
• 留一验证:只使用原本样本中的一项来当做验证资料, 而剩余的则留下来当做训练资料
学习交流PPT
9
学习交流PPT
10
学习交流PPT
11
Chlorotrianisene
妇女因雌激素缺乏所引起的症状 男性前列腺增生
Prostaglandin G/H synthase 前列腺素合成酶 Estrogen receptor 雌激素接收体
可能性仅仅是基于交叉验证得到的结果,并不代表真实的预测正确可能性
学习交流PPT
8
SwissTargetPrediction
——用于生物活性小分子靶点预测
• 交叉验证:
• 在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并 求这小部分样本的预报误差;
• K折交叉验证:初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他 K-1个样本用来训练,交叉验证重复K次,10折交叉验证最为常用;
药物及生物活性小分子发现 与分子设计
学习交流PPT
1
1
SwissTargetPrediction
2
DDI-CPI
3
SEPPA 2.0
4
ProTox
5
总结与展望
学习交流PPT
2
SwissTargetPrediction
——用于生物活性小分子靶点预测
生物活性小分子连接到蛋白或者大尺寸目标分子来 调节生物活性:
Lesinurad
抑制尿酸转运蛋白重吸收
Microtubule-associated protein tau微管相关蛋白 Muscleblind-like protein 盲肌蛋白
Selexipag
PGI2(前列环素)激动剂
Cannabinoid receptor 大麻素受体 Adeno学s习in交e流rPPeTceptor 腺苷受体
12
DDI-CPI
——根据药物-蛋白相互作用组预测药物联合作用
• 目的:
• 药物-药物相互作用(DDIs)可能导致严重的副作用,一些DDIs和药物蛋白相互作用有关,因此分析药物-蛋白相互作用组(CPI)结构来预测 DDIs是有价值的;
• 创新点:
• 根据上传分子的CPI构象,预测DDIs;
• 不集中在单一药-蛋白相互作用,而是考虑了对于所有目标分子
– 构象x和y特征的曼哈顿距离计算公式:
– 最终的3D相似值计算公式:
s1'
1/1118dij
– dij是20×20组里最小曼哈顿距学习离交,流P所PT以s’1是其中最大值。
5
SwissTargetPrediction
——用于生物活性小分子靶点预测
• 2D相似性计算:
FP3分子指纹
序号 结构
名称
学习交流PPT
4
SwissTargetPrediction
——用于生物活性小分子靶点预测
• 3D相似性计算:
• 18维特征实数向量:
– 每个分子通过ChemAxon molconvert工具生成20个同分异构体; – 超过20个时,选择能量最低的构象;不足20个时,则选择全部构象;
• Manhattan距离:
学习交流PPT
7
SwissTargetPrediction
——用于生物活性小分子靶点预测
• Precision(精确度)-预测分数曲线:
• 该服务器中的所有分子根据分子尺寸进行分组,每组有一个随机组成的1000个分子的子集用来评 价精确度;
• 采用留一交叉验证法:通过和其他配体分子比较,每个分子进行预测; • 靶点的精确度曲线:真阳性个数/同一组所有分子的预测目标分子个数; • 根据曲线将目标分数映射到可能性值。
Number of heavy
atoms
a0
a1
<=10
-3.262413174 6.322854779
11
-3.72535153
5.095483542
12
-3.837945832 4.912160662
13
-4.165145117 5.434698827
14
-4.098154884 5.071728873
映射活性小分子的目标分子可以预测潜在机理和副作用
学习交流PPT
3
SwissTargetPrediction
——用于生物活性小分子靶点预测
• 特点: • 结合2D和3D相似性测量; • 预测可针对五个不同生命体; • 数据集包括280381个小分子与2686个目标相互作用,其中66%的目标是人类的;
• 优势: • 同时预测PK(药代动力学)蛋白和PD(药效动力学)蛋白导致的DDIs;
• 预测模型的生物学原理简单;
• 交叉验证和独立验证中预测精度高,AUC达到0.85;
• 错误的配体-蛋白复合物偶联能被该预测方法最小化;