当前课程知识点:Computer-Aided Drug Design > Chapter three: The present life of CADD > 3.2 QSAR > 3.2.5 The operation of quantitative structure-activity relationship (1)
返回《Computer-Aided Drug Design》慕课在线视频课程列表
返回《Computer-Aided Drug Design》慕课在线视频列表
同学们大家好
今天我们带领大家进行QSAR的实操练习
QSAR实操
跟我们之前的方法学一样
主要分为五个部分
首先是是数据库的建立
第二步结构活性参数的设定
第三步是模型的建立
第四步是模型的分析及指导新化合物的优化
第一步我们首先需要准备一个分子数据库
也就是一定量的大约40个左右的分子数据库
所有分析均需要进行结构优化和叠合
接下来我们来看视频
好
我们现在已经进入到软件的一个实操的环节
我们刚才已经跟大家说了
QSAR分上面以上的几步
我们首先来进行第一步
也就是数据库的录入
首先我们点击软件相应的这一个图标
我们为了导入他的数据库
在demo这里面我们选择相应的数据库
把这里设置为database的形式
我们找到我们的目标数据库
jacs.mdb
然后点击OK
这个时候基本上所有的化合物
的结构就已经输入到这个table的表格里了
当然第一步是我们已经简化了的
这基本上是我们已经绘制好了化合物的结构
同时进行了能量优化和叠合
那么至于绘制结构和优化叠合
那我们要看基础的教程部分
好
当我们导入了数据库以后
接下来我们就先进行第二步操作
及导入活性和结构参数
那么导入活性和结构参数该怎么操作
同样我们在这一个数据库的表单中
我们要导入它的活性参数
点击这一个按钮
那么在这个里面我们把
格式设置为二分量的格式
这个时候我们就可以在数据库中导入
TBG.TSV 的文件点击OK
这个时候它就弹出一个对话框
那么让我们怎么样把活性跟结构的数据
进行相应的一个匹配
这个时候我们在这里面
大家跟着我一起操作
首先在上面这一栏
我们点merge by match
后面我们选择name两个
我们全部都选择name
同时在filed的这一栏
我们点击no merge这个格式
然后这个时候我们点击merge这个按钮
这个时候我们就可以看到
那么活性数据跟结构数据就进行了一个匹配
那么接下来我们就要计算它的结构参数
在这个里面我们COMFA其实跟COMSIA的
操作基本来说是一样的
只不过跟我们前面方法学说的是一样的
COMFA只包括立体场和静电场
而COMSIA则包括五个场
立体
静电
疏水
氢键供体
氢键受体
但计算方式基本上是一样的
我们点击计算器的按钮
这个时候我们就可以在QSAR里面选择
COMFA这一栏
双击这一栏
把它加到右边我们确定好了以后
我们就选择计算
计算完了以后
我们就看到这一栏多了
一个COMFA的这一个参数栏
那么这以上就是我们
针对数据库赋予了活性值和结构参数值
那么接下来我们将进行第三步
也就是利用训练集去构建QSAR模型
然后先用内部验证的方式
获得一个最佳的这一个组分数
利用最佳的组分数
再去构建一个合理的一个QSAR模型
我们同样在这个栏中间
我们首先要选择它的活性和结构参数这一列
因为我们是要探讨活性和结构参数之间的关系
那么这个时候我们就点击QSAR这一个按钮
那么找到偏最小二乘法
点击
这个时候就出现了一个对话框
那么这个时候我们所用的数据是这两列
我们的独立变量是什么
就是我们的一个活性参数
在刚开始所说了
我们首先要用内部验证的方式
去选择一个最佳的一个组分数
所以说我们在这个地方我们要选择
leave-one-out这一个验证方法
我们把use samples这个给去掉
当然以后可能大家可能会用到
但在这里我们就近把它给去掉
那么components这个数我们设置为六
在Filtering筛选这一栏
我们把它设置为2.0
那么至于这个名字就无所谓了
因为我们这个只是要去进行一个内部验证
选择一个最佳的一个主份数
我们点击运行一下pls
那么点OK
我们可以在这一个软件的栏里面
我们就可以看到它
在做计算时候给到的这一些参数
我们可以看到它的R squared
在这个地方我们认为是一个交叉验证系数
也认为是Q2
它是0.662
这是一个比较好的数值
那么它的最佳组分数是5
好
我们接下来就要利用这些参数
然后去进行一个进行一个正式模型的构建
那么正是模型构建的一个操作方式
跟刚才基本上来是一样的
只不过把leave-one-out变成no-validation
把components我们把它变成
我们刚才算出来的最佳组分数是5
是吧
那么在这里仍然选COMFA STANDARD
然后在这一个筛选的栏
也就是说filter
我们还是选择为2.0
这个时候我们可以把这个名字进行相应的一个修改
比如说我现在改成一个test
那么这个时候我们就可以开始真正的
运行它这一个模型了
好
这个是我以前做过的
所以说有一个相同名字的文件
我们把它覆盖掉就可以了
好
这个时候我们同样的在他的这一个记录栏
我们就可以看到这个模型的一些基本的参数
包括它的一个标准偏差
包括它的R2相关系数0.984
数字还是不错的
还有一个F值189.351
那么其实就说明了这个模型
通过内部验证的模型
目前我们得到的模型的参数比较好
那么可以继续用于
指导我们的一个化合物的一个优化
我们接下来
我们就开始要进行下一步的操作
也就是我们已经建好了这个模型
这个模型长什么样子
我们怎么样去评价这个模型
我们进行我们下一步的一个操作
也就是说分析
分析QSAR模型并指导化合物的结构优化
所以我们在这里同样我们回到刚才的表单
我们刚才已经建好了模型
这个时候我们要看这个模型
该怎么看
点QSAR这个按钮
然后我们点击View QSAR
我们要看QSAR
然后点击COMFA
因为我们刚才做的是一个COMFA的一个模型
那么这个时候它就弹出了一个对话栏
对吧
那么这个时候我们
可以在这里面进行相应的一些调整
这就是刚才我们的Pls的一个文件名
大家还记得这个是test
对吧
那么这个里面我们可以把它的一个展现的形式
和展现的方式进行相应的修改
比如说它的一个不透明的图
我们可以把它变成一些透明的图是吧
然后进行
以便于我们更好的去看化合物
是否匹配这个模型
然后我们点击show and quit
这个时候这个时候我们就可以看到了
它的结果图就已经展现在我们面前了
那么在左边就是一个
实际值和预测值的一个相关的一个曲线
可以看见其实线性范围还是比较好的
对吧
那么在右边就是我们构建的
一个QSAR的一个模型的一个等势图
大家可以拖拽图形进行相应的一个旋转
我们观察
那么它这个是包括立体场和静电场合在一起的
那么红色的区域
红色区域就代表负电性的基团
更有利于它的活性
那么蓝色的区域
就是说负电性的基团不利于它的活性
那么就是正电性的基团
有利于它的一个活性
那么绿色的地方代表
立体位阻比较大的基团有利于它的活性
那么黄色的区域则代表大的基团不利于它的活性
那么通过这些方式
我们就可以进行相应的一个化合物的一个改造
是吧
那么右边这么不同的点就代表不同的化合物
对吧
我们通过点击不同的点
我们就可以看到一个不同的一个化合物
那么接下来我们为了去验证
这个QSAR模型对我们到底有没有
一个指导化合物优化的一个作用
我们来点击我们这
看着上面看到的活性最好的一个化合物
我们可以看到活性最好的化合物
在这一栏上面显示的它是13号化合物
对吧
我们来仔细的观察一下它的一个结构
那么为了去进行化合物的优化
我们首先把化合物把它放到我们的
我们要准备把它放到我们的操作界面
当然这里有一个窗口
所以它不能操作
我们稍微先分析一下
那么左边是代表实际值
跟预测值之间的一个相关性
那么右边就是代表的是化合物
以及我们所构建的
构效关系的一个等势场的一个分布
包括立体场和静电场
那么绿色的部分代表体积大的有利于它的活性
黄色的代表体积大的不利于它的活性
红色的代表负电中心有利于它的活性
蓝色的代表则不利于它的活性
那么这个模型最主要的目的
是为了指导我们的一个化合物的
可以用于验证我们化合物的活性
同时能够指导化合物的优化
所以说我们看一下我们点击活性最好的化合物
我们看它哪一些原子与我们的药效团的分布不匹配
我们同时看修改一下能不能提高它的活性
我们点击活性最好的化合物
我们看到是13号化合物
我们可以看到在这一个原子
这一个氢原子
那么它所处于的是一个负电荷
负电中心有利于它的活性
同时体积又不能太大
那么这个时候我们有没有考虑过
如果把它换成强的吸电子
也就是负电中心的话
那么会有利于它的活性
而且体积不能大
我们说是考虑到用氟取代
那么会不会提高它的活性
那么怀着这个想法
我们来对化合物进行一个结构的优化
-1.1 CADD-Where am I coming from?
--1.1 CADD-Where am I coming from?
-1.2 CADD-My Value
-1.3 CADD-Application of CADD in the School of Pharmacy
--1.3 CADD-Application of CADD in the School of Pharmacy
-1.4 CADD-Friendship with undergraduates
--1.4 CADD-Friendship with undergraduates
-Unit test 1
-2.1 The mystery of drug structure
--2.1 The mystery of drug structure
-2.2 Drug activity decryption-receptors and ligands
--2.2 Drug activity decryption-receptors and ligands
-2.3 The magical journey of drug discovery
--2.3 The magical journey of drug discovery
-Unit test 2
-3.1 Brief introduction of CADD's main methods
--3.1 Brief introduction of CADD's main methods
-3.2 QSAR
--3.2.1 The quantitative structure-activity relationship theory
--3.2.2 The quantitative structure-activity relationship methodology(1)
--3.2.3 The quantitative structure-activity relationship methodology(2)
--3.2.4 The quantitative structure-activity relationship methodology(3)
--3.2.5 The operation of quantitative structure-activity relationship (1)
--3.2.6 The operation of quantitative structure-activity relationship (2)
--3.2.7 The operation of quantitative structure-activity relationship (3)
-3.3 Molecular docking
--3.3.1 The molecular docking theory
--3.3.2 The molecular docking methodology
--3.3.3 The operation of molecular docking(1)
--3.3.4 The operation of molecular docking(2)
--3.3.5 The operation of molecular docking(3)
-3.4 Pharmacophore
--3.4.1 The pharmacophore theory
--3.4.2 The pharmacophore methodology
--3.4.3 The operation of pharmacophore(1)
--3.4.4 The operation of pharmacophore(2)
--3.4.5 The operation of pharmacophore(3)
--3.4.6 The operation of pharmacophore(4)
-3.5 Homology modeling
--3.5.1 The homology modeling theory
--3.5.2 The homology modeling methodology(1)
--3.5.3 The homology modeling methodology(2)
--3.5.4 The operation of homology modeling(1)
--3.5.5 The operation of homology modeling(2)
--3.5.6 The operation of homology modeling(3)
--3.5.7 The operation of homology modeling(4)
--3.5.8 The operation of homology modeling(5)
-Unit test 3
-4.1 Comprehensive case I
--4.1.1 Comprehensive case I-Homology modeling
--4.1.2 Comprehensive case I-Operation
-4.2 Comprehensive case II
--4.2.1 Comprehensive case II –QSAR
--4.2.2 Comprehensive case II -Operation
-4.3 Comprehensive case III
--4.3.1 Comprehensive case III -3D-QSAR and molecular docking
--4.3.2 Comprehensive case III -Operation(1)
--4.3.3 Comprehensive case III -Operation(2)
-4.4 Comprehensive case IV
--4.4.1 Comprehensive case IV -Pharmacophore
--4.4.2 Comprehensive case IV-Parameter explanation
--4.4.3 Comprehensive case IV -Operation
--4.4.4 Comprehensive case IV -Analysis and interpretation
-Unit test 4