分子动力学（七） - 四川魔德科技有限公司

分子动力学（七）

分子动力学模拟的主要步骤

2 拓扑文件的制作

拓扑文件的制作主要是配体小分子的拓扑制作和复合物的拓扑制作。在Linux操作系统下，对配体小分子进行拓扑参数文件的制作步骤为：

执行命令：$ antchamber –i ligand.pdb –fi pdb –o ligand.prepin –fo prepi –c bcc –s 2（-i表示输入；-fi表示输入格式；-o表示输出；-fo表示输出格式；-c表示电荷方法；-s表示输出显示。）得到prepin文件。prepin文件类似mol2文件，储存着原子的类型、坐标和电荷等信息。其中，原子类型对应了gaff力场中的小分子类型；原子名称与顺序均与pdb文件一致。
得到prepin文件后，执行命令：$ parmchk –i ligand.prepin –f prepi –o ligand.frcmod（-i表示输入；-f表示输入格式；-o表示输出。）得到含有非正常二面角信息的frcmod文件。
使用tleap程序制作配体小分子6JS1003的的拓扑文件（*.prmtop）及MD模拟的初始坐标文件（*.inpcd）。执行命令：$ tleap –s –f leap.in，leap.in文件的内容如图1所示。图1中各字符段的含义如下：source leaprc.gaff表示加入小分子leaprc.gaff力场；source leaprc.ff03.r1表示加入leaprc.ff03.r1力场；loadamberparams ligand.frcmod表示载入小分子补充参数；loadamberprep ligand.prepin表示载入小分子结构参数；set default PBRadii mbondi2为使用leap制作prmtop文件必须添加的字符段；x1 = loadpdb NEWPDB.PDB表示加载pdb文件NEWPDB.PDB；saveamberparm x1 ligand_vac.prmtop ligand_vac.inpcd表示保存真空条件下的小分子拓扑和初始坐标文件；quit表示退出tleap程序。

图1 配体小分子拓扑制作所用leap.in的内容

至此，完成配体小分子6JS1003的拓扑文件制作。接下来是蛋白质-配体复合物的拓扑文件制作操作：

将NEWPDB.PDB中完成拓扑制作的小分子信息复制粘贴至protein.pdb文件的末尾，并将原子序号、结合链信息及残基序号修改与protein.pdb一致后键入TER及END字符段，另存为complex.pdb。
使用tleap程序制作复合物的拓扑文件和初始坐标文件。执行命令：$ tleap –s –f leap.in，leap.in，复合物拓扑制作中的leap.in文件内容如图2所示：

图2 复合物拓扑制作中leap.in文件的内容

图中字段addions x1 Na+ 6表示向体系中加入6个钠离子；solvatOct x1 TIP3PBOX 10.0表示向体系外围添加1.0 nm的去头八面体TIP3P水模型盒子；saveamberparm x1 comple_wat.prmtop complex_wat.inpcrd表示保存加水后的体系拓扑和初始坐标文件。

执行完tleap程序后，查阅leap.log文件。发现体系中加入水分子9604个，体系总原子数为33755个（含6个钠离子）。复合物体系原带有3个正电荷，加入6个钠离子后共带有9个正电荷。为保证模拟体系保持电中性，修改leap.in中的Na+ 6为Cl- 3。再次执行tleap程序，覆盖原结算结果。修改后的体系共加水分子9588个，体系总原子数为33704个（含3个氯离子）。

至此，完成了MD模拟所需的拓扑制作工作。需要特别注意的是：（1）若体系中含有金属离子，需要额外步骤，如通过高斯量化方法等，制作金属离子的参数文件，并在leap.in中调用；（2）若蛋白质体系中含有二硫键，需要将原pdb文件中的半胱氨酸名CYS修改为CYX，并使用bond命令将两个CYX的巯基连接起来，在进行拓扑制作。bond命令的一般格式为：bond atom1 atom2 [ order ]。

3 能量优化

MD模拟开始前，需要进行能量优化，以避免体系中存在的局部不合理性对模拟结果造成不良影响。常用的能量优化方法主要有最陡下降（steepest descent, SD）法和共轭梯度（conjugate gradient, CG）法。SD法利用当前位置的导数为直线搜索的方向，求取势能面的极小值。SD法具有优化速度快、省机时的特点。即使从一个不太好的初始点X⁰出发，往往也能收敛到局部极小。其缺点则是收敛速度慢。当初始点远离极小点时，收敛速度快，但越是接近极小点附近，收敛速度就越慢。

CG法也是一种一次求导方法。与SD法不同的是，CG法在直线搜寻方向时，要考虑前一步的优化结果。因此，能较好地预测下一步的搜寻方法，收敛性更好。但是，当CG法应用于不够合理的初始结构时，搜寻速度较慢。一般而言，在进行MD模拟前，均先采用SD法优化体系，然后转入CG法优化，直至能量收敛为止。

就本文中的示例而言，在对复合物体系5JEB进行MD模拟之前，同样需要进行能量优化。优化分两次进行，第一次为约束溶质，放松溶剂的能量优化，约束力常数设为2.09×10³ kJ·mol^-1·nm^-2。先用SD法优化5000步，再用CG法优化5000步。具体操作如下：

执行命令：$ sander –O -i min1.in –o min1.out –p ../complex_wat.prmtop –c ../complex_wat.inpcrd –r comolex_min1.rst –ref ../compelx_wat.inpcrd –inf min1.info（-p表示拓扑文件；-c表示输入的初始坐标；-r表示输出的坐标；-ref表示参考坐标；-inf表示结果信息。）开始约束溶质的能量优化。图3给出了min1.in文件的内容。

图3 文件min1.in的内容

图3中各行字符段的含义如下：第一行为注释语句；&cntrl为模拟参数起始标志；imin=1表示此任务为能量优化；maxcyc=10000表示优化总步数为10000；ncyc=5000表示前5000步为SD法优化，后5000步为CG法优化；ntb=1表示周期性边界条件，启动PME方法，0为不采用，1为定容，2为定压；ntr=1表示优化后，需约束一些原子；cut=10表示非键相互作用截断值为1 nm（不能超过周期性边界条件基本单元长的一半）；Hold the PROTEIN fixed为约束说明；500.0为约束力常数，单位为kcal·mol^-1；RES 1 302表示约束残基范围；END END为结尾标识。

第二次能量优化是去除约束后的优化，同样优化10000步，前5000步采用SD法，后5000步采用CG法。收敛条件为能量梯度小于4.18×10^-4 kJ·mol^-1·nm^-1。具体操作如下：

输入命令：$ sander –O –i min2.in –o min2.out –p ../complex_wat.prmtop –c complex_min1.rst –r complex_min2.rst –inf min2.info，参数解释同上。图4给出了min2.in文件的内容，图中ntr=0表示无约束优化。