原文分子动力学模拟蛋白-配体复合物过程中配体发生脱离的原因来自sob老师,为方便翻阅,进行整理
相互作用分析
- 氢键(通常主要本质是静电吸引作用,见http://sobereva.com/513)
- 盐桥(配体显离子性部分与氨基酸侧链带相反电荷基团的静电吸引)
- 范德华作用(具体来说是指色散吸引效应
- pi-pi堆积本质上与此也相同)
- 疏水作用(本质上来自于溶剂的熵效应)
分子结构的来源
- X光衍射测的复合物结构:这样的初始结构通常质量较高,小分子理应能在动力学过程中结合在初始的位置。但是也要注意,晶体状态的复合物结构只是实验测定条件下的最稳定结构,而在现实条件的动力学模拟过程中,由于热运动和溶剂效应,小分子未必就一定能始终稳定呆在晶体中原本的位置。另外,有些晶体结构的解析度较低,比如三点几埃,此时配体、氨基酸残基位置的不确定性很高,可能此结构下侧链与配体的相互作用情况和实际有明显偏差,进而可能导致模拟开始后没多久配体就跑掉。
- 分子对接得到的复合物结构:如果没有复合物晶体结构但是有蛋白质晶体结构,通常就是用对接得到的打分最高到的复合物结构当初始结构。受制于采样充分程度、打分函数的准确度、对受体的柔性考虑等因素,对接产生的初始结构的可靠性明显不如较高解析度的晶体衍射测出来的结构。很多人做过分子对接后都是再专门跑一下分子动力学检验配体能否基本维持在对接产生的位置,从而检验对接产生的结构的合理性。使用这种结构当初始结构时,如果配体在动力学模拟过程中跑掉了,很可能就是因为对接产生的打分最高的结构并不合理。此时可以考虑用你觉得看上去也靠谱但打分不是最高的复合物结构试试,或者换其它对接程序得到的结构试试。
- 对接得到的结构,而且蛋白质结构是预测出来的:这无疑是可靠性最低的结构,因为蛋白质本身结构的可靠性都成问题。这种情况配体如果在模拟中跑出来,除了考虑对接的问题外,当然也得考虑蛋白质三维模型是否真的合理。蛋白质预测程序/方法很多,其中一种不理想时可以再考虑别的,选择余地较大,比如基于同源模建的Modeller、Robetta等,基于深度学习预测蛋白质结构的AlphaFold 2和RoseTTAFold。
力场
目前模拟蛋白质+小分子体系的常见组合是AMBER(蛋白质)+GAFF(小分子)、CHARMM(蛋白质)+CGenFF(小分子)、GROMOS(直接描述蛋白质,并结合ATB创建的配体拓扑文件)、OPLS-AA(直接描述蛋白质,并结合LigParGen创建的配体拓扑文件)。其实以上这些蛋白质+小分子描述的组合,对于前述的范德华作用的描述没太大差异(而且通常范德华作用对蛋白质-配体结合的贡献相对来说较次要),而且也不直接影响疏水作用(疏水作用是在动力学模拟过程中自然而然体现的,不是在力场层面上描述的),也没法说哪个一定更好。对于GROMACS用户,sob个人建议优先考虑AMBER14SB结合acpype创建的基于GAFF力场的小分子拓扑文件,主要是因为这俩力场都比较鲁棒,AMBER14SB有GROMACS现成的力场包而且描述蛋白质构象较好(虽然目前也有更新的AMBER19SB,但截止到撰文时网上还没有现成的GROMACS力场包,对于描述蛋白-配体作用方面它比AMBER14SB没有额外优势),而且acpype程序用起来方便,还有在线版。如果在AMBER14SB+GAFF结合RESP2(0.5)原子电荷下模拟蛋白-配体复合物时出现配体中途跑掉的情况(而且看上去小分子自身结构的描述没啥问题),换力场也大概率解决不了。虽然也可以再试一个别的力场组合,但如果发现还不行,一般也没必要再试了,而应该从本文提及的其它角度考虑跑掉的原因。
有些特殊的蛋白-配体相互作用不是靠以上常见的力场能直接描述的。比如碘代苯和蛋白质上负电性原子间可以形成显著的卤键,这光靠原子电荷是没法展现的,而必须表现出卤原子周围电荷分布的各向异性,这需要修改原先的模型,考虑额外点电荷,或考虑原子多极矩。例如在JCTC, 14, 5383 (2018)有人提出给GROMOS力场的卤原子的σ-hole区域增加额外的正电性的点电荷使得卤键能够定性正确表现出来。PS:在GROMACS中如果想用此文的方式,需要依靠虚拟点来实现。另外,如果蛋白-配体之间有涉及过渡金属的配位键出现,光靠原子电荷描述的静电吸引作用一般也不足矣正确描述和维持之,此时往往需要加上限制势人为强行维持住。而对于涉及到高价主族金属离子的蛋白-配体结合,光靠原子电荷表现静电作用可能也描述不充分,因为明显的极化作用对结合会产生稳定化,这一般需要量子化学方法才能准确描述,因此这种情况下若配体在动力学过程中跑飞了的话也得考虑加上限制势来强行维持住金属离子与周围原子的作用。质子化状态
配体、残基侧链在结合时所处的质子化状态也是要恰当考虑的,否则无法正确表现蛋白-配体间的实际相互作用。有的配体、氨基酸残基在不同pH下有不同的质子化状态,而且蛋白-配体的相互作用还可能影响质子化状态。对于组氨酸尤其要注意考虑,它在模型体系中的pKa接近7,在生理环境下模拟时其侧链的质子化态有较大不确定性,受环境影响明显,既可以处于中性(侧链上的一个氮被质子化),也可以带一个正电荷(侧链上两个氮都被质子化)。当配体与组氨酸可能存在氢键作用时,组氨酸的质子化状态应当是有利于氢键形成的。
MD参数
动力学模拟设置不合理也是可能导致小分子跑掉的原因。做蛋白-配体的正式动力学模拟之前一般都是在给蛋白质和配体加上位置限制势的情况下跑一段短暂的动力学,以使得溶剂分子在这个过程中能充分弛豫、迎合复合物结构。如果没做这一步而直接跑常规的动力学的话,有可能会由于初始加的水的位置不够理想,不仅没有描述充分实际的水环境,甚至造成出现一些不合理的互斥,导致配体跑出去。另外,做生物体系的动力学我一般建议让参考温度从0 K开始缓慢线性上升,这样最为稳妥。如果让程序随机产生初速度,而且初速度对应的温度又不太低且没加限制势,也没准会导致在模拟初期配体和蛋白的相互作用尚未充分稳定的时候配体由于拥有过高的动能而跑走。
初期不稳定
如果复合物结构是通过对接方式产生的,发现动力学模拟还没有跑多久配体就脱离了,可以考虑给小分子和与之相互作用的残基之间恰当地加上一个或多个较弱的距离限制势(怎么加根据具体结构随机应变,比如如果配体和小分子之间通过氢键维持,可以给氢键作用的原子间加上限制势维持住氢键距离),避免小分子跑掉。等动力学跑一阵子后,蛋白质的口袋区域的构象就弛豫了,蛋白-配体相互作用会比一开始的状态有所增强,之后再去掉限制势进行正式的模拟,说不定配体就能一直呆住了。注意,除非是由于前述的力场的局限性而不得不加限制势,否则正式模拟时限制势必须去掉,否则相当于给模拟引入了明显的人为因素,发文章的话容易被审稿人抨击。
动态平衡
不要以为配体在现实中就应该始终和蛋白是维持结合状态的,不能一味地认为模拟中出现解离的现象就一定是错误的。有的人跑复合物的模拟并非才跑了没多久配体就脱离了,而是跑了好几百ns才出现配体脱离现象,很可能正是体现出真实的配体解离现象。
手机版“神探玺洛克”请扫码