参考资料
CG2AT
- 可以从Github库直接下载;或
conda install -c stansfeld_rg cg2at后将其添加路径export PATH="path_to_CG2AT2:$PATH" - 测试例教程见官网,所需文件可点击这里下载
tar -xzf tutorial_files.tar.gz cd tutorial_files cg2at -c dynamic.gro -a kalp-AA.pdb -ff charmm36-jul2020-updated -fg martini_3-0_charmm36 -w tip3p - 系统会开展以下流程,If the programme fails, in each folder (and any sub-folders) the gromacs-outputs file will record if there are any warnings/errors.比如你的gmx不是并行版可能会报错,把代码中的-ntmp改掉
- Initialisation
- Read in CG system
- Build protein systems
- Build non-protein system
- Merge and minimise de novo
- NVT on de novo
- Creating aligned system
- 待解决问题:win系统提示 “You have selected the forcefield: charmm36-jul2020-updated You have selected the fragment library: martini_3-0_charmm36 Cannot find fragments for: other You have selected the water model: TIP3P Cannot find fragment: ARG/ARG.pdb”,而linux运行不会有该问题。
Backward
- linux系统下成功,win系统下的anaconda中会有路径问题,相关文件太多xilock暂未解决.
- Reverse coarse-graining with Backward
- Martini粗粒化体系到全原子体系的反向映射
CG2AT vs. Backward
| 维度 | CG2AT(CG2AT2) | Backward |
|---|---|---|
| 核心原理 | 基于片段(fragment)的几何匹配与能量最小化。先将预先准备好的原子片段对齐到对应的粗粒化(CG)珠子上,再进行简短的 NVT 平衡和/或受控的 steered MD,以恢复原子间的几何关系[[1]]。 | 采用几何投影的方式:把原子放置在对应 CG 珠子的加权平均位置上,随后通过手工编写的映射文件对特定原子进行位置微调,最后进行能量最小化和短时 MD 进行松弛[[2]]。 |
| 实现方式 | - 片段库(fragment database)由实验或高分辨率模拟提供。 - 自动对齐 + 逐片段能量最小化。 - 可选 steered MD 将结构“拉回”到参考原子结构。 |
- 纯几何规则:原子坐标 = CG 珠子坐标的线性组合。 - 需要 .map 文件描述每个 CG 珠子对应的原子集合。 - 通过 initram.sh 生成临时文件,随后执行 backward.py 完成投影与松弛[[3]]。 |
| 对立体化学(手性、顺反)处理 | 片段库中已包含正确的手性信息,映射时直接使用对应的片段,避免翻转或手性错误[[4]]。 | 依赖映射文件手动指定原子顺序,若映射不完整或不当,容易出现 翻转(flipped)或手性错误,文献中多次报告此类问题[[5]]。 |
| 输入要求 | - CG 结构(Martini 等)。 - 可选 -d(复制链)和 -vs(虚拟位点)等标志。 - 片段库(随软件提供)和映射文件(自动生成或手动编辑)。 |
- CG 结构(Martini 2/3)。 - 完整的 .map 文件(需用户自行编写或从模板修改)。 - 可选的 initram.sh 脚本参数。 |
| 后处理步骤 | 1️) 初始片段对齐 2️) 能量最小化(EM) 3️) 短时 NVT(≈10 ps) 4️) 如需更高精度,可执行 steered MD(可选)[[6]]。 |
1️) 几何投影 2️) 初始随机 “kick” 以避免原子重叠 3️) 两轮能量最小化(EM1、EM2) 4️) 短时 NVT/ NPT 松弛(通常 10–20 ps)[[7]]。 |
| 计算效率 | 片段匹配后只需少量 EM 与短 NVT,线性随原子数增长,在大系统(> 800 k 原子)仍保持约 2–3 倍 的速度优势[[8]]。 | 由于几何投影后原子重叠较多,第二轮 EM 常出现 并行受限,在同等规模系统上运行时间约为 CG2AT 的 2–3 倍,且在极大系统(≈ 800 k 原子)会出现异常长的计算时间[[9]]。 |
| 成功率 / 稳定性 | 在文献测试中 ≈ 98 % 的成功率(仅少数因映射文件错误而失败),且大多数系统在第一次运行即可得到合理结构[[10]]。 | 成功率约 60 %(文献中 37/60 成功),常因第二轮 EM 期间出现 原子冲突导致崩溃,需要手动调参或重新运行[[11]]。 |
| 适用场景 | - 需要 高保真手性、复杂分子(蛋白质、脂质、配体) 的多尺度模拟。 - 对 速度 与 成功率 有较高要求的高通量工作流。 |
- 对 快速原型 或 小型系统(单膜、少量蛋白) 的快速回转需求。 - 已有成熟的 .map 文件库,且对手性要求不严格的场景。 |
| 主要优缺点 | 优点:片段库保证手性/立体化学;运行快、成功率高;可选 steered MD 提升精度。 缺点:需要维护片段库,初始学习曲线略高。 |
优点:实现简单、依赖少(仅映射文件),适合快速实验。 缺点:手性易出错、运行慢、成功率低,尤其在大系统上更易崩溃。 |
- 如果项目强调原子级手性准确性、对大体系有需求且希望流程尽可能稳健,推荐使用 CG2AT(CG2AT2)。其片段化方法在保持立体化学的同时,提供了更快的计算速度和更高的成功率[[12]]。
- 如果仅需对小规模系统进行快速原型验证,且已有完整的
.map文件,则 Backward 仍是一个轻量级的可行选择,但需注意可能出现的翻转或崩溃问题[[13]]。
在实际工作流中,常见的做法是先用 Backward 进行快速测试,确认系统可行后再切换到 CG2AT 进行正式的高精度回映射,以兼顾效率与可靠性。
手机版“神探玺洛克”请扫码