同源建模 Modeller

Posted by XiLock on December 11, 2019

不同同源建模平台

  1. CPH-Model v3.0 (DTU Health Tech,Department of Health Technology, Lyngby, Denmark),
  2. Phyre-2(Structural Bioinformatics Group, Imperial College, London, England),
  3. Swiss-Model (Protein Structure Bioinformatics Group, University ofBasel Klingelbergstrasse, Basel, Switzerland):没办法补缺失的氨基酸。教程可参考SWISS-MODEL同源建模快速入门
  4. I-TASSER服务器(Zhang服务器):从头建模的,不能做太长的蛋白建模,只能分段完成,分段的话需要把几段拼一起,很麻烦。
  5. Modeller:Sali lab开发,可以进行多聚体建模,二硫键建模,杂原子建模等。自带一套结构评价体系。该工具完全通过命令行控制(University of California, San Francisco, CA, USA).
  6. Yasara:一款商业化的多功能软件,内部包括同源建模模块.
  7. nest:由美国Columbia University 的Barry Honig教授及其同事开发,能够在SGI and Intel Linux平台下运行.

安装

Modeller官网Anaconda网站上有详细的安装说明,Xilock还是习惯用anaconda,进conda环境后,输入以下两行命令就行了:

conda config --add channels salilab
export KEY_MODELLER=MODELIRANJE
conda install modeller

conda config --add channels salilab
set KEY_MODELLER=MODELIRANJE
conda install modeller

注:MODELIRANJE为通用的学术key,公司不可用,可以自己去Modeller官网注册

或:
Authentication Prerequisites:anaconda login
To install this package run one of the following: conda install -c salilab modeller

有时候会下载的很慢或者报错:“An HTTP error occurred when trying to retrieve this URL. HTTP errors are often intermittent……”、“PackagesNotFoundError: The following packages are not available from current channels: - modeller”等,可能是源的问题,就是默认下载东西的链接是国外的镜像,存在一些问题,因此将源改成国内的镜像即可(清华或者中科大),不会或者嫌麻烦的话,直接把下面这段代码替换到“C:\Users\Xilock.condarc”里:

channels:
  - salilab
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

如果安装时没设置License,那么安装完后设置下License,“set KEY_MODELLER=MODELIRANJE”,或在“C:/Users/Xilock/.conda/envs/py36env\Library\modeller/modlib/modeller/config.py”里把license = r'XXX' 改为license = r'MODELIRANJE'

测试

可以在Modeller官网下载算例,然后测试:

  1. 创建新文件夹,把序列文件“TvLDH.ali”、模板文件“1bdm.pdb”、序列对比命令“align2d.py”、同源建模命令“model-single.py”复制进去,注意ali文件中序列的最后要加一个*。
  2. 序列对比,运行python align2d.py得到序列比对文件PIR (“TvLDH-1bdmA.ali”) and PAP (“TvLDH-1bdmA.pap”)。
  3. 同源建模:运行python model-single.py,生成5个models。

结构验证

  1. [UCLA-DOE的SAVES服务器(http://servicesn.mbi.ucla.edu/):包括PROCHECK、WHAT_CHECK、ERRAT、VERIFY_3D、PROVE、CRYST1 record matches、Ramachandran Plot、WedMol Viewer。这些软件可以分为两类:一类是检查结构的立体化学信息,比如PROCHECK。立体化学信息包括键长,键角,对称性,结构包埋率等等。另一类是检查序列与结构的匹配度,比如VERIFY 3D。

以拉式图分析为例。拉氏图分为四个区域: most favoured (red), additional allowed (yellow), generously allowed (light yellow) 以及disallowed (white),红色表示的是最合适的区域,白色表示最不适合的区域。一个高质量的蛋白质结构的分辨率通常小于2 Å, R-factor小于20%。统计分析118个这样的蛋白质结构表明,对于一个高质量的模型结构来说,其90%的ϕ and ψ 值都应该在红色的区域内.

残基补全

参考资料:

  1. MODELLER初级教程中译
  2. 官方教程:Missing residues

参考资料

  1. Modeller同源或比较建模安装及使用操作教程
  2. 解决:An HTTP error occurred when trying to retrieve this URL. HTTP errors are often intermittent……
  3. 小康学习 Modeller文档学习笔记

旧参考资料:

  1. 一文了解如何利用同源建模预测蛋白质三级结构
  2. 利用Modeller构建未知序列三维结构(利用cryo-EM map)的详细流程
  3. 同源建模方法整理
  4. 同源建模详细讲解-整理版
  5. DS同源建模讲义
  6. 同源建模工具easymodeller4.0 操作说明
  7. Easymodeller 4.0: a new gui to modeller,或链接1链接2


手机版“神探玺洛克”请扫码