Escolar Documentos
Profissional Documentos
Cultura Documentos
GROMACS-Tutorial (Portuguese BR) v.1.6 PDF
GROMACS-Tutorial (Portuguese BR) v.1.6 PDF
Verso 1.6
Ricardo O. S. Soares , MsC.
Group of Biological Physics, Dept. of Physics & Chemistry, Pharmaceutics Sciences Faculty from Ribeiro
Preto - University of So Paulo.
Av. do Caf, S/N - ZIP:14040-903 - Ribeiro Preto, So Paulo, Brazil - Phone: +55 1636024840.
http://lattes.cnpq.br/0777038258459931
rsoares@fcfrp.usp.br
Consideraes Gerais
Motivao do Tutorial. Este tutorial vem com o objetivo de introduzir passo a passo uma
simulao simples de dinmica molecular em protenas utilizando o pacote de programas
GROMACS. Inicialmente elaborado para auxiliar estudantes iniciantes nesse campo em nosso
laboratrio, este tutorial em portugus foi adaptado para atender as necessidades de um
pblico mais geral. Agradeo o Prof. Dr. David van der Spoel pelo convite e pela oportunidade.
Dvidas e sugestes: no hesite em me escrever!
Verso GROMACS Utilizada. Neste tutorial utilizamos a verso 4.5.5, ou seja, os comandos e
procedimentos aqui so compatveis com as mais novas verses do pacote. Ateno, partir da
verso 4.6, o sistema de instalao mudou completamente, sendo agora utilizado o cmake
(http://www.cmake.org/) para tanto, isso ser tratado na prxima verso do tutorial.
Para quem serve esse tutorial (Pr Requisitos). Este manual serve para estudantes de
graduao ou ps-graduao que no possuam noo alguma sobre a dinmica molecular, em
especial no funcionamento do pacote GROMACS. O usurio deve estar habituado com
conceitos bsicos da computao. Habilidade bsica em Linux desejvel, porm o tutorial traz
algumas dicas e uma tabela bsica de comandos que podem ajudar aqueles que nunca
trabalharam com esse sistema operacional. Dinmica molecular no um assunto trivial,
altamente recomendvel ler sobre ela. Pesquise na internet sobre o assunto, leia o manual do
GROMACS, procure livros sobre o assunto.
Dificuldade do Tutorial. muito importante que o usurio possua fidelidade em seguir os
passos, para maior eficincia. A priori no recomendado substituir uma protena por outra
(neste tutorial), visto que as cargas, nmero de aminocidos etc mudam, muitas vezes
radicalmente, o que pode alterar drasticamente os resultados finais. Este texto foi escrito
pensando como um aluno que nunca teve contato com a rea, ento acredito que no existam
grandes dificuldades.
Atualizao do Tutorial. O tutorial tentar manter-se atualizado, no entanto, caso algum link
apresentado aqui no funcione, por favor, escreva no e-mail de contato (pgina anterior), para
atualizao.
Dicas gerais:
- Sempre leia o manual oficial, ele tem informaes muito importantes sobre a dinmica
molecular
e
o
funcionamento
do
GROMACS
(em
ingls:
http://www.gromacs.org/Documentation/Manual).
- Ainda no se tem notcia de um tutorial que consegue esclarecer completamente o usurio,
dvidas sempre existiro. O que fazer nesses casos? Voc pode fazer uma pesquisa geral na
internet (http://www.google.com/); pesquisar nos arquivos de dvidas de usurios do GROMACS
(http://www.gromacs.org/Support/Mailing_Lists) e ainda se inscrever e enviar suas prprias dvidas,
mas cuidado, provavelmente sua dvida j foi respondida em algum momento, procure nos arquivos
antes!
- O console (ou terminal) do Linux (aqui usaremos UBUNTU) uma janela que aceita comandos
de texto e oferece uma interface poderosa. Se voc estiver comeando a trabalhar no Linux,
habitue-se a utiliz-lo sempre (para simulaes numricas ele pode ser at 10x mais rpido que
o concorrente pago). Procure em seu sistema como voc pode acess-lo.
Lista de Comandos bsicos no console do Linux:
Acessar diretrio ........................................................................................ cd nome do diretrio
Criar diretrio .....................................................................................mkdir nome do diretrio
Remover diretrio .............................................................................. rm r nome do diretrio
Remover arquivo ........................................................................................ rm nome do arquivo
Visualizar nome de arquivos no diretrio, em lista .......................................................... ls -la
Copiar arquivo ................................................cp nome do arquivo /caminho_da_pasta_alvo
Mover arquivo .............................................. mv nome do arquivo /caminho_da_pasta_alvo
Renomear arquivo ................................................................ mv nome do arquivo novo nome
Descompactar arquivos tar.gz .......................................................... tar zxvf arquivo.tar.gz
Modo superusurio .............................................................. su password ou sudo password
Dica: utilize a funo da tecla tab de completar os nomes de arquivos e comandos no console
do Linux, isso traz mais dinmica interface. Exemplificando, se voc digitar a chamada do
programa grompp, digitando apenas grom e pressionando a tecla tab o console completa
o resto para voc. Isso particularmente til para arquivos de nome longo, como
1TSK_273K_langevin01.gro.
Tutorial GROMACS
Pr-requisitos
(I) Compiladores:
Para compilar o cdigo fonte GROMACS (veja na seo 1.2 como
proceder para obt-lo) devemos primeiramente possuir os subsdios
para transform-lo em um aplicativo executvel, ou seja, precisamos
de compiladores. Neste caso, so necessrios compiladores C/C++ e
FORTRAN, os quais se encontram na maioria dos casos j instalados
5
(II) MPI:
GROMACS suporta multi-processamento2,3. At pouco tempo era
necessrio a instalao de do MPI, no entanto, aps as verses 4.5,
este passo se tornou obsoleto, e portanto podemos avanar para o
prximo item.
Para notificar-se se voc j possui o g77, v ao console, digite g7 e tecle TAB. Caso o console complete g7
para g77, tudo bem, caso contrrio ele est ausente do sistema. O mesmo procedimento serve para o g+.
2
O multi-processamento aquele que utiliza mais de um processador. Ento em uma mquina Quad Core,
possvel o processamento por quatro ncleos. Isso aumenta sensivelmente a velocidade da simulao.
3
Para descobrir quantos processadores existem em seu computador, digite no terminal: grep processor
/proc/cpuinfo. Ateno que a contagem inicia-se no zero, ou seja um dual core ter processador 0 e
processador 1 (dois, portanto).
4
Os prprios desenvolvedores do GROMACS aconselham a utilizao da livraria externa FFTW.
Agora a instalao:
Agora a instalao:
make install
(aguarde o processamento...)
1.2
Instalao do GROMACS
No se preocupe caso voc no saiba qual seu tipo de shell, se por exemplo voc digitar um
desses comandos bash em sistema tsch, ele no funcionar, nesse caso, troque o comando.
Agora acesse o diretrio em que GROMACS foi descompactado e entre:
./configure --enable-mpi prefix=/dir/de/instalao
(aguarde o processamento...)
Fique atento novas verses saem quase que constantemente. Acompanhe as atualizaes no site oficial, seo
de downloads. Para detalhes sobre as verses 4.x.x, leia a referncia 17.
Novamente fique atento para o diretrio de instalao. Caso queira escolher um, no
caso de no ser possvel o acesso de administrador, mantenha o comando --prefix=/..., caso
contrrio, remova essa parte e deixe o programa ser instalado na raiz (recomendado).
Se neste ponto voc se arrependeu de algum comando ou se equivocou na parte de
configurao do GROMACS, s digitar o comando abaixo e digitar novamente o comando de
configurao com os parmetros desejados.
make distclean
(aguarde o processamento)
Estamos quase finalizando a instalao. Agora mais um passo: a compilao. Para isso
simplesmente digite:
make
(aguarde
o processamento
tomar um caf)
Finalmente,
para concluir
a instalao, ov
ltimo
Ento:
make install
(aguarde o processamento outro caf...)
Para atribuir os programas do pacote aos atalhos, construa os links com o comando:
make links
(aguarde o processamento)
2.0
Uma vez em posse de 1tsk.pdb, voc pode visualiz-lo para ter mais intimidade com este tipo
de arquivo. Para isso obviamente necessrio algum programa de visualizao como: VMD
(http://www.ks.uiuc.edu/Research/vmd/), PyMol (http://pymol.sourceforge.net/), DeepView SwissPDBViewer (http://spdbv.vital-it.ch/), Rasmol (http://www.umass.edu/microbio/rasmol/),
entre outros.
10
minimizacao.mdp
pasta
minimizacao
minimizacao.mdp * pasta adicionar_ions
restricao.mdp
pasta restricao
dinamica.mdp
pasta dinamica
------minimizacao.mdp-----define
= -DFLEXIBLE
constraints
= none
integrator
= steep
nsteps
= 200
nstlist
= 10
rlist
= 1.0
coulombtype
= pme
rcoulomb
= 1.0
vdw-type
= cut-off
rvdw
= 1.0
nstenergy
= 500
emtol
= 1000.0
emstep
= 0.01
---------------------------
11
12
Importante: No manual do GROMACS existe cada um desses parmetros bem detalhados (em
ingls)
13
1: AMBER03 force field (Duan et al., J. Comp. Chem. 24, 1999-2012, 2003)
2: AMBER94 force field (Cornell et al., JACS 117, 5179-5197, 1995)
3: AMBER96 force field (Kollman et al., Acc. Chem. Res. 29, 461-469, 1996)
4: AMBER99 force field (Wang et al., J. Comp. Chem. 21, 1049-1074, 2000)
5: AMBER99SB force field (Hornak et al., Proteins 65, 712-725, 2006)
6: AMBER99SB-ILDN force field (Lindorff-Larsen et al., Proteins 78, 1950-58,
2010)
7: AMBERGS force field (Garcia & Sanbonmatsu, PNAS 99, 2782-2787, 2002)
8: CHARMM27 all-atom force field (with CMAP) - version 2.0beta
9: GROMOS96 43a1 force field
10: GROMOS96 43a2 force field (improved alkane dihedrals)
11: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205)
12: GROMOS96 53a5 force field (JCC 2004 vol 25 pag 1656)
13: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656)
14: OPLS-AA/L all-atom force field (2001 aminoacid dihedrals)
15: [DEPRECATED] Encad all-atom force field, using full solvent charges
16: [DEPRECATED] Encad all-atom force field, using scaled-down vacuum charges
17: [DEPRECATED] Gromacs force field (see manual)
18: [DEPRECATED] Gromacs force field with hydrogens for NMR
14
15
A opo box requer apenas um valor para uma caixa cbica, dodecaedro e octaedro
truncado. Com d e uma caixa triclnica o tamanho especificado em box utilizado. Com d e
uma caixa cbica, dodecadrica ou octadrica, as dimenses so ajustadas ao dimetro do
sistema, ou seja maior distncia entre tomos, mais duas vezes a distncia especificada (no
caso, 1.2 nm). Observe a figura 2.2 (o quadrado representa a caixa).
16
17
Para manter o nmero original de tomos no sistema, o prompt do programa vai lhe dar
as opes do meio a ser substitudo pelos ons neutralizantes a serem introduzidos. A melhor
opo para nosso propsito a remoo de molculas de gua, ou seja, de solvente ( selecione
a opo nmero 12 (SOL)].
19
previamente minimizada, para evitar problemas como exploses na caixa de hidratao por
possveis contatos prximos demais entre tomos (7 Passo).
Todo o processo desde os arquivos .pdb converso ao formato gromos, confeco da
caixa de solvatao, ao preenchimento da mesma etc. foi um caminho de preparao ao mdrun.
Este programa l o arquivo de entrada e distribui a topologia de maneira apropriada ao tipo de
simulao, se disponveis, em processadores paralelos. Primeiramente uma lista de vizinhanas
feita, ento as foras comeam a serem computadas (com base na temperatura e presso),
globalmente somadas e velocidades e posies so atualizadas. Se necessrio, uma agitao
feita para se restringir os comprimentos e ngulos das ligaes.
So gerados trs arquivos ao fim do processo: a trajetria, o qual contm as
coordenadas de todos os tomos ao longo do tempo (portanto as velocidades); a estrutura,
guarda as coordenadas e velocidades do ltimo passo; a energia, salva valores de energia,
presso entre outros. Um arquivo de log tambm gerado, o qual pode vir a ser til para fins
de arquivamento do processo.
Uma nova realizao possvel (pelo comando rerun) caso haja necessidade. Energias e
foras sero recalculadas, busca pela vizinhana ser feita em cada passo a menos que nstlist
seja igualado a zero no arquivo de parametrizao .mdp. Neste arquivo, podemos tambm
personalizar funes de potenciais para mdrun utilizar.
Sem mais delongas, entre no diretrio dinamica e digite o seguinte comando:
20
2.1
Analisando a simulao
I)
Uma das medidas mais comuns para se avaliar a condio da protena ao longo da
trajetria a quantificao da deformao da estrutura em comparao referncia do ponto
inicial. Essa avaliao feita atravs do RMSD (Root Mean Square Deviation), e pode ser
calculada basicamente de duas maneiras:
- Por ajuste de estruturas (fit). Para cada passo, a protena ajustada espacialmente ao modelo
inicial, ento a seguinte equao aplicada:
1
=
1/2
1/2
=1 =1
onde rij(t) e rij(o) se referem distncia entre os dois tomos i e j respectivamente no tempo t
arbitrrio e no tempo inicial t=0. Essa medida feita atravs do programa g_rmsdist.
21
Em nossa anlise, utilizaremos o primeiro mtodo (no entanto uma boa idia o uso de ambos
os mtodos, com posterior comparao, apenas em nvel de aprendizagem). Agora procedamos
com o comando (dentro da pasta dinamica):
xmgrace rmsd.xvg
22
II)
Raio de Girao
1/2
23
III) Animao
(Selecione a opo 1)
24
Para ver o resultado, utilize qualquer visualizador de protenas com suporte a frames
mltiplos tais como PyMol ou VMD.
3.0
Consideraes Finais
Agora voc j tem meios de seguir em frente sozinho. Baixe outras protenas, estenda a
simulao, rode em paralelo, enfim pense sobre o problema e procure analisar o que seja adequado s
suas necessidades. Este tutorial introdutrio, ele te guiou at aqui e lhe fez economizar considervel
esforo, poupando-lhe encontros com literatura especializada em contato imaturo, o que s serviria
para afugentar algumas pessoas. No entanto, conforme v progredindo, imperativo o
acompanhamento de artigos mais especficos e densos, pois s assim voc progride de forma satisfatria
para lidar com um campo to emergente quanto complexo como a dinmica molecular.
25
4.0
Leitura Recomendada
[3] van der Spoel, D.; Lindahl, E.; Hess, B.; Groenhof,
G.; Mark, A. E.; Berendsen, H. J. C.
J. Comp. Chem., 26:17011718, 2005.
[17] Hess, B.; Kutzner, C.; van der Spoel, D.; Lindahl,
E. J. Chem. Theory Comput., 4:435-447, 2008.
26