Você está na página 1de 26

GROMACS (4.5.

5): Tutorial para iniciantes (em Portugus-BR)


[GROMACS: Beginners Tutorial (Portuguese-Brazil)]

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

GROMACS (4.5.5): Tutorial para iniciantes (em Portugus-BR)


[GROMACS: Beginners Tutorial (Portuguese-Brazil)]
(Dez/2013)

Verso 1.6
Ricardo O. S. Soares , MsC.
Group of Biological Physics, Dept. of Physics & Chemistry, Pharmaceutics Sciences Faculty from Ribeiro
Preto - University of So Paulo.
Av. do Caf, S/N - ZIP:14040-903 - Ribeiro Preto, So Paulo, Brazil - Phone: +55 1636024840.

http://lattes.cnpq.br/0777038258459931
rsoares@fcfrp.usp.br

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

Consideraes Gerais

Motivao do Tutorial. Este tutorial vem com o objetivo de introduzir passo a passo uma
simulao simples de dinmica molecular em protenas utilizando o pacote de programas
GROMACS. Inicialmente elaborado para auxiliar estudantes iniciantes nesse campo em nosso
laboratrio, este tutorial em portugus foi adaptado para atender as necessidades de um
pblico mais geral. Agradeo o Prof. Dr. David van der Spoel pelo convite e pela oportunidade.
Dvidas e sugestes: no hesite em me escrever!
Verso GROMACS Utilizada. Neste tutorial utilizamos a verso 4.5.5, ou seja, os comandos e
procedimentos aqui so compatveis com as mais novas verses do pacote. Ateno, partir da
verso 4.6, o sistema de instalao mudou completamente, sendo agora utilizado o cmake
(http://www.cmake.org/) para tanto, isso ser tratado na prxima verso do tutorial.
Para quem serve esse tutorial (Pr Requisitos). Este manual serve para estudantes de
graduao ou ps-graduao que no possuam noo alguma sobre a dinmica molecular, em
especial no funcionamento do pacote GROMACS. O usurio deve estar habituado com
conceitos bsicos da computao. Habilidade bsica em Linux desejvel, porm o tutorial traz
algumas dicas e uma tabela bsica de comandos que podem ajudar aqueles que nunca
trabalharam com esse sistema operacional. Dinmica molecular no um assunto trivial,
altamente recomendvel ler sobre ela. Pesquise na internet sobre o assunto, leia o manual do
GROMACS, procure livros sobre o assunto.
Dificuldade do Tutorial. muito importante que o usurio possua fidelidade em seguir os
passos, para maior eficincia. A priori no recomendado substituir uma protena por outra
(neste tutorial), visto que as cargas, nmero de aminocidos etc mudam, muitas vezes
radicalmente, o que pode alterar drasticamente os resultados finais. Este texto foi escrito
pensando como um aluno que nunca teve contato com a rea, ento acredito que no existam
grandes dificuldades.
Atualizao do Tutorial. O tutorial tentar manter-se atualizado, no entanto, caso algum link
apresentado aqui no funcione, por favor, escreva no e-mail de contato (pgina anterior), para
atualizao.

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

Dicas gerais:
- Sempre leia o manual oficial, ele tem informaes muito importantes sobre a dinmica
molecular
e
o
funcionamento
do
GROMACS
(em
ingls:
http://www.gromacs.org/Documentation/Manual).
- Ainda no se tem notcia de um tutorial que consegue esclarecer completamente o usurio,
dvidas sempre existiro. O que fazer nesses casos? Voc pode fazer uma pesquisa geral na
internet (http://www.google.com/); pesquisar nos arquivos de dvidas de usurios do GROMACS
(http://www.gromacs.org/Support/Mailing_Lists) e ainda se inscrever e enviar suas prprias dvidas,
mas cuidado, provavelmente sua dvida j foi respondida em algum momento, procure nos arquivos
antes!

- O console (ou terminal) do Linux (aqui usaremos UBUNTU) uma janela que aceita comandos
de texto e oferece uma interface poderosa. Se voc estiver comeando a trabalhar no Linux,
habitue-se a utiliz-lo sempre (para simulaes numricas ele pode ser at 10x mais rpido que
o concorrente pago). Procure em seu sistema como voc pode acess-lo.
Lista de Comandos bsicos no console do Linux:
Acessar diretrio ........................................................................................ cd nome do diretrio
Criar diretrio .....................................................................................mkdir nome do diretrio
Remover diretrio .............................................................................. rm r nome do diretrio
Remover arquivo ........................................................................................ rm nome do arquivo
Visualizar nome de arquivos no diretrio, em lista .......................................................... ls -la
Copiar arquivo ................................................cp nome do arquivo /caminho_da_pasta_alvo
Mover arquivo .............................................. mv nome do arquivo /caminho_da_pasta_alvo
Renomear arquivo ................................................................ mv nome do arquivo novo nome
Descompactar arquivos tar.gz .......................................................... tar zxvf arquivo.tar.gz
Modo superusurio .............................................................. su password ou sudo password

Dica: utilize a funo da tecla tab de completar os nomes de arquivos e comandos no console
do Linux, isso traz mais dinmica interface. Exemplificando, se voc digitar a chamada do
programa grompp, digitando apenas grom e pressionando a tecla tab o console completa
o resto para voc. Isso particularmente til para arquivos de nome longo, como
1TSK_273K_langevin01.gro.

Tutorial GROMACS

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

1.0 Configurao do Sistema


Apesar de existirem maneiras de se obter verses do GROMACS para o sistema
operacional Windows, com nfase no se recomenda o uso destas, pois o cdigo do programa
j vem pronto para ser compilado em Linux, com todas as otimizaes necessrias para se
obter um melhor desempenho. Alm do mais, vrios dos pr-requisitos so tambm otimizados
para Linux, alm do qual por si s oferece plataforma para processamento muito mais rpido
que o outro sistema operacional. Por esta e outras razes, optamos pela elaborao de um
tutorial direcionado para Linux. Ateno: a configurao de sistemas operacionais varia
bastante, ento problemas particulares podem aparecer para voc. Nesse caso siga as
instrues originais de instalao em http://www.gromacs.org/Downloads/Installation_Instructions
1.0.1 Downloads e criao de pastas
Apresento aqui duas alternativas: o usurio pode optar por baixar (download) as pastas com os
arquivos j prontos, concentrando-se apenas na simulao em si; ou seguir os passos iniciais do
tutorial para a criao desses arquivos. A primeira opo mais rpida, porm a segunda mais
informativa e altamente recomendada, visto que explica vrios dos fundamentos da
parametrizao da simulao.
1.1

Pr-requisitos

Para se obter mximo desempenho do GROMACS, necessria a instalao de alguns


aplicativos adicionais antes do procedimento principal. Essa seo descreve passo a passo as
etapas dessa preparao inicial. importante ressaltar que a instalao a mesma para
computadores multi core, e sistemas 32 ou 64 bits. Caso haja algum problema de permisso
para acessar pastas ou modificar arquivos, utilize no terminal o comando sudo chmod 777
nome do arquivo/ou pasta para torn-lo (a) acessvel (cuidado com arquivos de sistema!).
Ateno: Antes de comear, certifique-se que voc
instalar tudo em reas de livre acesso do Linux,
ou, preferencialmente nas pastas default como
super usurio (requer senha).

(I) Compiladores:
Para compilar o cdigo fonte GROMACS (veja na seo 1.2 como
proceder para obt-lo) devemos primeiramente possuir os subsdios
para transform-lo em um aplicativo executvel, ou seja, precisamos
de compiladores. Neste caso, so necessrios compiladores C/C++ e
FORTRAN, os quais se encontram na maioria dos casos j instalados
5

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

em distribuies Linux mais recentes. Via de regra, apenas o primeiro


compilador necessrio, mas o segundo - em conjunto com o
primeiro se faz desejvel pela otimizao de loops internos do
GROMACS, aumentando a velocidade geral das simulaes1. Usurios
de Linux (K)Ubuntu podem baixar, se necessrio, os compiladores
g++ (necessrio para a instalao do passo II) e g77 atravs dos
comandos sudo apt-get install g++ e sudo apt-get install g77 para
a tarefa ou de maneira mais visual pelo aplicativo de instalao
automtica Synaptic ou Adept Package Manager, encontrados no
Ubuntu/Kubuntu.

(II) MPI:
GROMACS suporta multi-processamento2,3. At pouco tempo era
necessrio a instalao de do MPI, no entanto, aps as verses 4.5,
este passo se tornou obsoleto, e portanto podemos avanar para o
prximo item.

(III) Biblioteca FFTW:


Esta biblioteca responsvel pelas rotinas de transformadas de
Fourier no programa principal. No obrigatria, porm gratuita,
mais robusta e mais rpida que a verso distribuda e j incorporada
ao cdigo do GROMACS4. Neste tutorial sugerimos a verso FFTW 3.3
atualmente, a qual pode ser obtida no endereo:
http://www.fftw.org/fftw-3.3.tar.gz

Para a configurao manual deste pacote interessante


procedermos com as verses simples e dupla preciso, mas voc
pode escolher apenas uma, a de sua preferncia. Existem muitas
1

Para notificar-se se voc j possui o g77, v ao console, digite g7 e tecle TAB. Caso o console complete g7
para g77, tudo bem, caso contrrio ele est ausente do sistema. O mesmo procedimento serve para o g+.
2
O multi-processamento aquele que utiliza mais de um processador. Ento em uma mquina Quad Core,
possvel o processamento por quatro ncleos. Isso aumenta sensivelmente a velocidade da simulao.
3
Para descobrir quantos processadores existem em seu computador, digite no terminal: grep processor
/proc/cpuinfo. Ateno que a contagem inicia-se no zero, ou seja um dual core ter processador 0 e
processador 1 (dois, portanto).
4
Os prprios desenvolvedores do GROMACS aconselham a utilizao da livraria externa FFTW.

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

discusses sobre vantagens e desvantagens entre os dois tipos de


preciso. De forma simplificada, a preciso simples mais rpida e
menos refinada; caractersticas estas contrrias da dupla preciso.
Para uma discusso mais aprofundada sobre o assunto, visite os
fruns (mailing list) de http://www.gromacs.org.
Primeiramente, necessrio que voc possua a biblioteca
libc6-dev, que trabalha juntamente com o compilador C.
Novamente, esta biblioteca pode ser obtida pelo Synaptic ou Adept
nos sistemas Linux (K)Ubuntu, ou pelo console.
Para preciso simples, v ao diretrio onde foram descompactados
os arquivos e digite no console:
./configure --enable-float --enable-threads prefix=/dir/de/instalao
(aguarde o processamento...)

Caso escolha a preciso dupla, digite o mesmo comando acima,


exceto o --enable-float.
Ateno, para preciso simples: se voc utiliza computador
plataforma i686 ou x86-64, adicione ao fim do comando acima -enable-sse; se voc utiliza Pentium4, Xeon ou x86-64, adicione -enable-sse2. Caso voc no tenha conhecimento da arquitetura do
sistema, utilize no console o comando uname -m para descobrir.
Mais uma vez, recomenda-se a instalao do diretrio default, mas
caso deseje mudar o endereo, s manter a ltima parte do
comando acima (--prefix=/...).
Prosseguindo com a instalao, construa o arquivo:
make
(aguarde o processamento...)

Agora a instalao:
Agora a instalao:

make install
(aguarde o processamento...)

Agora, os preparativos esto prontos. Hora da instalao do GROMACS.


7

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

1.2

Instalao do GROMACS

Primeiramente necessrio a obteno do cdigo fonte, dessa forma, acesse o link


abaixo para a verso mais atual no momento (4.5.5)5:
ftp://ftp.gromacs.org/pub/gromacs/gromacs-4.5.5.tar.gz

Aps a extrao dos arquivos comprimidos, hora da configurao. Antes do prximo


passo, valido nos atentarmos a uma situao que pode vir a ocorrer. O sistema procura a
instalao do FFTW nas pastas /usr/local/include e /usr/local/lib. Se voc instalou o FFTW sem a
opo de escolher o local de instalao, muito provvel que eles estejam no endereo
procurado e no haja problemas. Caso contrrio, se voc escolheu um diretrio para instalao,
como por exemplo /home/computador/fftw, ento necessrio os comandos de exportao
abaixo (no importa em qual diretrio voc esteja):
Para sistemas shell tcsh:
setenv CPPFLAGS -I/home/computador/fftw/include
setenv LDFLAGS -L/home/computador/fftw/lib

Para sistemas shell bash:


export CPPFLAGS=-I/home/computador/fftw/include
export LDFLAGS=-L/home/computador/fftw/lib

No se preocupe caso voc no saiba qual seu tipo de shell, se por exemplo voc digitar um
desses comandos bash em sistema tsch, ele no funcionar, nesse caso, troque o comando.
Agora acesse o diretrio em que GROMACS foi descompactado e entre:
./configure --enable-mpi prefix=/dir/de/instalao
(aguarde o processamento...)

O segundo termo necessrio em nosso tutorial, pois pretendemos executar o


programa em paralelo, obtendo assim maior velocidade. Para preciso dupla, adicione o
comando ao fim da linha --disable-float. Caso deseje utilizar a verso 3 do fftw s adicionar
o comando --with-fft=fftw3 na mesma linha.

Fique atento novas verses saem quase que constantemente. Acompanhe as atualizaes no site oficial, seo
de downloads. Para detalhes sobre as verses 4.x.x, leia a referncia 17.

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

Novamente fique atento para o diretrio de instalao. Caso queira escolher um, no
caso de no ser possvel o acesso de administrador, mantenha o comando --prefix=/..., caso
contrrio, remova essa parte e deixe o programa ser instalado na raiz (recomendado).
Se neste ponto voc se arrependeu de algum comando ou se equivocou na parte de
configurao do GROMACS, s digitar o comando abaixo e digitar novamente o comando de
configurao com os parmetros desejados.
make distclean
(aguarde o processamento)

Estamos quase finalizando a instalao. Agora mais um passo: a compilao. Para isso
simplesmente digite:
make
(aguarde
o processamento
tomar um caf)
Finalmente,
para concluir
a instalao, ov
ltimo

Ento:
make install
(aguarde o processamento outro caf...)

Para atribuir os programas do pacote aos atalhos, construa os links com o comando:
make links
(aguarde o processamento)

Tudo pronto! Agora vamos ao ponto principal deste tutorial.

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

2.0

Simulao de protenas solvatadas por Dinmica Molecular (em 10 passos)

1 Passo : Criando as pastas


Vamos primeiramente criar pastas que acomodaro os arquivos necessrios de forma
organizada (caso voc tenha optado por no baixar as pastas). Lembrando que importante
copiar os nomes de forma idntica aos apresentados aqui (sem acentos), crie uma pasta geral
para voc trabalhar e colocar seus arquivos e subpastas; nomeie-a Tutorial. Em seguida
dentro desta, crie 5 pastas: adicionar_ions, minimizacao, restricao, dinamica e dados.

2 Passo: Obtendo o modelo protico


Agora precisamos obter a estrutura protica a qual participar da simulao. Para isso v para o
depsito oficial de arquivos de estrutura de protenas na internet, o RCSC-PDB (Research
Collaboratory for Structural Bioinformatics Protein Data Bank), mais conhecido simplesmente
como PDB (http://www.pdb.org/).
Aqui utilizaremos a protena TS-Kappa. Localize a barra de busca e digite 1TSK. Abrindo a
pgina correspondente, clique no cone Download PDB file (Fig. 2.1)

Figura 2.1. Download da protena 1TSK no site do PDB.

Uma vez em posse de 1tsk.pdb, voc pode visualiz-lo para ter mais intimidade com este tipo
de arquivo. Para isso obviamente necessrio algum programa de visualizao como: VMD
(http://www.ks.uiuc.edu/Research/vmd/), PyMol (http://pymol.sourceforge.net/), DeepView SwissPDBViewer (http://spdbv.vital-it.ch/), Rasmol (http://www.umass.edu/microbio/rasmol/),
entre outros.
10

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

minimizacao.mdp
pasta
minimizacao
minimizacao.mdp * pasta adicionar_ions
restricao.mdp

pasta restricao

dinamica.mdp

pasta dinamica

*Faa uma cpia


3 Passo:
Com o arquivo 1tsk.pdb salvo na pasta Tutorial, agora devemos criar trs arquivos
essenciais, os quais guardam os valores dos parmetros desejados para a simulao.Crie
primeiro trs arquivos de texto vazios. Em seguida copie o contedo de cada quadro abaixo
(com exceo das explicaes de cada linha entre parnteses, de cor cinza)6 em cada arquivo
separadamente, produzindo assim trs tipos diferentes. Nomeie cada arquivo de acordo com o
cabealho do contedo copiado: minimizacao.txt, restricao.txt e dinamica.txt. Agora
mude a extenso dos arquivos de .txt para .mdp. Finalmente, mova os arquivos s pastas
assinaladas da maneira indicada na tabela abaixo:

------minimizacao.mdp-----define
= -DFLEXIBLE
constraints
= none
integrator
= steep
nsteps
= 200
nstlist
= 10
rlist
= 1.0
coulombtype
= pme
rcoulomb
= 1.0
vdw-type
= cut-off
rvdw
= 1.0
nstenergy
= 500
emtol
= 1000.0
emstep
= 0.01
---------------------------

(Define a flexibilidade do soluto)


(Tipo de restrio)
(Tipo de integrador, aqui o steepest descent)
(Nmero de passos)
(Frequncia de atualizao da lista de vizinhos, em passos)
(Raio de corte para vizinhos de baixo alcance)
(Esquema de tratamento de foras Coulombianas)
(Raio de corte Coulomb)
(Esquema de tratamento Van der Waals, aqui cut-off)
(Raio de corte para Lennard-Jones ou Potencial de Buckingham)
(Frequncia a escrever as energias no arquivo)
(valor mximo para a convergncia de energia, em kJ.Mol -1.nm-1)
(passo inicial, em nm)

Para maiores explicaes, favor referir-se ao manual GROMACS.


http://www.gromacs.org/Documentation/Manual

11

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012


---------------restricao.mdp----------------define
= -DPOSRES
(Define a flexibilidade/mobilidade do soluto, aqui restrita)
constraints
= all-bonds
(Constries em todas as ligaes)
integrator
= md
(Tipo de integrador, aqui o md)
nsteps
= 50000
(Nmero de passos: nsteps X dt = Tempo da simulao em ps)
dt
= 0.002
(Time-Step, tempo para passo de integrao, em ps)
nstlist
= 10
(Frequncia de atualizao da lista de vizinhos, em passos)
nstxout
= 100
(Frequncia a escrever a trajetria em arquivo)
nstvout
= 100
(Frequncia a escrever as velocidades em arquivo)
nstxtcout
= 100
(Frequncia a escrever as coordenadas em arquivo)
nstenergy
= 100
(Frequncia a escrever as energias em arquivo)
rlist
= 1.0
(Raio de corte para vizinhos de baixo alcance)
coulombtype
= pme
(Esquema de tratamento de foras Coulombianas)
rcoulomb
= 1.0
(Raio de corte Coulomb, em nm)
rvdw
= 1.0
(Raio de corte para Lennard-Jones)
Tcoupl
= v-rescale
(Tipo de termostato, aqui usamos o berendsen modificado)
tc-grps
= protein non-protein (grupos separados ao banho de temperatura)
tau-t
= 0.1
0.1
(Constante de tempo para a temperatura)
ref-t
= 298
298
(Temperatura da protena e do resto do sistema - em Kelvin)
energygrps
= Protein SOL
(Monitoramento de Energia)
Pcoupl
= Parrinello-Rahman
(Barostato de Parrinello-Rahman)
tau_p
= 1.0
(Valor de Tau, no termostato de Berendsen, quando ligado)
compressibility
= 4.5e-5
(Compressibilidade da gua a 1 ATM e 300k, unidade em bar-1)
ref_p
= 1.0
(Referencial para o barostato)
gen_vel
= yes
(Gerar velocidades iniciais por distribuio de Maxwell)
gen_temp
= 298.0
(Temperatura inicial, em Kelvin)
gen_seed
= 116247
(Semente do nmero aleatrio inicial)
-------------------------------------------

12

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012


---------------dinamica.mdp----------------define
= -DFLEXIBLE
(Define a flexibilidade/mobilidade do soluto, aqui livre)
constraints
= all-bonds
(onde sero aplicadas as constries)
integrator
= md
(Tipo de integrador, aqui o md)
nsteps
= 500000
(Nmero de passos. nsteps X dt = Tempo da simulao em ps)
dt
= 0.002
(Time-Step, tempo para passo de integrao)
nstxout
= 1000
(Frequncia a escrever a trajetria em arquivo)
nstvout
= 1000
(Frequncia a escrever as velocidades em arquivo)
nstxtcout
= 1000
(Frequncia a escrever as coordenadas em arquivo)
nstenergy
= 5000
(Frequncia a escrever as energias em arquivo)
nstlist
= 10
(Frequncia de atualizao da lista de vizinhos, em passos)
rlist
= 1.0
(Raio de corte para vizinhos de baixo alcance)
coulombtype
= pme
(Esquema de tratamento de foras Coulombianas)
rcoulomb
= 1.0
(Raio de corte para o tratamento de foras de Coulomb)
vdw-type
= cut-off
(Esquema de tratamento Van der Waals, aqui cut-off)
rvdw
= 1.0
(Raio de corte para Lennard-Jones)
Tcoupl
= nose-hoover
(Controle de temperatura, aqui usamos o Nos-Hoover)
tc-grps
= protein non-protein (grupos separados ao banho de temperatura)
tau-t
= 0.1
0.1
(Constante de tempo para a temperatura)
ref-t
= 298
298
(Temperatura, em Kelvin)
energygrps
= Protein SOL
(Monitoramento de Energia)
Pcoupl
= no
(Barostato de Parrinello-Rahman)
tau_p
= 0.5
(Valor de Tau, no termostato)
compressibility
= 4.5e-5
(Compressibilidade da gua a 1 ATM e 300k, unidade em bar -1)
ref_p
= 1.0
(Referencial para o barostato de Berendsen)
gen_vel
= yes
(Gerar velocidades iniciais por distribuio de Maxwell)
gen_temp
= 298.0
(Temperatura inicial, em Kelvin)
gen_seed
= 116247
(Semente do nmero aleatrio inicial)
-------------------------------------------

Importante: No manual do GROMACS existe cada um desses parmetros bem detalhados (em
ingls)

4 Passo: Convertendo o arquivo .pdb em topologia .gro


Agora vamos efetivamente comear a trabalhar com os programas do GROMACS!
O programa pdb2gmx (Protein Data Bank to GROMACS), como o nome j diz, transforma
arquivos .pdb em arquivos GROMACS com a extenso .gro, as quais so apropriadas para a
dinmica molecular neste pacote especfico. Este programa, excluindo-se mdrun, o que mais
solicita os arquivos de campo de fora, sendo distribudos em conjunto com GROMACS
atualmente os seguintes:

13

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

1: AMBER03 force field (Duan et al., J. Comp. Chem. 24, 1999-2012, 2003)
2: AMBER94 force field (Cornell et al., JACS 117, 5179-5197, 1995)
3: AMBER96 force field (Kollman et al., Acc. Chem. Res. 29, 461-469, 1996)
4: AMBER99 force field (Wang et al., J. Comp. Chem. 21, 1049-1074, 2000)
5: AMBER99SB force field (Hornak et al., Proteins 65, 712-725, 2006)
6: AMBER99SB-ILDN force field (Lindorff-Larsen et al., Proteins 78, 1950-58,
2010)
7: AMBERGS force field (Garcia & Sanbonmatsu, PNAS 99, 2782-2787, 2002)
8: CHARMM27 all-atom force field (with CMAP) - version 2.0beta
9: GROMOS96 43a1 force field
10: GROMOS96 43a2 force field (improved alkane dihedrals)
11: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205)
12: GROMOS96 53a5 force field (JCC 2004 vol 25 pag 1656)
13: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656)
14: OPLS-AA/L all-atom force field (2001 aminoacid dihedrals)
15: [DEPRECATED] Encad all-atom force field, using full solvent charges
16: [DEPRECATED] Encad all-atom force field, using scaled-down vacuum charges
17: [DEPRECATED] Gromacs force field (see manual)
18: [DEPRECATED] Gromacs force field with hydrogens for NMR

O programa bastante interativo: permite ao usurio escolher a carga (nmero e


posio) dos aminocidos dissociveis (Asp, Glu, Cys, Lys ou His), bem como suas possveis
associaes com grupos heme (His) ou pontes dissulfeto (Cys-Cys). Pontes de hidrognio so
definidas com base em simples critrio geomtrico, especificado pelo ngulo hidrogniodoador-aceptor mximo e distncia doador-aceptor (-angle e -dist, respectivamente). No caso
de cadeias consecutivas em um nico arquivo .pdb, pdb2gmx pode, atravs da opo merge,
juntar tudo em uma nica definio de molcula, o que pode ser til no manuseio de alguns
tipos de arquivos com pontes dissulfeto.
Na converso, os tomos so rearranjados de acordo com a arquitetura GROMACS. No
entanto, os formatos .gro e .g96 no apresentam suporte a identificadores de cadeias, por isso
seria til a utilizao de uma entrada .pdb atravs do comando o.
A movimentao diedral pode ser alterada tanto pela eliminao de hidrognios e
substituio de anis aromticos comuns por virtuais, quanto pelo aumento da massa dos
hidrognios por um fator de 3 (o que pode tambm ser feito com a gua deutrio/trtio). O
aumento da massa dos hidrognios compensado pela diminuio da massa de tomos
pesados bem fixados por fortes ligaes, ento a massa total do sistema permanece a mesma.
Atravs do comando, no diretrio Tutorial onde est localizado 1TSK.pdb (atente-se para as
letras maisculas),digite:

pdb2gmx f 1TSK.pdb o proteina01.gro p topologia.top inter -ignh

14

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

Explicando os parmetros: -f sempre significa entrada de dado; -o indica o arquivo


de sada, ou seja, voc pode dar o nome que quiser (aqui ns geramos o proteina01.gro); -p
a entrada do arquivo de topologia (neste nico caso a sada, pois o estamos gerando); inter permite o usurio escolher manualmente o posicionamento de pontes dissulfeto, campo
de fora etc; -ignh: ignorar tomos de hidrognio do arquivo .pdb.
O programa ir lhe apresentar algumas opes, aqui vo elas:

escolha do campo de fora: escolha o OPLS-AA/L (digite 14);


na escolha do tipo de modelo de gua, escolha a TIP4P, digitando 1;
escolha das cargas: lisinas (+1), argininas (+1), NH+(+1), cido asprtico (-1), COO(-1);
escolha das pontes dissulfeto: ligue todas as trs, pressione y para isso.

Juntamente com os arquivos proteina01.gro e topologia.top, tambm foi gerado o


posre.itp, o qual inclui-se na topologia da molcula como restrio s molculas de gua a
serem adicionadas mais tarde.
5 Passo: Criando a caixa de simulao
Agora precisamos criar um ambiente para abrigar a protena juntamente com a gua
(ainda ausente). Para este fim se enquadra o programa editconf. Neste o arquivo de entrada
proteina01.gro, o qual ser modificado para proteina02.gro, agora adicionado da caixa
cbica vazia. Digite o comando abaixo:

editconf f proteina01.gro o proteina02.gro bt cubic c d 1.2

editconf um programa essencial para o propsito de dinmica molecular de protenas


solvatadas, e como tal, apresenta vrias funes. Primeiramente, editconf converte estruturas
genricas aos formatos .gro, .g96 ou .pdb. No entanto, essa converso pode dar-se ao mesmo
tempo em que se constri a caixa de solvatao ao redor da protena, com os seguintes
parmetros: -box, -d, -angles, -bt, especificando respectivamente trs vetores como arestas da
caixa, centralizando o sistema (raio de corte, em nanmetros), gerando ngulos dos vrtices e
finalmente determinando o tipo de caixa triclinic, cubic, dodecahedron ou octahedron. Observe
que opes como bt podem ser conflitantes com funes box e angle, j que a variao
angular e de arestas rgida ou invlida em caixas pr determinadas (triclinic, cubic,
dodecahedron).

15

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

A opo box requer apenas um valor para uma caixa cbica, dodecaedro e octaedro
truncado. Com d e uma caixa triclnica o tamanho especificado em box utilizado. Com d e
uma caixa cbica, dodecadrica ou octadrica, as dimenses so ajustadas ao dimetro do
sistema, ou seja maior distncia entre tomos, mais duas vezes a distncia especificada (no
caso, 1.2 nm). Observe a figura 2.2 (o quadrado representa a caixa).

Figura 2. 2. Exemplificando o distanciamento


na caixa cbica. Em nosso caso, atribumos
d=1.2 nm.

6 Passo: Adicionando gua caixa de simulao


genbox um aplicativo importante no pacote GROMACS, com ele efetuaremos o
preenchimento da caixa contendo uma protena com molculas de gua. Este processo leva em
conta os contatos por raios de van der Waals entre soluto e algumas molculas de solvente,
removendo assim as segundas e evitando um conflito espacial. Essa anlise feita com base nos
dados encontrados no arquivo padro vdwradii.dat;
O modelo de gua que utilizaremos o Simple Point Charge water (SPC), sendo este
apontado pelo arquivo da biblioteca spc216.gro. Naturalmente podemos escolher outros
modelos de gua que apresentam suporte para este programa, sendo includos no banco de
dados como novas substncias ou como modificaes de outras j existentes, sendo a nica
restrio para isso que suas molculas sejam monomricas.
Para este passo, digite no console, ainda no diretrio principal:

genbox cp proteina02.gro o proteina03.gro p topologia.top cs


tip4p.gro

16

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

7 Passo: Alcanando a eletroneutralidade do sistema


A presena de aminocidos e terminais proticos carregados pode gerar um
desequilbrio na topologia geral da protena durante a simulao, j que o sistema como um
todo, por ser micro cannico (NVE: partculas,volume e energia constantes), necessita ter uma
carga resultante igual a zero (neutra). Este programa adiciona cargas contrrias a aquelas
geradas durante a converso do arquivo .pdb (pelo programa pdb2gmx), substituindo uma
parte do conjunto (protena, solvente, aleatoriamente etc.) escolha do usurio. Em nosso
caso, as extremidades C e N da protena, bem como os aminocidos carregados positivamente
(como lisinas) e outros negativamente (como c. glutmicos) geraram carga positiva de +8 e
negativa de -3. Isso exige a adio de oito molculas negativas para a neutralizao das cargas
positivas e trs positivas para a neutralizao das negativas. Observe que o programa d a
liberdade de substituio, no entanto no uma boa idia substituir partes da protena por
estes ons inorgnicos, sendo a melhor opo a troca de 11 molculas (8+3) de solvente (SOL)
pelos ons livres, gerando uma carga total neutra no sistema.
Mas antes de procedermos, precisamos comentar sobre o programa grompp, pois ele
ser necessrio agora.
Este o pr-processador GROMACS (GROMACS PreProcessor). Como o nome diz, ele pr
processa um arquivo que ir para a simulao de dinmica molecular pelo programa mdrun, ou
seja, qualquer simulao de dinmica molecular no GROMACS precisa antes ser parametrizada
por este programa. Grompp l um arquivo de topologia, faz substituies necessrias no que se
diz respeito a tipos e configuraes moleculares: ngulos e distncias de ligao podem ser
convertidos em restries (comando -r) por adio de hidrognios ou tomos pesados. feita a
leitura dos parmetros a serem utilizados na futura simulao, com correes para uma
acelerao resultante se igualar a zero, criando um arquivo binrio o qual ser a base para o
mdrun trabalhar. O comando debug, o programa retorna mais detalhes do que foi feito no
processo.
No caso de erros ou apenas avisos o programa gera uma pequena sada na tela,
alertando o usurio a possveis correes pr dinmica molecular.
Este aplicativo oferece suporte ao reincio de uma simulao interrompida por motivos
externos ao software, no entanto tpbconv mais recomendado nestes casos.
Entre no diretrio adicionar_ions e digite:

17

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

grompp f minimizacao.mdp o minimizacao.tpr c ../proteina03.gro p


../topologia.top
genion s minimizacao.tpr o proteina04.gro p ../topologia.top pname NA
-nname CL neutral conc 0.15

Para manter o nmero original de tomos no sistema, o prompt do programa vai lhe dar
as opes do meio a ser substitudo pelos ons neutralizantes a serem introduzidos. A melhor
opo para nosso propsito a remoo de molculas de gua, ou seja, de solvente ( selecione
a opo nmero 12 (SOL)].

8 Passo: Minimizao de energia


Este passo necessrio, pois rearranja o sistema para promover a remoo de contatos
de van der Waals aberrantes originrios pelas recm introduzidas molculas de gua e pela
rede de ligaes de hidrognio rompidas. Essas variaes espaciais podem gerar energias
extremas, as quais funcionam como estopins e so liberadas logo no inicio da etapa da dinmica
molecular, com alta probabilidade de comprometimento da integridade da estrutura inicial
protica pela ocasional introduo de distores indesejveis.
Caso a simulao no convirja para o valor crtico estimulado no arquivo
minimizao.mdp, s aumentar o valor do parmetro emtol. ...
Entre no diretrio minimizao e digite o comando abaixo:

grompp f minimizacao.mdp o minimizacao.tpr c


../adicionar_ions/proteina04.gro p ../topologia.top
mdrun s minimizacao.tpr -v

O pr-processador grompp necessrio para concatenar todos os parmetros


necessrios para a simulao em si atravs da gerao de um nico arquivo, neste caso o
minimizacao.tpr. este arquivo que serve de entrada para o programa principal do pacote
GROMACS, o mdrun (responsvel pela dinmica molecular passo 7).
18

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

9 Passo: Dinmica de restrio


A dinmica de restrio prepara, neste penltimo passo, a protena para a principal
simulao. Nesta etapa, a protena tem seus tomos restringidos, ou seja, seus movimentos
ficam limitados enquanto a gua livre para acomodar-se de maneira otimizada ao longo de
sua superfcie. Fazemos isso porque com a restrio dos movimentos da protena, a gua se
organiza em funo de um suporte que no varia (na verdade varia, mas muito pouco) e tende a
entrar em equilbrio em seu tempo padro de relaxamento (~10ps). No entanto, por segurana,
desejvel rodarmos a simulao por um tempo de pelo menos uma ordem de magnitude em
relao ao valor bioqumico citado (rodaremos nsteps(10000) X dt(0,002) = 20 ps). Para
protenas maiores, recomenda-se um tempo maior, conforme o tamanho da cadeia aumenta.
Agora v para o diretrio restricao e digite:
grompp f restricao.mdp o restrio.tpr c ../minimizacao/confout.gro p
../topologia.top
mdrun s restricao.tpr v >&out&
tail f out

A poro v >&out& se encarrega de gerar um arquivo out que se atualiza


constantemente com a previso de trmino da simulao. O comando tail f out l o final do
arquivo out e mostra constantemente essa previso na tela (para sair, digite CTRL+C ou
CTRL+Z). Ao fim da simulao, obteremos o confout.gro, que corresponde estrutura
resultante da restrio.
10 Passo: Dinmica Molecular
Finalmente chegamos parte final do tutorial, aquela que gerar os dados que sero
utilizados para nossas anlises ulteriores. Mas antes, vamos comentar um pouco sobre este
programa central ao pacote GROMACS: o mdrun (Molecular Dynamics Run), o qual
responsvel pela dinmica molecular propriamente dita.
O mdrun o programa principal do pacote GROMACS. o motor das simulaes de
dinmica molecular, alm de ser capacitado a rodar simulaes de dinmica browniana e
langevinianas bem como de gradientes conjugados, minimizao de energia pelo mtodo da
descida oblqua (mais conhecido como Steepest Descent Energy Minimization) e refinamento de
NMR. importante que a estrutura a entrar em simulao j esteja com sua energia

19

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

previamente minimizada, para evitar problemas como exploses na caixa de hidratao por
possveis contatos prximos demais entre tomos (7 Passo).
Todo o processo desde os arquivos .pdb converso ao formato gromos, confeco da
caixa de solvatao, ao preenchimento da mesma etc. foi um caminho de preparao ao mdrun.
Este programa l o arquivo de entrada e distribui a topologia de maneira apropriada ao tipo de
simulao, se disponveis, em processadores paralelos. Primeiramente uma lista de vizinhanas
feita, ento as foras comeam a serem computadas (com base na temperatura e presso),
globalmente somadas e velocidades e posies so atualizadas. Se necessrio, uma agitao
feita para se restringir os comprimentos e ngulos das ligaes.
So gerados trs arquivos ao fim do processo: a trajetria, o qual contm as
coordenadas de todos os tomos ao longo do tempo (portanto as velocidades); a estrutura,
guarda as coordenadas e velocidades do ltimo passo; a energia, salva valores de energia,
presso entre outros. Um arquivo de log tambm gerado, o qual pode vir a ser til para fins
de arquivamento do processo.
Uma nova realizao possvel (pelo comando rerun) caso haja necessidade. Energias e
foras sero recalculadas, busca pela vizinhana ser feita em cada passo a menos que nstlist
seja igualado a zero no arquivo de parametrizao .mdp. Neste arquivo, podemos tambm
personalizar funes de potenciais para mdrun utilizar.
Sem mais delongas, entre no diretrio dinamica e digite o seguinte comando:

grompp f dinamica.mdp o dinamica.tpr c ../restricao/confout.gro p


../topologia.top
mdrun s dinamica.tpr v >&out&
tail f out

Tudo pronto, agora s esperar o tempo de simulao, que varia dramaticamente de


acordo com cada equipamento. Neste caso que atribumos nsteps= 500.000 e dt=0,002, a
simulao ir at completar seus 1000 ps (ou seja, 1 ns): isso deve durar menos que uma hora
em um computador mediano para o ano de 2012.

20

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

2.1

Analisando a simulao

To importante quanto saber simular trajetrias de protenas em gua por dinmica


molecular saber como interpretar e apresentar os dados obtidos. Essa seo se prope a
apresentar alguns dos principais programas disponveis no pacote GROMACS com fins de
anlise de trajetria.

I)

RMSD (Root Mean Square Deviation)

Uma das medidas mais comuns para se avaliar a condio da protena ao longo da
trajetria a quantificao da deformao da estrutura em comparao referncia do ponto
inicial. Essa avaliao feita atravs do RMSD (Root Mean Square Deviation), e pode ser
calculada basicamente de duas maneiras:
- Por ajuste de estruturas (fit). Para cada passo, a protena ajustada espacialmente ao modelo
inicial, ento a seguinte equao aplicada:

1
=

1/2

onde ri(t) e ri(o) so respectivamente a posio de um dado tomo no tempo t arbitrrio e no


tempo inicial t=0. Para este clculo, utiliza-se no GROMACS o programa g_rms.
- Sem ajuste de estruturas. Com a quantificao do RMSD desta maneira, seu valor tende a ser
mais elevado em relao ao mtodo anterior. Neste caso o clculo feito por utilizao de uma
matriz de distncia:
1
= 2

1/2

=1 =1

onde rij(t) e rij(o) se referem distncia entre os dois tomos i e j respectivamente no tempo t
arbitrrio e no tempo inicial t=0. Essa medida feita atravs do programa g_rmsdist.

21

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

Em nossa anlise, utilizaremos o primeiro mtodo (no entanto uma boa idia o uso de ambos
os mtodos, com posterior comparao, apenas em nvel de aprendizagem). Agora procedamos
com o comando (dentro da pasta dinamica):

g_rms s dinamica.tpr f traj.xtc o rmsd.xvg

(Utilize o backbone, opo 4)


O arquivo resultante rmsd.xvg dever ser movido para a pasta dados para fins de
organizao. Este arquivo contm tabelas numricas com instrues para a confeco de um
grfico. A maneira mais usual para isso a utilizao do programa XMGRACE. Caso no possua
este aplicativo, instale-o atravs do gerenciador de instalao de sua distribuio Linux. Segue
abaixo o comando para a leitura da matriz (utilize-o dentro da pasta dados):

xmgrace rmsd.xvg

Dentro do programa, j visualizando o grfico, acesse as opes e modifique o ttulo,


escalas ou qualquer elemento que o agrade. Aps este processo, salve o arquivo e o imprima,
preferencialmente em arquivo.png (v em opes de impresso). Observe abaixo um exemplo
de um grfico mostrando o RMSD tpico de uma simulao de uma protena de estrutura
estvel.

22

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

II)

Raio de Girao

Outra medida importante na avaliao do comportamento da estrutura ao longo do


tempo o raio de girao. Esta anlise responsvel pela verificao da compactao da
protena, a qual aumentar conforme diminui este ndice. O raio de girao obtido atravs do
programa g_gyrate, que se utiliza da equao abaixo:

1/2

onde ri a posio do tomo i em relao ao centro de massa Rcm as molcula e mi sua


respectiva massa.

Para obtermos o grfico, volte pasta dinamica e digite:

g_gyrate s dinamica.tpr f traj.xtc o raio_giracao.xvg

(Selecione o grupo Protein)


Uma vez criado o arquivo raio_giracao.xvg, mova-o para a pasta de dados e proceda como
para o RMSD. Abaixo um exemplo de um raio de girao estvel com mdia ao redor de 0.8
nanmetros.

23

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

III) Animao

Uma das opes mais didticas da parte de anlise a de transformar a trajetria em


arquivo animado, nos permitindo contemplar a movimentao da protena de maneira mais
intuitiva e visual possvel.
Vamos converter os dados de traj.xtc para um arquivo de sada com extenso .pdb.
Essa rotina realizada pelo programa conversor de formatos (trjconv) atravs da sintaxe abaixo
(digitar dentro do diretrio dinamica):

trjconv s dinamica.tpr f traj.xtc o filme.pdb ur compact center pbc


mol

(Selecione a opo 1)

24

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

Para ver o resultado, utilize qualquer visualizador de protenas com suporte a frames
mltiplos tais como PyMol ou VMD.

3.0

Consideraes Finais
Agora voc j tem meios de seguir em frente sozinho. Baixe outras protenas, estenda a

simulao, rode em paralelo, enfim pense sobre o problema e procure analisar o que seja adequado s
suas necessidades. Este tutorial introdutrio, ele te guiou at aqui e lhe fez economizar considervel
esforo, poupando-lhe encontros com literatura especializada em contato imaturo, o que s serviria
para afugentar algumas pessoas. No entanto, conforme v progredindo, imperativo o
acompanhamento de artigos mais especficos e densos, pois s assim voc progride de forma satisfatria
para lidar com um campo to emergente quanto complexo como a dinmica molecular.

25

- Tutorial Introdutrio GROMACS Ricardo O. S. Soares 2012

4.0

Leitura Recomendada

[1] Bekker, H.; Berendsen, H. J. C.; Dijkstra, E. J.;


Achterop, S.; van Drunen, R.; van der Spoel, D.;
Sijbers, A.; Keegstra, H.; Reitsma, B.; Renardus, M.
K.Physics Computing 92 (Singapore, 1993). de Groot,
R. A.; Nadrchal, J.; eds. World Scientific.

[9] Kahn, K. & Bruice, T. C. J. Comput. Chem., 23:


977996, 2002.
[10] Wensink, E. J. W.; Hoffmann, A. C.; van Maaren,
P. J.; van der Spoel, D. J. Chem. Phys., 119: 73087317, 2003.

[2] Berendsen, H. J. C.; van der Spoel, D.; van


Drunen, R. Comp. Phys. Comm. 91:4356, 1995.

[11] Suardiaz, R.; Maestre, M.; Surez, E.; Prez, C. J.


Mol. Struct., 778: 2125, 2006.

[3] van der Spoel, D.; Lindahl, E.; Hess, B.; Groenhof,
G.; Mark, A. E.; Berendsen, H. J. C.
J. Comp. Chem., 26:17011718, 2005.

[12] Martin, M. Fluid Phase Equilibria, 248: 5055,


2006.

[4]Taft, C. A.; Silva, C. H. T. P. (Org.). Current


Methods in Medicinal Chemistry and Biological
Physics. Kerala; Research Signpost 2007.

[13] Prez, S.; Imberty, A.; Engelsen, S. B.; Gruza, J.;


Mazeau, K.; Jimenez-Barbero, J.; Poveda, A.;
Espinosa, J. F.; van Eyck, B. P.; Johnson, G.; French, A.
D.; Louise, M. L.; Kouwijzer, C. E.; Grootenuis, P. D.
J.; Bernardi, A.; Raimondi, L.; Senderowitz, H.; Durier,
V.; Vergoten, G.; Rasmussen, K. Carbohydrate
Research 314: 141155, 1998.

[5] Ozkan, S. B.; Dill, K. A.; Bahar, I. Protein Sci. 11:


1958-1970, 2002.
[6] Scott, W. R. P.; Hnenberger, P. H.; Tironi, I. G.;
Mark, A. E.; Billeter, S. R.; Fennen, J.; Torda, A. E.;
Huber, T.; Krger, P.; van Gunsteren, W. F. J. Phys.
Chem., A. 103: 3596-3607, 1999.

[14] Kaminski, G. & Jorgensen, W. L. J. Phys. Chem.,


100: 18010-18013, 1996.
[15] Chen, B.; Martin, M. G.; Siepmann, J. I. J. Phys.
Chem. B, 102: 2578-2586, 1998.

[7] Kony, D.; Damm, W.; Stoll, S.; van Gunsteren, W.


F. J. Comput. Chem., 23: 14161429, 2002.

[16] Allen, M.P.; Tildesley, D.J. Computer Simulation


of Liquids. Clarendon Press, Oxford, 1987.

[8] Xu, Z.; Luo, H. H.; Tieleman, D. P. J. Comput.


Chem., 28: 689697, 2007.

[17] Hess, B.; Kutzner, C.; van der Spoel, D.; Lindahl,
E. J. Chem. Theory Comput., 4:435-447, 2008.

26

Você também pode gostar