Você está na página 1de 6

Chama-se folding de protenas ao processo espontneo a partir do qual uma cadeia linear de aminocidos adquire uma estrutura tridimensional

biologicamente activa. A compreenso deste fenmeno,


considerada por muitos um dos problemas mais
importantes da cincia actual, ter um grande impacto
no s ao nvel da sade e do bem-estar humanos

O MISTRIO DA
DAS PROTENAS

como tambm ao nvel da cincia fundamental, na


aprendizagem e aquisio de novas leis e conceitos
da fsica dos sistemas complexos. Tendo surgido no
contexto da biologia molecular, este problema
hoje claramente interdisciplinar, necessitando de ferra
mentas de vrias reas do conhecimento, e para o
qual o contributo da fsica tem sido determinante. O
objectivo deste artigo e mostrar como a utilizao de
metodologias da fsica, incluindo o recurso simulao
computacional de modelos simples, permitiu criar uma
estrutura conceptual (a chamada paisagem de energia) sobre a qual uma sinergia exemplar entre a teoria
e a experincia tem gerado avanos muito significativos.

PATRCIA F.N. FASCA

Experincias in vitro: a hiptese termodinmica


As protenas so robs celulares, mquinas moleculares construdas escala do nanometro, capazes de executar de uma
forma espontnea e programada todas as tarefas essenciais
manuteno da vida. Por exemplo, as enzimas aceleram
reaces qumicas que de outro modo seriam demasiado
lentas, os anticorpos so molculas responsveis pela identificao e eliminao de agentes invasores e as hormonas
asseguram a transmisso de informao entre as clulas.

Fig. 1 - Como determinar a estrutura nativa de uma protena a partir


do conhecimento da sua estrutura primria?

Centro de Fsica Terica e Computacional da


Universidade de Lisboa
Av. Prof. Gama Pinto 2,
1649-003 Lisboa
patnev@cii.fc.ul.pt
http://alf1.cii.fc.ul.pt/~patnev

Para que possa funcionar correctamente, cada protena


deve exibir uma estrutura tridimensional nica que determina a sua funo biolgica. a chamada estrutura nativa,
que emerge como produto final de um processo complexo
envolvendo o enrolamento e a dobragem (folding, em
ingls) da cadeia de aminocidos que compe a protena,
designada por estrutura primria. Christian Anfinsen foi

ARTIGO

Os resultados das experincias de Anfinsen foram o ponto


de partida para um novo problema, para o qual ainda hoje
procuramos uma soluo: como determinar a estrutura
tridimensional de uma protena partindo apenas do conhe
cimento da sequncia de aminocidos que constitui a
estrutura primria? claro que este problema (conhecido
como protein folding problem) pode ser tomado como corolrio da questo fundamental que consiste em compreender os
mecanismos envolvidos neste importante processo biolgico.

O paradoxo de Levinthal e os caminhos de folding


Em 1968, Cyrus Levinthal, um fsico de formao que se
converteu ao estudo da biologia molecular, levantou uma
sria objeco ideia de que a procura do estado nativo
possa ser feita de forma aleatria, tal como era sugerido
pela HT. O argumento de Levinthal, simples e eficaz,
baseava-se na seguinte experincia conceptual (gedanken

35

dos primeiros cientistas a interessar-se pela compreenso


dos princpios fsicos envolvidos no processo de folding de
protenas. Por que razo se dobra a protena para a estrutura nativa? Por que nica essa estrutura? Estas foram duas
das questes fundamentais para as quais procurou resposta
durante toda a dcada de 1950. Com a ajuda dos seus
alunos de ps doutoramento Fred White e Michael Sela,
Anfinsen dirigiu uma srie de experincias que culminaram
com a elaborao da chamada hiptese termodinmica
(HT), trabalho que foi galardoado com o Prmio Nobel
da Qumica de 1972. A HT baseada na observao de
que o processo de folding ocorre de uma forma espontnea
conduzindo, por isso, a um estado o estado nativo
que o mais estvel (de mais baixa energia) do ponto de
vista termodinmico. Por outro lado, Anfinsen tambm
concluu que a estrutura nativa tem necessariamente de
ser determinada pela sequncia de aminocidos (ou mais
rigorosamente, pela totalidade de interaces entre os
aminocidos que compem a protena) j que, para alm
da prpria protena, no necessria a participao de
nenhuma outra molcula no processo.

A vida depende largamente da existncia e do funcionamento correcto de uma quantidade enorme de protenas.
s vezes, muitos dos processos celulares de controlo
e regulao em que essas protenas esto envolvidas
falham, ou porque o organismo no de todo capaz de as
produzir, ou porque so fabricadas com defeito. Como a
funo da protena depende estritamente da sua estrutura
nativa, basta que esta ltima exiba uma pequena falha para
que a protena passe a no funcionar correctamente.
Patologias comuns, como a diabetes de tipo I e a hemofi
lia, ocorrem porque o organismo incapaz de produzir a
insulina e o factor VIII, respectivamente. J certos tipos de
cancro resultam da produo defeituosa de uma protena
que participa na regulao da diviso celular, o factor
p21Ras. Outras patologias, como as encefalopatias espongiformes, entre as quais a BSE ou doena das vacas loucas,
esto na origem de um processo de folding defeituoso do
qual resultam protenas (na realidade, agentes infecciosos chamados pries) que, tendo uma grande afinidade
entre si, se agregam para formar uma espcie de fibras.
Estas fibras actuam sobre o tecido neuronal do sistema
nervoso central e o desfecho pode ser dramtico. Estas
patologias tm sido denominadas doenas dos tempos
modernos porque resultam em parte da existncia de
condies completamente novas, criadas pelas actividades
desenvolvidas pelo homem, que so capazes de desafiar
e pr em risco a homeostase (ou controlo) dos processos
bioqumicos normais. A soluo para problemas deste tipo
passa por sermos capazes de fornecer a protena em falta
ao organismo, de uma forma artificial, ou por inactivar a
protena infecciosa, atravs da administrao de uma droga
para a qual a primeira tenha uma grande afinidade, quer
de um ponto de vista estrutural quer energtico. Encontrar uma droga que se encaixe numa certa protena da
melhor forma possvel o um problema tpico no design de
drogas. claro que se compreendermos a relao sequncia-estrutura, poderemos desenhar qualquer protena (ou
qualquer outra droga que seja especfica para uma certa
protena). Mas, para que isto seja possvel, precisamos
primeiro de compreender a questo fundamental de como
se processa o folding de protenas. frente veremos como
que a fsica e o recurso simulao computacional tm
tido um papel fundamental na elucidao deste processo.

GAZETA DE FSICA

A FORMA
S

Folding de protenas: um problema importante

O MISTRIO DA FORMA DAS PROTENAS

experiment). Consideremos uma pequena protena com


100 aminocidos e suponhamos que cada aminocido s
pode estar num de dois estados possveis (por exemplo, s
pode tomar duas orientaes diferentes). Nestas condies,
a protena tem acesso a um total de 2100 1030 conformaes, total esse que inclui obviamente a estrutura nativa.
Como a molcula no pode passar de uma conformao
para a outra em menos de 1 picossegundo (ps), que o
tempo de uma vibrao trmica, seriam precisos 2100 ps,
ou seja, 3,9 1010 anos, no mnimo, para explorar exaustivamente todo o espao conformacional e encontrar
a conformao (que apenas uma!) correspondente ao
estado nativo. Ora, acontece que esta escala de tempo
da ordem de grandeza da idade do Universo, estimada em
1,4 x 1010 anos. Estamos assim perante um problema, j
que o folding de protenas deste tamanho leva no mximo
alguns segundos, e tipicamente ocorre na escala temporal
do nanossegundo ou do segundo. A concluso que daqui
se tira que a HT no consegue explicar a escala de tempo
caracterstica do processo de folding de protenas.

GAZETA DE FSICA

36

Por razes bvias, este problema ficou conhecido como o


paradoxo de Levinthal e foi o prprio Levinthal o primeiro
a sugerir uma soluo. Levinthal teorizou a existncia de um
caminho de folding especfico (folding pathway), composto
por vrios estados intermedirios um pouco semelhana
do que se passa numa reaco qumica vulgar no fim do
qual se encontra o estado nativo. No entanto, e ao contrrio do sugerido pela HT, o estado nativo na proposta
de Levinthal no corresponde necessariamente ao mnimo
global da energia, no tem que ser o estado termodinamicamente mais estvel. Corresponde, isso sim, ao estado de
energia mnima mais acessvel de um ponto de vista cintico.
Como consequncia da proposta de Levinthal, a investigao
experimental em folding de protenas at ao incio da dcada
de 1990 foi em grande parte dominada pela procura de
produtos intermedirios de folding suficientemente estveis
para que pudessem ser isolados e devidamente caracterizados.
No entanto, a descoberta em 1991 de uma pequena protena, com cerca de 100 aminocidos, que se dobra rapidamente sem passar por quaisquer intermedirios, mostrou
que a existncia de intermedirios estveis no de todo
um requisito essencial para a rapidez do processo.
A perspectiva clssica do folding de protenas baseia-se na
dicotomia termodinmica versus cintica e na abordagem
tradicional da bioqumica, que considera cada molcula
um sistema nico, sendo por isso necessria uma descrio
detalhada, escala atmica, do seu caminho de folding.
Como veremos adiante, uma das contribuies mais impor
tantes da fsica para a compreenso deste fenmeno foi
precisamente a de reconciliar as perspectivas de Anfinsen e
Levinthal no quadro de uma teoria unificada, que se baseia
na natureza estatstica do processo.

Folding in silico 1: dinmica molecular


De acordo com Christian Anfinsen, se conhecermos a
totalidade das interaces que se estabelecem entre os
tomos de uma protena, devemos, em princpio, poder
prever qual ser a estrutura tridimensional adoptada pela
cadeia de aminocidos que contm esses tomos. Mas ser
fcil essa tarefa? De uma forma simplificada, podemos
dizer que as interaces entre os tomos so de natureza
electrosttica e quntica. claro que, dentro das interaces
electrostticas, temos que distinguir vrias categorias
(interaces de Lennard-Jones, de van der Waals, pontes
de hidrognio, de solvatao com as molculas de gua,
etc.). Uma protena como a hemoglobina, que transporta
o oxignio aos alvolos pulmonares, contm cerca de
4000 tomos que podem, em princpio, interagir durante
o processo de folding. Para todos os pares de interaco
possveis ento preciso saber quanto valem os parmetros de interaco correspondentes. O clculo rigoroso
destas quantidades requer um tratamento quntico e no
de todo trivial. Para alm disso, h que ter em conta que
o resultado do clculo depende no s do tipo de tomo
mas tambm do ambiente qumico em que se encontram
os tomos participantes na interaco, o que gera complicaes adicionais. Geralmente, este tipo de clculo faz-se
no contexto das simulaes por dinmica molecular (DM).
Trata-se de simulaes deterministas que modelam a
protena como sendo um sistema newtoniano de N tomos
ligados por molas. Para alm das interaces electrostticas
entre os tomos, h ainda a considerar o clculo dos parmetros relativos s energias de alongamento, de toro e de
dobragem da ligao qumica. Tudo isto implica o clculo
de um nmero extraordinariamente grande de parmetros,
que devem ser testados e refinados atravs de simulaes
que reproduzam a dinmica do folding. Se o conjunto de
parmetros for bom, a molcula, que na simulao lanada numa conformao inicial arbitrria, dever ser capaz de
encontrar a sua estrutura nativa ao fim de um certo tempo.
As simulaes por DM so extremamente exigentes do
ponto de vista computacional. Se pensarmos que precisamos de um dia de CPU para simular um nanossegundo
do processo de folding, o que uma estimativa razovel
tendo em conta as capacidades de clculo dos computadores de que dispomos actualmente, se uma protena
consumir 104 nanossegundos para encontrar o seu estado
nativo, ento precisaramos de 104 dias de CPU, ou seja
cerca de 30 anos, para simular o processo de folding na
totalidade. Isto obviamente muito tempo para se esperar
por apenas um resultado! claro que existem super-computadores capazes de simular mais do que um nanossegundo por dia e foi a eles que os dois cientistas americanos
Yong Duan e Peter Kollman recorreram, em 1998, para fazerem a simulao por DM que ainda hoje considerada o
estado da arte nesta rea. Estes investigadores simularam,

ARTIGO

Do que foi exposto anteriormente fica claro que se uma


simulao por DM for bem sucedida, conduzindo a
protena para o estado nativo, ento ficamos a conhecer a
relao sequncia-estrutura para aquela protena especfica.
Para qualquer outra protena, teremos que fazer um estudo
semelhante se quisermos modelar as interaces reais entre
os tomos que a compem. Apesar de ser importante,
este tipo de estudo tem a desvantagem de no permitir
identificar os princpios gerais (universais) envolvidos no
folding de protenas, para alm de ser muito exigente do
ponto de vista computacional. Para tal devemos recorrer a
modelos muito mais simples do que os usados em DM, os
chamados modelos de rede. Nestes modelos, a protena
representada apenas pela cadeia principal de aminocidos e
cada um destes por uma esfera que o identifica do ponto
de vista qumico. As esferas ocupam os nodos de uma rede
e as ligaes covalentes entre os aminocidos, ao longo da
cadeia, dispem-se segundo as arestas desta rede (Fig. 2).
Dentro da classe dos modelos de rede, o modelo H-P (em
ingls, Hydrophobic-Polar), que um dos mais simples, tem
como objectivo principal explorar o papel das interaces
entre os aminocidos e as molculas de gua durante o
processo de folding. Os aminocidos podem ser classificados, de acordo com a sua afinidade para a gua, em
hidrofbicos que no gostam de gua ou polares
que gostam de gua. No que se segue, veremos que,
at mesmo sem fazer qualquer simulao computacional,
conseguimos perceber alguns aspectos importantes do
problema do folding recorrendo a este modelo numa rede
bidimensional. Uma diferena fundamental em relao aos
modelos e simulaes por DM que neste caso no estamos interessados no detalhe escala atmica; a protena

Na Fig. 3 esto representadas cinco conformaes diferen


tes e as respectivas energias. Conformaes diferentes
podem ter energias diferentes (como o caso de 1,
2, 3) mas tambm podem ter a mesma energia, por
exemplo, 4 e 5. Quando duas conformaes diferentes
apresentam a mesma energia dizem-se degeneradas.
Para alm da degenerescncia, estes exemplos servem para
ilustrar um fenmeno ainda mais interessante, o fenmeno da frustrao. Consideremos os aminocidos 5 e
7 e os seus vizinhos, nas conformaes 4 e 5, respecti
vamente. Em 4, o aminocido 5, que hidrofbico,
est em contacto com o aminocido 8 da mesma espcie,
numa interaco que favorvel a ambos, j que se trata
de uma interaco que estvel do ponto de vista energtico. J os aminocidos 6 e 7 no estabelecem qualquer
interaco de contacto, e o aminocido 4 estabelece uma
interaco de contacto neutra (com energia igual a zero)
com o aminocido 1. Por outro lado, na conformao 5,
de certa forma os papis invertem-se, e o aminocido 7
que passa a interagir favoravelmente com o aminocido 4,
passando os aminocidos 5 e 8 a estar desestabilizados.
Diz-se que existe frustrao, porque ao competirem entre
si pelas posies que minimizam a energia de interaco
com os seus vizinhos, os aminocidos no conseguem
ficar todos igualmente estabilizados - no ficam igual-

Fig. 2 Conformao de uma pequena


protena (pptido) e parmetros de interaco no modelo H-P . Apenas as interaces representadas a tracejado na figura
do meio, contribuem para a energia total E
da conformao representada, que E=-3.

37

Folding in silico 2: modelos de rede e o conceito de


paisagem de energia

modelada simplesmente como uma cadeia de esferas de


diferentes cores conforme a sua espcie qumica. No caso
do modelo H-P, essas esferas so de apenas duas cores diferentes. Na Fig. 2 os aminocidos hidrofbicos so representados a branco e os polares a preto. A energia de interaco,
, entre aminocidos igual a zero, excepto entre pares
de aminocidos hidrofbicos, para os quais vale -1. Alm
disso, e como as ligaes entre os aminocidos ao longo
da cadeia no se quebram nunca durante o folding, apenas
as interaces ditas de contacto (a tracejado na Fig. 2)
contam para a energia total de uma certa conformao, ou
seja, de um certo arranjo geomtrico da cadeia de aminocidos sobre a rede. A energia total de uma conformao
assim a soma das energias de todos os pares de contacto
que a conformao contm.

GAZETA DE FSICA

ainda que apenas parcialmente, o processo de folding de


uma pequena protena com 36 resduos e doze mil tomos,
na presena de gua, durante 1000 ns, o que correspondeu,
na prtica, utilizao de quatro meses de clculo de CPU.

O MISTRIO DA FORMA DAS PROTENAS

Fig. 3 Exemplo de cinco conformaes diferentes e respectivas energias.

mente satisfeitos com os seus parceiros de interaco


- em conformaes que tm a mesma energia total. Ou
seja, sem fazermos qualquer conta analtica ou simulao
computacional o modelo H-P mostra que a degenerescncia e a frustrao so dois ingredientes fundamentais da
energtica do folding [2,3].

GAZETA DE FSICA

38

Chama-se paisagem de energia dependncia da energia


na conformao, E=E(). Conformaes de baixa energia,
ou mnimos locais, encontram-se separadas umas das outras por barreiras de energia. A topografia desta paisagem
de energia ser tanto mais acidentada quanto maior for a
frustrao exibida pela protena.
Um argumento simples mostra que, para uma protena
com N aminocidos na rede quadrada, qualquer conformao fica completamente descrita por (N-2) graus de
liberdade (que so os vectores que fixam a posio dos aminocidos) e que o nmero total de conformaes acessveis
3(N-2) [1]. Por exemplo, o peptdeo de 10 aminocidos
representado na Fig. 3 pode apresentar-se em 38=6651
conformaes possveis (das quais apenas 5 esto representados na figura), o que quer dizer que a sua paisagem de
energia contm 6651 pontos. Mas esse nmero sobe para
398~6 1046 conformaes, se considerarmos uma protena
com N=100. Se, em vez da rede, estivermos no espao
contnuo tridimensional, que onde vivem as protenas
reais, os graus de liberdade necessrios para descrever uma
conformao - que neste caso passam a ser os comprimentos e os ngulos de ligao - deixam de tomar apenas
valores discretos para passar a variar de uma forma cont-

nua. Daqui resulta que, mesmo para protenas pequenas,


o nmero de conformaes a priori infinito e a funo
E() toma valores num espao cuja dimenso ainda da
ordem do nmero de aminocidos da protena. Todos os
pontos desse espao, em vez de apenas um nmero grande
mas finito, correspondem, em princpio, a conformaes
possveis. Apesar desta diferena, tambm neste caso
temos degenerescncia e frustrao, sendo os mecanismos
que as explicam os mesmos que os do modelo discreto.
Folding de protenas: a perspectiva moderna
Resultados de estudos analticos e de simulaes computacionais com modelos de rede mostraram que as escalas de
tempo biolgicas so apenas compatveis com frustrao
mnima e que a topografia global da paisagem de energia
deve ser em forma de funil. A largura do topo do funil reflecte
o conjunto de todas as conformaes acessveis a uma
protena no incio do folding. Estas so as conformaes
menos estveis - de maior energia. possvel atingir o estado nativo partindo de qualquer uma dessas conformaes
iniciais e percorrendo um dos muitos caminhos de folding
alternativos. Cada um desses caminhos corresponde a um
conjunto de conformaes diferentes, pelas quais a prote
na passa at chegar conformao nativa. medida que
o folding progride, no s a energia das conformaes vai
diminuindo, at atingir o mnimo global na conformao
nativa, como tambm o prprio nmero de conformaes
acessveis vai diminuindo at ser apenas um. Na realidade,
a partir de certa altura, todas as trajectrias coalescem num

ARTIGO

Fig. 4 Ilustrao do conceito de paisagem


de energia (esquerda) e paisagem de
energia determinada experimentalmente
(direita).

Os conceitos de paisagem de energia e de funil de folding


conduziram quilo a que se costuma chamar a nova perspectiva do folding de protenas, em oposio perspectiva
clssica que, como vimos, opunha Anfinsen (e a termodinmica) a Levinthal (e a cintica). Na realidade, esta nova
perspectiva reconcilia os pontos de vista daqueles dois cientistas. O estado nativo realmente o estado termodinmico
mais estvel - o mnimo global da paisagem de energia
- e a procura desse estado no aleatria, embora no
exista apenas um nico caminho, como props Levinthal,
mas sim vrios, muitos caminhos de folding possveis.
A utilizao de modelos de rede simples e a nova perspecti
va do folding de protenas, que resultou largamente da
aplicao destes modelos, foram sem dvida ideias que,
nos ltimos dez anos, revolucionaram a nossa maneira de
pensar no mecanismo do folding. Esta nova perspectiva,
para alm de conduzir a interpretaes alternativas dos resultados experimentais clssicos, estimulou tambm, o que
talvez mais importante, o desenho de novas estratgias
experimentais que tm permitido, a pouco e pouco, des-

Agradecimentos
Este trabalho foi financiado pela Fundao para a
Cincia e a Tecnologia no mbito dos projectos SFRH/
BPD/21492/2005 e POCI/QUI/58482/2004.

Bibliografia
1. P. F. N. Fasca, O mistrio da forma das protenas,
O Cdigo Secreto: Descoberta dos padres da Natureza,
Coordenao de Margarida Telo da Gama, Guilherme
Valente, Ed., Gradiva, 2005, pp. 301-326.
2. Hue S. Chan e Ken A. Dill, The protein folding
problem, Physics Today 46, 1993, pp. 24-32.
3. Hans Frauenfelder e Peter G. Wolynes, Biomolecules: Where the physics of simplicity and complexity
meet, Physics Today 47, 1994, pp. 58-64.
4. P. F. N. Fasca e M. M. Telo da Gama, Folding of
small proteins: a matter of geometry?, Molec. Phys.
103, 2005, pp. 2903-2910.

39

Na Fig. 4 (direita) mostra-se a paisagem de energia de uma


protena real que foi determinada experimentalmente.
Note-se que, neste caso, a protena dispe de trs caminhos
de folding alternativos que conduzem todos ao estado nativo de forma diferente. A trajectria cinzenta a trajectria
ideal; a que conduz mais rapidamente ao estado nativo.
J a trajectria branca envolve a transposio da maior
barreira de energia desta paisagem, o que consome mais
tempo e conduz a um folding mais lento. Se seguir pela
trajectria preta, a protena ver-se- a certa altura forada a
voltar atrs, passando por uma conformao que est mais
longe da conformao nativa, para s depois apanhar o
caminho rpido, ou seja a trajectria cinzenta.

vendar os detalhes destes complexos processos biolgicos.


Na realidade hoje em dia j sabemos muita coisa (os mais
optimistas diriam at que se calhar j sabemos quase tudo)
sobre o mecanismo do folding de protenas pequenas [4].
O mecanismo do folding de protenas grandes, esse, ainda
permanece um grande mistrio...

GAZETA DE FSICA

caminho de folding nico, no final do qual se encontra o


estado nativo (Fig. 4, esquerda).

Você também pode gostar