Você está na página 1de 17

Universidade Federal do Triângulo Mineiro

Programa de Pós-Graduação Multicêntrico em Química de Minas Gerais

Desenvolvimento de métodos para cálculo do coeficiente de difusão no


enovelamento de proteínas

Frederico Campos Freitas

Uberaba - MG
2017
Universidade Federal do Triângulo Mineiro

Programa de Pós-Graduação Multicêntrico em Química de Minas Gerais

Desenvolvimento de métodos para cálculo do coeficiente de difusão no


enovelamento de proteínas

Frederico Campos Freitas

Projeto de pesquisa apresentado ao Programa de Pós


Graduação Multicêntrico em Química da Universi-
dade Federal do Triângulo Mineiro (UFTM).

Orientador: Prof. Dr. Ronaldo Júnio de Oliveira

Uberaba - MG
2017
Resumo

As proteínas são macromoléculas biológicas compostas por cadeias de aminoá-


cidos. Elas estão presentes em todos os seres vivos e atuam em praticamente todos os processos
celulares. Contudo, para que as proteínas possam exercer sua função corretamente, elas preci-
sam estar enoveladas, ou seja, ter um arranjo conformacional específico. As informações ne-
cessárias para que uma proteína desenovelada alcance seu estado enovelado estão na sequência
de aminoácidos que a compõe. Os mecanismos para que isso ocorra vêm sendo estudados por
bioquímicos, químicos e físicos nas últimas décadas. Apesar de ser composta por átomos e mo-
léculas, cujo comportamento os físicos conhecem a algum tempo, a simulação de uma proteína
real é praticamente inviável. Uma das alternativas é o uso de modelos simplificados, como o
conceito de funil de energia, que trata o processo de enovelamento através da competição entre
duas grandezas termodinâmicas (a energia total e a entropia) por meio da energia livre de Gibbs.
Quando a proteína atinge o nível de energia mais baixo desse funil, ela está completamente eno-
velada. A partir de modelos simplificados, o processo de enovelamento será estudado através
de uma coordenada generalizada dada pelo número de contatos nativos (Q), considerando o
processo de enovelamento como difusivo. Espera-se determinar estatisticamente o coeficiente
de difusão em função da coordenada generalizada e dessa forma entender e descrever melhor o
mecanismo de enovelamento de proteínas.
Sumário

Lista de Figuras

1 Introdução p. 5

2 Objetivos p. 10

3 Metodologia p. 11

4 Cronograma p. 13

5 Recursos técnicos e financeiros p. 14

Referências p. 15
Lista de Figuras

1.1 Superfície de energia (à esquerda) e perfil de energia livre (à direita). Alguns


estados da proteína foram representados. . . . . . . . . . . . . . . . . . . . . p. 7
5

1 Introdução

Do ponto de vista bioquímico e biofísico, as proteínas são as macromoléculas


biológicas mais abundantes e podem ser classificadas como longas cadeias poliméricas de ami-
noácidos, e são as maiores constituintes das células depois das moléculas de água. Elas são
uma classe de macromoléculas que podem desempenhar atividades catalíticas, enzimáticas, es-
truturais, como receptores de sinal e na regulação da entrada e saída de íons e outras moléculas
nas células. Essa sequência de aminoácidos é ligada covalentemente por ligações peptídicas
[1]. Vinte aminoácidos são comumente encontrados nas proteínas, e eles são compostos por um
carbono na cadeia principal (carbono 2, carbono-α ou Cα ) que mantém quatro ligações: com
um grupo amina (NH3+ ), com grupo carboxila (COO− ), uma com um hidrogênio e com uma
cadeia lateral, que os diferencia. Os aminoácidos podem ser classificados como hidrofílicos
(polares, ácidos ou básicos) ou hidrofóbicos (apolares).

As proteínas encontradas nos seres vivos são formadas por combinação desses
20 aminoácidos e sua conformação biologicamente ativa pode conter quatro níveis de estrutura,
que são denominados respectivamente por estrutura primária, secundária, terciária e quaterná-
ria. A sequência de aminoácidos na cadeia polipeptídica determina a estrutura primária (ou
a sequência da proteína). Grupos locais de aminoácidos que formam padrões que se repetem
pela proteína como estruturas de hélices alfa, folhas beta ou voltas aleatórias formam sua es-
trutura secundária. O arranjo tridimensional dessas estruturas secundárias e sua topologia com
as coordenadas de cada átomo (incluindo-se aí as cadeias laterais) formam a estrutura terciária.
Algumas proteínas têm duas ou mais subunidades separadas, que podem ser iguais ou diferen-
tes. O arranjo dessas subunidades forma a estrutura quaternária. A proteína só tem atividade
biológica quando ela está na sua forma de estrutura terciária (ou quaternária, quando houver).
Contudo, quando ela é codificada nos ribossomos, são feitas somente as ligações peptídicas
entre os aminoácidos, ou seja, ela está desenovelada. É importante descobrir como uma pro-
teína atinge sua forma nativa, quais são os mecanismos, as forças e parâmetros que atuam nesse
processo de enovelamento.

Na década de 60, Anfinsen observou usando a ribonuclease pancreática bovina


que uma proteína desnaturada, sob condições especiais, poderia se enovelar de forma espontâ-
nea, reativando sua função biológica [2]. Assim ele concluiu que a sequência de aminoácidos da
proteína contém toda informação necessária para definir sua estrutura tridimensional e sua fun-
6

ção. Além disso, concluiu que o estado nativo de uma proteína estava ligado ao nível energético
mais baixo da energia livre de Gibbs do sistema. Por outro lado, observa-se que é impossível
acessar todos os estados possíveis de uma proteína a fim de buscar a menor energia livre de
Gibbs em um tempo relativamente curto, já que o número de conformações cresce exponenci-
almente com o número de resíduos de aminoácidos [3]. Tal problema é conhecido na literatura
como paradoxo de Levinthal.

Outra forma de analisar o problema é usando-se o conceito de superfície (ou fu-


nil) de energia. A superfície de energia representa a energia livre interna de todos os estados
conformacionais, com base energética dominante. Essa superfície é rugosa, apresentando diver-
sos mínimos locais, ligados a estados parcialmente enovelados da proteína. Essa rugosidade é
pequena em comparação com o mínimo global, que uma vez atingido tende a ser estável e, por
isso, também é chamada de funil de energia. A grande inclinação do funil de energia explica a
relativa rapidez do processo de enovelamento, levando-se em conta o número de microestados
que o sistema poderia atingir.

As ideias sobre o funil são utilizadas para o entendimento do mecanismo cinético


de rearranjo das estruturas da proteína durante o enovelamento. Para isso, foram atribuídas as
seguintes propriedades às proteínas [4]:

• proteínas enovelam de um estado aleatório passando por um estado colapsado seguido de


um rearranjo;

• o rearranjo ocorre de maneira difusa e segue uma brusca queda de altas energias para
baixas energias conformacionais;

• o rearranjo acontece depois do colapso entre conformações geometricamente similares.

Dessa forma, um funil de enovelamento é entendido como uma a representação


energética de uma coleção de estruturas colapsadas (total ou parcialmente) e geometricamente
similares, uma das quais é termodinamicamente mais estável em relação às outras. O funil de
estruturas de uma proteína depende de sua sequência primária de aminoácidos, pois é nela que
está toda a informação necessária para se enovelar [5].

Um potencial termodinâmico que pode descrever um processo à pressão e tem-


peratura constante, como o enovelamento de proteína em um meio biológico, é a energia livre
de Gibbs. A superfície de energia apresenta mínimos locais, que são normalmente rotações de
cadeias laterais, com flutuações com energia da ordem de ≈ 1kB T e que são acessados mais
rapidamente que o mínimo global de energia.
7

Sob essa perspectiva, a superfície de energia pode ser associada a um funil par-
cialmente rugoso. Quanto mais baixo o nível de energia, mais próximo do estado nativo está o
sistema. Uma proteína caminha do seu estado desenovelado para o seu estado nativo dinami-
camente através dos caminhos presentes nesse funil, que são determinados pela forma e pela
rugosidade do relevo de energia da proteína. Quanto mais próximo do estado nativo, menor é
o número de estados acessíveis e isso permite que o estado nativo seja alcançado mais rapida-
mente [6].

A rugosidade da superfície de energia é determinada, do ponto de vista teórico,


pelas competições nas interações da função que mapeia a energia de uma determinada proteína.
Essa competição é chamada de frustração, e ela impede que as interações energéticas sejam
minimizadas de modo a satisfazer todas as interações locais [4]. Um exemplo de funil de
energia pode ser visto na figura 1.1.

Figura 1.1: Superfície de energia (à esquerda) e perfil de energia livre (à direita). Alguns estados
da proteína foram representados.

Figura adaptada de [7].

A conexão entre a teoria de superfície de energia e as proteínas reais já está bem


estabelecida para pequenas proteínas, que se enovelam rapidamente (com tempos de enovela-
mento da ordem de milissegundos) e tem domínio de enovelamento único (possuem dois estados
termodinâmicos com um único e bem definido funil). Todavia uma nova geração de experimen-
8

tos tem contribuído para o desenvolvimento e aperfeiçoamento dessa teoria para sistemas mais
complexos.

Como o processo de enovelamento não ocorre por uma sequência de passos obri-
gatórios (pathways) intermediários (microestados), mas por uma multiplicidade de rotas dentro
do funil de enovelamento descrito por macroestados (ensemble) [8], podemos acompanhar a
evolução do enovelamento no funil através de parâmetros de ordem macroscópicos, ou seja,
uma coordenada de reação efetiva. A coordenada de reação normalmente é o número de conta-
tos corretos (nativos) (Q) numa conformação. Ela descreve quão próximo da sua estrutura nativa
está uma determinada conformação. Normalmente essa coordenada de reação generalizada é
normalizada, ou seja, se Q = 1, a conformação em questão é a estrutura nativa e enovelada da
proteína e, se Q = 0, tem-se uma proteína totalmente desenovelada.

Termodinamicamente, a superfície de energia que modela o enovelamento pode


ser analisada por dois parâmetros, a energia total e a entropia. A vantagem nesse caso está no
fato de que o processo de enovelamento pode ser determinado por uma competição desses dois
parâmetros. À medida que a cadeia se “move” através da coordenada de reação, do topo para a
parte mais baixa do funil de energia, a sua entropia conformacional diminui. Esse movimento
é determinado por movimentos estocásticos, cuja estatística depende dos saltos através dos
mínimos locais que são acessados até que o mínimo global seja atingido.

Uma maneira de estudar o processo de enovelamento termodinamicamente é


considera-lo como difusivo, comparando-o a outros sistemas similares [9, 4]. Assim o tempo de
enovelamento pode ser calculado agrupando estatisticamente em “camadas” os estados com o
mesmo valor da coordenada de reação. O tempo de enovelamento dependerá da rugosidade da
superfície de energia e da dificuldade de superar a barreira termodinâmica de energia imposta
por essa rugosidade.

A equação de difusão descreve o fluxo de probabilidade através dessas camadas,


e ela é obtida assumindo-se que a coordenada de reação pode mudar somente por pequenos
passos relativos. Em uma determinada temperatura T , a equação que descreve a população
dessas várias camadas é do tipo Fokker-Planck, e será dada por [10]:
  
∂ P(Q,t) ∂ ∂ P(Q,t) ∂ β F(Q, T )
= D(Q, T ) + P(Q,t) (1.1)
∂t ∂Q ∂Q ∂Q

A direção média do fluxo é dada pelo gradiente da energia livre. Normalmente


em processos difusivos, incluindo-se o estudo do enovelamento de proteínas, uma primeira
aproximação considera o coeficiente de difusão (D) como constante mas, como pode ser visto
9

na equação 1.1, de maneira geral ele pode depender da coordenada de reação generalizada (Q)
e da temperatura (T ), ou seja, D(Q, T ). Em uma determinada temperatura, esse coeficiente de
difusão configuracional local D(Q) depende da rugosidade da superfície de energia e reflete
o tempo para escapar de seus mínimos locais no sistema próximo da transição para a fase de
vidro.

A energia livre F(Q, T ) depende da competição entre dois termos, o termo ener-
gético que diminui à medida que ocorre o enovelamento e o termo entrópico que aumenta com
o enovelamento. Além disso, a energia livre é fortemente dependente da temperatura. Em altas
temperaturas, a função energia livre possui um vale com uma barreira de energia muito grande
e o tempo de enovelamento aumenta exponencialmente. Na temperatura de enovelamento, a
energia livre possui dois estados com uma pequena barreira termodinâmica que tem origem na
competição entre o termo entrópico e o energético, à medida que o sistema tende ao enovela-
mento. A baixas temperaturas, o tempo de enovelamento se comporta como uma exponencial
decrescente. Por isso o coeficiente de difusão D(Q,T) depende da temperatura e da coordenada
de reação e, dessa forma, o tempo de enovelamento dependerá das forças termodinâmicas que
o governam. O tempo de enovelamento em uma dada temperatura pode ser escrito como uma
integral dupla [10]:
Z Q f old Z Q β {F(Q)−F(Q0 )}
0e
τf = dQ dQ . (1.2)
Qun f 0 D(Q)

Para uma função de energia livre F(Q) com uma barreira bem definida, Qun f
corresponde ao vale de F(Q) onde a cadeia está desenovelada e Q f old é a coordenada de reação
para o outro vale onde a cadeia está enovelada.
10

2 Objetivos

Desenvolver uma metodologia para determinar o coeficiente de difusão em fun-


ção da coordenada de reação para uma dada temperatura (D(Q)) por meio da equação de difusão
do tipo Fokker-Planck para o processo de enovelamento de proteína.

Objetivos específicos:

• Estudar a metodologia baseada na análise bayesiana para o cálculo de D(Q).

• Desenvolver uma metodologia baseada em dinâmica estocástica para o cálculo de D(Q).

• Comparar esses dois métodos com o método desenvolvido pelo grupo com o potencial
harmônico.
11

3 Metodologia

A simulação computacional de modelos minimalistas tem ajudado no entendi-


mento do enovelamento de proteínas já a algum tempo, porque uma simulação que tentasse
levar em conta todos os parâmetros envolvidos no processo demandaria um tempo computaci-
onal da mesma ordem da idade do universo, mesmo nos computadores mais modernos [4]. Os
modelos minimalistas gastam um tempo computacional bem menor por possuírem poucos pa-
râmetros. Os trabalhos teóricos computacionais começaram por volta de 1975, com simulações
em modelos de rede de duas dimensões (2D). Em 1989 foi criado um modelo mais realístico,
chamado de HP (Hidrofóbico-Polar), que foi estendido para o modelo de rede 3D no ano se-
guinte. Em 1994, Socci e Onuchic basearam-se no modelo de rede cúbica de Chan e Dill para
estudar o modelo de rede cúbica de 27 monômeros [4].

Nos sistemas que serão estudados, uma pequena proteína globular real será sim-
plificada como um heteropolímero de 27 monômeros (equivalentes aos aminoácidos de proteí-
nas reais) em uma rede cúbica 3D. Os monômeros estão ligados covalentemente ao longo da
cadeia. Cada monômero pode ocupar somente um sítio na rede (condição de volume excluído).
A estrutura inicial desenovelada do heteropolímero é criada aleatoriamente na rede. A estrutura
maximamente compacta (enovelada) é um cubo de tamanho 3 × 3 × 3 com número máximo de
contatos igual a 28. Em [11] foram enumeradas todas as conformações maximamente compac-
tas desse polímero com 27 monômeros, encontrando um número total de 103346 cubos. Se
for determinado um potencial que favoreça a formação de contatos, uma conformação maxima-
mente compacta será o estado de menor energia.

A partir desse potencial, é possível determinar a estrutura nativa de uma determi-


nada sequência enumerando os cubos, e a degenerescência do estado de energia mais baixa pode
ser determinada. O heteropolímero a ser estudado deve ter as mesmas propriedades de uma pro-
teína (protein-like), fazendo com que as sequências possuam um único estado de energia mais
baixa, um estado de energia mínima não degenerado. A força dominante no enovelamento de
proteínas é o efeito hidrofóbico [12]. Esse efeito surge da interação entre as cadeias laterais
hidrofóbicas da proteína (resíduos de aminoácidos) e o solvente (água), e é um efeito do tipo
“de muitos corpos”. O efeito hidrofóbico faz com que a cadeia sofra um colapso, ou seja, a
formação de um núcleo hidrofóbico. A escolha do potencial usado nesse modelo deve, dessa
forma, levar em conta esse efeito e assegurar que a sequência tenha um único estado mínima
12

energia no funil que o representa (energy landscape).

Existe um outro modelo, um pouco mais complexo, que considera a proteína


como uma cadeia polipeptídica na qual cada aminoácido é representado como uma esfera cen-
trada em seu carbono-α (Cα ) [13], nas quais as características de cada aminoácido (principal-
mente a hidrofobicidade, ligada ao tipo de resíduo) é atribuída a cada esfera correspondente.
Escolhendo-se o potencial de interação adequado, nesse modelo é possível mapear o enovela-
mento das proteínas tendo como referência sua conformação nativa obtida experimentalmente,
usando-se sua estrutura depositada no RCBS Protein Data Bank (PDB). [14, 15].

Através desses dois modelos, nesse trabalho será estudada a dependência do co-
eficiente de difusão nos tempos de enovelamento de um heteropolímero em um sistema de rede
cúbica e em algumas proteínas reais (usando o modelo baseado no carbono-α).
13

4 Cronograma

Durante o período de doutoramento do estudante, as seguintes atividades devem


ser realizadas:

1. Cursar disciplinas do programa.

2. Pesquisa bibliográfica sobre o tema.

3. Familiarização com o modelo de rede, modelo Cα e os códigos já existentes.

4. Desenvolvimento da teoria para o cálculo do coeficiente de difusão.

5. Desenvolvimento de algoritmos/scripts/códigos para simulação/análise.

6. Executar as simulações/análises para sistemas de interesse.

7. Participação em congressos de divulgação científica.

8. Análise dos resultados obtidos.

9. Escrita do(s) artigo(s) e sua submissão.

10. Escrita da tese de doutorado.

Tabela 4.1: Cronograma resumido das atividades a serem executadas

2017 2018 2019 2020


Janeiro 2, 3 2, 4, 5, 6, 8 7, 8, 9, 10
Fevereiro 1, 2, 3 2, 4, 5, 6, 8 7, 8, 9, 10
Março 1, 2, 3 1, 2, 3 2, 4, 5, 6, 7, 8 9, 10
Abril 1, 2, 3 1, 2, 3 2, 4, 5, 6, 7, 8, 9, 10
Maio 1, 2, 3 1, 2, 3 2, 4, 5, 6, 7, 8, 9, 10
Junho 1, 2, 3 1, 2, 3 2, 4, 5, 6, 7, 8, 9, 10
Julho 1, 2, 3 1, 2, 3 2, 4, 5, 6, 7, 8, 9, 10
Agosto 1, 2, 3 1, 2, 3 2, 4, 5, 6, 7, 8, 9, 10
Setembro 1, 2, 3 1, 2, 4, 5, 6, 8 4, 5, 6, 7, 8, 9, 10
Outubro 1, 2, 3 1, 2, 4, 5, 6, 8 4, 5, 6, 7, 8, 9, 10
Novembro 1, 2, 3 1, 2, 4, 5, 6, 8 4, 5, 6, 7, 8, 9, 10
Dezembro 1, 2, 3 1, 2, 4, 5, 6, 8 4, 5, 6, 7, 8, 9, 10
14

5 Recursos técnicos e financeiros

## O que eu coloco aqui? Devo colocar algo?


15

Referências

1 NELSON, D. L.; LEHNINGER, A. L.; COX, M. M. Lehninger Principles of Biochemis-


try. 4. ed. [S.l.]: W.H. Freeman, 2005.

2 ANFINSEN, C. B. et al. The kinetics of formation of native ribonuclease during oxidation of


the reduced polypeptide chain. Proceedings of the National Academy of Sciences, National
Acad Sciences, v. 47, n. 9, p. 1309–1314, 1961.

3 OLIVEIRA, R. J. ESTUDO DO COEFICIENTE DE DIFUSÃO NO ENOVELA-


MENTO DE PROTEÍNAS NA REDE. Dissertação (Mestrado) — UNESP, 2007.

4 OLIVEIRA, R. J. d. Estudo do Coeficiente de Difusão no Enovelamento de Proteína.


Tese (Doutorado) — UNESP, São José do Rio Preto, 08 2011.

5 ANFINSEN, C. B. Principles that govern the folding of protein chains. Science, JSTOR,
v. 181, n. 4096, p. 223–230, 1973.

6 BRYNGELSON, J. D. et al. Funnels, pathways, and the energy landscape of protein folding:
A synthesis. Proteins: Structure, Function, and Bioinformatics, Wiley Subscription Servi-
ces, Inc., A Wiley Company, v. 21, n. 3, p. 167–195, 1995. ISSN 1097-0134. Disponível em:
<http://dx.doi.org/10.1002/prot.340210302>.

7 WANG, J. et al. Topography of funneled landscapes determines the thermodynamics and


kinetics of protein folding. Proceedings of the National Academy of Sciences, National Acad
Sciences, v. 109, n. 39, p. 15763–15768, 2012.

8 DILL, K. A. et al. Principles of protein folding — A perspective from simple exact models.
Protein Science, Cold Spring Harbor Laboratory Press, v. 4, n. 4, p. 561–602, 1995. ISSN
1469-896X. Disponível em: <http://dx.doi.org/10.1002/pro.5560040401>.

9 BRYNGELSON, J. D.; WOLYNES, P. G. Spin glasses and the statistical mechanics of pro-
tein folding. Proceedings of the National Academy of Sciences, National Acad Sciences,
v. 84, n. 21, p. 7524–7528, 1987.

10 KRAMERS, H. A. Brownian motion in a field of force and the diffusion model of chemical
reactions. Physica, Elsevier, v. 7, n. 4, p. 284–304, 1940.

11 SHAKHNOVICH, E.; GUTIN, A. Enumeration of all compact conformations of copoly-


mers with random sequence of links. The Journal of Chemical Physics, AIP, v. 93, n. 8, p.
5967–5971, 1990.

12 OLIVEIRA, R. J. et al. The origin of nonmonotonic complex behavior and the effects
of nonnative interactions on the diffusive properties of protein folding. Biophysical journal,
Elsevier, v. 99, n. 2, p. 600–608, 2010.
16

13 OLIVEIRA, R. J. et al. Coordinate and time-dependent diffusion dynamics in protein fol-


ding. Methods, Elsevier, v. 52, n. 1, p. 91–98, 2010.

14 LEE, C.-L. et al. Diffusion dynamics, moments, and distribution of first-passage time on
the protein-folding energy landscape, with applications to single molecules. Physical Review
E, APS, v. 67, n. 4, p. 041905, 2003.

15 CLEMENTI, C.; NYMEYER, H.; ONUCHIC, J. N. Topological and energetic factors:


what determines the structural details of the transition state ensemble and “en-route” interme-
diates for protein folding? An investigation for small globular proteins. Journal of Molecular
Biology, Elsevier, v. 298, n. 5, p. 937–953, 2000.

Você também pode gostar