Escolar Documentos
Profissional Documentos
Cultura Documentos
Revisitando o
Dogma Central:
a relação
entre genes
e proteínas
Figura 1.
Proteínas estruturais - Dogma central da biologia
proteínas estruturais são as molecular, amplamente adotado
que sustentam a estrutura pela comunidade científica há
dos tecidos. Exemplos: muitos anos. Nessa concepção,
Naquela época, as proteínas eram as moléculas mais conheci-
queratina (presente na pele, o DNA serve como molde para
das da biologia molecular por algumas de suas funções estru- sua replicação e também para
unhas e cabelos) e colágeno
(responsável pela integridade turais, enzimáticas e reguladoras nos organismos, enquanto a síntese de RNA (transcrição)
das cartilagens, da pele e vasos o DNA era visto como uma molécula que contém somente que, por sua vez, contém as
sanguíneos). informações para a produção das proteínas. Também se sus- informações necessárias para
direcionar a síntese de proteína
peitava que o RNA poderia ser um intermediário entre DNA (tradução).
Paradigma - modelo, e proteína. Hoje sabemos que o RNA mensageiro é o inter-
exemplo típico ou conceito mediário responsável pela transmissão da informação genética
bem consolidado para uma à síntese proteica. Embora este seja, de fato, o fluxo geral do Reguladoras - proteínas
comunidade (no caso a processo, é apenas uma parte do todo. reguladoras ajudam a regular
científica). Diz-se que houve atividades no organismo.
a quebra de um paradigma Atualmente, sabe-se, por exemplo, que certos tipos de vírus Entre elas estão, por exemplo,
científico quando há, a partir de hormônios e fatores de
novas evidências, o rompimento
são capazes de sintetizar DNA a partir de RNA, em um pro-
transcrição (estes atuam
de um modelo ou conceito cesso conhecido como transcrição reversa, o que quebra o pa- ativando ou reprimindo a
amplamente aceito. radigma da unidirecionalidade proposta como dogma central. transcrição de genes).
A transcrição reversa ocorre por ação da enzima transcriptase
Retrovírus - grupo de vírus
reversa dos retrovírus, como o HIV. O DNA sintetizado a
HIV - Vírus da imunodeficiência
que tem genoma composto por partir da ação dessa enzima sobre o genoma viral contém os humana. Infecta células do
RNA que, por sua vez, serve genes virais, que serão integrados ao genoma de DNA da cé- sistema imunológico (de
como molde para produção de lula hospedeira, permitindo a multiplicação viral (Figura 2). defesa), o que faz com que os
DNA pela enzima transcriptase indivíduos não tratados tornem-
reversa. se mais suscetíveis a outras
infecções.
Figura 2.
Representação esquemática
da transcrição reversa. A
transcriptase reversa - enzima
presente em retrovírus - é
capaz de utilizar o RNA do
genoma viral como molde para
a síntese de DNA dentro da
célula hospedeira. Nesta figura,
são representadas as etapas:
(1 e 2) entrada do retrovírus
na célula hospedeira; (3)
liberação do material genético
e da enzima transcriptase
reversa no citoplasma; (4)
síntese de DNA a partir do RNA
viral; (5) integração do DNA
produzido ao genoma da célula
hospedeira.
Rotavírus - vírus de
transmissão fecal-oral que
causa gastroenterite, sendo
Alguns outros vírus, como os rotavírus, são capazes de reali- umas das principais causas de
+ssRNA - material genético
diarreia grave em crianças. Uma
constituído por RNA de cadeia zar a síntese de RNAm a partir de dsRNA (do inglês double-
especificidade desse tipo de
simples e sentido positivo. -stranded RNA; RNA dupla fita, que é o genoma deste tipo de vírus é seu material genético
Sentido positivo significa
vírus), isto é, produz-se RNA sem que um DNA seja utiliza- constituído por RNA de dupla
que o RNA genômico atua
diretamente como RNA do como molde, pois eles têm uma enzima especial, a polime- fita (dsRNA).
mensageiro e é traduzido rase do RNA dependente de RNA (nos rotavírus chamada
Polimerase do RNA - é uma
pelos ribossomos da célula de VP1 - proteína viral 1) (Figura 3). Já os coronavírus, como enzima que atua na síntese de
hospedeira. Já os vírus de RNA Sars-CoV-2, que causa Covid-19, têm genoma baseado em RNA a partir de um molde de
de sentido negativo (-ssRNA)
não podem ter seu genoma
RNA de uma fita (+ssRNA - fita simples de sentido positivo), DNA.
diretamente traduzido, pois o porém durante a interação com o hospedeiro há a produção de Coronavírus - família diversa
RNA genômico é complementar intermediários de replicação viral baseados em dsRNA. de vírus com genoma baseado
ao RNA que é traduzido. Os em RNA fita simples da qual
vírus +ssRNA são os mais faz parte o SARS-CoV-2 – vírus
abundantes do planeta que causou a pandemia de
(exemplos: vírus da hepatite COVID-19 a partir de 2019.
C, da dengue, MERS , SARS-
CoV-2 e os rinovírus - que
causam o resfriado comum).
Figura 3.
Transcrição a partir de dsRNA
em rotavírus. Os rotavírus
utilizam uma polimerase de
RNA dependente de RNA
(VP1 – proteína viral 1) para
produzir RNA sem que DNA
seja utilizado como molde.
Perceber que o molde utilizado
é o dsRNA presente no genoma
viral.
Um exemplo clássico de RNA não codifica- mossomos X do par, exceto por alguns genes
dor é o Xist (X-inactive specific transcript) que que permanecem ativos, especialmente aque-
faz parte da classe dos RNAlnc. Este RNA les mapeados nas chamadas regiões pseu-
Pseudoautossômicas - são
está envolvido no silenciamento do cromosso- doautossômicas. O mecanismo de inativação
sequências homólogas entre os mo X em fêmeas de mamíferos placentários permite uma equivalência de dosagem entre
cromossomos sexuais (X e Y), (Figura 5). Em fêmeas, o processo de inativa- machos e fêmeas para a expressão da maioria
localizadas nas extremidades ção silencia transcricionalmente um dos cro- dos genes do cromossomo X.
de seus braços curtos e longos
- chamadas de PAR1 e PAR2.
Tais regiões estão presentes
unicamente nos cromossomos
X e Y, que pareiam entre si
durante a meiose, permitindo a
ocorrência de recombinação.
Figura 5.
Esquema da inativação do
cromossomo X. O RNA não
codificador Xist atua no
silenciamento do cromossomo
X em fêmeas. Ao observar as
células, microscopicamente, é
possível visualizar corpúsculo
de Barr na periferia do núcleo,
que corresponde ao X inativo.
O processo de inativação é
aleatório, de maneira que
algumas células têm o X
materno inativo e, as demais, o
paterno.
Tendo claro que as instruções contidas no trofina (DMD) é um dos maiores da nossa
DNA não se limitam à função de produção espécie, com aproximadamente 2,2 Mb, isto
proteica, atualmente o conceito de gene não é, 2.200.000 pb (dois milhões e duzentos mil
abrange apenas sequências codificadoras, pares de bases), o que corresponde a cerca de
mas também as que orientam a síntese de 0,07% do genoma humano. Por ser tão gran-
RNAs funcionais (RNAnc). de, estima-se que o processo de transcrição
requer 16 horas. Por outro lado, o gene da
Em eucariotos, titina (TTN), embora seja menor (~281,4
Kb), produz uma proteína maior (35.991
o tamanho de aminoácidos) do que a proteína distrofina
(de 3.685 aminoácidos).
Kb - quilobases (mil pares de
bases).
Figura 6.
Transcrição, processamento
de RNAm e tradução. Após
Antes de se tornarem RNAm, os trans- chamado de 5’UTR (do inglês untranslated a retirada dos íntrons, em
critos de genes codificadores de proteínas region - região não traduzida). Também há um processo denominado
são chamados transcritos primários ou uma região não traduzida na extremida- splicing, o RNAm passa a ser
formado pelas regiões exônicas.
pré-RNAm. Um dos principais eventos do de 3’, a chamada 3’UTR, que corresponde As extremidades do RNAm
processamento de pré-RNAm é a excisão de ao segmento posterior ao códon de parada maduro (denominadas regiões
íntrons e união dos éxons, porém, nem todo (UAA, UAG ou UGA). No RNAm, a re- UTR, do inglês unstranslated
o RNAm resultante desse processamento é gião codificadora fica entre as regiões UTR. regions) não são codificadoras
de proteína. A sequência que
traduzido em proteína. O início da tradu- Cabe dizer ainda que as regiões UTR po- orienta a construção da cadeia
ção se dá pela presença de uma trinca de dem envolver apenas o éxon inicial e o final, peptídica no processo de
nucleotídeos com sequência AUG, que co- mas podem envolver também mais éxons, a tradução está contida na região
difica o aminoácido metionina. O segmen- depender da localização do primeiro AUG de codificação (CDS).
to de RNAm anterior ao primeiro AUG é e do códon de parada.
Tendo entendido o conceito de região co- dificadora da titina é quase dez vezes maior
dificadora, comparando o tamanho dessa que o da distrofina e isso significa que apenas
região nos transcritos da distrofina e da ti- uma pequena porcentagem da sequência do
tina (Tabela 2), percebe-se que, apesar de o gene da distrofina é codificadora. O gene da
gene da distrofina ser muito maior que o da distrofina tem muitos íntrons e esses introns
titina (2,2 Mb contra 281Kb), a região co- são muito grandes.
Figura 7.
Modificações pós-traducionais
para produção da insulina.
Perceba que é inicialmente
traduzida a cadeia polipeptídica
chamada de pré-pró-insulina,
com 110 aminoácidos, mas
ocorrem modificações que
retiram trechos dessa cadeia
(primeiro o peptídeo sinal e
depois a cadeia C), resultando
no hormônio insulina, de
apenas 51 aminoácidos.
à complexidade do
moléculas muito reativas que
em excesso podem ser danosas
ao organismo.
organismo
O Projeto do Genoma Humano foi um empreendimento in-
Bomba de sódio e potássio
ternacional que aconteceu entre 1990 e 2003 e contou com
- proteína localizada na pesquisadores de 18 países. Tinha como objetivo determinar a
membrana plasmática cuja sequência nucleotídica completa do genoma humano, além do
atividade utiliza a energia mapeamento e identificação de seus genes. No início do proje-
proveniente da degradação Ensembl - é um Genome
to, estimava-se que o genoma humano teria cerca de 100.000
do ATP (adenosina trifosfato) Browser - isto é, um navegador
em ADP (adenosina difosfato) (cem mil) genes. O raciocínio era baseado em uma ideia sim- - que permite o acesso a
para transportar íons de sódio ples: cada gene produz uma proteína e quanto mais genes, inúmeros bancos de dados,
e potássio entre os ambientes maior a complexidade do organismo, por isso esperavam que disponíveis online com
intracelular e extracelular, o ser humano tivesse mais genes que outros organismos para informações genômicas de
sempre contra o gradiente diversas espécies. O Ensembl
de concentração, isto é, do
os quais o genoma era razoavelmente conhecido, no entanto,
original (lançado em 1999 em
ambiente de menor para o de era equivocado esse raciocínio. resposta à iminente conclusão
maior concentração. do Projeto do Genoma
Surpreendentemente, chegou-se a um número total de genes Humano) concentrava-se
do genoma humano muito inferior a 100.000, o que estava apenas em genomas de
abaixo das expectativas. De acordo com dados atuais do En- vertebrados. Desde 2009, há
sembl, o genoma humano tem cerca de 20.500 genes que co- também portais específicos
online do Ensembl para
dificam proteínas e outros 24.000 genes não codificadores, ou metazoa, plantas, fungos,
seja, que contêm instruções para síntese de RNAs funcionais. bactérias e protistas.
Figura 8.
A expressão do gene CALCA
envolve eventos de splicing
alternativo tecido-específico e O gene CALCA tem seis éxons. A transcri- Entretanto, esse mecanismo de splicing e as
modificações pós-traducionais,
resultando em três produtos ção deste gene na tireoide, seguida de pro- alterações pós-traducionais não são os úni-
proteicos diferentes. O cessamento com excisão de íntrons (splicing), cos a contribuir para que haja uma enorme
splicing na tireoide não resulta em um RNAm maduro, contendo diversidade de proteínas sintetizadas por
ocorre da mesma maneira apenas os éxons 1, 2, 3 e 4. Já nos neurônios, cada genoma eucarioto, com número que
que em neurônios. Perceba
as diferenças no conteúdo
o RNAm maduro contém os éxons 1, 2, 3, 5 pode ser inclusive superior ao de genes,
exônico do mRNA da tireoide e 6. A esse fenômeno dá-se o nome de splicing como em humanos. Outro mecanismo im-
e de neurônios. Além disso, o alternativo, em que RNAs com conteúdos portante é a existência de sítios alternati-
precursor proteico traduzido exônicos diferentes são formados (transcri- vos de início da transcrição. Nos genomas
na tireoide passa por tos diferentes). O mecanismo ocorre durante de humanos, por exemplo, mais de 50%
alterações pós-traducionais –
representadas pelas tesouras o processamento de pré-RNAm em RNAm dos genes têm sítios alternativos de início
- e resulta em dois produtos maduro. da transcrição, sendo em média quatro por
(calcitonina e catacalcina), gene.
enquanto o de neurônios forma No caso específico do gene CALCA, o
apenas o CGRP após alterações RNAm formado na tireoide dá origem a uma Mas, como esse mecanismo funciona? Para
pós-traducionais. cadeia polipeptídica precursora que sofre uma entendermos, é preciso saber que a transcri-
série de alterações pós-traducionais e origina ção de um gene em organismos eucariotos
duas proteínas: a calcitonina e a catacalcina. Já é altamente controlada. Cada gene possui
o RNAm formado em neurônios dá origem regiões regulatórias, nas quais estão pre-
a uma cadeia polipeptídica que também sofre sentes sequências específicas que contro-
alterações pós-traducionais, produzindo ape- lam a transcrição. Uma dessas sequências
nas o CGRP, ou seja, a partir do gene CALCA é a região promotora que, como o nome já
há a síntese de três produtos proteicos graças a diz, ajuda a promover a transcrição do gene,
dois mecanismos aqui tratados: splicing alter- funcionando como um local de montagem
nativo e alterações pós-traducionais. de um complexo proteico (formado por po-
limerase do RNA e fatores de transcrição).
O splicing alternativo permite que um único O sítio de início da transcrição correspon-
pré-RNAm tenha diversas possibilidades de de ao primeiro nucleotídeo transcrito (co-
splicing, aumentando consideravelmente o mumente chamado de +1) (Figura 9).
número possível de produtos proteicos.
Figura 9.
Estrutura gênica com sítio
de início da transcrição (+1),
que é o primeiro nucleotídeo
A depender da localização do promotor genes, mas em como as sequências gênicas transcrito. A polimerase do RNA
(um mesmo gene pode ter mais de um pro- são usadas como módulos para construir reconhece a região promotora
motor), a posição do sítio +1 pode variar, diferentes produtos. Mecanismos como alte- do gene, mas só inicia sua
transcrição a partir do sítio +1.
originando diferentes transcritos por gene rações pós-traducionais, processos alternati-
(Figura 10). vos de splicing e múltiplos sítios de início de
transcrição contribuem para a ampla gama
Assim sendo, a chave da complexidade hu- de possibilidades na produção de proteínas.
mana provavelmente não está no número de
Figura 10.
Sítios alternativos de início
da transcrição. Perceber que
Dessa forma, não é tão surpreendente que, mil) genes codificadores de proteína a mais o início da transcrição pode
de acordo com dados atuais do Ensembl, o que os humanos. E, também, que o milho variar em um mesmo gene,
zebrafish (Danio rerio – peixe paulistinha) apresente cerca de 19.000 (dezenove mil) a gerando RNAs mensageiros
tenha aproximadamente 5.000 (cinco mil) mais. Já o verme Caenorhabditis elegans tem maduros diferentes e,
consequentemente, proteínas
genes codificadores de proteínas a mais que números próximos de genes codificadores e diferentes.
os humanos, ou que o tomate (Solanum lyco- não codificadores de proteínas em relação
persicum) tenha cerca de 14.000 (quatorze aos humanos (Figura 11).
Os dados do gráfico (Figura 11) evidenciam seu genoma, uma vez que há um amplo re-
que a complexidade de um organismo, tal pertório de mecanismos reguladores inter-
qual era entendida, não pode ser diretamen- mediários entre o gene e o produto de sua
te avaliada a partir do número de genes em expressão.
Figura 11.
Número de genes codificadores
e não codificadores de proteínas
em diferentes espécies de
eucariotos. Obs.: gráfico com
informações dos bancos de Financiamento: os autores são gratos às thesis. Proc. Natl. Acad. Sci v. 54, n. 3, p. 880-886,
agências de fomento CAPES, CNPq e 1965.
dados Ensembl, baseadas no
conhecimento científico atual. FAPESP. NCBI - Gene. Disponível em: https://www.ncbi.nlm.
Consulta em 08/06/2020, que nih.gov/gene/
está sujeito a atualizações. Ilustrações: As figuras foram produzidas
pelos autores utilizando recursos Mind the Ensembl genome browser. Disponível em: https://
www.ensembl.org/
Graph (https://www.mindthegraph.com/)
e Servier Medical Art (https://smart.servier. Ensembl plants. Disponível em: https://plants.ensem-
com/), respeitando as condições de seus ter- bl.org/
mos de uso. Ensembl protists. Disponível em: https://protists.en-
sembl.org/
Para saber mais Ensembl fungi. Disponível em: https://fungi.ensembl.
org/
STRACHAN, T.; READ, A. Genética molecular hu-
mana. 4ª edição. Porto Alegre. Artmed, 2013. Ensembl metazoa. Disponível em: https://metazoa.
ensembl.org/
MCCARTHY, B. J. HOLLAND, J. J. Denatured
DNA as a direct template for in vitro protein syn- UniProt. Disponível em: https://www.uniprot.org/