Você está na página 1de 12

CONCEITOS EM GENÉTICA

Revisitando o
Dogma Central:
a relação
entre genes
e proteínas

Felipe Tadeu Galante Rocha de Vasconcelos1*,


Igor Neves Barbosa1*,
Laura Machado Lara Carvalho1*,
Lucas Santos e Souza1*,
Ana Cristina Victorino Krepischi2
1
Pós-graduando do Departamento de Genética e Biologia
Evolutiva, Instituto de Biociências, Universidade de São Paulo, SP
* Felipe, Igor, Laura e Lucas contribuíram igualmente na produção
do texto.
2
Departamento de Genética e Biologia Evolutiva, Instituto de
Biociências, Universidade de São Paulo, SP

Autor para correspondência - ana.krepischi@ib.usp.br

Palavras-chave: dogma central, genes, proteínas, transcrição,


tradução, splicing

196 Genética na Escola | Vol. 16 | Nº 2 | 2021


Genética na Escola – ISSN: 1980-3540

Será que o ser humano tem mais genes do que organis-


mos menos complexos como um verme ou um toma-
Dogma - princípio ou conjunto
de princípios estabelecidos por te? Será que o tamanho das proteínas é proporcional
uma autoridade e considerados
como incontestavelmente
ao de seus respectivos genes? E o que faltava ao dogma
verdadeiros. Um dogma central da biologia molecular quando foi proposto?
científico é uma máxima
considerada fundamental
pela comunidade científica
Essas perguntas podem levar a ricas discussões em
para determinada área do
conhecimento.
sala de aula. Ainda assim, as discussões podem não al-
cançar a multiplicidade de processos envolvidos. Des-
sa forma, a leitura propõe-se a aprofundar conceitos
e oferecer dados que possam alicerçar tais discussões
com base nos conhecimentos científicos atuais.

Sociedade Brasileira de Genética 197


CONCEITOS EM GENÉTICA

A complexidade famosa suposição baseada nas informações


disponíveis à época de que, uma vez que a
de processos informação genética é traduzida no proces-
so de formação de proteína, não pode retor-
de transmissão nar aos níveis de DNA, RNA ou uma nova
proteína.
da informação Anos mais tarde (1965), na primeira edi-
genética e o ção do livro Biologia Molecular do Gene,
James Watson propôs que a síntese protei-
dogma central da ca poderia ser representada pelo esquema
DNA→RNA→proteína (DNA determina
biologia molecular a síntese de RNA que determina a síntese de
proteína) (Figura 1). Esse processo passou a
Em 1957, em uma palestra na Universida- ser tratado então pela comunidade científica
de College London intitulada síntese pro- como o dogma central da biologia molecular,
teica, Francis Crick, o mesmo cientista que termo proposto por Crick. Cabe frisar que
propôs o modelo da dupla hélice de DNA, esse modelo era limitado ao conhecimento
juntamente com James Watson, fez uma científico disponível à época.

Figura 1.
Proteínas estruturais - Dogma central da biologia
proteínas estruturais são as molecular, amplamente adotado
que sustentam a estrutura pela comunidade científica há
dos tecidos. Exemplos: muitos anos. Nessa concepção,
Naquela época, as proteínas eram as moléculas mais conheci-
queratina (presente na pele, o DNA serve como molde para
das da biologia molecular por algumas de suas funções estru- sua replicação e também para
unhas e cabelos) e colágeno
(responsável pela integridade turais, enzimáticas e reguladoras nos organismos, enquanto a síntese de RNA (transcrição)
das cartilagens, da pele e vasos o DNA era visto como uma molécula que contém somente que, por sua vez, contém as
sanguíneos). informações para a produção das proteínas. Também se sus- informações necessárias para
direcionar a síntese de proteína
peitava que o RNA poderia ser um intermediário entre DNA (tradução).
Paradigma - modelo, e proteína. Hoje sabemos que o RNA mensageiro é o inter-
exemplo típico ou conceito mediário responsável pela transmissão da informação genética
bem consolidado para uma à síntese proteica. Embora este seja, de fato, o fluxo geral do Reguladoras - proteínas
comunidade (no caso a processo, é apenas uma parte do todo. reguladoras ajudam a regular
científica). Diz-se que houve atividades no organismo.
a quebra de um paradigma Atualmente, sabe-se, por exemplo, que certos tipos de vírus Entre elas estão, por exemplo,
científico quando há, a partir de hormônios e fatores de
novas evidências, o rompimento
são capazes de sintetizar DNA a partir de RNA, em um pro-
transcrição (estes atuam
de um modelo ou conceito cesso conhecido como transcrição reversa, o que quebra o pa- ativando ou reprimindo a
amplamente aceito. radigma da unidirecionalidade proposta como dogma central. transcrição de genes).
A transcrição reversa ocorre por ação da enzima transcriptase
Retrovírus - grupo de vírus
reversa dos retrovírus, como o HIV. O DNA sintetizado a
HIV - Vírus da imunodeficiência
que tem genoma composto por partir da ação dessa enzima sobre o genoma viral contém os humana. Infecta células do
RNA que, por sua vez, serve genes virais, que serão integrados ao genoma de DNA da cé- sistema imunológico (de
como molde para produção de lula hospedeira, permitindo a multiplicação viral (Figura 2). defesa), o que faz com que os
DNA pela enzima transcriptase indivíduos não tratados tornem-
reversa. se mais suscetíveis a outras
infecções.

198 Genética na Escola | Vol. 16 | Nº 2 | 2021


Genética na Escola – ISSN: 1980-3540

Figura 2.
Representação esquemática
da transcrição reversa. A
transcriptase reversa - enzima
presente em retrovírus - é
capaz de utilizar o RNA do
genoma viral como molde para
a síntese de DNA dentro da
célula hospedeira. Nesta figura,
são representadas as etapas:
(1 e 2) entrada do retrovírus
na célula hospedeira; (3)
liberação do material genético
e da enzima transcriptase
reversa no citoplasma; (4)
síntese de DNA a partir do RNA
viral; (5) integração do DNA
produzido ao genoma da célula
hospedeira.

Rotavírus - vírus de
transmissão fecal-oral que
causa gastroenterite, sendo
Alguns outros vírus, como os rotavírus, são capazes de reali- umas das principais causas de
+ssRNA - material genético
diarreia grave em crianças. Uma
constituído por RNA de cadeia zar a síntese de RNAm a partir de dsRNA (do inglês double-
especificidade desse tipo de
simples e sentido positivo. -stranded RNA; RNA dupla fita, que é o genoma deste tipo de vírus é seu material genético
Sentido positivo significa
vírus), isto é, produz-se RNA sem que um DNA seja utiliza- constituído por RNA de dupla
que o RNA genômico atua
diretamente como RNA do como molde, pois eles têm uma enzima especial, a polime- fita (dsRNA).
mensageiro e é traduzido rase do RNA dependente de RNA (nos rotavírus chamada
Polimerase do RNA - é uma
pelos ribossomos da célula de VP1 - proteína viral 1) (Figura 3). Já os coronavírus, como enzima que atua na síntese de
hospedeira. Já os vírus de RNA Sars-CoV-2, que causa Covid-19, têm genoma baseado em RNA a partir de um molde de
de sentido negativo (-ssRNA)
não podem ter seu genoma
RNA de uma fita (+ssRNA - fita simples de sentido positivo), DNA.
diretamente traduzido, pois o porém durante a interação com o hospedeiro há a produção de Coronavírus - família diversa
RNA genômico é complementar intermediários de replicação viral baseados em dsRNA. de vírus com genoma baseado
ao RNA que é traduzido. Os em RNA fita simples da qual
vírus +ssRNA são os mais faz parte o SARS-CoV-2 – vírus
abundantes do planeta que causou a pandemia de
(exemplos: vírus da hepatite COVID-19 a partir de 2019.
C, da dengue, MERS , SARS-
CoV-2 e os rinovírus - que
causam o resfriado comum).

Figura 3.
Transcrição a partir de dsRNA
em rotavírus. Os rotavírus
utilizam uma polimerase de
RNA dependente de RNA
(VP1 – proteína viral 1) para
produzir RNA sem que DNA
seja utilizado como molde.
Perceber que o molde utilizado
é o dsRNA presente no genoma
viral.

Sociedade Brasileira de Genética 199


CONCEITOS EM GENÉTICA

Percebe-se, portanto, que apesar de os vírus da informação para produção de proteínas


serem estruturalmente menos complexos não são as únicas funções das moléculas de
que outros organismos, há uma multiplici- DNA e RNA. O DNA também pode ser-
dade de processos possíveis para que ocorra vir de molde para a transcrição de moléculas
a replicação de seu genoma e síntese de suas funcionais de RNA, que não são traduzi-
proteínas, a depender do tipo de vírus. das em proteínas. Atualmente, divide-se os
RNAs em RNAm (RNAs mensageiros) e
Também já foi observada a tradução direta do RNAs não codificadores (RNAnc - do inglês
DNA para proteína, sem um RNA interme- non codingRNAs) (Figura 4). Os RNAm são
diário, porém em ambiente artificial (in vitro), os que contêm a sequência codificadora para
usando ribossomos de extratos de bactérias. síntese de proteínas e já tinham sido previstos Figura 4.
Vale ressaltar que esse fenômeno nunca foi no modelo unidirecional do dogma central da Transcrição e tradução em
observado espontaneamente na natureza. eucariotos e algumas classes
biologia molecular. Os RNAnc são divididos de RNA. Na transcrição, é
Contudo, o armazenamento e a transmissão em várias classes, descritas na Tabela 1. produzido o RNAm a partir
de informações contidas no
DNA. Na tradução, o RNAm
orienta a síntese de proteínas.
Note a presença do RNAt
(RNA transportador) e dos
ribossomos, que são formados
por RNAr (RNA ribossômico).
O RNAt e o RNAr são RNAs
funcionais, não codificadores
de proteínas, isto é, não
contêm a sequência de códons
para produção da cadeia
polipeptídica/proteína, mas têm
papéis importantes no processo
de tradução. Cabe dizer
também que, em procariotos,
ambos os processos (transcrição
e tradução) ocorrem no
citoplasma, pois não há
membrana nuclear.

CLASSE FUNÇÃO Tabela 1.


Classes de RNAnc e suas
respectivas funções.
RNAs transportadores (RNAt) Transportam os aminoácidos no processo
→ ~ 70-80 nt de tradução nt - nucleotídeos.

RNAs ribossômicos (RNAr) Splicing - processo de


Compõem os ribossomos maturação do pré-RNAm em
→ ~ 120-5000 nt
RNAm por meio do qual ocorre
a retirada de íntrons e junção
Exclusivos de eucariotos, atuam no splicing
Pequenos RNAs nucleares (RNAsn) de éxons.
de RNAm, na manutenção dos telômeros e
→ ~ 60-360 nt Fatores de transcrição -
interagem com fatores de transcrição
proteínas importantes para
MicroRNAs (RNAmi) e pequenos o início e para o controle
Interagem com RNAm, regulando
RNAs de interferência (RNAsi) (reprimindo ou impulsionando)
negativamente a expressão gênica
→ ~ 21-22 nt da taxa de transcrição.
Elementos transponíveis -
RNAs de interação piwi (RNApi) Impedem a dispersão de elementos
trechos de DNA que se movem
→ ~ 24-31 nt transponíveis para outros loci dentro do genoma, podendo
por exemplo levar consigo
RNAs não codificadores longos (RNAlnc) Transcritos com mais de 200 nucleotídeos genes, promover rearranjos
→ > 200 nt envolvidos na regulação da expressão gênica cromossômicos e alterar a
expressão de genes vizinhos,
além de propiciar aumento da
variabilidade genética.

200 Genética na Escola | Vol. 16 | Nº 2 | 2021


Genética na Escola – ISSN: 1980-3540

Um exemplo clássico de RNA não codifica- mossomos X do par, exceto por alguns genes
dor é o Xist (X-inactive specific transcript) que que permanecem ativos, especialmente aque-
faz parte da classe dos RNAlnc. Este RNA les mapeados nas chamadas regiões pseu-
Pseudoautossômicas - são
está envolvido no silenciamento do cromosso- doautossômicas. O mecanismo de inativação
sequências homólogas entre os mo X em fêmeas de mamíferos placentários permite uma equivalência de dosagem entre
cromossomos sexuais (X e Y), (Figura 5). Em fêmeas, o processo de inativa- machos e fêmeas para a expressão da maioria
localizadas nas extremidades ção silencia transcricionalmente um dos cro- dos genes do cromossomo X.
de seus braços curtos e longos
- chamadas de PAR1 e PAR2.
Tais regiões estão presentes
unicamente nos cromossomos
X e Y, que pareiam entre si
durante a meiose, permitindo a
ocorrência de recombinação.

Figura 5.
Esquema da inativação do
cromossomo X. O RNA não
codificador Xist atua no
silenciamento do cromossomo
X em fêmeas. Ao observar as
células, microscopicamente, é
possível visualizar corpúsculo
de Barr na periferia do núcleo,
que corresponde ao X inativo.
O processo de inativação é
aleatório, de maneira que
algumas células têm o X
materno inativo e, as demais, o
paterno.

A escolha do cromossomo X a ser inati- no início do desenvolvimento embrionário,


vado é aleatória, de forma que algumas há a manutenção da inativação do mesmo
células terão o X paterno ativo e, outras, cromossomo X nas células-filhas. Des-
o X materno. Ao observar as células ao mi- sa forma, uma fêmea de mamíferos é um
croscópio, é possível visualizar o X inativo mosaico quanto à expressão de genes do
na periferia do núcleo, como uma estrutura cromossomo X (algumas células do orga-
condensada à qual se dá o nome de corpús- nismo têm X materno ativo e, outras, o X
culo de Barr. Após o processo de inativação paterno).

Sociedade Brasileira de Genética 201


CONCEITOS EM GENÉTICA

Tendo claro que as instruções contidas no trofina (DMD) é um dos maiores da nossa
DNA não se limitam à função de produção espécie, com aproximadamente 2,2 Mb, isto
proteica, atualmente o conceito de gene não é, 2.200.000 pb (dois milhões e duzentos mil
abrange apenas sequências codificadoras, pares de bases), o que corresponde a cerca de
mas também as que orientam a síntese de 0,07% do genoma humano. Por ser tão gran-
RNAs funcionais (RNAnc). de, estima-se que o processo de transcrição
requer 16 horas. Por outro lado, o gene da
Em eucariotos, titina (TTN), embora seja menor (~281,4
Kb), produz uma proteína maior (35.991
o tamanho de aminoácidos) do que a proteína distrofina
(de 3.685 aminoácidos).
Kb - quilobases (mil pares de
bases).

um gene não Por que essa discrepância na relação entre o


é rigidamente tamanho do gene e o tamanho da proteína?
Para entender isso, é preciso comparar as re-
proporcional ao giões codificadoras (CDS do inglês coding
sequence) que dão origem a cada uma dessas
tamanho da proteína proteínas. Mas o que é região codificadora?
Para compreender esse conceito, vamos preci-
A distrofina e a titina são proteínas presentes
sar entender o splicing do RNAm (Figura 6).
principalmente nos músculos. O gene da dis-

Figura 6.
Transcrição, processamento
de RNAm e tradução. Após
Antes de se tornarem RNAm, os trans- chamado de 5’UTR (do inglês untranslated a retirada dos íntrons, em
critos de genes codificadores de proteínas region - região não traduzida). Também há um processo denominado
são chamados transcritos primários ou uma região não traduzida na extremida- splicing, o RNAm passa a ser
formado pelas regiões exônicas.
pré-RNAm. Um dos principais eventos do de 3’, a chamada 3’UTR, que corresponde As extremidades do RNAm
processamento de pré-RNAm é a excisão de ao segmento posterior ao códon de parada maduro (denominadas regiões
íntrons e união dos éxons, porém, nem todo (UAA, UAG ou UGA). No RNAm, a re- UTR, do inglês unstranslated
o RNAm resultante desse processamento é gião codificadora fica entre as regiões UTR. regions) não são codificadoras
de proteína. A sequência que
traduzido em proteína. O início da tradu- Cabe dizer ainda que as regiões UTR po- orienta a construção da cadeia
ção se dá pela presença de uma trinca de dem envolver apenas o éxon inicial e o final, peptídica no processo de
nucleotídeos com sequência AUG, que co- mas podem envolver também mais éxons, a tradução está contida na região
difica o aminoácido metionina. O segmen- depender da localização do primeiro AUG de codificação (CDS).
to de RNAm anterior ao primeiro AUG é e do códon de parada.

202 Genética na Escola | Vol. 16 | Nº 2 | 2021


Genética na Escola – ISSN: 1980-3540

Tendo entendido o conceito de região co- dificadora da titina é quase dez vezes maior
dificadora, comparando o tamanho dessa que o da distrofina e isso significa que apenas
região nos transcritos da distrofina e da ti- uma pequena porcentagem da sequência do
tina (Tabela 2), percebe-se que, apesar de o gene da distrofina é codificadora. O gene da
gene da distrofina ser muito maior que o da distrofina tem muitos íntrons e esses introns
titina (2,2 Mb contra 281Kb), a região co- são muito grandes.

Tabela 2. Gene CDS Proteína


Informações sobre tamanhos
da sequência do gene no DNA, DMD
2,2 Mb 11.058 nt 3.685 aa
da região codificadora e da distrofina
proteína da distrofina, titina e
TTN
insulina humanas. CDS – região 281,4 Kb 107.976 nt 35.991 aa
codificadora; Mb – megabases titina
(um milhão de pares de bases); INS
Kb – quilobases (mil pares de 1,4 Kb 333 nt 51 aa
insulina
bases); nt – nucleotídeos; aa –
aminoácidos.
Outro evento que pode alterar considera- pondente à pré-pró-insulina. Durante o pro-
velmente o tamanho de uma proteína são cesso de maturação, ela sofre duas quebras
Alterações pós-traducionais alterações pós-traducionais. A proteína in- promovidas por enzimas específicas, que
- eventos de processamento sulina madura, por exemplo, passa por essas levam à retirada do peptídeo sinal e da ca-
que mudam as propriedades alterações (Figura 7). A região codificadora deia C. Dessa forma, a insulina madura tem
das proteínas por clivagem do gene da insulina leva à produção de uma apenas 51 aminoácidos, correspondentes às
(quebra) ou por adição de um
grupo químico a um ou mais
cadeia peptídica de 110 aminoácidos, corres- cadeias A e B.
aminoácidos.

Figura 7.
Modificações pós-traducionais
para produção da insulina.
Perceba que é inicialmente
traduzida a cadeia polipeptídica
chamada de pré-pró-insulina,
com 110 aminoácidos, mas
ocorrem modificações que
retiram trechos dessa cadeia
(primeiro o peptídeo sinal e
depois a cadeia C), resultando
no hormônio insulina, de
apenas 51 aminoácidos.

Sociedade Brasileira de Genética 203


CONCEITOS EM GENÉTICA

A insulina é responsável pela redução da glicemia, ao promo-


Glicemia - concentração de
ver a entrada de glicose nas células. Hoje se sabe também que glicose no sangue.
o peptídeo C cumpre algumas funções fisiológicas, tais quais:
Antioxidante - um
é um anti-inflamatório, antioxidante, antiapoptótico, tem Antiapoptótico - a apoptose
antioxidante é uma molécula atuação na melhora do fluxo sanguíneo e na bomba de sódio é um tipo de morte celular
capaz de inibir a oxidação de e potássio. Assim sendo, alterações pós-traducionais na pré- programada, um "suicídio
outras moléculas. A oxidação -pró-insulina levam à formação de duas proteínas importantes celular". Como consequência
é um tipo de reação na qual evita que células com
menores que a cadeia polipeptídica precursora: a insulina e o
ocorre a perda de elétrons de problemas comprometam o
uma determinada molécula. peptídeo C. funcionamento adequado
Embora as reações de oxidação do organismo. Mecanismos
sejam importantes em algumas
vias biológicas, elas têm O número de genes apoptóticos favorecem a
entrada em apoptose, enquanto
potencial de produzir radicais
livres que, por sua vez, são não é proporcional mecanismos antiapoptóticos a
evitam.

à complexidade do
moléculas muito reativas que
em excesso podem ser danosas
ao organismo.
organismo
O Projeto do Genoma Humano foi um empreendimento in-
Bomba de sódio e potássio
ternacional que aconteceu entre 1990 e 2003 e contou com
- proteína localizada na pesquisadores de 18 países. Tinha como objetivo determinar a
membrana plasmática cuja sequência nucleotídica completa do genoma humano, além do
atividade utiliza a energia mapeamento e identificação de seus genes. No início do proje-
proveniente da degradação Ensembl - é um Genome
to, estimava-se que o genoma humano teria cerca de 100.000
do ATP (adenosina trifosfato) Browser - isto é, um navegador
em ADP (adenosina difosfato) (cem mil) genes. O raciocínio era baseado em uma ideia sim- - que permite o acesso a
para transportar íons de sódio ples: cada gene produz uma proteína e quanto mais genes, inúmeros bancos de dados,
e potássio entre os ambientes maior a complexidade do organismo, por isso esperavam que disponíveis online com
intracelular e extracelular, o ser humano tivesse mais genes que outros organismos para informações genômicas de
sempre contra o gradiente diversas espécies. O Ensembl
de concentração, isto é, do
os quais o genoma era razoavelmente conhecido, no entanto,
original (lançado em 1999 em
ambiente de menor para o de era equivocado esse raciocínio. resposta à iminente conclusão
maior concentração. do Projeto do Genoma
Surpreendentemente, chegou-se a um número total de genes Humano) concentrava-se
do genoma humano muito inferior a 100.000, o que estava apenas em genomas de
abaixo das expectativas. De acordo com dados atuais do En- vertebrados. Desde 2009, há
sembl, o genoma humano tem cerca de 20.500 genes que co- também portais específicos
online do Ensembl para
dificam proteínas e outros 24.000 genes não codificadores, ou metazoa, plantas, fungos,
seja, que contêm instruções para síntese de RNAs funcionais. bactérias e protistas.

UniProt - banco de dados


De acordo com dados atuais do UniProt, nossa espécie tem
disponível online com pouco mais de 75.500 proteínas. Mas por que temos mais pro-
informações de sequências de teínas do que genes codificadores de proteínas em humanos?
aminoácidos nas proteínas e Há mais de um motivo, na verdade. O primeiro deles são as
suas funções. alterações pós-traducionais, das quais já tratamos aqui. Vol-
tando ao exemplo da insulina, perceba que após a tradução
ocorrem modificações na cadeia polipeptídica inicial e o resul- CGRP - peptídeo produzido
por neurônios e tem diversas
Calcitonina - produzida tado é a produção de duas proteínas derivadas: a insulina e o funções: é vasodilatador
pela tireoide, é um hormônio peptídeo C. (dilatador de vasos sanguíneos),
peptídico que diminui a
atua na transmissão de sinais de
concentração de cálcio no Outro mecanismo que contribui para termos mais proteínas dor ao cérebro e na regeneração
sangue e aumenta sua fixação
nos ossos. que genes codificadores de proteínas em humanos é um evento do tecido nervoso após lesão.
de nome splicing alternativo, que já era conhecido desde o iní- A sigla significa peptídeo
Catacalcina - peptídeo relacionado ao gene da
produzido na tireoide que atua
cio da década de 1980. Para entender o mecanismo de splicing calcitonina (do inglês, calcitonin
na redução de cálcio no sangue. alternativo, é necessária a explicação de como é a expressão gene related peptide).
da calcitonina, da catacalcina e do CGRP a partir do gene
CALCA (Figura 8).

204 Genética na Escola | Vol. 16 | Nº 2 | 2021


Genética na Escola – ISSN: 1980-3540

Figura 8.
A expressão do gene CALCA
envolve eventos de splicing
alternativo tecido-específico e O gene CALCA tem seis éxons. A transcri- Entretanto, esse mecanismo de splicing e as
modificações pós-traducionais,
resultando em três produtos ção deste gene na tireoide, seguida de pro- alterações pós-traducionais não são os úni-
proteicos diferentes. O cessamento com excisão de íntrons (splicing), cos a contribuir para que haja uma enorme
splicing na tireoide não resulta em um RNAm maduro, contendo diversidade de proteínas sintetizadas por
ocorre da mesma maneira apenas os éxons 1, 2, 3 e 4. Já nos neurônios, cada genoma eucarioto, com número que
que em neurônios. Perceba
as diferenças no conteúdo
o RNAm maduro contém os éxons 1, 2, 3, 5 pode ser inclusive superior ao de genes,
exônico do mRNA da tireoide e 6. A esse fenômeno dá-se o nome de splicing como em humanos. Outro mecanismo im-
e de neurônios. Além disso, o alternativo, em que RNAs com conteúdos portante é a existência de sítios alternati-
precursor proteico traduzido exônicos diferentes são formados (transcri- vos de início da transcrição. Nos genomas
na tireoide passa por tos diferentes). O mecanismo ocorre durante de humanos, por exemplo, mais de 50%
alterações pós-traducionais –
representadas pelas tesouras o processamento de pré-RNAm em RNAm dos genes têm sítios alternativos de início
- e resulta em dois produtos maduro. da transcrição, sendo em média quatro por
(calcitonina e catacalcina), gene.
enquanto o de neurônios forma No caso específico do gene CALCA, o
apenas o CGRP após alterações RNAm formado na tireoide dá origem a uma Mas, como esse mecanismo funciona? Para
pós-traducionais. cadeia polipeptídica precursora que sofre uma entendermos, é preciso saber que a transcri-
série de alterações pós-traducionais e origina ção de um gene em organismos eucariotos
duas proteínas: a calcitonina e a catacalcina. Já é altamente controlada. Cada gene possui
o RNAm formado em neurônios dá origem regiões regulatórias, nas quais estão pre-
a uma cadeia polipeptídica que também sofre sentes sequências específicas que contro-
alterações pós-traducionais, produzindo ape- lam a transcrição. Uma dessas sequências
nas o CGRP, ou seja, a partir do gene CALCA é a região promotora que, como o nome já
há a síntese de três produtos proteicos graças a diz, ajuda a promover a transcrição do gene,
dois mecanismos aqui tratados: splicing alter- funcionando como um local de montagem
nativo e alterações pós-traducionais. de um complexo proteico (formado por po-
limerase do RNA e fatores de transcrição).
O splicing alternativo permite que um único O sítio de início da transcrição correspon-
pré-RNAm tenha diversas possibilidades de de ao primeiro nucleotídeo transcrito (co-
splicing, aumentando consideravelmente o mumente chamado de +1) (Figura 9).
número possível de produtos proteicos.

Sociedade Brasileira de Genética 205


CONCEITOS EM GENÉTICA

Figura 9.
Estrutura gênica com sítio
de início da transcrição (+1),
que é o primeiro nucleotídeo
A depender da localização do promotor genes, mas em como as sequências gênicas transcrito. A polimerase do RNA
(um mesmo gene pode ter mais de um pro- são usadas como módulos para construir reconhece a região promotora
motor), a posição do sítio +1 pode variar, diferentes produtos. Mecanismos como alte- do gene, mas só inicia sua
transcrição a partir do sítio +1.
originando diferentes transcritos por gene rações pós-traducionais, processos alternati-
(Figura 10). vos de splicing e múltiplos sítios de início de
transcrição contribuem para a ampla gama
Assim sendo, a chave da complexidade hu- de possibilidades na produção de proteínas.
mana provavelmente não está no número de

Figura 10.
Sítios alternativos de início
da transcrição. Perceber que
Dessa forma, não é tão surpreendente que, mil) genes codificadores de proteína a mais o início da transcrição pode
de acordo com dados atuais do Ensembl, o que os humanos. E, também, que o milho variar em um mesmo gene,
zebrafish (Danio rerio – peixe paulistinha) apresente cerca de 19.000 (dezenove mil) a gerando RNAs mensageiros
tenha aproximadamente 5.000 (cinco mil) mais. Já o verme Caenorhabditis elegans tem maduros diferentes e,
consequentemente, proteínas
genes codificadores de proteínas a mais que números próximos de genes codificadores e diferentes.
os humanos, ou que o tomate (Solanum lyco- não codificadores de proteínas em relação
persicum) tenha cerca de 14.000 (quatorze aos humanos (Figura 11).

206 Genética na Escola | Vol. 16 | Nº 2 | 2021


Genética na Escola – ISSN: 1980-3540

Os dados do gráfico (Figura 11) evidenciam seu genoma, uma vez que há um amplo re-
que a complexidade de um organismo, tal pertório de mecanismos reguladores inter-
qual era entendida, não pode ser diretamen- mediários entre o gene e o produto de sua
te avaliada a partir do número de genes em expressão.

Figura 11.
Número de genes codificadores
e não codificadores de proteínas
em diferentes espécies de
eucariotos. Obs.: gráfico com
informações dos bancos de Financiamento: os autores são gratos às thesis. Proc. Natl. Acad. Sci v. 54, n. 3, p. 880-886,
agências de fomento CAPES, CNPq e 1965.
dados Ensembl, baseadas no
conhecimento científico atual. FAPESP. NCBI - Gene. Disponível em: https://www.ncbi.nlm.
Consulta em 08/06/2020, que nih.gov/gene/
está sujeito a atualizações. Ilustrações: As figuras foram produzidas
pelos autores utilizando recursos Mind the Ensembl genome browser. Disponível em: https://
www.ensembl.org/
Graph (https://www.mindthegraph.com/)
e Servier Medical Art (https://smart.servier. Ensembl plants. Disponível em: https://plants.ensem-
com/), respeitando as condições de seus ter- bl.org/
mos de uso. Ensembl protists. Disponível em: https://protists.en-
sembl.org/
Para saber mais Ensembl fungi. Disponível em: https://fungi.ensembl.
org/
STRACHAN, T.; READ, A. Genética molecular hu-
mana. 4ª edição. Porto Alegre. Artmed, 2013. Ensembl metazoa. Disponível em: https://metazoa.
ensembl.org/
MCCARTHY, B. J. HOLLAND, J. J. Denatured
DNA as a direct template for in vitro protein syn- UniProt. Disponível em: https://www.uniprot.org/

Sociedade Brasileira de Genética 207

Você também pode gostar