Escolar Documentos
Profissional Documentos
Cultura Documentos
Unidade 6
Transcrição e regulação da expressão gênica
I. Introdução
V. Processamento de RNA
IX. Referências
#M3U6 I. Introdução
N
o início dos anos 1950, após a descoberta da estrutura do DNA, pôde-se enten-
der como a informação hereditária nas células é codificada em seqüências de
nucleotídeos de DNA. Cinqüenta anos depois, a ciência já dispõe de seqüências
completas de genomas de muitos organismos, inclusive humanos, ou seja, conhecemos
a quantidade máxima de informação necessária para produzir um organismo complexo
como nós mesmos.
Nesta unidade, você verá como as células decodificam e usam a informação de seus
genomas por meio de quatro diferentes nucleotídeos do DNA. Ainda temos muito a des-
cobrir sobre como a informação armazenada no genoma de um organismo produz desde
o mais simples organismo unicelular bacteriano, contendo 500 genes, até o desenvolvi-
mento de um ser humano com aproximadamente 30 mil genes. Uma enorme quantidade
de informações ignoradas persiste; portanto, muitos desafios fascinantes aguardam as
próximas gerações de biólogos.
O DNA não direciona a síntese protéica diretamente, mas utiliza o RNA como
uma molécula intermediária. No início do processo de transcrição, a seqüência de nu-
cleotídeos da porção apropriada de uma longa molécula de DNA em um cromossomo é
primeiramente copiada sob forma de RNA. São essas cópias de RNA de segmentos de
DNA que são usadas diretamente como moldes para direcionar a síntese da proteína
(processo denominado de tradução), que será estudado em um próximo módulo. O
fluxo de informação genética nas células é, portanto, de DNA para RNA para proteína
(Figura 1). Todas as células, desde a bactéria até os seres humanos, expressam sua in-
Saiba mais formação genética dessa maneira – um princípio tão fundamental que é denominado o
ADN é a abreviatura Dogma Central da Biologia Molecular.
em português
para ácido
desoxirribonucleico
(em inglês, DNA:
deoxyribonucleic
acid).
RNA é a abreviatura
em inglês ribonucleic
acid (que em
português seria ARN:
ácido ribonucléico).
Figura 1: do DNA à proteína. A informação genética é lida e processada em duas etapas. Primeiro,
na transcrição, os segmentos de uma seqüência de DNA são usados para guiar a síntese de
moléculas de RNA. Depois, na tradução, as moléculas de RNA são usadas para guiar a síntese de
moléculas de proteínas.
Figura 2: a estrutura química do RNA. (A) O RNA contém o açúcar ribose, o qual difere da
desoxirribose, o açúcar utilizado no DNA pela presença de um agrupamento –OH adicional. (B)
O RNA contém a base uracila, a qual difere da timina, a base equivalente no DNA, pela ausência
de um grupo – CH3. (C) Um pequeno fragmento de RNA. A ligação química fosfodiéster entre
nucleotídeos no RNA é a mesma que ocorre no DNA.
que você verá a seguir, a cópia nunca é exata. Sempre ocorrem erros ocasionais, embora
em freqüência muito baixa. E são esses erros que, conhecidos como mutações, permitem
a evolução da vida.
Em contradição, a transcrição espelha o estado fisiológico da célula. Ela é extrema-
mente variável, transcrevendo somente um gene ou grupo de genes em particular em um
dado instante fisiológico. Por outro lado, dependendo da situação metabólica da célula, o
mesmo gene pode ser transcrito incontáveis vezes até que a demanda seja suprida.
Além da característica temporal da transcrição, esse é um processo extremamente
seletivo. Essa seletividade acontece em dois níveis:
somente partes do DNA são transcritas para produzir RNA. Por exemplo, nas
células da maioria dos mamíferos, somente 1% de toda a seqüência do DNA é
copiada para formar seqüências de RNA funcional, e algumas partes do DNA
podem nunca ser transcritas;
Duas seqüências
de ácidos
nucléicos são ditas
complementares
se elas podem
#M3U6 III. Mecanismos de transcrição formar uma
dupla hélice
com as bases
perfeitamente
A transcrição ocorre a partir da informação contida na seqüência de nucleotídeos pareadas.
Antiparalelismo
de uma molécula de DNA fita dupla, sendo sempre no sentido 5’ → 3’. Apenas uma das
é a característica
fitas do DNA, chamada de fita molde, é utilizada durante a síntese, que segue as mesmas que descreve a
orientação relativa
regras de complementaridade e antiparalelismo, exceto pelo pareamento de uracil (U),
das duas fitas
ao invés de timina (T), com adenina (A). O RNA recém-sintetizado (5’ → 3’) é, portanto, em uma dupla
hélice de DNA; a
complementar à fita de DNA, que serviu de molde (3’ → 5’), e idêntico (salvo o apareci-
polaridade de uma
mento ocasional de uma mutação, como anteriormente explicado) à outra fita de DNA do fita é orientada
na direção oposta
duplex (5’ → 3’). Por convenção, entretanto, a seqüência de nucleotídeos de um gene é
da polaridade da
sempre representada na orientação 5’ → 3’, ou seja, a fita que não serve de molde. outra.
Atividade complementar 1
Para que você possa entender melhor o termo “sentido 5’ → 3’, faça uma revisão do
Módulo I, em Estrutura e Função dos ácidos nucléicos. Esse termo está relacionado
com a posição dos novos nucleotídeos inseridos na nova molécula a ser formada,
por meio da ligação fosfodiéster (Figura 3).
Em 1960, foi descoberta uma enzima capaz de, na presença de DNA fita dupla e dos
ribonucleotídeos trifosfatados (ATP, CTP, GTP e UTP), sintetizar RNA. Essa enzima foi
denominada RNA-polimerase (RNAP). A reação catalisada pelas RNAPs é mecanistica-
mente idêntica à reação catalisada pelas DNA-polimerases (Figura 3).
Figura 3: o DNA é transcrito pela enzima RNA polimerase. A RNA polimerase (azul claro) move-se
paulatinamente ao longo do DNA, desespiralando, em seu sítio ativo, a hélice de DNA. Conforme
avança, a polimerase adiciona nucleotídeos (aqui, pequenos objetos na forma de “T”), um a um,
à cadeia de RNA, no sítio de polimerização, usando uma fita de DNA exposta como molde. O RNA
transcrito é, conseqüentemente, uma cópia complementar, fita simples, de uma das duas fitas do
DNA. A polimerase tem uma projeção que desloca o RNA recém-formado, permitindo que as duas
fitas de DNA atrás da polimerase voltem a se espiralizar. Uma região curta de hélice DNA/RNA (de
aproximadamente nove nucleotídeos) é, portanto, formada temporariamente, e uma “janela”da
hélice DNA/RNA move-se ao longo do DNA, com a polimerase. Os nucleotídeos a serem incorporados
estão na forma de ribonucleotídeos trifosfatos (ATP, UTP, CTP E GTP), e a energia estocada em vias
ligações fosfato-fosfato fornece a força necessária para a reação de polimerização.
Existem, pelo menos, cinco RNAPs diferentes que estão envolvidas na síntese de
RNAs específicos: RNAP I, RNAP II, RNAP III, RNAP mitocondrial (mtRNAP) e RNAP
de cloroplastos. As RNAPs nucleares são abordadas a seguir:
Iniciação
O primeiro passo da transcrição requer regiões reguladoras, acoplamento de fato-
res de transcrição e fatores de RNAP II. Embora a organização das regiões reguladoras
da transcrição por RNAP II varie para os diferentes genes e nos diferentes organismos,
existem alguns componentes básicos:
enhancers:
O início da transcrição, em genes que utilizam RNAP II, é complexo e envolve uma
cascata, na qual vários fatores de transcrição vão se ligando ao DNA. Primeiramente, há
ligação de um fator ao TATA Box.
Saiba mais
Proteína ativadora
Todos esses
detalhes da
formação da TATA
cascata para Ativador box Início da
iniciação da (sítio de ligação
transcrição
transcrição pela para a proteína
RNA polimerase ativadora) Ligação dos fatores gerais de transcrição,
II em célula RNA polimerase, mediador, complexos
eucariótica, você remodeladores de cromatina
encontrará em e acetilases de histonas.
nossa bibliografia
indicada. A figura
4 dará uma idéia
de toda essa
complexidade.
Mediador Complexo
remodelador
de cromatina
Figura 4: iniciação da transcrição pela RNA polimerase II em uma célula eucariótica. O início da
transcrição in vivo necessita da presença de proteínas ativadoras transcricionais. Essas proteínas se
ligam a pequenas seqüências específicas no DNA. Embora somente uma seja apresentada aqui, um
gene eucariótico típico tem muitas proteínas ativadoras que, juntas, determinam sua taxa de seu
padrão de transcrição. Às vezes agindo a uma distância de vários milhares de pares de nucleotídeos
(indicado pela molécula de DNA segmentada), essas proteínas reguladoras de genes auxiliam a RNA
polimerase, os fatores gerais e o mediador a se associarem no promotor. Além disso, os ativadores
atraem complexos remodeladores de cromatina dependentes de ATP e acetilases de histonas.
Essa ligação sinaliza para que outros fatores se liguem entre si e a outros elementos do
promotor. Quando todos os fatores já estiverem em seus devidos locais, o complexo estará
pronto para receber a RNAP II e formar o chamado complexo de iniciação da transcrição.
A RNAP II é responsável por abrir as fitas de DNA e colocar a primeira base. Essa
abertura das cadeias forma a “bolha de transcrição”, estrutura que é característica
do processo. Para ativar a transcrição, outros fatores ligam-se ao enhancer e intera-
gem com o complexo de iniciação da transcrição.
Alongamento
É o aumento da cadeia de RNA envolvendo outros fatores acessórios que são ne-
cessários. Os fatores utilizados no complexo de iniciação da transcrição são liberados, e a
RNAP II sofre alterações na sua conformação. A “bolha de transcrição” move-se sobre o
molde de DNA, abrindo o DNA à frente e fechando atrás de si. Um duplex híbrido DNA-
RNA forma-se dentro da bolha à medida que o RNA é sintetizado. Os erros na seqüência
da cadeia produzidos nessa etapa são cuidadosamente corrigidos pela RNA polimerase.
Terminação
Muito pouco se conhece sobre o término da transcrição. Sabe-se que todas as três
RNAPs terminam a síntese em regiões consenso do DNA ricas em T. Essas regiões são “si-
nais” codificados pelo DNA, que indicam onde deve ser a extremidade 3’. Esses sinais são
reconhecidos por enzimas que se ligam ao RNA, clivando-o para formar a extremidade 3’, ou
seja, o sítio de clivagem precede essa região consenso. Após a clivagem, esses nucleotídeos
que compunham a região consenso sinalizadora para a clivagem são degradados no núcleo.
A figura 5, abaixo, dará uma visão geral dos passos que levam do gene à proteína
em eucariotos e em bactérias.
Figura 5: resumo dos passos que levam do gene à proteína em eucariotos e em bactérias. O nível
final de uma proteína em uma célula depende da eficiência de cada passo e das taxas de degradação
das moléculas de RNA e de proteína. (A) Nas células eucarióticas, a molécula de RNA produzida por
transcrição (às vezes referida como o transcrito primário) pode conter tanto seqüências codificantes
(éxon) como não codificantes (íntron). Antes de esse ser traduzido em proteína, as duas extremidades
do RNA são modificadas, os íntrons são removidos por uma reação de RNA splicing catalisada
enzimaticamente, e o mRNA resultante é transportado do núcleo para o citoplasma. Embora esses
passos estejam ilustrados como se ocorressem um a um, em uma seqüência, na verdade, eles são
articulados, e diferentes passos podem ocorrer simultaneamente. Por exemplo, a capa de RNA é
adicionada, e o splicing caracteristicamente inicia antes que a transcrição tenha sido completada.
Devido a essa associação, o transcrito primário de RNA completo não existe caracteristicamente na
célula. (B) Nos procariotos, a produção de moléculas de mRNA é muito mais simples. A extremidade
de 5’de uma molécula de mRNA é produzida por meio da iniciação da transcrição pela RNA polimerase,
e a extremidade 3’ é produzida pela terminação da transcrição. Como as células procarióticas não
possuem núcleo, a transcrição e a tradução ocorrem em um compartimento comum. De fato, a
tradução de um mRNA bacteriano freqüentemente inicia antes de sua síntese ter sido completada.
Processamento de mRNA
A molécula de mRNA recém-sintetizada no núcleo sofre várias alterações bioquí-
micas. Assim, transforma-se no que é chamado de mRNA maduro ou mRNA processa-
do, para, só então, ser transportado ao citoplasma e lá ser traduzido. Esses precursores
de mRNA são chamados de RNA nuclear heterogêneo (hnRNA – heterogeneous nuclear
RNA). O processamento desses hnRNAs envolve modificações de nucleotídeos que aca-
bam por aumentar a estabilidade do mRNA e convertê-lo em RNA maduro.
Adição do cap – a primeira modificação do hnRNA ocorre em sua extremidade 5’,
logo após o início do processo de transcrição. Um resíduo de guanina é ligado cova-
lentemente ao primeiro nucleotídeo do hnRNA através de uma ligação fosfato 5’-5’,
com o resíduo de guanina, estando na posição inversa a dos demais nucleotídeos.
Essa estrutura é chamada de cap. O cap sofre, então, uma metilação na posição 7 da
guanina, resultando no nucleotídeo 7-metilguanilato (m7G). Todas essas reações são
Para que você possa visualizar toda essa descrição, acompanhe o esquema das
figuras 6 e 7.
Figura 6: uma comparação das estruturas de moléculas de mRNA procariótico e eucariótico. (A) As
extremidades 5’e 3’de um mRNA bacteriano são as extremidades não modificadas da cadeia sintetizada
pela RNA polimerase, a qual inicia e termina a transcrição naqueles pontos, respectivamente. As
extremidades correspondentes de um mRNA eucariótico são formadas pela adição de uma capa na
extremidade 5’e pela clivagem do transcrito pré-mRNA e adição de uma cauda poli-A, respectivamente.
A figura também ilustra outra diferença entre os mRNAs procarióticos e eucarióticos: os mRNAs
bacterianos podem conter as instruções para várias proteínas diferentes, enquanto que os mRNAs
eucarióticos praticamente contêm sempre a informação para uma única proteína. (B) A estrutura da
capa na extremidade 5’de moléculas de mRNA eucariótico. Observe a ligação incomum 5’- a 5’ do 7
metil G ao restante do RNA. Muitos mRNAs eucarióticos apresentam uma modificação adicional: um
grupamento 2’- hidroxil do segundo açúcar ribose no mRNA, o qual é metilado (não ilustrado).
Figura 7: as reações que capeiam a extremidade 5’ de cada molécula de RNA sintetizada pela RNA
polimerase II. A capa final contém uma nova ligação 5’- a 5’entre o resíduo 7 metil G positivamente
carregado e a extremidade 5’do transcrito de RNA. A letra N representa qualquer um dos quatro
ribonucleotídeos, embora o nucleotídeo que comece uma cadeia de eRNA seja geralmente uma
purina (um A ou um G).
onde deverá ser efetuado o splicing (chamado de sítio de splice), ou auxiliar na sua localiza-
ção, e têm características importantes:
os primeiros e os últimos dois nucleotídeos da extremidade 5’ e 3’ dos íntrons são
GU e AG, respectivamente;
há uma adenina aproximadamente 18-20 nucleotídeos upstream da extremidade 3’
do íntron. Ambas têm um papel importante no processo de splicing. Além dessas
seqüências consenso, há uma freqüência maior de algumas bases que estão próxi-
mas do sítio de splicing, tanto no éxon como no íntron, e há, também, uma tendên-
cia da região próxima à extremidade 3’ do íntron ser rica em pirimidinas (U e C).
Sem essas seqüências consenso, ocorrem alterações no processo de splicing.
Figura 8: a reação de splicing de RNA. (A) No primeiro passo, um nucleotídeo adenina específico
na seqüência do íntron (indicado em vermelho) ataca a região 5’de splicing e corta a estrutura de
açúcar-fosfato do RNA neste ponto. A extremidade 5’ cortada do íntron torna-se covalentemente
ligada ao nucleotídeo de adenina, como mostrado no detalhe em (B), criando, assim, uma alça na
molécula de RNA. A extremidade 3’-OH livre e liberada da seqüência do éxon reage com o início da
seqüência do éxon seguinte, unindo os dois éxons e liberando a seqüência do íntron na forma de
um laço ou de uma alça. Conseqüentemente, as seqüências dos dois éxons se unem, formando uma
seqüência codificante contínua. A seqüência do íntron liberado é degradada no momento adequado.
Atividade complementar 2
Agora chegou o momento de pesquisa e estudo!
Consulte os livros da nossa bibliografia indicada e veja como ocorre o processo me-
diado por “spliceossomos” e auto-splicing.
www. Após o estudo teórico, vemos a necessidade de uma interação melhor com
multimídias disponíveis na internet.
<http://www.nature.com/nrn/journal/v2/n1/animation/nrn0101_043a_swf_MEDIA1.html>
Saiba mais
Em 1965, os franceses François Jacob e Jacques Monod, juntamente com Andre Lwoff,
descreveram esse mecanismo, recebendo por isso o Prêmio Nobel em Medicina. Eles estudaram
os genes que codificam as enzimas responsáveis pela degradação da lactose em E. coli. Este
modelo se encontra em vários livros, textos, e introduziremos de forma didática um mecanismo
que é comum a muitos outros microrganismos, observado na regulação de muitos genes.
Figura 9: distribuição dos genes e módulos de controle do operon lac. O gene i, para o repressor
lac, expresso constitutivamente, está situado próximo ao conjunto dos genes induzíveis lacZ, lacY e
lacA, responsáveis pela síntese das proteínas b-galactosidase, permease e transacetilase. O promotor
plac é controlado pelo operador olac, onde se ligam duas moléculas do repressor.
Saiba mais
Saiba mais
Genética Moderna
Autores: J.F Antohony Griffiths,
Jeffrey H. Miller,
Richard C. Lewontin,
Lembre-se que:
O sítio operador é uma região do DNA logo abaixo do sítio promotor. Na verdade,
os dois sítios estão parcialmente imbricados, pois o promotor se estende da base -45 até a
base +5, enquanto o sítio operador vai da base -8 até a +12. Dessa forma, se tivermos uma
proteína ligada ao sítio operador, ela vai impedir que esse seja ligado pela RNApol.
O repressor lac, por sua vez, é o produto de um gene que está próximo ao óperon,
porém não faz parte integral dele (na verdade, esse gene poderia estar muito distante no
genoma de E. coli). Na ausência de lactose, as poucas moléculas de repressor presentes no
citosol da bactéria (menos de 10 por célula!) são suficientes para silenciar a expressão do
óperon, ligando-se ao sítio operador. Na presença de lactose, contudo, o repressor é inati-
vado pela ligação de um produto do metabolismo da lactose: a alolactose. Inicia-se, então,
a transcrição dos genes lacZ, lacY e lacA, formando-se um mRNA policistrônico.
Bom! O que você acha? Será que nesse momento o mRNA já foi traduzido?
Esse mRNA é imediatamente traduzido para formar três enzimas da via de degra-
dação da lactose: a b-galactosidase (b-gal), a permease e a transacetilase. A b-gal degrada
a lactose, até galactose e glicose, e a permease aumenta muitas vezes a permeabilidade da
célula à lactose. Com isso, a lactose do meio de cultura é rapidamente assimilada e utili-
zada pela célula. Quando a concentração de lactose reduz-se muito, até as moléculas que
estão ligadas ao repressor acabarão sendo clivadas pela b-gal. A conseqüência disso é a
ligação dos repressores, agora ativos, ao sítio operador, provocando a parada da transcri-
ção dos genes lacZ, lacY e lacA (Figura 10).
Figura 10: esquema representativo do controle da transcrição dos genes para as enzimas
responsáveis pelo uso da lactose em E. coli. O repressor, produto do gene i, liga-se ao operador
(em verdade, duas moléculas), impedindo a ligação da RNApol ao sítio promotor Plac e bloqueando a
transcrição. A lactose no citosol bacteriano liga-se ao repressor, inativando-o e liberando o promotor
para ser ligado pela RNApol. O processo de transcrição estará liberado até que a concentração
citosólica de lactose seja insuficiente para garantir a inativação das moléculas do repressor.
Esse curioso mecanismo de controle positivo do óperon lac também foi observado
em diversos outros óperons bacterianos. Qual seu objetivo, afinal?
A explicação é simples: quando a bactéria não tem glicose para degradar, ela pas-
sa por um processo de “fome” celular, com conseqüente aumento dos níveis de cAMP
celulares. Esse cAMP se liga à proteína CAP, permitindo uma expressão aumentada de
todos os óperons que são responsáveis pela degradação de açúcares e outros produtos
energéticos. A figura a seguir ilustra os dois controles (pelo repressor e pelo complexo
CAP-cAMP) do óperon lac (Figura 11).
Figura 11: controle do óperon lac pela proteína CAP e pelo repressor lac.
Diante de tantos detalhes, vem a pergunta! Que importância tem o óperon lac na
genética molecular?
Muitos dos vetores de expressão, sejam eles fagos ou plasmídeos, empregados em
engenharia genética, têm o gene clonado sob o controle de um promotor/operador lac.
Esse sistema propicia o controle da expressão do gene clonado através da adição de um
análogo da lactose: o IPTG (isopropiltiogalactosídeo). Este produto é muitas vezes mais
efetivo que a lactose na indução da expressão do óperon lac, além de não ser degradado.
Veremos, mais adiante, como podemos tirar vantagem dessas construções artificiais de
genes para a produção de proteínas recombinantes.
Leia mais sobre todo o processo do óperon triptofano (óperon tryp). Lembre-se www.
que será necessário correlacionar com os módulos vistos anteriormente, como a
biossíntese de aminoácidos, no site
<http://paginas.terra.com.br/educacao/biolmol/aula4_controle.htm>
De modo geral, os passos pelos quais a expressão gênica eucariótica pode ser con-
trolada estão descritos abaixo.
Como vimos, existem muitos passos no caminho que leva do DNA à proteína, e to-
dos podem, inicialmente, ser regulados. Portanto, uma célula pode controlar as proteínas
que podem, em princípio, ser reguladas. Portanto, uma célula pode controlar as proteínas
que produz das seguintes formas (Figura 12):
pelo controle de quando e como um determinado gene é transcrito (controle
transcricional);
pelo controle de como um transcrito de RNA é submetido a splicing ou processa-
do de alguma outra maneira (controle do processamento de RNA);
pela seleção de quais mRNAs completos no núcleo celular são exportados para
o citoplasma e quais determinam a sua localização no citoplasma (transporte de
RNA e controle da localização);
pela seleção de quais mRNAs no citoplasma são traduzidos pelos ribossomos
(controle traducional);
pela desestabilização seletiva de certas moléculas de mRNA no citoplasma (con-
trole da degradação do mRNA);
pela ativação, desativação, degradação ou compartimentalização seletiva de molé-
culas de proteína específicas após a sua produção (controle da atividade protéica).
Figura 12: seis passos pelos quais a expressão gênica eucariótica pode ser controlada. Os
controles que operam nos passos de 1 a 5 são discutidos neste módulo. O passo 6, a regulação da
atividade protéica, inclui a ativação e a inativação reversível pela fosforilação das proteínas, assim
como a inativação irreversível por degradação proteolítica.
Tabela 2: algumas Proteínas de regulação gênica e as seqüências de DNA que elas reconhecem.
O genoma de uma célula contém na sua seqüência de DNA a informação para fazer
milhares de diferentes moléculas de proteína e de RNA. Uma célula expressa, tipicamen-
te, somente uma fração de seus genes, e surgem diferentes tipos de células nos organis-
mos multicelulares, porque diferentes conjuntos de genes são expressos. Além disso, as
células podem alterar o padrão de genes que elas expressam em resposta às mudanças
no seu ambiente, tais como sinais de outras células.
Embora todas as etapas envolvidas na expressão de um gene possam, em princí-
pio, ser reguladas, para a maioria dos genes, o início da transcrição do RNA é o ponto de
controle mais importante. Dessa forma, é de grande valia a compreensão do sentido dessa
regulação e sua importância na manutenção da vida.
STRACHAN, T.; READ, A. P. Genética Molecular Humana. 2 ed. Porto Alegre: ARTMED
Editora, 2002.