Você está na página 1de 29

4

Ferramentas de biologia molecular para biocatálise


Resumo
O dogma básico da biologia afirma que a informação flui dos genes, representados
do DNA, através de uma molécula mensageira, o mRNA, até proteínas. Para a expressão
recombinante de proteínas, os hospedeiros bacterianos são frequentemente preferidos: transcrição
(DNA para RNA)
e a tradução (RNA para proteína) são menos complicadas do que nos eucariontes, e as bactérias
apresentam um número limitado de genes expressos, tempos de duplicação curtos, nenhuma
organelas para compartimentação e um metabolismo bastante simples.
Quando ferramentas de biologia molecular estão sendo utilizadas, existem seis etapas básicas para a
obtenção de proteínas recombinantes:
1. isolamento do DNA do organismo de interesse e purificação do DNA;
2. encontrar o gene de interesse no DNA isolado;
3. definição de iniciadores e sítios de restrição para clonagem bem sucedida;
4. clonar o gene num vector apropriado e transformar com ele um hospedeiro heterólogo adequado
(tal como uma estirpe de E. coli);
5. sequenciar o clone para confirmar a sequência correta do gene inserido, e
6. expressar a proteína de interesse.
A sequência de um gene de interesse é conhecida parcialmente (na maioria das vezes o
N-terminal do sequenciamento de proteínas) ou totalmente de bancos de dados. Para obter o gene
a partir de DNA genômico ou cDNA, seja pela reação em cadeia da polimerase (PCR) ou, no caso
no segundo caso, pode ser aplicada uma técnica de hibridização tal como Southern blot. O
o sucesso da PCR depende (i) da escolha correta de um conjunto de primers (com um comprimento
de
25–30 pares de bases, o Tm mais alto possível e um conteúdo de GC não superior a 40–
50%), (ii) a concentração correta de Mg2+ e (iii) pureza e concentração correta do modelo de DNA.
Southern blotting envolve a transferência do DNA alvo
de um modelo de DNA separado por eletroforese em gel para uma nitrocelulose ou náilon
membrana por meio de forças capilares ou corrente elétrica.
Um vetor pode ser descrito como um plasmídeo de fita dupla (uma molécula circular de DNA
propagado em um hospedeiro) que inclui o gene recombinante de interesse, seleção
marcadores, uma origem de replicação, um promotor e um sítio de clonagem múltipla (MCS) para
inserir um gene. Clonagem é o processo de introdução de novo DNA em um organismo
e subsequentemente criando cópias idênticas do organismo recém-criado. Para em Biocatálise.
Andreas S. Bommarius e Bettina R. Riebel
Direitos autorais © 2004 WILEY-VCH Verlag GmbH & Co.
ISBN: 3-527-30344-8
62
fragmentos corporativos de DNA estranho em um vetor plasmídico, enzimas de restrição para
são necessários cortes e ligases para reunir o DNA de fita dupla. A acção
de enzimas de restrição envolve o reconhecimento de uma sequência específica de DNA,
produzindo extremidades coesivas com saliências salientes na extremidade 5' ou 3', ou extremidades
rombas.
sem saliência.
Os plasmídeos ligados devem ser verificados quanto à inserção do fragmento desejado em vez de
apenas religação, mais convenientemente por triagem azul-branca. Em vetores com
sequência do gene lacZ′, a inserção em qualquer sítio de restrição do MCS resulta em
interrupção dessa sequência de modo que nenhuma β-galactosidase seja expressa e o substrato
sintético X-gal não possa formar colônias azuis.
Para atingir a quantidade desejada de produto proteico recombinante, a superexpressão
é necessário. O sucesso ainda é difícil de prever e depende da proteína expressa, do hospedeiro, do
vetor, do promotor e das condições de cultivo. Desde a expressão constitutiva
em altos rendimentos influencia negativamente o metabolismo celular, superexpressão indutível
com
O rendimento de 10 a 40% de proteína alvo solúvel é o objetivo. Os principais obstáculos incluem
códon ruim
uso, a preferência por tripletos específicos para codificar um aminoácido e um número insuficiente
de repressores para manter um controle rígido no caso de vetores de expressão de alto número de
cópias. Alternativas à expressão como proteína solúvel são (i) expressão
como corpos de inclusão, (ii) expressão como uma proteína de fusão, ou (iii) secreção no
médio.
4.1
Noções básicas de biologia molecular: DNA versus nível de proteína
Quando um pesquisador desenvolve um biocatalisador, a primeira escolha de hospedeiro é sempre
um
sistema bacteriano. As bactérias representam os organismos mais versáteis no que diz respeito à
reprodução, taxas de crescimento e eficiência de manejo. Desde a década de 1990,
a biologia molecular tornou-se uma ferramenta poderosa para a criação de proteínas recombinantes,
especialmente enzimas. Escherichia coli é o hospedeiro mais comumente utilizado porque é
um sistema tão bem caracterizado. Embora a E. coli não possa ser utilizada para produzir todos
proteínas grandes e complexas, como aquelas com ligações dissulfeto ou tióis desemparelhados, ou
proteínas que requerem modificação pós-tradução para atividade, existem alguns
exemplos de proteínas eucarióticas ainda superiores que foram produzidas com sucesso,
como interferons, insulina e albumina sérica humana (Hodgson, 1993). Esse
capítulo fornece uma visão geral das possibilidades atuais de clonagem e expressão
são necessários para obter um biocatalisador.
Comparadas com organismos superiores, as bactérias parecem ser bastante simples quando
considera o número de seus genes (Tabela 4.1). Among organismos unicelulares,
E. coli tem 4.289 genes que codificam proteínas, Agrobacterium tumefaciens 1833, e
Bacillus subtilis 4104; o archaeum Aquifex aeolicus possui apenas 1529 genes codificados
para funcionar como um organismo inteiro. Organismos superiores apresentam mais genes, como
como a mosca da fruta Drosophila com 13.500 genes anotados, a minhoca Caenorhabditis
elegans com 19.000 genes, ou humanos (Homo sapiens) com um número previsto de
35.000 genes que codificam proteínas (banco de dados Celera). Embora o número de genes
parece estar correlacionado com a complexidade do organismo, deve-se ter em mente que um nema
tode como C. elegans tem quase metade dos genes de um ser humano.
Qualquer organismo vivo consiste em um número variável de células. Enquanto as bactérias são
unicelulares, os humanos, como organismo mais desenvolvido, consistem em vários bilhões de
células, diferenciadas e organizadas em diferentes tecidos. Todas essas células possuem
algumas características comuns:
e metabolismo,
e procriação,
movimento, e
transferência de informações do DNA para proteínas que funcionam como enzimas ou proteínas
estruturais.
Dogma central da biologia
O dogma básico da biologia afirma que a informação flui dos genes, representados
pelo DNA, através de uma molécula mensageira, o mRNA, para proteínas:
transcrição tradução DNA RNA proteína
Este dogma é válido para a maioria dos organismos vivos; exceções são encontradas em vírus. A
regra exige a transcrição do DNA em RNA, que incorpora uracila
(U) em vez de timina (T) como o quarto ácido nucleico, e o RNA é então traduzido
em proteínas usando um mecanismo de tradução que consiste em ribossomos. Como a transcrição e
tradução bacteriana são menos complicadas do que os processos em
eucariontes, as bactérias são comumente usadas como hospedeiras para expressão recombinante de
proteínas. Para estudos adicionais e detalhes da transcrição de DNA em RNA e tradução de RNA
em proteínas, livros didáticos de bioquímica ou biologia molecular, como
listados em “Leituras Adicionais Sugeridas” são recomendados.
1. Transcrição. A transcrição é o processo de leitura de regiões de codificação dentro do
molécula de DNA e sua transcrição em uma molécula de mRNA, realizada por
4.1 Noções básicas de biologia molecular: DNA versus nível de proteína
Tabela 4.1 Número total de genes para diferentes espécies com genomas (quase) completos.
Número do gene da espécie
Aquifex aeolicus 1 529
Agrobacterium tumefaciens 1 833
Bacillus subtilis 4 104
Escherichia coli 4 289
Drosófila melanogaster 13 500
Homo sapiens 35.000–100.000
64
RNA polimerases, enzimas que são capazes de ler as informações do par de bases escritas na
sequência do DNA. As RNA polimerases usam uma fita dupla
DNA como modelo para criar a fita anti-sentido representada pela molécula de RNA em
desenvolvimento.
2. Tradução. A molécula de mRNA, representando um ORF (quadro de leitura aberto),
uma cópia direta da região codificadora do DNA correspondente da qual se originou pode ser
traduzida em uma sequência de aminoácidos com o código genético.
Cada códon (tripleto de pares de bases) dentro de uma sequência de DNA de uma ORF representa
um dos 20 aminoácidos proteinogênicos ou um evento de “parada”. À medida que o código é
degenerado, alguns aminoácidos são representados por mais de um códon.
3. Ribossomos. A maquinaria de tradução, que consiste em proteínas e moléculas de rRNA (RNA
ribos omal), liga-se ao mRNA e traduz sua sequência em
a sequência de aminoácidos (a sequência primária de proteínas) usando tRNAs
(RNAs de transferência), moléculas que possuem novamente os códons correspondentes ao
aminoácidos que eles carregam. Os tRNAs são transferidos para os ribossomos e os
aminoácido correspondente é incorporado na crescente cadeia de aminoácidos em
a localização exata do códon na molécula de mRNA.
Essas características diferem em bactérias e eucariotos e são ilustradas na Figura 4.1.
Além do número limitado de genes expressos, as bactérias apresentam uma
ciclo reprodutivo, mas sem núcleo celular, sem organelas para compartimentação, sem
comunicação célula a célula como nos tecidos e um metabolismo bastante simples.
Os sistemas bacterianos preferidos para a produção de proteínas recombinantes são várias cepas
de E. coli, Bacillus e Pseudomonas. Opções não bacterianas, como leveduras ou células de
mamíferos, serão discutidas brevemente mais adiante neste capítulo.

E. coli oferece diversas cepas, cada uma com um genoma ligeiramente diferente (Brown, 1991).
As mais comuns são E. coli XL1Blue, JM105, JM109 e DH5α (todas são derivadas da cepa K12) e
BL21, HB101, que também são derivadas da cepa B.
Essas cepas podem ser combinadas com vetores de diversas maneiras. Um vetor pode ser
descrito como um plasmídeo de cadeia dupla que inclui o gene recombinante de
interesse, marcadores de seleção, uma origem de replicação, um promotor e um múltiplo
local de clonagem onde um gene pode ser inserido. Uma cópia de um gene ou genoma codifica
mais de uma molécula de proteína correspondente porque (i) cada molécula de DNA
pode ser transcrito em várias cópias idênticas de mRNA, e (ii) cada mRNA pode
ser traduzido em várias cópias idênticas de proteína. Assim, apenas uma pequena quantidade de
O DNA, cerca de uma ou duas cópias, é necessário para uma quantidade razoável de proteína. O
O maquinário de tradução bacteriana é evolutivamente projetado para alta eficiência para servir
necessidades bacterianas dentro de um ciclo celular de 20 minutos. Organismos superiores
desenvolvem-se progressivamente
complexidade crescente, incluindo diferenciação celular, ciclos celulares prolongados e regulação, o
que complica a otimização da produção de uma única proteína.
Quando ferramentas de biologia molecular estão sendo utilizadas, existem seis etapas básicas para a
obtenção de proteínas recombinantes:
1. isolamento do DNA do organismo de interesse e purificação do DNA;
2. encontrar o gene de interesse no DNA isolado;
3. definição de iniciadores e sítios de restrição para clonagem bem sucedida;
4. clonar o gene num vector apropriado e transformar com ele um hospedeiro heterólogo adequado
(tal como uma estirpe de E. coli);
5. sequenciar o clone para confirmar a sequência correta do gene inserido; e
6. expressar a proteína de interesse.
4.2
Isolamento e Purificação de DNA
Experimentalmente, hoje em dia, o isolamento e a purificação do DNA podem ser considerados
simples, como diferentes kits de biologia molecular, de uma variedade de fornecedores, como
como Qiagen, BioRAD ou Clontech, podem ser adquiridos para isolar DNA ou RNA.
Com as bactérias como fonte de DNA genômico, deve-se distinguir entre
Bactérias Gram-negativas e Gram-positivas, que apresentam parede celular diferente (mureína
sacculus) composições que determinam a maneira como as células podem ser lisadas e o DNA
extraído. Bactérias Gram-negativas (como E.coli) são geralmente mais fáceis de manusear devido
para diminuir a resistência das paredes celulares devido a menos ligações cruzadas de peptídeos
dentro da camada pepti-doglicana dentro do sáculo de mureína. Etapas cruciais na purificação
envolvem
(i) lise celular, (ii) degradação de proteínas celulares com Proteinase K e (iii) subsequente
extrações de fenol para purificação de DNA.
Existem diferentes protocolos de purificação de DNA para diferentes organismos bacterianos,
com base em suas diferentes composições de parede celular. Purificação de macromolecular
O DNA pode ser obtido através de etapas subsequentes de extração com fenol (usando fenol
saturado com Tris para evitar que o DNA seja redissolvido no fenol). O
4.2 Isolamento e Purificação de DNA
66
O DNA é precipitado após extrações com fenol usando protocolos padrão com alta
sais e etanol a –70 °C (Maniatis, 1989). Bons resultados podem ser alcançados usando
kits de isolamento de DNA genômico, do Molecular Research Center, Inc.
OH, EUA), resultando em um rendimento de DNA genômico de até 40 µg (50 mL de cultura
bacteriana)–1. Para isolar DNA de baixo peso molecular, como plasmídeos, purificação
usar kits especiais é o que há de mais moderno. Todos os kits seguem um protocolo básico de lise
do
células, desnaturando detritos e proteínas, e ligando o DNA localizado no
sobrenadante para uma membrana carregada positivamente. Após as etapas de lavagem, o DNA
pode
ser eluído dessa membrana. Pode-se optar pela purificação com colunas de membrana (mais
comuns hoje em dia) ou com um pó ao qual o DNA adere durante a purificação.
4.2.1
Quantificação de DNA/RNA
O DNA pode ser quantificado espectrofotometricamente a 260 nm ou através da comparação de
amostras de DNA coradas com brometo de etídio ou laranja SYBR com escadas de DNA
(marcadores de pesos moleculares conhecidos) de quantidade conhecida em um gel de agarose.
A menor quantidade possível que pode ser visualizada é cerca de 20 ng (Lottspeich, 1998).
Géis de polímero de agarose são comumente usados para separar amostras de DNA de diferentes
tamanhos com base na mobilidade eletroforética da molécula de DNA no gel. Como
a mobilidade eletroforética depende do tamanho da molécula da amostra (aqui, DNA)
bem como a densidade característica (o comprimento de persistência ξ) do gel (Capítulo 9,
Seção 9.3.3), quanto menor a concentração de agarose e menor o valor molecular
peso do DNA, mais rápido a molécula viaja no gel. Portanto, gel diferente
concentrações são empregadas para diferentes faixas de tamanhos de amostra

Para espectrometria, são necessárias quantidades relativamente grandes de DNA (> 0,25 µg mL−1
).
A pureza dos ácidos nucleicos pode ser determinada pela razão de extinção em 260 para
isso em 280 nm. O DNA puro tem uma proporção de 1,8, o RNA puro uma de 2,0. A concentração
de ADN pode ser determinada utilizando os valores aproximados da Tabela 4.2.
Bibliotecas
Uma biblioteca genética é uma coleção de diferentes sequências de DNA ou fragmentos de DNA,
cada uma
dos quais foi clonado em um vetor para facilidade de purificação, armazenamento e análise.
Dependendo da fonte de DNA utilizada, existem dois tipos de bibliotecas de genes:
(i) uma biblioteca genômica, se a fonte de DNA for genômica; ou (ii) uma biblioteca de cDNA, se o
O DNA é uma cópia de uma população de mRNA (ver Seção 4.3.3). Uma biblioteca representativa
contém todas as sequências originais. Uma biblioteca de cDNA enriquecida carece de certas
sequências
mas é enriquecido em outros. A representação do material de partida é um importante
consideração ao produzir uma biblioteca. Uma causa para uma biblioteca não representativa
pode ser a falta de locais de restrição apropriados. É importante, em qualquer caso, no entanto,
a biblioteca deve conter um número suficiente de clones para ser representativa.
4.3
Isolamento, detecção e verificação de genes
Considerando um gene de interesse, duas possibilidades podem ocorrer:
1. a sequência genética é totalmente conhecida a partir de bancos de dados (veja o Capítulo 14 para
saber como obter
esta informação), ou
2. apenas parte da sequência é conhecida, como a sequência N-terminal, se a totalidade
a sequência da proteína ou do DNA ainda não foi submetida.
Para ambos os cenários a reação em cadeia da polimerase (PCR) pode ser utilizada.
Alternativamente,
no segundo caso, uma técnica de hibridização como Southern blot (veja mais adiante) pode
ser aplicado.
4.3.1
Reação em Cadeia da Polimerase
A reação em cadeia da polimerase, PCR, a técnica revolucionária para amplificação de DNA
descrita pela primeira vez por Mullis et al. (Mullis, 1986; Prêmio Nobel 1993), alterado
e ainda está mudando rapidamente o campo da biologia molecular. O princípio depende
múltiplos ciclos de repetição usando uma polimerase termoestável e um conjunto de iniciadores
específicos do gene, resultando na amplificação específica da sequência de DNA que fica entre o
par de iniciadores sentido e anti-sentido (Figura 4.2).
A PCR utiliza as propriedades enzimáticas de uma DNA polimerase para duplicar o DNA
através da extensão de um pedaço curto e existente de fita dupla de DNA, geralmente
15-30 pb. Este pequeno pedaço de DNA de fita dupla pode ser imitado através da adição de
oligonucleotídeos curtos (primer) a cada uma das fitas de DNA, o sentido (5'-3')
e iniciador anti-sentido (3′ –5′). Primeiro, na etapa de desnaturação, o DNA tem que ser
4.3 Isolamento, detecção e verificação de genes
68 4 Ferramentas de Biologia Molecular para Biocatálise
Figura 4.2 Polimerase
reação em cadeia
(PCR)
(Lottspeich, 1998). O
Ciclos de PCR entre
um
etapa de desnaturação
para obter
DNA de fita simples,
um
etapa de recozimento
para
fixação do primer ao
modelo de DNA e um
etapa de
polimerização, em
qual o termoestável
a polimerase alonga o
vertente
correspondente
usando os primers
como
pontos de partida.
aquecido a 95 °C para obter fios simples. Na segunda etapa, os primers são capazes de
ligam-se à parte correspondente no DNA de fita simples, um processo denominado “an nealing”. A
terceira etapa envolve uma temperatura ideal de polimerase para o primer
extensão (72 ° C para a polimerase Taq de Thermus aquaticus). Estas três etapas
pode ser repetido em ciclos devido à estabilidade térmica das polimerases que,
afinal, são obtidos de organismos extremofílicos (Capítulo 3, Seção 3.4). Cada
fita de DNA recém-sintetizada e cada uma que já existe serve como modelo para o próximo ciclo,
criando assim um número exponencial de moléculas de DNA.
A cada ciclo, a amplificação do DNA dentro dos primers ultrapassa o DNA mais longo.
presente desde o início; no final, praticamente todo o DNA amplificado fica dentro do
limites dos primers escolhidos.
4.3.2
Otimização de uma reação PCR
Uma das etapas cruciais e demoradas ao estabelecer uma reação de PCR de
um produto desconhecido é seu protocolo de otimização. Primeiro, a escolha certa de um primer
conjunto deve ser considerado uma necessidade. Os primers devem ter comprimento ideal de
25–30 pares de bases, uma faixa de Tm adequada para ambos (eles não devem diferir em
sua Tm superior a 2 °C) e a Tm deve ser tão alta quanto possível para atingir
especificidade nos produtos de PCR. O conteúdo do primer GC não deve exceder 40–50%
(se isso não for possível, deve ser utilizado um kit de PCR diferente para alto conteúdo de GC),
e o usuário deve testar os primers para produção de dímeros de primer. Um dímero de primer
significa (i) o emparelhamento de um iniciador em diferentes posições dentro do gene, causando
adições curtas ou longas de iniciadores, ou produtos sem sentido que podem ser enganosos;
ou (ii) o recozimento de um primer consigo mesmo. Existem vários programas de computador
disponível para a escolha correta do primer (como Amplify para Macintosh ou na Web,
http://www.hgmp.mrc.ac.uk/GenomeWeb/nuc-primer.html).
Figura 4.3 Perfil típico de uma reação de PCR. O x min no
a etapa de alongamento depende do comprimento do DNA amplificado.
94°C 94°C
55°C
72°C 72°C
4°C
1 Ciclo 30 Ciclos 1 Ciclo Espera
5 minutos 30 segundos
30 segundos
x min 7 minutos
4.3 Isolamento, detecção e verificação de genes
70
Em segundo lugar, as DNA polimerases precisam de íons magnésio para serem ativas; uma
concentração correta de Mg2+ é crucial para uma amplificação bem-sucedida, bem como para uma
sequência correta
do produto amplificado. Este fato pode ser usado como uma ferramenta para a evolução direcionada
para
introduzir erros de sequência deliberadamente durante a amplificação (PCR propenso a erros;
consulte
Capítulo 11, Seção 11.3) adicionando Mn2+ geometricamente semelhante ao buffer de PCR
já contendo Mg2+. Na maioria dos casos, a concentração do tampão fornecida
em um kit comercial de PCR é otimizado para a polimerase correspondente, portanto, o ajuste da
concentração de Mg2+ raramente deve ser considerado.
Terceiro, a pureza e a concentração do modelo de DNA são muito importantes para
PCR bem sucedido. Se possível, o DNA deve ser purificado com kits de alta qualidade
(tais como os disponíveis na Qiagen ou Clontech) e não devem ser deixados vestígios de
substâncias inibidoras, como o etanol, após a preparação do ADN genómico. Quantidade
modelo de DNA, com base no gene de interesse e não em todo o genoma ou
DNA plasmídico, idealmente deve estar entre 10–100 pg e deve ser verificado no
início do processo de otimização. Uma concentração excessiva de DNA modelo
pode impedir a amplificação, enquanto muito pouco do gene desejado a ser amplificado
resulta em tempo de ciclo excessivo ou má resolução. No início da otimização da PCR, diferentes
concentrações de modelo cobrindo ordens de grandeza devem ser
testado para verificar a faixa de concentração ideal.
Uma pequena lista de possíveis kits de PCR e websites úteis é apresentada na Tabela 4.3.
Para produtos de PCR grandes ou modelos difíceis (estrutura secundária ou GC alto
conteúdo), polimerases de alta fidelidade (baixa taxa de erro), como Advantage PCR
(Clontech) ou Failsafe PCR (Epicentre) são altamente recomendados.
Se, mesmo após consideração de todas as técnicas de otimização de PCR mencionadas,
ainda nenhuma amplificação por PCR é obtida, é viável tentar uma PCR de toque com
os mesmos primers para estabelecer a temperatura correta de recozimento. Um toque para baixo
PCR implica uma diminuição da temperatura de recozimento em incrementos de 0,1–0,5 °C em
os primeiros 10 ciclos para determinar a temperatura ideal de recozimento. O início
a temperatura é a mais alta permitida para o par de primers. Após cerca de 10 ciclos por
O programa de PCR “normal” começa, usando a temperatura de recozimento mais alta de
o programa de toque para amplificação. Este procedimento geralmente resulta em maior
especificidade do produto de PCR. Para reações de PCR desafiadoras com modelos difíceis
mostrando estruturas secundárias ou um alto teor de GC aditivos como DMSO
formamida, Tween 20 ou Triton-X-100 são por vezes necessários para facilitar a desnaturação do
modelo de ADN. Outros compostos como glicerol, BSA ou PEG são
necessário para estabilizar uma ligação frágil de primer-DNA
4.3.3
Técnicas Especiais de PCR
4.3.3.1 PCR aninhado
Nested PCR é usado para amplificação de genes eucarióticos usando cDNA (cópia-DNA,
sendo copiado de bibliotecas de mRNA por meio de transcrição reversa). A tecnica
é útil para i) aumentar a especificidade da amplificação de um conjunto de modelos e ii)
verificando o produto de amplificação correto. Um nested PCR usa dois conjuntos diferentes
de primers, um par externo e interno. O par de primers externo pode ser complementar
às regiões 5 'e 3' dos mRNAs, mas normalmente hibrida com as regiões 5' e 3'
próximo ao gene de interesse e deve ter uma temperatura de fusão (Tm) mais alta
do que o par interno de primers, que pode estar dentro do gene ou marcar as partes terminais N e C
do gene. Uma primeira reação de PCR usa o par externo para gerar um
Produto de PCR mais longo que o gene; a segunda reação de PCR é realizada no
primeiro produto de amplificação usando o segundo par interno de iniciadores. As duas reações
podem ser realizadas em etapas consecutivas em dois tubos ou, se o processo de fusão
as temperaturas dos dois pares de primers diferentes diferem significativamente entre si,
a amplificação aninhada pode ocorrer durante a mesma reação. Nesse caso, quanto mais tempo
produto com maior Tm é amplificado primeiro, então, a temperatura de recozimento é
trocou para o par de primers interno para amplificar o produto do gene mais curto.
4.3.3.2 PCR Inverso
A PCR inversa foi originalmente desenvolvida como um método para amplificar rapidamente
regiões de
sequência desconhecida flanqueando qualquer segmento caracterizado do genoma. A técnica
elimina a necessidade de construir e rastrear bibliotecas de DNA (ver anteriormente em
neste capítulo) para percorrer centenas de pares de bases em regiões flanqueadoras e é útil
principalmente para genomas grandes (eucarióticos, começando com C. elegans) e triagem de
YACs (cromossomos artificiais de levedura). Pode ser adaptado para gerar fragmentos de ligação –
pedaços de DNA que identificam fragmentos de restrição adjacentes (Collins,
1984) – para criar uma biblioteca ordenada e mapas físicos em grande escala de complexos
genomas. Além disso, Helmsley et al. (Helmsley, 1989) desenvolveram um método
para mutagênese dirigida ao local usando PCR inverso. Neste esquema, um dos iniciadores
oligonucleotídicos é sintetizado com uma base alternativa que reflete a mutação desejada.
4.3.3.3 RACE: Amplificação rápida de extremidades de cDNA
Para alguns biocatalisadores úteis, as bactérias podem não ser a única fonte, e a recuperação
o gene de organismos eucarióticos pode ser necessário.
Para proteger um gene de um genoma eucariótico, o método mais eficiente entre
Outra é obter cDNA (DNA complementar) a partir de mRNA via transcritase reversa. O uso do
cDNA evita lidar com o problema dos íntrons, onde um gene completo pode se estender por
milhares de pares de bases, mas é dividido em vários pequenos
éxons, alternando com íntrons de tamanho às vezes notável [vários milhares
pares de bases (kB) para um íntron]. Como, no entanto, apenas alguns genes eucarióticos estão
completamente
sequenciado e depositado em um dos bancos de dados, é preciso contar com ESTs (expressos
4.3 Isolamento, detecção e verificação de genes
72
tags de sequência) para as sequências do genoma disponíveis nos bancos de dados. Essas tags
fornecem informações limitadas sobre o gene (principalmente para identificar e classificar o tipo de
enzima ou proteína), mas suficiente para realizar um RACE, para o qual podem ser utilizados
cDNA de tamanho auto-sintetizado (conforme descrito abaixo) ou bibliotecas de cDNA
comercialmente disponíveis (comuns para tecidos de organismos superiores).
Em essência, o protocolo RACE gera genes amplificados usando PCR para amplificar cópias da
região entre um único ponto no transcrito (um primer gerado contra a parte conhecida da sequência,
como a etiqueta EST) e o 5º ponto. 'ou 3'
final (iniciadores gerais, como um iniciador adaptador para a região UTR flanqueadora de um
gene). O primer autogerado fornece especificidade à reação (veja os kits
para mais detalhes). Neste contexto, uma amplificação ou verificação de acompanhamento do
pedaço de DNA correto usando um nested PCR (veja acima) pode ser aplicado. Primeiro, deve ser
escolhida uma biblioteca de ADNc adequada, dependendo do tecido (no caso de genes de
mamíferos), ou deve ser realizado o isolamento total do ARN (descrito abaixo) para
traduzir RNA em cDNA que serve como modelo para o RACE.
Isolamento total de RNA
Para obter um modelo para o RACE, é necessário o isolamento do RNA para reescrevê-lo em
ADNc. É necessário tomar precauções, uma vez que o ARN é uma molécula consideravelmente
mais instável que o ADN e, para agravar a situação, as suas enzimas degradantes estão entre as
mais estável conhecido. Hoje em dia, a maioria dos fornecedores fornece tampões livres de RNAse
e
água, portanto o tratamento com DEPC (dietilpirocarbonato) para destruir a atividade da RNAse é
necessário apenas para tampões caseiros. Kits para preparação de RNA, seja para RNA total
ou para isolamento de mRNA, não requerem nenhum tratamento com DEPC.
Em relação ao procedimento de isolamento em si, as células são lisadas cuidadosamente utilizando
um
tampão proporcional à fonte de RNA e são então interrompidos durante a centrifugação usando uma
coluna de membrana (Qiashredder da Qiagen).O lisado é
misturado com um volume igual de etanol a 70% (sem RNAse) e depois transferido para
outra coluna, na qual o RNA se liga à membrana da coluna. Subseqüente
etapas de lavagem purificam o RNA, que é finalmente eluído com água livre de RNAse (para
detalhes, consulte http://www.qiagen.com/literature/BenchGuide/BG_RNA_lit.asp).
A –80 °C, o RNA é estável por alguns meses. Outro método usa Trizol como reagente com um
protocolo da Life Technologies (http://www.lifetechnologies.com/con
tent/sfs/manuals/15596026.pdf).
Reação da transcriptase reversa
Depois de obter RNA total puro de células eucarióticas, o RNA precisa ser reescrito em cDNA para
servir como modelo na PCR, pois o RNA não pode ser amplificado por PCR.
A tarefa de reescrever é realizada com a transcriptase reversa (RT), uma enzima viral usada pelos
retrovírus (cujo nome deriva de abrigar esta enzima e
a capacidade de reescrever RNA em cDNA). O grupo de retrovírus tem membros como o vírus da
AIDS, o vírus da mieloblastose aviária, o vírus da leucemia murina
(Frohmann, 1988; Kawasaki, 1988) e Adenovírus. Reverso comumente empregado
transcriptases provêm do vírus aviário (AMV-RT) ou da leucemia murina
vírus (MMLV, usado no kit Clontech RT).
4 ferramentas de biologia molecular para biocatálise
73
Hoje, a enzima é de fonte recombinante e faz parte de kits de RT
(Clontech, Novagen, Qiagen). RT requer um primer curto capaz de se ligar ao mRNA
e então reescreve a primeira fita de cDNA usando dNTPs, bem como mRNA como
modelo (Figura 4.4). Durante a segunda ronda, o ADNc de cadeia simples é complementado com
um ADN de cadeia dupla. A cauda poli-A do mRNA eucariótico pode ser
explorado para sintetizar cDNA usando um iniciador oligo-dT que se liga ao
cauda poli-A e serve como ponto de partida para a transcriptase reversa. Para ideal
resultados, a quantidade de RNA total usada na reação deve estar entre 1–2 µg e
muito puro, isto é, livre de DNA genômico para evitar que a cópia genômica do gene funcione
como modelo. O RNA, juntamente com o primer inicial (oligo-dT), é primeiro desnaturado a 70 °C
para destruir a estrutura secundária e depois transferido para gelo para permitir
o primer para se ligar ao RNA estendido de fita simples. As condições de reação ideais para
temperatura ambiente são 42 °C e um tempo de reação geralmente de 1 h. O cDNA resultante pode
ser usado para criar bibliotecas de cDNA ou para quantificar a quantidade de DNA
expressão de um gene alvo, ou para determinar sequências desconhecidas no 5' ou 3'
extremidades do RNA (a RACE)

4.3.4
Mancha do Sul
O Southern blot, desenvolvido por E. M. Southern (1974), é uma rota alternativa para
PCR para obter uma sequência genética completa quando apenas partes da sequência genética são
conhecido. É uma ferramenta importante para identificar genes dentro de um conjunto de modelos
de DNA para uma parte conhecida do gene alvo pela técnica de hibridização. Sulista
blotting envolve a transferência do DNA alvo de um modelo de DNA separado por eletroforese em
gel para uma membrana de nitrocelulose ou náilon (Tabela 4.4) por meio de
forças capilares ou corrente elétrica. O DNA precisa ser desnaturado após a eletroforese para ficar
de fita simples; o DNA de fita simples com carga negativa é então
transferido para uma membrana de náilon carregada positivamente usando tampão com alto teor de
sal em pH 7,0.
Existem várias técnicas para transferência de manchas, tais como transferência acionada por força
capilar,
mancha seca ou eletroblotting. A transferência capilar, que é o método mais utilizado e
fornece a mais alta sensibilidade e reprodutibilidade, descreve a transferência passiva de
o alvo em buffer através de forças capilares, exigindo depurinação, desnaturação,
e neutralização do DNA dentro do gel de agarose. A mancha seca funciona sem
tampão de transferência e é útil para ensaios de deslocamento de gel (um ensaio para análise de
DNA-
associações de proteínas). Electroblotting é recomendado apenas para géis de acrilamida, pois
são aplicados em DNA de tamanho pequeno até oligonucleotídeos e fornecem o máximo
transferência rápida. A eficiência da transferência depende da duração da transferência, buffer
concentração e qualidade da membrana utilizada.
O DNA transferido é então reticulado à membrana usando luz UV ou por
aquecimento durante várias horas a 80 °C. Máquinas de reticulação que exploram luz UV (por
exemplo,
da Stratagene) otimizam a eficiência do rendimento e do tempo. Se a membrana escolhida for
uma membrana de náilon carregada positivamente, a reticulação pode até ser negligenciada como
DNA
permanecerá ligado à membrana de qualquer maneira.
Qualquer DNA de fita simples na membrana pode então ser hibridizado com sondas de fita simples
que são idênticas a partes do gene alvo.
está envolvido. Primeiro, a membrana precisa ser bloqueada com uma solução de bloqueio
fornecida com o kit ou com uma solução de trabalho PBS com 0,1% de Tween 20 e 5%
leite em pó por 1–3 h para minimizar a ligação inespecífica do anticorpo. Nas próximas
A etapa envolve a incubação do anticorpo anti-DIG por 1 h à temperatura ambiente. Após várias
etapas de lavagem com tampão maleato 0,1 m (+0,15 m NaCl, pH 7,5 com 0,3%
Tween 20) o substrato de detecção pode ser aplicado à membrana. Um esperado
o sinal fraco da reação de quimioluminescência pode ser aumentado pela incubação a 37 °C.
O sinal pode ser revelado usando filmes de raios X ou um sistema de imagem adequado para
sinais de quimioluminescência (Alpha Innotech, UVP Imaging Systems, Stratagene).
4.3.5
Sequenciamento de DNA
Hoje em dia, o sequenciamento de DNA é geralmente realizado por instalações centrais de serviços
de DNA.
Em resumo, os sistemas automatizados utilizam o método de sequenciamento de DNA Sanger
(Sanger,
1977). O método baseia-se no princípio do alongamento do DNA terminado aleatoriamente através
da incorporação de didesoxinucleotídeos (terminação da cadeia). O ADN
cadeia não pode ser alongada neste nucleotídeo porque o fosfato necessário para
formando a ligação fosfodiéster da estrutura do DNA na posição C2 no
falta o anel ribose. Ao oferecer uma mistura dos quatro nucleotídeos, cada um dos quais
tem uma porção do didesoxinucleotídeo correspondente, desenvolve-se uma mistura de cadeias de
DNA terminadas aleatoriamente, representando estatisticamente uma parada em cada nucleotídeo.
da sequência alvo. As moléculas de DNA de diferentes comprimentos são separadas em uma
gel de poliacrilamida e detectado ao passar um feixe de laser devido à fluorescência
marcadores ligados aos didesoxinucleotídeos.
4.4
Técnicas de clonagem
Clonagem é o processo de introdução de novo DNA em um organismo e subsequentemente
criando co idênticotortas do organismo recém-criado. Hoje em dia, as técnicas de clonagem foram
padronizadas a tal ponto que, na maioria dos casos, os kits (de empresas como Stratagene, Clontech,
Roche, Amersham–Pharmacia ou Qiagen)
estão disponíveis para esta etapa, melhorando enormemente as chances de sucesso. Ainda assim,
dois passos cruciais devem ser mantidos em mente ao resolver um desafio de clonagem: primeiro,
escolher
a combinação certa de enzimas de restrição, incluindo design preciso de primers
para a reação de PCR; em segundo lugar, usando uma técnica de ligadura eficiente.
4.4 Técnicas de Clonagem
78
4.4.1
Mapeamento de restrição
Para incorporar fragmentos de ADN estranho num vector plasmídico, são necessários métodos para
cortar e juntar novamente o ADN de cadeia dupla. A identificação e manipulação de endonucleases
de restrição na década de 1960 constituiu uma descoberta chave para
clonagem. Hoje, as enzimas de restrição comumente usadas são produzidas de forma recombinante
e amplamente distribuído.
A ação das enzimas de restrição envolve o reconhecimento de uma sequência específica de DNA,
muitas vezes um palíndromo (uma sequência idêntica quando lida de trás para frente). Eles
pode produzir extremidades coesivas, ou seja, uma extremidade 5' saliente com um grupo fosfato e
um
extremidade 3' correspondente com um grupo hidroxila livre. Alternativamente, menos enzimas
geram extremidades cegas sem saliências na extremidade 5' ou 3'. Clonagem de um gene
o uso de enzimas de restrição geradoras de extremidades cegas tem menos probabilidade de sucesso
porque
ambas as orientações do gene podem ocorrer. Desde que a sequência do gene de interesse seja
conhecida, tem de ser gerado um mapa de restrição do gene e do vector.
Os mapas vetoriais são facilmente acessíveis e são fornecidos pelos fornecedores na Web.
O mapeamento de restrições ajuda a fazer escolhas para os locais de restrição flanqueadores em
ambos
lados do gene para clonagem, porque o mapa fornecerá informações sobre qualquer
enzima que irá ou não cortar o gene de interesse.
Se a sequência não for conhecida, um sistema vetorial como o kit de clonagem TA (Clontech)
deve ser usado. O vetor fornecido tem uma base T saliente e o resultado
O produto de PCR pode ser diretamente ligado ao vetor, porque as polimerases Taq, geralmente
usadas em PCR, geram uma saliência A de uma base na extremidade 3' em ambas as fitas.
O mapeamento de restrições pode ser realizado diretamente na Web, visitando web
páginas como www.ebi.srs.uk (o sistema de recuperação SRS) ou www.expasy.ch, ou
através de programas como “Lasergene” (DNAstar).
4.4.2
Vetores
Os vetores são veículos especialmente projetados, derivados de bactérias que ocorrem naturalmente.
plasmídeos. Um plasmídeo é uma molécula circular de DNA que se propaga em um hospedeiro; a
vector é uma ferramenta de biologia molecular que fornece os recursos necessários para a criação
um plasmídeo recombinante. Ao ligar o gene de interesse em um plasmídeo vetorial
o produto indesejado mais frequente é o plasmídeo vetorial religado e inalterado
em si (ver Seção 4.4.4). Portanto, o plasmídeo ligado deve ser analisado para
inserção do fragmento desejado para evitar apenas a produção do vetor religado.
Um método de análise popular é a seleção azul-branca, discutida abaixo, seguida
por análise de restrição de clones positivos dentro da seleção azul-branca.
Um dos primeiros vetores foi denominado pBR322; contém o gene para conferir
resistência à ampicilina no hospedeiro. Vetores derivados, chamados de série pUC, também
incluem um local de clonagem múltipla (MCS) e contêm uma versão projetada do lacZ′
gene que possui múltiplos locais de reconhecimento de enzimas de restrição na primeira parte
da região codificadora desse gene. Inserção de um fragmento de DNA com qualquer restrição
4 ferramentas de biologia molecular para biocatálise
79
local deste MCS resulta na ruptura da sequência do gene lacZ′. Este fato pode ser
explorado para triagem azul-branca quanto à presença de um plasmídeo recombinante.
A triagem azul-branca é baseada na produção de um composto azul catalisado por
β-galactosidase que é codificada pelo gene lacZ e sob o controle do
promotor lacZ. Os hospedeiros de E. coli empregados possuem apenas uma versão incompleta do
gene lacZ, que deve ser completado pela parte lacZ′ do vetor para resultar em
uma β-galactosidase ativa, bem como um repressor lacZ. O repressor lacZ pode ser
ativado por indução com lactose (o indutor natural) ou seu produto não natural
derivado IPTG (isopropil-β-d-galactopiranosídeo). A β-galactosidase é capaz de clivar
o substrato sintético 5'-bromo-4'-cloro-3-indoil-β-d-galactopiranósido (X-gal)
para d-galactose e 5-bromo-4-cloroindol azul-esverdeado. O resultado é uma colônia azul
se o fragmento lacZ′ no vetor estiver intacto ou uma colônia branca se o fragmento lacZ′
foi interrompido pela inserção do gene desejado. Portanto, colônias brancas em um
placa de transformação tratada com X-gal e IPTG indicam sucesso na inserção do
gene de interesse e deve ser selecionado para novos experimentos.
Vetores como a série pUC (Molecular Diagnostics) ou a série Bluescript
(Stratagene) são vetores de clonagem ideais devido ao seu tamanho relativamente pequeno, boa
aaceitação pelos hospedeiros e promotores fracos que fazem com que pouco produto seja expresso,
o que ajuda na formação de colônias. A Figura 4.6 dá dois exemplos de clonagem
vetores.
A clonagem de fragmentos de DNA em bactérias também pode ser conseguida através de
bacteriófagos.
vetores, como lambda. Porções não essenciais do nome lambda linear de 48,5 kB podem ser
substituídas por até 23 kB de DNA estranho; portanto, o vetor é
útil para clonar bibliotecas. A partícula fago injeta seu DNA linear no hospedeiro
célula, onde os sítios cos em ambas as extremidades da partícula linear do fago permitem a ligação
em
um fago circular. A célula hospedeira pode replicar-se para formar muitas partículas fágicas,
que são liberados da célula por lise e morte celular (fase lítica), ou o fago
O DNA pode integrar-se ao genoma do hospedeiro por recombinação específica do local, onde

permanece por um longo período (fase lisogênica). Os fragmentos de DNA alvo são ligados
com as extremidades λ do DNA, que fornecem os genes essenciais para a infecção de E. coli. Um
A célula infectada produz então fagos recombinantes, que podem ser rastreados para
DNA desejado.
Vetores eucarióticos
Existe uma variedade de vetores para clonagem em sistemas eucarióticos, desde
levedura (Saccharomyces e Pichia) através de células de insetos (Baculovírus) e plantas
(plasmídeo Ti de Agrobacterium tumefaciens) para células de mamíferos (transfectadas por
vetores virais ou de mamíferos). Como a expressão em hospedeiros eucarióticos é menos eficiente
do que a expressão bacteriana em termos de rendimento e tempo e mais complicada em termos
da estrutura do vetor e das condições de cultura, tais sistemas de expressão eucariótica são
usado apenas para genes cujas proteínas requerem modificação pós-tradução que
não é possível em bactérias. O fermento é a opção preferida por ser relativamente facilmente
cultivável
sistema unicelular, mas as capacidades de modificação pós-tradução são limitadas. O
complexidade adicional pode ser contornada em parte explorando a capacidade de
vetores eucarióticos para atuarem como vetores de transporte, que podem ser transportados entre
dois
hospedeiros evolutivamente diferentes. Assim, vetores eucarióticos podem ser replicados e
analisado em bactérias e transfectado em células eucarióticas para expressão do
produto recombinante.
Vetores de expressão bacteriana
Estes vetores são tratados em conexão com a Seção 4.3.
4.4.3
Ligadura
Após a restrição, a ligação fosfodiéster clivada resultante deve ser selada novamente para
obter DNA circular, com ou sem inserção de um fragmento de DNA alvo em um vetor
para a ligação covalente de moléculas de DNA. Desde que uma das fitas duplas tenha
um grupo fosfato na extremidade 5', as DNA ligases podem selar uma ligação fosfodiéster clivada
em um par recozido de extremidades coesivas de DNA de fita dupla quebrado resultante de
a ação das enzimas de restrição. Um vetor tão restrito pode, portanto, ser usado para
inserir um fragmento de DNA, desde que o fragmento apresente as mesmas extremidades coesivas
que
o vetor agora linear. Para uma ligadura eficiente, existem vários kits disponíveis em fornecedores
como Novagen ou Roche. Esses kits de ligadura “Rápida” fornecem uma solução geneticamente
ligase T4 projetada que permite uma ligação bem-sucedida à temperatura ambiente dentro
5 min, uma economia de tempo considerável, pois os protocolos comuns recomendam 14 °C por 16
h.
No entanto, a cinética de ligação mais lenta a 14 °C muitas vezes leva a perfis mais precisos e deve
ser preferida para certos substratos. A falta de ATP pode causar falha
da reação de ligação, já que as ligases T4 comumente usadas são dependentes de ATP.
Antes da ligação da extremidade romba de uma inserção, o vetor precisa ser desfosforilado
porque a nova vedação das duas extremidades do vetor linear para formar um plasmídeo circular
representando uma reação intramolecular é entropicamente favorecida e, portanto, mais rápida
(Capítulo 2, Seção 2.2.3), do que a inserção intermolecular do frag 4 Ferramentas de Biologia
Molecular para Biocatálise
81
mento no vetor. Um vetor desfosforilado não pode ser religado em forma circular
DNA de fita dupla devido à falta de grupos fosfato na extremidade 5', cruciais para
a reação da ligase. A desfosforilação pode ser realizada usando altamente eficiente
fosfatase alcalina de camarão (Roche) em uma reação em um único recipiente com a reação de
restrição do vetor após adição de tampão e enzima apropriados; ambos os processos são
realizado a 37°C.
4.4.3.1 Propagação de Plasmídeos e Transformação em Hospedeiros
Durante a transformação (absorção bacteriana de DNA estranho), os componentes do
mistura de moléculas de plasmídeo recombinantes e nativas formadas por ligação são transferidas
para uma célula hospedeira para replicação (clonagem). Os hospedeiros mais comuns são cepas
de E. coli com propriedades genéticas específicas (ver Molecular Biology Labfax Series,
por exemplo, Brown, 1991). Antes da transformação, as células de E. coli têm de se tornar
competentes, isto é, susceptíveis à absorção de ADN. Um método simples é o pré-tratamento com
Ca2+,
Rb+
, ou soluções de Mn2+ ou uma mistura desses íons. Outro método renderiza células
eletrocompetente e os utiliza na eletroporação para transformar DNA estranho. Em
em geral, células competentes podem ser compradas ou facilmente criadas (Hanahan, 1983).
DNA e células competentes são misturados e incubados em gelo por 15 a 30 minutos para permitir
o DNA a ser coletado. A mistura é então submetida a choque térmico a 42 °C por 1–2 min,
que induz enzimas de reparo de DNA, permitindo que as células se recuperem do estado
competente e da absorção de DNA. A recuperação pode ocorrer em meio de crescimento em
37 °C antes de estrias em uma placa de ágar com seleção apropriada. As placas são
incubado a 37°C durante a noite; se for bem sucedido, várias colônias são formadas.
A transfecção, captação de DNA em sistemas eucarióticos, muitas vezes é mais problemática do que
transformação bacteriana: o modo de absorção do DNA é mal compreendido e a eficiência é muito
menor. Na levedura, as paredes celulares podem ser digeridas com enzimas degradativas
para produzir protoplastos frágeis, que são então capazes de absorver DNA. Cetodas as paredes são
ressintetizado após a remoção das enzimas degradantes. As células dos mamíferos absorvem
DNA após precipitação em sua superfície com fosfato de cálcio [Fugene 6
(Rocha); Lipofectina (Life Technologies); Effectene (Qiagen)]. A eletroporação é dez vezes mais
eficiente para transfecção em sistemas de células eucarióticas, especialmente em leveduras.
4,5
(Sobre)expressão de uma função enzimática em um host
4.5.1
Escolha de um sistema de expressão
Expressão de genes em um nível regularmente baixo, resultando em um baixo nível de produto,
ocorre em todos os organismos. Para proteínas recombinantes, a superexpressão que leva
são desejadas quantidades consideravelmente aumentadas da proteína recombinante. Sucesso
de uma tentativa de superexpressão recombinante não pode ser prevista ainda e
depende de muitos fatores, como a proteína a ser expressa, o hospedeiro, o vetor, o promotor, as
condições de cultura e, por último mas não menos importante, a experiência do investigador.
4.5 (Sobre)expressão de uma função enzimática em um hospedeiro
82
Os dois fatores mais importantes na escolha de um sistema de expressão devem ser
(i) economia e eficiência, e (ii) a maior proximidade possível do anfitrião com
a fonte de DNA se forem necessárias modificações pós-tradução. No entanto, no
No caso de genes eucarióticos, compromissos são frequentemente necessários. A necessidade de um
o relacionamento próximo muitas vezes exclui a superexpressão, porque muitas vezes não existe um
sistema eficiente de expressão de alto rendimento entre eucariotos relacionados; um dos mais
conhecidos
sistemas emprega células CHO (ovário de hamster chinês).
Alguns problemas durante a superexpressão, que foram tratados, são mencionados aqui. As
proteínas recombinantes podem ser tóxicas para o hospedeiro; então superexpressão
resulta em baixas taxas de expressão, lise das células ou proteólise do recombinante
proteína. Outras opções além de alterar o host, que muitas vezes é impossível, incluem
regulação das condições de cultura, mudança de indutores ou secreção da proteína recombinante. A
proteólise pode ser evitada por
y usando deficiência de protease (como ompT negativo, DlgP–
) Cepas de E. coli (Murby,
1996),
modificando o aminoácido N-terminal para estabilizar a proteína (Met, Ser, Ala, Thr,
Val ou Cys estão se estabilizando; Arg, Leu, Asp, Lys ou Phe são desestabilizadores) (Lottspeich,
1998), ou por
y temperaturas de cultura mais baixas e tempos de indução curtos.
Uma vez que a expressão constitutiva em altos rendimentos influencia negativamente o
metabolismo celular
com consequências até e incluindo a morte celular, a expressão comumente usada
sistemas são indutíveis. O objetivo da superexpressão indutível é um rendimento de solúvel
proteína alvo entre 5 e 50%, tipicamente cerca de 20%, da proteína celular total. Se a expressão
como proteína solúvel for considerada impossível, as alternativas são (i) expressão como
corpos de inclusão (fração de proteína insolúvel), (ii) expressão como uma proteína de fusão, ou
(iii) secreção no meio. Para uma boa proporção de recombinantes solúveis e insolúveis
proteína (a proporção dificilmente é infinita), os critérios de expressão devem ser otimizados.
4.5.2
Tradução e uso de códons em E. coli
E. coli requer uma certa sequência para iniciar a tradução, o sítio de ligação ao ribossomo (RBS ou
sequência Shine-Dalgarno) AGGA. Esta sequência envolve a ligação do mRNA ao 16S-rRNA do
ribossomo bacteriano (Figura 4.7). A lacuna
entre o RBS e o códon de início ATG (Met) da proteína alvo deve variar
de três a dez pares de bases, ou às vezes até 15 pares de bases. Variação desta lacuna
em direção à mesma proteína alvo pode influenciar muito a superexpressão. Por exemplo, uma
proteína fortemente expressa pode ser deslocada de expressão insolúvel para solúvel, criando um
sinal de iniciação de tradução mais fraco, ampliando a lacuna entre
RBS e ATG. Desde que os sites de restrição dentro do site de clonagem múltipla permitam
flexibilidade, a lacuna entre o RBS e o códon de início inicialmente, ao usar um
promotor forte, deve ser mantido o mais amplo possível para aumentar a superexpressão solúvel.
4 ferramentas de biologia molecular para biocatálise 8

Figura 4.7 Representação esquemática das principais características do


um vetor de expressão procariótico (Hannig, 1998). A expressão
vetor tem um promotor a montante que consiste em pelo menos um –35
e –10 região; o espaço entre eles define a fraqueza
ou força de um promotor. Entre o gene alvo inserido e
promotor encontra-se no sítio de ligação do ribossomo (RBS) com seu Shine–
Sequência de Dalgarno AGGA. O gene geralmente é inserido em um
local de clonagem múltipla construído artificialmente. Depois da parada
códon, às vezes a ser adicionado pelo usuário (como é o início
códon ATG), um sinal de terminação segue para liberar o RNA
polimerase do DNA. Duas outras características importantes são a
local de origem da replicação bacteriana (ori), o que garante que
o plasmídeo é copiado dentro de cada ciclo celular, e uma seleção
marcador, neste caso o tetr
gene.

O uso de códons em diferentes organismos, a preferência de um organismo por um ou mais


algumas das várias combinações de trigêmeos (no caso de degeneração) para codificar um amino
ácido, é um dos principais obstáculos à superexpressão de alto rendimento. Quanto maior for
distância relacional entre os organismos, maior a chance de problemas com
uso de códons. Em contraste com a sua utilização em sistemas eucarióticos, o correspondente
Os tRNAs para os códons de arginina AGG e AGA são muito raros em E. coli; o mesmo
vale para códons de leucina (CUA), isoleucina (AUA) e prolina (CGG). Este problema pode ser
superado por cepas especiais (ambas Stratagene): BL21-CodonPlus-RIL
as células contêm genes extras de tRNA argU, ileY e leuW, as células BL21-CodonPlus-RP contêm
genes extras de tRNA argU e proL. Para superar tais problemas, mesmo drásticos
medidas como a síntese genética devem ser consideradas para ajustar o uso de códons.
Ao usar vetores de expressão de alta cópia, que são capazes de gerar até 100
moléculas de proteína alvo por célula, o número de cópias do repressor lacI fornecido
pela célula hospedeira, como E. coli, é insuficiente para garantir um controle rígido. Expressão
os rendimentos podem ser aumentados fornecendo cópias extras do repressor em um segundo
plasma.
Plasmídeos com alto número de cópias também podem expressar grandes quantidades de produtos
tóxicos
para o anfitrião. Sem pressão seletiva e se o produto não for tóxico, as perdas são
em baixa frequência (10–5–10–6 por geração), mas pode aumentar tremendamente quando
a inserção expressa é tóxica (Baneyx, 1999). Isto pode ocorrer mesmo sob condições seletivas
pressão porque a população de plasmídeo contém uma mistura de plasmídeos com e
Figura 4.7 Representação esquemática das principais características do
um vetor de expressão procariótico (Hannig, 1998). A expressão
vetor tem um promotor a montante que consiste em pelo menos um –35
e –10 região; o espaço entre eles define a fraqueza
ou força de um promotor. Entre o gene alvo inserido e
promotor encontra-se no sítio de ligação do ribossomo (RBS) com seu Shine–
Sequência de Dalgarno AGGA. O gene geralmente é inserido em um
local de clonagem múltipla construído artificialmente. Depois da parada
códon, às vezes a ser adicionado pelo usuário (como é o início
códon ATG), um sinal de terminação segue para liberar o RNA
polimerase do DNA. Duas outras características importantes são a
local de origem da replicação bacteriana (ori), o que garante que
o plasmídeo é copiado dentro de cada ciclo celular, e uma seleção
marcador, neste caso o tetr
gene.
4.5 (Sobre)expressão de uma função enzimática em um hospedeiro
84
sem inserção. Como as células que transportam plasmídeos com inserções não sobreviverão, tais
plasmídeos
são frequentemente extirpados pela célula, um fenômeno denominado “instabilidade plasmidial”.
Para contornar este problema, os vetores que causam a morte celular após a perda do plasmídeo
podem ser
usado, porque um gene essencial para o metabolismo do hospedeiro se perde junto com o
plasmídeo. Este mecanismo proporciona uma seleção melhor do que a resistência aos antibióticos,
pois
o último é encontrado em vetores com e sem inserção de alvo.
4.5.3
Escolha do vetor
Uma visão geral de alguns dos sistemas de vetores mais comuns é fornecida na Tabela 4.5.
Todos os vetores aqui escolhidos são sistemas de expressão induzíveis. A indução pode resultar
de uma mudança de temperatura, da adição de metabólitos ou da remoção de um
fonte de carbono necessária.
Uma das partes cruciais de qualquer sistema vetorial é o promotor, um pedaço de DNA
sequência que controla o nível de expressão da proteína.
O promotor tac híbrido, uma combinação dos promotores lac e trp, combina o
alta eficiência de transcrição do promotor trp com a fácil indutibilidade do
promotor lac. O promotor lac, como os outros promotores indutíveis por IPTG, não
têm controle rígido do repressor, cepas lacIq de E. coli com uma grande quantidade de repressor
lacI
deve sempre ser usado com este promotor; possivelmente cópias extras de lacI deveriam até
ser fornecido (como o plasmídeo rep4 da Qiagen).
O promotor T7 altamente eficiente em termos de transcrição é reconhecido pelo RNA T7
polimerase. Este tipo de expressão tem origem no bacteriófago T7, cujo
aparelho de transcrição compete com sucesso com o aparelho bacteriano
hospedar. O sistema de expressão T7 está perfeitamente incorporado nos vetores pET (Novagen),
dos quais uma grande variedade está disponível, distinguível por um número como
“pET30a”. Este sistema permite a expressão da proteína recombinante por si só, com
tags (histidina) ou como proteínas de fusão. Resultados muito bons podem ser alcançados, com
proteína alvo de até 50% da proteína celular total. Apenas cepas de E. coli BL21 (DE3) podem ser
usado com o sistema de expressão T7 porque essas cepas possuem o T7 necessário
RNA polimerase sob o controle do promotor lacUV5 integrado no
genoma. A produção da polimerase T7 é induzida pelo análogo da lactose IPTG, que
em seguida, identifica o promotor T7 mínimo a montante do gene alvo. O uso de
dois promotores para expressar o gene alvo garantem um controle rígido. Contudo, como não
O sistema de expressão atua independentemente da proteína expressa, mesmo no sistema T7 pode
ocorrer vazamento do promotor e, portanto, na maioria dos casos, resultados de expressão fracos.
Outro sistema promotor rigorosamente controlado (araB; Invitrogen) é baseado na arabinose. A
indução do promotor é totalmente reprimida por açúcares como a glicose ou
frutose, enquanto o controle da transcrição pode ser nivelado através do controle da concentração de
arabinose.
4.5.3.1 Geração de Órgãos de Inclusão
Altos níveis de expressão de proteínas hidrofóbicas podem levar a agregados insolúveis,
os chamados “órgãos de inclusão”. Eles consistem principalmente de células recombinantes mal
dobradas
proteína e são um sinal revelador de sobrecarga da maquinaria de expressão incapaz de
forneça tempo ou ajuda suficiente para o enovelamento de proteínas (Capítulo 17, Seção 17.8). O
O advento geralmente indesejável de corpos de inclusão só pode ser transformado em uma
vantagem se a proteína puder ser facilmente solubilizada, já que o processo de purificação neste
caso
O caso é muito simples e podem resultar rendimentos mais elevados do que para a purificação de
substâncias solúveis.
proteínas. Se a proteína não for facilmente resolúvel, tais agregados devem ser contornados por
todos os meios possíveis.
Meios possíveis incluem limitar a concentração de proteína recombinante por
cortando a indução diminuindo a temperatura, escolhendo um mais fraco
promotor, ou adição de um açúcar não digerível, como a desoxiglicose, como fonte de carbono
no momento da indução. Alternativamente, utilização através da coexpressão de E. coli
acompanhantes, como GroEL ou GroES (subunidades grandes e pequenas de um heptâmero duplo
proteína de choque térmico), pode ajudar a corrigir o dobramento da proteína alvo; no entanto,
sucesso
depende fortemente da proteína alvo e não pode ser prevista (Weickert, 1996;
para um exemplo positivo, ver Cole, 1996). Outra opção é a expressão do
proteína recombinante como uma proteína de fusão.
4.5.3.2 Expressão de Proteínas de Fusão
Como as proteínas heterólogas podem ser facilmente degradadas ou tóxicas para a célula
hospedeira, a fusão
o gene alvo para o gene correspondente de uma proteína solúvel específica do hospedeiro pode
desacelerar qualquer processo prejudicial. Um desafio comum é a expressão de uma
(sobre)expressão hy4.5 de uma função enzimática em um hospedeiro
86 4 Ferramentas de Biologia Molecular para Biocatálise

Figura 4.8 O sistema intein usado para proteínas de fusão


(Xu, 2000). As proteínas de fusão sofrem autoclivagem no
junção de emenda a montante. Os aminoácidos que participam
diretamente são mostrados, e o restante do intein e do alvo
proteínas são desenhadas como caixas. Normalmente, o intein é conjugado com
um domínio de ligação à quitina, então a purificação da proteína de fusão
pode ocorrer usando uma coluna conjugada com quitina. Auto-clivagem
pode ocorrer durante a noite. proteína drrófoba com tendência à agregação; isso pode ser resolvido
pela fusão do gene do
proteína hidrofóbica para um domínio hidrofílico para aumentar a solubilidade do alvo
proteína. Se fundida a um domínio que permite a purificação por afinidade, a proteína de fusão pode
ser purificado em uma única etapa. Exemplos de proteínas de fusão comuns são a glutationa-
transferase (GST) e a proteína de ligação à maltose (MBP) (Tabela 4.6). Uma expressão bem
sucedida de um receptor mínimo eucariótico fundido à proteína GST bacteriana
(Glutation-S-Transferase) é descrita por Boesen (2000).
A separação da proteína alvo da proteína de fusão pode ser realizada
quimicamente ou enzimaticamente. A base para a clivagem química é a estabilidade ácida ou básica
da proteína alvo. A separação enzimática por proteases é altamente específica, mas sua
a eficiência pode ser diminuída pelo acesso limitado à parte da sequência de aminoácidos
necessária para a proteólise.
Uma opção especial, mas elegante, como proteína de fusão é o domínio inteína, que explora a
capacidade de auto-splicing deste grupo de proteínas (Figura 4.8). A autoclivagem é
iniciado pelo resíduo de cisteína N-terminal da proteína inteína fundida, que produz uma ligação
tioéster através da substituição nucleofílica da amida da ligação peptídica pelo resíduo C-terminal
da proteína alvo. O tioéster é
hidrolisado pela adição de grandes quantidades de tióis, como DTT de 25 mm, assim
alcançar a clivagem da inteína da proteína alvo. Todo o processo pode ser
feito em uma única coluna adicionando TDT durante a noite (para uma boa descrição do
procedimento, ver Xu, 2000).
4.5.3.3 Expressão de Superfície
Pelo método de exibição em fagos, proteínas recombinantes podem ser expressas no
superfície de bactérias, leveduras ou bacteriófagos. Este procedimento é útil principalmente para
extrair novas variantes de proteínas ou peptídeos com funções especializadas. A exibição em fagos
funciona através da fusão de peptídeos ou proteínas com as proteínas da cápsula de
fagos, que podem ser montados in vivo. O processo de seleção inclui a incubação dos fagos com
estruturas ou substratos definidos para alcançar o novo desejado
proteínas (panorâmica). Através do panning, novas funções enzimáticas podem ser encontradas
como
parte da evolução in vitro.
4.5.4
Expressão de genes eucarióticos em leveduras
A expressão de genes eucarióticos em leveduras tem duas vantagens principais: (i) o sistema de
expressão de leveduras contém muitas características de um sistema de expressão eucariótico, como
glicosilação ou formação de ligações dissulfeto, e (ii) a levedura é um sistema muito econômico. As
leveduras são células únicas, podem ser facilmente cultivadas e apresentam duplicação bastante
curta
vezes e requerem ingredientes médios relativamente baratos; em muitos aspectos
eles se assemelham a bactérias.
Saccharomyces cerevisiae
Assim como a E. coli, a S. cerevisiae é um organismo bem estudado com uma base de
conhecimento genética e de biologia molecular bem estabelecida. A disponibilidade comercial
inclui:
4.5 (Sobre)expressão de uma função enzimática em um hospedeiro
88
y vários mutantes deficientes em protease, tornando pequena a possibilidade de degradação de
proteínas recombinantes;
y vários promotores constitutivamente expressos ou induzíveis; exemplos do antigo
são promotores expressos constitutivamente de enzimas glicolíticas, como fosfoglicerol quinase 1
ou álcool desidrogenase 1, e os induzíveis mais comuns
O promotor é GAL1 do gene da galactoquinase.
Uma vantagem da expressão constitutiva é a produção constante de proteína com
alto rendimento no caso de proteínas estáveis e solúveis. A indução de GAL1 ocorre
através da adição de galactose a células livres de glicose. Embora S. cerevisiae seja capaz
de adicionar glicosilação para proteínas secretadas, manosilação excessiva comum em
este tipo de levedura pode levar a efeitos adversos, como níveis de expressão mais baixos ou
proteínas mal dobradas.
Leveduras metilotróficas
Leveduras como Pichia pastoris (Invitrogen) ou Hansenula polymorpha (Rhein-Braun
Biotecnologia), que eram raros como sistemas de expressão há alguns anos, estão se tornando cada
vez mais estabelecidos. P. pastoris, especialmente, é adequado para expressão de
proteínas glicosiladas devido a menos resíduos de manose incorporados. O vetor
O sistema de ambas as leveduras apresenta um forte promotor induzível por metanol, derivado de
o gene da álcool oxidase (AOX1 e 2) para P. pastoris e a metanol oxidase
gene para H. polymorpha. Embora ambos os sistemas de expressão ainda não estejam
completamente
compreendido, mais e mais publicações descrevem expressões bem-sucedidas com até
até 30% de rendimento de expressão global. Para evitar a necessidade de otimizar bactérias
separadas
e sistemas de expressão eucarióticos se o requisito ou preferência não for claro no momento
desde o início, uma tentativa promissora de construir um vetor de expressão dupla para Pichia
pastoris é fornecido por Luecking (2000).
Para genes eucarióticos, a expressão em células de inseto (sistema baculovírus) ou células de
mamíferos (células de ovário de hamster chinês, células de macaco cos7) é possível e é
frequentemente
é mais provável que conduza a proteínas activas do que em bactérias ou leveduras devido a uma
maquinaria pós-tradução mais eficiente. No entanto, as taxas de expressão são muito baixas e não
f

Você também pode gostar