Você está na página 1de 66

Engenharia Genética 2011

Aula 1 - 08 de Fevereiro de 2011


O programa de engenharia genética consta de: clonagem molecular, clonagem de expressão, técnica de PCR,
hibridação de ácidos nucleicos e análise dos produtos dos genes clonados.

Análise dos produtos dos genes clonados: o que é que isto vos diz? O que é que acham que vão aprender
aqui? Técnicas, de quê? Vamos trabalhar com plasmídeos, genes… tecnologia do DNA recombinante: vamos
trabalhar com DNA, RNA e proteínas. E por isso é que se chama de biologia molecular, trabalhamos com
moléculas. Ouvimos falar de recombinação a propósito da troca, meiose… nós somos recombinantes, e por
isso é que somos diferentes dos nossos pais. Mas tudo isso é in vivo, tudo isso é natural. Aqui nós vamos fazer
essa recombinação, sim, mas a tecnologia do DNA recombinante começou por construir novas moléculas de
DNA in vitro, mas (mesmo assim) há muitas coisas que se vão fazer in vivo. Trabalhamos com DNA mas usamos
uma quantidade de ferramentas para corta-lo, cola-lo e manipulá-lo e por isso é que se chama tecnologia do
DNA recombinante, estamos a fazer novas moléculas, novas combinações.

E isso é possível fazer com DNA. O que é o DNA? É uma molécula de cadeia dupla. E o RNA? Uma molécula de
cadeia simples. Uma das ferramentas que vocês utilizam para trabalhar com o DNA são as enzimas de
restrição. Uma enzima de restrição é uma enzima que cliva o DNA em sequências de DNA específicas. Não
clivam RNA (as que conhecemos) porque para já não foram identificadas enzimas para clivar o RNA da mesma
forma que as que clivam o DNA, isto é, numa sequencia específica, mas há as RNAases que clivam o RNA que,
tanto quanto se saiba, são inespecíficas. Portanto, para trabalharmos com o RNA como é que o fazemos?
Como o transformamos em fragmentos mais pequenos? Porque uma das funções das enzimas de restrição é
transformar o DNA em fragmentos mais pequenos para que possamos trabalhar com ele de uma forma mais
controlada. Vocês têm as moléculas de RNA vão transformá-las em DNA através da transcriptase reversa e aí
sim vão ter uma molécula de cadeia dupla para poderem trabalhar o RNA ou aquilo a que este deu origem na
forma de DNA! Mas porque queremos estudar o RNA? Porque o RNA tem actividade catalítica, para saber se
um gene está a ser expresso… uma das razões pelas quais podem querer estudar o RNA é porque querem
estudar a expressão genica. Outros produtos que resultam da expressão génica são as proteínas. O produto
final de cada gene é a informação genética mas isso podem ser proteínas ou só RNA (como o RNAr, que não
passa daí mas que veio de um gene).

Se estão a estudar uma bactéria, ou uma célula de fígado humano, ou do pulmão do ratinho… cada uma
destas células tem o seu DNA cujos genes vão ser expressos. Mas nem todos os genes vão ser expressos,
portanto interessa fazer estas construções para saber como e que factores influenciam esta expressão génica
quer a nível da expressão do RNA quer a nível da produção de proteínas.

Então na análise dos genes clonados e dos seus produtos quer dizer que vamos aprender técnicas para
analisar o produto dos genes que clonámos (o DNA, RNA e as proteínas), que permitem estudar o segmento
de DNA (que não tem de ser um gene, pode conter informação genética ou não, pode ser codificante ou não).

Clonagem Molecular

Um clone é uma coisa que é igual a outra, uma molécula de DNA, uma célula, um organismo… desde que
sejam geneticamente iguais e descendentes de uma célula ou molécula é um clone: seja clone de DNA, de
organismos, de células… desde que sejam geneticamente iguais porque descenderam de uma primeira
molécula ou célula que se foram replicando a si mesmos. Como vamos falar de clonagem molecular nós vamos
descobrir como vamos fazer clonagem de moléculas.

1
Engenharia Genética 2011
Para a fazer temos de usar DNA, não vamos clonar RNA nem proteínas. Onde o vamos buscar? A uma fonte: a
nós, às nossas células, bactérias, vírus…

Plasmídeo: é uma molécula de DNA circular, pode ser dupla ou simples, mas maioria é dupla. São identificados
em bactérias (principalmente) mas já foram identificados em leveduras. O DNA plasmídico bacteriano isolado
das bactérias é exactamente o que é utilizado na tecnologia do DNA recombinante? Não, são alterados, são
moléculas de DNA recombinante, os próprios plasmídeos que vamos usar já foram construídos porque foram
buscar uma origem de replicação, uma resistência a antibiótico, e aqui foram ligados vários fragmentos e
sequencias importantes, com sentido, há um objectivo para construir um DNA plasmídico e, esse sim, é que é
um vector.

Dizer que um DNA plasmídico é um vector pode ter duas conotações:

A primeira é um vector natural porque as bactérias têm-nos para serem como tampões, isto é, para fazerem
uma limpeza de alguns genes do exterior para as bactérias poderem incorporar e ganhar alguma resistência
contra o ambiente (isto de uma forma muito simplista, porque não é sempre assim) e acabam por ser vectores
para poderem passar (nem todos) de bactérias para bactérias, são vectores para passar estes genes de umas
para as outras, e dão uma vantagem selectiva às que os incorporam em relação às outras que não os têm.

(a professora não diz, não chega a mencionar a segunda conotação mas sendo ela óbvia…) Em engenharia
genética são vectores porque transportam o fragmento de DNA que produzimos que se irão, assim, multiplicar.
Aqui utilizam-se genes de resistência a antibióticos.

Quando estamos a fazer clonagem molecular temos de ter DNA e depois temos de ter um vector. Então se
temos uma molécula de DNA muito complexa e o vector, o que é que temos de fazer a seguir? Cortar, clivar
com as enzimas de restrição para ter vários fragmentos de DNA mais pequenos e podermos clonar. Portanto
esta molécula circular também tem de ser clivada e, então sim, podemos ligar… e construímos a molécula de
DNA recombinante. E fazemos clonagem molecular.

2
Engenharia Genética 2011

Aula 2 – 10 de Fevereiro de 2011


Relativamente ao Dogma Central o que eu vos queria chamar a atenção para Engenharia Genética (EG) é que
quando nós pensamos na molécula de DNA, que é a molécula informativa, no fundo nós temos 4 letras (ACGT)
cuja combinação nos vai dar a variedade dos seres vivos. E, no fundo, essa diferente combinação é um texto
que tem que ser lido correctamente para que possa ser bem interpretado, para obtermos não só o ser vivo
que depende dessa informação, como a sua manutenção na Evolução. O que lá está não é só um gene que vai
dar aquilo. O que está é “o que vai ter que ser expresso”, “quando é que vai ter que ser expresso”, onde e
como.

Uma das surpresas que ocorreu aquando da sequenciação do genoma humano foi o número reduzido de
sequências codificantes (genes). De facto no nosso genoma só 3% (há quem defenda 5%) do que lá está é que
é codificante. Então para que serve tudo o resto? Tudo o resto está provavelmente envolvido na regulação de
“o quê?”, “quando?”, “onde?”, “como?”.

Outra coisa que vos quero transmitir é que durante muito tempo pensou-se que eram só as proteínas que
eram estruturais, no fundo, e que davam função, etc, e agora começa-se a ver que o RNA é uma molécula
também muito importante na regulação da expressão. Portanto isto não acaba nunca, no sentido em que
estamos sempre a avançar no conhecimento desta molécula, nomeadamente na informação que ela contém.

Outra coisa ainda, quando se sequenciou o genoma humano parecia “ pronto, já está!”, mas não, não está
nada! Ainda se sabe muito pouco…O passo seguinte é perceber o que é que aquilo tudo quer dizer. E uma das
funções da EG é fornecer as ferramentas (ela não vai dar respostas), para nós percebermos o que é aquilo
tudo quer dizer, ou seja que significado é que aquilo tem em cada problema biológico que vai surgir. Isto é
uma coisa importante para vocês perceberem que a EG permite-nos aceder a regiões muito específicas de
DNA de um genoma que é extremamente complexo, seja qual for o organismo que se está a estudar. E
portanto os enzimas que estão envolvidos neste processo de expressão génica, da mesma forma que vocês
têm in vivo uma DNApolimerase que é responsável por fazer cópias do DNA de si mesmo (replicar), sempre
que estivermos a trabalhar in vitro e precisarmos de fazer cópias (nem precisa de ser cópia de uma molécula
inteira, basta copiar qualquer coisa do DNA) é uma DNApolimerase que vamos utilizar. Há muitas destas,
inclusive algumas que foram manipuladas para terem funções mais ou menos específicas. Nunca se esqueçam,
sempre que precisamos de fazer qualquer coisa em que é preciso sintetizar DNA, copiar DNA, incorporar
nucleótidos (que é o que acontece, no fundo, quando nós estamos a replicar o DNA, é sempre uma
DNApolimerase que usam. O enzima responsável pela transcrição, ou seja, a síntese de RNA: é a
RNApolimerase, logo, sempre que for preciso expressão génica utilizamos uma RNApolimerase ).

Portanto, nesta aula íamos falar do significado e do objectivo da Clonagem Molecular, bem como dos seus
principais passos (começamos a falar na 1ª aula no tal vector e inserto). Vamos falar dos sistemas gerais de
clonagem e dentro destes vamos falar de E.coli e de sistemas de clonagem em Eucariotas. Fiz esta separação
porque muitas coisas passam de facto primeiro por E.coli, porque é um organismo extremamente simples,
barato, divide-se muito rapidamente, existem muitas estirpes com mutações várias que servem para a EG e
vocês já vão perceber porquê. Existe inclusivamente um livro (ATCC) onde estão contempladas listas de
diferentes estirpes bacterianas, muitas de E.coli, porque basta uma mutação para servir para um determinado
fim, enquanto que outra já serve para outro. A ideia a reter é que por E.coli que muitas das vezes é o 1º passo
para começarmos a clonar, porque é simples. Vamos falar de sistemas eucarióticos porque também são muito
importantes. Durante muito tempo só se trabalhava em E.coli mas de seguida começou-se a utilizar sistemas
eucarióticos.

3
Engenharia Genética 2011
Isto só para terem uma ideia que a genética começou com Mendel e foi muito desenvolvida, sobretudo, na
altura em que se começou a fazer muito a chamada Genética Microbiana, em que se trabalhava com bactérias
e com fagos e foi de facto este trabalho que possibilitou a descoberta dos enzimas de restrição… A partir de
1940 deu-se a descoberta que o DNA era o material genético mas ainda não era a estrutura da molécula, era
só que era aquele ácido desoxiribonucleico que continha a informação genética e não as proteínas (ao
contrário do que se tinha pensado durante muito tempo), depois apareceu o conceito de plasmídeo (ainda
não se tinha isolado) em que havia uma molécula que se transferia entre bactérias. Depois em 1953 dá-se a
descoberta da estrutura do DNA e em 66 o código genético. Em 67 o isolamento da DNAligase, que permite
ligar segmentos de DNA e em 1970 o isolamento da 1ª enzima de restrição e por aí a diante… Desde aí tem
sido uma evolução exponencial.

O que é que significa Clonagem molecular? No fundo quando o estamos a fazer, estamos a construir
moléculas de DNA recombinante, o chamado “construct”. No fundo estamos a fazer uma construção
molecular. Vamos ter várias designações que querem dizer todas a mesma coisa: Engenharia Genética,
Tecnologia do DNA recombinante, manipulação genética, clonagem genética…

Para que é que vamos utilizar a EG? Para analisar genes e os seus produtos. Temos varias técnicas que vamos
abordar mais a diante: DNAfingerprinting, microarrays, western blot, southern blot, northern blot. No fundo
estamos sempre a estudar a expressão génica mas também posteriormente a aplicação em terapia genética,
organismos trangénicos e descoberta de novas drogas (o chamado estudo aplicado). Mas não basta fazer uma
construção e “já está”. O que temos é ferramentas para podermos ir mais longe.

Agora vamos falar dos primeiros passos da clonagem molecular:

(1) Temos que ter um fragmento de DNA ou DNA dador (muitas vezes também chamado de inserto) e um
vector. Esse vector pode ser um plasmídeo, mas existem muitos outros. Para termos o fragmento de DNA
temos que ter enzimas de restrição. Estas têm que clivar o DNA que queremos manipular e o próprio vector.
As enzimas de restrição geram um determinado tipo de extremidades. E isto é o 1º passo.

(2) A seguir temos que ligar, porque preparámos o vector e os fragmentos mas eles têm que entrar em
contacto um com outro através de uma DNAligase que vai ligar as moléculas de DNArecombinante. Quando
nós pretendemos que os fragmentos se liguem, as enzimas de restrição que vamos adicionar têm que gerar
extremidades compatíveis. Essa compatibilidade é sobre os pares de bases, ou seja, a extremidade que se gera
tem que deixar um x nº de pb que seja complementar do que foi deixado no outro caso, para que possa
ocorrer emparelhamento de bases. Mas não basta emparelhar, é preciso estabelecer as ligações fosfodiéster
para ligar covalentemente á outra molécula e essa ligação é que é estabelecida pela DNAligase.

(3) O passo seguinte é amplificar as moléculas recombinantes (ou só uma específica) porque eu não consigo
fazer nada com uma só molécula, tenho que ter moles de moléculas. Para isso vamos ter que introduzir estas
construções numa célula bacteriana, neste caso E.coli, porque é por esta que se começa. E.coli tem o seu
próprio DNA genómico sob a forma de um só cromossoma todo enrolado numa região chamada nucleóide. Há
processos para introduzir este DNA plasmídico, em que as células têm que ser “preparadas” para receber este
DNA. Normalmente só entra uma molécula de DNA plasmídico em E.coli e muitas das células de E.coli nem
sequer vão receber nenhuma molécula plasmídica. Quando nós fazemos a transformação, que é a introdução
destas contruções em E.coli, muitas células de E.coli não recebem DNA plasmídico. Recapitulando, quando
digerimos o DNA genómico originámos diferentes fragmentos, que quando inseridos no vector deram origem
a diferentes moléculas recombinantes, que então podem ser introduzidas em diferentes células, e por isso
cada uma das células tem uma informação diferente.

4
Engenharia Genética 2011
(4) Uma vez dentro da célula, estas moléculas vão replicar, fazendo cópias de si mesmas e também as células
vão replicar, originando clones. O DNA plasmídico tem um número de cópias determinado, ou seja, uma
determinada molécula pode existir dentro de uma célula sempre só com uma cópia (single-copy), mas outra
molécula de DNA plasmídico pode ter informação para existir em 10 cópias, sendo que nesse caso quando
entra replica até atingir as 10 cópias. Mas podemos ter DNA’s plasmídicos que existem em 100 cópias, 500
cópias… e portanto é só nessas circunstâncias que ele vai replicar. Se determinado DNA plasmídico tiver a
informação no seu genoma de 1 cópia, ele não vai replicar. Dito isto, se quiséssemos ter muito DNA plasmídico
no fim escolhíamos um plasmídeo de elevado número de cópias. Isto chama-se o número de cópias do DNA
plasmídico e é uma característica do próprio plasmídeo.

(5) Agora olhando para os diferentes clones que obtivemos, eu vou querer diferenciar quem tem DNA
plasmídico e quem não tem. Portanto vamos fazer a selecção das bactérias transformadas. Como é que eu
posso fazer esta selecção? Tem que haver qualquer coisa no DNA plasmídico que me permita distinguir aquela
bactéria de outra. E frequentemente os plasmídeos têm um gene que codifica para uma marca de resistência
a um antibiótico (Atenção: não codifica para o antibiótico em si, apesar de essa região poder ter o seu nome).
Isto quer dizer que este gene codifica para uma proteína, um enzima que me confere a resistência. Isto quer
dizer que, se este plasmídeo estiver dentro de uma célula e se eu colocar essa mesma célula numa placa de
Petri com meio com um antibiótico, por exemplo a Ampicilina, ela vai crescer enquanto que as outras que só
têm DNA genómico não crescem (isto porque E.coli é sensível à Ampicilina, não crescendo portanto num meio
com este antibiótico). Normalmente esse gene é o bla (em itálico ou sublinhado - é assim que se escreve o
nome dos genes procarióticos) que codifica para uma β-lactamase que é um enzima que cliva o anel β-
lactâmico da Ampicilina, sendo que esta deixa de estar activa, fazendo com que a célula consiga multiplicar-se.
O passo seguinte é fazer a selecção das células transformadas. Entretanto, se eu tiver colónias significa que
aquelas células que lá estão são clones bacterianos e clones de DNA, porque à partida só têm uma molécula
de DNA por célula.

(6) Agora o que é que eu faço com o meu clone? Vocês acham que eu ia ter este trabalho todo para chegar ao
fim e ter uma colónia só e cada vez que precisasse desta construção tinha que fazer isto tudo outra vez? Não!
Nós temos que “eternizar” esta colónia ou, pelo menos, a construção porque eu não vou querer voltar a fazer
isto tudo, até porque nem sempre resulta. Para isso repicamos esta colónia e pomos em meio de cultura, onde
ela se vai multiplicar (se eu tiver um volume de 3 mL, vou ter uma cultura com um x nº de células, se tiver 10
mL tenho ainda mais células… e assim por diante).
5
Engenharia Genética 2011
(7) Mas eu não estou interessada nas células, mas sim no DNA. Por isso vou deixar crescer e depois vou
centrifugar para separar as células do meio e vou lisá-las, para ter o DNAplasmídico. Existem protocolos
expecíficos para purificar o DNA plasmídico, separando-o do DNA genómico. Então sim, eu sei que á partida
cada colónia será diferente ou não, amplifiquei o DNA recombinante e a seguir o que eu quero é purificar uma
molécula de DNA e essa sim vai ficar congelada e eternizada. Agora imaginem: vocês chegam ao fim e têm um
tubinho com muitas moléculas de DNA plasmídico recombinante que vão gastando para os vossos estudos. E
se um dia acaba como é que fazem? Congelam as células com o DNA plasmídico lá dentro (para além de
porem fazer um PCR) e cada vez que eu quiser é só pegar naquele congelado e meter a crescer e volto a ter
mais DNA plasmídico. Agora imaginem que há um problema de electricidade e morre tudo. Nesse caso vamos
ao nosso DNA plasmídico e voltamos a transformar as células (a construção já está feita, só vamos
transformar). O mais difícil nisto tudo é obter a construção. O resto (crescer, centrifugar, lisar, separar DNA
cromossómico e DNA plasmídico…) é fácil.

Quando vocês estão a clonar tanto podem ter uma


mistura de fragmentos de DNA ou então podem já ter
um gene bem identificado (uma única sequência de
DNA simples) que vamos clonar e que sabemos que
todos os clones são daquela mesma sequência de DNA.
Ou seja, temos muitos segmentos ou um só. Seja como
for, muitos ou um só podem ser clonados. Quando eu
tenho um só, já sei que vai ser tudo igual. Quando
tenho muitos, já sei que muitos vão ser diferentes. Seja
como for, vocês têm sempre a possibilidade de fazer
muitas cópias (amplificar). Isto é o primeiro passo da
clonagem.

Qual é o papel dos ácidos nucleícos em clonagem molecular? Primeiro que tudo, já viram que o DNA tanto
pode ser usado como vector como inserto. Depois o cDNA é sintetizado a partir do RNA. Mas quer o DNA quer
o RNA podem ser utilizados como sondas. O que é uma sonda? É uma sequência quer de DNA quer de RNA
que vai hibridar, por complementaridade, com outros ácidos nucleicos de DNA ou RNA e que muitas vezes a
complementaridade pode não ser total! E é muitas vezes usando essa sonda (para sondar/pesquisar) de um
organismo, por exemplo de um determinado gene de E.coli, e eu vou pegar no DNA de outras bactérias como
Neisseria, Salmonella… à procura se essa bactéria tem no seu genoma um gene semelhante (não tem que ser
igual!). A palavra-chave é “hibridar” e usamos este termo quando nos referimos à complementaridade entre
bases dos ácidos nucleícos. Há muitas técnicas de hibridação de que vamos falar, que é outro capítulo major
da EG.

Passos da clonagem molecular:

1º Seleccionar sistema vector/hospedeiro - isto porque qualquer vector, seja plasmídeo ou fago, etc, não
serve para qualquer hospedeiro, tem de haver uma relação entre o vector e o hospedeiro. O que é que
determina a sua escolha? O que determina a escolha do sistema é o nosso objectivo, i.e., se eu quisesse
produzir uma proteína em grande quantidade (a partir de um gene/fragmento) deveria escolher um vector
que não fosse single-copy.

2º Preparar o vector após a sua escolha. O DNA dador também tem que ser preparado. A seguir temos que
ligar. Depois, preparar as células do hospedeiro, introduzir as moléculas de DNA recombinante, seleccionar e
identificar. Aqui é outra coisa. Neste caso, construímos mas temos que ter q certeza absoluta de que aquilo

6
Engenharia Genética 2011
que construímos é “aquilo que construímos”, porque podemos estar a construir e depois chegamos aqui e não
temos nada. Portanto há que confirmar o clone para que não se continue a experiência com o clone errado.

Para preparar quer o DNA vector quer o DNA do inserto a primeira coisa no DNA do vector é digerir com
enzimas de restrição tipo II. E também no caso do DNA inserto usamos enzimas de restrição tipo II embora não
seja o único processo possível para gerar fragmentos de DNA (não tem quer ser sempre as enzimas de
restrição em locais específicos) mas praticamente estes não se usam ou usam-se somente em determinadas
circunstâncias:

• Clivagem mecânica (controlada) – através de um sonicador, por ex.

• Através de uma seringa com uma agulha muito fininha que não permite ao DNA passar com facilidade,
clivando-o aleatoriamente

• Através de um Sintetizador de oligonucleótidos (pequenas sequências de nucleótidos) em que


introduzimos a sequência que pretendemos e ele tira de cada frasco contento dATP, dCTP, dGTP e
dTTP para o construir. Pode ter 17 mer (oligómero), ou seja 17 nucleótidos. E genericamente estes
oligonucleótidos chamam-se Primers (curtas sequências de DNA).

Portanto podem sintetizar fragmentos de DNA, a única forma não é só clivar, mas também sintetizar.

• E também podem sintetizar quimicamente, por PCR. È uma reacção de polimerização em cadeia.
Precisamos de primers (para ladear a sequencia que vamos amplificar), DNApolimerase e nucleótidos.
Mas a premissa nº 1 para podermos produzir um fragmento de DNA por PCR é termos algum
conhecimento da sequência (não é necessário saber toda, apenas alguma).

Em relação às enzimas de restrição, nem todas são usadas em Tecnologia do DNA recombinante, apenas as do
tipo II.

7
Engenharia Genética 2011

Aula 3 – 15 de Fevereiro de 2011


A origem do nome das enzimas de restrição advém do hospedeiro donde são
isoladas, que geralmente são bactérias (embora já tenham sido isoladas de
outros organismos - há uma alga que possui uns fagos que a infectam e
produz enzimas de restrição).

A 1ª Letra do nome da enzima está relacionada com o nome genérico do


organismo, neste caso é “E” Escherichia, depois “co” de coli.

O “R”- É de restrição (tem o R logo no inicio porque a bactéria


para além de produzir a enzima de restrição também produzia a
respectiva enzima de modificação.)

O “I” é por ordem de aparecimento, cronológica. (Etc)

As enzimas de restrição cortam uma ligação fosfodiester (vocês sabem que no DNA vocês têm 2 ligações
diester e portanto a ligação fosfodiester) e corta deixando a extremidade 3’ OH e uma extremidade 5’ fosfato
(há uma enzima que contraria isto e produz extremidade 3’ fosfato e 5’ OH—NciI)

As enzimas de restrição geram 3 tipos de extremidades, dois tipos de extremidades coesivas (1. extremidade
3’ OH recuada ou 5’ fosfato projectada 2. 3’OH projectada e 5’fosfato recuada) também se podem formar
extremidades blunt (cegas).

Isoesquisómeros – são enzimas de restrição diferentes (normalmente isoladas de organismos diferentes) mas
que reconhecem exactamente a mesma sequência (e cortam da mesma maneira), no entanto vocês podem
ter isoesquisomeros que reconhecem a mesma sequência mas que cortam de maneira diferente.

O tipo de enzima que vamos usar depende do local onde formos clonar (quando formos clonar o fragmento
originado, se for cortado Acc65I tem um tipo de extremidades se cortam com Kpn1 tem outro tipo de
extremidades) e o que vocês pretendem é que o fragmento que vocês criaram seja possível clonar com algo
que tem o mesmo tipo de extremidades para poderem ligar (temos de ter em atenção a extremidade
projectada e ver como pode encaixar)

Outro assunto (ainda nos isoesquizomeros), dissemos que os isoesquisomeros reconhecem a mesma
sequência, cortam da mesma maneira (e assim é indiferente usar um enzima ou outro) ou reconhecem a
mesma sequência e cortam de maneira diferente (e assim já não é indiferente usar um ou outro) têm de saber
8
Engenharia Genética 2011
exactamente o que estão a fazer. Vocês também podem ter isoesquizomeros que têm diferente sensibilidade
à metilação.

O que é que é isso de metilação, para que é que serve e quando é que se descobriu?

Pode ter a ver com o silenciamento de genes (mas não esta relacionado com o que estamos a falar - é um tipo
de metilação que se observa nos eucariotas) (curiosidade: metilação não existe em drosofila, sendo um
mecanismo importante no silenciamento de genes como é que é possível que não exista em drosofila?... mas
o que queremos saber é a relação da metilação com as enzimas de restrição.

A metilação descobriu-se quando se estudava a infecção fágica (dos fagos que infectam bactérias) e que se
verificou que alguns fagos escapavam ao mecanismo de restrição das bactérias, ou seja os fagos infectavam as
bactérias e o seu DNA não era degradado (o que acontece é que se fosse fácil para os fagos infectar bactérias
era uma grande infecção de bactérias pelos bacteriófagos). O que acontece é que as bactérias para se
defenderem da infecção fágica sintetizam as tais enzimas de restrição para clivar o DNA fágico (é como se
fosse um mecanismo de defesa das bactérias contra a infecção). São as próprias bactérias que sintetizam as
enzimas de restrição para clivar o DNA fágico, mas se as bactérias estão a produzir enzimas de restrição que
clivam DNA, ao clivar DNA fagico também clivavam o seu próprio DNA. O que acontece é que as bactérias
produzem enzimas de restrição (ex. EcoRI) mas para se protegerem do corte endógeno produzem uma enzima
que modifica a sequencia que a EcoRI reconhece, e portanto ela ao estar a produzir EcoRI o seu próprio DNA
não vai ser clivado, porque naquela sequencia que ele reconhece vai ocorrer uma modificação na sequencia
que impede que o enzima produzido pela própria bactéria clive o DNA. E que modificação é essa? É uma
metilação.

É um sistema de restrição/modificação, mas a modificação que ocorre é uma modificação química, ou seja, a
metilação ao nível da sequência que é reconhecida pela enzima de restrição. Em condições normais a EcoRI
corta, mas se esta sequência for metilada pela metilase da EcoRI, a EcoRI já não corta.

Portanto existem isoesquisómeros que têm uma diferente sensibilidade à metilação. Existe enzimas que só
clivam sequências metiladas, enzimas que não clivam sequências metiladas e outros enzimas que clivam
sequências quer estejam metiladas ou não.

9
Engenharia Genética 2011

Acabámos a matéria das enzimas de restrição!

Para manipularem o DNA, para além das enzimas de restrição que clivam o DNA em locais específicos, vocês
têm um grande grupo de enzimas chamadas enzimas de modificação – são enzimas que modificam o DNA de
alguma forma e de muitas maneiras de forma a podermos manipular o DNA (todas essas enzimas são enzimas
que existem in vivo e são produzidas em grande quantidade para podermos trabalhar no laboratório).

• Uma das primeiras enzimas que vos quero falar é o Fragmento Klenow

(relembrar – a DNA polimerase I tem actividade de polimerase e exonuclease, polimerase no sentido 5’-3’ e
exonuclease no sentido 3’-5’ esta actividade chama-se revisão de provas (prof reading). Também tem
actividade exonucleolitica de 5’-3’ e no laboratório quando estão a trabalhar com o DNA polimerase I sabem
que a vossa DNA polímerase I tem estas 3 capacidades:

• Polimerase 5’-3’
• Exonuclease 3’-5’
• Exonuclease de 5’-3’ (Prof reading)

mas como esta actividade era um pouco “incómoda”, porque era dispensável ou até dava jeito que não
existisse. E houve um senhor eu foi o senhor Klenow que manipulou com subtilizina (uma protease) a DNase
polimerase I e anulou a actividade exonucleásica 5’-3’ da DNA polimerase e então surgiu o DNA polimerase
fragmento de Klenow ou podemos só dizer fragmento de Klenow ou polimerase de Klenow (há muitas formas
de se dizer).

• DNA ends modifications

Ora bem quando nós estamos a manipular o DNA e usamos um enzima de restrição que gera determinado
tipo de extremidades e queremos clonar esse fragmento de DNA num vector e esse vector por mais que vocês
dêem voltas não conseguem clivá-lo com enzimas que dêem extremidades que sejam compatíveis com
aquelas que vocês criaram no fragmento, há maneira de vocês manipularem ou o fragmento ou o vector (as
extremidades do fragmento ou as extremidades do vector) de forma a ficarem compatíveis as extremidades
para poderem ligar.

1. Preenchimento parcial

Uma das maneiras é fazendo o preenchimento parcial das extremidades 3’ OH recuadas (se for caso disso,
consoante as extremidades que se geram assim se faz o tratamento adequado)

Têm TCGA é a extremidade 5’ projectada (gerado pela HindIII) e o fragmento foi cortado com XbaI e gerou
extremidade GATC- portanto não são compatíveis. Mas eu posso torna-las compatíveis. Como? Fazendo o
preenchimento parcial destas extremidades, se vocês repararem, se eu adicionar uma adenina e uma guanina
fico com GA projectado.

10
Engenharia Genética 2011

Se eu adicionar fragmento Klenow e dATP e dGTP (são os precursores), conseguimos adicionar uma adenina e
uma guanina e ficamos com GA projectado, e se ao vector adicionar dCTP e dTTP (são os precursores para
vocês poderem preencher um pouco) ficamos com 2 extremidades que encaixam.

A Klenow preenche/polimeriza no sentido 5’-3’

Outra forma (estratégia) de clonar o fragmento no vector: podiam (na extremidade 5’ projectada) gerar
extremidades cegas digerindo, podiam usar uma exonuclease ou uma DNA polimerase que tem actividade 5’-
3’ que vos digerisse a extremidade. Ou por outro lado em vez de digerir podia-se adicionar tudo, fazia-se um
preenchimento total das extremidades.

No primeiro caso vocês conseguem gerar extremidades mantendo ambas as extremidades coesivas mas
geraram extremidades compatíveis. (Partial fill-in of 3’ recessed ends)

2. Total fill-in of recessed ends

No segundo caso tinham as extremidades coesivas, geram extremidades cegas (fazem o preenchimento total)

Como se geravam extremidades blunt (na extremidade 3’OH recuada, quando temos a 3’ OH recuada
podemos usar uma DNA polimerase que polimerisa de 5’-3’) numa extremidade 3’OH projectada? Não há
maneira de preencher, porque não há nenhuma DNA polimerase que preencha no sentido 3’-5’. A única
hipótese é digerir, porque preencher não podem, não há nenhuma enzima que faça isso.

3. Removal of 3’ protruding ends

Podem digerir com o quê, no sentido 3’-5’? Podem usar a DNA Polimerase I ou a Klenow ou T4 DNA
polimerase – a T4 DNA polimerase tem uma actividade 3’-5’ exonucleolítica mais potente que a Klenow. Ou
seja, tendo a T4 não se utilizaria a Klenow.

Portanto o objectivo agora era converter as extremidades coesivas em blunt.

Outra forma de remover extremidades 3’ projectadas é com a enzima S1 nuclease (tem muitas utilidades) e
temos a Mung bean nuclease que tem basicamente a mesma função que a S1.

11
Engenharia Genética 2011
- O que é que a S1 nuclease faz? Vocês podem ter um caso em que têm um mRNA e têm um fragmento de
DNA que híbrida com o RNA (que é complementar, aliás isto é uma das técnicas que se utiliza para fazer o
mapeamento do inicio da transcrição - falaremos mais adiante). Vocês têm um RNA e têm uma sonda
(fragmento de DNA) que é complementar desta região. Então, se nós usarmos a nuclease S1, esta digere quer
seja DNA quer seja RNA em cadeia simples e quer seja no sentido 5’-3’ quer seja no 3’-5’. Portanto ela o que
faz é digerir, e tudo o que for DNA ou RNA ou híbridos DNA-RNA em cadeia dupla são resistentes à digestão
pela S1, ou seja a S1
detecta que já estamos na
zona de cadeia dupla (quer
seja dupla DNA-DNA, quer
seja RNA-RNA, quer seja
dupla híbrido DNA-RNA) e
já não digere. A nuclease S1
faz isto através da sua
actividade de exonuclease (a partir das extremidades), mas a nuclease S1 também tem a possibilidade de
cortar em loops que estejam em cadeia simples (ou seja actividade endonucleasica em cadeia simples). E isto
quer seja DNA ou RNA. A grande afinidade dela é para cadeia simples.

4. Addition of linkers

Como é que nos podemos converter extremidades que estão blunt em extremidades coesivas?

Uma das razões pelo qual é importante ter extremidades coesivas qual será?

Se vocês tiverem clonado um fragmento de DNA que tem extremidades blunt num vector que também tem de
ter extremidades blunt ou um fragmento de DNA que tem extremidades coesivas num vector que tem
extremidades coesivas compatíveis é mais fácil clonar quando se tem extremidades coesivas.

Quando estamos a fazer grandes bibliotecas/clonagens que envolvem muitos fragmentos, para garantir que
todos os fragmentos têm a mesma possibilidade de serem clonados, queremos que todos esses fragmentos
tenham extremidades coesivas. E para isso há uma possibilidade que é adicionar linkers.

Linkers são sequências que no meio têm uma sequência que vai ser reconhecida por uma determinada enzima
de restrição (ou seja são precisos 2 linkers se for necessário para as duas extremidades)

12
Engenharia Genética 2011

Como é que ligam um linker ao DNA? Para ligarem um Linker a um fragmento de DNA vocês precisam de uma
DNA Ligase.

No fundo vamos digerir com a enzima AatII para gerar extremidades coesivas e vão clonar num vector que
gera extremidades compatíveis.

Quando eu estou a digerir com a AatII o que é que eu tenho de garantir?

- Que o vector tem de ter extremidades compatíveis

- Que o meu fragmento não tem locais AatII (porque senão estamos a digerir o fragmento), mas se tiver
podemos metilar com a metilase da AatII antes de ligar os linkers e só depois ligar os linkers e digerir com AatII
(assim mesmo que tenham locais AatII no vosso fragmento ele não vai ser digerido)

5. Addition of adaptors

Para além dos linkers vocês tem os chamados adaptadores. A diferença é que enquanto o linker é blunt blunt,
os adaptadores já tem extremidades coesivas ou uma extremidade coesiva e uma extremidade blunt. Ou seja,
quando vocês adicionam adaptadores não
precisam de digerir, porque eles já tem as
extremidades adaptadas a vossa estratégia.

Por exemplo vocês têm uma extremidade


coesiva que vão ligar a um fragmento que
também tem uma extremidade coesiva e
que vai ficar com outra extremidade coesiva
(liguei o meu fragmento BamHI e vai ficar
com uma extremidade EcoRI). Dentro do
adaptador vocês ainda têm outro local de
restrição se quiserem utilizá-lo (XmnI)

Existem vários tipos de adaptadores é só


pegar nos catálogos e escolher o que é mais
adequado a vossa estratégia

6. Addition of homopolimer tails

13
Engenharia Genética 2011
Consiste na adição de homocaudas de homopolímeros (homo - tudo igual, ou seja sequência toda igual). Qual
é a enzima responsável pela adição de homopolimeros? – É a transferase terminal. A grande particularidade
da transferase terminal é que adiciona qualquer nucleótido que seja fornecido sem necessidade de ter molde
(enquanto as DNA polimerases têm de ter um molde para saberem o que é que adicionam, a transferase
terminal adiciona GGGG ou CCCC sem precisar de molde).

Quando vocês estão a adicionar com a transferase


terminal dCTP ou dCTP conseguem controlar o número
que colocam através do tempo de actuação, mas não
sabem ao certo quantos nucleótidos foram
adicionados (há uma relação mas não é possível saber
ao certo). Pode acontecer depois que não haja
emparelhamento certo (7 Gs para 5 Cs por ex-ver no
slide), tem de se adicionar depois dCTP e uma DNA
polimerase (a Klenow por exemplo).

Entretanto já esta tudo ligado porque já adicionaram


DNA ligase. Agora adicionam DNA polimerase Klenow
para preencher e fica o que se chama um Nick. Um nick é quando vocês têm tudo preenchido mas a ligação
fosfodiester não está estabelecida. Quando vocês têm uma ligação estabelecida em que falta mais do que um
nucleotido é um Gap.

Podiam adicionar DNA ligase para estabelecer a ligação fosfodiester, mas também podiam pegar na molécula
de DNA plasmidico, transformar e a própria bactéria com os seus sistemas de reparação estabelecia esta
ligação logo durante o primeiro ciclo de replicação do DNA plasmidico (se houver muitos Nicks isto não
acontece).

7. Ligation

T4 DNA Polimerase; T4 DNA ligase - O T4 significa que vem do fago T4. E vem do fago T4 porque foi de onde
foram isoladas varias enzimas e é produzida em grandes quantidades.

A T4 DNA ligase só liga extremidades 5’P a extremidades 3’OH de grupos que estão adjacentes (se tiver um
gap, basta que falte um nucleotido já não liga) e na mesma cadeia. Se já tem uma molécula com extremidades
coesivas compatíveis e com capacidade de emparelhar, isto não chega, tem de haver depois a ligação (no slide
só estão representadas extremidades coesivas mas a T4 DNA ligase também actua com extremidades blunt).

8. Dephosphorylation

A desfosforilação tem a ver com a remoção de um grupo fosfato da extremidade 5’P.

Ex: vocês tem um fragmento de DNA que foi


digerido e tem 2 extremidades 5’ fosfato, se vocês
usarem qualquer um destas enzimas (CIP – Calf
Intestinal Phosphatase e BAP – Bacterial Alkaline
phosphatase) que são as principais fosfatases
(enzimas que fazem a desfosforilação) que
existem. O que acontece é que a extremidade 5’P
deixa de estar fosfatada (dos dois lados do
fragmento). E portanto se eu for ligar o fragmento

14
Engenharia Genética 2011
num local, não vai ser possível estabelecer-se a ligação fosfodiester numa das cadeias (fica o tal Nick).

Quando é que é importante a desfosforilação? Quando vocês estão a fazer clonagem de DNA digerem uma
molécula com BamHI e tenho vários fragmentos, e tenho um vector com extremidades compatíveis. O que é
desejável é que vocês tenham moléculas de DNA recombinantes em que tem um vector com um fragmento e
outros vectores com fragmentos diferentes (não é possível garantir que isto acontece – pode-se jogar com as
proporções do vector e do fragmento mas não é possível garantir que isto acontece [pode-se ter uma
molécula vector em que entra o fragmento 1 e o 17, porque é tudo compatível]) – Isto é o básico que se
espera que aconteça.

Por outro lado, quando digerem por exemplo nas duas extremidades com BamHI pode acontecer a auto-
ligação. Neste caso eu posso favorecer a formação de moléculas de DNA recombinante – Em primeiro lugar
impedindo a auto-ligação. E como posso impedir a auto-ligação? Desfosforilando (se eu remover o grupo
fosfato o vector já não auto-liga, mas continua a poder ligar-se com os fragmentos de DNA.

Ou seja, eu desfosforilei o vector (já não auto-liga) e quando eu coloco o fragmento de DNA ele estabelece
ligação 5’P mas só num local, mas podemos transformar a bactéria e dentro da bactéria estabelece-se a
ligação fosfodiester. Favoreceram no fundo o número de moléculas recombinantes impedindo a auto-ligação
e têm a garantia que a bactéria estabelece essa ligação dentro da bactéria, por sistema normal de reparação
de sistema da bactéria (não era possível fazer ligação fora da bactéria mesmo com DNA ligase, porque não
está lá o grupo fosfato)

Estratégia para construir um novo local de clonagem: linkers, adaptadores, etc.

Como é que perdem locais de clonagem: digerindo e clonando, mutagénese.

15
Engenharia Genética 2011

Aula 4 – 17 de Fevereiro de 2011


Sistemas de selecção vector - hospedeiro: como se selecciona o vector e como se selecciona o
hospedeiro? A clonagem molecular geral é normalmente feita em E. Coli, sendo assim dada
relevância às melhores estirpes e melhor sistema de selecção vector - hospedeiro de E. coli. Além da
clonagem geral há também a clonagem de expressão e essa ocorre recorrendo-se a outros
organismos além de E.Coli.

Principais características de vectores de clonagem e diversos tipos de vectores: os vectores mais


utilizados são os plasmídeos, mas além destes existem outros, uma vez que os plasmídeos não são
suficientes para dar resposta a tudo o que é pretendido. Um vector de clonagem geral é uma
molécula que permite a propagação do segmento de DNA que é clonado num vector apropriado de
E.Coli. O que foi clonado, podendo ser um gene ou não, é um segmento de DNA que está num vector
que vai replicar e originar várias cópias dessa molécula clonada sendo assim amplificado. Na
clonagem geral apenas há amplificação, não ocorrendo expressão neste tipo e clonagem.

Características dos vectores:

• São moléculas de DNA em cadeia dupla, seja plasmídeo, fago, ou outro. Este vector tem de
ter marcadores de selecção, ou algo que nos permita seleccioná-lo/identificá-lo; seja qual for
o vector a, b ou c que é introduzido no hospedeiro, tem de haver algo no vector que nos
permita diferenciar e seleccionar as células que têm o vector das células que não o têm, e a
isto chama-se marcadores de selecção.
• Têm de ter uma origem de replicação que lhes permita replicar dentro do hospedeiro, pois se
o vector enquanto molécula de DNA entrar dentro do hospedeiro, mas se não replicar,
quando a célula se dividir, se ele não fez cópias de si próprio, há uma célula - filha que não o
vai ter. Esta origem de replicação é reconhecida no hospedeiro para que o vector se possa
replicar. Os vectores são construídos pelo homem e as enzimas responsáveis pela replicação
não foram clonadas, o que significa que os vectores não tem o gene para a DNA polimerase,
portanto o vector tem de ter os sinais responsáveis para a sua replicação: a DNA polimerase
do hospedeiro vai reconhecer a sua origem de replicação e assim o vector começa a replicar.
A origem de replicação é a sequência reconhecida pela DNA polimerase do hospedeiro para
que se comessem a fazer cópias do vector. Pode haver origens de replicação:
• Plasmídicas: os plasmídeos são isolados de bactérias e podemos por a sua origem
de replicação nos nossos vectores plasmídicos e assim sabemos que este vector
vai replicar nessa bactéria;
• Fágicas: podemos por uma origem de replicação num plasmídeo ou num vector
fágico e esta ser reconhecida ou não.
• Eucariotas.

O que se sabe sobre origem de replicação eucariota? O problema destas células eucariotas é que
ainda não se conseguiu identificar uma região que se poderia retirar, colocar num vector e ser
reconhecida numa célula de um mamífero. Não há uma sequência específica. Então como é possível
ter um vector dentro de uma célula eucariota (de um mamífero, por ex.) e este vector ser

16
Engenharia Genética 2011

reconhecido pelo sistema dessa célula eucariota? Como é que os vírus replicam dentro das células
dos animais? Estes vírus vão utilizar maquinaria de replicação dos hospedeiros – os virús têm uma
origem de replicação que é reconhecida pela maquinaria do hospedeiro; os cientistas foram buscar
a origem de replicação que é reconhecida pela maquinaria das células dos mamíferos aos vírus que
infectam mamíferos, e assim estes vectores têm uma origem de replicação que é reconhecida pela
maquinaria do hospedeiro.

É também uma característica dos vectores de clonagem terem locais únicos de restrição. Outras
características úteis é:

• Ter baixo peso molecular: é mais fácil introduzir uma molécula de baixo peso molecular. Para
clonar algo nessa molécula e ainda introduzi-la dentro da célula, quanto menor for o peso
molecular do vector, maior é a capacidade de clonagem (maior o fragmento que podemos
clonar)
• Podem ter mais do que um sistema de selecção (falaremos mais adiante)

Em E. coli há determinados vectores para determinadas células e, cada célula tem de ter
características especiais.

Marcadores de selecção

Os marcadores de selecção são marcas de resistência a antibióticos. Ampr é o gene de resistência à


ampicilina; Zeo é o gene de resistência a zeocina (ou seja, para distinguir as células que têm ou não o
vector, colocamos a crescer em meio com zeocina); bla confere resistência à ampicilina – lembrar
que quando está escrito ampicilina, não se refere ao antibiótico ampicilina mas sim ao gene de
resistência à ampicilina. Temos um vector com dois marcadores de selecção: a kanamicina e a
ampicilina (ver imagem acima) e depois tem-se o triptofano que não é um gene de resistência, mas

17
Engenharia Genética 2011

sim uma marca de selecção de um componente metabólico; para se poder seleccionar tem que
crescer em meio sem triptofano.

Origem de Replicação

Das origens de replicação plasmídicas as mais comuns são a pMB1 (origem de replicação retirada de
um plasmídio e usada em muitos vectores, nomeadamente em pUC19) e ColE1, sendo as mais
utilizadas nos plasmídeos de clonagem geral. ColE1 foi isolada de uma estirpe de E.Coli que sintetiza
uma toxina. pMB1 e ColE1 são muito semelhantes.

Não podemos ter uma célula com dois plasmídeos que tenham a mesma origem de replicação ou
origens que utilizem o mesmo sistema para replicar. Os plasmídeos têm um determinado número
de cópias; um plasmídeo pode ter 1 ou 300 cópias dentro de uma célula e esse número é uma
característica intrínseca de cada plasmídeo
e está relacionada com a sua origem de
replicação. Se um plasmídeo tem 100 ou
500 cópias é algo que é determinado por
sinais da sua origem de replicação. Se
tivermos dois plasmídeos que utilizam o
mesmo sistema para replicar, estes vão
competir um com o outro.

Temos um plasmídeo A e um plasmídeo B

18
Engenharia Genética 2011

com a mesma origem de replicação e essa origem diz que eles existem em 8 cópias na célula (4 de A
e 4 de B); temos os 2 plasmideos, clonamos e entram para dentro da célula, tendo ambos a mesma
origem de replicação: a célula vai dividir e os plasmídeos vão aleatoriamente para cada célula-filha
(neste caso, vão 5 para uma e 3 para outra). Eles vão proliferar até atingir 8 cópias e param; no lado
em que há maior numero de copias de um dos plasmideos relativamente ao outro, este já vai ficar
em vantagem, pois quando começa a formar cópias já vai ficar em maior numero que do outro. Estas
células – filhas voltam a dividir e separar, até que um dos plasmideos (o plasmídeo A, neste caso) se
vai perder e deixar de estar presente (lado direito da imagem). Este processo é chamado cura
plasmidica, acabando um dos plasmídeos por desaparecer.

Quando clonamos temos um tubo com as moléculas em que fazemos a ligação e a essas vamos
adicionar mais células. Normalmente por célula, só entra uma molécula de DNA plasmidico (como o
número de células é muito superior ao número de moléculas que construímos, raramente entram
duas moléculas numa célula). Mas, se entrarem duas moléculas de DNA plasmidico, aquilo que
vamos obter é uma colónia que é uma mistura de divisões, e se formos extrair os plasmídios temos
uma mistura de coisas que não entendemos, porque há células que têm 1 e outras que têm 2. No
entanto isto é pouco provável de acontecer.

No entanto, é possível trabalhar com plasmídeos que têm a mesma origem de replicação. No caso de
um plasmídeo que tem o gene de resistência à ampicilina, vamos adicionar um gene de resistência a
outro antibiótico, e pomos o plasmídeo a crescer num meio com ambos os antibióticos. Sabemos que
as células que crescerem têm de ter forçosamente os dois plasmídeos, caso contrário não
cresceriam. Mantendo a pressão selectiva isto acontece. O que temos na realidade, é que enquanto
tivermos colónias, temos 2 plasmídeos. Por vezes há vantagens de ter dois plasmídeos, por exemplo,
no caso da clonagem de expressão quando queremos obter dois tipos de expressão.

F1 origin é uma origem de replicação fágica

SV40 é uma origem de replicação eucariota – SV40 é o vírus do macaco Rhesus, logo é uma origem
de replicação viral: permite que o plasmídeo replique em células eucariotas.

Embora ColE1 e pMB1 sejam as principais origens de replicação, elas estão em muitos vectores mas
já foram mutadas, e portanto podemos ter um PBR322 que tem a origem ColE1 e tem um nº de
cópias entre 15 – 20, pode-se ter um pUC que tem também esta origem mas está mutada e em vez
de ter 15 a 20 cópias tem 300 cópias.

Polylinker ou MCS (multiplecloningsite)

Permitem ter no plasmídeo um local específico bem localizado com locais únicos de restrição e que
foram sintetizados quimicamente, num sintetizador de oligonucleótidos; é uma curta sequencia que
nos permite tirar ou clonar um segmento de DNA e tirar partido de todas as potencialidades do
vector, ficando este integro.

Clonagem de plasmídeos

A clonagem de plasmídeos envolve ter o plasmídeo que foi clivado, ter o DNA que é introduzido
numa célula bacteriana e obter clones diferentes. A selecção é feita em função do marcador,

19
Engenharia Genética 2011

obtendo-se moléculas diferentes e isolamos cada uma delas para obter as moléculas de DNA
individual. Quando se faz uma clonagem de DNA plasmídico o que se obtém são colónias.

Vectores que tomam partido do fago λ

Este fago tem uma molécula de DNA em cadeia dupla,


que pode ser circular ou linear. É específico de
bactérias E. coli, penetrando nas suas células através
do reconhecimento de receptores específicos que
existem na superfície celular desta bacteria. O ciclo de
vida deste fago pode seguir duas vias: ciclo lítico ou
ciclo lisogénico.

No ciclo lisogénico entra como molécula de DNA linear,


mas este fago tem extremidades cos (com 12 pb
projectadas) e assim que entra vai circularizar (para
não ser degradada, para se defender da acção das
exonucleases) e pode integrar ou seguir o ciclo
lisogénico. Essa circularização dá-se graças à ligase do hospedeiro que sela a cos com o
emparelhamento dessas regiões e a ligase permite assim a formação de um círculo covalentemente
fechado. Porque se dá esta circularização? Porque a molécula linear pode ser degradada e assim é
uma forma de o fago se proteger da acção das exonucleases. Quando o fago entra para dentro da
célula, o DNA replica e forma os chamados concatameros que são moléculas multiméricas que vão
estar ligadas umas às outras covalentemente através das extremidades cos. Entretanto já está a
ocorrer a expressão dos genes que codificam para a cápside, estas formam-se, e há um
reconhecimento através de 2 proteínas da cápside que reconhecem as extremidades cos e
encapsidam, permitindo a encapsidação do DNA. Entretanto a cauda também já foi sintetizada e
assim, o fago está pronto para lisar a célula. Então vamos mistura-lo com células e espalhar essa
mistura numa caixa de Petri com meio selectivo. Desta forma, vamos obter uma camada de
crescimento celular: temos placas de lise, o fago infecta a célula e multiplica-se, ocorre lise e vai
infectar células vizinhas. Temos assim um tapete de células e nas zonas mais transparentes, nas
placas fágicas, temos os fagos.

Temos o genoma do fago λ completamente sequenciado, que são aproximadamente 48kb e sabe-se
tudo acerca da regulação da expressão dos genes do fago λ, então como tirar partido deste como
vector de clonagem? Temos os genes envolvidos na formação da capside, genes do ciclo lítico e no
meio genes do ciclo lisogénico (ou seja, todas as proteínas envolvidas na integração do fago) (na
imagem). Podemos usar o fago para se clonar algo removendo o que ali temos (os genes do ciclo
lisogénico), porque isto não nos interessa já que apenas queremos que o fago entre, replique e saia,
formando placa fágica com DNA recombinante. O que vai acontecer é que se tira partido deste fago
removendo a parte média que não interessa e inserindo nesse local o DNA recombinante. O fago λ
tem capacidade de clonagem na ordem dos 25kb (porque o fragmento removido tem esse tamanho)

20
Engenharia Genética 2011

Um plasmídeo para ser totalmente introduzido na célula não deve ultrapassar os 10kb. Normalmente
um vector tem entre 3 a 8kb. A capacidade de clonagem num DNA plasmidico oscila até completar os
10kb, portanto quanto maior o DNA plasmidico, mais difícil é colocá-lo dentro da célula, uma vez que
a sua introdução na maioria das vezes é forçada. E. coli não é normalmente competente, não estando
naturalmente apta a receber o DNA plasmídico. Com o DNA de λ a capacidade de clonagem é maior,
podendo-se tirar partido de um processo biológico, já que o fago λ infecta naturalmente E. coli. E
eficiência de introdução do fago λ em E. coli é muito superior à eficiência de introdução do DNA
plasmídico em E. coli. Para ter um grande numero de recombinates é vantajoso utilizar λ, por
infecção natural.

Mas nem sempre queremos clonar 25kb, e por isso é que se tem sistemas vector-hospedeiro. Ou
seja, a escolha de se usar plasmídeo, ou fago λ, ou outro vector que ainda não falámos, depende do
fragmento que se tem e do objectivo em causa.

Se tenho um fragmento de DNA num vector e quero cloná-lo noutro, vou escolher λ? Depende do
tamanho. λ tem aplicações precisas: não só a capacidade, mas também quando queremos ter o
maior número de recombinantes possível; quando temos um DNA complexo e este está digerido e
queremos apanhar o maior número de segmentos possível, uma vez que tem capacidade de
infecção tão boa que eu quero ter muitos fragmentos misturados com λ para ter o maior nº de
moléculas de DNA recombinante que depois infecta E.Coli. E assim, tenho o maior número de
partículas fágicas diferentes que me representam este genoma. Ou seja, tira-se partido da
capacidade de clonagem de 25kb (vai apanhar muito fragmentos grandes), e estou a tirar partido da
eficiência de infecção.

A cápside que se forma em λ tem uma capacidade limite: o que fica clonado não pode ser nem
muito maior que 25kb porque não cabe dentro, nem muito menor que 25kb, para poder ser
reconhecido. A cápside de λ consegue albergar entre 38 e 52kb. Aquilo que conseguimos clonar tem
limite determinado pela capacidade da cápside e pelo tamanho do vector. Porque não há só um
vector λ, há vários:

21
Engenharia Genética 2011

Isto já são λ manipulados para formar um vector, e podemos ver que temos os chamados vectores de
inserção, em que temos um local EcoRI e é aí que vamos clonar.

E estes são vectores de substituição, ou seja, estão aqui os locais de clonagem – quando digerimos
com BamHI de ambos os lados, sai todo aquele fragmento, e como sai a capacidade de clonagem dos
vectores de substituição é maior (ao tirarmos para clonar outra coisas no local deixado livro, temos
mais capacidade do que se tivermos um vector em que só inserimos qualquer coisa).

Vantagens de λ: Maior capacidade de clonagem relativamente a plasmídeos, maior eficiência de


infecção do que o processo de inserção do DNA plasmídico em E. coli e maior numero de
recombinantes.

Desvantagens de λ: limite de dimensão dos fragmentos que são clonados.

Imaginemos que digerimos, temos muitos fragmentos que vão ser clonados em λ – acham que todos
estes fragmentos vão ficar clonados em λ? Não, só os que têm aquela determinada dimensão. Todos
os clones recombinantes que vamos obter através da clonagem de λ vão ter fragmentos que oscilam
entre determinados limites.

Clonagem in vitro: digeridos os fragmentos de DNA e feita a clonagem, como é que se infecta E. coli?
Temos DNA porque acabámos de clonar, e para infectar E. coli é necessário o fago ter a cápside,
porque esta vai ter afinidade para os receptores de E.Coli. É necessário então construir o fago para a
infecção de E. coli, e esta construção faz-se in vitro depois de fazer a clonagem. Ou seja, ainda
precisamos de fazer a encapsidação. Todo o DNA recombinante tem de ser encapsidado

22
Engenharia Genética 2011

Como se faz a encapsidação? Temos uma estirpe de E. coli que foi infectada por λ que é lisogénico
(integra-se) mas tem mutação para a proteína E, que é uma proteína fundamental da cápside (vai
produzir todas as proteínas da cápside excepto a E). Temos outra estirpe de E. coli que foi infectada
com λ e produz todas as proteínas da cápside excepto a proteína D (proteína secundária), mas sem E
e D em conjunto, não há formação da cápside e como tal não há lise. Colocamos ambas as estirpes
a crescer individualmente e recuperam-se todos os produtos por lise, excepto E (num dos casos) e D
(no outro caso). Juntamos um (produtos da estirpe mutada para E) com o outro (produtos da estirpe
mutada para D) e juntamos DNA recombinante e assim formam-se as cápsides e fazemos a
encapsidação in vitro (vai ocorrer que a proteina E está presente na estirpe mutante para D e a
proteina D está presente na estirpe mutante para E, e assim temos D e E), com junção dos extractos
proteicos também. Mutações no genoma do fago impedem a lise.

23
Engenharia Genética 2011

Aula 5 – 22 de Fevereiro de 2011

Nós estamos a falar de clonagem geral, é este o capitulo, é disto que se fala e, por oposição há clonagem
geral, a seguir vamos falar de clonagem de expressão, que como é evidente como é clonagem tem muito a ver
com a clonagem geral.

Dentro da clonagem geral, estamos a falar dos diferentes vectores que vocês podem utilizar, e eu comecei a
falar dos vectores, mas se vocês nem sequer percebem para quê que estes vectores servem se calhar é um
bocado cru eu falar-vos deles sem vocês perceberem para que é que eles servem. Bem vamos começar pelas
aplicações e talvez assim vocês percebam para que servem os vectores.

Primeira coisa, imaginem que vocês têm um trabalho em mãos: a primeira coisa para saber qual é o vector
utilizado e qual o respectivo sistema vector-hospedeiro (que o hospedeiro tem muito que ver com o vector). A
primeira coisa a saber é o que é que temos em mãos, qual é o objectivo, o que é que queremos fazer?

Portanto vamos considerar agora estas 4 situações diferentes: imaginem que vocês têm que clonar um
fragmento de DNA que por exemplo foi amplificado por PCR, não acham que é completamente diferente
clonar um fragmento de DNA a clonar todos ou muitos fragmentos de DNA originados por digestão enzimatica
do genoma de E.coli. Imaginem que vocês digeriam o genome de E. coli e obtinham uma panóplia de
fragmentos de diferentes dimensões com diferentes informações. É completamente diferente o objectivo de
clonar tanto quanto possível todos esses fragmentos de clonar este único fragmento. Mais, quando vocês
pretendem clonar estes fragmentos é porque pretendem muito provavelmente fazer aquilo que se chama
uma biblioteca genómica. Portanto o que queremos é ter a representação daquele genoma em diferentes
clones e queremos que tanto quanto possível todo o genoma, toda aquela sequência esteja representada, e
por isso é que vocês têm bibliotecas genómicas e como o próprio nome indica é uma biblioteca, portanto deve
ter toda a informação. Mas continua a ser diferente se vocês quiserem fazer o que aqui está ou um genoma
que em vez de ter 4x10^6 pares de bases tem 1x10^8 pares de bases e estamos a falar de drosophila. Ou seja,
para terem a representação deste genoma tinham que ter muito mais clones, ou se calhar cada um dos vossos
clones (cada molécula de DNA recombinante construída) tinha que ter uma capacidade maior de conter DNA.

Portanto para colmatar esta diferença, das duas uma: imaginem que aqui são 2 milhões de clones que tenho
que fazer para poder ter todo este genoma representado. E em cada clone tenho aproximadamente 20 Kb de
DNA. Das duas uma, para ter isto tudo representado em 2 milhões de clones se calhar tenho que ter
fragmentos de DNA em cada clone muito maiores, ou então aumento o nº de clones. E é ai que também entra
a escolha do vosso vector, se calhar para ter um número de clones não muito exagerado (imaginem que em
vez de ter 200 milhões de clones se calhar eu vou querer um vector onde possa clonar um fragmento de DNA
não de 20 Kb mas se calhar de 40Kb ou de 50Kb ou de 300Kb) escolhemos um vector apropriado. E portanto a
escolha do vector também é importante – se o meu genoma é maior então vou ter que ter um vector que
tenha uma capacidade de clonagem maior.

E isto é partindo do princípio que nós só estamos a falar de clonagem geral: só queremos ter, por exemplo
nestes casos aqui, a representação do genoma. Mas se nós estivermos a falar de clonagem de expressão, que
é o que vamos falar no próximo capitulo, se calhar os vossos vectores que serviram para isto e que para
servirem para isto têm que ter o que nós já falámos (seja plasmidio, seja fago…): têm que ter uma origem de
replicação, um local de clonagem único, marcas de selecção. Quando nós estamos a falar de clonagem de
expressão, os nosso vectores têm que ter, para além disto, sinais responsáveis pela expressão das regiões
que vocês clonaram. Nos vectores de clonagem geral não se espera que haja expressão (pode haver ou não,
se o que clonámos tiver todos os sinais responsáveis pelo início da transcrição e tradução, e se provocarmos
isso de alguma forma).

24
Engenharia Genética 2011
Nas marcas de selecção, em que nós falámos de genes de resistência a antibióticos, que nos permitem no
fundo detectar as moléculas do hospedeiro que contem o vector, muitas vezes as marcas de selecção
permitem não só seleccionar os hospedeiros que têm o vector como os hospedeiros que contêm o vector
recombinante. Vocês podem ter no fundo hospedeiros onde foi introduzido o vector que não é o
recombinante. E portanto ainda podemos ter marcas que permitem seleccionar vectores recombinantes.

Na última aula tínhamos acabado de falar no lambda e eu tinha-vos dito que havia por exemplo 2 tipos de
vectores lambda: o de inserção e o de substituição, e como a própria palavra indica, aquele que é de inserção
há-de ter uma capacidade de clonagem menor porque vocês vão inserir, e como eu vos disse há um limite na
capacidade de encapsidação; e os vectores de substituição em que há uma coisa que sai e outra que entra,
têm uma capacidade de clonagem maior. Para todos os efeitos, lambda tem uma capacidade de clonagem
superior à dos plasmidios, porque os plasmidios normalmente acima de 10Kb já apresentam uma grande
instabilidade. Se vocês quisessem fazer a dita biblioteca genómica de E. coli não iam usar um plasmidio,
portanto iam usar um vector como por exemplo o lambda que tem uma capacidade de clonagem muito
superior ao plasmidio. E aqui (slide 49) está um exemplo da capacidade de clonagem de lambda, e aqui até foi
com o genoma humano e vocês não se esqueçam nunca se durante uns tempos se falava de plasmidios e fago
lambda,etc. A evolução destas ferramentas está sempre a acontecer, e no fim vocês vão ver que existem
outros vectores para alem do lambda que também são muito utilizadas na construção de genomas complexos
chamados de genomas de grandes dimensões.

Aqui (slide 49) vocês têm um processo de clonagem normal: têm DNA genómico que é digerido (lá para o fim
do capitulo falamos melhor), com algumas particularidades, aqui têm o fago lambda, que tem as tais
extremidades Cos, do qual foi removido um fragmento cortado com BamHI. Estão ali também os diferentes
fragmentos do genoma que vão ser cortados e clonados, vai ocorrer empasidação dentro dos limites da
capacidade de encapsidação do fago lambda, e portanto o hospedeiro é depois infectado.

25
Engenharia Genética 2011
Lambda tinha uma capacidade de clonagem que rondava os 20 Kb, e entretanto inventou-se outro vector que
é o cosmídio. O cosmídio no fundo é um plasmidio (que como vos disse tem uma capacidade de clonagem
baixa) mas que é extremamente estável enquanto molécula, mas é um plasmidio que tem as extremidades
cos. Vocês têm aqui representado um plasmídio com extrimidades cos, e este plasmidio chama-se cosmidio.
Ele no fundo acaba por jogar com o bom dos 2: Maior capacidade de clonagem (entre os 30 e 42Kb), portanto
superior a lambda.

O plasmídio é digerido, os fragmentos são clonados, e ocorre


encapsidação in vitro. Portanto, ocorre empacotamento in
vitro, ocorre a infecção da bactéria, e dentro da bactéria a
molécula de DNA recombinante não vai replicar como um
fago, mas replica como um plasmídio. O que acontece é que
vão ter colónias bacterianas, lisam as bactérias, e vão obter
os clones manipulando DNA plasmidico que é muito mais
fácil de manipular que fagos. Portanto com um cosmidio
vocês têm a sorte de poder manipular DNA plasmidico que é
mais facil, cortar com enzimas, purificar, etc. Mas ganham
não só em capacidade de clonagem mas também no
processo de introdução da molécula de DNA recombinante
que é por infecção e é muito mais eficiente do que os
processos que nós temos de introdução de plasmídio
livre/Nu (dna naked) dentro da célula. Ganha-se em
eficiência de infecção, vamos ter um maior número de células
que foram infectadas eficientemente.

E aqui (ao lado) têm mais uma vez o processo de clonagem de


DNA plasmidico: tem vários fragmentos de DNA, o cosmidio é
digerido, ocorre a ligação do cosmidio com as diferentes
cadeias de DNA, ocorre encapsidação in vitro e depois infecta-
se a estirpe, e quando se infecta dizemos que se faz
transdução. Depois faz-se a selecção para o antibiótico.

26
Engenharia Genética 2011
Agora vamos falar de fasmídeos. Para vos falar deles, vou-vos falar então do fago M13, que é outro fago de E.
coli, que tem características completamente diferentes de lambda, é um fago filamentoso e que quase todo o
seu genoma está implicado no seu ciclo. E tem uma região que é uma região intergénica (entre genes) e
portanto vai ser utilizada para usar este fago como vector. Tudo o resto está ocupado por genes e portanto
não se podia interromper de forma nenhuma se não vocês ao interromperem qualquer coisa na sequência
que aqui está estavam a impedir que aquele fago se comporta-se como fago, porque estavam a aniquilar a
possibilidade de expressão de genes importantes no seu ciclo de vida.

Este fago M13 quando é introduzido em E. coli, ele pode ser introduzido por transformação porque ele tem a
possibilidade de existir em dupla cadeia (a professora não diz mas obviamente tambem pode por transfecção),
e quando ele entra dentro de E. coli pode replicar segundo o modelo teta e vai fazer mais copias de si próprio
em dupla cadeia, no entanto um dos seus genes que é o produto do gene II, quando é sintetizado cliva a
cadeia chamada “cadeia +” e este fago começa a replicar-se segundo o modelo de círculo rolante e vai formar
as mesmas moléculas do fago só que em cadeia simples. E o que acontece é que a molécula que é sintetizada
em cadeia simples é a cadeia de fora que é a cadeia +.

27
Engenharia Genética 2011
Portanto é um fago que pode existir quer na forma de DNA em cadeia dupla quer na forma de molécula de
DNA em cadeia simples.

Em engenharia genética qual é a forma que vocês acham que podem utilizar na Tecnologia de DNA
recombinante? A cadeia dupla. Não se esqueçam, o substrato das enzimas de restrição é DNA em cadeia
dupla, logo não podemos usar em cadeia simples. Evidente que também existe enzimas que cortam DNA em
cadeia simples só que aquelas que nós usamos no laboratório e que é a grande maioria, cortam só em cadeia
dupla. Este fago tem a grande particularidade de poder ser utilizado em cadeia dupla ou cadeia simples
(também vai ser muito útil e vão perceber porque).

Dentro do ciclo de vida do fago em que ele infecta pode entrar também como molécula de DNA em cadeia
dupla e então dizemos que a bactéria foi transformada, porque vocês têm a cadeia de DNA dupla livre, como
se fosse um plasmídio, entra dentro de e.coli. Dentro de E. coli transforma, forma moléculas de DNA em
cadeia dupla, e neste processo de formação de moléculas de DNA em cadeia dupla, quando é expresso o gene
II, cliva a cadeia dupla e começa-se a sintetizar moléculas de cadeia simples e são libertadas para o
sobrenadante. Portanto o fago selvagem existe sempre em molécula de cadeia dupla e molécula de cadeia
simples. O que é formidável é que enquanto molécula de DNA em cadeia dupla está dentro da célula, replica
dentro da célula, (reparem que as cadeias duplas não saiem para fora da célula) e depois quando começa a
sintetizar moléculas de DNA a mais em cadeia simples estas moléculas vão ser no fundo cobertas com 1 dos
produtos que ele também sintetiza que é uma proteína (GP5) que se liga ao DNA em cadeia simples,
aproxima-se da membrana de E. coli e os fagos são libertados para o exterior. E portanto dentro de uma
cultura vão ter dentro das células moléculas de DNA em cadeia dupla e no sobrenadante moléculas do mesmo
fago mas em cadeia simples.

Este é o fago, e do fago ao vector foi aproveitada esta região intergénica e foi clonado por exemplo um
polylinker e também uma série de genes que nos permitem seleccionar os recombinantes.

O fago pode funcionar em cadeia dupla ou cadeia simples, foi transformado em vector e para ser
transformado em vector foi utilizada esta região em que se introduziu uma série de características (já agora
tudo isto tem a ver com o operão Lac) que nos vão permitir diferenciar recombinantes de não recombinantes.

E portanto vocês têm aqui já o vector M13 com a tal parte do operão lac e o tal MCS
e portanto vocês podem clonar aqui um fragmento de DNA que é introduzido no
hospedeiro por transformação (estamos a falar da forma replicativa ou da forma em
cadeia dupla do fago). Ele produz partículas fágicas e portanto das duas uma: vocês
transformam, põem as células a crescer mantêm uma pressão selectiva e depois ou
eu quero trabalhar com o DNA em cadeia dupla (para voltar a cortar, tirar
fragmentos de DNA para clonar) e nessa altura centrifuga-se, recupera-se, lisa-se as
células e purifica-se o DNA e então tenho DNA em cadeia dupla; ou eu quero
trabalhar com o DNA em cadeia simples e vou centrifugar e recuperar o
sobrenadante onde estão as moléculas de DNA em cadeia simples ainda
encapsidadas, essas moléculas virais são precipitadas, quebram-se as capsides e cá
tenho eu a molécula de DNA em cadeia simples. Esta molécula de DNA em cadeia
simples depois vai ser utilizada para transfectar outras células de E.coli.

Agora vamos ver o seguinte: Fazem uma construção em que vão clonar algo na zona MCS, então tem a vossa
molécula de DNA recombinante. Introduzem dentro de E.coli e têm a vossa molécula de M13 recombinante.
Vão plaquear e vão ter colónias pois vai funcionar como um plasmidio. No entanto se sabemos que estão a
sair moléculas de DNA em cadeia simples, estas moléculas também podem infectar outras colónias de E.coli,

28
Engenharia Genética 2011
portanto o que acontece quando trabalham com o fago M13 é que vocês vão ter um mar de bactérias, e vão
ver é, no fundo, como se fossem placas fágicas, só que não são placas fágicas porque este fago quando sai
da bactérias não lisa a bactéria o que acontece é que ele sai e infecta a bactéria circundante, e como neste
processo de replicação, sair da bactéria, infectar a bactéria circundante, o que acontece é que há um atraso
no crescimento das bactérias no local. Não têm uma verdadeira placa de lise, mas se repicarem daqui vocês
no fundo vão ter muitas moléculas de DNA em cadeia simples.

E por esta razão o hospedeiro de M13 tem que ser F+ ou seja tem que ter o plasmidio F, ou seja, tem que ter
capacidade de formar pilus. Porque se vocês usarem um hospedeiro de E. coli que não tem a capacidade de
formar pilus, não tem a possibilidade que o fago infecte E.coli porque infecta através do pilus. E daqui já
podem ver que quando falo daquela relação vector-hospedeiro, isto é uma das coisas que se tem que ter em
atenção, porque quando estou a trabalhar com estes fagos ditos filamentosos como o M13, a minha bactéria
tem que ser F+ ou F’. (Duvida: os fagos são encapsidados do lado de fora? Resposta: Não, são encapsidados
DENTRO da célula e depois saiem sem lisar a célula). (Historia sobre o porque de se usar isto). (Duvida sobre as
placas que não são de lise).

Além de o fago M13 ser utilizado desta forma criaram-se uns vectores que são os fasmídios. No fundo são
plasmídios nos quais se introduziu uma origem de replicação fágica. Praticamente já não se trabalha com os
ditos fagos filamentosos, mas com fasmídios. Porque vocês vêem que aqui sim têm marca de resistência a
antibiótico, têm uma origem de replicação plasmídica, têm aquela região o que vos falei que é o polylinker
com parte do operão lac e ainda têm a origem de replicação fágica.

29
Engenharia Genética 2011

E portanto vocês podem trabalhar com um fasmídio como se ele fosse ou um plasmídio ou um fago. Neste
caso reparem que quando está indicado f1 (que é outro fago filamentoso) +ori, sabem que quando
trabalharem com estes fasmídio e que tem esta origem de replicação fágica, quando sair a cadeia + sai a
cadeia + que está aqui indicada. Mas vocês podem ter um fasmídio que tem F1- e nessa altura vocês sabem
que sai a cadeia complementar ao que aqui está indicado. Se vocês têm um gene LacZ e tem aqui um ATG e o
sentido da transcrição é “aquele” quando for F1- sai a cadeia complementar por isso sai com o sentido da
transcrição ao contrário.

O fasmídio que está aqui representado, é no fundo um plasmídio que só tem a origem de replicação fágica e
portanto para que possam ser libertadas moléculas de DNA em cadeia simples, é necessário que a célula, além
de ser transformada com o DNA plasmidico, também seja transformada com o chamado Helperphage ou seja
um fago que é M13 ou F1 helper que forneça todas as proteínas necessárias à formação de cápsides, para que
possa haver encapsidação do DNA em cadeia simples.

Transform

Se vocês não infectarem com o fago auxiliar estão a trabalhar com um plasmídio, tem sempre só DNA em
cadeia dupla.
30
Engenharia Genética 2011
Este fago no fundo fornece todas as proteínas necessárias à encapsidação e também, contém o gene II cujo
produto vai clivar esta molécula na cadeia + e vos vai permitir sintetizar DNA em cadeia simples. Se não existir
o produto do gene II, nunca vai ser sintetizado DNA em cadeia simples e nunca se vai iniciar a replicação
segundo o modelo de círculo rolante.

Aqui têm a diferente capacidade de clonagem dos vectores que vos falei (slide 57). Os plasmidios na ordem
dos 10 Kb, os fagos λ entre 5-25 Kb, os cosmidios 30-45. E agora têm aqui os PAC e os BAC’s . São novos
vectores de clonagem, o PAC baseado no fago P1 de E. coli e o BAC baseado no plasmidio F. No fundo são
vectores que têm uma capacidade de clonagem muito elevada, PAC entre 100 a 300 Kb e BAC entre 150 a 350
kb. Portanto eles já não funcionam como os outros mas funcionam como cromossomas, porque se verificou
que se tiverem origens de P1 ou origens do plasmidio F funcionavam como cromossomas extremamente
estáveis. Portanto são muito utilizados para fazer as bibliotecas de genomas complexos.

Uma cábulazinha para quando estiverem a estudar:

É preciso ter noção dos plasmidios Shuttle. Shuttle vão ser aqueles plasmídios que podem replicar em 2
hospedeiros diferentes, sejam eles quais forem. Até agora o que temos estado a falar é sempre de vectores
que replicam em E. coli. Quando vocês olham para um vector, comecem já a tentar perceber o que são as
marcas, porque vocês têm que perceber o significado destas marcas. Portanto ColE1 já sabem que é a origem
de replicação plasmídica dentro de E.coli, mas se estou a dizer que o vector é shuttle, estou a dizer que pode
replicar dentro de outro hospedeiro que não E. coli. Qual a origem de replicação? SV40, que é uma origem de
replicação de um vírus que infecta células de eucariotas, nomeadamente mamíferos. E portanto nesse caso,
quando este plasmidio está dentro de células de mamífero, ele vai replicar não porque haja algo nos
mamíferos que reconheçam esta origem de replicação (portanto não é esta que vai ser utilizada para
desencadear a replicação de DNA plasmídico), mas é aquela que é utilizada, vai ser lida/ententida pelos
mecanismos da célula onde o plasmídio está. Vocês têm shuttle entre vários organismos (E.coli-levedura,
E.coli-Homem, etc), normalmente E. coli e qualquer coisa.

31
Engenharia Genética 2011
E Portanto reparem nesta região, está indicado tudo o que está relativamente a este plasmídio shuttle.
Reparem que CMV está indicado que é uma região promotora do citomegalovirus de eucariotas. Quer dizer
que quando este vector está em células de mamífero, para que ocorra transcrição de tudo isto que aqui está
que é importante para a selecção dos meus recombinantes, acontece porque naquela célula de mamífero os
mecanismos responsáveis pela transcrição vão reconhecer, não o promotor Lac que não lhes diz nada, mas
vão reconhecer é um promotor eucariota. E portanto estão os 2 um ao lado do outro: o que isto quer dizer é
que em células de mamíferos é este que é reconhecido e vai haver transcrição a partir daquele promotor; em
células de E. coli é este o outro promotor que é reconhecido e vai haver transcrição das mesmas coisas mas a
partir do promotor Lac.

Estão a ver aqui o promotor Lac? Está aqui ATG lacZ, codão de iniciação do lacZ, e depois vêem MCS, e depois
continua lacZ. Ou seja, se vocês não introduzirem aqui nada no MCS, vão ter transcrição e tradução do que
aqui está (lacZ). Se introduzirem um inserto vai interromper aquela leitura, vai haver transcrição na mesma,
mas quando começar a tradução aqui do ATG, e às tantas começa a traduzir aquilo que lá meteram. E depois
continua e é preciso que entre na mesma grelha de leitura do lacZ ou vão ter aqui uma coisa que não tem
nada a ver com lacZ.

Como a tradução é feita codão a codão se por acaso o inserto que aqui pus está exactamente entre eles, se
calhar até vou ter um bocado de B-galactosidase, mas se calhar não vou ter.

Sem se aperceberem já sabem muita coisa (enquanto olha para slide 61), vou dar um exemplo.

Para já, há aqui alguma estirpe que vocês pudessem utilizar para usar um fasmídio (transformar) para poder
produzir DNA em cadeia simples? Portanto tem de ser F+ ou F’ portanto só a JM109 e a XL1-Blue MRF, podiam
ser utilizadas para produzir DNA em cadeia simples através de um fasmídio.

Quando isto vos aparece, vocês vão ter que ter a capacidade de decidir qual é a estirpe que vão utilizar. Têm
que imaginar que aquelas estirpes de E. coli são selvagens para tudo, excepto para o que está aqui indicado.
Este F’ que está entre parênteses recto quer dizer que contém tudo o que aqui está.

32
Engenharia Genética 2011
Se vocês amplificarem DNA por PCR, podem usar uma estirpe de E.coli que tenha os seus sistemas de restrição
activos? Não, logo já sabem vou ter que utilizar uma estirpe que seja pelo menos hsdR - (R de restrição).
Porque quando vocês amplificam por PCR o produto que é amplificado não vai estar metilado, portanto não
tem qualquer tipo de protecção há restrição, e portanto vocês vão clonar um vector, vão introduzir em E. coli,
mas querem que aquela estirpe de E.coli não tenha os seus sistemas de restrição activos, senão corta tudo, e
por isso tem de ter uma mutação num dos principais sistemas de restrição.

Acham que tinham vantagens em que essa estirpe fosse m+ (metilação) ou - ? Mais, o ideal é ter uma estirpe
hsdR (r-, m+), porque eu sei que esse DNA então vai ficar metilado e depois posso usar essa molécula de DNA
noutra estirpe qualquer.

33
Engenharia Genética 2011

34
Engenharia Genética 2011
Aula 6 – 24 de Fevereiro de 2011

Então, nós na última aula ficámos mais ou menos a falar dos genótipos das estirpes de E. coli que podem ser
utilizadas nos diversos sistemas de vector-hospedeiro. E eu disse-vos logo, isto é um panorama, não se
preocupem muito porque isto, para já, parece completamente hieróglifos, mas aos poucos vocês vão
entendendo o que cada uma destas designações quer dizer. Eu não estou muito preocupada com este assunto
porque eu sei que vocês vão entendendo, e nós vamos falando nas práticas; portanto, a única coisa que é
importante vocês reterem é que, de facto, o que aqui está:

são as mutações, porque tudo o resto, tudo o que aqui não está, significa que aquela estirpe é selvagem, para
as outras marcas. Mas eu também não ia falar disto agora, porque, no fundo, é para vocês poderem consultar,
quando estiverem a estudar, o que é que quer dizer cada uma destas designações, em que muitas delas vocês
já conhecem [alguma coisa]; aqui:

por exemplo, tem tudo a ver com sistemas de modificação/restrição, que são fundamentais quando se está a
trabalhar em tecnologia de DNA recombinante, porque vocês arriscam-se a que tudo seja digerido: toda a
vossa molécula de DNA recombinante, porque foi preparada em determinadas condições, se for inserida na
estirpe errada, arrisca-se a ficar completamente degradada, e não é isso que vocês querem. Mas, vamos com
calma.

Ora bem, hoje o que eu queria falar era dos métodos de introdução de DNA recombinante dentro de células;
e, embora estejamos a falar de clonagem geral em E. coli, vou já falar globalmente de todos os métodos de
introdução de DNA em todo o tipo de células. Está aqui a transformação bacteriana:

35
Engenharia Genética 2011

que é a introdução de DNA livre, nu, digamos, em bactérias, e chama-se transformação. Os termos às vezes
não ajudam, porque a pessoa baralha-se, mas quando se introduz DNA nu, livre, em células eucarióticas, não
se chama transformação, apesar de ser o mesmo processo no sentido em que é DNA livre introduzido dentro
de células: quando é em células eucarióticas chama-se transfecção. Porquê? Porque a palavra
“transformação” já existia para falar de células eucarióticas, de linhas celulares, que estavam em
transformação devido a um processo cancerígeno; e, portanto, não se pode dizer transformação. O processo
de introdução é transfecção, do DNA livre dentro de células eucarióticas. Portanto, em bactérias, o que vocês
têm, de introdução de DNA, são, fundamentalmente: transformação de bactérias, que é a introdução de DNA
nu; ou, infecção fágica, em que o processo principal é a transdução. A conjugação também é um processo de
transferência de informação genética mas está muito reduzido ao plasmídio F, plasmídios que têm a
capacidade de formar o pilus, enquanto que, em infecção fágica, falamos numa série de vectores que foram
construídos, e que no fundo permitem a transferência de material genético para dentro de outras células.
Electroporação é um processo físico, e que se aplica, quer a bactérias, quer a todo o tipo de células:

Aliás, revolucionou completamente o problema de introduzir DNA livre dentro de células, porque havia muitas
células, sobretudo células vegetais, e muitas células animais para as quais não existiam protocolos adequados
para introduzir DNA dentro dessas células, e a electroporação resolveu esse processo. A Transfecção é aquilo
que eu vos falei, DNA livre dentro de células eucarióticas; microinjecção também é um processo físico, vamos
ver:

36
Engenharia Genética 2011

Bombardeamento de partículas é outro processo físico:

E aqui têm a infecção viral


que é um processo biológico,
mas nós quando falamos de
infecção viral estamos a falar
em células eucarióticas.

Ora bem, na transformação bacteriana, um dos principais processos, que é o que nós vamos fazer nas nossas
aulas práticas, é pôr as células a crescer em presença de iões bivalentes (normalmente Ca2+ e Mg2+): põe-se as
células a crescer na presença destes iões, têm que estar sempre no gelo, e após isso as células podem, ou ser
congeladas (que é o que nós vamos fazer, ou não), ou são imediatamente postas em contacto com o
plasmídio, e depois, mediante um choque térmico, o DNA entra para dentro das células. O processo é muito
empírico, não se sabe bem porque é que na realidade as células ficam permeáveis à entrada do DNA; pensa-se
que seja porque, em presença de CaCl2 e MgCl2, o ião Cl- entra para dentro das células, arrasta moléculas de
água com ele, a célula de alguma forma incha, digamos assim, aumenta de volume, e depois, perante o
choque térmico, há uma contracção e o DNA entra para dentro das células. É completamente empírico, mas a
realidade é que permeabiliza as membranas.

A seguir, transfecção, que é então a introdução de DNA livre também, mas em linhas celulares de eucariotas:

37
Engenharia Genética 2011

Ora bem, aqui existem vários processos, estes dois [representados na imagem] são químicos, aliás estes dois
são compostos químicos, o primeiro é um composto químico, e o segundo é um reagente baseado em lípidos:

Mas qual é o objectivo da transfecção, e o que é que estes compostos pretendem fazer? Pretendem, no
fundo, neutralizar de alguma forma, ou obviar, a carga negativa do DNA, quando entra numa estrutura
membranar que também tem carga negativa. Portanto, o que se pretende é neutralizar um pouco a repulsão
que pode existir entre a membrana da célula e a entrada do DNA; e então, existem compostos catiónicos,
sobretudo, existem variadíssimos protocolos, e vocês têm que aferir os protocolos a cada linha celular nova
com que estão a trabalhar. Podem trabalhar muito bem com o DEAE-Dextrano numa linha celular, mas depois,
numa outra linha celular, já têm que trabalhar com um dos outros compostos. Portanto, a primeira coisa é
aferir os protocolos; a segunda coisa tem a ver com o seguinte: qual é o vosso objectivo? O meu objectivo é
introduzir DNA para que ele fique só com uma expressão dita transitória ou transiente, ou seja, durante
poucos dias, ou a minha ideia é introduzir este DNA para que ele ainda atravesse a membrana nuclear (vocês
lembram-se que estamos a falar de células eucarióticas), e ainda se integre no cromossoma, e assim vão ter
uma expressão estável e permanente? Depende, porque na vossa experiência vocês podem querer só ver um
efeito transiente, dá/não dá, expressa/não expressa, acontece/não acontece, ou então não, criar uma linha
celular estável; e também, perante isso, a vossa decisão de qual destes compostos vão utilizar. E de facto, o
composto que permite de alguma forma, ainda que não se saiba como é que, de facto, o DNA depois atravessa
a membrana nuclear e se integra, os compostos que permitem mais esse tipo de expressão estável são estes
reagentes catiónicos baseados em lípidos; e porquê? Porque além de, de alguma forma, neutralizar a carga
negativa, têm uma componente fusogénica com a membrana lipídica, e portanto ajuda muito mais à entrada
do DNA, e à protecção do DNA dentro do citoplasma, para depois ainda poder atravessar a membrana
nuclear. Os processos de entrada podem ser, normalmente, endocitose e/ou fagocitose. Este:

38
Engenharia Genética 2011

pensa-se que seja, sim, por endocitose; este:

pensa-se que seja por endocitose ou por fagocitose, porque no fundo o Ca3(PO4)2 precipita o DNA, e pensa-se
que possa ser por fagocitose e endocitose; e este:

pensa-se que também possa ser por endocitose, ou a tal fusão das membranas lipídicas.

Os outros processos: têm o bombardeamento de partículas — portanto, existe uma série de equipamentos
(devices, no fundo) para introduzir o DNA por bombardeamento; no fundo são partículas ou de ouro, ou de
tungsténio, que são revestidas por DNA, que portanto são projectadas, entram à força para dentro das células;
são equipamentos caríssimos, técnicas caríssimas, e portanto não é assim que se usam, usam-se em situações
muito precisas.

A microinjecção, em que o DNA é directamente introduzido, com uma agulha por exemplo (e logo no núcleo,
portanto deixa de ter o problema de atravessar a membrana nuclear); como é lógico, só pode ser em células
de grandes dimensões, como por exemplo um óvulo fecundado, mas isto são processos muito morosos, muito
caros, que precisam de técnicos muito especializados, e portanto não é para todo o tipo de introduções de
DNA que nós queremos fazer.

E, depois cá têm também a infecção viral; existem, em eucariotas, 3 grandes tipos de vírus que são utilizados
como vectores virais: os retrovírus, os lentivírus, e os adenovírus. Isto são vírus que existem na natureza, são
vírus de origem animal, e que foram transformados em vectores, e que nos permitem também, depois dessas
modificações todas, serem usados como vectores. Por exemplo, os lentivírus têm a particularidade de infectar
células que não estão em divisão, que estão em G0; os retrovírus têm a particularidade de infectar células que

39
Engenharia Genética 2011
estão em divisão; e os adenovírus têm a particularidade de infectar células que estão em divisão e que não
estão em divisão, portanto infectam os dois tipos de células. Os retrovírus por exemplo, permitem uma
expressão sobretudo estável, ou seja, permitem que haja integração depois no genoma, mas os adenovírus
não: são sobretudo utilizados quando nós queremos que a experiência, portanto, a introdução do DNA, seja só
transitória ou transiente. Portanto, isto são tudo coisas que vocês podem ficar com a noção, e mais tarde, se
tiverem que trabalhar com estas coisas, têm que depois saber qual é o melhor vector; discutir, ver, consultar,
etc..

Ora bem, e depois aqui têm a electroporação; eu deixei para o fim a electroporação porque têm uma
aplicação que é de “A a Z”, é usada em todo o tipo de células. É um processo físico, e, inclusivamente, vocês
podem não ter só células isoladas para serem electroporadas, podem ter uma estrutura, por exemplo um
embrião, ou alguns tecidos embrionários, pôr esses tecidos embrionários numa pequena “cultura”, digamos
assim, e tentar que haja introdução de DNA dentro desses tecidos. Sabem que, depois, os tecidos circundantes
também vão receber DNA, mas vocês pretendem estudar a estrutura, o que é que acontece depois ao
processo de diferenciação, de desenvolvimento daquela estrutura, e portanto não podem separar as células,
têm que ser na estrutura; portanto, o processo de electroporação não é só para células livres, mas também
pode ser para estruturas. Há vários aparelhos, isto são as cuvettes que se utilizam:

Têm dois eléctrodos, portanto, as células seriam colocadas aqui, mas no caso de se terem estruturas, já não é
com a cuvette, há uma forma de se pôr aqui [dentro do aparelho; ver imagem do aparelho de electroporação
acima] a placa com o embriãozinho, com os eléctrodos de cada lado, e, portanto, fazem-se as descargas
eléctricas, e o DNA entrará. Isto depois são coisas que têm de ser muito afinadas; há um impulso com uma
determinada intensidade, por um determinado tempo, e é essa intensidade e esse tempo que têm de ser
estudados para cada tipo de célula: em E. coli são 25 µV, etc., 25 µF e não sei que mais, e em outras células
são outros tipos de intensidade.

Bem, o DNA entrou para dentro das células; e agora, como é que nós vamos seleccionar os recombinantes?
Porque vocês sabem que o DNA pode entrar para dentro das células, mas vocês podem ter recombinantes ou
não. E como é que nós sabemos quais são os recombinantes? Então, aqui eu pus 3 processos que têm que ver
com os vectores de E. coli de que falámos:

mas, há umas reticências muito “gordas”, porque além destes 3 processos existem muitos outros processos, e
que têm a ver, no fundo, com o sistema vector-hospedeiro que vocês estão a utilizar. É evidente que eu não
40
Engenharia Genética 2011
vos posso injectar com tudo, portanto lembrem-se sempre que têm aqui umas reticências muito gordas,
porque cada vez que vocês estiverem a trabalhar com um sistema vector-hospedeiro, têm que saber como é
que vão seleccionar.

Um dos processos de selecção é por inactivação de um gene de resistência, e já vão perceber porque é que é
um processo indirecto. Vocês imaginem que têm um plasmídio, como aquele que vocês já conhecem, o
pBR322 (trabalharam com ele em Biologia Molecular):

e que tem um gene de resistência à ampicilina [parte verde do plasmídio], e aqui tem um gene de resistência à
tetraciclina [parte laranja do plasmídio], e depois tem a dita origem de replicação [pequena parte a castanho
do plasmídio]. E este pBR322 não tem polylinker, ou seja, foi um vector de primeiríssima geração, ainda não se
tinha pensado que era útil que existisse um polylinker; tinha locais de restrição únicos, mas não todos
localizados num local, como por definição o polylinker é. Então, se vocês quiaessem clonar um segmento de
DNA, oque é que tinham de fazer? Por exemplo, tinham que clonar num destes locais únicos, que inactivavam
ou o gene de resistência à tetraciclina, ou o gene de resistência à ampicilina. Então vocês, por exemplo,
introduziam aqui [na parte laranja] um fragmento de DNA, e então estavam a inactivar o gene de resistência à
tetraciclina; vão seleccionar para quê? O que é que vocês põem no meio para seleccionar as vossas colónias
transformantes? Ampicilina, porque se puserem tetraciclina, as células morrem; com ampicilina, crescem
todas as colónias transformantes. Portanto, o que é que acontece? Aqui, todas as colónias são transformantes
de certeza absoluta, mas vocês, olhando para elas, não conseguem distinguir as transformantes das
recombinantes; volto a dizer, quando vocês transformam, têm sempre plasmídios que nunca receberam o
inserto, portanto na vossa mistura de ligação vocês vão ter sempre isto:

Mas vão ter plasmídios que autoligaram, ou que nunca foram digeridos, etc., e, portanto, quando vocês
transformam células com esta mistura de ligação, tudo isto [as colónias que se formam] são transformantes,
mas, olhando para as colónias, eu não sei quem é o transformante, e quem é, também, recombinante.

41
Engenharia Genética 2011
Portanto, como é que vocês podiam saber quem eram os recombinantes? Faziam replica-plating (põe um
risquinhos para saber a orientação da caixa, depois com um filtro ou com uma membrana põe por cima
ficando uma impressão da caixa com as colónias [as células aderem à membrana], depois põem aqui na caixa
com tetraciclina [as células da membrana aderem ao novo meio com Tet como uma impressão]) e quem é que
cresce? Os transformantes [não recombinantes], portanto voltam à caixa-mãe e vão ver, então, quem são os
recombinantes. Portanto, isto é um método indirecto, ou seja, demora 2 dias, porque não é directo, eu não
olho para as colónias e sei imediatamente quem são as colónias recombinantes; portanto eu ainda tenho que
ir fazer a replica-plating, e depois ainda tenho de voltar à caixa-mãe e dizer “ok, são estes os recombinantes”.
Este processo pode existir em termos práticos, é um bom raciocínio, mas praticamente já não se faz, porque
depois inventou-se um outro processo, que é um processo directo, que passa pela inactivação do gene lacZ e
se utiliza em muitos vectores, vocês têm imensos vectores em que se utiliza este processo para detecção
directa dos recombinantes, que é esse que eu então vos vou explicar.

Vocês vão imaginar o seguinte: uma célula que tem esta construção que aqui está:

Tem todo o operão lac, excepto que aqui, no gene lacZ, foi feita uma delecção, em que vocês, depois quando
há transcrição e tradução, têm uma proteína β-galactosidase, mas que não tem os aminoácidos 1 a 42.
Portanto, no cromossoma da célula foi feita a deleção, uma construção, não interessa agora como, em que
depois vocês vão ter uma β-galactosidase que, no fundo, é inactiva, porque faltam os aminoácidos 1 a 42; e
isto é a vossa estirpe hospedeira, ela é sempre assim. O vosso vector:

o que é que ele tem de particular? Tem um gene lacZ’, ’ (linha) porque tem os 146 aminoácidos que
pertencem à região N-terminal da β-galactosidase, mas não tem a porção C-terminal; isto é o vosso vector. E
portanto, se vocês induzirem a expressão desta β-galactosidase, vai dar uma β-galactosidase também inactiva.
Esta é inactiva (a codificada pelo gene Lac’Z, do genoma do hospedeiro) e esta é inactiva (a codificada pelo
gene lacZ’, do vector). Se na célula, que produz β-galactosidase inactiva, transformam com um vector, que
produz outra β-galactosidase inactiva, ambas, que por si só estão inactivas, quando juntas, na célula,
conseguem ter actividade de β-galactosidase; e se vocês, quando transformam as células, puserem um
substrato, que é o X-gal, que é um substrato incolor, mas que quando clivado produz uma cor azul, as vossas
colónias vão ser azuis. Portanto, isto é super engenhoso: como é que vocês seleccionam os recombinantes?
Lembrem-se que, como existe todo o operão lac na célula, está sempre a haver produção de repressor,
portanto nunca está a haver expressão de lacZ, e se vocês quiserem que haja expressão de lacZ têm que
inactivar o repressor, têm que impedir a acção do repressor de se ligar ao operador, e nessa altura tinham que
adicionar lactose; mas como nós não adicionamos lactose, porque isto é um processo que nós queremos que

42
Engenharia Genética 2011
seja muito bem controlado, vamos adicionar um composto que é o IPTG, que é no fundo um análogo da
lactose, mas que não é metabolizável, portanto quando vocês adicionam IPTG vocês estão permanentemente
a forçar a inactivação do repressor, portanto nunca está a haver repressão e portanto estão sempre a ter
expressão desta β-galactosidase, ainda que inactiva; e portanto quando transformam, adicionam IPTG, para
exactamente terem isso em préstimo e depois poderem ver o que é que acontece. Mas como é que, então,
agora nós vamos detectar os recombinantes? Porque, aqui está, é aqui que está localizado o polylinker (isto é
o vosso vector):

O polylinker está embebido, foi introduzido logo no início do gene lacZ, mas sem quebrar a grelha de leitura do
lacZ. Portanto, apesar de ele estar cá, vocês têm sempre produção de β-galactosidase, com uns aminoácidos a
mais, que correspondem à sequência do polylinker, mas esses aminoácidos a mais em nada perturbam a
formação desta β-galactosidase, e em nada perturbam que, quando ambas juntas, formem uma β-
galactosidase activa. Pergunta: Mas o nosso produto não vai sair agarrado ao fragmento do lacZ? Resposta:
Espere; isto é em condições normais. Portanto, se vocês têm só célula e vector, o que é que acontece?
Colónias azuis. Têm a célula transformada com o vector, sem ser vector recombinante, sem ser plasmídio
recombinante, e têm células azuis; mas se vocês introduzirem aqui, no polylinker, um segmento de DNA, o
mais provável é, de facto, haver uma interrupção da produção correcta desta porção N-terminal da β-
galactosidase, e então vão produzir uma β-galactosidase que, se antes já nem era activa, então agora, se
calhar, nem sequer é β-galactosidase, são uns aminoácidos quaisquer, e portanto não vão ter aquilo a que nós
chamamos a α-complementação; porque, na realidade, o que se estava a fazer aqui era: uma porção α, a
porção N-terminal, complementava aquela que falta. A este processo chama-se α-complementação. E quando
vocês interrompem a possibilidade de se formar a porção N-terminal, ou porção α, correctamente, então
deixam de ter α-complementação, e as vossas colónias já não vão ser azuis, vão ser brancas. Portanto, quando
vocês fazem este tipo de selecção, é uma selecção directa, porque no dia a seguir eu olho para a placa e vejo
colónias azuis — não são recombinantes — e colónias brancas — recombinantes. [a professora volta atrás
para complementar a parte da mutação dos a.a. 1 a 42 no genoma da célula hospedeira] Esta mutação, no
fundo, esta deleção 1-42 a.a., chama-se lacZ∆M15; portanto, se vocês estiverem a usar um vector que sabem
que tem o gene lacZ porção α, têm que usar então um hospedeiro que tenha esta mutação para poderem
realizar a α-complementação. Sempre que o vosso vector tiver a porção lacZ-α, para vocês tirarem partido
dessa possibilidade de seleccionarem os recombinantes, o vosso hospedeiro tem que ter obrigatoriamente
esta mutação. Pergunta: Mas, nesta técnica, é impossível distinguir os recombinantes dos hospedeiros que
nem sequer foram transformados, são todos brancos. Resposta: Os hospedeiros que não foram transformados
crescem? Não, porque temos que pôr sempre em meio com ampicilina. O que é que vai ter o seu meio de
cultura? Ampicilina, X-gal e IPTG. São a condição sine qua non para que vocês possam fazer a selecção entre
transformantes e recombinantes: ampicilina para transformantes, X-gal para detectar recombinantes de
transformantes, e IPTG para induzir o sistema, senão não têm o sistema “aberto”, digamos assim.

Posto isto, vocês olham para este bluescript, que é um vector:

43
Engenharia Genética 2011

E têm aqui dois possíveis hospedeiros:

E eu pergunto-vos: qual, na vossa opinião, é o melhor hospedeiro para este vector? Podíamos escolher o
primeiro ou o segundo, se estivéssemos só a pensar em selecção de recombinantes. Mas, já agora, reparem
que este plasmídio é um fagemídio, e tem aqui a origem de replicação fágica; e já agora, podia-vos dar jeito,
também, tirar partido desta replicação fágica, nunca sabem se vão precisar de DNA em cadeia simples para o
que for, e então já agora utilizavam uma estirpe que fosse F’, que tivesse o plasmídio F inserido no genoma.
De facto, qualquer das duas podiam utilizar, mas, já agora, podiam utilizar esta, que vos potenciava ainda mais
o vosso sistema, no sentido que podiam tirar mais partido do vosso sistema.

A 3ª forma de seleccionarem recombinantes (o fenótipo Spi-) faz parte da matéria; é assim. [a prof diz que,
como tem sido necessário ao longo dos anos diminuir a matéria, já não é dada esta 3ª forma em
profundidade; e sorte a nossa, porque é uma dor de cabeça] Portanto, só quero que retenham o seguinte:
isto, de facto, é uma forma de seleccionar recombinantes, quando estão a utilizar o fago λ, fagos λ esses que
têm esta construção red/gam:

44
Engenharia Genética 2011
É só isso que eu gostava que vocês retivessem; porque vocês podem estar a utilizar fagos, como eu vos
mostrei para trás, que têm lacZ, e então aí, X-gal, etc.. Aqui, quando têm red e gam, que são dois genes que
estão envolvidos em ciclos de replicação que não interessa agora, o que vocês têm que utilizar sempre é uma
estirpe hospedeira que se diz lisogénica para P2, ou seja, no genoma tem que ter inserido o fago P2, porque
quando este fago P2 está inserido no genoma gera uma interferência com os genes red e gam, e a isso chama-
se fenótipo Spi+. Ou seja, o que vocês querem seleccionar é o fenótipo Spi-. Portanto, este é o vector; eu vou
clonar, por exemplo, digiro com BamHI, corta aqui, corta aqui, vou clonar aqui o fragmento, e desaparece-me
o red e o gam; se desaparecem o red e o gam da vossa construção, vocês no fundo deixam de ter a dita
interferência com o fago P2, e há formação de placas fágicas. Se o vector mantiver o red e o gam, há
interferência com o P2, o vector não consegue replicar, não se formam placas fágicas, diz-se que o fenótipo é
Spi+. mas simplesmente vocês não seleccionam nada. Ou seja, se vocês utilizarem este vector e vos
aparecerem placas fágicas, quer dizer que são todas recombinantes, porque só essas é que tiveram a
capacidade de replicar — deixaram de ter red e gam, e já não houve interferência com o P2. Portanto a vossa
selecção é para o fenótipo Spi-, placas fágicas que aparecem são recombinantes, e diz-se que o fenótipo é Spi-.

Como é que vocês identificam os clones recombinantes? Portanto, uma coisa é dizerem “olha, ele é branco,
por oposição ao azul, portanto é recombinante”; mas eu agora quero saber exactamente o que é que lá está
clonado, porque pode estar com uma orientação que não me interessa, porque pode estar um fragmento
contaminante; como é que eu identifico, e como é que eu sei o que é que lá está clonado? São variadíssimos
os processos para vocês identificarem os clones recombinantes:

O primeiro passo é fazer uma análise do padrão de restrição; porque vocês são da era da genómica, vocês têm
tudo sequenciado, vocês podem conhecer tudo. E, portanto, isto foi o que nós já falámos também nas
práticas; não vou deter aqui muito tempo, porque vocês olham para aqui e percebem logo:

Têm um vector, têm um local Eco, um local Hind, e vão clonar o fragmento no local Eco, estão a ver? Só que o
vosso inserto também tem um local Hind. Aqui, têm outro plasmídio recombinante, que é a inserção do
mesmo fragmento:

45
Engenharia Genética 2011

só que, em vez de estar como o anterior, está ao contrário. Portanto, são dois plasmídios recombinantes, o
fragmento é exactamente o mesmo, só que está ao contrário. Portanto, vocês têm as colónias, não sabem
quem é quem, e vão repicar, vão extrair o DNA plasmídico, e agora vão digerir para ver o que é que é o quê.
Digerem um DNA plasmídico, que vos dá isto, com EcoRI:

que vos dá, pura e simplesmente, uma única banda; então é o vector, porque só tem um local EcoRI, e com 2,5
aproximadamente. Digerem outra colónia com EcoRI, que vos dá 4,5, mais o vector:

Digerem outra colónia, a colónia B, que vos dá a mesma coisa:

Portanto, a digestão com EcoRI permite distinguir recombinantes de vectores, mas não vos permite dizer se há
alguma diferença entre os recombinantes. E vocês até sabem que fizeram uma clonagem não dirigida,

46
Engenharia Genética 2011
portanto têm as duas probabilidades de inserção do fragmento. E portanto, ao digerirem com HindIII, que
digere fora e dentro do vector, aí sim, já conseguem distinguir o clone A do clone B:

Não se arrepiem com o que aqui está, porque nós ainda havemos de falar disto mais tarde, iremos falar
bastante disto, mas uma das maneiras de vocês poderem, de facto, saber se têm ou não o clone recombinante
que pretendem é através de técnicas de hibridação de ácidos nucleicos:

Esqueçam o que aqui está, se quiserem depois vejam, mas pensem no seguinte: imaginem que vocês
digeriram um genoma, e clonaram num vector. E portanto sabem que, se digeriram um genoma e clonaram
num vector, vão ter numerosos clones recombinantes, com diferentes insertos; plaquearam, e têm uma série
de colónias. Mas vocês querem um gene em particular; e portanto, o que é que acontece? Olham para ali, e
podem ter uma sonda, ou seja, um fragmento de DNA que corresponda a esse gene, porque já foi isolado, que
existe num plasmídio, ou o que for, e constroem uma sonda. Ou seja, isolam esse fragmento de DNA, que vão
marcar de alguma forma, ou seja, ele tem que ter algo que depois vos permita detectar qual é o clone com
qual ela hibridou. No fundo, as vossas colónias são transferidas para uma membrana, essa membrana tem
uma série de tratamentos, as colónias vão ser lisadas in loco, na membrana, portanto há uma lise local, vão
ficar imobilizadas, e depois vocês vão hibridar a sonda; e a sonda vai emparelhar com o clone com o qual tiver
complementaridade. Como ela está marcada, ela há-se emitir um sinal qualquer, e vocês depois conseguem
identificar qual é o clone que pretendem. Portanto, tecnologia de hibridação de ácidos nucleicos permite-vos

47
Engenharia Genética 2011
também detectar, no fundo, quais são os recombinantes com os quais querem trabalhar. Mas mais para
diante vamos falar disto.

E agora, esta técnica, que... eu devo-vos dizer uma coisa: isto é das formas que eu acho muito “engenhocas”
para vocês poderem detectar, de uma panóplia de 35.000 clones, qual é aquele clone que vos interessa. Vocês
imaginem então, é o que aqui está representado:

que fizeram uma biblioteca, ou seja, a mesma coisa: vários fragmentos clonados, num outro vector que é o tal
YAC, que vai de 100 kb a 3000 kb. Mas fizeram uma biblioteca no YAC, que é um Yeast Artificial Chromosome;
já vos vou mostrar o que é um YAC, é outro vector. E portanto têm, como ali está indicado, 35.000 clones; mas
vocês querem um clone, daqueles 35.000 clones. Como é que a pessoa vai procurar UM clone, naqueles
35.000... então, o que é que foi feito? Cada clone foi posto a crescer num poço, de uma série de placas. Vocês
reparem que cada placa tem 12 poços por 8 poços. Portanto, distribuíram isto, e têm 20 conjuntos de 9
placas; e em cada poço está um clone diferente. Então, o que é que eles fazem? Ao conjunto n.º 1, vão
remover o DNA de todos os poços, juntam tudo num só tubo, e vão fazer PCR para ver se identificam o vosso
clone; ao conjunto n.º 2, “arrebanham” DNA, põem noutro tubo, e fazem PCR para ver se está lá o vosso
clone; estão a ver? É o que aqui está indicado; aliás, temos 40 conjuntos. Eles identificam o vosso clone, num

conjunto de 5, mas num conjunto de 5 vocês têm 12 8 9 clones, estão a perceber o que eu estou a dizer?
No poço 1A tem um clone, no poço 2A tem outro clone, ok, uma placa; segunda placa, terceira placa, etc., 9
placas, todos diferentes. Isto é um conjunto de 9 placas, todos diferentes:

48
Engenharia Genética 2011

Depois outro conjunto de 9 placas, todos diferentes uns dos outros; portanto têm 40 conjuntos de 9 placas,
todos diferentes em cada poço. Portanto, depois eu pego num conjunto 1, junto DNA de todos os DNAs daqui,
e vou fazer PCR. Este é o meu conjunto 1:

Faço PCR, para detectar se está lá o meu clone:

Vêem alguma banda no conjunto n.º 1? Não? Óptimo, lixo! Não tenho lá o meu DNA. “Lixo” é uma forma de
expressão, não deitam nada disto para o lixo, hã? Não tenho lá o DNA que me interessa. Conjunto n.º 2, vêem
alguma banda? Não; óptimo, não está lá. Conjunto n.º 5, vêm uma banda? Sim: algures, em parte incerta, está
lá o meu clone. Então, eu já só vou trabalhar, agora no passo seguinte, com o conjunto 5, o conjunto 12 e o
conjunto 33. De todo aquele conjunto de clones, eu já só vou trabalhar com 3 conjuntos de clones, porque,
algures, está lá o clone. Pergunta: E se eu não souber o... (?) Resposta: Ah, mas têm de saber, isso faz parte da
estratégia. Vocês adaptam a estratégia àquilo que podem; a premissa n.º 1 para vocês fazerem PCR é terem
um conhecimento mínimo da sequência que querem amplificar. Pergunta: Não devia aparecer só num
conjunto (o clone que queremos)? Resposta: Eu estava à espera dessa pergunta. Quando vocês fazem isto,
“corta aqui e corta aqui” [enzimas de restrição, que cortam em determinados locais do plasmídio]; mas
também podem ter “corta aqui, e corta aqui” [locais diferentes]. Vocês podem ter um clone que vai daqui a
aqui, e isto é um; e outro clone, que vai daqui a aqui [locais diferentes]. E, portanto, há aqui uma
sobreposição, portanto, vocês podem ter clones que se sobrepõem; e também podem ter amplificações
inespecíficas, mas a realidade é que já restringiu a 3 conjuntos.

49
Engenharia Genética 2011
A seguir, o que é que fazem? Pego, por exemplo, no conjunto 5, e, desse conjunto, fazem: por exemplo,
juntam todos os clones de uma fila, mas por ali abaixo [dessa fila e de todas as outras filas correspondentes,
em cada uma das outras placas que fazem parte do conjunto 5]; todos os clones de uma coluna, mas por ali
abaixo [o mesmo]; e depois, por placa [cada placa pertencente ao conjunto, individualmente]. Então, o que é
que vocês têm?

Filas 

Aparece-vos um clone positivo G; ou seja, eu sei que pode ser na placa G que está; depois, aparece-me na fila
F, ou seja, pode ser na fila F que está; e depois aparece no 5. Portanto, há-de ser na placa G, fila F, coluna 5: é
aquele, o clone que eu quero. Estão a ver? Não acham isto fantástico?! Garanto-vos! Em 35.000 clones
conseguiram, com uma estratégia — isto é o que se chama fazer um pool —, portanto faz-se um pool, e vocês
conseguem identificar o clone que pretendem. Pergunta: (não percebo o início)... podemos também fazer
hibridação, ou não? Resposta: É, podem, podem. Aliás, isto é um processo, porque vocês, depois no fim do
semestre vão ouvir falar dos microarrays, e nos microarrays o que vocês têm são processos de hibridação em
que vocês têm, no fundo, estas bibliotecas, estes clones todos, num array, em série, e portanto fazem isso; as
coisas estão muito mais facilitadas. Isto é uma das estratégias, há muitas estratégias. Ora bem, isto é só para
vocês saberem o que é que é um YAC:

50
Engenharia Genética 2011

E o YAC é um vector baseado num cromossoma das leveduras, e que, no fundo, tem uma origem de replicação
de levedura, que se chama ARS; tem umas regiões que equivalem ao centrómero, e umas regiões que
equivalem aos telómeros. Depois falaremos disto mais para diante, era só porque aquela biblioteca era feita
em YAC. Outra forma de analisar os produtos é... eu falei-vos que vocês podem ter, no fundo, identificação por
hibridação, com uma sonda de DNA ou de RNA, com um ácido nucleico, e isso chama-se hibridação, ou então
podem fazer por detecção imunológica. Olhem o seguinte:

51
Engenharia Genética 2011
Se vocês tiverem colónias, portanto vocês usaram vectores não de clonagem geral, mas de expressão,
portanto vai haver expressão do produto, e têm dentro das colónias o produto. E portanto, quando
transferem as colónias, lisam as colónias, e se puserem um anticorpo específico do produto, vão detectar qual
é o clone que está a produzir o produto que vocês pretendem; é exactamente a mesma coisa, portanto, é um
processo de detecção, só que em vez de se dizer “hibridação” (não se diz “hibridação”, porque “hibridação” é
específico para ácidos nucleicos), vocês estão a fazer uma detecção imunológica: estão a usar um anticorpo
específico do produto que foi produzido pelo clone que vocês construíram.

Horário de atendimento da professora:

Segunda feira: 11h—12h

Sexta feira: 14h30—15h30

[a professora dá um trabalho para casa, mas aparentemente não faz parte dos slides]

Quais as combinações possíveis de coexistência destes plasmídeos numa estirpe hospedeira? O que é que
podem cointroduzir na estirpe hospedeira, cotransformar, o que pode coexistir e como os seleccionam.

52
Engenharia Genética 2011
7ª Aula – 1 de Março de 2011

Na última aula acabámos com a estratégia dos YAC’s. Hoje vamos acabar este capítulo da clonagem geral.

Quando ali está escrito “Estratégias de clonagem” é evidente que não quer dizer que sejam só estas
as duas únicas estratégias de clonagem. Há muitas mais estratégias de clonagem, só que hoje vamos falar
nestas duas que são, no fundo, a construção de bibliotecas genómicas e a construção de bibliotecas de cDNA.
Talvez hoje em dia ainda se façam bibliotecas genómicas como se faziam há muitos anos e talvez se façam
ainda bibliotecas de cDNA, mas a representação dessas bibliotecas e que é diferente e isso falamos no fim.

Como a própria palavra indica, e é isso que é fácil, dizer que se tem uma biblioteca genómica, no
fundo, é ter uma colecção de clones que representam um genoma particular de um organismo qualquer.
Portanto o que acontece é que para vocês construírem uma biblioteca genómica têm que primeiro digerir o
genoma desse organismo. Ao digerir o genoma desse organismo a primeira questão que se põe é:

1. Com que enzimas é que vou digerir o genoma deste organismo? Enzimas que cortem
frequentemente? Enzimas que cortem raramente?

Para já, não sei se já pensaram nisso, mas o cortar frequentemente e o cortar raramente tem a ver
com o quê? O que é que acham que está directamente relacionado com o corte frequente ou mais raro de
uma enzima de restrição?
• A dimensão da sequência que é reconhecida.
o Vocês sabem que as enzimas de restrição cortam em sequências de 4 nucleótidos, raramente
sequências com 5 nucleótidos (enzimas tipo II), a maioria corta em sequências de
reconhecimento com 6 nucleótidos e outras com 8 nucleótidos. É claro que para as enzimas
que cortam em sequências com 8 nucleótidos é mais raro encontrar esta sequência do que
uma de 4.
• Riqueza em G e C ou A e T nesse local de corte
o Os genomas não são todos igualmente ricos no mesmo tipo de nucleótidos. Há genomas mais
ricos em G’s e C’s e há genomas mais ricos em A’s e T’s e isso sobretudo vê-se ao nível das
bactérias. Vocês têm um Staphylococcus aureus ou um Staphylococcus em geral, que são
muito ricos em A’s e T’s e têm outras bactérias, como Streptococcus, por exemplo, que são
muito ricos em G’s e C’s.

Portanto se queremos fazer uma biblioteca temos que pensar nas enzimas, porque se utilizar uma
enzima que corta muito em A’s e T’s se calhar não a vou usar em Staphylococcus aureus, porque senão os
fragmentos ficam muito pequenos. Portanto isto é um dos assuntos, e por isso mesmo é que não existem
bibliotecas genómicas só construídas com um tipo de enzima. Podem ser construídas com 1 ou com 2 ou uma
biblioteca construída com, por exemplo, a AatII (vocês já conhecem essa enzima) ou uma biblioteca construída
com Bst mais qualquer coisa. Portanto há mais do que um tipo de biblioteca. A realidade é que qualquer que
seja a enzima que se escolha ou qualquer que seja a biblioteca, esta tem que ser, tanto quanto possível,
representativa do genoma todo e uma das particularidades é que os seus clones têm que ser sobreponíveis. E
porque é que os clones têm que ser sobreponíveis? Porque reparem:

53
Engenharia Genética 2011

Esta sequência que vai desde a primeira seta até à segunda é uma região do DNA (o mesmo se aplica a
cada uma das parcelas entre setas). Se utilizar uma enzima que corta nestes locais todos que estão aqui
indicados, que é a mesma mas que corta para aqueles locais todos, imaginem que faziam um clone só com a
sequência 1, um clone só com a sequência 2, um clone só com a sequência 5 e um clone só com a sequência 6
tinham os clones em separado, não conseguiam saber que o clone 1 era ao lado do clone 2. Não se consegue
saber quem está ao lado de quem. Por outro lado se conseguirem um clone que contem parte das sequências
1 e 2 no mesmo fragmento já é possível saber então que o 1 e o 2 estão um ao lado do outro porque o clone 5
está inteiro. Assim, porque há sobreposição dos clones, é possível fazer-se uma continuidade do genoma e é
isso que se pretende. Estão a ver aqui os clones 2 e 3, com 2 e 3 em separado eu nunca saberia se o 2 estava
ao lado do 3 porque fiz uma construção e tenho outra construção, pode até vir de outro local do genoma, não
sei. São dois clones que não têm nada em comum mas como têm um clone, o 6, que me abrange parte do 2 e
parte do 3 então eu sei que o 2 e o 3 só podem estar juntos, porque como o 6 abrange aquilo tudo eu sei que
só podem estar juntos e assim é possível ter-se uma representação não só do genoma mas também saber
quem é que é ao lado de quem.

Uma destas particularidades das bibliotecas genómicas é que as enzimas que utilizamos, para além de
termos que ter esse cuidado da sua escolha, temos que provocar aquilo a que se chama digestões parciais,
pois se estou a utilizar uma enzima qualquer e para ter estes clones que se sobrepõem tenho que permitir que
o DNA não seja, por exemplo, cortado entre o fragmento vermelho e o fragmento roxo, como está na figura:

No fragmento 6 existe o local de corte na mesma só que não foi cortado e por isso ficamos com o
clone 6. Assim, a outra particularidade é permitir que se dêem digestões parciais. Mas como é que vocês
provocavam uma digestão parcial? Para se fazer uma digestão parcial tem que se jogar com o tempo e com a
concentração de enzima.

Antes de continuar vou-vos falar de uma coisa que se chama “Chromosome Walking”. Chromosome
Walking, tal como o próprio nome indica é a possibilidade de se caminhar ao longo do cromossoma,
sobretudo quando não conhecemos o cromossoma e qual a sua continuidade, quando não conhecemos toda a
sequência. Para poder explicar uma das técnicas de fazer Chromosome Walking tenho que vos falar de uma
coisa que se chama RFLP (RESTRICTION FRAGMENT LENGTH POLIMORFISM).

O que é um polimorfismo? É uma diferença num nucleótido, portanto vocês podem ter polimorfismos
quando numa determinada região do DNA há uma variação de 1 ou 2 nucleótidos suficientemente
representativa na população para se considerar que é polimórfica. Não é uma variação ao acaso, tem que
haver uma representatividade suficiente, que normalmente é de 1%. Portanto vocês podem ter polimorfismos
em regiões génicas ou podem ter polimorfismos em regiões intergénicas e sobretudo nestas regiões é muito
frequente numa população existir os chamados polimorfismos, (estas variações nas sequências) porque estas
regiões, como podem imaginar, não estão sujeitas à pressão selectiva. O que é que isto quer dizer? Se tiverem
uma variação numa região génica, ou seja, se houver uma mutação (que é por ai que começa), uma alteração
e começa a haver uma variação, há uma pressão selectiva porque se essa mutação for letal aquele organismo
já não sobrevive e portanto o que é que acontece? Essas variações em regiões génicas que estão sujeitas a
pressões selectivas são mais raras do que nas regiões intergénicas. Isto só para vos dizer no fundo que nas

54
Engenharia Genética 2011
regiões intergénicas existem muitas. E quando as variações ocorrem nas regiões génicas nós chamamos, ou de
mutações e a palavra mutação está sempre associada a qualquer coisa nociva, de pior, ou pura e
simplesmente de variantes, variantes génicas. Os diferentes alelos de um gene não são mais do que
polimorfismos de um gene. Assim, um polimorfismo é essa variação, um alelo como é diferente de outro alelo
mas como é para o mesmo gene é no fundo um polimorfismo e normalmente só chamamos mutações a
polimorfismos que são letais ou que causam doença, etc.

Quando estamos a falar das regiões intergénicas, já não falamos de mutações nem de variantes.
Globalmente temos polimorfismos. Mas agora, para que é que servem esses polimorfismos? O Homem é tão
esperto que ao perceber que existiam estes polimorfismos tira partido deles para diferenciar indivíduos sem
que haja implicações éticas. Ou seja, se eu estabelecer um polimorfismo num gene pode trazer implicações
éticas porque posso estar a dizer que este gene ou é melhor ou é pior, ou é doente ou é saudável. Numa
região intergénica que é totalmente neutra não tem implicações éticas de qualquer tipo e portanto pode
estabelecer a diferenciação entre os indivíduos porque são diferentes naquela região. E é ai que se baseiam
todos aqueles filmes do CSI e todas aquelas coisas que vocês vêem e é exactamente isso. É ver quais os
polimorfismos entre indivíduos em regiões que não causam dano ético nem legal por serem aquelas regiões.

Um desses polimorfismos que se utiliza chama-se RFLP. E o que é um RFLP? Como a palavra indica é
um polimorfismo que está associado à dimensão dos fragmentos que se obtêm quando utilizamos enzimas de
restrição. No fundo é um polimorfismo que tem a ver com a dimensão dos fragmentos que se geram quando
utilizam enzimas de restrição.

Se vocês imaginarem que esta região que tem 2 locais de corte para esta enzima HaeIII, têm 2
indivíduos que são o Bob e o Joe, por exemplo e o que acontece é que o Bob tem um polimorfismo num local
de corte do HaeIII, ou seja, em condições normais estaria lá o local de corte mas como há uma variação,
portanto tem outro nucleótido, em vez de ter um G tem um A, quer dizer que ali o HaeIII já não vai cortar
(estamos a falar da mesma região mas já não corta). Portanto quando comparamos, no fundo, a digestão com

55
Engenharia Genética 2011
HaeIII e estamos no fundo a estudar esta região o que é que acontece? O Bob dá 3 fragmentos e o Joe já só dá
2 e portanto faz-se uma análise de RFLP destes dois indivíduos. É evidente que este RFLP já está tipificado, já
se sabe que naquela região existe aquele polimorfismo e portanto nesses estudos que vos falei, nos tais
estudos de medicina forense, no fundo, há polimorfismos, ou seja, marcadores genéticos que nós utilizamos.
Mas há marcadores genéticos melhores que outros. Pode haver um que ora dá ora não dá, ora aparece ora
não aparece, e isso não é bom: é um polimorfismo mas não é representativo, não funciona bem. E isto
considerando que eles são homozigóticos, considerando que o outro cromossoma é igual a este.

Agora para que é que serve o RFLP para aquilo que quero que vocês prestem atenção, que é o
Chromosome Walking? Quando um RFLP, um tipo de polimorfismo deste tipo está associado a uma doença,
ou seja, está em Linkage com uma doença, então o RFLP é o meu marcador genético dessa doença e se calhar
permite-me fazer o Chromosome Walking. Como é que isto é possível? Vocês lembram-se do que é estar em
Linkage? É quando os alelos estão tão perto um do outro que a probabilidade de serem segregados
independentemente um do outro não existe. Para que a probabilidade de ocorrer crossing-over entre os dois
não ocorra.

Portanto, e agora vejam bem a “trick” da coisa, se vocês tiverem um RFLP suficientemente próximo de
um gene que é responsável por uma doença a probabilidade do indivíduo que herda esse gene herdar esse
RFLP é grande. Portanto, o que é que acontece? Se nós estamos a estudar uma doença podemos pura e
simplesmente estudar o RFLP porque sabemos que se aquele indivíduo apresenta aquele RFLP é porque
apresentará quase com toda a certeza o gene da doença. Se o Joe tivesse uma doença ou o Bob, não interessa,
o que é preciso saber é qual o RFLP que está associado à doença, qual é o alelo que está associado à doença e
qual é o alelo que está associado ao selvagem, sabendo quem é quem, se o alelo presente no Joe é o que está
associado à doença então todos os indivíduos que apresentarem este alelo apresentam a doença e todos os
que não apresentarem o alelo não terão a doença.

56
Engenharia Genética 2011
Então como é que isto se aplica ao Chromosome Walking? No fundo, imaginem que têm uma
biblioteca genómica com o clone acima identificado e neste clone vocês identificavam um RFLP. Ora, se
soubessem que esse RFLP era o que estava em Linkage com uma determinada doença para eu chegar ao clone
que continha o gene da doença bastava fazer então Chromosome Walking, porque eu sei que eles têm que
estar perto um do outro, porque estão em Linkage. Vou repetir:

Imaginem que vocês têm uma biblioteca genómica e num determinado clone dessa biblioteca
genómica identificam um RFLP e sabem, porque hoje em dia sabe-se muita coisa, que esse RFLP está em
Linkage com determinada doença, mas vocês ainda não têm o gene da doença nem o clone que contém o
gene que codifica para a doença. Mas sabem que têm este clone que codifica para o RFLP, sabem que ele está
em Linkage com uma doença e se está em Linkage com uma doença só temos que fazer agora Chromosome
Walking até encontrar o clone que contém o gene que codifica para a doença. Certo? Porque eu sei que eles
têm que estar perto um do outro. Portanto se 1 for o genoma e 2 for o clone que tem o RFLP, eu isolo aquele
DNA, construo uma sonda que esteja próxima da extremidade e vou hibridar com a biblioteca genómica e
onde é que ela vai hibridar? Com o clone que está imediatamente a seguir. Vai então hibridar com o clone 3
que continua para a direita. Depois vou isolar o lado próximo da extremidade do clone e vou hibridar com a
biblioteca genómica. E onde é que ele vai hibridar? Com o clone que contem a continuidade, ou seja, 4 até que
às tantas chega ao gene que estava lá no cromossoma próximo mas longe ao ponto de termos que fazer
Chromosome Walking.

Isto que estou a dizer desta forma tão simples demorava anos. Não pensem que em duas semanas já
conseguia identificar o gene que codifica para… Não, porquê? Porque é evidente que vocês isolaram aqui,
hibridaram e continuaram para a frente mas tinham que fazer a mesma coisa para o sentido contrário. Não
sabiam para que lado é que ele estava. Sabiam que estava em Linkage, mas para que lado? Então iam fazer a
mesma coisa. Iam isolar e hibridar e de cada vez que identificassem um clone com o qual a sonda hibridasse
sabiam que potencialmente o gene estava lá. Mas como é que eu sei se o gene está lá? Então tinham que
sequenciar para ver se o gene estava lá, se codificava para a proteína, etc, etc. Mas isto é só para perceberem
a estratégia de fazerem Chromosome Walking.

Interessa-me mais nesta disciplina despertar-vos estratégias, como é que as coisas se podem
engendrar, etc, do que vocês saberem muitas minhoquisses.

Falámos de bibliotecas genómicas que já sabem o que é que é, falamos como é que se pode caminhar
ao longo de uma biblioteca genómica, sobretudo em genomas que não estão sequenciados e que não têm
tudo na net, e agora como é que se constrói as bibliotecas de cDNA?

Ora bem, o cDNA, sabem o que é? Uma biblioteca de cDNA no fundo acaba por ser uma biblioteca que
vocês têm só a representação do que está a ser transcrito em determinado momento e isto é fundamental
que vocês percebam porque se estamos a fazer uma biblioteca de cDNA de bactérias é um assunto, se
estamos a fazer uma biblioteca de cDNA humana, não se diz isto, não se diz uma biblioteca de cDNA humana.
Diz-se quanto muito uma biblioteca de cDNA das células do fígado em determinada fase do desenvolvimento,
ou uma biblioteca de cDNA de células do fígado canceroso. Estão a ver? Porque a expressão génica a cada
momento e em cada tipo de célula é diferente. Nós estamos de facto a tentar ter uma representação do que é
que está a ser produzido, transcrito, no fundo, naquele momento, naquela célula. Estão a ver então a
diferença que há entre uma biblioteca de cDNA de uma bactéria que normalmente em condições normais tem
um ciclo de vida e vai haver uma variação da expressão dos genes no inicio da fase estacionária e no fim da
fase estacionária. Sem dúvida que vai haver, mas é a bactéria. Aqui temos que ir tecido a tecido, condição a
condição, estados de desenvolvimento diferentes, etc.

57
Engenharia Genética 2011
Portanto para se fazer uma biblioteca de cDNA o que é que têm que fazer? Primeiro têm que purificar
o RNAm. Há vários protocolos de purificação de RNA. Alguém sabe algum? Quando vocês querem purificar o
RNA o que é que fazem? Em que é que pensam?

1. Lisar as células e separar o RNA do DNA


2. Separar as diferentes moléculas de RNA, porque temos RNAr, RNAt, RNAsn…

Vocês sabem que uma das particularidades do RNAm é que quase todos os RNAm eucarióticos são
poli-adenilados e portanto hoje em dia, ainda continua a ser a grande fonte de isolamento de RNAm a partir
de RNAm poli-adenilados, sabendo que estão a perder os RNAm que não são poli-adenilados e portanto faz-se
em colunas de afinidade que são colunas com oligo-T’s (oligo-timinas), faz-se uma mistura com todo o RNA
citoplasmático (nesta altura já não existe DNA) só os RNAm é que se vão ligar, lava-se a coluna e ao ser lavada
fica-se só com os RNAm ligados, que vão depois ser eluídos da coluna e ficam com o pool de RNAm daquela
célula.

A partir destes RNAm é que vão poder fazer a síntese do cDNA. Depois de purificarem o RNA vão
depois ver em gel para verificar se ele está ou não está bem purificado. Porquê? Porque uma das
particularidades que eu acho que vocês aprenderam é que as moléculas de RNAm são extremamente instáveis
(varia muito a sua estabilidade) e portanto, se vocês trabalham em condição não ideais acontece que chegam
ao fim e não têm lá RNA, têm somente ribonucleótidos, mas as moléculas já lá não estão. Por isso vêem em
gel de agarose e isto é o aspecto de um RNA puro:

58
Engenharia Genética 2011
Isto é um RNA total, ainda não é depois de purificado. Vocês vêem aqui os nucleótidos correspondentes à
subunidade 28S e 18S do ribossoma. E onde andarão os RNAm? Porque é que só vejo RNAr? Porque são os
que estão mais representados. E onde é que estão então os RNAm? Estão no arrastamento entre os RNAr só
que estão muito menos representados. Vocês sabem que os RNAr são todos iguais, são muitos e todos iguais,
portanto vêem-se. Os RNAm são todos diferentes e não estão representados como os ribossomais. A amostra
3, por exemplo, é para deitar fora porque está tudo degradado. Porque é que os RNAr são mais estáveis que
os RNAm? Por causa da estrutura que têm. Então quer dizer que eles são sempre estáveis? Não, eles também
são degradados, mas de facto são mais estáveis.

Então como é que sintetiza o cDNA? Volto a dizer, há variadíssimos protocolos de síntese de cDNA e
não vos vou bombardear com todos os protocolos de síntese de cDNA. Vocês irão ou não ter que fazer alguns
deles mas basicamente, depois de terem RNAm purificado, qualquer que seja o protocolo têm que usar uma
transcriptase reversa, que é aquela enzima que vos permite sintetizar DNA tendo RNA como molde. Por isso
aqui têm que ter uma transcriptase reversa que tem RNA como molde mas que precisa de uma extremidade
3’OH para iniciar a sua síntese, por isso vão ter que utilizar um primer que emparelha com o RNA e depois
ocorre a síntese. Então vai-se gerar uma molécula híbrida de DNA/RNA. Esta molécula híbrida para já não
interessa para nada porque vocês só querem o DNA por isso vão ter que se ver livres do RNA. Como é que se
podem ver livres do RNA? Utilizando ou RNase H ou fazendo uma hidrólise alcalina com NaOH. A RNase H
cliva os híbridos DNA/RNA só no RNA. O NaOH é um agente desnaturante que simplesmente desnatura as
duas cadeias de RNA/DNA.

Seja qual for o protocolo que se utilize vocês se usarem NaOH gera-se a ansa representada no 3º passo
da imagem acima, e portanto já se libertaram do RNA. Então o que é que vão ter que usar? DNA polimerase
para sintetizar no sentido 5’-3’. Vão usar uma DNA polimerase para sintetizar o que se chama a segunda
cadeia do cDNA. Se usarem a RNase H ela vai cortar (vou perguntar a professora onde é que a RNAse H corta)
e portanto vamos ter que utilizar uma DNA polimerase, mas não o fragmento de Klenow. Vão ter que usar
uma DNA polimerase I porque essa também tem actividade 5’-3’ exonucleolítica. Portanto ela sintetiza e vai
degradando o RNA que ainda lá está. E porque é que utilizam a S1? Porque ao fazer isto queria dizer que a
molécula ficava toda interligada e o que é que a S1 faz? Corta em moléculas de cadeia simples (porque ela
tinha as duas actividades exonucleolítica 5’-3’, 3’-5’, DNA, RNA e ainda endonucleolítica). A seguir, para
59
Engenharia Genética 2011
fazerem a dita biblioteca de cDNA, vocês têm o cDNA, mas como é que o vão clonar? O ideal seria juntar
linkers ou adaptadores:

Porque vocês têm aqui umas extremidades cegas mas vão juntar linkers ou adaptadores para depois
clivar e então cortar no vector que têm o mesmo tipo de extremidades. É muito mais fácil fazerem isto do que
tentar clonar o que aqui está em locais blunt num vector. Portanto se gerarem extremidades coesivas nas
vossas moléculas de cDNA através da adição de linkers ou adaptadores vocês cortam e é muito mais fácil do
que estar a clonar extremidades cegas.

60
Engenharia Genética 2011

Estas duas estratégias que aqui estão são para vocês pensarem, para casa. São duas estratégias, são a mesma
coisa, de no fundo, síntese de cDNA. É evidente que hoje em dia, gostava sobretudo que entendessem a 2
(está cá tudo explicado). Hoje em dia é muito mais fácil, vocês amplificarem cDNA utilizando PCR. Eu vou
deixar isto para quando falarmos das técnicas de PCR mas gostava que vissem já como é que é possível fazer
isto.

E isto são outras coisas que eu gostava que pensassem a cerca e que viessem com as vossas dúvidas falar
comigo no horário de atendimento.

61
Engenharia Genética 2011

Aqui é a mesma coisa, porque é que se


usa a Eco RI metilase, da qual já falámos várias
vezes.

<-- EcoRI metilase

62
Engenharia Genética 2011

E aqui está a amplificação por cDNA. Estes 4 slides é para vocês olharem, terem dúvidas e discutirmos
depois, se quiserem na aula de quinta-feira podem vir já com dúvidas.

Agora vamos passar finalmente à clonagem de expressão. O que é que acham que é a clonagem de
expressão? É a clonagem de um gene que se expresse, porque pode não expressar uma proteína, pode não
produzir uma proteína. Então isso implica que o gene tem que levar toda a sua região reguladora para se
poder expressar? Não. A clonagem de expressão permite expressar um produto, produzir um produto génico
mas não está nem de longe nem de perto relacionado com a parte de toda a região reguladora desse gene.
Vocês já estão a imaginar em eucariotas o que é que isso seria. Os eucariotas têm uma região reguladora tão
expandida, que muitas vezes nem se a conhece toda, como é que isso seria possível. Portanto vamos ver
então sobre o que é que vamos falar neste capítulo todo, não só quais é que são os objectivos da clonagem de
expressão como também das características gerais destes sistemas de expressão como da expressão
heteróloga em E. coli, em Saccharomyces e em sistemas de células de mamíferos, e vamos falar de alguns
sistemas de expressão.

Primeira coisa: O objectivo.

O objectivo é mesmo esse. Permitir que haja expressão de um gene. Esse gene não tem que produzir
necessariamente uma proteína e por isso é que eu comecei logo por vos dizer que o produto pode ser
utilizado como aquilo a que se chama uma Ribo-Probe ou uma sonda de RNA. Portanto vocês podem ter um
sistema de expressão que obrigam à expressão de algo para funcionar como uma sonda e esse algo
inclusivamente até pode nem ser um gene. Vocês estão pura e simplesmente a obrigar a expressão de
determinada sequência nucleótídica que até pode nem ser naturalmente codificante, mas como obrigaram à
sua expressão vão ter um transcrito e esse transcrito pode ser utilizado, se tiver marcado, como uma sonda,
porque sonda é qualquer ácido núcleico, desde RNA a DNA que podem utilizar para sondar algo que estejam a
procura ao nível dos ácidos núcleicos.

Também podem pura e simplesmente ter a expressão de um determinado produto, por exemplo
dentro de uma biblioteca não genómica, não de cDNA, mas uma biblioteca de expressão. Da mesma forma
que temos bibliotecas genómicas e bibliotecas de cDNA também podemos ter bibliotecas de expressão, ou

63
Engenharia Genética 2011
seja, produtos de normalmente cDNA que é clonado de forma a poder ser expresso, porque se clonarem cDNA
o cDNA é expresso? Não, porque o cDNA não leva a sua região reguladora da transcrição. Os transcritos não
contêm a sua região reguladora e portanto se clonarem cDNA esse cDNA nunca vai ser expresso. Para ser
expresso então o vector tem que conter os sinais necessários para o inicio da transcrição para que haja
expressão desse cDNA.

Para produzir proteínas de interesse comercial, também podem querer clonar determinado gene
porque têm que produzir aquela proteína em grandes quantidades.

Ou para se estudar, pura e simplesmente, a função de uma determinada proteína. Eu até pus
reticências porque vocês não podem imaginar a quantidade de coisas para que se usa no fundo a clonagem de
expressão, e aqui quando é para estudar funções proteicas é de ganho ou perda de função. Vocês já imaginam
que os sistemas que utilizam, no fundo, para fazer clonagem de expressão variam muito com aquilo em que
estão a trabalhar: se estão a trabalhar em bactérias, se estão a trabalhar com células humanas, se aquilo que
querem ver é in vivo, se aquilo que querem ver é in vitro, se estão a estudar um só gene, se estão a estudar
uma popolação, se querem construir uma vacina, se querem saber qual é o sistema de patogénese de uma
bactéria, se estão a estudar uma proteína de inflamação, estão a ver? Portanto, perante isso, o que é que
temos que pensar quando vamos escolher um sistema de expressão, porque são muitos. A primeira coisa é a
questão biológica. Qual é a questão biológica? O que é que estamos a estudar? O que é que nós queremos?

Segunda coisa: Características dos hospedeiros.

Mesmo dentro de uma determinada questão biológica vocês podem ter vários hospedeiros para
escolher.

Terceira coisa: Níveis de expressão.

Interessa-me ter um nível de expressão alto? Interessa-me ter um nível de expressão baixo?

Quarta coisa: Local onde fica o produto de expressão.

Se o produto de expressão fica dentro da célula ou fora da célula, ou no espaço periplásmico no caso
de E.coli. Se é excretado? Se me interessa que seja excretado? Se prefiro que fique dentro da célula? Qual é o
interesse que tenho?

Quinta coisa: Que modificações é que sofre?

Se for em E. coli eu sei que não sofre modificações pós-traducionais. É importante que sofra essas
modificações? Não é? Eu quero a proteína nativa? Não quero? Quero que essa proteína esteja em fusão com
outra?

Sexta coisa: Quais são as dificuldades técnicas e o orçamento que têm?

Etc, etc…

Às tantas damos em loucos, mas estamos bem orientados. =D

Posto isto, e como disse anteriormente, vocês vão olhar mais uma vez para o fluxo da expressão
génica e vão dizer: “Ok, isto tudo também está relacionado com:

• O número de cópias do meu vector de expressão que estou a utilizar

64
Engenharia Genética 2011
o Se esse vector de expressão tem um número grande de cópias ou não para eu saber a
quantidade de produto que tenho

• Qual a actividade do promotor que o vector tem

o Se é uma actividade forte ou não, vocês sabem que existem promotores mais fortes,
promotores menos fortes e posso querer uma expressão mais controlada, posso até querer
uma expressão que seja induzida.

• Se o RNA é ou não estável

• O codon usage

• Qual a estabilidade da proteína?

• Quais os factores?

Tudo isto tem a ver com o vosso hospedeiro.

Portanto, posto isto, estamos a falar de sistemas de expressão. Se estamos a falar de sistemas de
expressão seja qual for o vector que nos permita expressar, vocês têm dois tipos de vectores, e atenção que
nas aulas práticas já vos falei nisto mas atenção que vocês têm dois tipos de vectores: os vectores que contêm
no fundo a informação para que haja transcrição só. Então vocês têm vectores de fusão transcricional; e vocês
têm vectores que têm os sinais para que haja transcrição e tradução, então têm vectores de fusão traducional.
Só que, e é por isso que vos estou a chamar já à atenção, em 1 e 2 temos um vector que contêm, seja ele qual
for, um sinal responsável pela tradução e vocês vão clonar algo que queiram que seja expresso e aqui a fusão
é transcricional, porque o inicio da proteína pertence ao vector mas a determinada altura o transcrito passa a
ser do que clonámos; e em 3 e 4 temos fusão traducional, ou seja, têm o promotor e ainda mais qualquer
coisa que é responsável pela tradução (e eu digo qualquer coisa porque não quero estar sempre a dizer RBS,
porque em eucariotas não se chama RBS, e por isso é que eu digo sinais responsáveis pelo inicio da tradução)
e depois têm o vosso produto que pode corresponder só, única e exclusivamente, à região codificante.

Mas nas aulas, na prática o que vos falei foi exactamente isto, só que ao contrário. Vocês têm um vector que
tem um produto e vocês clonaram foi o promotor (2 e 4). Vocês fizeram exactamente o contrário, no vector
têm o gene lac Z (podia ser outro gene qualquer que nos permitisse localizar a produção de produto, como
uma fosfatase alcalina, um cloranfenicol acetil-transferase, ou seja, um gene repórter) e também falei-vos que
os nossos vectores da prática são o quê? Promotor e RBS (agora sim porque estamos a trabalhar em E. coli) e
lac Z. Quer no caso 2 quer no caso 4 (que é o que estamos a utilizar nas práticas), um é transcricional outro é
traducional, o que o vector contém é que é diferente. O vector 2 é um Promoter probe porque é específico
65
Engenharia Genética 2011
para detectar a presença de promotores. Mas vocês podem ter vectores como muitos há, do tipo da fig. 1 em
que têm o promotor e é só clonar o que querem expressar.

Portanto isto que acabei de vos falar é o que está aqui representado. Vocês têm no fundo uma fusão
transcricional, porque está aqui tudo o que é responsável pelo inicio da tradução e vocês têm o produto
nativo, completamente; e neste caso aqui já têm uma proteína de fusão porque se aqui estão os sinais de
inicio da tradução, muitas vezes já vão alguns aminoácidos que estão no vector e nesse caso vão ter uma fusão
de proteína.

66