Você está na página 1de 100

BIOLOGIA MOLECULAR

Prof. Dr. José Luis da C. Silva


Aplicando a Biologia Molecular: Tecnologia do DNA
recombinante
 O séc. xx e os avanços na Biologia molecular
 Descoberta das enzimas de restrição/modificação e outras enzimas
com aplicação na biologia molecular
Palíndrome
Extremidades produzidas por enzimas de
restrição

Extremidades coesivas Extremidades abruptas


Estrutura básica de um vetor de
clonagem em E. coli

 Origem de replicação;
 Marcador de seleção;
 Sítio de clonagem.

Tamanho ≈1,2 - 3 kb
PLASMÍDEO
Capacidade máxima de diferentes
vetores de clonagem
vetor Hospedeiro Capacidade (kb)
Plasmídio Escherichia coli 0,1 - 10

Bacteriófago λ E. coli 10 - 20

Cosmídio E. coli 35 -45


Bacteriófago P1 E. coli 70 - 100

BAC (“Bacterial...”) E. coli 50 - 300

YAC (“Yeast...”) Saccharomyces cereviseae 100 - 2000

HAC (“Human...”) Células humanas > 2000


Clonando fragmentos de DNA em plasmídeos
Seleção dos clones recombinantes
Marcas de seleção - resistência
Passos na Clonagem
 Isolamento do DNA genômico
 Clivagem com enzimas de restrição
 ligação dos fragmentos genômicos
 Transformação com plasmídeos ligados
 Seleção dos clones recombinantes

http://br.youtube.com/watch?v=acKWdNj936o&NR=1
Bibliotecas genômicas e cDNA

Bibliotecas de cDNA

Biblioteca genômica em
plasmídeo ou Fago
Produção e clonagem de cDNA

Produção de fármacos
Promotor
cDNA do gene clonado
Produção de proteínas recombinantes

DNA recombinante
Molécula de DNA produzida a partir da combinação de seqüências
de DNA provenientes de diferentes fontes.

Proteína recombinante
Proteína produzida a partir da expressão de uma molécula
de DNA recombinante em um sistema
de expressão adequado.
Por que produzir e purificar proteínas recombinantes?
 Estudos bioquímicos;

 Determinação da estrutura 3D;


 Aplicações biotecnológicas;
 Terapia humana.
Biblioteca de cDNA

Purificação de mRNA eucariótico por cromatografia de


afinidade em coluna de oligo-dT

Hibridização Lavagem (r e tRNA)


Eluição mRNA

Síntese de cDNA a partir de mRNA

Após a síntese de cDNA é feita a adição de adptadores contendo sítios para


enzimas de restrição às extremidades da moléculas.
Inserção de moléculas de cDNA em plasmídio (vetor)
e clonagem em E. coli

Clone
Primeiro sistema de expressão de
proteínas heterólogas

 Baseado no operon lac (operon induzível: transcrição ativada por molécula indutora)

Operon lac

Lactose presente - repressor inativo - transcrição lacZ,Y e A)

Indutores: análogos da lactose


Componentes básicos de um sistema de expressão
baseado no óperon lac
1 - Promotor;
2 - Operador lac (lacO);
3 - Proteína repressora (lacI);
4 - Marcador de seleção;
5 - Indutor: análogo da lactose (alolactose, IPTG...).
produção de proteínas de fusão

A produção de proteínas de fusão facilita a etapa de purificação


 Proteínas em fusão com a proteína ligadora de maltose (MBP) (ex.:vetor pMAL);
 Proteínas em fusão com glutationa S-transferase (GST) (ex.: vetor pGEX1);
 Proteínas com cauda de Histidina (vetor pQE-30).

As Colunas para purificação consistem de:


 Resina de amilose imobilizada (sistema pMAL);
 Glutationa imobilizada em beads de agarose (sistema pGEX);
 Ácido nitrilotriacético imobilizado (sistema pTREX).
Produção de proteínas recombinantes em E. coli
pMAL™: Sistema de expressão e purificação de proteínas em
fusão com a proteína ligadora de maltose (MBP)

Sistema pMAL™

 pMAL-c: 10 μg (with deletion of malE signal sequence)


- Expressão e localização no citoplasma.

 pMAL-p: 10 μg (with normal malE signal sequence)


- Expressão no citoplasma e exportação p/ o periplasma

 Amylose Resin: 15 ml
- Capacidade de ligação ~40 mg.

 Factor Xa: 50 μg
 Anti-MBP antiserum: 25 μl (p/ Western blot)
 MBP2*: 10 μg (marker for SDS-PAGE)
 MBP2-paramyosin-ΔSal: 100 μg (control for cleavage)
 E. coli host

Após a clivagem a proteína de interesse é separada da MBP através da


passagem da mistura nova em coluna de amilose.
Desenho esquemático do vector de expressão pMAL™

Sítio múltiplo de clonagem


Fluxograma para um experimento piloto

IPTG

1 2 3 4 5 6

SDS-PAGE - frações da purificação de


MBP-paramiosina
Algumas companhias que comercializam vetores
de clonagem e expressão

http://www.promega.com

http://www.neb.com

http://www.stratagene.com

http://www.invitrogen.com
Produção de insulina recombinante
(Humulin: Human insulin da Eli Lilley Corporation)

 Primeiro hormônio recombinante disponível comercial para humanos;

 Antes de ser disponibilizada comercial era extraída de pâncreas de animais;

 Atual a forma recombinante é a mais usada no tratamento do diabetes.

Estrutura e biossíntese da molécula de insulina humana


Seq. sinal Cadeia β Peptídeo C Cadeia α
Preproinsulina
Clivagem da sequência sinal de secreção
Cadeia α
Ligações dissulfeto Cadeia β Peptídeo C Cadeia α
Proinsulina
Cadeia β
Clivagem do peptídeo C

Insulina funcional
Modificações pós-traducionais ao longo da via
de biossíntese da insulina
Produção de Insulina recombinante
Expressão de insulina humana em E.
coli. As duas cadeias de insulina são
feitas separadamente como proteínas
de fusão com β-galactosidase. Elas são
processadas quimicamente e então
misturadas, e forma-se uma insulina
ativa.
Modificações pós-traducionais em sistemas de
expressão procarióticos
 Formação de ligações dissulfeto; Não
 Clivagem da cadeia polipeptídica; Sim
 Fosforilação; Sim
 Glicosilação; Não
 Metilação/acetilação; Sim
 Adição de âncoras lipídicas. Sim
Vantagens e desvantagens de sistemas de
expressão heteróloga em E. coli

Vantagens Desvantagens
Genética e fisiologia bem conhecidas Não faz certas modificações pós-traducionais
Enorme variedade de vetores disponíveis Atividade biológica pode diferir da proteína natural

Fácil controle da expressão gênica A bactéria apresenta alto conteúdo de endotoxinas


Facilidade de manutenção em laboratório Falta de um mecanismo de secreção
Alta produção de proteínas heterólogas Formação de corpos de inclusão
Produção de proteínas recombinantes mais complexas
 Hormônio folículo-estimulante humano (h-FSH);
 Hormônio luteinizante humano (h-LH);
 Gonadotrofina coriônica humana (h-CG).

Sistemas de expressão eucarióticos (células de mamíferos)


Algumas proteínas recombinantes disponíveis
para terapia humana
 Insulina (rhI);
 Hormônio do crescimento (rhGH);
 Hormônio folículo estimulante (rhFSH);
 Fator VIII (rhFactorVIII);
 Eritropoetina (EPO);
 Fator estimulante de colônias de granulócitos (rhG-CSF);
 N-acetilgalactosamina-4-sulfatase (rhASB);
 DNAse
 Ativador do plasminogênio tecidual (rhTPA);
 Glicocerebrosidase (rhGBA);
 Interferon-alfa, -beta e gama (rhIFN-alpha, -beta e -gama);
 Fator de crescimento semelhante à insulina (IGF-1).
Avanços em Genômica

Seqüenciamento de DNA
e as aplicações em biologia
Seqüenciamento de DNA
Base do método de Sanger
http://br.youtube.com/watch?v=f1ifyEJ2Gjs&NR=1
Didesoxinucleotídeos
marcados com diferentes
fluorescências
http://br.youtube.com/watch?v=ezAefHhvecM

http://br.youtube.com/watch?v=oYpllbI0qF8&feature=related
Seqüenciador capilar
Megabace 1000
Megabace 1000
Etapas do seqüenciamento
Etapas do seqüenciamento
Em vez de marcações radioativas, os marcadores ligados aos primer
oligonucleotídeos podem ser corantes fluorescentes. Um emissor de cor
fluorescente diferente é usado para cada uma das quatro reações, e as
quatro misturas são submetidas, juntas, á eletroforese. A detecção da
fluorescência é usada nas máquinas de seqüênciamento automatizado de
DNA, que podem ler até 1000 bases em uma separação.
Modelos

Enzimas de restrição
Eletroforese em gel
Como analisar seqüências
biológicas (DNA, RNA e proteína)

GENÔMICA
e
BIOINFORMÁTICA
O que é a “Ciência Genômica”?

É a ciência que estuda a estrutura, o conteúdo e a evolução dos genomas.

Atualmente, “genômica” não se limita ao seqüênciamento de genomas,


mas engloba também a análise da expressão e da função de genes e
proteínas.

O avanço nesta área do conhecimento é indissociável dos avanços na


bioinformática e na biologia computacional.

Atualmente, existem mais de 700 projetos genoma terminados


Um dos objetivos fundamentais da ciência genômica é fornecer dados
que possam facilitar o entendimento da interação entre moléculas
dentro das células e das interações entre células que permitem a
construção de um organismo multicelular.

Genomas: o conhecimento da seqüência completa de DNA de muitos


organismos.
A genômica abrange muitos dos aspectos relativos à biologia celular e

molecular: os diferentes tipos de mapas genômicos; seqüênciamento dos

ácidos nucléicos; reunião, armazenamento e manuseio de dados;

identificação de genes; análise funcional; evolução de genomas; e outras

áreas interdisciplinares que se relacionam a uma grande variedade de

genomas em diferentes organismos.


A genômica é é dividida em duas áreas básicas:

Genômica estrutural: é a completa e precisa elucidação da seqüência de


DNA de um genoma haplóide representativo de uma determinada
espécie.

Um genoma eucariótico, contido nos cromossomos, é muito maior do


que um genoma procariótico, que consiste em um cromossomo circular
com genes organizados compactamente.
Genômica funcional:

Transcriptomas: o conhecimento de todos os RNAs transcritos em um


dado tipo de célula.

Proteomas: o conhecimento de todas as possíveis formas e funções das


proteínas.
Interrelações da genômica
Técnicas aplicadas na genômica
Genomas completos ou parcialmente seqüenciado e publicado
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj
Estratégia de Seqüênciamento do Genoma

1a. Etapa: Construção de bibliotecas genômicas para


seqüênciamento tipo “shotgun” (força bruta ao acaso).

2a.Etapa: Seqüênciamento de 100.000 clones aleatórios

3. Ordenamento destas seqüência em contíguos produzindo um


esqueleto do mapa físico do genoma. (Bioinformática).
4a. Etapa: Seqüênciamento das extremidades de cosmídeos
contendo inserto de 20-40.000 pares de bases visando preencher
descontinuidades, reforçar os contíguos e refinar o mapa físico.

5a. Etapa: Anotação e garimpagem de dados (data mining) do


genoma para a identificação dos genes e suas funções. Deverá
correr paralelamente com o seqüênciamento.
Etapas no seqüenciamento
a) Na estratégia de shotgun, todo o DNA genômico de um organismo é fragmentado
em pequenos pedaços (1), que são clonados em vetores de pequeno porte, como
plasmídeos, para o posterior seqüênciamento. b) Na estratégia de shotgun
hierárquico, normalmente utilizada para grandes genomas, realizam-se dois passos.
(1) Primeiramente fragmenta-se o genoma em grandes pedaços, que são clonados
em vetores de grande porte, como BACs ou YACs. (2) Posteriormente realiza-se
uma segunda etapa de shotgun, onde as seqüências contidas nesses vetores são
fragmentadas em pequenos pedaços e clonadas em vetores de pequeno porte, que
serão seqüenciados.
Análise Computacional
das Seqüências de DNA
Estrutura da Rede de Computadores

PC1 PC2

PC3
HUB

Firewall
Servidor Web PCn
Servidor FTP
INTERNET
Pentium II/III

Sun 450 Enterprise


(4 processadores 4 – 12 MB
Instituições participantes do projeto de RAM 300 GB de HD)
Processamento das seqüências
 Recebimento via rede
 Renomeação
On-line
 Validação
 Montagem do genoma Central de
processamento
Grande parte dos bioinformatas modernos trabalha com dados de

projetos genoma ou transcriptoma. Em projetos genoma adota-se a

abordagem de fragmentar todo o genoma de um organismo em pequenos

pedaços e de seqüenciar tais pedaços, utilizando programas

computacionais para montá-los e reconstituir a informação genômica

inicial. Essa estratégia é adotada principalmente devido à restrição do

tamanho da seqüência que pode ser lida nos seqüenciadores. Mesmo os

mais modernos conseguem ler apenas cerca de 1000 pares de base em

cada corrida.
Os dados brutos provenientes do seqüenciador de DNA são

normalmente submetidos diretamente a algum programa de base calling.

O base calling consiste no processo de leitura dos dados do

seqüenciador e identificação da seqüência de DNA gerada, atribuindo

ainda um valor de qualidade para cada posição nucleotídica identificada.

Normalmente cada seqüenciador apresenta um programa de base calling

associado. Entretanto, o programa mais utilizado nessa etapa é o

PHRED.
Phred – base calling
Phred – qualidade dos reads

Alta qualidade

Média qualidade

Baixa qualidade
Validação

 Valor Phred ≥ 20 em um mínimo de 400 bases


 Phred 20 = 1 erro em 100 (102)
 Phred 30 = 1 erro em 1.000 (103)
 O valor phred é determinado para cada base em
uma leitura
Montagem do genoma

 Phred – identificação de bases (base calling) e valores de


qualidade
 Cross-match – identificação de seqüências de vetor
 Phrap – montagem das seqüências contíguas (contigs)
 Consed – análise e edição dos contigs
 Finalização – fechamento de falhas (Scaffold), determinação
de genes (BLAST/Glimmer) e anotação (Artemis/Sequin)
Phrap
Após a geração de arquivos sem contaminantes, contendo a identificação
das bases e a qualidade, todas essas informações são repassadas a um
software de montagem como o PHRAP, o CAP3 ou o TIGR Assembler. O
software mais utilizado nessa etapa, o PHRAP (Phragment Assembly
Program) é o programa responsável pela leitura das informações do base
call e montagem dos pequenos fragmentos de DNA seqüenciados em
seqüências maiores, os contíguos (contigs).
Phrap

Contig 1

reads

Contig 2
Consed
A visualização e edição das seqüências geradas após a montagem são
realizadas normalmente através do programa Phrapview ou Consed
Finalização – fechamento de
falhas

Contig 1 Contig 2 Contig 3

iniciador
cosmídeo
A partir da anotação de seqüências nucleotídicas procura-se,
primeiramente, identificar a natureza de uma determinada seqüência.
Devemos descobrir se tal seqüência está inserida em uma região gênica, se
representa uma molécula de RNA transportador ou RNA ribossômico, se
pertence a algum tipo de região repetitiva já descrita ou se apresenta
algum marcador genético conhecido em seu interior.

O principal objetivo dessa etapa é construir um mapa do genoma do


organismo, posicionando cada um dos possíveis genes e caracterizando as
regiões não-gênicas.
Finalização – determinação de genes e ORFs

BLAST

Glimmer

BLAST é o programa de alinhamento mais utilizado no mundo. Realiza a busca


por seqüências homólogas em banco de dados de ácidos nucléicos e proteínas. O
programa BLAST 2 consiste no algoritmo BLAST para alinhamento de duas
seqüências.
O Projeto Genoma Humano (PGH) consistiu num esforço
internacional para o mapeamento do genoma humano, e a
identificação de todos os nucleótidos que o compõem.
Após iniciativa dos Institutos Nacionais de Saúde
estadunidenses (National Institutes of Health –NIH),
centenas de laboratórios de todo o mundo se uniram à
tarefa de sequenciar, um a um, os genes que codificam as
proteínas do corpo humano e também aquelas seqüências
de DNA que não são genes.

Laboratórios de países em desenvolvimento também


participaram do empreendimento com o objetivo de
formar mão-de-obra qualificada em genômica.
Seqüenciamento do Genoma Humano

 2003: Consórcio público apresenta versão final


do seqüenciamento do genoma humano
 Comprimento total: 3 bilhões pb

 99% deste total foi seqüenciado

 Erro de seqüenciamento estimado em 1/10.000 nt

 99.9% não apresenta diferenças entre indivíduos.

 25.000 genes

 Genes codificadores de proteínas correspondem a


apenas 2% do genoma

 50 % do genoma consiste de regiões repetitivas


(D.melanogaster 3%, C.elegans 7%)
Projetos Genomas
http://www.ncbi.nlm.nih.gov/
Celera Genomics – Iniciativa privada

Whole genome shotgun (WGS)

Genoma

Biblioteca genômica
Plasmídeo (inserto 10 kb)
BAC (inserto 100 kb)

Leituras ou reads

Seqüenciamento das
extremidades
do inserto
Celera Genomics – Iniciativa privada

Whole genome shotgun (WGS) – Montagem

Mate pairs

AGCGTTA
GTTACAAC

AGCGTTACAAC

Contig
Celera Genomics – Iniciativa privada

Whole genome shotgun (WGS) – Montagem

Mate pairs

Contig Contig
Celera Genomics – Iniciativa privada

Whole genome shotgun (WGS) – Montagem

BAC contendo
Mate pairs inserto de
maior
comprimento

Contig Contig
Celera Genomics – Iniciativa privada

Whole genome shotgun (WGS) – Montagem

Mate pairs

Contig Contig

Mate pairs

Scaffold
Contig Contig
Consórcio público
Mapeamento físico, shotgun hierárquico

Cromossomo

Biblioteca genômica
em BAC (inserto 100Kb)

Fragmento cromossômico

Biblioteca genômica
em BAC
Consórcio público
Mapeamento físico, shotgun hierárquico -
Montagem
BAC

Biblioteca
Plasmídeo (inserto 10 kb)

Leituras ou reads

Seqüenciamento das
extremidades
do inserto
Consórcio público
Mapeamento físico, shotgun hierárquico -
Montagem

Mate pairs

AGCGTTA
GTTACAAC

AGCGTTACAAC

Contig
Avaliação de estratégias de
seqüenciamento

Vantagens WGS

• Estratégia mais simples com menos etapas.

Vantagens Shotgun Hierárquico

• Menos vulnerável que a estratégia WGS em


relação a montagem de regiões repetitivas.
In silico
Base-calling
• Geração de uma seqüência de nucleotídeos através da
análise dos chromatogramas

PHRED

gaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcc
cgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgttt
ttgttgtcgttgttgcagcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgt
actaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaaggga
agagtgaaagtcgag
Mascaramento
• Eliminar fragmentos de vetor
cross_match

>5’
gctccaccgcggtggcggccgctctagaactagtggatcccccgggctgcaggaattcggcacgagagttct
cccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcg
catcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgca

>3’
gcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgag
gttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgaggg
ggggcccggtacccaattc
Montagem
• Produzir uma seqüência contígua através de
seqüências menores que possuam regiões de
sobreposição
PHRAP, Celera Assembler, Arachne

leituras

contig
Anotação
• Localizar na seqüencia genômica final:
• Genes que codificam proteínas e RNAs não traduzidos
(tRNA, rRNA, snRNA)

• Determinar, se possível, o produto provável de cada


gene encontrado.

• Associar cada gene à uma categoria funcional ou via


metabólica. Ex.: síntese de lipídeos, maquinaria de
tradução, fosforilação oxidativa, etc.
Anotação Automática

contig

Glimmer RBSfinder GeneMark tRNAscan

CDS
Anotação Automática

BLAST contra KEGG BLAST contra COG PSORT

BLAST contra GenBank Interpro

Anotação manual
Anotação – Mapa final

Streptococcus pneumoniae R6

Você também pode gostar