Você está na página 1de 49

Projetos Genoma

Disciplina: Biologia Molecular


UNIFESP
Prof. Andr L. Vettore
andre.vettore@gmail.com

Um pouco de histria....
1953 A estrutura molecular do DNA

Francis Crick 1916 - 2004

James Watson 1928 -

Maurice Wilkins 1916 - 2004

Rosalind Franklin 1920 - 1958

Um pouco de histria....
1953 A estrutura molecular do DNA

Francis Crick 1916 - 2004

James Watson 1928 -

Maurice Wilkins 1916 - 2004

Rosalind Franklin 1920 - 1958

Por suas descobertas a respeito da estrutura molecular dos cidos nuclicos e sua significncia para a transferncia da informao nos seres vivios Nobel de Fisiologia ou Medicina, 1962

Um Pouco de Histria.....
1977 Seqenciamento do DNA

Frederick Sanger 1918

Walter Gilbert 1932

por suas contribuies a respeito da determinao da seqncia de bases dos cidos nuclicos Nobel de Qumica - 1980

Um Pouco de Histria.....
1983 Reao em Cadeia da Polimerase

pela inveno do mtodo da Reao em Cadeia da Polimerase (PCR)" Nobel de Qumica, 1994
Kary Mullis 1944 -

Seqenciamento Manual
1977 - 1995

Fazer o Gel Eletroforese Expor Filme de Raio X Leitura

Em 1993
3.000nt / 6 meses 3.000nt / 180 dias 3.000nt / 259.200 minutos 0,01nt / min. ou 1nt/100 min.

Seqenciamento Automtico
1995 - hoje

Hoje
384 x 500nt / 2 horas 384 x 500nt / 120 minutos 92.000nt / 120 minutos 1.600nt / minuto

O Banco de Dados GenBank


Em 1982.
606 seqncias 680.338 nucleotideos

Em 2005.
52.016.762 seqncias 56.037.734.462 nucleotideos

http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html

Projeto Genoma
Seqenciamento Completo do Genoma
Regio Gnica e Regio Intergnica

EST Expressed Sequence Tag


Regies que codificam protenas (Genes)

Uma Data Histrica


28 de Julho de 1995

Bactria
1,6 Mb - 1.700 genes
Fleichmann et al. (1995), Science 269:496

1997
Eukaryote
12 Mb - 6.000 genes [Nature 387:5-105 Suppl]

1998
Animal
100 Mb - 18.000 genes [Science 282:1945]

2000
Insect
130 Mb - 13.000 genes [Science 287:2185]

2000
Plant
120 Mb - 26.000 genes [Nature 408:791]

2000
Bacteria Plant pathogen
2,6 Mb - 3.000 genes [Nature 406:151]

2001
Human

2002
Plant

2002
Parasite - Host
23 Mb - 5.300 genes [Nature 419:498] 278Mb 14.000 genes [Science298:129]

2002-2004
Mouse - Rat
2,5 Gb - 30.000 genes [Nature 420:520]

2005
Chimpanzee
2,5 Gb - 30.000 genes [Nature 437:69]

3,2 Gb - ~25.000 genes 420 Mb - 35.000 genes [Nature 409:745] [Science 296:79] [Science 291:1304]

2,7 Gb - 21.000 genes [Nature 428:493] http://www.genomesonline.org/

Genomas Completos
Completos:
Procariotos

1.129
1.011
580 Kb 9.105 Kb

Mycoplasma Bradyrhizobium

Eucariotos

118

P. troglodytes S. cereviciae

G. gallus

C. elegans

D. melanogaster

A. thaliana

H. sapiens

R. norvegicus

Vitis vinifera

Candida

Guillardia

M. mullata

S. pombe

O. sativa

Plasmodium

C. lupus

A. aegypti

Debaryomyces

Anopheles

Mus musculus

A. mellifera

T. cruzi

C. briggsae

C. hominis

http://www.genomesonline.org/

Genomas em Andamento
Em Andamento:
Procariotos Eucariotos

4.690
3.477 1.213

Protozorios Fungos Nematides (Ascaris suum) Plantas (Milho, Trigo, Tomate, Algodo, Soja) Insetos (bicho-da-seda) Anfbios (Xenopus) Aves (peru, pavo) Peixes (salmo, tubaro) Mamferos (vaca, gato, porco, elefante, coelho, ovelha)

http://www.genomesonline.org/

O Projeto Genoma Humano

O Projeto Genoma Humano


James Watson escolhido para coordenar o Projeto
Incio: Previso de Trmino: 1990 2005

Custo Estimado
3 bilhes de dlares

Participantes
EUA, Inglaterra, Japo, Frana e Alemanha

As Metas do HGP
Determinar a seqncia dos 3 bilhes de nucleotdeos do genoma humano Identificar todos os genes humanos Estocar esta informao em banco de dados Implementar as ferramentas de anlise Encaminhar as questes ticas, legais e sociais que vierem a surgir

Fbricas de Seqncias

1.000 nt/seg

O Homem caminha na Lua


O HGP pode ser comparado ao Projeto Appolo que levou o Homem a Lua

http://cagle.slate.msn.com/news/gene

Da Lua para a Terra


Teflon

Velcro

Alimentos liofilizados

Lentes de proteo contra UVA e UVB

1994 - Substituio na Coordenao

James Watson

Francis Collins

1998 8 anos de projeto........


Metade do prazo estimado (15 anos) j havia se esgotado

Apenas cerca de 6% (~200 Mb) do Genoma Humano havia sido decodificado

1,8 bilho de dlares

1998 Comea a Corrida


Craig Venter funda a Celera Genomics Corp.
Anuncia que sua empresa concluir o seqenciamento do Genoma Humano em apenas 3 anos Em 4 meses decodifica o genoma da Drosophila melanogaster (130Mb)

Dois Grupos Independentes

International Human Genome Sequencing Consortium

Francis Collins

Craig Venter

Consrcio Pblico 1990

Privado 1998

Diferentes Estratgias
Seqenciamento Hierrquico
Quebrar os cromossomos em pedaos grandes (100-200 kb) Mapear os pedaos nos cromossomos Seqenciar apenas os pedaos com pequena sobreposio

Genoma Completo
Biblioteca de BACs (~ 200 kb) Clones Ordenados
DNA Genmico

Seqenciamento dos BACs

Shotgun dos BACs (~ 5kb)

...ATGTTGGGCCACAGTTGACCATTGAAACTG GTTGACCATTGAAACTGACCTTGACGTAACGT....

Alinhamento das Seqncias Seqncia nica

...ATGTTGGGCCACAGTTGACCATTGAAACTGACCTTGACGTAACGT...

Diferentes Estratgias
Shotgun do Genoma Inteiro
Quebrar os cromossomos em pedaos pequenos (~5 kb) Seqenciar todos os pedaos Deixar o computador organizar os pedaos em uma seqncia coerente (maior parque
computacional civil do mundo)

Shotgun Total
Biblioteca de BACs Clones Ordenados
DNA Genmico

Seqenciamento dos BACs Shotgun dos BACs

...ATGTTGGGCCACAGTTGACCATTGAAACTG GTTGACCATTGAAACTGACCTTGACGTAACGTGGTA....

Alinhamento das Seqncias Seqncia nica

...ATGTTGGGCCACAGTTGACCATTGAAACTGACCTTGACGTAACGTGGTA...

Avano Notvel !!!!

Avano Notvel !!!!

Ch na Casa Branca

26 de Junho de 2000
Um rascunho da seqncia

26 de Junho de 2000
Um rascunho da seqncia
O Consrcio Pblico do Genoma Humano e a Celera Genomics anuciaram, conjuntamente, que haviam concludo um rascunho (90% completo) da seqncia do DNA humano

15 e 16 de Fevereiro de 2001

14 Abril de 2003
A Seqncia Referncia
50 anos aps a descoberta da estrutura em dupla-hlice do DNA, a cumunidade cientfica celebrou a elucidao da Seqncia Referncia do DNA humano O Consrcio Pblico do Genoma Humano anunciou a concluso do trabalho de seqenciamento e a disponibilidade de Seqncia Referncia (99,9%) do DNA do Homo sapiens Apenas 341 contigs

Esta seqncia esta disponvel para todos


(http://www.ncbi.nlm.nih.gov/genome/seq/)
Nature (2003), 422:787-929

Os Resultados do HGP
O maior genoma seqenciado at agora
2,85 bilhes de nucleotdeos

3 bilhes de nucleotdeos ???


O DNA contido em 1 clula = 2 metros Cabea de 1 alfinete = 200 cels. = 400m DNA

Corpo Humano = 100 trilhes cels. = 200X Sol-Terra

3 bilhes de nucleotdeos ???


9,5 anos para ler em voz alta 400 listas telefnicas (1.000 paginas cada)

Os Resultados do HGP
Somos 99,9% geneticamente idnticos

Ou seja, somos diferentes uns dos outros em apenas 0,1% do genoma

Os Resultados do HGP
0,1% do genoma = 3 milhes de posies

Willie Shoemaker
Altura: 1,52 m Peso: 42 kg

Wilt Chamberlain
Altura: 2,13 m Peso: 136 kg

Os Resultados do HGP
0,1% do genoma = 3 milhes de posies

Bao Xishun
Chins Altura: 2,36 m

He Pingping
Chins Altura: 73 cm

Os Resultados do HGP
Humanos e chimpanzs so 97% idnticos geneticamente
(3% do genoma = 90 milhes de posies)

Quantos genes ns temos ?


Organismo
Bacteria (E. coli) Levedura (S. cerevisiae) Mosca (D. melanogaster) Verme (C. elegans) Planta (A. thaliana) Human (Homo sapiens)

Tamanho do Genoma
4.6 million 12.1 million 137 million 97 million 120 million 3 billion

Nmero de Genes
3.200 6.000 13.000 18.000 26,000 ??????

Quantos genes ns temos ?

Nature Genetics 25:232-234 (01 Jun 2000)

Nature Genetics 25:239-240 (01 Jun 2000)

O Livro da Vida
Hino Nacional

Quantos genes ns temos ?


tgaggaacggtgcctggaaaagggcaagaatatccggcatgggcatgagtagcttgaaactgctgaagtatgtcctgttttt cttcaacttgccttttggatctgtggctgctgcattttgggctttgggatctacctgctgatccacaacacttcggagtgct cttccataacctcccctccctcacgctgggcaatgtgtttgtcatcggggctctattatcatggtagttgccttcctgggct gcatgggctctatcaaggaaaacagtgtctgcttatgtcgttcttcatcctgctgctgattatcctccttgctgaggtgacc tggccatcctgctctttgtatatgaacagaagctgaatgagtatgtggctaagggtctgacgacagcatccaccgttaccac tcagacaatagcaccaaggcagcgtgggactccatccgtcatttctgcagtgttgtggtataaatggcacgagtgattggac cagtggcccaccagatcttgcccctcagatcgaaaagtggagggttgctatgcgaaagcaagactgtggtttcttccaattt cctgtatatcggaatcatcaccatctgtgtatgtgtgattgaggtgttgggatgtcctttgcactgaccctgaactgccaga ttgacaaaaccagccagaccatagggcatgatctgcagtagttctgtggtgaagagacttgtttcatctccggaaatgcaaa accattatagcatgaagccctacatgatcactgcaggatgatcctcctcccatcctttcccttttaggtccctgtcttatac aaccagagaagtgggtgttggccaggcacatcccatctcagcagcaagacaatctttcactcactgacggcagcagccatgt ctctcaaagtggtgaaataatatctgagcatcttttagacaagagaggcaaagacaaactggatttaatggcccaaatcaaa gggtgaacccaggatatgaatttttgcatcttcccattgtcgaattagtctccgcctctaaataatgcccagtcttctcccc aaagtcaagcaagagactagttgaagggagtctggggccaggctcactggaccattgtcacaaccctctgtttctctttgac taagtgcctggctacaggaattacacagttctctttctccaaagggcaagatctcatttcaatttcttattagagggcctta ttgatgtgttctaagtctttccagaaaaaaactatccagtgattatatcctgatttcaaccagtcacttagctgataatcac agtaagaagacttctggtatatctctctatcagataagattttgttaatgtactattttactcttcaataaataaaacattt attatctcaaaatagccccggatatctgtgttaccagccttgtctcggccacctcaaggaaatcactaaattctgccgaaag gactgaggaacggtgcctggaaaagggcaagaatatccggcatgggcatgagtagcttgaaactgctgaagtatgtcctgtt tttcttcaacttgccttttggatctgtggctgctgcattttgggctttgggatctacct

Quantos genes ns temos ?


tgaggaacggtgcctggaaaagggcaagaatatccggcatgggcatgagtagcttgaaactgctgaagtatgtcctgttttt cttcaacttgccttttggatctgtggctgctgcattttgggctttgggatctacctgctgatccacaacacttcggagtgct cttccataacctcccctccctcacgctgggcaatgtgtttgtcatcggggctctattatcatggtagttgccttcctgggct gcatgggctctatcaaggaaaacagtgtctgcttatgtcgttcttcatcctgctgctgattatcctccttgctgaggtgacc tggccatcctgctctttgtatatgaacagaagctgaatgagtatgtggctaagggtctgacgacagcatccaccgttaccac tcagacaatagcaccaaggcagcgtgggactccatccgtcatttctgcagtgttgtggtataaatggcacgagtgattggac cagtggcccaccagatcttgcccctcagatcgaaaagtggagggttgctatgcgaaagcaagactgtggtttcttccaattt cctgtatatcggaatcatcaccatctgtgtatgtgtgattgaggtgttgggatgtcctttgcactgaccctgaactgccaga ttgacaaaaccagccagaccatagggcatgatctgcagtagttctgtggtgaagagacttgtttcatctccggaaatgcaaa accattatagcatgaagccctacatgatcactgcaggatgatcctcctcccatcctttcccttttaggtccctgtcttatac aaccagagaagtgggtgttggccaggcacatcccatctcagcagcaagacaatctttcactcactgacggcagcagccatgt ctctcaaagtggtgaaataatatctgagcatcttttagacaagagaggcaaagacaaactggatttaatggcccaaatcaaa gggtgaacccaggatatgaatttttgcatcttcccattgtcgaattagtctccgcctctaaataatgcccagtcttctcccc aaagtcaagcaagagactagttgaagggagtctggggccaggctcactggaccattgtcacaaccctctgtttctctttgac taagtgcctggctacaggaattacacagttctctttctccaaagggcaagatctcatttcaatttcttattagagggcctta ttgatgtgttctaagtctttccagaaaaaaactatccagtgattatatcctgatttcaaccagtcacttagctgataatcac agtaagaagacttctggtatatctctctatcagataagattttgttaatgtactattttactcttcaataaataaaacattt attatctcaaaatagccccggatatctgtgttaccagccttgtctcggccacctcaaggaaatcactaaattctgccgaaag gactgaggaacggtgcctggaaaagggcaagaatatccggcatgggcatgagtagcttgaaactgctgaagtatgtcctgtt tttcttcaacttgccttttggatctgtggctgctgcattttgggctttgggatctacct

Introns

Exons

Quantos genes ns temos ?

Celera

HGP Consortium

31,830

25,271

Quantos genes ns temos ?


Celera X HGP Consortium
Celera
(31,830)

HGP Consortium
(25,271)

15,978

15,852

9,919

somando.... temos 41,749

Hogenesch J.B. et al. (2001), Cell 106:413

Os Resultados do HGP
22.287 genes (20.000 - 30.000)

Você também pode gostar