Você está na página 1de 32

Complexidade

de
Genomas

Genoma
Termo criado por Hans Winkler, professor de botânica,
em 1920.

GENe + cromossOMA

O que é Genoma ?

• É o conjunto de todo o material genético que


estabelece a identidade de uma determinada
espécie

• Genoma = (DNA nuclear + DNA citoplasmático)

1
Tipos de Genomas

• DNA (ssDNA ou dsDNA): a maior parte dos


organismos
• RNA (ssRNA ou dsRNA): vírus

• Circulares: genomas de procariotos, mitocôndria,


cloroplasto, vírus, plasmídeos
• Lineares: cromossomos de eucariotos, alguns vírus

Elementos que compõem os genomas

• Cromossomos
• genes “housekeeping“

• Elementos extra-cromossomais
• plasmídios
• DNA de organelas

Tamanhos de genomas
Mimivírus e Mamavírus

2
Mimivírus: um vírus gigante
1,18 Mb: 979 proteínas! (2003)

Acanthamoeba polyphaga

Virófagos (2008)

Sputinik é um vírus parasita do


mimivírus

Os vírus são seres vivos ???


Partículas gigantes de
mimivírus (vermelho) e vírus
satélite de mimivírus
chamado Sputnik (verde)

Megavirus chilensis
(PNAS, outubro de 2011)

1,25 Mb: 15% maior que o mimivírus – 1.120 proteínas

3
Pandoravirus salinus – julho de 2013
O maior genoma viral
Philippe, N. et al. Science 341, 281–286 (2013)

• 0,7 µm - 2,5 Mb
• 93% dos genes não têm homologia com nada
conhecido !
• Origem a partir de um quarto domínio da vida ??

Pithovirus sibericum – março de 2014


Legendre et al. Proc Natl Acad Sci U S A. 2014 Mar 3

• Pithovirus sibericum
• 30 mil anos de idade
• 1,5 µm – 1,25 Mb
• Parasita de amebas

Outros genomas
Organismo Tamanho do genoma (pares de bases)

Vírus, Fago ΦX174; 5386 – Primeiro genoma sequenciado


4
Vírus, Fago λ 5×10
5
Archae, Nanoarchaeum equitans 5×10 – Menor genoma não-viral (Dez, 2005)
5
Bacteria, Buchnera aphidicola 6×10
5
Bacteria, Wigglesworthia glossinidia 7×10
6
Bacteria, Escherichia coli 4×10
11
Ameba, Polychaos dubium 6.7×10 – Maior genoma ! (Dez, 2005)
8
Planta, Arabidopsis thaliana 1.2×10 – Primeiro genoma de planta (Dez, 2000)
11
Planta, Fritillaria assyrica 1.3×10
7
Fungos, Saccharomyces cerevisiae 2×10 – Primeiro genoma eucariótico sequenciado (1996)
7
Nematódeo, Caenorhabditis elegans 8×10
8
Inseto, Drosophila melanogaster 1.3×10
9
Mamífero, Homo sapiens 3×10

4
Genomas x número de genes

Bactérias → tamanho do genoma está relacionado com o número


de genes

Eucariotos → tamanho do genoma NÃO está relacionado com o


número de genes ou com a complexidade do
organismo

Razões:
- muito DNA intergênico (DNA entre genes)
- presença de íntrons
- muito DNA repetitivo

Genomas procarióticos x eucarióticos

Procariotos Eucariotos

Genoma compacto e Grandes blocos de DNA


econômico que nada codificam (?)

Múltiplas cópias
Sequências únicas de sequências
particulares
Genes interrompidos
Genes não-interrompidos
com íntrons

A questão dos genes interrompidos

5
Organismos com genomas maiores tendem a ter genes com mais
íntrons
• Levedura (uma exceção): só 4% dos genes têm íntrons
• Drosophila: 83% genes têm íntrons, poucos íntrons/gene
• Mamíferos e plantas: 94% genes têm íntrons, muitos íntrons/gene

Nota: não há correlação entre tamanho do gene e do mRNA

Gene da Distrofia Muscular de Duchenne (DMD) tem alto


número de íntrons
• 2,4 Mb: maior gene humano com mais de 60 éxons!
• mRNA maduro tem ~14 kb
• Codifica a distrofina (~500 kDa), presente no músculo esquelético e
cardíaco

O DNA repetitivo

1) Famílias multigênicas (genes funcionais)

2) Família de DNA extragênico repetitivo (DNA não-


transcrito)

Famílias Multigênicas
1) Famílias Multigênicas Conjunto de genes originados por duplicação e
variação de algum gene ancestral. Estes genes podem
• surgem por duplicação e posterior divergência estar reunidos nos mesmo cromossomo ou dispersos
• podem estar dispersos ou agrupados (“clusters”)
em cromossomos diferentes. São exemplos de famílias
multigênicas as que codificam as hemoglobinas,
Tipos: imunoglobulinas, antígenos de histocompatibilidades,
actinas, tubulinas, queratinas, colágenos, proteínas de
1.1. DNA repetitivo que codifica RNA (rDNA, tRNA, snRNA) choque térmico, proteínas adesivas salivares, proteínas
• rDNA: 100 cópias/genoma haploide (0,4% genoma humano) coriônicas, proteínas de cutícula, proteínas vitelínicas,
• organização in tandem
e faseolinas, bem como as histonas, RNA ribossômico,
• localiza-se no nucléolo
e genes de RNA de transferência. Os últimos três são
• em Xenopus, os genes 18S, 5.8S, 28S repetem-se 500 vezes!
exemplos de genes repetidos, onde centenas de genes
• cada cluster tem uma unidade transcricional separada por
DNA espaçador não-codificador idênticos estão presentes e ordenados em fila.

6
Organização do rDNA

1.2. DNA repetitivo que codifica para proteínas

Família das histonas - os 5 genes que produzem histonas


podem estar em um "cluster" que se repete várias vezes, ou
podem estar dispersos, como em alguns vertebrados.

Distribuição dos genes das histonas


em humanos

7
Família da globina. A hemoglobina é formada por duas cadeia
 e duas β de globina.

Família   cromossomo humano 16


Família β  cromossomo humano 11

Obs: Em algumas famílias, alguns membros não são


funcionais, são os pseudogenes (relíquias evolutivas).

• Família : genes ativos: , 2 genes  idênticos e os


pseudogenes : , , , 

• Família β: 5 genes funcionais: ε, 2 genes γ diferentes, δ, β e


1 pseudogene ()

As diferentes cadeias das globinas são utilizadas de acordo


com o desenvolvimento do embrião

Outras famílias

8
2) Família de DNA extragênico repetitivo

Dividem-se em 2 classes:
• Repetições in tandem
• Repetições interespaçadas (“interspersed”)

2.1. Repetições in tandem


DNA satélite (STD = “short tandem repeats”):
• descoberto por sua densidade em gradientes de cloreto de césio
• tamanho médio variado
• correspondem às sequências alta ou moderadamente repetitivas
• formam parte da heterocromatina, que se localiza, sobretudo, nos
centrômeros (“DNA alfoide”)
• existem diversas famílias de DNA satélite

DNA satélite no centrômero em camundongo


DNA satélite em Drosophila
(hibridação in situ)

DNA minisatélite
• tamanho médio de ~7 pb
• localizam-se nos telômeros ou em outras regiões
• a telemorase adiciona repetições de TTAGGG

DNA microsatélite
• 1-4 pb
• totalmente dispersos
• (A)n , (T)n, (CA)n  forma Z-DNA in vitro mas não se sabe se o mesmo
ocorre in vivo
Obs: Os minisatélites são também chamados de VNTR ("variable number
tandem repeats")
São usados no teste de paternidade (“DNA fingerprinting”) pois há uma
grande variação no número de cópias destes elementos entre diferentes
indivíduos gerando polimorfismo genético.

9
2.2. Repetições interespaçadas

SINE ("short interpersed elements”)

Espalhados pelo genoma, não codificam proteínas, podem “saltar” e se


inserir em certos genes causando doenças, como a neurofibromatose-1
(“Mal do Homem Elefante”).

Exe: "Sequências Alu" (~300 pb) que correspondem a 10% do genoma (1


milhão de cópias). Trata-se de um retrotransposon.

LINE ("long interpersed elements")

Maiores que os SINEs, (7000 pb). Assim como os SINE, podem causar
doenças por ruptura gênica.

Exe: “Kpn repeats” (também chamados de Line-1)

Os elementos móveis correspondem a quase 50% do genoma


humano e de outros primatas !

Joseph Merrick (1862-1890)


NF1 ou Síndrome de Proteus???

Composição de sequências repetidas

Quase metade do genoma humano é formado por elementos


transponíveis, embora a atividade deles esteja bem reduzida na
linhagem humana

10
Como se originam as repetições?
• Transposição duplicativa
• Crossing-over desigual

• “Escorregão” da DNA Polimerase durante a replicação


• Amplificação gênica (rolling circle)

Amplificação Gênica
Pode ocorrer para certos genes a fim de suprimir
necessidades durante o desenvolvimento.
Exe:
• rDNA de Xenopus  forma DNA extracromossomal circular
com várias cópias in tandem
• cromossomos politênicos  durante desenvolvimento de
insetos
• amplificação devido à pressão seletiva  metotrexato induz a
amplificação do gene DHFR em Leishmania

Genoma de organelas
• Extranuclear, origem endossimbiôntica: DNA mitocondrial Operon (em francês) ou operão é um
(mtDNA) e de cloroplasto (cpDNA) conjunto de genes nos procariontes e em
alguns eucariontes que se encontram
• Circulares, pequenos, estrutura parecida com operon, funcionalmente relacionados, contíguos e
proteínas ribossomais semelhantes às de procariotos
controlados coordenadamente, sendo
• Alguns genes têm íntrons todos expressos em apenas um RNA
mensageiro. Ou seja, é constituído pelo
• mtDNA humano: 16,5 kb: 13 proteínas, 22 tRNA, 2 rRNA promotor, o operador e os genes
estruturais.

11
• São considerados DNA repetitivos pois, embora haja uma
só cópia dos genes/círculo, há várias cópias do
círculo/célula

• Minicírculos e maxicírculos de T. cruzi formam o k-DNA


(DNA do cinetoplasto)

k-DNA

O Genoma
Humano

O genoma humano

DNA mitocondrial: 16.569 pb  37 genes

DNA nuclear: ~3 bilhões de pb  100.000 genes (previsto)

12
Projeto Genoma Humano (HGP)
- Consórcio Público -

• Iniciativa pública, lançamento oficial em 1990

• Pelo menos 18 países participaram (Austrália, Brasil, Canadá, China,


Dinamarca, União Europeia, França, Alemanha, Israel, Itália, Japão, Coréia,
México, Holanda, Rússia, Suécia, Reino Unido, EUA)

Objetivos:

 Sequenciar os 3 bilhões de pares de bases do genoma humano identificando


os 100.000 genes previstos,

 Depositar e disponibilizar estas sequências em bancos de dados,

 Desenvolver ferramentas computacionais para a análise das sequências,

 Transferir tecnologia para o setor privado,

 Discutir as questões éticas, legais e sociais que fossem levantadas.

• Human Genome Organization (HUGO): coordenação geral

• Mais de 1.100 cientistas trabalharam no projeto durante toda


uma década e foram gastos cerca de US$ 3 bilhões.

• As sequências foram depositadas no GenBank


(http://www.ncbi.nlm.nih.gov/)

• Em 1992: primeiro mapa de baixa resolução de todos os


cromossomos humanos.

13
Center for Genome Research (Whitehead Institute)

Projeto Genoma Humano


- Iniciativa Privada (Celera) -

Craig Venter funda o The Institute for Genomic Research (TIGR)

1995: Venter publica o primeiro


sequenciamento do genoma de um
ser vivo: Haemophilus influenzae
(apenas 1 ano!)

• Em 1998, Craig Venter se associou à divisão Applied


Biosystems da empresa privada Perkin-Elmer para fundar a
Celera Genomics Corporation.

• Custo do projeto projeto: US$ 300 milhões (3 anos)

• Previram que 100 a 300 genes de interesse para as indústrias


farmacêuticas seriam patenteados

• Acredita-se que cada ser humano tenha 99,9% de suas


sequências de DNA idênticas entre si.

• As companhias farmacêuticas estão particularmente


interessadas no 0,1% de diferenças entre nossos genomas,
pois são estas variações que podem ser responsáveis pelo
fato de uma droga ser eficaz num indivíduo e não em outro.

14
Vantagens da Celera: robotização e bioinformática

Estratégias de sequenciamento HGP x Celera

Estratégia: “shotgun”
(Celera)

Estratégia: “sequenciamento direcionado (ordenado)”


(HGP)

1999: Primeiro cromossomo sequenciado: número 22


Nature 402: 489-495 (1999)

2000: Sequenciamento do cromossomo 21


Nature 405: 311-319 (2000)

26 de junho de 2000: o presidente norte-americano Bill Clinton


e o primeiro ministro inglês Tony Blair anunciaram que o
consórcio PGH e o grupo Celera haviam completado o primeiro
esboço do genoma humano.

15
Fevereiro de 2001: publicação do esboço do genoma humano

HGP: Nature, vol. 409 (2001)

Celera: Science, vol. 291 (2001)

Abril de 2003: “fim” do projeto. Previsão de 30 a 40 mil genes

2006: último cromossomo sequenciado: o de número 1, o maior


cromossomo humano (8% genoma) - Nature 441: 315-321 (2006)

16
A contribuição brasileira
• Projeto Genoma do Câncer Humano

• Instituto Ludwig do Câncer

• Sequenciamento de EST (Expression Sequence Tags)


de alguns tecidos cancerosos

12/06/2007: Primeiro genoma individual sequenciado:


James Watson

Custo: menos de US$ 1 milhão


Tempo: 2 meses !

Genoma do James Watson (2008)

17
05/09/2007: O primeiro genoma
humano diploide é sequenciado

• Sangue de Craig Venter


• Genoma mais completo já feito
• 44% de diferenças entre cópia da mãe
em relação ao pai: diferença entre
indivíduos aumentou para 99,5%

S. Levy et al. PLoS Biol. 5, e254; 2007

Tamanho genoma haploide: 3.164.700.000 pb

99,5% de semelhança entre cada indivíduo (uma mudança a


cada 300-400 pb – Single Nucleotide Polymorphism (SNP)

Número de genes preditos: entre 20-30 mil


 Celera – 39.114
 Consórcio público – 29.691
 Genes já conhecidos – 11.015

 menos de 2% genoma → genes codificadores de proteínas


1/3 genoma é formado por íntrons !
 DNA extragênico → a maior parte do genoma

18
Afinal, quantos genes nós temos?

Quadro de apostas em 2000

Resposta: 20.488 genes codificadores


de proteínas.

...e os RNA não-codificadores??

Projeto ENCODE - 2003


• ENCyclopedia Of DNA
Elements
• Identificar todos os
elementos funcionais
do genoma
• Finalização em
setembro 2012
• Só 1,5% do genoma
codifica proteínas

Mais de 85% do genoma humano é transcrito !!!

A complexidade da transcrição
desafia o conceito de gene
• Anos 60: 1 gene codifica 1
proteína

• Hoje: uma mesma região


do DNA pode gerar vários
transcritos

19
Transcrição “Pervarsiva”
(em todas as direções)
Afinal, o que é um gene???

“O gene é a união de sequências genômicas codificadoras


de um conjunto de produtos funcionais sobrepostos”

Complexidade

20
RNAs não-codificadores

Como os genes humanos podem


codificar para mais de uma
proteína?

1) Múltiplos sítios de iniciação da tradução no mesmo mRNA

2) Promotores alternativos para o mesmo gene

3) Vários sítios de splicing podem gerar diferentes mRNA que, por


sua vez, podem gerar diferentes proteínas

21
Nature, maio 2010

Um secundo código genético: um que prediz como segmentos


de mRNA transcritos a partir de um dado gene podem ser
combinados para gerar múltiplos produtos em diferentes
tecidos, um processo chamado splicing alternativo

Pseudogenes

• Relíquias evolutivas “mortas”


• Alguns podem ser protogenes
• No genoma humano há mais de 19.000 pseudogenes para
somente 21.000 genes codificadores de proteínas !
• Pseudogenes:
1) não-processados (com íntrons) - 11.000
2) processados (sem íntrons) - 8.000

Pseudogenes funcionais!
Nature 458 (2008)

22
Retrovírus no genoma humano

• 8% do genoma humano é derivado de retrovírus (human


endogenous retrovirus – HERV)
• A maioria têm mutações mas...

Benefícios do projeto Genoma Humano


• Compreensão mais ampla da organização do genoma e
função dos genes humanos pela comparação com outros
genomas já sequenciados.

• Diagnóstico antecipado de doenças.

• Desenvolvimento de drogas específicas para certos indivíduos


– drogas racionais (farmacogenômica).

• Aplicação da "terapia gênica" para a cura de doenças


genéticas.

• Determinação da predisposição genética de indivíduos a


agentes cancerígenos.

• A análise comparativa de diversos genomas humanos


permitirá determinar a linhagem e evolução das raças.

• Estabelecimento de novas estratégias para a determinação da


identidade de indivíduos ("DNA forense").

23
Projeto “1000 Genomas”

• Lançado em 2008
• Consórcio internacional
• Sequenciar pelo menos 1000 genomas de indivíduos de
diversas partes do mundo
• Verificar as diferenças entre populações – interesse médico

O Brasil na era genômica

Julho, 2000: genoma


de Xylella fastidiosa

O genoma do chimpanzé

Setembro de 2005
96% de identidade com humanos

24
Abril de 2007: Genoma do macaco Rhesus

Maio 2008 – Genoma do ornitorrinco

• Nature, vol 453 (2008)


• Uma mistura de características genéticas de mamíferos,
pássaros e répteis

Novembro 2008 – Genoma do


mamute

25
Primeiro genoma de um
paleo-humano - 2010

Benefícios: Paleogenômica

Poinar et al., Science 311: 392-394 (2006)


Metagenoma do mamute
tem pouco DNA ambiental

26
Genoma do Homem de Neanderthal

Svante Pääbo, em 1997, publica a


primeira sequência de DNA mitocondrial

Cell 90: 19-30 (1997)

2006: Svante Pääbo sequencia 1 milhão


de pb de DNA nuclear (0,003% genoma)

2008: Genoma mitocondrial completo!

Green, R.E. et al. Cell 134, 416-426 (2008)

Primeiro esboço...
Science, 328 (2010)

2% do genoma humano é de origem Neanderthal !

27
Science, Fev 2016

Abril 2009 – genoma do boi

Participação brasileira!

Soja: 2010

28
Genoma do gorila - 2012

Mais antigo genoma sequenciado


Nature, junho de 2013

• Cavalo de Przewalski
• ~700 mil anos de idade

Tecnologia e Genômica

29
Genomas Sintéticos

Science 319, 1215 (2008)

Primeiro genoma desenhado in silico

Science, 328 (2010)

Começa o projeto do genoma


humano sintético (HGP-write) - 2016

US$ 100 milhões, pra começar....

30
Pirosequenciamento

Sequenciamento de 20 Mb
em 4.5 horas !!!

31
"I think the single most important message is that genetic
reductionism doesn't work. We are not the sum total of our
genes.... it is the independent regulation of sets of genes, and our
own interaction with the environment that determines who we
are.“

Craig Venter

32

Você também pode gostar