Você está na página 1de 57

Prof. Alexandre S.

Osório
O QUE É UM GENOMA
• É o conjunto haplóide de cromossomos de uma
espécie.

• O projeto genoma humano analisou 24


cromossomos humanos.
- 22 autossomos + X + Y

• Podemos considerar o genoma como o conjunto


de todo material genético de um ser vivo.
COMPOSIÇÃO DO GENOMA HUMANO
Objetivo

Mapear o patrimônio
genético do Homem
• Avanço na Medicina
– Preventiva
– Diagnóstico (específico, sensível,
efetivo e seguro)
– Tratamento (desenhos de fármacos
específicos)
• O arranjo linear dos nossos
cromossomos fazem parte da nossa
micro-anatomia.
• Histórico:
– 1543- corporis humani Fabrica por Andreas
Vesalius;
– 1628- fisiologia da circulação por Harvey;
– 1761- anatomia mórbida por Morgagni.
1956- Evolução da Genética Médica
• 1956- Estabelecimento do número de
cromossomos e a determinação da
estrutura de dupla-hélice do DNA por
Watson e Crick;
• 1959, descrita a 1º síndrome (Down).
Nos anos 60 uma série de
anormalidades começaram a ser
descritas (nº, translocação, deficiência,
mosaicos, triploidias e microdeleções).
Mapeamento Genético
• Provavelmente o 1º gene a
ser mapeado foi o do
Daltonismo (1911-1968)
• 1980- análise de células
somáticas através do uso de
sondas (“diretamente no
gene afetado);
• Construção de marcadores
genéticos para serem
utilizados em famílias
(RFLP, Seq TANDEM,
Microsatélites, etc).
O Sequenciamento do Genoma Humano
– A última anatomia
Antes mesmo do lançamento do PGH ser lançado uma
variedade genes já haviam sido descritos;
• 1944- 1ª apresentação do material genético por Avery,
McLeod e McCArty em pneumococcus;
• 1953- Watson e Crick deduziram a dupla-hélice do DNA
por difração de radiografia;
• 1966- dedução dos nucleotídeos (para codificação de aa);
• 1960s – Uso de enzimas de restrição;
• 1970s- Clonagem de genes em plasmídeos bacterianos e
a técnica do DNA recombinante;
• 1980- O Departamento de Energia dos EUA propõem do
sequenciamento do genoma humana devido a
preocupação de mutações ocorridas devido a radiação
que seus trabalhadores estavam expostos.
Década de 1980- Primeiras discussões  PGH;

1984- PG: EUA  mapear patrimônio genético


humano.
Japão e Austrália: organismo de coordenação
internacional HUGO (Human Genome Organization)
 facilitar e coordenar  mapear, sequenciar e
analisar: genoma humano e sua aplicação;

1990- PGH internacional: pesquisadores


americanos e europeus.
• 1988- acreditava-se que o mapeamento e o seq.
completo do genoma humano seria possível ser
feito em 10-15 anos (2005), com um custo de
$200 milhões de dólares as ano liberado pelo
congresso nacional americano.
• O Comitê assessor do PGH recomendou que se
fizesse o seq. a partir da construção dos mapas
genéticos e físicos dos cromossomos e que fossem
sendo feitos modelos de outros organismos em
paralelo.
• 01/10/1990: foi lançado nos EUA do PGH:
patrocinado pelo NIH (National Institutue of
Health) e pelo DOE (Departament of Energy).
• Foi criado o grande consórcio mundial para o seq.
do genoma humano formado pela Europa, Japão
e Austrália.
• HUGO ( Human Genome Organization)-
sintonizar o trabalho e organizar o conhecimento
em um banco de dados.
• Abril de 2003 durante as comemorações de 50 anos
da molécula de DNA. – 96% do genoma.
• Os 6% restante são regiões que ainda hoje não se
possui meios de serem analisadas. Essas regiões são
basicamente os centrômeros e os telômeros dos
cromossomos, que representam o centro e as
extremidades de um cromossomo, respectivamente.
A dificuldade em se analisar essas regiões se deve a
grande quantidade de repetições de DNA e regiões
de extremo condensamento.
No dia 4 de Setembro de 2007, o grupo de pesquisa
do Instituto J. Craig Venter publicou a sequência
completa do genoma do próprio pesquisador Craig
Venter (Venter, et al 2007). A grande revolução
nesse novo trabalho é a de que o genoma avaliado
corresponde ao genoma diplóide, contendo a
informação de cada par de cromossomo herdado de
nossos pais, ao contrário da sequência determinada
pelo Projeto Genoma que corresponde ao genoma
haplóide. Como resultado, descobriu-se que a
diferença das sequências genéticas entre dois
indivíduos é de 99,5% e não de 99,9% como se
imaginava ao fim do Projeto Genoma Humano.
Quem participa do PGH ?
• Setor Público  dados - qualidade e
precisão: detalhes das células humanas.

• Setor Privado  genes de interesse.

• 18 Países : Alemanha, Austrália, Brasil,


Canadá, China, Coréia, Dinamarca, EUA,
França, Holanda, Israel, Itália, Japão,
México, Reino Unido, Rússia, Suécia e
União Européia.
MAPEAMENTO E
SEQUENCIAMENTO DO GENOMA

GENOMA: DNA  células - determinado


organismo.

• Mapeamento  Divisão dos cromossomos 


fragmentos menores  propagados,
caracterizados e ordenados  respectivas
posições nos cromossomos.

• Sequenciamento  Seqüência de bases 


fragmentos de DNA já ordenados  genes na
seqüência do DNA.
VANTAGENS DO PGH

• Doenças fator genético;

• Tecnologias clínicas  diagnósticos de


DNA;

• Terapias novas classes de remédios;

• Técnicas imunoterápicas;
•Prevenção Doenças condições ambientais: mal
de Alzheimer, hipertensão, obesidade, artrite
reumática, suscetibilidade ao câncer de mama e
ovário, osteoporose, câncer do cólon, doenças
cardiovasculares, mal de Parkinson, calvície;

•Genes defeituosos  Terapia Gênica

•Drogas medicinais  organismos geneticamente


alterados
Filme Projeto Genoma Humano
COMO É FEITO O SEQUENCIAMENTO

• Mapeamento

• Sequenciamento
1. Picotando o DNA
2. Clonagem
• Etapas do
3. Marcação com
Sequenciamento Fluorescência
4. Separação
5. Leitura
Ver animação!!!
1. Picotando o DNA 4. Separação

Fig . 1 : Bases nitrogenadas do DNA

2. Clonagem

3. Marcação com
Fluorescência Fig . 3: Fragmentos de DNA separados
pelo tamanho

5. Leitura

Fig . 2 : Cromatograma de 4 cores

Fig . 4 : Dados processados


Os resultados são mostrados num
cromatograma de quatro cores.

•Depois os computadores reúnem as


seqüências em longos e contínuos
trechos.
• 1º organismo livre seq. foi a bactéria Haemophilus
influenzae, com 1800 genes que codificam
proteínas. Este seq. foi feito pelo grupo do J. Craig
Venter utilizando a técnica de aproximação.
• Helicobacter pylori, Mycobacterium tuberculosis
e Treponema pallidum.
• 1996- 1º eucarioto seq. completamente, o
Saccharomyces cereviae.
• 1998- 1º organismo multicelular completamente
seq. foi o nematoíde Caenorhabditis elegans.
• 2000/ março – Drosophila melanogaster.
ALGUNS GENOMAS FINALIZADOS
• 26 de junho de 2000
– Na Casa Branca, Colins e Venter anunciaram a
conclusão inicial do PGH
– O grupo do Colins publicou na “Nature”
– O grupo do Venter publicou na “Science”
A maior conclusão deste grande projeto
foi explicar que a complexidade do ser
humano esta baseada codificação de
diferentes proteínas e não no número de
genes.
Venter et al. Colins et al.
• Abril de 2003 : seqüência completa.
• O sequenciamento do genoma humano não corresponde ao
genoma específico de determinada pessoa.
• Estima-se que 99.9% da seqüência seja exatamente a
mesma entre todos os seres humanos.
• O Tamanho dos genes varia enormemente: gene médio =
3.000 bases
• Maior gene conhecido: distrofina (2.4 milhões de bases).

• Cromossomo 1 tem a maioria dos genes (2.968), e o Y a


menor parte (231).
Sequenciamento dos genes

“É cada vez maior o


esforço dos cientistas
para colocar à
disposição um número
crescente de genomas
inteiros sequenciados
dos mais diferentes
organismos.”
Fig.7 : Representação do mapeamento genético no cromossomo humano
• O DNA humano é formado por 3.1
bilhões de pares de base, com 4
nucleotídeos diferentes (A, C, G,
T). Essas combinações se repetem
ao longo do genoma em diferentes
ordens para formar aa, que
combinado formaram as proteínas
necessárias.

• Ele é formado por grandes desertos


e alguns oásis. Só 3% do DNA
contém regiões codificadoras
(centrais).

“A complexidade dos seres • O genoma humano é idêntico em


humanos surgiu de alguma 99,5%, os 0,1% é que traz as
outra fonte” Colins 12/02/01 variações e pistas de muitas
doenças
• O Brasil também participou do Projeto Genoma Humano .
• As principais iniciativas tomadas foram a da clonagem dos
genes pelo laboratório da pesquisadora Mayana Zatz;
• Projeto Genoma Humano do Câncer está em andamento
graças a união da Fapesp, Instituto Ludwig, Unicamp,
EPM e da Faculdade de Medicina da USP;
• O Genoma Cana leva o Brasil a liderar a pesquisa em
genoma de plantas (Copersucar à FAPESP em 1998)
• O seqüenciamento de uma praga de lavoura de laranja
chamada de Xylella fastidiosa.
Câncer e o Projeto Genoma

Fig . 8 : Representação da porcentagem dos tipos de câncer


Genoma Câncer
• Pretende gerar entre 500mil e 700mil
sequenciamentos

• Acesso a regiões codificadoras ainda


não explorados

• Elucidação no sequenciamento
genético do Homo sapiens

• Descoberta (???) da cura do câncer


• O Futuro: A Medicina do Século 21
– Saber a função de todas essas proteínas
– Saber as variações, padrões, estruturas e fenótipos
– Identificar alelos para suscetibilidade
– Buscar marcadores
– Especificar diagnósticos (mendelianos ou não)
– Conhecer a vulnerabilidade ou resistência
– Influência: medicina reprodutiva, preditiva, no conceito
de doenças que levem os médicos a interpretar genes
como hemogramas, diagnósticos específicos e clínicos,
caracterização precisa das doenças, busca de terapias
personalizadas (fármacos), impressão digital dos
tumores (2020).
EXERCÍCIOS
1) (Unifesp-2004) Em abril de 2003, a finalização do Projeto Genoma
Humano foi noticiada por vários meios de comunicação como sendo a
“decifração do código genético humano”. A informação, da maneira
como foi veiculada, está
a) correta, porque agora se sabe toda a seqüência de nucleotídeos dos
cromossomos humanos.
b) correta, porque agora se sabe toda a seqüência de genes dos
cromossomos humanos.
c) errada, porque o código genético diz respeito à correspondência entre
os códons do DNA e os aminoácidos nas proteínas.
d) errada, porque o Projeto decifrou os genes dos cromossomos humanos,
não as proteínas que eles codificam.
e) errada, porque não é possível decifrar todo o código genético, existem
regiões cromossômicas com alta taxa de mutação.

CORRETA : LETRA C
2) O bacteriófago t2 tem como material genético uma molécula de DNA
com cerca de 3600 nucleotídeos, que compreendem três genes.
Admitindo que esses três genes tenham aproximadamente as mesmas
dimensões e que a massa molecular média dos aminoácidos seja igual
a 120, cada uma das proteínas por eles codificada deve ter uma massa
molecular aproximada de:
a) 48000 d) 12 000
b) 24 x 103 e) 144 x 103
c) 4 x 102

RESOLUÇÃO:
3600 nucleotídeos / 3 genes = 1200 nucleotídeos em cada gene.

3 nucleotídeos ----------- 1 aminoácido


1200 nucleotídeos ------- X aminoácidos

X = 400 aminoácidos em cada proteína.


400 aminoácidos
x 120 massa molecular média
48 000 massa molecular das proteínas

RESPOSTA : LETRA A
3) (UnB – DF) Cientistas norte-americanos e britânicos
conseguiram, pela primeira vez, identificar todos os elementos
que compõem o genoma de um animal, um verme conhecido
como Caenorhabditis elegans. O trabalho, realizado durante
oito anos por equipes da Universidade de Washington, de
Saint Louis (EUA), e do Centro Sanger de Carnbridge (Grã-
Bretanha), permitiu que fossem identificados os 97 milhões de
pares de bases e os cerca de 20 mil genes que constituem o
ácido desoxirribonucléico (DNA) do animal.
O Estado de s. Paulo, 11/12/98 (com adaptações).
Supondo que todos os genes mapeados codifiquem proteínas e
que uma proteína possui, em média, 200 aminoácidos, calcule
a porcentagem do genoma do Caenorhabditis elegans
representada pelas regiões codificadoras de proteínas.
Despreze a parte fracionária de seu resultado, caso exista.
RESOLUÇÃO :

20 000 genes = 20 000 proteínas = 2 x 104 proteínas.

2 x 104 proteínas
x 200 aminoácidos
400 x 104 = 4 x 106 aminoácidos em todas as proteínas do verme.

3 nucleotídeos ------------ 1 aminoácido


X nucleotídeos ----------- 4 x 106 aminoácidos

X = 12 x 106 nucleotídeos (que codificam todas as proteínas do verme)


97 000 000 de pb. = 97 x 106 pb.

97 x 106 ----------------- 100%


12 x 106 ----------------- X

X = 1200/97 = 12,37 %

RESPOSTA: 12
4) As duas principais revistas científicas do planeta, a inglesa
Nature e a norte-americana Science, publicaram, dia
12/02/2001, uma das conquistas mais aguardadas dos últimos
tempos: a conclusão do seqüenciamento do genoma humano. A
grande novidade, no final dos estudos, foi que o número de
genes identificados (cerca de 30 mil) é bem mais tímido do que
o inicialmente aguardado (em torno de 140 mil). Os trabalhos
desenvolvidos pela empresa de biotecnologia Celera e o Projeto
Genoma Humano (PGH), formado por 16 instituições públicas
de pesquisa, permitiram a identificação quase total dos 3
bilhões de pares de bases que constituem o ácido
desoxirribonucléico dos humanos.
(http://noticias.correioweb.com.br, com adaptações)
Supondo que todos os genes mapeados codifiquem proteínas e que
uma proteína possui, em média, 200 aminoácidos, calcule a
porcentagem do genoma humano representada pelas regiões
codificadoras de proteínas.
a) 0,6% d) 2,5%
b) 1% e) 50%
c) 1,6%
RESOLUÇÃO:

30 000 genes = 30 000 proteínas = 3 x 104 proteínas

3 x 104 proteínas
x 200 aminoácidos
600 x 104 aminoácidos em todas as proteínas humanas

3 nucleotídeos ------------- 1 aminoácido


X nucleotídeos ------------ 6 x 106 aminoácidos

X = 18 x 106 nucleotídeos (codificam todas as proteínas humanas)

3 000 000 000 pb = 3 x 109 pb

3 x 109 ---------------- 100%


18 x 106 ---------------- X

X = 18 x 108 / 3 x 109
X = 18/30 = 0,6 %

RESPOSTA: LETRA A
5) O gene supressor de tumor p-53 é um dos principais alvos de mutação durante
o processo de carcinogênese. Está localizado no braço curto do cromossomo
17 e codifica a nucleoproteína p-53 que é responsável pela regulação da
transcrição nuclear, funcionando como um “policial molecular”. Se a célula
for exposta a agentes mutagênicos externos a p-53 acumula-se no núcleo
freando o ciclo celular em G1, dando tempo para que a célula repare seu
DNA. Caso a célula não o repare, a p-53 dispara a morte celular por apoptose.
Na versão mutagênica desse gene, a célula que sofre lesão em seu material
genético não tem sua divisão celular interrompida e deste modo, o dano
celular se transmite às células filhas. A mutação de p-53 não causa a
transformação maligna sozinha, porém predispõe a célula a outras mutações
que a levarão a uma transformação maligna.
Baseando-se no texto e em conhecimentos correlatos, responda ao que se pede.
a) Sabendo que a p-53 é uma proteína constituída por 393 aminoácidos, quantos
nucleotídeos serão necessários apenas para a codificação desses aminoácidos?
b) Quantos códons serão necessários para a síntese dos 393 aminoácidos?
Justifique.
RESOLUÇÃO :

c) 3 nucleotídeos --------------- 1 aminoácido


X nucleotídeos --------------- 393 aminoácidos

X = 1179 nucleotídeos

h) 3 nucleotídeos = 1 códon = codificação de 1 aminoácido, logo 393


aminoácidos = 393 códons.
6) Galactosemia: incapacidade de transformar galactose
em glicose
As reações bioquímicas que envolvem a galactose –
monossacarídeo derivado da lactose (açúcar do leite) – são
de particular interesse porque, em seres humanos, estão
sujeitas a defeitos genéticos que resultam na doença
conhecida como galactosemia. Quando o defeito está
presente, os indivíduos são incapazes de metabolizar a
galactose a metabólitos da glicose, o que freqüentemente
ocasiona catarata, crescimento deficiente, retardo mental e
eventual morte por lesão hepática. Um dos distúrbios
genéticos é devido à mutação no gene GALK1, expressa
como uma deficiência celular da enzima galactoquinase,
promotora da degradação do referido monossacarídeo.
Sabendo-se que a enzima galactoquinase possui 392
aminoácidos e que o gene GALK1 ocupa uma região de
7.300 pb no genoma, qual a porcentagem da região
codificadora (éxons) em relação ao tamanho total do gene?
RESOLUÇÃO :

1 aminoácido ------- 3 bases no RNAm -------- 3 pb no DNA


392 aminoácidos -------------------------------------- X

X = 1.176 pb

7.300 pb ------------ 100%


1.176 pb ------------x

x = 16,11%
7) "Um mecanismo molecular para as conexões entre os neurônios"
Artigo publicado recentemente na revista norte-americana Cell (vol. 101, pp. 671-
684, 2000) apresenta uma possível explicação para a grande especificidade e
diversidade das conexões feitas pelas células nervosas. Além de dar novas
pistas sobre as bases moleculares dos circuitos neuronais, o trabalho também é
uma valiosa contribuição aos estudos sobre o papel de certas regiões do
genoma, que aparentemente não têm função, na síntese de proteínas.
O trabalho baseou-se na clonagem e na identificação de um gene da Drosophila,
mais conhecida como moscadas- frutas. Esse gene codifica uma proteína
localizada na membrana celular dos axônios, que são as projeções dos
neurônios responsáveis pelas conexões com outras dessas células nervosas. G.
Schmucker e colaboradores descobriram que uma proteína, denominada
Dscam, localizada na membrana dos axônios, é o componente externo do
receptor de um sistema de sinalização que governa o movimento e o
estabelecimento de conexões entre os neurônios.
(Ciência Hoje, nº 168, com adaptações)
Sabendo-se que a Dscam tem 2.026 aminoácidos e que o gene que a produz
contém 24 regiões codificadoras (exons), espalhadas num total de 61.200 pares
de bases nitrogenadas, calcule:
a) A porcentagem aproximada da região do DNA codificadora de tal proteína.
b) A quantidade aproximada de códons do RNAm responsável pelo "comando" da
tradução da Dscam. Justifique.
RESOLUÇÃO:
a) 3 nucleotídeos --------------- 1 aminoácido
X nucleotídeos ------------- 2026 aminoácidos

X = 6078 nucleotídeos

61.200 nucleotídeos ----------------- 100%


6.078 nucleotídeos -------------------- x
x = 9,93%

b) 3 nucleotídeos ----------------- 1 códon


6078 nucleotídeos ------------- X

X = 2026 códons.
8) "DNA pode criar novo teste para hanseníase"
O bacilo da hanseníase acaba de ter seu genoma decifrado. Os resultados deverão
permitir o desenvolvimento de testes de diagnóstico mais rápidos e eficazes
para a doença, que é responsável por 700 mil casos novos anualmente em todo
o mundo, mais de 42 mil só no Brasil. O trabalho publicado na edição de hoje
da revista britânica "Nature" (www.nature.com) trouxe algumas surpresas para
os pesquisadores do Instituto Pasteur (França) e do Sanger Centre (Reino
Unido) que conduziram o estudo. Uma delas é o número reduzido de genes,
principalmente se comparado com o de um parente próximo, o bacilo da
tuberculose. Enquanto a Mycobacterium leprae (que causa a hanseníase) tem
cerca de 1.600 genes, a M. tuberculosis (que causa a tuberculose) tem mais de
3.900 genes. O tamanho do genoma dos bacilos é 3.268.203 e 4.411.532 pares
de bases, respectivamente.
A análise do proteoma (o repertório de proteínas que são produzidas pelo
organismo) revelou dados mais curiosos ainda. Como a cada gene corresponde
pelo menos uma proteína, seria de esperar que a M. leprae produzisse 1.600
proteínas. No entanto, foram detectadas apenas 391. "Cerca de um terço são
proteínas de membrana, insolúveis, e portanto não identificáveis pelo
proteoma.(...) (Folha de São Paulo, 22/02/2001, com adaptações)
Supondo-se que todas as proteínas do M. leprae possuam 300 aminoácidos,
calcule a porcentagem da região codificadora, identificável pelo proteoma, em
relação ao genoma total dessa bactéria.
RESOLUÇÃO :

1 códon ----------- 3 nucleotídeos ------ 1 aminoácido


x ---------------------- 300 aminoácidos
X = 900 nucleotídeos

1 gene ---------- 900 nucleotídeos ----------1 proteína


X ------------- 391 proteínas
X = 351.900 nucleotídeos

Genoma: 3.268.203 pb ---------------- 100%


351.900 pb ---------------- X
X = 10,77%
8) Grupo decifra DNA de levedura da cerveja
Um consórcio internacional completou o seqüenciamento do material
genético da levedura de cerveja Schizosaccharomyces pombe, que tornou-
se o sexto organismo com núcleo celular organizado a ter seu genoma
conhecido. O grupo foi coordenado pelo britânico Paul Nurse, do Instituto
do Câncer em Londres, Nobel de Medicina de 2001. O sequenciamento
revelou um número pequeno de genes que codificam proteínas (4.824) e
um grande número deles (43%) com os chamados "íntrons" no meio
(DNA não-codificador de proteína). "Pombe" quer dizer cerveja em suaíli,
língua da África oriental, onde a levedura foi primeiro isolada, no século
19. O estudo está na "Nature". (Folha de São Paulo 21/02/2002)
Baseando-se no texto e em conhecimentos correlatos, responda:
a) Supondo que cada gene codifique uma proteína de 400 aminoácidos,
calcule o tamanho total (em pares de bases ou pares de nucleotídeos) das
regiões que não contêm introns nesses genes.
b) Quantos códons seriam transcritos pelos exons?
RESOLUÇÃO:
a) 3 nucleotídeos ----------- 1 aminoácido
X ---------- 400 aminoácidos

X = 1.200 nucleotídeos no DNA = 1 gene (com exon e intron)

1 gene ---------------- 1.200 nucleotídeos


4.824 genes ---------- X

X = 5.788.800 nucleotídeos (sendo que 43% são introns, portanto,


57% são exons)

5.788.800 x 57% = 3.299.616 nucleotídeos


a) 1 códon --------------- 3 nucleotídeos
X ---------------- 3.299.616 nucleotídeos

X = 3.299.616/ 3 = 1.099.872 códons