Você está na página 1de 65

Organizao e Evoluo de Genomas

Juliana de Oliveira

Roteiro

Dogmas: central e perifrico


Genomas e proteomas
Espionando a transmisso da informao gentica
Selecionando genes e genomas
Genomas de procariotos
Genomas de eucariotos
O genoma do Homo sapiens
Polimorfismos de um nico nucleotdeo (SNPs)
Diversidade gentica na antropologia
Evoluo de genomas

Dogmas: central e perifrico


O arquivo de informaes em cada organismo o
material gentico
A replicao quase perfeita do DNA essencial
para estabilidade da herdabilidade
As imperfeies tambm so necessrias, gerando
informaes evolutivas

A implementao da informao gentica ocorre


inicialmente com a sntese de RNA e protenas

Dogmas: central e perifrico


O cdigo gentico de fato uma codificao
Tripletos de letras sucessivas da sequncia do DNA
especificam aminocidos consecutivos
Poro de sequncias de DNA codificam sequncias de
aminocidos de protenas

Protenas so compostas de 200 a 400 aminocidos,


o que exige de 600 a 1.200 letras de mensagens de
DNA expresso para especific-las
RNA ribossomal tambm determinado pelo DNA

Dogmas: central e perifrico


Nem todo DNA expresso em protenas ou RNA
estrutural
Muitos genes a serem transcritos apresentam
sequncias chamadas ntrons (sequncias no
traduzidas)
Algumas regies do DNA atuam como mecanismos
de controle
Uma poro substancial do genoma dos organismos
superiores aparenta ser suprflua (ainda no
compreendemos sua funo)

Dogmas: central e perifrico


Nomenclatura e estrutura molecular
Os quatro nucleotdeos
de ocorrncia natural
no DNA (RNA)

a
g
c
t

adenina
guanina
citosina
timina
(u
uracila)

1.

2.

As molculas de DNA so
quimicamente similares, e a
estrutura do DNA uniforme
(embora algumas interaes
DNA protena causam
distores na estrutura do DNA
Protenas e RNAs estruturais
apresentam ampla variedade de
conformaes tridimensional,
necessrias para garantir o
desempenho de diversos papis
funcionais

Dogmas: central e perifrico


Aminocidos
No-polares

G glicina (Gli)
I isoleucina (Ile)
A alanina (Ala)
P prolina (Pro)
V valina (Val)
L leucina (Leu)
F fenilalanina
(Phe)
M metionina
(Met)

Polares

S serina (Ser)
C cistena (Cis)
T treonina (ter)
N asparigina
(Asn)
Q glutamina
(Gln)
H histidina (His)
Y tirosina (Tir)
W triptofano
(Trp)

Carregados
D c. Asprtico
(Asp)
E c. Glutmico
(Glu)
K lisina (Lis)
R arginina (Arg)

Dogmas: central e perifrico


O cdigo gentico padro
ttt
ttc
tta
ttg

Phe
Phe
Leu
Leu

tct
tcc
tca
tcg

Ser
Ser
Ser
Ser

tat
tac
taa
tag

Tir
Tir
Parada
Parada

tgt
tgc
tga
tgg

Cis
Cis
Parada
Trp

ctt
ctc
cta
ctg

Leu
Leu
Leu
Leu

cct
ccc
cca
ccg

Pro
Pro
Pro
Pro

cat
cac
caa
cag

His
His
Gln
Gln

cgt
cgc
cga
cgg

Arg
Arg
Arg
Arg

att
atc
ata
atg

Ile
Ile
Ile
Met

act
acc
aca
acg

Tre
Tre
Tre
Tre

aat
aac
aaa
aag

Asn
Asn
Lis
Lis

agt
agc
aga
agg

Ser
Ser
Arg
Arg

gtt
gtc
gta
gtg

Val
Val
Val
Val

gct
gcc
gca
gcg

Ala
Ala
Ala
Ala

gat
gac
gaa
gag

Asp
Asp
Glu
Glu

ggt
ggc
gga
ggg

Gli
Gli
Gli
Gli

Dogmas: central e perifrico


Nomenclatura dos aminocidos
Histidina, fenilalanina, tirosina e triptofano so
aromticos e desempenham papis estruturais
especiais em protenas de membrana
Os nomes dos aminocidos so abreviados com as
suas trs primeiras letras
Exceto: isoleucina (Ile), asparagina (Asn), glutamina (Gln),
triptofano (Trp), selenocsteina (Sec)

Conveno: escreve-se
nucleotdeos com letras minsculas (atg = adenina-timinaguanina)
Aminocidos em letras maisculas (ATG = alanina-treoninaglicina)

Dogmas: central e perifrico


A sequncia de aminocidos de uma protena determina sua
estrutura tridimensional
Para cada sequncia de aminocidos natural, h um nico
estado nativo estvel, o qual sob condies adequadas
estabelecida sem alteraes
Para leitura de uma protena preciso desenovelar em uma
estrutura desordenada e inativa
Quando as condies normais so restauradas, as molculas
de protenas geralmente reassumem a sua estrutura nativa
As funes das protenas dependem de elas adotarem a
estrutura tridimensional do seu estado nativo

Dogmas: central e perifrico

Dogmas: central e perifrico


O enovelamento espontneo de protenas para
formar seu estado nativo o ponto em que a
natureza realiza o grande salto do mundo
unidimensional em sequncias dos genes e
sequncias de protenas para o mundo
tridimensional em que vivemos
Paradoxo
A traduo de sequncias de DNA em sequncias de
aminocidos muito simples de descrever de maneira
lgica
cdigo gentico

Dogmas: central e perifrico


O enovelamento de uma cadeia polipeptdica em
uma estrutura tridimensional precisa muito difcil
de explicar de maneira lgica
A traduo exige mecanismos moleculares
complicados do ribossomos, dos tRNAs e molculas
associadas
Entretanto, o enovelamento ocorre
espontaneamente

Dogmas: central e perifrico


Caractersticas dos aminocidos
Dependem dos componentes de suas cadeias laterais, fazem
com que possam ser reunidos em grupos especficos, como
hidrofbicos, hidroflicos, aromticos, alifticos, entre outros
Um somatrio de caractersticas, como grau de hidrofobicidade,
presena de enxofre, tamanho, determinam que tipo de
estrutura secundria, terciria e quaternria uma determinada
sequncia de aminocidos ir formar
Sequncias contendo vrias diferenas em relao aos
aminocidos, podem formar protenas semelhantes, bastando
conter aminocidos com caractersticas semelhantes em posio
anlogas nas sequncias

Dogmas: central e perifrico


Paradigma molecular

A sequncia de DNA determina a sequncia de protena


A sequncia de protena determina a estrutura da protena
A estrutura da protena determina a funo da protena
Mecanismos reguladores, incluindo mas no limitado ao
controle de padres de expresso, fornecem as
quantidades corretas das funes corretas, nos momentos
e nos locais corretos

Dogmas: central e perifrico


Grande parte da atividade organizada da
bioinformtica est focalizada na analise de dados
relacionados a esses processos do paradigma
Esse paradigma no inclui nveis maiores do que o da
estrutura e organizao molecular

Genomas e proteomas
O Projeto Genoma um trabalho que visa desvendar
o cdigo gentico de um organismo (animal, vegetal,
fungos, bactrias ou vrus) atravs do seu
mapeamento
O genoma de uma bactria se apresenta como uma
nica molcula de DNA
O DNA de organismos superiores est organizado em
cromossomos
Clulas humanas contm 23 pares de cromossomos

Genomas e proteomas
A quantidade total de informao gentica por
clula, ou seja, a sequncia de nucleotdeos de DNA,
aproximadamente constante para todos os
membros de uma espcie, mas varia bastante entre
espcies

Genomas e proteomas
Tamanhos de alguns genomas
Organismo

Nmero de pares
de bases

Nmero de genes

Comentrio

X-174

5.386

10

Vrus que infecta E.


coli

H. influenzae

1.830.138

1.738

Bactria causadora
de infeces do
ouvido mdio

E. coli

4.639.221

4.377

Organismo
predileto dos
bilogos
moleculares

C. elegans

103.006.709

20.598

Verme

D. melanogaster

128.343.463

13.525

Mosca-das-frutas

Humanos

3.223 x 106

36000?

Trigo

16 x 109

30.000

Genomas e proteomas
Nem todo o DNA codifica protenas
Alguns genes existe em mltiplas cpias
A quantidade de informao sobre sequncias de
protenas em uma clula no pode ser facilmente
estimada a partir do tamanho do genoma

Um gene que codifica uma determinada protena


corresponde a uma sequncia de nucleotdeos ao
longo de uma ou mais regies de uma molcula de
DNA

Genomas e proteomas

http://www.accessexcellence.org/RC/VL/GG/ecb/gene_to_protein.php

Genomas e proteomas
O gene seria definido ento como um segmento do
DNA contendo o cdigo para uma determinada
protena
J se sabia antes de completado o genoma, que seus
elementos significativos ou regio codificadora
(xons) aparecem interrompidos na longa cadeia de
DNA por sequncias aparentemente inteis ou no
codificadoras (ntrons)
O cdigo para a fabricao da protena s ser
montado na hora, num processo conhecido como
unio (splice)

Genomas e proteomas

Genomas e proteomas

Genomas e proteomas
O controle da informao organiza a expresso de
genes
Mecanismos de controle podem ligar ou desligar
genes
Muitas regies do DNA esto localizadas prximas a
segmentos de DNA que codificam protenas
Que contm sequncias sinalizadoras que servem de stio
de ligao para as molculas reguladoras que podem
bloquear a transcrio

Genomas e proteomas
O Projeto proteoma um programa em larga escala
que lida de forma integral com o padres de
expresso de protenas em sistemas biolgicos, de
modo complementar e suplementar aos projetos
genoma
O objetivo principal a descrio espao-temporal da
distribuio de protenas no organismo

Genomas e proteomas
O sequenciamento dos aminocidos das protenas
pode ser realizado
A partir da traduo do DNA
Uma protena inferida a partir da sequncia de um genoma
apenas um objeto hipottico at que experimentos comprovem a
sua existncia

Diretamente a partir do sequenciamento de protenas

Espionando a transmisso da informao


gentica
Como a informao hereditria armazenada,
transmitida e implementada talvez seja o problema
fundamental da biologia
Existem trs tipos essenciais de mapas
Mapas de ligaes de genes
Padres de bandeamento de cromossomos
Sequncias de DNA

Esses mapas representam tipos bastante diferentes


de dados

Espionando a transmisso da informao


gentica
Mapas de ligaes de genes
determinado classicamente pela observao de padres
de hereditariedade

Mapas de padres de bandeamento de


cromossomos
Os cromossomos so objetos fsicos
Padres de bandas so suas caractersticas visveis

Espionando a transmisso da informao


gentica
A sequncia de DNA
Fisicamente, constitui-se da sequncia de nucleotdeos em
uma molcula
Computacionalmente, um conjunto de caracteres
A, T, G e C

Os genes so regies da sequncia, em muitos casos,


interrompida por regies no-codificadoras

Espionando a transmisso da informao


gentica
Fazer conexes entre esses trs tipos de dados foi a
grande conquista da biologia do sculo passado
As relaes entre cromossomos, genes e sequncias
de DNA foram essenciais na identificao das
deficincias moleculares responsveis pelas doenas
hereditrias
O sequenciamento do genoma humano modificou
esta situao

Espionando a transmisso da informao


gentica
Dada uma doena ocasionada por uma protena
defeituosa
Se soubermos qual a protena envolvida, podemos
desenvolver terapias por meio de mtodos racionais
Se soubermos qual o gene envolvido, podemos
desenvolver testes para identificar indivduos doentes e
portadores
Em muitos casos, o conhecimento da localizao
cromossmica do gene no necessrio para a terapia
nem para a deteco
necessrio apenas para a identificao do gene, criando uma
ponte entre os padres de hereditariedade e a sequncia de DNA

Selecionando genes em genomas


Programas de computadores para a anlise de
genomas identificam fases de leitura aberta ou ORFs
(open reading frame)
Uma ORF uma regio da sequncia de DNA que
comea com um cdon iniciador (ATG) e termina
com um cdon de parada
Uma ORF uma regio codificadora de protena em
potencial

Selecionando genes em genomas


Tcnicas para a identificao de regies codificadoras
de protenas combinam ou escolhem entre duas
abordagens possveis
Deteco de regies similares a regies codificadoras
conhecidas de outros organismos
Mtodos ab initio (deste o incio) que procuram identificar
genes a partir de propriedades intrnsecas das sequncias
de DNA

Selecionando genes em genomas


O NCBI mantm um programa de busca de ORFs
O Finder ORF (Open Reading Frame Finder) uma
ferramenta de anlise grfica que encontra todos os
quadros de leitura aberta de um tamanho mnimo
selecionvel em sequncia de um usurio ou em uma
sequncia j no banco de dados
http://www.ncbi.nlm.nih.gov/gorf/gorf.html
Sequncia pesquisada
Gene da fibrose cstica CFTR (cystic fibrosis transmembrane
conductance regulator
Gene ID: 1080

Selecionando genes em genomas

Selecionando genes em genomas

Genomas de procariotos
A maioria das clulas procariticas contm seu
material gentico na forma de uma nica molcula
de DNA dupla fita circular grande
As regies codificadoras de protenas nos genomas
bacterianos no contm ntrons
Em muitos genomas procariticos, tais regies esto
parcialmente organizadas em perons genes
adjacentes que so transcritos em uma nica
molcula de mRNA, sob o controle transcricional

Genomas de procariotos
Em bactrias, os genes de muitos perons codificam
protenas com funes correlatas
Um genoma procaritico tpico contm apenas uma
quantidade relativamente pequena de DNA nocodificador
Exemplos
Mycoplasma genitalium (NC_000908.2) (1995)
0,58x106pb, 524 genes e 475 protenas

Methanococcus jannaschii (NC_000909.1) (1996)


1,74x106pb, 1.823 genes e 1.771 protenas

Escherichia coli K-12 MG1655 (NC_000913.2) (1997)


4,64x106pb, 4.496 genes e 4.146 protenas
Gene ID: 3654480

Genomas de eucariotos
Em clulas eucariticas, a maior parte do DNA est
no ncleo, separado em feixes de nucleoprotenas,
os cromossomos
Cada cromossomo contm uma nica molcula de
DNA fita dupla
Quantidades menores de DNA so observadas em
organelas mitocndrias e cloroplastos

Genomas de eucariotos
As espcies eucariticas variam quanto ao
Contedo de DNA
Ao nmero de cromossomos
Distribuio de genes entre eles

Exemplo
Os humanos possuem 23 pares de cromossomos e os
chimpanzs tm 24
O cromossomo 2 humano corresponde a uma fuso dos
cromossomos 12 e 13 dos chimpanzs

Genomas de eucariotos
Exemplos
Saccharomyces cerevisiae (fermento de padeiro) (1996)
16 cromossomos, 12,16x106pb, 6.352 genes e 5907 protenas

Caenorhabditis elegans (verme) (1998)


6 cromossomos, 100,28x106pb, 21.187 genes e 23.906 protenas

Drosophila melanogaster (mosca-das-frutas) (1999)


6 cromossomos, 149,78x106pb, 15.581 genes e 24.161 protenas

Arabidopsis thaliana (planta florfera) (2000)


5 cromossomos, 119,67x106pb, 33.583 genes e 35.378 protenas

O genoma do Homo sapiens


Homo sapiens (homem) (2003)
22 pares de cromossomos, mais os cromossomos
X e Y,
3.095,69x106pb
36.073 genes
32.143 protenas

O genoma do Homo sapiens


A anlise do repertrio de protenas humanas derivadas de
sequncia do genoma tem se mostrado bastante complicada
pelos problemas de confiabilidade na deteco de genes
Principais categorias de protenas, em uma classificao
funcional, num total de 39 classes (subclasses), totalizando
15.683 protenas

Ligao a cido nuclicos (2.207)


Enzima (3.242)
Transduo de sinal (1.790)
Protena estrutural (714)
Transporte (682)
Supressor de tumor (5)
No classificadas (4.813)

O genoma do Homo sapiens


Uma classificao baseada na estrutura revelou os
tipos mais comuns de protenas num total de 30
tipos
Imunoglobulina e domnio do complexo de
histocompatibilidade principal (591)
Dedo de zinco tipo C2H2 (499)
Protena cnase eucaritica (459)
Superfamlia GPCR tipo rodopsina (346)
Stio ativo da famlia de protenas serina/treonina cnase
(285)

O genoma do Homo sapiens


Sequncias de repeties compreendem mais de
50% do genoma
Elementos de transposio, ou repeties intercaladas
Psedogenes retropostos (cpias danificadas no-funcionais
de genes)
Simples repeties de pequenos oligmeros (fragmentos
curtos de DNA)
Duplicao de segmentos de blocos de ~10 a ~300 kpb

O genoma do Homo sapiens


Genes de RNA no genoma humano incluem:

497 genes de RNA transportador


Genes de RNAs ribossomais
RNAs nucleolares
snRNAs (RNAs pequenos)

Polimorfismos de um nico nucleotdeo (SNPs)


Um polimorfismo de um nico nucleotdeo ou SNP
uma variao gentica entre indivduos, limitada a
um nico par de bases, o qual pode ser substitudo,
inserido ou removido
Os SNPs esto distribudos ao longo de todo o
genoma, ocorrendo em mdia a cada 5.000 pb
Muitos dos SNPs se encontram em regies nofuncionais do genoma
Exemplo
Anemia falciforme (mutao AT)
Os alelos A, B e O dos genes para os tipos sanguneos

Polimorfismos de um nico nucleotdeo (SNPs)


Tratamentos de doenas causadas por protenas
defeituosas ou ausentes incluem
Proviso da protena funcional
Ajuste ao estilo de vida que tornem a protena desnecessria
Terapia gnica para a substituio da protena ausente ou
mutante

Diversidade gentica na antropologia


Antropologia a cincia que tem como objeto o
estudo sobre o homem e a humanidade de maneira
totalizante, ou seja, abrangendo todas as suas
dimenses
As informaes obtidas com os SNPs so de grande
utilidade na antropologia, fornecendo dados sobre
variaes histricas no tamanho da populao e
padres de migrao

Diversidade gentica na antropologia


Os graus de diversidade gentica so interpretveis
em termos do tamanho da populao fundadora
Fundadores so o conjunto original de indivduos dos quais
uma populao inteira descende
Exemplo
Extrapolaes da variao do DNA mitocondrial ( um organelo,
notavelmente mvel e plstico, presente no citoplasma de clulas
eucariticas - O contedo mitocondrial das nossas clulas
herdado apenas por via materna) do homem contemporneo
sugerem um nico ancestral materno, o qual viveu entre 14.000 e
200.000 anos atrs

Diversidade gentica na antropologia


Os SNPs especficos de uma populao podem
fornecer informaes sobre migraes
Sequncias mitocondriais fornecem informaes
sobre ancestrais femininos e sequncias do
cromossomo Y fornecem informaes sobre
ancestrais masculinos
Exemplo
Foi sugerido que a populao da Islndia descende de homens
oriundos da Escandinvia e de mulheres oriundas tanto da
Escandinvia quanto das Ilhas Britnicas
O que se comprovou atravs de escritos medievais islandeses

Diversidade gentica na antropologia


Na descoberta de populaes isoladas, a gentica
antropolgica fornece informaes teis na
medicina, pois o mapeamento de genes relacionados
com doenas se torna fcil se as variaes
espontneas forem baixas
Populaes europeias geneticamente isoladas: bascos,
finlandeses, islandeses, galeses e lapes

Diversidade gentica na antropologia


Variaes em nossa sequncia de DNA nos conferem
marcas individuais, como se fosse uma impresso
digital gentica
Nossas sequncias de DNA mitocondrial so
geneticamente idnticas (homoplasmia)
Porm alguns indivduos contm mitocndrias com
sequncias diferentes de DNA (heteroplasmia)
O que pode contribuir para a identificao pessoal

Diversidade gentica na antropologia


Anlise gentica animal os recursos animais so um
aspecto integral e essencial da cultura humana
Anlises das sequncias de DNA esclareceram alguns
aspectos do seu desenvolvimento histrico e das
variedades genticas que caracterizam as populaes
modernas
Exemplo
Anlises de sequncias de DNA mitocondrial do gado europeu,
africano e asitico sugerem que todas as raas europeias e
africanas esto mais relacionadas entre si do que cada uma delas
com as raas indianas e que estes dois grupos divergiram h cerca
de 200.000 anos

Evoluo de genomas
A disponibilidade de informaes completas sobre
sequncias de genomas alterou o rumo das pesquisas
Um desafio comum na anlise de genomas identificar
algum evento interessante
A genmica comparativa uma nova rea de pesquisa
que lida com questes tais como
Quais genes so compartilhados por filos diferentes?
Quais protenas homlogas so compartilhadas por filos
diferentes?
Quais funes bioqumicas so compartilhadas por diferentes
filos?

Evoluo de genomas
Pesquisas da genmica comparativa entre trs espcies
(H. influenzae (bactria), M. jannaschii (arqueobactria)
e S. crerevisiae (levedura)) levaram a uma lista de classes
de funes gerais e a responderem a pergunta existem
protenas comuns com funes comuns?
Sim existem
E anlises das funes compartilhadas pelos trs domnios
levaram os cientistas a se perguntarem se seria possvel definir
um organismo mnimo
Isto , um organismo com o menor genoma possvel que fosse
consistente com uma forma de vida independente e baseada no
dogma central DNARNAprotena (ou seja, excluindo-se as formas
de vida livres de protenas e baseadas apenas em RNA)

Evoluo de genomas
Concluses
A viabilidade de um organismo com estas protenas no foi
demonstrada
Mas a pesquisa identificou uma srie de funes
necessariamente comuns a todas as formas de vida
O que levou a uma questo
At que ponto diferentes formas de vida desempenham essas funes
da mesma maneira?

O desafio continua sendo o de mapear funes comuns e


protenas comuns
Ou seja, um conjunto de protenas comuns executa um conjunto
de funes comuns?

Evoluo de genomas
A evoluo explorou, em propores variadas, o
vasto potencial das protenas para diferentes tipos de
funes
Esta variao foi mais conservadora na rea de
sntese de protenas

Evoluo de genomas
Ainda na genmica comparativa, mas de eucariotos
A comparao dos genomas de levedura, mosca,
verme e do homem revelou 1.308 grupos de
protenas que so comuns aos quatro organismos
Esses grupos formam um conjunto central de protenas
conservadas para funes bsicas, incluindo metabolismo,
replicao e reparo do DNA e traduo

Evoluo de genomas
A duplicao gnica seguida de divergncia um
mecanismo de criao de famlias de protenas
Exemplo
Existem 906 genes e pseudogenes para receptores olfativos no
genoma humano
Foram encontrados homlogos em levedura e outros fungos
Mas a necessidade dos vertebrados de terem um olfato
altamente desenvolvido que levou esta famlia de genes a este
nvel de multiplicao e especializao

Evoluo de genomas
Outra rea de pesquisa a transmisso horizontal de
genes
Em geral, a transferncia horizontal de genes a
aquisio de material gentico de um organismo por
outro organismo, por meios naturais e no por
procedimentos, atravs de mecanismos que no
incluam a descendncia direta durante a replicao
ou reproduo

Evoluo de genomas
Evidncias de transferncia horizontal incluem
Discrepncias entre rvores evolucionrias construdas a
partir de genes diferentes
Comparaes diretas entre genes de espcies distintas

Exemplo
Pelo menos oito genes humanos so observados no
genoma M. tuberculosis

Referncias

LESK, A. M. Introduo a Bioinformtica. 2 Ed. Porto Alegre: Editora Artmed, 2008


GIBAS, C., JAMBECK, P., Desenvolvendo Bioinformtica. Rio de Janeiro: Campus,
2001
NCBI. National Center for Biotechnology Information. Disponvel em:
<http://www.ncbi.nlm.nih.gov/>. Acesso em: 09 Ago. 2012
BLAST. Basic Local Alignment Search Tool. Disponvel em:
<http://blast.ncbi.nlm.nih.gov/Blast.cgi>. Acesso em: 09 Ago. 2012