Filo Mol

Você também pode gostar

Você está na página 1de 10

SUMÁ

SUMÁRIO

•Filogenia
•Conceitos
FILOGENIA MOLECULAR •Alinhamentos
•Análises e Métodos
•Principais programas
Daniel Macedo de Melo Jorge •Aplicações: 9Sistemática Molecular
9Estudo de Famílias Gênicas
danielmacedo.jorge@gmail.com
9Desenvolvimento de Novas Drogas
9Forense

Filogenia Molecular – Daniel Macedo de Melo Jorge

FILOGENIA FILOGENIA

Charles Darwin
• Objetivos:
• Definição:
Definição – Determinar a história evolutiva do
Propõe a ancestralidade comum a gene, da função ou da espécie;
todoshistórica,
A relação os organismos vivos
resultante da – Caracterizar ancestrais;
evolução, entre taxa terminais,
representada em forma de uma – Estimar tempo de divergência entre
árvore ou a representação em dois organismos desde o último
forma Possibilidade
de árvore da história ancestral compartilhado
de se
evolutiva
reconstruir a história da vida – Caracterizar famílias gênicas e
protéicas (uso de formas parálogas)

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

Os organismos possuem
E as moléculas também
padrões

Alinhamento

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

1
CONTRUÇÃO DE ÁRVORES CONTRUÇÃO DE ÁRVORES
FILOGENÉTICAS FILOGENÉTICAS

•Como fazer uma árvore?


...mas existe outra maneira

•Metodologia mais comum...


1) Alinhamento – estabelecimento de homologias
Apertar o enter várias vezes até 2) Estimativa da árvore – reconhecimento de padrões entre
aparecer uma árvore na tela seqüências
3) Interpretação da árvore – interpretação das relações
filogenéticas entre organismos

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

ALINHAMENTO CONCEITOS

A ESCOLHA DO GENE
• Estabelece as posições homólogas entre as seqüências
• O segmento deve ter variabilidade compatível com problema
• Homologia pode ser confiavelmente inferida a partir de filogenético (cheque GenBank)
alta similaridade
• Seja criativo, use aminoácidos, terceiras posições, primeiras e
• Se o alinhamento estiver ruim, toda a análise proveniente segundas, todas elas
dele também o será
• Cheque seu alinhamento

pareamento não-pareamento buraco

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

ÁRVORES ÁRVORES

• Árvores sem raíz Æ reflete as relações entre os grupos


Método de representação das constituintes sem cogitar, necessariamente, o caminho
relações (não necessariamente evolutivo dos mesmos
evolutivas) entre táxons

• Árvores com raiz Æ escolha de um


Podem ser divididas em: “outgroup” que seja sabidamente
distante de todos as outras entidades
• Fenogramas (baseadas em (considerado como possuindo um
similaridade) ancestral comum com todas as entidades)
• Cladogramas (baseadas em
relações evolutivas) • Reflete o caminho evolutivo

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

2
ÁRVORES GRUPO EXTERNO

A maioria dos métodos filogenéticos produzem árvores • O grupo externo usa táxons de referência que sabidamente
sem raiz. Esses métodos geralmente detectam as
se situam fora do grupo de interesse (o “grupo de dentro”).
diferenças entre as seqüências, mas não indicam e não
orientam o quanto essas mudanças ocorreram a longo • Requer conhecimento a priori sobre relacionamentos entre
do tempo os táxons.

• Informações adicionais:

ƒGrupo externo
ƒHipótese de relógio molecular
Grupo externo
ƒSaturação dos dados

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

RELÓGIO MOLECULAR RELÓGIO MOLECULAR

Mas o que é Relógio Molecular? • Quais genes são bons para serem
usado em relógio molecular?
– Genes que tenham a mesma
É um conceito baseado na taxa de evolução em diferentes
idéia de que mutações linhagens
espontâneas se acumulam a
• Na maioria das vezes deve ter a
Qde de alterações

uma velocidade constante ao mesma função em todas as


longo do tempo evolutivo em espécies (ex.: citocromo c)
um determinado gene
• Relógio molecular conta o numero
de gerações e não o numero de
anos

Tempo evolutivo
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

MÉTODOS DE RECONSTRUÇÃO
SATURAÇÃO DOS DADOS FILOGENÉTICA

Perda do sinal filogenético

Quando comparadas seqüências ancestral -Fenéticos


homologas que sofreram uma
-Cladísticos
grande quantidade de mutações
ao longo do tempo, é impossível -Probabilísticos
de determinar uma árvore
filogenética independente da
método ou modelo escolhido seq.
seq. 1 seq.
seq. 2 seq.
seq. 3

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

3
MÉTODOS FENÉTICOS DISTÂNCIA

Árvores calculadas de acordo com a similaridade • É a medida de diferença entre duas seqüências
entre seqüências, sendo baseadas nos métodos de
• A mais simples é a distância p: onde p = nd/n (nd = número
distância. Esses métodos atribuem um valor às
de diferenças, n = número total de sítios)
diferenças existentes entre duas seqüências.

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

DISTÂNCIA DISTÂNCIA

•Princípios gerais:
ESCOLHA DA DISTÂNCIA
• Se p < 0,1 não precisa corrigir
1. Calcular a matriz de distância (a partir do alinhamento)
• Se 0,1<p < 0,25 pouca correção, 2 parâmetros no
2. Construção da árvores a partir dos valores da matriz de
máximo (JC, K2, TajN)
distância
• Se p > 0,25 corrija suas distâncias

DADOS: ALINHAMENTO MATRIZ MÉTODO DE


W: AAGATACA G WXYZ AGRUPAMENTO:
UPGMA
X: AAGA GATAA W 355 e
Y: AACC GATAA X 23 NEIGHBOR
Z: AACC GATAC Y 1 JOINING

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

DISTÂNCIA DISTÂNCIA

MODELOS DE SUBSTITUIÇÃO DE MODELOS DE SUBSTITUIÇÃO DE


NUCLEOTÍDEOS NUCLEOTÍDEOS

•Jukes & Cantor •Outros (Tajima Nei (ATGC) Tamura 3 (s/v + GC) Tamura Nei (s1s2/v + GC)
Transições
HKY (s/v + ATGC)):
Assume que todos os nucleotídeos
têm a mesma probabilidade de Transversões Assumem mais parâmetros, que na média se aproximam
mudar para qualquer um dos outros mais da realidade, mas têm uma variância maior
nucleotídeos Transições

•Kimura- •Variáveis:
Kimura-2-Parâmetros
Assume taxas diferentes entre transições (A-G, C-T) e •Correção Gama (Taxa para sítios heterólogos)
transversões (A-C, A-T, C-G, G-T). •Numero de sítios invariáveis

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

4
DISTÂNCIA DISTÂNCIA

UPGMA UPGMA
(Unweigthed Pair Group Method using arithmetic Averages) (Unweigthed Pair Group Method using arithmetic Averages)

- Sneath & Sokal, 1973


Vantagens e desvantagens:
- Agrupamento seqüencial até a raiz
- Assume o relógio molecular • Quando os dados cumprem a proposta do algoritmo, o
- Complexidade: O(n2), n quantidade de OTU’s resultado fornece uma árvore filogenética ótima
• É um método rápido
• A desvantagem principal é que para dados reais,
raramente se cumpre a propriedade ultra-métrica

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

DISTÂNCIA DISTÂNCIA

EVOLUÇÃO MÍNIMA NEIGHBOR-


NEIGHBOR-JOINING

- Cavalli-Sfoorza & Edwards, 1967 • Saitou & Nei, 1987


- Minimiza o somatório dos ramos das árvores
• Baseado no princípio de evolução mínima (Cavalli-Sforza &
- Busca exaustiva em todas as árvores
Edwards, 1967), mas é muito mais rápido
Ex.: 4 organismos ou taxa: 3 possíveis árvores
• Identifica os vizinhos que sequencialmente minimizam o
tamanho total da árvore (S)
• Um dos algoritmos mais usados, eficiente e rápido

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

DISTÂNCIA DISTÂNCIA

NEIGHBOR-
NEIGHBOR-JOINING Métodos baseados em distâncias
• O método começa com uma árvore em
forma de estrela Vantagens:
• O primeiro passo é separar o par de • Método simples e muito rápido;
OTUs mais próximo (a partir dos valores
da matriz de distância), separando dos • Pode ser aplicado em bases de
outros dados muito extensas.

• Novamente une-se os ramos que


apresentam as seqüências mais próximas, a Desvantagens:
partir da matriz de distância
• Não considera os dados originais,
• Este procedimento é repetido até que todos os ramos são apenas as distancias.
encontrados

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

5
MÉTODOS CLADÍSTICOS Máxima Parsimonia (MP)

• As árvores são calculadas levando-se em consideração • Supõe que o caminho evolutivo mais provável é o mais
os vários possíveis caminhos da evolução. simples, que se explica com o menor número de
• São baseados no métodos de parcimônia. mudanças (substituições).
• Esses métodos usam cada posição do alinhamento como • Baseado na informação proporcionada pelos caracteres
informação evolutiva para construir a árvore.
derivados compartidos (SINAPOMORFIAS).
• Sítios Informativos: aqueles que apresentam pelo menos
2 tipos de caracteres, cada um ocorrendo duas vezes.

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

Máxima Parsimonia (MP) Máxima Parsimonia (MP)

• Vantagens • Desvantagens
•No alinhamento utiliza somente os sítios informativos – Método com premissas – Pode levar a resultados
simples; errados se homoplasia for
•Funciona melhor com o relógio molecular – Deve resultar em dados comum ou concentrada em
confiáveis: partes específicas da árvore.
•Busca heurística – Homoplasia e substituições Exemplo:
múltiplas forem raras ou – Desvio de composição de
•Busca branch & bound distribuídas aleatoriamente na bases;
topologia. – Atração de ramos longos.
•Busca exaustiva – Amostragem densa. Mais de uma linhagem
acumulando substituições em
velocidade diferente das
demais linhagens.
– Exige muito esforço
computacional (Tempo).

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

MÉTODOS PROBABILÍSTICOS Máximo verossimilhança

• Usam cálculos probabilísticos para encontrar a árvore – O processo de substituição segue um modelo
que melhor explica a variação dado o conjunto de probabilístico onde a expressão matemática, mas
seqüências não os valores dos parâmetros são conhecidos a
priori.
• Máxima verossimilhança (Maximum Likelihood)
– Os sítios evoluem independentemente
• Inferência Bayesiana
– Todos os sítios seguem o mesmo processo de
substituição
– As probabilidades de substituição não mudam com
o tempo (elas podem variar entre os ramos)

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

6
AVALIANDO A SIGNIFICÂNCIA
Máximo verossimilhança
DA ÁRVORE

Vantagens: Desvantagens: Teste de Confiança:


- Utiliza todos os sítios; - Valores dos parâmetros são
- É o melhor modelo de um ponto estimados e fixados a partir dos
de vista teórico; dados e podem não refletir BOOTSTRAP
- Permite considerar modelo adequadamente as taxas
evolutivo específico; naturais de substituição e
freqüências se a amostragem
- Estimativa acurada dos tamanhos não for significativa;
de ramo (substituições/ sítio) - Praticamente impossível avaliar
mesmo quando ocorre
Teste estatístico para medir o grau de suporte
todas as possíveis árvores, é dos nós nas árvores filogenéticas pelo
substituições múltiplas; feita uma exploração parcial das
- Menos sensível a atração de árvores. alinhamento das seqüências
ramos longos se o modelo for - Exige muito esforço
adequado. computacional (Tempo).

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

BOOTSTRAP BOOTSTRAP

• Jogue todos os sítios em um chapéu G


A C
• Alinhamento inicial e a árvore são formados • Amostras aleatórias dos sítios (com reposição) são
sorteadas para construir uma nova árvore filogenética T
• O alinhamento inicial e a ávore são feitos da forma usual.
com o mesmo método inicial e mesmo tamanho de
• Cada sítio alinhado é então considerado independente
seqüência
• São feitas várias replicatas
vaca
camundongo
rato ovelha
vaca porco
ovelha coelho
porco rato
humano
coelho camundongo
humano

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

BOOTSTRAP BOOTSTRAP

• O novo alinhamento pode conter alguns sítios múltiplas vezes


• Um valor de bootstrap para 0.02 Gallus
• Outros sítios podem estar ausentes cada nó

vaca
• O valor de bootstrap Rattus
ovelha
COELHO
representa número de vezes 91
PORCO
que o agrupamento ocorreu
rato
46 Mus
camundongo
humano
nas replicações
porco
vaca
ovelha Bos
HUMANO
COELHO 97
camundongo vaca
rato ovelha
vaca porco Homo
ovelha coelho
porco rato
COELHO camundongo
HUMANO humano
camundongo Xenopus
rato

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

7
BOOTSTRAP

• O ideal é fazer 1000 ou mais replicatas APLICAÇ


APLICAÇÕES DA
• Um agrupamento tem um bom suporte se ocorreu em FILOGENIA MOLECULAR
mais de 80% das árvores (idealmente em mais de 95%)
• Pode ser chamado de nível de confiança da ocorrência
para um determinado clado (agrupamento)
• Não avalia a exatidão de uma árvore, somente indica a
consistência e estabilidade de clados individuais
• Outros métodos: jacknifing

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

SISTEMA DE TRANSPORTE ABC OS CINCO REINOS SÃO TRÊS

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

FORENSE: A ORIGEM DO HOMO


O DENTISTA ASSASSINO SAPIENS REVISTA

Árvore filogenética das


seqüências de HIV do DENTISTA Sim:
DENTISTA, seus Paciente C
Paciente A As seqüências de HIV
pacientes, e pessoas de todos estes pacientes
Paciente G
locais infectadas com Paciente B está no clado das
HIV Paciente E seqüências encontradas
Paciente A no dentista.
DENTISTA
Milhões de anos Milhões de anos
Controle local 2
Controle local 3
Patient F Não Na era pré-molecular pensava-se que DNA mitocondrial, genes nucleares
Controle Local 9 os grande macacos formavam um e hibridação DNA/DNA mostram
Controle local 35 clado separado dos humanos e que que os bonobos e chimpanzés são
Controle local 3
os humanos divergiram dos macacos mais relacionados aos humanos
Patient D no mínimo 15-30 milhões de anos. que aos gorilas.
Não
Ou et al. (1992) and Page & Holmes (1998)
Freeman and Herron, 1998

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

8
Acromyrmex constituem um “A classificação por descendência não pode
único gênero? ser inventada por biólogos, ela pode apenas
ser descoberta”

Theodosius Dobzansky

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

LITERATURA RECOMENDADA WWW recursos para filogenia

• Compilações
9 Lista de sites e recursos:
http://www.ucmp.berkeley.edu/subway/phylogen.html
9 Uma grande quantidade de programas de filogenia
http://evolution.genetics.washington.edu/phylip/software.html

• Databases of rRNA sequences and associated software


9 The rRNA WWW Server - Antwerp, Belgium.
http://rrna.uia.ac.be

9 The Ribosomal Database Project - Michigan State University


http://rdp.cme.msu.edu/html/

• Database similarity searches (Blast) :


9http://www.ncbi.nlm.nih.gov/BLAST/
9http://www.infobiogen.fr/services/menuserv.html
9http://bioweb.pasteur.fr/seqanal/blast/intro-fr.html
9http://pbil.univ-lyon1.fr/BLAST/blast.html

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

WWW recursos para filogenia WWW recursos para filogenia

C. Conversão de formatos
A. Alinhamento de seqüências 1. Readseq (http://www.ebi.ac.uk/cgi-bin/readseq.cgi)
1. ClustalX : multiple sequence alignment with a graphical interface
D. Visualizador e editor de árvores
(for all types of computers). http://www.ebi.ac.uk/FTP/index.html
1. Treeview (todas as versões para PC e Mac OS9; versão básica para
and go to ‘software’ UNIX/LINUX/; http://taxonomy.zoology.gla.ac.uk/rod/treeview.html)
2. ClustalW: (XXXXXXXXXXXX)
2. TreeExplorer in MEGA3.1 (http://www.megasoftware.net/)
3. MUSCLE (http://www.drive5.com/muscle/)
3. Hypertree ( for large trees; http://www.kinase.com/tools/HyperTree.html)
B. Editores de seqüências
1. Seqlab (disponível no pacote GCG em socrates)
2. Jalview (http://www.jalview.org/) E. Software de Filogenia
3. Bioedit (http://www.mbio.ncsu.edu/BioEdit/page2.html) 1. MrBayes
Análise Bayesiana (DNA or protein)
Gratuito
Muito flexível
http://morphbank.ebc.uu.se/mrbayes/

Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge

9
WWW recursos para filogenia

E. Software de Filogenia
2. PAUP*
Maximum likelihood (DNA only), parsimony, distance
Pago ($85-$150; incluso upgrades)
O mais flexivel de todos.
http://paup.csit.fsu.edu/
Muito obrigado
3. Phylip
a todos!!!!!!!!!
Maximum likelihood, parsimony, distance (DNA, protein, etc.)
Gratuito
O usuário deve fornecer o valor alpha para a taxa de
heterogenicidade
http://evolution.genetics.washington.edu/phylip.html

4. Outros programas:
MEGA 3.1 (http://www.megasoftware.net)
Tree-Puzzle (http://www.tree-puzzle.de/)
PAML (http://abacus.gene.ucl.ac.uk/software/paml.html)
Filogenia Molecular – Daniel Macedo de Melo Jorge

10

Você também pode gostar