Escolar Documentos
Profissional Documentos
Cultura Documentos
Filo Mol
Filo Mol
Filo Mol
SUMÁRIO
•Filogenia
•Conceitos
FILOGENIA MOLECULAR •Alinhamentos
•Análises e Métodos
•Principais programas
Daniel Macedo de Melo Jorge •Aplicações: 9Sistemática Molecular
9Estudo de Famílias Gênicas
danielmacedo.jorge@gmail.com
9Desenvolvimento de Novas Drogas
9Forense
FILOGENIA FILOGENIA
Charles Darwin
• Objetivos:
• Definição:
Definição – Determinar a história evolutiva do
Propõe a ancestralidade comum a gene, da função ou da espécie;
todoshistórica,
A relação os organismos vivos
resultante da – Caracterizar ancestrais;
evolução, entre taxa terminais,
representada em forma de uma – Estimar tempo de divergência entre
árvore ou a representação em dois organismos desde o último
forma Possibilidade
de árvore da história ancestral compartilhado
de se
evolutiva
reconstruir a história da vida – Caracterizar famílias gênicas e
protéicas (uso de formas parálogas)
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
Os organismos possuem
E as moléculas também
padrões
Alinhamento
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
1
CONTRUÇÃO DE ÁRVORES CONTRUÇÃO DE ÁRVORES
FILOGENÉTICAS FILOGENÉTICAS
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
ALINHAMENTO CONCEITOS
A ESCOLHA DO GENE
• Estabelece as posições homólogas entre as seqüências
• O segmento deve ter variabilidade compatível com problema
• Homologia pode ser confiavelmente inferida a partir de filogenético (cheque GenBank)
alta similaridade
• Seja criativo, use aminoácidos, terceiras posições, primeiras e
• Se o alinhamento estiver ruim, toda a análise proveniente segundas, todas elas
dele também o será
• Cheque seu alinhamento
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
ÁRVORES ÁRVORES
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
2
ÁRVORES GRUPO EXTERNO
A maioria dos métodos filogenéticos produzem árvores • O grupo externo usa táxons de referência que sabidamente
sem raiz. Esses métodos geralmente detectam as
se situam fora do grupo de interesse (o “grupo de dentro”).
diferenças entre as seqüências, mas não indicam e não
orientam o quanto essas mudanças ocorreram a longo • Requer conhecimento a priori sobre relacionamentos entre
do tempo os táxons.
• Informações adicionais:
Grupo externo
Hipótese de relógio molecular
Grupo externo
Saturação dos dados
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
Mas o que é Relógio Molecular? • Quais genes são bons para serem
usado em relógio molecular?
– Genes que tenham a mesma
É um conceito baseado na taxa de evolução em diferentes
idéia de que mutações linhagens
espontâneas se acumulam a
• Na maioria das vezes deve ter a
Qde de alterações
Tempo evolutivo
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
MÉTODOS DE RECONSTRUÇÃO
SATURAÇÃO DOS DADOS FILOGENÉTICA
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
3
MÉTODOS FENÉTICOS DISTÂNCIA
Árvores calculadas de acordo com a similaridade • É a medida de diferença entre duas seqüências
entre seqüências, sendo baseadas nos métodos de
• A mais simples é a distância p: onde p = nd/n (nd = número
distância. Esses métodos atribuem um valor às
de diferenças, n = número total de sítios)
diferenças existentes entre duas seqüências.
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
DISTÂNCIA DISTÂNCIA
•Princípios gerais:
ESCOLHA DA DISTÂNCIA
• Se p < 0,1 não precisa corrigir
1. Calcular a matriz de distância (a partir do alinhamento)
• Se 0,1<p < 0,25 pouca correção, 2 parâmetros no
2. Construção da árvores a partir dos valores da matriz de
máximo (JC, K2, TajN)
distância
• Se p > 0,25 corrija suas distâncias
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
DISTÂNCIA DISTÂNCIA
•Jukes & Cantor •Outros (Tajima Nei (ATGC) Tamura 3 (s/v + GC) Tamura Nei (s1s2/v + GC)
Transições
HKY (s/v + ATGC)):
Assume que todos os nucleotídeos
têm a mesma probabilidade de Transversões Assumem mais parâmetros, que na média se aproximam
mudar para qualquer um dos outros mais da realidade, mas têm uma variância maior
nucleotídeos Transições
•Kimura- •Variáveis:
Kimura-2-Parâmetros
Assume taxas diferentes entre transições (A-G, C-T) e •Correção Gama (Taxa para sítios heterólogos)
transversões (A-C, A-T, C-G, G-T). •Numero de sítios invariáveis
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
4
DISTÂNCIA DISTÂNCIA
UPGMA UPGMA
(Unweigthed Pair Group Method using arithmetic Averages) (Unweigthed Pair Group Method using arithmetic Averages)
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
DISTÂNCIA DISTÂNCIA
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
DISTÂNCIA DISTÂNCIA
NEIGHBOR-
NEIGHBOR-JOINING Métodos baseados em distâncias
• O método começa com uma árvore em
forma de estrela Vantagens:
• O primeiro passo é separar o par de • Método simples e muito rápido;
OTUs mais próximo (a partir dos valores
da matriz de distância), separando dos • Pode ser aplicado em bases de
outros dados muito extensas.
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
5
MÉTODOS CLADÍSTICOS Máxima Parsimonia (MP)
• As árvores são calculadas levando-se em consideração • Supõe que o caminho evolutivo mais provável é o mais
os vários possíveis caminhos da evolução. simples, que se explica com o menor número de
• São baseados no métodos de parcimônia. mudanças (substituições).
• Esses métodos usam cada posição do alinhamento como • Baseado na informação proporcionada pelos caracteres
informação evolutiva para construir a árvore.
derivados compartidos (SINAPOMORFIAS).
• Sítios Informativos: aqueles que apresentam pelo menos
2 tipos de caracteres, cada um ocorrendo duas vezes.
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
• Vantagens • Desvantagens
•No alinhamento utiliza somente os sítios informativos – Método com premissas – Pode levar a resultados
simples; errados se homoplasia for
•Funciona melhor com o relógio molecular – Deve resultar em dados comum ou concentrada em
confiáveis: partes específicas da árvore.
•Busca heurística – Homoplasia e substituições Exemplo:
múltiplas forem raras ou – Desvio de composição de
•Busca branch & bound distribuídas aleatoriamente na bases;
topologia. – Atração de ramos longos.
•Busca exaustiva – Amostragem densa. Mais de uma linhagem
acumulando substituições em
velocidade diferente das
demais linhagens.
– Exige muito esforço
computacional (Tempo).
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
• Usam cálculos probabilísticos para encontrar a árvore – O processo de substituição segue um modelo
que melhor explica a variação dado o conjunto de probabilístico onde a expressão matemática, mas
seqüências não os valores dos parâmetros são conhecidos a
priori.
• Máxima verossimilhança (Maximum Likelihood)
– Os sítios evoluem independentemente
• Inferência Bayesiana
– Todos os sítios seguem o mesmo processo de
substituição
– As probabilidades de substituição não mudam com
o tempo (elas podem variar entre os ramos)
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
6
AVALIANDO A SIGNIFICÂNCIA
Máximo verossimilhança
DA ÁRVORE
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
BOOTSTRAP BOOTSTRAP
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
BOOTSTRAP BOOTSTRAP
vaca
• O valor de bootstrap Rattus
ovelha
COELHO
representa número de vezes 91
PORCO
que o agrupamento ocorreu
rato
46 Mus
camundongo
humano
nas replicações
porco
vaca
ovelha Bos
HUMANO
COELHO 97
camundongo vaca
rato ovelha
vaca porco Homo
ovelha coelho
porco rato
COELHO camundongo
HUMANO humano
camundongo Xenopus
rato
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
7
BOOTSTRAP
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
8
Acromyrmex constituem um “A classificação por descendência não pode
único gênero? ser inventada por biólogos, ela pode apenas
ser descoberta”
Theodosius Dobzansky
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
• Compilações
9 Lista de sites e recursos:
http://www.ucmp.berkeley.edu/subway/phylogen.html
9 Uma grande quantidade de programas de filogenia
http://evolution.genetics.washington.edu/phylip/software.html
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
C. Conversão de formatos
A. Alinhamento de seqüências 1. Readseq (http://www.ebi.ac.uk/cgi-bin/readseq.cgi)
1. ClustalX : multiple sequence alignment with a graphical interface
D. Visualizador e editor de árvores
(for all types of computers). http://www.ebi.ac.uk/FTP/index.html
1. Treeview (todas as versões para PC e Mac OS9; versão básica para
and go to ‘software’ UNIX/LINUX/; http://taxonomy.zoology.gla.ac.uk/rod/treeview.html)
2. ClustalW: (XXXXXXXXXXXX)
2. TreeExplorer in MEGA3.1 (http://www.megasoftware.net/)
3. MUSCLE (http://www.drive5.com/muscle/)
3. Hypertree ( for large trees; http://www.kinase.com/tools/HyperTree.html)
B. Editores de seqüências
1. Seqlab (disponível no pacote GCG em socrates)
2. Jalview (http://www.jalview.org/) E. Software de Filogenia
3. Bioedit (http://www.mbio.ncsu.edu/BioEdit/page2.html) 1. MrBayes
Análise Bayesiana (DNA or protein)
Gratuito
Muito flexível
http://morphbank.ebc.uu.se/mrbayes/
Filogenia Molecular – Daniel Macedo de Melo Jorge Filogenia Molecular – Daniel Macedo de Melo Jorge
9
WWW recursos para filogenia
E. Software de Filogenia
2. PAUP*
Maximum likelihood (DNA only), parsimony, distance
Pago ($85-$150; incluso upgrades)
O mais flexivel de todos.
http://paup.csit.fsu.edu/
Muito obrigado
3. Phylip
a todos!!!!!!!!!
Maximum likelihood, parsimony, distance (DNA, protein, etc.)
Gratuito
O usuário deve fornecer o valor alpha para a taxa de
heterogenicidade
http://evolution.genetics.washington.edu/phylip.html
4. Outros programas:
MEGA 3.1 (http://www.megasoftware.net)
Tree-Puzzle (http://www.tree-puzzle.de/)
PAML (http://abacus.gene.ucl.ac.uk/software/paml.html)
Filogenia Molecular – Daniel Macedo de Melo Jorge
10