Você está na página 1de 59

Mtodo da mxima parcimnia

Mtodos de anlise filogentica


baseados no estado do carter

Mxima Parcimnia
PAUP
PHYLIP
PAUPRAT
Mtodo da mxima parcimnia

Hennig (1965), fundador da escola cladstica de classificao


estabeleceu que a classificao dos seres vivos, a fim ser
biologicamente significativa, devia ser baseada na distino
de grupos estritamente monofilticos.
Mtodo da mxima parcimnia

Que so grupos estritamente


monofilticos?

Cite exemplo de um grupo muito familiar


para a espcie humana que no
monofiltico!
Mtodo da mxima parcimnia

O critrio de otimizao que a melhor


explicao dos dados :
mais simples,
requer o menor nmero de suposies.
origina a rvore mais curta
apresenta o menor nmero de
substitues
assume o menor nmero de
homoplasias
Mtodo da mxima parcimnia
Vantagens
Maximiza a similaridade que pode ser devido a ancestralidade
comum.
Qualquer carter que no se ajusta a rvore explicado como
homoplasia.
baseada em suposies evolucionrias implcitas.
Mudana evolucionria rara.
Pode produzir muitas rvores igualmente parcimoniosas.

Desvantagens
Pode ser inconsistente sob certos modelos (LBA).
Produz muitas rvores igualmente parcimoniosas.
Mtodo da mxima parcimnia

Escore de Parcimnia o nmero mnimo de mudanas ou passos


requeridos.

O escore de um carter (stio) tambm chamado de comprimento


do carter.

A somatria dos escores de cada carter resulta no escore ou


comprimento da rvore.
Mtodo da mxima parcimnia
Mtodo da mxima parcimnia

A C

[ A C T]
A
T
Mtodo da mxima parcimnia

A C

[ A C G]
A
G
Tipos de Parcimnia
Parcimnia de Fitch
TS=TV=1

Parcimnia de transverso
TS=0
TV=1

Parcimnia generalizada
TS= N
TV=xN
#NEXUS
Begin Data;
DIMENSIONS NTAX=5 NCHAR=18;
FORMAT DATATYPE = DNA GAP = - MISSING = ?;
MATRIX
Homem GGTTATCCTACATGTATA
Camundongo ACTTGTCCAACGCGGACA
Rato ACTCGTCCAACGTGCACA
Cachorro AGCTGCCTTACGTACATA
Gato AGCTGTCTTACGTACGTA
;
END;
Begin paup;
usertype titv stepmatrix = 4 acgt
[a] [c] [g] [t]
[a] - 1 1 1
[c] 1 - 1 1
[g] 1 1 - 1
[t] 1 1 1 -
;
ctype titv:all;
[!P A R C I M O N I A D E F I T C H]
BAND;
end;
Begin paup;
usertype titv stepmatrix = 4 acgt
[a] [c] [g] [t]
[a] - 1 0 1 [a] [c] [g] [t]
[c] 1 - 1 0
[a] - 1 0 1
[g] 0 1 - 1 [c] 1 - 1 0
[t] 1 0 1 - [g] 0 1 - 1
; [t] 1 0 1 -
ctype titv:all;
[!P A R C I M O N I A D E T R A N S V E R S A O]
BAND;
end;
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia
Swofford

Begin paup;
usertype titv stepmatrix = 4 acgt
[a] [c] [g] [t]
[a] - 6 1 6
[c] 6 - 1 1
[g] 1 6 - 6
[t] 6 1 6 -
;
ctype titv:all;
[!P A R C I M O N I A G E N E R A L I Z A D A]
BAND;
end;
Mtodo da Mxima Parcimnia

Mtodos de busca

1.All => exaustivo


2.bandb => branch and bound
3.hs=> heuristico
Mtodo da Mxima Parcimnia
Branch and Bound
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia
Heurstico
duas aspectos
(i) incio da busca e (ii) rearranjo dos ramos.
Inicio da busca
Opes em PAUP
Start : stepwise /NJ/Current
PAUP pode iniciar a anlise passo a passo ou a partir das rvores na
memria (Current). No caso da busca usando critrio de ML ou NJ
deve-se definir NJ.
Mtodo da Mxima Parcimnia
Se stepwise, especificar o modo de adio das taxa.
Opes em PAUP:
AddSeq Simple/Closest/AsIs/Random/Furthest

As Is adiciona na ordem em que est na matriz


Closest adiciona taxon que requer menor aumento
Furthest adiciona o txon que requer o maior aumento
Simple Farriss (1970) simple algorithm usa um conjunto de
diferenas par a par como referncia
Random usa permutao ao acaso dos txons para escolher a
ordem
Mtodo da Mxima Parcimnia

Rearranjo dos ramos -


Opes em PAUP
Swap None/NNI/SPR/TBR TBR
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia
Finding optimal trees - heuristics

A busca heurstica significa que no temos como saber se o


mtodo ir encontrar a arvore mais parcimoniosa. Entretanto,
TBR a rotina mais usada e com a opo de adio ao acaso de
mltiplas seqncias deve funcionar bem.
(heuristic swap=tbr addseq=random)
Mtodo da Mxima Parcimnia

Restrio Topolgica - hipteses filogenticas definidas pelo usurio.


Pode ser usada para encontrar rvores timas que:

1. Incluem um clado especificado ou um conjunto de grupos


2. Excluem um clado especificado ou um conjunto de relacionamentos
(reverse constraint)
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia
H dois tipos de otimizao do carter:
acctran e deltran.

Acctran (ACCelerated TRANsformation) as mudanas no estado


do carter ocorreram h mais tempo, mais prximas da raiz.
Isto favorece reverses (perdas de caracteres) sobre
convergncias

Deltran derivado de "DELayed TRANsformation," - a mudana


no estado do carter ocorreu mais recentemente. Deltran
assume convergncia como mais provvel que reverso.
Mtodo da Mxima Parcimnia
Mtodo da Mxima Parcimnia

Homem GGTTATCCTACATGTATA
Camundongo ACTTGTCCAACGCGGACA
Rato ACTCGTCCAACGTGCACA
Cachorro AGCTGCCTTACGTACATA
Gato AGCTGTCTTACGTACGTA
Mtodo da Mxima Parcimnia

Como se calcula o escore de mxima


parcimnia?

Vamos ao nosso exemplo!

Pule
paup> band

Branch-and-bound search settings:


Optimality criterion = parsimony
Character-status summary:
Of 18 total characters:
All characters are of type 'unord'
All characters have equal weight
4 characters are constant
8 variable characters are parsimony-uninformative
Number of parsimony-informative characters = 6
Gaps are treated as "missing"
Initial upper bound: unknown (compute heuristically)
Addition sequence: furthest
Initial 'MaxTrees' setting = 100
Branches collapsed (creating polytomies) if maximum branch length is zero
'MulTrees' option in effect
Topological constraints not enforced
Trees are unrooted

Branch-and-bound search completed:


Score of best tree found = 15
Number of trees retained = 1
Time used = <1 sec (CPU time = 0.00 sec)

paup>
Mtodo da Mxima Parcimnia
Note que quando h apenas uma base diferente, independentemente
da topologia, o custo ser sempre o mesmo (escore=1). Como temos
sete (7) stios deste tipo j temos um custo (escore=comprimento) de
sete (7).

000000000111111111
123456789012345678
Homem GGTTATCCTACATGTATA
Camundongo ACTTGTCCAACGCGGACA
Rato ACTCGTCCAACGTGCACA
Cachorro AGCTGCCTTACGTACATA
Gato AGCTGTCTTACGTACGTA
Mtodo da Mxima Parcimnia
O stio 15 tambm no informativo. Como tem duas bases
diferentes no duplicadas o custo igual a 2.

000000000111111111
123456789012345678
Homem GGTTATCCTACATGTATA
Camundongo ACTTGTCCAACGCGGACA
Rato ACTCGTCCAACGTGCACA
Cachorro AGCTGCCTTACGTACATA
Gato AGCTGTCTTACGTACGTA
Mtodo da Mxima Parcimnia

Resumo:
18 stios, sendo quatro (4) iguais,
sete (7) com apenas uma diferena,
um (1) com duas diferenas e
seis (6) com duas bases diferentes duplicadas.
Dos 18 stios, 14 so variveis, sendo que destes apenas seis so
informativos para parcimnia. Em termos de escore, a nossa
rvore j tem um comprimento igual a 7+2=9.
000000000111111111
123456789012345678
Homem GGTTATCCTACATGTATA
Camundongo ACTTGTCCAACGCGGACA
Rato ACTCGTCCAACGTGCACA
Cachorro AGCTGCCTTACGTACATA
Gato AGCTGTCTTACGTACGTA
STIOS INFORMATIVOS

2 3 8 9 14 17

Homem GTCTGT
Camundongo CTCAGC
Rato CTCAGC
Cachorro GCTTAT
Gato GCTTAT
STIOS INFORMATIVOS

2 3 8 9 14 17

Homem ++++++
Camundongo -++-+-
Rato -++-+-
Cachorro +--+-+
Gato +--+-+
C C C
C C
C
Sitios
1 2 2,9,17
C C C
C C
C

5
C C C

C C C
9
C C C
C
C C

C C C
C C C
T T T
T T T
T T C Sitios
C
C C
C
T
C 3,8,14
1 2
T
C
C C
T C
T C C
5
C C C
C C C

9
C C
C
C C C

C C C
C C C
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

A= 1 1 2 2 1 2 2 2 2 2 2 2 2 2 2

B= 2 2 2 2 1 2 2 2 1 2 2 2 2 2 1

Tsi 9 9 12 12 6 12 12 12 9 12 12 12 12 12 9

Tni 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9

18 18 21 21 15 21 21 21 18 21 21 21 21 21 18
Trees A B NI Score
1 1 2 9 18
2 1 2 9 18
3 2 2 9 21
4 2 2 9 21
5 1 1 9 15
6 2 2 9 21
7 2 2 9 21
8 2 2 9 21
9 2 1 9 18
10 2 2 9 21
11 2 2 9 21
12 2 2 9 21
13 2 2 9 21
14 2 2 9 21
1,5,12,15

13,15 000000000111111111
123456789012345678
2,9,17 Homem GGTTATCCTACATGTATA
Camundongo ACTTGTCCAACGCGGACA
4 Rato ACTCGTCCAACGTGCACA
Cachorro AGCTGCCTTACGTACATA
Gato AGCTGTCTTACGTACGTA
6

3,8,14

16
Testes de Monofilia
Bootstrap
Jackknife
ndice de decay
Nexus
Begin paup;
execute mydata.nex;
set autoclose=yes increase=auto criterion=parsimony;
Pset gapmode=missing;
outgroup 1;
hs;
Root outroot=monophyl;
savetrees file=mydata.tre format=altnexus replace=yes
root=yes;
boot nreps=1000; [Comando para bootstrap]
Root outroot=monophyl;
savetrees file=mydataMPBS.tre format=altnexus
replace=yes savebootp=both maxdecimals=0 root=yes
from=1 to=1000;
end;
Hillis & Bull (1993) atravs estudos de simulao propuseram valores
de 70% de bootstrap como limiar de significncia para os clados.
Entretanto, essa postura no tem unanimidade.

Li (1997) considera que, para um agrupamento ser considerado como


significativamente apoiado, o valor de bootstrap deve ser igual ou
superior a 95%. (http://www.lcb.uu.se/course/dist_ht99/phylo1.html).

Chen et al. (2003), sugeriram uma estratgia de averiguao de


confiabilidade baseada em repetibilidade. Os autores defendem o ponto
de vista de que prefervel aceitar um mesmo clado que inferido
repetidas vezes a partir de diferentes conjuntos de dados, mesmo com
baixos valores de bootstrap, do que um clado fortemente apoiado
inferido a partir de um nico conjunto de dados
Indice de decaimento de Bremer
Criar um arquivo vazio com nome mydatacopy.tre no seu diretorio
Anote o escore da arvore mais parcimoniosa. Ex. mydata.tre=2371

------VA PARA O PRAP


Abrir PRAP2
File
load data=mydata.nex
load tree=mydata.tre
Decay
Decay Analysis settings
[digite > 2371]
create batch file
-> VA PARA O PAUP
No paup execute o arquivo mydata.nex, calcule a rvore de mxima parcimnia

-> VA PARA O PRAP


get decay values carregue o arquivo mydata.dcc.log, clique OK e grave ar
Abra o arquivo mydatacopy.tre no FigTree
Testes de restrio tipolgica

ados de mydata.nex apoiariam Aotus como grupo irmo de Callice

Begin paup;
Constraints Rosenberger=((Aotus, Callicebus));
End;

gica existentes para parcimnia so Kishino-Hase


Clique aba trees- Tree scores - Parsimony
Os dados de mydata.nex apoiariam Aotus no ligado a Cebus
e Saimiri?
Outros programas de Mxima Parcimnia

DNAPARS
Phylip Seqboot
Consense
Joe Felseinstein

TNT ?
Pablo Goloboff