Escolar Documentos
Profissional Documentos
Cultura Documentos
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
ANEXO III
I - Instalação:
Em "File":
"Open input file": selecione o arquivo da matriz em formato de texto (.txt) ou formato T.N.T.
(.T.N.T.). Utilize editores de matrizes que permitam abrir e salvar dados em múltiplos
formatos (Nexus, T.N.T., texto, etc), permitindo que bases de dados de qualquer proveniência
possam ser rapidamente incorporados e editados para serem utilizados no T.N.T..
Recomendado: Mesquite (MADDISON & MADDISON, 2011), disponível gratuitamente
em: http://mesquiteproject.org
167
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
Em “File”:
1 – Ir em “Output” > “Open output file”. Cria arquivo log (.out)
2- Clique em “Save display buffer” para salvar todos os comandos realizados (armazenados
temporariamente na memória buffer do programa). Ele será salvo no arquivo output (.out)
criado e pode ser aberto pelo bloco de notas.
3 – Clique em “Close output file” após salvar todos os dados desejados. O arquivo de texto
só poderá ser aberto após este procedimento.
Mesmo que o arquivo .out não tenha sido criado desde o início do trabalho, todas os
procedimentos realizados e em exibição no display do T.N.T. serão salvos quando o
procedimento “Save display buffer” for realizado.
Em “Data” :
>“Save data”
Em “Settings”
> “Batch” > “Set menus to batch”
As ações então podem ser visualizadas, salvas e re-executadas através das seguintes opções
do sub-menu “Batch”:
Em “Format”:
> “Data Format” – permite definir os tipos de estados (nucleotídeos, aminoácidos) ou o
número total de estados possíveis:
V - Caracteres:
Em “Data”:
“Character settings” para editar e “Show character status” para exibir as configurações
ativas no momento:
Em “Character settings”:
> “of weight”- Adiciona peso diferente ao caráter selecionado.
> “step-matrix of costs” – Define um custo (peso) para determinadas transformações de
estados.
> “ancestral (force root states)” – Define que o estado presente no grupo externo para um
dado caráter (Ex: 0) permaneça fixo como o estado ancestral. Isto não traz diferenças na
análise quando todas as transformações têm pesos iguais. Porém, em um caráter onde o
estado do grupo externo seja, por exemplo, 0 e este mesmo caráter tiver uma transformação 1
–> 0 como tendo maior peso do que a 0 –> 1, este procedimento garante que, apesar deste
peso maior, a transformação 0 –> 1 continue sendo sempre a que ocorre entre o grupo externo
e o grupo interno. Em outras palavras, garante o estado 0 para o grupo externo, mas mantém a
maior probabilidade de uma transformação 1 –> 0 dentre táxons do grupo interno. Isso é de
particular importância para o estudo de caracteres moleculares, onde aplica-se maior peso
para transformações de nucleotídeos que costumam ocorrer com maior freqüência: transições
(conversões de uma purina em outra purina, ou uma pirimidina em outra pirimidina) são mais
frequentes de ocorrerem do que transversões (onde uma purina se converte em uma
pirimidina, ou vice-versa).
especial onde são possíveis 0 – 65 estados de caráter, com até 3 casas decimais. Por exemplo,
eles são sempre considerados como ordenados, sem opção de mudança. Não são editáveis
pelos menus, apenas pela linha de comando. A padronização do peso dos caracteres quando
todos têm o mesmo peso (default – “Implied weights”) não afeta este tipo de caráter. Devem
ser sempre os primeiros caracteres listados numa análise.
O programa de edição de matrizes Mesquite não exporta matrizes com dados contínuos para
o T.N.T.. Em função disso, os dados contínuos devem ser inseridos separadamente no
arquivo .T.N.T. criado ao se exportar os dados discretos criados no Mesquite. Abra o arquivo
.T.N.T. no bloco de notas e insira os dados dos caracteres contínuos. Eles devem ser inseridos
em um bloco de caracteres a parte, produzindo a seguinte configuração final da matriz:
nstates cont;
xread
94
&[cont]
Taxon1 4.145-5.248 0.77-0.823 0.093-0.107 0.058-0.077
Taxon2 2.917-3.274 0.723-0.803 0.023-0.032 0.11-0.134
Taxon3 4.598-5.309 0.708-0.776 0.102-0.114 0.032-0.04
Taxon4 1.336-1.424 0.616-0.657 0.056-0.074 0.029-0.042
&[num]
Taxon1 00000
Taxon2 01000
Taxon3 01110
Taxon4 01010
;
proc /;
comments 0
;
171
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
VI - Pesagem de caracteres:
Em “Settings”
“Implied weighting”:
> “Based on prior weights only”- Pesos pré-definidos ao se importar o arquivo com a
matriz de dados. Se pesos não tiverem sido atribuídos previamente, o T.N.T. atribui pesos
iguais a todos os caracteres (default).
> ”Using implied weights”- Ativa os pesos implícitos configurados no próprio T.N.T.: os
pesos atribuídos aos caracteres ou aos passos internos extras em “Data” > “Character
Settings”.
> “Weighting state transformations” - O programa irá gerar o peso dos caracteres
baseando-se na frequência de transformações deles em cada árvore. Quanto mais vezes ele
aparecer de maneira independente (homoplástica), menor peso relativo ele terá.
* O ícone “Set parameters” apesar de permanecer ativo em todas as seleções, atua somente
sobre o critério “Weighting state transformations”, se este for selecionado.
VII – Táxons
Em “Data”:
> Taxa > selecione táxons que se deseja desativar (excluir da análise).
> Show táxon status > permite ver nominalmente os táxons ativos e inativos no momento.
“Contraint taxa”
172
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
Para forçar um grupo de táxons como um grupo monofilético antes de se realizar qualquer
análise, é necessário utilizar-se a linha de comando. Após realizar-se pelo menos uma rodada
de análises, pode-se escolher quais os táxons a se forçar um monofiletismo selecionando-os
em uma das árvores armazenadas na memória buffer após a análise realizada. Porém, para
realizar a primeira opção, digite na linha de comando:
Force+[A B C]
A, B e C acima representam os nomes dos táxons que se deseja incluir neste grupo de
“constrained taxa”, e devem ser separados entre si por espaço. Alternativamente, pode-se
inserir o número destes táxons na matriz.
Taxon 0: Sphenodon
Taxon 1: Kuehneosaurus
Taxon 2: Huehuecuetzpalli
Para criar um subgrupo de táxons flutuantes dentre este grupo monofilético, coloca-se os
mesmos entre “( )”
> Force+[A B C (D E)]
Para formar uma constraint negativa (forçar certos táxons como não monofiléticos):
> Force-[A B C]
importante em algumas situações, como por exemplo, ao se utilizar buscas do tipo “Sectorial
Search” (ver abaixo para uma explicação deste método). Isto ocorre porque ao se utilizar este
método de busca, e dentro dele, utilizar as árvores armazenadas na memória RAM de buscas
anteriores como árvores iniciais da análise, o T.N.T. poderá pedir que se realize o
“constraint”dos táxons para esta busca. Para realizar isso:
Em “Data”:
> “Define constraints”
No quadrante “for monophyly”, selecione o ícone “tree number”. Deste modo, você estará
solicitando que ele utiliza “constraints”de certos grupos à partir de uma determinada árvore
presente na memória RAM. Caso não se deseja atribuir nenhuma “constraint” para a análise
(manter a análise livre de qualquer pré-concepção em termos de hipóteses de monofiletismo),
selecione uma árvore qualquer dentro de “tree number” (exemplo: árvore 0) e depois clique
em:
> “Use selected groups” – será aberta uma janela com a árvore selecionada (e.g. árvore 0) e
nela você deverá selecionar o grupo que se deseja manter como monofilético. Clique no nó
mais basal da árvore (na bifurcação entre o se grupo externo e o seu grupo interno). O nó
ficará vermelho. Após isso clique OK. Você retornará a janela inicial, e clique OK nela
também. Desta forma, você constringiu como monofilético o grupo formado por todos os
táxons da sua análise, incluindo o grupo externo. Na prática isso representa 0 “constraints”, já
que todos os táxons poderão se agrupar de qualquer forma com outros táxons dentro da sua
análise. Isso poderá ser confirmado pela mensagem que aparecerá no programa logo após
clicar o último OK:
“ 0 negative constraints”
“ 0 positive constraints”
“ 0 tree-constraints”
Caso deseja-se, de fato, fixar certos grupos como monofiléticos. Ao invés de selecionar o nó
mais basal na etapa anterior, selecione o grupo em questão que se deseja manter como
monofilético.
VIII - Buscas
A - Buscas exatas:
Para análise de matrizes com número de táxons limitados, mas que garante encontrar a(s)
árvore(s) mais parcimoniosa(s) (AMPs) existente(s). No T.N.T. o mecanismo oferecido é o
de “Implicit enumeration”, limitado à 15 – 30 táxons (HOVENKAMP, 2004)
Em “Analyze”:
> “Implicit Enumeration” – equivalente ao branch-and-bound do PAUP*
Levando-se em conta uma matriz de dados com mais do que apenas alguns poucos táxons
(Ex: mais de 10 táxons), os programas de análise filogenética precisam fazer uso de buscas
não exatas, ou heurísticas, para conseguirem realizar a análise dentro de um período de tempo
viável para a pesquisa. Estas buscas consistem em dois passos: a obtenção de uma árvore
filogenética inicial (por “stepwise addition”) e o subseqüente rearranjo (ou “swapping”)
de seus ramos de forma aleatória, onde se busca encontrar por tentativa e erro uma árvore tão
ou mais parcimoniosa quanto à árvore inicial obtida. O T.N.T. realiza esta tarefa através dos
seguintes procedimentos:
Em “Analyze” > “Traditional search” – busca heurística equivalente à busca por branch
swapping do PAUP*,
Stepwise addition – Esta metodologia computacional (algoritmo) permite que se crie uma
cladograma inicial entre 3 táxons terminais. Posteriormente, é adicionado a este cladograma
em desenvolvimento táxon a táxon, de acordo com uma ordem pré-determinada, até finalizar-
se o processo e obtermos uma árvore inicial completa. As árvores filogenéticas construídas
por este método são denominadas árvores de Wagner.
A escolha dos 3 táxons iniciais, o critério para a ordem de inclusão dos outros táxons e qual o
ramo do cladograma em construção ao qual eles são inseridos são fundamentais para o
resultado final da análise. Alguns métodos foram desenvolvidos para tal tarefa, com o método
de adição aleatória de táxons (random addition sequence - RAS) o preferido pelo T.N.T.:
RAS (Random addition sequence) – Neste processo a ordem de inclusão dos táxons
terminais é determinada de forma aleatória antes mesmo de a análise começar. Cada
novo táxon será adicionado a algum ramo da árvore em construção de modo aleatório.
Quanto maior o número de replicações (default = 10), maior a probabilidade de se
encontrar as melhores árvores. Número de replicações sugerido = 1.000.
separadas de outras ilhas por árvores com maior número de passos (MADDISON, 1991).
Desta forma, os programas de análise filogenética ao esbarrar nas árvores mais longas
interrompem a busca por árvores mais curtas naquele sentido, tornando a análise limitada ao
conjunto de árvores constituintes de uma ilha. Por isso, os programas realizam novas e
múltiplas análises ao mesmo tempo utilizando o mesmo conjunto de dados (replicações)
alterando em cada uma a ordem aleatória dos táxons adicionados para poder enxergar todas
as ilhas de árvores possíveis, cada ilha com uma ou algumas árvores inicias mais curtas. Ou
seja, ter diferentes pontos de partida para se obter a maior variedade possível de ilhas dentro
do universo de árvores possíveis.
Figura A.1. Duas ilhas de árvores (discos claros) separadas por árvores de maior número de passos
(áreas cinzentas) – (MADDISON, 1991).
Nenhum – as árvores finais mais parcimoniosas são as árvores de Wagner mais curtas
(sem “swapping”).
177
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
O mecanismo utilizando RAS + TBR realiza buscas com resultados consistentes em análises
de até 100 táxons. Acima deste valor, a análise levará um tempo exponencialmente maior (na
escala de semanas ou meses) para recuperar todas as AMPs.
Apesar de tornar buscas de matrizes amplas possíveis, o mecanismo de RAS + TBR ainda
apresenta significativas limitações na medida em que matrizes com uma larga base de dados
(Ex: com mais de 100 táxons) podem facilmente apresentar um grande número de árvores de
Wagner e de ilhas de árvores que não podem ser totalmente analisadas por análises
tradicionais de RAS+TBR em um tempo viável, dificultando a análise final (GOLOBOFF,
1999). Isto ocorre porque cada setor do cladograma de árvores com mais de 40 – 50 táxons
(Fig. 2) terá sua configuração ótima (menor número de passos) encontrada em árvores
distintas. Cada uma destas árvores, por sua vez, pode estar localizada em “ilhas de árvores”
distintas. Por isso, para dados extremamente amplos, um grande número de replicações por
RAS não é o suficiente para se vasculhar todo o universo de ilhas de árvores possível. Para
solucionar isto, é necessário que cada setor das árvores encontradas ao longo da análise seja
analisado independentemente do resto da árvore e que suas topologias ótimas sejam
combinadas em uma única AMP. Por isso, O T.N.T. lança mão de um conjunto de quatro
algoritmos que permitem isolar e analisar cada setor das árvores mais parcimoniosas de
maneira independente. Além disso, as árvores mais parcimoniosas encontradas por
“swapping” (e.g. RAS+TBR) diferem pouco das árvores iniciais utilizadas e raramente levam
a um novo conjunto de árvores mais curtas (GOLOBOFF, 1999), tornando os novos
algoritmos mais eficientes para se encontrar árvores mais curtas mesmo em análises de
matrizes que poderiam teoricamente ser analisadas apenas por buscas heurísticas.
178
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
Os quatro algoritmos extras utilizados pelo T.N.T. que permitem os avanços citados em
análises com um grande número de dados (100 táxons ou mais) são:
Ratched (RAT) – Durante a fase de “swapping” (TBR), ele realiza perturbações nas árvores
de Wagner previamente encontradas, altera o peso dos caracteres e depois procura por
árvores mais parcimoniosas do que aquelas sendo utilizadas na fase de swapping. Estas fases
de perturbação são de três tipos: (O – original weight) mantendo o peso original; (U – upper-
weight) aumentando o peso de certos caracteres; ou (D - under-weight) diminuindo o peso
dos caracteres, alternando cada uma com uma fase de busca (S – search) por árvores
melhores dentre as possíveis novas árvores geradas. A sequência fica sendo: O, S, U, S, D, S,
O, S, D, S... Estas perturbações e buscas são realizadas até um certo limite de substituições
feitas ou até que uma determinada porcentagem do processo de rearranjo já tenha sido
realizada, ambas podendo ser definidas pelo usuário.
O “fit” é um índice que se apresenta de duas formas: o “fit” absoluto e o “fit” relativo. A
diferença entre dois “fits” absolutos é obtida pelo cálculo da diferença no número de passos
entre dois cladogramas, enquanto a diferença entre “fits” relativos (RFD) entre dois
cladogramas A e B é calculado pela fórmula: RFD = (F-C)/F, aonde F é a soma da diferença
entre o número de passos dos caracteres que são mais parcimoniosos ao cladograma A do que
o cladograma B; e C a soma dos caracteres que são mais parcimoniosos no cladograma B em
relação ao A (GOLOBOFF & FARRIS, 2001).
Sectorial searches (SS) – É um tipo especial de rearranjo de ramos das árvores. O programa
seleciona, de modo aleatório, ou definido por um critério do usuário, certos setores de uma
árvore já existente. Uma re-análise isolada deste pequeno conjunto de dados é feita,
utilizando-se RAS+TBR e, se uma nova combinação dos táxons com menor número de
passos for encontrada, esta irá substituir a original na árvore da qual ela foi retirada. Se um
número X de substituições forem feitas em uma mesma árvore, esta passará por um novo
processo de rearranjo por TBR após a “Sectorial search” se completar.
Nas configurações da "Sectorial search" o tamanho de cada setor (número de táxons em cada
um) que será reanalisado pode ser definido pelo usuário, assim como o número X de
substituições necessárias para se realizar um novo “Global rearrangement” (rearranjo de
ramos) na árvore obtida.
de maior conflito serão então expostas na forma de politomias, tendo então os setores com
estas áreas mais conflitantes selecionados para a busca setorial. Por último, há a opção de
uma busca setorial mista (mixed sectorial search – RSS + CSS). Neste tipo, cada replicação é
feita utilizando-se o procedimento RAS + SPR. Ao final de cada réplica, é produzida uma
árvore de consenso desta com a obtida anteriormente (como na CSS), com as áreas de
consenso sendo constringidas e então encaminhadas para um rearranjo de ramos por TBR.
Este processo se repete ao final de cada réplica e, ao se obter as árvores finais, as zonas de
constrição são abandonadas e uma RSS é realizada com todas as árvores.
Em “Settings”:
> “Memory” > “Max. Number of trees” (Default = 100)
181
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
A - Ver árvores:
Em “Trees”
> “Tree view” ou “Tree display/save”
É importante notar que no seu modo default, o T.N.T. não colapsa os ramos das árvores mais
parcimoniosas obtidas. Desta forma, agrupamentos não suporados por sinapomorfias
permanecem “ladderizados”, formando pseudo grupos monofiléticos (Fig. A.3). Para evitar
isso, selecione a regra de colapso desejada em:
“Settings”
> “Collapsing rules”
Em seguida, selecione o ícone “Collapse trees after the search” na janela do modo de busca
de árvores a ser utilizado. No exemplo abaixo (Fig. A.4), a regra de colapso é a de colapsar
ramos com grupos de estados semelhantes, sem transformação entre estados (não suportados
por sinapomorfias).
B - Editando árvores:
Compactados – clicando-se com o botão esquerdo do mouse duas vezes seguidas em nós
não-selecionados faz todo o agrupamento de táxons internos a este ser reduzido a um táxon
terminal, de novo nome a ser definido pelo usuário; Esta ferramenta é útil para se mostrar
versões reduzidas ou simplificadas de determinados setores das árvores obtidas quando estas
são demasiadamente grandes para serem impressas em uma única página.
183
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
Em “Tree”
“Consensus” permite quatro tipos de árvores de consenso:
Em "Show/Save"
> Selecione "show/save tree diagram" (default) - para obter a figura da árvore na tela de
visualização, onde poderá salvá-la em formato de metarquivo (.emf) que pode ser editado
como uma fotografia (ver item XIII abaixo)
> Selecione a opção "Save to RAM" - para incluir as árvores a serem obtidas na memória
temporária do programa, juntamente com as árvores mais parcimoniosas já armazenadas na
mesma. O T.N.T. irá informar no display o número atribuído a cada árvore de consenso
obtida, para posterior localização delas dentre as demais árvores na memória.
Automaticamente também serão criados grupos de árvores para abrigar cada árvore de
consenso obtida onde, por exemplo, a árvore obtida pelo consenso estrito estará em um grupo
denominado "Strict consensus". Para checar este processo, observe os grupos de árvores
criados indo em:
Após obterem-se as árvores de consenso, selecione a(s) árvore(s) com a(s) qual(is) deseja
trabalhar para os passos seguintes. Para tal:
Em "Tree"
> "Tree Buffer" > "Select Trees" – escolha individualmente as árvores obtidas através do seu
número e armazene-as na memória temporária para as próximas análises em "select trees".
Alternativamente, vá em "group of trees" e selecione um dos grupos de árvores de consenso
que o programa cria automaticamente após a obtenção das mesmas.
Em “Optimize”
“Synapomorphies”:
> “Map synapomorphies” – permite ver todas as sinapomorfias em todas as árvores geradas
com “see all trees” ou de uma árvore em especial em “select trees”. Novamente, pode-se
clicar na letra “M” para salvar a árvore num metarquivo extendido para publicação. Nesta
imagem, porém, não aparece o estado em que o caráter sinapomórfico se apresenta. Para tal,
deve-se gerar a listagem deles (abaixo).
> “List synapomorphies” - gera na tela a listagem de todos os táxons terminais e nós (do mais
basal aos mais derivados) e suas respectivas autapomorfias e sinapomorfias de todas as
árvores geradas com “see all trees” ou de uma árvore em especial em “select trees”. Ao
aparecer a listagem, salve a tela no arquivo log (.out) e abra-o no bloco de notas para
recuperar esta listagem em forma de texto editável.
> “Map common synapomorphies” e “List common synapomorphies” - fazem o mesmo que
as opções anteriores considerando sinapomorfias comuns a todas as árvores armazenadas na
memória.
186
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
B - Listando e mapeando transformações sofridas por cada caráter ao longo das árvores
selecionadas
Em “Optimize”
“Characters”:
> “Map characters” – mapeia as transformações de cada caráter ocorridas ao longo da
árvore.
> “List Characters” – lista todas as transformações sofridas por cada caráter.
> “Map common characters” e “List common characters”- fazem o mesmo que os
anteriores considerando transformações comuns a todas as árvores armazenadas na memória.
C – Outros dados
Em “Optimize” :
> "Character scores" – indica o número de transformações sofridas por todos os caracteres
> "Count specific changes" – indica o número de transformações de cada estado (definido
pelo usuário) para outro em cada caráter de cada árvore desejada.
> "Branch lenght" – indica o tamanho (número de passos) de cada ramo da árvore
> "Tree lenght" – indica o tamanho total das árvores
Em “Trees”:
> “Comparisons” > “Show resolutions” – reporta quais são os nós que apresentam
politomias não-resolvidas na árvore de consenso estrito.
D - Índices de suporte:
Índice de Bremer
Em “Tree”:
> “Bremer support” - índices de Bremer (ou índice de decaímento): É calculado obtendo-se
comparações entre as árvores mais parcimoniosas com árvores sub-ótimas. A diferença no
número de passos (“fit”) de uma árvore de consenso que contenha o agrupamento cujo
187
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
suporte deseja-se calcular e a árvore sub-ótima mais curta onde ele esteja colapsado será o
valor do índice. Para tal, um número significativo de árvores sub-ótimas deve ser calculado, o
que pode ser realizado de duas maneiras: na primeira, realiza-se TBR sobre um conjunto de
árvores sub-ótimas armazenadas na memória RAM plotando os índices encontrados ("plot
on") sobre a árvore de consenso estrito. Na segunda maneira, seleciona-se as árvore sub-
ótimas da memória RAM que foram retidas durante as análises de busca. Neste caso, é
aconselhável selecionar um número significativo de árvores sub-ótimas e que tenham uma
larga diferença no número de passos em relação às AMPs (ex: fit de 10 passos). Para
selecionar todas as árvores de fit absoluto ≤ 10, por exemplo, em relação às árvores mais
parcimoniosas, utiliza-se no menu “Tree”:
> “Tree Buffer” > “Filter” – Permite excluir árvores redundantes, ou árvores sub-ótimas. Por
exemplo, elimina-se todas as árvores sub-ótimas com 10 ou mais passos em relação à árvore
mais parcimoniosa. Esta ferramenta é importante para se decidir quais árvores sub-ótimas
serão mantidas na análise para, por exemplo, se calcular o índice de Bremer com base nestas
árvores sub-ótimas obtidas ao longo da análise.
Em “Analyze”:
> “Resampling” – Para o cálculo dos índices de Boostrap e índices de Jackknife
Para este cálculo, uma re-análise da matriz será conduzida adquirindo novas árvores iniciais.
Portanto, o número de réplicas deverá ser alto (default = 100). Se o tamanho da matriz exige
uma análise utilizando “New Technology Search”, leve em consideração que o número total
de réplicas será aquele produzido pelo “New Technology Search” vezes o número de réplicas
da análise de Jackknife e Bootstrap. Logo, se o número de réplicas para o índice é de 100 e o
de replicações utilizando “New Technology Search” é 10, o número total de réplicas para o
cálculo dos índices será de 1.000 (100 x 10).
Sempre após se obter as árvores mais parcimoniosas, e mais tarde, a árvore de consenso:
A - Salve-a como arquivo (.tre) para futuras edições no T.N.T. , outros programas de
análise filogenética ou edição ou de edições de árvores:
1- Em “File”:
“Tree Save File” > “Open, parenthetical” – para abrir um arquivo onde as árvores serão
salvas.
2 - Em “File”:
“Tree save file” > “Save trees to open file” – para salvar as árvores desejadas
Atenção: Se o usuário desejar salvar outras árvores neste mesmo arquivo posteriormente,
permaneça com ele aberto e salve as futuras árvores como mencionado no ítem 2. Após ter
salvo todas as árvores desejadas neste arquivo:
3 – Em "File":
“Tree save file" > "Close tree file"- os arquivos (.tre) só poderão ser abertos nos diretórios
onde foram salvos quando este procedimento for realizado.
C - Salve a árvore num metarquivo extendido (.emf) para publicação (um arquivo de
imagem que pode ser posteriormente aberto e editado por programas de edição de imagem
vetorial (e.g. CorelDraw):
Em “Trees”:
> “Tree display/save” > clique na letra “M” para salvar a árvore
O programa Mesquite permite a importação dos arquivos de árvores no formato TRE e então
editá-los com uma boa variedade de ferramentas disponíveis, sendo muito superior ao
programa TreeView. No entanto, a única forma de exportar a árvore num formato de imagem
é salvando-a como PDF no menu "File".
Em "File":
"Exit"
Ferramentas adicionais
Se a árvore de consenso estrito apresentar resoluções que sejam insatisfatórias para o estudo
sendo conduzido, pode-se tentar identificar e remover os táxons responsáveis pelos conflitos
e subseqüentes agrupamentos colapsados. Para tal, deve-se primeiro identificar quantos nós
colapsados seriam recuperados realizando a remoção de determinados táxons:
190
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
Em ”Trees”
> “Comparisons” > “Prunned Trees”
Numa segunda etapa deste processo, remova os táxons utilizando “Prune Taxa”, e depois,
faça uma nova filtragem (“Filter”) para se obter as novas AMPs recuperadas após o
“prunning”. Como um novo patamar de número de passos de AMPs foi alcançado, é
importante realizar novas rodadas utilizando-se os algoritmos de busca para saber se há
outras AMPs com este mesmo número de passos que não foram recuperadas utilizando-se
apenas o “prunning”.
> selecione a opção “...for non-monophyly” > “use selected groups”. Nele, selecione com o
mouse o nó que sustenta os agrupamentos a serem investigados por não estarem presentes em
100% das AMPs.
191
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
Como deseja-se saber quais são as AMPs onde este agrupamento predominante está ausente,
deve-se realizar a filtragem de todas as árvores que possuam esta configuração, de forma a
remanescer apenas as de topologia distinta desta. Portanto, filtre as AMPs de modo a manter
na memória RAM apenas as árvores com a topologia definida no “constraint”:
> “Filter”
> “Constraints” > “Delete if not fulfilled”
O mesmo processo pode ser realizado para um resultado oposto, como para se reter as AMPs
que contém os agrupamentos que aparecem na árvore de consenso de maioria ou outras
operações equivalentes.
192
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
ADDENDUM 1 – BUGs
Para uma lista dos BUGs presentes nas versões anteriores e que foram corrigidos a partir de
2004 veja o link “Bug fixes” disponível no pacote de arquivos providos no download da
versão mais recente programa. Todos os BUGs de edições anteriores do T.N.T. já foram
reparados na edição mais recente disponível para download (2012). Os aqui referidos são
BUGs ainda presentes na edição de 2012.
ADDENDUM 2
Por que o T.N.T. é mais rápido do que o PAUP*?
O mecanismo tradicional de buscas pelas árvores mais parcimoniosas utilizando RAS + TBR
é empregado no PAUP, NONA e no T.N.T.. No entanto, a capacidade do algoritmo de
Goloboff (GOLOBOFF, 1996) para maximizar o RAS + TBR (presente no NONA e
posteriormente no T.N.T.) e de realizar análises em um tempo milhares de vezes menor do
que o PAUP se baseia no fato dele colapsar árvores mais parcimoniosas com agrupamentos
de suporte igual a zero durante as etapas de busca. Em outros programas de análise, todas
estas árvores ótimas temporárias eram salvas na memória temporária do programa
aumentando exponencialmente o tempo de análise sem efetivamente contribuir para uma
melhor resolução da mesma. Desta forma, o T.N.T. permite uma capacidade operacional mais
rápida, tornando viável completar a análise de todas as replicações por RAS (GOLOBOFF,
1999), seja para análises tradicionais (RAS+TBR) ou com os mecanismos de “New
Technology Search”. Isto permite tornar a análise não apenas mais rápida, mas também mas
eficiente, já que a análise do maior número de árvores iniciais possíveis obtidas por RAS é
fundamental para se realizar uma amostragem significativa do universo de árvores existentes
e evitar o problema das “ilhas de árvores” (FARRIS et al., 1996). Em função disso, a versão
mais recente do PAUP* 4.0 (SWOFFORD, 1998) também passou a incorporar este novo
algoritmo. Ainda assim, o mecanismo de RAS + TBR do T.N.T. é entre 5 – 10 vezes mais
rápido do que o do PAUP* 4.0 para pequenos conjuntos de dados e até 900 (!) vezes mais
rápido para matrizes com números de táxons na casa dos milhares, do que a versão 4.0
lançada por Swofford (GOLOBOFF et al., 2008). Como as análises com os mecanismos da
“New Technology Search” utilizam a busca RAS + TBR como base, estas análises ficam,
consequentemente, também mais rápidas do que se fossem realizadas no PAUP* 4.0.
Portanto, o grande mérito do T.N.T. é conseguir obter árvores mais parcimoniosas e em
menos tempo através tanto dos mecanismos tradicionais de busca heurística quanto através
dos quatro novos algoritmos de busca, além de viabilizar análises de matrizes extensas em
tempo viável de pesquisa através dos 4 novos algoritmos do “New Technologies Search”.
195
Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das
espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu
Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).
REFERÊNCIAS BIBLIOGRAFIA
FARRIS, J. S., ALBERT, V. A., KÄLLERSJÖ, M., LIPSCOMB, D. & KLUGE, A. G. 1996.
Parsimony jackknifing outperforms neighbor-joining. Cladistics, 12, 99-124.
GLADSTEIN, D. S. 1997. Efficient Incremental Character Optimization. Cladistics, 13, 21-
26.
GOLOBOFF, P. A. 1996. Methods for Faster Parsimony Analysis. Cladistics, 12, 199-220.
GOLOBOFF, P. A. 1999. Analyzing large data sets in reasonable times: solutions for
composite optima. Cladistics, 15, 415-428.
GOLOBOFF, P. A. & FARRIS, J. S. 2001. Methods for quick consensus estimation.
Cladistics, 17, S26-S34.
GOLOBOFF, P. A., FARRIS, J. S. & NIXON, K. C. 2008. T.N.T., a free program for
phylogenetic analysis. Cladistics, 24, 774-786.
HOVENKAMP, P. 2004. Review of: T.N.T.—Tree Analysis Using New Technology.
Version 1.0, by P. Goloboff, J. S. Farris and K. Nixon. . Cladistics, 20, 378-383.
MADDISON, D. R. 1991. The Discovery and Importance of Multiple Islands of Most-
Parsimonious Trees. Syst. Biol., 40, 315-328.
MADDISON, W. P. & MADDISON, D. R. 2011. Mesquite: a modular system for
evolutionary analysis. Version 2.75 (http://mesquiteproject.org).
SWOFFORD, D. 1998. Phylogenetic Analysis Using Parsimony (* and other methods),
version 4. Sinauer Associates, Sunderland, MA. . In).