Você está na página 1de 19

UNIVERSIDADE FEDERAL DA

INTEGRAO LATINO AMERICANA -


UNILA

TUTORIAL BASICO DE CONSTRUO DE


FILOGENIAS COM DADOS
MOLECULARES

ALEJANDRO GOMEZ
2 3

1 Na barra de busca digite o endereo do National Center for biotecnology and Information, como mostrado na imagem.
2 Agora selecione como base de dados no lista suspensa a base de dados Nucleotide na qual voc ira fazer a busca da sua sequncia.
3 Digite o cdigo de identificao da sua sequncia na barra de busca e logo click em search.
1 2 6

Observao 1: Uma vez feito o anterior, voc ira observar o seguinte contedo na tela, onde esta listada a respectiva informao referente
a sequncia consultada, tais como detalhes da sua sequncia, informao taxonmica e bibliogrfica.
Verificar que na lista suspensa esteja selecionado (1)Genebank (se no selecionar ento).
click na lista suspensa (2)Send e selecione (3)Complete Record, depois em Choose Destination, selecione (4)Clipboard.
Logo click no boto (5)Add to Clipboard para adicionar a sequncia lista.
Observao 2: Repita o mesmo procedimento para o numero de sequncias desejado com as quais voc ir trabalhar.
Logo click em (6)Items para ver o total de sequncias adicionadas lista.
2 3

1 4

Uma vez nesta tela


(1)selecionar cada sequncia respetivamente.

click em (2)Send.

Selecionar (3)Complete Record.

Em Choose Destination Seleicionar (4)File

Logo em Format (5)Fasta e em Sort by escolha (6)Taxonomy ID e finalmente de click em (7)Create File.

Observaes: uma vez dado click no boto Create file, sera criado um arquivo com o nome de sequence.FAS, trocar o nome para
facilitar a identificao. Logo criar uma pasta e salvar o arquivo ali para facilitar o trabalho e posteriores analises.
1

Observaes

1)Abrir o arquivo salvado na pasta no passo anterior. Para isso utilize o programa MEGA, dando click direito sobre o arquivo e selecionar
Abrir com e logo selecionar o MEGA da lista de programas.

2) Editar os nomes de cada sequncia correspondente espcie na matriz aberta no MEGA. Para isso doble click sobre o nome e deixar
unicamente o nome da espcie separando o gnero do epteto especifico por um under line Ex Hyla_minuta

3) Aps feito o anterior, prossiga fazer o alinhamento das sequncias desejadas para isso faa o seguinte:

click em Aligment e selecionar (1)Aling by ClustalIW, o programa ira lhe perguntar que se deseja selecionar todo? De click em OK.
Posteriormente ir a aparecer uma janela para (2) configurar os parmetros desejados para as penalidades de apertura e extenso de
Gaps, insira os segundo seu critrio e logo de click em Ok.
1

2 3

Observaes

1) Aps ter sido feito o anterior, pode ser observar agora asteriscos (*) acima do alinhamento, eles indicam a posio na sequncia onde o
onde a base nucleotidica conservada para todas as sequncias alinhadas.

2) sempre bom fazer a traduo do alinhamento para aminocidos e verificar a presena de cdons de parada na sequncia trabalhada
se o caso. Um cdon de parada por definio uma sequncia curta (trs nucleotdeos) que sinaliza a terminao da traduo numa
sequncia. Em genes que codificam protenas os cdons de parada no estaro presentes no meio dela durante a leitura porque isto
indicaria ao RNA mensageiro de que a traduo dos nucleotdeos em aminocidos j esta completa e isso resultaria em muitas partes no
funcionais numa protena. Para verificar faa o seguinte:

click em (1)Translated Protein sequence, logo aparecera uma janela de dialogo que lhe perguntara se o tipo de DNA trabalhado
correto. Click em (2)No e prossiga na outra janela a selecionar o indicado e click em ok. Neste caso foi selecionado DNA mitocondrial de
vertebrado, que o tipo que esta sendo usado.
Observaes caso 1
1)Uma vez configurados os parmetros para a traduo de aminocidos no passo anterior, voc ir a observar uma tela como esta no caso
de um gene codificador de protena (na tela podemos ver o alinhamento do Cito cromo oxidase b para um grupo de anfbios)

Observaes caso 2
1)Uma vez configurados os parmetros para a traduo de aminocidos no passo anterior, voc ir a observar uma tela como esta no caso de um gene
codificador de protena no qual h cdons de parada (representados por asteriscos) o qual no pode acontecer. Assim para concertar o problema
dependera do seu critrio eliminar bases no alinhamento no posio adequada nas sequncias de DNA, para obter uma traduo como a anterior
Observaes

1) Aps de termos a nossa matriz de alinhamento pronta, esta representa agora a nossa hiptese de homologia primaria a qual ser
submetida a analises posteriores para achar o melhor modelo de evoluo nucleotidica que melhor se ajusta a nossos dados. Para comear
faa o seguinte:

Exporte a matriz em formato NEXUS. Click em Data Export Aligment NEXUS/PAUP Format e salve na mesma pasta de trabalho
usada no comeo.
1 3

Observaes: Uma vez exportada a nossa matriz alinhada em formato NEXUS, abrir ela utilizando o bloco de notas. Uma vez aberta
voc ter uma estrutura de dados similar mostrada nas imagens. Na imagem 1 o primeiro algoritmo especifica os taxas que esto
sendo utilizados na analise. Na imagem 2 o segundo algoritmo especifica as dimenses (numero de carteres) junto com as
convenes utilizadas para os dados na matriz. Na imagem 3 o algoritmo representa as parties que sero utilizadas na analise. Em
analises filogenticas de dados moleculares de sequncias, o particiona mento involucra uma estimativa independente de modelos de
evoluo molecular para diferentes conjuntos de stios num alinhamento de sequncias. Assim, escolhendo um apropriado esquema
de particiona mento, um importante passo na maioria das analises devido a que isto pode afetar a acurcia da reconstruo
filogentica. Neste caso o esquema de particiona mento foi feito mediante as posies dos cdons. Tendo que ser este ultimo
adicionado no bloco de notas aps a terminao dos taxa.
1

Observaes: Uma vez editado o bloco de notas com as parties e os modelos de evoluo nucleotidica, abrir o programa PAUP e
dar click em (1)Open e selecionar o arquivo editado da pasta de trabalho utilizada anteriormente. Uma vez importado o arquivo PAUP
comear automaticamente a computar as probabilidades.
Observaes: Uma vez o PAUP tenha finalizado o computo das probabilidades, ele gerar dois arquivos na sua pasta referncia de trabalho
um arquivo chamado de model.scores e outro de modelfit. Agora vamos submeter o arquivo model.scores no programa Model test para
calcular o melhor modelo de evoluo nucleotidica para ser usado na construo das arvores filogenticas.

Para fazer isso abra o Command Prompt do windows e entre no diretrio da sua pasta de referncia de trabalho na qual voc deve ter
guardado o Model test junto com os arquivos mencionados anterior mente. Para se situar no diretrio de trabalho simplesmente digite o
seguinte cd aqui voc coloca o endereo do diretrio pressione a tecla Enter e logo escreva o seguinte Modeltest3.7.win <
model.scores > test.outfile
1

Observaes: Ir na pasta de referncia de trabalho e abrir o arquivo test.outfile com o bloco de notas. Ali voc encontrara toda informao
respetiva ao modelo de evoluo nucleotidica que melhor se ajusta a seus dados (1).
Observaes: uma vez feito o anterior
voc dever abrir o primeiro arquivo com
sua matriz de alinhamento exportada do
MEGA em formato NEXUS.

Estamos prontos agora para fazer a


nossa arvore de mxima
verossimilhana! Para isso vamos ao final
do bloco de notas onde as nossas
sequncias terminam e exatamente aps
do end; vamos comear a digitar as
seguintes instrues que esto na
imagem. Colocando um nome a nossa
arvore onde esta assinalado com o
numero 2 e colando os resultados da
analise de seleo de modelos onde esta
assinalado com o numero 1.

2
Observaes: uma vez feito o
anterior voc dever abrir o PAUP e
carregar o arquivo desde sua pasta
referncia de trabalho e
automaticamente comear o
computo da sua arvore de mxima
verossimilhana!
Observaes: uma vez a
analise computada tenha
finalizado voc devera ter
uma tela como esta! Nela
mostrada os dados
gerais respeito arvore
de mxima
verossimilhana obtida.
Se voc quiser ver as
arvores obtidas basta
digitar o comando
showtree.
Observaes: uma vez
digitado o comando
showtree voc devera
obter uma tela como
esta mostrando a
primeira arvore das N
obtidas na alise, neste
caso a primeira de 12.
Para passar para prxima
arvore basta digitar o
comando showtree2 e
assim por diante at a
sua ltima arvore.
Observaes: Agora para
se obter a arvore de
consenso estrito basta
digitar o comando
contree e se voc
quiser exportar la basta
digitar o comando
contree all/strict=yes
majrule=no
usetreewts=yes
treefile=MajRule.tre
sera exportado num
arquivo .tre na sua pasta
de referncia de
trabalho.
Observaes: Caso voc
deseja realizar mais
analises ou mostrar mais
coisas com respeito ao
resultado da analise
obtida basta digitar o
comando help para
receber uma lista de
comandos para isso!
Fuck....
Mother of fap....
This was not quite clear!

Você também pode gostar