Você está na página 1de 4

Introduction to Bash, Python and R for Biologists [BIZ 5788 – 4.

3]

Lidando com dados para evidência total


Denis Jacob Machado

Lembre-se
Os scripts auxiliares que você irá precisar estão disponíveis no seguinte URL:

• help1.zip

• help2.zip

1 Renomeando terminais
Quando maior a amostragem de uma análise filogenética, mais problemas você terá formatando os nomes dos
seus terminais. Alguns programas terão problemas com nomes muito longos ou nomes com caracteres especiais,
enquanto outros irão truncar nomes que começam com as mesmas palavras gerando toda sorte de confusão.
Uma estratégia que eu pessoalmente prefiro é substituir todos os nomes dos terminais por códigos numéricos
durante a análise, apenas para trocar esses códigos pelos nomes que eu quero quando os dados estiverem
prontos.
Execute o script help_ex_renaming.sh e siga as instruções na tela.

1.1 Use as linhas abaixo para descrever seu script em Bash para renomear todos os arquivos .nex,
.phy e .svg que vieram como exemplo.
1.2 Como você pode redirecionar o que o programa renamingTerminals.py escreve na tela para
arquivos de texto novos?

1.3 Como você pode usar o programa renamingTerminals.py para receber arquivos com códigos e
trocar estes códigos de volta para nomes?

2 Dicionários
O programa renamingTerminals.py usa dicionários. Este tipo de variável, um pouco parecida com listas, são
muito úteis em Python.
Um dicionário vazio é definido por “{}”. Um dicionário pode receber um valor “key” e uma descrição associada
à este valor, como em um dicionario de palavras comum. Assim, se dic = "palavra1" : "descrição1",
"palavra2" : "descrição2", então dic["palavra1"] é igual a "descrição1".
Usando o terminal interativo do python3 (>>>), indique o resultado dos comando abaixo:

>>> dic = {"UAG" : "Stop", "UAA" : "Stop", "AUG" : "Metionina/ Start"}


>>> for key in dic: print(key, dic[key])

>>> for i in ["UUU", "UUC"]: dic[i] = "Fenilalanina"


>>> dic

>>> dic["AUG"] = "Start"


>>> dic

>>> del dic["UUU"]


>>> dic
3 Concatenando matrizes moleculares e morfológicas para análises de ev-
idência total
Execute o script auxiliar help_ex_totevidence.sh e siga as instruções na tela.

3.1 Escreva um programa em Python com 10 linhas ou menos que leia as sequências em formato PHY
e imprimam novos arquivos em formato FASTA.

3.2 Escreva um programa em Bash que concatene os dados morfológicos em NEX e os dados moleculares
em FASTA com a ajuda do programa combineMatricesForPhylogenetics.py.
3.3 Escreva um pequeno manual para o programa combineMatricesForPhylogenetics.py incluindo
detalhes de seus argumentos e um exemplo de como executá-lo.

Você também pode gostar