Você está na página 1de 13

Construção de pipelines para Bioinformática

O que são pipelines?


• São processos pelo qual uma instrução de
processamento é subdividido em etapas
• Executar um conjunto de programas
sequencialmente
Executar três programas

Programa Programa Programa


A B C

3
Programas de computador

Entrada de
Processamento Saída de dados
dados

4
Dependência

Programa A Programa B Programa C

• Entrada • Entrada • Entrada


(usuário) (A) (B)
• Saída (A) • Saída (B) • Saída (C)

5
Controle

Pipeline

Programa A Programa B Programa C

6
Pipelines
• Programa principal que controla a execução
de outros programas
• Processa entrada e saída de dados
• Manipulação de formatos

7
Por que usar pipelines?
• Você não precisa reinventar a roda
– Existem programas que são considerados estado-
da-arte (ex. BLAST)

• Automatização de processos
– Execução em larga escala

8
Exemplo de pipeline PHP + Python

9
Montagem de genomas
Tratamento de dados

Filtro de qualidade Remoção de primers Simples scripts

Montagem de novo

Mira SPADES

Scaffolding

CONTIGuator Optical mapping

10
Modelagem de proteínas

• Importância da estrutura tridimensional


– Difíceis de se obter

• Dados de sequenciamento
• Conversão:
– Sequências => estruturas tridimensionais

11
Pipeline para modelagem de proteínas

Identificação de template

Alinhamento

Modelagem por homologia

Avaliação do modelo

12
.com Obrigado!

@diiegomariano
13

Você também pode gostar