Você está na página 1de 94

Universidade Federal Rural da Amazônia

Campus Paragominas

INTRODUÇÃO A BIOINFORMÁTICA
Prof. Marcus Braga

Bacharelado em Sistemas de informação


BIOINFORMÁTICA
VISÃO GERAL
continuação

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Sequenciamento NGS (pra finalizar)

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Sequenciamento NGS (pra finalizar)

Quais são as finalidades de sequenciamento?

Para citar algumas:


• Descoberta de genes, transcritos e proteínas;
• Identificação de taxa - espécies, gêneros...;
• Genotipagem de populações;
• Identificação de diferenças genéticas que implicam no fenótipo de determinado
organismo.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
O que está envolvido ?

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
O que está envolvido ?

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
O que se deseja ?

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
Ciências Ômicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
Ciências Ômicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
Ciências Ômicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bioinformática: Aplicações
Ciências Ômicas (Trans-Ômicas)

Introdução a Bioinformática
Onde tudo começa:
SEQUÊNCIA BIOLÓGICA
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Importante pra avaliar diferenças

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Como avaliar as diferenças ?

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA - HOMOLOGIA

O que é Homologia ?

• Conceito básico para estudos de genômica comparativa;


• Passo inicial para estudos de filogenia (ômica);
• Importante para pipelines de anotação funcional;
• Utilizado em processos de modelagem estrutural;

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

O que é Homologia ?
É o compartilhamento de uma estrutura com origem comum.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

O que é Homologia ?
Essa origem é comum porque foi herdada a partir de um ancestral comum.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

O que é Homologia ?

• O conceito de homologia é oposto ao de analogia.


• Os caracteres análogos não possuem origem comum,
mesmo possuindo funções semelhantes.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Homologia na Biologia Molecular

• Genes de organismos distintos herdados a partir do mesmo ancestral são


homólogos.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Homologia na Biologia Molecular

• Homologia não significa igualdade, mas simplesmente origem comum.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Homologia na Biologia Molecular

• Homologia tem um caráter booleano: Verdadeiro ou Falso.

• Afirmações como:

. 30% de homologia;
. 78% homólogos;
. Forte homologia.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Homologia na Biologia Molecular

• Homologia tem um caráter booleano: Verdadeiro ou Falso.

• Afirmações como:

. 30% de homologia; das !


erra
estão
. 78% homólogos;
. Forte homologia.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Homologia na Biologia Molecular

• Homologia tem um caráter booleano: Verdadeiro ou Falso.

• Afirmações como:

. 30% similares; eto!


co rr
. 78% de similaridade;
. Divergiram recentemente.

• Ou a origem é comum ou não é Introdução a Bioinformática


BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia

• Diferentes maneiras de divergir levam a diferentes tipos de homologia:


. Ortólogos
. Parálogos
. Xenólogos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia

• Diferentes maneiras de divergir levam a diferentes tipos de homologia:


.
. Parálogos
. Xenólogos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia

• Diferentes maneiras de divergir levam a diferentes tipos de homologia:


. Ortólogos
. Parálogos
. Xenólogos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia

• Diferentes maneiras de divergir levam a diferentes tipos de homologia:


. Ortólogos
. Parálogos
. Xenólogos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Ortólogos

• Genes que divergiram por especiação


. cada descendente possui uma cópia do gene
. tendência à conservar função:
- ambas instâncias continuam sendo necessárias

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Ortólogos

• Genes que divergiram por especiação


. cada descendente possui uma cópia do gene
. tendência à conservar função:
- ambas instâncias continuam sendo necessárias

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Ortólogos

• Genes que divergiram por especiação


. cada descendente possui uma cópia do gene
. tendência à conservar função:
- ambas instâncias continuam sendo necessárias

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Ortólogos

• Genes que divergiram por especiação


. cada descendente possui uma cópia do gene
. tendência à conservar função:
- ambas instâncias continuam sendo necessárias

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Ortólogos

• Genes que divergiram por especiação


. cada descendente possui uma cópia do gene
. tendência à conservar função:
- ambas instâncias continuam sendo necessárias

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Parálogos

• Genes que divergiram por uma duplicação


. genes parálogos estão presentes em mais de uma cópia
. após a divergência a função tende a mudar

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Parálogos

• Genes que divergiram por uma duplicação


. genes parálogos estão presentes em mais de uma cópia
. após a divergência a função tende a mudar

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Parálogos

• Genes que divergiram por uma duplicação


. genes parálogos estão presentes em mais de uma cópia
. após a divergência a função tende a mudar

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Parálogos

• Genes que divergiram por uma duplicação


. genes parálogos estão presentes em mais de uma cópia
. após a divergência a função tende a mudar

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Parálogos

• Genes que divergiram por uma duplicação


. genes parálogos estão presentes em mais de uma cópia
. após a divergência a função tende a mudar

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Xenólogos

• Divergiram por Transferência Horizontal de Genes (HGT)


• Aquisição de novas funções

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Xenólogos

• Divergiram por Transferência Horizontal de Genes (HGT)


• Aquisição de novas funções

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Xenólogos

• Divergiram por Transferência Horizontal de Genes (HGT)


• Aquisição de novas funções

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Tipos de Homologia - Xenólogos

• Induzir a fusão de células é um mecanismo utilizado por vírus para expandir


• Ex.: formação de um sincício;

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Identidade, Similaridade e Homologia

• Se duas (ou mais) sequências são parecidas:

elas podem ser homólogas


elas podem ter funções similares
elas podem ter a mesma estrutura

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Busca pela Similaridade

Predição de genes
Predição de função
Predição de estrutura
Inferência de árvores filogenéticas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Segundo Lesk (2005), consiste na determinação da correspondência entre pares de


resíduos.

Em Bioinformática, um alinhamento de sequências é uma forma de organizar


estruturas primárias de DNA, RNA ou proteína para identificar regiões similares que
possam ser consequência de relações funcionais, estruturais ou evolucionárias entre
elas.

Uma das técnicas mais usadas na Bioinformática !

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Um bom alinhamento (Mishra et al., 2016)

“A true alignment of nucleotide or amino acid sequences is one that reflects the
evolutionary relationship between two or more homologous sequences that
share a common ancestor (...) Homologous sequences may have different length,
though, which is nearly explained through insertions or deletions in sequences.”

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Por que alinhar ? Montagem de genomas e transcriptomas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Por que alinhar ? Desenho de primers

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Por que alinhar ? Predição de transcritos

Identificação de introns e exons


Overview of the SFA-align algorithm (Jammali et al., 2019)
(CDS-to-gene), domínios, regiões conservadas.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Por que alinhar ?


• Avaliar se duas sequências de resíduos
(nucleotídeos ou aminoácidos) são similares;
• Inferir (e justificar) homologia entre
sequências;
• Transferir informação funcional;
• Traçar possíveis caminhos de
desenvolvimento evolutivo entre genes
parálogos e ortólogos.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• Na base da evolução dos organismos está a evolução dos genes.


• Genes também tem “parentesco”.
• Podemos quantificar o parentesco entre genes fazendo alinhamento entre suas
sequências.
• Mas o alinhamento deve ser feito sempre entre genes homólogos.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

GTGGTGGCCTACGAAGGT
GTAGTGCCTTCGAAGGGT

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• Como avaliar um alinhamento ?


• Com um sistema de pontuação.
• Quando um caractere corresponder (match) haverá bonificação, quando não
corresponder (mismatch), haverá uma penalização.

• Ex.: . Match: +1
. Mismatch: –1

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• Como avaliar um alinhamento ?


• Com um sistema de pontuação.
• Quando um caractere corresponder (match) haverá bonificação, quando não
corresponder (mismatch), haverá uma penalização.

• Ex.: . Match: +1
. Mismatch: –1

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• É possível melhorar um alinhamento ?


• Sim, com a introdução de espaços.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• É possível melhorar um alinhamento ?


• Sim, com a introdução de espaços.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• Sistema de pontuação com espaços

. Match: +1
. Mismatch: –1
. Espaço: –2
. Buraco: sequência de espaços (Em inglês: gaps)

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• Sistema de pontuação com espaços

. Match: +1
. Mismatch: –1
. Espaço: –2
. Buraco: sequência de espaços (Em inglês: gaps)

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

• Matches tem que ser recompensados (> 0).


• Mismatches e espaços tem que ser penalizados (< 0).
• Mismatches representam substituições.
. Mutações (ocorrem com frequência)
. Podem não trazer letalidade
• Espaços representam inserções ou remoções (indel).
. Mais prováveis de causarem letalidade
- Alteram quadro de leitura
. Ocorrem com muito menos frequência

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequência do DNA

Alinhamentos Ótimos

• São os alinhamentos de pontuação máxima.


• Mede a similaridade entre duas sequências
. É o valor da pontuação do alinhamento ótimo
• No exemplo anterior
. Similaridade = 9

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipos de Algoritmos

Quanto à exaustão/exatidão da busca

• EXATOS (Exact Matching): Busca exaustiva entre sequências idênticas.


Ex.: Needleman-Wunsch (global, DP, sequências curtas), Smith-Waterman
(local, DP).
• HEURÍSTICOS (Approximate Matching): não exaustivos, abordagem aproximada
(busca por sequencias ou trechos similares). Tempo razoável de execução.
Exemplos: FASTA e BLAST.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipos de Algoritmos

Quanto à abrangência da comparação

• LOCAL: sequências que podem ser similares (ou não). Busca regiões com alto grau
de similaridade.
Ex. : BLAST, Smith-Waterman (SWAT), Water, Matcher (EMBOSS), LALIGN.
• GLOBAL: mais adequado para sequências próximas/similares de mesmo
comprimento. Alinhamento do começo ao fim das sequências para encontrar o
melhor alinhamento.
Ex.: Needleman-Wunsch, Needle, Stretcher (EMBOSS).
• SEMI-GLOBAL
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

• Aplicação: comparar 2 sequências de aminoácidos


• Aminoácidos se dividem em famílias

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

• Aplicação: comparar 2 sequências de aminoácidos

• % de identidade é uma medida simples mas válida de similaridade de sequências


de proteínas.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

• O objetivo de alinhamentos globais é sobrepor “sítios homólogos” das sequências


alinhadas.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

• O objetivo de alinhamentos globais é sobrepor “sítios homólogos” das sequências


alinhadas.
• Lacunas: são adicionadas quando há uma inserção/deleção, e portanto não há
equivalente na outra sequência

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

• O objetivo de alinhamentos globais é sobrepor “sítios homólogos” das sequências


alinhadas.
• Pareamentos e não-pareamentos: essas posições vão ser sobrepostas de acordo
com a insersão das lacunas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Global

• Algoritmo Needleman-Wunsch.
• Programas:

. needle (EMBOSS)
. stretcher (EMBOSS) (demora mais, mas economiza memória)
. FASTA

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Local

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Local

• Aplicações:

. Encontrar um gene em um genoma


. Identificar éxons
. Identificar domínios proteicos
. Identificar possíveis homólogos em um banco de dados

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Local

• Algoritmo Smith-Waterman
• Programas

. water (EMBOSS)
. matcher (demora mais, mas economiza memória)
. cross_match (swat) – bom para mascaramento
. FASTA
. BLAST
. BLAT

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Semi-Global

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Semi-Global

• Aplicação: Montagem de Genomas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Semi-Global

• Aplicação: Alinhamento múltiplo de sequências

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo Semi-Global

• Aplicação: Alinhamento múltiplo de sequências

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipos de Algoritmos

Quanto ao número de sequências comparadas

• PAREADO (PAIRWISE): entre duas sequências.


Ex.: BLAST.

• MÚLTIPLO: usado para identificar regiões de similaridade entre três ou mais


sequências de comprimento similar. Requisito para análises filogenéticas.
Ex,: BLAST, CLUSTAL, HMMs, MUSCLE.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo PAIRWISE

• Objetivo de deixar duas sequências o mais parecidas possível.


• Como ? Ajustando as posições de suas letras, se necessário usando espaços:

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo PAIRWISE

• Objetivo de deixar duas sequências o mais parecidas possível.


• Como ? Ajustando as posições de suas letras, se necessário usando espaços:

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo PAIRWISE

• Objetivo de deixar duas sequências o mais parecidas possível.


• Como ? Ajustando as posições de suas letras, se necessário usando espaços:

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo PAIRWISE

• Objetivo de deixar duas sequências o mais parecidas possível.


• Como ? Ajustando as posições de suas letras, se necessário usando espaços:

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo PAIRWISE

Sistema de SCORES.

• Pontos para match (ex: +2)


• Penalidades para mismatch (ex: -1)
• Penalidades para gap
. abertura (ex: -3)
. extensão (ex: -1)

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo PAIRWISE

Sistema de SCORES.

• Pontos para match (ex: +2)


• Penalidades para mismatch (ex: -1)
• Penalidades para gap
. abertura (ex: -3)
. extensão (ex: -1)

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Tipo MÚLTIPLO

Sempre usará o paradigma do ALINHAMENTO GLOBAL

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Identidade, Similaridade e Homologia

Conceito Tipo de Métrica Sentido

Identidade Quantitativa quantos idênticos ?

Similaridade Quantitativa quantos parecidos ?

Homologia Qualitativa TEM ou NÃO TEM um


ancestral comum ?

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância HAMMING

• Quantidade de mal pareamentos.


• Aplicada a sequências do mesmo tamanho.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância HAMMING

• Quantidade de mal pareamentos.


• Aplicada a sequências do mesmo tamanho.
• Ex.:
A A C T G G C C G T
| | | | | | | | | |
A A A T G G C C T T

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância HAMMING

• Quantidade de mal pareamentos.


• Aplicada a sequências do mesmo tamanho.
• Ex.:
A A C T G G C C G T
| | | | | | | | | |
A A A T G G C C T T

• H=2 Introdução a Bioinformática


BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.
• Ex.:
T G G A C T T
| | | | | | |
A A A T G G C C T T

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.
• Ex.: 4 edições

- - - T G G - C T T
| | | | | | |
A A A T G G C C T T

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.
• Ex.: 4 edições + 4 edições

A A A T G G C C T T
| | | | | | |
A A A T G G C C T T

• L=8 Introdução a Bioinformática

Você também pode gostar