Você está na página 1de 68

Universidade Federal Rural da Amazônia

Campus Paragominas

INTRODUÇÃO A BIOINFORMÁTICA
Prof. Marcus Braga

Bacharelado em Sistemas de informação


BIOINFORMÁTICA
VISÃO GERAL
continuação

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Representação de Sequências Biológicas - DNA

Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Representação de Sequências Biológicas - RNA

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Representação de Sequências Biológicas - Aminoácidos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Representação de Sequências Biológicas - Sequência Sacarídica

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Aplicações dos Métodos de Alinhamento de Sequências Biológicas (Resumo).

Inferência filogenética a partir do alinhamento de quatro sequências de nucleotídeos.

Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Aplicações dos Métodos de Alinhamento de Sequências Biológicas (Resumo).

Inferência da estrutura de uma proteína alvo (Desconhecida) a partir do alinhamento com uma sequência de aminoácidos
cuja estrutura tridimensional é conhecida (Conhecida).
Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Aplicações dos Métodos de Alinhamento de Sequências Biológicas (Resumo).

Inferência da função de um domínio proteico a parBr da comparação de sequências de aminoácidos.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Aplicações dos Métodos de Alinhamento de Sequências Biológicas (Resumo).

Comparação de sequências de uma porção de determinado gene de indivíduos afetados e não afetados por uma
doença genética. Os asteriscos identificam colunas com total similaridade dos caracteres.
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Técnicas/Algoritmos

Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância HAMMING

• Quantidade de mal pareamentos.


• Aplicada a sequências do mesmo tamanho.
• Ex.:
A A C T G G C C G T
| | | | | | | | | |
A A A T G G C C T T

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância HAMMING

• Quantidade de mal pareamentos.


• Aplicada a sequências do mesmo tamanho.
• Ex.:
A A C T G G C C G T
| | | | | | | | | |
A A A T G G C C T T

• H=2 Introdução a Bioinformática


BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.
• Ex.:
T G G A C T T
| | | | | | |
A A A T G G C C T T

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.
• Ex.: 4 edições

- - - T G G - C T T
| | | | | | |
A A A T G G C C T T

Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Alinhamento de Sequências

Alinhamento de Sequências - Medidas de Distância (Comparação)

Distância LEVENSHTEIN

• Quantidade de edições necessárias para transformar uma sequência na outra.


• Aplicada a sequências de tamanho variado.
• Ex.: 4 edições + 4 edições

A A A T G G C C T T
| | | | | | |
A A A T G G C C T T

• L=8 Introdução a Bioinformática


BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

• O Resultado do sequenciamento em geral é publicado em Bancos de Dados de


sequências biológicas.
• Na verdade, estes BDs são catálogos de dados com toneladas de informações
sobre as sequências já identificadas.
• A partir das sequencias depositadas (publicadas) é possível fazer comparações e
buscas para se tentar identificar novas (ou não) sequências.
• Por exemplo, se você quer apenas saber o homólogo de um gene específico, o
processo é bem mais simples:

. Procurar e comparar sua sequência comparando com outras em bancos de


sequências.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

A seguir, uma lista dos principais BDs biológicos.

• NCBI (National Center for Biotechnology Information)


www.ncbi.nlm.nih.gov/

• EBI (European Bioinformatics Institute)


www.ebi.ac.uk/

• Ensembl Genome Browser


www.genome.ucsc.edu/

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

• UniProt Knowledgebase (UniProtKB)


https://www.ebi.ac.uk/uniprot/

• PDB (The Protein Databank)


www.rcsb.org/pdb/

• GenBank (NIH Genetic Sequence Database)


www.ncbi.nlm.nih.gov/genbank/

• EMBL (European Molecular Biology Laboratory)


www.ebi.ac.uk/embl/

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

• DDBJ (DNA Data Bank of Japan)


www.ddbj.nig.ac.jp/

• Interpro
www.ebi.ac.uk/interpro/

• KEGG (Kyoto Encyclopedia of Genes and Genomes)


www.genome.ad.jp/kegg/

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

• COG Database
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC102395/

• EggNOG Database
http://eggnog5.embl.de/#/app/home

• OMA Browser - Orthology Matrix


https://omabrowser.org/oma/home/

Dezenas de outros bancos de dados de sequencias biológicas:


https://en.wikipedia.org/wiki/List_of_biological_databases
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Provavelmente o mais importante BD público biológico: GenBank (NCBI)

https://www.ncbi.nlm.nih.gov/

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Provavelmente o mais importante BD público biológico: GenBank (NCBI)

https://www.ncbi.nlm.nih.gov/

BLAST

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

• BLAST - Basic Local Alignment Search Tool.


• É um algoritmo capaz de realizar buscas baseadas em alinhamento que, apesar de
não serem exatas, são confiáveis e muito rápidas.
• Um dos programas mais usados em Bioinformática devido à velocidade em
comparar uma sequência desconhecida com as depositadas em bancos de dados.
• O BLAST aumenta a velocidade do alinhamento de sequências ao buscar primeiro
por palavras comuns (k-tuples) na sequência de busca e em cada sequência do
banco de dados.
• O BLAST limita a busca às palavras que são mais significantes. O tamanho de
palavra é fixado em 3 caracteres para aminoácidos e 11 para nucleotídeos
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

• BLAST

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

• BLAST
• Ex.: Buscar a seguinte sequência (no formato FASTA):

GCCCCCGGCCCCGCCCCGGCCCCGCCCCCGGCCCCGCCCCGCAAGGGTCACAGGTCACGGGG
CGGGGCCGAGGCGGAAGCGCCCGCAGCCCGGTACCGGCTCCTCCTGGGCTCCCTCTAGCGCC
TTCCCCCCGGCCCGACTCCGCTGGTCAGCGCCAAGTGACTTACGCCCCCGACCTCTGAGCCCG
GACCGCTAG

https://blast.ncbi.nlm.nih.gov/Blast.cgi

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Insere a sequência FASTA

Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Insere a sequência FASTA

Mecanismo de busca

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Resultado da busca por similaridade

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Resultado da busca por similaridade

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Resultado da busca por similaridade

Trecho procurado

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Resultado da busca por similaridade

Restante da
sequência

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Outras modalidades de BLAST


• PSI-BLAST – Position-Specific Iterated BLAST:
– busca iterativa a partir de sequências encontradas

• PHI-BLAST – Pattern-Hit Initiated BLAST:


– expressões regulares + alinhamento local nos matches

• MEGABLAST:
– algoritmo guloso para acelerar buscas de sequências
altamente similares (até 10x)
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Outras modalidades de BLAST

Compara uma sequência de nucleotídeos contra uma base de dados de sequência de nucleotídeos.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Outras modalidades de BLAST

Compara uma sequência de aminoácidos contra uma base de dados de sequência de proteínas.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Outras modalidades de BLAST

Compara uma sequência de nucleotídeos traduzida, em todos os quadros de leitura, contra uma base de dados de
sequência de proteínas.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Outras modalidades de BLAST

Compara uma sequência de proteína contra uma base de dados de sequência de nucleotídeos traduzida dinamicamente
em todos os quadros de leitura.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Exemplo de Busca em Bancos de Dados Biológicos

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Busca de um Genoma em Bancos de Dados Biológicos

Ex. de Organismos procatiotos:

Escherichia coli K12

Bacillus subtilis

Mycobacterium tuberculosis H37Rv

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Busca de um Genoma em Bancos de Dados Biológicos

1. Na página do NCBI escolha genome no menu da caixa de busca, e digite o genoma


que você quer buscar, atentando para não errar a grafia.
2. Na página desse genoma, explore as informações e depois encontre o link browse
the list e clique nele.
3. Vai aparecer uma tabela com vários genomas dessa espécie. Fixe-se no primeiro
genoma da tabela.
4. Para poder navegar no genoma, clique no link da coluna replicons que seja de um
cromossomo.
5. Na próxima página, clique no link Graphics.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Busca de um Genoma em Bancos de Dados Biológicos

6. Para poder ver a lista de proteínas desse genoma, na tabela clique no link da coluna
proteins (que é um número).
7. Para ter acesso à sequência FASTA desse genoma basta clicar em FASTA.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Pairwise Sequence Alignment is used to identify regions of similarity that may


indicate functional, structural and/or evolutionary relationships between two
biological sequences (protein or nucleic acid).

https://www.ebi.ac.uk/Tools/psa/

Global Alignment - Needle (EMBOSS) - EMBOSS Needle creates an optimal global


alignment of two sequences using the Needleman-Wunsch algorithm.

https://www.ebi.ac.uk/Tools/psa/emboss_needle/
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Pairwise Sequence Alignment is used to identify regions of similarity that may


indicate functional, structural and/or evolutionary relationships between two
biological sequences (protein or nucleic acid).

https://www.ebi.ac.uk/Tools/psa/

Global Alignment - Stretcher (EMBOSS) - EMBOSS Stretcher uses a modification of


the Needleman-Wunsch algorithm that allows larger sequences to be globally aligned.

https://www.ebi.ac.uk/Tools/psa/emboss_stretcher/
Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Pairwise Sequence Alignment is used to identify regions of similarity that may


indicate functional, structural and/or evolutionary relationships between two
biological sequences (protein or nucleic acid).

https://www.ebi.ac.uk/Tools/psa/

Local Alignment - Water (EMBOSS) - EMBOSS Water uses the Smith-Waterman


algorithm (modified for speed enhancements) to calculate the local alignment of two
sequences.

https://www.ebi.ac.uk/Tools/psa/emboss_water/ Introdução a Bioinformática


BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Pairwise Sequence Alignment is used to identify regions of similarity that may


indicate functional, structural and/or evolutionary relationships between two
biological sequences (protein or nucleic acid).

https://www.ebi.ac.uk/Tools/psa/

Local Alignment - Matcher (EMBOSS) - EMBOSS Matcher identifies local similarities


between two sequences using a rigorous algorithm based on the LALIGN application.

https://www.ebi.ac.uk/Tools/psa/emboss_matcher/
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Pairwise Sequence Alignment is used to identify regions of similarity that may


indicate functional, structural and/or evolutionary relationships between two
biological sequences (protein or nucleic acid).

https://www.ebi.ac.uk/Tools/psa/

Local Alignment - LALIGN - LALIGN finds internal duplications by calculating non-


intersecting local alignments of protein or DNA sequences.

https://www.ebi.ac.uk/Tools/psa/lalign/
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Pairwise Sequence Alignment is used to identify regions of similarity that may


indicate functional, structural and/or evolutionary relationships between two
biological sequences (protein or nucleic acid).

https://www.ebi.ac.uk/Tools/psa/

Genomic Alignment - GeneWise - GeneWise compares a protein sequence to a


genomic DNA sequence, allowing for introns and frameshifting errors.

https://www.ebi.ac.uk/Tools/psa/genewise/
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Multiple Sequence Alignment (MSA) is generally the alignment of three or more


biological sequences (protein or nucleic acid) of similar length. From the output,
homology can be inferred and the evolutionary relationships between the sequences
studied.

https://www.ebi.ac.uk/Tools/msa/

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

MulYple Sequence Alignment (MSA)

Clustal Omega - New MSA tool that uses seeded guide trees and HMM profile-
profile techniques to generate alignments. Suitable for medium-large
alignments.
h=ps://www.ebi.ac.uk/Tools/msa/clustalo/

EMBOSS Cons - EMBOSS Cons creates a consensus sequence from a protein or


nucleoGde mulGple alignment.
h=ps://www.ebi.ac.uk/Tools/msa/emboss_cons/ Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Multiple Sequence Alignment (MSA)

Kalign - Very fast MSA tool that concentrates on local regions. Suitable for large
alignments.
https://www.ebi.ac.uk/Tools/msa/kalign/

MAFFT - MSA tool that uses Fast Fourier Transforms. Suitable for medium-large
alignments.
https://www.ebi.ac.uk/Tools/msa/mafft/
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Multiple Sequence Alignment (MSA)

MUSCLE - Accurate MSA tool, especially good with proteins. Suitable for
medium alignments.
https://www.ebi.ac.uk/Tools/msa/muscle/

Mview - Transform a Sequence Similarity Search result into a Multiple Sequence


Alignment or reformat a Multiple Sequence Alignment using the MView
program.
https://www.ebi.ac.uk/Tools/msa/mview/ Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Programas de Alinhamento de Sequências

Multiple Sequence Alignment (MSA)

T-Coffee - Consistency-based MSA tool that attempts to mitigate the pitfalls of


progressive alignment methods. Suitable for small alignments.
https://www.ebi.ac.uk/Tools/msa/tcoffee/

WebPRANK - The EBI has a new phylogeny-aware multiple sequence alignment


program which makes use of evolutionary information to help place insertions
and deletions.
https://www.ebi.ac.uk/goldman-srv/webprank/ Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências

>gi|4504347|ref|NP_000549.1| alpha 1 globin [Homo sapiens]


MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKV
ADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKF
LASVSTVLTSK YR

>gi|14456443|gb|AAG40102.1| hemoglobin-alpha 1 [Equus caballus]


HFDLSHGSAQVKAHGQKVGDALTLAVGHLDDLPGALSNLSDLHAHKLRVDPVNFKLLSHCLLSTL
AVHLP NDFTPAVHASLDKFLSSVST

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências

1. Alinhamento Pairwise Global - Needle

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências

1. Alinhamento Pairwise Global - Needle

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências

1. Alinhamento Pairwise Local - Water

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências

1. Alinhamento Pairwise Local - Water

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências - Atividade

1. Alinhar as sequências de um mRNA de hemoglobina de camundongo com seu locus


genômico. Usar alinhamento Global e Local.
>gi|6680174|ref|NM_008218.1| Mus musculus hemoglobin alpha, adult chain 1
(Hba-a1), mRNA

CACTTCTGATTCTGACAGACTCAGGAAGAAACCATGGTGCTCTCTGGGGAAGACAAAAGCAACATCAAGGCTGCCTGGGGGAAGATTGGTGGCCATGGTGCT
GAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCACCACCAAGACCTACTTTCCTCACTTTGATGTAAGCCACGGCTCTGCCCAGGTCAAGGG
TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCCCGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTG
CGTGTGGATCCCGTCAACTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTTCACCCCCGCGGTACATGCCTCTCTGGAC
AAATTCCTTGCCTCTGTGAGCACCGTGCTGACCTCCAAGTACCGTTAAGCTGCCTTCTGCGGGGCTTGCCTTCTGGCCATGCCCTTCTTCTCTCCCTTGCACCTGT
ACCTCTTGGTCTTTGAATAAAGCCTGAGTAGGAAGAAGCC TGCA

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências - Atividade

1. Alinhar as sequências de um mRNA de hemoglobina de camundongo com seu locus


genômico. Usar alinhamento Global e Local.
>gi|49899|emb|V00714.1| Mouse gene for alpha-globin
GTAAGCAGGTTGTGGTTGAGAAAGGAAAGTGTGAAACAGGGACCCAGAGGGAGAGGTGGGGGGATGGCGCTGCTCAGTTTGGTTTGAGGGACTTGCTTCTCTGACCAAGGTAGG
AGGATACTAACTTCTTCCCAAACTGCCATCACTGGAGACATAGTAAGGGGTAAGAAAGTGTGTCCGGGCAACTGATAAGGATTCCCTGCACCTAGGGGAAGCACAACCCAGCCCCAG
AATCTCAGGGGCCCTAACAAGTTTTACTGGGTAGAGCAAGCACAAACCAGCCAATGAGTAACTGCTCCAAGGGCGTGTCCACCCTGCCTGGAGGACAGCCCTTGGAGGGCATATAA
GTGCTACTTGCTGCAGGTCCAAGACACTTCTGATTCTGACAGACTCAGGAAGAAACCATGGTGCTCTCTGGGGAAGACAAAAGCAACATCAAGGCTGCCTGGGGGAAGATTGGTGG
CCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGTGAGAACAGGACCTTGATCTGTAAGGATCACAGGATCCAATATGGACCTGGCACTCGCTCAGTGGGCAGCTTCTAACTAT
GCTTTTCTGTGACCTCAACTTCTCTTCTCTCCTTCTCCCAGGATGTTTGCTAGCTTCCCCACCACCAAGACCTACTTTCCTCACTTTGATGTAAGCCACGGCTCTGCCCAGGTCAAGGGT
CACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCCCGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTC
AACTTCAAGGTATGCGCTGGGACCTGGCAGGCGGCATCTGGGACCCCTAGGAAGGGCTTGGGGGTCCTCGTGCCCAAGGCAGGGAACATAGTGGTCCCAGGAAGGGGAGCAGAG
GCATCAGGGTGTCCACTTTGTCTCCGCAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTTCACCCCCGCGGTACATGCCTCTCTGGACAAATTCCTT
GCCTCTGTGAGCACCGTGCTGACCTCCAAGTACCGTTAAGCTGCCTTCTGCGGGGCTTGCCTTCTGGCCATGCCCTTCTTCTCTCCCTTGCACCTGTACCTCTTGGTCTTTGAATAAAGC
CTGAGTAGGAAGAAGCCTGCATGCCTGGTTCTCTGCGTCTGCAAAGGTGTCATGTTTAGTGTGGGGATGCCGCAGCTCATTTGCCATGGGGCAGTAAAGACAAGGTTCAGAGCAAA
AAGCATAATTGGATGCCTACACACACACACATATGTCTTCTGAGTCTGGGCAGCAGTCCCTCCCAAGCCCTCCACTGACAGCCATGTGTCTTCTCCTCGAGCCAAAGAAGCCAAAGATC
GTCTTTGGAGGGTCCTTATCACAGGACCTCTGAGGG Introdução a Bioinformá2ca
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências - Atividade

2. Buscar sequências similares no BLAST e identificar qual é essa sequência.

Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências - Atividade

2. Buscar sequências similares no BLAST e identificar qual é essa sequência.


>PF11_0344
ATGAGAAAATTATACTGCGTATTATTATTGAGCGCCTTTGAGTTTACATATATGATAAACTTTGGAAGAGGACAGAATTATTGGGAACATCCATATCAAAATAGTGATGTGTATCGTCCA
ATCAACGAACATAGGGAACATCCAAAAGAATACGAATATCCATTACACCAGGAACATACATACCAACAAGAAGATTCAGGAGAAGACGAAAATACATTACAACACGCATATCCAATAGA
CCACGAAGGTGCCGAACCCGCACCACAAGAACAAAATTTATTTTCAAGCATTGAAATAGTAGAAAGAAGTAATTATATGGGTAATCCATGGACGGAATATATGGCAAAATATGATATTG
AAGAAGTTCATGGTTCAGGTATAAGAGTAGATTTAGGAGAAGATGCTGAAGTAGCTGGAACTCAATATAGACTTCCATCAGGGAAATGTCCAGTATTTGGTAAAGGTATAATTATTGAG
AATTCAAATACTACTTTTTTAACACCGGTAGCTACGGGAAATCAATATTTAAAAGATGGAGGTTTTGCTTTTCCTCCAACAGAACCTCTTATGTCACCAATGACATTAGATGAAATGAGA
CAT TTTTATAAAGATAATAAATATGTAAAAAATTTAGATGAATTGACTTTATGTTCAAGACATGCAGGAAATATGATTCCAGATAATGATAAAAATTCAAATTATAAATATCCAGCTGTTTAT
GATGACAAAGATAAAAAGTGTCATATATTATATATTGCAGCTCAAGAAAATAATGGTCCTAGATATTGTAATAAAGACGAAAGTAAAAGAAACAGCATGTTTTGTTTTAGACCAGCAAAA
GATATATCATTTCAAAACTATACATATTTAAGTAAGAATGTAGTTGATAACTGGGAAAAAGTTTGCCCTAGAAAGAATTTACAGAATGCAAAATTCGGATTATGGGTCGATGGAAATTGT
GAAGATATACCACATGTAAATGAATTTCCAGCAATTGATCTTTTTGAATGTAATAAATTAGTTTTTGAATTGAGTGCTTCGGATCAACCTAAACAATATGAACAACATTTAACAGATTAT
GAAAAAATTAAAGAAGGTTTCAAAAATAAGAACGCTAGTATGATCAAAAGTGCTTTTCTTCCCACTGGTGCTTTTAAAGCAGATAGATATAAAAGTCATGGTAAGGGTTATAATTGGGG
A AATTATAACACAGAAACACAAAAATGTGAAATTTTTAATGTCAAACCAACATGTTTAATTAACAATTCATCATACATTGCTACTACTGCTTTGTCCCATCCCATCGAAGTTGAAAACAAT
TTTCCATGTTCATTATATAAAGATGAAATAATGAAAGAAATCGAAAGAGAATCAAAACGAATTAAATTAAATGATAATGATGATGAAGGGAATAAAAAAATTATAGCTCCAAGAATTTTT
ATTTCAGATGATAAAGACAGTTTAAAATGCCCATGTGACCCTGAAATGGTAAGTAATAGTACATGTCGTTTCTTTGTATGTAAATGTGTAGAAAGAAGGGCAGAAGTAACATCAAATAAT
GAAGTTGTAGTTAAAGAAGAATATAAAGATGAATATGCAGATATTCCTGAACATAAACCAACTTATGATAAAATGAAAATTATAATTGCATCATCAGCTGCTGTCGCTGTATTAGCAACT
ATTTTAATGGTTTATCTTTATAAAAGAAAAGGAAATGCTGAAAAATATGATAAAATGGATGAACCACAAGATTATGGGAAATCAAATTCAAGAAATGATGAAATGTTAGATCCTGAGGC
ATCTTTTTGGGGGGAAGAAAAAAGAGCATCACATACAACACCAGTTCTGATGGAAAAACCATACTATTA
Introdução a Bioinformática
BIOINFORMÁTICA - VISÃO GERAL
Bancos de Dados de Sequências Biológicas

Ex. Alinhamento de sequências - Atividade

3. Buscar no BLAST ou SWISSPROT (UniPROTKB) sequências similares à hemoglobina


do camundongo.

Introdução a Bioinformática

Você também pode gostar