Escolar Documentos
Profissional Documentos
Cultura Documentos
sequncias biolgicas
?
- Uma forma rpida de agregar alguma informao sobre uma
sequncia desconhecida compar-la com um banco de dados de
sequncias com funes conhecidas
- Esta comparao feita atravs de alinhamentos par a par entre
as sequncias. Isto , se o banco de dados possuir 1000 sequncias
conhecidas sero realizados 1000 alinhamentos
- Tipicamente so usados os bancos de dados mundiais (NCBI,
EMBL)
Fonte: http://www3.ebi.ac.uk/Services/DBStats/
E-value
value 0.0001
0.00001 = 1 x 10-5 = 1e-5
1e-10
1e-50
1e-100
1e-180
0
- Reconstruo
da sequncia consensu a partir de sobreposies
de fragmentos de sequncias (montagens de sequncias de
DNA)
- Alinhamento entre sequncias de ESTs e DNA genmico
- Comparao entre protenas e DNA
- Construo de mapas fsicos
- Comparao entre genomas
- ...
Alinhamentos
-A comparao entre sequncias de DNA de organismos
diferentes baseada no conceito de que estes organismos
originaram-se de um ancestral comum.
- No contexto de evoluo as sequncias de DNA sofrem
mutaes. Estas modificaes locais entre os nucleotdeos podem
ser :
- Inseres : insero de uma base ou vrias bases na
sequncia
- Delees : deleo de uma base ou mais bases na sequncia
- Substituies : substituio de uma base por outra
- Portanto um programa de alinhamento de sequncias biolgicas
tem que considerar essas mutaes
Exemplo :
Gap = -2
Match = 1 Mismatch = -1
http://bioweb.pasteur.fr/seqanal/interfaces/stretcher-simple.html
- G A C A T T G
- 0 -2 -4 -6 -8 -10 -12 -14
G -2
A -4
T -6
C -8
A -10
A -12 [i,j]=p(i,j)
T -14
G -16
- Para
um elemento da matriz [i,j] qualquer, temos p(i,j) = 1 se for
um match e p(i,j) = -1 se for um mismatch.
- G A C A T T G
- 0 -2 -4 -6 -8 -10 -12 -14
G -2
A -4
T -6
C -8
A -10 [i-1,j-1] [i-1,j]
A -12 [i,j-1] [i,j] = max([i-1,j] - 2,
T -14 [i-1,j-1] + p(i,j),
[i,j-1] - 2)
G -16
A G C
0 -2 -4 -6
A -2 1 -1 -3
A -4 -1 0 -2
A -6 -3 -2 -1
C -8 -5 -4 -1
- G A C A T T G
- 0 0 0 0 0 0 0 0
G 0
A 0
T 0
C 0
A 0 [i-1,j-1] [i-1,j]
A 0 [i,j-1] [i,j] = max([i-1,j] - 2,
[i-1,j-1] + p(i,j),
T 0 [i,j-1] 2,
G 0 0 zero)
- Alinhamento protena-protena
- Alinhamento nucleotdeo-protena
- Alinhamento protena-nucleotdeo
- Alinhamento nucleotdeo-nucleotdeo (feito em protenas)
Matrizes de substituio
- BLOSUM (BLOcks of amino acid SUbstitution Matrix )
- I e V => Hidrofbicos
- D e W => D (carga negativa) e W (aromtico)
- C => pontes de sulfeto (estrutural)
-A matriz foi construda a partir de alinhamentos
mltiplos globais de 504 grupos de protenas
http://www.ncbi.nlm.nih.gov/blast/
Limita a regio da sequncia
que ser usada na consulta
E-value de corte
Nmero de bases que sero
utilizados para formar as k-tuplas
Corte 1e-5
1 64
query
subject
1 71 134
BLASTx diferenas importantes
91
63 95 243
1 query
subject
1 11 60
10
BLAST local
Pode ser instalado localmente
Bancos de dados prprios e atualizaes
Facilidades
Velocidade de buscas
Maleabilidade
Automatizao
Dados locais
Independe de internet
PHI-BLAST
-um blastp com a opo de passar uma outra sequncia curta ou
um padro servindo como um vnculo para a consulta
N - Qualquer nucleotdeo
N(3) - Uma sequncia de trs nucleotdeos
Ex :
N(2,4) - Uma sequncia de 2,3 ou 4
nucleotdeos [CG](5)TG{A}N(1,5)C
[AC] - pode ser um A ou um C
{AG} - no pode ser nem A e nem G
PSI-BLAST
- um blastp interativo no qual a matriz (BLOSUM), aps a primeira
interao, refeita com base nos alinhamentos entre as protenas
resultantes da consulta :
- uma posico conservada no alinhamento recebe um score
alto e uma posio no conservada um score baixo
- til para encontrar membros distantes de famlias de protenas
BL2SEQS
- Faz um alinhamento de uma sequncia contra a outra (blastn/blastx/blastp/tblastx/tblastn)
- http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi
Spliced alignments
http://mobyle.pasteur.fr/cgi-bin/MobylePortal/portal.py?form=est2genome
Alinhamento de genomas
http://asap.ahabs.wisc.edu/mauve/
FIM