Você está na página 1de 19

Busqueda avanzada

con BLAST
Preparada por Genis Parra

Contenido

1.
2.
3.

Blast traducidos
Aplicaciones especiales de Blast NCBI
PSI-Blast Busqueda de homlogos remotos

1. Blast traducidos

La familia Blast

Blast estndar:

blastn: nucletido x nucletido


blastp: protena x protena

Blast traducidos:

blastx : nucletido x protena


tblastn : protena x nucletido
tblastx : nucletido x nucletido

blastx
Traduce la secuencia de DNA, en sus seis
posibles pautas de lectura, y las compara
contra una base de datos de protenas.

Secuencia problema: DNA


Base de datos: Protena

blastx (ejemplo)

Conocemos una secuencia de DNA que


sabemos que se transcribe y queremos
saber si tiene alguna protena codificada en
ella que se parezca a una protena de la
base de datos

# Problema
ATGATTCATGCAGACTAGTAC

Traduccin
MIHAD*Y
*FMQTS
VLVCMNH Y*SA*I

# Base de datos
ASFGTDA SSAEVBH FASDEAG SDFEARS

DSCRLV
TSLHES

FSASDF ASFSERA

tblastn
Compara una protena problema contra una
base de datos de DNA traducida
dinmicamente

Secuencia problema: protena


Base de datos: DNA

tblastn (ejemplo)

Queremos saber si la protena que estamos


estudiando se encuentra en algn genoma
recin secuenciado de otra especie.

# Problema
ASFGTDAMHVN
# Base de datos
TAACGTCAGT CATGCATGCA
ATGATTCATGCAGACTAGTAC

Traduccin
*RQSCMH NVSHAC TSVMHA
MHA*LTL CMHD*R ACMTDV
MIHAD*Y
*FMQTS DSCRLV
VLVCMNH Y*SA*I
TSLHES

tblastx
Compara las seis posibles traducciones de
una secuencia de DNA contra las las seis
posibles traducciones de una base de datos
de DNA.

Secuencia problema: DNA


Base de datos: DNA

tblastx (ejemplo)

Tenemos un fragmento genmico que


sospechamos que codifica para una protena
queremos saber si algn fragmento de DNA de
otra especie se parece a nivel de protena
traducida para reforzar nuestra hiptesis.

# Problema
TTACATAGTCATGGCTTGCT

Traduccin
*RQSCMH NVSHAC
MHA*LTL CMHD*R
# Base de datos
Traduccin
TAACGTCAGTCATGCATGCA
*RQSCMH NVSHAC
MHA*LTL CMHD*R
ATGATTCATGCAGACTAGTAC MIHAD*Y
*FMQTS
VLVCMNH Y*SA*I

TSVMHA
ACMTDV
TSVMHA
ACMTDV
DSCRLV
TSLHES

2. Aplicaciones especiales
de BLAST NCBI

Aplicaciones especiales (I)

Alineando dos secuencias con BLAST

Blast2Sequences

BLAST especializados:

Deteccin de contaminacin durante el clonado y


secuenciacin (VecScreen)
Deteccin de inmunoglobulinas y sus dominios
(IgBLAST)

Aplicaciones especiales (II)

Bsqueda de dominios conservados en


Conserved Domain Database. (CDD)
Megablast: Blast optimizado para bsquedas
en largas regiones genmicas (genomas
completos).
Blast configurado automticamente para
encontrar fragmentos cortos y altamente
conservados.

3. PSI-BLAST

PSI-BLAST
Position-Specific Iterated BLAST
PSI-BLAST realiza una bsqueda iterativa en
que las secuencias encontradas en cada
bsqueda son utilizadas para generar una matriz
de sustitucin especifica para cada posicin de
la protena problema.
La nueva matriz de substituciones generada con
las protenas alineadas nos permite reconocer
homlogos remotos, ya que tenemos
informacin de las substituciones especificas de
esta familia.

Aliniamiento multiple
Matriz de pesos
target
A = a 1a2a3a4a5
B = b 1b2b3b4b5
homlogo 1
C = c1c2c3c4c5
homlogo 2
D = d 1d2d3d4d5
homlogo 3
E = e 1e2e3e4e5
homlogo 4
sustitucin
especfica de
posicin

Que ocurrir si
volvemos a
ejecutar BLAST ?

Nuevo score de
sustitucin

ANNQERTYWDFGH Score
AQQQDKSFFEYGG
ANNQERTYWDFGH Score
GQQ-DKSFY--GG

PSI-BLAST
BLAST

La misma target

Nueva matriz
ANNQERTYWDFGH
Nuevo Score
GQQ-DKSFY--GG
BLAST 2
ANNQERTYWDFGH Nueva Secuencia
GQQD-KKS--HG

PSI-BLAST
Iterativo
Incrementa el nmero
de homlogos remotos

No hay nuevas secuencias

STOP

Problemas del PSI-blast


1.

2.

Necesitamos un conjunto de protenas


relacionadas evolutivamente para generar
la matriz de substitucin especfica.
Si incluimos protenas que no estn
relacionadas evolutivamente, estamos
degenerando el patrn de bsqueda.

Você também pode gostar