Você está na página 1de 42

GenBank

GenBank

Qu es Genbank?

GenBank es la base de datos de secuencias genticas del


NIH. Contiene todas las secuencias de ADN de acceso
pblico y, adems, incluye anotaciones. Las secuencias
estn distribudas en 3 BD: Nucleotide, EST y GSS

http://www.ncbi.nlm.nih.gov/genbank/

GenBank

NAR (Database Issue)

GenBank

International Nucleotide Sequence Database Collaboration

GenBank
Cada dos meses sale una
nueva versin de GenBank.
La versin 206 (15 de
Febrero de 2015)
contiene ms de 181
millones de secuencias
Ms o menos cada 18
meses se duplica el nmero
de secuencias de GenBank
Es posible descargar la
base de datos completa
desde el sitio ftp del NCBI.

ftp://ftp.ncbi.nih.gov/genbank
El crecimiento de GenBank

GenBank

Tambin crece el nmero de usuarios de GenBank

GenBank
Hay varias formas de enviar secuencias a GenBank

Cmo envo una secuencia a GenBank?

GenBank
(12)

(8)

Cada secuencia pertenece a una de las 20 divisiones de GenBank

GenBank
Hay varias formas de acceder a las secuencias de
nucletidos almacenadas en Gen Bank: (1) a travs de
la base de datos Nucleotide, (2) a travs de la
herramienta BLAST o (3) a travs de programas
especficos desarrollados por el NCBI.

Cmo accedo a una secuencia de GenBank?

GenBank
Puedo acceder a las secuencias almacenadas en
GenBank a travs de la base de datos Nucleotide.

http://www.ncbi.nlm.nih.gov/nucleotide/

Acceso directo: La base de datos Nucleotide

GenBank
Puedo acceder a las secuencias almacenadas
en GenBank a travs de la base de datos EST.

http://www.ncbi.nlm.nih.gov/nucest/

Acceso directo: La base de datos EST

GenBank
Puedo acceder a las secuencias almacenadas
en GenBank a travs de la base de datos GSS.

http://www.ncbi.nlm.nih.gov/nucgss/

Acceso directo: La base de datos GSS

GenBank
http://blast.ncbi.nlm.nih.gov/Blast.cgi

Acceso indirecto: desde la herramienta BLAST

GenBank
Resultados de una
bsqueda en BLAST

Pincha aqu para


acceder al registro de
GenBank
correspondiente a una
de las secuencias que
ha encontrado BLAST

Acceso indirecto desde la pgina de resultados

GenBank

Pincha aqu
para
seleccionar
GenBank
Pincha aqu para acceder
al fichero de GenBank
correspondiente al gen
que codifica esta protena

Acceso indirecto: desde un registro de la BD UniProtKB

GenBank

GenBank
Puedes
seleccionar otras
bases de datos

Introduce aqu
el trmino de
la bsqueda
Inicia la
bsqueda
Informacin
sobre el NCBI

Documentacin
sobre el NCBI
Otras bases de datos

http://www.ncbi.nlm.nih.gov/nucleotide

GenBank
Para buscar secuencias en Gen Bank se puede introducir el nombre
de una protena, de un gen o del autor que envi la secuencia.
Tambin se puede introducir directamente el nmero de acceso. Si
se ponen trminos compuestos, entre comillas.

Cmo hacer una bsqueda sencilla

GenBank
Aqu se introduce el trmino
que queremos buscar: colicin

Inicio la
bsqueda

NUCLEOTIDE: Bsqueda rpida

GenBank
Tambin ha encontrado
secuencias EST y GSS

104720 secuencias
encontradas

Esta bsqueda no ha
sido muy productiva

Hay que definir mejor los


trminos de la bsqueda
para que me sea til

Resultados de la bsqueda

GenBank

Los trminos compuestos


se ponen entre comillas

Inicio de la
bsqueda

Bsqueda ms detallada con un trmino compuesto

GenBank
73 secuencias
encontradas

Resultados de
la bsqueda
clasificados por
organismo

Selecciona las
secuencias de
Escherichia coli

Puedes filtrar los


resultados de la bsqueda

Bsqueda ms detallada con un trmino compuesto

GenBank

Inicio de la
bsqueda

Puedo introducir ms de un
trmino y usar los operadores
lgicos (AND, OR, NOT)

Bsqueda con varios trminos usando operadores lgicos

GenBank
Pincha aqu para
cambiar el formato
de presentacin de
los resultados de la
bsqueda

Pincha aqu
para acceder a
la secuencia

Selecciona la secuencia que quieres ver

GenBank

Se puede cambiar el formato de presentacin de los resultados

GenBank

Enlaces a otras
bases de datos

Registro de GenBank seleccionado

GenBank

Bsqueda avanzada

GenBank
Introduce un
operador
lgico

Introduce aqu
los trminos de
la bsqueda

Aade otro
trmino de
bsqueda

Trminos de bsqueda avanzada

GenBank
Los registros almacenados en la base de datos
GenBank constan de varios apartados:
1.- Encabezamiento: informacin general
sobre el registro (identificadores, nmero
de acceso, descripcin del gen y del
organismo de donde procede)
2.- Referencias bibliogrficas
3.- Tabla de caractersticas (Features table)
4.- Secuencia de nucletidos (en cdigo de
una letra)
Contenido de un registro de GenBank

GenBank

Encabezamiento

Referencias
bibliogrficas
La ltima referencia (en este caso es la 2) incluye detalles
sobre quin ha enviado la secuencia a la base de datos

Encabezamiento y referencias bibliogrficas

GenBank
Tipos de
caracterstica

Se detalla la ubicacin
exacta (location) de
cada tipo de
caracterstica y se
aaden uno o ms
calificadores
(qualifiers). Tambin
hay enlaces a otras BD.

Tabla que rene las


caractersticas de
la secuencia

Tabla de caractersticas (Features table)

GenBank
Secuencia de
nucletidos. Cada lnea
contiene 60 nucletidos
agrupados en 6 bloques
de 10. El tipo de letra es
Courier para que cada
lnea ocupe siempre la
misma anchura.

Smbolo que
indica que se ha
llegado al final
del registro

La secuencia de nucletidos

GenBank

Pincha aqu para


ver la secuencia
mediante un
grfico interactivo
Pincha aqu para
obtener la
secuencia en
formato FASTA

El formato FASTA es aceptado por


la mayora de los programas de
anlisis de secuencias

Otras formas de ver la secuencia

GenBank
Lnea de definicin: En la
primera lnea se incluye
una escueta definicin de
la secuencia. Siempre
empieza por el smbolo >

Secuencia
ininterrumpida de
nucletidos (70
por cada lnea)

Es posible que te interese guardar esta


secuencia en tu ordenador. Puedes hacer
corta y pega y guardarla en un fichero Word.

La secuencia de nucletidos en formato FASTA

GenBank
Regin
vista en
pantalla

Zoom
Hebra directa 53
(forward)

Hebra complementaria
(complement)

Hebra directa (53) y protena


que codifica. La hebra
complementaria tambin puede
codificar protenas.

Grfico interactivo de la secuencia

GenBank
Forward: Cualquier secuencia escrita en sentido (5 3)

5-gaggagaagtctgccgttactgccctgtgg-3
Reverse: la secuencia anterior escrita en sentido (3 5)

3-ggtgtcccgtcattgccgtctgaagaggag-5
Complement: la secuencia complementaria escrita en sentido (3 5)

5-gaggagaagtctgccgttactgccctgtgg-3
3-ctcctcttcagacggcaatgacgggacacc-5
Reverse-complement: la secuencia complementaria escrita en sentido (5 3)

5-gaggagaagtctgccgttactgccctgtgg-3
5-ccacagggcagtaacggcagacttctcctc-3

Forward, reverse, complement and reverse-complement

GenBank
La hebra que sirve de molde para la transcripcin
es la hebra antisentido. Tambin se llama hebra
no codificante, hebra (-) o hebra de Watson.

La hebra complementaria, que no sirve de molde para la transcripcin, es la


hebra con sentido. Su secuencia es igual a la del transcrito RNA (cambiando
U por T). Tambin se llama hebra codificante, hebra (+) o hebra de Crick.

Qu sentido tiene todo esto?

GenBank
Pinchando en cada
caracterstica
(feature), la puedes
ver con todo detalle

Se puede ver cada caracterstica por separado

GenBank
Se resalta la regin de la secuencia de nucletidos que
corresponde a la CDS (empieza por ATG y termina en TAA)
Pincha aqu para
obtener la regin
seleccionada en
formato FASTA
Enlaces a otras
BD que ofrecen
informacin
relacionada

Pincha aqu para


seleccionar otra
caracterstica

Pincha aqu para


ver los detalles
relacionados con
la caracterstica
seleccionada

Pincha aqu
para obtener
la regin
seleccionada
en el formato
de GenBank

Vista detallada de una caracterstica (CDS)

GenBank

Cmo guardar una copia del registro en tu ordenador

GenBank
Pincha aqu para
hacerte con una
copia del registro

Seleccionar la
parte del registro
que te interesa

Pincha aqu para


crear un fichero
con tu seleccin

Pincha aqu para


seleccionar el
formato en que
quieres
almacenar el
registro

Cmo guardar una copia del registro en tu ordenador

GenBank

Captulo 2: How most people use Bioinformatics


Captulo 3: Using nucleotide sequences databases

Bibliografa

Você também pode gostar