Você está na página 1de 20

ASIGNATURA: TCNICAS AVANZADAS EN MICROBIOLOGA

Comparacin de secuencias, Identificacin y Tipificacin

Curso 2009-10

NOMBRE DEL ALUMNO: ________________________________

Profesores: Dra. Mara Jess Garca Garca (mariaj.garcia@uam.es) Dra. M del Carmen Menndez Gmez (carmen.menendez@uam.es) Dpt. Medicina Preventiva, Salud Pblica y Microbiologa Facultad de Medicina. UAM. Ext.: 2753 / 5491

ndice

Pgina 1. Introduccin 2. Cronograma 3. Material 3.1 Reactivos utilizados 3.2 Direcciones de Internet 4 Identificacin de especies bacterianas 4.1 Preparacin de las muestras 4.2 Preparacin de la mezcla de reaccin 4.3 Reaccin de amplificacin 4.4 Visualizacin del resultado de PCR 4.5 Digestin de los productos de PCR con enzimas de restriccin 4.6 Visualizacin y anlisis de los patrones de RFLP 5 Tipificacin de cepas bacterianas 5.1 Preparacin de las muestras 5.2 Preparacin de la mezcla de la reaccin 5.3 Reaccin de amplificacin 5.4 Visualizacin y anlisis de resultados 6 Comparacin de secuencias 6.1 Bsqueda de secuencias en Bases de Datos 6.2 Alineamiento de secuencias: por pares y mltiple 6.3 Construccin de rboles filogenticos 3 4 5 5 5 6 6 7 7 8 8 10 11 11 11 13 13 14 14 15 18

1. Introduccin
La identificacin de las bacterias presentes en una muestra se ha favorecido del desarrollo de mtodos de biologa molecular, permitiendo la deteccin e identificacin de bacterias de forma ms sensible, rpida y especfica. Los componentes de una muestra dada, pueden identificarse a distintos niveles taxonmicos. En la mayora de los casos, se considera que la identificacin a nivel de especie informa sobre la variedad de taxones existentes; siendo este nivel el que permite dar un diagnstico de certeza cuando se trata de muestras de origen clnico. En ciertas circunstancias, es necesario determinar niveles inferiores, e identificar si los aislados corresponden a la misma o a diferentes cepas; esta identificacin es la que se requiere en el caso de sospechar la presencia de un brote epidmico, o para determinar una contaminacin alimentaria. Existe una amplia variedad de mtodos que se utilizan con el propsito de identificar los componentes bacterianos de una muestra. Las metodologas a utilizar en cada caso pueden ser de aplicacin general o bien se han desarrollado para resolver la deteccin de ciertos grupos bacterianos o de ciertas caractersticas del grupo en particular. En estas prcticas vamos a aplicar mtodos moleculares bien caracterizados en la identificacin de bacterias del gnero Mycobacterium. Este gnero comprende bacterias del grupo de los Actinomycetales ampliamente distribuido en la naturaleza, pero que tambin incluye especies patgenas importantes del hombre y los animales; como por ejemplo M. tuberculosis y M. leprae, agentes causales en el hombre la Tuberculosis y la Lepra respectivamente; o M. marinum y M. avium subsp. paratuberculosis, que causan infecciones importantes en animales. Sin duda el mayor avance en Bioinformtica ha sido la automatizacin de la secuenciacin de genomas microbianos completos y el desarrollo de Bases de Datos y su accesibilidad a travs de Internet. La disponibilidad de cientos de secuencias de genomas de microorganismos, representando no solo a distintas especies, sino tambin a mltiples cepas de la misma especie en Bases de datos pblicas, y la posibilidad de su anlisis ha facilitado el conocimiento del gen y de la funcin genmica. Muchos genes hipotticos son ahora conocidos por existir ortlogos (genes que comparten el ltimo ancestro comn y cuya divergencia se debe a la especiacin y que muestran la mayor identidad posible en otros genomas microbianos) que tambin han sido secuenciados. La evolucin es el resultado de mutaciones puntuales, duplicaciones, inserciones y delecciones gnicas, transferencia horizontal gnica, reordenamientos cromosmicos, etc Adicionalmente la interaccin con el medio ambiente establece cual de todos estos cambios son aceptables y viables, seleccionado cada uno de ellos, establecindose finalmente la relacin entre las distintas cepas o especies. El avance de las herramientas bioinformticas ha posibilitado la investigacin en diversos campos, utilizndose en Medicina forense, Epidemiologa, Biologa molecular o en Evolucin y filogenia.

Global phylogeny of fully sequenced organisms. Ciccarelli et al, Science 311: 1283 (2006).

2. Cronograma
Este grupo de prcticas se estructura en tres partes. Las dos primeras partes se componen de una sesin inicial de introduccin terica seguida de sesiones prcticas de laboratorio, terminando con una sesin de anlisis y discusin de resultados. La tercera parte trata del uso de bases de datos y programas informticos bsicos aplicables en anlisis evolutivos o de comparacin de microorganismos. Primera parte: Identificacin de especies bacterianas (PCR-RFLP del gen hsp65) Preparacin de las muestras de DNA Preparacin de las reacciones de PCR Realizacin de la amplificacin Digestin de los amplicones con Enzimas de Restriccin Anlisis de los patrones

Segunda parte: Tipificacin de bacterias (Amplificacin al azar [RAPD]) Preparacin de las muestras de DNA Preparacin de las reacciones de PCR Realizacin de la amplificacin Visualizacin y anlisis de los resultados

Tercera parte: Comparacin de secuencias (BLAST, Clustal X y Mega 4) Bsqueda de secuencias en bases de datos. Alineamiento de secuencias por pares: BLAST Alineamiento mltiple de secuencias: Clustal X v 2.0.5 Construccin de rboles filogenticos: Mega v.4

3. Material
3.1 Reactivos necesarios Agarosa Agarosa bajo punto de fusin 1Kb plus DNA ladder 100bp DNA Ladder Bromuro de etidio Azul de Bromofenol dNTPs BSA BstEII HaeIII Taq-polimerasa Cloruro de Magnesio Glicerol Tritiplex III (EDTA) Tris-Trizma Base Dodecilsulfato sdico (SDS) Oligonucletidos 3.2 Direcciones de Internet Bancos de datos (secuencias, genomas, bibliografa, etc) NCBI (National Center for Biotechnology Information) http://www.ncbi.nlm.nih.gov EMBL-EBI (European Molecular Biology Laboratory-European Bioinformatics Institute) http://www.ebi.ac.uk DDBJ (DNA Data Bank of Japan) http://www.ddbj.nig.ac.jp Sanger Institute: http://www.sanger.ac.uk TIGR (The Institute for Genomic Research) http://www.tigr.org GOLD (Genomes OnLine Database) http://www.genomesonline.org Comparacin de secuencias: Basic Local Alignment Search Tool: http://blast.ncbi.nlm.nih.gov/Blast.cgi ClustalX, Multiple Sequence Alignment Programs: ftp://ftp.ebi.ac.uk/pub/software/clustalw2/ Mega4, Molecular Evolutionay Genetics Anlisis: http://www.megasoftware.net/mega.html Comparacin de genomas: Mauve Genome Alignment: http://gel.ahabs.wisc.edu/mauve/ Comparison prokaryotes genomes: http://www.microbesonline.org/ Otros Identificacin de micobacterias (Patrones de PRA): http://app.chuv.ch/prasite/index.html SEAKEM SeaPLAQUE NuSieve Gibco BRL Gibco BRL SIGMA Bio-Rad APPLIED BIOSYSTEM PROMEGA PROMEGA PROMEGA ROCHE APPLIED BIOSYSTEM MERCK MERCK SIGMA MERCK ROCHE

REALIZA LAS ACTIVIDADES QUE HAY A LO LARGO DEL GUIN EN EL ANEXO, EN LOS SITIOS ESTABLECIDOS PARA ELLO.

4. Primera parte. Identificacin de especies bacterianas


Objetivo: Aplicar el anlisis de genes conservados en la diferenciacin de especies bacterianas. PCR-RFLP del gen hsp65 Procedimiento descrito por Telenti et al (1993). Es un mtodo sencillo y rpido que permite diferenciar especies del gnero Mycobacterium. Desde su descripcin se utiliza con frecuencia en el diagnstico de aislados clnicos, y es un procedimiento empleado para la descripcin de especies nuevas. Ms recientemente se ha descrito que la secuencia completa del gen podra tener inters en ciertos grupos (Turenne et al. 2006). El gen hsp65 codifica para una protena de choque trmino de secuencia conservada. Generalmente existe una nica copia del gen por genoma bacteriano. En el proceso se amplifica un fragmento interno del gen, con oligonucletidos de zonas conservadas (PCR) realizando despus digestin del producto amplificado con enzimas de restriccin y separacin de los fragmentos resultantes en geles de agarosa (RFLP). Se amplifica un fragmento de 441 pb, que se digiere con los enzimas: BstEII (G GTNACC) y HaeIII (GG CC). Se utilizan los oligos Tb11 y Tb12: Oligo Tb11: 5 ACCAACGATGGTGTGTCCAT 3 Oligo Tb12: 5 CTTGTGGAACCGCATACCCT 3 Estos oligonucletidos, amplifican un fragmento interno de la ORF entre los nucletidos 398-836 (441 pb) IMPORTANTE Realizar precauciones usuales en el procedimiento de PCR (usar guantes, trabajar en cabina pre-tratada con luz ultravioleta) en particular NUNCA manipular los DNAs y los reactivos de PCR EN LA MISMA HABITACION ni con los mismos guantes. Cuando el procedimiento se utilice en diagnstico, estas medidas son OBLIGATORIAS, incluyendo el cambio de bata para cada fase del proceso. 4.1. Preparacin de las muestras Descongelar en hielo agua ultrapura (milliq) y los DNAs de las cepas a analizar y de las cepas de referencia. Se utilizan como cepas de referencia las cepas-tipo de las especies: M. tuberculosis, M. avium y M. chelonae. Se han seleccionado estas cepas por los tamaos que rinden tras la digestin con los enzimas, sirviendo de control (Leao et al, 2005). Los DNAs descongelados deben mezclarse bien con micropipeta y centrifugarse despus unos segundos. Para la amplificacin se usan 100ng (aproximadamente) de DNA-template, que se ajusta a un volumen de 10l con agua, incluyndose un tubo sin DNA como control negativo.

VIAL 1 2 3 4 5 6 7

MUESTRA (ng/l) M. chelonaeT M. aviumT M. tuberculosisT Aislado 1 Aislado 2 Aislado 3 Control negativo

DNA (l)

H2O (l)

----

10 l

4.2 Preparacin de la mezcla de reaccin Con guantes limpios colocar a descongelar los reactivos de la mezcla de reaccin: buffer; Cl2Mg; dNTPs; glicerol; oligos. Cada uno de los reactivos debe usarse a una concentracin determinada:
REACTIVO Buffer Cl2Mg dNTPs (mezcla de los 4) Glicerol Primers (Tb11+Tb12) Taq Polimerasa gold CONCENTRACIN Solucin stock Solucin trabajo 10 X 1X 25mM 1.5mM 100mM 0.8mM (0.2mM c/u) 100% 10 % 20M 0.4 M (0,2M c/u) 1,5 U 5 U/l

Para preparar la mezcla de reaccin (mx), el clculo se hace multiplicando la cantidad de cada reactivo requerido por prueba (a la concentracin indicada en la solucin de trabajo), por el nmero total de pruebas que se van a correr, incluyendo una ms para compensar errores de pipeteo. El volumen final a aadir a cada tubo conteniendo DNAtemplate es de 40 l por reaccin, lo que da un volumen final en cada reaccin de 50 l:
REACTIVO Buffer 10X Cl2Mg dNTPs (mezcla de los 4) Glicerol Primers (Tb11+Tb12) Taq Polimerasa gold H2O VOLUMEN FINAL Cantidad por muestra 5 l 3 l 0.4 l 5 l 1 l 0.3 l 25.3 l 40 l Cantidad total

El agua es SIEMPRE lo primero que se aade. El enzima es SIEMPRE lo ltimo que se aade. Una vez preparada la mezcla, se guardan todos los reactivos antes de manipular de nuevo los tubos con el DNA-template preparado. 4.3 Reaccin de amplificacin Mezclar bien el volumen total de mx preparada, y centrifugar unos segundos para bajar todo el contenido del tubo. A cada tubo con DNA se le aaden 40 l de la mx preparada. Mezclar cada tubo y llevar al termociclador. Se utilizan las siguientes condiciones de reaccin:

Fase inicial Temperatura Duracin Nmero ciclos de 95C 5 min 1

Fase de amplificacin 95C 60C 1min 45 72C

Fase final 72C 10 min 1

Las muestras se mantienen en un ciclo final a 4C hasta su procesamiento. 4.4 Visualizacin del resultado de PCR Se prepara un gel de agarosa al 1% en Buffer de electroforesis standard y Bromuro de Ethidio (0,1 l/ml). Se toman 5 l del producto amplificado a los que se aaden 2 l de mezcla de carga (Glicerol 50%, EDTA 125mM y Azul de Bromofenol 0.05%). Se colocan las muestras en los pocillos, incluyendo 2 l de un marcador de tamaos (1 Kb plus DNA Ladder) en el primer pocillo. Un ejemplo del resultado esperable se muestra en la siguiente figura:
L 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

441 pb

L- Ladder 1- control positivo (M. avium) 2-22- muestras problema 23- control negativo

Debe amplificarse un fragmento algo mayor de 400 pb tanto en las muestras como en los controles de referencia, no debindose ver ninguna banda en el control negativo. 4.5 Digestin de los productos de PCR con enzimas de restriccin. Se marcan dos series de tubos limpios, una por cada ER a utilizar (BstEII y HaeIII) incluyendo un tubo con una mezcla proporcional de las tres cepas de referencia. En cada tubo habr un volumen final de 15 l de producto amplificado para digerir con enzimas.

BstEII Tubo Control B 5 l M. chelonae 5 l M. avium 5 l M.tuberculosis Aislado 1 Aislado 2 Aislado 3 Tubo 1B 15 l Tubo 2B 15 l Tubo 3B 15 l

HaeIII Tubo Control H 5 l M. chelonae 5 l M. avium 5 l M.tuberculosis Tubo 1H 15 l Tubo 2H 15 l Tubo 3H 15 l

Se preparan dos mezclas de reaccin, una por cada ER, con una concentracin de reactivos como se indica en la Tabla:
REACTIVO Buffer C HaeIII Buffer D BstEII BSA CONCENTRACIN Solucin stock Solucin trabajo 10 X 1X 5U 10 U/l 10 X 1X 5U 10 U/l 10 mg/ml 1 mg/ml

El volumen final de cada mezcla va a depender del nmero de muestras a analizar. De nuevo se considera una muestra ms para compensar los errores de pipeteo. El clculo est representado en la siguiente Tabla:
REACTIVOS BstEII 1 reaccin H2O destilada Buffer C Buffer D BSA HaeIII BstEII VOLUMEN FINAL 8 ---------3 3 0.5 0.5 15 l ----------X reacciones 1 reaccin 8 3 ----------3 0.5 0.5 15 l ----------HaeIII X reacciones

En cada tubo con 15 l de producto de PCR se aaden 15 l de la correspondiente mezcla de reaccin (mezcla BstEII en la serie B; mezcla HaeIII en la serie H) mezclando adecuadamente el contenido (Volumen final 30 ul). La digestin se realiza durante 2 horas. Los tubos de la serie B se incuban a 60C; y los tubos de la serie H se incuban a 37C. Se agrega a cada tubo una gota de aceite mineral para evitar evaporaciones en los tubos de la serie B.

4.6 Visualizacin y anlisis de los patrones de RFLP. Preparar un gel con agarosa de bajo punto de fusin al 3% y Bromuro de Ethidio (0,1 l/ml de gel). Recoger los 30 l de la digestin en tubos limpios (con cuidado no llevarse el aceite) y aadir 3 l de buffer de carga en cada muestra (ver 4.4). Aplicar en el gel, en el pocillo precedente a cada serie de digestiones, 7 l del marcador de tamaos (100bp DNA Ladder) y el resto de las muestras en los pocillos siguientes, comenzando con el tubo de los DNAs controles de cada enzima. Correr el gel a 50V durante 3-4 horas. Fotografiar y calcular el tamao de las bandas resultantes de las digestiones. El primer tubo (tubo CONTROL) debe dar los siguientes fragmentos (tamaos en pares de bases): Digestin con HaeIII: 200/150/130/105/70/60/55 Digestin con BstEII: 320/235/210/130/120/85 Calcular el tamao de las bandas de las muestras problema, tomando como referencia el marcador de tamaos (ladder) y el control (mezcla de DNAs de patrones conocidos). Determinar la especie de cada muestra comparando los patrones obtenidos con los patrones que aparecen en la base de datos (http://app.chuv.ch/prasite/index.html). Un ejemplo se muestra en la siguiente figura:

Bst EII
L M Av In 1 2 3 4 5 6

Hae III
L M Av In 1 2 3 4 5 6

L marcador de tamaos M mezcla cepas de referencia Av: M. avium In: M. intracellulare 1-6: Aislados clnicos

Indica y comenta tus resultados en el Apartado 4 del documento Anexo.

10

5. Segunda parte. Tipificacin de bacterias


Objetivo: Determinar si varios aislados de una misma especie pertenecen o no a una misma cepa (uso de marcadores moleculares en epidemiologa) En bacterias en las cuales se desconoce gran parte de su secuencia gentica, puede emplearse el mtodo RAPD (Random Amplified Polymorphic DNA) para la diferenciacin de cepas (Persing DH et al (Eds.) Molecular Microbiology. Diagnostic principles and practice. ASM Press. 2004). Se trata de un mtodo sencillo, basado en la amplificacin del genoma completo con iniciadores inespecficos, permitiendo que la unin en las dianas del genoma sea al azar al utilizar condiciones poco restrictivas en el anillamiento durante la reaccin de PCR. El producto de dicha amplificacin es un patrn de bandas diferente de acuerdo con el contenido gentico de la cepa, siendo en general idntico para aislados de la misma cepa. El mtodo se ha utilizado en una amplia gama de gneros y especies bacterianos. Las condiciones de la amplificacin deben ajustarse para las bacterias que se vayan a estudiar. En esta prctica se va a utilizar en la tipificacin de aislados de bacterias del gnero Mycobacterium. En este gnero los oligonucletidos que se han utilizado ms frecuentemente, y van a emplearse son: OPA2 OPA18 INS2 M13 5' TGCCGAGCTG 3' 5' AGGTGACCGT 3' 5' GCGTAGGCGTCGGTGA 3' 5' TTATGTAAAACGACGGCCAGT 3' (Kauppinen J, 1994) (Kauppinen J, 1994) (Linton CJ, 1994) (Welsh J, 1990)

5.1 Preparacin de las muestras Descongelar en hielo agua ultrapura (milliQ) y los DNAs de las cepas a analizar. Los DNAs descongelados deben mezclarse bien con micropipeta y centrifugarse despus unos segundos. Para la amplificacin se usan 100ng (aproximadamente) de DNA-template, que se ajusta a un volumen de 10l con agua, incluyndose un tubo sin DNA como control negativo.
VIAL 1 2 3 4 5 MUESTRA (100 ng/l) Aislado 1 Aislado 2 Aislado 3 Aislado 4 Control negativo DNA H2O

----

10 l

5.2 Preparacin de la mezcla de reaccin Con guantes limpios colocar a descongelar los reactivos de la mezcla de reaccin: buffer; Cl2Mg; dNTPs; glicerol; oligos.

11

Se utiliza un nico iniciador por reaccin, que ocurrir nicamente cuando el anillamiento de una pareja est en la orientacin adecuada. Cada uno de los reactivos debe usarse a una concentracin determinada:
REACTIVO Buffer Cl2Mg dNTPs (mezcla de los 4) Glicerol Primer Taq Polimerasa gold CONCENTRACIN Solucin stock Solucin trabajo 10 X 1X 25mM 1.5mM 100mM 0.2mM (cada uno) 100% 10 % 100 pmoles 25p moles/ l 2U 5 U/l

Para preparar la mezcla de reaccin, el clculo se hace multiplicando la cantidad de cada reactivo requerido por prueba, por el nmero total de pruebas que se van a correr, incluyendo una ms para compensar errores de pipeteo. El volumen final a aadir a cada tubo conteniendo DNA-template es de 40 l por reaccin, lo que da un volumen final en cada reaccin de 50 l. Cada grupo de aislados de una misma especie debe analizarse al menos con dos oligonucletidos diferentes.

REACTIVO oligo 1 Buffer 10X Cl2Mg dNTPs (mezcla de los 4) Glicerol Oligo 1 Taq Polimerasa gold H2O VOLUMEN FINAL

Cantidad por muestra 5 l 3 l 0.5 l 5 l 4 l 0.5 l 22 l 40 l

Cantidad total

REACTIVO oligo 2 Buffer 10X Cl2Mg dNTPs (mezcla de los 4) Glicerol Oligo 2 Taq Polimerasa gold H2O VOLUMEN FINAL

Cantidad por muestra 5 l 3 l 0.5 l 5 l 4 l 0.5 l 22 l 40 l

Cantidad total

El agua es SIEMPRE lo primero que se aade. El enzima es SIEMPRE lo ltimo que se aade. Una vez preparada la mezcla, se guardan todos los reactivos antes de manipular de nuevo los tubos con el DNA-template preparado. 5.3 Reaccin de amplificacin

12

Mezclar bien el volumen total de mezcla preparada, y centrifugar unos segundos para bajar todo el contenido del tubo. A cada tubo con DNA se aaden 40 l de la mezcla preparada. Mezclar cada tubo y llevar al termociclador. Se utilizan las siguientes condiciones de reaccin:
Fase inicial Temperatura Duracin Nmero ciclos de 95C 5 min 1 Fase de amplificacin 95C 40C 1min 40 72C Fase final 72C 10 min 1

Las muestras se mantienen en un ciclo final a 4C hasta su procesamiento. 5.4 Visualizacin y anlisis de resultados Se prepara un gel de agarosa al 2% en Buffer de electroforesis standard y Bromuro de Ethidio (0,1 l/ml de gel). Se toman 25 l del producto amplificado a los que se aaden 3 l de mezcla de carga (Glicerol 50%, EDTA 125mM y Azul de Bromofenol 0.05%). Se colocan las muestras en los pocillos, incluyendo 2 l de un marcador de tamaos (1 Kb plus DNA Ladder) en el primer pocillo.

L 1 2 3

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 L

Resultado de RAPD- PCR utilizando el oligonucletido INS2 . L, ladder; 1-24 aislados clnicos.

El resultado se compara visualmente. Indica y comenta tus resultados en el Apartado 5 del documento Anexo.

13

6. Tercera parte. Mtodos bsicos de comparacin de secuencias


Objetivo: Nociones en la bsqueda de secuencias a partir de bases de datos, alineamiento de las mismas y construccin de rboles filogenticos. URLs tiles: Comparacin de secuencias: Basic Local Alignment Search Tool: http://blast.ncbi.nlm.nih.gov/Blast.cgi Multiple Sequence Alignment Programs: ftp://ftp.ebi.ac.uk/pub/software/clustalw2/ Molecular Evolutionay Genetics Anlisis Software: http://www.megasoftware.net/mega.html Comparacin de genomas: Mauve Genome Alignment Software: http://gel.ahabs.wisc.edu/mauve/ Comparison prokaryotes genomes: http://www.microbesonline.org/ 6.1 Bsqueda de secuencias en Bases de Datos (NCBI) El desarrollo de las Bases de Datos ha facilitado el avance en los estudios filogenticos. Hoy en da las secuencias son enviadas a diferentes bases de datos: EMBL, GeneBank (NCBI), o DDBJ, donde quedan registradas con un N de accesin no solo las secuencias sino tambin todas y cada una de las caractersticas de dicha secuencia (marcos de lectura abierta, producto, sitios de inicio de la transcripcin, regin Shine-Dalgarno,). A partir de aqu podemos: (i) acceder a todos los datos registrados de dicho gen o protena, (ii) enviar una secuencia propia a comparar con toda las secuencias en la Base de Datos o (iii) recopilar secuencias para realizar posteriores alineamientos y estudios filogenticos. Utilizaremos para la prctica el GenBank (Base de Datos del NCBI). Prctica: Bsqueda de secuencias (nucletidos y protenas) por distintos criterios de bsqueda y observar cuales son los datos de inters que nos proporcionan respecto a una secuencia de protenas y respecto a una secuencia de nucletidos:

Nombre del producto (por ejemplo catalase). Los nombres siempre han de escribirse en ingls. Gnero bacteriano (por ejemplo Mycobacterium) Nombre del gen (por ejemplo sodA) y N de accesin.

Para realizar esta parte de la prctica, abre, por favor, la pgina del NCBI: http://www.ncbi.nlm.nih.gov/ en el navegador.

Completa la tabla correspondiente del Anexo con los datos buscados en la base de datos.

14

6.2 Alineamiento de secuencias: por pares (BLAST) y mltiple (ClustalX) Existen diversas razones para comparar secuencias. En el caso de que dichas secuencias sean protenas la comparacin nos permite conocer la funcin de las mismas, sus dominios o centros activos, predecir la estructura 3D,En el caso de que las secuencias sean de ADN, la comparacin de secuencias nos permite la bsqueda de genes, estudios poblacionales, etc En bacterias, las secuencias correspondientes al 16S ARNr son las ms utilizadas para la distincin de especies, adems de otros genes denominados house keeping, genes esenciales. La comparacin de secuencias puede realizarse por pares (alineamiento de dos secuencias, bsqueda de secuencias homlogas) como resultado de la bsqueda en Bases de Datos como BLAST o mediante alineamiento mltiple (alineacin de muchos homlogos al mismo tiempo) utilizando programas como por ejemplo Clustal-W, Mega4 en cuyo caso nos indica tambin que posiciones pueden ser importantes, dominios proteicos, etc... El objetivo final de la comparacin es localizar el alineamiento que con mayor probabilidad muestre qu cambios se han producido evolutivamente. Alineamiento por pares: Enviaremos secuencias resultantes de la bsqueda anterior al banco de datos para su comparacin mediante el programa BLAST (NCBI) utilizando diversos criterios de comparacin: blastn (compara secuencias de nucletidos), blastp (compara secuencias de protenas), y diferentes combinaciones de comparaciones como: blastx, tblastn, tblastx.

Basic BLAST

Choose a BLAST program to run. nucleotide blast protein blast blastx tblastn tblastx Search a nucleotide database using a nucleotide query Algorithms: blastn, megablast, discontiguous megablast Search protein database using a protein query Algorithms: blastp, psi-blast, phi-blast Search protein database using a translated nucleotide query Search translated nucleotide database using a protein query Search translated nucleotide database using a translated nucleotide query

15

ATENCIN: el formato FASTA, es el tipo de formato que ms se utiliza y el ms solicitado por programas de alineamiento. Consiste en: >Nombre SECUENCIA

Prctica: Para realizar esta parte de la prctica, abre por favor, la pgina del NCBI: http://www.ncbi.nlm.nih.gov/ en el navegador. El procedimiento que vamos a utilizar para comparar secuencias en esta prctica es el siguiente: 1. Escoge 2-3 n de accesin pertenecientes a las secuencias de la prctica anterior para realizar tu comparacin por BLAST. Escoge al menos una secuencia de aminocidos y otra de ncleotidos. 2. Seleccionar BLAST en el men principal del NCBI en la parte superior y elige Nucleotide (blastn), Protein (blastp), u otros programas de eleccin (blastx, tblastn, tblastx) segn el tipo de bsqueda a realizar. 3. Compara genes/protenas en cada apartado. Te sugiero comiences las comparaciones con blastn/blastp y contines tu aprendizaje con blastx, tblastn,para que te vayas familiarizando (ver la tabla que muestra la pgina Web del NCBI-BLAST). Haz un BLAST con alguna de las secuencias de nt y aminocidos. Indica en la tabla correspondiente del anexo los N de accesin escogidos. Describe en el apartado correspondiente del Anexo los datos e informacin que obtienes de las bsquedas anteriores as como de las opciones que el Banco de datos te proporciona. Elimina y/o Duplica alguna zona interna de la secuencia de nucletidos o aminocidos y vuelve a compararla en el BLAST. Observa los nuevos alineamientos con la nueva insercin y/o deleccin. Describe los datos e informacin que obtienes en el apartado correspondiente del Anexo.
Comparacin de dos secuencias por identidades
Idnticas Divergencia

Deleccin

Inserccin

16

Explora diferentes bases de datos Existen otras bases de datos que os pueden interesar, donde existe informacin sobre genomas completamente secuenciados o en fase de secuenciacin, y donde tambin puedes realizar bsquedas y comparaciones. Explralas: GOLD: TIGR: SANGER Institute: EMBL-EBI: DDBJ: http://www.genomesonline.org/ http://www.tigr.org/ http://www.sanger.ac.uk/ http://www.ebi.ac.uk http://www.ddbj.nig.ac.jp

Alineamiento mltiple: Para el alineamiento mltiple utilizaremos el programa ClustalX el cual es de libre acceso. Construye una matriz de distancias y posibilidad de utilizar el algoritmo de Neirborn Joining. El programa requiere que: Todas las secuencias que se vayan a comparar han de tener caracteres iguales y han de ser de la misma longitud. Las secuencias han de tener suficiente longitud, diferencias y similitudes Se utilizarn listados de secuencias previamente determinadas que cumplan los requisitos. Prctica: Selecciona un bloque de 30-40 o ms secuencias de tu inters utilizando los N de accesin tomados de la lista asignada. Escoge 15-20 secuencias pertenecientes al grupo de Micobacterias de crecimiento rpido y 15-20 de crecimiento lento dentro del mismo gen. Anota en la parte correspondiente del Anexo el/los gen-es de tu bsqueda y a que especie pertenecen. El procedimiento a seguir ser el siguiente: 1. Seleccionar las secuencias de nucletidos (de la misma zona del gen). Los secuencias de la LISTA 1 ya presentan esta caracterstica. 2. Hay que comprobar que las secuencias son del mismo tamao y tienen la suficiente homologa y divergencia como para que el alineamiento sea posible. 3. Salvar las secuencias en texto sin formato y en formato FASTA una a continuacin de la otra en el mismo fichero. NOTA: Cuando se ha de poner en formato FASTA la forma es la siguiente: >Especie bacteriana SECUENCIA/secuencia Todas las secuencias a alinear han de estar seguidas una detrs de la otra, como sigue: >secuencia1 accccggtaaagggacaccacca >secuencia2 tacccccggtaaagggacagtcca 4. Proceder al alineamiento siguiendo el esquema del programa indicado en el recuadro. 5. Se guardan los ficheros correspondientes al ---.dnd (dendograma) y al ---.aln (alineamiento)

17

6. Puedes guardar el alineamiento como postscript (.ps) en la opcin File del Menu y posteriormente pasarlo a .pdf.

Multiple alignment Mode File Load sequence file (worpad, formato fasta) Alignment Alignment parameters Multiple alignment parameters: gap opening = 100 gap extension =0.5 delay divergent sequence = 90% OK Output format options: CLUSTAL format

Do complete alignment: ---.dnd (rbol visible con el Programa Treeview) ---.aln (alineamiento)

Para la actividad guarda los archivos: .aln y si es possible el postscript (.ps) para cumplimentar el anexo a este manual. Rellena las tablas con los datos e incorpora los alineamientos mltiples seleccionados en la parte correspondiente del documento Anexo. Comenta tambin que conclusiones sacas a la vista de los resultados obtenidos:

6.3 Construccin de rboles filogenticos (MEGA v.4) La relacin evolutiva se muestra a menudo en forma de un rbol filogentico, el cual podramos definir como un diagrama que nos indica las relaciones entre las diversas especies o genes presentes as como la distancia evolutiva que existe entre ellas.
rbol enraizado

De este modo, se denominan nodos externos a las distintas entidades en estudio y de nodos internos a los ancestros de las anteriores. Tambin podemos hablar de ramas internas o externas del rbol. Un rbol filogentico puede o no presentar raiz. El rbol filogentico puede hacerse a partir de diferentes datos como por ejemplo secuencias, sitios de restriccin, etc Existen dos tipos de reconstruccin filogentico dependiendo de si estn basados en distancias o en caracteres.

rbol no enraizado

18

Los rboles filogenticos basados en distancias se asientan en un alineamiento mltiple, utilizando dicho alineamiento para calcular la distancia entre secuencias mediante una matriz de distancias y construyendo el rbol a partir de dichas distancias. Entre estos mtodos nos encontramos con: UPGMA (Unweighted Pair-Group Method with Arithmetic means) (Agrupamiento pareado no ponderado utilizando media aritmtica): Es un mtodo sencillo que asume la existencia de un reloj evolutivo. Consiste en un algoritmo de agrupamiento o clustering a partir del cual se genera una matriz de distancias construyendo un rbol filogentico. Produce rboles enraizados y todas las ramas terminan a la misma altura. Neighbor Joining: Es tambin un algoritmo de agrupamiento pero no asume la existencia de un reloj molecular. Una vez que la matriz de distancias entre las secuencias ha sido definida, genera un rbol que minimiza su longitud. Genera rboles sin raiz, por lo que generalmente se incluye un grupo externo o out group, definido como un punto de referencia externo que nos permite conocer en que parte del rbol se sita el ancestro comn. Es un mtodo rpido que suele dar buenos resultados.
Mtodos de reconstruccin filogentica
ABCDACTTGACCCTTACGAT AGCTGGCCCTGATTAC AGTTGACCATTACGAT AGCTGGTCCTGATGAC

Basados en distancias Mtodos muy rpidos UPGMA: Reloj molecular (cambio es constante
y proporcional al tiempo). rbol con raiz

B 7 7 2

C 2 7 7

D 7 2 7 -

Neighbor-joining: No asume reloj evolutivo. Mnima evolucin. rbol sin raiz Basados en caracteres Mxima parsimonia (Sitios informativos) Mxima verosimilitud Mtodos bayesianos

A B C D

7 2 7

rbol?

Neighbor-joining:
Out-group: secuencia perteneciente a un grupo taxonmico distinto o a una familia de protenas diferente, para averiguar el lugar de enraizamiento apropiado.

Raz

Outgroup

19

Los rboles filogenticos basados en caracteres utilizan cada posicin del alineamiento mltiple como pista para buscar la mejor opcin de rbol que encaje todos los datos. Entre estos mtodos nos encontramos con: Mxima parsimonia: Mantiene que la hiptesis ms sencilla es la ms probable. Mxima verosimilitud Mtodos bayesianos Prctica: Utilizaremos los alineamientos realizados con el programa ClustalX (fichero NOMBRE.aln), que debern ser convertidos al formato MEGA. La elaboracin de los rboles filogenticos se realizar con el programa Mega v. 4. El programa Mega v.4 es de acceso libre en Internet. Observa los distintos tipos de rbol y las diferentes formas de comparar las secuencias. El procedimiento a seguir ser el siguiente: 1. Hay que convertir el fichero ---.aln del formato Clustal al formato Mega como indica el recuadro. 2. Se han de corregir los errores: hay ocasiones que el programa duplica las secuencias o coloca al final del fichero ---.meg signos que despus no reconoce. Todos estos errores hay que eliminarlos. 3. Tras seleccionar de nuevo el fichero el formato ---.meg para analizar procedemos a calcular la matriz de distancias como indica el diagrama. 4. Realizaremos el rbol filogentico.

File Convert to Mega format

MEGA 3
Corregir errores Select file and format: ---.aln (fichero del ClustalX) OK

Save as: ---.meg

Click me to activate a data file Choose a data file to analyse (---.meg) Input data nucleotide sequences OK

Distances Compute pairwise Analysis preferences Phylogeny Neighbourn Joining OK Test philogeny bootstrap =1000 rbol filogentico compute distances only compute Matriz de distancias

Incluye los rboles obtenidos en los apartados correspondientes del Anexo y comenta que conclusiones sacas a la vista de los dichos resultados, compara la informacin de ambos rboles.

20

Você também pode gostar