Actividad III Departamental TRG

Actividad III Departamental.
Tecnologas de Recombinacin Gentica

BIOINFORMTICA
OBJETIVO:
Conocer bases de datos utilizadas en el anlisis bioinformtico y utilizarlas mediante el
anlisis de una secuencia.
INTRODUCCIN
Manejo de bancos de informacin de genes y protenas
National Center for Biotechnology Information (NCBI)
Blast: Basic Local Alignment Search Tool. Alineamiento de nucletidos o secuencias
aminoacdicas. Proporciona el % de similitud con la secuencia analizada.
http://tools.neb.com/NEBcutter2/index.php. Proporciona mapas de restriccin de la
secuencia analizada.
http://www.ebi.ac.uk/Tools/clustalw2/index.html. Proporciona alineamientos mltiple y
rboles filogenticos de la secuencia de inters.
ExPASy Proteomics Server (Expert Protein Analysis System). Permite la Identificacin de
modificaciones post-traduccionales, obtencin de pI, PM, identificacin de protenas de
acuerdo a valores de PI y PM, sitios potenciales de rompimiento de secuencia
aminoacdicas por proteasas, software para el anlisis de geles en doble dimensin,
traduccin a partir de nucletidos, prediccin de sitios de glicosilacin, prediccin de
localizacin subcelular de protenas, prediccin de la estructura secundaria, anlisis
filogentico, etc.
PCR: Reaccin en Cadena de la Polimerasa.
El objetivo de la tcnica de PCR es la amplificacin directa de un gen o un fragmento de
DNA presentes en mezclas de muy diversas fuentes, sin necesidad de una purificacin previa de la
muestra integra. Entre los ingredientes necesarios para la mezcla de reaccin figuran dos primers o
cebadores, los cuales, son oligonucletidos de cadena sencilla (generalmente de 18 a 30
nucletidos) complementarios a los dos extremos 3 de la regin diana, uno en cada hebra. El
objetivo de tener estos oligonucletidos en la mezcla de reaccin es que actan como cebadores
para la replicacin de las dos hebras en la regin diana (Luqu, et. al, 2002).
Amplificacin exponencial de secuencias de ADN o ARN.
Requiere:
ADN o ARN molde
2 iniciadores (oligonucletidos) o primers complementarios a distintas regiones del
molde
ADN polimerasa termoestable
4 nucletidos (dNTPs)
Buffer (para Taq, para PCR, MgCl2)
El alineamiento que den los iniciadores directo y reverse en la reaccin de PCR, deber de
ser nico.
Temperatura de alineamiento y especificidad de productos:
- Temperatura de alineamiento muy baja: alineamiento inespecfico, varios productos
Temperatura de alineamiento muy alta: alineamiento pobre, ningn producto
Tm para ambos iniciadores: Los iniciadores con los que se realiza la reaccin de PCR,
delimitan el fragmento a amplificar y se colocan ambos en la mezcla de reaccin (reverso y
directo). La diferencia entre Tm de cada uno de ellos, deber ser de 3C mximo.
Longitud de los primers:
La longitud de los primers, tendr efectos en el lugar del genoma al cual reconocern: A
mayor longitud, menos lugares para su alineamiento. En el caso del genoma humano,
existen 3 x 109 pb. La probabilidad de que un primer compuesto por el siguiente nmero de
bases, se calcula mediante la siguiente frmula:
Secuencia Probabilidad de encontrarla
A 1:4
AT 1:(4)2 1:16
ATGCATGCAT 1:(4)10 1:1,048,576
15
ATGCATGCATATGCA 1:(4) 1:1,073,741,824
A mayor longitud de de los primers, aumenta la T m. Por esta razn, un primer deber
componerse de al menos 15 bases, por lo regular entre 17-24 bases.
Composicin de bases en el diseo de primers. Se recomienda un 50-60% mnimo de GC;
Se recomienda evitar repeticiones de bases ATATAT o regiones muy ricas en una sola base
GGG (3 o 4 repeticiones mximo).
Caractersticas de un adecuado diseo de primers: temperatura de alineamiento entre 52C
y 65C, para evitar la formacin de estructuras secundarias; Longitud de 17-24 bases;
reconocen un sitio nico dentro del genoma, es decir, no se unen a sitios secundarios; unin
especfica en el extremo 3'; la diferencia de Tm entre el primer directo y el reverso no
deber ser mayor a 5C; y debern estar compuestos por Guaninas y Citocinas en un
porcentaje entre 40 y 60%; no forman dmeros (primer-primer) ni horquillas, o si se forman,
stas pueden romperse fcilmente, es decir, con un G menor a -2 Kcal/mol (Permier
Biosoft, 2013).
Anlisis BLAST (Basic Local Alignment Search Tool)

La herramienta de bsqueda de alineamientos bsicos locales o BLAST, como su nombre lo
indica, encuentra regiones de similitud local entre distintas secuencias. Este programa es capaz de
comparar tanto secuencias nucleotdicas como aminoacdicas (de protenas) con secuencias
presentes en la base de datos del NCBI, adems de calcular el significado estadstico de dichas
coincidencias. El BLAST puede ser utilizado para inferir relaciones funcionales y evolutivas entre
diversas secuencias, as como ayudar a identificar a los miembros de familias genticas.
Es un programa de alineamiento de secuencias de tipo local ya sea de ADN o de protenas.
BLAST compara una secuencia problema (comnmente llamada query) contra una que se encuentre
en una base de datos. El algoritmo encuentra las secuencias de la base de datos que tienen mayor
parecido a la secuencia query. BLAST es capaz de calcular la significacin de sus resultados, por lo
que nos provee de un parmetro para juzgar los resultados que se obtienen.
Utilidad de los alineamientos de secuencias de ADN o Protenas:
Organizar los datos para reflejar homologa de secuencias
Inferir rboles filogenticos de posiciones homlogas
Resaltar regiones/posiciones conservadas (o variables)
Detectar cambios en la estructura de genes
Sumarizar la informacin de varias secuencias
Mapas de restriccin
Los mapas de restriccin se llevan a cabo con el fin de analizar genomas de organismos
vivos, sin embargo, debido a que las molculas de ADN que componen dichos genomas son
demasiado largas se ha recurrido a la utilizacin de enzimas de restriccin. Las enzimas de
restriccin, a menudo llamadas endonucleasas de restriccin, son enzimas que cortan el ADN en
sitios definidos, denominados sitios diana o sitios de restriccin. En la actualidad existen alrededor
de 400 endonucleasas de restriccin provenientes de diferentes bacterias (Passarge, 2010).
Seleccin de un vector de clonacin

Un vector de clonacin es una molcula de ADN de pequeo tamao, fcil de aislar y
caracterizar, con secuencia y mapa de restriccin conocido, de fcil introduccin en la clula
hospedera y una vez all con capacidad de replicacin autnoma (Luqu, et.al, 2002). En ingeniera
gentica se utilizan para clonar fragmentos de ADN o sobreexpresar protenas de inters en una
clula hospedera. El plsmido pUC18 como vector para alojar al gen de inters, o parte de l. Este
vector es un derivado del plsmido pBR322, su tamao es de aproximadamente 2.7 kb, tiene un
origen de replicacin y puede ser seleccionado gracias a dos marcadores: uno basado en la
resistencia a ampicilina (fragmento gris de la Figura 3), y otro, el gen para la galactosidasa
(Stryer, et. al, 2007). En la regin nica de clonacin mltiple o polylinker, existen diversos sitios
de restriccin para diferentes endonucleasas, entre las cuales figuran, Hind III, Apo I, Eco RI, Sac I,
Ban II, etc.
Traduccin a protenas
El genoma es el lugar de alojamiento de todos los genes y ADN intergentico. Los genes, a
su vez, son secuencias de ADN que codifican un producto final, sea una protena o un ARN con
funcin estructural o cataltica (Lehninger, 2004). La forma de traducir la secuencia de nucletidos
de un gen a una secuencia aminoacdica que en conjunto forme una protena, es utilizando la
herramienta ExPASy. El Sistema Experto de Anlisis de Protenas o ExPASy, es un servidor que
analiza secuencias y estructuras de protenas.
Una vez que el gen ha sido secuenciado, es importante determinar el correcto marco de lectura, ya
que cada regin del ADN tiene seis posibles marcos de lectura (tres en cada direccin). La correcta
eleccin del marco de lectura es de suma importancia, ya que este determina que aminocidos sern
codificados por la secuencia gentica. Generalmente, los correctos marcos de lectura son los ms
extensos, los que contienen la secuencia ms larga de aminocidos antes de un codn de paro y por
supuesto aquellos que contengan la menor cantidad de codones de paro (Bioinformatics Basics at
Tufts University, 2005).
Comparacin de secuencias aminoacdicas utilizando BLASTp

Para comprobar que el marco de lectura abierto seleccionado es el adecuado, es decir, aquel
que codifica para el gen de inters, se debe realizar un BLASTp a dicha secuencia aminoacdica de
modo que esta se compare con otras secuencias disponibles en la base de datos del NCBI. La
herramienta del BLASTp es similar al BLASTn, la nica diferencia es que en este caso, no se
compara una secuencia nucleotdica con secuencias existentes en la base de datos del NCBI, sino
que se analiza la similitud entre secuencias de aminocidos. Como producto de la comparacin, el
BLASTp desglosa todos los alineamientos posibles con la secuencia de aminocidos del marco de
lectura elegido, presentando las descripciones y resultados estadsticos de la similitud con la
secuencia comparada. Como resultado del anlisis, la secuencias aminoacdicas que poseen un
porcentaje de identidad del 100% y un valor esperado de cero, son aquellas que codifican para el
gen en estudio, con lo que se puede concluir que, efectivamente, el marco de lectura abierto
analizado es el correcto y el nico que codifica para dicha protena.
Clculo del punto isoelctrico y peso molecular

El punto isoelctrico de una protena se define como el pH al cual una molcula no presenta
ninguna carga neta. Esta propiedad es til en la electroforesis, ya que permite la identificacin de
protenas. Otra forma de identificar protenas es a partir de su peso molecular mediante la tcnica de
SDS PAGE (Campbell y Farrell, 2009).
Las herramientas bioinformticas son de suma utilidad cuando se trabaja con material
gentico, pues estas permiten prever los resultados posibles para as elegir la metodologa ms
adecuada y evitar a su vez, el uso innecesario de muestras y reactivos. Por otra parte, estas
herramientas tambin ofrecen una gran ventaja cuando se trata de identificacin de muestras
desconocidas, ya que se encuentran al alcance de todos.
EJERCICIO GUIADO DE BIOINFORMTICA
Analiza la siguiente secuencia:
caaacaagacggttattaaagataaaggaacaatgtcagttttaacgaatgctaaagctgatgcgacccgaatagataatggcggggttatggat
gttgccggaaacgcgacaaataccataattaatggtggcacacagaatattaataatcatggtattgccacgggaaccaatatcaacagcggaac
acaaaatatcaagagcggcgggaaagctgacacgacaaatatctcctccgggagccggcaggttgttgagaaagatggtacggcaactggca
gcaatattagcgccggaggctcgctgattgtctataccggtggtatcgcacatggggttaaccaggagacgggcagtgctttagttgccaacac
gggcgcagggactgatattgaaggatacaacaagctctctcacttcactattaccggaggggaggctaattatgttgtgctggaaaataccggcg
aactgacggtagtggctaaaaccacggcgaaaaatactaccgttgatgctggcggtaagctgattgtccagaaggaggctaaaacagatacca
ccagacttaataatggtggcgttctggaggttcaggacggtggtgaggctaagcatgttgagcaacaatccggcggcgcattgattgcttccacg
acttccggaacacttatcgaaggaaccaacagttatggtgatgctttctacatcaggaattcagaagctaaaaatgtagtgctggaaaacgctggc
tcattaacagtcgttactggttcccgggcagttgatacgattattaatgccaacggcaaaatggatgtttaatggaaaagatgttggcactgtaactc
aatagtgcgggcacccaaacaatatatgccagtgccacttctgataaagcaaatatcaaaggtggcaagcaaacggtatatggtttagccactga
ggcaaatatcga
Pasos para analizar la secuencia:

- Contar cuantas bases componen la secuencia a analizar, en la misma pgina de word (en
este caso 960 bases)
- Buscar en Google: ncbi (http://www.ncbi.nlm.nih.gov/)
- Presionar: BLAST
- Presionar: nucleotide BLAST
- Copiar la secuencia y pegarla en el recuadro
- Cambiar el parmetro: Choose Search Set, en lugar de Human genomic, poner others.
- Presionar: Blast (botn azul, hasta debajo de la pantalla)
- Enseguida aparecen todas las comparaciones de tu secuencia con los genomas de los dems
organismos:
- Copiar toda la informacin relacionada con la primera comparacin que hizo el blast, como
evidencia de la similitud DNA-DNA.(Query, es tu secuencia, Sbjct es la secuencia a la que
se parece).
- Copiar con Control-Imprimir, pegar en la pgina de Word y ajustar el tamao o las partes
que se peguen. EJEMPLO:
Identificar el gen al que codifica dicha secuencia:
- Dentro de la pgina: ncbi (http://www.ncbi.nlm.nih.gov/)
- Presionar: BLASTx
- Presionar: Blast (botn azul, hasta debajo de la pantalla)
- Enseguida aparecen todas las comparaciones de tu secuencia con los genomas de los dems
organismos:
- Copiar toda la informacin relacionada con la primera comparacin que hizo el blast, como
evidencia de la similitud DNA-DNA.(Query, es tu secuencia de DNA, Sbjct es la secuencia
de protena a la que se parece).
- Identificar, como en este caso, que la secuencia que se copi, pertenece a un fragmento de
un gen, ya que, como indica lo que se peg, se trata de una secuencia parecida a una familia
de protenas IRK, de longitud de 778 aminocidos, de tal manera que en nuestra secuencia,
del nucletido 3 al 824, tenemos un fragmento del gen, que va del aminocido 778 al 683.
Ubica la secuencia aminoacdica de la protena que identificaste dentro de la secuencia

nucleotdica que analizaste.
- Busca en Google : Expasy, presiona tralate (http://expasy.org/tools/dna.html)

- Cambia el parmetro: Output format, por: includes nucleotide sequence
- Presionar: Traslate sequence
- Buscar, dentro de los 6 marcos que predice el expasy, la secuencia que corresponda con la
protena que predijo el Blast.
- Para poder editar esta misma secuencia, copiarlo y pegarlo en formato Courier New, 10.
5'3' Frame 3
caaacaagacggttattaaagataaaggaacaatgtcagttttaacgaatgctaaagctgat
N K T V I K D K G T M S V L T N A K A D
gcgacccgaatagataatggcggggttatggatgttgccggaaacgcgacaaataccata
A T R I D N G G V M D V A G N A T N T I
attaatggtggcacacagaatattaataatcatggtattgccacgggaaccaatatcaac
I N G G T Q N I N N H G I A T G T N I N
agcggaacacaaaatatcaagagcggcgggaaagctgacacgacaaatatctcctccggg
S G T Q N I K S G G K A D T T N I S S G
agccggcaggttgttgagaaagatggtacggcaactggcagcaatattagcgccggaggc
S R Q V V E K D G T A T G S N I S A G G
tcgctgattgtctataccggtggtatcgcacatggggttaaccaggagacgggcagtgct
S L I V Y T G G I A H G V N Q E T G S A
ttagttgccaacacgggcgcagggactgatattgaaggatacaacaagctctctcacttc
L V A N T G A G T D I E G Y N K L S H F
actattaccggaggggaggctaattatgttgtgctggaaaataccggcgaactgacggta
T I T G G E A N Y V V L E N T G E L T V
gtggctaaaaccacggcgaaaaatactaccgttgatgctggcggtaagctgattgtccag
V A K T T A K N T T V D A G G K L I V Q
aaggaggctaaaacagataccaccagacttaataatggtggcgttctggaggttcaggac
K E A K T D T T R L N N G G V L E V Q D
ggtggtgaggctaagcatgttgagcaacaatccggcggcgcattgattgcttccacgact
G G E A K H V E Q Q S G G A L I A S T T
tccggaacacttatcgaaggaaccaacagttatggtgatgctttctacatcaggaattca
S G T L I E G T N S Y G D A F Y I R N S
gaagctaaaaatgtagtgctggaaaacgctggctcattaacagtcgttactggttcccgg
E A K N V V L E N A G S L T V V T G S R
gcagttgatacgattattaatgccaacggcaaaatggatgtttaatggaaaagatgttgg
A V D T I I N A N G K M D V - W K R C W
cactgtaactcaatagtgcgggcacccaaacaatatatgccagtgccacttctgataaag
H C N S I V R A P K Q Y M P V P L L I K
caaatatcaaaggtggcaagcaaacggtatatggtttagccactgaggcaaatatcga
Q I S K V A S K R Y M V - P L R Q I S
- Eliminar de esta secuencia los aminocidos que el Blast no haya reconocido como parte de
esta protena, sombrear los nucletidos de un color y los aminocidos de otro.
5'3' Frame 3
caaacaagacggttattaaagataaaggaacaatgtcagttttaacgaatgctaaagctgat
gcgacccgaatagataatggcggggttatggatgttgccggaaacgcgacaaataccata
attaatggtggcacacagaatattaataatcatggtattgccacgggaaccaatatcaac
agcggaacacaaaatatcaagagcggcgggaaagctgacacgacaaatatctcctccggg
agccggcaggttgttgagaaagatggtacggcaactggcagcaatattagcgccggaggc
ggtggtgaggctaagcatgttgagcaacaatccggcggcgcattgattgcttccacgact
tccggaacacttatcgaaggaaccaacagttatggtgatgctttctacatcaggaattca
gaagctaaaaatgtagtgctggaaaacgctggctcattaacagtcgttactggttcccgg
gcagttgatacgattattaatgccaacggcaaaatggatgtttaatggaaaagatgttgg
A V D T I I N A N G K M D V
cactgtaactcaatagtgcgggcacccaaacaatatatgccagtgccacttctgataaag
caaatatcaaaggtggcaagcaaacggtatatggtttagccactgaggcaaatatcga
- Copiar la traduccin virtual, eliminar la secuencia de nucletidos y dejar solamente

la secuencia de aminocidos traducidos que correspondan a la protena analizada.
A V D T I I N A N G K M D V
- Contar palabras (274 aminocidos, en este caso)

- En la pgina del expasy correspondiente a la traduccin a protena, presionar en el cono
5'3' Frame 3 (o en el marco y en la direccin donde se lea correctamente el gen que ests
analizando, en este caso, corresponde este cono)
- Presionar en la primera letra que corresponde al fragmento que se desee analizar (en este
caso presionar N, que corresponde al inicio del fragmento NKTV)
- En un recuadro aparecer la secuencia de aminocidos que se analizar (checar que
corresponda con el fragmento que se desea comparar o analizar, y si hay letras de mas,
eliminarlas, o agregar las que falten).
- Presionar el cono Compute pI/Mw
Diseo de oligonucletidos
Utilizar un programa bioinformtico, que en base a una secuencia de ADN identifique los primers
adecuados que permitan la amplificacin de un fragmento de ADN interno mediante PCR (revisar la
base de datos del NCBI u otra base de datos que permita realizar el diseo de primers en base a una
secuencia definida por el estudiante).
Analizar los primers diseados, detectados por el programa. Construir una tabla en la que se
describa la secuencia del Primer Directo y reverso, indicando la secuencia de cada uno en la
direccin 5-3 (indicar al principio y al final cual es el extremo 5 y el extremo 3), indicar la
longitud y la temperatura de alineamiento de cada primer. Extraer una temperatura de alineamiento
promedio, obtenido entre el primer directo y reverso, que sera la temperatura a la que se
programara el termociclador para amplificar la banda especfica de ADN. Ubicar ambos primers
dentro de la secuencia analizada.
- Traducir la secuencia de nucletidos delimitada por los primers utilizando el Traslate-

Expasy, para conocer la secuencia de aminocidos de la protena que se obtendr a partir
del juego de Primers diseado.
ggagccggcaggttgttgagaaagatggtacggcaactggcagcaatattagcgccggaggc
ggtggtgaggctaagcatgttgagcaacaatccggcggc
G G E A K H V E Q Q S G G
- Agregar a la secuencia de tu primer que diseaste, un sitio de restriccin diferente en cada

extremo, para que sepas cual es la orientacin que te da el producto de PCR amplificado.
-
Sitios de corte para enzimas de restriccin que dejen extremo cohesivo: EcoRI (GAATTC), Hind III
(AAGCTT), BamHI (GGATCC), PstI (CTGCAG), o que dejen extremo romo: Sma I (CCCGGG)
Hasta aqu el trabajo queda concluido, pues se define una regin dentro del gen y es
posible amplificarla con el juego de primers diseado, y tambin puede ser clonado este fragmento
de ADN en un vector, ya que le agregaste los sitios de restriccin en la orientacin que
seleccionaste.
DISCUSION
Compara y discute los resultados obtenidos apoyados de bibliografa.
CUESTIONARIO
1.- Cules son las ramas de la Ciencia en las que participa la Bioinformtica?
2.- Para qu sirve el anlisis Bioinformtico de una secuencia de ADN?
3.- Menciona metodologas de Biologa Molecular que complementaran los resultados obtenidos en
un anlisis Bioinformtico en el estudio de un ADN, ARN o protena.
REFERENCIAS
1. Bioinformatics Basics at Tufts University (2005) Exercise 3: Translating an Unknown DNA
Sequence. Recuperado el 16 de mayo de 2013, de http://ase.tufts.edu/biology/bioinformatics
/exercise3.asp
2. Campbell, Farrell (2009) Bioqumica (6 edicin) Mxico. Ed. Cengage Learning.
3. Chepuri V, L. Lemieux, D. C. Au and R. B. Gennis (1990) The sequence of the cyo operon
indicates substantial structural similarities between the cytochrome o ubiquinol oxidase of
Escherichia coli and the aa3-type family of cytochrome c oxidases. The Journal of Biological
Chemistry. Col. 205, No. 19. USA.
4. Eberhard Passarge (2010) Gnetica: texto y atlas (3a edicin). Mxico. Ed. Mdica
Panamericana.
5. Hillier L., Green, P. (1991). OSP: a computer program for choosing PCR and DNA sequencing
primers. Cold Spring Harbor Laboratory Press.
6. Lehninger (2005) Principios de bioqumica (4 edicin). Mxico. Ed. Omega.
7. Luque Jos, Herrez ngel (2002) Biologa molecular e ingeniera gentica (1 edicin). Espaa.
Ed. Harcourt.
8. Martn E. (S.F.) Introduccin al diseo de primers. Curso Introduccin a la Bioinformtica.
9. PCR Primer Design Guidelines. (2013), Permier Biosoft.
10. Stryer Berg (2008) Bioqmica (3 edicin) Espaa. Ed. Revert.

Actividad III Departamental TRG

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Actividad III Departamental TRG

Enviado por

Direitos autorais:

Formatos disponíveis

Actividad III Departamental.

Tecnologas de Recombinacin Gentica

Anlisis BLAST (Basic Local Alignment Search Tool)

Seleccin de un vector de clonacin

Comparacin de secuencias aminoacdicas utilizando BLASTp

Clculo del punto isoelctrico y peso molecular

EJERCICIO GUIADO DE BIOINFORMTICA

Analiza la siguiente secuencia:

Pasos para analizar la secuencia:

Ubica la secuencia aminoacdica de la protena que identificaste dentro de la secuencia

- Busca en Google : Expasy, presiona tralate (http://expasy.org/tools/dna.html)

- Copiar la traduccin virtual, eliminar la secuencia de nucletidos y dejar solamente

- Contar palabras (274 aminocidos, en este caso)

- Traducir la secuencia de nucletidos delimitada por los primers utilizando el Traslate-

- Agregar a la secuencia de tu primer que diseaste, un sitio de restriccin diferente en cada

Você também pode gostar