Escolar Documentos
Profissional Documentos
Cultura Documentos
OBJETIVO:
Conocer bases de datos utilizadas en el anlisis bioinformtico y utilizarlas mediante el
anlisis de una secuencia.
INTRODUCCIN
Manejo de bancos de informacin de genes y protenas
National Center for Biotechnology Information (NCBI)
Blast: Basic Local Alignment Search Tool. Alineamiento de nucletidos o secuencias
aminoacdicas. Proporciona el % de similitud con la secuencia analizada.
http://tools.neb.com/NEBcutter2/index.php. Proporciona mapas de restriccin de la
secuencia analizada.
http://www.ebi.ac.uk/Tools/clustalw2/index.html. Proporciona alineamientos mltiple y
rboles filogenticos de la secuencia de inters.
ExPASy Proteomics Server (Expert Protein Analysis System). Permite la Identificacin de
modificaciones post-traduccionales, obtencin de pI, PM, identificacin de protenas de
acuerdo a valores de PI y PM, sitios potenciales de rompimiento de secuencia
aminoacdicas por proteasas, software para el anlisis de geles en doble dimensin,
traduccin a partir de nucletidos, prediccin de sitios de glicosilacin, prediccin de
localizacin subcelular de protenas, prediccin de la estructura secundaria, anlisis
filogentico, etc.
PCR: Reaccin en Cadena de la Polimerasa.
El objetivo de la tcnica de PCR es la amplificacin directa de un gen o un fragmento de
DNA presentes en mezclas de muy diversas fuentes, sin necesidad de una purificacin previa de la
muestra integra. Entre los ingredientes necesarios para la mezcla de reaccin figuran dos primers o
cebadores, los cuales, son oligonucletidos de cadena sencilla (generalmente de 18 a 30
nucletidos) complementarios a los dos extremos 3 de la regin diana, uno en cada hebra. El
objetivo de tener estos oligonucletidos en la mezcla de reaccin es que actan como cebadores
para la replicacin de las dos hebras en la regin diana (Luqu, et. al, 2002).
Amplificacin exponencial de secuencias de ADN o ARN.
Requiere:
ADN o ARN molde
2 iniciadores (oligonucletidos) o primers complementarios a distintas regiones del
molde
ADN polimerasa termoestable
4 nucletidos (dNTPs)
Buffer (para Taq, para PCR, MgCl2)
El alineamiento que den los iniciadores directo y reverse en la reaccin de PCR, deber de
ser nico.
Temperatura de alineamiento y especificidad de productos:
- Temperatura de alineamiento muy baja: alineamiento inespecfico, varios productos
Temperatura de alineamiento muy alta: alineamiento pobre, ningn producto
Tm para ambos iniciadores: Los iniciadores con los que se realiza la reaccin de PCR,
delimitan el fragmento a amplificar y se colocan ambos en la mezcla de reaccin (reverso y
directo). La diferencia entre Tm de cada uno de ellos, deber ser de 3C mximo.
Longitud de los primers:
La longitud de los primers, tendr efectos en el lugar del genoma al cual reconocern: A
mayor longitud, menos lugares para su alineamiento. En el caso del genoma humano,
existen 3 x 109 pb. La probabilidad de que un primer compuesto por el siguiente nmero de
bases, se calcula mediante la siguiente frmula:
Secuencia Probabilidad de encontrarla
A 1:4
AT 1:(4)2 1:16
ATGCATGCAT 1:(4)10 1:1,048,576
15
ATGCATGCATATGCA 1:(4) 1:1,073,741,824
A mayor longitud de de los primers, aumenta la T m. Por esta razn, un primer deber
componerse de al menos 15 bases, por lo regular entre 17-24 bases.
Composicin de bases en el diseo de primers. Se recomienda un 50-60% mnimo de GC;
Se recomienda evitar repeticiones de bases ATATAT o regiones muy ricas en una sola base
GGG (3 o 4 repeticiones mximo).
Caractersticas de un adecuado diseo de primers: temperatura de alineamiento entre 52C
y 65C, para evitar la formacin de estructuras secundarias; Longitud de 17-24 bases;
reconocen un sitio nico dentro del genoma, es decir, no se unen a sitios secundarios; unin
especfica en el extremo 3'; la diferencia de Tm entre el primer directo y el reverso no
deber ser mayor a 5C; y debern estar compuestos por Guaninas y Citocinas en un
porcentaje entre 40 y 60%; no forman dmeros (primer-primer) ni horquillas, o si se forman,
stas pueden romperse fcilmente, es decir, con un G menor a -2 Kcal/mol (Permier
Biosoft, 2013).
Traduccin a protenas
El genoma es el lugar de alojamiento de todos los genes y ADN intergentico. Los genes, a
su vez, son secuencias de ADN que codifican un producto final, sea una protena o un ARN con
funcin estructural o cataltica (Lehninger, 2004). La forma de traducir la secuencia de nucletidos
de un gen a una secuencia aminoacdica que en conjunto forme una protena, es utilizando la
herramienta ExPASy. El Sistema Experto de Anlisis de Protenas o ExPASy, es un servidor que
analiza secuencias y estructuras de protenas.
Una vez que el gen ha sido secuenciado, es importante determinar el correcto marco de lectura, ya
que cada regin del ADN tiene seis posibles marcos de lectura (tres en cada direccin). La correcta
eleccin del marco de lectura es de suma importancia, ya que este determina que aminocidos sern
codificados por la secuencia gentica. Generalmente, los correctos marcos de lectura son los ms
extensos, los que contienen la secuencia ms larga de aminocidos antes de un codn de paro y por
supuesto aquellos que contengan la menor cantidad de codones de paro (Bioinformatics Basics at
Tufts University, 2005).
caaacaagacggttattaaagataaaggaacaatgtcagttttaacgaatgctaaagctgatgcgacccgaatagataatggcggggttatggat
gttgccggaaacgcgacaaataccataattaatggtggcacacagaatattaataatcatggtattgccacgggaaccaatatcaacagcggaac
acaaaatatcaagagcggcgggaaagctgacacgacaaatatctcctccgggagccggcaggttgttgagaaagatggtacggcaactggca
gcaatattagcgccggaggctcgctgattgtctataccggtggtatcgcacatggggttaaccaggagacgggcagtgctttagttgccaacac
gggcgcagggactgatattgaaggatacaacaagctctctcacttcactattaccggaggggaggctaattatgttgtgctggaaaataccggcg
aactgacggtagtggctaaaaccacggcgaaaaatactaccgttgatgctggcggtaagctgattgtccagaaggaggctaaaacagatacca
ccagacttaataatggtggcgttctggaggttcaggacggtggtgaggctaagcatgttgagcaacaatccggcggcgcattgattgcttccacg
acttccggaacacttatcgaaggaaccaacagttatggtgatgctttctacatcaggaattcagaagctaaaaatgtagtgctggaaaacgctggc
tcattaacagtcgttactggttcccgggcagttgatacgattattaatgccaacggcaaaatggatgtttaatggaaaagatgttggcactgtaactc
aatagtgcgggcacccaaacaatatatgccagtgccacttctgataaagcaaatatcaaaggtggcaagcaaacggtatatggtttagccactga
ggcaaatatcga
- Identificar, como en este caso, que la secuencia que se copi, pertenece a un fragmento de
un gen, ya que, como indica lo que se peg, se trata de una secuencia parecida a una familia
de protenas IRK, de longitud de 778 aminocidos, de tal manera que en nuestra secuencia,
del nucletido 3 al 824, tenemos un fragmento del gen, que va del aminocido 778 al 683.
- Para poder editar esta misma secuencia, copiarlo y pegarlo en formato Courier New, 10.
5'3' Frame 3
caaacaagacggttattaaagataaaggaacaatgtcagttttaacgaatgctaaagctgat
N K T V I K D K G T M S V L T N A K A D
gcgacccgaatagataatggcggggttatggatgttgccggaaacgcgacaaataccata
A T R I D N G G V M D V A G N A T N T I
attaatggtggcacacagaatattaataatcatggtattgccacgggaaccaatatcaac
I N G G T Q N I N N H G I A T G T N I N
agcggaacacaaaatatcaagagcggcgggaaagctgacacgacaaatatctcctccggg
S G T Q N I K S G G K A D T T N I S S G
agccggcaggttgttgagaaagatggtacggcaactggcagcaatattagcgccggaggc
S R Q V V E K D G T A T G S N I S A G G
tcgctgattgtctataccggtggtatcgcacatggggttaaccaggagacgggcagtgct
S L I V Y T G G I A H G V N Q E T G S A
ttagttgccaacacgggcgcagggactgatattgaaggatacaacaagctctctcacttc
L V A N T G A G T D I E G Y N K L S H F
actattaccggaggggaggctaattatgttgtgctggaaaataccggcgaactgacggta
T I T G G E A N Y V V L E N T G E L T V
gtggctaaaaccacggcgaaaaatactaccgttgatgctggcggtaagctgattgtccag
V A K T T A K N T T V D A G G K L I V Q
aaggaggctaaaacagataccaccagacttaataatggtggcgttctggaggttcaggac
K E A K T D T T R L N N G G V L E V Q D
ggtggtgaggctaagcatgttgagcaacaatccggcggcgcattgattgcttccacgact
G G E A K H V E Q Q S G G A L I A S T T
tccggaacacttatcgaaggaaccaacagttatggtgatgctttctacatcaggaattca
S G T L I E G T N S Y G D A F Y I R N S
gaagctaaaaatgtagtgctggaaaacgctggctcattaacagtcgttactggttcccgg
E A K N V V L E N A G S L T V V T G S R
gcagttgatacgattattaatgccaacggcaaaatggatgtttaatggaaaagatgttgg
A V D T I I N A N G K M D V - W K R C W
cactgtaactcaatagtgcgggcacccaaacaatatatgccagtgccacttctgataaag
H C N S I V R A P K Q Y M P V P L L I K
caaatatcaaaggtggcaagcaaacggtatatggtttagccactgaggcaaatatcga
Q I S K V A S K R Y M V - P L R Q I S
- Eliminar de esta secuencia los aminocidos que el Blast no haya reconocido como parte de
esta protena, sombrear los nucletidos de un color y los aminocidos de otro.
5'3' Frame 3
caaacaagacggttattaaagataaaggaacaatgtcagttttaacgaatgctaaagctgat
N K T V I K D K G T M S V L T N A K A D
gcgacccgaatagataatggcggggttatggatgttgccggaaacgcgacaaataccata
A T R I D N G G V M D V A G N A T N T I
attaatggtggcacacagaatattaataatcatggtattgccacgggaaccaatatcaac
I N G G T Q N I N N H G I A T G T N I N
agcggaacacaaaatatcaagagcggcgggaaagctgacacgacaaatatctcctccggg
S G T Q N I K S G G K A D T T N I S S G
agccggcaggttgttgagaaagatggtacggcaactggcagcaatattagcgccggaggc
S R Q V V E K D G T A T G S N I S A G G
tcgctgattgtctataccggtggtatcgcacatggggttaaccaggagacgggcagtgct
S L I V Y T G G I A H G V N Q E T G S A
ttagttgccaacacgggcgcagggactgatattgaaggatacaacaagctctctcacttc
L V A N T G A G T D I E G Y N K L S H F
actattaccggaggggaggctaattatgttgtgctggaaaataccggcgaactgacggta
T I T G G E A N Y V V L E N T G E L T V
gtggctaaaaccacggcgaaaaatactaccgttgatgctggcggtaagctgattgtccag
V A K T T A K N T T V D A G G K L I V Q
aaggaggctaaaacagataccaccagacttaataatggtggcgttctggaggttcaggac
K E A K T D T T R L N N G G V L E V Q D
ggtggtgaggctaagcatgttgagcaacaatccggcggcgcattgattgcttccacgact
G G E A K H V E Q Q S G G A L I A S T T
tccggaacacttatcgaaggaaccaacagttatggtgatgctttctacatcaggaattca
S G T L I E G T N S Y G D A F Y I R N S
gaagctaaaaatgtagtgctggaaaacgctggctcattaacagtcgttactggttcccgg
E A K N V V L E N A G S L T V V T G S R
gcagttgatacgattattaatgccaacggcaaaatggatgtttaatggaaaagatgttgg
A V D T I I N A N G K M D V
cactgtaactcaatagtgcgggcacccaaacaatatatgccagtgccacttctgataaag
caaatatcaaaggtggcaagcaaacggtatatggtttagccactgaggcaaatatcga
Diseo de oligonucletidos
Utilizar un programa bioinformtico, que en base a una secuencia de ADN identifique los primers
adecuados que permitan la amplificacin de un fragmento de ADN interno mediante PCR (revisar la
base de datos del NCBI u otra base de datos que permita realizar el diseo de primers en base a una
secuencia definida por el estudiante).
Analizar los primers diseados, detectados por el programa. Construir una tabla en la que se
describa la secuencia del Primer Directo y reverso, indicando la secuencia de cada uno en la
direccin 5-3 (indicar al principio y al final cual es el extremo 5 y el extremo 3), indicar la
longitud y la temperatura de alineamiento de cada primer. Extraer una temperatura de alineamiento
promedio, obtenido entre el primer directo y reverso, que sera la temperatura a la que se
programara el termociclador para amplificar la banda especfica de ADN. Ubicar ambos primers
dentro de la secuencia analizada.
ggagccggcaggttgttgagaaagatggtacggcaactggcagcaatattagcgccggaggc
S R Q V V E K D G T A T G S N I S A G G
tcgctgattgtctataccggtggtatcgcacatggggttaaccaggagacgggcagtgct
S L I V Y T G G I A H G V N Q E T G S A
ttagttgccaacacgggcgcagggactgatattgaaggatacaacaagctctctcacttc
L V A N T G A G T D I E G Y N K L S H F
actattaccggaggggaggctaattatgttgtgctggaaaataccggcgaactgacggta
T I T G G E A N Y V V L E N T G E L T V
gtggctaaaaccacggcgaaaaatactaccgttgatgctggcggtaagctgattgtccag
V A K T T A K N T T V D A G G K L I V Q
aaggaggctaaaacagataccaccagacttaataatggtggcgttctggaggttcaggac
K E A K T D T T R L N N G G V L E V Q D
ggtggtgaggctaagcatgttgagcaacaatccggcggc
G G E A K H V E Q Q S G G
Hasta aqu el trabajo queda concluido, pues se define una regin dentro del gen y es
posible amplificarla con el juego de primers diseado, y tambin puede ser clonado este fragmento
de ADN en un vector, ya que le agregaste los sitios de restriccin en la orientacin que
seleccionaste.
DISCUSION
Compara y discute los resultados obtenidos apoyados de bibliografa.
CUESTIONARIO
1.- Cules son las ramas de la Ciencia en las que participa la Bioinformtica?
2.- Para qu sirve el anlisis Bioinformtico de una secuencia de ADN?
3.- Menciona metodologas de Biologa Molecular que complementaran los resultados obtenidos en
un anlisis Bioinformtico en el estudio de un ADN, ARN o protena.
REFERENCIAS
1. Bioinformatics Basics at Tufts University (2005) Exercise 3: Translating an Unknown DNA
Sequence. Recuperado el 16 de mayo de 2013, de http://ase.tufts.edu/biology/bioinformatics
/exercise3.asp
2. Campbell, Farrell (2009) Bioqumica (6 edicin) Mxico. Ed. Cengage Learning.
3. Chepuri V, L. Lemieux, D. C. Au and R. B. Gennis (1990) The sequence of the cyo operon
indicates substantial structural similarities between the cytochrome o ubiquinol oxidase of
Escherichia coli and the aa3-type family of cytochrome c oxidases. The Journal of Biological
Chemistry. Col. 205, No. 19. USA.
4. Eberhard Passarge (2010) Gnetica: texto y atlas (3a edicin). Mxico. Ed. Mdica
Panamericana.
5. Hillier L., Green, P. (1991). OSP: a computer program for choosing PCR and DNA sequencing
primers. Cold Spring Harbor Laboratory Press.
6. Lehninger (2005) Principios de bioqumica (4 edicin). Mxico. Ed. Omega.
7. Luque Jos, Herrez ngel (2002) Biologa molecular e ingeniera gentica (1 edicin). Espaa.
Ed. Harcourt.
8. Martn E. (S.F.) Introduccin al diseo de primers. Curso Introduccin a la Bioinformtica.
9. PCR Primer Design Guidelines. (2013), Permier Biosoft.
10. Stryer Berg (2008) Bioqmica (3 edicin) Espaa. Ed. Revert.