Você está na página 1de 19

A Dynamic Programming Algorithm for RNA Structure

Prediction Including Pseudoknots


Elena Rivas and Sean R. Eddy*

Se presenta una implementacin del algoritmo que genera la


estructura mnima de energa ptima para una sola secuencia de ARN,
utilizando ARN estndar plegable a parmetros termodinmicos
aumentados por unos parmetros que describen la estabilidad
termodinmica de pseudonodos.

Una estructura de ARN est dominada por las interacciones de


apareamiento de bases, la mayora de los cuales son pares WatsonCrick entre bases complementarias. La estructura de bases apareadas
de un ARN es llamada estructura secundaria. Debido a que los pares de
Watson-Crick son una interaccin estereotipadas y relativamente
simples, ARN precisa prediccin de estructura secundaria parece ser un
objetivo alcanzable.

El modelo termodinmico para el ARN de no pseudonudos la


estructura secundaria incluye algunas interacciones estereotipadas,
como bases apiladas de tallos apareados, hairpins, bulges, bucles
internos, y multi-bucles. Formalmente, las estructuras no
pseudoanudadas obedecen una convencin "que anida": que para dos
pares de bases i,j y k,l, ya sea i<k<l<i o i<j<k<l. Un pseudonudo de ARN
es definido como una estructura que contiene los pares bajos que
violan la convencin de anidacin.

Preeliminares
Una lnea plana continua representar la espina dorsal de una
secuencia de ARN con sus 5-end colocados en el lado izquierdo del
segmento. La N representar la longitud (en el nmero de nucletidos)
del ARN. Las interacciones secundarias sern representadas por lneas
onduladas que unen las dos posiciones que actan recprocamente en
la cadena.

Representacin esquemtica de los algoritmos anidadas


Para describir el algoritmo se introduce dos NxN matrices, son llamadas
. Estas matrices son definidas del modo siguiente: (, ) es
la puntuacin del mejor plegado entre las posiciones i y j, a condicin
de que i y j estn emparejados entre s; mientras que (, ) es la
puntuacin de la mejor plegado entre las posiciones i y j
independientemente de si i y j estn apareados entre si o no.

La lnea ondulada en indica que la relacin entre i y j estn


definitivamente emparejados, y similarmente la lnea discontinua en
indica que la relacin entre i y j es desconocida. Tambin forman
parte de nuestra convencin que para un fragmento dado, el
nucletido i es en el 5-end y el nucletido j es en el 3-end, tal que i
.
El propsito del algoritmo de programacin dinmica anidada es llenar
el matrices con pesos numricos apropiados por medio de
algn tipo de clculo recursivo.

Superficie: es cualquier secuencia alternante de lneas continuas y


onduladas que se cierra sobre s mismo.
Superficie irreducible: es una superficie de tal manera que si uno de
los H-enlaces (o interacciones secundarias) es roto, no hay ninguna
otra superficie contenida en el interior, es decir, un IS no puede ser
reducido a cualquier otra superficie. El orden de un IS es dado por
el numero de lneas onduladas, lo cual es igual al numero del
intervalo de lneas continuas.

La recursin para dada en la figura, y puede ser expresada como:

Cada lnea da la puntuacin oficial de uno de los diagramas en la Figura


4. El diagrama de la izquierda se calcula como la puntuacin del mejor
diagrama de la derecha. Las condiciones de iniciales son:

Aqu (1 , 1 : 2 , 2 , , , ) representa la funcin de puntuacin


para un IS de orden n. Este algoritmo general es bastante imprctico,
porque un el cual tiene orden , , adhiere una complejidad de
( 2 1 al calculo. Para hacer esto til, se debe de truncar la
expansin en ISs hasta algn orden en la recursin para en la figura.

El truncamiento ms simple debe pararse en el orden cero. En esta


aproximacin ninguno de los Iss, se dan las puntuaciones
especializados. Slo tenemos que dar una puntuacin especfica para
un par de bases, B. La recursividad para se simplifica en la figura 5
y puede ser representada de la forma:

La matriz es similar a definido antes, con la especificacin de


aparecer dentro de un par de bases. Este sencillo algoritmo calcula el
plegado con el mximo nmero de pares de bases. Para un orden
mayor a 0 se tiene la siguiente funcin de recursin:

M representa la puntuacin para generar una multiloop. Las reglas termodinmicas


de Turner tambin penalizan a una cantidad para cada par de cierre en un multiloop.
Al iniciar un multiloop estamos especificando ya uno de sus pares de cierre; esta
puntuacin de cierre de par est representado aqu por la .

Las relaciones de recursividad utilizados para llenar la matriz


incluyen: los nucletidos de cadena sencilla, pares externos, y
bifurcaciones. La recursin puede ser expresado como:

La condicin de frontera se expresa como:

Q representa el puntaje para un nucletido de cadena


sencilla y P el puntaje para un par externo.

Descripcin del algoritmo de pseudonudo


Los pseudonudos son configuraciones no
anidadas y no pueden ser descritas
solamente con las matrices . El
punto clave del algoritmo de pseudonudo
es el empleo matrices GAP adems de
.

El algoritmo de programacin dinmica


pseudonudo utiliza matrices de agujero o GAP
como una generalizacin de las matrices .
Definamos , : , como el grafo que
describe el mejor plegado que conecta los
segmentos[i, k] con [l, j], .
Definamos a (, : , ) como el grafo que
describe el mejor plegado que conecta los
segmentos[i, k] con [l, j], .

Para a completar se introduce la matriz


(, : , ) y su contraparte (, : , )

Las matrices son contenidas como un caso particular de las


matrices GAP. Cuando no hay ningn agujero k=l-1, entonces por
construccin:

La recursin para la matriz no-gap es dada por:

Los parmetros adicionales son:


: la puntuacin de un par en un multiloop no anidado.
: una puntuacin genrica para generar una multiloop no anidado.
: la puntuacin para generar una pseudonudo interno.

Similarmente para :

Los parmetros adicionales son:


: la puntuacin por introducir un pseudonudo.

Você também pode gostar