Você está na página 1de 7

Mtodos filogenticos

Bsico

La inferencia filogentica es un campo per se del estudio de la


evolucin, en continuo movimiento y expansin.

La inferencia filogentica es un procedimiento de estimacin


estadstica.

Disponemos de informacin actual sobre las molculas (u otros


caracteres) e intentamos hipotetizar sobre el pasado

La pregunta es: cul es la historia evolutiva de este grupo de


taxones?

Leccin 4. Mtodos filogenticos

Curso Anlisis filogentico


David Posada
Mster de Bioestadstica 2006
Universidad de Santiago de Compostela
Marzo 2006

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Propiedades deseables

Poder: cuntos datos se necesitan para producir un resultado


razonable?

MTODO COMPUTACIONAL
Criterio de optimalidad

Consistencia: converger a la solucin correcta si proporcionamos


suficientes datos?

Robustez: si se violan algunas asunciones el mtodo sigue


proporcionando soluciones razonables?

Falsabilidad: nos indicar el mtodo cundo no lo deberamos estar


utilizando?

No existe el mtodo perfecto

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Caracteres

Distancias

Eficiencia: cun rpido es el mtodo?

TIPO DE DATOS

Tipos de mtodos

Algoritmo de agrupamiento

Mxima Parsimonia (MP)


Mxima Verosimilitud (ML)
Inferencia Bayesiana (BY)

Evolucin mnima (ME)


Mnimos cuadrados (LS)

Neighbor-joining (NJ)
UPGMA

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Caracteres y distancias

Algoritmos vs. Criterios de optimalidad

Los mtodos algortmicos definen una serie de pasos que conducen a


la determinacin de un rbol

Los mtodos de optimalidad definen un criterio que permiten comparar


diferentes rboles y decidir cal es mejor (o igual).

Mtodos que usan caracteres nos indican cules cambian y nos permiten
reconstruir estados ancestrales
Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Son bastante atractivos

Dos pasos:
1. Definir el criterio de optimalidad (parsimonia, mnimos cuadrados,
verosimilitud, probabilidad posterior)
2. Buscar el rbol ptimo bajo el criterio en question

Tienen limitaciones

Proporcionan una forma de establecer un rango de bondad de las


diferente soluciones posibles

Estos mtodos son mucho ms lentos que los mtodos algortmicos,


ya que hay que buscar entre varias soluciones posibles

Mxima parsimonia (MP), Mnima evolucin (ME), Mxima


verosimilitud (ML), Inferencia Bayesiana (Bayes)

Pueden depender del orden en el que se aaden los taxones


No permiten comparar diferentes rboles

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos de optimalidad

Son mtodos fciles de implementar, incluso a mano.


El tiempo de computacin
Suelen resultar en un nico rbol

Optimalidad

Mtodos filogenticos

Mtodos algortmicos

Algoritmo

UPGMA (ya no se usa), Unin del vecino o Neighbor-joining (NJ)

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Cuntos rboles hay?

Problema muy difcil

Taxa (n)

Enrazados
(2n-3)!/((n-2)! 2n-2)

No enrazados
(2n-5)!/((n-3)! 2n-3)

15

105

15

954

105

10,395

954

135,135

10,395

2,027,025

135,135

10

34,459,425

2,027,025

20

8.20!1021

2.22!1020

50

2.75!1076

2.84!1074

La inferencia filogentica es un problema NP (non-deterministic


polinomial): no se conocen algoritmos eficientes para sus solucin.

Para un nmero razonable de secuencias (p.e., ms de 20) es a


menudo imposible garantizar que se han encontrado el rbol ptimo.

A menudo hay que realizar bsquedas heursticas, que pueden resultar


en rboles buenos, regulares, malos

El nmero total de tomos en el cuerpo humano es 1028.


El nmero total de partculas en el universo es 1072 1087.
Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Paisajes de rboles (tree landscape)

Islas de rboles (tree islands)

rbol ptimo global


Un buen rbol

rbol ptimo local

Y si la bsqueda
empezase aqu?
Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Bsqueda de rboles

Bsqueda exhaustiva

Exacta: garantizan todos los ptimos globales (8-20 taxa)


Exhaustiva: cuando se evaluan todos los rboles posibles
Branch-and-Bound

Aproximada: se buscan una solucin que sea ptima aunque sin


garantizar que sea la mejor (ptimo local o global?)
Heurstica: empezamos en un rbol dado y nos movemos a otros rboles
intentando mejorar su optimalidad. Cuando no podemos mejorar, paramos.
Algoritmos genticos

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Bsqueda Branch-and-Bound

Ejemplo Branch-and-Bound

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Bsqueda heurstica

Adicin secuencial (stepwise addition)

1.

Hay que empezar en algn sitio: adicin secuencial o descomposicin de


estrella

2.

Hay que buscar (branch swapping): TBR, SPR, NNI. Conviene hacer
varias rplicas de esta bsqueda con diferentes rdenes de adicin

GLOBAL
MAXIMUM

Search
for global
maximum

GLOBAL
MAXIMUM

local
maximum

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Ejemplo adicin secuencial (stepwise addition)

Descomposicin de la estrella (star decomposition)

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Movindose en el bosque

A partir del rbol inicial, queremos explorar diferentes rboles


Se efectuan una serie de movimientos y nos quedamos con el mejor
rbol
El proceso se repite hasta que no se pueda mejorar
Existen varios tipos de movimientos:

NNI: Intercambio del vecino ms cercano (nearest


neighbor interchange)

Intercambia ramas adyacentes del rbol


Se trata de reordenar los cuatro subrboles definidos por una rama
interna

NNI: intercambio del vecino cercano


SPR: poda y regrafo
TBR: biseccin y reconexin

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

SPR: poda y regrafo de subrboles (subtree prunning


and regrafting)

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

TBR: biseccin y reconexin del rbol (tree bisection


and reconnection)

Se elimina una rama (interna o externa) del rbol


El subrbol resultante se injerta en otra de las ramas

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Se rompe una rama interna, obtenindose dos rboles


Se exploran todas las conexiones entre todas las ramas de uno con
todas las del otro

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

rboles consenso

Tipos de consenso

A menudo encontramos varios rboles igualmente ptimos. Es posible


construir rboles consenso a partir de un conjunto de rboles:

Estricto: contiene los grupos (o nodos) que aparecen en todos los rboles
Adams: contiene los tripletes que aparecen en todos los rboles
Semi-estricto: contiene los grupos (o nodos) que no se contradicen
Regla de la mayora (majority rule): contiene los grupos (que aparecen
ms de la mitad de los rboles

Estricto

Adams

Cual es es consenso estricto?

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Mtodos filogenticos

Mtodos filogenticos

Mtodos algortmicos

Comparativa optimalidad-algoritmos

Los mtodos algortmicos combinan la inferencia del rbol y la


definicin del rbol optimo en un nico paso

No proporcionan una forma de establecer un rango de bondad de las


diferente soluciones posibles

Estos mtodos son computacionalmente mucho ms rpidos que los


mtodos de optimalidad, ya que no hay que buscar entre varias
soluciones posibles

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Regla de la mayora

Optimalidad

Algortmicos

Ventajas

Permiten ordenar los


rboles

Rpidos

Desventajas

Lentos

nica respuesta
Utilizan distancias

Incluyen UPGMA y Neighbor-Joining (NJ)

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Leccin 4. Mtodos
Anlisis filogentico 2006
David Posada

Você também pode gostar