Escolar Documentos
Profissional Documentos
Cultura Documentos
Evolucin de caracteres:
Los mtodos de reconstruccin filogentica requieren que se hagan suposiciones explcitas
sobre:
1.- no. de pasos discretos necesarios para que se d un cambio en estado de caracter
2.- la probabilidad con la que acontece un cambio en estado de caracter
Direccionalidad en la evolucin de los cambios de estado de caracter (EC):
- caracteres ordenados: siguen secuencia especfica de pasos (matrices de pasos)
- caracteres desordenados: los cambios en EC se dan en un solo paso (nt)
Tipo de datos
algoritmo de
agrupamiento
UPGMA
y
Neighbor
joining
Bsquedas
bajo criterio
de optimizacin
distancias
Mtodo de reconstruccin
Mnimos
cuadrados
y
Evolucin
mnima
caracteres
discretos
1.- Una larga lista de estados de caracter, como una secuencia de DNA aa, carece en s
misma de significado evolutivo; en cambio, decir que 3 secuencias A <-> B <-> C presentan
95% y 50% de identidad entre ellas evoca una imagen intuitiva del grado de parentesco
2.- Los modelos de sust. de secuencias corrigen posibles mltiples sustituciones;
estas correcciones se aplican a las distancias pero no a las secuencias (o datos)
3.- Los mtodos de reconstruccn basados en matrices de dist. son muy rpidos
1. d (a,b) 0
A
(no-negatividad)
2. d (a,b) = d (b,a)
(simetra)
(inecualidad triangular)
4. d (a,b) = 0 slo si a = b
(distincin)
5
B
A
La inecualidad ultramtrica. Las dos distancias
pareadas ms largas [d (a,c) y d (b, c)] son iguales,
y por lo tanto la ultrametricidad define un tringulo
Ser una medida mtrica (o ultramtrica) es una condicin necesaria pero no suficiente
para representar una medida vlida del cambio evolutivo. Para ello tiene que satisfacer
tambin la condicin de los cuatro puntos:
A
B
C
issceles
C
Las distancias ultramtricas tienen la virtud de implicar igual tasa de evolucin entre
Esta condicin matemtica equivale a decir que las distancias son aditivas.
Distancias topolgicas
en cuyo caso podramos encontrar una combinacin de long. de ramas (a, b, c, d, e) tales que
el camino a travs del rbol conectando el OTU i con el j (pij = distancia topolgica o
dos.
(n-1) = 4 ramas
independientes
SS = 0.26577
Distancias K2P (sobre la diagonal) y distancias topolgicas obtenidas por MC para mtDNAs.
En negritas dt > de; en cursiva dt < de (dt =dist. topol.; de = dist. observada o evolutiva)
raz
rbol ultramtrico
rbol aditivo
Al igual que para los caracteres discretos, encontrar el rbol de distancias ptimo es computacionalmente difcil. Para nmeros chicos de secs. se pueden usar mtodos exactos; para
nmeros grandes, se emplean mtodos heursticos (aproximados):
1.- mtodo de los vecinos
2.- mtodo de unin de vecinos (NJ)
3.- UPGMA
- este es uno de los pocos mtodos que construye rboles ultramtricos (todas las hojas
equidistantes de la raz), es decir asume un reloj molecular perfecto a lo largo de toda
la topologa
- se puede concebir como un mtodo heurstico para encontrar la topologa ultramtrica
de mnimos cuadrados para una matriz de distancias pareadas
OTU A
B dAB
C dAC
D dAD
dBC
dBD
dCD
OTU (AB)
C
d(AB)C
D
d(AB)D
dCD
l(AB)C = d(AB)C/2
1. Alineamiento:
Rhizobium
Agrobacterium
Sinorhizobium
Bradyrhizobium
1.0
5.0
9.0
5.0
9.0
6.0
D]
1.
2.
[
[Rhizobium, A]
[Agrobacterium, B]
[Sinorhizobium, C]
[Bradyrhizobium, D]
OTU A
B dAB
C dAC
D dAD
OTU
C
D
(AB)
1.0
5.0
9.0
5.0
9.0
D]
Matriz de
distancias:
6.0
dBC
dBD
d(AB)C
d(AB)D
0.50
0.50
Rhizobium
Agrobacterium
4.
dCD
C
dCD
OTU (AB)
C
5
D
9
0.50
0.50
2.00
2.50
d(AB)C/2
[
[Rhizobium, A]
[Agrobacterium, B]
[Sinorhizobium, C]
[Bradyrhizobium, D]
1.0
5.0
9.0
5.0
9.0
6.0
(ABC)
d(ABC)D
1.0
5.0
9.0
5.0
9.0
6.0
D]
D]
1.50
d(AB)C = (9 + 9 + 6 ) / 3 = 8
2.50
4.00
Rhizobium
Agrobacterium
Sinorhizobium
OTU
D
2.00
5.
3.
[
[Rhizobium, A]
[Agrobacterium, B]
[Sinorhizobium, C]
[Bradyrhizobium, D]
0.50
0.50
Rhizobium
Agrobacterium
Sinorhizobium
Bradyrhizobium
d(ABC)D / 2
2.00
1.50
2.50
4.00
0.50
0.50
Rhizobium
Agrobacterium
Sinorhizobium
Bradyrhizobium
d(ABC)D / 2
N(N-1)/2 modos
de buscar pares
de OTUs en X
La calidad de la seal filogentica de los datos es una de las fuentes de posible error
en la estima filogentica, pudiendo afectar tanto a la exactitud como a la precisin de la
estima.
Si un set de datos contiene homoplasias implica que distintos sitios del alineamiento van
a apoyar diferentes topologas. Por lo tanto, qu rbol (o rboles) van a ser apoyados por
un set de datos depender del subconjunto de caracteres muestreados.
Por tanto, para minimizar los errores de muestreo (debidos a homoplasias) hay que tratar de
obtener secuencias lo ms largas posibles para el mayor nmero posible de genes
Homo sapiens
Pan
de 12 primates.
Gorilla
Pongo
Hylobates
M sylvanus
Macaca fuscata
M m ulatta
Lem ur catta
pendencia de caracteres y que estn distribudos idnticamente. Es decir, asume que cada
sitio es independiente de todas las dems y que la tasa de variacin est distribuda homogneamente a lo largo del alineamiento.
Homo sapiens
83
10 0
Pan
96
Gorilla
100
Pongo
Hylobates
97
M sylvanus
independencia analizando 10 genomas completos de mitocondrias comparando los rboles obtenidos para datos
contrastantes de muestreo: 1) bloques contiguos de
secuencia vs. 2) caracteres muestreados al azar a lo
argo de los genomas.
(Cummings et al. 1995. MBE, 12:814-22)
M fascicularis
1 00
0.05
Macaca fuscata
99
10 0
M fascicularis
igualmente soportadas?
M mulatta
Saimiri sciureus
Tarsius syrichta
Lemur catta
100
0.05