Você está na página 1de 89

PaNcpos Bscos

d L
ads1ca
por
PABLO A. GOLOBOFF
Investigador Adjunto del CONICET
Instituto Miguel Lillo, Miguel Lillo 205,
4000 San Miguel de Tucumn
SOCIEDAD ARGENTINA DE BOTNICA
BUE
NOS
AIRES
- 1 9
9 8
SOCIEDAD ARGENTINA DE BOTNICA
COl11isin Directiva
P(osidento;
Vic(pr,:sirlenlc:
5ecrcr'tri,l:
Tc'50rera:
Sfcreiiri,l de Actas
log. ,.gr. Rob(r!o D. Torto!,l
Ing. Agr. lu!an ClClrd er"dez
[)r,1. jor) td"ma
lk'. Mirla O. Arriaga
ProL Ct'I!!IJ M. Malleri
111;. i),I'. /\dri,ln.1 BiHtoli
ne. Ar. <anIn Palacios, DI Gustavo lJe!uccb:,
Dr.J. Anllrl PcrtU: Ilg. Agr. Mar<l riel CDv'l Mennflez
Sevillano, lrJ. Estreila Lrtube'f: Dr. Enrique ZJ!locchi.
r(')lsorcs de Cucnt,J! lng .AgL An.1 Mara Mianie /\J7og41rny,
Voca,t:s Suplcnk"
Ing. Agr. Ana D' All1brogio
Ing. /g', SarJ Alonsu, tc. Leonor Cus,ll(), Dra. Beatriz GaLl:i,
I)/. ( `los A, Nar<1f'_jo
SOCIWAD ARC[NTlNA Uf. HOT ,IC:A
1','CU'I"d de AgfOnOmiJ de :< UI)>efdMJ dc BUf:lh Airc
CfH<dr de BOlnici Agrieol.
Av San M,lrH1144SJ :1 ^ Bltt'lOS Aire". Argelt;IJ
rel. 52,1-BQ69 . 8(1)(
l-m.i!: lortosa@ifc'hLcdu"n
PRIMERA EDICiN
Mayo 1998
Queda hecho el depsito que marca la ley 1 i, 723
Reserados lodos los derechos.
Prohibida la reproduccin o uso tanto en espaol o en cualquier otro idioma.
en todo o en parte por n'lnguf medro mecnico o electrnico,
para uso pblico o privado, sn la previa auorizacin por escrito
del aulor y fa editorial
Copyright (e) 1998 - IS8N 987 - 97012-0-8
Impreso en la Argentina Plinted in Argentina
SCIEDAD ARGENTINA DE BOTNICA
Cuando se fund nuestra Sociedad y di a luz el primer volumen de su
Boletfn. d manera de prlogo Lorenzo R, Paradi explic que el propsito de
la nuOa publicacin era {exponer en (orma metdica la situaci6n de (los)
conocimientos cientficos" y presetar al lector un rgano "que le ayude en
sus investigaciones, o que le smpliique la tarea de buscar datos dispersos
que se publican constantemente en todos 105 pases
Luego de ms de DL aRos de continuidad, el Boletn de la Sociedad Ar
getina de Botnica constituye hoy Un rgano de difusin de traba
l
os espe
cializados de primer nivel (no siempre valorado por los rbitros por su caracter
de autctono) y no dispone'de espacio suficinte para contribuciones largas
como la que hoy presentamos en forma de libro.
El espritu de la Sociedad sigue siedo el mismo que el enunciado por Pa
rodi, y al i
g
ul que l creemos que "la colaboracin de los que aspiran P
contrihuir con su esiuCr7o al adelanto de esta Ciencia (Botnicai podr esti
mular D los investigadores que disponen de medios adeCuddo5 haciendo
posible cierras trabajos que de otro modo quedaran l3rgo tiempo sln ser
hechos". Es el caso de el Dr, G% bof, quin desinteresadamente y desde
una ciencia vecina, la Zoologa, ofreci a nuestra Sociedad su obra "Princi
pios bsicos de Cladstica"para que mediante sU publi caci| podamos brin
dar a 105 investigadores, especialmente a los jvenes una visin global de
los fundamentos de esta disciplina,
El mtodo cladstico, luego de las tormentas desatadas desde su formu
ladn, ha encontrado Su lugar en la ciencia BotniCa tanto en la realizacin
de estudios filogneticos como en aqullos que buscan realizar una mejor
clasificacin de 10& vCgetales Creemos que esta contribucIP ser valorilda
por los que deseall incursionar en esta metodologa, as como por los que se
guimos iieles a la taxonoma clsica,
\!J
ROBERTO D, TORTOSA
Prsidente
SQciedad Argentina Ue bO!JOir
-- ..
PRlOGO ......................................................................... ........................ VII
INTRODUCCiN ........................................................................................ .
REPRESENTACiN DE CLASIFICACIONES .... .. .... .. .. ... .............. ... ..... ...... . 5
CLASIFICACiN Y GENEALOGA............................................................ 8
INFORMACiN Y CLASifiCACIN .... .. .............................. ................... 1 5
EVALUACiN DE ClASIFICACIONES
EIEI.PLOS ... .. . ..... ..... .............. ............................................................ 21
CONSECUENCIAS DEL CRITERIO DE PARSiMONIA................................ 26
AGRUPAMIENTOS POR SIMILITUD GLOBAL . ......... ... ............. .... ....... .. .. 29
POLAI<lDAD Y ENRAIZAMIENTO .. ........ ... ... .......................................... 34
OPTIMIZACIN DE CARACTERES
IDEAS BSIC,\S .. ................... ..... ... .. ....... .... ..... ..... ........... ................ ........ 38
OPTIMIZACIN GENERALIZADA ..... ............ . ........ ...... . ......................... 39
BSQUEDA DE SOlUCIONES PTIMAS
GENERALIDADES . ..... ..... .... ...... ......... ........................................... 48
SOLUCIONES EXACTAS ..... ..... .. ............................................................. 49
MTODOS DE PUEBA y ERROR
RBOLES D WAGNER ..... ... ............................... ..................... 50
PERMUTACIN DE RAMAS .. ... ..... .... ................ ....................... 5 1
MTODOS MS EXHAUSTIVOS ... .. .... ..... .............. .... .. ..... ..... .............. 52
MTODOS RPIDOS DEAN1I51S . .... ..... .. .. ... . ...................................... 53
PESADO DE CARACTERES .... ...... .... ........... .. ..... ........... .. ............... .... ..... . 54
MEDICiN DE APOYO DE GRUPOS ... .... ...... .. .. ... ....... .. . ... ... ...... .. .. .. .... .. 58
PROGRAMAS DE COMPUTADORA .. ....... ..... ....... .... ... . ............ ....... 59
CONCLUSiN ........ ... ........... .. ......... ......... ..................... ......... ....... 60
Bibliografa .....
65
IX
Apndice 1. ............................... ................................................................... 71
Optimizacin de Flch ... ........................... ,.................................... .......... 71
Optimizacin de Farris ....................... ", ................ , ... , ......... ".", ..... ,........ 72
Apndice 2. .................. ................................................................................ 75
x
INTRODUCCiN
En la actualidad, el mtodo ms utilizado en sistemtica es el
mtodo cladstico. La formulacin original de este mtodo suele
atribuirse al entomlogo alemn Willi Hennig, pero muchas de las
ideas bsicas del mtodo fueron desarrolladas independientemente
por varios investigadores (algunos, mucho antes de HennigJ. Hennig
desarrolls" sus ideas entre los aos '50 y '60, Y su metodologa
empez a hacerse ms conocida en la dcada del '70. Sostena
que las clasificaciones deben estar basadas en la filogenia, y propu
so un mtodo que permitiera hacer hiptesis de filogenia a partir de
las observaciones de las caractersticas actuales de los rganismos.
Fue uno de los cientficos que ms se mostraron en contra de I a idea
de que la sistemtica era una especie de "arte" -la idea de que el
sistemtico simplemente mete las cosas en casilleros, sin necesidad
n posibilidad de justificar cmo son elegidos esos casilleros. Henng
insisti, en cambio, en que la sistemtica debe verse como una cien
cia, y que sus principios y fundamentos por lo tanto deben ser justi
ficados y discutidos en una forma lgica y racional. El difundir este
punto de vista fue probablemente una de las contribuciones ms
Importantes de Hennig.
Hasta mediados de la dcada del '70, se consider que el prin
cipio fundamental de la dadstica era que las clasificaciones de
ban basarse exclusivamente en las relaciones filogenticas (sin
importar tanto cmo han llegado a descubrirsededucirse esas rela
(iones). En esta poca fue comn que se presentara a la cladstca
como un
"rompimiento epistemolgico" con el pasado, represen-
Pablo A. Goloboff
tando un enfoque completamente nuevo de cmo hacer clasifica
ciones. Esto implicaba que los trabajos de sistemticos pre
hennigianos podan ser ignorados, ya que trataban de problemas
ahora considerados irrelevantes. Slo al tomar las relaciones
filogenticas en lugar de tan slo las similitudes y diferencias podia
lograrse, supuestamente, una clasificacin ms "cientfICa" -en lu
gar de tan slo "descriptiva."
Hennig mismo, en sus trabajos, pareca desdear a menudo el
aspecto descriptivo de la sistemtica. Sin embargo, se fue haciendo
evidente a mediados de los 70 que el mtodo cladstico puede ver
se tambin como una forma especial de "describir." Cierto es que
el mtodo fue originalmente pensado con el propsito de reconstruir
filogenias, pero la idea fundamental del mtodo era que el estudio
de la filognia es una ciencia emprica y las conclusiones deben
basarse entonces en evidencia -en caracteres. Por lo tanto, el m
todo cladstico puede verse tambin como un mtodo de estudio de
caracteres, es decir, una forma de relacionar clasificaciones y ca
racteres ... y por lo tanto, como una forma especial de usar las clasi
ficaciones para describir los caracteres. Este puntu de vista fue sos
tenido especialmente por James S. Farris (posiblemente el investiga
dor que ms ha contribuido a hacer que la cladstica moderna sea lo
que es hoy da), Gareth Nelson, y Norman 1. Platnick. Segn estos
autores, el modo en que los caracteres se relacionan con la clasifi
cacin final en el mtodo cladstico es el mejor, e lo que se refiere
a eficiencia descriptiva. Desde este punto de vista la cladstica no
representa ningn "rompimiento epistemolgico" con el pasado, sino
tan slo una manera ms explcita y lgica de llevar a cabo el mis
mo propsito que han buscado todos los sistemticos desde Unneo:
organizar a la diversidad en un sistema coherente. los trabajos .de
sistemticos pre-hennigianos tambin pueden -y deben- ser consi
derados, analizados y discutidos.
Este trabajo, entonces, har hincapi tanto en la justificacin
"filogentica" del mtodo como en las posibles relaciones entre la
clasificacin y los caracteres de los organismos.a clasificar. Esta
forma de enfocar el problema de cmo elegir un mtodo de clasifi
cacin no es la ms comn, pero los enfoques ms tradicionales
dejan en realidad el problema sin resolver. Tradicionalmente se ha
hablado de tres "escuelas" de sistemtica (fentica, evolutiva, y
2
PRINCIPIOS de (L-DlS1|A
C!USlJCI UUC GIIcIcH e SUS OD|ClIvOS o HOlJVCIOHCS. LSIO toda
V se CHSCP3 cH HUC!OS CUI5OS UHJVcI5IIIJO5 /S uSCUc
C!USIIC DI0ICHGCI3 IC!0]I cH C!SIICIH 5ODCHlC !HOI-
HCJH 5ODIC 2Cc!O3, SIH IHOIII CHO 5O !OS OI3HISHO> a
CSIICI, fentica, SOHCHIC IOIHCJH SODIC CHO 5OH 105
OI2HJ5HOS, 5IH IHDOIII SU CC!O2!a, y ! tVO!UIIV DICICHUCI
ICCI c! CSIIC3CIH HDOS SDcCIOS, UHGO DIIHC UO U
OIIO en 105 CSOS en UUC CSlcH C COH!JClO. 13c5 UI5CUSOHC5 0H
lCIHJHOS Gc HOIJVOS en conflicto SOD IIIcSOUDC5, y HO GHIlc UD
solucin IC (qu cS HC]OI, CDSI O Coca?), Ms an: este
planteamiento presupone JHDCJIHcHI0 UUC CUGO S0 C5lUGJH
OS CICICICS DI ODlCHcI !3 2CHcO!3 HdS I7OHDC |UUc 5c
IIJDUyc ! mtodo CGJSIJCO. CSJJCCIH DIOGUCIG HO ncCe
sariamente Cs UUc Hc]OI describe UJSIIIDUCIH UC CICICIcS
observada (UUe 5C IIDUy0 as al HCIOUO CHCIICO). CIO !Sl3 OS
HISHO5 IDVCSIIGOIC5 UUc han DDlcGO CS UICOIOH! CHlIC
IO2cDJ y UcSCIIDCJD ICCOOCc UUc hiptesis Gc CVOUCIH
COH5lJIUyC HCOI CXD!ItCID DI 3UIVCI5JGG DJOIC. OSIc-
HcI UUC UC!5I|JCCJ cHc!2JC O DUCUC 5CI GCSCIIDIv3 an
CUHGO !OcHIc5 !Hc|OI CXD!IC3CI GCla UIVcISJUU DIO!PJ-
C cOUJVC SOSICHCI UUC O$ DIODSJIOS de UCSCIJDCIH y 0DIC-
cin estn divorciados UHO GC! Ul/O, UUc son IHCOHDIID!C5. LsIO
IICHc DOC DSC, cHICIUU. LOS lID]OSde |IIJS lICSUH)UOS H3S
UcHIc) HUCSIIH UUcC HCIOGOC!USIICO c5IHCDIC IHOIHII-
VO ICSDcCIO GC las ScH0]7S y diferencias ODS0IVUS, y UUc !OS
DIODSJIOS U0 explicacin y descripcin SC DUCU0 CUHDII D0IcC-
lHcHlC al mismo lIcHDO. .O DOU3ScIUC OII HHCI3. UIICIHCHlC
DUCdc "explicarse" aqUCO UUc no sc DUCUcGC5CIIDJI. Ht!USO 0H
una CICDCJCOHO ! l5JC3,!5CycS O 5OH HS UUC lOIH35 c5DC-
CI!cS Uc UcSCIIDCJ !C. OIHS UC hacer UU0 aparezcan COHO
lDSlHCI35 GC !O HISHO CVcHIO5 UUC CSO COIIIIO- apareceran
COHO lOIHcHIC aislados yUJCIcHICSI. /UH, DOI!OIHIO.COHDI-
lCHO5 S IIC5 cSCUC!S - S UI5IIHIS IOIH5 GC IC!CIOHI C-
IClCICS y CSI!ICCI- cH ICIHIHOS O SO de 5U CDCJGU DI
IH!CIII JO2CHJS, 5IDO lHDCH Uc CDJG3G DI IccjI SIHI!J
I
uUcS
y UICIcHCIS e C!SIICCIH-C5 GCCII CHO SOD OS OI
R!>PO5. 5 IHDIOUUCI!vO hablar Gt lIcS CSCUc!S y !CCI ICCIcDCI

DIOD5lO> UISlJHIOS e IIIcCODCIIDcS. es DIc!cIIDc !DI Uc iH
$0 uSlJICCIH lcIC3 y UC GISUHIOS HCIOUOS DI3 COHscHII
Pablo A. Golobo{f
Veremos que los propsitos de descripcin y explicacin necesaria
mente llevan al mismo mtodo y las mismas conclusiones.
Tras revisar brevemente cmo se representan las clasificacio
nes, discutiremos cmo las clasificaciones facilitan la tarea de ex
plicar, organizar y describir el conocimiento de la diversidad biol
gica, y veremos que esto se hace mejor en la medida en que la
clasificacin requiera menos diferencias entre los caracteres (o es
tados) asociados con cada grupo o, lo que es equivalente, menos
paralelismos. A estas diferencias tambin se las llama a menudo
pasos o cambios. Luego se dan ;Igunas nociones de fentica. En la
seccin que sigue se explica cmo encontrar (para un rbol dado)
la cantidad de pasos para un carcter; dado que esto requiere asig
nar estados a los grupos en forma ptima, se conoce al procedi
miento como optimizacin. A continuacin, se explica brevemente
cmo se puede hacer en la prctica para encontrar o identificar el o
los rboles que efectivamente requieran la menor cantidad de pa
sos -lo cual constituye un problema bastante complicado, que se
resuelve en general mediante mtodos de "prueba y error" o bs
quedas. Finalmente, para aquellos interesados en aplicar estos prin
cipios, se incluye n ejemplo (muy simplificado) de cdigo para un
programa de computadora en lenguaje e (esto requiere al menos un
conocimiento rudimentario de programacin).
Quiero aclarar aqur que la idea de este trabajo no es la de dar
un tratamiento completo ni profundo del tema, sino solamente tralar
de introducir en forma accesible algunas ideas bsicas pero poco
difundidas. Prcticamente nada de lo que aqu se dice es original,
aunque las ideas de muchos autores distintos han terminado mez
cladas en una forma que s es personal -no puede decirse que la
visin presentada aqu sea original, pero tampoco puede decirse
que represente un consenso absoluto: otros investigadores en leora
de sistemtica pueden estar en desacuerdo con muchas de las ideas
presentadas aqu. Quiero tambin agradecer a las personas que le
yeron distintas versiones de este trabajo (Lone Aagesen, Virginia
Abdala, Eduardo Domnguez, Ins Horovitz, Martn Ramrez, Gabriel
Rua, y Claudia Szumik) por sus sugerencias y comentarios. Asimis
mo, las discusiones e intercambios de ideas con muchos colegas de
habla inglesa (quienes por cuestiones idiomticas no pudieron leer
el manuscrito) han terminado incorporadas de un modo u otro; en
4
PRINCIPIOS de ClADSTICA
este sentido, estoy especialmente en deuda con James Carpenter,
Jonatha
n Coddington, James Farris, Kevin Nixon, Nonnan Platnck,
y Ward Wheeler. Finalmente, mis disculpas a los botnicos si -pese
a mis intentos por evitarlo- he abusado de los ejemplos zoolgicos.
REPRESENTACiN
DE
CLASifICACIONES
Las clasificaciones biolgicas son jerrquicas. Hubo investi
gadores que intentaron organizar la diversidad biolgica de otras
maneras (por ejemplo, se ha propuesto una tabla peridica de mari
posas), pero esos intentos tuvieron poco xito -las semejanzas y
diferencias de los organismos realmente parecan adaptarse mejor
a una estructura jerrquica. As como la mejor forma de hacer una
sistematizacin de las propiedades de los elementos qumicos es
mediante una tabla peridica, parece que la mejor forma de hacer
lo para los organismos vivos es mediante una clasificacin jerrqui
ca. Que esto era as, pareca evidente incluso a los sistemticos
pre.darwinianos; muchos investigadores se haban preguntado por
qu las relaciones entre organismos se daban en forma jerrquica,
pero fue Darwin quien convenci a la comunidad b'lolgica de que
la causa era la evolucin -los grados de parentesco de la clasifica
cin se correspondan con grados de parentesco genealgico, y el
parentesco genealgico se da naturalmente en forma jerrquica.
Revisaremos entonces algunos de 105 aspectos bscos de las
,Iasilicaciones jerrquicas. Estas consisten en grupos divididos en
sub-grupos; su estructura puede representarse de varias formas.
Quizs la ms intuitiva sea en forma de conjuntos, como se muestra
en la fig. 1. Otra forma mu
y
comn de representacin es la nota
cin parenttica: se encierra cada grupo de la clasificacin en pa
rntesis anidados. As, la clasificacin de lig. 1 es equivalente a (F
!D E (A Be))). Cualquier clasificacin puede tambin representarse
Como un rbol, y este es el tipo de representacin usado ms a me
!udo en cladistica. La informacin sobre agrupamientos es exacta
mente la misma y cualquier representacin, entonces, es completa
mente equivalente a las otras. El ejemplo de la lig. 1 tambin puede
pibujarse como se muestra en la lig. 2, utilizando ramas para conec-
5
P blo A. Golobof
Figura 1.
lar los nodos -que representaran los grupos, formados por una sola
especie o taxn ("nodos terminales") o fOrlllados por varias ("nodos
internos"). Al nodo ms basal, del.cual se "originan" todos los de
ms, se le llama raz. A esta representacin de una clasificacin en
forma de rbol tambin suele llamrsela c/ado
g
rama. Los nodos
interos representan, como ya dijimos, los grupos de especies; si se
interpreta al cladograma como un diagrama indicando relaciones
fi logenticas, los nodos internos representarian ancestros comunes
(hipotticos), ancestrales de los grupos a los que dieron origen. Cuan
do se asigna a los nodos internos un estado de carcter dado (ver
seccin siguiente), se encuentra cules estados caracterizan a los
grupos. Interpreiado filogenticamente, sos son los estados que
razonablemente pueden atribuirse al ancestro comlm del grupo.
Todo grupo que se encuentra efectivamente como un grupo en
el rbol es un grupo monoflUco. El caso contrario se da muchas
veces cuando investigadores previos propusieron grupos basndo
se en evidencia escasa o mal interpretada: los grupos as propuestos
aparecen a menudo como nomonofilticos al estudiarse mejor el
problema. Por ejemplo, un taxnomo puede haber propuesto que
las especies A y F formaban un grupo, pero segn la clasificacin
Ae D E F
Figura 2.
!!
PRINCIPIOS de CLADSTICA
de las figs. 1-2 el grupo A+F es po/filtico: se "origina" varias ve
ces. Tambin puede suceder que un grupo se "origine" una sola
vez en el rbol pero no sea monofiltico -o sea, que no se corres
ponda exactamente con ningn grupo del rbol. Antes de Hennig,
a estos grupos se los llamaba tambin monofilticos, pero Hennig
restringi el uso de monofltico a los grupos que coinciden perfec
tamente con un rbol. Un grupo como B+C+D+E se "origina" una
sola vez en el rbol de la fig. 2, pero A ha "perdido" la perenencia
al grupo; a estos grupos se los llam, a partir de Hennig, parafilticos.
Previo a Henn ig, estaba claro que si se usaban caracteres conver
gentes para agrupar especies no genealgicamente relacionadas,
se producan grupo polifilticos. Hennig mostr adems que si se
agrupa por compartr caracteres primitivos se pueden producir gru
pos parafilticos o monofilticos; slo agrupando por caracteres
derivados (ver ms abajo) se producen grupos monofiltcos.
Ntese en el ejemplo de arriba que A, B
Y e se incluyen en un
grupo. Cuando cada grupo de una clasificacin (rbol) se divide en
dos grupos se dice que el rbo
.
l es dicotmico; cuando se divide en
ms de dos, se dice que es politmico. En el ejemplo de arriba, A, B
Y C forman una politoma (o tricotoma). Las clasificaciones com
pletamente dicotmicas contienen ms informacin acerca de qu
grupos existen que las politomas; cada politoma puede "resolver
se" de varias maneras. Si la clasificacin hubiera dicho que B est
ms cercano de A que de C, todava habra habido un grupo A+B+C
en el rbol; es decir, se especificaran todos los grupos de antes ms
un grupo adicional, A+B. El nmero de posibles resoluciones de
una politoma puede ser grande; por ejemplo, en el caso de arriba,
el rbol es compatible con 9 resoluciones dicotmicas distintas: 3
para la tricotoma de A+B+C, y por cada una de ellas, 3 para la
tricotoma de {ABC)+D+E. En cada una de esas 9 resoluciones
dicotmicas se respetar toda la informacin explicitada en la cla
sificacin de arriba -o sea, ninguna de esas 9 resoluciones contra . .
dice a l a poi itoma. Siempre que existan caracteres -evidencia
positiva- para resolver una politoma, ser preferible hacerlo. Toda
vez que no exista evidencia para preferir ninguna de las posibles
resoluciones dicotmicas, ser preferible quedarse con la politoma,
pero teniendo bien claro que esa politoma no es ms que una ex
presin de ignorancia de cmo resolver el problema. Nunca puede
haber evidencia positiva que lleve a preferir una politoma sobre
7
luUIO A. Lo|obol|
cualquiera de sus posibles resoluciones. Toda distribucin de ca
racteres perfectamente compatible con una politoma ser, siem
pre, igualmente compatible con cualquiera de sus resoluciones.
Muchos cursos o apuntes ponen bastante nfasis en cmo se
debe trasladar a la jerarqua linneana un esquema de clasificacin
como 105 mostrados. En realidad, dicha traslacin es poco menos
que automtica: cada grupo debe recibir una categora (por ej.,
subfamilia), y subdividirse en grupos de categora inferior (por ej.,
gneros). Tpicamente, el rbol que resulta de un anlisis c1adstico
tendr grupos de muchos niveles diferentes, con lo que los niveles
de la jerarqua linneana podran ser insuficientes; sin embargo, no
es necesario que todos los grupos del rbol reciban un nombre for
mal, sino tan slo que todos aquellos grupos que reciben un nombre
formal se correspondan efectivamente con un grupo del rbol, en
virtud de tener idntica composicin.
CLASIFICACiN
Y
GENEALOGA
El inters de los sistemticos en proponer clasificaciones
genealgicas (=filogenticas) radica en que la filogenia es la princi
pal causa de las similitudes y diferencias entre organismos. Esto
quiere decir que si dos especies cercanas comparten caractersti
cas similares, es ms probable que esto se deba a haber heredado
esas caractersticas de un ancestro en comn, que a dos adquisicio
nes independientes de caractersticas idnticas. Bajo condiciones
ideales, todas las especies descendientes de una especie ancestral
que haya adquirido una novedad evolutiva dada habrn heredado
esa caracterstica; llevar esa novedad evolutiva es una "marca" que
indica que todas las especies que comparten esa caracterstica son
descendientes de un nico ancestro -y como todos los descendien
tes habrn heredado esa modificacin, la ausencia de ella indica
automticamente que una especie sin la caracterstica modificada
no puede descender de ese ancestro. Hennig llam a las caracte
rsticas derivadas sina
p
omoras; a la condicin alternativa (no mo
dificada) que exista anteriormente la llam plesiomora. El com
partir plesiomorflas no indica que las especies correspondientes for-

~ .I ____
IR!^'!l!5 Oc CL^OI51l!^
men un grupo monofiltico. Esta formulacIn simplificada funcio
nara perfectamente si no existieran paralelismos (i.e. adquisicin
en dos linajes independientes de una caracterstica similar -sugiere
inclusin equivocada en el grupo) ni reversiones (Le. prdida 5L
cundaria de la caracterstica que debi haber sido heredada de un
ancestro -sugiere exclusin equivocada del grupo). Dado que pa
ralelismos y reversiones producen similitud no debida a homologa,
se los conoce con el nombre general de homop/asia (i.e. lo opuesto
a homologa).
la formulacin ms moderna del mtodo cladstico consiste en
buscar aquellos rboles que requieran considerar como homoplsicas
la menor cantidad posible de similitudes. Esto se conoce con el
nombre de criterio de parsimonia, y equivale a decir que se prefie
ren los rboles que expliquen por ancestralidad com(1I1 la mayor
cantidad posible de similitudes. Esta formulacin no requiere hacer
referencia a la nocin de sinapomorfa/plesiomorfa. yes por lo tan
to ms general; ms bien, la idea de agrupar por sinapomorfia es
una consecuencia lgica del criterio de parsimonia. Una hiptesis
de filogenia slo puede explicar un aspecto de la morfologa: por
qu algunas especies comparten similitudes y otras no. Una hipte
sis de filogenia no puede explicar, por s sola, por qu el ancestro
comn de las aves adquiri alas; para esto, es necesario un tipo de
explicacin ms compleja (por ej., acerca de mecanismos evoluti
vos). Pero una filogenia si puede explicar por qu todas las aves de
hoy en da tienen alas (o vestigios de ellas. al menos): porque todas
descienden de una especie ancestral con alas. Por lo tanto, una
clasificacin (=filogenia) puede explicar por ancestralidad comn
una similitud compartida toda vez que pueda atribuirse esa condi
cin al ancestro comn de las especies que la comparten. Cuando
las especies que comparten una condicin dada aparecen en dos
grupos muy separados (digamos, J y K, en la fig. 3) no puede razona
blemente atribuirse esa condicin al ancestro coml (U de los dos
grupos. En un caso as, la condicin trbol (. slo puede atribuirse
al ancestro comn (l) si se considera que tanto el ancestro c
omn
como todos los ancestros intermedios entre I y K la tenan tambin.
Sin embargo, esto querra decir que todas las especies que descien
den de los ancestros intermedios y tienen la condicin alternativa,
diamante (tl, habran adquirido la condicin diamante independien-
Figura 3.
Pablo A. Golobulf
(Ll





Grupo J
) Grupo K
temente -es decir, la similitud en 13 condicin diamante no se debe
ra a ancestralid
a
d comn. Por l o tanto, los casos de similitudes no
atribuibles a herencia comn (en la condicin alternativa, diaman
te) seran ms numerosos, y por lo tanto es preferible considerar que
lo que no se debe a ancestralidad comn son algunas similitudes en
l a condicin trbol, En la prctica, se utiliza a menudo un cdigo
numrico para representar las distintas condiciones observadas, o a
veces, cdigos de letras, Sin embargo, esto es puramente conven
cional, y cualquier tipo de simbologa podra ser usado.
El nmero de especies incluidas en J o K no influye en la cuenta
de las instancias de similitudes no explicadas por una hiptesis de
flogenia que separe a J y K en dos grupos lejanos. las posibles
comparaciones entre miembros de J y K no deben contarse como
instancias independientes de similitudes no explicadas por
ancestralidad comn -la similitud entre dos miembros cualesquiera
de J s es explicada, y por lo tanto las comparaciones entre un miem
bro de K y esos dos miembros de J quedan subsumidas en una sola,
la cantidad de similitudes en una caracterstica cualquiera que no
son expl icables fi logenticamente depende slo del nmero de gru
pos en que se separe a las especies que comparten la caractersti-
1(1
PRINCIPIOS de CLAOSTICA
ca; en el caso del ejemplo, una sola. O sea: si se hubiera repartido
a esas especies en cinco grupos no relacionados entre s, habra
cuatro instancias de similitudes no explicadas (Le. el nmero de gru
pos menos uno). Generalizando, puede decirse que la cantidad de
similitudes explicadas por ancestralidad comn por una hiptesis
de genealoga disminuye directam
!
nt

.
(
!
n
,
el nmero de derivacio
nes independientes requeridas
al
ptesis. E n la mejor genea
loga para dos condiciones alternativas de un mismo carcter habr
una sola derivacin, y todas las similitudes sern explicables por
ancestral idad comn. Ntese que en este caso, la nica derivacin
(o cambio, o paso) requerida corresponder a un cambio de una
condicin primitiva a una derivada -una sinapomorfa. Es perfecta
mente posible, dada una aparente sinapomorfa compartida por va
rias especies, postular una genealoga donde esas especies aparez
can separadas en varios grupos -la hiptesis donde la sinapomorfa
aparece como tal es preferible justamente por ser ms parsimoniosa.
Es importante destacar que el hecho de agrupar a varias espe
cies que comparten una caracterstica dada permite considerar su
similitud como explicada por ancestralidad comn, pero no requie
re ni asume que la similitud se debe efectivamente a ancestralidad
comn. Ni si quiera el que cada uno de los miembros del grupo
hubiera adquirido la condicin derivada independientemente impli
cara que la hiptesis de monofilia del grupo es falsa; slo implicara
que la aparente similitud en realidad no nos dice nada acerca de las
relaciones entre esas especies. Es decir, una clasificacin de mxi
ma parsimonia no requiere que la naturaleza trabaje parsimonio
samente, slo lo permite; tal clasificacin es igualmente compatible
con una, dos, o tantas derivaciones independientes como se quiera.
Una clasificacin que separe en cambio a las especies en cuestin
en 10 grupos, requerir que haya habido como mnimo otras tantas
derivaciones (y como mximo, tantas derivaciones como se quie
ra); esta clasificacin menos parsimoniosa es i ncompatible con me
nos de 10 derivaciones. Suele pensarse que el criterio de parsimo
nia se utiliza porque s e piensa que l a evol ucin procede
parsimoniosamente (que la evolucin "se hace por el camino ms
corto"). Esto es un error; la ventaja del criterio de parsimonia es que
requiere muy poco en cuanto a cmo la evolucin funciona. Las
clasificaciones poco parsimoniosas en realidad requieren que exis-
11
Pablo A. Goioboff
ta homoplasia (Le. paralelismos y reversiones); las ms parsimoniosas
no requieren ni poca ni mucha.
Si hay mucha homoplasia 105 resultados de aplicar el criterio
de parsimonia sern, en general, menos confiables -pero esto no
quiere decir que una clasificacin de menos parsimonia vaya a ser
preferible. Supngase tener tres especies, y 10 caracteres; 9 son
sinapomorfas aparentes de A+B. y 1 es una sinapomorfa aparente
de A+C. Si una sola de las 9 aparentes sinapomorfas de A+B es
realmente una sinapomorfa, la clasificacin e (A B) ser correcta.
Si la homoplasia es tan comn como para que slo uno entre los 10
caracteres observados est libre de homoplasia, es ms probable (9
veces ms probable) que ese nico carcter sea uno de los 9 que
juntan A COn B, y no el nico que junta A con e -y e (A Bl sigue
siendo mucho mejor hiptesis que B (A C). En el extremo. si la
homoplasia fuera universal, no habra ninguna relacin entre ca
racteres y genealoga, y pretender hacer una hiptesis de filogenia
basndose en el estudio de caracteres -sea usando el mtodo
cladstico o cualquier otro mtodo sera totalmente imposible. F
cil es descartar tales temores. Si esto fuera as, los hijos no necesa
riamente se pareceran a sus padres. Por ejemplo, una vaca podra
parir una avispa -o, en realidad, un bicho que sea un mezcla de
todos 105 caracteres de cualquier otro ser viviente. Si bien la evolu
cin produce a menudo casos de homoplasia, casos extremos como
el de este ejemplo no existen, y es claro entonces que s existe una
cierta correlacin entre caracteres y genealogia.
La discusin precedente no debe interpretarse como una afir
macin de que el criterio de parsimonia produce automticamente
la verdadera filogenia para un grupo. El criterio de parsimonia no
garantiza encontrar una solucin correcta, lo cual se aplica exacta
mente igual a cualquier otro mtodo emprico: ningn mtodo pue
de hacer que las conclusiones se establezcan automticamente con
certeza absoluta, ni siquiera dadas las observaciones mas favora
bles posibles. La razn para preferir la hiptesis de relaciones ms
parsimoniosa no es que sea verdadera, sino que es la que provee la
mejor explicacin -la explicacin ms simple- de las observacio
nes realizadas.
Bajo ciertos modelos evolutivos el criterio de parsimonia lIeva-
12
'i

PRINCIPIOS de ClADlsTICA
r normalmente a error -por ejemplo, cuando los paralelismos sigan
un patrn de distribucin especial. Un caso muy conocido es el
planteado por Felsenstein (1 978). Supongamos tres especies A-C, y
el rbol A (B C). Supongamos que cada uno de los caracteres ob
servados puede tener un nmero limitado de estados posibles, que
existe un nmero no muy grande de caracteres, y que la probabili
dad de cambio para todos los caracteres es igual a lo largo de una
rama dada del rbol A (B el. Supongamos adems que la probabili
dad de cambio en las ramas que dan a A y B es muy alta (y la misma
para cada carcter), mientras que en la rama interna del rbol y en
la rama que da a e, es muy baja. En estas condiciones tan restringi
das, es muy probable que haya ms sinapomorfas compartidas por
A y B que por B y e --on lo que un anlisis de parsimonia producira
la genealoga equivocada, e (A B). Las ramas que dan a A y B se
dice que son muy "largas" (Le. tienen una gran probabilidad de cam
bio), y entonces se han usado estos modelos para sugerir que, bajo
el criterio de parsimonia, las ramas largas se "atraen" (i.e. aparecen
juntas cuando deberan ir separadas). En realidad, el modelo pre
sentado por Felsenstein es un caso en el que la causa ms probable
de similitud entre dos especies no es la ancestralidad comn. La
razn por la que los bilogos tienen tanto inters en estudiar filogenia
es que la filogenia se considera la mejor explicacin de los grados
de similitud observados; Felsenstein ha diseado un modelo en el
que esto no se cumple, y por lo tanto si se demostrara (Icmo!?) que
su modelo evolutivo prevalece en la naturaleza, ms que una razn
para no aplicar parsimonia, sera una razn para considerar a l
i
'

"
"
genealoga como de un inters secundario. Ello no obstante, exist "
una serie de mtodos destinados a producir genealogas bajo este
tipo de condiciones, conocidos como mtodos de maximum
likelihood (o "mxima verosimilitud"). Estos mtodos se basan en
asumir un modelo evolutivo dado (a veces con numerosos
parmetros), y calcular la probabilidad de obtener la distribucin de
caracteres observada en la prctica. Esta probabilidad normalmen-
te ser distinta para distintos rboles; aquellos rboles que -en con
juncin con el modelo elegido- hagan a los datos ms probables,
sern seleccionados.
Los mtodos de mxima verosimilitud se aplican principalmen
te al estudio de datos moleculares, y han tenido un renacimiento en
13
'ablo A. Goiohoff
los ltimos aos. Una de las crticas ms convincentes de los mode
los actuales de likelihood es la de Sidall y Whiting (en prep.).
Huelsenbeck (1997) reanaliz con likelihood una matriz de datos
de secuencias de ADN para rdenes de insectos; bajo likelihood,
dos grupos (Diptera y 5trepsiptera) que aparecan juntos bajo parsi
monia, aparecieron separados, y entonces este autor sugiri que el
resultado original (i.e. Diptera y 5trepsiptera juntos) era errneo por
que los grupos se conectaban mediante ramas largas. Sidall y
Whiting mostraron que si se reanalizan los datos con parsimonia,
excluyendo a Diptera, los 5trepsiptera aparecen en la misma regin
del rbol; el mismo efecto se observa cuando se excluye a
Strepsiptera. Las ramas largas no pueden atraerse cuando no estn
presentes en un anlisis, de lo que Sidall y Whiting concluyen que -
as como parsimonia podra a veces juntar artificalmente ramas lar
gas- los mtodos de likelihood usados actualmente pueden separar
arificialmente ramas largas que en realidad deben ir juntas. Sidall
y Whiting reanalizaron el problema agregando ms datos (ms ca
racteres y ms taxones), y los resultados de parsimonia se mantu
vieron bastante estables, mientras que 105 de likelihood cambiaron
mucho. Es decir, los resultados del reanlisis de Huelsenbeck cam
bian dramticamente cuando se agrega evidencia. En otro trabajo,
Sidall (en prensa) ha mostrado tambin con varios ejemplos y simu
laciones que as como bajo ciertas restricciones la parsimonia pue
de producir estimaciones equivocadas y el mtodo de likelihood
estimaciones correctas, bajo otras restricciones el caso es el inver-
.
h
.
,
so, produciendo likelihood estimaciones equivocadas y parsimonia
eS!1 maClones correctas.
En suma: los mtodos de likelihood producirn buenas estima
ciones de filogenia toda vez que los modelos evolutivos elegidos
sean los "correctos," pero si los modelos asumidos no se correspon
den con la realidad, las estimaciones producidas por mxima vero
similitud sern tan poco confiables como las de mxima parsimonia
-y es en general muy difcil saber si un modelo evolutivo es aplica
ble a un grupo dado o no. El criterio de mxima parsimonia tambin
es un mtodo de mxima verosimilitud, bajo ciertas condiciones -
esas condiciones generales son, en breve, que dada una similitud
entre dos especies, sea ms probable que se deba a ancestralidad
comn y no a paralelismo. Queel criterio de mxima parsimonia
PRINCIPIOS de CLAOSTICA
sea -bajo ciertas condiciones tambin un mtodo de mxima ve
rosimilitud es una dudosa ventaja; su poder explicativo parece una
ventaja mucho mayor. Como Farris (J 983) ha observado. 105 mto
dos de mxima verosimilitud presuponen que para estudiar evolu
cin, uno debe primero saber en detalle cmo opera la evolucin.
Farris -junto con muchos otros cladistas- sugiere que el camino es
en realidad el inverso: el conocimiento que uno pueda tener de me
canismos de evolucin. deber basarse en nuestros conocimientos
de filogenia. Nuestros conocimientos de filogenia, por ende, no de
bern presuponer un mecanismo evolutivo dado, siempre que sea
evitable, sino que deben estar basados solamente en observaciones
que puedan efectivamente hacerse en el presente. El uso de mto
dos de mxima verosimilitud representa, en cierto modo, un enfo
que filosfico diferente de la reconstruccin ilogentica. Este enfo
que est basado en la nocin de que slo mediante referencia a
modelos estadsticosprobabilsticos -que implican, por supuesto,
asumir una serie de cosaspuede hacerse ciencia. El enfoque
cladistico prefiere asumr menos y basarse ms en lo que la eviden
cia por si sola dice; es un enfoque -podra decirse- ms
estructuralista. Si bien ambos enfoques pueden tener ciertos puntos
de contacto, la controversia principal no est resuelta en forma de
finitiva. y es quizs uno de los temas ms discutidos en este momen
to.
I NfO R M ACi N
Y
CLASifiCACiN
Desde el momento en que se decide tratar de clasificar a un
grupo de organismos debe tenerse en cuenta cules son 105 objeti
vos que se persiguen. El objetivo discutido en la seccin anterior
era el de correspondencia con la filogenia del grupo, El requisito
que discutiremos en esta seccin es el que menos a menudo se aso
cia con la cladstica: el de permitir transmitir informacin sobre las
caractersticas de los organismos clasificados con la mayor efica
cia/eficencia posible. El tratamiento presentado aqu est tomado
pe
los trabajos de Farris (1977,1978, 1979a, b, 1980, 1982), que
constituyen el tratamiento ms completo del tema.
15
Pablo A. Golobofr
Una cl asi fi caci n no ti ene en s mi sma i nformacin acerca de
caractersticas, si no que l a tiene sl o a travs de l as di agnosi s aso
ci adas con los grupos defi nidos en la cl asi fi caci n, Ntese adems
que las diagnosi s no necesitan ser exhaustivas y es esto l o que l as
hace ti les, A cual qui era l e resu l tara mol esta una di agnosi s de
Drsophila melanogaster que di jera que "tiene al as, l as posteriores
reducidas a hal teri os, sei s patas, antenas, abdomen segmentado,
exoesquel eto, etc. etc." Todas esas caractersti cas se asoci an en
real i dad con l as di agnosi s de los grupos en los que Drosophila mela
nogaster est i ncl ui da (Drosophi l i dae, Di ptera, Insecta, Arthropoda,
etc), Basta saber que Drosophi/a me/anogaster es un i nsecto para
saber que tiene seis patas, y no hay razn para enunci ar esa condi
ci n en su di agnosis -sera total mente redundante, La di agnosis de
Drosophi/a melanogaster, de hecho, ser mxi mamente til cuando
i ncl uya slo aquel l as caractersticas que la diferencian de otras es
pecies del gnero,
No todas l as clasifi caci ones posibles, si n embargo, permi ti rn
confeccionar di agnosi s i gual mente breves, Por ejemplo, si Droso
phi/a melanogaster fuera cl asi fi cada dentro del Phylum Vertebrata
(separada de las' dems Drosoph/a), l a di agnosi s de Drosophila
melanogaster ahora s deber i ncl ui r todas l as caracterst icas que
era i nnecesario i ncl ui r cuando se l a cl asi fi caba dentro del gnero
Drosophila -ya que ni nguna de esas caractersticas se asoci a, ni
puede razonabl emente asoci arse, con l a di agnosi s de ni nguno de
los grupos en que Drosophila me/anogaster estara ahora conteni
da. En l a medi da en que una cl asi fi caci n permite que l as di agnosi s
asociadas con sus grupos sean breves, esa cl asi fi caci n si mpl i fi ca
r l a tarea de descri bi r l a diversidad biolgica, Esto nos da una idea
de cmo deberan el egi rse las posibles clasificaciones, En general,
un grupo de una cl asi fi caci n permi ti r transmi ti r i nformaci n sobre
una determi nada caracterstica en forma perfecta si se cumpl en dos
condi ci ones:
1) todas l as especi es que ti enen la caracterstica se encuentran
en el grupo.
2) todas las especies que estn en el grupo ti enen l a caracters
ti ca,
Cuando se cumpl en estas dos condi ci ones si n excepci n, se
puede asoci ar a caractersti cas y grupos de manera perfecta, Los
16
rR.NCiPIOS do ClAOSTICA
casos en que al gunas especies fuera del grupo ti enen los caracteres
que defi nen al grupo, son excepciones a la condici n (1); los casos
en que una especi e dentro de un grupo no tiene el estado que define
al grupo, son excepciones a l a condi cin (2). En l a medida en que
se mi ni micen las excepci ones a las condi ci ones (1) y (2), la cl asi fi
cacin ser ms i nformati va. Cuando no hay excepciones a l as
condi ci ones (1) y (2), se podr, por ejemplo, hacer enunci ados del
tipo "todos los ani males que al i mentan a sus cras con secreciones
maternas estn en el grupo Mammal a, y todos l os ani mal es que
estn en el grupo Mammal i a al i mentan a sus cras con secreciones
maternas" (ntese que ni nguna de l as dos afi rmaci ones i mpl ica a la
otra). Si para un grupo dado de una cl asificacin l as condiciones (1)
y (2) ci tadas arri ba no se cumplen para ni ngn caracter, el grupo no
es demasiado ti l , ya que no permi ti r hacer el tipo de afi rmacin
recin ejempl i ficado. Un grupo de una clasificacin es til enton
ces cuando todos sus miembros se parecen en al gunas caractersti
cas, pero adems difieren tambin en otras caractersticas de l os
dems grupos de l a clasi fi caci n. Si un grupo no ti ene ni ngn ca
rcter nico, su diagnosis no podr ser asociada con ni ngn carc
ter ni co, y la transmi si n de i nformacin acerca de caracteres po
dr hacerse con exactamente l a mi sma efi cienci a si se el i mi na al
grupo -el grupo es totalmente i nti l . Esto muestra que no al canza 1;
semejanza i nterna para justificar un grupo, si no que tambin es ne
cesari a l a diferencia con aquel las cosas no i ncl uidas en el grupo.
La di ferenci a es necesaria porque, si no, el agrupamiento no permi
ti r hacer afirmaciones del tipo "todos los que tienen el carcter X
se encuentran en el grupo Y." Ser en cambio necesario hacer refe
renci a a vari os grupos, lo cual indica que la capacidad de transmi tr
informacin de esa cl asi fi caci n sera menor. El grupo formado por
sapo+ratn+cabal l o+perro+ave comparte muchsi mas caractersti
cas (col umna vertebral , miembros pares, etc. etc.), pero si n embar
go sera un grupo total mente i nti l , ya que todas l as caractersticas
que comparen son tambin compartidas con muchos otros grupos,
y se asoci an en real i dad con Tetrapoda. Las caractersticas propias
de l os tetrpodos (es deci r, aquel l as que los diferenci an de olros
vertebrados) aparecern en la diagnosis de Tetrapoda, y como este
grupo superf l uo es un subgrupo de aquel , es obvi o que sus miem
bros tendrn esas caractersticas. Aquell os caracteres en los que
17
Pablo A. Goiobff
l os mi embros de un grupo se di ferenci an de taxa rel acionados son
las sinapomoras del grupo.
Queda por di scuti r el problema de l as jerarquas. Una clasifi
caci n se di vi de en grupos que a su vez se subdi vi den; caso contra
ri o, existiran solo dos grupos de seres vi vientes en el mundo, Es
cl aro que cual qui er subgrupo deber di ferenci arse de l os dems
miembros del grupo en al guna caracterstica (caso contrari o sera
un grupo superfl uo), y por lo tanto el grupo ser necesariamente
heterogneo para al guna caractersti ca. Di cho de otro modo: para
cual qu ier cl asi fi caci n de varios niveles habr caractersti cas que
no pueden asociarse perfectamente con un grupo de la cl asi fi ca
ci n. Supongamos que l os bi chos a cl asi fi car pueden tener 6 u 8
patas, y ser de col or bl anco o negro; los de 6 patas pueden ser bi
chos bl ancos y negros; l os de 8 son todos bl ancos. Si se di vi de a l os
bi chos en dos grupos de 6/8 patas, y a los de 6 en dos subgrupos
bl anco/negro, el color bl anco no podr asociarse di rectamente con
ni ngn grupo de la cl asi fi caci n; si se l os di vi de en dos grupos bl an
co/negro, y a l os bl ancos en 6/8 patas, l as 6 patas aparecern ahora
como no asoci adas di rectamente con ni ngn grupo (fi g. 4). En ca
sos como ste, puede si n embargo hacerse reerenci a al "comple
mento del grupo" (Le. todos los que no pertenecen al grupo) para
i ndi car l a caracterst ica alternati va. Es deci r, el grupo que tiene l a
condi ci n al ternati va no se encontrar di rectamente en l a cl asi fi ca
ci n, pero ser pos i bl e definirl o i nmediatamente mediante referen
cia a los grupos que s se definen di rectamente en l a cl asi ficacin.
En l a cl asi fi caci n de l a i zqui erda, para saber cul es bi chos son
bl ancos bastar decir "todas las especies no i ncl udas en el grupo
D;" en l a de l a derecha, para saber cul es bi chos ti enen 6 patas,
"todas las especies no i ncl udas e el grupo W." Dado que los gru
pos dentro de grupos (i .e. cl asifi caci ones de varios nivel es) son i n
evi tables, es inevitable que al gunas de las caractersti cas no estn
di rectamente asociadas a grupos, si no a sus compl ementos, y por lo
tanto consi deraremos que el poder descriptivo de una cl asi fi caci a"n
no se ve di smi nui do por hacerse de este modo, En consecuenci a,
ambas cl asi fi caci ones en l a fi g, 4 son mxi mamente informati vas
para los caracteres mencionados,
Una forma de evitar tener que hacer referenci a expl cita a los
grupos compl emento es, si mpl emente, transmi ti r la l ocal izaci n de
1 B
.

figura 4.
Grupo A
(8 patas ,
|
Sp. I
blanco)
Sp . .
Sp. 3
--
Grupo e
'
Sp .
(blanco)
Sp.
Sp.
Grupo B
(6 patas) Sp.
Sp.
Grupo O
(negro) Sp.
4
5
6
7
8
9

Grupo X
P" ,
6 patas)
Sp . 8
Sp . 9
G
SP. l
(S patas)
Sp. 2
Sp. 3
Grupo y
(blaco) ; Sp. 4
Sp. 5
Grupo Z
( 6 patas) '- Sp. 6
Pib,o A. Golobof
105 cambios en el rbol . En este caso es necesario i ndi car la condi
ci n que corresponde a l a raz ( hi pottica) del rbol , y l uego sl o l as
excepciones. Esto muestra ms claramente l a relacin con el cri te
ri o de parsi moni a y el conteni do de i nformacin de una cl asi fi ca
ci n; para un carcter dado, ser necesario transmi ti r tantas l ocal i
zaci ones (=nombres de grupos) como pasos ("derivaciones) tenga
el carcter en el rbol. El conteni do de informaCin para un conjun
to de smbolos vi ene dado por l a cantidad de smbolos que es nece
sario usar para transmi ti r un mensaje; mientras menos smbolos sean
necesarios, en promedi o, mayor ser el contenido de i nformaci n
por smbolo. En el caso presente, el mensaje es l a matri z de datos
con las observaciones, y 105 smbolos son 105 grupos de la cl asi fi ca
ci n. Por l o tanto, si transmi ti r completamente la informacin de
qu especies ti enen cada condi ci n observada (el mensaje) puede
hacerse medi ante referenci a a menos grupos (smbol os), es obvi o
que l a cl asi fi caci n ser ms i nformativa. Y l o que el cri teri o de
parsi moni a sel ecci ona es, exactamente, l a cl asi ficaci n que (para
todos los caracteres en conjunto) permite usar el m ni mo nmero
posi bl e de smbolos -o sea, la cl asifi caci n mxi mamente i nforma
ti va.
Respecto de l a predi cci n de caractersti cas no observadas
(cuntos l cul os tendr el ovario de esta especie de angiosperma
que nunca ha si do di secada todava?), es cl aro que en l a medi da
que una cl asi ii caci n se ajuste bien a un buen n mero de observa
ci ones real i zadas, ser esperabl e que se ajuste tambin a las futu
ras, y por lo tanto que permita hacer predicciones con menos erro
res. Descripcin, explicacin, y predi cci n, entonces, son caracte
rsticas que vienen j untas, Si el propsito de un i nvestigador no es el
de construi r cl asi fi caci ones que sean mxi mamente descri pti vas!
expl i cativaspredictivas, ci ertamente no hay ni nguna razn para que
el mtodo de cl asi ficaci n a usar sea el de parsi moni a. Si n embar
go, resul ta di f ci l i magi nar propiedades de una cl asi fi caci n que
puedan ser tan deseables como para sacrificar el poder expl i cativo
y descri pti vo en aras de el l as . . .
20
Ejemplos
PRINCIPIOS de CLAOSTICA
| v A | u A C | O O |
C | A | | | C AC | O |
Eval uar una cl asifi caci n, segn se vio, requiere que se mi da
el nmero de derivaciones i ndependi entes de condici ones si mi l ares
i mpl i cadas por l a cl asi fi caci n - lo que es l o mi smo, el nmero y
l ocal izacin de l os cambi os que deben i ndi carse para descri bi r com
pl etamente l a di stri buci n del carcter. Cul es cl asi fi caci ones sean
consi deradas como las mejores depender, en l ti ma i nstanci a, de
todos los caracteres al mismo tiempo, pero cada carcter es evalua
do i ndependientemente de los otros, sumando l uego l os val ores to
tal es para cada carcter. Esto puede hacerse para cual qui er rbol ;
de entre todos l os rboles posi bl es, aquel l os que requi eran menos
cambios deben preferi rse. A esto se reduce toda la base del mto
do cJadstico.
Determi nar el n mero de deri vaci ones requeri das por u n rbol
a veces no es senci l l o. Dada una seri e de especies y un carcter
cual qui era, vaJias especies tendrn un estado o condiCIn ( l I ammos
le X) y otras el estado al ternativo (y). Supongamos el rbol de la fig.
5 para al gunos ani mal es y pl antas (con sus nodos i nternos numera
dos). A cada nodo i nterno puede asi gnrsel e un estado (los de l os
termi na les estn fijos, dados por l as observaci ones), que es el que
Figur
a 5.
Eucalyptus X
Solanum x
'-1
--8
'- 7
Opuntia X
Pinus X
Drosophila
3
Triatoma Y
6
G
Y
Cania
4
Felis
" 1
Y
y
Y
figura 6,
ex
'-7X
P3Dlo A, Goloboff
Eucalytus X
Solanum X
Opuntia X
Pinus X
Drosophila y
.
..-3 Y
Triatoma y
'-6Y
Canis y
FeliS Y
caracterizara al grupo correspondiente a ese nodo (ii g, 6) , Ntese
en l a fig, 6 que" en todos los casos, a cada nodo se asign el mi smo
estado que a su ancestro, excepto al nodo 6; en la rama de 7 a 6 hay
cambi o (o paso) del estado X al Y. Al nmero de pasos para todos
Llos caracteres de un rbol se le l l ama el largo del ri
Para el rbol de l a lig. 5 no es posible asi gnar estados a los
nodos internos de manera que haya menos cambios que en l a fig, 6;
un paso es el nmero de cambios mni mo requerido por el rbol
para ese carcter. Podra por supuesto asignarse estados de manera
que haya ms cambios. Por ejemplo, si se asignaran estados como
se muestra en l a lig. 7 habra cambios a lo l argo de las ramas que
dan a los nodos 2, 7, 3, Y 5, Y tambin a Eucalyptu5, Solanum, Opuntia,
Pinus, Dro50phila, Tiaroma, Bufo, Canis y Felis; 1 3 cambios en to
lal . Ntese que l a asignacin anterior -la de un solo cambio- es l a
que asoci a a l a condiCin y con el grupo 'ani mal es' y a X con su
compl emento ("todas las cosas del grupo 'ani males' ti enen Y; todas
las cosas que tienen Y son 'ani males;' todas las cosas obseradas
excepto los 'ani males' tienen X; ni nguna de las cosas que tienen X
son 'ani mal es'''). El complemento de 'animal es: o sea, 'plantas: no
recibe nombre di rectamente en la clasificacin, ya que no es ni n
gn grupo defi ni do (=monofilti co) en esa cl asi fi caci n, La asi gna-
2 2
Fiura 7.
PRINCiPIOS de ClAOSTICA
ex
'
-- 7Y
Eucalytus X
S
olanum X
Opuntia X
Pinus X
Drosophila
3X
Triatoma Y
6Y
Y
Can1s
Felis
Y
y
Y
cin de un solo cambio se dice que es "ptima" -no puede deci rse
lo mi smo de la segunda asignaci n. En el caSO de l a segunda asig
nacin, el grupo 'animales' aparecera aSoCdo con la condicin Y,
pero no as 105 grupos Drosophila+ Triatoma, Bufo+Canis+Fels, y
Canis+Fels, que estn asociados con la condi ci n X, pese a que
todos sus mi embros tienen Y. Es claro que l a primera asignacin es
preferi bl e.
.
En j erga flogentica, dada l a genealga de l a fig. 5, la mejor
expl i cacin de la distribucin del carctel (fig. 6) es que la condi
cin original -la de l a raz- era X, y que en el ancestro comn de
todos los ani males esa condi cin cambi a Y, si n haber revertido
nynca. Todos los ani mal es por lo tanto se asemejaran e l a condi
ci6f Y por haberJa heredado de un ancestro comn; l o mismo es
cierto para las plantas y la condicin X. Todas las si mi l i tudes en
condiciones X e Y son entonces explicadas completamente por el
rbol mostrado; no hay ni nguna si mi l itud que no pueda expl i carse
por ancestral i dad. Ntese que la causa comn invocada, ancestra
lidad, podra tambin ser cual qui er otra causa; el grupo 'animales'
prmite considerar que l a si mi l itud en todas l as especies que tienen
Y se debe a la mi sma causa, sea esa la causa que sea. Esto permite
una buena definicin de homologa; se pueden considerar homlogas
23
figura 8.
8
'-7
roblo A. Golobf
Solanum X
Canie y
Opuntia X
,-
3
Drosophila Y
Triatoma Y
'-6
Pinus X
Felie Y
aquel l as si milildes que puedan trazarse a un nico nodo. En reali
dad, el que dos condiciones sean homlogas no es algo observable,
si no algo sobre l o que se hace una hiptesis; la coincidenci a en l a
condicin Y de todos l os ani males es homologabJe. A aquel l as co
i nci dencias que no puedan homologarse (i .e. que slo puedan tra
zarse a distintos nodos) se las l l ama homoplsicas.
Ahora bien . . . el caso mostrado es simple. los hay ms compli
cados. Por ejempl o, si el rbol hubiera sido el de l a fig. 8 l a mejor
asignacin de estados (la que produce el nmero m ni mo de cam
bi os para dicho rbol ; l a que permite l as mejores diagnosis de l os
grupos de ese rbol; l a que dado ese rbol considera la mayor can
tidad posibl e de simil itudes como debidas a causa comn) habra
requerido 3 cambios, en l as ramas que dan a Canis, nodo 6, y Pinus
(como se muestra en la fig. 9). As, transmitir compl etamente l a
distribucin del carcter requerir que digamos "l a condicin X se
encuentra en todas las cosas observadas, excepto en Cani.> y ex
cepto en los mi embros del grupo 6 que no son Pinus, que tienen Y."
Esto requiere expl icitar 3 casos de excepciones. Contrstese esto
con el enunci ado ms simpl e que permitira la cl asificacin de l a
2 4
" \
Figura 9.
PJI NClPIOS de CLADiSTlCA
Solanum X
Canis y
ex
Opuntia X
'-
7X Drosophila Y
Triatoma Y
,.3Y
L.6Y
y
Pinus x
Felis Y
Hg. de una sola excepci n: "l a condici n X se encuentra en todas
l as cosas observadas excepto en los 'ani males' (grupo 6), que ti enen
Y." En concordanci a con su meor poder como vehcul o para trans
mi t i r i nformacin sobre l as caractersticas observadas, el rbol de l a
fig. 8 permite expli car l as si mi l itudes observadas mucho peor que el
rbol de l a fig. 5. La si mi l i tud en l a condi ci n Y entre Canis y otros
ani males, o en X para Pinus y otras pl antas, no es expl i cada por la
cl asi fi cacin, es deci r, no puede atribuirse a causa comn al . mi smo
ti empo (si de a una, pero slo explicando peor l as si mi l i tudes en l as
otras condi ci ones). Hay por lo tanto 2 casos de si mi l i tudes que no
pueden ser explicadas por la cl asi ficacin de la lig. 8, mi entras que
no hay ni nguno segn l a clasificaci n de l a fi g. 5. la cl asi fi caci n
de la fi g. S no requiere ni ngn paso extra (Le. pasos ms al l del
mni mo que se puede requeri r para el carcter, en este caso 1 ), l a de
l a 7 requi ere 2. Como ya se di jo: en l a medi da en que una cl asi fi ca
ci n requiera ms y ms pasos extra, ser porque hay ms y ms
casos de si mi l itudes que no est permitiendo expl i car mediante causa
comn.
25
Pablo A. Goloboff '
CON S ECU E NCI A S
D E l
C R I T E R I O
D E
P A R S I MON I A
El cri teri o de parsi moni a l leva a agrupar por si napomorfas, es
deci r, por caracteres nicos. Una de l as i mpl i caciones poco i ntui ti vas
es que, dadas dos condi ci ones alternativas de un carcter, sl o una
de l as dos condi ciones defi ni r un grupo, y ser consi derable como
si napomorfa; l a otra aparecer automti camente como una
pl esi omorfa, y por lo tanto no defi ni r nada. La clasi fi caci n "cl
si ca" abunda en ejemplos de grupos defi ni dos por l a condi ci n opues
ta de l a encontrada en su grupo al ternati vo: vertebrados vs .
i nvertebrados, repti l es vs. aves, apterygota vs. pterygota, gymnos
permas vs. angiospermas, di coti l edneas vs. monocotiledneas. En
cada uno de esos ejemplos, uno de l os dos grupos se hace i nmedi a
tamente sospechoso, desde el punto de vista cl adstico .. Un grupo
como "apterygota" (i nsectos si n al as: colmbolos, pececitos de pla
ta, y al gunas bestezuel as semejantes) no est en real i dad defi ni do
por nada nico,. si no por no tener l os caracteres cl arsi mos que den
nen a su grupo alternativo -Pterygota, i nsectos alados. Anl i si s ms
detallados han encontrado que, en real i dad, hay algunos caracteres
nicos compartidos por los pteryogta y al gunos apterygota. Por l o
tanto, si se conserva el grupo "apterygota" sl o para poder asoci arlo
con l a ausenci a de alas, se perder la capacidad de transmi ti r i nor
maci n sobre esos otros caracteres nicos -y la informaci n acerca
de qu organi smos carecen de al as, en real i dad, no podr
transmiti rse mejor que antes; en ambos casos, slo es necesario enun
ci ar que "carecen de al as (torcicas) todos l os seres vi vi entes ex
cepto los Pterygota." Adems, la cl asificaci n no ser geneal gi
camente correcta: esas si napomorfas de al gunos "apterygota" y
Pterygota muestran que esos "apterygota" comparten con Pterygota
un ancestro comn no compartido con l os dems "apterygota." La
sol a carenci a de alas (al igual que cual qui er pl esi omorfa) nunca
debi haber si do consi derada como un argumento para agrupar a
l os i nsectos si n alas; investi gaci ones futuras podran haber mostrado
que s existan si napomorfas para "apterygota," y que "apterygota"
era un grupo l gi camente justificable -pero no haba ni nguna evi -
26
,
figura 10.
PRINCIPIOS de CLADSTICA
EucalYt
.
us
solanum
Opuntia
-- Pinus
Drosophila
Triatoma
'- Bufo
Canis
Felis
dencia positiva que permitiera saber s esto era ms probable que lo
que realmente se encontr.
Esto podra haberse aplicado tambin al ejemplo de la fig. 5:
muchos de los grupos en ese ejemplo son superfluos, ya que no hay
(mostrada en la figura, al menos) ninguna sinapomora para ellos.
El nico grupo de la fig. 5 que s est justificado (dada la observa
cin de que algunas especies tienen la condicin X y otras la y) es
el de 'animales;' por lo tanto, cualquier resolucin de la politoma
de la fig. l O en realidad habra sido igualmente til y correcta como
clasificacin; la sola observacin de qu especies tienen la condi
cin X y cules la Y no provee ninguna evidencia de que 'plantas'
sea un grupo, O de que algunas 'plantas' estn ms emparentadas
con los 'animales' que con las dems 'plantas.' Esta politoma sim
plemente deja el problema de las relaciones entre 'plantas' abierto,
Incluso si uno hubiera conocido 1 000 caracteres con una distribu
cin idntica a la del carcter mostrado ( Le, con un estado en
Eucalyptus, So/anum, Opuntia y Pinu5, y el estado alternativo en
Drosophila, Triatoma, Bufo, Can;s y Fe/isJ las cosas no habran sido
diferentes. Lo que es ms, dados esos 1 000 caracteres, habra bas
tado encontrar un slo carcter adicional que tuviera un estado dado
en los animales y en Pinus, y el otro en todas las plantas excepto
Pnus, para que la mejor clasificacin de este conjunto de taxones
hubiera sido como en la fig. 1 1 . Si bien intuitivamente puede pare
cer que ste es un caso de conflicto, donde 1 000 caracteres propo-
2 7
Figura 1 1 .
Pablo A. Goloborf
Eucalytus
Solanum
opuntia
Pinus
Drosophila
Triatoma
Bufo
Canis
Felis
nen una di vi si n, y I sol o carcler propone un grupo i ncompatibl e
con esa di vi si n, esto no es as: todos esos caracteres son perfecta
mente congruentes desde el punto de vista cladstico. Puede darse
cuenta de el l os con mxi ma efi caci a (Le. con un slo paso) al mi s
mo ti empo en una sol a cl asi fi caci n. Adems, dados esos 1 001 ca
racteres, l a cl as'ifi caci n de l a fig. 11 sera capaz de expl i car por
ancestralidad comn todas las si mi l i tudes observadas.
Esto permite revi sar tambin el ejemplo de la fig. 4. Las dos
cl asi fi caci ones presentadas al l no son las ni cas mxi mamente i n
formativas. Por ejemplo, ser igual mente informativa cual qui er re-
Sp. 1
Sp . 2
8 patas
S
p. 3
blanco
Sp. 4
Sp. 5
Sp. 6
Grupo A
( 6 patas)
Sp.
7
Sp. 8
Figura 1 2.
Grupo B
(negro) Sp. 9
.. "
PRINCI PIOS de CLADSTICA
sol uci n del rbol de la fig. 1 2 (entre las cual es se cuenta la fig. 4
i zqui erda). Cual qui er resolucin de la fig. 1 2 permi ti r deci r tan
faci l mente como la fig. 4 cules especies tienen col or bl anco o ne
gro ("son todas bl ancas, excepto l as del grupo B, que son negras") y
cul es tienen 6 u 8 patas ("tienen 8 patas todas, excepto l as del gru
po A, que tienen 6"). Esto puede hacerse pese a que ni el col or
bl anco ni l a presencia de 8 patas aparecen asociadas di rectamente
con ni ngn grupo (al menos, no e todas las resoluciones de la fi g.
1 2). Segn la clasificaci n de l a fig. 1 2, estas caractersticas (col or
bl anco, 8 patas) que se asocian sl o con grupos complementari os
son plesi omorfas.
AG R U P AM I E NT OS
P O R
S I M I LI T U D G LO B AL
A pri nci pi os de los aos '60 se empez a hacer conocido un
mtodo de cl asi fi caci n que se conoci como "fentico" o de
l/taxonoma numri ca. /f El trmi no de l/taxonoma numri ca" no es
totalmente apropiado para esta escuela, ya que cual qui er criteri o
de cl asi fi cacin puede expresarse medi ante nmeros, i ncl uso el cri
terio cl adstico.
Parece ms adecuado habl ar del mtodo fentico; este mtodo
consi ste en agrupar las cosas que son ms parecidas, en trmi nos
de parecido gl obal . Esto l leva a consi derar que ambos estados de
un carcter son siempre razn para tratar de hacer dos grupos -no
uno slo, como en el mtodo cladstico. A fines de la dcada del ' 70
el mtodo fentico comenz a caer en desuso en si stemtica. En l a
actuali dad, se si guen usando tcnicas fenticas en ecologa, en psi
cologa, en medi ci na, etc., donde su uso puede tener justi ficaciones
y propsitos di stintos que en clasificacin bi olgi ca. El propsito
explcito persegui do por los feneticistas que aplicaron el mtodo en
cl asi fi caci n biolgi ca era el de tener cl asi fi caci ones ms i nforma
tivas y que permitieran una mejor descripcin de la di versi dad.
Daremos aqu sl o l os aspectos bsicos del mtodo fenti co.
La si mi l itud S entre taxones puede cuantificarse como l a suma de
l as si mi l itudes en cada uno de los caracteres observados; para esto
29
PablO A. Goloboff
existen vari os coef i ci entes. Luego se forman rboles, donde se j un
tan l as cosas ms s i mi l ares; estos rboles constituyen una represen
taci n de l as si mi l itudes relativas de las especies i ncl udas, y se' los
conoce como feno
g
ramas. Para cada grupo se puede i ndi car el ni
vel de s i mi l i tud que representa; esto se conoce como niveles de
ligamiento. La si mi l itud S' i mpl icada por un fenograma para dos es
peci es cual esquiera ser la del ni vel de l i gami ento del grupo mni
mo que l as contenga. Normal mente, no ser posi bl e construi r un
fenograma tal que l as si mi l i tudes i mpl i cadas (5') sean i dnti cas a las
observadas (S), para todas las especies si mul tneamente. Cuanto
ms grandes sean estas di ferencias, mayor ser l a di storsin de las
medidas de si mi l i tud ori gi nal es; se prefiere, en general , fenogramas
con menor di storsi n. Este cri teri o puede producir resultados di st i n
tos a los del mtodo cladsti co: agrupar l as cosas ms parecidas no
necesari amente resul ta en cl asi fi caci ones que tengan el mini mo
nmero de deri vaci ones i ndependi entes de caractersti cas si mi l a
res. Un ejempl o cl si co es el del grupo Repti les; 105 Cocodri l os y
l as Aves forman u n grupo monofi l tico, y comparten varios caracte
res ni cos !cui dad, parental , corazn de cuatr cmaras, vocal i za
ci n, etc.) que no se encuentran en otros Repti l es (Escamados y
Quel oni os). Si n embargo, l os Cocodri l os son i ndudabl emente ms
parecidos a l os dems Repti l es que a l as Aves, y entonces seran
i ncl udos en los Reptiles segn el criterio fentico.
Desde un punto de vi sta cl adsti co, todas las caractersti cas
compartidas por Cocodrilos, Escamados y Quel oni os, se asoci arn
con l a di agnosi s del grupo que i ncl uye a Escamados, Quel oni os,
Cocodrilos y Aves (Amni ota, que i ncluye tambin a Mamferos); para
saber cmo es cual quiera de el l os respecto de esas caractersticas
basta saber que es un Amni ota. El colocar a Cocodri l os y Aves en
un grupo aparte ti ene la ventaja de que los varios caracteres ni cos
menci onados ms arriba pueden asoci arse con l a di agnosi s de ese
. grupo; cosa que no podra hacerse si se reconoce un grupo "Repti
les" en l a cl asi fi caci n -s deci r, si no se coloca Aves y Cocodri l os
ms cerca unos de otros que de Escamados y Quel oni os. La cl asi fi
caci n fenti ca reconoce como grupo a Repti l es sl o por su si mi l i
tud i nterna, pero ese es un grupo para el que no se puede encontrar
ni nguna diferencia con grupos relacionados.
la taxonoma evol uti va propona hacer cl asi fi caciones de ca m-
30
PRlNClPlOS de CJAoSTICA
promiso en los casos en que l a i nformacin de f logeni a y la de pa
reci dos globales estuvieran en confli cto -como sucede en el caso
de Reptiles y Aves. No exista (a di ferenci a del mtodo fentico)
u
na formal i zaci n matemtica de este mtodo; en cada caso, deba
apl i carse el cri teri o del taxnomo para decidi r si se daba ms i m
portancia al aspecto fentko o al cladstico, y entonces este mto
do fue -con justi cia acusado de ser muy subjetivo. Adems, al ser
la cl asi fi cacin resultante una especie de hbrido, era imposi bl e sa
ber cunto de cada uno de l os componentes -fentico o cladstico
se haba usado para justificar un grupo. Ms al l de estos proble
mas, tambin estaba equi vocada la misma idea que se usaba para
justi fi car la necesidad de establecer cl asi ficaciones que fueran un
compromi so entre genealoga y si mi l itudes. Es deci r, l a i dea de que
una cl asi fi caci n que agrupara las cosas ms simi l ares sera la ms
i nf ormativa de si mi l i tudes y di ferenci as.
Dado que se vio que el pri nci pi o de parsi monia se puede deri
var en real i dad de l a idea de tener cl asi fi caci ones mxi rnamente
descriptivas y expl icativas, resultar poco sorprendente a esta altu
ra el que los otros mtodos de cl asi ficacin propuestos no logren
cl asificaciones que permitan transmi tir la i nformaci n contenida en
l a matriz de datos en forma ms eficiente que el mtodo cl adstico.
Los gru pos de organismos que no comparen ni nguna caracterstica
ni ca, por ms pareci dos que sean sus componentes, no aumentan
en modo al guno l a capacidad de l a cl asi ficacin para transmi t i r i n
formaci n. En tanto se modi fi que un rbol de mxi ma parsimonia
. para que se "ajuste" mejor a los datos al respetar si mi l itlldes global es,
se estar di smi nuyendo la efici enci a con que el rbol permi te trans
mit i r i nformacin acerca de los datos.
Mucha gente pi ensa que una ventaja del mtodo fentico es su
formal i zaci n, pero esto no constituye en real i dad una di ferencia
con el mtodo cl adstico -que tambin est muy formalizado, Asi
mi smo, se cree a menudo que el mtodo fentico es menos especu
l ativo, y para apl i carl o slo se requiere observar las semejanzas y
diferenci as entre l os organismos. Una de l as creencias i njusti fi ca
das muy comunes ti ene que ver con esto: una clasifcacin fentica
sirve como una primera aproximacin a la c1asificcin de un gru
po dado, y trabajos posteriores sern cada vez ms filogenticos.
Esta creencia viene junto con la creenci a de que el mtodo cladfstico
3 1
Pablo A. Golobof
puede apl i carse sl o en ciertas condi ci ones (como por ej . , cuando
se conocen l as pol ari dades; ver secci n si gui ente). En real i dad,
apl i car el mtodo cl adstico tampoco requiere ms que l a observa
ci n de semej anzas y diferencias entre los bichos: a cual qui er ma"
triz de datos se l e pueden apl i car al goritmos fenticos o cl adsticos.
los comentarios hechos hasta ahora se refieren a l a transmi
si n de i nformacin sobre caracteres; los feneticistas resuman l as
semejanzas de l os organi smos en medi das gl obal es de di ferencia o
di stanci a. Si se puede derivar l os datos de caracteres i ndi vi dual es
efi ci entemente, es l gi co esperar que tambi n se pueda deri var
eficientemete l os datos de distancia, pero l a comparacin de i nfor
maci n de datos de di stanci a puede hacerse tambin en una forma
un poco ms tcnica. En pri nci pio, teniendo como dato l as di stan
ci as gl obal es se puede deri var de el l as una medi da anl oga a l a
cantidad de si napomorfas. Dadas dos especies A y B, Y un taxn
de referencia R (al que hi potticamente se puede considerar como
teni endo los estados ancestrales, aunque esta consideracin puede
obvi arse), la comparacin de las distancias entre las especies y el
taxn de referencia dar una medida de la cantidad de caracteres
para los que A y B son si mi l ares entre s y di stintas de R. Esto es, una
medi da (E) de l a canti dad de si napomorfas compartidas por A y B, Y
se calcul a como E = 1/2 (o,,+o -o,s) (donde o
AK
es la di stanci a
de A a B). E es una medi da de si mi l itud especi al o si mi l i tud en
caracteres derivados; dada cual qui er matriz de di stancias s puede
cal cul ar fci l mente, a partir de sta, la matri z de si mi l itudes espe
ci al es. luego, se puede usar esta matriz de si mil i tudes especi al es
para agrupar (como en el mtodo fentco, pero en real idad E es
si mi l i tud comparti da en si napomorfas); l os ni veles de li gamiento
i ndi carn en este caso la si mi l itud especi al i mpl i cada por el rbol ,
E'. Cuando se hace esto, l os "fengramas" (cladogramas) obtenidos
presentan siempre una di storsin de l as distancias ori gi nal es mucho
menor que l a de l os fenogramas obtenidos por medi os fenticos con
vencionales (l as di stancias i mpl icadas por el rbol no se obtienen
di rectamente en este caso, si no que se las deriva de las si mi l i tudes
especiales i mpl icadas, E'). El mtodo puede generalizarse ms an
(i ndependizndose del uso de un taxn de referencia, y permiti endo
reversi bi l i dad, cosa que el uso de E impide -ver Farri s, 1 979) si se
asi gna largos a l as ramas del rbol en forma tal que l as desviaciones
entre las di stanci as observadas y l as i mpl icadas por el rbol sean
3 2
PRI NCIPIOS de CLADSTICA
mni mas. Farris (1 979, 1 981 ) presenta una discusin detal l ada de
estos argumentos. Esto no quiere decir que las observaciones de
una matriz de datos deban siempre convertirse a distancias y luego
a si mi l itudes especi al es ruti nari amente; existen varios problemas con
los datos de di stanci as en s que no son superados por este trata
mi ento (huel ga decirlo: ms lejos est an de superarlos el trata
mi ento fentico). En suma: i ncl uso en el dudoso caso de que deba
hacerse uso de datos de di stanci a y no exista ni ngn i nters en l a
genealoga, l a mejor manera de representar l a informacin origi nal
de di stancias no es producitdo agrupaciones por si mi l i tud gl obal
como en el mtodo fentico- si no por si mi l itud especi al -como en
el anlogo del mtodo cl adstico.
Si bien el mtodo fentico no fue propuesto ori gi nal mente con
l a i ntencin de reconstrui r filogenias, ha si do usado para ese prop
sito por varios autores. Bajo ci ertas condiciones evolutivas, el m
todo fentico puede producir genealogas correctas. Esto suceder
cuando la tasa de evol uci n sea constante a lo l argo de todas las
ramas del rbol (en particular: que la cantidad de evol uci n desde
un ancestro dado a cual quiera de sus descendientes sea la mi sma).
los defensores del reloj molecular (muy en boga en los aos '60,
ahora en desuso) sostenan que la evolucin de muchas mol cul as
se hada efectivamente de esta forma constante, y que l as canti da
des de diferencias adems permitan dar una datacin cronolgica
absoluta de cada grupo. Si bien la tasa de evolucin puede perma
necer ms o menos constante en algunos casos, es evidente que
esto no se cumple si empre, y menos para caracteres morfolgicos.
Parece bastante evidente que ha habido velocidades de evolucin
radi cal mente di sti ntas en las lneas evolutivas que l l evan al ginkgo
y a l as orqudeas, o a aves y celacantos. Si el "reloj molecular" ha
de tener el status de una hi ptesis ci entfica, es obvio que deber
estar sujeto a posibles tests empricos. Tales tests empricos slo
pueden provenir de las conclusi ones obteni das medi ante mtodos
'que no presupongan nada acerca del reloj molecular. Es decir, si
las conclusiones mejor apoyadas por la evidenci a (y si n asumi r l a
exi stencia de un reloj molecul ar) muestran tasas constantes de evo
l uci n, la hi ptesis del reloj se vera apoyada por la evidencia (esto,
en real i dad, no sucede: l a evidencia disponi bl e permite descartar l a
exjstenci a de un reloj mol ecul ar uni versal ) . Las concl us i ones
genealgicas mej<Y c. poyadas por l a evidencia son obtenidas siem-
33
Pablo A. Golobo((
pre, como ya se vio, mediante la aplicacin del criterio de parsimo
nia. Para l os casos en que los datos disponi bles estn como di stan
ci as (y el criterio de parsimoni a no sea entonces aplicable), es posi
bl e utilizar 105 mtodos descriptos ms arriba (los que se basan en
buscar los rboles donde los l argos de ramas sean tales que las dis
tancias i mplicadas y l as observadas difieran tan poco como sea po
si ble), que no asumen una tasa constante de evolucin, y son por l o
tanto preferi bles a cualquier mtodo fenti co. Hay varios algori tmos
aproximados para esto (Distance Wagner Trees, de Farris, 1 972, y
Neighbour Joining, de Saitou y Nei, 1 987, son dos muy conocidos).
Pese a obviar. el problema de l a constancia de tasas evolutivas, es
tos mtodos tienen (como ya se i ndi c) varios probl emas concep
tuales, y sus resultados y premisas no si empre son consistentes y
lgicamente interpretables (Farris, 1 981, 1985).
En resumen: el mtodo fentico, en realidad, estaba basado en
objetivos muy l oables, pero los defensores del agrupar por similitud
global nunca haban deducido a partir de su objetivo principal
("cl asi f i caci ones mxi mamente descri pt i vasexpl i cati vaspre
dicti vas") un mtodo que se siguiera como consecuencia lgica. La
cl asificacin que' se deriva l gi camente de l os objetivos de los
fenetici stas es, en realidad, una clasificacin cladstica.
POL ARI DAD
Y
ENRAIZAMIENTO
Los ejemplos mostrados anteriminente, de asignar estados a
l os nodos internos (o "ancestros hi pteticos"), sirven tambin para
mostrar cmo un anli si s cladstico no requiere una determinacin
a priori de la polaridad. Suele descri birse al mtodo cl adstico como
el mtodo de agrupar por si napomorfas, requiriendo que se sepa de
antemano cul condicin de cada carcter es "primitiva" (plesio,
mrfica) y cul "derivada" (apomrfica). La polaridad sera enton
ces el sentido en que una condi cin se transforma en la otra: A->B
B->A? En esto se basa una de las crticas ms comunes al mtodo
cl adstico: .. . el mtodo es difcil de aplicar porque la determina
cin de la polaridad es muy difcil, o arbitrada." la crtica es i rrele
vante porque el mtodo no requiere que la polaridad se determine
34
\
I I
PRINCIPIOS de ClADISTICA
de antemano. La apl icacin del criterio de parsimonia no requi ee
de polaridad o direccin. En l os casos anteriores, se pudo asignar
estados a 105 nodos i nternos (ancestros hi potticos) basndose tan
sol o en la distribucin de esos estados en l os terminales Incl udos en
el rbol --es decir, si n consideracin de cul estado es apomrlico y
cul plesi omrfico. En la fig. 6, por ej., el estado que ms razona
bl emente puede as'gnarse al nodo 6 es el Y, y a su ancestro el X;
dado ese rbol y esa di stri buci n de estados X e Y, la mejor explica
cin de l a distribucin del carcter es que cambi del ancestro hi
pottico 7 a l 6; es decir, que el carcter es una si napomorfa del
grupo 'animales: Ntese que el rbol podra haberse di bujado con
su raz (nodo 8) ubi cada, no entre los nodos 2 y 7, si no entre cual
quiera de l as 2N-3 ramas del "retculo" (donde N es el nmero de
termi nales; para 3 terminales hay 3 ramas, al agregar un taxn se
agregan 2 , o sea 5 ramas; para 5, 7, etc). Por ejemplo, ubicar la
raz entre 105 nodos 4 y 5 dara por resultado el rbol de l a fig. 1 3. El
retcul o es exactamente el mismo en l os dos casos, aunque l os rbo
les son distintos: tienen di sti nta "direccin." Las asignaciones de
estados a 105 nodos i nternos equi val entes, si n embargo, siguen sien
do exactamente las mismas '. El nodo 7, por ejempl o, sigue teniendo
como asignacin ptima X, y el nodo 6, Y. Los grupos definidos en
cada caso son di ferentes; en el rbol de lig. 5, los ani males eran un
grupo monofi ltico, en el de lig. 1 3, l o son las plantas. Ntese que
segn el rbol de lig. ] 3 , la si napomorfa de 'plantas' es un cambi o
y->X en el carcter (en l ugar de X->Y como era antes). Lo que
determi na l as sinapomorfas de cada grupo es entonces, en lti ma
i nstancia, el rbol que se tenga; di stintos rboles podrn i mpl i car
di stintas sinapomorfas para un mi smo grupo. Pero siempre, dados
N terminales, habr 2N-3 ramas donde enraizar (si n ni ngn grupo
en comn a todos los enraizami entos posi bl es). Es aqu donde radi
ca el problema de determi nar l a direccin de un anl i si s cl adstico,
a nivel de todo el rbol, y no a ni vel de los caracteres i ndivi duales.
Cmo se puede hacer esto? Pues bien, si se elige uno o ms taxones
de fuera del grupo en cuestin, se sabe que la raz deber estar ubi -
lSern las mismas toda vez que los costos de transformacin entre estados sean smt r'lco5
cuando los <05to5 de transfrmacin son asi mulcos, e posible que algunas asignacionls
de estados a los nodos Intrnos cambien al cambiar la ubicacin de la raz_
35
rabio A GolobofC
Canis y
..4
y
Felis y
BY
Bufo Y
L.5Y
,--
3Y
L-6Y
figura 13.
Drosophila y
Triatoma Y
Pinus X
Eucalyptus X
Solanum X
opuntia X
cada entre ese o esos taxones, lo cual automticamente determi na
r l a di recci n entro del grupo que nos interese resol ver. Los
axones externos, en' el anl i si s de parsi moni a, se ubicarn entre l os
nodos del retculo correspondi ente al grupo en estudi o (o "grupo i n
terno") de acuerdo a los estados de carcter que presenten. La cues
ti n de l a polari dad se resuelve entonces agregando taxones a nues
tros datos, en forma tal que se agregue al menos un taxn que se
sepa que ha de quedar por fuera del grupo. Esto es en real i dad
bastante si mpl e; por ejemplo, en un anl i si s de l a fami l i a Droso
phi l i dae (que sabemos que no i ncl uye a los tabnidosl se puede ele
gir para enraizar a cual qui er tabni do. Tambi n podra elegi rse,
para enraizar, a un pez o a un protozoo, lo cual sera, desde el punto
de vista terico, tan correcto como elegir un tabnido. Sin embargo,
la uti l i dad prctica de el egi r esos grupos tan alejados y di st i ntos,
como peces o protozoos, sera bastante reduci da, ya que tendran
numerosas entradas faltantes o muchos caracteres que son di fci l
mente comparables, y por l o tanto agregaran muy poca i nforma
ci n a la matri z, El taxn "raz" podr flotar en varas ubicaci ones
alternativas de nodos del retcul o, y el lugar donde debe enraizarse
el rbol no quedar determi nado i nequvocamente, Por lo tanto, es
si empre preferi bl e el egi r para el enraizamiento taxones que se sepa
36
PRINCIPIOS e ClAOSTlCA
que deben quedar por fuera de nuestro grupo, pero lo ms cercanos
posibles al grupo.
Es otra creencia comn la de que una de las cosas que debe
asumi rse para hacer un anl i si s cladstico es que el grpo en estudio
(o "grupo i nterno") es monofiltico. Esto no es estrictamente ci erto.
Si se i ncl uye una sola especie que se cree externa al grupo y se
enrai za el rbol resultante en forma que esa especie quede por fue
ra, es i mposible qlje el grupo interno no aparezca como monofi l tico.
Pero cuando se incluyen varias especies que se creen externas a]
grupo, y se consideran tambin los caracteres que permitan resolver
las relaciones entre esas especies, el caso es di ferente. Ahora s
ser posible que el grupo i nterno no aparezca como monofiltico,
es decir, para ciertos resultados posibles no habr ni ngn lugar don
de enrai zar el rbol y que el grupo interno resulte monofiltico. El
anl i si s ahora puede potenci almente i ndi car no monoli l i a del grupo
interno; cuando esto no sucede, el anl i sis constituye una corrobo
raci n de la monoli l i a del grupo.
Ntese que el concepto ms "tradi ci ona! , " de determi nar l a
"polaridad" del carcter a pri ori del anl isi s no es equivalente a l a
determi naci n de di reccin que se propone aqu. Hablar de l a "po
l ari dad de un carcter" i mpl ica creer que los estados en s son o
pri mitivos o derivados; lo correcto es habl ar de la di reccin de una
transformaci n en parti cular, como la transformaci n Y->X en el
nodo 7 de l a fig. 1 3. En muchos casos no podra deci rse con propie
dad que lo que es derivado es el estado en s, si no el estado presente
en tales o cual es grupos. Por ejemplo, en la lig. 9 . . . cul estado es
primiti vo, X o Y? Bueno, en el nodo 6 el estado Y es derivado res
pecto del X presente en el nodo ancestral, pero en Pinus el tener el
estado X es derivdo respecto del y de su nodo ancestral .
En los al bores de l a cladstca, hubo una prol i feracin de mto
dos destinados a determi nar la polaridad de los caracteres en forma
absoluta. Esto no es necesario (ni posible), pero adems estos "m
todos" tenan en muchos casos el defecto de asumi r coss que ms
bien deberan ser demostradas a posterior; de un anl i si s cl adstico.
As! uno puede ver en algunos trabajos anti guos l a proposi ci n de
que puede determi narse l a polaridad tornando en cuenta que las
estructuras complejas es ms probable que se ganen y no que se
pierdan, o que el estado ms comn es el pr"l mitivo, o que los carac,
37
Pablo A, Golobof
teres mejor "adaptados" son derivados, o que las teratologas gene
ral mente representan i nvol uci ones a condiciones ancestrales. Es
tas proposiciones pueden o no ser ciertas, pero la ni ca forma de
demostrarlo sera con fi logeni as que no estn basadas en asumi r
una cosa ni otra.
En resumen: el procedi mi ento correcto es el de eval uar cun
pars i moni oso es cada rbol posi ble, sel ecci onar l os ms par
si moniosos, y l uego determinar la polari dad a posteriori. Esto mues
tra la i mportanci a de poder hacer asi gnaciones de estados a los nodos
i nternos en forma ptima, ya que es l o que permite evaluar cada
rbol.
O P T I M I Z ACi N
D E
CA R ACT E R E S
IDEAS BSICAS
Los casos mostrados en la seccin anterior (i .e. l as clasifi caci o
nes de las figs. 4, 5 y 7) son muy si mples. Constaban de pocos termi
nal es, con s610 dos estados alternativos, y en todos los casos las
asi gnaci ones pti mas a l os nodos interos podan encontrarse
intui tivamente con cierta faci l idad. Esto suel e no ser el caso en l a
prctica.
Cuando hay ms terminales, puede ser difci l darse cuenta a
si mpl e vista cules asi gnaci ones son ptimas. Esto se compl ica ms
todava cuando l as condici ones al ternativas del carctr . no son dos,
si no varias. En realidad, adems, se puede calcul ar el nmero de
pasos para caracteres donde el costo de transformarse de un estado
a otro se define no como l a unidad, si no como cual qui er val or. Por
ejemplo, entre patas "ausentes," "pequeas" y "grandes" sera lgi
co coniderar que el costo para pasar de "ausentes" a "grandes" sea
mayor que de "ausentes" a "pequeas" o de "pequeas" a "gran
des" -ya que l as categoras "pequeas" y "grandes" se parecen
entre s ms que con la otra; ambas i mpl i can presenci a de patas,
despus de todo. Si el costo para pasar de "aUSl'tes" a "grandes"
es i gual a l a suma de 105 costos para pasar de "ausentes" a "peque
as" mas el costo d "pequeas" a "grandes" se dice que el carc-
36
PRI'CIPIOS de clADlsTICA
ter es aditivo -ya que l os costos se suman (esto es equivalente a l a
opci n "ordenado" de al gunos programas de computadora). Si l os
costos para pasar de cual qui er condi cin a cual qui er otra son todos
i dnticos (como seria lgi co en el caso de alternativas "verde," "rojo"
o "amaril lo," que no puede ordenarse lgi camente), se di ce que el
carcter es no-aditivo -ya que el costo de "wrde" a "rojo" no es l a
suma de l os costos de "verde" a "amarillo" y de "amari l l o" a "rojo"
(esto es equivalente al "no-ordenado" de algunos pFgramas). Los
caracteres que son "aditivos" o "no-adi tivos" pueden opti m'l zarse
mediante mtodos especi ales, mucho rs rpidos. Tamb'l n es po
si bl e defi ni r los costos como asi mtricos; por ejemplo, perder una
estructura puede consi derarse menos "costoso" que ganarla; en tal
caso, el costo de una asi gnacin de estados dada se cal cul a como
antes, es deci r, tomando en cuenta los estados ancestral y descen
diente de una rama. Para cal cul ar las asignaciones de estados que
producen el mni mo nmero de cambios, se usa un procedi miento
conoci do como opti mi zacin, La optimizacin general i zada si rve
para cual qui er tipo de costo de transformaciones entre estados; re
qui ere cl cul os mucho ms laboriosos, pero es si n embargo ms
simple conceptualmente (el Apndice 1 conti ene una descri peln
de los algoritmos de Farris, 1 970 -para caracteres adi ti vos- y de
Fitch, 1 971 -para caracteres no-aditivos),
OPTIMIZACiN
GENERALIZADA
El problema de encontrar las asignacones de estados ptimas
si n tener que exami nar todas l as posi bl es asignaciones medi ante
prueba y error, es un probl ema de i nferenci a gl obal : taxones ubi ca
dos a ci erta di stanci a de un grupo tendrn influenci a en l os estados
que deban asignarse al grupo. Este problema gl obal , si n embargo,
puede si mpl ificarse como una serie de problemas locales de fci l
resol uci n. El caso ms si mpl e es el de "rboles" de dos termi nal es
solamente (fig. 14); en cada caso, es posi bl e deduci r los estados que
se debe asi gnar al nodo (=ancestro) comn de l os dos termi nales
mostrados, si n ni ngn tipo de i nformacin adi ci onal . En el caso A,
lo ms razonabl e es suponer que el ancestro comn de dos cosas
que tienen estado O tena tambin estado O; eso requerira O pasos.
39
Pablo A. Go!obof

A B e D E
figura l-.
Asi gnar estado 1 al nodo comn en el caso A i mpl i cara dos pasos:
de 1 a O en la rama i zquierda, y de 1 a O en la rama derecha. La
asignacin de estado O es preferi bl e, El caso B es idntico. En el
caso C, asi gnar el estado O al nodo comn requeri ra O pasos en l a
rama i zquierda y 1 en I a derecha, dando 1 paso en total; asi gnar
estado 1, 1 paso e l a rama i zquierda y O en l a derecha. En el caso
C, entonces, debe asignarse el conjunt
o
[Ol } al nodo COmn, ya que
tanto O COmo 1 producen l a mi sma longitud, En el caso D, sl o el
estado O es ptmo, y en el E, el 1 .
Los termi nales en 105 rboles de l a fig. 1 4 bien podran haber
si do, en real i dad, nodos internos. As, puede i r cal cul ndose asi g
naciones de estados de a un nodo por vez, recorriendo el rbol ha
ci a abajo (es deci r, asi gnando estados sl o a aquel l os nodos i nter
nos cuyos descendi entes son termi nales o nodos internos ya exami
nados); en cada caso se mi ran sol amente 1 05 descendi etes del nodo.
Esa "pasada haci a abajo" permite cal cul ar la l ongtd del rbol ;
I cada vez que no elJosibl e asignar a un nodo un
-
e
stad
i
TquF
produzca ni ngn cambi o a l o largo de l as ramas descendietes, se
i ncrementa l a l ongi tud del rbol en el nmero correspondi ente de
pasos, Este nmero de pasos es i ndependiente del "peso" del carac
ler; si se le da al caracler mayor peso, el nmero de pasos debe ser
mul ti pl i cado por el peso (cada paso del caracter "vale" por varios),
Dado que la opti mi zaci n se l lea a cabo si n tomar en cuenta el
peso, el hecho de pesar caracteres no afecta l os estados que se asi g
ne a los nodos, ni en qu ramas del rbol ocurri rn cambi os. Como
ya vi mos, l a pasada hacia abajo toma e cueta 5610 la informaci n
"por arriba" del nodo; si l os grupos hermanos del nodo e cuestin
40
Figura 15.
tienen otros estados, si n embargo, puede ser necesario cambi ar l as
asignaciones. Otra forma de expresar esto es que la pasada hacia
abajo usa informacin local , mi entras que el deci dir los estados fi
nales requi ere que se considere la informacin en forma gl obal . Por
ejemplo, para estados como se muestra en l a fig. 1 5 l a asignacin
ms parsimoni osa al nodo comn es Ol ), es decir, tanto el asignar
como el asi gnar l producen longitud mn i ma para ese rbol. Pero si
supiramos que el grupo hermano de A+B es e, que tiene estado 0,
la asignacin ms parsi moni osa al nodo comn de AS sera 0, no
(01 ); y si supiramos que el grupo hermano es D, con estado 1, l a
asi gnaci n ptima para el nodo comn de AS sera 1 en l ugar de
101) (fig. 1 6). Es entonces cl aro que si bien los estados que se asig-
.
figura 1".
.. ...
L-

Acestro .
( lI e
n
)
Figura 1 7.
4 1
..
..
=.

Acestro : 1 ( II DU )
Pablo A. Goloboff
nan a cada nodo en la pasada haci a abajo seran los ptimos si no
hubi era ms taxones por fuera de ese nodo, el considerar a los taxa
por fuera puede modificar al gunas de esas asignaciones. En el caso
del ejemplo, el taxon de afuera era un termi nal; pero en realidad,
para cada nodo pueden compararse l os estados (prel i mi nares) de
sus descendientes y l os estados (finales) de su ancestro, consideran
do al ancestro como si fuera un termi nal . Es deci r, el ancestro hace
l as veces del tercer taxon en el ejemplo de l a Hg. 1 6 (rig. 1 7). los
estados fi nal es del ancestro de cada nodo deben tomarse en cuenta
porque resumen la informacin por fuera de ese nodo; para asignar
estados fi nal es a un nodo, es necesario que se haya asignado esta
dos finales a su ancestro, y esto se hace viajando haci a arriba del
rbol (es decir, partiendo de l a raz haci a 105 terminales). la "pasa
da hacia arriba," entonces, considera l a informacin en forma gl obal .
Como el nodo raz del rbol no ti ene grupos hermanos (o sea:
no tiene nada por afuera), l os estados cal cul ados en l a pasada hacia
abajo para ese nodo son final es. Tras l a pasada haci a abajo, se
empieza entonces l a pasada haci a arriba, para asi gnar a cada nodo
estados finales. los estados prel i mi nares de l os pescendi entes se
toman ahora co
'
o si fueran fi nal es; los del an(.

l o son. Por
cada estado asignable al ancestro, l os estados que asi gnados a l nodo
medi o produzcan l ongi tud mni ma a lo largo de l as tres ramas
ancestro/nodo y nodo/descendientes, sern aquellos que produzcan
longitud mni ma para todo el rbol en conjunto. las asignaciones al
1 0 1 1 0 0
Figura 18.
|
42
'

: e
L

0
'
1
1

:
`
:
paso
.
Lon
paso
g. par'ial '
>
( e

:
J
o
figura 19.
L-
o : : paso
: . : paso.
Long. parcial :
> ( e: i
e
1

:
`
e
paso
.
Lon
pasos .
g
.
parcial ,
>
( : i

:

2 pasos
o : 2 pasos .
: . e pasos
.
Long. parcial : :
-> ( :i
L

|
o : e pasos .
: . : paso.
o
Long. ( final ) : 2 pasos
-. . .
_>

e

Z
n
'
(
.
.

n
.
"
o

>
I--

. . . .

.
.

J
I
L-l
J
..J
J
\ < L. . ""L
L
: < O

_
'IJ

< .-_

.
\;
c
I J
c
l?d . . .,..
I
.

-
-
J
. J .-.- _
-> , .
c

c c
. . 2 ,-...
: .
_> , :
I I I I
figura 4-
iRI~LIilL5 de LI^ll5]|C^

Figura J1.
nodo que produzcan esa longitud mni ma ocurrirn en al menos una
reconstruccin de mxima parsi moni a (ntese que cada estado fi
nal del ancestro debe probarse por separado, ya que se sabe que
cada uno de el los aparecer en al menos una reconstruccin de
longitud mnima).
Como ejemplo: tomemos el rbol (O (O (1 (1 (O 1 ))))) (que se
muestra en l a fig. 1 8). En la pasada hacia abajo se procede como se
indi ca en la fig. 1 9 (se muestra con l nea doble las ramas que deben
tomarse en cuenta en cada caso). Ntese que si Jos costos de trans
formaciones entre estados son definidos como disti ntos de la uni
dad, pueden tomarse en cuenta de modo si mi l ar (es preciso cal cul ar
el costo de asignar cada estado a cada nodo, considerando el costo
de transformarse a cada estado del descendiente y el costo de asig
nar ese estado al descendi ente, sumando l os costos parciales; el
mnimo de l os costos al l l egar a l a raz es l a longitud mni ma del
rbol; aquel l os estados de costo mni mo en l a raz ocurrirn como
(prel . ) (prel . l
Figura JJ.
UJ (finl)
+b
Pablo A. Golobof
estados final es de l a raz). Luego es necesario hacer la pasada ha
cia arri ba, que se muestra en la fig. 20. Las asignaci ones final es son
las que se muestran en l a fig. 21 w
Si se hubiera defi ni do el costo de transformaciones entre esta
dos como distintas de la uni dad, en la pasada haci a arri ba habra
sido necesario tomar en cuenta dicho costo para cada caso; el costo
de asi gnar un estado al nodo (por cada estado del ancestro) depen
der de los costos ya cal cul ados en la pasada haci a abajo y de los
costos de cada estado en el ancestro. Obvi amente, esto se hace
bastante compl i cado. Cuando l os costos de transformaci ones entre
estados son si mpl es (p. ej., adi tivos o no-aditivos), puede considerar
se slo los estados ptimos para cada nodo, ignorando los sub-pti
mos, y esto permi te simpl ificar el problema. Un ejemplo de esta
si mpl i ficacin se muestra en el Apndice 1 .
En l os casos en que el conjunto de estados del ancestro de un
nodo tiene vari os estados, se debe probar cada as i gnaci n del
ancestro por separado. Supongamos el si gui ente caso (de un carc
ter adi ti vo, o sea, costos de transformacin entre estados i gual a su
di ferencia numri ca), donde el ancestro del nodo ti ene ms de un
estado posi bl e como asi gnaci n fi nal (fig, 22); en tal caso, es nece
sari o probar todas l as combi naciones, lo cual se puede hacer en
forma de tabl a:
ancestro noo costo (inf. + izq. + der.)
O O 0 + 0 + 2 = 2
1 1 + 1 + 1 = 3
2 2 + 2 + 0 = 4
O 1 + 0 + 2 = 3
1 0 + 1 + 1 = 2
2 1 + 2 + 0 = 3
El conjunto pti mo para el nodo medio ser la uni n de los con
juntos que resultan de las posibles asignaciones al ancestro; para O
en el ancestro, {Oi , y para 1 , 1 1 1 . La asignaci n ptima para el nodo
entonces es (01 L porque (OI U( 1 1 = tol l .
Tras l a pasada haci a a"rri ba, si hay nodos con vari os estados
46
PRINCIPIOS de ClAD'STICA
posibl es, si gnifi ca que hay "ambigedad" (hay di sti ntas asi gnaci o
nes de estados a los nodos que producen longitud mni ma). Una
optimizacin como l a descrita encuentra todos los estados que ocu
rren en al menos una reconstruccin de mxi ma pars i moni a. Si
existe ambigedad, no encuentra l as reconstrucciones en s. Si se
qui ere hacer una reconstruccin parti cular de mxi ma parsi moni a,
deben entonces respetarse al gunas reglas. En la mayora de los ca
sos, si para un nodo ambi guo se elige un estado dado, deber elegi rse
el mi smo estado para todos los noos adyacentes donde tambin
exista ambigedad y dicho estado sea una de las posi bi l idades. Por
ejemplo, en el caso de la lig. 23 los dos nodos ambiguos deben ser o
bien O o bien 1 ; designar un nodo como O y el otro como 1 i mpl icara
un paso adi ci onal . Esto no garantiza encontrar todas las posibles
reconstruc.ciones al ternativas, pero encontrar una o ms de el las
(es decir, l as asignaciones de estados i ndi vi duales a los nodos que
dan l ongitud mni ma) para el carcter. Esto muy raramente es nece
sario; para casi todos los pri nci pi os di scuti dos en este apunte, es
i nnecesario conocer las reconstrucciones en s, siendo sufi ci ente con
conocer los conjuntos de estados que ocurren en reconstrucciones
de longi tud mni ma.
Este mtodo, que podra l l amarse de "enumeracin de posi bi l i
dades" para cada nodo, es s i mpl e pero muy labori oso. Adems,
cuando hay numerosos estados se puede torar casi i mposi bl e de
hacer manual mente. Para casos especiales de costos de transfor
maciones entre estados, se pueden usar ciertas "reglas" (como la
opti mi zacin de Farris y l a de Fi tch) que evi tan tener que hacer l a
enumeracin exhausUva mencionada ms arri ba .
Figura 23.
,
<.
. ,
o
1
LiJ
J
l . :
L
' O
/ t
o
|
0

J
j
47
I

.
6
Pablo A. Goloboff
B S Q U E D A S
D E
S O L U C I ON E S P T I MA S
GENERALIDADES
El hecho de tener un criterio cl aramente defi ni do para medi r el
ajuste entre un rbol y l as observaciones, permite que se programe
una computadora para que se encargue d la tediosa tarea de se
leccionar los rboles que satisfagan el criterio elegido. El uso de
computadoras es especi al mente deseable porque es bastante di f ci l
identificar l os rboles de mxi ma parsi moni a. La di fi cultad radi ca
en que no existe una frmul a o algoritmo que produzca el resultado
en forma di recta; la ni ca forma de hacerlo sera, en pri ncipio, ea
l uar cada rbol posible, mi dindole el nmero de pasos para los
datos dados, y retener aquellos ms cortos. Esto es fci l de deci r
pero di fci l de hacer. Ms que di fci l , i mposi ble. El nmero de rbo
les posibles para ms de 1 0 taxones es un nmero i nmensamente
grande. La tabla 1 muestra los nmeros de rboles dicotmicos para
di stintos nmeros de taxones. Para 20 taxones (y raz), si se qui si era
cal cul ar la longitud de cada uno de l os rboles posibles mediante
una opti mi zaci n, y se pudiera cal cul ar l a longitud de 1 mi l ln de
rboles en un segundo (cosa que ni nguna computadora, por ahora,
puede hacer, por ms eficientemente que se la programe), se tarda
ra al rededor de 260 mi l l ones de aos. Los programas de computadora
actuales, si n embargo, pueden encontrar sol uci ones garanti zadas
como de longi tud mni ma para problemas de 20 taxones en lapsos
de tiempo que varan entre 1 mi nuto y unos pocos das (dependi endo
del programa y del conjunto de datos). Tambin pueden encontrar
sol uci ones mediante mtodos de "prueba y error," que si bien no
dan garanta de haber encontrado l a longitud mni ma, son altamente
confi ables; medi ante estos mtodos de prueba y error, se pueden
econtrar sol uci ones para problemas de 50-100 taxones en tiempos
que van desde 1 2 mi nutos hasta 2 3 hs. como mximo.
L a reducci n en l os ti empos necesari os para un anl i s i s
cl adstico se logra mediante l a combinacin de mtodos que permi
tan tener ci erta confianza de haber encontrado los mejores rboles
pero que evalen di rectamente un nmero de rboles lo ms peque-
48
PRINCII'IOS ele ClAOlsTICA
ro posible, junto con algoritmos que permitan eval uar cada uno de
l os rboles lo ms rpidamente posible. A continuacin se expl i
can, en orma muy bsica y si mpl ificada, al gunas de l as tcnicas
usadas para eval uar un nmero de rboles lo ms pequeo posi ble.
El Apndi ce 2 conti ene un ejemplo de la apl i caci n real de estas
ideas en un programa de computadora muy simpl e. Los mtodos
para cumpl i r el segundo de estos propsi tos (cmo cal cul ar la longi
tud en forma l o ms rpida posible) son ms compl icados, y expl i
carlos excede l os propsitos de este l i bro (varios de l os trabajos ci
tados en l a bi bl i ografa se ocupan de esto).
Tabla 1 .
Numero de posibles rboles dicotmico, para ].20 t ones
T Nmero de rbole. T .. Nmero d rboJes
3 3 1 2 1 3. 74931 0. 575
4 1 5 1 3 3 1 6. 234. 1 43. 225
5 1 05 1 4 7. 905. 853. 580. 625
6 945 1 5 2 1 3. 458. 046. 676. 875
7 1 0. 395 1 6 6. 1 90.283353. 629. 375
8 1 35 . 1 35 1 7 1 9 1 .898.783.962. 5 1 0. 625
9 2.027.025 1 8 6.332. 659.870. 762. 850. 625
1 0 34. 459. 425 1 9 221 .643.095.476.699. 771 . 875
1 1 654. 729.075 20 8.200.794. 532. 637. 89 1 . 559. 375
SOLUCIONES EXACTAS
Para cal cul ar sol uci ones exactas puede uti l izarse el mtodo de
"enumeracin i mpl ci ta" o "branchandbound. " Para generar to
dos 105 rboles posibles de una matriz, primero se deberan juntar 3
taxones, luego ubi car el cuarto taxn en cada una de las ramas po
si bl es, en cada uno de esos casos ubicar al quinto taxn en cada
rama disponible, etc. Pero al ir agregando taxones se puede calcu
l ar la longitud de los rboles parciales. Aqu se aprovecha el hecho
de que, al agregar taxones, la longitud que tena el rbol con menos
49
Pablo A. Goloboff
taxones puede mantenerse i gual o aumentar; nunca puede di smi
nui r. L.uego, si un rbol parci al es ms l argo que el mejor rbol
"entero" encontrado hasta el momento, se deduce que lodos l os r
boles enteros que resultaran de agregar l os taxones restantes a ese
rbol parci al sern ms l argos que el mejor rbol entero encontrado
hasta el momento. Por lo tanto, es i nnecesario segui r agregando
taxones, y es posible mover el lti mo taxn que haba si do agrega
do a la prxima ubi caci n disponibl e. Cuando los datos sOn bastan
te congruentes, agregando muy pocos taxones ya se excede l a Ion
gitud l mi te, con l o cual se puede garantizar en poco tiempo que se
han encontrado todos 105 rboles de longi tud mni ma. Las sol uci o
nes exactas, si n embargo, slo pueden hacerse en tiempos razona
bles (mi nutos, horas, o pocos das) para 1 520 taxones; para 2 1 25
taxones (y en programas muy rpidos como Hennig86) toman un
ti empo muy l argo (a menudo varios das), Para ms de 25 taxones
son casi si empre impracticables, y slo pueden hacerse sol uci ones
de prueba y error.
MTODOS
O|
|ku|8AY |kkOk
RBOLES DE WACNER
La idea bsi ca de u n rbol de Wagner es l a de agregar l os
taxones secuenci al mente. Dado que el nmero de pasos de l os r
boles parciales que resultaran de agregar un taxn en disti ntas po
si ci ones es di sti nto, s el ige agregarlo en aquel l as posiciones que
i ncrementen l a l ongi tud lo menos posible y as se inienta l l egar a
rboles de l ongi tud global relativamente pequea. En la prctica,
para ms de 1 520 taxones y datos con considerable homopl asi a, es
casi imposi ble encontrar el/los rboles de longitud mni ma medi ante
rbol es de Wagner. los rboles de Wagner, si n embargo, son en
general mucho ms cortos que rboles generados arbitrariamente
(al azar, por ejempl o), y por lo tanto constituyen un mejor punto de
partida para permutacin de ramas (ver seccin si gui ente).
Al ir agregando los taxones, se puede cal cul ar la longi tud que
se produci ra al agregar cada taxn en una posicin dada medi ante
50
PRINCIPIOS de ClAOisTICA
una optimi zacin (de primera pasada). Esto es lo que hace la fun
ci n do_ wa
r
oet.en el Apndice 2 (usando l a pasada haci a aba
jo de la optimizacin de Fitch para evaluar el resultado de agregar
cada terminal en cada posicin disponibl e). El cl cul o de l ongi tud
es l o que toma ms ti empo; l os programas de computadora actuales
cal cul an l a longitud en otra forma, i ndirecta y mucho ms rpida.
Disti ntas secuenci as de adicin de los taxones pueden dar por resul
tado disti ntos rboles. Un ejemplo es:
x o 00 00
A 1 DO OO
8 1 00 1 1
CO 1 1 1 1
D0 1 1 00
donde formar un rbol de Wagner agregando los taxones en el mis
mo orden en que se encuentran en la matriz produce el rbol inco
rrecto. Eso es porque los primeros 3 caracteres determi nan como
ni co rbol para esa matriz a ( X A B) (e O)), con l os l ti mos dos
caracteres apareciendo como homoplsicos. Sin embargo, s i se han
agregado X, A Y B, al i r a agregar C los caracteres que j untan a e
con D aparecern como no informativos (=requi ri endo el mi smo
nmero de pasos en cualqui era de los lugares donde se agregue el.
ya que D todava no est bicado en el rbol. En cambi o, si se
agregaran los taxones en el orden (XAC), D,B. se obtendra si empre
el rbol ms corto.
PERUT ACION
DE
RAMAS
La permutacin de ramas consi ste en tomar los mejores rboles
que se hayan encontrado hasta el momento, cortar una rama del
rbol , y moverla a otras partes del rbol, cal cul ando en cada caso l a
l ongitud. Esto permite, ideal mente, i r aproximndose gradualmente
alla los rboles ptimos. Los cambios de ramas pueden hacerse de
varios modos di stintos; los dos ti pos ms usados son el corte si mpl e y
el corte con re-enraizamiento, conoci dos en i ngl s como "subtree
pruni ng regrafti ng" (SPR) y "tree bsection reconection" (TBR), res
pecti vamente. E l corte simpl e toma cada nodo del rbol, l o corta y
5 1
Pablo A. Golobaf
l o mueve a cada ubicacin di sponibl e; el corte con re-enraizamiento
reenraiza el grupo cortado en todas sus posibles races (si el grupo
tiene N terminales, se lo puede re-enraizar de 2N-3 formas distin
tas), y en cada caso l o muee a todas l as ubicaciones posibles. Para
rboles de T terminal es, el corte si mpl e genera alrededor de 31'
reacomodamientos, y el corte con reenraizamiento al rededor de T'/2.
Como ejempl o, l a funci n do_swapsO, en el Apndice 2, usa
corte si mpl e para tratar de mejorar el rbol producido por la funcin
do_ wa
r
oet|.En este ejemplo, l a longitud de cada reacomodami ento
es cal cul ada usando la funci n ttee_eo
r
t|. 105 programas de
computadora actuales usan mtodos de cl cul o de l ongitud que son
(por lo menos) 2T veces ms rpidos que esto. Para matrices de da
tos de 40 o ms taxones, las funciones do_5wapsO vttee_eo
r
t|0.
son extremadamente lentas (como ya se i ndic, vari os de l os traba
jos que se citan en la bi bl i ografa se ocupan de esol.
MTODOS
MS
EXHAUSTIVOS
La permutacin de ramas no garantiza encontrar todos los r
bol es de l ongitud mni ma; ni si quiera garantiza encontrar, aunque
sea, un rbol de l ongitud mni ma. A veces puede ser imposi ble l l e
gar desde el rbol que se est permutando hasta otro rbol de l ongi
tud menor o i gual , a menos que se pase a travs de rbol es de longi
tud mayor.
Esto se conoce (un poco informal mente) como el problema de
las "i sl as" de rboles. Los rboles que no estn conectados entre s,
ni por medi o de rboles de longitud mni ma, se dice que estn en
disti ntas "i sl as. " Hay vari as maneras de solucionar el problema de
las isl as, pero l as que parecen mas efectivas son 1 ) usar disti ntos
puntos de partida para l a permutacin de ramas, de forma que se
pueda l l egar a rboles de distintas i sl as, y 2) usar al gori tmos de
permutacin de ramas ms exhaustivos (i.e. que hagan reacomo
dami entos ms drsticos). La primera posi bi l idad es la ms uti l i za
da; l a segunda slo recientemente ha comenzado a ser explorada.
Para distintos puntos de partida para permutaci n de ramas,
52
PRINCIPIOS de CLAOSTICA
suelen uti l i zarse rboles de Wagner producidos por di sti ntas secuen
ci as de adi ci n (podra uti l i zarse cual quier rbol, i ncl uso rboles
generados al azar, pero l as bsquedas en tal caso tomaran mucho
ti empo, ya que l os rboles al azar siempre son mucho ms largos
que l os de Wagner, y ser necesar i o hacer muchos ms
reacomodamientos hasta l legar a rboles de l ongi tud cuasi -mni ma).
En l a medi da en que di stintas secuenci as de adi ci n produzcan los
mi smos resul tados, aumenta la certeza de haber encontrado todos
los rboles ptimos. Por ejemplo, si de l as permutaciones a parti r de
30 secuenci as de adi ci n di stintas, 25 termi nan en los mi smos rbo
les, y slo 5 encuentran rboles ms l argos, estaremos ms confia
dos de haber encontrado los rboles ptimos que si todas producen
resultados y l ongi tudes di sti ntas. Es evidente que en el segundo caso
se estara frente a un conjunto de datos muy complejo que requerir
hacer corri das ms exhaustivas.
MODOS RPIDOS
DE
ANLISIS
la i nformaci n de en qu medi da disti ntos puntos de partida
para permutaci n de ramas producen resultados finales parecidos
es i mportante, y esto es lo que aprovechan al gunos mtodos nuevos
(todava en desarrollo) para tratar de l legar a concl usiones en forma
ms rpi da. Si di sti ntas secuenci as de adi ci n para rholes de
Wagner termi nan en rboles casi i dnti cos, los datos apoyan clara
mente las concl usiones, y los grupos en comn a todas las repl i ca
ci ones estn bien apoyados. Estos mtodos tendran l a ventaja adi
ci onal , en pri ncipi o al menos, de que sl o encuentran los grupos
apoyados si n ambi gedad por l os datos. A aquell os grupos que, si
bi en son apoyados por los datos, l o son slo muy dbi l mente (ejem
plo; 1 00 caracteres a favor, 99 en contra), es preferi ble excl ui rl os de
las conclusiones.
En l ugar de hacer permutaci n de ramas exhaustiva, entonces,
pueden hacerse vari as secuenci as de adi ci n (por ejempl o, segui da
de permutacin de ramas con corte si mpl e, sal vando no ms de un
rbol por repli caci n); aquel l os grupos que aparezcan en un por-
53
Pablo A. GoloboH
centaje al to de repl i caci ones (digamos, 75%) se encontrarn casi
con certeza en todos 105 rboles de mxi ma parsimon ia. los grupos
de frecuenci a menor al 75% se el imi nan, y por l o tanto no se i nclu
yen en l as concl usiones del anl i si s. Este ti po de efoque es muy
reci ente, y es por ahora l a ni ca forma de encontrar sol uci ones
aproxi madas a problemas de ms de 500 taxones. Con l os mtodos
tradi ci onal es (Le. ml ti pl es secuenci as de adi ci n seguidas de cor
tes con reenrai zamiento, sal vando y permutando numerosos rboles
en cada repl i caci n), un anl i si s as poda tomar das o semanas;
con estos nuevos mtodos, puede requerir sol amente unas pocas
horas. En parte, la ganancia de velocidad viene dada porque los
mtodos i ntentan encontrar slo los grupos bien apoyados, es deci r,
aquel los que estn cl aramente defi ni dos por 105 datos di sponi bles;
stos son fci l es de encontrar, precisamente por estar cl aramente
apoyados. En los mtodos tradicionales, l a mayor parte del tiempo
de una bsqueda se uti l i za en encontrar l as pequeas vari aci ones
en grupos poco apoyados, que es mucho ms di fci l .
PE SADO
DE
CARACT E RE S
Cuando no exi ste confli cto entre caracteres el pesado de ca
racteres es absol utamente innecesario: las concl usi ones permane
cern i nal teradas para cual qui er conjunto de pesos mayores que
cero. Si n embargo, cuando hay caracteres incongruentes (Le. ca
racteres que no pueden estar l ibres de homopl asi a al mi smo tiempo,
como algu nas si napomorfas de A+B y otras de A+Cl debe tomarse
en cuenta el peso de 105 caracteres para el egi r una u otra de esas
a I ternati v as.
Muchos autores estn en contra del pesado de caracteres, por
que consideran a esta prcti ca como "i nevitablemente subjetiva."
Si bien muchas formas de pesar caracteres no pueden ser l gica
mente justifi cadas, hay otras perfectamente justi ficabl es en el con
texto de parsi moni a. A menudo se i nterpreta al pri nci pi o de parsi
moni a como afirmando que "todos los caracteres deben tener i gual
peso", pero esto no es ms que una i nterpretacin equivocada. El
criterio de parsi moni a slo di ce que mi entras ms pasos se requl e-
I
I
PRI NCIPIOS d. ClADS11CA
ran para un carcter, peor se ajusta el carcter al rbol dado. Si un
rbol ahorra un paso en un carcter y agrega un paso en otro, es
necesario tomar en cuenta cun fuerte -onfi abl e- es la evidenci a
presentada por cada uno de esos caracteres. El criterio de parsimo
ni a es perfectamente compatible con el pesado de caracteres; ms
bien, requiere que se decida si l os pesos de l os caracteres son igua
les o no. La creenci a de que esta decisin se puede evitar dando
igual peso a todos los caracteres es i l usoria -consi derar ambas cla
sificaciones como i gual es requiere defender la i dea de que ambos
caracteres, efectivamente, ti een i gual peso. Deci di rse en favor de
uno de l os caracteres del caso anterior i mpl i ca que ese carcter
ser mejor explicado por l a cl asi ficacin, y el otro peor. Si uno de
los caracteres provee evidenci a ms confi abl e que el otro, cierta
mente que ser preferi bl e desdear evidenci a poco confi abl e en fa
vor de l a evidenci a fuerte (Farrls, 1 983). La di ferenci a en el poder
expl icati vo real de l as dos hi ptesi s depende, entonces, de l as
confiabi l i dades relativas de l os caracteres entre s. La formul aci n
en trminos del conteni do de informacin de cl asi fi caci ones tam
bi n es total mente compatible con el pesado de caracteres: en los
casos de confl i cto, puede ser preferi bl e mejorar el poder descriptivo
para cierto(s) carcter(es) a expensas de di smi nui rl o para otro(sl.
En cl adstica, se conidera como eidencia de confi abi l i dad a
l a cantidad de homopl asi a que presenta un carcter. Un carcter
con ms homopl asi a nos llevara a equi vocarnos ms s i qui siramos
crear grupos basndonos slo en ese carcter; el carcter tiene una
correlacin muy pobre con l a estructura jerrqui ca del rbol. En
prcticamente todos l os casos de anl i si s cladsticos reales, no pue
de haber ni ngn rbol donde todos 105 caracteres estn l i bres de
homopl asi a al mi smo tiempo. Por lo tanto, se sigue que al gunos
caracteres al menos tendrn un peso menor que l os dems. El pesa
do de un carcter no es equivalente a su el i mi nacin, si no a darle
una i mportancia relativa. Cuatro caracteres de peso 3 sern equ i
val entes a sei s caracteres de peso 2. Lo que i mporta, adems, son
las proporci ones entre los pesos; en lugar de 3 y 2, pesos de 30 y 20,
o de 300 y 200, habran produci do exactamente el m ismo resultado.
Pero he aqu un problema . . . cmo pueden determi narse los pesos
relativos de cada carcter?
A raz de la di ficultad en determi nar l a confi abi l idad de los ca
racteres, el pesado de caracteres ha si do a menudo considerado
55
Pablo A. Golobofr
como una prctica muy subjetiva. Esto es cierto, s i n duda, de mu
chas i deas tempranas sobre el pesado de caracteres, como la idea
de que debe darse menos peso a los caracteres adaptativos (ya que
seran muy "fl exi bl es"). Cmo puede saberse s i un carcter es
adaptativo o no, medi ante l a sola observaci n de los organi smos a
clasi ficar? A lo sumo, puede decirse que un carcter es una adapta
ci n para determi nada funci n si , en l a historia evol uti va del grupo,
aparece asoci ado con la funci n dada muchas veces. Pero el de
mostrar esa asoci aci n presupone una hi ptesi s fi logent ica. y si la
hi ptesi s fi logentica hubi era si do el egi da precisamente porque se
consi deraba adaptati vo al carcter en cuesti n. " el razonami ento
sera, l i teral mente habl ando, ci rcul ar. El uso de l a homopl asi a en l a
poca temprana de l a cladstica no pareca mucho ms defendi bl e,
y se l e apl i ca l a mi sma crtica, ya que para cual qui er carcter. ha
br al menos un arbol posi ble donde no hay nada de homopl asi a.
Por ms que se usen frmulas para deri var el peso matemticamen
te, como una funci n de las cantidades de homopl asi a, el problema
no se sol uci ona, porque ". en qu rbol debe medirse l a homopl asi a
de un carcter para determi nar su peso?
Este aparente d l ema, si n embargo, puede resolverse. Los m
todos ms usados en cl adstica se derivan de los trabajos de Farris
( 1 969) en pesado sucesivo. Farris propuso un mtodo i terativo, don
de se anal i zan l os caracteres bajo pesos que se van modi fi cando en
corri das sucesivas, de acuerdo a l as canti dades de homopl asi a que
se observan en l os resul tados de cada anl i si s. As, se hace un pri
mer anl i si s bajo una serie i ni ci al de pesos; esto l l ear a el egi r una
serie de rboles, y al medi r l a homopl asi a de cada carcter sobre
esos rboles se pueden re-asi gnar pesos a los caracteres, y hacer un
nuevo anl i si s. Si el nueo anl i si s produce idnticos resultados, el
proceso se detiene, caso contrario, se modi fi can l os pesos y se sigue
corriendo hasta lograr un resultado estable. Ideal mente, los resulta
dos de cada corri da i rn produci endo pesos que se acerquen cada
vez ms a "los reales." En la prctica, si n embargo, se observa a
menudo que di sti ntas condi ci ones i ni ci ales O. e. disti ntos conjuntos
de pesos i ni ci ales) pueden l l evar a disti ntas sol uci ones estables; como
no es posible el egi r entre el las, el problema bsico queda en ci erto
modo si n resolver. Gol oboff (1 993) propuso una modi fi caci n de
este mtodo, el anl i si.s bajo pesos i mpl icados, que permite compa-
56
IJfINOP10S de ClADIST1CA
rar, en forma relativamente si mple, dos rboles cual esqui era segn
l os pesos que esos mi smos rboles i mpl iquen. El mtodo se basa en
sel ecci onar rbol es que, en l ugar de mi ni mi zar l a canti dad de
homopl asi a (H) di rectamente, mi ni micen una funcin creciente y
concava de l a homopl asia, como H/(l +H) (ver Gol oboff, 1 993, para
discusin). Para evaluar u n rbol segn este mtodo se apl i can los
algoritmos de opti mizaci n comunes (de Fitch o Farrs, por ej, ), pero
en lugar de usar la suma total de homopl asi a para todos l os caracte
res, se hace la suma de Hj(l +H) para todos los caracteres, E n una
bsqueda por permutaci n de ramas, mini mi zar H/(l +H) es equiva
lente a comparar al mejor rbol encontrado hasta el momento con el
candidato producido por un reacomodami ento, de acuerdo a l os pesos
que habra que aceptar si se aceptara a cual quiera de esas dos hi
ptesi s como "verdadera" -y sto permite seleccionar entre uno de
esos dos rboles. la comparacin entre un par de rboles disti ntos
puede hacerse posteriormente de acuerdo a otro conjunto de pesos,
con l o que nunca es necesario asumi r que 105 pesos son efectiva
mente iguales -los pesos quedan determinados por los rboles en
cada comparaci n, Los pesos de los caracteres, por lo tanto, no
necesitan tomarse como dados ni permanecer fi j os durante un an
l i sis (=bsqueda de rboles ptimos); l o que determi na l os pesos es,
ms bien, el resultado de un anl i si s ( i ,e, los rboles elegidos).
Este enfoque del probl ema de pesado de caracteres puede ex
tenderse tambin a l a determinaci n de 105 costos d transformacio
nes entre los estados de un carcter, Normal mente, se considera
que es igual mente razonable postul ar la prdida de una estructura
que su gananci a. A veces esto parece poco razonable , .. puede una
estructura tan compleja como l as al as de l os insectos ser tan fci l
mente ganada como perdida? En real idad, no es necesario que l a
respuesta se asuma a pri ori . . . si l a hi ptesi s actual de genealoga de
i nsectos es i ncl uso vagamente aproximada a la realidad, el carcter
ausencia/presenci a de al as se opti mizara con muchsi mas ms pr
di das secundarias que gananci as, En otras pal abras, l a hi ptesi s
actual de genealoga i mpl i ca -en pri nci pi o, si n asumi rlo- que es
ms probable perder que ganar las al as. Este ti po de razonamiento
puede aplicarse tambin a 105 mtodos de opti mi zacin (Goloboff,
1 997), resultando en asignaciones de estados -y en selecciones de
rboles- que permiten considerar a l as asimetras en l os costos de
57
Pablo A GoloboH
transformacin entre estados como una conclusin del anl i si s y no
como una premi sa. Este mtodo es, por ahora, relativamente expe
rimental; requiere cl cul os muy i ntensivos y por lo tanto no puede
apl icarse a conjuntos de datos muy grandes (ms de 60-70 !axones).
Algunos estudios empricos sugieren que, cuando se usan estos
mtodos cl adsti cos de pesado de caracteres, l as cl asi fi caciones
produci das son ms estables ante l a adi cin de nueva evi denci a,
que cuando se usan pesos/costos iguales. Esto equival e a decir que
l as clasificaciones son ms predictivas, l o cual es de esperar. Es de
esperar, porque l os caracteres con mucha homopl asi a -y entonces
consi derados menos infl uyentes en el anl i s',s- se ajustan menos a
l a estructura del rbol. Por lo tanto es menos probable que predigan
o describan adecuadamente la di stribucin de aquel l os caracteres
an no observados que se ajusten bien al rbol .
M E D I C i N
D E
A P O Y O
D E
G R U P O S
La necesidad de excl ui r grupos dbi lmente apoyados es obvi a.
En ignorar esto se basa otra de l as "crticas" que se hace a menudo
a la cl adsti ca: " . . . el mtodo no puede usarse para establecer con
cl usi ones en forma confi abl e porque pequeas al teraciones de l a
matriz (por ejemplo, descubri mi ento de errores de observacin, o
agregado de al gunos caracteres nuevos) puede l l evar a concl usi o
nes radical mete di sti ntas pra al gunos grupos." Si bi en esto es cierto
e s, no menos cierto es que eso slo puede suceder cuando se
considera como "conclusiones" aquel l os casos como el del ejempl o
dado en l a seccin anterior, de 1 00 caracteres contra 99. Los gru
pos bien apoyados por evidencia fuerte permanecern i nal terados
ante l a adicin de nuea evidencia, y son los que realmente deben
tomarse en cuenta. A l o sumo, los grupos dbil mente apoyados pue
den ser menci onados como "grupos tentati vos," pero no debe
atriburseles el mi smo status que a los grupos fuertemente apoyados.
La crtica es por l o tanto tan poco relevante como l o era la crtica de
que el mtodo cl adstico es di fci l de apl i car porque requi ere que se
58
PRINCIPIOS de CLADSTICA
determi nen las polaridades de los caracteres. Hay varios mtodos
(adems de l os mtodos rpidos mencionados en la seccin ante
rior) para tratar de medir el apoyo de grupos. El "Bremer support" es
l a
di ferenci a en l ongi tud entre los rboles ms coros con y si n el
grupo; cuanto mayor es esa di ferenci a, mejor apoyado estar el gru
po. los mtodos de "jackni fing" y "bootstrapping" se basan en ha
cer alteraciones de l a matriz (mediante re-muestreos al azar de to
dos o parte de los caracteres), un nmero dado de veces, cal cul an
do con qu frecuenci a l os rboles ptimos tienen un grupo dado.
los re-muestreos al azar dan una idea de qu proporcin de
evidenci a a favor y en contra hay para cada grupo, y por l o tanto de
en qu grado l a adici n de nuevos caracteres puede modificar l as
concl usiones. los re-muestreos al azar pueden usarse en conjun
ci n con los mtodos rpidos de anl i si s descriptos en l a seccin
anteri or.
P R oe R A MA S
D E
C O M P U T A D O R A
Hayvarios programas que implementan los mtodos descriptos.
El programa PAUP es qui zs el programa para anlisi s cl adstico
ms conocido; fue lanzado e 1 984, pero las versiones para DOS
tenan serios problemas. las versiones sigu ietes de PAUP han su
perado muchsi mo a la versin de DOS, pero slo se di stri buyen
ofi ci al mente para Maclntosh. Este programa i mpl ementa casi todos
los mtodos descriptos; para matrices de tamao pequeo o medi a
no es efectivo y rpido. Para matrices muy grandes, as como para
l a aplicacin de ci ertos mtodos en parti cul ar, puede ser excesiva
mente lento.
Para DOS, hay tres programas pri nci pales di sponi bl es: Henn ig86,
NONA Y Pee-Wee. Henng86 es el programa ms rpi do para an
l isi s de parsimonia; es muy efectivo. Sus l i mitaciones ms i mpor
tantes se deben en parte a que el programa fue l anzado en 1 988,
cuando ni nguna pe tena mas de 640 KB de memoria disponible; por
lo tanto, el programa no est equi pado para muchas funciones tiles
pero que requeri ran ms memoria. Pee-Wee y NONA son dos pro
gramas gemelos; slo difieren e que Pee-Wee i mpl ementa anl i si s
59
Pablo A. Goloboff
bajo pesos i mpl icados, mi entras que NONA busca rboles de longi
tud m ni ma bajo pesos defi ni dos previ amente. Ambos programas
son, en trminos de veloci dad absoluta, un poco ms lentos que
Henni g86, pero como tienen un tratami ento ms estricto de l as
politomfas (tema que excede este trabaja), a menudo l levan a consi
derar como distintos menos rboles que Hennig86. Esto requiere
permutar las ramas de menos rboles, y por lo tanto las bsquedas a
menudo toman casi tan poco ti empo como Henni g86. Pee-Wee y
NONA i mpl ementan vari as formas de medi r el apoyo de grupos.
Un programa reciente, Jack, i mpl ementa el mtodo de jacknifing en
combinacin con bsquedas rpi das (mediante rboles de Wagner);
permite econtrar grupos bien apoyados en forma poco menos que
i nstantnea,
Otros programas cladsticos no estn orientados primariamente
a la bsqueda de rboles de mxi ma parsimonia, si no que permiten
opt i mi zar los caracteres -en forma grica- en rboles dados (nor
mal mente, en los rboles encontrados por los programas de bsque
da). Estos programas si rven para presentaci n de concl usiones, o
para estudi ar la evol uci n de los caracteres sobre rboles dados.
Un programa muy conocido es Mace/ade, para Maclntosh. Para
DOS, el programa Ci ados permite i mpri mi r rboles de muy buena
cal i dad grfi ca.
C O N C L U S i N
El l ti mo punto que merece comentario es el de l a prediccin,
es deci r, l a extrapolaci n respecto de aquellas observaciones an
no realizadas. Esto puede ser el caso para caracteres sexuales se
cundari os en una especie de la que se conoce un solo sexo, o carac
teres de comportamiento en una especie conocida slo por materi al
conservado. Los cladogramas obteni dos predicen en forma di recta
los estados que se espera sean observados en fa prctica: los mi s
mos que se asi gnan, en una opti mi zaci n, al ancestro de la especie
para la cual no se ha podido observar el carcter. No siempre ser
posi ble hacer una prediccin de una caracterstica dada; suponga
mos que se sabe que Zea mays (Gramineae) tiene una sustancia ti l ,
y se sabe que l a sustanci a t i l est ausente en vari as pl antas no
gr am neas (fi g. 24) . El poseer esa sustanci a puede ser una
60
'
Compositae ( sin)
.--l sin
--sin
/
GRlN
Figura 24.
Fabaceae ( sin)
Bambusa | ?
con/sin
Oryza | 7
lcon/sin

Ayena | ?
.- -- con/sJn
-con/sin
Aegilops | ?

- Eagrostis | ?
L. . -- . . con/sJn

- Pnisetum
L. . --,. con/sJn
| ?
Zea sp . | ?
= con/ sin
Zea mays ( con)
..
'
z

:;
i
'
"




e
'

Pablo A. Golobof
si napomorfa de Gramineae, del gnero Zea, o ser una autapomorfa
de l a especie en cuestin. la optimizacin en este caso sera como
se muestra en la fig. 24, optimizacin con l a cual no es posible pre
deci r para ninguna gramnea si tendr el carcter o no. En l a taxo
noma clsica, exista la idea de que ciertos caracteres eran de un
"ni vel " dado, es decir, que ci erto ti po de caractersti cas se conser
vara constante dentro de una fami l i a, otro ti po dentro de un gnero,
etc. En real i dad, eso es i mposible; en el ejemplo, por ms que se
sepa que las otras pl antas i ncl udas perenecen al mismo "gnero"
o "fami l i a" (segn el caso), no hay prediccin posible. Para esto es
necesario haber observado efectivamente en ms especies si tie
nen o no el carcter. Bastara saber que Aegilops s ti ene la sustan
cia, y Oryza carece de el la, para que l a optimizacin se resol viera
sin ambi gedades y permitiera predecir todos los estados no obser
vados (fig. 25). En este caso, Avena, Eragrostis, Pennsetum, y Zea
sp. son candi datos igual mente buenos para buscar l a sustancia; Bam
busa -pese a ser una "gramnea"- debera carecer de l a sustanci a.
las predicciones, por supuesto, pueden no cumpl i rse, como
cual qui er prediccin emprica. En la medida en que una clasifica
cin se ajuste bie a 'Ias observaciones real i zadas hasta el momen
to, ser esperable que se ajuste a aquellas todava no real izadas;
este argumento, por s solo, permite suponer que la cl asi fi caci n
cladstica -l a que mejor se ajusta a las obseraci ones- ser l a que
permita hacer .predi cciones con menos error. Poder predi cti vo, en
tonces, viee de la mano con estabi l i dad. Es por l o tanto poco sor
prendente que al gunos estudios empricos (Farris, 1 971 ; Mi ckevi ch,
1 9 78) hayan efectivamente encontrado que l as cl asi fi caci ones
cl adsticas, en l a prctica, se modifican menos ante l a adi ci n de
nuea i nformaci n que las clasificaciones fentcas o evolutivas.
El problema de la estabi l idad tiene que ver con l a confiabi l idad
de conclusiones obteni das sobre l a base de eidencia l i mitada. Esto
permite hacer hi ncapi en otro de los tabes que l a gente tiene res
pecto del mtodo cl adstico, l a creenci a de que el no haber podido
estudi ar todas l as especies de un grupo, o (en el caso de especies
con di morfismo sexual) no teer todas las especies representadas
por ambos sexos, i mpi de hacer un anl i sis cladstico, o di smi nuye
muchsimo su calidad. Un bue anl i si s cladstico de sl o parte de
l as especies de un gnero puede ser extremadamente ti l para di ri-
62
'
'
Comositae ( e1n
~sin
--sin
Fabaceae | e1n
Prediccin
imPliCida
Bambusa ( 1)
-
------1 " sin"
/
sin
Orza (sin)
GRlN
sin
I con
Aegilops ( e on
Avena ( 1) - l " con"
con
Eragrostis ( 1) H con"
con
Pen setum ( 1) l " con"
con
I
con
I
Zea ep. ( ?)
.
" co
n
fl
Zea maya ( con
Figura 25.

z
Q




n

>
Q
v
:
'"
>
Pablo A. Goloboff
gi r las i nvestigaciones futuras. Ci ertamente que nada podr decirse
acerca de aquel l as especies no i ncl udas en el anl i si s, pero el con
cepto de parentesco es despus de todo relativo, no pudiendo defi ni rse
en forma absoluta. As, dados tres taxones, A, B Y C, se puede decir
como resultado del anl i si s que A est ms relacionado con B que
con C. Si existe una especie del grupo, D, que no fue i ncl uda en el
anl i si s, O podr ubi carse, en pri nci pio, en cual qui era de las ram
del rbol; puede estar ms relacionado con A que con cual qui er
otro, o con B, l o cual hara al grupo (A+B) "no-monofi lti co." Esto no
contradice en modo al guno el resultado del anl i si s i ni ci al , que no
deca que A+B fueran un grupo monofiltico en un sentido absol uto,
si no que deca que A+B forman un grupo monofiltico respecto de C
-es deci r, que A y B estn ms relacionados entre s que con C. y
este lt i mo resultado se mantiene por ms que al agregar O aparez
ca ms cerca de A o de B. Por supuesto, tambin puede suceder
que al agregar O l os caracteres lnteracten en forma tal que ahora
A aparezca ms cercano de C que de B, en cuyo caso l a concl usi n
del anli si s i n ici al s se vera contradi cha. Lo mi smo puede suceder
s i se agregan nueos caracteres. Es obvio que la probabi l i dad de
que l as concl usi ones cambien cuando se agrega nuea informacin
depede no sl o del apoyo de los grupos, si no tambin de cunta
informacin se haya usade para sacar las concl usi ones en pri mer
l ugar. Si se han estudi ade sl e 5 especies de un grupo monofiltico
de 30 especies, es bastante esperable ql,e estudi ar l as 2S restantes
nos vaya a obl i gar a cambi ar nuestras concl usi ones respecto de l as
5 pri meras, perQ si se han observado 1 5 especies, l as concl usi ones
probablemente se modi ficarn menos al estudi ar las restantes 1 5.
Por l o tanto, si empre que se di sponga de informaci n debera in
cl ursela en el anl i si s, pero el no contar con ci erta informacin -
por ejemplo, el no haber podido estudi ar materi al de unas pocas
especies dentro de un gnero- no debe impedi r l levar a cabo estu
di os . . . que probablemente si gni fi caran un avance i mportante en la
sistemtica del grupo.
BIBLlOGRAFfA
La l ista sigUl'ente incluye algunos trabajos sobre disti ntos leras espedficos de
teora sistemtica. No es exhaustiva, Muchos trabajos se incluyen por ser represen
tativos de una postura dada ms que por cnslderrselos correctosinteresantes en s,
el.dstica y filos"f. en generl:
.B.II, l. 1 983. On groups, existence and the ordering oi nature. Sy'!. lool., 32:446-
45 1 .
-Be.lty, l . 1 9.82. CI.sse, and cladi't . Sys\. Zool., 31 :25-34.
-Brady, R. 1 982. Theoreti c.1 issues and "pallern dad,stics". Sys!. lool., 31 :286-291 .
-Brady, R. 1 983. ParsimonYI hierarchy aod biological Implications. AdvancEs i n
Cladi stics 2:49-60.
-Brady. R. 1 985. On the independence o systematics. Cladistics 1 :1 1 3-126.
-Farri" j. 1 983. The 10gio.1 Osis o phylogenetic an.ly,is. lin Advanees in Cladistics
2. Proceeding 01 the Second Meeting o the Willi Hennig Sodety. Platnick, N. and
V. Funk eds.] Columbia Univ. Pr.s,., pp.7-36.
-Farris, J. y A. Kluge. 1 985. Parsimony, synapomorphy, and explanatory powe,: A
reply to Dunean. Taxon 34:1 30-1 35.
-FelsenSlein, ). 1 978. T numbe, 01 evolutiona,y I'ees. Syst. Zool ., 27:27-33.
-Felsen,[ein,
l
. 1978. Cases i n whicn parsmony or compatibilily methads will be
posvely msleading. Sys!. looL, 27:401-410.
-Huelsnbeek, J. 1 997. 15 the Felsenstein zone a fly trap? SysL Biol. 46:69-74.
-Platnick, N. 1 977. Cladograms, phylogenetic lrees, and hypothesis testing. 5ysL lool.,
26:438-442.
-Plalnek, N. 1 978. Cl as5lf cations, hi storieal narralives and hypotheses. Sys!. Zool.,
27:365-369.
65
Pablo A. Golobrr
-Platnick, N. 1 979. Phi losophy and thetransformation ofcladistics. Sy.!. loo!" 28:537-
546. Platnick, N, and E, Gafrne. 1 977. Systematics: A Popperian perspctive. Sys!.
Zool . , 26:360-365.
-Platnick, N. and E. Gafney. 1 978, Evolutionary biology: A Popperian perspective,
Syst. lool., 27: 1 37-1 41 . Rosen, 0. 1 974, Cladism or gradism?: A reply to Ernsl
Mayr, Syst. lool . , 23:446-45 1 .
-Wile, E. 1 975. Kr1 Popper, Systemalics, and cl assiication: A reply to Walter Bock
and other evol utionary taxonomists, Sys!. Zool., 24:233-243.
Optimizacin y evaluacin de rboles:
Farris, J. 1967. The mean!ng of relationship and taxonomic procedure. Syst. Zool . ,
1 6:44-51 .
-Farris, ]. 1 970. Methods for computing Wagner Irees. Syst. Zool" 1 9:83-92.
-Fitch, W. 1 971 , Toward defining the course of eolubon: minmum cnange fer a
specifie tree lopology. Syst. Zool., 20:406-1 6.
-Golobaff, P. 1 993, Character optimization and ca!culation of tree lengths. Cladistics
9:433-436,
-Pimenlel, R. y R. Riggins, 1 987, The nature o cladistic data, Cladistics 3: 201 -209,
-Swofford, D. and W, Maddson. 1 992, Pal'Simony, character-state reconstructionsJ
ind Evolutionary nferences. En Systematics, Historical Ecology, and Norlh
American Freshwaler Fishes, R. M.iden (ed,), Slamlord Univ. Press, Slamford, pp,
1 86-223.
-Swoford, O. and G. Ol sen. 1 990. Pilylogeny reconstruction. I n: Mol ecul ar
Systematics. Hil l is and Moritz eds, Sinauer, Sunderland, Massachussets,
Bsquedas de soluciones ptimas/Programa de Computadora:
-Farr's, j. 1 970. Melhods for computing Wagner trees, Syst. Zool., 1 9:83-92,
-Farris, J, 1 988. Hennig86, programa y documentacin/ Port Jefferson Station, New
York.
-Goloboff, p, 1 996, Methods for fasler parsimony analysis, Cladistics 1 2: 1 99-220.
-Goloboff, p, 1 996, Pee-Wee, NONA, SPA, an Phasl, programs and doeumelation,
Willi Hennig Society Web Site, hltp://ww.vims.edu/-mes/heniglhenig.html.
-Goloboff, P. 1 997. Tree searehes under S.nkof parsimony, Cladistics (en prena),
-Maddison, O, 1 991 . Tile diseovery and importance of multiple islands 01 masl
parsimonius Irees. Sys!. Zool., 40:31 5-328.
-Platnick, N, 1 989, An empirical comparison of microcomputer parsimony programs,
11. Cladisties 5: 1 45-1 61 .
-Swofford, D, and G, Olsen. 1 990, Phylogeny reconstruction, In: Molecular 5ystematies,
Hill is and Moritz, oos" Slnauer, Sunderland, Massachussets.
&&
PRINCIPIOS de CLAOisTICA
Polaridad/enraizamiento:
-Farris, l. 1 991. Hennig detne paraphyly. Cladistics, 7:297-304,
-Maddison, W .. M. Donoghue, and D. Maddison. 1 984. Outgroup .nalysis ,nd
parsimony. Syst. Zool., 33:83-103.
-Nixan, K., .nd /. M. Carpenter, 1 993, On outgroups. Cladistics 9:41 3-426.
-Rieppel, O. 1 985. Ontogeny and the hierarchy of the types, Cladistlcs 1 : 234-246.
-Wheeler, Q. 1990. Ontogeny .nd charaeter phylogeny. Cladistics 6: 225-268.
-Weston, p, 1 988, Indirect and direct methods i n systematcs. En Humphries, C. ted.),
Onlogeny and Systemalics, Columb,a Univ. Press, New York, pp. 27-56.
Medicin de apoyo de grupos:
-Bremer, K. 1 994. Branch support "nd treestabil ity. Cladislics 10:295-304.
\/ -Carpenter,
l
., P. Golobff. y J. Farris. 1 996, PTP is meaningless, T-PTP i.s contradi ctor.
I
Cladistics (en prnsa),
-Faith, D. 1 991 . Cladistie permutation tests for monophyly .nd nonmonophyly. Sy'!'
Zool. 40:366-375.
-Farris, )., M. Kallerjo. A. Kluge, y C. Bult. 1 994. Permutations. Cladisties 1 0:65-76.
-Farris, J .. V. Al bert, M, KlIefjo, D. Lipscomb, y A. Kluge. 1 997. Parsimony jacknifing
outperforms nei ghbour joi ni ng. Cladislics 1 2:99-1 24. Felsenstein, J. 1 985,
Confidence l imi ts on phylogeies: an approacn using the bootstrap. Evolution,
39(4):783-791 .
-Huelsenbeek, J . 1 991 . Tree-Iength d'lribulion skewness: an i ndie.tor ophylogenetie
nlormati on, Sy'l. Zool. 40:257-270.
-Kallersjo. M., J. S. Far,;s, A. Kluge. y C. Bull. 1992. Skewness and perutalion. Cladisties
8:275-287,
Pesado de caracteres:
-C.rpenter, J. 1 988. Choo,ing .mong mulliple equ.lly parsimoniau, ciadograms.
Cl adi,tics 4:291 -296.
-Farris, J. 1969. A succesive approximations approach lo character weighting. SysL
Zool., 1 8: 374-385.
-Farris, J . 1 983, The lagica! basl! oi phylogenetic analy.is. [in Advances in Cladistics
2. Proeeedi ng o[ the Second Meeting 01 the Will i Hennig Society. Platnick, N. and
V. Funk eds.j Columbia Univ. Pros" , pp.7-36.
-Gol aboff. P. 1 993. Estim.ting eh.racter weights du'ing tree seareh. Cladistics 9: 83-
91 .
V' -Goloboff. P. 1 997. Self-weighted optmzation: character state recootruction and
tree searches under implied lransformation costs. Cladistics 1 3:225-245.
67
Pablo A. Golobof
Aplicaciones de la cladstica en biogeografa/comportamiento/conserva-
cin:
-Carpenter, J. 1 989. lesti ng scenari os: Wasp social behavi or. C1 adi sli cs, 5 : 1 3 1 - 1 44.
-Coddington, l . 1 988. Cladistic tests of adaptati onal hypotheses. C1 adi sli cs 4: 3-22.
-Fai lh, D. 1 992. Conservation ealuation and phylogenetic diversity. En Bi ol ogi cal
Conservation, Elsevier Publ i shers, pp. 1 - 1 0.
-Lipscomb, D. 1 992. Pa rsimony, Homol ogy, and l he analysi s of mul tistale chari;lClers.
C1adi sti cs 8: 45-66.
-Maddison, W. 1 990. A melhod for testing lhe correlated evol uti on of two bi nary
characters: are gai ns or l osses concentrated on certai n branches of a phylogenelic
tree? EvoJution, 44(3): 539-557.
-Mickevich, M. 1 982. lransformation Series Analysis. Syst. lool . 31 : 461-473.
-Nel son, G. and N. Platnick. 1 9 9 1 . lhree-laxon slatements: a more precise use of
parsimony? Cl adi sli cs 7: 351 -366.
-Pl atni ck, N. 1 993. Character optimi zati on and weighting: Diferences between the
slandard and lhree-laxon approaches to phylogeetic i nference. Cl adi sli cs 9: 246-
259.
-Wi l l i ams, P., R. Vane-Wright, y C. Humphri es. 1 9XX. Measuring biodiversiLy for
choosi ng conservati on areas. La Sal l e and Gaul d (eds.), Hymenoptera and
B i od i vers ity.
Conceptos de especie y su relacin con la teora cladistica:
-Ghi sel i n, M. 1 974. A radical sol uti on to the species problem. Sysl. lool . 23: 536-
544.
-Lyvlrup, S. 1 987. On species and other Laxa. C1adislics 3: 1 57 -1 77.
-Nel son, G. 1 989. Species and Taxa: systematics and evol uti on, f i n Speci ati on ami its
consequences. D. Otte and J. Endl er, eds.] Si nauer, 5underland, Massachusetls,
pp.60-81 .
-Nixon, K. and Q. Wheeler. 1 990. An amplificationof the phylogretic species concept.
Cladistlcs 6:2 1 1 -223.
Contenido de informacin y comparacin entre distintos mtodos de clasi
ficacin:
-Farris, J. 1 9 7 1 . lile Ilypothesi s of nonspecificity and taxonomic congruence. Ann.
Rev. Ecol. Syst. 2: 277-302.
-Farris, J. 1 972. Estimating phylogenetic trees from distance matrices. lile American
NaturaJisl 1 06(951 ):645-668.
-Farris, J . 1 979. On lhe naturalness of phylogenetic cl assificali on. SySl. lool . 28:200-
2 1 4.
-Farri s, J . 1 979. lhe i nformalion contenl of the phyl ogenetic syslem. Syst. lool . 28: 483-
5 1 9 .
68
PRI NCI PI OS ee CLADSTICA
-Farris, J . 1 980. The efficient diagnoses of the phylogenetic system. Syst. Zool . 29: 386-
40l .
-Farris, J. 1 981 . Di slance dala i n phylogenetic anal ysis. [i n Advances i n Cl adi sli cs:
Proceedi ng of the Fi rsl Meeti ng of the Wi I l i Hennig Sociely. Funk, V and D. Brooks,
eds. pp. 3-23.
-Farri s, J. 1 982. Si mpl i ci ty and informativeness i n systematics and phylogeny. Syst.
lool . 31 : 41 3-444.
-Farris, J. 1 986. On lhe boundaries of phylogenetic systematics. Cladistics 2: 1 4-27.
Mickevich, M. 1 978. Taxonomi c congruence. Syst. Zool . 27: 1 43-1 58.
-Saitou, N. and M. Nei . 1 987. lhe neighbour-joini ng method: a new melhod for
reconstructing p!1yl ogenetic trees. Mol . Bi ol . Evol . 4(4):406-425.
Textos Generales (excepto el de Forey et. al . , los dems son poco recomendabl es
como introduccin prctica):
-Brooks, D., J. Caira T Platt and M. Pritchard. 1 984. Pri nci pi es and methods of
phylogenetic systematics: A cl adi stics workbook. Univ. of Kansas, Museum of Na
tural Hi story Speci al Publ icati on. 1 2, 92 pp.
-El dredge, N. and J. Cracraft. 1 980. Phyl ogenetic palterns and the evolutionary process.
New York, Col umbi a Univ. Press, 349 pp.
-Forey el. al . 1 992. Cl adistics: a practical course in systematics. Clarendon Press,
Oxford. 1 91 pp.
-Hennig, W.' 962. El ementos de una sistemtica filogentica. ' EUDEBA, Buenos Aires.
-Nelson, G. and N. Pl atni ck. 1 981 . Systematics and bi ogeography: cladistics and
vicariance. Col umbi a Univ. Press.
-Rieppel, O. 1 988. Fundamentals of comparative bi ol ogy. Bi rkhauser, Basel.
-Sober, E. 1 988. Reconstructing the past: parsimony, evol uti on, and inference.
Massachussetts Inst. of lechnology, Cambridge, 265 pp.
-Wi l ey, E. 1 98 1 . Phyl ogenetics: lhe theory and practice of phylogenelic systemati cs.
J. Wiley and sons, eds. , New York.
-Wi l ey. E . D. Siegel-Causey, D. Brooks, V. Funk. 1 991 . The compl eat cl adi st: a primer
of phylogenetic procedures. Kansas Museum of Nat. Hi st. , speci al publi cati on No.
1 9, Lawrence, Kansas.
69
'.
Aptmdc 1 .
Algoritmos rpidos para opti mi zacin. Se apl i can slo a rboles
dicotmicos (para que se apliquen tambin a politomas, es necesario modi
ficarlos).
Optimizacin de Fitch
Este mtodo de optimizacin I Fitch, 1 971 ) se usa solamente para ca
racteres no aditivos ("no-ordenados"), o sea, cuando se considera que una
transformacin entre dos estdos cualesquiera requiere el mismo nmero de
pasos. El caso de caracteres binarios es un caso especial de este tipo de
opti mizacin. Se hace tambin en dos pasadas:
1 ) Pasada "hacia abajo". La asignacin de los conjuntos prel i minares
se hace de dos formas posibles:
a) Interseccin: si los descendientes del nodo a ser asignado tienen
estados en comn en sus conjuntos prel iminares, se asigna al con
junto preliminar del ancestro los estados compartidos.
b) Uni n: si los descendientes del nodo a ser asignado no tienen esta
dos en comn en sus conjuntos prel i minares, se asigna al conjunto
preliminar del ancestro todos los estados de los dos descendientes.
Para calcular el nmero mnimo de pasos para el carcter en el rbol
dado, cada vez que es necesario hacer una unin (es decir, que no hay
estados compartidos por los decendientes), se i ncrementa el nmero de
pasos en uno. El Apndice 2 muestra una funcin, Iree_encH0.que
implementa este mtodo (dicha funcin hace solamente l a pasada hacia
abajo, ya que s610 debe calcular la longitud del rbol) usando los operado
res '&' y ' 1 ' del lenguaje e (bitwise 'anding' y 'oring' -equivalentes a l a
interseccin y unin, respectivamente, de l os conjuntos de bi ts).
2) Pasada hacia arriba: El conjunto final de la ralz del rbol es igual a
su "conjunto preliminar". Se asigna los conjuntos finales de estados posi
bles para cada nodo, como sigue:
71
Pablo A Golobof(
a) Si el conjunto prel i mi nar de un nodo contiene todos los estados
presentes (tenga o no tenga ms estados) en el conjunto fi nal de su
ancestro inmediato: el conjunto final del descendiente es igual al
conjunto final del ancestro. En otras palabras, se el i mi nan todos
los estados del descendiente no presentes en el ancestro.
bl Si el conjunto preliminar de un nodo no contiene todos los estados
presentes en el conjunto final de su ancestro inmediato:
i) Si el conjunto preliminar del nodo en cuestin fue formado por
una unin de los conjuntos de sus descendientes, mantenga esos
estados y agregue los estados presentes en el conjunto final del
ancestro inmediato del nodo. Esto formara el conjunto final del
nodo en cuestin.
ii) Si el conjunto preliminar del nodo en cuestin fue formado por
una interseccin de los conjuntos de sus descendientes, man
tenga esos estados y agregue cada estado presente en el conjun
to fi nal del ancestro y al menos uno de los conjuntos prelimina
res de los descendientes. Esto formara el conjunto fi nal del
nodo en cuestin.
Optimizacin de Farris
Este algoitmo (Farris, 1 970) se utiliza para caracteres "aditivos" u "or
denados" l i neales. En este caso, el costo de transformarse de un estado a
otro es su diferencia numrica; por lo tanto, para cualquier X, Y Y Z, el costo
de transformarse de X a Y es la suma de l os costos de transformarse de X a Z
y de Z a Y (de ah que se los l l ame "aditivos"). En este caso se asigna a los
nodos rangos de estados (o "i ntervalos"), ya que siempre que dos estados X
e y puedan producir longitud mnima, tambin la producir cualquier esta
do Z, si X<.Y, o X;Z; y (o sea: si Z es intermedio entre X e Yl. La pasada
hacia abajo se describe a continuacin:
1) Si los intervalos se superponen, se asigna l a parte comn. Supon
gamos:
0-3 2-6
LJ
i
O 1 2 3 4 5
I I I I I I
------. _--
--_._.
-
6 7
I I
a
I
dse . iZQ.
dese. der .
noo 2-3
PRINCIPIOS de CLAOISTICA
2) Si los i ntervalos no se superponen, se asigna el intervalo de longitud
mnima que una a los dos intervalos descendientes. Supongamos:
O 1 2
I I I
------
0-2 4-6
L?J
i
3 4 5 6
I I I I
------
7
I
8
I
dese. i zq.
dese. dr .
nodo 2-4
Para cal cul ar l a longitud, toda vez que se apl i c,1 l a regl a (2), se
incrementa l a longitud en un n mero de pasos igual a l a longitud del inter
valo (en el ejemplo se agregaran 4
-
2 " 2 pasos),
La pasada haci a arriba es un poco ms complicada, Farr;s (1 970)
propuso un algoritmo que encuentra slo una reconstruccin} incluso cuan
do hay ambigedad; autores posteriores propusieron otros algoritlnos que
encuentran todos los estados posibles. Au se describe el de <oloboff (1 993);
dados dos intervalos no superpuestos X e Y, defnase al "estado de X ms
cercano a Y" como el menor estado de X si todo Y es mayor que cualquier X,
y viceversa, Se apl i can las siguientes reglas:
1 ) Si la i nterseccin del conjunto del ancestro con el del nodo es
i gual al conjunto del ancestro, se asigna al nodo el conjunto del ancestro.
2) Caso contrario, si la unin de l os intervalos prel i mi nares de los
descendientes y del nodo, intersectada con el intervalo final del ancestro,
no produce un conjunto vaco, se asigna al nodo dicha i nterseccin. Si no
hay estados compartidos entre el conjunto prel i mi nar del nodo y el {jnal del
ancestro, se agregan todos aquellos estados que unan al conjunto del ances
tro con el conjunto preliminar del nodo.
Ejemplos:
73
--
0-2 4-6
|: -> preliminar:
i'
O 1 2 3 4 6 7 8
I I I 1 I I I I
0-2 4-6
|: -> preliminar:
s'
O 1 2 3 4 6 7 8
I I I I I I I I I
--
--
2-4
desc. izq.
desc. der.
nodo (prel iminar)
ancestro
noo i-s
2-4
desc. izq.
desc. der.
n (prel im1nar)
anestro
nodo 4-6
3) Si l as regl as 1 2 no se apl ican, se asi gna al nodo un intervalo que
vaya desde el estado del interval o prel i mi nar del nodo ms cercano al inter
valo final del ancestro, hista el estado del intervalo de uno de los descen
dientes ms cercano al ancestro,
Ejempl o:
0-2 1 -4
|-
->
p
rel imi nar: 1 -2
5'7
O 1 2 3 4 5 6 7 8
|
-----
-------
._.... -
74
desc. i zq_
desc . der.
nodo (
p
reliminar)
ancestro
nodo - 2-4
Aptmd c Z.
tlemplo de cdigo. en lenguaje para leer una matri z de datos,
generar un rol de Wagner, y hacer permutacin de ramas mediante corle
simpl e. El rbol resultante es salvado en notadn parenttica y di bujado,
por l as {unciones drawtreeO y pri ntreeO, la longitud es calculada en cad.l
caso con l a funcin treeJengthO, El rbol es tratado como una lista de
ancestros (dne[ D, y descendientes izquierdos (Ieftdel J ) y derechos (rightdesl
J); para nt terminales, los termi nal es Se numeran de O a nt- l , los nodo,
i nternos de nt a 2*nt-2, El nodo basal (l a raz) es 2'nt-2; los otros nodos
i nteros se numeran de cualquier forma (la (uncin que optimiza hace Ula
lista del orden de los nodos antes de l a optimizacin en s), L, funcin
do_swapsO permuta slo un rbol; en casos reales. casi siempre es neceSil
ro salvar rboles ml ti ples -lo cual requerira funciones adicionales par
asegurarse de que los rboles no son idnticos y para el i mi nar los grupos no
apoyados por sinapomorfas produciendo >olitomas (caso contrario, se ge
neran enormes cantidades de rboles superfluos!. Es posible cal cul ar l a
longi tud en forma mucho ms rpida que con una optimizacin completa,
pero esto requiere cdigo ms compl i cado. Como este ejemplo hace
permutacin simpl e en un solo rbol, en muchos casos :especi al mente para
datos de mayor nmero de taxones) se queda "atasc" do" en una i sl a (pese a
todos estos problemas, es mucho ms efectivo que una bsqueda a mano!.
Los conjuntos de estados se almacenan como conjuntos de bits ON/OF. El
estado O "presente" tendr el bit O 12_1 1 como ON; el conjunto lO, 1 . 31
tendr entonces como ON a los bits 0. 1 Y 3 ( o sea, ser el nmero 2" + 2' +
2' - 1 1 ). la funcin treeJengthil considera a todos los caracteres como no
aditivos (opti mizacin de Fi tchL Las i ntersecciones y uniones entre los
conjuntos de estados se hacen fci l mente con los operadores & (bi twise
.nd) y I Ibi ti wi se i ncl usi ve or) del lenguaje C; as !O, l , 3) p 1 1 ,2,51 ser
equivalente a 1 1 & 38 = 2,
7S
Pablo A Coloboff
#include<stdio.h>
#include<timeh>
#define NT 90
#deline NC 1 20
#deine MISSING 1023
nt nc, nt, rool;
inl leitdes l2NTL rightdes[2'NT], anc[2'NT], I ist[2'NT],
rnatrix[2'NTllNCI, groupszeI2'NTI, abs[2'NTI;
char laxnarneINTI ! 1 51 ;
void readdataOJ dowagnerOf doswapsO drawtree(int) printree(void);
i nt sister ofO! tree lengthO;
FILE " nfile, "outile;
void main(int argc, char Hargvl t
doek_t clockO, usedtime;
il(arge < 2) l lprintl(stderr,"\n\n"
Un programa de demostracin para parsimonia\n"
crea u n rbol de Wagnery hace permutacin de ramas\n"
(con una optimizacin de pasada hacia abajo para\n"
calcular el largo en cada reacomodamiento)\n\n"
" Argumentos:\n"
W
1 archivo de input \n"
2 archivo de output {opcional; default consola)\n\n"
Formato de los datos (ejemplo):\n"
7 5\n"
" . laxnameO OOO-OO?\n"
!axname 1 000001 0\n"
laxname2 1 1 1 0000\n"
taxname3 1 1 1 1 1 00\n"
laxname4 1 1 1 1 1 1 O\n\n");
exil(O); )
1[( (infile =fopeniargvl1 1, "r")) == NULU
t fpri nd{stderr, tI\nNo se encuentra el archivo los \n" arg[ 1 l);
exit(Q); )
outfile : stderr.:
il(arge > 2 outlile = fopenlargvI2Ii'w"i;
usedtime = dock!);
read._dataO;
do_wagner):
doswapsO;
fprinlfloutlile,"\nARBOL \nni;
drawtree(root;
pri ntreeO;
usedtime ::clockO - usedtime;
fprintttstderr, N\n\nEjecucin completada en C/0,1 f segs, \n"

((floaO usedlimelCLK_ TCK):


exil(1 J; 1
vod readdata() I
i nt al b.char state;
76
PRINCIPIOS de CLADISTICA
nt = nc : 0;
fscanfniile," %i %i", &nc, &nO,;
ifne<l I I nt<4 1 1 nc>NC 1 1 nl>NTj
I fpnntstderr,"`n|rrOrenla matriz, nmeros de crs.I|x... \n" );ext(O); }
for{a=O;a<nt;++a)
! Iscanf(nfile," "s, &taxnamelaJ);
lorlb : 0.b<nc; ++b)
I
fscanf{nf Ie'".ec, &state};
if(isspace(state)) I b,continue; )
illstate! : '?' && s||e!= && !sdi|lsta|e))
! Ipr o|llstderr
"\nError en la matriz, cr ". taxon ">\n",
b, laxnamelall;
exit|0).I
ilistate:= '1' I l state == '.') matrix[a][b] MISSING;
elsem|rx|lb| = 1 (slate.O'I; JI
root :: 2"nt-2;
fprintflstderr,"\n \nDATOS LEIDOS, );
re|urn,
void do_wagnerO I
i nt irs|nOde,taxon_to_add. position,
besCposition, . x,y, bes|_en|h,
Iprlntf(stderr," \nCREANDO ARBOL DE WAGNER ... \n");
leftdes [root] = 0;
lihtdeslrOO| =nt;
leftdes[nt] : ot- 1 ;
rhtdes|nt = nt-2;
anc[ot-ll : anc[nt.2] =nt;
nc|nI = nc0" root;
rstnode ^ nt;
taxon_to_add = ot-3;
whilel|xOn to add)
I
Iprin|IU:derr, "JI pOragregaL. taxon_lo_add);
=Z;vhleI.. 1 rinIstderr b
ancftaxon to add] : ++firstnode;
beslenI\ =J Z767;
IOrIpOstOn =(taxon_to_add+1); position<firstnode; ++position)
I x =aoc!posltlon1;
y =sister_oHpositionl;
leltdes[firStnodel = position;
rihtdes[Ii rInode1 : taxon_to_add;
Ieltdes l =y;
rightdes[xl =Irs!nOde;
nciIrstnode] = Xi
anc[posltlonJ = !nInOde,
a =|ree_en|h0;
l <besIen|h
I besten|h= a;
77
--
Pablo A. Golobo{f
Oe>!jOi|iOn = ostion;J
anclosition =x;
Ieloes|x y;
rl0htoesl =posl|lon;

positon =Oestposltlon,
anclositlon;
y ;; sister_oI|post|lon),
|eoes|i rstnooe =pos|lon;
ri0htoes|Iirs|noo0l =|axon|o aoo,
|e|Ioes! y;
rl0h|oes| =Ilrs|nOoe:
anc|Irs|nooe| =x:
anc losi|ion! =llrstnooe:
-taxon to aoo:

.
tree1en0Ih|);
IprlntloutIiIe.Lanoo0IarOo| oeVa0ner."I", a),
i|outIlIe!=s|o0rr) Irn|I|out||e,`n");
return;
int|ree_en0Ihut
in| nooes_oone, nooes_|o_oo. a, O, c,
_st|es.O_staIes,cs|ates,x,Ien0th;
IsI|0 =|oo|:
nooes_oone = 0.
noOes_to_oo 1 ;
vh|e\nooes oone <nOoes to oo)
I a =| i s||noDes_oon0++.
IIleI|oesla >=nt)
ls|| noo0so_oo++ =leItoes|a;
llrl0htoes|a >=nU
Iist| nooeso_oo++ =ri0htoes|a;
Ien0th =0;
vhiIe|nooes to oo!
l a = |ist| --nOoC$_to_oo ;
O=|eI|oes|a,
e =rl0h|oes||,
Ior|x =0.x<nc,++x
I OsIates = ma|rx|O
Ixl;
e sttes=ma|r |clx!:
a_states b_s|aIes & C_sta|es;
il|a_sta|es==O)
\ _stat0s =O_>tates c_states;
++|en0|h,
matrxla|| =asta|es.J I
r0turnl|en0th);J
78
PRINCIPIOS de CLADISTCA
i nt sister of(int which) I
if(whico leltdes lanclwhich])) return I,ightdeslanciwhich
1 1 1;
return Ileltdeslanclwhiehlll;
I
void drawtreelint whch) I
int a
fpnntf(outii le, "("J;
for(a : O;a<root;++a)
iflandal == woieo)
ifla<nt) fprintf(outfile:%s ", taxname!all;
cisc drawtree(a);
Iprintlloutfile,")"); J
void do_swapsO
I
i nt x, 'I Z, dz, w, u, bestJength, clip, desl, foundbetter_tree, 3
long int rearrangs;
fprintlslderr,"\nHACIENDO PERMUTACION DE RAMA5...\n");
rearrangs=O;
bestJength = treeJengthO;
fo,(cl ip 1 ; cli p<root; ++elip)
foundbelter_tree : O;
if(anc[elipl "" root) eontinue;
x anc[cli pl ;
dz ::si ster ... o(x):
l ^ anc[x]
w :;si ster_of(cI ip};
leftdeslx) rightdes[x] = cl i p;
ancldz] = z;
anc[w] = z;
leltdes[z] = dz;
rigotdes!zl = w;
lor(de" = 1 ; dest<root; ++destl
I if(desl==w) cont'nue;
a ;;dest;
while(a != root && a ! = xl a = ancla];
if(a =" x) continue;
y = aneldest);
u = sister _ofldest);
ancidest] = x;
79
Pablo A, Goloboff
anelxl = y;
leftdeslyl = X;
rightdeslyl = u;
rightdeslxJ = de'l;
a = treeJengthO;
++rearrangs;
ifla < besUengthl
I besUength = a;
found_beltertree ; 1 ;
fprintf(stderr,
" arbol de %51 pasos encontrado .. ,", a);
a=40; while(a--) fprintf(stden,"\b");
break; 1
leftdesly] = des!;
aneldestl = y; 1
i fffoundbetteuree) I clip = 1 ; continue; 1
righldeslxl = w;
anc[wl = x;
anc\xl * z;
rightdeslzl = X;
leltdeslz] = dz;
I
fptintf{outfil e, "Largo final; %i (% l reacomodamientos hechosl\nll,
be'Uength, reanaogs);
relurn; I
void printree() I
i nt a, b, e, x, printedJines;
or(a;O;a<nt;++a} group,.sile[a] ; 1 ;
for(a:;;nl;a<:fooi;++3) group_size[al = O;
for(a;; O;a<nt;++i)
I b = a;
whi le(b != rool)
a ;0;
b ; 1 ;
1 b = anc[bl;
++groupsizelb]; 11
Iist[OI = root;
anelrootJ = root + 1 ;
leftdeslrot+ 1 ] =rool;
rightdeslroot+ 1 ] = rightdeslroot]:
abs]root+ 1 1=0;
while(a < b) [
e = listla++l :
irlc == l eftdeslanc[elJ)
absle] = abslanclcJl;
else abslel = abs[anC[cJl + groupsizelsister_or(cll:
if(e >= nI) I
Iistlb++1 = letdeslcJ:
l istlb++J = rightdeslcJ: 1
80
iJ!NCtf'IOS de ClAIJI ST!CA
I
pri
nlloutn le," \n \n":;
pri ntedl i nes ::O;
l i sl l ol rool;
x :: O;
wh le{orinted,. l lIles <: nI ) I
; : lis! (xl;
i{'l<: O! I fprintf(omfl(-/,
11)
;
++x:
contlnue; i
i(;b,lal>prin1edJine,) 1
fprintf(outfile/ 1 );
++x;
conLinue; 1
if(" l eldeslonc! al l )
I
pri ntf\oLllfi l e, " );
Iis11xJ sisler_of(il;;
else fpri ntloutfi l e/ el;
l isllxl - I ; !
if(l >= nO
I l!$tl++x! ::lefldesial;
fprintf(outfile,"
T
, ,1);
retur:
else t fprntfloulJile,"- 'Ys\n , taxn,une[a\):
x = 1 ;
++prinletli nes;
8 1

Você também pode gostar