Você está na página 1de 64

Introducción a la primera parte

En términos muy generales, la filosofía de la ciencia tiene dos tareas


principales. Una es explicar los rasgos que son comunes a todas las ciencias
(o por lo menos a todas las ciencias empíricas), y la otra es dar cuenta de lo
que las diferencia unas de otras. Para comenzar con la segunda, la distinción
entre las ciencias naturales y las humanidades (Geisteswissens-chaften) tiene
una larga tradición. Dentro de las ciencias naturales se puede distinguir,
además, entre el estudio de la naturaleza inorgánica (o física) y el estudio
de la naturaleza orgánica (biología). Dentro de las humanidades tal como se
las ha definido tradicionalmente, se ha producido una escisión entre las
ciencias sociales (que defino en términos muy amplios como para incluir la
lingüística, la historia y la psicología además de las disciplinas más obvias) y
las disciplinas estéticas o artes. Ahora bien, estas distinciones temáticas no
resultan en sí muy interesantes. Si hay algo pertinente, debe surgir de que
se las correlaciones con otras clasificaciones. Voy a analizar tres de esos
modos de clasificar a las ciencias: según el método, según el interés
subyacente, y según la modalidad de explicación.
Una concepción ampliamente sostenida indica que las ciencias se dis-
tinguen entre sí según los métodos característicos que utilizan. Según este
punto de vista, las ciencias naturales utilizan el método hipotético-de-
ductivo, las artes, el método hermenéutico y las ciencias sociales, el mé-
todo dialéctico. No siempre resulta claro si se trata de métodos para la
construcción de teorías o para su verificación, salvo el caso del método hi-
potético-deductivo que sin duda pertenece al último tipo. Voy a exponer
mis opiniones sobre este punto, en forma muy sucinta y sin mucha argu-
mentación. 1) El método hipotético-deductivo es el método de verificación en
todas las ciencias empíricas. Si el método hermenéutico se lo entiende como
un procedimiento de verificación, sólo puede ser una subespecie del
hipotético-deductivo. Para ser más preciso, el método hermenéutico es el
método hipotético-deductivo aplicado a fenómenos intencionales, con al-
gunos rasgos peculiares que se deben a la naturaleza de esos fenóme-
nos.[l] 2) Si el método hermenéutico se concibe como un método deformación
de teorías, coincide con la noción de explicación intencional. 3) El método
dialéctico como procedimiento de verificación supone algún tipo de
apelación a la "praxis", es decir, a la idea de que las teorías sociales pueden
ser al mismo tiempo agentes del cambio y explicaciones del cambio.

19
aparecen dos tricotomías cruzadas entre sí, de modo que cuando una de-
terminada modalidad de explicación es claramente pertinente para un
campo dado, la entrada correspondiente dice: "Sí", y cuando es claramen-
te irrelevante, la entrada dice "No". En los casos en que hay motivos de
duda la entrada es "?". En última instancia los casos dudosos resultarán
asimilables a los indudablemente irrelevantes, pero será necesario argu-
mentar mucho para explicar en qué sentido esto es cierto, y con qué al-
cances.

Cuadro 1

Física Biología Ciencia social

1 4 7
Explicación Explicación
¿Se aplica la subfuncional subintencional
Sí c¡r cjf
explicación
causal? Explicación Explicación
suprafuncional supraintencional

2 5 8
¿Se aplica la
explicación No Sí ?
funcional?
¿Se aplica la 3 6 9

explicación No ? Sí
intencional?

En la primera parte propiamente dicha voy a analizar en detalle qué


significan las diversas categorías del cuadro. Por el momento me limito a
presentar breves comentarios sobre cada una de las nueve entradas.
1) La explicación causal es la única modalidad de explicación en físi
ca, y la física es el ejemplo y el modelo estándar de una ciencia que utiliza
la explicación causal. Más adelante, en las sucintas observaciones sobre
física que haré en el capítulo 1, me limitaré en la mayor parte de los casos
a la física clásica, anterior a la teoría de la relatividad y a la física cuán
tica.
2) Las explicaciones funcionales suponen, para anticipar, nociones ta
les como beneficios, adaptación, selección y evolución. Podría parecer ob
vio que no hay lugar para todo esto en la física, pero hay quienes no lo han
creído así. C. S. Peirce consideró que el universo realmente existente es
sólo una de las múltiples configuraciones posibles de átomos, seleccionada

21
—por algo parecido a una cadena de Markov absorbente— a causa de su
estabilidad.[5] Pero no creo que haya físicos que suscriban hoy este punto
de vista. Aunque a veces se sostiene que las constantes fundamentales de
la física cambian con el tiempo; que yo sepa nadie ha señalado que ese
cambio pueda concebirse como evolución o progreso.
3) También existe hoy un acuerdo generalizado de que no hay lugar en
la física para la explicación intencional o teleológica, pero este consenso es
relativamente reciente. La cuestión es mucho más compleja y va más allá
de la explicación funcional en física. La extensa tradición aristotélica en el
campo de la física, finalmente quebrada por Galileo, a mi entender hoy no
es admisible.[6] Pero el razonamiento teleológico en física de ninguna ma
nera desapareció con la revolución científica del siglo XVII. Durante mucho
tiempo se pensó que el principio del menor tiempo y otras formulaciones
variacionales de las leyes físicas tenían una base teleológica. Al parecer,
la luz era capaz de un comportamiento inteligente, de tomar caminos indi
rectos para llegar a la meta en el mínimo tiempo posible.[7] Análogamen
te, otros procesos de la naturaleza parecían reducir al mínimo la acción, la
energía o el trabajo. Puesto que todo proceso físico puede describirse como
la minimización o maximización de algo,[8] es fácil caer en la idea de que
debe de haber un sujeto —alguien que minimiza o maximiza— como guía
del proceso. Por lo menos ésta fue una noción admisible en tanto los físicos
supusieron que funcionaba una intencionalidad divina en el universo físi
co. [9] Con la secularización de la física, ya no resulta posible sacar la con
clusión retrospectiva de que existen intenciones de maximizar a partir de
conductas de maximización.[10] Tampoco existe ninguna otra manera de
explicar por ejemplo la conducta de un péndulo, por la tendencia a reducir
al mínimo la energía potencial.tll] Las fuerzas que actúan en el péndulo
explican tanto por qué se mueve como lo hace y también por qué tiende a
reducir al mínimo la energía potencial. Este último efecto no tiene capaci
dad explicativa por sí mismo.
4) Por supuesto, la biología invoca en forma decisiva la explicación
causal. De hecho, la explicación funcional en la biología sólo está justifica
da cuando creemos en la verdad de una determinada teoría causal, que es
la teoría de la evolución por selección natural. Por causalidad subfuncio-
nal en biología, entiendo los errores o mutaciones accidentales que, por
una parte hacen posible la selección y la evolución natural, y por otra par
te son responsables de fenómenos tales como el envejecimiento y el cáncer.
Estos errores no tienen ninguna función, contrariamente a la idea popular
de que la función de las mutaciones es la de permitir y estimular la evolu
ción de la vida en laTierra.[12] Por causalidad suprafuncional entiendo la
interacción causal de muchos organismos individuales, cada una de cuyas
conductas puede ser explicada funcionalmente. Por ejemplo, existen aná
logos biológicos de "consecuencias no queridas" de la conducta individual.
5) La biología es el paradigma de la explicación funcional, tanto como
la física lo es para la explicación causal, y la ciencia social para la intencio
nal. La estructura de la explicación funcional en biología la presento en el
capítulo 2. En este punto sólo voy a formular la conclusión de ese análisis:
un rasgo estructural o un esquema de conducta de un organismo se expli-

22
ca funcionalmente cuando se muestra que forma parte de un máximo
local para el organismo respecto de su capacidad reproductora.
6) La explicación intencional en biología prácticamente nadie la sus
tenta hoy, como lo hicieron los biólogos predarwinianos, quienes no po
dían explicar la adaptación de los organismos salvo si postulaban la exis
tencia de un creador divino. Sin embargo, creo que algunos biólogos y filó
sofos de la ciencia han sido llevados a subestimar las diferencias entre la
adaptación funcional y la intencional, de modo tal que en realidad razo
nan como si la evolución de los organismos fuera guiada por algún agente
intencional. Así, atribuyen a la selección natural la capacidad de simular
algunas de las formas más complejas de adaptación intencional, como por
ejemplo la capacidad para utilizar estrategias indirectas. Contra esto voy
a argumentar que tal simulación, si bien no es imposible, es mucho menos
característica de la selección natural que la tendencia a llegar al reposo
en la máxima local lograda por la adaptación creciente.
7) La explicación causal en las ciencias sociales puede entenderse en
un marco parcialmente semejante al que se utiliza para el análisis de la
causalidad biológica. En primer lugar, todos los fenómenos cubiertos por
la explicación intencional también pueden explicarse causalmente, aun
que la relación es bastante diferente de la que se da entre el análisis fun-
cional y el causal. En segundo lugar, aun aquellos que no estén de acuer-
do con este punto de vista, deben aceptar que existe algún lugar para la
explicación causal en el análisis de la conducta humana. Interviene la
causalidad subintencional en las operaciones mentales que no están regi-
das por la voluntad o la intención, sino que se producen —hablando meta
fóricamente— "en el fondo" de ese individuo. La causalidad suprainten-
cional se refiere a la interacción causal entre actores intencionales. (Ade-
más existe la interacción intencional entre actores intencionales que es la
estudiada por la teoría de los juegos.)
8) La más controvertida de las afirmaciones que se exponen en esta
obra es la negación del papel de la explicación funcional en las ciencias
sociales. Aquí no me refiero a explicación funcional en el sentido mencio
nado anteriormente, que supone el beneficio puramente biológico del
incremento de la capacidad de reproducción. Ese tipo de razonamiento
biológico tiene un lugar en el estudio de la conducta humana, aunque muy
limitado. Pero aquí me refiero a explicaciones de fenómenos sociales en
términos de beneficios no biológicos. No me atrevería a negar que tales
consecuencias beneficiosas puedan explicar sus causas aun cuando los be
neficios no sean biológicos, siempre que se especifique algún mecanismo
de realimentación. En biología la teoría de la selección natural crea la pre-
sunción de que todo lo que beneficie a la capacidad reproductiva también
puede ser explicado por esos beneficios. En ciencias sociales no existe una
teoría de generalidad comparable, de modo que el verdadero mecanismo
debe ser explicado en cada caso particular.
9) El bloque básico en las ciencias sociales, la unidad elemental de ex
plicación, es la acción individual guiada por alguna intención. Me propon-
go argumentar que la adaptación intencional difiere de la funcional en
que la primera puede estar dirigida hacia el futuro distante, mientras que

23
mentación la concepción que me parece la más admisible, la de Donald
Davidson.[15] Dentro de esta concepción es posible ser materialista en la
cuestión referida a mente-cuerpo, sin ser además reduccionista. Los esta-
dos mentales por supuesto son estados cerebrales, pero esto no significa
que hablar de estados mentales pueda reducirse sin ninguna ambigüedad
a hablar de estados cerebrales.
Para explicar esto un poco mejor, voy a utilizar V como variable indi-
vidual y "a" como constante individual, que denota a alguna persona de-
terminada. Decir "a cree que Beethoven murió en Viena" es un enunciado
acerca de la persona a, mientras que "x cree que Beethoven murió en Vie-
na" es un predicado que puede aplicarse a una determinada persona, co-
mo a, al reemplazar su nombre por "x". En este sentido Davidson es mate-
rialista porque cree que el hecho expresado por el enunciado "a cree que
Beethoven murió en Viena" puede ser descrito en forma exhaustiva por al-
gún enunciado neurofisiológico (presumiblemente muy complejo). El enun-
ciado, si es verdadero, lo es porque una determinada persona en una si-
tuación dada cree que Beethoven murió en Viena, y una descripción fisio-
lógica completa de la persona en esa situación contendría también una
descripción (en términos fisiológicos) de su creencia de que Beethoven
murió en Viena. Por otra u
parte, Davidson es antirreduccionista porque
piensa que el predicado x cree que Beethoven murió en Viena" no es ex-
tensionalmente equivalente a cualquier predicado neurofisiológico. "Si un
determinado concepto psicológico se aplica a un acontecimiento y no a
otro, debe de haber una diferencia describible en términos físicos. Pero de
esto no se sigue que existe una única diferencia describible físicamente
que distingue a cualquiera de dos acontecimientos que difieren en un as-
pecto psicológico dado. [16] Por lo tanto, concluir que a partir del materia-
lismo se es reduccionista es cometer la misma falacia que cuando del he-
cho de que todo tiene una causa, se concluye que hay algo que es la causa
de todo.
Una consecuencia de la concepción de Davidson es que las acciones
son causadas por creencias y deseos. Por supuesto, decir que lo que hace
el agente, p, fue causado por el deseo de hacer dep, no es dar una explica-
ción causal. Es sólo parafrasear la explicación intencional de modo de in-
dicar la existencia de alguna explicación causal (desconocida). De todas
maneras, no me faltará oportunidad de utilizar este lenguaje de las creen-
cias y deseos que provocan acciones, ya que resulta muy conveniente para
muchos propósitos. En particular es muy útil para establecer un modo co-
herente de hablar acerca de los fenómenos irracionales.
Por lo tanto, creo que la explicación intencional es algo sui generis en
un sentido que no vale para la explicación funcional. Se puede usar la ex-
plicación causal, se puede hablar acerca de todo lo que existe, pero eso no
nos permitirá distinguir los fenómenos mentales de todo lo demás que
existe. Una analogía tomada de la matemática puede resultar esclarece-
dora. Existe una axiomatización determinable del sistema de los números
reales en la cual, sin embargo, es imposible definir el conjunto de los nú-
meros naturales. De hecho, esto debe de resultar imposible, puesto que de
otro modo tendríamos un procedimiento de decisión para la teoría de los

25
números naturales, lo cual se sabe que es imposible.[17] Utilizando el sis-
tema axiomático, podemos hablar de todos los números que existen, pero
no estaremos en condiciones de distinguir los números naturales de todo
lo demás que existe.
Sea como fuere, resulta claro que para propósitos prácticos, tratamos
las explicaciones intencionales y causales como algo enteramente distin-
to. Cuando empleamos una explicación funcional, en general ya sabemos,
por lo menos a grandes rasgos, cómo se la podría respaldar con un relato
causal adecuado. Pero en el estado actual de nuestros conocimientos, no
podemos tener ni siquiera un esbozo de cómo se relacionan las explicacio-
nes intencionales con los análisis causales de los mismos fenómenos. Aun
si en algún momento del futuro, Davidson se uniera a la línea de distin-
guidos pensadores que han declarado que en principio era imposible ha-
cer algo que los científicos luego pudieron llevar a la práctica, por el mo-
mento y para mayor seguridad, los epistemólogos consideran las dos pers-
pectivas como algo radicalmente diferente.
La segunda cuestión se refiere al tipo de hechos que pueden entrar en
una explicación científica. Dentro de una disciplina científica determina-
da, por lo general habrá conceptos definidos en diferentes niveles de orga-
nización y complejidad. En la física hay moléculas, átomos, partículas ele-
mentales y demás, en una cadena descendente aparentemente intermi-
nable. En biología hay ecosistemas, poblaciones, organismos, órganos,
células y genomas; en las ciencias sociales hay sociedades, organizacio-
nes, industrias, empresas, familias e individuos. En cualquiera de los ni-
veles se pueden plantear problemas e incógnitas pero ¿en qué nivel hay
que buscar la solución? En particular, ¿se pueden explicar hechos de un
nivel altamente integrado por otros hechos del mismo nivel, o hay que
buscar la explicación en hechos de nivel menor?
Hablando en términos generales, la práctica científica consiste en
buscar una explicación en un nivel inferior al del explanandum. Si quere-
mos comprender la patología del hígado, buscamos la explicación en la
biología celular. Si queremos entender las cadenas químicas, la mecánica
cuántica proporciona la explicación. Si queremos comprender las revolu-
ciones sociales, buscamos una explicación en las acciones y motivaciones
individuales. La búsqueda de microbuses, para usar un término de moda
en las polémicas recientes en el campo de la economía,[18] en realidad es
un rasgo de la ciencia omnipresente y generalizado. Esto se corresponde
con la insistencia de William Blake en que "El arte y la ciencia no pueden
existir más que en particulares detalladamente organizados". Explicar es
proporcionar un mecanismo, abrir la caja negra y mostrar las tuercas y
tornillos, las piezas y las ruedas de la maquinaria interna. (Aquí el térmi-
no "mecanismo" debe entenderse en un sentido muy amplio, que abarque
cadenas intencionales que van desde un objetivo a una acción, lo mismo
que cadenas causales desde un acontecimiento hasta su efecto.)
El papel de los mecanismos es doble. Primero, nos permite ir de lo
más grande a lo más pequeño: de moléculas a átomos, de sociedades a in-
dividuos. Segundo y principal, reduce el vacío temporal entre explanans y
explanandum. Un mecanismo proporciona una cadena continua y conti-

26
gua de vínculos causales o intencionales; una caja negra es un vacío en la
cadena. Si consideramos a los mecanismos desde la primera perspectiva,
son siempre relativos. "Desde el punto de vista ya sea de la investigación
científica o del análisis filosófico, legítimamente se puede decir que el me-
canismo de un hombre es la caja negra de otro. Quiero decir con esto que
los mecanismos postulados y utilizados por una generación son mecanis-
mos que han de ser explicados y comprendidos por las siguientes genera-
ciones en términos de mecanismos más primitivos."[19] Sin embargo,
visto desde la segunda perspectiva, podría parecer que los sistemas de
ecuaciones diferenciales simultáneas encarnan el caso de no vacío tempo-
ral entre explanans y explanandum. Si esto fuera verdaderamente así,
proporcionarían la forma canónica de explicación científica, una explica-
ción que no podría mejorarse. Tales sistemas, sin embargo, son siempre
artificiales, puesto que las variables nunca se desagregan en la misma
medida. Establecer una relación entre macrovariablers como renta nacio-
nal, inversión y consumo mediante un conjunto de ecuaciones diferencia-
les, puede ser conveniente para propósitos de análisis, pero sin duda
distorsiona la representación de la realidad. Debe haber intervalos entre
macrovariables.[20] Podemos concluir que, aunque el propósito de un me-
canismo es reducir el intervalo temporal entre causa y efecto, el éxito de la
reducción depende de la medida en que las macrovariables sean reempla-
zadas simultáneamente por microvariables.

27
Explicación causal

El análisis de la relación causal y de la explicación causal plantea pro-


fundas cuestiones filosóficas, que necesariamente caen fuera del alcance
de esta exposición, aun cuando estuvieran dentro de mi competencia.
Afortunadamente, ahora puedo remitir al lector a un completo y excelente
estudio, Hume and the Problem of Causation, de Tom L. Beauchamp y
Alexander Rosenberg. Por lo tanto, me limitaré a efectuar algunos comen-
tarios bastante amplios sobre la cuestión general de la causación y la ex-
plicación causal, y luego voy a analizar en términos un poco más específi-
cos la explicación causal en las ciencias sociales e históricas.

a. Explicación causal: en general


La cuestión de la naturaleza de la causación debe distinguirse muy
claramente de la de la explicación causal. La relación causal se da entre
acontecimientos, en virtud de una conjunción regular entre hechos de ese
tipo. Esta es la concepción humana de la causación, expuesta y defendida
por Beauchamp y Rosenberg. Por el contrario, los explanando, de las expli-
caciones causales pueden ser hechos de cualquier tipo: el hecho de que un
acontecimiento tuvo lugar o el hecho de que se da algún estado de cosas.
Por el momento me limitaré a la explicación causal de los acontecimientos
y dejaré para más adelante el análisis de la explicación de los estados de
cosas. Otra diferencia es que la explicación causal depende de la mente,
mientras que la relación causal no. Cuando citamos un acontecimiento co-
mo causa de otro, como lo hacemos en el caso de la explicación causal, só-
lo podemos mencionar algunos rasgos de la causa. Pero por supuesto lo
que actúa como causa es el acontecimiento completo; de hecho no puede
haber un acontecimiento incompleto. "Si un acontecimiento causó otro es
una cuestión aparte de por qué lo causó. La descripción de un aconteci-
miento por medio de sus rasgos causalmente irrelevantes recogerá la mis-
ma causa, aun cuando no proveerá una explicación de por qué tuvo ese
efecto en particular."!!] Los rasgos causalmente pertinentes son aquellos
que se mencionan en la ley causal que enuncia la conjunción regular bajo
la que queda subsumido el par de acontecimientos. Así, los enunciados
causales verdaderos y singulares no siempre proporcionan una explica-
ción causal. Dan una explicación sólo cuando los rasgos mencionados en el

28
enunciado también están mencionados en la ley bajo la cual quedan sub-
sumidos los acontecimientos. El enunciado, suponiendo que sea
verdadero de que "poner en un estante un ejemplar de la Fenomenología
de Hegel causó la rotura del estante" no explica nada, porque el rasgo
causalmente pertinente, es decir, el peso del libro, no se menciona.[2]
La explicación causal, entonces, subsume los acontecimientos bajo
leyes causales. Esta concepción de la explicación se relaciona, aunque
con algunas diferencias, con la "ley de cobertura" o modelo "nomológico-
deductivo" de Cari Hempel. Según Hempel las leyes que sostienen la
expli-íOación son enunciados universales legaliformes a partir de los
cuales, dado un conjunto de condiciones iniciales, se puede derivar
lógicamente el explanandum.[3] Este análisis no da cuenta de la
explicación causal, puesto que permite entrar a leyes no causales como la
Ley de Boyle, en la cual la temperatura, el volumen y la presión del gas
varían funcional y simétricamente de un modo en que no lo hacen las
secuencias causales.[4] Lo que es más importante, el análisis de Hempel
no da cuenta de la explicación causal, puesto que muchas derivaciones
del tipo especificado no se explican en absoluto. Dos casos importantes
son los que, siguiendo a David Lewis, podemos denominar epifenómenos
y causación precedente.[5] Puede haber un enunciado universal,
legaliforme y verdadero que diga que A siempre es seguido por B, y sin
embargo B puede ser un simple epifenómeno si A y B son ambos efectos
de una causa común C. En otras palabras, el problema de los
epifenómenos es idéntico al problema de distinguir entre la correlación
verdadera (o explicativa) y la espuria. Además, puede haber una ley
verdadera que asegure que se produce A, dadas ciertas condiciones
iniciales, y sin embargo, lo que verdaderamente produce A en un caso
determinado (donde se dan esas condiciones) puede ser un mecanismo
totalmente diferente que, por así decirlo, precede al mecanismo que
subyace en esa ley. En otros términos, el problema de la causación
precedente es idéntico al de distinguir entre obligación y explicación.[6]
Estos dos problemas volveré a retomarlos más adelante, cuando analice la
relación entre enunciados causales y contrafácticos.
Por lo general se piensa que la relación causal obedece a los tres prin-
cipios siguientes: determinismo, localidad, asimetría temporal. Los anali-
zaré sucintamente en ese orden, prestando especial atención al papel que
desempeñan en la restricción de la explicación causal. Excepcionalmente
la relación causal en sí puede violar esos principios, pero con mucha ma-
yor frecuencia aparecen explicaciones causales que no los obedecen.
Deterninismo es el postulado que dice que todo acontecimiento tiene
una causa: un conjunto determinable de antecedentes causales que en
conjunto son suficientes e individualmente necesarios para, que se pro-
duzca. La negación del determinismo puede asumir varias formas distin-
tas. La más conocida es la idea de acontecimientos estadísticamente alea-
torios, lo que supone la existencia de una distribución probabilística del
rango de resultados posibles. En este sentido el azar objetivo no es total-
mente indeterminado, puesto que la ley de los grandes números permite
predicciones muy precisas cuando tratamos con conglomerados de aconte-
cimientos. Menos conocida es la idea de indeterminación objetiva, que sig-

29
nifica que no podemos siquiera atribuir probabilidades a los diversos re-
sultados posibles, no porque no podamos averiguarlas sino porque no es-
tán allí para que se las averigüe. La distinción es parecida a la que se da
entre riesgo e incertidumbre (apéndice 1), con la diferencia de que en el ca-
so presente el azar o carácter indeterminado del proceso se supone que tie-
ne una base objetiva y no se debe a las deficiencias cognitivas del sujeto
cognoscente. Más aun, esta comparación también indica la distinción en-
tre incertidumbre en el rango de los resultados e incertidumbre dentro de
un conjunto fijo de resultados!?] Desde el punto de vista explicativo, la in-
determinación con regularidad (azar objetivo o conjunto restringido de re-
sultados posibles) es claramente más admisible que la indeterminación
sin regularidad (indeterminación objetiva no restringida).
Los mecanismos cuánticos se basan en la idea del azar objetivo en el
nivel de la conducta de las partículas elementales. En este terreno la ex-
plicación sólo puede ser estadística. Puede ser bastante satisfactoria se-
gún los cánones ordinarios, pero la ciencia en sí nos dice que no vendrá
una explicación mejor. La situación es completamente diferente cuando
recurrimos a la explicación estadística en otros terrenos, como por ejem-
plo la mecánica estadística o el estudio de la movilidad sociaUEn estos ca-
sos suponemos que las entidades individuales en estudio están regidas
por leyes deterministas y que en principio se puede elaborar una explica-
ción determinista. Sin embargo, puede haber abrumadoras razones prác-
ticas para poner patrones de explicación más bajos y quedarse contento
con una explicación estadística. Un poco más adelante vuelvo a esta cues-
tión. Aquí sólo me interesa destacar la diferencia radical entre la explica-
ción estadística en la mecánica cuántica y en otras disciplinas. Cuando
salimos de la física de las partículas elementales y ascendemos hacia
niveles más altos de variables, en primer lugar pasamos del azar al deter-
minismo y luego, en algunos casos, del determinismo al azar. Tanto la me-
cánica estadística como la cuántica son teorías de los procesos accidenta-
les, pero en medio de ellas está la teoría determinista de la conducta de
las moléculas individuales.[8]
Causalidad local significa que una causa siempre actúa sobre lo que
es contiguo a ella, en espacio y tiempo. La acción a distancia es imposible.
Si se dice que una causa tiene un efecto distante de ella en tiempo o espa-
cio, suponemos que debe de haber una cadena continua de causa a efecto,
sin vacíos insuperables en ella. En la historia de la ciencia este postulado
desempeñó un papel muy importante en el debate producido en el siglo
XVU entre newtonianos y cartesianos. Estos últimos, con razón en muchos
sentidos, consideraron la teoría de Newton como oscurantista y reacciona-
ria, puesto que invocaba una fuerza oculta que podía actuar donde no es-
taba. Pero por supuesto la alternativa que ellos proponían, si bien inobje-
table sobre bases metafísicas, no tenía el extraordinario poder predictivo
de la mecánica newtoniana y de esta manera permaneció en las sombras
durante dos siglos hasta que fue rehabilitada por la moderna teoría de la
gravitación.
En el caso de Newton contra los cartesianos, lo que estaba en juego
era la acción espacial a distancia. Pero existe también un problema acerca

30
de la acción temporal a distancia, o causación directa remota. Esta
noción se denomina histéresis y se utiliza en el estudio de algunos
fenómenos magnéticos y elásticos que aparentemente manifiestan algún
tipo de memoria. Leibniz, con su insuperable lucidez, reconoció que, si se
la toma literalmente, la idea era tan inaceptable como su análogo
espacial mejor conocido. En este sentido tuvo que polemizar contra los
partidarios carte-sianos, quienes trataban de salvar la teoría del
movimiento de Descartes postulando que la 'Fuerza" de un cuerpo en
cualquier momento dado depende de la longitud del período durante el
cual se haya acumulado. Es-to para Leibniz era tan absurdo como
pretender afirmar que la salud actual de una persona depende del tiempo
que haya utilizado para acumul a r l a [ 9 ]
Postular la histéresis es violar "el dogma científico ampliamente
difundido de que todos los aspectos del conocimiento histórico pueden
ser reemplazados en última instancia y en principio por un conocimiento
es-tructural suficientemente profundo del estado actual de los fenómenos
en cuestión".[10] Si no obstante muchos modelos, especialmente en las
ciencias sociales, manifiestan histéresis, es porque todavía no hemos
adquirido ese conocimiento estructural. Tanto los modelos
probabilísticos como los modelos que implican acción temporal remota
reflejan nuestra ignorancia de la causalidad local determinista que se
supone que funciona.[ll] La explicación causal en tales casos tiene
rasgos que no se cree Ique estén presentes en las relaciones causales
que los sostienen.
En algunos casos podemos suplir esta ignorancia recurriendo
alternativamente al azar o a la histéresis. Este es el caso, por ejemplo, de
las cadenas de Markov de alto orden, en las cuales las probabilidades de
transición de un período al siguiente dependen no sólo del estado actual
del sistema, sino también de estados anteriores.[12] Un ejemplo es el
pronóstico meteorológico, donde el conocimiento de la temperatura de
hoy y de ayer sirve mejor para predecir que sólo el conocimiento de la
temperatura de hoy. Por el contrario, las cadenas de primer orden
encarnan el "supuesto markoviano" de que las probabilidades de
transición dependen solamente del estado actual. No es correcto sostener
que este supuesto es el "análogo probabilístico al principio del
determinismo científico".[13] Las cadenas de primer orden conservan la
causalidad local pero violan el determinismo, y éstos son principios
reguladores distintivos.
Resultará claro por el momento que el principio de causalidad local se
relaciona con lo que denominé anteriormente como la necesidad de meca-
nismos de explicación científica. Más aun, los dos conceptos gemelos, el de
causalidad local en el espacio y causalidad local en el tiempo, se relacio-
nan con los dos aspectos de los mecanismos que denominé sustitución de
macrovariables por microvariables y de intervalos de corto plazo por otros
más prolongados. Pero la causalidad local es un rasgo del mundo, es decir,
de la relación causal en la medida en que existe independientemente de
nuestra mente, mientras que la idea de mecanismo depende de la mente,
puesto que sólo tiene sentido en contraste con explicaciones menos sutiles.
La creencia en que el mundo está regido por la causalidad local es precisa-
mente lo que nos obliga a buscar mecanismos mucho más sutiles. Por últi-

31
mo, debe quedar claro que la causalidad local nos indica la salida de las di-
ficultades que enfrentó la teoría de la explicación de Hempel, puesto que
la cuestión de los epifenómenos y de la causalidad precedente no se plan-
tea cuando postulamos cadenas causales continuas y contiguas. Pero tam-
bién queda claro que cualquier mecanismo real tiene que ser demasiado
grueso para evitar estas dificultades. La diferencia entre la concepción de
Hempel y la que aquí se expone reside en que yo he argumentado que la
explicación debe abandonarse siempre y cuando una especificación más
refinada del mecanismo muestre que lo que creíamos que era causación en
realidad era un epifenómeno o causación precedente.
Asimetría temporal significa que una causa debe preceder a su efecto,
o por lo menos no sucederlo. El aspecto controvertido de este principio se
refiere a la diferencia entre las dos formulaciones que se acaban de dar.
¿Puede un efecto ser simultáneo con su causa? Volveré a esta pregunta
más adelante. Aquí quisiera observar que el principio de asimetría tem-
poral puede generalizarse a partir de la explicación causal a cualquier ti-
po de explicación: el explanans no puede seguir al explanandum. Respecto
de la explicación intencional esto se sigue del hecho de que no explicamos
la conducta intencional por las consecuencias reales que se derivan de
ella, sino sólo por las consecuencias previstas, que pueden no haberse
cumplido o que inclusive pueden ser irrealizables. Podría parecer que la
explicación funcional viola el principio generalizado, puesto que en este
caso los fenómenos son explicados por sus consecuencias reales.[14] Pero
la conclusión que se debe sacar no es que el efecto retroactivo es posible,
sino que el explanandum debe ser una entidad que perdura en el tiempo y
no un acontecimiento que se produce una sola vez. Si fuéramos a decir, por
ejemplo, que el delito ha de explicarse por sus efectos beneficiosos para la
competencia capitalista, eso sólo puede significar que el delito en el tiem-
po t tiene consecuencias beneficiosas que mantienen y sostienen el delito
en algún tiempo posterior t3.
Los tres principios de causalidad son lógicamente independientes. Só-
lo afirmaré esto respecto de los dos primeros principios, puesto que el ter-
cero no presenta ninguna dificultad (ni interés) en este sentido. Con deter-
minismo sin causalidad local, apelamos al pasado para explicar el presen-
te y predecir el futuro. Supongamos, por ejemplo, que se ha demostrado
que el siguiente enunciado es falso: siempre que dos sistemas (de un tipo
dado) son idénticos en el tiempo t, también son idénticos en todos los tiem-
pos posteriores. A partir de esto podemos concluir la falsedad del determi-
nisino, pero no necesitamos hacerlo. Podemos conservarlo si el siguiente
enunciado es verdadero: toda vez que dos sistemas han sido idénticos has-
ta í inclusive, serán idénticos en todos los tiempos posteriores. Para que el
primer enunciado sea verdadero y el segundo falso, debe haber alguna
histéresis real en el sistema. Se ha señalado, por ejemplo, que el aparente
indeterminismo de la mecánica cuántica puede suprimirse tomando en
cuenta la historia pasada de las partículas.[15] Pero la solución estándar
es la contraria, o sea conservar la causalidad local y abandonar el deter-
minismo. Esto supone rechazar los dos enunciados que acabamos de men-
cionar y aceptar el siguiente: toda vez que dos sistemas son idénticos en el

32
tiempo t, tendrán idéntica distribución de probabilidades para su
desarrollo futuro.
En realidad, el status epistemológico de las tres propiedades de la re-
lación causal es una cuestión problemática. Tal vez la mejor respuesta
sea k siguiente. Invariablemente se encuentra que los principios
funcionan >n el nivel molar, el de los objetos aproximadamente
comparables por su amaño a los seres humanos. Por el tipo de
mecanismo que tan bien describió Hume, esto ha llevado a creer en su
absoluta necesidad, tanto en el ¡aso de objetos menores como mayores que
aquellos que podemos manipular y observar. Los filósofos han tratado de
comprender la naturaleza de esta necesidad y también sus fundamentos.
Pero la ciencia recientemente ha llegado a cuestionar y —en el caso del
determinismo— a rechazar los principios sobre bases empíricas. Y si se
los puede cuestionar sobre bases empíricas, aparentemente serían de
carácter empírico, aun si en algún tiempo posterior llegaran a ser
reafirmados. Sin embargo, este último pasó no es obvio. Si el análisis
científico futuro conduce a una rehabilitación leí determinismo, podría
hacerlo de un modo tal que lo hiciera aparecer como verdaderamente
necesario, en alguno de los muchos sentidos de es-ñ término.
Sin embargo, sea como fuere, el científico que no trabaja en física ató-
nica probablemente pueda continuar invocando los principios con relati-
va buena conciencia, no sólo en el nivel molar sino también en el caso de
os fenómenos micro y macro que están fuera del alcance de los sentidos.
Pero esta conciencia a lo sumo puede ser relativamente buena, porque el
izar objetivo de la mecánica cuántica no puede quedar totalmente restrin-
gido a la física atómica. Puede volcarse hacia la biología y también a la
psicología: la biología, puesto que las mutaciones al azar en última instan-
cia pueden tener alguna explicación en mecánica cuántica, y la psicología,
puesto que los fenómenos del pensamiento pueden depender de la descar-
ga al azar de las neuronas.
Quedan dos hilos sueltos en el argumento, que en realidad se pueden
usar recíprocamente para anudarse entre sí. Estos son: la cuestión de las
explicaciones causales de los estados de cosas y la cuestión de la causa-
non simultánea. Que puede haber explicaciones causales de los hechos
fácticos es obvio. El hecho de que mi máquina de escribir en este momen-
x» esté situada a 85 cm del suelo es un estado de cosas que puede explicar-
se causalmente. Pero por supuesto ese estado no entra como relatum en
una relación causal, puesto que sólo los acontecimientos pueden ser relata
causales. La explicación causal de un estado de cosas se maneja con leyes
causales, pero de un modo más complejo que las explicaciones causales de
acontecimientos. La posición presente de mi máquina de escribir puede
explicarse como el resultado equilibrado de una cantidad muy grande de
mecanismos causales interrelacionados que especifican qué ocurre en el
grano fino de la máquina de escribir tanto como en el de la mesa en la que
asta apoyada. Resulta tentador decir que la posición actual de la máquina
¡le escribir es explicada, y tal vez hasta causada, por el hecho de que co-
rrientemente está en reposo encima de mi mesa. Con lo cual podríamos in-
troducir la noción de explicación simultánea, y tal vez la de causación si-

33
multánea. Pero creo que estas tentaciones deben resistirse, o por lo menos
entregarse a ellas sólo metafóricamente. Un equilibrio puede modelarse
como intemporal, pero ésta es sólo una aproximación superficial. Los equi-
librios se sostienen en micromecanismos que operan de modos muy sutil-
mente afinados y compensadores. Esto vale para el equilibrio térmico del
gas como para el equilibrio económico general. Tal vez queremos decir,
con una expresión abreviada, que un rasgo del equilibrio es explicado por
otro, y este modo de expresión puede ser útil para algunos propósitos. Pe-
ro estrictamente hablando, esto es cometer la falacia de los epifenómenos,
puesto que los macrorrasgos de los equilibrios son efectos conjuntos de la
microestructura.

b. Explicación causal: en las ciencias sociales


Puesto que la temática central de este libro es la explicación del cam-
bio tecnológico —cuestión que se plantea en el spno de las ciencias socia-
les— me pareció útil y de hecho necesario explicitar cómo algunos de los
principios generales analizados antes se aplican en estas disciplinas. Voy
a tomar las siguientes cuestiones. ¿Cuál es el "papel del individuo en la
historia"? ¿Cuál es la importancia de la histéresis en las ciencias sociales?
¿Cuál es la relación entre causalidad y enunciados contrafácticos en la
historia y en la ciencia social? ¿Cuál es el papel de la causación simultá-
nea en las ciencias sociales? ¿Cuál es el papel verdadero y característico
de la explicación estadística en las ciencias sociales? Además, en el capítu-
lo 3 me ocuparé de algunas otras modalidades de explicación causal en las
ciencias sociales, en relación con la explicación causal de las creencias y
preferencias. No es necesario decir que el análisis ha de ser sumamente
esquemático y, me parece, un tanto idiosincrático.
El papel del individuo en la historia. Se sigue inmediatamente de lo
que se expuso en la introducción a la Parte I que en algún sentido éste es
un pseudoproblema. La historia la hacen los individuos y debe ser expli-
cada en términos de acción individual. Sin embargo, en otro sentido, la
cuestión es significativa. Podemos preguntarnos si el curso de la historia
puede ser desviado por la acción de un solo individuo. Esto a veces se de-
nomina determinismo, pero en realidad debería conceptualizarse como
una cuestión de estabilidad. Es decir, podemos preguntarnos si las socie-
dades tienen la propiedad de homeorhesisf[16] de forma tal que ante cual-
quier pequeña desviación en su curso retomarán más adelante el desarro-
llo que hubieran seguido si la desviación no se hubiera producido. Si las
sociedades son estables en este sentido, y si cualquier acción individual
aparece como una "pequeña" contribución, entonces, el individuo no tiene
ningún papel característico en la historia.
Es muy fácil ver cómo esta cuestión puede llegar a confundirse con la
del determinismo. A menudo queremos realizar dos tareas simultánea-
mente: predicción y totalización. Si el grupo social dado es estable en el
sentido indicado, podemos tener éxito en ambas, puesto que el grano fino

34
en realidad no altera la predicción. Esto significa que el grupo se comporta
como si fuera determinista en su conjunto. Por supuesto, no hay razones
generales para esperar la misma estabilidad que encontramos en la
biología evolutiva, donde apareció por primera vez la noción de
homeorhesis de modo que tenemos que dar razones específicas en cada
caso particular para creer que existen sociedades dinámicamente estables.
Pero suponiendo que se haya dado alguna demostración de ese tipo,
podemos predecir únicamente el valor futuro de macrovariables, usando
sólo valores presentes de macrovariables. (O posiblemente también
valores pasados, en la medida en que aquí sólo me ocupo del
determinismo y no de la causalidad local.) Si en otros casos —que en las
ciencias sociales e históricas serán la abrumadora mayoría— no estamos
en condiciones de predecir macrovariables usando sólo macrovariables,
esto no significa que ésa sociedad no se comporte en forma determinista,
sino sólo que le falta un cierto tipo de estabilidad. Sin embargo, aun puede
ser posible formular macroteorías, si renunciamos a la predicción singular.
Se han hecho intentos, por ejemplo, de desarrollar una teoría del cambio
histórico utilizando correspondencias (impropiamente denominadas
funciones multivalentes) y no funciones (denominadas en forma
redundante funciones univalentes).[17] Dado el macroestado actual,
podemos predecir que el macroestado siguiente se encontrará dentro de
algún subconjunto de los estados abstractamente concebibles. O bien,
alternativamente, podríamos tratar de definir una distribución
probabilística sobre el conjunto de macroestados que pueden surgir.
Histéresis en las ciencias sociales.[18] Se ha sostenido que la histére-
sis tiene una importancia especial en las ciencias sociales, a causa de la
irreductible importancia de la historia para la comprensión del presen-
te.[19] En el nivel ontológico no es así, como se indicó antes. Pero es pro-
bablemente verdad que en las ciencias sociales los modelos y teorías que
presentan intervalos temporales tienen un lugar más destacado que en
las ciencias físicas, porque no se ha alcanzado el conocimiento estructural
que nos permitiría acabar con la histéresis aparente. La meta de la inves-
tigación debería ser reemplazar por causas pasadas las huellas que deja
en el presente el funcionamiento de esas causas, pero esto no siempre lo
podemos lograr. Esas huellas generalmente se denominan "variables de
estado" y ocupan una posición privilegiada en la explicación científi-
ca.[20]
Un ejemplo tomado del estudio de la tecnología nos resultará útil más
adelante. En la función de producción neoclásica, la producción total es
una función del capital conjunto y el trabajo: P=f(K, T). La así llamada
"controversia capital" ha demostrado, al menos para mi satisfacción que
la noción de capital conjunto en algunos casos resiste a la construc-
ción.!^ 1] Si la estructura tecnológica desagregada subyacente tiene ciertas
propiedades (no improbables), la noción de capital conjunto no se compor-
ta como era de esperar. En particular, puede no manifestar productividad
marginal decreciente, ni verificarse la esperada relación monótona entre
la tasa de salario y la intensidad de capital. Dado este resultado, algunos
-»_

35
autores,[22] han sostenido que más bien debería considerarse la corriente
de producción en el tiempo como una función de la corriente de energía de
trabajo en el tiempo: P(t)=F(T(t)). Sin embargo, esto supone histéresis,
porque entonces no se puede predecir producción en el tiempo t sin apelar
a la energía de trabajo en tiempos anteriores. El procedimiento puede ser
conveniente para algunos propósitos analíticos, además de su evidente
atractivo político, pero como descripción de la estructura causal del proce-
so de producción es claramente inadecuado. Tiene que ser posible explicar
lo que ocurre en el proceso de producción ahora sin apelar al pasado dis-
tante. Una manera de hacerlo sería simplemente desagregar la función
de producción: P=f(K1,...Kn, T).
Causalidad y contrafácticos. Habitualmente se da por sentado que
existe un vínculo estrecho entre enunciados causales y enunciados con-
trafácticos, es decir, entre "A causó a B" y "Si A no hubiera ocurrido, B no
habría ocurrido".[23] Sin embargo puede demostrarse que la verdad del
enunciado contrafáctico no es ni suficiente ni necesaria para la verdad del
enunciado causal. La condición de no suficiente surge de la posibilidad de
los epifenómenos. Si C es suficiente para A y necesario para B, el enuncia-
do contrafáctico es verdadero, pero el causal es falso. La condición de no
necesaria surge de la posibilidad de la causación precedente. Si C hubiera
producido B en caso de estar A ausente, el enunciado causal sigue siendo
verdadero pero el contrafáctico es falso. En términos más generales, todo
intento de definir nociones causales en términos de enunciados contrafác-
ticos supone poner el carro delante de los caballos. A continuación argu-
mentaré que esto explica el fracaso de dos recientes intentos de definir las
nociones esencialmente causales de poder y explotación.
Poder supone conseguir lo que se quiere, pero esto solo no es suficien-
te. Hay que agregar: 1) una cláusula causal a los efectos de que la persona
que tiene el poder sea instrumental en lograr conseguir lo que quería; 2)
que tuviese la intención de lograrlo; 3) que lo lograse en la forma en que
quería (es decir, no por un golpe de suerte), y 4) que lo lograse frente a la
resistencia de otra gente o, si no había ninguna resistencia, que lo hubie-
se logrado aun cuando hubiese habido. La última cláusula muestra que el
análisis del poder sí incluye contrafácticos, pero sería un error entender el
componente causal del poder en términos de contrafácticos. Si se argu-
menta que en ausencia de la acción de la persona que detenta el poder, el
efecto hubiese estado ausente, inmediatamente aparece el problema de la
causación precedente. Y si, siguiendo a Alvin Goldman, se argumenta que
el poderoso conseguirá lo que quería aunque lo hubiese querido de modo
diferente, se va más allá de lo que está implícito en esta noción.[24] Para
verlo, consideremos al hombre que quiere lograrp porque sabe que si no lo
hace, su rival lo hará, de modo que precede a su rival por despecho, supe-
rando la resistencia de aquél. Seguramente este hombre tiene poder para
lograr p, aun cuando su deseo de lograrlo es causado por el conocimiento
de que eso se producirá de todos modos. Y su deseo de lograr p, según
Goldman, no disminuye un ápice por su incapacidad para lograr q, si es
que el deseo de fastidiar a su rival tomara esa forma.

36
La explotación supone sacar provecho indebido de alguien.[25] Por
eso -incluye la noción moral de falta de equidad, así como un requisito
esen- cialmente causal de que explotador y explotado interactúen de modo
que Leí primero "saque provecho" del último. En su importante obra
sobre explotación y clase, John Roemer presentó dos definiciones de
explotación: una que respeta estos requisitos y la otra no.[26] La última —
la única que me interesa en este caso— estipula que un grupo es explotado
si hubiese testado en mejores condiciones si se lo hubiera apartado del
conjunto de la sociedad, llevándose consigo alguno de los activos sociales
conforme a alguna regla de separación. Para superar posibles objeciones,
también estipula que el grupo complementario —los explotadores—
hubiesen estado en peores condiciones si tuviesen que apartarse siguiendo
las mismas reglas. Pero es fácil elaborar ejemplos en los que dos grupos
interactúan de un modo en que estos dos enunciados contrafácticos
resultan verdaderos, y sin embargo la interacción no es de
explotación.[27]
Pero aunque los enunciados contrafácticos no agotan el significado de
los enunciados causales, pueden ofrecer caracterizaciones verdaderas no
definicionales de relaciones causales en muchos casos centrales. Una ra-
zón por la que la causalidad es tan importante prácticamente, es p0r su-
puesto el hecho de que con mucha frecuencia el efecto no se producirá en
ausencia de la causa. De un modo semejante, la definición de Roemer de
explotación y la de Goldman de poder ofrecen una comprensión decisiva
de muchos casos empíricos importantes.
Aunque el significado de la causalidad no se puede dar por enuncia-
dos contrafácticos, éstos tienen una función importante en el análisis cau-
sal. Cuando queremos evaluar la importancia relativa de las causas
Cr..Cn para algún efecto E, tenemos que eliminar mentalmente las cau-
sas, una por una, para ver qué diferencia establece la ausencia de esa cau-
sa para el efecto. (Y, por supuesto, tenemos que eliminar cualquier otra
causa que estuviera esperando en alguna parte pero que fue precedida
por esa causa determinada. Volveré a este tema más adelante.) Cuando el
efecto E es alguna variable cuantitativa, la importancia relativa de las
causas puede estimarse simplemente evaluando su influencia cuantitati-
va sobre E. En otros casos tal vez esto no sea factible, y entonces debemos
aguzar el ingenio para elaborar otras medidas. Si, por ejemplo, la ausen-
cia de la causa Cj hubiera postergado por un año la producción de E y la
ausencia de C2 a una demora de 10 años, sin duda tenemos justificación
para decir que C2 era más importante que Cj, pero quizá no para decir que
era 10 veces más importante. Este procedimiento podría utilizarse, por
ejemplo, en un análisis de la importancia relativa de las causas de la Pri-
mera Guerra Mundial, mientras que el enfoque cuantitativo más directo
podría usarse para evaluar las causas del crecimiento económico nortea-
mericano en el siglo XTX.
El problema epistemológico es cómo averiguar la verdad, o la asertibi-
lidad, de los enunciados contrafácticos. En mi opinión, es muy difícil acep-
tar que esos enunciados tienen condiciones de verdad, es decir, que son
verdaderos, cuando son verdaderos, a causa de alguna correspondencia
con los hechos. En particular, no puedo aceptar la sugerencia de que los

37
enunciados contrafácticos podrían tener sus condiciones de verdad en
mundos posibles, como señalan algunos escritores recientes.[28] Sostie-
nen que el enunciado "Si hubiera ocurrido A, entonces hubiera ocurrido
B" es verdadero en el mundo x si y sólo si: 1) A no ocurre en cualquier
mundo que sea posible relativamente a x, y 2) B ocurre en el mundo más
cercano a x en el que ocurre A. Aquí se supone, primero, que la noción de
un mundo posible está en relación con otro mundo y no se la ve sólo como
posible tout court, y segundo, que de alguna manera podemos medir la
distancia entre un mundo dado y los otros mundos que son posibles rela-
tivos a él.
Mi propia concepción, que es también la de otros autores huméanos
que escriben sobre causación, es que los contrafácticos no pueden ser ver-
daderos o falsos, sino sólo asertibles o no asertibles.[29J Las bases o condi-
ciones para la asertibilidad son nuestras teorías científicas actualmente
aceptadas, es decir, los enunciados universales legaliformes aceptados
hoy. Un enunciado contrafáctico es garantizado o asertible si el conse-
cuente se puede deducir del antecedente junto con algunos enunciados
teóricos adecuadamente elegidos. Por otra parte, es importante conservar
parte de la descripción del mundo posible, como por ejemplo, la idea de
que debemos limitarnos a las alternativas más próximas bajo las cuales el
antecedente es verdadero. Queremos decir que el contrafáctico es aserti-
ble cuando el consecuente se sigue del supuesto del antecedente y la can-
tidad mínima de otros cambios. Cuando suponemos un antecedente con-
trario a los hechos, normalmente tenemos que agregar una cantidad de
otros cambios para que el supuesto sea internamente coherente.[30] Diga-
mos, no podemos eliminar mentalmente a todos los esclavos del Sur norte-
americano anterior a 1861, sin eliminar también a los capataces, los pro-
pietarios de los esclavos, las leyes esclavistas, etc. Pero si bien algunos
cambios de este tipo deben aceptarse, no es lo mismo en todos los casos. Si
queremos defender el enunciado "En ausencia de la esclavitud la econo-
mía sureña anterior a 1861 hubiera tenido una tasa de crecimiento sus-
tancialmente más alta", no nos ocupamos de la alta tasa de crecimiento de
todas las economías no esclavistas internamente coherentes anteriores a
1861, incluyendo las que fueron devastadas por un terremoto o afectadas
por plagas.
Además de la coherencia interna del supuesto contrafáctico, necesita-
mos la posibilidad histórica. Si el antecedente de un contrafáctico históri-
co no puede insertarse dentro del desarrollo histórico real, no debe incluír-
selo. Si queremos evaluar la economía norteamericana real en 1860 com-
parándola con un estado contrafáctico de la economía en la misma época,
necesitamos que este último pudiera haberse derivado de la historia real
en alguna época posterior, hasta donde sepamos, es decir, hasta donde
nuestras teorías nos lo digan. Puesto que si este requisito no se cumple, no
estaremos hablando del curso de la historia norteamericana, que es un in-
dividuo histórico.[31] Por supuesto, para que tal derivación sea posible
nuestras teorías deben tener un carácter no determinista pero, como he-
mos dicho antes, esto sólo podríamos esperarlo en el nivel de las macroteo-
rías utilizadas para el estudio del cambio social.

38
Un ejemplo relacionado con el cambio tecnológico puede ayudarnos a
explicitar lo que está implícito en este enfoque de los contrafácticos. El es-
tudio de Robert Fogel sobre la importancia de los ferrocarriles para el cre-
cimiento económico norteamericano en el siglo XIXprobablemente es el in-
tento más ambicioso que jamás se haya hecho en el campo de la historia
contrafáctica.[32] Fogel se propone defender una tesis: que el PBN nortea-
mericano en 1890 no hubiese sido mucho menor si los ferrocarriles nunca
se hubieran introducido .[33] Al exponer los argumentos para su tesis, Fo-
gel generalmente se toma mucho cuidado en seguir el procedimiento que
hemos delineado antes: reconstruir el desarrollo económico norteamerica-
no a partir de la época más tardía posible en que se pudiera haber deriva-
do una economía sin ferrocarriles, es decir, aproximadamente a partir de
1830. Pero existe un error flagrante en el razonamiento, señalado por
Paul David en su reseña de esa obra. Se trata del supuesto implícito de Fo-
gel de que las ventajas de la introducción son equiparables a las pérdidas
de su eliminación. El principal ejemplo de David se refiere a la existencia
de economías de escala irreversibles, debidas al aprender haciendo (capítulo
6), Si los menores costos del transporte por ferrocarril llevaron a menos
precios de las mercaderías transportadas, y a una mayor demanda de
ellas, las técnicas de producción masiva podrían haber logrado que —su-
poniendo una eliminación instantánea del ferrocarril en 1890— se obtu-
viera todavía una mayor eficiencia con un volumen menor de producción
que con las técnicas dadas inicialmente. Al medir la falta de ganancias por
la introducción mediante la pérdida ocasionada por la eliminación, Fogel
argumenta como si fuera posible medir la importancia de la escalera en el
punto en que se ha hecho posible dejarla caer.
El análisis de enunciados contrafácticos en historia plantea varios in-
terrogantes de los cuales mencionaré tres. El primero podemos llamarlo
"el problema de la tijera" creado por el uso doble de la teoría en el análisis
de contrafácticos. Claramente necesitamos una teoría para pasar del an-
tecedente al consecuente en los enunciados contrafácticos, pero también
necesitamos teoría para evaluar la legitimidad del antecedente tomado
en sí. Necesitamos teoría para que nos diga si el supuesto del antecedente
contrafáctico es compatible con lo que contiene el mundo real. La teoría
económica nos dice, por ejemplo, que normalmente no podemos suponer
un mayor volumen de ventas y mantener constante la unidad de pre-
cio.[35] El interrogante se plantea porque estas dos funciones asignadas a
la teoría pueden entrar en conflicto entre sí. Cuanto mejores sean nues-
tras teorías, tanto más antecedentes podrán eliminar como ilegítimos, y
en mejores condiciones estaremos de evaluar el consecuente. O formular-
lo de otra manera: cuantas más preguntas podemos hacer, menos pode-
mos contestar. Sin duda aquí hay que encontrar un delicado equilibrio.
Una vez más, el ejemplo del ferrocarril resultará útil. Si queremos sa-
ber qué hubiera pasado si el ferrocarril no se hubiera inventado, podría
interesarnos determinar si la máquina de combustión interna podía ha-
berse inventado antes del momento en que efectivamente se hizo. Para
contestar a esta pregunta necesitaríamos una teoría que relacionara el
cambio tecnológico con diversas condiciones socioeconómicas y científicas.

39
Pero si tuviéramos tal teoría, hay grandes posibilidades de que también
nos diría que la invención del ferrocarril era inevitable, dadas las condi-
ciones existentes en ese momento, de modo que la misma teoría que nos
dice cómo contestar a la pregunta (¿qué hubiera pasado sin el ferrocarril?)
también nos dice que ésta no es una pregunta que se deba formular (por-
que la invención era inevitable de acuerdo con la teoría). Si suponemos
que no había ferrocarril en 1830, la teoría nos-dice que será inventado en
1831; y si insistimos en suponer que no lo había durante todo el período,
la teoría nos dice que algo muy parecido a él se inventará.[36] En otras
palabras, la causación precedente nuevamente vuelve a levantar su desa-
gradable cabeza. Fogel se puede permitir una estratagema con este pro-
blema porque no pudo evaluar la importancia exacta de los ferrocarriles
para el crecimiento económico norteamericano, sino sólo probar la tesis de
que la importancia estaba por debajo de cierto límite superior. Entonces
puede hacer de abogado del Diablo y suponer que no se hubiera desarro-
llado ningún sustituto del ferrocarril, porque si su tesis es válida con este
supuesto, continuará siéndolo si se lo elimina.
El segundo interrogante se plantea cuando hay causas que interac-
túan en forma no aditiva. Supongamos, esquemáticamente, que las cau-
sas Cj y 2 contribuyen al efecto E del modo siguiente: E=2C1+3C2+C1.C2.
Más aun, supongamos que en un caso dado C1 y C, tienen valores 2 y 1 res-
pectivamente, suponiendo un valor de 9 para E. Si tratamos de determi-
nar la importancia relativa de las causas suponiendo que no estén prime-
ro Cj y luego C2, obtenemos el resultado de que Cl contribuye 6 a E (puesto
que sin ella el efecto sería 3) y Ca contribuye 5 (puesto que sin ella el
efecto sería 4). Pero esto a su vez implica que la contribución total de las
dos causas al efecto excede el efecto total, lo cual es absurdo.
El problema tiene una pertinencia crucial en el caso de la teoría de la
distribución del ingreso. Si se acepta que el factor participación debe re-
flejar el factor contribución ("A cada uno según su contribución"), enton-
ces necesitamos un principio para determinar qué porción del producto
final debe asignarse causalmente a los diversos factores de la producción.
Si suponemos que los factores son capital y trabajo (dejando de lado el
problema del capital conjunto), relacionados como lo están en la función
de producción de Cobb-Douglas P=a.KM/, con b+c=l, entonces el método
contrafáctico tiene la implicación absurda de que cada factor es causal-
mente responsable del producto total puesto que el resultado es cero
cuando un factor es cero. El enfoque elegido en algunas versiones más
simplificadas de la tee»a neoclásica es suponer en cambio que la contri-
bución por unidad de cada factor debe ser equiparada con el producto
marginal de ese factor. Entonces resulta, mágicamente, que las contribu-
ciones totales de todas las unidades de ambos factores agotan el producto
total.[37] Y puesto que la contribución de cada trabajador se considera co-
mo el producto marginal, el principio "A cada cual según su contribución"
inmediatamente implica que el trabajo debe pagarse de acuerdo con la
productividad marginal.
Se pueden levantar las siguientes objeciones contra esta línea de ar-
gumentación. Primero, simplemente no existe ningún modo de descompo-

40
ner el producto total en la contribución del capital y la del trabajo. De he-
cho, resulta claro que no se puede tratar a cada trabajador como si fuera
el último que va a ser contratado.[38] Este análisis causal tiene sentido en
él margen, pero no para el factor contribución en su conjunto. Si renuncia-
mos al supuesto de que b+c=l en la función de producción, permitiendo
rendimientos crecientes o decrecientes en escala, entonces deja de ser
verdad que el producto sea exactamente agotado por el factor total "con-
tribuciones" (en el sentido de productos marginales). Con rendimientos
crecientes en escala, la suma total de "contribuciones" excederá el produc-
to total, y con rendimientos decrecientes se quedará corta. En segundo lu-
gar, el principio "A cada uno según su contribución" no debe extenderse a
la contribución de capital. Aun cuando los bienes de capital tienen un pa-
pel causal en el proceso de producción, sus propietarios no trabajan como
para que pudiera justificarse que conservan una parte del producto neto.
A menudo los marxistas expresan esto diciendo que el capital "realmente"
es trabajo congelado, y así no pueden reclamar ninguna parte del produc-
to. [39] Argumenté anteriormente que este lenguaje es engañoso, puesto
que da la impresión de alguna histéresis verdadera en el proceso de pro-
ducción. La representación flK, T) del proceso de producción es engañosa
a causa del problema de la agregación, pero sería un error descartar esta
representación arguyendo que el capital, al ser solamente trabajo conge-
lado, no debe figurar en la función de producción. Si el problema de la
agregación no surgiera, se podría aceptar fl[K, T) como representación ade-
cuada y sin embargo objetar el derecho del capital a una participación en
el producto.
El tercer interrogante tiene que ver con la identificación de los actores
que participan en el enunciado contrafáctico. A menudo queremos saber
si la situación económica —miseria o prosperidad— de un cierto grupo de
personas puede ser atribuida al sistema económico en el que se encuen-
tran. Entonces contestamos, contrafácticamente, si hubieran estado en
mejores condiciones en algún sistema alternativo. Sin duda puede resul-
tar conceptualmente difícil determinar cuál es el sistema pertinente para
la comparación.[40] Sin embargo, un problema más básico es que en el sis-
tema alternativo que se analiza puede resultar imposible identificar al
grupo cuya situación queremos evaluar, si está definido en términos espe-
cíficos para el sistema real. En ese caso podemos evaluar la situación del
grupo sólo en los casos realmente especiales en que el miembro más aco-
modado de la sociedad real está en peor situación que el miembro que se
encuentra en la peor situación en el sistema alternativo, o el miembro en
peor situación de la sociedad real está en mejores condiciones que el más
acomodado en el alternativo.
Una vez más la esclavitud nos proporciona un ejemplo instructivo. Un
historiador de la esclavitud norteamericana escribe que "si no hubiera si-
do por las plantaciones y la esclavitud, las ciudades y pueblos del Sur hu-
biesen sido menos y más pequeñas todavía, lo cual hubiese resultado en
oportunidades mucho menores para los blancos que no tenían escla-
vos".[41] Ahora bien, dejando de lado la "ilusión microeconómica" que sub-
yace en este argumento,[42] éste falla por la simple base lógica de que en

41
la economía sureña sin esclavos no sería posible identificar a los grupos
que en la economía esclavista eran "los blancos que no tenían esclavos" y
distinguirlos de los que tenían esclavos. Esto es así porque el grupo de
blancos que no tienen esclavos está definido en términos del propio siste-
ma que se nos pide que se elimine del supuesto. Por el contrario, no habría
problema si preguntáramos por el destino de los pequeños granjeros o de
los negros en un sistema no esclavista, puesto que éstas no son categorías
definidas en términos de esclavitud. Tales problemas de "identidad trans-
mundiar se plantean bastante a menudo en las ciencias sociales, y tien-
den a socavar nuestras nociones intuitivas acerca de cuáles son las com-
paraciones significativas que se pueden hacer entre grupos o sistemas. [43]
Los tres interrogantes que destaqué para su análisis son todos, bási-
camente, problemas de agregación. Se plantean porque con frecuencia
queremos explicar en el macronivel, aun cuando los mecanismos subya-
centes son de grano más fino. Claramente, en el futuro previsible las cien-
cias sociales no pueden prescindir de macroexplicaciones, pero tampoco
pueden esperar deshacerse de tales interrogantes.
Causación simultánea. En las ciencias sociales constantemente se
nos presentan enunciados tales como "las democracias conducen al escep-
ticismo" o "la vida en las grandes ciudades favorece el delito", en los cua-
les estados contemporáneos se relacionan entre sí como causa y efecto.
Para que tales enunciados tengan sentido, sin apelar a la noción misteriosa
de causación simultánea o instantánea, tenemos que estar en condiciones
de distinguir entre variables exógenas y endógenas dentro del sistema en
consideración. Podemos entonces interpretar tales enunciados en térmi-
nos del efecto de estado fijo en una variable endógena producido por un
cambio en una variable exógena. Si solamente consideramos al sistema
en un momento determinado después del cambio en la variable exógena, y
observamos que ha producido un cambio en una variable endógena, no
podemos concluir que éste es un efecto de estado fijo. En primer lugar, el
sistema no puede haber encontrado todavía su estado fijo, de modo que
más adelante la variable endógena puede adoptar valores completamente
diferentes: y en segundo lugar, el sistema puede ser tal que no exista esta-
do fijo hacia el que converja después del cambio en la variable exó-
gena.[44]
Voy a ilustrar estos principios con algunos ejemplos tomados de la
obra de Alexis de Tocqueville. En La democracia en América y en otros
textos, se ocupó de evaluar las consecuencias sociales de las consti-
tuciones, y en particular de las constituciones democráticas. En el curso
de este análisis se nos aparece como una persona extraordinariamente
sofisticada para la comprensión de la causalidad social. Brevemente voy a
explicitar los cuatro principios básicos que subyacen en su análisis.
El primero podemos denominarlo el principio del holismo: las relacio-
nes causales que son válidas en el margen no se pueden generalizar al
conjunto. Por ejemplo, aun cuando los matrimonios por amor tiendan a no
ser felices en las sociedades donde constituyen la excepción, no se puede
concluir que también serán infelices en las sociedades democráticas don-

42
de constituyen la regla. Casarse por amor en una sociedad aristocrática es
ponerse al borde del desastre, puesto que ir contra la corriente tiende a
crear hostilidad y a su vez rencor. Más aun, sólo las personas obstinadas
irán contra la corriente en primer lugar, y el hecho de ser obstinado no es
un rasgo de carácter que pueda conducir a un matrimonio feliz. [45]
El segundo principio es el del efecto neto. Un ejemplo típico es el si-
guiente: "Como no hay organización preventiva en los Estados Unidos,
hay más incendios que en Europa, pero generalmente se los apaga más
rápidamente, porque los vecinos nunca dejan de acudir con premura al si-
tio del siniestro".[46] Un argumento similar se aplica al impacto de la de-
mocracia sobre la integración social, en el que Tocqueville afirma que, en
comparación con las aristocracias, cada persona está ligada a una mayor
cantidad de personas, aunque la fuerza de cada vínculo es más débil.[47]
La estructura general de estos argumentos es la siguiente. Queremos en-
tender el efecto de la variable exógena, la democracia, sobre variables en-
dógenas tales como la cantidad de casas destruidas por el fuego o la fuerza
de la integración social. Tocqueville observa que el efecto en cada caso está
modificado por dos variables intermedias, que interactúan multipli-
cativamente en lugar de aditivamente; y que trabajan en direcciones
opuestas. Por lo tanto, el efecto neto puede darse en cualquiera de los dos
sentidos, en ausencia de información acerca de la fuerza relativa de las
dos tendencias. El punto metodológico es que el impacto de la democracia
puede decidirse simplemente observando el efecto neto, y no focalizando
uno de los mecanismos parciales, como se podría hacer fácilmente.
El tercer principio es el del largo plazo. De hecho, es un caso especial
del segundo, pero de suficiente importancia como para ser considerado in-
dividualmente. Tocqueville escribe que "con el tiempo el gobierno demo-
crático debería aumentar las fuerzas reales de una sociedad, pero no pue-
de reunir inmediatamente, en un punto y en un momento dado, fuerzas
tan grandes como las que están a disposición de un gobierno aristocrático
o de una monarquía absoluta".[48] El punto es similar al que planteó
Schumpeter en un famoso argumento a favor del capitalismo, analizado
más adelante en el capítulo 5.
El cuarto principio es el del estado estable. Quizás el argumento cen-
tral del trabajo de Tocqueville sobre la democracia es que no deben con-
fundirse los efectos de la democratización con los efectos de la democracia.
Los primeros son los que se observan antes de que la democracia haya
encontrado su "equilibrio permanente y tranquilo",[49] mientras que los
segundos se encuentran cuando el proceso finalmente llega a un alto. Ob-
sérvese que la distinción entre efectos a corto y largo plazo se realiza den-
tro del estado estable: la ineficiencia del corto plazo y la eficiencia del lar-
go plazo de la democracia pertenecen a las características de estado esta-
ble. Por lo tanto, no deben confundirse efectos transitorios con efectos a
corto plazo. Tocqueville conoce bien el hecho que puede no resultar un es-
tado estable a partir de un cambio exógeno dado. Alrededor de 1855,
cuando escribe acerca del impacto de la revolución francesa, observa que
"ya he escuchado cuatro veces en mi vida que la nueva sociedad, así como
la hizo la Revolución, finalmente había encontrado su estado natural y

43
permanente, y luego los hechos siguientes demostraron que era un
error”.[50] En tales casos, no es posible identificar los efectos de la demo-
cracia: solamente se puede buscar la cadena de efectos que se originan en
la revolución democrática. Pero en su análisis de los Estados Unidos,
Tocqueville claramente creyó posible distinguir los efectos del estado esta-
ble de los meramente transitorios.[51]
Además de las dos dificultades mencionadas más arriba —que el sis-
tema que observamos quizá no haya alcanzado aún su estado estable, y
que quizá no tenga un estado estable— existe la dificultad de que tal vez
nunca haya tiempo para que el efecto de estado estable aparezca, porque
el sistema está constantemente expuesto a choques exógenos. Probable-
mente éste sea el caso en sociedades modernas que cambian rápidamente
(véase el capítulo 3 para un análisis de un problema análogo que surge en
los modelos de cambio social como una cadena de Markov absorbente). Por
todas estas razones, puede resultar difícil identificar casos de causación
simultánea. Por otro lado, se puede aliviar el problema que se origina en
la ausencia de un estado estable extendiendo el concepto de manera de in-
cluir también los ciclos límite. Si, después de un cambio en una variable
exógena, las variables endógenas finalmente quedan fijas en una configu-
ración oscilatoria estable, puede denominarse un efecto del cambio^ en
cuestión. Por ejemplo, se ha dicho que un efecto de la Revolución Francesa
fue introducir un cambio cíclico entre el orleanismo y el bonapartismo.[52]
Explicación estadística. Aunque la explicación determinista es la
ideal en ciencia, con frecuencia hay que contentarse con menos. En parti-
cular, la explicación estadística puede ofrecer una comprensión parcial de
los fenómenos estudiados. Analizaré brevemente tres variedades de este
modo de explicación: explicación deductiva-estadística, explicación induc-
tiva-estadística y análisis de correlación.
Según Hempel,[53] la explicación deductiva-estadística deduce una
regularidad estadística a partir del supuesto de que hay un proceso esto-
cástico. En el estudio de la movilidad social, podemos tratar de explicar los
modelos de movilidad observados bajo la suposición de que se trata de un
proceso de Markov de primer orden o de orden superior, por ejemplo. Es
decir que suponemos que en un momento dado la probabilidad de tran-
sición de un grupo a otro depende de la pertenencia actual o pasada al
grupo. Este enfoque satisface la demanda de un mecanismo en el sentido
que demuestra cómo un simple microproceso genera macromodelos
complejos, pero también nos deja insatisfechos porque el proceso, aunque
simple, sigue siendo fundamentalmente oscuro mientras no se propor-
cione una justificación teórica para el modelo. La afirmación, por ejemplo,
que un obrero seguirá siéndolo con una probabilidad del 60 por ciento y
que será ascendido con una probabilidad del 40 por ciento, no puede ser el
fundamento explicativo. De hecho, si no hay justificación teórica para el
modelo tampoco puede decirse que lo explica, ya que la aparente ca-
pacidad para explicar los datos puede ser simplemente un caso de
"coincidencia con la curva", desacreditada práctica en las ciencias so-
ciales.

44
_ Hay varios modos para tratar de proporcionar un apuntalamiento
teórico de las probabilidades de transición. 1) Suponiendo que la elección
de carrera depende de preferencias, capacidad y oportunidades, el carácter
aleatorio de las primeras puede hacerse inteligible en términos de la
distribución aleatoria de uno de los dos últimos. La capacidad, para tomar
el caso más obvio, puede entenderse en términos de leyes genéticas
estadísticas. Aunque esto es simplemente pasar la responsabilidad
explicativa, mejorar nuestra comprensión si la teoría invocada satisface
uno de requisitos que aquí se estudian. 2) La elección de carrera puede
entenderse-a través de la idea de una estrategia mixta, es decir, una
distribución de probabilidades intencionalmente elegida de entre el
conjunto de estrategias posibles. Lo que parece una explicación causal
imperfecta se transforma en una explicación intencional completamente
satisfactoria.[54] 3) El contexto puede ser tal que justifique el supuesto de
equiprobabilidad, basada en el principio de razón insuficiente. Para tomar
un ejemplo juera de las ciencias sociales, en mecánica estadística se deriva
la distribución de Maxwell de las velocidades de las moléculas a partir del
supuesto de que su movimiento es aleatorio, es decir, que no tiende a
ninguna dirección en particular. La suposición de aleatoriedad está
justificada por el siguiente argumento:
Si el gas está formado por una gran cantidad de partículas en movimiento,
entonces el movimiento de las partículas debe ser completamente aleatorio o
caótico... Si el movimiento fuera ordenado (por ejemplo, que todas las partí-
culas en una caja rectangular se movieran precisamente en caminos parale-
los), tal condición no podría persistir. Cualquier leve irregularidad en la pa-
red de la caja desviaría a alguna partícula fuera de su camino; el choque de
esta partícula desviada con otra desviaría a la segunda, y así sucesivamente.
Evidentemente, el movimiento pronto sería caótico.[55]

El argumento supone que no existe fuerza externa como la gravedad


que logre la regularidad, ni mecanismo interno alguno que logre la
homeostasis. En la deducción de la distribución de Maxwell también hay
que suponer que las partículas tienen la misma masa. Resultará claro por
qué argumentos de este tipo rara vez se aplican a las ciencias sociales.
Las personas difieren entre sí; están sujetas a fuerzas comunes no gene-
radas por su interacción; y no siempre se desvían de su camino cuando se
encuentran.
La explicación inductiva-estadística (otro término tomado de Hem-
pel)[56] invoca las leyes estadísticas para explicar casos especiales en
lugar de modelos de casos. Un ejemplo sería la explicación de la recupera-
ción de una enfermedad mediante el tratamiento con algún medicamento.
Dado el hecho de que la mayoría de los pacientes con la enfermedad se re-
cuperan de ella mediante ese tratamiento, pueden explicarse casos espe-
ciales de recuperación. O un caso particular de ascenso social puede expli-
carse señalando las altas probabilidades de transición que vinculan a
ambos estados analizados. Obviamente, dichas explicaciones comparten
la dificultad observada en el caso de la explicación deductiva-estadística,
y permanece oscura mientras las probabilidades no se justifiquen teórica-

45
mente. Además, la explicación inductiva-estadística tiene una dificultad
propia, señalada por Hempel.[57] Consideremos las siguientes inferencias:
(l a) Si el barómetro baja, casi seguro lloverá
(2a) El barómetro baja
(3a) Casi seguro lloverá
(1b) Cuando el cielo está colorado a la noche, es casi seguro que no
lloverá
(2b) El cielo está colorado esta noche
(3b) Es casi seguro que no lloverá
Aquí las cuatro premisas pueden ser ciertas, y sin embargo, ambas
conclusiones pueden no serlo. Por lo tanto, debe haber algo incorrecto en
el modo de inferencia. Hempel diagnostica la falla en el hecho de que la
conclusión es independiente de sus premisas, y afirma que solamente
puede entenderse en relación con la evidencia o fundamento en que se ba-
sa. Esta dificultad se arrastra de la predicción a la explicación, dado que
"no importa si se nos informa que determinado hecho... ocurrió o no, pode-
mos producir una explicación del resultado en cualquiera de los dos casos;
y una explicación, más aun, cuyas premisas son afirmaciones científica-
mente establecidas que confieren una alta probabilidad lógica al resulta-
do informado".[58] O nuevamente, consideremos el siguiente ejemplo.
López se recupera de una enfermedad luego de haberse tratado con peni-
cilina. Como la mayoría de las personas que trataron la misma enferme-
dad con penicilina se recuperan, podemos explicar la recuperación de Ló-
pez según líneas inductivo-estadísticas. Sin embargo, puede suceder que
un pequeño subgrupo de personas sean muy probablemente inmunes al
tratamiento con penicilina. Y López es uno de ellos. Si bien se curó, fue
porque pertenecía a un subgrupo de dicho subgrupo, cuyos miembros tie-
nen grandes probabilidades de ser curados por la penicilina. Evidente-
mente, la explicación —si es que este término es correcto— de la recupera-
ción de López debe invocar su pertenencia al subgrupo del subgrupo, y no
su pertenencia a la población general. Pero si no supiéramos nada acerca
de estas diferenciaciones finas, bien podríamos concluir que López se curó
porque la penicilina en general lleva a la recuperación. La explicación in-
ductiva-estadística, por las razones demostradas en tales casos, puede ser
ilegítima.
El análisis de correlación y sus derivaciones más sofisticadas como el
análisis de camino, proceden encontrando covariaciones sistemáticas en-
tre las variables. Para una variable dependiente dada podemos encontrar
que covaría con varias variables independientes, y mediante ^conocidas
técnicas estadísticas es posible determinar la fuerza relativa de estos
vínculos, distinguir entre efectos directos e indirectos, etc. Típicamente la
variable dependiente solamente es explicada parcialmente por las varia-
bles independientes, y el "residuo inexplicado" que queda frecuentemente
es muy grande. Sin embargo, decir que una explicación es sólo parcial-
mente exitosa no es decir que es ilegítima.[59] Generalmente con esto úl-

46
timo nos referimos a la correlación entre dos
variables que no se origina en una relación causal
entre ellas, sino en su relación común con una ter-
cera. Esto es lo que antes apareció como el problema
de epifenómenos. El peligro de confundir correlación
y causación es un problema constante en este modo
de explicación estadística y la razón por la que hay
que cuidar- se de interpretar correlaciones como más
que indicaciones que "algo está pasando" que vale la
pena ser observado con más detalle. O quizás el pun-
to debería expresarse negativamente, que la función
del análisis de correlación es que nos permite
descartar una hipótesis causal si la correlación resulta
baja.
Es común decir en tales casos que se puede
distinguir la correlación verdadera (es decir,
explicatoria) de la ilegítima "controlando" la tercera
variable. Si, por ejemplo, hay una alta correlación
negativa entre x (el porcentaje de miembros de un
grupo que son casados) e y (la cantidad promedio de
kilos de caramelos consumidos mensualmente por
cada miembro), podemos sospechar que esto se debe
a que son efectos de una causa común z (la edad
promedio de los miembros del grupo). Si z se
mantiene constante, la correlación entre x, e y puede
desaparecer, y podríamos concluir sin más que la
correlación era ilegítima. Y en este caso
probablemente sería la conclusión correcta. Pero
consideremos el siguiente caso, extraído, como el
anterior, de un importante artículo de Herbert Simón.
[60] Suponemos una alta correlación positiva entre x
(el porcentaje de mujeres empleadas casadas) e y (el
promedio de ausencias semanales por empleado). Sin
embargo, cuando z (la cantidad de trabajo en la casa
realizado semanalmen-te por empleada) se mantiene
constante, la correlación entre x e y desaparece. Sin
embargo, aquí concluiríamos que z es una variable
interviniente entre x e y. En el primer caso la cadena
causal es x <— z —>y, en el segundo es x —>z —
>y. En el primer caso la correlación entre x e y era
realmente ilegítima, en el segundo, no, aunque en
ambos casos desaparece cuando se mantiene z
constante. Lo que nos permite distinguir entre los dos
casos son supuestos a priori acerca de los
mecanismos causales que seguramente operarán; y
ninguna mera manipulación o control de las variables
puede sustituir tales supuestos.
47
Explicación funcional

En biología la explicación funcional es, histórica y lógicamente, el


principal ejemplo de este modo de explicación. Históricamente, porque en
gran medida la ciencia social funcionalista contemporánea deriva del pa-
radigma biológico; y lógicamente porque la teoría evolucionista sigue
siendo el único caso de éxito completo de explicación funcional. Por lo tanto,
en primer lugar voy a exponer este paradigma biológico y luego continuaré
con el análisis de algunas variedades de explicación funcional en las
ciencias sociales.

a. Explicación funcional: en biología


Primeramente esbozaré una explicación muy simplificada [1] de la
teoría de la selección natural, que es el fundamento de la explicación fun-
cional en biología. Ateniéndome estrictamente a los principios iniciales
espero no cometer errores sobre asuntos específicamente biológicos fuera
de mi competencia. Como las conclusiones estarán en el nivel de dichos
principios, espero que mis simplificaciones estén justificadas.
Pensemos en los organismos de una población como una máquina que
constantemente recibe entradas en forma de mutaciones. (La analogía de
la máquina puede parecer forzada, pero resultará útil después.) Por razones
de simplicidad supongo reproducción asexual, de modo que las mutaciones
son la única fuente de novedades genéticas; por otro lado podemos ignorar
la recombinación si afirmamos que con el tiempo solamente las
mutaciones pueden perturbar el equilibrio biológico (en un medio cons-
tante). Supongo, y esto es decisivo, que las mutaciones son aleatorias y pe-
queñas. La corriente de entradas es aleatoria, en el sentido de que no hay
correlación entre los requisitos funcionales o las necesidades del organis-
mo y la probabilidad de ocurrencia de una mutación que satisface dichas
necesidades. Mediante mutagenes es posible aumentar la probabilidad de
mutaciones en general e incluso de subgrupos de mutaciones estructural-
mente especificados, pero es imposible —y éste es el dogma central de la
biología molecular— modificar la probabilidad de subgrúpos de mutaciones
funcionalmente definidos. Si comparamos las mutaciones con errores de
imprenta, se puede aumentar la probabilidad de errores de imprenta
rompiendo los lentes del tipógrafo, pero no hay manera de aumentar se-

48
lectivamente )a probabilidad de errores de imprenta que ocurran en la se-
gunda edición de un libro que corregirá los errores de la primera edición.
Más aun, se supone que las mutaciones son pequeñas, típicamente
Instituciones de aminoácidos que resultan del error en una sola letra del
lenguaje genético. Sin duda hay mecanismos, como la duplicación de ge-
nes, que pueden producir macromutaciones. Sin embargo, en primer lu-
gar la importancia evolutiva de éstos actualmente es muy controvertida;
y en segundo lugar, tales mutaciones, mientras que son grandes compara-
das con las sustituciones de aminoácidos, son pequeñas comparadas con
las discontinuidades que se encuentran en la innovación humana. Antici-
pando el análisis del capítulo 5 más adelante, ninguna duplicación de ge-
nes podría producir un cambio del orden de magnitud del cambio de un ca-
rro tirado por caballos a uno "sin caballos".[2] O para citar a Schumpeter
Por más que agreguemos sucesivamente tantos vagones de correo como
queramos, nunca tendremos con un eso un ferrocarril".[3] Como el argu-
mento principal en este trabajo es que hay una diferencia básica entre la
optimización local a través de pequeñas mejoras y la maximización global
que permite pasos de cualquier tamaño, la definición precisa de "pequeño"
no es realmente importante.
En la frase de Jacques Monod, la selección natural funciona por ca-
sualidad y necesidad.[4] Mientras que las mutaciones son aleatorias, el
proceso de selección es determinístico, en el sentido de que en cualquier
momento la máquina tiene criterios bien definidos para aceptar o recha-
zar cualquier mutación dada. (Esto significa que no me ocuparé de la
corriente genética ni de la evolución no darwiniana.) La mutación es acep-
tada si el primer organismo en la que ocurre se beneficia con una mayor
capacidad reproductiva. Entonces como el organismo deja más descen-
dientes que los otros organismos de la población, el nuevo alelo se expan-
dirá hasta estar universalmente presente. (Esto significa que no hablaré
de la selección dependiente de la frecuencia ni de otras fuentes de poli-
morfismo estable —como la heterosis— salvo un breve análisis en el
capítulo 3.) Una vez aceptada una mutación, los criterios para aceptar o
rechazar otras mutaciones cambiarán ya que el organismo, al estar ahora
en un estado diferente, puede resultar perjudicado o beneficiado por dife-
rentes entradas. La máquina dice Sí o No para cada entrada según crite-
rios que cambian cada vez que dice Sí. Si la máquina alguna vez llega a un
estado en el que dice No para cada una de las entradas (finitamente) posi-
bles, decimos que ha alcanzado un máximo local. La población asciende
por un gradiente de conveniencia hasta que llega a un punto desde el que
cualquier otro movimiento solamente puede ser descendente, y allí se de-
tiene.
Esta máquina de maximizar localmente es incapaz de determinadas
clases de conducta que, sin embargo, están indisociablemente vinculadas
a la adaptación humana y la resolución de problemas. En primer lugar, la
máquina no puede aprender de errores pasados, ya que sólo el éxito se
trae desde el pasado. En evolución no hay nada que corresponda a las "fa-
llas útiles" de ingeniería.[5] En segundo lugar, la máquina no puede utili-
zar la clase de estrategias indirectas resumidas en la frase "un paso hacia

49
atrás, dos hacia adelante". Un excelente ejemplo de tal conducta entre los
humanos es la inversión, por ejemplo: en maquinaria; consumir menos
ahora para consumir más en el futuro. En tercer lugar, la máquina es in-
capaz de esperar, es decir, de rechazar oportunidades ahora para poder
explotar otras más favorables más tarde. El sistema de las patentes pue-
de ser un ejemplo de tal conducta entre los humanos: "retrasar la difusión
de progresos técnicos asegura que habrá más progresos para difundir".[6]
Y por último, la máquina no podn'a comprometerse con antelación, lle-
vando a cabo pasos hoy para restringir lo factible mañana.[7] Analizo al-
gunos de estos puntos con más detalle en el capítulo siguiente. Aquí sola-
mente quiero subrayar lo que se ha denominado el carácter impaciente,
miópico u oportunista de la selección natural: no tiene memoria del pasa-
do ni capacidad para actuar en términos del futuro.
Un análisis más detallado de la máquina explicará la posibilidad de
cambio ambiental Si el medio cambia, los criterios para decir Sí o No a las
mutaciones en general también cambiarán. Una mutación no es benefi-
ciosa o perjudicial en sí misma, sino solamente con respecto a anteceden-
tes genéticos dados (que son el resultado de mutaciones anteriores) y a un
medio dado. Con un medio cambiante bien puede darse el caso de que in-
cluso nunca se alcancen máximos locales transitorios si el organismo no
puede avanzar al mismo ritmo que el medio. Sin embargo, el concepto de
medio es ambiguo. En primer lugar, los cambios ambientales pueden ser
modificaciones del medio climático y geológico, hasta el punto en que pro-
vocan un cambio evolutivo sin verse afectados por él. (La última condición
es necesaria para excluir cambios climáticos endógenos, tales como el
cambio en la atmósfera originado por la evolución de las plantas.) En
segundo lugar, algunas partes de los ambientes son organismos en
evolución o que están afectados por ella. Si una población está constante-
mente sujeta a un cambio ambiental exógeno, nunca puede lograrse un
equilibrio duradero, pero si el medio está formado (o afectado) por orga-
nismos en evolución, tiene sentido preguntar si se puede lograr un equili-
brio biológico general, un estado en el que todos los organismos han alcan-
zado máximos locales con respecto a los demás. A priori, no es obvio que
éste sea siempre el caso: podría haber "juegos evolutivos" sin equilibrio.
No hay una objeción lógica a la idea de un mundo en el que la propor-
ción de cambios del medio sea tan alta, en relación con la proporción de
mutaciones, que la mayoría de los organismos la mayor parte del tiempo
se adapten mal entre sí y al medio inorgánico. Sin embargo, en el mundo
que conocemos las infinitas adaptaciones sutiles que se encuentran en la
estructura y conducta de los organismos han atraído durante milenios la
curiosidad y —menos justificadamente— la admiración de los naturalis-
tas. En muchos casos bien documentados la solución natural a los proble-
mas estructurales y funcionales está sorprendentemente cerca de la que
hubiera elegido un ingeniero trabajando sobre el mismo problema. En al-
gunos casos los animales y los hombres se están enfrentando a los mismos
problemas, de manera que se pueden comparar las soluciones. Como lo
demostró d'Arcy Wentworth Thompson en su tratado clásico On Growth
and Form, así como también otros autores recientes,[8] estas soluciones

50
con frecuencia son fuertemente convergentes. En trabajos ecológicos re
cientes,[9] la naturaleza se considera como un economista y no como un
ingeniero; de hecho la presupuestaron óptima, la programación lineal, la
maximización de las ganancias, la minimización de los costos e incluso
la teoría del juego se están convirtiendo en parte de la teoría
evolucionista como de la economía. La evolución ha tenido mucho éxito
en la resolución del problema de acertar a un blanco móvil, es decir, de
adaptarse a un me-dio cambiante. Esto sólo puede ser debido a la
velocidad relativa de los ¿dos procesos intervinientes: la velocidad con
la que se mueve la evolución hacia el blanco debe ser mucho mayor que
la velocidad con que el blanco se aleja de la evolución. (Debería
agregar, para evitar un malentendido, que un medio que cambia
regularmente puede tratarse como uno constante a los efectos de la
teoría de la evolución.)[10]
Ahora estamos en condiciones de mostrar la estructura lógica de la
explicación funcional en biología. Me ocuparé del caso ideal, en el que po-
demos describir el explanandum lo más completamente posible dentro del
marco funcional. De lo que se ha dicho más arriba, está claro que, y por
qué, rara vez si es que sucede, se realiza este ideal. Entonces podemos de-
cir que una característica estructural o de conducta de un organismo está
explicada funcionalmente si se puede demostrar que es parte de un máxi-
mo individual local con respecto a la capacidad reproductiva, en un medio
de otros organismos que han alcanzado máximos locales similares. Es de-
cir, si podemos demostrar que un pequeño cambio en la característica
estudiada conducirá a una capacidad reproductiva reducida para el orga-
nismo, entonces entenderemos por qué el organismo tiene dicha caracte-
rística.
He analizado dos de los elementos de esta definición: el concepto de
un máximo local y el de un equilibrio biológico general. Ahora quiero decir
algo acerca de las otras dos ideas que entran en la definición. Primero, de-
bemos insistir en el carácter estrictamente individualista de la explica-
ción funcional en biología. La evolución natural promueve la capacidad
reproductiva del organismo individual, no la de la población, de las espe-
cies o del ecosistema. De hecho, el aumento de la capacidad reproductiva
del individuo puede reducir la de la población. Para explicar cómo puede
suceder esto necesitamos un aparato conceptual que resultará útil en ca-
pítulos posteriores.
Supongamos que un organismo (o un individuo humano) pueda com-
portarse en una de dos maneras diferentes, egoístamente (E) y altruista-
mente (A). No debe preocuparnos aquí el origen de cualquier conducta ob-
servada: puede ser elección deliberada, mutación, etc. Supongamos también
que el organismo (restringiéndonos a este caso por el momento) vive en
una población de otros organismos que también se comportan de alguna
de estas dos maneras. Debido a la interacción, el resultado —en términos
de capacidad reproductiva— para el organismo dependerá no solamente
de su propia conducta, sino también de la de los demás. Por conveniencia
y sin mucha pérdida de generalidad,[ll] podemos suponer que la situa-
ción que enfrenta el organismo es la siguiente. Hay sólo cuatro posibilida-
des: por un lado el organismo puede seguir A o E, y por el otro lado todos

51
los demás pueden seguir A o todos pueden seguir E. Escribiremos '(A, E)'
:para el caso en que el organismo adopta A y todos los demás E; '(E, E)' pa-
ra el caso en que el organismo y los demás adoptan E; y así con los demás.
Si tomamos un ejemplo de los cardúmenes de peces,[12] 'E' será la tenden-
cia hacia el medio del cardumen y 'A' será la ausencia de dicha tendencia.
Es claro entonces que será favorecida una mutación hacia E ya que, sien-
do las otras iguales, siempre es mejor estar en el medio del cardumen que
en la periferia porque los peces del medio están menos expuestos a los de-
predadores. Sin embargo, si todos tratan de estar en el medio (como lo ha-
rán, ya que los peces que lo hagan se verán favorecidos por la selección na-
tural), el cardumen como un todo se tornará más compacto y estará más
expuesto a los depredadores. Esto significa que, desde el punto de vista de
la capacidad reproductiva de cada pez, las cuatro alternativas pueden cla-
sificarse según el orden de preferencia del dilema de los prisioneros:
Preferencias del dilema de los prisioneros:
1. (E, A). 2. (A, A). 3. (E, E). 4. (A, E).
Para referencias futuras deberán tenerse en cuenta las siguientes ca-
racterísticas de esta estructura, 1) Si nos limitamos a los casos en que to-
dos se comportan del mismo modo,.el altruismo universal tiene preferen-
cia sobre el egoísmo universal. 2) El egoísmo es una estrategia dominante,
ya que cualquier cosa que hagan los demás peces, la mejor opción para
cada pez es seguir E. 3) Esto significa que el resultado será que todos si-
gan E. 4) Esto significa que el resultado real es peor para todos que cual-
quier otra opción concebible, y peor en particular para todos que la situa-
ción que sé obtuvo antes de la mutación a E. Entonces el resultado real es
Pareto inferior al estado inicial. 5) Él resultado "colectivamente óptimo"
(A, A) es tanto individualmente inaccesible (no hay ventaja dando el pri-
mer paso hacia él) como individualmente inestable (hay una ventaja en
dar el primer paso alejándose de él). 6) Para cada organismo la mejor si-
tuación posible es la de egoísmo unilateral ("jinete independiente"), la
peor, la de altruismo unilateral ("aprovechador").
Muchas de estas observaciones resultarán más pertinentes cuando se
traduzcan al lenguaje intencional propio del análisis de la conducta hu-
mana. Pero demuestran claramente que no hay mecanismo mediante el
cual la selección natural tiende a favorecer la supervivencia de las espe-
cies o de la población. De hecho, la población puede "mejorarse hasta la
extinción". Sin embargo, esta tendencia individualista de la selección
natural no excluye la evolución de una conducta altruista, a través de me-
canismos tales como la selección por parentesco, la selección recíproca o
—posiblemente— la selección grupal.[13] Pero la tendencia requiere que
todas estas explicaciones tengan una base firme en las presiones de la se-
lección que se ejercen sobre los indi vi dúos..El antiguo concepto de que las
características que originan beneficios colectivos pueden explicarse sim-
plemente a través de aquellos beneficios, ha sido abandonado por la biolo-
gía contemporánea.[14]
La última característica de la explicación funcional sobre la que quie-

52
ro dirigir la atención es que el maximando es la adaptación
reproductiva, no la adaptación al ambiente según se mide, digamos,
durante una vida. Es obvio que cierta adaptación ecológica en general
es un medio indispensable para la adaptación reproductiva, pues si no se
sobrevive, tampoco se puede reproducir. Pero la conexión es
solamente general: la selección natural no favorece el grado
máximo de adaptación ecológica, sino el grado que es óptimo para
la adaptación reproductiva. Demasiada adaptación ecológica puede
resultar perjudicial para la adaptación reproductiva, simplemente
porque el sólo proceso de producir y criar descendencia crea un
riesgo ecológico para el organismo exponiéndolo más a depredadores que
en otro momento. Para maximizar la adaptación ecológica un organismo
debería ser estéril, con adaptación reproductiva cero.
Es importante ver que las dos últimas características mencionadas de la
explicación funcional crean una teoría muy diferente de la imagen po-
pular de la evolución. En lugar del tranquilizador panorama de la selec-
ción natural que adapta las especies a su medio, por ejemplo, evitando el
pastoreo excesivo o la agresión, obtenemos la triste historia de organis-
mos individuales que salen a maximizar la cantidad de descendientes, su-
ceda lo que suceda. O, más sombrío aun, una historia acerca de genes indi-
viduales que salen a maximizar las copias de ellos mismos, utilizando a
cada organismo como sus recipientes.[15]

ií); Explicación funcional: en las ciencias sociales


. Mi análisis de la explicación funcional en las ciencias sociales constará
de dos pasos. En primer lugar expondré un argumento contra esta ex-
plicación que ya he desarrollado en otra parte, y que aún creo que es bási-
camente válida.[16] Sin embargo, en segundo lugar explicaré algunas de
tas razones que me han hecho ver que el tema es más complicado de lo que
¡solía pensar. Antes de entrar en los detalles de estos argumentos, quiero
decir algunas palabras acerca de la gran atracción que parece ejercer la
explicación funcional sobre muchos científicos sociales, bastante indepen-
dientemente de los argumentos serios que puedan introducirse en su de-
fensa. Creo que la atracción se origina en el supuesto implícito de que to-
dos los fenómenos sociales y psicológicos deben tener un significado, es
decir que debe haber algún sentido, alguna perspectiva en los que son be-
neficiosos para alguien o algo; y que además estos efectos benéficos son
;los que explican el fenómeno estudiado. Este modo de pensar es totalmen-
te ajeno a la idea de que puede haber elementos de sonido y furia en la vi-
da social, consecuencias involuntarias y accidentales que no tienen signi-
ficado alguno. Incluso cuando el cuento parece relatado por un idiota, se
supone que existe un código que, una vez hallado, nos permitirá descifrar
el verdadero significado.
Esta actitud tiene dos raíces principales en la historia de las ideas. La
primera es la tradición teológica que culmina con la Teodicea de Leibniz,
con el argumento de que todos los males aparentes del mundo tienen con-

53
secuencias beneficiosas para el modelo más amplio que los justifica y ex-
plica. Es cierto, ésta no es la única forma posible de teodicea, pues tam-
bién existe la tradición alternativa que explica el mal como el inevitable
subproducto del bien y no como un medio necesario para lograrlo.[173 Cas-
car los huevos no contribuye al sabor de la omelette; simplemente no pue-
de ser de otro modo. Además, la teodicea no puede servir como una base
deductiva para la sociodicea, para utilizar un término acuñado por Ray-
mond Aron, solamente como una analogía. No hay razón para que el mejor
de los mundos posibles también incluya a la mejor de las sociedades posi-
bles. De hecho, el punto central de la teodicea es que la suboptimalidad en
la parte puede ser una condición para la optimalidad en el todo, y esto
también puede ser cierto si la parte considerada es el rincón del universo
en el que la historia del hombre se desarrolla. A pesar de estas amenidades
lógicas, el legado de la tradición teológica a las ciencias sociales fue una
fuerte conjetura de que los vicios privados resultarían ser beneficios pú-
blicos.
En segundo lugar, la búsqueda de significado deriva de la biología
moderna. La biología predarwiniana también encontró un penetrante sig-
nificado en los fenómenos biológicos, pero era un significado otorgado por
el creador divino y no uno que pudiera servir como una inspiración inde-
pendiente para la sociología. Sin embargo, Darwin le dio a la adaptación
biológica un fundamento sólido en el análisis causal proporcionando así
un sustituto para la tradición teológica a cuya destrucción también con-
tribuyó. Anteriormente tanto la sociodicea como la biodicea derivaban di-
rectamente de la teodicea, pero ahora la sociodicea podría apelar a una
biodicea independiente. Nuevamente, la biodicea no servía como una base
deductiva (excepto algunas formas de darwinismo social y más reciente-
mente la sociobiología), sino como una analogía. De modos algunas veces
crudos y otras veces sutiles, los científicos sociales estudiaban la sociedad
como si los presupuestos de adaptación y estabilidad tuvieran la misma
validez que en el reino animal. En la cámara de los horrores del pensa-
miento científico los excesos biológicos de muchos científicos sociales cer-
ca de comienzos de siglo ocupan un lugar primordial.[18] Actualmente la
situación es menos desastrosa, pero el paradigma biológico mantiene una
importancia desproporcionada con respecto a sus méritos.
Podemos distinguir entre el programa fuerte y débil de la sociología
funcionalista. El programa fuerte puede resumirse en el
Principio de Malinowski: Todos los fenómenos sociales tienen conse-
cuencias beneficiosas (intencionadas o no, reconocidas o no) que los
explican.
Este principio puede asociarse con ideologías tanto conservadoras co-
mo revolucionarias: las primeras explicarán los hechos sociales en térmi-
nos de su contribución a la cohesión social, las segundas según su contri-
bución a la opresión y el dominio de clase.[19]
Esta teoría fue hábilmente criticada por Merton,[20] que propuso a su
vez expresar el programa débil de la siguiente manera:

54
Principio de Merton: Cada vez que los fenómenos sociales tienen con-
secuencias beneficiosas, involuntarias y no reconocidas, también pue-
den explicarse a través de dichas consecuencias.
Para situar la falacia en este principio, permítaseme enunciar lo que .
una forma de explicación funcional válida, si bien rara vez ejemplifi-i, para
demostrar cómo se desvía de ella el Principio de Merton. De Urentes
estándar como Social Theory and Social Structure de Merton y
Constructing Social Theories de Stinchcombe, podemos extraer la siguien-
lescriptión de lo que parecería una explicación funcional válida:[21]
Un modelo X de institución o de conducta es explicado por su función
el grupo Z si y sólo si:
1) Y es un efecto de X;
2) Y es beneficioso para Z;
3) Y no es intención de los actores que realizan X;
4) Y —o por lo menos la relación causal entre X e Y— no es reconoci
da por los actores en Z;
5) Y mantiene a X por un giro de retroalimentación causal que pasa a
través de Z.[22]
Hay algunos casos en las ciencias sociales que satisfacen todos estos
Criterios. El más conocido es el intento de la escuela de economistas de
Chicago de explicar la conducta de maximización de ganancias como re-
Multado de la "selección natural" de empresas por el mercado. [23] La ano-
malía que motivó este intento fue la siguiente. Por un lado, la conducta
«xterna observada en las empresas, como la elección de combinaciones de
factores y de nivel de producción, parece indicar que adoptan una posición
pe maximizar las ganancias ajustándose óptimamente a la situación del
"mercado. Por otro lado, estudios del proceso interno de toma de decisiones
^Le la empresa no encontraron que tuviera dicho objetivo; sino que eran
^usuales ciertas reglas prácticas e inmediatas. Para cubrir la brecha entre
la producción de la caja negra y su trabajo interno, uno postuló que algu-
nas empresas simplemente utilizaran reglas prácticas para maximizar
las ganancias y otras no; que las primeras sobreviven mientras que las
Jotras se extinguen; que las rutinas de maximización de ganancias tienden
"a propagarse entre la población de empresas, ya sea por imitación o por
adquisición de compañías. Si fijamos X igual a cierta regla práctica, Y
igual a la maximización de ganancias y Z igual al conjunto de empresas,
-tendremos un ejemplo de análisis funcional exitoso, en el sentido de que
'posee la clase correcta de estructura explicativa. Sin embargo, debe obser-
varse que la condición 4 solamente se cumple si las reglas se propagan por
adquisición de compañías, no por imitación.
Russell Hardin me ha convencido de que este ejemplo no es tan singu-
lar como se pensaba antes.[24] Entre otros, da el siguiente ingenioso
ejemplo: el crecimiento de la burocracia norteamericana puede explicarse
a través de sus consecuencias beneficiosas para los congresistas, pues una

55
burocracia significa más problemas burocráticos para el votante, y más
quejas para sus representantes en el Congreso, que entonces son reelegi-
dos porque son más capaces que los candidatos nuevos para brindar este
servicio, pero también significa que los congresistas tienen menos tiempo
para el trabajo legislativo, que entonces recae en la burocracia, que por lo
tanto aumenta. Similarmente, el refuerzo skinneriano proporcionaría un
mecanismo que puede sostener explicaciones funcionales, aunque nueva-
mente es dudoso si se cumple la condición 4, pues "si un vínculo causal es
tan sutil que su percepción está más allá de los poderes cognitivos (del be-
neficiario), no puede desempeñar ningún papel en el refuerzo".[25] Si
abandonamos la condición 4, obtenemos la clase de explicaciones que po-
drían denominarse explicaciones filtro, en las que el beneficiario puede
percibir y reforzar (o adoptar) el modelo que lo beneficia, aunque en pri-
mer lugar dichos beneficios no tuvieron ningún papel en su surgimiento.
Si bien son empíricamente importantes,[26] estas explicaciones no sirven
como ejemplos de explicación funcional exitosa así como se utiliza el tér-
mino aquí.
Sin embargo, mi preocupación principal no es la rareza o frecuencia
de los casos exitosos del paradigma enunciado más arriba. Quiero decir
que muchos casos aparentes de explicación funcional fallan porque el giro
de retroalimentación del criterio 5 está postulado y no demostrado. O qui-
zá "postulado" es demasiado fuerte, y debería decir "tácitamente presu-
puesto". Los sociólogos funcionalistas afirman como si (que no es afirmar
qué) el criterio 5 se cumpliera automáticamente cuando se cumplen los
otros criterios. Como la demostración de que un fenómeno tiene conse-
cuencias involuntarias, no percibidas y beneficiosas parece otorgarle cier-
ta clase de significado, y como dar significado es explicar, el sociólogo tien-
de a suponer que su trabajo ha terminado cuando se demuestra que se
cumplen los primeros cuatro criterios. En todo caso, ésta es la única mane-
ra en que puedo explicar la verdadera práctica de la sociología funcionalis-
ta, de la que ahora daré algunas muestras.
Consideremos primero un argumento de Lewis Coser con respecto a
que "Los conflictos dentro y entre estructuras burocráticas proporcionan
los medios para evitar la osificación y el ritualismo que amenaza su forma
de organización".[27] La frase es característicamente ambigua, pero es di-
fícil no retener una impresión de que la prevención de la osificación expli-
ca el conflicto burocrático. Si no se hacen reclamos explícatenos, ¿por qué
Coser no escribió "tiene el efecto de reducir" en lugar de "proporcionan los
medios para evitar"? El término "medios" indica claramente el concepto
complementario de un "fin", con la idea sugerida de que el medio está allí
en favor del fin. Pero por supuesto no se postula ningún actor que desplie-
gue los medios o que defina el fin: estamos en presencia de una teleología
objetiva, un proceso que no tiene sujeto y sin embargo tiene una meta.
Como ejemplo tomaré el siguiente pasaje del tercer volumen del Capi-
tal de Marx:
La circunstancia de que un hombre sin fortuna pero que posee energía, soli-
dez, estabilidad y agudeza comercial pueda convertirse en un capitalista de

56
esta manera... es muy admirada por los apologistas del sistema capitalista.
Aunque esta circunstancia trae continuamente una indeseada cantidad de
nuevos soldados de fortuna al campo y a la competencia con los capitalistas P-
ya existentes, también refuerza la supremacía del capital mismo, extiende su
base y le permite reclutar nuevas fuerzas para sí fuera del sustrato de la
sociedad. De manera similar, la circunstancia de que la Iglesia Católica, en la
Edad Media, formara su jerarquía con los mejores cerebros del territorio, sín
considerar sus propiedades, nacimiento o fortuna, fue uno de los principales
medios para consolidar el poder eclesiástico y suprimir la laicicidad
Nuevamente observamos el uso delator de la palabra "medios", así
como la/idea de que el "capital" —no debe confundirse con el conjunto de
los capitalistas— tiene ojos que ven y manos que se mueven.[29] Es
verdad queel texto puede interpretarse como para entender que Marx
simplemente está describiendo una feliz coincidencia, pero a la luz de sus
antecedentes hegelianos y su persistente inclinación a la explicación
funcional, no tomar seriamente la idea.[30]
Luego los marxistas continuaron la tradición de la teleología
objetiva, Es un procedimiento normal entre los científicos sociales
marxistas explicar cualquier institución, política o conducta dadas,
buscando primero la clase a cuyo interés sirven y luego explicándolas
a través de dichos intereses. O con frecuencia se supone que todos los
fenómenos sociales sirven a los intereses de la clase capitalista, y
luego el asunto se convierte en la búsqueda de un sentido aceptable
en el que esto sea cierto. Esto resulta muy fácil con los significados
múltiples del concepto de interés de clase, que es ambiguo con respecto
a las distinciones entre el interés del inte-grante de cada clase y el
interés de la clase como un todo; entre el interés a corto y a largo plazo;
entre el interés transicional y el de estado fijo; entre el interés inmediato y el
fundamental; entre el interés económico y el político. Pero por
supuesto el solo hecho de que en cierto sentido se atienda a un interés
de clase no ofrece una explicación. Por ejemplo, es cierto: las
divisiones internas en la clase obrera sirven a los intereses de la
capitalista, pero no debemos concluir a partir de ello que ocurren
porque tienen dicho efecto.[31] Hacerlo es ignorar la importante
distinción de Simmel entre tertius gaudens y divide et impera: es posible
beneficiarse con el conflicto entre los propios enemigos y sin embargo no
tener en el sufrimiento del conflicto.[32]
Los científicos sociales marxistas tienden a combinar la falacia
funcio-nalista general con otra, el supuesto de que las consecuencias de
largo pueden explicar sus causas incluso cuando no hay acción
intencional (o selección).[33] Por ejemplo, hay algunas teorías marxistas
del Esta-;||ó que 1) rechazan el concepto instrumental del Estado como
una herramienta en manos de la clase capitalista, 2) aceptan que el Estado
frecuentemente actúa de un modo que va en detrimento del interés a corto
plazo de la clase capitalista, 3) afirman que es en el interés a largo plazo
de dicha clase tener un Estado que no actúa siempre y en todas partes en
favor de su interés a corto plazo, y 4) sostienen que este interés a largo plazo
explica las acciones del Estado,incluyendo las que están contra el interés a

57
corto plazo.[34] Ahora bien, en primer lugar, el concepto de interés a largo
plazo es tan elástico y ambiguo que puede utilizarse para demostrar casi
cualquier cosa; y en segundo lugar no se puede apelar al modelo "un paso
hacia atrás, dos hacia adelante" sin apelar también a la existencia de un
agente intencional. No se pueden tener las dos situaciones: ambas apelan
a una teleología objetiva que no requiere un agente intencional, y atribu-
yen a esta teleología un modelo que solamente tiene sentido para la inten-
cionalidad subjetiva.[35]
Esto concluye mi argumento —o debería decir diatriba— contra la ex-
plicación funcional del tipo más irreflexivo. Podría parecer injusto incluir
a Merton entre, e incluso como el ejemplo más importante de, los adhe-
rentes a este procedimiento. De hecho deja el interrogante de si sus análi-
sis funcionales pretenden explicar, o quizá simplemente son paradigmas
para el estudio de consecuencias involuntarias en general. Pero como los
comprensivos lectores han considerado que su meta es la explicación,[36]
y como sin duda ha sido la interpretación más influyente, creo que mi pre-
sentación está ampliamente justificada.
Los argumentos presentados más arriba descansan sobre dos pre-
misas tácitas. Primero, una explicación funcional puede triunfar sola-
mente si hay razones para creer en un giro de realimentación desde la
consecuencia hasta el fenómeno que se explica. Segundo, estas razones
solamente pueden ser la muestra de un mecanismo específico de rea-
limentación en cada caso en particular. La segunda premisa no es ne-
cesaria en el caso de la explicación funcional en biología, pues aquí
tenemos conocimiento general —la teoría de la evolución a través de la
selección natural— de que asegura la existencia de cierto mecanismo de
realimentación, aunque en un caso dado no podamos demostrarlo. Pero no
hay un análogo de las ciencias sociales a la teoría de la evolución y, por lo
tanto, los científicos sociales se ven obligados a mostrar en cada caso cómo
funciona la realimentación. Ahora continuaré analizando dos defensas de
la explicación funcional que se basan en la negación de ambas premisas
respectivamente. Comienzo con el intento de Arthur Stinchcombe de de-
mostrar que hay un análogo de las ciencias sociales a la teoría de la selec-
ción natural, y luego analizaré la propuesta más revolucionaria de G. A.
Cohen de que para una explicación funcional exitosa no es necesario nin-
gún conocimiento —general o específico— de un mecanismo.
Stinchcombe indica que deberíamos considerar el cambio social como
una cadena absorbente de Markov.[37] Para explicar esta idea, utilizaré
un ejemplo de un pasaje citado más arriba, con respecto a la función de los
conflictos dentro y entre las burocracias. Suponemos que el sistema bu-
rocrático puede estar en uno de dos estados posibles: R (rígido) y F (flexi-
ble). Una burocracia rígida tiene una estructura jerárquica que no permi-
te la manifestación de conflictos. Esto conduce a la acumulación de
tensión en la organización, que tendrá dificultades, para adaptarse a las
condiciones cambiantes y a los problemas. Por otro lado, una estructura
flexible permite el desarrollo actualizado del conflicto y asegura la adap-
tación. Entonces planteamos la pregunta de Markov: dado que la organi-
zación en el momento t se encuentra en uno de los dos estados R o F, ¿cuá-

58
les son las probabilidades de que el momento £ +1 esté en uno u otro de los
estados?
Estado en el momento t R

R 0 < p <1 0

F 1-p 1
El supuesto central representado en el cuadro 2 es que
el estado F es absorbente. Una vez que la organización ha
entrado en dicho estado, nunca lo abandona, ya que no hay
acumulación de tensión que produzca un Cambio. Si la
organización comienza en el estado F, permanecerá allí. Si
comienza en el estado R, sabemos por la teoría de las
cadenas de Markov --y.de hecho es obvio— que tarde o temprano
terminará en el estado F con una probabilidad del 100% de permanecer
allí. El argumento dice que esto demuestra que hay una presunción de
equilibrio en los sistemas so-ciales. Los estados de no equilibrio no son
duraderos, y por lo tanto son reemplazados por otros, que pueden o no
estar en equilibrio. Mientras ha-y alguna probabilidad no nula de que el
estado de no equilibrio será reem-plazado por uno de equilibrio, el
segundo se alcanzará tarde o temprano.
La teoría de la cadena de Markov de la evolución social difiere de la
teoría de la selección natural de la evolución biológica en que no hay com-
petencia entre las soluciones coexistentes para los mismos problemas
funcionales. En realidad hay una secuencia de soluciones sucesivas que se
detiene una vez que ha surgido un arreglo satisfactorio. En el lenguaje
utilizado más arriba: una vez que la máquina ha dicho Sí a una entrada,
deja de buscar más entradas (hasta que un cambio en el ambiente nueva-
mente lo requiera). O nuevamente, la teoría supone que la evolución social
se basa en satisfacer en lugar de maximizar. Seguiré hablando de satisfa-
cer en los capítulos 3 y 6 más adelante.
¿Cuál es el poder explicativo de este ambicioso e interesante intento
de proporcionar un fundamento general para la explicación funcional en
las ciencias sociales? En mi opinión es débil pues está sujeto a las dos ob-
jeciones que enunciaré ahora.
En primer lugar, el modelo fracasa como base para la explicación
funcional ya que no explica los fenómenos sociales en términos de sus
consecuencias beneficiosas o estabilizadoras. En realidad, la carga
explicativa se traslada a la ausencia de consecuencias desestabilizadoras.
Una inferencia es que el modelo viola nuestros conceptos intuitivos sobre la
explicación funcional, que seguramente debe estar relacionada de alguna
manera con funciones, no simplemente con la falta de disfunciones. Por
ejemplo, en el enfoque de la cadena de Markov podríamos decir que la
posición

59
de una persona que duerme puede explicarse como un estado absorbente:
damos vueltas dormidos hasta que encontramos una posición en la que no
hay presiones hacia otro cambio.[38] Esta puede ser una explicación váli-
da de la posición, pero no es una explicación funcional. Esta no es una ob-
jeción seria en sí misma. Sin embargo, en el caso más general un estado de
neutralidad funcional o de indiferencia con frecuencia inducirá una des-
viación,[39] que con el tiempo se acumulará para producir grandes cam-
bios. La tradición es un ejemplo. A diferencia del tradicionalismo, la tradi-
ción tiene una memoria corta e inexacta: consiste en hacer aproximada-
mente lo que hicieron nuestros padres, no hacer exactamente lo que las
personas de nuestra sociedad han estado haciendo desde tiempos inme-
moriales.[40] Por lo tanto, la conducta tradicional frecuentemente se en-
cuentra en un estado de cambio incesante y hasta imperceptible. Explicar
la conducta tradicional, como la danza de la lluvia de los trobriandos,[41]
mediante la ausencia de consecuencias desestabilizadoras es, entonces,
ser víctima de miopía o aceptar sin pensar la descripción local de la prác-
tica como antigua e inmutable. Para que la tradición sea inmutable, debe
haber fuerzas que actúan sobre ella para mantener constante la conduc
ta.[42]
Sin embargo, en muchos casos la ausencia de un efecto positivo será
como la presencia de uno negativo. Por ejemplo, no es siempre cierto que
aquellos que pagan a los burócratas continuarán apoyándolos aunque no
les envíen por lo menos algo de la mercadería. Algunas veces las burocra-
cias sobreviven simplemente por no causar perjuicios, pero esto no sirve
como un enunciado general. Concentrándome en los equilibrios estables
puedo ahora enunciar mi segunda objeción al modelo de Stinchcombe.
El modelo de la cadena de Markov se aplica a instituciones específi-
cas, no a sociedades enteras. Para cualquier institución, lo que cuenta co-
mo equilibrio dependerá del estado actual de todas las demás institucio-
nes, igual que en el caso biológico. Esto significa que, como en el caso de la
evolución biológica, estamos en presencia de un blanco móvil. Sin embar-
go, en el caso social no hay razones para creer que la velocidad del proce-
so de adaptación exceda, en caso de hacerlo, la del cambio de los criterios
de adaptación. Por el contrario, el mismo ejemplo considerado más arriba
demuestra muy bien que los cambios sociales no tienen el carácter lento e
incremental de la evolución biológica. Una vez que el sistema burocrático
de una sociedad cambia tanto como de R a F, o de F a R, todos los demás
subsistemas pueden ser lanzados —o alejarse— del equilibrio y puede no
haber tiempo para moverse a (o sustancialmente hacia) uno nuevo.
Sin duda es un asunto empírico que admite niveles. En las sociedades
campesinas tradicionales puede ser que todos los subsistemas estén en un
estado de adaptación mutua entre sí, aunque nuevamente podría .ser una
ilusión debida a la visión limitada del observador (o de la ideología local).
Edmund Leach, en su estudio de los kachin, argumenta en favor de un ci-
clo muy largo de cambio social en esta sociedad tradicional, apelando a
una analogía con los ciclos de población en ecología.[43] Si esto es así, me
resulta claro que en las modernas sociedades industriales hay demasia-
dos cambios como para que los equilibrios tengan tiempo para producirse

60
del modo que propone Stinchcombe.[44] La asociación entre antropología
social y explicación funcional entonces puede no ser accidental. fe La
defensa de Cohen de la explicación funcional se basa en consideraciones
epistemológicas y no en una teoría sociológica justificativa.[45] Afirma
que mientras el conocimiento de un mecanismo es condición suficiente
para una explicación funcional exitosa, y la existencia de un mecanismo
es una condición necesaria, el conocimiento no es una condición necesaria.
Una explicación funcional debe estar respaldada por algo más allá de la
mera observación de que el explanandum tiene consecuencias
benefíciosas, pero no necesitamos apelar a un mecanismo específico para
el respaldo. Las leyes de consecuencia proporcionan un respaldo alternati-
vo, por ejemplo, enunciados generales legaliformes a los efectos de que ca-
da vez que una institución o una conducta tuviera efectos beneficiosos, se
observaría realmente.
Esta idea puede explicitarse a través de un ejemplo. En su análisis
de la variedad y número de organizaciones en los Estados Unidos,
Tocqueville ofrece una explicación que, parafraseando una cita, dice lo
siguiente. En las democracias los ciudadanos no difieren mucho entre sí
y son constantemente arrojados todos juntos a una vasta masa. Por lo
tanto, surgen una cantidad de clasificaciones artificiales y arbitrarias
mediante las cuales cada uno trata de mantenerse aparte, temiendo que
de otro modo sería absorbido por la multitud.[46] Similarmente, sin
referirse a Tocqueville, Paul Veyne ofrece el mismo análisis de los
colegios romanos, cuya "función latente" era permitir festividades en un
grupo lo suficientemente pequeño como para la intimidad requerida,
mientras que la función manifiesta era alguna meta arbitrariamente
elegida y poco importante. [47] Ahora es difícil ver cómo estos efectos
involuntarios, no reconocidos y beneficiosos de las agrupaciones también
pueden explicarlas, y en todo caso ninguno de los dos autores
proporciona un mecanismo que dé una explicación. Sin embargo, Cohen
diría que el análisis puede ser válido a pesar de todo. Consideremos la
siguiente proposición que resume el análisis de Veyne:
1) Los colegios romanos pueden explicarse a través de sus efectos
beneficiosos sobre los participantes.
No será discutido por nadie. Creo que no podemos defender esta pro-
posición simplemente señalando la existencia de los beneficios. Un respal-
do posible podría ser el siguiente:
2) Los colegios romanos pueden explicarse por sus efectos benefi
ciosos sobre los participantes, a través del mecanismo de reali
mentación X.
Si bien acepta que esta justificación es tan buena como cualquiera, y
de hecho mejor que cualquiera, Cohen afirma que también podemos ape-
lar a una defensa de la siguiente manera:
3) En virtud de la ley de consecuencia Y, los colegios romanos pue
den explicarse por sus efectos beneficiosos sobre los participantes.
61
Esta ley, a su vez, podría tener la siguiente forma:
Y) En todos los casos en que la aparición de colegios (o asociaciones
similares) tendría efectos beneficiosos sobre los participantes,
dichas asociaciones realmente surgen.
La estructura de esta ley, así como de todas las leyes de consecuencia,
es "Si (si A, entonces B), entonces A".[48] Una vez establecida una ley de
tal naturaleza, podemos, si en un caso dado observamos que ocurre A y
que conduce hacia B, apelar a la ley y decir que A es explicado por su con-
secuencia B. La explicación de ninguna manera está invalidada por nues-
tra falta de conocimiento del mecanismo subyacente, aunque por supues-
to suponemos que existe tal mecanismo en virtud del cual es válida la ex-
plicación, en caso de serlo. Así podemos proceder como en el caso normal:
1) proponer una hipótesis; 2) tratar de verificarla en tantos casos específi-
cos como sea posible; 3) tratar activamente de demostrar su falsedad me-
diante contraejemplos; 4) luego de una confirmación exitosa y de una des-
confirmación fallida acordarle el carácter (provisional) de ley; y 5) utilizar
la ley para explicar otros casos. Las explicaciones propuestas por Tocque-
ville y Veyne son, por lo tanto, más convincentes tomadas en conjunto que
individualmente, ya que cada caso puede entrar en la ley explicando al
otro.
Cohen argumenta en favor de esta tesis citando el estado de la biolo-
gía antes de Darwin. En esa época los biólogos tenían el conocimiento su-
ficiente como para estar justificados al formular una ley de consecuencia
a los efectos de que, hablando groseramente, las necesidades del organis-
mo tienden a ser satisfechas, aunque no habían propuesto una explica-
ción correcta del mecanismo subyacente. Por ejemplo, Lamarck estuvo
bastante justificado y acertado al explicar la estructura de los organismos
a través de sus consecuencias útiles, aunque estaba errado en su esbozo
de un mecanismo, Similarmente, Cohen afirma que actualmente el mar-
xismo está en una situación predarwiniana. Tenemos el conocimiento
requerido para explicar, digamos, las relaciones productivas en una socie-
dad en términos de sus consecuencias para las fuerzas productivas, aun-
que todavía no podamos proporcionar un análisis detallado de la reali-
mentación en funcionamiento (véanse el capítulo 7 y el apéndice 2 más
adelante).
Mi primera objeción a esta explicación es que hace imposible distin-
guir entre las correlaciones explicatorias y las no explicatorias. Cada vez
que hemos establecido una ley de consecuencia "Si (si A, entonces B), en-
tonces A", esto puede expresar alguna relación subyacente que de hecho
proporciona una explicación de A en términos de su consecuencia B, o en
términos de su propensión a producir dicha consecuencia.[49] Sin embar-
go, siempre existe la posibilidad de que haya un tercer factor C, que expli-
ca tanto la presencia de A como su tendencia a generar B. De hecho, creo
que esto es cierto para la explicación de Lamarck de la adaptación biológi-
ca. No estableció una correlación explicatoria, pues creía equivocadamen-
te que la adaptación ecológica y no la reproductiva era el hecho funda-
mental acerca de los organismos. Darwin demostró que la adaptación re-

62
productiva es el "tercer factor", que explica tanto las características del
organismo como su tendencia a ser ecológicamente adaptables.
Un ejemplo de las ciencias sociales es más ilustrativo. En su análisis
"relaciones de autoridad en la antigüedad clásica, Paul Veyne apela
tría de Festinger de la disonancia cognitiva para explicar por qué los
súbditos aceptaban tan fácilmente su sumisión.[50] El no aceptar la
prioridad natural de sus gobernantes habría creado un estado muy
desagradable —"disonancia cognitiva"— en los súbditos, que por lo
tanto, se resignaban a un estado de sumisión del que no podían
escapar en ningún caso. Sin ninguna duda, la resignación era útil a los
gobernantes, distaba de ser indispensable. Si era necesario podrían
haber defendido —y cuando fue necesario lo hicieron— su mandato
por la fuerza. Sin embargo, el hecho es que era útil; más aun, se llevaba
a cabo incisamente en aquellas circunstancias donde sería útil, es decir,
aquellas caracterizadas por una marcada desigualdad social. Un grado
moderado de desigualdad no llevaría a la resignación, pero tampoco
conduciría a la rebelión. Entonces podemos formular una ley de
consecuencia a los efectos que "Cuando la resignación sería útil a los
gobernantes, se produce la resignación", y sin embargo no podemos
explicar la resignación a través de estas consecuencias, ya que hay un
"tercer factor" —la marcada desigualdad social— que explica tanto la
tendencia a la resignación como los beneficios para los gobernantes.
Debemos concluir que lo que explica la resignación de los súbditos al
statu quo es que tenía beneficios para ellos, siendo meramente casuales
los beneficios para los gobernantes. La explicación de Cohen de la
explicación funcional en términos de leyes de consecuencia recae en el
problema de los epifenómenos. Para terminar con el argumento debemos
apelar al de Herbert Simón, citado en el último párrafo del capítulo 1
más arriba, de que es imposible en principio distinguir entre
correlaciones reales y falsas sin algunos supuestos a priori sobre el
mecanismo causal en funcionamiento.
Análogamente, el problema de la explicación precedente destruye el
argumento de Cohen. Podría haber una ley de consecuencia no falsa de la
forma dada más arriba y, sin embargo, la presencia de A en algún caso
específico podría deberse a un mecanismo muy diferente, que precedió al
mecanismo subyacente a la ley de consecuencia. Se podría modificar el
ejemplo utilizado en el párrafo anterior para ilustrar esta posibilidad,
Imaginemos que !en general los gobernantes deben adoctrinar a los súbdi-
tos para que éstos crean en la legitimidad del gobierno, y que de hecho lo
lacen cuando lo necesitan. Sin embargo, en algunos casos pueden no ne-
cesitarlo, por ejemplo, si los subditos espontáneamente inventan esta
ideología en bien de su tranquilidad espiritual. La ley de consecuencia
ciada en el párrafo anterior entonces necesitaría la resignación, pero no
explicaría en los casos en que los subditos preceden el adoctrinamiento
creando su propia ideología. Aunque Cohén conoce bien las dificultades
que provocan los epifenómenos y la precedencia para el modelo de Hempel
de la explicación,[51] curiosamente desconoce hasta qué punto destruyen
su propia teoría de la explicación funcional.

63
Independientemente de estas cuestiones de principio, hay fuertes razones pragmáticas para ser
escéptico en el uso de las leyes de consecuencia para respaldar la explicación funcional. Estas se
relacionan con algunas diferencias básicas entre la explicación funcional en biología y en
sociología. Primero, la biología se basa en la idea de las consecuencias óptimas, mientras que la
sociología se basa en el concepto mucho más vago de las consecuencias beneficiosas. En segundo
lugar, la biología apela a la misma consecuencia en todos los casos, como la adaptación reproductiva,
mientras que en las ciencias sociales los beneficios explicatorios difieren de caso a caso.[52] Dada
esta amplitud en el concepto de consecuencias beneficiosas, parece probable que para cualquier
fenómeno social e histórico importante se pueda encontrar una consecuencia a la que está
vinculado en una ley de consecuencia espuria. Hay tan pocos ejemplos históricos de fenómenos tales
como la transición de un modo de producción a otro, para tomar el principal ejemplo de Cohen, que
no se requiere mucho ingenio para hallar una falsa ley de consecuencia confirmada por todos ellos.
Entonces, esta objeción dice que en las ciencias sociales puede resultar difícil distinguir entre
generalizaciones legales y accidentales del tipo representado por las leyes de consecuencia. Las
objeciones enunciadas en los párrafos precedentes dicen que incluso una generalización con carác-
ter de ley puede no explicar, debido a la posibilidad de que estemos en presencia de epifenómenos o
de precedencias.
Explicación intencional
La explicación intencional es la característica que diferencia a las
ciencias sociales de las ciencias naturales. No tiene sentido discutir si
también es el método más importante de explicación dentro de las cien-
cias sociales. Por supuesto, el análisis causal también es muy importante
tanto en el nivel individual como en el colectivo. Dedicaré la mayor parte
de este capítulo a un análisis de la intencionalidad, y luego finalizaré con
¿algunas observaciones sobre la relación entre el análisis causal y el inten-
cional en las ciencias sociales.
La red conceptual que subyace al análisis de la intencionalidad es
bastante compleja. Comenzaré con un gráfico que muestra la estructura
del argumento que sigue, de manera que el lector en cualquier momento
de la exposición podrá referirse a él y situar su lugar en la jerarquía con-
ceptual.

Cuadro 3

Juegos sin
estrategias
dominantes

A
Con Sin
solución solución

65
a. Intencionalidad
Explicar la conducta intencionalmente es equivalente a demostrar
que es conducta intencional, es decir, conducta realizada para lograr una
meta. Explicamos una acción intencionalmente (o la entendemos, como al-
gunas veces se dice en una terminología diferente de la que adoptamos
aquí)[l] cuando podemos especificar el estado futuro que se pretendía
crear. Por supuesto, no estamos explicando la acción en términos de un
estado futuro: primero porque el explanandum no puede preceder al ex-
planans, y segundo, porque el futuro estado deseado puede no producirse
por una cantidad de razones. En particular, algunas intenciones pueden
ser intrínsecamente irrealizables y, a pesar de ello, ser mencionadas en la
explicación de la conducta desarrollada para realizarlas. Esto resultará
importante cuando se analicen las intenciones irracionales.
El esquema general para explicar la conducta intencional no sola-
mente incluye metas o deseos, sino también creencias. Un agente inten-
cional elige una acción que cree será el medio para su meta. A su vez esta
creencia está relacionada con diversas creencias acerca de asuntos fácti-
cos, relaciones causales entre medios y fines, etc. La explicación intencio-
nal esencialmente comprende una relación triádica entre acción, deseo y
creencia. Como las creencias y deseos necesitan ser explicados, la explica-
ción intencional dista de un profundo análisis de conducta. Más adelante
en este capítulo tendré algo que decir acerca de la explicación (causal o in-
tencional) de las creencias y los deseos.
Utilicemos "razón" como término común para las creencias y los de-
seos, y diferenciemos "actuar con una razón" de "actuar por una razón".
Actuar con una razón significa que el actor tiene razones para hacer lo
que hace, y actuar por una razón significa además que hizo lo que hizo de-
bido a dichas razones. La explicación intencional incluye mostrar que el
actor hizo lo que hizo por una razón. La necesidad de esta distinción se de-
muestra en casos en los que el actor hace algo accidentalmente que resul-
ta ser coincidente con lo que cree es una manera de promover su deseo.
Por ejemplo, la conducta compulsiva ocasionalmente puede ser adecuada
a la situación, pero eso no la convierte en intencional. El requisito de que
el actor hace lo que hace por una razón implica que la razón es causalmen-
te eficiente para producir la acción,[2] pero no queda agotada por dicha
deducción. Debemos agregar que las razones causan la acción "en la for-
ma correcta", es decir, no por casualidad.[3] Por lo tanto, debemos excluir
no sólo las "coincidencias del primer tipo", en las que algo diferente de las
razones provoca la acción, de la que son razones, sino también las "coinci-
dencias del segundo tipo", en las que las razones realmente causan la ac-
ción de la que son razones, pero lo hacen de un modo no convencional.
La conducta intencional está esencialmente relacionada con el futuro.
Es acción guiada por una meta ausente, no realizada aún, simplemente
imaginada y representada. Como observa François Jacob, los hombres
pueden elegir entre posibles no realizados, mientras que la selección na-
tural puede elegir solamente entre las alternativas reales. [4] Es conocido
que la capacidad de gratificación postergada o la espera caracterizan al

66
hombre y lo diferencian de los animales.[5] Además de esperar, que inclu-
ye la capacidad de rechazar opciones favorables para acceder a opciones
más favorables más adelante, el hombre también tiene la capacidad de
utilizar estrategias indirectas, es decir, de aceptar opciones desfavora-
bles para acceder a las muy favorables más tarde. Ambos modos de
conducta fundamentalmente comprenden la relación con el futuro, así
como también lo hace la capacidad más compleja del precompromiso y
otros métodos estratégicos de superar la propia irracionalidad.[63
En el capítulo 2 varias veces apelé a la idea de que cada vez que
queremos explicar un modelo mediante sus consecuencias positivas a
largo ¡plazo, mientras que también le adjudicamos consecuencias
negativas a corto plazo, implícitamente estamos suponiendo la presencia
de un tomador de decisiones consciente. De hecho, la conciencia puede
definirse como: un medio de re-presentación, una pantalla interna sobre
la que lo físicamente ausente puede tener presencia y marcar una
diferencia para la acción en el presente. Operacionalmente, la
conciencia puede detectarse a través de la capacidad de desarrollar
estrategias indirectas o de esperar en situaciones cualitativamente
nuevas. Aunque los animales algunas veces se comportan de este
modo, generalmente lo hacen solamente en contextos muy
estereotipados. Y cuando algunos animales parecen hacerlo
espontáneamente, la conclusión correcta es que sin duda están dotados
de conciencia y de la capacidad para comportarse intencionalmente.[7]
De este argumento se sigue que el concepto de intenciones inconscien-
tes no es más coherente que el de la cuadratura del círculo. Sin embargo,
no se puede deducir que es imposible sacar sentido del concepto de incons-
ciente, si lo concebimos estrictamente como un mecanismo para trepar
por un gradiente de placer.[8] Sería absurdo adjudicar al inconsciente la
capacidad de esperar, de hacer sacrificios, de actuar de acuerdo con re-
glas, etc., pues todos estos modos de conducta presuponen conciencia.[9]
Los fenómenos como las ilusiones [10] o la flaqueza de voluntad [11] se
originan en el "principio del placer", es decir, de la tendencia a buscar la
gratificación inmediata. Deberían explicarse en términos de los "cables de
la máquina del placer",[12] no apelando a un agente milagroso u ho-
múnculo dentro de la persona. Muchas explicaciones psicoanalíticas de la
conducta se originan en la misma obsesión errónea por el significado que
subyace en gran parte de la explicación funcional.

b. Intencionalidad y racionalidad
¿Puede haber intencionalidad sin racionalidad? ¿O racionalidad sin
intencionalidad? Mi principal interés en este apartado es la primera pre-
gunta, pero permítaseme también algunas palabras sobre la segunda.
Evidentemente todo depende de cómo definimos el concepto de racionali-
dad. Si solamente queremos decir adaptación en el sentido de maximiza-
ción local, hemos visto en el capítulo 2 que puede haber racionalidad no
intencional. Pero cualquiera sea el modo en que definimos la racionali-
dad, creo que debería reservarse para los casos en que tiene poder explica-

67
tivo. Es decir que nunca habría que caracterizar una creencia, una acción
o un modelo de conducta como racional a no ser que se esté dispuesto a
afirmar que la racionalidad explica que lo que se dice es racional. O, si el
término se utiliza en un sentido no explicativo, debe aclararse. El término
"racional", como el término "funcional", se utiliza frecuentemente para ca-
racterizar la acción de un modo que hace poco claro si realmente hay una
intención de explicación.
La manera habitual de definir conducta racional es apelando a algún
concepto de optimización. Es decir que se dice que el agente racional elige
una acción que no sólo es un medio para el fin, sino el mejor de todos los
medios que cree disponibles. En el siguiente apartado afirmaré que los
conceptos de racionalidad y optimalidad no son sinónimos. La caracteri-
zación más completa de racionalidad tendrá que posponerse hasta ese
momento. Para los propósitos presentes es suficiente observar que la ra-
cionalidad mínimamente implica consistencia de metas y creencias. Para
calzar una cuña entre intencionalidad y racionalidad, debemos demostrar
que puede haber deseos inconsistentes y creencias inconsistentes.
Con respecto a las creencias inconsistentes, demostraré su posibili-
dad mediante una historia sobre Niels Bohr, que cierta vez tenía una he-
rradura sobre la puerta. Cuando se le preguntó si la había colocado allí
porque creía que le traería suerte, contestó: "No, pero me dijeron que
traen suerte incluso a quienes no creen en ellas".[13] Arreglando un poco
la historia, resulta lo siguiente:
1) Niels Bohr cree "La herradura no me traerá suerte".
2) Niels Bohr cree "Las herraduras le traen suerte a quienes no
creen que les traerán suerte".

Aunque las creencias entre comillas son consistentes entre sí, ambas
no pueden ser ciertas y ser creídas (por Bohr). Pero un sistema de creen-
cias es consistente solamente si existe un mundo posible en el que son to-
das ciertas y creídas.[14] Si en favor del argumento suponemos que Bohr
no estaba haciendo una broma y que en realidad colocó una herradura so-
bre la puerta porque quería suerte y creía, aunque inconsistentemente,
que le traería suerte, tenemos el caso de una acción claramente irracio-
nal, y sin embargo explicada intencionalmente.
Sin embargo, son más centrales los deseos irracionales que fueron es-
tudiados intensivamente desde Hegel por filósofos y psicólogos. Los crite-
rios de consistencia para los deseos pueden definirse análogamente a los
criterios para la creencia: debería haber algún mundo posible en el que el
deseo 1) se cumple y 2) se cumple a través del intento de hacerlo. La nece-
sidad de la primera condición es obvia: sirve para caracterizar deseos tan
irracionales como el deseo bien intencionado de que todos ganen más di-
nero que el ingreso promedio. La necesidad de la segunda condición se
demuestra observando la importancia de los fenómenos que son esencial-
mente subproductos, es decir, el conjunto de estados que solamente pue-
den aparecer, no ser producidos por la acción deliberada. [15] Un caso pa-
radigmático es el sueño, que —después de cierto punto— elude a quien

68
trata de provocarlo, mientras que llega compasivamente cuando final-
mente ha decidido que lo eludirá. Similarmente para otras "ausencias de-
seadas", como el olvido, la indiferencia o el no deseo (en el budismo). Tam-
bién hay estados definidos positivamente, como la creencia o el coraje, que
;son imposibles de lograr por voluntad, y el intento de hacerlo entonces es
una intención irracional. Además, hay casos en los que es conceptualmente
imposible provocar por la mera orden determinados estados en otra
Apersona, por ejemplo, tratar de ordenar la gratitud de otra persona. O si
tomamos una paradoja obvia, consideremos la orden "Sea espontáneo".
Esto incluye tratar de no tratar, es decir, intenciones de un orden mayor,
así como la paradoja de Bohr comprendía creencias de un orden mayor.
Tratar de no tratar, o desear la ausencia de voluntad, serían metas con-
sistentes si solamente se apelara al criterio 1. Sin embargo, como son cla-
ramente autoderrotistas, es necesaria la condición 2.
Otro ejemplo de deseos inconsistentes puede servir como transición
para el análisis de optimalidad. Supongamos que una persona se aboca a
encontrar la solución de un problema de maximización que en realidad no
tiene solución, como por ejemplo "Encontrar el número real más pequeño
estrictamente mayor que 1". La conducta de esta persona entonces-puede
explicarse mediante la meta que se ha fijado. La observamos escribiendo
números cada vez más pequeños, todos estrictamente mayores que 1, y
explicamos lo que hace a la luz de este plan inconsistente. Esto no sólo cal-
za una cuña entre intencionalidad y racionalidad, sino también entre
racionalidad y optimalidad. Evidentemente, en este caso la conducta
racional no es la que optimiza. Lo que sería la (o una) .conducta racional
depende de los motivos prácticos detrás de la operación. Si la persona va a
recibir una cantidad de dinero igual a una libra dividida por la diferencia
entre el número elegido y 1, puede pensar en una suma "satisfactoria" y
elegir el número de acuerdo con ella.

c. Racionalidad y optimalidad
En este apartado primero continuaré con las últimas observaciones y
luego me olvidaré de ellas. De hecho, aunque hay fuertes razones de prin-
cipio para insistir en las diferencias entre intencionalidad y racionalidad
y entre racionalidad y optimalidad, la explicación en términos de optimi-
zación sigue siendo el caso paradigmático de la explicación en las ciencias
sociales fuera de la psicología. En economía, la teoría de la satisfacción es
reconocida por muchos como una importante alternativa teórica para op-
timizar, pero sigue insuficientemente desarrollada como para servir de
base para el trabajo empírico.
Hay dos razones por las que la interpretación de racionalidad como
optimalidad no vale para la generalidad. También hay razones para creer
que algunas veces la racionalidad debe entenderse como satisfaciente, es
decir, como que encuentra una alternativa "lo suficientemente buena" pa-
ra nuestro propósito y no la "mejor".[16] Primero, existe el argumento es-
pecial para satisfacer que deriva de los problemas de optimización sin so-

69
luciones bien definidas, como en el caso mencionado más arriba. Para un
ejemplo menos trivial, consideremos un plan sobre tiempo infinito. La
persona que lo realiza tratando de maximizar el consumo en tiempo infi-
nito puede descubrir—utilizando el "criterio de adquisición"—[17] que no
hay un porcentaje óptimo de ahorro, ya que por cada porcentaje menor
que el 100% hay uno mayor que es mejor, aunque el porcentaje 100% es
inferior a todos los demás, pues implica que se pospone siempre el consu-
mo. [18] En tales casos la conducta racional debe ser encontrar un plan
que sea "suficientemente bueno", formalizado en la teoría de los planes
agradables.[19] Si realmente observamos una persona que realiza un
plan eligiendo un porcentaje de ahorro bastante alto en tales casos, pode-
mos explicar su elección intencionalmente, en términos de la meta de ma-
ximizar el consumo en el tiempo. Sin embargo, obsérvese que la explica-
ción no tiene "una sola salida",[20] es decir, que del supuesto acerca de la
meta no podemos derivar una única consecuencia observacional que se
compare con el comportamiento real/La explicación intencional debe
completarse con algún relato causal de por qué la persona fijó exactamente
aquel porcentaje de ahorro. La razón por la que la satisfacción no emergió
como una alternativa para optimizar es sin duda que tales explicaciones
suplementarias no han sido próximas, mientras que el supuesto de
satisfacer en sí mismo puede ser compatible con una gran cantidad de he-
chos observados.
En segundo lugar, se puede apelar al argumento general para satisfa-
cer que deriva de las paradojas de información que se analizan más ade-
lante en el capítulo 6. Aquí solamente observaré que el argumento requie-
re que no definamos la racionalidad en términos de creencias dadas, sino
que preguntemos si las creencias son racionales. Esto significa que a la
pregunta "¿Puede esta acción ser explicada como una conducta optimi-
zante?", podemos dar respuestas diferentes, dependiendo de si las creen-
cias son consideradas como constantes o como variables de conducta. Si
adoptamos un concepto "delgado" de racionalidad, definido con respecto a
creencias dadas, solamente se aplica el argumento especial para satisfa-
cer. El argumento general tiene fuerza si adoptamos un concepto más am-
plio de racionalidad, que también requiere racionalidad en la recolección
de información y la formación de creencias.
Ahora proseguiré con la estructura fina de optimizar la conducta. El
primer caso y el más simple es lo que denominaré racionalidad paramétri-
ca, es decir, conducta racional dentro de un medio que el agente (quizás
erróneamente) supone está formado: a) por objetos naturales gobernados
por leyes causales, y b) por otros agentes que o bien son tales que su con-
ducta no le resulta diferente, o si sí le resulta diferente, se suponen menos
sofisticados de lo que él es. La última condición implica que el agente
piensa en sí mismo como una variable y de los demás como constantes; o
si piensa que los demás se adaptan a su medio, se cree el único que se
adapta a la adaptación de los demás, y así sucesivamente. Esto compren-
de la parte "paramétrica" del concepto de racionalidad paramétrica. La
parte de la racionalidad implica que el agente trata de hacer lo mejor po-
sible para sí, dadas sus creencias acerca del mundo. En muchos casos es

70
ta meta puede representarse mediante alguna función objetiva, que puede
ser real o imaginaria. Una función objetiva real es la que el agente se
pone a maximizar conscientemente, así como cuando se trata de explicar
la conducta de una empresa suponiendo que (el gerente) trata de
maximizar las ganancias. Una función objetiva imaginaria es una función
de conveniencia que puede construirse como una expresión taquigráfica
conveniente para una subclase importante de ordenamientos de
preferencias ||1píisistentes.[21] El caso común de racionalidad
paramétrica es la maximización de una función objetiva dentro de los
límites dados, pero debe quedar claro que a partir de las observaciones
anteriores la definición incompleta es un poco más complicada.
Incluso si el actor supone que el medio es paramétrico, puede tener
in-formación incompleta sobre él. En este caso debemos hacer una
distinción básica, pero discutida, entre riesgo e incertidumbre (véase el
apéndice 1 para un análisis más completo). Hay riesgo cuando el agente
tiene grados cuantificables de creencia, o "probabilidades subjetivas",
sobre los diversos estados posibles del mundo. En este caso racionalidad
implica que el agente debería maximizar la utilidad esperada asociada
con los diversos cursos de acción, es decir, un promedio de las
conveniencias que se realizarán para diferentes estados del mundo. Por
otro lado, la incertidumbre surge cuando el agente no puede especificar
probabilidades numéricas, ni siquiera dentro de un rango de límites
inferiores y superiores. O, aun más fundamentalmente, ni siquiera puede
especificar un conjunto completo de los posibles estados del mundo, sin
mencionar su probabilidad. En el primero de estos casos, hay un
importante teorema que establece que el agente puede considerar
solamente los mejores y los peores resultados posibles asociados con cada
curso de acción, pero que no puede decidir racionalmente cuánto peso
darle a uno o al otro. Por ejemplo, esto dependerá de rasgos de carácter
como el "optimismo" o el "pesimismo", de modo que la decisión final
solamente puede explicarse causalmente. Por supuesto, en el segundo
caso hay incluso menos campo de acción para la toma de decisiones
racionales. En la primera variedad de incertidumbre, por lo menos
podemos excluir algunos cursos de acción como indudablemente
inferiores, es decir, aquellos cuya mejor consecuencia es peor que la peor
consecuencia de alguna otra alternativa. Sin embargo, en la segunda va-
riedad ni siquiera puede llevarse a cabo esta clase de comparación, ya que
no conocemos el rango completo de estados posibles del mundo y por lo
tanto de los posibles resultados de los diversos cursos de acción.
La racionalidad estratégica se define mediante un axioma de sime-
tría: el agente actúa en un medio de otros actores, ninguno de los cuales
puede suponerse menos racional o sofisticado que él mismo. Entonces, ca-
da actor necesita anticipar las decisiones de los demás antes de tomar la
propia, y sabe que hacen lo mismo con respecto a los demás y a él. El enfo-
que estratégico de la conducta humana se formaliza mediante la teoría de
los juegos, que podría haberse denominado más correctamente la teoría
de las decisiones interdependientes.
Para situar el lugar correcto y la contribución de la teoría de los jue-
gos en el análisis de la interacción social, podemos observar que la vida

71
social está constituida por cuatro conjuntos entrelazados de interdepen-
dencias. Primero, la recompensa de cada uno depende de la elección de to-
dos, a través de la causalidad social general. Segundo, la recompensa de
cada uno depende de la recompensa de todos, mediante la envidia o el al-
truismo. Tercero, la decisión de cada uno depende de la decisión de todos:
ésta es la contribución específica de la teoría de los juegos. Por último, la
estructura de preferencias de cada uno depende de las acciones de todos, a
través de la socialización y mecanismos similares. Por supuesto, todos es-
tos enunciados se refieren al caso más general; en casos particulares pue-
den no ser válidos.
La estructura completa de la teoría de los juegos es bastante compli-
cada y aquí no se trata ni siquiera de esbozar las generalidades.[22] Sin
embargo, diré algunas palabras sobre la distinción básica entre juegos
cooperativos y no cooperativos, y luego señalaré algunos casos importan-
tes dentro de la última categoría. La teoría del juego cooperativo supone
que grupos de agentes pueden actuar juntos contra otros grupos y no in-
vestiga la posibilidad ni las condiciones para que se produzca dicha coope-
ración. En mi opinión esto significa que la teoría no puede tener gran po-
der de explicación, aunque puede resultar muy útil para el propósito ~del
análisis normativo.[23] La teoría del juego no cooperativo es más satisfac-
toria en este respecto pues solamente postula decisiones racionales indi-
viduales. La teoría del juego cooperativo requiere fundamentos en la teo-
ría no cooperativa, demostrando que la decisión de cooperar puede ser un
movimiento dentro de un juego no cooperativo. O, inversamente, se puede
tratar de demostrar que hay mecanismos (no estratégicos) que tienden a
lograr la "solución" de un juego cooperativo, mediante alguna clase de
"mano invisible".[24] Suponer que la conducta cooperativa se producirá
simplemente porque es colectivamente óptima, es caer víctima del pensa-
miento funcionalista.[25]
Dentro de la clase de juegos no cooperativos, una variedad es teórica-
mente trivial, aunque importante por sus aplicaciones. Son los juegos en
los que cada participante o jugador tiene un curso de acción o estrategia
que es su mejor opción sin considerar cómo eligen los demás. El dilema de
los prisioneros presentado en el capítulo 2, tiene al egoísmo como estra-
tegia dominante en este sentido. Allí vimos que era racional para cada in-
dividuo actuar de un modo que, cuando es adoptado por todos, es desas-
troso para todos. Aunque en este juego la recompensa de cada uno está
afectada por la decisión de todos, la decisión de cada uno puede tomarse
independientemente de las decisiones de todos. Por otro lado, considere-
mos una situación generalmente denominada el "juego de los seguros".[26]
En el lenguaje del capítulo 2 este juego se define postulando que todos los
jugadores clasifican las alternativas de la siguiente manera:
Preferencias del juego de los seguros: 1. (A, A). 2. (E, A). 3. (E, E). 4.
(A, E).
Aquí el egoísmo ya no es dominante, pues si todos los demás se com-
portan en forma altruista, esto es lo que el individuo también prefiere

72
hacer el óptimo (A, A) es individualmente estable. Sin embargo, no es in-
dividualmente accesible, pues si los demás se comportan egoístamente,
entonces el individuo también lo hará. No hay deseo de andar solo, aun-
que ¿todavía existe el temor de ser un "aprovechador". Aunque el juego no
tiene estrategias dominantes, tiene una solución que es (A, A). No describiré
la definición precisa del concepto de solución en la teoría del juego no coo-
perativo, pero informalmente hablando consiste en un conjunto de estra-
tegias hacia las cuales jugadores racionales y perfectamente informados
convergerán tácitamente. Si la solución está formada por estrategias do-
minantes, solamente será bloqueada por falta de racionalidad individual, i
En juegos sin estrategias dominantes, la solución puede estar bloqueada
por falta de información. Así, en el juego de los seguros el óptimo no apa-
recerá si cada jugador desconoce las preferencias de los demás, creyendo
quizá que son como en el dilema de los prisioneros, o si cada uno cree que
los demás tienen preferencias del juego de los seguros, pero también cree
que los demás no saben esto de cada uno de los otros, y así sucesivamente.
¡para que se llegue a una solución, no es suficiente compartir las preferen-
cias del juego de los seguros; "debe compartirse el hecho mismo de com-
partir".[27]
Esto significa que debido a la falta de información se puede obtener un
resultado que es peor para todos que cualquier otro resultado factible. Tal
resultado se denomina "Pareto-subóptimo". Evidentemente es un rasgo
perverso e inquietante de la interacción social. También está presente en el
dilema de los prisioneros, aunque por una razón diferente y más pro-funda.
La suboptimalidad en el juego de los seguros surge de una falla de
información; en el dilema de los prisioneros de una falla en la coordina-
ción. Podemos preguntarnos si la falla en la información del juego de los
seguros no será la regla, ya que la solución depende de requisitos de infor-
mación estrictos que seguramente no serán satisfechos en casos rea-
les.[28] En el caso extremo que hemos presentado, esto puede ser verdad,
pero hemos estado utilizando el caso extremo sólo para aclarar la exposi-
ción y es muy posible modificarlo para hacerlo más realista. En particular,
se puede construir un marco más poderoso que permita que la elección
sea accidental en diversas proporciones de otros participantes que eligen
un modo u otro, en lugar de hacer que dependa de iodos los de-más.[29]
Cuando se trata de explicar suboptimalidades observadas en la vida
social, puede resultar difícil asegurar si se deben a fallas en la informa-
ción o a fallas en la coordinación.[30] Por ejemplo, podemos tener razones
para creer que la mayoría de las personas preferirán un estado en el que
nadie se comprometa con la contaminación ambiental, la evasión de im-
puestos y otros, a uno en el que todos lo hagan, y sin embargo observamos
que la contaminación ambiental y la evasión de impuestos son desenfre-
nados. La difícil tarea de explicar es determinar si las preferencias son co-
mo en el dilema de los prisioneros o como en el juego de los seguros. El
problema también tiene consecuencias prácticas importantes ya que las
técnicas para superar la suboptimalidad difieren radicalmente en ambos
casos. En particular, podemos afirmar que una importante tarea de lide-

73
razgo es proporcionar la información que permita a las personas conver-
ger en una conducta por la que todos tienen una preferencia condicional.
Con preferencias incondicionalmente altruistas no hay necesidad de lide-
razgo y con preferencias incondicionalmente egoístas se necesita coerción
en lugar de liderazgo para lograr el óptimo colectivo.[31]
Aun más perversos que las suboptimalidades debidas a fallas en la in-
formación o en la coordinación son los juegos sin solución, es decir, situa-
ciones tales donde no hay conducta estratégicamente racional. Estos jue-
gos se dividen en dos clases. Primero, hay juegos en los que no hay un con-
junto de estrategias que sean individualmente estables, es decir, no hay
conjunto de estrategias de manera que nadie pueda beneficiarse saliendo
del juego. El término técnico para un conjunto de estrategias con esta pro-
piedad es un punto de equilibrio. Un simple juego sin punto de equilibrio
es el siguiente. Cada actor debe pensar en un número y escribirlo sin que
los demás lo vean. Cuando se comparan los números, el jugador que ha es-
crito el número mayor obtiene de los demás una cantidad igual a la dife-
rencia entre su número y el que escribió el otro. Evidentemente, cualquier
jugador siempre ganará escribiendo un número mayor. La hiperinflación
puede ser un ejemplo más real de una estructura de interacción con pro-
piedades similares.
Segundo, hay juegos con más de un punto de equilibrio, ninguno de
los cuales surgirá como el punto focal de una convergencia tácita. El juego
de los seguros tiene dos puntos de equilibrio, (A, A) y (E, E), de los cuales
el primero surge como la solución porque todos lo prefieren al segundo.
Pero también hay juegos con equilibrios múltiples ¿e los cuales ninguno
puede considerarse la solución. El regateo y el monopolio bilateral son ca-
sos típicos. Consideremos también la siguiente variación sobre los temas
presentados más arriba:
Preferencias de gallinas: 1. (E, A). 2. (A, A). 3. (A, E). 4. (E, E).[32]
Aquí la situación es tal que cada uno tiene un incentivo para utilizar
E si todos los demás utilizan A, y viceversa. Es fácil ver intuitivamente
que esto produce inestabilidad y provoca que todos persigan a todos en
una persecución interminable. Más formalmente, el juego tiene los si-
guientes puntos de equilibrio. Con más información sobre la estructura
de premios del juego podemos determinar una proporción p de los jugado-
res tal que si p eligen A y 1-p eligen E, tenemos un punto de equilibrio en
el que nadie puede mejorar su resultado cambiando a otra estrategia. De
hecho, esto nos da una cantidad mayor de puntos de equilibrio, pues hay
muchas permutaciones de los jugadores compatibles con estas proporcio-
nes. Además, está el punto de equilibrio en el que cada actor elige A con
probabilidad p y E con probabilidad 1-p. Es una estrategia mixta ya men-
cionada en el capítulo 1. Racionalmente, no hay manera en que los actores
puedan elegir entre estos equilibrios. Psicológicamente, puede discutirse
que la estrategia mixta sea un punto focal,[33] siendo cualitativamente
diferente de todos los demás. Pero siempre puede haber dudas acerca de
la psicología de los otros jugadores, y en todo caso hay otros juegos sin

74
solución que no tienen puntos de equilibrio psicológicamente
sobresalientes.
Cuando se juega un juego sin solución racional, cada jugador tiene
que suponer algo sobre lo que los demás van a hacer, y luego actuar para
maximizar su recompensa en base a dicho supuesto. El supuesto no pue-
de ser racional, en el sentido de ser derivable de la hipótesis de que los
lemas son tan racionales y están tan bien informados como él. Debe pro-
ducir algún conocimiento psicológico o alguna creencia, ya sea sobre los
jugadores humanos específicamente o sobre los seres humanos en gene-
ral. Sin embargo, la situación se torna intolerable cuando cada jugador, al
tratar de adivinar a los demás, sabe que ellos están tratando de hacer lo
mismo. Cada jugador es racional y sabe que los demás lo son y que saben
tanto de la situación como él, y sin embargo, debe tratarlos como
causalmente determinados, sabiendo que lo tratan a él similarmente.
Esta es la reintroducción del pensamiento paramétrico dentro de la
racionalidad estratégica. La explicación intencional no es suficiente en
tales casos. Puede excluir algunas líneas de conducta claramente
irracionales, pero solamente la teoría causal puede reducir las
posibilidades restantes a un único resultado determinado. Sin duda, la
situación no es "objetivamente indeterminada" en el sentido de la
mecánica cuántica,[34] pero puede hacerse determinada simplemente
complementando el modelo intencional con una teoría causal.
Aquí puede ser útil un ejemplo. Hay mucha bibliografía sobre la
racionalidad de la participación política: ¿se molestaría en votar una
persona egoísta y racional? Seguramente sabría que su probabilidad de
tener alguna influencia sobre el resultado es virtualmente nula y en todo
caso menor que la probabilidad de ser atropellado por un auto y morir en
camino hacia la votación. En las elecciones nacionales esto sin duda es
cierto y entonces solamente podemos explicar que las personas votan
suponiendo que no lo hacen especialmente en interés propio ni movidas
exclusivamente por las consecuencias de lo que hacen. Pero en
electorados más pequeños, una persona podría razonar de la siguiente
manera.[35] "Seguramente otras personas verán que es irracional que
ellos voten, excepto por una pequeña cantidad de Votantes éticos'. Sin
embargo, serán tan pocos que mi voto realmente podría marcar una
diferencia, por lo tanto es racional que yo vote. ¡Pero atención! Otros
podrían pensar lo mismo y acudir a votar en cantidades tan grandes que
después de todo puede no ser racional que yo vote. Entonces me
quedaré en casa. ¡Pero atención otra vez! Los demás podrían pensar del
mismo modo y así sería racional que yo rote después de todo." Y así
sucesivamente. En algún punto la regresión puede interrumpirse por la
acción, es decir, por la persona que va a votar ) que toma la decisión
consciente de no votar. Entonces podríamos afirmar que la persona ha
hecho una estimación implícita o explícita de cómo actuarán los demás y
que ha hecho lo mejor posible según dicho supuesto. Pero, ¿qué sucedería
si la persona sigue deliberando hasta que la mesa electoral ha cerrado?
Su situación es hasta cierto punto como la del asno le Buridan, aunque
para mí representa una anomalía mucho más profunda en la teoría de la
elección racional.

75
Podemos utilizar estos conceptos de la teoría de los juegos para
conocer la diferencia entre la adaptación intencional y la funcional. Pri-
mero, consideremos el juego de los seguros. Algunas veces los anímale
parecen comportarse de un modo que corresponde a esta situación, por
ejemplo, adoptando la estrategia de "empantanar el apetito de los depre-
dadores".[36] Está en la naturaleza de este caso que esta conducta sea
eficaz cuando es adoptada por muchas presas simultáneamente, pero 1
primera que lo intenta casi no tendría ventajas reproductivas. Entonces
esta conducta no es individualmente accesible, pero hay casos en los que
es individualmente estable porque "hay seguridad en números". Pero
como la accesibilidad individual es de lo que trata la selección natural, no
se puede explicar la presencia de tal conducta afirmando que constituye
un "estrategia evolutiva estable". Contrariamente, en la interacción
humana la estabilidad individual puede explicar la presencia de un
modelo de conducta si se cumplen los requisitos de información
pertinentes. Si todos saben que cierto arreglo es mejor para todos y si no
hay tentación para desertar y todos los saben, entonces aquel arreglo
surgirá espontáneamente aunque no haya incentivo individual para
contribuir unilateralmente.
En segundo lugar, consideremos los casos de la gallina en el reino
animal, como "la lógica del conflicto animar.[37] Aquí suponemos que ha
dos variantes de conducta entre los organismos en una población: k
"halcones" y las "palomas", así llamados debido a su conducta cuando s
encuentran y luchan. Suponemos que cuando una paloma se encuentra
con otra paloma, cada una tiene un 50% de probabilidades de ganar 5
"unidades evolutivas" (medida de éxito de reproducción) y de perder (
10%; que cuando una paloma se encuentra con un halcón, la primera n
ganará ni perderá y el segundo ganará 50 con certeza; y que cuando u
halcón se encuentra con un halcón tienen iguales probabilidades de
ganar 50 y de perder 100 unidades. Es fácil ver que en una población de
paloma el halcón solitario tendrá una ventaja reproductiva, y viceversa.
También se puede demostrar que el equilibrio es un polimorfismo estable
en el que hay 5/12 de palomas y 7/12 de halcones. En la interacción
humana, como se dijo antes, también podría existir la posibilidad de
que todos le individuos utilicen una estrategia mixta, actuando en cada
ocasión como halcones con probabilidad 7/12 y como palomas con
probabilidad 5/12. Si embargo, esto es improbable en el reino animal.[38]
Un "gen de cambio tendría una desventaja inicial en cualquier población
excepto en una que hubiera alcanzado el cociente 5:7, e incluso allí no
conferiría ningún ventaja: sería tan bueno como cualquiera de las
estrategias puras, pero no mejor. La moraleja es la misma que en el
ejemplo precedente: la adaptación animal es estrictamente
individualista y nunca podría favorece una conducta que es
beneficiosa solamente cuando todos la adoptan. En contraste, los seres
intencionales pueden elegir en términos dé su expectativas, incluyendo
sus expectativas acerca de las de los demás. Entonces, en las ciencias
sociales hay más campo que en biología para 1a explicación de la
conducta en términos de beneficios colectivos, suponiendo estabilidad
individual a pesar de ello. Que algo sea bueno para

76
todos puede explicar por qué todos lo hacen, suponiendo que ni siquiera es
mejor para cada uno ser el único que no lo hace.
Permítaseme concluir este estudio de la teoría de la racionalidad con
algunas observaciones acerca de las anomalías que hemos encontrado.[39]
Primero, el concepto de intenciones irracionales va contra la naturaleza de
muchos de los recientes análisis, que tienden a ver las ideas de intencio-
nalidad y racionalidad como sinónimos. En segundo lugar, los argumentos
especiales y generales para satisfacer quiebran el vínculo entre racionali-
dad y optimalidad. Tercero, las variedades de toma de decisiones bajo in-
certidumbre inducen al escepticismo acerca del poder de la teoría de la ra-
cionalidad como una guía para actuar. Y por último, la existencia de juegos
sin solución demuestra que la racionalidad individual puede desmoronar-
se cuando la estructura de interacción es suficientemente perversa. Sin
duda, estas últimas conclusiones serán cuestionadas. Algunos dirán que
siempre se pueden producir anticipaciones o probabilidades subjetivas
acerca de la conducta de los demás o el estado del mundo, y maximizar la
conveniencia esperada de acuerdo con ello. En el apéndice 1 el lector ha-
llará un intento de refutar esta objeción. Otros afirmarán que incluso bajo
la incertidumbre o en un juego sin solución se puede actuar con alguna
racionalidad, es decir, satisfaciendo. Para ser preciso, el concepto de "con-
ducta maximizadora" —eligiendo el curso de acción con la mejor peor con-
secuencia posible— puede verse como una variedad de satisfacer. Pero
obsérvese que en juegos sin un punto de equilibrio, como el juego de la hiper-
inflación, y en decisiones bajo una incertidumbre extrema, que se extiende
hasta el rango de posibles estados del mundo, el concepto de conducta
maximizadora no está bien definido. Concluyo que las anomalías son difi-
cultades verdaderas, que no deben resolverse de modo procrusteano.

d. Intencionalidad y causalidad
La teoría de los juegos estudia lo que podría llamarse interacción in-
tencional entre seres intencionales. Por supuesto, también ocurre la inte-
racción causal entre agentes intencionales. Esto se produce cuando cada
agente actúa en base a supuestos injustificados acerca de la conducta de
los demás, por ejemplo, cuando cada agente cree que es el único que se
adapta al ambiente, mientras que los demás simplemente siguen hábitos
o tradiciones. O nuevamente, para repetir una frase ya utilizada más
arriba, cuando cada agente se considera como una variable y a los demás
como parámetros, viéndose como únicamente pour-soi y a todos los demás
en-soi.[40] Este modo de interacción puede causar dramáticas consecuen-
cias no deseadas. De hecho, para emplear el término de Sartre,[41] la con-
trafinalidad es una de las principales contradicciones en la vida social
junto con la suboptimalidad y los juegos sin solución.[42] Para un ejemplo
de cómo pueden bloquearse las intenciones de esta manera, consideremos
el ciclo de la telaraña de la teoría económica.[43] Aquí cada productor de-
be decidir en el año í cuánto producir en el año í+1. Si actúa ingenuamen-
te, decidirá el volumen que maximiza sus ingresos en el año í+1 suponien-

77
do que los precios serán los mismos que en el año t. Con precios bajos en el
año í producirá un volumen pequeño en el año f+1, lo que conducirá a pre-
cios altos en el año í+1, lo que producirá un volumen grande en el año í+2
y así sucesivamente. El supuesto de precios constantes implica el supues-
to de que todos los demás productores comercializarán el mismo volumen
que en el corriente año, y que la modificación de los individuos no altera-
rá el nivel de precios. La segunda parte del supuesto se justifica en un
mercado perfectamente competitivo, la primera no.
Esto proporciona un paradigma para muchos casos de análisis en las
ciencias sociales: la explicación intencional de acciones individuales junto
con la explicación causal de la interacción entre los individuos.
Primero debemos "entender" por qué —es decir, en pos de qué meta—
los actores se comportan del modo en que lo hacen; y luego debemos "ex-
plicar" por qué, comportándose como lo hacen, provocan lo que hacen. De-
bemos tratar de descomponer la explicación en estas dos etapas ya sea
que el fenómeno a ser explicado sea un ciclo comercial, una campaña
presidencial, movilidad geográfica o cambio tecnológico. No alcanza con
postular simplemente la relación causal entre macrovariables. Podemos
observar como una regularidad empírica que en un ciclo comercial un as-
censo seguirá a un descenso, o que determinados patrones de distribución
de ingresos producirán determinados patrones de migración, pero no he-
mos explicado nada hasta que podamos demostrar 1) cómo los macroesta-
dos en el momento í influyen la conducta de individuos motivados por de-
terminadas metas y 2) cómo estas acciones individuales se suman para
dar nuevos macroestados en el momento í+1.
Sin embargo, hay también "causalidad subintencionar, es decir,
procesos causales que moldean creencias y deseos en cuyos términos se
pueden explicar intencionalmente las acciones. Primero permítaseme
señalar que cuando tratamos de explicar deseos y creencias no es obvio
que solamente se dispone de explicaciones causales. De hecho, se pueden
elegir deseos propios mediante el "planeamiento de carácter",[44] que
luego proporciona una explicación intencional de por qué los deseos son lo
que son. Pero entonces, por supuesto, el asunto surge otra vez en otro
grado, y supuestamente habrá alguna etapa en la regresión en la que
solamente cabe una explicación causal.[45] Similarmente, pero más
controvertidamente, puede ser posible elegir las propias creencias, en el
sentido de adoptar deliberadamente determinadas creencias porque es
útil mantenerlas, independientemente de si el agente cree que son
ciertas.[46] Sin embargo, es probable que la elección deliberada de rasgos
de carácter y sistemas de creencias sea un fenómeno raro. En todo caso
me limitaré a la explicación causal de los deseos y las creencias.
Los deseos están moldeados, predominantemente, por la socializa-
ción. Esto no significa que se nos socializa para desear algún producto en
particular, sin tener en cuenta el costo. La idea es que de la socialización
se aprende cómo comerciar diferentes artículos por otros. Por ejemplo, un
delincuente no es alguien que se ha desarrollado dentro de una subcultu-
ra criminal que lo priva de una elección de carrera. Es una persona que, al
hacer su elección tiende a adjudicar mayor importancia a algunas con se-

78
cuencias que a otras. Por ejemplo, puede preferir los riesgos en lugar
de temerlos; puede darle más peso a las consecuencias a corto plazo
que a las de largo plazo, y así sucesivamente. Decir esto no es decir
que correrá cualquier riesgo, o que prefiere cualquier beneficio a
corto plazo frente a cualquier ganancia a largo plazo. Tampoco es decir
que será imposible influir sobre su elección modificando la estructura
de recompensas, por mediante penalidades más severas o una mayor
probabilidad de ser encontrado. Sin embargo, puede ser que este modo de
cambiar su conducta sea relativamente costoso y que trabajar
directamente sobre su ambiente sea un método más eficiente. Para
resumir: no debemos buscar en la socialización la fuente directa de la
acción, sólo la causa de determinados esquemas de preferencias que, en un
medio dado, pueden hacer que se prefiera una acción en lugar de las
alternativas factibles. Si agregamos una nueva hilera a la estructura de
dos hileras indicada más arriba, podemos formular el siguiente lema:
primero una explicación causal de los deseos, luego una explicación
intencional de la acción en términos de los deseos y finalmente una
explicación causal de los macroestados en términos de las diversas
acciones individuales.
Sin embargo, la socialización no es el único mecanismo causal que
moldea nuestros deseos. También existe la "formación de preferencias de
adaptación", resumida en la fábula de la zorra y las uvas verdes.[47] Esto
surge de lo que me referí más arriba como los cables de la máquina de
I .placer, por ejemplo, por la tendencia a reducir la disonancia cognitiva.
Otros procesos causales que moldean los deseos incluyen la producción de
disonancia, por ejemplo, mediante el impulso perverso por la novedad,[48]
o fenómenos imitativos tales como el conformismo y el anticonformismo.
Estos procesos indican la idea de una teoría sociológica general, en la que
las preferencias y los deseos se explican endógenamente como un produc-
to de los estados sociales a cuya generación también contribuyen, como se
explicó cerca del final del párrafo precedente. Esta teoría —que, obvia-
mente, en el presente estado del arte parece estar a años luz de distan-
cia— incluiría 1) la explicación de la acción individual en términos de
deseos y creencias individuales, 2) la explicación de macroestados en
términos de acciones individuales y 3) la explicación de deseos y creencias
en términos de macroestados.
Pero hay más para decir sobre los procesos causales de formación de
preferencias. Los mecanismos analizados en el párrafo precedente son
predominantemente "calientes", es decir, que explican la formación y el
cambio de las preferencias a través de los impulsos y los cables de placer
del individuo. Pero los deseos también pueden estar moldeados por meca-
nismos "fríos", es decir, por distorsiones cognitivas en cierto modo empa-
rentadas con las ilusiones ópticas. Así la relativa naturaleza atractiva de
las opciones puede cambiar cuando la situación de elección se reformula
en un modo que, racionalmente, no debería tener influencia sobre las pre-
ferencias. Tversky y Kahneman citan un ejemplo de L. J. Savage de "un
cliente que desea agregar $X al costo de un auto nuevo para comprar un
moderno estéreo, pero se da cuenta de que no querría agregar $X por el
estéreo después de haber comprado el auto por el precio normal". Y agre-

79
gan que "muchos lectores reconocerán la devaluación temporaria del dine-
ro que hace nuevas compras desusadamente atractivas en el contexto de
la compra de una casa".[49]
Pasando de deseos a creencias, también encontramos procesos calien-
tes y fríos. La formación "caliente" de creencias influye fenómenos tales
como la ilusión, la racionalización y el autoengaño, es decir, casos en los
que nuestras creencias sobre cómo es el mundo están moldeadas por
nuestros deseos relativos a cómo debería ser. Similarmente, los errores
"fríos" incluyen aquellos que resultan de fracasos cognitivos, como cuando
"un individuo que se juzga como muy probable republicano pero improba-
blemente abogado sería juzgado moderadamente como probable abogado
republicano",[50] como si las probabilidades fueran aditivas y no multi-
plicativas.
Pero por supuesto no toda formación de creencias es errónea o tenden-
ciosa. También existe formación de creencias que en cierto sentido es co-
rrecta o racional, no necesariamente resultante en creencias ciertas, pero
por lo menos en creencias justificadas. (Aquí utilizo el término "justifica-
das" en el sentido fuerte de que la persona debe tener dicha creencia por
buenas razones, y no simplemente que debe haber buenas razones para la
creencia que tiene. De hecho, lo último es compatible con la ilusión, si sus
deseos lo llevan a sostener creencias para las que tiene buenas razones,
aunque aquellas razones realmente no hayan jugado papel alguno en la
formación de la creencia. Es decir, el sentido fuerte de "justificadas" se ne-
cesita para excluir "coincidencias de la primera clase".) Frecuentemente
se dice que las personas con capacidad para formar creencias racionales o
bien fundamentadas tienen juicio, cualidad fundamental en muchos ca-
minos de la vida. Decir que una persona tiene cierta creencia porque tiene
buenas razones es en cierto modo como ofrecer una explicación intencio-
nal de la creencia, pero no tanto. No estamos diciendo que ha elegido la
creencia, sino que al sostenerla demuestra ser racional. Esto vale en un
grado aun mayor si la persona va más allá de tener creencias racionales
en relación con las pruebas disponibles y continúa adquiriendo más prue-
bas si siente que es necesario.
Me desconcierta esta forma anómala de explicación, que no corres-
ponde a la variedad intencional ni causal. Un problema similar surge en
la formación de deseos. Muchos de los mecanismos que moldean nuestros
deseos conducen a la heteronomía, así como cuando alguien siempre
quiere hacer lo contrario de lo que hace la mayoría, no porque tenga una
metapreferencia por aquellos deseos, sino porque es la clase de personas
contrarias. Tales personas no tienen el principio motor dentro de sí, sino
que se comportan más como apéndices de la estructura social. Y hay
muchos otros mecanismos de esta clase. Contrariamente, de una persona
autónoma podemos decir que posee el deseo, en lugar de decir que el deseo
lo posee a él. Desafortunadamente no sé cómo definir el concepto de
autonomía, aunque estoy seguro de que hay personas autónomas. Definir
la autonomía a través de la idea de deseos intencionalmente elegidos da
demasiado y demasiado poco: demasiado porque puede haber metadeseos
no autónomos, demasiado poco porque la autonomía puede existir sin esta

80
actitud autorreflexiva. Pero suponiendo que supiéramos cómo definir o
por lo menos cómo reconocer personas autónomas, aun habría un
problema conceptual en cuanto a qué clase de explicación proponemos
cuando decimos que una persona actúa en base a un deseo autónomo.
De hecho, el concepto de conducta racional relativa a deseos y
creen-Bdadas (y consistentes) es extremadamente débil. Además de esta
realidad formal queremos que las personas tengan racionalidad real, en
formas gemelas de juicio y autonomía. La fórmula de explicación
racional-cum-intencional de la acción en términos de deseos y creencias,
nplementadas con la explicación causal de las creencias y deseos
mismos, puede resultar engañosa o superficial. Si las personas son
agentes en sentido real y no sólo los soportes pasivos de sus estructuras
de preferencias y sistemas de creencias, entonces necesitamos entender
cómo son posibles el juicio y la autonomía. En mi opinión, éste es el
problema sobresaliente no resuelto tanto en filosofía como en las ciencias
sociales.

64

Você também pode gostar