Escolar Documentos
Profissional Documentos
Cultura Documentos
Keohane
y Sdney Verba
II tfseo de la
investiptip-n
La Tfiferfncia cientfica
en los estudios eua-maftvos
Alianza Hditoral
e fc a , s. a .
ndice
P re f a c io ......................................................................................................................................
1.
2.
9
13
13
13
17
20
23
24
29
33
37
39
39
39
42
42
45
46
48
53
55
2.
3.
4.
5.
(t.
7.
57
W)
(2
64
if
74
74
7f>
K7
XX
XX
'M
')<>
*N>
*>X
100
102
102
1
for>
107
4. Precisar qu va a observarse.....................................................................................
1. Diseos de investigacin im precisos...............................................................
I. I MAs inferencias que ob servacion es... .................................................
1.2 M ulticolincalidad.............................................i..........................................
2. Limites de la seleccin aleatoria......................................................................
3. Sesgo de seleccin ...............................................................................................
3.1 Seleccionar en funcin de la variable d ependiente............................
3.1.1 Ejemplos de sesgo de seleccin producido por el investiga
dor ........................................................................................................
3 .1.2 Ejemplos de sesgo de seleccin producido por el m undo.....
3.2 Seleccionar en funcin de una variable explicativa............................
3.3 Otros tipos de sesgo de Seleccin............................................................
4. Seleccin intencionada de observaciones......................................................
4 . 1 Seleccionar observaciones en funcin tic la variable explicativa....
4.2 Seleccionar un abanico tic valores de la variable dependiente........
4.3 Seleccionar observaciones utilizando tanto las variables explicati
vas com o h s dependientes ........................................................................
4.4 Seleccionar observaciones de manera que la variable causal clavo
sea constante........ .........................................................................................
125
12X
12*>
131
134
IJX
I .W
142
145
147
14')
150
150
15 1
153
157
15*
159
161
162
167
169
170
173
178
178
186
193
197
199
200
201
202
205
207
211
218
221
222
222
225
226
230
232
236
237
241
Not;*s ...................................................................................................................................
243
255
265
Prefacio
m en te c o in c id c n tc s porque la s d o s entraan la a d q u isici n de i h i o v o s cofioc im ie n to s y su -tra n sm isi n a O tras p erson as. aunque d e una m anera ligera
m e n te d iferen te e n u n o y .otro c a s o , liste lib ro atestigu a el carcter sin cr n i
c o d e am b a s a c tiv id a d e s . D e s d e 1 9 X 9 ,,h e m o s e s ta d o trab ajan d o en e s te
lib ro y d rg ien d o ju n to s en e l d ep artam en to d e g o b iern o d e la U n iversid ad
d e H arvard un se m in a r io d e tercer c ic lo titu lad o M to d o s cu a lita tiv o s en
la s c ie n c ia s s o c ia le s , lil se m in a r io ha sid o m uy a n im a d o y co n frecu en cia
h a co n tin u a d o e n lo s p a sillo s y en lo s largos m en sa jes q u e h em o s-in terca m
b ia d o entre n o so tr o s y c o n n u estro s estu d ian tes. I.as b atallas in te le ctu a les
h a n s id o sie m p r e a m is t o s a s , p ero la s r e g la s d el c o m b a te d ic ta b a n que
a cep ta r el d esa c u e r d o y h a cer c o n c e s io n e s eran g ra v es i le ilo s. S i uno de
n o so tro s no esta b a verd ad eram en te co n v e n c id o de a lg o , cre a m o s q u e n u es
tra o b lig a ci n era con tin u ar el d eb ate. A l fin a l, los au tores a p ren d im os bas
tante unos de o tro s y d e lo s e stu d ia n tes acerca de lo s m to d o s de in v estig a
c i n cu a litativo s y c u a n tita tiv o s, y ca m b ia m o s m u ch o s d e n u estros p u n ios
d e v ista in ic ia le s. A l m argen d e su s o b je tiv o s p rin cip ales, este tib io c o n sti
tu ye una d ecla ra ci n d el e n fo q u e u n n im e d e la in feren cia c ie n tfic a en la
in v estig a ci n cu a lita tiv a al q u e tanto n os c o s i llegar. .
La prim era v ersi n d el lib ro se term in en 1991, y en lo s an os p o sterio
res la h em o s r e v isa d o co n sid er a b lem en te, (ia r y K ing fu e e l prim ero en su
gerir que lo e sc r ib i r a m o s, e s b o z las prim eras v e rsio n es d e la m ayora d e
lo s ca p tu lo s y lle v la v o z can tan te cu el largo p ro ceso d e rev isi n . S in e m
b a rgo , la red a ccin d el lib ro ha sid o alterada en tan gran m ed ida por Robcrt
K c o h a n e y S k ln c y Verba, a si c o m o por el p rop io (ary K in g , qu e n o s resul
tara im p o sib le d eterm in a r d e m anera fia b le la autora d e m u c h o s fragm en
to s y apartados.
Durante e s te la r g o p r o c e s o p a sa m o s borradores a c o m p a e ro s d e tod os
lo s E sta d os U n id o s , a lo s q u e esta m o s m u y a g r a d ecid o s por la extraord in a
ria g en ero sid a d d e s u s c o m e n ta r io s. D a m o s tam bin la s g racias a lo s estu
d ia n tes d e d o cto ra d o , tan to d e Harvard c o m o d e otras u n iv ersid a d es, que
han id o c o n o c ie n d o e l te x to y c u y a rea cci n ha sid o im p ortan te a la hora de
revisa rlo. E s m u y aven tu rad o preten d er m en cion ar a to d o s a q u e llo s q u e lian
co la b o ra d o en un p ro y ecto c o m o este (ca lc u la m o s q u e e x is te una p o s ib ili
d a d d e 0 ,9 2 d e q u e sin d a rn o s cu en ta o m ita m o s a a lg u ie n q u e n o s h aya h e
ch o co m en ta r io s im p o r ta n tes). S in em b argo, q u isira m o s m en cio n a r a las
s ig u ie n te s p erson as: C h risto p h er II. A c h e n .J o h n A ld rich , lla y w a rd AIker.
R ob crt II. D a tes. J a m e s U a ltista , N ath an cl H cek . N a n c y H urns. M ich a el
C o b b , D avid G o llie r . t a r y C o x . M ichacI C . D esch . D avid D cssler. Jorge
D o m n g u e z , G e o r g e D o w n s, M itch ell D u n cicr. M a ilh ew E v a n g elista . John
F crcjohn, A u d rcw ( ie h n a n , A lcx a n d cr ( ic o r g e , Joshua ( io ld s tc iu . Aiulr^w
C ree n , D avid O r e e n . K obin 1 lam ia. M ichacI llis c o x , J a m es L. J o n es, padre.
M ile s Kahler, L li/a b c th K in g , A lcx a n d cr K ozh em iak in . N tcphcn I). Krasncr, Mcrbcrt K rilzcr, J a m es K u k lin sk i, N alh an Lae. 1e le r L an gc. T on y Lavclle', Judy L ayzcr, Jack S . L cvy, D an iel Lili le. S ean L yn n -Jon es. L isa L.
IT
1.
1.
La ciencia en las
ciencias sociales
Introduccin
1.1
mente a esta idea. Esta diferencia de opiniones genera una viva polmica,
pero, por desgracia, tambin divide la disciplina en dos ramas, una cuantitativa-sistemtica-generalizadora y otra cualitativa-humanista-discursiva. A
m edida que la prim era aum enta la complejidad de sus anlisis estadsticos
(y su trabajo se hace menos comprensible para los que no han estudiado las
tcnicas), la segunda se convence cada vez ms de que tales anlisis resul
tan irrelevantes para acontecimientos que, como aquellos que interesan a
sus partidarios, no parecen poder reproducirse o generalizarse.
Uno de los principales propsitos de este libro es demostrar que las dife
rencias entre la tradicin cuantitativa y la cualitativa son slo de tipo estils
tico y que su im portancia en trm inos metodolgicos y de contenido es m
nima. Puede considerarse con razn que toda buena investigacin
procede de la misma lgica inferencial subyacente. Tanto los estudios cuan
titativos como los cualitativos pueden ser sistem ticos y cientficos. La
investigacin histrica puede ser analtica si lo que pretende es evaluar di
versas explicaciones m ediante un proceso inferencial causal vlido. La his
toria, o la sociologa histrica, no es incompatible con las ciencias sociales
(Skocpol, 1984, pp. 374-86).
Para romper estas barreras es preciso que comencemos por cuestionar el
concepto mismo de investigacin cualitativa. Hemos utilizado el trmino
en el ttulo de este libro para hacer referencia a nuestro objeto de estudio,
pero sin querer decir con ello que la investigacin cualitativa se diferen
cie fundamentalmente de la cuantitativa, excepto en el estilo.
La mayora de las investigaciones no corresponde claramente a una u otra
categora, y las mejores suelen combinar caractersticas de los dos tipos. En
el mismo proyecto de investigacin, algunos de los datos recogidos pueden
ser objeto de anlisis estadstico, pero no as otros elementos igualmente re
levantes. Las pautas y tendencias del comportamiento social, poltico o eco
nmico son ms susceptibles de anlisis cuantitativo que el flujo de ideas
entre personas o la influencia determinante que tiene un lder extraordinario.
Para entender un mundo social en cambio constante tenemos que barajar in
formacin que no es fcilmente cuantificable y tambin la que s lo es. Ade
ms, todas las ciencias sociales necesitan comparar, lo cual supone que se
evale qu fenmenos se parecen ms o menos en cuestin de grado (o
sea, diferencias cuantitativas) o de tipo (diferencias cualitativas).
Dos m agnficos estudios recientes son ejemplo de este punto de vista.
En Coercive Cooperation (1992), Lisa L. M artin quiso explicar el grado de
cooperacin internacional en materia de sanciones econmicas, analizando
cuantitativamente 99 casos en los que se intent aplicar tales medidas des
pus de la Segunda G uerra Mundial. Aunque este anlisis cuantitativo ofre
ca mucha informacin valiosa, algunas de las inferencias causales que in
dicaban los datos eran ambiguas; de ah que M artin decidiera estudiar en
detalle seis casos de sanciones con la intencin de recabar ms pruebas de
relevancia para su inferencia causal. Para escribir M aking Democracy Work
1.2
1.
2.
L o s p r o c e d im ie n to s so n p b lic o s
Para generar y analizar datos la investigacin cientfica utiliza m todos explcitos, codi
ficados y p blicos que, por lo tanto, pueden evaluarse. Gran parte de la investigacin
social cualitativa sigue procedim ientos de bsqueda o inferenciales m enos precisos.
C om o afirm Robert K. M erton ([1949], 1968, pp. 71-72): El anlisis sociolgico de
datos cualitativos suele depender de un m undo privado de ideas penetrantes pero inson
dables y de interpretaciones inefables [...] [Sin em bargo,] la ciencia [...] es pblica, no
privada. La afirm acin de M erton no es aplicable a todos los cualitativistas (y, por des
gracia, s a algunos cuantitativistas), pero m uchos se com portan com o si carecieran de
m todo y, a veces, com o si la utilizacin de m edios explcitos m enoscabara su creativi
dad. N o obstante, no pueden dejar de utilizar alguno. De alguna form a observan los fe
nm enos, plantean preguntas, extraen inform acin sobre el m undo a partir de esas ob-
3.
L a s c o n c lu sio n e s so n in cierta s
4.
E l co n te n id o es el m to d o
1.3
Ciencia y complejidad
Las ciencias sociales pretenden explicar situaciones del m undo social que
consideramos ms o menos complejas. Sin embargo, hay que reconocer que lo
que percibim os como com plejidad no es algo inherente a los fenmenos:
el mundo no est dividido de form a natural en conjuntos de acontecim ien
tos simples o complejos. Por el contrario, la com plejidad que se percibe en
una situacin depende en parte de en qu medida podemos sim plificar la
realidad adecuadamente, y nuestra capacidad de sim plificar depende de si
podemos extraer con coherencia resultados y variables explicativas. Tener
ms observaciones puede ayudam os en este proceso, pero suele resultar in
suficiente. Por lo tanto, la complejidad depende, en parte, del estado de
nuestra teora.
Los mtodos cientficos pueden ser tan valiosos para acontecim ientos
intrnsecamente complejos como para otros ms simples. Es probable que
la complejidad haga ms inciertas nuestras inferencias, pero no tiene por
qu hacerlas menos cientficas. La incertidumbre y unos datos limitados no
tienen que llevamos a abandonar una investigacin cientfica. Por el contra
rio: la compensacin ms grande a la hora de utilizar las reglas de la infe
rencia cientfica se logra precisamente cuando los datos son limitados, los
instrumentos de observacin tienen defectos, las medidas no estn claras y
las relaciones son inciertas. Si hay relaciones claras y datos no ambiguos,
quiz el mtodo no sea tan importante, ya que incluso reglas o inferencias
defectuosas podran producir respuestas medianamente aceptables.
Consideremos algunos acontecimientos com plejos y, en cierto sentido,
nicos que tuvieron enormes ramificaciones. La cada del Imperio romano,
la Revolucin francesa, la G uerra Civil de los Estados Unidos, la Primera
G uerra M undial, el holocausto y la reunificacin alem ana de 1990 son
ejemplos de este tipo. El que estos acontecimientos tuvieran lugar parece
ser el resultado de una compleja interaccin de muchas fuerzas cuya con
juncin se antoja crucial para que as fuera. Esto quiere decir que series de
21*
2.
2.1
to a una poltica, y tam bin existen m anuales para llevar a cabo observa
cin participante en una oficina. Sin embargo, no hay reglas que indiquen
cmo elegir el proyecto de investigacin que se va a realizar y, si decidimos
llevar a cabo trabajo de campo, tam poco las hay para indicarnos dnde te
nemos que hacerlo.
Podemos proponer m aneras de hacer una muestra de comunidades con
el fin de estudiar el impacto de diferentes polticas educativas o formas de
conceptualizar los conflictos tnicos que nos lleven a la formulacin y com
probacin de hiptesis relativas a su incidencia. Sin embargo, no existen
normas que nos indiquen si hay que estudiar la poltica educativa o el con
flicto tnico. Desde el punto de vista de la metodologa de las ciencias so
ciales, hay form as m ejores y peores de estudiar la cada del rgim en de
Alem ania del Este en 1989, al igual que las hay para abordar la relacin en
tre las opiniones de un candidato en m ateria fiscal y sus probabilidades de
xito electoral. Sin embargo, no hay ninguna manera de determ inar si es
mejor estudiar la cada del rgimen germ ano oriental o el papel de los im
puestos en las elecciones estadounidenses.
El tem a concreto que estudia un cientfico social puede tener un origen
personal e idiosincrsico. N o es casual que, habitualmente, sean los m iem
bros de un grupo los que com iencen a estudiarlo: las mujeres han solido
llevar la batuta en la historia de su propio gnero, los negros en la de su et
nia y los inmigrantes en la de la emigracin. Los temas tambin pueden
verse influidos por inclinaciones o valores personales. Es probable que
quien estudia el Tercer M undo tenga ms ganas de viajar ^ tolere m ejor
condiciones de vida difciles que el que se ocupa de la elaboracin de pol
ticas en el Congreso estadounidense, del m ismo modo que quien analice la
cooperacin internacional puede tener una especial aversin a los conflictos
violentos.
Estas experiencias y valores personales suelen proporcionar la motiva
cin para convertirse en un cientfico social y, posteriormente, para elegir
una determ inada pregunta de investigacin. En consecuencia, pueden ser
las autnticas razones para embarcarse en un determinado proyecto, y es
justo que sea as. Sin embargo, independientemente de lo personales o pe
culiares que sean las razones para elegir un tema, los mtodos cientficos y
normas inferenciales que se analizan en este libro ayudarn a los acadm i
cos a hacer proyectos de investigacin ms slidos. Desde el punto de vista
de la posible aportacin a las ciencias sociales, las razones personales no
son ni necesarias ni suficientes para justificar la eleccin de un tema. En la
mayora de los casos, no tendran que aparecer en los escritos acadmicos.
Para decirlo de manera ms directa pero menos delicada, a nadie le im porta
nuestra opinin: a la com unidad acadm ica slo le interesa lo que podemos
demostrar.
Aunque no existan norm as precisas para elegir un tema, s hay maneras
de determ inar aparte de las preferencias personales la posible trans-
rrollo econmico similar (Russett, 1978, pp. 913-28). Dentro de los Esta
dos Unidos, la eficacia de los programas que combaten la pobreza o la de
sarticulacin social parece haber variado de forma considerable. No cabe
duda de que ser importante toda investigacin que contribuya, aunque sea
de form a marginal, al conocim iento de estos problemas.
Aunque los cientficos sociales tienen muchas cuestiones significativas
que investigar, las herram ientas para entenderlas son escasas y poco elabo
radas. Hay muchos escritos sobre la guerra o el sufrimiento en las socieda
des que poco contribuyen a la com prensin de tales problemas porque no
los describen de forma sistem tica o no hacen inferencias causales o des
criptivas vlidas. Las ideas brillantes pueden m ejorar la com prensin al
aportar nuevas e interesantes hiptesis, pero la brillantez no es un mtodo
de investigacin emprica. Todas las hiptesis han de ser contrastadas em p
ricam ente antes de que hagan una aportacin al conocimiento. Este libro no
da consejos sobre cmo ser brillante. Sin embargo, lo que s puede hacer es
recalcar la im portancia de que la investigacin se lleve a cabo de manera
que constituya una aportacin al conocimiento.
Nuestro segundo criterio para elegir una pregunta de investigacin, ha
cer una aportacin, significa explcitamente que hay que situar el diseo
del estudio dentro del marco de la bibliografa cientfica existente. Esto ga
rantiza que el investigador com prende el estado de la cuestin y reduce
al mnimo la posibilidad de repetir lo que ya se ha hecho. Tambin garanti
za que el trabajo sea im portante para otros, aumentando as el xito del
conjunto de la com unidad acadmica. Se puede hacer una aportacin expl
cita a lo escrito sobre el tem a de varias maneras. A continuacin se enume
ran algunas de ellas:
1.
2.
3.
4.
5.
6.
2.2
Mejorar la teora
29
pamos mucho de un asunto, no parece que haya muchas razones para prac
ticarla. Ni siquiera necesitamos este principio para evitar teoras excesiva
mente com plicadas, porque est implcito en la mxima de que la teora
debe ser tan com plicada como indican los datos. Las situaciones en las que
no hay inform acin suficiente sobre la complejidad de la teora que se in
vestiga pueden conducir a lo que se denomina diseos de investigacin
imprecisos (vase el apartado 1 del captulo 4), pero stos son problemas
del diseo de la investigacin y no supuestos acerca del mundo.
Todos los consejos que hem os dado hasta pueden aplicarse si an no
hemos reunido nuestros datos ni hemos comenzado a analizarlos. Sin em
bargo, si estn ya recogidos, podemos utilizar esas reglas para modificar
nuestra teora y conseguir ms datos, generando de este modo ms conse
cuencias observables sobre la nueva teora. Por supuesto, este proceso es
caro, cuesta mucho tiempo y quiz vayamos a desperdiciar los datos que ya
se han recogido. Qu ocurre entonces cuando est claro que hay que m e
jorar nuestra teora pero no podemos perm itim os recoger ms datos? Esta
situacin en la que con frecuencia se encuentra el investigador ha de
tratarse con cautela y dom inio de uno mismo. Cualquier investigador inteli
gente puede elaborar una teora plausible con el conjunto de datos que
surge de un hecho; sin embargo, esto no dira nada sobre la veracidad de la
teora, que puede ajustarse muy bien a los datos y ser completamente falsa
y, de hecho, su falsedad ser demostrable con otros muchos datos. A los
seres hum anos se les da bien reconocer pautas, pero no tan bien detectar la
falta de las mismas (la mayora vemos pautas en manchas de tinta saltea
das!). A una teora hay que racionarle los ajustes realizados sobre la marcha
que no sean coherentes con los datos disponibles, y hay que hacerlos con
bastante disciplina8.
Todava nos queda el problem a de qu hacer cuando hayamos terminado
tanto la recogida de datos com o nuestro anlisis y queramos mejorar nues
tra teora. En esta situacin, recomendamos que se respeten dos normas: en
prim er lugar, si nuestra prediccin se halla condicionada por diversas varia
bles y queremos libram os de una de las condiciones, podemos hacerlo. Por
ejemplo, si al principio nuestra hiptesis era que los pases democrticos
con sistemas avanzados de proteccin social no luchan entre s, sera acep
table extender tal hiptesis a todas las democracias contemporneas y de
este modo contrastar nuestra teora en un mayor nmero de casos y aumen
tar las posibilidades de que sea falsada. El propsito general es que, des
pus de ver los datos, podamos m odificar la teora para que se pueda apli
car a una gama ms am plia de fenmenos. Esta alteracin de nuestras tesis,
al exponerlas an ms a la falsacin, no debera llevamos a explicaciones
para salir del paso que slo pretendan salvar una teora inadecuada res
tringindola a fenmenos con los que ya se ha comprobado que concuerda.
Sin embargo, la prctica opuesta no suele ser apropiada. Despus de ob
servar los datos, no deberam os nicamente aadir una condicin restrictiva
2.3
Los datos son inform aciones sobre el m undo recogidas de forma siste
mtica y pueden ser de tipo cualitativo o cuantitativo. A veces se renen
datos para evaluar una teora muy concreta, pero no es inusual que los aca
dmicos los recojan antes de saber exactamente qu es lo que les interesa
encontrar. Adems, aunque los datos se renan para contrastar una hipte
sis determ inada, puede que al final a los investigadores les interesen pre
guntas que no se les haban ocurrido anteriormente.
En cualquier caso, ya sea que los datos se renan para un determinado
propsito o que se utilicen para otro que no est claro cuando se realiza la
recogida, existen ciertas norm as que mejoran la calidad de tales datos. En
principio, podem os considerar esas norm as al margen de las que se han
mencionado en el apartado 2.2 para m ejorar la teora. En la prctica, para
toda recogida de datos se necesita cierto grado de teora, del mismo modo
que para form ular cualquier teora se precisan algunos datos (vase Coombs, 1964).
N uestra primera y ms im portante directriz para m ejorar la calidad de
los datos es: registrar y detallar el proceso con el que se generan los datos.
Sin esta inform acin no podem os determ inar si la utilizacin de proced-
2.4
directrices que hay que seguir para utilizar mejor datos recogidos con an
terioridad.
En prim er lugar, siempre que sea posible, para hacer inferencias hay que
utilizar datos que no estn sesgados, es decir, que como promedio sean
correctos. Para entender esta idea tan concreta de la investigacin estadsti
ca, imaginemos que se aplica la m ism a m etodologa (ya sea en la investiga
cin cuantitativa o en la cualitativa) para analizar y extraer conclusiones de
datos procedentes de varias m atrices de datos brutos. Es probable que, a
causa de pequeos errores en los datos o en la aplicacin del procedim ien
to, utilizar slo una vez esta m etodologa nunca dar resultados del todo co
rrectos. Un procedimiento no sesgado ser correcto si se considera como
una m edia de muchas aplicaciones; aunque, por separado, stas no sean co
rrectas. El procedim iento no inclinar sistem ticamente el resultado en una
u otra direccin.
Es evidente que la extraccin de inferencias no sesgadas depende tanto
de la prim era recogida de datos com o de su uso posterior y que, como he
mos sealado anteriorm ente, siempre es mejor prever los problemas antes
de com enzar a reunir los datos. Sin embargo, aqu mencionamos brevemen
te estas dificultades porque al utilizar los datos es preciso poner un especial
cuidado en el anlisis de posibles fuentes de sesgo que hayan pasado desa
percibidas cuando se recogan dichos datos. Una de esas fuentes, que puede
falsear las inferencias, es la del sesgo de seleccin, que consiste en elegir
observaciones de tal m anera que se distorsiona sistemticamente la pobla
cin de la que proceden. Aunque un ejemplo obvio es el de escoger a pro
psito slo aquellos casos que apoyan nuestra teora, el sesgo de seleccin
puede ser mucho m s sutil. Hay otro sesgo que puede surgir de las varia
bles omitidas y que consiste en excluir alguna variable de control que pu
diera influir en una aparente conexin causal entre las variables explicativas
y la que queremos aclarar. Entre los captulos 2 y 6 analizaremos estas y
otras posibles dificultades que se presentan en la extraccin de inferencias
no sesgadas.
La segunda directriz se basa en el concepto estadstico de eficiencia:
para que los datos se utilicen de manera eficiente hay que m axim izar la in
formacin que se ha tenido en cuenta para hacer las inferencias descriptivas
o causales. Para m axim izar la eficiencia no slo es preciso utilizar todos
nuestros datos, sino usar tambin toda la informacin relevante que hay en
ellos para mejorar las inferencias. Por ejemplo, si los datos estn desagre
gados en pequeas unidades geogrficas, tenem os que utilizarlos de esa
forma, no slo como un agregado nacional. Los agregados ms pequeos
tendrn un mayor grado de incertidumbre, pero si son, al menos en parte,
consecuencias observables de la teora, contendrn informacin que puede
traerse a colacin en el problem a inferencial.
3.
3.1
En este captulo hem os subrayado que para que una teora merezca la pena
debe contem plar consecuencias relacionadas con las observaciones que es
peram os encontrar si es correcta. Estas consecuencias observables de la
teora han de guiar nuestra recogida de datos y ayudarnos a distinguir entre
hechos relevantes e irreJevantes. En el apartado 6 del captulo 2 analizamos
cmo afecta la teora a la recogida de datos y de qu manera stos discipli
nan la imaginacin terica. Aqu lo que queremos recalcar es que la teora
y la investigacin emprica deben estar estrechamente relacionadas. Cual
quier teora que de verdad trabaje para nosotros tendr consecuencias en la
investigacin emprica, y sta no podr llegar a buen puerto sin una teora
que la gue en la eleccin de sus preguntas. Tanto la teora como la recogi
da de datos son aspectos esenciales del proceso que nos lleva a decidir si
una teora puede considerarse de forma provisional verdadera o falsa, aun
que est sujeta en am bos casos a la incertidumbre que caracteriza a todas
las inferencias.
A toda teora hay que preguntarle cules son sus consecuencias observa
bles y en cualquier investigacin emprica hay que saber si las observacio
nes son relevantes para las consecuencias de la teora y, si es as, qu nos
permiten inferir sobre la correccin de la misma. En cualquier estudio so
cial cientfico las consecuencias de la teora y de la observacin de los he
chos han de ser elementos imbricados: las conclusiones de las ciencias so
ciales no pueden considerarse fiables si no se basan en teoras y datos
estrecham ente relacionados, que se hayan forjado mediante la formulacin
y anlisis de las consecuencias observables de una teora.
3.2
3.3
Admitir la incertidumbre
3.4
2.
La inferencia descriptiva
1.
49
es guiar.
Puede que Psathas tenga razn al sealar que los cientficos sociales que
slo se centran en comportamientos evidentes u observables se estn per
diendo mucho, pero cmo habram os de saber esto si no podemos ver
ms? Por ejemplo, si dos teoras sobre el concepto que uno tiene de s mis
mo tienen idnticas manifestaciones observables, ningn observador tendr
informacin suficiente para distinguirlas. Esto es as para cualquier obser
vador, independientemente de lo inteligente o sensible a factores culturales
que sea, de sus habilidades para la interpretacin, de lo bien que clasifique
sus propias suposiciones o del empeo que ponga en su empresa. La inter
pretacin, el presentimiento, la descripcin minuciosa, la observacin parti
cipante y la que no lo es, la entrevista en profundidad, la empatia, la cuantificacin y el anlisis estadstico, al igual que los dems procedimientos y
mtodos, no sirven para distinguir entre dos teoras que no tengan conse
cuencias observables diferentes. Por otra parte, si las hay, los mtodos que
describimos en este libro proporcionan formas de distinguirlas.
En la prctica, los etngrafos (y todos los buenos cientficos sociales) s
que buscan comportamientos observables con el fin de establecer diferen
cias entre las teoras. Puede que se sumerjan en la cultura, pero todos se ba
san en diversas formas de observacin, y cualquier nueva apreciacin del
contexto cultural procede directamente de ellas o de otros medios compara
bles. No siempre resulta fcil identificar observaciones relevantes. Por el
contrario, encontrar las apropiadas quiz sea la parte ms difcil de un pro
yecto de investigacin, especialmente (y necesariamente) en aquellas reas
de estudio tradicionalmente dominadas por la investigacin cualitativa.
1.2
1.3
tandariza las necesidades de los datos de los estudios de caso [...] formulan
do preguntas relevantes desde el punto de vista terico con el fin de dar
pautas para el anlisis de cada caso (George y McKeown, 1985, p. 41). El
problema que sealan George y McKeown est bien trado: Para hacer una
comparacin controlada mediante un tamao muestral pequeo hay que se
guir un procedimiento sistemtico de recogida de datos. Esa compara
cin estructurada y centrada precisa datos de las mismas variables en dife
rentes unidades. Por lo tanto, no es un mtodo diferente al que subrayamos
aqu, ya que constituye una forma de sistematizar la informacin en estu
dios de caso descriptivos de manera que sea factible utilizarla para hacer in
ferencias descriptivas o causales. M uchos de los valiosos consejos que,
como ste, se dan para hacer estudios de caso comparados son elementales,
pero se suelen pasar por alto.
2.
bar nuestras teoras, pero aprender de ellos puede ser un objetivo tan impor
tante como evaluar teoras e hiptesis previas. Para que se produzca este
aprendizaje hay que reorganizar los datos como consecuencias observables
de la nueva teora. Esta reorganizacin es muy habitual al principio de mu
chas investigaciones, generalmente despus de haber recogido algunos da
tos prelim inares; despus, prosigue la recogida de datos para evaluar la
nueva teora. Siempre se debe intentar seguir recogiendo datos, incluso des
pus de la reorganizacin, para contrastar la nueva teora y evitar as utili
zar el mismo material para evaluar sta y aquella de la que parti 4.
En tercer lugar, insistir en que se recojan datos que sean consecuencias
observables de una hiptesis deja mucho ms claro el territorio comn que
comparten los estilos de investigacin cuantitativo y cualitativo. De hecho,
una vez que dejamos de pensar en los casos, unidades o registros de la for
ma generalmente estrecha, e incluso ingenua, que es habitual, nos damos
cuenta de que la mayora de los estudios cualitativos podran aportar una
gran cantidad de consecuencias observables a las teoras que estamos eva
luando; sin embargo, muchas de ellas pueden pasarle desapercibidas al in
vestigador. En consecuencia, organizar los datos mediante una lista de las
observaciones especficas de una teora ayuda a poner de manifiesto el fin
cientfico esencial de gran parte de la investigacin cualitativa. En cierto
sentido, estamos pidindole al investigador que estudia un acontecimiento
concreto quiz una decisin gubernamental especfica que se pregun
te: Si mi explicacin de por qu la decisin result de una determinada
manera es correcta, que ms podra observar en el mundo real?. Se pue
den encontrar consecuencias observables adicionales en otras decisiones,
pero tambin en otros aspectos de la que se estudia, por ejemplo: cundo se
tom, cmo, o de qu manera se justific. La mxima crucial que ha de
guiar tanto la creacin de una teora como la recogida de datos es la bs
queda de ms consecuencias observables de esa teora.
Cada vez que desarrollamos una nueva teora o hiptesis resulta prove
choso hacer una lista de todas las consecuencias de la misma que, en prin
cipio, pudieran observarse. La lista, que podra despus limitarse a los ele
m entos sobre los que se han recogido datos o pudiera fcilm ente
hacerse , constituye a continuacin la gua bsica operativa para el pro
yecto de estudio. Si recoger un dato ms nos ayuda a considerar otra mane
ra de evaluar la teora, merece la pena hacerlo (siempre sujetos a los condi
cionantes de tiempo, dinero y esfuerzo). Cuando una entrevista u otro tipo
de observacin puede ser de inters, pero no es una consecuencia observa
ble potencial de esta teora (o de otra que sea relevante), entonces tiene que
ser evidente que no nos ayudar a evaluarla.
Dentro del proceso de simplificacin que se desarrolla al organizar nues
tros datos como consecuencias observables de la teora, necesitamos siste
matizar dichos datos. Podemos pensar en convertir los fenmenos brutos del
mundo real en clases que estn compuestas por unidades o en casos
3.
4.
5.
i
',+;>'2 + +:<') = 1 > ,
* i=l
(2.1)
La media muestral de las cuatro cifras de renta del ejemplo del apartado 4
(9.000, 22.000, 21.000 y 54.292 dlares) es 26.573 dlares, mientras que el
mximo muestral es 54.292. Podemos resumir los datos originales que con
tienen cuatro cifras mediante las dos cantidades que representan, respecti
vamente, la m edia y el m xim o m ustrales. Tambin podemos calcular
otras caractersticas de la muestra, como el mnimo, la mediana, la moda o
la varianza.
Cada resumen de este modelo reduce todos los datos (cuatro cifras en
este ejemplo simple o lo que conocemos de algn aspecto de la historia eu
ropea en el anterior) a un nico nmero. Comunicarse mediante resmenes
suele ser ms fcil y tiene ms sentido para el lector que utilizar todos los
datos originales. Evidentemente, si en nuestro conjunto de datos slo hu
biera cuatro nmeros, no tendra mucho sentido utilizar cinco resmenes
diferentes y sera ms sencillo presentar las cuatro cantidades originales.
Interpretar un estadstico suele ser ms fcil que comprender todo un con
junto de datos, pero siempre se pierde informacin al describir una gran
cantidad de nmeros utilizando unos pocos.
Qu normas rigen el resumen de los pormenores histricos? La primera
es que los resmenes deben centrarse en los resultados que queremos des
cribir o explicar. Si lo que nos interesa es el crecimiento de la organizacin
internacional media, no sera muy inteligente centrarse en las Naciones
Unidas; pero si lo que nos importa es cmo influye el mayor o menor tama
o en la distribucin de dichas organizaciones, las Naciones Unidas seran
seguramente una de las unidades en las que tendramos que centrarnos. La
ONU no es una organizacin representativa, pero s es importante. Para es
tudiar la tpica organizacin internacional desde el punto de vista estadsti
co examinaramos valores medios (de presupuestos, cometidos, nmero de
miembros, etc.), pero para comprender el abanico de actividades tendra
mos que examinar la varianza. El segundo precepto, igualmente evidente,
es que un resumen tiene que simplificar la informacin de que disponemos.
En trminos cuantitativos, esto significa que siempre hay que utilizar me
nos estadsticos sintetizadores que unidades hay en los datos originales,
porque, de no ser as, podra ser ms fcil presentar los datos originales sin
6.
La inferencia descriptiva
n Si
=M
(2-2)
(2.3)
nemos que hacer inferencias descriptivas que distingan los fenmenos alea
torios de los sistemticos. Saber qu ocurri en una ocasin concreta no es
suficiente. Si no nos esforzamos p o r determinar las caractersticas sistem
ticas de un asunto, las lecciones de la historia se perdern y nada aprende
remos de los aspectos de nuestro objeto de estudio que pueden mantenerse
o ser relevantes para estudios o acontecimientos futuros.
7.
En este ltimo apartado presentamos tres criterios explcitos que suelen uti
lizarse en estadstica para juzgar los mtodos inferenciales: falta de sesgo,
eficiencia y coherencia. Todos se basan en el marco de las variables aleato
rias que sealamos en el apartado 6 de este mismo captulo, pero tienen
consecuencias directas y profundas para la evaluacin y mejora de la inves
tigacin cualitativa. Con el fin de clarificar estos conceptos, en el presente
apartado slo damos ejemplos muy sencillos, todos ellos tomados de la in
ferencia descriptiva. Una versin simple de la inferencia conlleva la estima
cin de ciertos parmetros, incluyendo en ellos el valor esperado o la va
rianza de una variable aleatoria (ju. o o2) en una inferencia descriptiva.
Tambin utilizamos estos mismos criterios para evaluar inferencias causa
les en el siguiente captulo (vase su apartado 4). Reservamos para captu
los posteriores los consejos especficos que implican estos criterios para la
investigacin cualitativa y, en el resto del apartado, nos centramos nica
mente en conceptos.
7.1
Inferencias no sesgadas
dad observado en cada comunidad estara sesgado hacia niveles altos. Si las
reproducciones de nuestras hipotticas elecciones de 1979 se hubieran he
cho todas en sbado (cuando se podran haber celebrado cualquier otro
da), las estimaciones estaran sesgadas si ese hecho ayudara sistemtica
mente a uno de los partidos y no al otro (si, por ejemplo, los conservadores
fueran ms reacios a votar en sbado por razones religiosas). Las estima
ciones reproducidas tambin podran haberse basado en informes de contabilizadores de votos corruptos que favorecieran a un partido ms que a
otro. Sin embargo, si las elecciones reproducidas se celebraran en diversos
das elegidos de una manera que no estuviera relacionada con la variable
que nos interesa, los posibles errores de medida no produciran resultados
sesgados, aunque uno u otro da favoreciera a algn partido. Por ejemplo, si
hubiera fallos en el recuento de votos por descuidos aleatorios de los encar
gados de contabilizarlos, el conjunto de estimaciones no estara sesgado.
Si, por ley, las elecciones britnicas se celebraran siempre en domingo o
si el sistema electoral tuviera un mtodo de recuento que favoreciera ms a
uno de los partidos (por la utilizacin de un determinado procedimiento o
quiz incluso por una persistente corrupcin), necesitaramos un estimador
que variara segn la media de votos que pudiera esperarse en las condicio
nes de estas caractersticas sistemticas. De este modo, el sesgo depende de
la teora que se investiga, y no slo existe en los datos. No tiene mucho
sentido decir que un determinado conjunto de datos est sesgado, aunque
est plagado de errores individuales.
En este ejemplo, puede que queramos distinguir entre nuestra definicin
de sesgo estadstico en un estimador y la de sesgo esencial en un siste
ma electoral. Un ejemplo del segundo tipo es un horario de votacin que
dificulte el ejercicio del voto a los trabajadores; sesgo esencial bastante co
mn en varios sistemas electorales. Como investigadores, quiz queramos
hacer una estimacin de la media de votos en el presente sistema electoral
(el del sesgo esencial), pero quiz queramos tambin hacer un clculo apro
ximado de este indicador en un hipottico sistema que no presente un sesgo
esencial debido a los horarios de los colegios electorales. Esto hara posible
que calculramos el grado de sesgo esencial del sistema. Cualquiera que
sea la media que estemos calculando, lo que queremos es un estimador es
tadstico sin sesgos.
Los datos de las ciencias sociales pueden sufrir un sesgo importante del
que hay que ser consciente: las personas que nos proporcionan los datos
brutos que utilizamos en nuestras inferencias descriptivas suelen tener razo
nes para hacer estimaciones que son, sistemticamente, demasiado altas o
demasiado bajas. Puede que los funcionarios quieran exagerar las conse
cuencias de un nuevo programa para pedir una mayor financiacin o calcu
lar el ndice de paro a la baja para demostrar que estn haciendo un buen
trabajo. Quiz sea necesario buscar con ms ahnco estimaciones menos
sesgadas. En el estudio cualitativo de Myron Weiner (1991) acerca de la
SSSBSM
75
7.2
Eficiencia
|
i
-i
I
|
'
i-i
Y = K, si se considera en
$
|
i
I
f
f
|
j
|
I
<2-4 )
i
i
= n
n
i
I
*
I
As, Y es un estimador no sesgado de (i (este ejemplo es un poco menos f
formal que los que aparecen en los manuales de estadstica propiamente i
dichos, pero las caractersticas principales son las mismas).
1
tra teora corno sea posible, pero tambin demuestra el concepto general de
e fic ie n cia estadstica, que es igualm ente relevante cuando estamos d e ci
diendo cm o se pueden evaluar m ejor las diferentes maneras de com binar
en una inferencia las observaciones recogidas.
L a e ficie n cia nos perm ite comparar el estim ador i del estudio de caso
en el que slo hay una observacin {n = 1) con el gran estimador que tiene
cin que tiene con las dems. Podramos preguntar a unos pocos residentes
o leer informes de prensa para comprobar si es una comunidad media o si
algn factor no sistemtico ha hecho que esta observacin sea atpica; des
pus podramos ajustar el nivel de conflictividad observado para hacer una
estimacin del nivel medio, j., que se registra en Cisjordania. sta sera la
parte ms difcil del estimador del estudio de caso, y habra que tener cui
dado de que no se nos colara el sesgo. Una vez que estamos razonablemen
te seguros de haberlo m inim izado, podramos centrarnos en aumentar la
eficiencia. Para hacerlo, podramos pasar muchas semanas en la comuni
dad, llevando a cabo numerosos estudios independientes. Podramos entre
vistar a lderes comunitarios, leer los peridicos, acompaar a una familia
en su vida diaria y utilizar otras tcnicas para recabar informacin. Median
te tales procedimientos, podramos conseguir muchas ms de 25 observa
ciones dentro de esta nica comunidad y producir un estudio de caso que,
al igual que el de las 25 comunidades, no estuviera sesgado y que fuera
ms eficiente que ste.
Consideremos otro ejemplo: supongamos que estamos realizando un es
tudio sobre el problema internacional que plantean las drogas y que necesi
tamos calcular el porcentaje de tierra cultivable de una determinada regin
del mundo en el que se ha plantado cocana. Supongamos, adems, que
podemos elegir entre dos mtodos: un estudio de caso de un solo pas o una
investigacin a gran escala de tipo estadstico que se ocupe de todos los
pases de la regin. Parece mejor estudiar toda la regin, pero hay que sea
lar que, para optar por esta alternativa, es necesario (por razones prcticas)
utilizar los datos que proporcionan los gobiernos de la zona a un organismo
de la ONU. Se sabe que estas cifras tienen poca relacin con las pautas rea
les de cultivo, ya que las preparan los ministerios de asuntos exteriores y se
basan en consideraciones relativas a las relaciones pblicas. Supongamos
tambin que, mediante visitas que observaran de cerca un pas, podramos
corregir las estimaciones de su gobierno para acercarlas ms a Jas cifras
verdaderas. Qu mtodo elegiramos? Quiz decidamos estudiar slo un
pas, o quiz dos o tres; tambin podramos analizar uno en profundidad y
utilizar nuestros resultados para reinterpretar, y por tanto mejorar, los datos
gubernamentales de los otros pases. La eleccin tendra que basarse en qu
datos responden mejor a nuestras preguntas.
Por poner un ejemplo ms, supongamos que estamos estudiando la Co
munidad Europea y queremos hacer una estimacin del grado de regulacin
que se espera produzcan en un sector de toda la Comunidad las acciones de
la Comisin y del Consejo de Ministros. Podramos recabar informacin en
un gran nmero de normativas adoptadas formalmente por el sector indus
trial en cuestin, codificarlas segn su severidad y, posteriormente, hacer
una estimacin de la severidad media de una normativa. Si recogemos da
tos sobre 1 0 0 normativas que muestren, en principio, un rigor similar, la va
rianza de nuestro clculo ser el resultado de dividir la de cualquiera de las
i
I
I
"
nzt
'
(2-5) S
|
c^/n
jj
I
p
|
|
|
\
Hacemos un modelo del estudio pequeo con un estimador diferente de jl, f
que es c:
f (ya) = MY E(Y2) = MQu estimador sera preferible? Nuestra primera respuesta es que no
deberamos utilizar ninguno de ellos y que seria mejor optar por la media
muestraly, o sea, por un estudio de n grande realizado por un investiga
dor imparcial. Sin embargo, no siempre puede aplicarse el estimador obvio
o el mejor. Para solucionar este problema, recurrimos a una evaluacin del
sesgo y de la eficiencia.
En primer lugar, calibramos el sesgo. Podemos sealar que el primer es
timador d est ligeramente sesgado segn el clculo habitual:
E(d) = E\ X Yt ~ 0,01
\ n /-i
= /x -
0 ,0 1
EjYj + E(Y2)
2
P-+ M
=A
Utilizando slo estos clculos, elegiramos el estimador c, que repre-
senta el resultado del estudio con un n pequeo de nuestro investigador
Krf) = ^ K - o , o i
\n -i
= o*/n
= 0^/650
|
cambia (tiene una varianza cero) en las diferentes muestras. Del mismo
s modo, se calcula la varianza de c como sigu e1S:
l/(c) = V1 +
(2.6)
EMC(</) = - ^ + ( 0 , 0 1 ) 2
(2.7)
----- + 0,0001
650
EMC(c) = - y -
(2.8)
$
De este modo, en la mayora de los valores de o2, EMC(t/) < EMC(c), y d
sera preferible como estimador de c.
En teora, siempre hay que optar por estimadores no sesgados que sean
lo ms eficientes posible (o sea, que utilicen la mayor cantidad posible de
informacin). Sin embargo, en las investigaciones reales que analizamos
en captulos posteriores, este equilibrio entre sesgo y eficiencia es bastan
te llamativo.
3. Causalidad
e inferencia causal
1.
Definicin de causalidad
89
(3-1)
(3.2)
(3.3)
1.2
Un ejemplo cualitativo
bilidad democrtica; sin embargo, para cada pas slo hay una oportunidad:
slo una reproduccin de este experimento. En tal situacin, puede que a
los lderes polticos les interese algo ms que el efecto causal medio. Quiz
quieran comprender cules podran ser los efectos causales mximo y mni
mo o, al menos, la varianza de los efectos causales. Por ejemplo, quiz el
sistema presidencial reduzca la estabilidad democrtica media, pero la va
riabilidad de este efecto es enorme: a veces aumenta mucho la estabilidad y
otras la disminuye de forma considerable. Esta varianza se convierte en un
riesgo para el sistema poltico. En tales circunstancias, puede que los ciu
dadanos y los lderes polticos prefieran optar por un ordenamiento que ge
nere una estabilidad m edia slo un poco menor, pero con una varianza
tambin inferior en su efecto causal, de manera que se minimicen las posi
bilidades de llegar a un resultado desastroso.
2.
2.1
Mecanismos causales
nismo causal que opera en este proceso conllevara hasta que se produje
ra el efecto final sobre la balanza de pagos estadounidense respecto a
Japn la firm a y ratificacin del acuerdo, la informacin que dieran los
peridicos, las reuniones de los actores afectados en las compaas m ulti
nacionales y las acciones compensatorias que realizaran para reducir la car
ga fiscal de sus empresas (como el cambio en las reglas de fijacin de pre
cios de transferencia o el traslado de las fbricas de un pas a otro), as
como las acciones de otras compaas y trabajadores que quisieran aprove
charse de los movimientos de capital y de fuerza productiva entre los pa
ses, etc.
Desde el punto de vista de los procesos con los que opera la causalidad,
hacer hincapi en los mecanismos causales tiene sentido intuitivamente:
toda explicacin coherente de la causalidad tiene que explicar de qu mane
ra se producen sus efectos. Identificar mecanismos causales es una forma
habitual de hacer anlisis empricos a la que se ha denominado con expre
siones ligeramente diferentes: rastreo de procesos (que analizaremos en
el apartado 3.3 del captulo 6 ), anlisis histrico y estudios de caso de
tallados. Muchos de los pormenores de los estudios de caso bien hechos
conllevan la identificacin de mecanismos causales.
Sin embargo, para precisar cules son tales mecanismos es necesario uti
lizar la inferencia causal, empleando los mtodos que se analizan posterior
mente. Esto quiere decir que el investigador, para demostrar el carcter cau
sal de cada posible vnculo en un mecanismo como se, tendr que definir
el efecto causal subyacente y luego hacer una estimacin del mismo. Si se
quiere representar un mecanismo causal con coherencia interna es necesa
rio utilizar, para cada uno de los eslabones de la cadena de acontecimien
tos, la definicin de causalidad fundamental que hemos dado en el aparta
do 1 de este captulo.
De ah que nuestra definicin de causalidad sea, lgicamente, previa a la
identificacin de los m ecanism os causales. Adems, en las ciencias so
ciales siempre existen infinidad de pasos causales entre cualquier par de es
labones de esa cadena de m ecanism os. Si postulam os que una variable
explicativa produce otra dependiente, para utilizar un enfoque a base de
mecanismos causales tendremos que listar los vnculos causales que hay
entre ambas variables. En esta definicin tambin necesitaremos determi
nar una serie de enlaces causales, definir la causalidad en cada par de varia
bles consecutivas de la secuencia y precisar qu unin existe entre cada dos
variables, as como la conexin entre parejas diferentes. Este enfoque nos
conducir rpidamente a un regreso al infinito y en ningn momento ofrece
por s solo una definicin precisa de causalidad, relativa a una causa y un
efecto.
En el ejemplo referido al efecto que tiene un sistema presidencial o par
lamentario en la estabilidad democrtica (apartado 1 .2 ) los mecanismos
causales de la hiptesis incluyen una mayor desafeccin de las minoras en
2.2
Causalidad mltiple
En un trabajo reciente, Charles Ragin (1987, pp. 34-52) aboga por una me
todologa que utilice muchas variables explicativas y pocas observaciones,
con el fin de que se pueda tener en cuenta lo que l denomina causalidad
mltiple. Esto quiere decir que El fenmeno que se investiga tiene deter
minantes alternativos; lo que Mili (1843) llamaba el problema de la plura
lidad de causas. Para la teora general de sistemas (George, 1982, p. 11),
este problem a se denom ina equifinalidad. En situaciones con causas
mltiples, estos autores sealan que un mismo resultado pueden producirlo
combinaciones de diferentes variables independientesl0.
Para Ragin, cuando diversas variables explicativas pueden explicar el
mismo resultado en una variable dependiente, hay mtodos estadsticos que
rechazan equivocadamente la hiptesis de que tales variables tengan un ca
rcter causal. Ragin tiene razn al afirmar que algunos modelos estadsti
cos (o relevantes diseos de investigacin cualitativa) quiz no alerten al in
vestigador de la existencia de una causalidad mltiple, pero s los hay
adecuados (algunos de los que Ragin analiza) para manejar con facilidad
este tipo de situaciones.
Adems, los rasgos fundamentales de la causalidad mltiple pueden
compatibilizarse con nuestra definicin de causalidad y son los mismos en
la investigacin cuantitativa y en la cualitativa. Esta idea no contiene rasgos
o requisitos tericos nuevos. Consideremos, por ejemplo, la hiptesis de
RKiSS
98
que el nivel de renta de una persona depende tanto de que culmine con xi
to estudios superiores como del hecho de que sus padres tambin lo hicie
ran. Resulta insuficiente cumplir una condicin y no la otra. En este caso,
necesitam os com parar diversas categoras de nuestra variable causal: los
encuestados que cumplen ambas condiciones, los dos grupos en los que
slo se da una u otra y aquel que no cuenta con ninguna. De este modo, el
concepto de causalidad mltiple exige ms de nuestros datos, ya que
ahora nuestras variables causales se dividen en cuatro categoras, aunque
esto no haga necesario un cambio en nuestra definicin de causalidad. Para
sta, tendramos que medir la renta esperada en la misma persona, al mis
mo tiempo y en cada una de las cuatro situaciones.
Sin embargo, qu ocurre si diferentes explicaciones causales producen
los mismos valores en la variable dependiente? Supongamos, por ejemplo,
que en una poblacin de trabajadores fabriles nuestra variable causal (dicotmica) fuera el hecho de tener o no tener una licenciatura universitaria. En
esta situacin sera bastante razonable que licenciados y no licenciados tu
vieran la misma renta (nuestra variable dependiente). Una de las razones
puede ser que esta variable explicativa (los estudios universitarios) no tiene
un efecto causal en la renta de los trabajadores fabriles, quiz porque la
educacin superior no ayuda a un mejor rendimiento. Por el contrario, hay
diversas razones que pueden explicar que ambos grupos tengan el mismo
nivel de renta. Quiz el de los licenciados tenga que ver con su ttulo y el
de los que no fueron a la universidad con sus cuatro aos de antigedad en
el puesto. En esta situacin, no podramos llegar a la conclusin de que la
educacin universitaria no tiene un efecto causal en los niveles de renta
de los que van a convertirse en trabajadores fabriles?
Por fortuna, nuestra definicin de causalidad requiere una mayor preci
sin en la condicin contrafctica. En el presente ejemplo los valores de la
variable causal principal que hay que cambiar son ( 1 ) tener un ttulo univer
sitario frente a (2) carecer de l pero llevar cuatro aos en un puesto. La va
riable dependiente es la renta anual inicial. En consecuencia, nuestro efecto
causal se define de la siguiente manera: registramos la renta de una persona
que termina su carrera y va a trabajar a una fbrica. Despus, retrocedemos
cuatro aos y ponemos al mismo individuo a trabajar en la misma fbrica,
en vez de mandarle a la universidad, y al cabo de cuatro aos medimos de
nuevo sus ingresos. La diferencia esperada entre estos dos niveles de renta
en el mismo individuo es nuestra definicin de efecto causal medio. En la
situacin actual, hemos imaginado que este efecto causal es igual a cero,
pero esto no significa que los estudios universitarios no tengan un efecto
sobre la renta, slo que la diferencia media entre los grupos de tratamien
to (1) y (2) es cero. De hecho, no hay una nica definicin lgica del efecto
causal de los estudios universitarios, ya que no se puede definir un efec
to causal sin que haya, al menos, dos condiciones. No tienen por qu ser las
que hemos mencionado, pero es preciso identificarlas claramente.
2.3
Stanley Lieberson (1985, pp. 63-64) distingue entre lo que clasifica como
formas de causalidad simtricas y asimtricas y se centra en las dife
rencias que se producen en los efectos causales cuando se aumenta una va
riable explicativa o cuando se reduce. Segn sus propias palabras:
Al examinar, por ejemplo, la influencia causal de X, [una variable explicativa] sobre Y
[una dependiente], tam bin hay que considerar si los cam bios producidos desde cual
quier direccin en un valor dado de X tienen las m ism as consecuencias para Y [...] Si la
relacin causal entre X s [la variable explicativa] e Y [la dependiente] es sim trica o real
mente reversible, el efecto que tendr sobre Y un aum ento de X t desaparecer si X , vuel
ve a su nivel anterior (siempre que el resto de las condiciones sea constante).
3.
3.1
dad (que puede reducir la asistencia a las urnas en algunas reas) no varia
r, como promedio, de una circunscripcin a otra, a menos que haya dife
rencias climticas sistemticas entre las dos.
En la cita siguiente, Holland (1986, p. 947) da un ejemplo claro del su
puesto de homogeneidad de las unidades (definido a partir de su idea de
efecto causal realizado y no en funcin del efecto causal medio). Al no
existir apenas aleatoriedad en el experimento del siguiente ejemplo, su de
finicin y la nuestra se parecen (de hecho, como planteamos en el aparta
do 2 del captulo 4, en un pequeo nmero de unidades, el supuesto de la
homogeneidad de las unidades es ms til cuando el grado de aleatoriedad
es bastante bajo).
Si [la unidad] es la habitacin de una casa, t [de tratamiento] significa que pulso el in
terruptor de la luz en esa habitacin, c [de control] significa que no lo hago y [la varia
ble dependiente] indica si la luz est encendida o no durante un corto periodo despus
de que se aplique t o c, de manera que podra creer que se pueden conocer los valores de
[la variable dependiente, tanto en t com o en c] al pulsar el interruptor. Sin embargo, est
claro que mi creencia slo la puede com partir alguien por la plausibilidad de ciertos su
puestos relativos a la situacin. Si, por ejemplo, la luz se ha estado apagando y encen
diendo sin razn aparente mientras estoy pensando en realizar mi experimento, podra
dudar de que se puedan conocer los valores de [la variable dependiente tanto en t como
en r] despus de pulsar el interruptor, al menos hasta que fuera lo suficientemente in
genioso como para concebir un nuevo experimento!
3.2
Independencia condicional
4.
5.
/3 = (K| X. = 1 ) - ( K | X = 0) = 4 - M "
(3.4)
(3.5)
5.1
Con esta primera regla no slo queremos decir que una teora que no
puede estar equivocada no es tal teora, sino que las teoras hay que dise-
-/4+0
4Sf
(/,)= X./3
(3.6)
El parmetro /3 sigue siendo el valor terico del efecto causal medio, una
caracterstica sistemtica de las variables aleatorias y uno de nuestros ob
jetivos en la inferencia causal. Este modelo constituye un caso especial
del anlisis de regresin que es habitual en la investigacin cuantitati
va, pero los coeficientes de regresin slo coinciden a veces con las esti
maciones de los efectos causales.
1YX
= - ^ ------
(3.7)
IV ,
!1___ ____
E(b) =
(3.8)
1
IW ,)
i*1
*]
i*l
= /3
lo cual demuestra que b es un estimador no sesgado de /3.
pregunta debe aplicarse a cualquier teora o hiptesis, pero, sobre todo, tie
ne que hacerlo el investigador que primero formula una teora.
Karl Popper es el autor que ms se relaciona con la idea de falsabilidad
(Popper, 1968), y para l existe una asimetra fundamental entre confirmar
Z W
(3.9)
V(b) = V
z * 2m
zn)
ti* ,
a2
z*
/
i
En consecuencia, la varianza de este estimador es una funcin de dos
componentes. En primer lugar, cuanto ms aleatoria sea cada unidad en
nuestros datos (la mayor es a2), ms variable ser nuestro estimador b, y
esto no debera sorprendernos. Adems, cuanto mayor sea la varianza ob
servada en la variable explicativa j Z ^ j ' menos variable ser nuestra es
timacin de b. En el caso extremo de que no haya variabilidad en X, nada
podr ayudarnos a estimar el efecto que tienen los cambios producidos en
la variable explicativa sobre la dependiente, y, en este ejemplo, la frmula
pronosticar una varianza infin ita (incertidumbre completa). De manera
ms general, este componente indica que la eficiencia es mayor cuando,
en la variable explicativa, tenemos datos que proceden de una gama de
valores ms amplia. Por tanto, lo ms habitual es que sea mejor evaluar |
nuestras hiptesis causales en tantas situaciones diferentes como sea po
sible. Se puede pensar en este ltimo asunto como si consistiera en trazar
una lnea utilizando una regla, dos puntos sobre una pgina y poco pulso.
Si los dos puntos estn muy juntos (X tiene una pequea varianza), los
errores que se registren al colocar la regla sern mucho mayores que si es
tuvieran ms separados (situacin en la que X tiene una varianza grande).
i
Para los cientficos (y especialmente para los sociales) que evalan teo
ras formuladas con propiedad, la asimetra fundamental de Popper resulta
prcticamente irrelevante. O Hear (1989, p. 43) hizo una afirmacin sim i
lar acerca de la aplicacin de las ideas de Popper a las ciencias fsicas:
Popper siempre suele hablar teniendo en mente explicaciones de teoras universales.
Pero hay que insistir una vez ms en que proponer y com probar teoras universales es
slo uno de los objetivos de la ciencia. Puede que, debido a condiciones que han varia
do considerablem ente a lo largo del tiem po y el espacio, no haya teoras universales
verdaderas, y sta es una posibilidad que no podem os subestimar. Sin em bargo, aunque
asi fuera, la ciencia an podra cumplir m uchos de sus objetivos, al dam os conocim ien
tos y hacer verdaderas predicciones acerca de las condiciones que constituyen y rodean
nuestro restringido m bito espacio-temporal.
5.2
emprico. Slo desde un punto de vista abstracto son ms precisas que las
teoras sociales no formales: sus predicciones acerca del mundo real no son
ms especficas porque sus condiciones no se corresponden, ni siquiera de
forma aproximada, con las reales.
Simplificar es esencial para los modelos formales, al igual que lo es en
toda investigacin, pero hay que tener cuidado con las inferencias que se
extraen de la realidad a partir de esos modelos. Por ejemplo, presuponer
que todas las variables omitidas no tienen consecuencias sobre los resulta
dos puede ser muy til al construir modelos, y, precisamente, esto es lo que
hacemos en muchos de los modelos formales cualitativos de este libro. Es
tos supuestos no suelen justificarse por ser rasgos del mundo; slo se dice
que son instrumentos tiles para construir modelos a partir de l. En conse
cuencia, sus resultados se refieren concretamente a situaciones en la que ta
les variables omitidas son irrelevantes y pueden parecerse o no a los del
mundo real. No tenemos que comprobar el supuesto para elaborar el m ode
lo y sus consecuencias, pero s es esencial que lo pongamos a prueba du
rante la evaluacin emprica. Para que el modelo formal sea til, el supues
to no tiene que ser correcto, pero no podemos emplear en la elaboracin de
diseos de investigacin em prica supuestos tericos no comprobados o
justificados. Por el contrario, para que las teoras formales sean tiles en
los estudios empricos, suele ser preciso complementarlas con otros ele
mentos.
Un buen modelo formal debe ser abstracto, de manera que los rasgos
clave del problema se pongan de manifiesto y pueda aplicarse fcilmente el
razonamiento matemtico. As, consideremos un modelo formal sobre las
consecuencias de la representacin proporcional en los sistemas de partidos
que implique que la primera fragmenta los segundos. La variable causal
clave es el ordenamiento electoral, o sea, si es un sistema de representacin
proporcional en el que los partidos obtienen escaos en funcin del porcen
taje de votos que logran o si es un sistema mayoritario en el que slo hay un
ganador en cada circunscripcin. La variable dependiente es el nmero de
partidos polticos, que suele denominarse grado de fragmentacin del sis
tema de partidos. La hiptesis principal es que los ordenamientos electo
rales que se basan en la representacin proporcional generan ms partidos
polticos que los de tipo mayoritario. Para una mayor sencillez, este modelo
podra incluir nicamente variables que midieran algunos rasgos esenciales
del sistema electoral y tambin el grado de fragmentacin del de partidos.
El modelo slo generara una hiptesis, no una conclusin, acerca de la re
lacin que existe entre la representacin proporcional y la fragmentacin
del sistema de partidos en el mundo real, y esa hiptesis habra que com
probarla utilizando mtodos cualitativos o cuantitativos empricos.
Sin embargo, aunque una de las consecuencias de este modelo sea que la
representacin proporcional fragmenta los partidos polticos y aunque no se
utilizaran otras variables en el modelo, en un anlisis emprico sera absurdo
5.3
Es evidente que al investigar todo debe hacerse con cuidado, pero elegir las
variables, principalmente las dependientes, es una decisin especialmente
importante. A continuacin damos tres indicaciones (basadas en errores
que se cometen con demasiada frecuencia en escritos cuantitativos y cuali
tativos):
En primer lugar, las variables dependientes deben ser realmente depen
dientes. Elegir una variable dependiente que en realidad produce cambios
en las explicativas es un error muy habitual. Analizamos las consecuencias
especficas de la endogeneidad y ciertas maneras de esquivarla en el aparta
do 4 del captulo 5, pero hay que subrayar aqu este problema porque la for
ma ms fcil de evitarlo es elegir variables explicativas claramente exgenas y variables dependientes manifiestamente endgenas.
En segundo lugar, no hay que seleccionar observaciones que estn basa
das en la variable dependiente para que sta se mantenga constante. Esto
tambin puede parecer bastante obvio, pero hay investigadores que suelen
elegir observaciones en las que la variable dependiente no cambia en abso
luto (como en el ejemplo analizado en el apartado 3.1 del captulo 4). Aun
que el diseo de investigacin no se haga con el propsito de que esta va
riable se mantenga constante, puede resultar que lo sea. Sin embargo, esto
no supondr un problema a menos que hayamos predeterminado tal situa
cin mediante la seleccin de criterios. Por ejemplo, supongamos que se se
leccionan observaciones en dos categoras de una variable explicativa y que
resulta que la dependiente es constante en los dos grupos. ste no ser ms
que un caso en el que el efecto causal estimado es cero.
Para terminar, tenemos que elegir una variable dependiente que repre
sente la variacin que queremos explicar. Aunque esta indicacin parezca
evidente, el asunto es bastante delicado, como pone de manifiesto Stanley
Lieberson (1985, p. 100):
Un sim ple experim ento gravitatorio, presente en el Ontario Science Centre de Toronto,
inspira un ejemplo heurstico. En este montaje se deja caer una moneda y una pluma
dentro de un tubo en el que se ha hecho el vaco, y ambas llegan al fondo casi al mismo
tiem po. Como el vaco no es total, es de suponer que la moneda llegar al fondo un po
quito antes que la pluma. En cualquier caso, imaginmonos un estudio en el que se de
jen caer varios objetos, sin que se tenga el control tan frreo que otorga el vaco (que es
lo que ocurrira en una investigacin social no experimental). Si los cientficos sociales
perciben que varia el tiempo que tarda cada objeto en llegar al suelo, lo normal es que
quieran saber qu caractersticas determ inan esa diferencia. Es probable que rasgos
como la densidad y la forma de los objetos influyan en la velocidad de la cada si no
existe el vaco. Si el investigador social tiene suene, la conjuncin de esos factores ex
plicar completamente las diferencias de velocidad que presenta la cada de cada uno de
los objetos y, si es as, se pondr muy contento porque se habrn explicado todas las va
riaciones que hay entre un objeto y otro. Mediante el razonamiento habitual en las cien
cias sociales, el investigador llegar a la conclusin de que se entiende completamente
el fenmeno porque se han explicado todas las diferencias que existen entre los objetos
que se estudian. Seguramente, debe de haber algo que falla en nuestros procedimientos
si podemos abordar este problem a sin siquiera referirnos a la gravedad.
5.4
Con esta regla no queremos decir en modo alguno que conceptos como
los de intencionalidad o motivacin carezcan de importancia. Slo preten
demos sealar que, en una ciencia emprica como la nuestra, la principal
norma explicativa tiene que ser la verificacin o falsacin emprica. Siem
pre ser ms difcil y menos provechoso buscar pruebas empricas para
conceptos abstractos, inconmensurables e inobservables que para muchas
ideas especficas y concretas concebidas de manera imperfecta. Cuanto
ms abstractos sean nuestros conceptos, ms difusas sern sus consecuen
cias observables y menos posibilidades habr de falsar la teora.
Los investigadores suelen utilizar la siguiente estrategia. Parten de algn
concepto abstracto como los mencionados anteriormente, aceptan que no
pueden medirlo de forma directa y, en consecuencia, sealan indicadores
especficos de dicho concepto que s pueden medirse y los utilizan en sus
explicaciones. La eleccin de ese indicador concreto se basa en que es ob
servable. A veces, es lo nico observable (por ejemplo, slo hay datos dis
ponibles de este fenmeno o es el nico tipo de acontecimiento histrico
del que se guarda informacin). Este aspecto de la investigacin emprica
es perfectamente respetable y, de hecho, suele ser necesario.
Sin embargo, tiene una parte mala, pues con frecuencia el indicador es
pecfico est lejos del concepto original y slo se relaciona con l de forma
indirecta e incierta. Quiz no sea en absoluto un indicador vlido del con
cepto abstracto, pero el investigador, despus de pedir perdn rpidamente
por el desfase que hay entre uno y otro, adjudica al primero el nombre del
segundo y sigue adelante como si estuviera midiendo el concepto directa
mente. Por desgracia, esta objetualizacin es frecuente en las ciencias so
ciales, quiz ms en la investigacin cuantitativa que en la cualitativa, pero
demasiado habitual en ambas. Por ejemplo, el investigador utiliza las cifras
que tiene sobre correos, com ercio, turismo e intercambio de estudiantes
para elaborar un ndice de integracin social en Europa; realiza una en
cuesta para averiguar si a los entrevistados les preocupa ms el medio am
biente que ganar dinero, clasificndolos despus com o materialistas o
postmaterialistas, u observa que las instituciones federales estadouniden
ses se diferencian entre s por el perodo medio de permanencia de los tra
bajadores en sus empleos y con este dato mide la institucionalizacin de
dichos organismos.
Aqu tenemos que dejar claro lo que queremos decir. El desfase entre
concepto e indicador es inevitable en gran parte de los estudios sociales,
pero hay buenas razones para utilizar conceptos generales en vez de espec
ficos: nos permiten ampliar nuestro marco de referencia y la aplicabilidad
de las teoras. De este modo, podemos referimos al poder legislativo en vez de
utilizar categoras ms estrechas, como parlamento, o instituciones concre
tas, como el Bundestag alemn. Podemos hablar de rganos decisorios
en lugar de legislativo cuando queremos que nuestra teora sea aplicable a
una gama de instituciones an ms amplia (de hecho, en el siguiente apar
5.5
Puede que parezca que esta regla entra en conflicto con la preferencia
que mostr Robert Merton ([1949], 1968) por las teoras de alcance m e
dio, pero incluso una lectura rpida de este autor nos indicar que no es
as. Merton estaba reaccionando contra una tradicin sociolgica en la que
haba teoras, como la de la accin de Parsons, que se formulaban de
manera tan amplia que no podan falsarse. En la ciencia poltica, la teora
de sistemas de Easton (1965) se halla en la misma tradicin (vase Ecks
tein, 1975, p. 90). ste es un ejemplo del tipo de crticas que a Merton
([1949], 1968, p. 43) le gustaba hacer: Por lo que se ve, la teora de la fi
jacin de los roles no concuerda con orientaciones tericas tan generales
como el m arxism o, el anlisis funcionalista, el conductism o social, la
sociologa integral de Sorokin o la teora de la accin de Parsons. Merton
no critica la teora de la fijacin de los roles, que consideraba de alcance
medio, sino que ataca las amplias orientaciones tericas con las que con
cuerda casi cualquier teora ms especfica u observacin emprica. Merton
est a favor de las teoras de alcance medio, pero creemos que estara de
acuerdo en que hay que formular teoras de la manera ms general posible,
siempre que sigan siendo falsables y concretas. Para retomar un concepto
que hemos mencionado anteriormente, enunciar teoras de este modo es
maximizar el control. Si la teora puede comprobarse y es evidente que el
peligro de las ms generales es que quiz estn expresadas de manera que
no se pueda , cuanto ms general sea, mejor. O sea, a mayor amplitud,
ms control.
4.
Precisar qu va
a observarse
Hasta ahora hemos sealado cules son para nosotros las normas de la infe
rencia cientfica, segn se aplican tanto a la investigacin cualitativa como
a la cuantitativa (captulo 1), hemos definido la inferencia descriptiva (ca
ptulo 2) y aclarado lo que entendemos por causalidad e inferencia causal
(captulo 3). A continuacin, vamos a plantear problemas especficos del
diseo de investigaciones. A partir de ahora, para ilustrar nuestros argu
mentos utilizaremos muchos ejemplos tomados de la bibliografa existente
o elaborados de forma hipottica. El presente captulo se ocupa de cmo te
nemos que seleccionar los casos u observaciones para nuestro anlisis. Es
tas decisiones tienen gran importancia, ya que una mala seleccin de casos
puede impedir que, en estadios posteriores, la ms imaginativa de las ini
ciativas logre extraer inferencias causales vlidas. En el captulo 5 seala
mos algunas de las principales causas de sesgo e ineficiencia que habra
que evitar o, al menos, entender para poder aquilatar nuestras estimaciones.
Posteriormente, en el captulo 6, proponemos algunas ideas para incremen
tar las observaciones disponibles, las cuales suelen encontrarse ya en los
datos que hemos recogido. A continuacin, retomamos un asunto que se in
trodujo en el captulo 1: la necesidad de extraer la mayor cantidad posible
de consecuencias observables de nuestras teoras y, en la medida de lo posi
ble, de comprobar cuantas ms mejor.
En el apartado 3.2 del captulo 3 analizamos la independencia condi
cional: supuesto que seala que se eligen las observaciones y se asignan
los valores de las variables explicativas al margen de los de las dependien
1.
2.
1.1
1.2
Multicolinealidad
Supongamos que, centrndonos en los efectos de ciertas causas preseleccionadas en lugar de en las de los efectos observados, conseguimos resol
ver el problema de las pocas observaciones aadiendo otras procedentes de
diferentes niveles de anlisis o mediante algn otro cambio en el diseo
de la investigacin. Seguir siendo necesario ocuparse del otro problema
que conduce a la imprecisin de los diseos de investigacin: la multicoli
nealidad. Hemos tomado este trmino de la investigacin estadstica, es
pecialmente del anlisis de regresin, pero vamos a utilizarlo de forma mu
cho ms general. El uso que hacemos de l se refiere particularmente a
cualquier situacin en la que podamos predecir perfectamente una variable
explicativa en funcin de una o ms de las restantes. No partimos de nin
gn supuesto de linealidad, como s se hace en el significado habitual del
trmino estadstico.
i
;
(4.1)
'
j
j
F1
i
3
!
(4.2)
35 = 3/3j + 502
El problema es que esta ecuacin no tiene una nica solucin. Por ejempo, los valores
= 10, /32 = 1) la satisfacen, pero tambin Lo hacen
(jSj = 5, /32 = 4) y ( p 1 = -10, 0 2 = 13). Esto resulta bastante problemtico,
ya que los diferentes valores de los parmetros pueden sealar consecuencas esenciales muy diferentes acerca de los efectos causales de estas dos
variables; en el ltimo caso, cambia incluso un signo. En realidad, tanto
estas como un nmero in fin ito de soluciones satisfacen igualmente la
ecuacin. De este modo, no hay nada en el problema que nos ayude a distinguir entre las soluciones, porque todas ellas concuerdan con nuestra
nica observacin.
:-j
*j
a
j
!j
s
i
Supongamos, por ejemplo, que en el estudio sobre cooperacin armamentstica antes mencionado dos de las hiptesis sean: (1) es ms probable que
progrese la colaboracin entre los pases cuando sus tamaos son diferentes
que cuando son similares y (2) su xito es ms probable cuando los pases no
son vecinos que cuando s lo son. Las variables explicativas que estn detrs
de estas hiptesis se centran en el impacto negativo que tiene la rivalidad so
bre la colaboracin; ambas son bastante razonables y puede que incluso las
respalden entrevistas en profundidad o la bibliografa sobre poltica indus
trial. Sin embargo, supongamos que slo logramos identificar un pequeo
conjunto de datos en el que la unidad de anlisis sea un par de pases. Supon
gamos, adems, que nicamente recogemos dos tipos de observaciones:
(1) pases vecinos de tamao diferente y (2) pases vecinos de tamao simi
lar. Si sucediera que (por diseo o por azar) todas nuestras observaciones
pertenecieran a dichas categoras, sera imposible utilizar los datos para en
contrar prueba alguna que constatara o negara cualquiera de las hiptesis. La
razn es que las dos variables explicativas se correlacionan perfectamente:
toda observacin en la que los posibles asociados tengan un tamao similar
preocupar a los vecinos, y al revs. El tamao y la proximidad geogrfica
son variables conceptualmente muy diferentes, pero, al menos en este con
junto de datos, no se distinguen la una de la otra. En este punto, lo mejor que
podra hacerse es recoger ms observaciones en las que estados de tamao
similar fueran vecinos. Si esto fuera imposible, la nica solucin sera buscar
consecuencias observables en algn otro nivel de anlisis.
Aunque se solucione el problema de la imprecisin del diseo de inves
tigacin, puede que nuestras inferencias causales sigan siendo muy incier
tas, por cuestiones como la de un nmero insuficiente de observaciones o
la colinealidad entre las variables causales. Para tener ms confianza en las
estimaciones siempre habr que intentar maximizar el control sobre nuestro
problema. En consecuencia, siempre tendremos que observar tantas conse
cuencias de nuestra teora como sea posible. Es evidente que, en la prctica,
el tiempo y los recursos que podemos dedicar a la recogida de datos siem
pre estn condicionados, pero la necesidad de tener ms observaciones que
inferencias debe alertamos frente a situaciones en las que haya que dejar de
recabar informacin detallada sobre un caso determinado para comenzar a re
cogerla sobre otros parecidos. La preocupacin por la imprecisin tambin
tiene que influir en cmo definimos nuestra unidad de anlisis: tendremos
problemas al hacer inferencias causales vlidas si en nuestro estudio slo
disponemos de una unidad de anlisis en la que los acontecimientos son
prcticamente nicos, ya que resultar muy difcil encontrar muchos ejem
plos. Aunque lo que nos interese sea el comunismo, la Revolucin francesa
o las causas de la democracia, tambin compensar dividir el problema en
unidades manejables y ms numerosas.
Tambin recomendamos que se maximice el control limitando el nme
ro de variables explicativas con las que se quiere hacer inferencias causales.
2.
134
EW -X^+XA
(4.3)
sino que eligen dentro de una poblacin adecuada como los estudiantes
de segundo curso de una facultad , pero aqu nos centramos en una situa
cin ideal. Analizamos la seleccin, posponiendo al final del captulo 5 el
estudio de la adjudicacin de valores de las variables explicativas.
En la investigacin cualitativa, y de hecho en gran parte de la cuantitati
va, la seleccin aleatoria puede no ser factible, porque el universo de casos
no est claramente especificado. Por ejemplo, si quisiramos elaborar una
muestra aleatoria de las lites que tienen que ver con la poltica exterior de
los Estados Unidos, no las encontraramos en una lista comparable a la de las
3.
Sesgo de seleccin
3.1
Grfico 4.1
Sesgo de seleccin
estn sesgadas, pero de una forma previsible que podemos compensar. Los
siguientes ejemplos ilustran esta situacin.
Dado que con frecuencia nos veremos obligados a elegir observaciones
que se correlacionan con la variable dependiente y que, por tanto, contie
nen sesgo de seleccin, merece la pena comprobar si, de todos modos, po
dremos sacarles informacin valiosa. El grfico 4.1, que presenta un simple
modelo de sesgo de seleccin, demuestra que s es posible. Cada punto re
presenta un observacin (una persona, por ejemplo); el eje horizontal es la
variable explicativa (como puede ser el nmero de cursos de contabilidad
que se reciben en una escuela de negocios), y el vertical, la dependiente
(por ejemplo, el salario inicial en el primer trabajo con dedicacin exclusi
va, cifrado en unidades de 10.000 dlares estadounidenses). La lnea de re
gresin que muestra la relacin que hay entre estas dos variables es la con
tinua que cruza el diagrama de puntos. Cada curso de contabilidad tiene un
valor medio de 10.000 dlares en concepto de salario inicial. El diagrama
de puntos que rodea esta lnea continua de regresin indica que, como es
habitual, sta no se ajusta perfectamente a la situacin de todos los estu
diantes. En grficos como ste la desviacin vertical que hay entre los pun
tos y la lnea representa los errores de prediccin (dados unos determinados
valores para las variables explicativas) que, por tanto, se minimizan a la
hora de adecuar dicha lnea a los puntos.
Ahora supongamos que un alumno que acaba de matricularse en una es
cuela de negocios quiera estudiar cmo va a aumentar su renta cuando ter
3.1.1
que nos proponemos estudiar aquellas en cuyas reuniones consta que parti
cip el presidente. El problema de este diseo de investigacin es que el
criterio de seleccin (la disponibilidad de informacin) probablemente se
correlacione con unos niveles relativamente bajos de participacin presi
dencial (la variable dependiente), ya que es probable que el presidente haya
tenido una mayor presencia en las reuniones ms secretas a las que no se
podr acceder que en aquellas cuyas deliberaciones se hayan hecho p
blicas. Por lo tanto, en el conjunto de las observaciones que se refieren a la
informacin disponible, habr una excesiva representacin de los aconteci
mientos en los que se haya registrado un participacin presidencial menor,
lo cual sesgar las inferencias que hagamos acerca de los factores determi
nantes de dicha actividad.
El razonamiento utilizado en nuestro ejemplo de la escuela de negocios
puede ayudamos a comprender las consecuencias que tendr un inevitable
sesgo de seleccin en la investigacin cualitativa. Supongamos que en el
estudio anterior nos interesara saber si los presidentes se implican ms
cuando los acontecim ientos conllevan una amenaza de utilizacin de la
fuerza que cuando sta no se plantea. Supongamos tambin que, segn las
pruebas disponibles, quiz basadas en dos docenas de observaciones, s
existe esta relacin entre los hechos pero su magnitud es sorprendentemen
te baja. Para calibrar el grado de sesgo de seleccin de este estudio, en pri
mer lugar haramos una lista de situaciones relativas a la poltica exterior en
las que el presidente hubiera actuado o hecho declaraciones pblicas, inde
pendientemente de que se disponga de alguna informacin sobre los proce
sos de toma de decisiones. Esta lista evitara una de las causas de sesgo de
seleccin que hemos identificado: el mayor secretismo en las decisiones
que conllevan una amenaza de utilizacin de la fuerza. Esta nueva lista no
incluira todos los problemas en los que se implic el presidente, ya que
no registrara las operaciones encubiertas ni aquellas en las que no se tom
ninguna medida, pero s sera una lista ms larga que la primera porque en
sta necesitbamos inform acin sobre la toma de decisiones. Podramos
despus comparar ambas listas para determinar si (tal como sospechba
mos) exista un sesgo que favoreca a aquellos casos sobre los que haba in
formacin relativa a la toma de decisiones e iba en contra de aquellos en
los que se utilizaba la fuerza o se amenazaba con utilizarla. Si fuera as, se
ra razonable inferir que, probablemente, la verdadera relacin entre los he
chos era an ms intensa de lo que pareca en nuestro primer anlisis.
El problema del sesgo de seleccin suele aparecer en la poltica compa
rada cuando los investigadores tienen que viajar a determinados lugares
para abordar su objeto de estudio. Con frecuencia, su capacidad de elegir
unidades es limitada, ya que algunos gobiernos no dan informacin a los
investigadores extranjeros. Por desgracia, esta negativa puede correlacio
narse con la variable dependiente que interesa al investigador. Alguien que
quiera explicar la liberalizacin de los regmenes autoritarios basndose en
mmm,
143^
las tcticas utilizadas por los grupos de disidentes podra obtener resultados
sesgados, especialmente si slo estudiara los lugares en los que se le ha
permitido la entrada, ya que las razones por las que el rgimen le ha conce
dido este acceso probablemente se correlacionen con la variable dependien
te, que es la liberalizacin. Es evidente que no vamos a recomendar que se
realice trabajo clandestino en lugares inhspitos, pero s aconsejamos que
se tenga en cuenta este problema y que se utilice la imaginacin para bus
car fuentes de datos alternativas cuando no se dispone de las que estn en el
lugar de los hechos. Reconocer estas dificultades tambin podra llevamos
a revisar el diseo de nuestra investigacin, con el fin de enfrentarnos a la
realidad del acceso a las fuentes para fines acadmicos en el mundo. Si no
podemos solucionar el problema de los datos, al menos podremos utilizar
nuestras indagaciones sobre el sesgo de seleccin para saber hacia dnde se
sesgarn nuestros resultados y quiz as podamos corregir parcialmente
ese inevitable sesgo de seleccin que conlleva un estudio de este tipo. Es
decir, que si esta clase de sesgo es inevitable, hay que analizarlo, determi
nar su direccin y, si es posible, su magnitud, y utilizar tambin esta infor
macin para modificar nuestras primeras estimaciones en la direccin co
rrecta.
El sesgo de seleccin es un problema tan endmico que puede que sea
til abordar algunos ejemplos ms de l. Pensemos en un trabajo reciente
de Michael Porter (1990), autor que quera conocer el origen de lo que de
nominaba ventaja competitiva en los actuales sectores industriales y em
presas. Para estudiar este tema, dise un proyecto a gran escala con diez
equipos nacionales. Al elegir los diez pases que iba a analizar opt, segn
sus palabras, por los que ya haban demostrado su capacidad de competir
en diversos sectores o, como era el caso de Corea y Singapur, los que pre
sentaban sntomas de mejora en este sentido (Porter, 1990, p. 22). En su
impaciencia por ahondar en el problema que le interesaba, Porter fue cons
ciente de que seleccionaba en funcin de la variable dependiente, haciendo
que esta variable observada fuera casi constante. En consecuencia, cual
quier intento que haga Porter, o todo aquel que utilice sus datos en este ni
vel de anlisis, para explicar el grado de xito de cada uno de los diez pa
ses producir efectos causales considerablemente sesgados.
Sin embargo, lo que hizo Porter intentar determinar las circunstancias
y polticas que se relacionan con el xito competitivo tiene que ver, en
cierto sentido, con el mtodo del compromiso de Mili. ste no es un mal
sistema para abordar el problema, ya que le permiti a Porter desarrollar al
guna hiptesis sobre las causas de la ventaja competitiva, por medio de la
observacin de las caractersticas que compartan las naciones selecciona
das; sin embargo, su diseo de investigacin le impidi evaluar efectos cau
sales concretos.
Ms grave resulta el error de lgica del mtodo: sin un grupo de control
de naciones (o sea, con la variable explicativa adscrita a otros valores) el
3.1.2
3.2
cifra para excluir todas aquellas observaciones en las que la variable expli
cativa es igual a uno, la lgica de esta cantidad no se ver afectada y no
cambiar la lnea que atraviesa los puntos. En cierto modo, al tener ahora
menos observaciones y menos inform acin disponible para el problema
inferencial, ser un poco menos segura, pero, como promedio, no habr
sesgo9.
En consecuencia, se puede evitar el sesgo seleccionando casos en fun
cin de la variable causal clave, pero tambin podemos lograr el mismo ob
jetivo utilizando las categoras de una variable de control (siempre que, en
trminos causales, sta preceda a la variable causal clave, como ha de ser
siempre en las variables de control). Los experimentos casi siempre selec
cionan en funcin de las variables explicativas. Las unidades se crean cuan
do se manipulan dichas variables (administrando un frmaco, por ejemplo)
y despus se observa lo que le ocurre a la variable dependiente (si mejora la
salud del paciente). En este caso, sera difcil seleccionar a partir de esta l
tima variable, ya que su valor no se conoce hasta despus del experimento.
Sin embargo, la mayora de los experimentos no son en absoluto perfectos,
y podemos cometer el error de seleccionar en funcin de la variable depen
diente, aplicando tratamientos a los pacientes que, sin que nos demos cuen
ta, se basan en la respuesta esperada.
Para dar otro ejemplo, pensemos que, si estamos investigando las conse
cuencias de la discriminacin racial en las notas escolares de los nios ne
gros, ser bastante razonable seleccionar varias escuelas en las que haya
poca discriminacin y otras en las que haya mucha. Aunque nuestro criterio
de seleccin se correlacione con la variable dependiente (los negros obtie
nen peores notas en las escuelas en las que hay segregacin), esto no ocu
rrir despus de que tengamos en cuenta el efecto de las variables explicati
vas, ya que los valores de una de ellas determinan el criterio de seleccin.
Tambin podemos evitar el sesgo haciendo la seleccin a partir de una
variable irrelevante para nuestro estudio (que no influye en nuestra variable
dependiente). Por ejemplo, para estudiar el efecto de la discriminacin en
las notas, supongamos que alguien elige todas las escuelas cuyo nombre
comienza por la letra A. Evidentemente, aunque este criterio no es reco
mendable, si la variable irrelevante no representa a alguna otra que se co
rrelaciona con la dependiente, no producir sesgo.
Cuando resulta muy til seleccionar en funcin de una variable irrele
vante hay que realizar un anlisis secundario de los datos que existen. Por
ejemplo, supongamos que nos interesan los factores que hacen que triunfe
un golpe de Estado. Nuestra hiptesis principal es que estas intentonas sue
len tener ms xito con un jefe militar que con uno civil. Supongamos que
encontramos un estudio de golpes de Estado que hubiera seleccionado los
casos en funcin de en qu medida exista en cada pas una jerarqua buro
crtica antes del golpe. Podramos utilizar tales datos aunque este factor
fuera irrelevante para nuestra investigacin. Sin embargo, para ir sobre se
guro, no sera difcil hacer que esta variable fuera un control en nuestro
anlisis de las consecuencias que genera tener lderes militares o civiles. Se
incluira este control si estudiramos con qu frecuencia triunfan los golpes
de Estado dirigidos por uno u otro tipo de lderes, en pases en los que hay
o no una jerarqua burocrtica. La presencia de este control nos ayudara a
evitar el sesgo de seleccin, y su efecto causal proporcionara informacin
quiz importante sobre el proceso que se haba utilizado realmente para se
leccionar las observaciones.
3.3
4.
4.1
4.2
4.3
155-
4.4
157
4.5
5.
Comntanos finales
5.
Entender qu debe
evitarse
161
tiempo. La fa lta de sesgo tiene que ver con el hecho de centrar un intervalo
cerca de la estimacin correcta, mientras que la eficiencia se relaciona con
el estrechamiento de un intervalo que se ha centrado correctamente.
Estas definiciones de falta de sesgo y de eficiencia son siempre aplica
bles, independientemente de que se quieran hacer inferencias descriptivas
como en el ejemplo de la edad o causales. Si, por ejemplo, queremos
hacer una estimacin del efecto que tienen los estudios en la renta (los in
gresos monetarios que se perciben por cada ao de estudio), tendremos un
punto de estimacin del efecto que estar flanqueado por un intervalo que
refleja nuestra incertidumbre respecto a la cantidad exacta. Necesitaremos
un intervalo que sea lo ms estrecho posible (para una mayor eficiencia) y
cuyo centro est cerca de la estimacin correcta (para evitar sesgos); tam
bin ser necesario que el clculo aproximado del ancho del intervalo re
presente sinceramente nuestra incertidumbre.
En este captulo nos centramos en las causas del sesgo y de la ineficiencia, desde ese primer momento del estudio en el que pretendemos mejorar
la calidad de la informacin hasta cuando llegamos a extraer inferencias
causales. En el apartado 1 analizamos los errores de medida que pueden
sesgar nuestros resultados y hacerlos tambin menos eficientes. Posterior
mente, en el apartado 2, pasamos a considerar el sesgo que puede aparecer
en nuestras inferencias causales cuando hemos eliminado del anlisis varia
bles explicativas que se deberan haber incluido. En el apartado 3 aborda
mos el problema contrario: controlar las variables irrelevantes que reducen
la eficiencia de nuestro anlisis. A continuacin, estudiaremos el problema
que se plantea cuando nuestra variable dependiente afecta a las explica
tivas. Este problem a se conoce con el nombre de endogeneidad y se
aborda en l apartado 4. Para terminar, en los apartados 5 y 6 analizaremos,
respectivamente, la adjudicacin aleatoria de valores en las variables expli
cativas, as como diversos mtodos de control no experimental.
1.
Error de medida
mediana edad y vejez. Para ciertos fines, esta clasificacin puede ser sufi
ciente, pero, como presentacin terica de la edad de una persona, el proce
dimiento resulta innecesariamente impreciso. El error de agrupacin que
se producir ser considerable y hay que evitarlo. El hecho de librarse de
este tipo de error nos remite al principio de que no hay que descartar datos
sin que haya razn para ello.
Sin embargo, podemos cometer el error contrario: asignar valores conti
nuos y numricos de intervalo a variables que por naturaleza son discon
tinuas. En general, la medicin mediante intervalos no es mejor que la ordi
nal o nominal. Por ejemplo, en una encuesta se puede preguntar sobre la
filiacin religiosa y sobre el grado de compromiso en este sentido. La in
tensidad del segundo indicador podra medirse si las preguntas estn bien
planteadas mediante una variable ordinal, incluso utilizando intervalos,
dependiendo de cul sea la naturaleza del instrumento de medicin. Sin
embargo, no tendra mucho sentido hacer una lista numrica con las reli
giones a las que pertenece cada individuo. En este caso, probablemente no
exista una variable ordinal o continua, y este procedimiento generara un
error de medida.
Elegir entre categoras nominales, por un lado, u ordinales o de interva
lo, por otro, puede implicar un intercambio entre riqueza descriptiva y faci
lidad a la hora de comparar. Pensemos, por ejemplo, en las normas de voto
de las organizaciones internacionales. El ordenamiento institucional que las
dicta es importante porque refleja una concepcin de la soberana de los es
tados y porque tiene consecuencias sobre la clase de resoluciones que pue
de aprobarse, los recursos que se destinan a la organizacin y las expectati
vas de que se cumplan las resoluciones.
Un conjunto de categoras nom inales podra distinguir entre aquellos
sistemas en los que un nico miembro tiene la facultad de vetar cualquier
resolucin (como ocurra en el Consejo de la Sociedad de Naciones, segn
el artculo 15 de su Acta de Constitucin), aquellos en los que slo pueden
hacerlo ciertos miembros (como en el Consejo de Seguridad de las Nacio
nes Unidas), en los que se decide en funcin de algn tipo de mayora cua
lificada (com o en las decisiones que afectan al m ercado interno de la
Unin Europea) y en los que es una mayora simple la que toma las decisio
nes (como ocurre en la mayora de las votaciones de la Asamblea General
de las Naciones Unidas). Cada sistema puede generar sus propias dinmi
cas de negociacin, y, si lo que pretendemos es estudiar cmo funciona uno
de ellos en particular (aquel en el que un miembro puede ejercer el veto), es
esencial que definamos nuestras categoras para no incluir en el anlisis
otros tipos de sistemas. Las categoras nominales seran apropiadas para
este propsito.
Sin embargo, tambin podramos ver estas categoras de forma ordinal,
yendo de las ms restrictivas (en las que se requiere unanimidad) a las m e
nos (en las que se precisa mayora simple). Esta categorizacin sera nece
iliif
1.1
1.2
1.2.1
Grfico 5.1
X (desempleo)
1.2.2
medida en y
n
I
E(Y*) = P X
Y = Y* + U
Es decir, que la variable dependiente observada Y es igual a la verdadera
variable dependiente Y*, ms algn error de medida aleatorio, U. Para for
malizar la idea de que U contiene slo un error de medida no sistemtico,
necesitamos que ste desaparezca en la media de reproducciones hipotti
cas, E(U) = 0, y que no se correlacione con la verdadera variable depen
diente, C(U,Y*) = 0, ni con la explicativa, C(U,X) = O 5. Adems, presupo
nemos que el error de medida tiene una varianza V(U;) = t 2 en cada una de
las unidades i. Si r 2 vale cero, Y no contendr ningn error de medida y
ser igual a V"*; cuanto ms grande sea la varianza, ms error contendr
nuestra medida Y.
Cmo afecta el error de medida aleatorio en la variable dependiente a
la estimacin de 3? Para saberlo, utilizamos nuestro estimador habitual
con Y en vez de con Y*:
^Y . XI .I
----^1
JL
E(b) = E
5^vpc^ri^3CTs-3afKnai,'jis6ryssri.i
I W ,)
*J
, +LJ)
xi
i-l
X P
S*f
-P
Este anlisis demuestra que, incluso cuando haya un error de medida
en la variable dependiente, el estimador tpico no estar sesgado (ser
igual a la media de 5), ta l como mostramos que ocurra en la ecuacin
(3.8) cuando una variable dependiente no tena error de medida.
Sin embargo, para completar este anlisis, tenemos que comprobar la
eficiencia de nuestro estimador en presencia de una variable dependiente
que se ha medido con errores. Utilizamos el procedimiento habitual:
(5.1)
V(b) = V
I* ?
a2 + r 2
" i^1*
Hay que sealar que aqu este estimador es menos eficiente que cuan
do se aplica a datos que carecen de error de medida en la variable depen
diente (comprese con la ecuacin [3.9]), por lo que respecta al nivel de
error de medida que aparece en dicha variable t 2.
Grfico 5.2
X (desem pleo)
Si, en principio, un anlisis indica que no hay ningn efecto, el efecto verdadero
ser muy difcil de calibrar, ya que no se sabe la direccin del sesgo; por consi
guiente, el anlisis ser bastante impreciso y as habr que describirlo. Puede
que el autntico efecto sea nulo, negativo o positivo, y que nada en los datos nos
seale cmo es.
2.
Sin em bargo, si un anlisis indica que la variable explicativa con error de m edi
da aleatorio tiene un pequeo efecto positivo, tendrem os que utilizar los resulta
dos de este apartado como justificacin para concluir que el autntico efecto
probablemente sea an m ayor que el que hem os encontrado. Del mismo m odo,
si lo que hallam os es un pequeo efecto negativo, los resultados de este aparta
do podrn utilizarse como prueba de que el efecto verdadero probablem ente in
dique la existencia de una relacin negativa an mayor.
2.
2.1
Supongamos que queremos hacer una estimacin del efecto causal que tie
ne nuestra variable explicativa X sobre la dependiente Y. Si estam os
haciendo un anlisis cuantitativo, este efecto causal de X x sobre Y lo expre
saremos mediante j8 (, que se puede estimar mediante una ecuacin de re
gresin 3 o utilizando otra forma de anlisis que nos d una estimacin b t
de 3r Si estamos realizando investigacin cualitativa tambin intentaremos
obtener esa estim acin del efecto causal; sin embargo, en este caso, el
179
E{Y) = (JX*
j?
3
y el error de medida aleatorio U tiene propiedades similares a las de antes:
su media es cero, E (U) = 0, y no se correlaciona ni con la verdadera variable explicativa, C(U,X*) = 0, ni con la dependiente, C(U,Y) = 0.
Qu ocurre cuando utilizamos el estimador tpico de 3 con una X pagada de errores, en vez de con la X * no observada? Esta situacin es habtual en la investigacin cualitativa si hay un error de medida y no se hace
ningn ajuste especial en los resultados que se obtienen. Para analizar el
efecto de este procedimiento evaluamos el sesgo, que va a ser la principal
consecuencia de este tipo de problema de medida. Por lo tanto, comenzamos por aplicar el estimador tpico de la ecuacin (3.7) a las X e Y observadas en el modelo anterior.
b=
YlX I
------
3
|
i
jj
I
1
|
!
t>
i
(52)
-1
i-\
________
W + u y
xI+Y'+IZU'Y'
(5.3)
Debera quedar claro que b estar sesgada, E(b) * j3. Adems, la media
de los dos trminos que estn entre parntesis en la ltima lnea de la
ecuacin (5.2) ser cero porque presuponemos que U e Y, as como U y
X*, no se correlacionan (o sea, que C(A,K) = E{Uf Y) = 0. Por lo tanto,
esta ecuacin se reduce aproximadamente a 8:
i-i____
n
hay en el denominador, L/* (comprese con la ecuacin [3.7]), que re^1
181
guno de los dos casos especiales en los que el trmino que expresa el sesgo,
F/3-,, es igual a cero. Resulta fcil apreciar que esto formaliza las condicio
nes de falta de sesgo que antes hemos sealado. Es decir, que podemos
omitir una variable de control si:
La variable omitida no tiene un efecto causal sobre la dependiente (o sea, /3, = 0,
independientem ente del tipo de relacin que exista entre la variable incluida y la
excluida, F).
La variable omitida no se correlaciona con la incluida (es decir, F = 0 cualquiera
que sea el valor de /3,).
Cuando sospechemos que hay una variable omitida que puede estar ses
gando los resultados, nuestro anlisis no podr terminar aqu. Si es posible,
hay que controlar esa variable omitida y, aunque no podamos hacerlo por
falta de una buena fuente de datos acerca de ella, nuestro modelo podr
ayudarnos a determinar la direccin del sesgo, lo cual puede ser muy til.
Una sobreestimacin puede reforzar sustancialmente un argumento existen
te y una subestimacin puede debilitarlo.
Supongamos, por ejemplo, que estamos estudiando unos pocos estados
subsaharianos y que nos damos cuenta de que los golpes de Estado son ms
frecuentes en regmenes que practican la represin poltica (aquellos en los
que f i t, el efecto que tiene la represin en la probabilidad de golpe, es positi
vo). Esto significa que la variable explicativa es el grado de represin poltica
y que la dependiente corresponde a la probabilidad de que haya un golpe de
Estado. La unidad de anlisis son los pases africanos del rea subsahariana.
Incluso, podramos incorporar a la muestra otros pases africanos y llegar a la
misma conclusin. Sin embargo, supongamos que no hemos considerado los
efectos que puede tener la situacin econmica en los golpes de Estado. Aun
que quiz no dispongamos de datos sobre este indicador, sera razonable plan
tear la hiptesis de que probablemente el desempleo incrementa la probabili
dad de golpe (/?, > 0 ), y tambin parece plausible que haya una correlacin
positiva entre desempleo y represin poltica (F > 0). Tambin presupone
mos, porque es til en este ejemplo, que las condiciones econmicas son pre
vias a nuestra variable causal clave: el nivel de represin poltica. Si as fuera,
el grado de sesgo de nuestro anlisis podra ser considerable. Como el de
sempleo se correlaciona positivamente con la variable dependiente y con la
explicativa (F/32 > 0 en este caso), excluir ese factor supondra que, sin dar
nos cuenta, estaramos haciendo una estimacin del efecto que tienen la re
presin y el desempleo en la posibilidad de que haya un golpe de Estado, en
vez de hacerla nicamente de la represin (/3, + Ff32 en vez de 3^). Adems,
al ser el impacto conjunto de ambos factores mayor que el de la represin por
s sola, (/3 + F/32 es mayor que /3:), la estimacin del efecto medio de esta l
tima variable (A,) sera demasiado grande. Por lo tanto, el anlisis demuestra
que, al excluir las consecuencias del desempleo, sobreestimamos las que tie
185
cin de votar a los demcratas que se expresa cinco minutos antes de entrar
al colegio electoral y controlando todos los dems factores que se corre
lacionan con ella. Si no disponemos de un modelo con fundamento terico,
no podremos determinar si hay que controlar las posibles variables explica
tivas o hacer caso omiso de las que se correlacionan entre s y, adems, nos
arriesgaremos a incurrir en el sesgo de la variable omitida o a elaborar un
diseo de investigacin trivial.
No es en absoluto sencillo decidir cundo hay que incorporar ms varia
bles explicativas a nuestro anlisis. El nmero de variables adicionales es
siempre ilimitado, pero nuestros recursos no, y, sobre todo, cuantas ms va
riables de este tipo incluyamos, menos control tendremos sobre las estima
ciones de cada uno de los efectos causales. Evitar el sesgo de la variable
omitida justifica la incorporacin de ms variables explicativas. Si se omi
ten variables relevantes, nuestra capacidad de hacer estimaciones correctas
de las inferencias causales se ver limitada.
2.2
E( 0
(5.5)
donde F =
189
cin, la ineficiencia tiene muchos costes, entre los que se puede incluir el
riesgo de que la presencia de demasiadas variables de control irrelevantes
haga que el diseo de investigacin sea impreciso (apartado 1 del captu
lo 4). Sin embargo, om itir variables de control relevantes puede producir
sesgo, y, en principio, quiz el investigador no sepa si una posible variable
es relevante o no.
En este punto, podramos caer en la tentacin de afirmar que la inferen
cia causal es imposible con un nmero escaso de observaciones. Sin embar
go, para nosotros, las lecciones que hay que sacar de todo esto son ms li
m itadas y optim istas. Com prender la dificultad que com porta extraer
inferencias causales vlidas a partir de pocas observaciones tendra que ha
cernos ms cautelosos a la hora de hacer aseveraciones causales. Como in
dicamos en el captulo 2 , las buenas descripciones e inferencias descripti
vas tienen ms valor que las inferencias causales errneas. De hecho, gran
parte de la investigacin cualitativa mejorara si se prestara ms atencin a
las inferencias descriptivas vlidas y menos mpetu a la extraccin de afir
maciones causales a partir de datos inadecuados y sin calibrar adecuada
mente la incertidum bre. No obstante, es posible avanzar un poco en la
comprensin de los problemas causales si los problemas tericos que nos
preocupan se plantean con la suficiente claridad y se vinculan a las conse
cuencias observables adecuadas. Una investigacin reciente del rea de las
relaciones internacionales puede ayudamos a incidir en este punto.
Lo que llev a Helen M ilner a escribir Resisting Protectionism (1988)
fue una perplejidad: por qu la poltica comercial de los Estados Unidos
era ms proteccionista en los aos veinte que en los setenta, a pesar de los
muchos parecidos que haba entre ambos perodos? Su hiptesis era que la
interdependencia internacional haba aumentado entre una y otra dcada y
que esto ayudaba a explicar la diferencia de comportamiento de los Estados
Unidos. Sin embargo, en este nivel de anlisis agregado, slo dispona de
las dos observaciones que le haban sorprendido, y stas no podan ayudar
le a distinguir entre su hiptesis y otras muchas explicaciones posibles que
se podan dar a la variacin observada. Por lo tanto, el grado de incertidum
bre de su teora habra sido mucho mayor si se hubiera detenido aqu. En
consecuencia, tuvo que buscar en otro sitio ms consecuencias observables
de su teora.
Lo que M ilner hizo fue describir el proceso que pensaba que produca su
efecto causal. Plante la hiptesis de que la interdependencia econmica
entre las democracias capitalistas afectaba a las preferencias nacionales
porque influa en las opciones de los sectores industriales y empresas, los
cuales, a base de presionar, conseguan que se llevaran a cabo las polticas
que queran. En consecuencia, M ilner estudi diversos sectores industriales
estadounidenses de los aos veinte y setenta, as como otros franceses en este
segundo perodo, y se dio cuenta de que aquellos que ms invertan a escala
multinacional y dependan ms de las exportaciones eran los menos protec
3.
Por supuesto, puede darse el caso de que el investigador siga sin estar
seguro de qu variables de control previas tienen un impacto causal en las
incluidas o cules se correlacionan con stas. En tal situacin, habr inves
tigadores que intenten incorporar todas las variables de control cuya corre
lacin con las variables explicativas utilizadas sea concebible, as como to
das aquellas que, desde un punto de vista terico, se pueda esperar que
afecten a la variable dependiente. Es probable que el resultado de esto sea
una larga lista de variables y que muchas de ellas sean irrelevantes. Este en
foque, que a primera vista parece una manera cuidadosa y prudente de evi
tar el sesgo de la variable omitida, de hecho nos hara correr el riesgo de
elaborar un diseo de investigacin cuyos resultados no podran ser ms
que imprecisos. Cuando se utiliza un nmero relativamente escaso de ob
servaciones, la imprecisin, tal como se analiz en el apartado 1 del captu
lo 4, es un problema bastante grave para el que este cuidadoso diseo se
ra en realidad perjudicial. En el presente apartado analizamos los costes
que tiene incluir variables explicativas irrelevantes y mostramos reservas
fundamentales ante la pretensin de incluirlo todo. Incorporar variables
irrelevantes puede ser muy daino. Nuestra idea principal es que aunque la
variable de control no tenga ningn efecto causal en la dependiente, cuanta
mayor correlacin haya entre la variable explicativa y la irrelevante de
control, menos eficiente ser la estimacin del principal efecto causal.
Vamos a ilustrar esta afirmacin centrndonos en dos diferentes proce
dimientos (o estimadores), con el fin de calcular el efecto causal de una
variable explicativa cuya inclusin s es apropiada. La primera estimacin
de este efecto procede de un anlisis realizado sin variables de control irre
levantes; en el segundo hay una que s lo es. El anlisis formal que figura
en el recuadro posterior llega a las siguientes conclusiones respecto al valor
relativo de estos dos procedimientos y al del mtodo antes mencionado. En
primer lugar, ninguno de los estimadores est sesgado. Esto quiere decir
que, aunque se controle una variable explicativa irrelevante, el estimador
habitual seguir dndonos una respuesta media correcta. En segundo lugar,
si la variable de control irrelevante no se correlaciona con la explicativa
principal, la estimacin del efecto causal de la segunda no slo estar ses
gado, sino que resultar tan ineficiente como si no se hubiera incluido la
variable irrelevante. En realidad, si estas variables no estn correlaciona
das, se obtendr precisamente la misma inferencia. Sin embargo, si la va
riable de control irrelevante est muy correlacionada con la explicativa
principal, se registrar una ineficiencia considerable.
Por lo tanto, los costes de controlar variables irrelevantes son altos. Si lo
hacemos, es ms posible que nuestros estudios hagan estimaciones alejadas
de los autnticos efectos causales. Cuando reproduzcamos un estudio, en
un conjunto de datos que presenta una alta correlacin entre la variable ex
plicativa clave y una de control irrelevante incluida en el anlisis, probable
mente obtengamos resultados diferentes que nos lleven a otras inferencias
(5.6) |
sin saber que, en realidad, /32 = 0. Qu consecuencias tiene una estimacin simultnea de ambos parmetros para nuestra estimacin de (3,?
Si definimos 6, como el estimador correcto que se basa nicamente
en la regresin entre Y X, yjSj como el primer coeficiente de X. en una
regresin entre Y, por una parte, y X, y X2, por otra, es fcil mostrar que
no podemos distinguir entre estos dos estimadores utilizando la falta de
sesgo (una media correcta en muchos experimentos hipotticos), ya que
ambos carecen de l:
( > ,) - ( & ) - ,
|
|
I
|
|
|
|
(5.7) |
5.8) j
5X
M -
V(fr) = ------------;-----
(l-'iEX
( 5 -9)
V(fct)
(1 - r y
donde la correlacin entre X, y X2 es rn (vase Goldberger, 1991, p. 245).
En la ltima lnea de la ecuacin podemos ver la relacin precisa que
existe entre las varianzas de los dos estimadores. Si la correlacin entre
las dos variables explicativas es nula, no tendr importancia si se incluye la
variable irrelevante o no, ya que ambos estimadores tendrn la misma va
rianza. Sin embargo, cuanto ms se correlacionen dos variables, mayor
ser la varianza y, por tanto, menor la eficiencia de jSj.
4.
Endogeneidad
4.1
199
4.2
4.3
201
tesis con datos diferentes a los que las produjeron), los investigadores se
dieron cuenta de que en aquellas sociedades en las que muchos grupos de
mentalidad estrecha y arraigada se oponen a otros minoritarios, tnicos o
religiosos, es ms probable que se opte por la representacin proporcional,
ya que ste es el nico sistema electoral que ambas facciones pueden acep
tar. Una mirada ms atenta a la situacin de la poltica alemana antes de
que se introdujera este tipo de representacin confirm esta idea, ya que se
localizaron muchas facciones pequeas. La representacin proporcional no
las haba creado, aunque puede que s facilitara la expresin de sus ideas en
el parlamento. Tampoco las facciones eran la nica causa de la representa
cin proporcional; sin embargo, s pareca que tanto la adopcin del siste
ma proporcional como la gran divisin del parlamento eran consecuencia
de la fragmentacin social (vase Lakeman y Lambert, 1955, p. 155, para
una de las primeras explicaciones de este argumento).
De este modo, hemos transformado un problema de endogeneidad en un
sesgo de la variable omitida. Esto quiere decir que la fragmentacin social
previa es una variable omitida que lleva a la representacin proporcional;
desde el punto de vista causal es anterior a sta y, en parte, condujo a la ca
da de Weimar. Al transformar el problema de esta manera, los acadmicos
consiguieron abordar mejor el problema, ya que podan medir de manera
explcita esta variable omitida y controlarla en estudios posteriores. En este
ejemplo, una vez que se incluy y control dicha variable omitida, los in
vestigadores se dieron cuenta de que exista una posibilidad razonable de
que la aparente relacin causal que haba entre la representacin proporcio
nal y la cada de la Repblica de Weimar fuera casi completamente falsa.
La relacin que existe entre los sistemas electorales y la democracia si
gue suscitando polmica, aunque el estudio de este tema ha avanzado mu
cho desde los primeros trabajos que se hicieron. Los investigadores han
ampliado esta rea, dejando a un lado los intensos estudios de caso, que
apenas se preocupaban de la lgica de las explicaciones, para hacer trabajos
que se basan en muchas observaciones de determinadas consecuencias y
as resolver gradualm ente algunos aspectos relacionados con la m edida
y, finalmente, con la inferencia. Con este cambio, han logrado separar de
modo ms sistemtico los efectos exgenos de los endgenos.
4.4
4.5
5.
|
|
5
|
(5.10)
sta tambin puede expresarse como Y = Xf} + e, en la que e = Y - E(Y) se
denomina el error o trmino perturbador. Supongamos, adems, que
hay endogeneidad, o sea, que X tambin depende de /:
E (X) = Yy
(5.11)
il
(5.12)
w
Para evaluar este estimador utilizamos la propiedad de falta de sesgo y,
por lo tanto, calculamos su valor esperado:
E(b) = E
(5.13)
1-1
!
'?
-*,>
-1_________
-0
L C M
+ -
Hl______
t m
= /3 + sesgo
*1
Normalmente, la covarianza de X y
el trmino perturbador e., C{X .e^ valen cero, de manera que el trmino
de sesgo tambin tendr este valor. En consecuencia, el valor esperado
de b es 3 y, por tanto, carece de sesgo. Suele ocurrir que, despus de que
se tiene en cuenta X para predecir Y, la parte que queda (e) no se corre
laciona con X. Sin embargo, en el presente ejemplo, despus de que se
contempla el efecto de X, sigue quedando alguna variacin por la retroalim entacin que procede del efecto causal de Y sobre X. De este modo, la
endogeneidad im plica que, en general, el segundo trmino de la ltima
lnea de la ecuacin (5.13) no valdr cero y que la estimacin estar ses
gada.
La direccin del sesgo depende de la covarianza, ya que la varianza de
X siempre es positiva. Sin embargo, en los pocos casos en los que sta sea
extremadamente grande, arrollar a la covarianza y har que el trmino de
sesgo resulte insignificante. En el texto se ofrece un ejemplo con una
buena interpretacin de este trmino de sesgo.
6.
211
Sin embargo, siempre hay otras variables omitidas que podran causar
sesgo porque se correlacionan tanto con la variable explicativa clave como
con la dependiente (y porque, desde el punto de vista causal, son anteriores
a aqulla). El problema est en que intentar equiparar dos unidades, si se
hace de forma incorrecta o incompleta, puede aumentar la probabilidad de
que haya otra variable omitida significativa que se correlacione tanto con la
variable explicativa como con la dependiente.
Por qu es as? Hay que sealar que, para equiparar pases, el investiga
dor tiene que encontrar uno que reciba bastante ayuda y otro que reciba
poca. Supongamos que elige dos pases que son similares respecto a las
otras dos variables, es decir, que tienen un alto nivel educativo y pocas
amenazas internas. El resultado sera el siguiente:
P a s A: mucha ayuda, mucha educacin, pacfico.
P a s B: poca ayuda, mucha educacin, pacifico.
7.
Observaciones finales
Esperamos que los consejos que hemos dado en este captulo y en el ante
rior sean tiles para los investigadores cualitativos, aunque no sean recetas
que siempre puedan aplicarse fcilmente. En la realidad, los problemas no
suelen venir solos. Por ejemplo, supongamos que un investigador detecta
un sesgo de seleccin menor, un cierto error de medida en la variable de
pendiente y una importante variable de control que slo puede medirse oca
sionalmente. Si sigue los consejos que se han dado anteriormente para cada
caso, tendr cierta idea sobre lo que hay que hacer. Sin embargo, en este y
en otros casos complejos, los que realizan estudios cualitativos tienen que
6.
Aumentar el nmero
de observaciones
1.
1.1
Explicaciones alternativas
3.
D eterm in ism o
La ltima razn, y quiz la ms decisiva, para considerar inadecuados los estudios que
slo se basan en una consecuencia observable tiene que ver con el grado de determ inis
mo que se da en el mundo. Si ste fuera determinista y la observacin produjera una
medida que no se correspondiera con la teora, podram os afirm ar con certeza que dicha
teora es falsa. Sin embargo, en toda teora social de inters siem pre existe la posibilidad
de que se omitan variables desconocidas, que podran conducir a un resultado im predecible aunque el modelo fundamental de dicha teora fuera correcto. Si slo existe una
consecuencia observada de la teora causal, carecerem os de fundam entos para determ i
nar si la observacin confirm a o desm iente una teora o si proviene de algn factor des
conocido. Aunque tuviram os dos observaciones en un experimento perfecto, varira
mos slo un factor explicativo y produjram os nicam ente una observacin para
diferenciar dos observaciones que, de otro modo, seran idnticas respecto a la variable
dependiente, tendram os que considerar la posibilidad de que, en nuestro m undo probabilstico, existiera algn factor no sistem tico, fruto del azar, que cam biara el efecto
causal que se est observando. No importa que el mundo sea inherentem ente probabilstico (en el sentido del apartado 6 del captulo 2) o que, simplemente, no podam os con
trolar todas las posibles variables om itidas. En cualquier caso, nuestras predicciones
sobre las relaciones sociales slo podrn ser precisas desde un punto de vista probabilstico. En realidad, Eckstein admite que los factores fortuitos influyen en todas las inves
tigaciones:
La posibilidad de que un resultado se deba al azar no puede descartarse en ningn
tipo de estudio; incluso en las grandes investigaciones comparadas es m s o m enos pro
bable [...]. Por lo tanto, la autntica diferencia entre los estudios de la observacin cru
cial y los comparados es que en estos ltimos, pero no en los prim eros, se pueden respe
tar ciertas convenciones para adjudicar un determinado valor a la posibilidad de que
haya resultados fortuitos (por ejemplo, significativo en el nivel de 0,05).
Eckstein tiene razn cuando afirm a que slo es habitual adm itir que existe una de
term inada posibilidad de que se produzcan resultados fortuitos en los estudios que uti
lizan un n grande. Sin em bargo, adm itirlo tiene la m ism a im portancia en todos los es
tudios, tan to en los que b a rajan m uchas o b se rv ac io n es com o en los que u tilizan
p o c a s2.
1.2
Razonamiento analgico
Los peligros de los diseos que no utilizan ms que una observacin que
dan patentes cuando se hace referencia a la forma de equiparacin habitual
que usan los que elaboran polticas y algunos analistas de esa rea cuando
intentan comprender acontecimientos polticos, es decir, estamos hablando
del razonamiento analgico (vase Khong, 1992). El uso adecuado de la
analoga es fundamentalmente el mismo que el de la equiparacin que man
tiene otras variables constantes. Nuestra hiptesis causal es que si dos uni
dades son las mismas en todos los aspectos relevantes (esto quiere decir
que hemos logrado equipararlas o que, dicho de otro modo, hemos encon
trado una buena analoga), unos valores parecidos en las variables explicati
vas relevantes harn que tam bin se asem ejen los de la dependiente. Si
nuestra equiparacin fuera perfecta y no hubiera error aleatorio en el mun
do, sabramos que la situacin de crisis a la que se enfrenta en la actualidad
el pas B, que es equiparable a la del pas A el ao pasado, tendra las mis
mas consecuencias que las que se observaron en este ltimo. Si lo expresa
mos de este modo se ver que el razonamiento analgico puede ser apro
piado.
2.
hagan. Esto tendra que quedar claro con la ecuacin (6.1), ya que se puede solucionar
la incertidum bre del efecto causal V(bt) considerndola una funcin de las otras cuatro
cantidades (si conocemos n y el resto de las cantidades, excepto en lo relativo a la incer
tidumbre de la estimacin causal). Esto significa que m ediante este m odelo formal po
demos calcular tanto el grado de incertidumbre de una inferencia causal, utilizando in
formacin sobre varias observaciones, como la variabilidad fundamental, la varianza de
la variable explicativa causal y la relacin que existe entre sta y las de control.
2.
La presencia de V(b{) en el denom inador de la ecuacin (6.1) dem uestra que es obvio
que cuanta ms incertidumbre estemos dispuestos a tolerar, menos observaciones habr que
recoger. En aquellas reas en las que cualquier nueva informacin sea crucial, quiz po
damos hacer aportaciones importantes con un nm ero relativamente pequeo de obser
vaciones. En otros casos en los que ya se haya profundizado ms en el tema y un estu
dio slo pueda ser relevante con un grado de certidum bre considerable, necesitaremos
un nm ero relativamente m ayor de observaciones para convencer de la existencia de un
nuevo efecto causal (vase el apartado 2.1 del captulo 1).
3.
Por lo tanto, en la situacin general, al igual que en este ejemplo, cuanta m s colinealidad haya entre la variable causal explicativa y las de control, m s observaciones des
perdiciaremos. En consecuencia, sern necesarias ms para alcanzar un determinado ni
vel de incertidumbre. Este asunto tiene una gran im portancia prctica para el diseo de
investigaciones, ya que suele ser posible seleccionar observaciones para m antener baja
la correlacin entre la variable causal y las de control. En el ejemplo actual, para reducir
esta correlacin slo necesitaram os entrevistar a un nm ero suficiente de mujeres ne
gras y de hom bres blancos.
4.
Para term inar, cuanto m ayor sea la varianza de los valores de la variable explicativa
causal, menos observaciones necesitarem os recabar para alcanzar un determinado nivel
de certidum bre en relacin a la inferencia causal.
Este resultado, al igual que el ltimo que hem os m encionado, tiene consecuencias
prcticas, ya que, si seleccionam os apropiadam ente las observaciones, podrem os reducir
la necesidad de que tengan que ser muchas. Slo necesitam os centram os en elegir aque
llas que presenten una am plia gama de valores en relacin a la variable causal clave. Si
nos interesa saber el efecto que tiene el nivel de estudios medio de una comunidad sobre
la delincuencia, lo m ejor ser elegir algunas com unidades que registren niveles muy al
tos de este indicador y otras que los tengan muy bajos. Si se hace as, ser m enor el tra
bajo necesario para extraer una inferencia causal que tenga un determinado nivel de cer
tidumbre porque habr que recoger m enos observaciones.
respuesta precisa que siempre sea aplicable. Como hemos demostrado con
el ltimo modelo formal, la respuesta depende de cuatro informaciones di
ferentes, que variarn en cada diseo de investigacin. Adems, la mayora
de las situaciones que son objeto de investigacin cualitativa no se ajusta
rn exactamente a este modelo formal, aunque, en un sentido ms general,
las intuiciones fundamentales s sean aplicables.
Cuantas ms observaciones, mejor, pero cuntas son necesarias? En la
situacin ms sencilla en la que hay niveles de variabilidad escasos, va
rianza alta en la variable causal, ninguna correlacin entre sta y las de
control y se requieren niveles bastante bajos de certidumbre se necesita
rn pocas observaciones: probablemente ms de cinco pero menos de vein
te. De nuevo, la respuesta precisa depende de la exacta especificacin del
modelo formal y del valor exacto de cada uno de sus componentes. Lamen
tablemente, la investigacin cualitativa, por definicin, no suele ser precisa
y, en consecuencia, no siempre podem os reducir este aspecto a una sola
respuesta.
Por fortuna, s suele ser posible evitar estos problemas aumentando el
nmero de observaciones. A veces esto supone recoger ms datos, pero,
como sealamos en el apartado siguiente, suele ser posible reconceptualizar
un diseo de investigacin cualitativo para sacarle muchas ms observacio
nes y darle as una estructura ms consistente. A continuacin nos ocupa
mos de este asunto.
3.
3.1
Hay que tener cuidado al decidir si las nuevas unidades son apropiadas
para reproducir nuestra hiptesis, es decir, si en ellas puede tener lugar el
proceso que implica dicha hiptesis. La validez que tenga la aplicacin de
la hiptesis a otras clases de unidades depender de la teora e hiptesis que
se estn utilizando, as como del tipo de unidades. Si la variable dependien
te es la poltica de proteccin social, los estados o provincias sern adecua
dos si pueden implantar ese tipo de polticas, pero si lo que estamos estu
diando es la poltica arancelaria y todas las decisiones al respecto las toma
el gobierno central, quiz las unidades estatales o provinciales no sean las
indicadas. Del mismo modo, no tendra sentido estudiar los gobiernos loca
les de la India o de Pakistn para comprobar una teora relativa a las condi
ciones en las que una unidad poltica decide desarrollar armamento nuclear,
ya que este tipo de eleccin la realiza el gobierno central. Para dar otro
ejemplo, podemos sealar que se puede comprobar el impacto que tiene el
cambio de los precios agrcolas sobre la inestabilidad social en los estados
indios, pero que no es factible utilizar varias organizaciones del gobierno in
dio para verificar esta relacin, ya que este proceso no tiene lugar dentro de
ellas. Dicho en pocas palabras, el hecho de que las subunidades sean luga
res apropiados para observar una teora en accin depende de esa misma
teora. Esta es la razn por la que aconsejamos que se comience por elabo
rar una lista de las consecuencias observables de nuestra teora y no bus
cando montones de posibles unidades, independientemente de la teora que
se utilice. Slo podremos elegir las unidades de estudio una vez que haya
mos especificado cul es la teora.
Un enfoque alternativo es considerar observaciones a lo largo del tiem
po. La India actual y la de hace una dcada pueden ser dos ejemplos del
proceso que nos interesa. De hecho, en la mayora de las investigaciones
que se consideran estudios de caso hay mltiples medidas de una hipte
sis a lo largo del tiempo.
Creemos que aconsejar que se aumente el nmero de observaciones bus
cando ms ejemplos en las subunidades o teniendo en cuenta ms situacio
nes a lo largo del tiempo es una de las indicaciones ms tiles que podemos
dar a los investigadores cualitativos. Soluciona el problema que plantea un
n pequeo porque lo aumenta sin que sea necesario, por ejemplo, viajar a
otro pas o analizar una decisin completamente nueva. Sin embargo, es un
consejo que hay que seguir con cuidado: la teora o hiptesis tiene que ser
aplicable a la nueva situacin, es decir, la subunidad debe contener real
mente una consecuencia observable de dicha teora. No tiene por qu ser
(ni siquiera aproximadamente) la consecuencia observable que nos interese
en ese preciso momento; siempre que sea una consecuencia de la misma teo
ra, los datos que organicemos nos darn un mayor control sobre la inferen
cia causal.
Hay que ser consciente de otro problema. Queremos utilizar estos nue
vos ejemplos para someter nuestra teora a otras pruebas, pero las subuni-
dades o los diversos ejemplos que hemos encontrado a lo largo del tiempo
quiz no sean com probaciones independientes de dicha teora. De este
modo, como reconoce George (1982, pp. 20-23), cada nuevo caso no nos
aportar tanta informacin sobre el problema como lo hara si las observa
ciones fueran independientes. El hecho de que las observaciones dependan
unas de otras no descalifica las comprobaciones, a menos que esa depen
dencia sea perfecta, es decir, a menos que se puedan predecir totalmente los
nuevos datos a partir de los existentes. Si no se da este caso improbable, al
menos s habr nueva informacin en los nuevos datos que nos ayude a
analizarlos. Estas nuevas observaciones, que se basan en informacin no
independiente, no aportarn tanta informacin como las que son completa
mente independientes, pero, de todos modos, pueden ser tiles.
Esta conclusin tiene dos consecuencias prcticas. En primer lugar, al
barajar observaciones parcialmente dependientes tenemos que tener cuida
do de no exagerar la certeza de las conclusiones. Especialmente, no hay
que considerar que esos datos nos ofrecen tantas observaciones como ten
dramos si las observaciones fueran independientes. En segundo lugar, es
preciso analizar con precaucin por qu las observaciones dependen unas
de otras. Con frecuencia, la dependencia proceder de una o de algunas va
riables omitidas interesantes que pueden inducir a confusin. Por ejemplo,
supongamos que nos interesa la participacin poltica de los ciudadanos en
los condados de los Estados Unidos. Quiz los condados contiguos no sean
independientes porque la gente va a trabajar cada da de unos a otros, por la
movilidad residencial o por los valores socioeconmicos similares que tie
nen las personas que viven en ellos. Recabar datos en condados vecinos s
aportar ms informacin al estudio, aunque no tanta como se podra espe
rar de condados que fueran completamente independientes de aquellos en
los que ya habamos recogido datos.
Para dar otro ejemplo, pensemos en la relacin que existe entre el cam
bio de los precios agrcolas y la inestabilidad social. Podramos comprobar
si se da esta relacin en varios estados indios, calculando estos precios y la
inestabilidad social. Sin embargo, los estados no son unidades experimenta
les aisladas. Los valores de la variable dependiente pueden verse afectados
no slo por los que adopten las variables explicativas dentro de cada uni
dad, sino por los de las omitidas que estn fuera. En un estado el detonador
de la inestabilidad social pueden ser los precios agrcolas (tal como predice
la teora), pero esa alteracin del orden social puede influir directamente en
que se genere una situacin parecida en un estado contiguo (lo cual har que
sta slo sea una demostracin parcialmente independiente de nuestra teo
ra). Sera posible enfrentarse al problema controlando adecuadamente esta
propagacin. Algo similar puede ocurrir con la influencia que ejerce cierto
perodo sobre otro posterior. Podramos reproducir nuestro anlisis en la In
dia una dcada despus, pero la inestabilidad social del primer perodo qui
z tuviera un efecto directo en la del segundo.
S"
235
3.2
3.3
239
que vincule las condiciones iniciales con los resultados a menudo implicar
que en esos actores se d un determinado conjunto de motivaciones o per
cepciones. Por consiguiente, el rastreo de procesos conllevar una bsqueda
de pruebas coherentes con la teora causal general relativas a los pro
cesos decisorios que han producido los resultados. Para utilizar este proce
dimiento quiz se necesite entrevistar a los actores o leer lo que han escrito
para explicar las razones de sus actos.
Por ejemplo, en las relaciones internacionales, la cooperacin entre esta
dos puede producirse por muchas razones: porque se espere obtener benefi
cios de la reciprocidad, porque funcione una disuasin con amenazas de
destruccin o porque haya unos intereses comunes en cierto conjunto de re
sultados. En cada uno de estos mecanismos causales participarn muchas
variables explicativas, pero en cada uno de los mecanismos posibles el con
junto de variables ser diferente, y tambin lo sern las relaciones entre
ellas. Un estudio atento del proceso que lleva a las naciones a cooperar qui
z nos permita determinar qu mecanismo causal es ms posible que est
funcionando. Esto puede conllevar el estudio, entre otros asuntos, de las
motivaciones expresadas por los actores o del tipo de comunicacin que
hay entre ellos.
Desde nuestra perspectiva, el rastreo de procesos y otras formas de ela
borar mecanismos causales aumentan el nmero de observaciones relevan
tes desde el punto de vista tericol4. Estas estrategias vinculan el trabajo te
rico y el emprico porque utilizan consecuencias observables de una teora
para indicar nuevas observaciones que habra que hacer para evaluarla. Este
mtodo, al aportar ms observaciones relevantes para las consecuencias de
una teora, puede ayudarnos a superar los dilemas que plantean los estudios
de n pequeo y hacer posible que tanto los investigadores como los lectores
tengan ms confianza en los hallazgos de las ciencias sociales. En cada su
cesin de acontecimientos, el rastreo de procesos produce muchas observa
ciones. As ocurre tambin, dentro de cada unidad poltica, cuando se anali
zan actitudes o com portam ientos individuales. Adems, el investigador
controla las variables que son aplicables a todas las observaciones porque
se relacionan con la sucesin de acontecimientos o con el conjunto de la
unidad. En general, un enfoque que slo preste atencin al resultado final
har que el investigador no disponga ms que de un nmero muy escaso de
observaciones para resolver el dilema que se presenta cuando se encuentra
o bien sesgo de la variable omitida o imprecisin. Al revisar mltiples ob
servaciones relativas a las actitudes o comportamientos individuales, el in
vestigador puede calibrar qu mecanismos causales se han activado.
No es probable que este tipo de anlisis produzca inferencias causales
consistentes porque se puede poner en m archa ms de un mecanismo y,
dentro de cada uno de ellos, quiz no est clara la fuerza relativa de las va
riables explicativas. Sin embargo, s que servir, en cierta m edida, para
contrastar hiptesis, ya que una elaboracin terica que explique resultados
tambin puede tener consecuencias para el proceso que lleva a que stos se
produzcan. Por lo tanto, buscar mecanismos causales aporta observaciones
que podran refutar la hiptesis. Quiz este enfoque tambin permita al in
vestigador hacer alguna generalizacin descriptiva sobre la frecuencia con
que se activa cada posible mecanismo causal y puede que tales generaliza
ciones descriptivas sirvan de base para futuros anlisis de otros mecanis
mos causales relacionados y de las condiciones en las que cada uno de ellos
se pone en marcha.
Para nosotros, el rastreo de procesos y la bsqueda de los fundamentos
psicolgicos que sustentan una hiptesis desarrollada en un nivel de agre
gacin superior son enfoques muy valiosos. Sin embargo, constituyen ex
tensiones de la lgica analtica fundamental que hemos venido utilizando y
no formas de evitarla. Los estudios de este tipo, si quieren hacer alguna
aportacin a la inferencia causal, tendrn que enfrentarse a todos sus pro
blemas: la homogeneidad de las unidades, la endogeneidad y el sesgo. Para
alcanzar inferencias causales vlidas es preciso que, en el nivel del indivi
duo que toma las decisiones, nos planteemos las preguntas que surgen al di
sear una investigacin y que las respondamos. Habr que calibrar con pre
cisin las razones que nos d ese individuo, seleccionar las observaciones
de manera que sean independientes del resultado que se ha producido (si
no, tendrem os problem as de endogeneidad) y evitar que haya variables
omitidas relevantes. Tambin es importante recalcar aqu que los mecanis
mos causales que se rastreen de este modo tendrn que hacer que nuestra
teora sea ms, y no menos, restrictiva: este tipo de tcnicas ha de aumen
tar, y no evadir, las posibilidades de refutacin de una teora. En suma, el
rastreo de procesos y otros anlisis de subunidades son tiles para encon
trar hiptesis plausibles sobre mecanismos causales que, a su vez, pueden
favorecer la elaboracin de generalizaciones descriptivas y allanar el cami
no hacia la inferencia causal. Sin embargo, este enfoque tiene que enfren
tarse a todos los problemas del anlisis causal.
4.
Observaciones finales
un n pequeo que cuando ste es grande. En este libro se han sealado for
mas de incrementar el nmero de observaciones para un estudio y tambin
cmo hacer inferencias a partir de una cantidad de observaciones relativa
mente pequea.
Tanto los investigadores cuantitativos como los cualitativos pueden ha
cer ms eficiente un estimador aumentando la cantidad de informacin que
se utiliza para resolver un problema con frecuencia mediante el incre
mento del nmero de observaciones (apartado 7.2 del captulo 2) y, a ve
ces, recurrir a procedimientos aleatorios de seleccin y adjudicacin de va
lores con el fin de evitar autom ticam ente el sesgo. Gran parte de los
anlisis de este libro pretendan ayudar a los cualitativistas a tener estima
dores ms precisos, pero las tcnicas que hemos sealado son diversas y,
con frecuencia, hay que llegar a un equilibrio entre varios objetivos de in
vestigacin vlidos; de ah que sea difcil concentrar nuestras indicaciones
en enunciados concisos que se correspondan con las ecuaciones formales
que prefiere la investigacin cuantitativa.
Los investigadores que, en el anlisis de los fenmenos sociales, deciden
prescindir de los procedimientos cuantitativos formales no pueden hacer
caso omiso de los sesgos e ineficiencias que crean los diseos de investiga
cin metodolgicamente irreflexivos. Sus temas de estudio son tan impor
tantes, y a veces ms, que los que analizan los cuantitativistas. Las inferen
cias descriptivas y causales que hacen los cualitativistas merecen ser tan
sensatas como las de cualquier otro investigador, y para que sean vlidas
sus autores van a necesitar acercarse ms que antes a las cuestiones meto
dolgicas. Tambin deben ser ms contenidos al disear sus estudios y ms
explcitos al plantear resultados importantes. Los lectores no tienen por qu
reformular los estudios cualitativos publicados para hacerlos cientficamen
te vlidos. Si un autor conceptualiza un proyecto de investigacin de nume
rosas consecuencias observables utilizando slo dos de ellas y doce hipte
sis causales, no ser responsabilidad de quien lo lea o resee el explicar que
el diseo implcito del autor era mejor que el explcito. Lo que es an ms
fundamental, los investigadores que comprendan y expliquen la lgica de
sus anlisis producirn estudios ms valiosos. Por fortuna, las cuestiones
m etodolgicas que los cualitativistas tienen que comprender son, preci
samente, las mismas que el resto de los investigadores cientficos debe res
petar. Una inferencia vlida slo es posible si se entiende y respeta la lgica
interna que subyace en todas las investigaciones sociales de tipo cientfico.
Notas
Captulo 1
5 ste es el principio de falsabilidad (Popper, 1968), asunto sobre el que hay diver
sas opiniones en la filosofa de la ciencia. Sin embargo, pocos cuestionan la idea de que
las teoras deban enunciarse con la m ayor claridad posible, de forma que pueda revelar
se que estn equivocadas.
6 Probablemente, sta sea la pregunta que se plantea ms a m enudo en las entrevis
tas de trabajo de nuestro departamento y de m uchos otros.
7 Esta frase es conocida como el postulado de sim plicidad de Jeffreys-W rinch. El
concepto es sim ilar al de la navaja de Occam.
8 Si hemos elegido un asunto de importancia para el m undo real y/o ste hace algu
na aportacin a lo escrito en un rea de estudio, la naturaleza social de la academia co
rregir cualquier posible error: alguien reproducir nuestro estudio con otro conjunto de
datos y demostrar que estbamos equivocados.
9 Nos hemos dado cuenta de que m uchos estudiantes de doctorado tienen un miedo
innecesario a com partir los datos y la informacin precisa para reproducir sus resulta
dos. Tem en que alguien les robe su preciado trabajo o que incluso demuestre que estn
equivocados. Son tem ores habituales, pero pocas veces estn justificados. Publicar (o, al
menos, enviar copias de lo escrito sobre la investigacin a otros acadm icos) y com par
tir los datos es la m ejor forma de darle credibilidad a nuestra aportacin. Adems, com
partir los datos no har m s que facilitar que otros sigan el camino trazado con la inves
tigacin que uno ha comenzado. Una vez que sta se publique, citarn nuestro esfuerzo
e incrementarn nuestra visibilidad y reputacin.
10 Podemos com probar nosotros m ism os la fiabilidad m idiendo una m ism a canti
dad dos veces y fijndonos en si el resultado es igual. A veces esto parece fcil, como
en el caso de hacer exactam ente la misma pregunta en diferentes ocasiones durante una
entrevista; sin embargo, plantearla una vez puede influir en el entrevistado para que en
la segunda ocasin responda de una forma coherente con la anterior, de m odo que hay
que tener cuidado de que las dos m ediciones sean realmente independientes.
11 Ejemplo de ello es la utilizacin de m s de un codificador para la extraccin de
informacin sistemtica de las transcripciones de entrevistas en profundidad. Si dos per
sonas utilizan las m ism as norm as de codificacin, podem os observar con cunta fre
cuencia emiten el m ismo juicio. Si no se obtienen m edidas fiables, se pueden elaborar
normas de codificacin ms precisas e intentarlo de nuevo. Al final, suele ser posible
crear un conjunto de norm as para que la aplicacin de un m ism o procedim iento por di
ferentes codificadores arroje el mismo resultado.
12 La expresin falacia ecolgica es confusa porque el razonamiento que lleva de
los niveles agregados a los individuales no es ni ecolgico ni falaz. N o es muy afortuna
do utilizar el trmino ecolgico para describir un anlisis de tipo agregado. Aunque
Robinson (1990) lleg a la conclusin, en su prim er articulo sobre este asunto, de que
utilizar el anlisis agregado para hacer razonam ientos sobre individuos es una falacia,
m uchos cuantitativistas de las ciencias sociales y tam bin estadsticos reconocen ahora
que en niveles agregados de anlisis s existe cierta informacin sobre los individuos, y
se han desarrollado m uchos mtodos de inferencia ecolgica no sesgados.
Captulo 2
dacin de la cam paa en el xito electoral?, qu motiva a los que dan dinero para la
cam paa? El anlisis se centra en una determinada candidatura de una circunscripcin
concreta, pero el problem a y las cuestiones que plantea se solapan con lo que es habitual
en la ciencia poltica.
2 Con el fin de com pletar esta explicacin, m erece la pena sealar que podram os
im aginar una teora completamente diferente en la que una contraccin del prpado no
fuera un guio pero tuviera, a pesar de todo, un efecto causal en otros actores. Por ejem
plo, el tic podra haberse m alinterpretado. Si tam bin nos interesara si la persona que
contrae el prpado pretenda hacer un guio, tendramos que buscar otras consecuencias
observables de esta m isma teora.
3 La bibliografa sobre los estudios de caso com parados es enorme. Para com ple
m entarla, algunas de las m ejores obras son las de Eckstein (1975), Lijphart (1971) y Collier (1991).
4 Coom bs (1964), por ejem plo, demostr que casi todas las colecciones de datos
tiles requieren o implican un cierto grado de teora, o de miniteora. Sin embargo,
hay m uchos datos cuantitativos, e histricos de tipo cualitativo, que se recogen con el
propsito explcito de anim ar a futuros investigadores a que los utilicen para fines no
previstos anteriormente. Quince m inutos con el Statistical A bstract o f the United States
(Resum en estadstico de los Estados Unidos) convencer a la m ayora de este hecho.
Las labores de recogida de datos tam bin difieren por el grado de rigidez con que los in
vestigadores siguen sus presupuestos previos.
5 Form alm ente, para un conjunto de unidades n en el que se m ide la variable y
(y,, ..., y ), un estadstico h es una funcin con un valor real que se define com o:
h = h(y) = h(yl, . . . , y i) .
6 Este asunto est m uy relacionado con el concepto de diseo de investigacin im
preciso, que analizamos en el apartado 1 del captulo 4.
7 Vase Popper (1982) para un libro entero dedicado a la defensa del indeterminismo.
8 Evidentemente, lo m ism o puede aplicarse a todas las com unidades que podramos
estudiar.
9 Hay que sealar que la aleatoriedad no tiene que ver exactam ente con diferentes
sem anas reales, ya que tanto los acontecimientos imprevistos como las diferencias siste
m ticas podran explicar las divergencias observadas. Por lo tanto, creamos una situa
cin lo ms ideal posible en la que podamos im aginar que ponemos en m archa el m un
do de nuevo con cara cte rstica s sistem ticas constantes y dejando que varen los
factores imprevistos.
10 Por supuesto, v5 puede tener m ucho inters para los habitantes de la circuns
cripcin 5 en ese ao y, por tanto, puede valer la pena estudiar los componentes aleato
rio y sistemtico de ese acontecimiento. No obstante, siem pre tendram os que intentar
distinguir lo aleatorio de lo sistemtico.
11 Vase K ing (1991b) para una elaboracin de esta distincin.
12 Los econom istas tienden a estar ms cerca del punto de vista 1, mientras que los
estadsticos estn m s prxim os al 2. El primero tam bin es especialm ente comn en la
rama de la ingeniera que se denom ina control de calidad. Los fsicos han llegado a
debatir esta distincin dentro de la m ecnica cuntica. En esta rea, los primeros que
propusieron el punto de vista 2 fueron los partidarios de la teora de la variable ocul
ta. Sin em bargo, las obras m s recientes tienden a constatar el punto de vista 1: el
m undo fsico parece intrnsecam ente probabilstico. Todos esperam os la resolucin de
las num erosas contradicciones que quedan en esta im portante teora y en sus consecuen
cias para la naturaleza del m undo fsico. Sin embargo, esta disputa dentro de la fsica,
aunque sola justificar gran parte de la filosofa de las ciencias sociales, probablemente
no influir en la lgica inferencial de stas o en la prctica de sus investigaciones.
13 En nuestro lenguaje, como analizarem os m s adelante en el apartado 5 del cap
tulo 3, ste es un problem a de endogeneidad. El prever la cooperacin podra conducir a
que se convocaran reuniones en la cumbre, de modo que no seran estas cum bres las que
explicaran la cooperacin, sino que sta parecera el resultado de tal previsin, lo cual
no sera m uy sorprendente si los actores son racionales!
14 Hay que sealar que el estim ador puede no estar sesgado pero s ser incoherente.
Por ejem plo,
es un estim ador no sesgado de i, pero es incoherente porque no mejora
cuando va dism inuyendo el nmero de unidades (o, en realidad, no cam bia en absoluto).
Un estim ador tam bin puede ser coherente pero estar sesgado. Por ejem plo Y - Sin est
sesgado, pero es coherente porque 5n se convierte en cero a m edida que n se acerca al
infinito.
15 En la segunda lnea de este clculo y en los siguientes presuponem os que no
existe una correlacin espacial entre los distritos.
Captulo 3
laasaa
246
ca una variable causal (la m ala comunicacin) y sostiene que con ella aumenta la proba
bilidad de que se produzca un determinado resultado (una guerra). Sin embargo, no pue
de convertirse en una afirm acin acerca de las condiciones necesarias y suficientes para
que haya una guerra, por lo que es irreductiblem ente probabilstica.
11 El insistir en la necesidad de diferenciar los componentes sistemticos de los no
sistem ticos en las observaciones que son objeto de inferencia causal refleja nuestra
idea general de que el mundo, al menos tal como lo conocemos, es m s probabilstico
que determinstico. De ahi que tampoco estem os de acuerdo con la premisa de Ragin
(1987, p. 15), segn la cual las explicaciones que surgen de aplicar el mtodo com pa
rado no se conciben de forma probabilstica porque, si es posible, cada uno de los ejem
plos de un fenmeno se examina y explica. Aunque se pudiera hacer una especie de
censo con la informacin de cada uno de los ejem plos de un fenmeno, as com o con
cada permutacin y combinacin de los valores de las variables explicativas, el mundo,
de todas formas, producira esos datos mediante algn proceso probabilstico (tal como
se defini en el apartado 6 del captulo 2). Esto parece invalidar el enfoque del lgebra
booleana de Ragin com o forma general de disear explicaciones tericas o extraer in
ferencias. Para aprender de los datos es necesario utilizar la m ism a lgica de la inferen
cia cientfica que analizamos en este libro. Sin embargo, el enfoque de este autor s pue
de ser valioso como un tipo de teora formal (vase el apartado 5.2 del captulo 3), ya
que posibilita que el investigador concrete una teora y sus consecuencias mucho ms
fcilmente que si se careciera de l.
12 Con el fin de evitar la utilizacin de un trm ino constante, presuponem os que to
das las variables tienen una m edia igual a cero. Esto sim plifica la presentacin, pero no
limita en modo alguno nuestras conclusiones.
13 Se nos podra llam ar (o acusar de!) justificacionistas o incluso justificacionistas probabilsticos (vase Lakatos, 1970), pero si nos han de poner una etiqueta,
preferimos la ms coherente y filosfica de bayesianos (vanse Leamer, 1978; Zellner, 1971; y Bam ett, 1982). De hecho, nuestros objetivos son lo que m s nos diferencia
de Popper. Si el objetivo es concretam ente el suyo, estamos de acuerdo con el procedi
miento; si es el nuestro, quiz l estuviera de acuerdo con nosotros. Sin embargo, cree
m os que nuestros objetivos estn ms cerca de los que se plantean en las ciencias socia
les y tambin de los que es m s probable alcanzar.
14 Como siempre, cuando m odificam os una teora para que concuerde con los datos
que hemos recogido, hay que evaluar dicha teora (o la parte a la que se refieren nues
tros datos) en un contexto diferente o en otro conjunto de datos.
15 O tra formulacin de las ideas de Popper es la de que no es posible demostrar
una negacin. Para este autor, no es posible porque el hecho de que un resultado con
cuerde con la hiptesis puede proceder, sim plem ente, de una com probacin equivocada.
Quien intente demostrar negaciones siempre se encontrar con este problem a. De he
cho, las dificultades no slo sern tericas, sino tam bin profesionales, ya que las revis
tas acadmicas tienden a publicar ms resultados positivos que negativos.
Esto ha llevado a lo que se denomina problem a del archivador, que donde m s cla
ram ente se m anifiesta es en la bibliografa cuantitativa. Supongam os que no existen
pautas en el mundo. De manera que cinco de cada cien comprobaciones a las que se so
m eta cualquiera de ellas se apartarn del 95% que constituye el intervalo de confianza y
que, por tanto, generarn inferencias incorrectas. Si partim os de la base de que las revis
tas acadmicas publican resultados positivos en vez de negativos, slo publicarn ese
5% que es significativo, o sea, nicam ente conclusiones equivocadas, por lo que
cerlo un cientfico social, sino com o suele ser habitual cuando, al discutir de poltica,
defendemos nuestras profundas convicciones seleccionando con frecuencia ejem plos
que refuerzan nuestros argumentos. Al investigar, si es posible, hay que intentar tener
todas las observaciones. Si se precisa una seleccin, hay que procurar obtener las obser
vaciones que sean esenciales para decidir cul es la pregunta que tiene inters, y no slo
las que concuerdan con nuestra posicin.
6 En este apartado, no contem plam os la posibilidad de que ciertos proyectos de in
vestigacin que se disean para no dejar que cam bie en absoluto la variable dependiente
sean parte de un program a de estudio m ayor y que, por tanto, puedan aportar inform a
cin til sobre las hiptesis causales. Explicam os esta cuestin en el apartado 4 del ca
ptulo 4.
7 Porter afirm a que tiene m uchos ejem plos de pases que no han alcanzado el xito
competitivo; sin embargo, stos entran en su anlisis m ediante una eleccin selectiva de
ancdotas y no se estudian con m todos parecidos a los de sus prim eras diez naciones.
Cuando los ejem plos que corroboran nuestro argumento se extraen de form a no sistem
tica de un infinito abanico de posibilidades que incluye elem entos que nos favorecen y
otros que no, resulta demasiado fcil hacer el ridculo encontrando relaciones que no
existen. No vamos a valorar si las hiptesis de Porter son correctas; slo querem os sea
lar que la informacin necesaria para decidir sobre este punto debe recabarse de m anera
m s sistemtica.
8 En general, el sesgo de seleccin tiene lugar cuando sta se realiza a partir de la
variable dependiente, despus de tener en cuenta (o controlar) las variables explicativas.
Como una de ellas es el mtodo de seleccin, lo controlam os y no introducim os sesgo.
9 La inferencia tam bin ser un poco m enos segura si el abanico de valores de las
variables explicativas se lim ita m ediante la seleccin. V ase el apartado 2 del cap
tulo 6.
10 Dicho de otra form a diferente, si seleccionam os en funcin de las distribuciones
m arginales de la variable dependiente y de las explicativas, podrem os seguir aprendien
do algo sobre su distribucin conjunta al hacer el estudio.
Captulo 5
1 Una excepcin a esta regla se produce cuando los errores sistem ticos positivos anu
lan los negativos, pero es m s correcto definir este caso inusual como un tipo de error
de medida no sistemtico.
2 Este error, independientem ente de que se produzca por nuestra incapacidad de
medir el mundo real con precisin o por la aleatoriedad de la naturaleza, siempre nos
plantear una pregunta filosfica que puede responderse de varias m aneras (apartado 6
del captulo 2). C ualquiera que sea la posicin que aceptemos, la consecuencia ser la
misma.
3 Imaginamos de nuevo que los cuatro crculos blancos representan o bien un gran
nmero de observaciones que coinciden exactam ente con ellos o bien una escasa varia
cin estocstica.
4 Los lectores versados en estadstica reconocern que esto corresponde a la propie
dad de hom ocedasticidad, o varianza constante.
5 Estos supuestos de error implican que el valor esperado de la variable dependiente
observada es igual al esperado para la verdadera variable dependiente:
E (Y ) = E (Y* + U )= E (Y*) + E (U ) = E (Y*) = X
8250
6 Seguimos presuponiendo aqu que cada crculo representa o bien datos en los que
apenas hay variacin estocstica o bien una situacin en la que num erosos puntos coin
ciden en el m ismo lugar. Al igual que en el apartado 1 de este m ismo captulo, el prop
sito de este supuesto es centram os en el problema.
7 Es preciso sealar la diferencia que hay entre los dos casos en los que resulta
aceptable om itir una variable. En el primero, donde la variable omitida no tiene relacin
con la dependiente, no existe sesgo y no perdem os ninguna capacidad de predecir los
valores futuros de esta ltim a variable. En el segundo caso, en el que la variable omitida
no tiene relacin con la independiente pero s con la dependiente, tampoco aparece ses
go en nuestra estim acin de la relacin entre la variable explicativa incluida en el anli
sis y la dependiente, pero s perdem os cierta capacidad de pronosticar con exactitud los
valores futuros de la segunda. Por lo tanto, si el estar ya en el poder no tuviera relacin
con los gastos de la campaa electoral, omitir este factor no sesgara nuestra estimacin de
la relacin que hay entre ese gasto y los votos. Pero si nuestro objetivo fuera pronosti
car, tendram os que representar todas las variaciones sistemticas de la variable depen
diente, y om itir el hecho de estar ya en el poder nos lo impedira, porque estaramos de
ja n d o de lado una im portante v ariable causal. Sin em bargo, aunque a largo plazo
nuestro objetivo fuera explicar el voto de la forma ms completa y sistemtica, podra
resultar difcil confiar en varios efectos causales que estuvieran encuadrados dentro de
un solo estudio. Por lo tanto, quiz necesitramos centram os en un nico efecto causal
(o slo en unos pocos), cualquiera que fuera nuestro objetivo ltimo.
8 Para decirlo de una form a ms precisa, F es la estimacin del coeficiente que se
produce cuando se hace una regresin entre X t y A",.
9 Como esta ecuacin slo es exactamente aplicable cuando hay grandes muestras, en
realidad estamos analizando la coherencia en vez de la falta de sesgo (apartado 7.1 del ca
ptulo 2). Para ser ms exactos, los trminos que aparecen entre parntesis en la ecuacin
(5.2) se desvanecen al dividirlos por n, a medida que este valor se acerca al infinito.
10 M erece la pena considerar lo que supone ocuparse del efecto causal estimado de
los precios del crudo sobre la actitud d la opinin pblica ante la escasez de energa,
controlando a la vez la cantidad de informacin televisiva al respecto. Pensem os en dos
descripciones que son importantes porque posibilitan anlisis y estudios ms profundos de
los procesos causales. En prim er lugar, este efecto estimado slo representa la influen
cia que tiene el elem ento de los precios del crudo que afecta directamente a la actitud de
la opinin pblica ante la escasez de energa, y que es diferente del que influye en la au
diencia de m anera indirecta cuando cambia la informacin televisiva. En resumen, es el
efecto directo que tiene el crudo sobre la opinin pblica y no el indirecto. El efecto to
tal puede encontrarse si no se controla en absoluto la cantidad de informacin televisiva
que hay acerca de la escasez de energa. Este efecto tambin se puede describir como el
que tienen los precios de la energa sobre la variable opinin pblica en relacin a la
escasez de energa si se registran unos niveles fijos de informacin televisiva al respec
to. Como ejemplo de esta posibilidad, imaginem os un experimento en el que control
ramos la informacin que dan las cadenas de televisin sobre la escasez de crudo, m an
teniendo esta variable constante m ientras varan, lgicamente, los precios del petrleo.
Como la cantidad de informacin es constante en este experimento, se controla este fac
tor sin recurrir a ningn otro procedimiento explcito. Aunque no pudiramos llevar a
cabo un experimento, s podram os hacer una estimacin del efecto condicional que tie
nen los precios del crudo sobre lo que piensa la opinin pblica de la escasez de ener
ga. controlando la inform acin televisiva.
7 Estamos de acuerdo con lo que seala W illiam Baumol (1990, p. 1715) en rela
cin a la historia econmica: M uchos historiadores econm icos se tienden a s m ismos
una absurda tram pa cuando pretenden explicar com pletam ente una determinada evolu
cin histrica. Quien intente describir las cinco causas principales del punto critico al
que lleg Gran Bretaa a finales del siglo xix o las de la depresin econm ica europea
de 1847 estar embarcndose en una empresa imposible. Las ciencias naturales, a pesar de
sus m uchos avances y conocim iento acum ulado, siguen basndose en gran m edida en
experim entos controlados que, com o tales, se centran en la influencia sim ultnea de una
o varias variables. En realidad, los cientficos buscan derivaciones parciales, ms que
explicaciones globales para fenmenos complejos de la realidad.
8 Tam bin podemos m antener la misma variable dependiente pero cam biando las
explicativas. Sin em bargo, en la m ayora de las situaciones, esta estrategia se utiliza
para evitar el error de medida, utilizndose m edidas m ltiples de la misma variable ex
plicativa subyacente.
9 A veces, los investigadores realizan estudios que se describen como reproduccio
nes de otros anteriores y en los que no se incluyen nuevas observaciones. Fundam en
talm ente, lo que reproducen o intentan reproducir son estudios ajenos, con el fin de
com probar si los resultados se repiten. U n cuantitativista intentar repetir el anlisis
de un estudio anterior utilizando los mismos datos. Un historiador revisar las fuentes
utilizadas por otro historiador. Un etngrafo escuchar las entrevistas grabadas para
com probar si las conclusiones originales eran sensatas. Este tipo de actividad es muy
til porque las pruebas cientficas deben ser reproducibles; sin embargo, no es lo que
planteam os en este apartado, ya que no conlleva la utilizacin de nuevas observaciones.
10 Ciertas fuerzas extem as tam bin favorecieron el fracaso de Allende, pero Kohli
concede ms importancia a las internas.
11 Los cuantitativistas han desarrollado una enorme coleccin de elaboradas tcni
cas estadsticas para analizar datos en los que aparecen las denominadas propiedades de
las series temporales o de la autocorrelacin espacial. N o slo consiguen corregir estos
problem as, sino que han logrado sacar una extraordinaria inform acin de los datos.
Vanse Granger y Newbold (1977), Anselin (1988), Beck (1991) y King (1989, 1991c).
12 La utilizacin de la cultura como variable explicativa en las investigaciones
sociales es objeto de un gran debate, pero no es el tem a de este libro. Slo sealarem os
que las explicaciones de este tipo deben som eterse a las mismas comprobaciones lgi
cas y de m edida que se aplican al resto de las investigaciones.
13 Donald M oon denom ina explicacin de los fundam entos a una versin de este
enfoque o, por utilizar una expresin de otros autores, anlisis de las razones (Moon,
1975).
14 Lo que George y M cKeown denominan explicacin dentro de la observacin
constituye, siguiendo a Eckstein, una estrategia de redefinicin de la unidad de anli
sis, con el fin de aum entar el nmero de observaciones. George y M cKeown (1985,
p. 36) afirm an que en los estudios de caso el comportam iento del sistem a no se resume
en un solo punto de datos, sino en una serie de puntos o de curvas que se van trazando a
travs del tiem po. En nuestra terminologa, que tom am os de Eckstein (1975), este m
todo consiste en aum entar el nm ero de observaciones, ya que una sola observacin se
define como un fenmeno del que slo sealamos e interpretamos una nica medida
en cada variable pertinente.
Bibliografa
Dcwnkl, William G ., Jcrry C!. Tlmrsby y Richard (!. Andcrson (1986): The Joiunal
o f Moncy, Crcdit and Banking Project. A m erican l im o m ic Kcyicw 76, num. 4
(septiembre), pp. 5H 7-603.
D iam ond, Larry. y M are lr. P la ltn e r (cd s.) (1 9 9 3 ): The (lohal Kcsiagcnce o f f)cmt>cracy. B altim o re , Jo h n s H o p k in s U n iv crsity P ress.
D uncicr, M itch cll (1 9 9 3 ): S lim x Tahlc. C h ic ag o . U n iv crsity o l . In c a lo P ress.
F aslon , D avid ( 19 6 5 ): A System s A n lisis o f Political l.ifc N u ev a York, W iley,
E c k ste in , Ila rry (1 9 6 9 ): A n th o rily R clalio n s a n d G o v c rn m e iita l P e rfo rm a n ce .
Comparativc l'olitical Stialies 2, pp. 2 6 9-325.
()9 7 5 ): C ase S lu d y and T h c o ry in Polilicid S cien ce , I:n I r e d I. t rceitstein y
N clso n W. P o lsby (cd s.). Ilandbook o f Political Science, vo). 1, l'olitical Scien
ce: Scopc a n d Thcory. R ca d in g . M ass.. A d d iso n -W cslcy .
Elster, Jon (1983): Explaining Technical Chance: A Case Stm ly in the PhUosophy
o f Science. N u e v a York. C a m b rid g e IJn iv ersity P ress [cd. c a ste lla n a : // cambio
tecnolgico: investigaciones sobre la racionalidad y la transform acin social.
B arcelo n a: G c d isa , 1992).
F e a ro n , Jam e s D. (1 9 9 1 ): C o u n tc ra c lu a ls a n d lly p o th e s is T c s lin g in P o ltica)
S eicn cc , IVnrltl Politics 4 3 . n m . 2 (en ero ), pp. 169-195.
Fenno, R ichard F. ( I97K ): (lom e Stve. B oston. I.ittle , B row n,
F c rc jo h n , John (1 9 9 3 ): S tru c tu re an d Id eo lo g y : C h an g o in P a rlia m e n t in liarly
S tu a rt E n g lan d . lin Judilli G o ld stc in y R o b crt O. K co liane (cds.). Ideas tmd
Forcign Policy: Deliefs, Institiitions atul Politicat Ctumge. Ithaca. C o rn e ll U n i
v crsiiy Press.
F crguson. Yate II,, y R ich ard W. M an sh ach ( I9KK): The U a stvc {Jnest: Thcory oml
International Politics. C o lo m b ia . U m v crsity o lS o u th C a ro lin a .
F c y n m a n , R ic h a r d P. ( 1 9 6 5 ) : T he ('h a r a c te r o f P h y sic a l l.a w C a m b r id g e .
M ass., M IT P ress [cd. c a ste lla n a: K carcter de la ley (sica. B arcelona: O rbis.
1987],
Fiorina. M orris, y C h a rle s R. Plott (I97K ): ( o m m iite c D rc is m n s im der M ajo n ty
R ule. Anterictat Poltica} Science Itcvie it* 72, m un. 2 (jmiiio). p|>. 575-59K.
I;ishcr, Ronald A. (19 3 5 ): The Design o f Kxfterimeais. N ueva ^'oik. Ila ln e r Pubhshtng.
Fogcl, R ohcrl W tllia m (19 8 9 ): iVithout Cansen! or C o ntra ef Ih e Rise and hall <>f
Am erican Slavery. N ueva Y ork, W. W. N orton.
(ichnan. Andrew. y (ii*ry Ktng (1990): listim ating Incimihcncy Advantnge withmil ilias. A m erican Jo u rn a l n f P olticaI Science 34, m'im. 4 (noviembre),
p p 1 1 4 2 -I I 6 4 .
{ 19'J.t): W hy Are U.S. Prcsidcrttiat F.lection Polis So Variable Whcn the Vote Is
So Ired dable. flritish Jo u rn a l o f P oltica! Science.
Gcorge. Alcxandcr L. (1982): Case Studies and Theory Development. Trabajo
presentado en el segundo sim posio antial sobre el proceso de la informacin en
las organizaciones, Carncgie-M cllon University (octubre), pp. 15-16.
, y Timothy J. McKeown (1985): C ase Studies and Thcories o f Organizalional Decisin Making. A dvancex in Inform ation Processing in Organ2ations 2,
pp. 2 1-58.
, y Richard Sm oke (1974); D eterrence in A m erican Foreign Policy. Nueva York,
H c rm c n s, F. A. (1 9 4 1 ): Oem ocracy o r Anarchv: A Study o jP r o p o t ttonul Representation. Scmlh B cn d , h u .. U n iv e rsity o f N o lrc l>anc Press.
IfirscJm ian , Alt>crt . (1 9 7 0 ): The S c a rc h fo r P a ra d ig m s a s a llim h a n c c lo U nd c rsln n d in g , World Pofitics 2 2 , n im . 3 (a b ril). p p. 3 2 9 -3 4 3 .
1loT m ann, S tan ley (1 9 6 0 ): C 'ontem poivty Theory in In tern a tio n a l llefations. I ng lc w o o d CliTs, P rc n tic c -lln ll Jctl. c a ste lla n a: Teoras contem porneas sane las
relaciones internacionales. M a d rid : T ccnos. 1979),
H olland , Paul (1 9 8 6 ): S la tis tic s a n d C au sa l In fcrcn c c . Jo u rn a l o f the American
Stafistical A ssociation 8 1 , pp. 9 4 5 -9 6 0 .
H orow ilz, D o n ald (1 9 9 3 ): C o m p a rin g D c m o cratic S y slc m s . I-n l.a r ry D inm nm l y
M arc ). P ln ltn cr fe d s .). The (ilolu/l R esurgente o f f>cnunni< y. Ila llm tirc . Jolins
llo p k in s U n iv e rsity Press.
Jlsia o , C . (19 8 3 ): Id c n lilic a lio n . l-.n / v i (rilc h e s y M ich a c l In irilig u to r (cds.),
vol. I, / landhook o fl-ononietrics. A m slcrd am . N orlh-I lo lla m l.
1 lulh . Paul (19X8): K x tc n d cd D c lc rrc n c c an d lite O u ib rc a k o f W ;ir. ,1 u ru m Po
ltica! Science R vview X2. n m . 2 (ju n io ). p|>, 4 2 3 -4 4 3 .
, y B ru c e R n ssctl (1 9 9 0 ): T c slin g D c lcrrc n cc T h e o ry : R ig o r M a k c s a UilVcrctv
cc . World PoUtics 4 2 , n m . 4 (ju lio ), pp. 4 6 6 -5 0 1 .
in k e lc s, A lcx , y Peler R o ssi ( l >56): N a lio n a l C o m p a riso n s ol O c c u p a lio n a l Prcstig c . Am erican Jo u rn a l o f Soviolngy 6 1. pp. 329*339.
Iyengar, S a ls, y Jo el I). G re c n h o u se (19X 8): S e lc c o n M o d c ls a n d ihe I ile Drawer
P ro b lcm . S iatistica! Science 3 . n m . I (feb rero ), p. 1 0 9 -135.
Iyeng ar. S h a n to , y D o n n ld K in d e r (1 9 8 7 ): News That M ultis. C h ic a g o , U nivcrsily
o f C h ic a g o P ress.
JcT rcys. Ila ro ld (1 9 6 1 ): Theoty o f Pm hahility. O x fo rd . C la rc n d o n Press.
J c rv is, R o b crl (1 9 7 6 ): P en eptio n antl M ispercepiion in Internatinnol Politicx. Princ c lo n , P rin cc lo n U n iv c rsily P ress.
, R ic h ard N cd L e b o w y Jan ic c C iross S lcin (1 9 8 5 ): P sycluilttgy a n d Deterence.
B altim o re , J o h n s 1 lo p k in s U n iv c rsily Press.
J o n e s. C. L. (1 9 8 1 ): Tlie E tuopean M inele: linvironments. Ecotunnies. and (ieopolitics in thc llis lo r v o f liuropc a n d Asia. C a m b rid g e , C a m b r id g e U n iv c rsily
P ress (cd , c a s te lla n a : E i m ilagro europea. M ad rid : A lia n /a , I 9 9 4 .
Jo b n slo n , J. (1 9 8 4 ): Hconometric M ethads. 3.* c d ., N u ev a Y ork, M c irn w Mili [cd.
ca ste lla n a : M todos d e econam etria. B arcelo n a: V ic cn s-V iv e s, 1994).
K a h n c m n n , D a n iel. P a u l S lo v ik y A m o s T v e rs k y (c d s .) (1 9 X 2 ): Judem e? under
U ncrrtainty: H eu ristics a n d Piases. N ueva Y ork. C a m b rid g e U n iv c rs ily Press.
K a tzc n stc in , Peler J. (1 9 8 5 ): Sm till States in World M urkets: Industrial Policy in hnrope. i (haca. C o rn c ll U n iv crsily P re ss [cd. casi el lana: P equeos estadas en m er
cados mundiales: poltica industrial en lim pa. M ad rid : M in is te rio de T rabajo
y S e g u rid a d S o c ia l. I987J.
K canc. M ark T. (I9XX ): A nalgica/ P m hlrm So/ving. C 'h ich cslcr. 1 ,11is llo rw o o d ,
K ennedy, Paul (1 9 8 7 ); The Rise a n d hall o f the (irvat Powcrs. N u e v a York, R and o m M ottse [cd. c a s te lla n a : A uge r cuida de fas grandes potencias. U arcclona:
Plaza y Jan.s, 19971.
K colianc, R obcrt O. (1 9 8 0 ): T h e T h e o ry o f I Icg cn io n ic S la b ilib y and C liangcs m
In lc m a lio n a l r.c o n o m ic R cg im cs, 1 9 67-1977. I;.n O le R. I lo ls ii, R andolph M.
S iv c rso n y A lc x a iu lc r L. e o r g e (c d s .). Changa in the In tcn u itia n n l System.
D ouldcr, W cstv icw P ress.
(19X4): A ftcr ffeg em on y; Cooperatiim iind D isconl in thc li'orhl / nlitical Economy. P rin cc lo n , P rin c c lo n U n iv c rsily Press.
5551
(19X2): T h e O p e n U n iv c rs c : A A rp u m c n l fo r In clctcrm in ism . E n W. W. O ar1ley 1(1 ( c d ) , Tin' Posiscripl lo fhe f.otiic >/ S cien tiftc Ifisctnvrv. T oto w n , N. J.,
K uw m an a n d I.iltlc lie ld .
P o rtcr, M ic h a e l E. (1 9 9 0 ): The C o m p eilive A ti van/age o f Norton*. N u e v a Y ork,
I ice P ress )cd . c aste lla n a; Ventaja camfyeiiliva de fax tuiciones. B a rce lo n a : P laza
y Jan es, 1*791).
P rzc w o rsk i. A d a n i, y H c n ry T c u n c <1982): The Logic n f Com parntive S o cia l Inquhy. M a la b a r, F lorida. K ric g c r PtiK Iishing C o m p an y .
P saih as. (i'co rj!c (1 9 6 8 ): E lh n o m c tlio d s n n d P h c n o m c n o ltg y . Soda! Reseanft 35,
pp. 5 0 0 -5 2 0 .
P tilnatn. K oberl I)., co n R o h crt L c o n a rd i y UafTacHa Y. N a n c lli (1993): M aking D e m o e tm y lli> ii: t i v i c T m dithm x in M otlern Italy. P rin c c lo n , P rin cc lo n U n iv e rsily Press.
U ajiit, ( lia rle s ( '. (19X 7): The C om paratise M elhotl: M oving heyand QuaU tative
<nu/ {fu a n iiu itive Stm tegiex. U crk clcy . U n iv c rs ily o f C a lifo rn ia P ress.
Uivors. D o u p la s. y M o rris I* F io rin n (19X 9): C o n slilu e n c y S e rv ic e . R cp u ta lio n , a nd
(he in c iim b c n c y A dvm iaj;c. E n M o rris P. ( orina y D av id U ohdc (c d s .), H om e
SVi /r' m iil W ashington IIUil. A m i Arb<r. U n iv c rsily o f M ich ig an Press.
K d bin sn u , NVilliam S. (1 9 9 0 ): E c o lo g ic a ! C o rre la lio n s a n d thc U clinvior o f In d iv i
du is , A m erican Sociolagicnl R cvirw 15, p p. 3 5 1 -3 5 7 .
R o^o w sk i, lo n n ld (19X 7): T ra d c a n d ih c V aricly o f D c m o c ra lic In stifu tio n s . Inteniationa! (h fta n i:u tin n 4 I, n m , 2 (p rim a v e ra ), pp. 20.1-224.
ltisetiau , P a u lin o ( I W d ) : O n e c A g n in tilo th c Fray: hxlcrnnliouM R c tn lio m C o n fionts ilic I lu m a n ilic s . A fillvnium : Jo u rn a l o f h ito nalional Siudie.t 19, n m . I
(p rim a v era), p p . 8 3 -1 1 0 .
lo se n M o n c , S lc v c n l. (19X 3): fh r e c a s d n g P resitleniial Efections. N e w I la v e n ,
Y:ile U n iv c rsily P ress.
R o lh , A Ivh E . (1 9 8 8 ): L a b o ra to ry E x p e rim e n ta l ion in E c o n o m ic s : A M c th o d o lo y ieat O v c rv ic w . TIte E conom ice Journal 9 8 (d ic ie m b re ), pp. 9 7 4 - 1 0 3 1.
U ubin, D o n ald I). (1 9 7 4 ): E s lim a tin g C a u s a l ETccts o f T rca ln ic n ls in R an d o rp iz ed
atuf N o n n u u lo m izcil S tudics. Journal o f Educational l'sychology 66, pp. 6 8 8 -7 0 1 .
(1 9 7 8 ): lla y c s ia n In fcren c c fo r C a u s a l EITccls: T h e R o le o f R an d o m iza tio n ,
The Antuds o fS ta fistic s (>, p p . 3 4 -5 8 .
K u ss e d . H ru c c (1 9 7 8 ) : T h e M a r g in a l U lilily o f In c o m c T ra n s fe rs to th e T h ird
W orld. Internationa! Organ'uation 3 2 . n m . 4 , p p . 9 1 3 -9 2 8 .
Nanday, lq rg y R e v e s (1 9 8 3 ): T h e E lh n o g ra p h ic Paradij>nH s). En John V an M a a ncn (c d .), Q nalitativc M ethodologv. S a p c . le v c rly Mills.
S c h im ip c le r. .lo scp li A . [1 9 3 6 ] ( 1 9 9 1 ) : C a n C a p itn lis m S ttrv iv c ? . En R ic h a rd
S w c d b e r|t (e d .), The E conom ics o f Socio! r>>v a n d Capiiolixm. P rin cc lo n , P rin c e o n U n iv crsily P ress.
S h c p s lc . K en n efh A . (19X 6): In s lilu lto n a l F ju ilih ritim nn d E q u ilib riu m In slrlu tio n s . ln lle r b e r l F. W cisbcrf* (c d .), l'o litic a ! Science: The Science n f ftiliti y . N ueva Y ork. A fjathnn P ress.
S ln v ely , \V P h iH ip s (1 991)): The Croft of P oltico! Research. 3 . ctl , f'n g lc w o o d
( lili*. P ie n iic c -I lall.
S im n . O erbei l A. (I9 K 5 ): H u m a n N a lu re in P o litics: T h e D ialo g u e o f P s y c h o lo g y
w iih P o li eal S c ie n c e . / huerico Polilicol Science Revicw 79. nm . 2 (ju n io ),
pp. 2 9 3 -305.
S k o c p o l. T heda (1 9 7 9 ): States a n d Social Revohttions. C a m b rid g e U niversity P ress.
Indice analtico
7')
anlisis racional, 253 n. 13
Amlcrsoit, Richard, 256
Ansclin, Luc. 253 n. 11. 255
a t ir(acin i los escritos cicnti Ticos, 2728
ren de las relaciones internacionales,
necesidad de describir en el, 55-56
armas nucleares, 158-59
Asaro, Irank, 255
asignacin aleatoria de valores, 105,
126, 2 0 7 -1 1,2 42
d c s c tip liv a
I Ic rm c n s, F. A .. 2 0 1. 258
h e u rstic a de la d is p o n ib ilid a d . 252 n. 3
h ip te s is c au sa l. 5 1
h ip te s is, 29
a p licaci n a la reco g id a y a n lisis de
d a lo s. 23. 2 9 -3 0 . 3 9 -4 0 , 5 6 , 576 0 . 1 8 5 .2 0 3 -4 ,2 3 9 - 4 1
c o m p ro b a rla s c o n d a to s, 2 3 , 30-33.
3 9 -4 1 .5 7 -6 0 . 113-16
c o n cisi n c o m o o b je tiv o d e la s, 30
c o nlrol d e las, 4 0 , 115
e sp e c ific id a d c o m o o b je liv o de las.
30
h a ce rla m s re s tric tiv a , 3 1 -3 2 , 241
papel (lo las, 2 0 - 2 1
p royectos p ilo to a i-c o m p ro b a rla s , 33
reg las para c o n stru irla s . 107-24
su falsabilidad. 3 0
u tiliz a c i n d e m o d e lo s fo rm a le s
para e v alu arlas. I[ i-I7 .
y a u m c n lo d e o b s e r v a c io n e s , 2 3 1 .
234
y cm logcncidad. I9X
I lirsc h m a n , A lb crl (> ..2 1 . 2 5 8
h is to ria e c o n m ic a . 253 n. 7
I in flu a n . Sl.m lcy, 258
H u llan d . Paul. 9 3 . 103. 246 n. 2, 247 ii,
6 . 258
homoccdaslicidad, 250 n. 4
'homogeneidad de las unidades. 102-5,
126-27,241
I loover. Dwigtn. 255
llorowitz, Dona Id. 94. 258
Ils ia o .C .,249 n. 1.258
I lulh. laul, 34, 258
id e a s c om o variab le e x p lic ativ a, 2(1.1
id e n tific a c i n . 2 4 9 n. I
id io m a s,
c o n o cim ien to d e . 137
in cc rlid u m h rc . 170. 226-29
e n la in v e s tig a c i n c i e n t f i c a . 19.
93
in fo rm a r d e s u e x is te n c ia , 4 2 , 88,
106.163
hacha, ejemplo del. 17
Hall. Pcter, 202, 258
Halpcrn, Nina, 203-4, 258
96
m o d elo form al d e . 196
pblico, 66
punto de vista probabilistico, 7(1
Putnnm, Robcrl D., 16, 49, 236, 261
Ragin. Charles. 98. 24K n. I I . 255. 2 6 1
rastreo tic procesos, 97-98, 238-41
razonam iento analgico, 225-26
recogida de dalos. 62-63
cuantilieadn en la, 55
d irectrices para m ejo rarla, 3.1-36.
57-58
fiabilidad como objetivo. 3(>
garantizar la fiabilidad en la. 36,
162
nivel de agregacin. 60. 128
para compensar la variabilidad fun
damental, 227
para maximi/.iir el control, 216-17
proyectos piloto antes tic la, 33
registrar c proceso de, 33-34
reproduccin corno objetivo, 36-37
u tilizacin de m odelos form ales
para la. 62-64. I 16-17
y eficiencia, 227, 242
y el problema del n pequeo. 226-30
rgimen nazi. 201-2
reglas de la inferencia, 16-17. 19. XX
representacin proporcional, I17-IK ,
1 6 4,2 0 0 .2 01 -2
reproduccin, como objetivo de la reco
gida de datos. 36.37
Kcsisfin/ Pm iectionixni, 190-93
resumir Jos dalos, 64-66
estadsticos para. 64*65
reuniones en la cumbre, 189
revoluciones sociales europeas. 139-40
revoluciones. 21
Rivers, Douglas. 261
Robinson, Willinm, 244 n. 12. 2 6 1
Rogowski, Rpnald, 261
Roscnau, Pnuline. 261
Roscnstone. Slevcn, 261, 263
Rossi, Pcter, 157, 258
Roth, Alvin, 249 n, 3. 261
Rubin. Donald. 246 n. 2, 261
Russetl. lrucc, 25H, 261
Ryle, Gilbcrt. 50
y endogeneidad, 19$
teoras causales, 107-8
reglas para construirlas, 107-24
Teunc. Ilenry, 47, 178, 213, 2 16, 261
Tluirshy, Jerry, 256
Tilly, Charles, 146-47,262
Tirle, Jciin, 35, 257
tradiciones m usulm anas en N igeria,
I5X .2I7
Tvcrsky, Amos, 252 n. 3, 258
unidad de la ciencia. 19
unidad de observacin, 62-63, 68, 88X9
y subunidades para mtmcular las ob
servaciones, 233-34
utilizacin de subtinidadcs para aumen
tar las observaciones, 233-34
validez. 35
validez, construir la, 35
valores alpieos, 68
valores esperados, 69
variabilidad fundamental, 70, 224, 2272X. 248 n. 11
variable causal clave. 89
seleccionaren funcin de la, 157
variables aleatorias, 62-63, 6 8-69, 91,
247 n. 7
variables de control, 89
variables tic resullatlo. 89,1 1 8 -2 0
con error de medida. 169-75
precisar sus componentes, 200
seleccionar en funcin de las, 13947. 151-56
su variabilidad fundamental, 227-28
variacin tic las. 139-40,144
variables dependientes, 8 9 ,1 1 8 -2 0
con error de medida, 169*75
precisar sus componentes. 200
seleccionar a partir de las, 139-47,
151-56
su variabilidad fundamental, 227-28
variacin en tas. 139-40, 144
variables explicativas, 89, 133-34
asignacin 1c valores para las, 2 0 7 -11
con error de medida, 169-70, 17378,1X0*81
m m
272
111
ventaja competitiv;. 144
ventaja electoral Id que ya est en el
poder. 89-93
Verba, Siditey, 56. I7K. 205-6. 233. 262
i'tr,\(chcn, 48-49, 52
velo, procedimientos de. 165-66
voto en (Irn Biela a, 66-69
Walton. Donlas, 2'>, 261
W.lt/.. Kennetb. 163. 262
Webb, liigcnc, 262
Weber, Max. 2 1, 198.262
Wciek. Karl, 262
Weiner, Myron, 75. 239. 262
Wendt, Alcxamler, 263
Wolfinger, Kayinoiul, 263
Woods. John. 29. 263
/.clditcli, Morris. 157, 263
/.cllncr. Anm M 30. 248 n. 13. 263
Zimbabtic. 232