Diseño Investiga Social

Gary King, Robert 0.
Keohane
y Sdney Verba
II tfseo de la
investiptip-n
La Tfiferfncia cientfica
en los estudios eua-maftvos
Versin de Jess Cullar Menezo
Alianza Hditoral
de la traduccin: Jess C ullar M enezo. 2000

1994 by Prin ceto n U niversity Press
Ed. cast.: A lianza Editorial, S.A ., M adrid, 2000
Calle Juan Ignacio Luca de Tena, 15; 28027 Madrid; telf. 91 393 88 88
ISBN: 84-206-8697-2
Depsito legal: M. 1.102-2000
Fotocomposicin:
e fc a , s. a .
Polgono L as M onjas; 28850 T orrejn de A rdoz (M adrid)

Printed in Spain
ndice
P re f a c io ......................................................................................................................................
1.
2.
L a c ie n cia en las cie n cia s s o c ia le s ..........................................................................

1. I n tro d u c c i n ................................................................................................................
1.1 D o s fo rm as de investigar, una sola l g ica in fe re n c ia l..........................
1.2 D e fin ic i n de inv estig aci n c ie n tfica en las cien cias so c iales.........
1.3 C ien cia y c o m p le jid a d ....................................................................................
2. P rin c ip a les c o m p o n e n tes del d ise o de in v estig a ci n ...................................
2.1 M e jo ra r las p re g u n ta s de la in v e s tig a c i n ...............................................
2.2 M e jo ra r la te o r a ...............................................................................................
2.3 M e jo rar la calid ad de los d a to s....................................................................
2.4 U tilizar m ejo r los d ato s e x is te n te s .............................................................
3. T em as d e estu d io d e e ste v o lu m e n .....................................................................
3.1 L a u tilizaci n de co n secu en cias ob serv ab les p ara v in cu lar la teo
ra y los d a to s ....................................................................................................
3.2 L a m ax im izaci n d el c o n tro l........................................................................
3.3 A d m itir la in c e rtid u m b re ...............................................................................
3.4 P en sar co m o un c ie n tfic o social: escep ticism o e h iptesis co n tra
p u e stas ..................................................................................................................
L a inferen cia d e sc rip tiv a .............................................................................................
1. E l co n o cim ien to g en eral y los hechos p a rtic u la re s ......................................
1.1 In terp re ta c i n e in fe re n c ia .......................................................................
1.2 S ing u larid ad , co m p le jid ad y s im p lific a c i n .....................................
1.3 E stu d io s de caso c o m p a ra d o s......................................................................
9
13
13
13
17
20
23
24
29
33
37
39
39
39
42
42
45
46
48
53
55
2.
3.
4.
5.
(t.
7.
La inrcrcncia: el fin cien tfico de l;i recocida de d a lo s..... .......................

M odelos formules <lc investgaciti cualitativa.....................................
Un m odelo formal solre b recogida de d atos.............................................
El resumen de Jos pormenores histricos......................................................
La inferencia descriptiva....................................................................................
Criterios para juzgar las in lerendas descriptivas.......................................
7.1 Inferencias no sesgad as............................................................. .................
7.2 E fic ie n c ia ........ ................................ ....................................................... .....
57
W)
(2
64
if
74
74
7f>
3. Causalidad c inHcrencia ca u sa l..............................................................................

1. Definicin de causalidad....................................................................................
I. I D efinicin y un ejem plo cuanlilalivo.....................................................
1.2 Un ejem plo cualitativo............................................................. ..................
2. Clarificacin le las definiciones alternativas de causalidad...................
2.1 M ecanism os cau sales...... ......................................................... ............
2.2 Causalidad m ltiple.................................................................................
2.3 Causalidad simtrica y asim trica..................................................
3. Supuestos necesarios para la estimacin de electos c a u sa le s...................
3 .1 Ilom ogeneidad de las unidades...............................................................
3.2 Independencia condicional.................................................................
4. Criterios para evaluar las inferencias causales.............................................
K7
XX
XX
'M
')<>
*N>
*>X
100
102
102
1
for>
5. Reglas pan elaborar Icorns causales........................... ........................

5.1
5.2
5.3
5.4
5.5
107
Regla I : elaborar teoras lalsables...........................................................

I0X
Regla 2: construir teoras que tenga coherencia interna.................
1 H>
Regla 3: seleccionar cuidadosam ente las variables
dependientes...1 1X
Regla 4: mnximizar lo co n creto ..............................................................
12(1
Regla 5: formular (cortas de forma tan incluyente
com o sea.p osi
b le...............
123
4. Precisar qu va a observarse.....................................................................................
1. Diseos de investigacin im precisos...............................................................
I. I MAs inferencias que ob servacion es... .................................................
1.2 M ulticolincalidad.............................................i..........................................
2. Limites de la seleccin aleatoria......................................................................
3. Sesgo de seleccin ...............................................................................................
3.1 Seleccionar en funcin de la variable d ependiente............................
3.1.1 Ejemplos de sesgo de seleccin producido por el investiga
dor ........................................................................................................
3 .1.2 Ejemplos de sesgo de seleccin producido por el m undo.....
3.2 Seleccionar en funcin de una variable explicativa............................
3.3 Otros tipos de sesgo de Seleccin............................................................
4. Seleccin intencionada de observaciones......................................................
4 . 1 Seleccionar observaciones en funcin tic la variable explicativa....
4.2 Seleccionar un abanico tic valores de la variable dependiente........
4.3 Seleccionar observaciones utilizando tanto las variables explicati
vas com o h s dependientes ........................................................................
4.4 Seleccionar observaciones de manera que la variable causal clavo
sea constante........ .........................................................................................
125
12X
12*>
131
134
IJX
I .W
142
145
147
14')
150
150
15 1
153
157
4.5 Seleccionar observaciones de manera que la variable dependiente

sea constante....................................... ..........................................................
5. Comentarios finales ................................................................... .....................
15*
159
5. Unlendcr que ilebe evitarse............ ........................................................................

1. lirror de medida.....................................................................................................
I. I l:rror de medida sistem tico......................................................................
1.2 Urror de medida no sistem tico.......... ................... ................................
1.2 .1 P,rror <lc medida no sistemtico en la variable dependiente...
1.2.2 f 'rror de medida no sistemAtico en una variable explicativa
2. lixclusiti de variables relevantes: el se sg o .................................................
2.1 ( Y*nu calibrar el se sg o tic Ins variables om itidas................................
2.2 lijem plos de sesgo de la variable omitida ..............................................
3. Inclusin de variables irrelcvanlcs: la in cfic ic n c ia ...............................
4. l.iKlopcneidad.......................................................................... ............. ..............
*1. ( ( 'orregr inlervneiits sesgadas........... ........................................................
4 .2 Precisar citles son los com ponentes de la variable dependiente...,
4.3 Convertir la endogeneidad en un problema de variable om itida....
4.4 Seleccionar observaciones para evitar la endogeneidad... ...............
4.5 Precisar cules son lo* com ponentes de la variable explicativa......
5. A signacin de valores 8 la variable explicativa........................................ .
6. Controlar la situacin que se investiga..........................................................
7. Observaciones fin a le s........................................................................................
161
162
167
169
170
173
178
178
186
193
197
199
200
201
202
205
207
211
218
6. A mentar el nmero de ob servacion es................................................................

1. Inferencias causales con disertos de una sola observacin.......................
1.1 Ustudios de caso cruciales.....................................................................
1.2 Razonamiento a n a l g ico .......................... .................. ..............................
2. Cuntas observaciones son su ficien tes?............................................ .........
3. Aumentar el nmero d e observaciones a partir de unas pocas................
3.1 Las mismas medidas con otras unidades...............................................
3.2 N uevas medidas con las mismas unidades............................................
3.3 Nuevas medidas con nuevas unidades....................................................
4. Observaciones fin a le s.........................................................................................
221
222
222
225
226
230
232
236
237
241
Not;*s ...................................................................................................................................
243
lliblm grafr.i................................................. .............................. ........................... ............
255
indico analtico............................................................................................. ......................
265
Prefacio
t;u este libro se propone un m ism o enfoque para la extraccin de inferen*

cas vlidas. lano causales com o descriptivas, en In investigacin cualitntiva. donde las m edidas num ricas resultan im posibles o no recom endables.
Lo que querem os sealar es que la lgica de un buen proyecto de investiga
cin no difiere fundam entalm ente por q u e ste sea cuantitativo o cualitati
vo. Nuestro enfoque se aplica por igual a estas dos form as de estudio apareulcmcnlc distintas.
Con este libro pretendem os anim ar a los investigadores cualitativos a
que se tomen en serio la inferencia cientfica y la incorporen a su trabajo.
C onfiam os en que nuestra lgica inferencia! nica y el intento de dem ostrar
que puede ser til para los cualitatvistas ayuden a m ejorar los trabajos en
nuestra disciplina y, quiz tam bin, los de otros estudios sociales. Por lo
lano, esperam os que este trabajo lo lean y exam inen de forma critica politlogos y cientficos sociales de todas las tendencias y niveles profesiona
les. desde los investigadores cualitativos hasta los estadsticos, desde los es
tudiantes tic ios ltim os c u rso s de licenciatura y ios que co m ienzan el
doctorado hasta acad m ico s ya asentados. U tilizam os algunas frm ulas
m atem ticas porque resultan esp ecialm ente tiles para clarificar ciertos
conceptos do los m todos cualitativos; sin em bargo, no presuponem os en el
lector conocim ientos m atem ticos o estadsticos, y es posible saltarse la
mayora tic las frm ulas sin perder el hilo argumenta!.
I.as autoridades universitarias suelen decir que la docencia y la investi
gacin son com plem entarias. De hecho, am bas actividades son prctica-
m en te c o in c id c n tc s porque la s d o s entraan la a d q u isici n de i h i o v o s cofioc im ie n to s y su -tra n sm isi n a O tras p erson as. aunque d e una m anera ligera
m e n te d iferen te e n u n o y .otro c a s o , liste lib ro atestigu a el carcter sin cr n i
c o d e am b a s a c tiv id a d e s . D e s d e 1 9 X 9 ,,h e m o s e s ta d o trab ajan d o en e s te
lib ro y d rg ien d o ju n to s en e l d ep artam en to d e g o b iern o d e la U n iversid ad
d e H arvard un se m in a r io d e tercer c ic lo titu lad o M to d o s cu a lita tiv o s en
la s c ie n c ia s s o c ia le s , lil se m in a r io ha sid o m uy a n im a d o y co n frecu en cia
h a co n tin u a d o e n lo s p a sillo s y en lo s largos m en sa jes q u e h em o s-in terca m
b ia d o entre n o so tr o s y c o n n u estro s estu d ian tes. I.as b atallas in te le ctu a les
h a n s id o sie m p r e a m is t o s a s , p ero la s r e g la s d el c o m b a te d ic ta b a n que
a cep ta r el d esa c u e r d o y h a cer c o n c e s io n e s eran g ra v es i le ilo s. S i uno de
n o so tro s no esta b a verd ad eram en te co n v e n c id o de a lg o , cre a m o s q u e n u es
tra o b lig a ci n era con tin u ar el d eb ate. A l fin a l, los au tores a p ren d im os bas
tante unos de o tro s y d e lo s e stu d ia n tes acerca de lo s m to d o s de in v estig a
c i n cu a litativo s y c u a n tita tiv o s, y ca m b ia m o s m u ch o s d e n u estros p u n ios
d e v ista in ic ia le s. A l m argen d e su s o b je tiv o s p rin cip ales, este tib io c o n sti
tu ye una d ecla ra ci n d el e n fo q u e u n n im e d e la in feren cia c ie n tfic a en la
in v estig a ci n cu a lita tiv a al q u e tanto n os c o s i llegar. .
La prim era v ersi n d el lib ro se term in en 1991, y en lo s an os p o sterio
res la h em o s r e v isa d o co n sid er a b lem en te, (ia r y K ing fu e e l prim ero en su
gerir que lo e sc r ib i r a m o s, e s b o z las prim eras v e rsio n es d e la m ayora d e
lo s ca p tu lo s y lle v la v o z can tan te cu el largo p ro ceso d e rev isi n . S in e m
b a rgo , la red a ccin d el lib ro ha sid o alterada en tan gran m ed ida por Robcrt
K c o h a n e y S k ln c y Verba, a si c o m o por el p rop io (ary K in g , qu e n o s resul
tara im p o sib le d eterm in a r d e m anera fia b le la autora d e m u c h o s fragm en
to s y apartados.
Durante e s te la r g o p r o c e s o p a sa m o s borradores a c o m p a e ro s d e tod os
lo s E sta d os U n id o s , a lo s q u e esta m o s m u y a g r a d ecid o s por la extraord in a
ria g en ero sid a d d e s u s c o m e n ta r io s. D a m o s tam bin la s g racias a lo s estu
d ia n tes d e d o cto ra d o , tan to d e Harvard c o m o d e otras u n iv ersid a d es, que
han id o c o n o c ie n d o e l te x to y c u y a rea cci n ha sid o im p ortan te a la hora de
revisa rlo. E s m u y aven tu rad o preten d er m en cion ar a to d o s a q u e llo s q u e lian
co la b o ra d o en un p ro y ecto c o m o este (ca lc u la m o s q u e e x is te una p o s ib ili
d a d d e 0 ,9 2 d e q u e sin d a rn o s cu en ta o m ita m o s a a lg u ie n q u e n o s h aya h e
ch o co m en ta r io s im p o r ta n tes). S in em b argo, q u isira m o s m en cio n a r a las
s ig u ie n te s p erson as: C h risto p h er II. A c h e n .J o h n A ld rich , lla y w a rd AIker.
R ob crt II. D a tes. J a m e s U a ltista , N ath an cl H cek . N a n c y H urns. M ich a el
C o b b , D avid G o llie r . t a r y C o x . M ichacI C . D esch . D avid D cssler. Jorge
D o m n g u e z , G e o r g e D o w n s, M itch ell D u n cicr. M a ilh ew E v a n g elista . John
F crcjohn, A u d rcw ( ie h n a n , A lcx a n d cr ( ic o r g e , Joshua ( io ld s tc iu . Aiulr^w
C ree n , D avid O r e e n . K obin 1 lam ia. M ichacI llis c o x , J a m es L. J o n es, padre.
M ile s Kahler, L li/a b c th K in g , A lcx a n d cr K ozh em iak in . N tcphcn I). Krasncr, Mcrbcrt K rilzcr, J a m es K u k lin sk i, N alh an Lae. 1e le r L an gc. T on y Lavclle', Judy L ayzcr, Jack S . L cvy, D an iel Lili le. S ean L yn n -Jon es. L isa L.
M artin. Ilclen M ilncr, G erardo L. M unck. Trnwthy P. N okken, Joseph S.

Nyc. ( luirlos Kagin. Swarna R ajagopalan, Sham ara Shantu Kiley. David
Rockc, David Kolulc, Francs R osenbluth. David Schw icdcr, C ollins 0 .
ShackcU'ord. padre. Kcnncth Shepslc, Daniel Walsh, Carolyn Warner, Steve
Aviv Yctiv, Mory^Zcrbinos y M ichacl Zrn. Vaya nuestro agradecim iento a
Sicve Voss por confeccionar el ndice analtico y al persona! de Princeton
University Press: W altcr Lippincolt, M atcolm DcBcvoisc, Peter Dougherty
y A lessnndra lo cco . Tam bin dam os las g racias n la N ational Science
l:oundation de los Estados U nidos por la ayuda a la investigacin S 8 R 9223637 que concedi a (ary King. Robcrt O. Keolmne agradece a la John
Simn uggcnlicim Memorial Foundation el perodo de beca que le perm i
ti concluir el trabajo en esle libro.
Los tres autores (ordenados y com binados de diversas m aneras) tuvimos
la inm ensa fortuna de poder presentar versiones anteriores de este libro en
sem inarios y g ru po s de trabajo de las reuniones de la M idwcst Political
Science A ssociation (Chicago, 2-6 de abril de 1990); del G rupo sobre M e
todologa Poltica (U niversidad de Duke, 18-20 de ju lio de 1990); de la
A m eritan Political Seiencc A ssociation (W ashington, D.C., del 29 de agos
to al I de septiem bre de 1991); del Sem inario sobre m etodologa y filosofa
de las ciencias sociales (Universidad de Harvard. C cntcr for International
A flairs, 25 tic septiem bre de 1992); de la serie de coloquios del Intcrdscplinnry C onsortum for Statistical A pplications (U niversidad de Indiana,
4 ile diciem bre d e 1991); del celo de sem inarios del Institutc for Global
Cooperation and C hangc (Universidad de C alifornia, Uerkeley, 15 de enero
de 1993); as com o en la U n iv ersid ad de Illin o is, U rbana-C ham paign
(18 de m arzo de 1993).
O a k y K ino
R o h u r t O . K e o ii n e
S id n e y V e r b a
Cam bridge, Massachusetts
IT
1.
1.
La ciencia en las
ciencias sociales
Introduccin
Este libro trata de la investigacin en las ciencias sociales y tiene un objeti

vo prctico: disear investigaciones que generen inferencias vlidas sobre
la vida social y poltica. Nos centramos en la ciencia poltica, pero nuestro
argumento es aplicable a disciplinas como la sociologa, la antropologa, la
historia, la econom a y la psicologa, as como a reas que no se consideran
una disciplina, como las tcnicas periciales, la investigacin en temas de
educacin y el razonam iento clnico.
Nuestra obra no se ocupa de la filosofa de las ciencias sociales, ni tam
poco es un manual para tareas especficas de la investigacin como el dise
o de encuestas, la realizacin del trabajo de campo o el anlisis de datos e s
tadsticos. En realidad, trata del diseo de la investigacin: de cmo plantear
preguntas y moldear los estudios acadmicos para extraer inferencias des
criptivas y causales vlidas. Por lo tanto, se sita en un zona intermedia en
tre las abstractas polmicas filosficas y las tcnicas prcticas para centrarse
en la lgica intrnseca que subyace en toda investigacin social cientfica.
1.1
Dos formas de investigar, una sola lgica inferendal
Nuestro principal objetivo es relacionar las tradiciones de lo que se suele de

nom inar investigacin cuantitativa y cualitativa m ediante una m ism a
lgica inferencial. Ambas tendencias parecen bastante diferentes y, de he-
cho, a veces se consideran enfrentadas. Para nosotros, tales diferencias slo

son una cuestin de estilo y de tcnicas especficas. Los dos tipos de investi
gacin participan de una m ism a lgica subyacente, que suele explicarse y
formalizarse claramente al analizar mtodos cuantitativos. Sin embargo, esta
lgica inferencial es igual a la que respalda las buenas investigaciones cuali
tativas, y tanto los cualitativistas como los cuantitativistas se beneficiaran si
se le concediera una atencin ms explcita al disear investigaciones.
Los estilos de la investigacin cuantitativa y cualitativa son muy diferen
tes. La prim era se sirve de nmeros y mtodos estadsticos. Suele basarse
en medidas num ricas de ciertos aspectos de los fenmenos; parte de casos
concretos para llegar a una descripcin general o para comprobar hiptesis
causales y busca medidas y anlisis que otros investigadores puedan repro
ducir fcilmente.
Por el contrario, la investigacin cualitativa abarca una amplia gam a de
enfoques, pero, por definicin, ninguno de ellos se basa en medidas num
ricas. Este tipo de trabajo se centra generalm ente en un caso o en un reduci
do nm ero de ellos; se sirve de entrevistas en profundidad o de anlisis de
tallados de m ateriales histricos; utiliza un m todo discursivo e intenta
estudiar de form a global o exhaustiva un acontecim iento o unidad. Los cua1 litativistas, aunque slo tengan un pequeo nm ero de casos, suelen sacar a
la luz en sus estudios una gran cantidad de informacin. A veces, en las
ciencias sociales este tipo de trabajo tiene que ver con estudios de rea o de
caso en los que el centro de atencin es un hecho determinado o una deci
sin, institucin, lugar, problem a o ley. Al igual que en la investigacin
cuantitativa, el objeto de estudio puede ser importante en s mismo: es un
cambio crucial en una nacin, unas elecciones, una decisin transcendental
o una crisis mundial. Por qu se derrum b tan sbitamente el rgimen ger
mano oriental en 1989? De form a ms general, por qu casi todos los reg
menes comunistas de Europa del Este se vinieron abajo en 1989? A veces,
aunque desde luego no siempre, se puede elegir un acontecimiento como
ejemplo de un cierto tipo de hechos, como sera el caso de una revolucin
poltica o de una determ inada com unidad que decide oponerse a la instala
cin de un depsito de residuos. Este tipo de trabajo suele estar relacionado
con estudios de rea en los que se aborda la historia y la cultura de una de
term inada parte del mundo. El lugar o acontecimiento en cuestin se anali
za de cerca y con todo detalle.
Durante varias dcadas, los politlogos han venido contrastando las ven
tajas de los estudios de caso con las de los estadsticos, las de los estudios
de rea con las de los trabajos comparativos, as como las de las investiga
ciones polticas cientficas, que usan m todos cuantitativos, con las de
las histricas, que se basan en una profunda comprensin de las fuentes
escritas o los contextos. Algunos cuantitativistas creen que en las ciencias
sociales el nico camino que lleva a la verdad es el anlisis estadstico sis
temtico. Los partidarios de la investigacin cualitativa se oponen violenta
mente a esta idea. Esta diferencia de opiniones genera una viva polmica,
pero, por desgracia, tambin divide la disciplina en dos ramas, una cuantitativa-sistemtica-generalizadora y otra cualitativa-humanista-discursiva. A
m edida que la prim era aum enta la complejidad de sus anlisis estadsticos
(y su trabajo se hace menos comprensible para los que no han estudiado las
tcnicas), la segunda se convence cada vez ms de que tales anlisis resul
tan irrelevantes para acontecimientos que, como aquellos que interesan a
sus partidarios, no parecen poder reproducirse o generalizarse.
Uno de los principales propsitos de este libro es demostrar que las dife
rencias entre la tradicin cuantitativa y la cualitativa son slo de tipo estils
tico y que su im portancia en trm inos metodolgicos y de contenido es m
nima. Puede considerarse con razn que toda buena investigacin
procede de la misma lgica inferencial subyacente. Tanto los estudios cuan
titativos como los cualitativos pueden ser sistem ticos y cientficos. La
investigacin histrica puede ser analtica si lo que pretende es evaluar di
versas explicaciones m ediante un proceso inferencial causal vlido. La his
toria, o la sociologa histrica, no es incompatible con las ciencias sociales
(Skocpol, 1984, pp. 374-86).
Para romper estas barreras es preciso que comencemos por cuestionar el
concepto mismo de investigacin cualitativa. Hemos utilizado el trmino
en el ttulo de este libro para hacer referencia a nuestro objeto de estudio,
pero sin querer decir con ello que la investigacin cualitativa se diferen
cie fundamentalmente de la cuantitativa, excepto en el estilo.
La mayora de las investigaciones no corresponde claramente a una u otra
categora, y las mejores suelen combinar caractersticas de los dos tipos. En
el mismo proyecto de investigacin, algunos de los datos recogidos pueden
ser objeto de anlisis estadstico, pero no as otros elementos igualmente re
levantes. Las pautas y tendencias del comportamiento social, poltico o eco
nmico son ms susceptibles de anlisis cuantitativo que el flujo de ideas
entre personas o la influencia determinante que tiene un lder extraordinario.
Para entender un mundo social en cambio constante tenemos que barajar in
formacin que no es fcilmente cuantificable y tambin la que s lo es. Ade
ms, todas las ciencias sociales necesitan comparar, lo cual supone que se
evale qu fenmenos se parecen ms o menos en cuestin de grado (o
sea, diferencias cuantitativas) o de tipo (diferencias cualitativas).
Dos m agnficos estudios recientes son ejemplo de este punto de vista.
En Coercive Cooperation (1992), Lisa L. M artin quiso explicar el grado de
cooperacin internacional en materia de sanciones econmicas, analizando
cuantitativamente 99 casos en los que se intent aplicar tales medidas des
pus de la Segunda G uerra Mundial. Aunque este anlisis cuantitativo ofre
ca mucha informacin valiosa, algunas de las inferencias causales que in
dicaban los datos eran ambiguas; de ah que M artin decidiera estudiar en
detalle seis casos de sanciones con la intencin de recabar ms pruebas de
relevancia para su inferencia causal. Para escribir M aking Democracy Work
(1993), Robert D. Putnam y sus colegas entrevistaron a 112 parlamentarios

regionales italianos en 1970, a 194 en 1976 y a 234 entre 1981 y 1982, as
como a 115 lderes comunitarios en 1976 y a 118 entre 1981 y 1982. Tam
bin enviaron por correo un cuestionario a ms de 500 lderes comunitarios
de todo el pas en 1983. Adems, ex profeso para este trabajo, se llevaron a
cabo cuatro encuestas de alcance nacional. No obstante, entre 1976 y 1989
los autores del libro realizaron estudios de caso porm enorizados sobre la
vida poltica de seis regiones. Los investigadores, con la intencin de som e
terse a la prueba del traum a interocular, llegaron a conocer con detalle
las maniobras y personalidades polticas que haban animado la poltica re
gional en las dos ltim as dcadas (Putnam, 1993, p. 190).
Las lecciones de estos anlisis deberan ser claras: cualquiera que sea el
tema de estudio, ni la investigacin cuantitativa ser mejor que la cualitativa
ni al contrario. Dado que muchos asuntos de inters para las ciencias socia
les, si han de tener sentido, no pueden formularse de manera que sea posible
la comprobacin estadstica de hiptesis m ediante datos cuantitativos, no
queremos animar a nadie a que utilice nicamente tcnicas cuantitativas. No
pretendemos sacar de la biblioteca a todos los cientificos sociales para lle
varlos a centros informticos ni sustituir conversaciones irrepetibles por en
trevistas estructuradas. En realidad, lo que sealamos es que los estudios no
estadsticos tendran resultados ms fiables si los investigadores prestaran
ms atencin a las reglas de la inferencia cientfica, que a veces se formulan
mejor con el estilo de la investigacin cuantitativa. Los precisos m todos es
tadsticos que sustentan esta tendencia conform an m odelos formales abs
tractos que son aplicables a todo tipo de investigacin, incluso a aquellas en
las que las variables no pueden medirse cuantitativamente. El carcter extre
madamente abstracto, e incluso poco realista, de los modelos estadsticos es
lo que hace que las reglas inferenciales resalten con tanta claridad.
Las reglas de la inferencia que analizamos no son relevantes para todos
los problemas que los cientficos sociales consideran importantes. Muchos
asuntos cruciales de la vida poltica relacionados con conceptos como el
de accin (agency), obligacin, legitimidad, ciudadana o soberana y con la
correcta relacin entre las sociedades nacionales y la poltica internacio
nal tienen un carcter filosfico ms que emprico. Sin embargo, estas
reglas s que tienen importancia para toda investigacin en la que el objeti
vo sea conocer lo que ocurre en el m undo real. De hecho, lo que distingue a
las ciencias sociales de la observacin ocasional es que la prim era pretende
hacer inferencias vlidas mediante el uso sistemtico de procedimientos de
investigacin contrastados. El hecho de que aqu nos centremos en la inda
gacin emprica supone dejar de lado muchos problem as de la filosofa de
las ciencias sociales, as como las polm icas que se ocupan del papel del
postm odem ism o, del carcter y existencia de la verdad, del relativismo y de
asuntos similares. Partimos de la base de que es posible lograr cierto cono
cimiento del mundo exterior, pero tal conocimiento siempre ser incierto.
Adems, nada en nuestro conjunto de reglas implica que tengamos que

llevar a cabo el experimento perfecto (si es que existe tal cosa) o reunir to
dos los datos relevantes antes de poder extraer inferencias cientficas vli
das. Merece la pena estudiar un asunto importante aunque se disponga de
poca informacin. Si aplicam os cualquier diseo de investigacin a esta
situacin las conclusiones sern relativamente inciertas, pero si se admite
honestamente tal incertidumbre esta clase de estudio ser muy til. Con fre
cuencia, la investigacin social se caracteriza por disponer de una inform a
cin limitada. Como el mundo social cambia rpidamente, los anlisis que
nos ayudan a com prender las transformaciones han de describirlas e intentar
interpretarlas en su contexto, aunque la incertidumbre de nuestras conclusio
nes sea alta. La necesidad de resolver un problema puede ser tan grande que
quiz haya datos recogidos con los mtodos cientficos ms tiles que se
queden obsoletos antes de organizarlos. Si una persona enloquecida corre
hacia nosotros blandiendo un hacha, puede que entregarle un cuestionario de
cinco pginas sobre psicopata no sea la mejor estrategia. Joseph Schumpeter cit una vez a Albert Einstein, que haba dicho que siempre que nues
tras proposiciones sean ciertas no dirn nada acerca de la realidad, y siempre
que no digan nada acerca de la realidad, no sern ciertas (Schum peter
[1936], 1991, pp. 298-299). Sin embargo, aunque la certeza no pueda alcan
zarse, la seguridad en nuestras conclusiones, as como su fiabilidad, validez
y sinceridad, podrn incrementarse si prestamos atencin a las reglas de la
inferencia cientfica. Las ciencias sociales que propugnamos pretenden ex
traer del mundo inferencias descriptivas y causales. Los que no comparten la
premisa de que es posible un conocimiento parcial e imperfecto ni aspiran a
una comprensin descriptiva y causal tendrn que buscar en otra parte inspi
racin o batallas sobre paradigmas en las que participar.
En resumen, aqu no se dan recetas para la investigacin cientfica em p
rica. Ofrecemos ciertos preceptos y reglas cuya intencin es disciplinar el
pensamiento, no sofocarlo. Tanto en la investigacin cuantitativa como en
la cualitativa aplicamos de m anera imperfecta reglas inferenciales tericas
a diseos de investigacin y a datos empricos inherentemente imperfectos.
Toda reglamentacin que tenga sentido admitir excepciones, pero hay que
pedir que stas se justifiquen de manera explcita, que se evalen sus con
secuencias para la fiabilidad de la investigacin y que se plantee la incerti
dumbre de las conclusiones. No buscam os un dogma, sino un pensamiento
disciplinado.
1.2
Definicin de investigacin cientfica en las ciencias sociales
Nuestra definicin de investigacin cientfica es un ideal al que toda in

vestigacin cuantitativa y cualitativa, incluso la ms cuidadosa, slo puede
aproximarse. Sin embargo, necesitam os definir lo que es una buena investi
gacin, y para ello utilizam os la palabra cientfica como calificativo

Esta palabra tiene m uchas connotaciones injustificables, inapropiadas o,
para m uchos investigadores cualitativos, com pletam ente incendiarias. De
ah que nosotros le dem os una definicin explcita. Tiene que quedar claro
que no consideram os m s cientfica la investigacin cuantitativa que la
cualitativa. El estilo de una buena investigacin o sea, la que es cientfi
ca puede ser cuantitativo o cualitativo. Sin embargo, en lo tocante al di
seo, la investigacin tiene estas cuatro caractersticas:
1.
E l o b je tiv o es la in fe ren cia
El diseo de la investigacin cientfica tiene com o objetivo la extraccin de inferencias

descriptivas o explicativas a partir de la inform acin em prica que se tenga del m undo.
Para hacer estudios cientficos suele ser indispensable describir con cuidado ciertos fe
nm enos, pero la acum ulacin de hechos no es. en s m ism a, suficiente. Estos pueden
ser reunidos (por investigadores cualitativos o cuantitativos) de form a m s o m enos sis
tem tica, y, evidentem ente, la prim era es m ejor que la segunda; sin em bargo, nuestra
definicin de ciencia conlleva un paso adicional, que es el de utilizar los datos inm edia
tos para hacer inferencias que conduzcan a algo m s am plio que no se observa directa
m ente. Ese algo puede entraar una inferencia descriptiva utilizar observaciones del
m undo para revelar otros hechos que no se han observado o una inferencia causal
conocer efectos causales a partir de los datos observados. El alcance de la inferencia
puede delim itarse en el espacio y el tiem po el com portam iento electoral en las elec
ciones estadounidenses desde 1960, los m ovim ientos sociales en Europa del Este desde
1989 o puede ser ms general el com portam iento hum ano desde la aparicin de la
agricultura. En cualquiera de los casos, lo que distingue la investigacin cientfica es el
objetivo de hacer inferencias que vayan m s all de las observaciones especficas que se
han recogido.
2.
L o s p r o c e d im ie n to s so n p b lic o s
Para generar y analizar datos la investigacin cientfica utiliza m todos explcitos, codi
ficados y p blicos que, por lo tanto, pueden evaluarse. Gran parte de la investigacin
social cualitativa sigue procedim ientos de bsqueda o inferenciales m enos precisos.
C om o afirm Robert K. M erton ([1949], 1968, pp. 71-72): El anlisis sociolgico de
datos cualitativos suele depender de un m undo privado de ideas penetrantes pero inson
dables y de interpretaciones inefables [...] [Sin em bargo,] la ciencia [...] es pblica, no
privada. La afirm acin de M erton no es aplicable a todos los cualitativistas (y, por des
gracia, s a algunos cuantitativistas), pero m uchos se com portan com o si carecieran de
m todo y, a veces, com o si la utilizacin de m edios explcitos m enoscabara su creativi
dad. N o obstante, no pueden dejar de utilizar alguno. De alguna form a observan los fe
nm enos, plantean preguntas, extraen inform acin sobre el m undo a partir de esas ob-
servaciones y hacen inferencias sobre causas y consecuencias. Si el m todo y la lgica

de las observaciones e inferencias de un investigador no se hacen explcitos, la com uni
dad acadm ica no tiene form a de juzgar la validez de lo que se ha hecho. N o podr eva
luar los principios de seleccin utilizados para registrar las observaciones, ni cm o se
han procesado stas, ni la lgica de las conclusiones. N o podrem os aprender de sus m
todos ni reproducir sus resultados. Esta investigacin no ser un hecho pblico. Aunque
sea una buena lectura, no ser una aportacin a las ciencias sociales.
Todos los m todos sean o no explcitos tienen sus lim itaciones. La ventaja de
lo explcito es que pueden captarse tales lim itaciones y, si es posible, rem ediarlas. A de
ms, los m todos se pueden ensear y com partir. Este proceso perm ite que los resulta
dos de la investigacin se com paren con los de otros investigadores, que se reproduzcan
los estudios de proyectos ajenos y que los acadm icos aprendan.
3.
L a s c o n c lu sio n e s so n in cierta s
La inferencia es, por definicin, un proceso im perfecto. Su objetivo es utilizar datos

cuantitativos y cualitativos para conocer el m undo que los ha producido. Evidentem en
te, es im posible llegar a conclusiones perfectam ente ciertas utilizando datos inciertos.
De hecho, la incertidum bre es un aspecto crucial de toda investigacin o conocim iento
del m undo. Si este factor no se calcula de m anera razonable, no se podr interpretar nin
guna descripcin del m undo real ni ninguna inferencia causal que le afecte. Un investi
gador que no contem ple abiertam ente la incertidum bre estar afirm ando que lo sabe
todo a la perfeccin o que no tiene ni idea de la certeza o incertidum bre de sus resulta
dos. En cualquier caso, las inferencias que carecen de un clculo de incertidum bre no
son ciencia tal com o aqu se define.
4.
E l co n te n id o es el m to d o
Para term inar, la investigacin cientfica propugna un conjunto de norm as inferenciales

de las que depende su validez. E xplicar las m s im portantes es una de las tareas prim or
diales de este lib ro 2. El principal contenido de la ciencia son sus m todos y reglas, no
su objeto de estudio, ya que podem os utilizar tales m todos para estudiar prcticam ente
todo. Esta idea fue aceptada hace unos cien aos cuando Karl Pearson (1892, p. 16) ex
plic que el cam po de la ciencia es ilim itado; su m ateria es infinita; cada conjunto de
fenm enos naturales, cada fase de la vida social, cada estadio del desarrollo pasado o
presente es m ateria cientfica. La unidad de todas las ciencias se basa nicam ente en su
m todo, no en su m ateria.
A su vez, estas cuatro caractersticas tienen otra consecuencia: cuando la

ciencia es buena, es una empresa social. Eltrabajo de todo investigador o
equipo de investigadores est sometido a limitaciones de conocimiento e
ideas y los errores son inevitables, pero es probable que otros los sealen.
Comprender el carcter social de la ciencia puede resultar liberador, ya que

implica que nuestro trabajo no tiene que estar por encima de la crtica para
hacer una aportacin importante ya sea en cuanto a la descripcin de un
problema o a su conceptualizacin, a la teora o a la evaluacin de una en
concreto. Una aportacin ser posible siempre que nuestro trabajo contem
ple explcitamente (o pretenda reinterpretar) las preocupaciones de la co
munidad acadm ica y utilice m edios pblicos para hacer inferencias que
respeten las reglas cientficas y la informacin de que disponemos. Incluso
la aportacin de un artculo m enor ser siempre m s grande que la de un
trabajo importante que permanezca para siempre en un cajn o confina
do en un ordenador.
1.3
Ciencia y complejidad
Las ciencias sociales pretenden explicar situaciones del m undo social que
consideramos ms o menos complejas. Sin embargo, hay que reconocer que lo
que percibim os como com plejidad no es algo inherente a los fenmenos:
el mundo no est dividido de form a natural en conjuntos de acontecim ien
tos simples o complejos. Por el contrario, la com plejidad que se percibe en
una situacin depende en parte de en qu medida podemos sim plificar la
realidad adecuadamente, y nuestra capacidad de sim plificar depende de si
podemos extraer con coherencia resultados y variables explicativas. Tener
ms observaciones puede ayudam os en este proceso, pero suele resultar in
suficiente. Por lo tanto, la complejidad depende, en parte, del estado de
nuestra teora.
Los mtodos cientficos pueden ser tan valiosos para acontecim ientos
intrnsecamente complejos como para otros ms simples. Es probable que
la complejidad haga ms inciertas nuestras inferencias, pero no tiene por
qu hacerlas menos cientficas. La incertidumbre y unos datos limitados no
tienen que llevamos a abandonar una investigacin cientfica. Por el contra
rio: la compensacin ms grande a la hora de utilizar las reglas de la infe
rencia cientfica se logra precisamente cuando los datos son limitados, los
instrumentos de observacin tienen defectos, las medidas no estn claras y
las relaciones son inciertas. Si hay relaciones claras y datos no ambiguos,
quiz el mtodo no sea tan importante, ya que incluso reglas o inferencias
defectuosas podran producir respuestas medianamente aceptables.
Consideremos algunos acontecimientos com plejos y, en cierto sentido,
nicos que tuvieron enormes ramificaciones. La cada del Imperio romano,
la Revolucin francesa, la G uerra Civil de los Estados Unidos, la Primera
G uerra M undial, el holocausto y la reunificacin alem ana de 1990 son
ejemplos de este tipo. El que estos acontecimientos tuvieran lugar parece
ser el resultado de una compleja interaccin de muchas fuerzas cuya con
juncin se antoja crucial para que as fuera. Esto quiere decir que series de
acontecim ientos y de fuerzas, cuyas causas son independientes entre s,

convergieron en un lugar y m om ento determinados, de manera que su inte
raccin parece que ocasion los acontecim ientos que se observan (Hirschman, 1970). Adems, suele ser difcil creer que tales acontecimientos fue
ran consecuencias inevitables de fuerzas histricas a gran escala: algunos
parecen haber dependido, en parte, de la idiosincrasia de ciertas personali
dades, instituciones o movimientos sociales. De hecho, desde el punto de
vista de nuestras teoras, con frecuencia el azar parece haber tenido su pa
pel: factores que se encuentran fuera del alcance de la teora vincularon de
form a determ inante la sucesin de los acontecimientos.
Una de las formas de com prender estos hechos es mediante la bsqueda
de generalizaciones, que conceptualizan cada caso dentro de un tipo de
acontecimientos del que se puede decir que tiene una serie de caracters
ticas generales. Este mtodo suele funcionar bien para guerras o revolucio
nes ordinarias, pero algunos de estos procesos, al ser mucho ms extremos
que otros, constituyen valores atpicos en la distribucin estadstica.
Adems, hay guerras o revoluciones precursoras de gran importancia que
pueden tener una influencia tan considerable en fenmenos posteriores del
mismo tipo pensamos de nuevo en la Revolucin francesa que hay que
tener cuidado al compararlas con sus secuelas, ya que, en cierto sentido, s
tas pueden ser fruto de la im itacin. Expandir el tipo de acqntecim iento
puede ser til, pero no siempre resulta apropiado.
Tambin se puede proceder de m anera cientfica con acontecim ientos
peculiares de gran m agnitud utilizando un anlisis contrafctico, que es
la construccin mental de una serie de acontecimientos que se altera m e
diante la m odificacin de una o ms condiciones (Weber [1905], 1949,
p. 173). La aplicacin de esta idea de form a sistemtica y cientfica se pone
de m anifiesto en un ejemplo especialm ente extremo de un peculiar aconte
cim iento de la geologa y la biologa evolutiva, ciencias naturales con
orientacin histrica. Stephen J. Gould ha indicado que una de las formas
de distinguir entre caractersticas evolutivas sistemticas y acontecimientos
estocsticos, aleatorios, puede ser imaginar cmo sera el mundo si se fija
ran todas las condiciones, hasta un determ inado punto, y se volviera a dar
cuerda al resto de la historia. Seala que si fuera posible volver a poner en
marcha la cinta de la vida y dejar que la evolucin tuviera de nuevo lugar
desde el principio, los organism os del mundo actual seran completamente
diferentes (Gould, 1989a).
Un acontecimiento nico en el que se han centrado ltimamente los que
estudian la evolucin es la sbita desaparicin de los dinosaurios hace 65
m illones de aos. Gould (1989a, p. 318) afirm a que debemos aceptar que
nuestra conciencia no se habra desarrollado en el planeta si una catstrofe
csmica no se hubiera cobrado la vida de los dinosaurios. Si tal afirm a
cin fuera cierta, la extincin de estos anim ales habra sido para los seres
hum anos tan importante como cualquier otro hecho histrico. Sin embargo,
ESiEi-
21*
su desaparicin no se ajusta con propiedad al tipo de acontecimientos que

se podran estudiar directam ente de forma sistem tica y comparativa m e
diante la aplicacin de leyes generales.
No obstante, la extincin de los dinosaurios puede abordarse cientfica
mente, ya que se pueden desarrollar hiptesis alternativas y contrastarlas
con sus consecuencias observables. Una de las hiptesis que explican este
fenmeno, que desarrollaron Luis lvarez y sus colaboradores de Berkeley
a finales de los aos setenta (W. lvarez y Asaro, 1990), postula que hubo
una colisin csmica: un m eteorito choc con la Tierra a unos 72.000 kil
metros por hora, lo cual gener una explosin m ayor que la de una guerra
nuclear total. Si esta hiptesis fuera correcta, su consecuencia observable
sera que el iridio (un elem ento habitual en los meteoritos, pero escaso en la
Tierra) se encontrara en una determ inada capa de la corteza terrestre que
corresponde a los sedim entos depositados hace 65 millones de aos; de he
cho, el descubrimiento de este metal en las capas que se haba pronosticado
se ha considerado una prueba que confirm a parcialm ente esta teora. A un
que este acontecimiento es sin duda nico, hay otras muchas consecuencias
observables. Para dar slo un ejemplo, tendra que ser posible encontrar el
crter del m eteorito en algn lugar de la Tierra (y ya se han encontrado al
gunos candidatos)3.
El problem a que plantea la causa (o causas) de la extincin de los dino
saurios sigue sin resolverse, aunque la polm ica ha generado investigacio
nes muy valiosas. Por lo que a nosotros respecta, la im portancia de este
ejem plo radica en que las generalizaciones cientficas son tiles incluso
cuando se estudian acontecim ientos muy poco habituales que no pertene
cen a un tipo importante. La hiptesis de lvarez no puede contrastarse con
un conjunto de acontecim ientos normales, pero s tiene consecuencias ob
servables en otros fenmenos evaluables. Sin embargo, hay que sealar que
una hiptesis no se considera una explicacin razonablemente cierta hasta
que no se evala em pricam ente y se som ete a ciertas pruebas estrictas.
Como mnimo, sus consecuencias deben ser compatibles con nuestro cono
cim iento del mundo exterior, y cuando la hiptesis es realmente buena debe
predecir lo que Imre Lakatos (1970) denom ina hechos nuevos, o sea,
aquellos que no se haban observado hasta entonces.
La cuestin es que incluso acontecimientos aparentemente nicos, como
la extincin de los dinosaurios, pueden estudiarse de form a cientfica si nos
ocupamos de mejorar las teoras, los datos y la form a de utilizarlos. M ati
zar nuestra teora m ediante la clarificacin conceptual y la especificacin
de variables puede generar ms consecuencias observables e incluso poner
a prueba teoras causales referidas a acontecimientos nicos como la extin
cin de los dinosaurios. Perfeccionar nuestros datos nos perm itir contem
plar un mayor nmero de consecuencias observables, mientras que utilizar
los m ejor har posible que extraigam os m s consecuencias de ellos. El
hecho de estudiar acontecim ientos muy com plejos no hace irrelevante la
realizacin de un cuidadoso diseo de investigacin. Si recogemos datos

sobre la mayor cantidad posible de consecuencias observables de nuestra
teora, el estudio mejorar, independientemente de que estemos barajando
m uchos o pocos fenmenos o incluso uno.
2.
Principales componentes del diseo de investigacin
Cuando la investigacin social es de calidad, constituye un proceso creativo

en el que la intuicin y el descubrimiento surgen dentro de una consolidada
estructura de estudio cientfico. Para el cientfico social de primera catego
ra el diseo de una investigacin no es un programa que haya que seguir
m ecnicamente para recoger y evaluar datos. Por el contrario, el investiga
dor debe ser lo suficientem ente flexible como para rechazar las viejas for
m as de mirar el mundo y plantear nuevas preguntas, revisar los diseos de
investigacin apropiadam ente y recoger despus datos diferentes de los que
haba pensado en un principio. Sin em bargo, para que sus conclusiones
sean vlidas y aceptables para los expertos del rea, todas estas revisiones y
nuevas consideraciones han de producirse siguiendo procedimientos expl
citos que respeten las normas de la inferencia. Un proceso de investigacin
dinm ico tiene lugar dentro de una normativa estable.
Con frecuencia, los cientficos sociales comienzan sus investigaciones
con un diseo ponderado, recogen algunos datos y extraen conclusiones.
Sin embargo, el proceso no suele carecer de obstculos,, y este orden no
siempre es el mejor, ya que las conclusiones pocas veces se desprenden f
cilmente del diseo de investigacin y de los datos que se recogen de acuer
do con l. Una vez que el investigador ha reunido esos datos, tal como indi
caba su proyecto, a m enudo se encontrar con que el engarce entre las
principales preguntas de la investigacin, la teora y los datos disponibles
es imperfecto. En este momento, suele cundir el desnimo y se cree, equi
vocadamente, que otros cientficos sociales hallan un vnculo estrecho e in
mediato entre datos e investigacin. Esta percepcin se debe a que con fre
cuencia los investigadores retiran los andam ios despus de levantar sus
edificios intelectuales, sin dejar apenas rastro de las penalidades e incertidum bres de la construccin. De ah que el proceso investigador parezca
ms mecnico y previsible de lo que realmente es.
Algunos de nuestros consejos van dirigidos a los investigadores que in
tentan relacionar la teora y los datos. A veces pueden concebir procedi
mientos de recogida de datos ms apropiados para la mejor evaluacin de
una teora; en otras ocasiones pueden utilizar los datos de que disponen y reformular una pregunta terica (o incluso plantear otra completamente dife
rente que no se contempl en un principio) con el fin de generar un proyecto
de investigacin ms importante. Si el'estudio sigue las normas inferenciales,
seguir siendo cientfico y producir inferencias fiables acerca del mundo.
Siempre que sea posible, los investigadores deben tambin perfeccionar

el diseo de su investigacin antes de llevar a cabo cualquier trabajo de
campo. Sin embargo, los datos disciplinan el pensamiento a su manera. Es
muy habitual que un diseo excelente haga aguas cuando se recogen las
primeras observaciones: no es que la teora est equivocada, sino que los
datos no son apropiados para responder a las preguntas planteadas en un
principio. Entender desde el comienzo lo que se puede y no se puede hacer
en las etapas finales puede ayudar al investigador a prever, al menos, algu
nos problemas cuando haga el prim er diseo de investigacin.
Para un mejor anlisis, dividimos todos estos diseos en cuatro partes: la
pregunta de la investigacin, la teora, los datos y la utilizacin de los da
tos. Estos componentes no suelen desarrollarse por separado y los estudio
sos no se ocupan de ellos con un orden preestablecido. De hecho, para los
cualitativistas que comienzan el trabajo de campo antes de elegir una pre
gunta precisa para su investigacin, prim ero van los datos y despus lo de
ms. Sin embargo, esta peculiar ruptura, que explicamos entre los aparta
dos 2.1 y 2.4 de este captulo, es especialm ente til para com prender el
carcter de los diseos de investigacin. Con el fin de determ inar con pre
cisin lo que podra hacerse si se reorientaran los recursos, nuestros conse
jos en el resto de este apartado presuponen que el investigador dispone de
tiempo y medios ilimitados. Evidentemente, en cualquier investigacin real
siempre hay que hacer concesiones. Creemos que si el investigador entien
de los consejos que damos para los cuatro componentes, esto le ayudar a
hacer concesiones que mejoren al mximo el proyecto de su investigacin,
aunque sta sea objeto de condicionantes extemos.
2.1
Mejorar las preguntas de la investigacin
A lo largo de este libro se plantea qu hacer una vez que identificamos el

objeto de estudio. Cuando hay una pregunta para la investigacin, cmo
podemos llevar sta a cabo para dar explicaciones vlidas a los fenmenos
sociales y polticos? Nuestro anlisis com ienza con una pregunta para la in
vestigacin y contina despus con las fases de diseo y realizacin. Pero,
dnde se originan las preguntas de un estudio? Cmo elige un investiga
dor el tem a de anlisis? No hay respuesta sencilla a estas preguntas. Al
igual que otros autores, Karl Popper (1968, p. 32) ha sealado que no
existe algo que pueda llamarse mtodo lgico para tener nuevas ideas [...]
El descubrimiento contiene un elem ento irracional o una intuicin crea
tiva. En los primeros estadios del proceso de investigacin, las normas de
eleccin estn menos formalizadas que las de otras actividades de ese m is
mo proceso. En el rea de la eleccin social existen textos que tratan sobre
cmo disear experimentos de laboratorio; en estadstica hay criterios para
seleccionar la muestra de una encuesta que trate sobre las actitudes respec
to a una poltica, y tam bin existen m anuales para llevar a cabo observa
cin participante en una oficina. Sin embargo, no hay reglas que indiquen
cmo elegir el proyecto de investigacin que se va a realizar y, si decidimos
llevar a cabo trabajo de campo, tam poco las hay para indicarnos dnde te
nemos que hacerlo.
Podemos proponer m aneras de hacer una muestra de comunidades con
el fin de estudiar el impacto de diferentes polticas educativas o formas de
conceptualizar los conflictos tnicos que nos lleven a la formulacin y com
probacin de hiptesis relativas a su incidencia. Sin embargo, no existen
normas que nos indiquen si hay que estudiar la poltica educativa o el con
flicto tnico. Desde el punto de vista de la metodologa de las ciencias so
ciales, hay form as m ejores y peores de estudiar la cada del rgim en de
Alem ania del Este en 1989, al igual que las hay para abordar la relacin en
tre las opiniones de un candidato en m ateria fiscal y sus probabilidades de
xito electoral. Sin embargo, no hay ninguna manera de determ inar si es
mejor estudiar la cada del rgimen germ ano oriental o el papel de los im
puestos en las elecciones estadounidenses.
El tem a concreto que estudia un cientfico social puede tener un origen
personal e idiosincrsico. N o es casual que, habitualmente, sean los m iem
bros de un grupo los que com iencen a estudiarlo: las mujeres han solido
llevar la batuta en la historia de su propio gnero, los negros en la de su et
nia y los inmigrantes en la de la emigracin. Los temas tambin pueden
verse influidos por inclinaciones o valores personales. Es probable que
quien estudia el Tercer M undo tenga ms ganas de viajar ^ tolere m ejor
condiciones de vida difciles que el que se ocupa de la elaboracin de pol
ticas en el Congreso estadounidense, del m ismo modo que quien analice la
cooperacin internacional puede tener una especial aversin a los conflictos
violentos.
Estas experiencias y valores personales suelen proporcionar la motiva
cin para convertirse en un cientfico social y, posteriormente, para elegir
una determ inada pregunta de investigacin. En consecuencia, pueden ser
las autnticas razones para embarcarse en un determinado proyecto, y es
justo que sea as. Sin embargo, independientemente de lo personales o pe
culiares que sean las razones para elegir un tema, los mtodos cientficos y
normas inferenciales que se analizan en este libro ayudarn a los acadm i
cos a hacer proyectos de investigacin ms slidos. Desde el punto de vista
de la posible aportacin a las ciencias sociales, las razones personales no
son ni necesarias ni suficientes para justificar la eleccin de un tema. En la
mayora de los casos, no tendran que aparecer en los escritos acadmicos.
Para decirlo de manera ms directa pero menos delicada, a nadie le im porta
nuestra opinin: a la com unidad acadm ica slo le interesa lo que podemos
demostrar.
Aunque no existan norm as precisas para elegir un tema, s hay maneras
de determ inar aparte de las preferencias personales la posible trans-
cenuw.w^ Mu t nene para la com unidad cientfica una empresa investigadora.

Lo ideal sera que todos los proyectos de investigacin de las ciencias so
ciales cumplieran dos condiciones. En primer lugar, un proyecto de investi
gacin tiene que plantear una pregunta importante para el mundo real.
El tem a ha de ser relevante para la vida poltica, social o econmica, para
entender algo que afecte de manera significativa a la vida de muchas perso
nas o para com prender o predecir acontecim ientos que pudieran resultar da
inos o beneficiosos (vase Shively, 1990, p. 15). En segundo lugar, un
proyecto de investigacin tiene que hacer una aportacin concreta a lo es
crito en un rea acadmica identificable, aumentando la capacidad colecti
va de dar explicaciones cientficas verificables a algn aspecto del mundo.
Esta segunda condicin no supone que todas las investigaciones que apor
ten algo a nuestra reserva de explicaciones para las ciencias sociales preten
dan en realidad hacer inferencias causales. En ocasiones, la situacin del
conocim iento en un determ inado cam po hace que se precisen muchos datos
y descripciones antes de afrontar el reto de dar una explicacin. A veces, la
aportacin de un proyecto slo es la inferencia descriptiva, mientras que en
otras el objetivo ni siquiera es hacer tal inferencia, sino nicam ente observar
de cerca ciertos acontecim ientos o hacer un resumen de hechos histricos.
Sin embargo, en este caso se cumple nuestra segunda condicin, porque ta
les acontecim ientos son un requisito imprescindible para la explicacin.
La prim era condicin dirige nuestro inters al mundo real de los fenm e
nos polticos y sociales, y tam bin a cmo se registran los acontecimientos y
problemas actuales e histricos que configuran la vida de las personas. D e
term inar si una pregunta de investigacin cumple dicho criterio es algo prin
cipalmente social. La segunda condicin nos sita en la bibliografa acad
mica de las ciencias sociales, es decir, en las perplejidades intelectuales que
no se han planteado todava, en las que estn por resolver, as como en las
teoras y mtodos cientficos de que se dispone para resolverlas.
A los politlogos no les resulta difcil encontrar un objeto de estudio que
cum pla la prim era condicin. A lo largo de los ltimos cuatrocientos aos
diez guerras im portantes se han cobrado la vida de casi treinta millones de
personas (Levy, 1985, p. 372); algunas guerras limitadas, como las que
libraron los Estados Unidos y Vietnam del N orte, o Irn e Irak, han produ
cido cada una un nm ero de vctim as cercano al milln; del mismo modo,
si hubiera una guerra nuclear, sta podra elim inar a miles de m illones de
seres hum anos. La m ala gestin de los polticos, tanto en el m bito na
cional como en el internacional, ha generado como en los aos treinta
privaciones econmicas de carcter global y crisis regionales y locales, tal
com o lo dem uestran las trgicas experiencias de gran parte de frica y
Amrica Latina durante los aos ochenta. En general, las variaciones entre
pases en lo tocante a instituciones polticas se relacionan con las diversas
condiciones de la vida ordinaria, las cuales se reflejan en la diferente espe
ranza de vida o m ortalidad infantil que tienen pases con un grado de desa
rrollo econmico similar (Russett, 1978, pp. 913-28). Dentro de los Esta
dos Unidos, la eficacia de los programas que combaten la pobreza o la de
sarticulacin social parece haber variado de forma considerable. No cabe
duda de que ser importante toda investigacin que contribuya, aunque sea
de form a marginal, al conocim iento de estos problemas.
Aunque los cientficos sociales tienen muchas cuestiones significativas
que investigar, las herram ientas para entenderlas son escasas y poco elabo
radas. Hay muchos escritos sobre la guerra o el sufrimiento en las socieda
des que poco contribuyen a la com prensin de tales problemas porque no
los describen de forma sistem tica o no hacen inferencias causales o des
criptivas vlidas. Las ideas brillantes pueden m ejorar la com prensin al
aportar nuevas e interesantes hiptesis, pero la brillantez no es un mtodo
de investigacin emprica. Todas las hiptesis han de ser contrastadas em p
ricam ente antes de que hagan una aportacin al conocimiento. Este libro no
da consejos sobre cmo ser brillante. Sin embargo, lo que s puede hacer es
recalcar la im portancia de que la investigacin se lleve a cabo de manera
que constituya una aportacin al conocimiento.
Nuestro segundo criterio para elegir una pregunta de investigacin, ha
cer una aportacin, significa explcitamente que hay que situar el diseo
del estudio dentro del marco de la bibliografa cientfica existente. Esto ga
rantiza que el investigador com prende el estado de la cuestin y reduce
al mnimo la posibilidad de repetir lo que ya se ha hecho. Tambin garanti
za que el trabajo sea im portante para otros, aumentando as el xito del
conjunto de la com unidad acadmica. Se puede hacer una aportacin expl
cita a lo escrito sobre el tem a de varias maneras. A continuacin se enume
ran algunas de ellas:
1.
Eligiendo una hiptesis que los estudiosos consideren im portante en la biblio

grafa pero de la que no se haya realizado un estudio sistem tico. Si encontra
m os pruebas a favor o en contra de la hiptesis, estarem os haciendo una aporta
cin.
2.
Eligiendo una hiptesis aceptada en la bibliografa que sospechem os es falsa (o

cream os que no se ha dem ostrado adecuadam ente) e investigando si realmente
lo es o si otra teora es correcta.
3.
Intentando resolver o presentando m s pruebas a favor de uno de los bandos en

una polm ica que est presente en lo escrito hasta el m om ento; dem ostrando
quiz que toda esa polm ica careca de fundam ento desde el principio.
4.
D iseando investigaciones que arrojen luz o evalen prem isas no cuestionadas

por la bibliografa.
5.
Sealando que en la bibliografa no se ha concedido atencin a un asunto im

portante y proceder a continuacin a aportar a ese cam po un estudio sistemtico.
6.
Sealando que las teoras o pruebas relativas a cierto objetivo en un cam po po

dran aplicarse a otro para solucionar un problem a existente, pero aparentem en
te alejado.
Si nos preocupamos demasiado por hacer una aportacin a la bibliogra

fa acadmica sin prestar cierta atencin a asuntos importantes para el m un
do real, correremos el riesgo de form ular preguntas insignificantes desde el
punto de vista poltico. Por el contrario, centrarse en el contexto poltico ac
tual sin preocuparse de hasta qu punto un problema social es susceptible
de investigarse sistemticamente dentro del marco de un cuerpo de conoci
miento conduce a trabajos descuidados que poco aaden a una compren
sin profunda.
Nuestros dos criterios para elegir preguntas de investigacin no son ne
cesariamente opuestos. A largo plazo, la comprensin de los fenmenos del
mundo real aumenta con la elaboracin y evaluacin de hiptesis explicati
vas que propugna el mtodo cientfico. Sin embargo, de form a ms inm e
diata, puede haber contradiccin entre lo que es til desde el punto de vista
prctico y lo que finalmente tiene valor. Por ejemplo, Mankiw (1990) sea
la que la teora macroeconmica y la m acroeconom a aplicada se apartaron
considerablemente la una de la otra en los aos setenta y ochenta: modelos
cuya incoherencia terica se haba dem ostrado siguieron utilizndose para
hacer pronsticos sobre la economa estadounidense, mientras que los nue
vos modelos tericos, concebidos para corregir esos fallos, continuaron te
niendo un carcter especulativo y no se desarrollaron lo suficiente como
para realizar predicciones ajustadas con ellos.
Cuando un investigador elige un tema, puede parecer que los criterios de
aplicabilidad al mundo real y aportacin al progreso cientfico son opues
tos. Algunos investigadores comenzarn con un problema del mundo real
que sea muy significativo socialmente, como la amenaza de guerra nuclear,
la disparidad de ingresos entre hombres y mujeres o la transicin a la de
m ocracia en Europa del Este. Otros quiz partan de un problema intelectual
planteado en la bibliografa de las ciencias sociales: la contradiccin entre
diversos estudios experimentales de tomas de decisin en condiciones de
incertidumbre o la existente entre diversas teoras de voto referidas a las
elecciones para el Congreso estadounidense y los ltimos resultados en las
urnas. Evidentemente, no hay una distincin estricta entre los criterios. A l
gunas preguntas de investigacin responden a los dos desde el principio,
pero, a la hora de disear el estudio, los investigadores suelen com enzar es
tando ms cerca de uno que de otro4.
Independientemente del punto de partida, el proceso de disear una in
vestigacin para dar respuesta a una pregunta debe cum plir nuestras dos
condiciones, y es evidente que la direccin de este movimiento depender
de dnde comience. Si lo que nos motiva es una perplejidad cientfica, ten
dremos que preguntam os cmo hacer que el objeto de la investigacin sea
ms relevante para asuntos importantes del mundo real: por ejemplo, cmo
podra un experimento de laboratorio dilucidar m ejor las elecciones estrat
gicas de los decisores del mundo real o las consecuencias que, para el com
portamiento, puede tener esta teora. Si partim os de un problema real, ten
dremos que preguntam os cmo puede estudiarse con mtodos cientficos

modernos para hacer una aportacin al fondo de explicaciones de las cien
cias sociales. Bien pudiera ser que apartarse demasiado de uno u otro crite
rio no fuera la m ejor opcin. Los que hacen experimentos de laboratorio
pueden sealar que es prematuro buscar referencias extemas y que se avan
zar ms si se perfecciona la teora y el mtodo en un m edio controlado;
quiz, en un estudio de larga duracin, esto sea cierto. Por el contrario,
quien est preocupado por un problem a del mundo real puede indicar que
antes de explicar es necesario describir con precisin, y puede que tambin
tenga razn, ya que la descripcin exacta es un paso importante de los estu
dios explicativos.
En cualquier caso, si es posible, todo proyecto de investigacin tiene que
intentar cum plir nuestras dos condiciones: ocuparse de un asunto relevante
del mundo real y estar concebido para realizar una aportacin, directa o in
directamente, a una determ inada rea bibliogrfica acadmica. En este li
bro, al ser nuestra principal preocupacin que la investigacin cualitativa
sea m s cientfica, nos ocuparem os m s del investigador que parte del
mundo real, pero nuestro anlisis es aplicable a ambas tendencias.
Cuando el punto de partida es un problem a significativo del mundo real
y no un rea bibliogrfica ya establecida, resulta esencial que elaboremos
un plan de estudio factible. Si se propone un asunto que no puede desarro
llarse hasta convertirlo en un proyecto de investigacin concreto, que p e r
mita la extraccin de inferencias descriptivas y causales vlidas, hay que
modificarlo o abandonarlo. Del m ism o m odo, tam bin hay que cam biar
toda propuesta que no haga alguna aportacin a los escritos acadmicos. Al
elegir provisionalmente un tema, estamos dialogando con su bibliografa.
Qu preguntas de inters para nosotros se han respondido ya? Cmo se
puede plantear y pulir nuestra pregunta para que parezca posible contestarla
con las herramientas disponibles? Podemos partir de un asunto candente,
pero tendremos que hacer frente tanto a lo escrito en las ciencias sociales
como a problemas inferenciales.
2.2
Mejorar la teora
En las ciencias sociales, una teora es una especulacin razonada y precisa

sobre la respuesta que cabe dar a la pregunta de una investigacin, e inclu
ye una declaracin de por qu tal respuesta es correcta. Las teoras suelen
conllevar hiptesis descriptivas o causales ms especficas. Una teora debe
estar en consonancia con los datos disponibles anteriormente sobre una pre
gunta de investigacin. Una teora que no tiene en cuenta los datos exis
tentes es una incoherencia. Si dispusiram os de algo equivalente a la legis
lacin sobre veracidad en la publicidad, esta incoherencia no se llamara
teora (Lieberson, 1992, p. 4; vase tam bin Woods y Walton, 1982).
e l - *:
29
u>-;>ciiiuiiu ue 1a teora suele presentarse como el primer paso de la in

vestigacin. A m enudo, en la prctica, es lo primero, pero no tiene por qu
serlo. De hecho, no podemos elaborar una teora sin conocer antes los tra
bajos realizados sobre el tema y sin haber reunido algunos datos, ya que en
este estadio ni siquiera se sabe cul es la pregunta de la investigacin. No
obstante, independientem ente de la cantidad de datos que se hayan reunido
ya, hay algunas formas generales de evaluar y aumentar la utilidad de una
teora. Ahora slo vamos a esbozarlas, pero las analizaremos en detalle en
captulos posteriores.
En prim er lugar, hay que elegir teoras que puedan estar equivocadas. En
realidad, se aprende mucho ms de las que estn equivocadas que de aque
llas que se enuncian de forma tan general que puede que ni siquiera lo es
tn en principio5. Es necesario poder responder directamente a la pregunta:
qu datos nos convenceran de que estam os equivocados?6. Si no hay res
puesta para esta pregunta, tam poco hay teora.
En segundo lugar, para asegurarse de que una teora es falsable, hay que
elegir una que pueda generar tantas consecuencias observables como sea
posible. Tal eleccin posibilitar que la teora se someta a ms pruebas, uti
lizando ms datos y ms variados, que est ms veces en peligro de ser falsada y que se puedan recoger ms datos para darle una mayor consistencia.
En tercer lugar, al disear teoras es preciso ser lo ms concreto posible.
Las teoras e hiptesis que se form ulan con vaguedad no sirven ms que
para ofuscar. Se puede dem ostrar ms fcilmente que una teora est equi
vocada cuando se ha enunciado con precisin y hace predicciones especfi
cas; por consiguiente, esta teora ser mejor.
Algunos investigadores recom iendan que se siga el principio de conci
sin. Por desgracia, este trm ino se ha utilizado tantas veces en conversa
ciones inform ales y en escritos acadm icos que el principio ha quedado
eclipsado (vase Sober [1988] para un anlisis completo). Jeffreys (1961,
p. 47) dio la definicin m s clara de concisin: Las teoras ms simples
tienen en principio ms probabilidades 1. Por lo tanto, la concisin es un
juicio, e incluso un supuesto, sobre la naturaleza del mundo: se presupone
que es simple. Elegir teoras cuya prem isa es la existencia de un m undo
simple es una regla que se aplica con claridad en situaciones en las que se
est muy seguro de que el m undo es as realm ente. Los fsicos parecen c
modos con la concisin, pero los bilogos suelen creer que es absurda. En
las ciencias sociales, los hay que la defienden con vehemencia para sus subreas (por ejemplo, Zellner, 1984), pero nosotros creemos que slo es til
en ciertas ocasiones. Dada la precisa definicin de concisin como supues
to acerca del mundo, nunca deberamos insistir en que fuera un principio
general a la hora de disear teoras, aunque sea til en aquellas situaciones
en las que haya indicios de que el mundo que estudiamos es simple.
Lo que querem os decir es que no recom endam os al investigador que
busque la concisin como un bien en s mismo, porque, a m enos que ya se
pamos mucho de un asunto, no parece que haya muchas razones para prac
ticarla. Ni siquiera necesitamos este principio para evitar teoras excesiva
mente com plicadas, porque est implcito en la mxima de que la teora
debe ser tan com plicada como indican los datos. Las situaciones en las que
no hay inform acin suficiente sobre la complejidad de la teora que se in
vestiga pueden conducir a lo que se denomina diseos de investigacin
imprecisos (vase el apartado 1 del captulo 4), pero stos son problemas
del diseo de la investigacin y no supuestos acerca del mundo.
Todos los consejos que hem os dado hasta pueden aplicarse si an no
hemos reunido nuestros datos ni hemos comenzado a analizarlos. Sin em
bargo, si estn ya recogidos, podemos utilizar esas reglas para modificar
nuestra teora y conseguir ms datos, generando de este modo ms conse
cuencias observables sobre la nueva teora. Por supuesto, este proceso es
caro, cuesta mucho tiempo y quiz vayamos a desperdiciar los datos que ya
se han recogido. Qu ocurre entonces cuando est claro que hay que m e
jorar nuestra teora pero no podemos perm itim os recoger ms datos? Esta
situacin en la que con frecuencia se encuentra el investigador ha de
tratarse con cautela y dom inio de uno mismo. Cualquier investigador inteli
gente puede elaborar una teora plausible con el conjunto de datos que
surge de un hecho; sin embargo, esto no dira nada sobre la veracidad de la
teora, que puede ajustarse muy bien a los datos y ser completamente falsa
y, de hecho, su falsedad ser demostrable con otros muchos datos. A los
seres hum anos se les da bien reconocer pautas, pero no tan bien detectar la
falta de las mismas (la mayora vemos pautas en manchas de tinta saltea
das!). A una teora hay que racionarle los ajustes realizados sobre la marcha
que no sean coherentes con los datos disponibles, y hay que hacerlos con
bastante disciplina8.
Todava nos queda el problem a de qu hacer cuando hayamos terminado
tanto la recogida de datos com o nuestro anlisis y queramos mejorar nues
tra teora. En esta situacin, recomendamos que se respeten dos normas: en
prim er lugar, si nuestra prediccin se halla condicionada por diversas varia
bles y queremos libram os de una de las condiciones, podemos hacerlo. Por
ejemplo, si al principio nuestra hiptesis era que los pases democrticos
con sistemas avanzados de proteccin social no luchan entre s, sera acep
table extender tal hiptesis a todas las democracias contemporneas y de
este modo contrastar nuestra teora en un mayor nmero de casos y aumen
tar las posibilidades de que sea falsada. El propsito general es que, des
pus de ver los datos, podamos m odificar la teora para que se pueda apli
car a una gama ms am plia de fenmenos. Esta alteracin de nuestras tesis,
al exponerlas an ms a la falsacin, no debera llevamos a explicaciones
para salir del paso que slo pretendan salvar una teora inadecuada res
tringindola a fenmenos con los que ya se ha comprobado que concuerda.
Sin embargo, la prctica opuesta no suele ser apropiada. Despus de ob
servar los datos, no deberam os nicamente aadir una condicin restrictiva
y continuar como si esa m atizacin hubiera demostrado que nuestra teora

es correcta. Si la teora original fuera que las dem ocracias contemporneas
no luchan entre s porque tienen sistem as constitucionales, sera m enos
aceptable que, al encontrar excepciones a nuestra regla, lim itram os la
proposicin a las dem ocracias que disponen de un sistem a avanzado de
proteccin social una vez que se ha constatado mediante la inspeccin de
los datos que esta matizacin parece convertir nuestra proposicin en co
rrecta. O supongamos que nuestra teora inicial fuera que las revoluciones
slo tienen lugar en situaciones de grave crisis econmica, pero nos damos
cuenta de que no es verdad en uno de nuestros estudios de caso. En esta si
tuacin no sera razonable aadir nicamente condiciones generales como:
las revoluciones nunca tienen lugar durante periodos de prosperidad excep
to all donde el ejrcito es dbil, los lderes polticos son represivos, la eco
noma se basa en un reducido nm ero de productos y el clima es clido. Tal
formulacin es una forma caprichosa (y engaosa) de afirm ar que mi teo
ra es correcta, excepto en el pas X. Ya que hemos descubierto que nues
tra teora no se aplica en dicho pas, no es de mucha ayuda convertir esta
falsacin en una generalizacin espuria. Si no nos esforzam os por reca
bar nuevos datos, no dispondremos de pruebas aceptables que sostengan la
nueva versin de la teora.
Por lo tanto, nuestra regla bsica en cuanto a la alteracin de una teora
una vez que se han observado los datos es: podem os hacer que la teora sea
menos restrictiva (deform a que contemple una gama ms amplia de fenm e
nos y se vea expuesta a ms oportunidades de falsacin), pero esto no ha
de hacerse sin haber recogido m s datos con los que contrastar la nueva
versin de la teora. Si no podemos recabar ms datos, estaremos en punto
muerto y no podemos proponer ningn mtodo mgico para dejar de estar
lo. En ciertos momentos, aceptar que estamos equivocados es lo mejor y, de
hecho, algunos resultados negativos pueden ser bastante tiles para un rea
acadmica. Quin no habra de preferir una slida conclusin negativa an
tes que varias de carcter insustancial que se basen en teoras elaboradas
para salir del paso?
Adems, si estamos equivocados, no tenem os por qu dejar de escribir
una vez que hayamos admitido nuestra derrota. Podemos aadir un aparta
do a nuestro artculo o un captulo en el libro para ocupam os de futuras in
vestigaciones empricas y de la presente especulacin terica. En este con
texto, disponem os de bastante m s libertad y podem os sealar nuevas
condiciones que sera plausible introducir en nuestra teora si creemos
que pueden solucionar el problema ; plantear la modificacin de otra teo
ra existente o apuntar hacia una gama de teoras completamente diferente.
En tal situacin, no podem os llegar a ninguna conclusin con mucha certe
za (excepto, quiz, al afirm ar que la teora que planteamos al principio est
equivocada), pero s podem os perm itim os el lujo de inventar nuevos dise
os de investigacin o proyectos de recogida de datos que podran utilizarse
para determ inar si nuestras especulaciones son correctas. Este ejercicio

puede ser bastante til, especialmente a la hora de sealar reas de las que
los futuros investigadores podran ocuparse.
Com o hemos sealado anteriormente, ya se sabe que las ciencias socia
les no siguen normas estrictas: la necesidad de creatividad a veces exige
que se prescinda del manual! Y los datos pueden disciplinar el pensam ien
to. De ah que a los investigadores, una vez que se enfrentan a los datos, se
les ocurra cmo deberan haber construido la teora en un principio. Aun
que sea de forma restrictiva, tal m odificacin quiz valga la pena si pode
mos convencernos a nosotros mism os y a los dems de que reformar la teo
ra tal com o lo proponem os es algo que habram os hecho antes de recoger
los datos si se nos hubiera ocurrido. Sin embargo, hasta que la teora no se
contraste con nuevos datos, su posicin seguir siendo incierta, y as habr
que considerarla.
Una de las consecuencias importantes de estas norm as es que los pro
yectos piloto suelen ser muy tiles, especialm ente en investigaciones en las
que los datos han de recogerse mediante entrevistas u otros medios particu
larm ente costosos. La recogida de datos prelim inar puede llevamos a alte
rar las preguntas de la investigacin o a m odificar la teora. Posteriormente,
se pueden recabar otros datos para contrastar la nueva teora, evitndose as
el problem a de utilizar la m ism a inform acin para elaborar y com probar
una teora.
2.3
Mejorar la calidad de los datos
Los datos son inform aciones sobre el m undo recogidas de forma siste
mtica y pueden ser de tipo cualitativo o cuantitativo. A veces se renen
datos para evaluar una teora muy concreta, pero no es inusual que los aca
dmicos los recojan antes de saber exactamente qu es lo que les interesa
encontrar. Adems, aunque los datos se renan para contrastar una hipte
sis determ inada, puede que al final a los investigadores les interesen pre
guntas que no se les haban ocurrido anteriormente.
En cualquier caso, ya sea que los datos se renan para un determinado
propsito o que se utilicen para otro que no est claro cuando se realiza la
recogida, existen ciertas norm as que mejoran la calidad de tales datos. En
principio, podem os considerar esas norm as al margen de las que se han
mencionado en el apartado 2.2 para m ejorar la teora. En la prctica, para
toda recogida de datos se necesita cierto grado de teora, del mismo modo
que para form ular cualquier teora se precisan algunos datos (vase Coombs, 1964).
N uestra primera y ms im portante directriz para m ejorar la calidad de
los datos es: registrar y detallar el proceso con el que se generan los datos.
Sin esta inform acin no podem os determ inar si la utilizacin de proced-
m ientos norm alizados de anlisis producir inferencias sesgadas. Slo si

conocem os el proceso de obtencin de los datos podremos hacer inferen
cias descriptivas y causales vlidas. En una encuesta de opinin de tipo
cuantitativo, para registrar el proceso de obtencin de datos es preciso co
nocer exactamente de qu manera se ha realizado la muestra y qu pregun
tas se han hecho. En un estudio de caso comparado de tipo cualitativo es
crucial enunciar las normas precisas que hemos utilizado para elegir el re
ducido nmero de casos que se van a analizar. En el captulo 6 damos ms
directrices para la seleccin de casos en investigacin cualitativa, pero an
m s im portante que elegir un buen mtodo es registrar y detallar con cuida
do cualqiera que se utilice, as como la informacin necesaria para que
otros lo apliquen9.
En el apartado 2.2 defendim os teoras de las que pudieran extraerse m u
chas consecuencias observables. Nuestra segunda directriz para mejorar la
calidad de los datos es: para evaluar m ejor una teora hay que recoger da
tos acerca de la m ayor cantidad p o sib le de consecuencias observables.
Esto supone recoger tantos datos com o sea posible en los contextos ms di
versos. C ada consecuencia adicional de nuestra teora que observem os
aportar un nuevo contexto en el que poner a prueba su veracidad. Cuantas
m s consecuencias observables encontrem os que sean coherentes con la
teora, m s penetrante ser la explicacin y ms ciertos sus resultados.
Al aadir datos sobre nuevas consecuencias observables de una teora,
podem os (a) recoger ms observaciones sobre la m ism a variable depen
diente o (b) registrar ms variables dependientes. Podemos, por ejemplo,
desagregar los datos en perodos de tiem po ms cortos o reas geogrficas
ms pequeas. Tambin se puede recabar informacin sobre variables de
pendientes de un inters menos directo; si los resultados son como los que
prev la teora, tendrem os ms confianza en ella.
Pensem os, por ejem plo, en la teora de la disuasin racional: los poten
ciales iniciadores de una guerra calculan los costes y beneficios de atacar
a otros estados, y en estos clculos pueden influir amenazas de represalia
crebles. La com probacin ms directa de esta teora sera evaluar si,
dadas ciertas am enazas de guerra, la decisin de atacar se asocia con
factores como el equilibrio de fuerzas m ilitares entre los posibles conten
dientes o con los intereses que estn en juego para el pas atacado (Huth,
1988). Sin embargo, aunque utilizar nicam ente casos en los que se lanzan
am enazas conform e un conjunto de consecuencias observables de la teora,
stas son slo una parte de las que se podran recoger (y si slo se contem
plan stas se podra producir un sesgo de seleccin), ya que aquellas situa
ciones en las que se disuade incluso de am enazar serian excluidas de los
datos. Por lo tanto, tam bin podra m erecer la pena recoger inform acin
sobre otra variable dependiente (o sea, sobre otro conjunto de consecuen
cias observables) que calibrara si los estados am enazan cuando tienen in
centivos para hacerlo.
Siempre que se carezca de datos suficientes sobre la disuasin en polti

ca internacional, tam bin puede ser til poner a prueba otra teora que parta
de presupuestos similares respecto a la motivacin y que se aplique a otra
variable dependiente en diferentes condiciones, sin dejar de ser una conse
cuencia observable de la m ism a teora. Por ejemplo, podramos concebir un
experimento de laboratorio para ver si, en circunstancias simuladas, la ca
pacidad militar y unas negociaciones firmes, en vez de acentuar las ame
nazas, hacen que no se produzcan. Tambin podramos examinar si, en si
tuaciones anlogas, actores como los oligopolios que compiten por su cuota
de mercado o las familias del crim en organizado que luchan por el territo
rio utilizan estrategias de disuasin y hasta qu punto tienen xito en diver
sas circunstancias. De hecho, los economistas que trabajan en el rea de la
organizacin industrial han utilizado la teora de juegos no cooperativa, en
la que tam bin se basa la de la disuasin, para estudiar problemas como el
de la entrada en ciertos mercados o las estrategias de precios (Fudenberg y
Tirle, 1989). Como las teoras se parecen tanto, los datos empricos en los
que se basan las predicciones de la teora de juegos acerca del comporta
miento de las em presas aum entaran la plausibilidad de otras hiptesis rela
cionadas con la accin del Estado en poltica internacional. Seguira ha
biendo incertidumbre al aplicar las conclusiones de un campo al otro, pero
el problem a es lo suficientem ente importante como para justificar que se
intente sacar ideas y pruebas de donde sea posible.
Es evidente que una recogida de datos que siempre prescinda del anlisis
impedir la finalizacin de una investigacin til en vez de facilitarla. En la
prctica, las limitaciones de tiempo y de recursos siempre condicionarn
los esfuerzos por recoger datos. Aunque ms informacin, ms casos, ms
entrevistas, una nueva variable y otras formas relevantes de recopilacin de
datos siempre vayan a dar m s certeza a nuestras inferencias en algn senti
do, puede que haya investigadores prometedores que se vean perjudicados
en igual m edida por el exceso de informacin que por su escasez. Insistir
en leer un libro ms o en hacerse con otra matriz de datos brutos sin escri
bir una lnea es recetar improductividad.
La tercera directriz es: maxim izar la validez de nuestras mediciones. La
validez tiene que ver con calibrar lo que creemos que estamos calibrando.
El ndice de paro puede ser un buen indicador de la situacin econmica,
pero uno y otra no son sinnimos. En general, lo ms fcil es m aximizar la
validez ajustndose a los datos sin permitir que se nos interpongan concep
tos no observados o no mensurables. Si un entrevistado responde a nuestra
pregunta aduciendo ignorancia, lo que sabemos es que dijo que no lo saba,
y para eso s tenemos una medida vlida. Sin embargo, lo que guiso decir
en realidad constituye un concepto completamente diferente que no puede
medirse con un alto grado de confianza. Por ejemplo, en pases con gobier
nos represivos, aducir ignorancia puede ser, para algunas personas, una for
ma de criticar el sistema poltico; para otros es como decir No s.
Nuestra cuarta directriz es: asegurarse de que los mtodos de recogida

de datos son fiables. Fiabilidad significa que si se aplica el mismo procedi
miento de la misma manera siempre se obtendr la misma medida. Cuando
se utiliza un procedim iento fiable en diferentes ocasiones, sin que nada
haya ocurrido entretanto que transforme la verdadera situacin del objeto
que estamos calibrando, se observar el mism o resultado l0. Las medidas
fiables tambin ofrecen los mismos resultados cuando las realizan diferen
tes investigadores, y ello depende, evidentemente, de que se puedan seguir
procedimientos explcitos u .
Nuestra ltima directriz es que todos los datos y anlisis deben ser, en la
medida de lo posible, reproducibles. La capacidad de reproduccin no slo
se aplica a los datos, con el fin de que podamos comprobar si nuestras m e
didas son fiables, sino que tambin tiene que ver con el proceso de razona
miento que se utiliza para alcanzar conclusiones. Partiendo del informe de
nuestra investigacin, otro investigador debera poder copiar los datos y
rastrear la lgica de nuestras conclusiones. La capacidad de reproduccin
es importante aunque nadie repita nuestro estudio. Los procedim ientos y
mtodos utilizados slo se podrn evaluar si el estudio se describe con el
suficiente detalle como para que pueda reproducirse.
En algunos tipos de investigacin reproducir los datos puede resultar di
fcil o imposible: quiz los entrevistados mueran o desaparezcan y no sea
posible reproducir las observaciones directas de acontecimientos del mun
do real que han hecho testigos o participantes en ellos. La capacidad de re
produccin tambin significa cosas diferentes en cada tradicin investiga
dora. En los estudios cuantitativos se centra en repetir el anlisis a partir de
los mismos datos. Como bien sabe cualquiera que haya intentado alguna
vez reproducir los resultados cuantitativos de obras publicadas, la tarea sue
le ser bastante ms difcil de lo que debera aunque las obras sean de re
nombre y siempre resulta ms til de lo que parece al principio (acerca
de la reproduccin en investigacin cuantitativa, vase Dewald y otros,
1986).
En la investigacin cualitativa tradicional la analoga la proporcionan las
notas a pie de pgina y las revisiones bibliogrficas. Utilizando estas herra
mientas, los sucesivos investigadores tendran que poder localizar las fuen
tes utilizadas en una obra publicada y hacer sus propias evaluaciones sobre
las inferencias que han surgido de esa informacin. Si los estudios se basan
en la observacin directa, la reproduccin es ms difcil. Un investigador
puede tomar prestadas las notas de campo de otro o la grabacin de sus en
trevistas para comprobar si este material fundamenta las conclusiones ex
tradas en primera instancia. Este nuevo anlisis de resultados, utilizando
los mismos datos, no suele hacerse, ya que gran parte de la informacin del
trabajo de campo se basa en conversaciones, impresiones y otros actos de
participacin no registrados. Sin embargo, se podra avanzar bastante si hu
biera ms investigadores que intentaran hacer este tipo de reproduccin, y
as se anim ara tambin a otros a tomar notas de campo ms detalladas. A l

guna vez se ha reproducido un proyecto de investigacin completo, inclu
yendo la recogida de datos. La reproduccin no puede ser perfecta porque
es imposible retrotraerse en el tiempo; no obstante, el intento puede resultar
bastante fructfero. Quiz la reproduccin ms exhaustiva que se haya lle
vado a cabo de un proyecto cualitativo sea la del estudio sociolgico de la
ciudad estadounidense de M iddletown, en Indiana, que comenzaron Robert
y Helen Lynd. Su prim er estudio de M iddletown se public en 1929 y se
reprodujo en un libro que apareci en 1937. Unos cincuenta aos despus
del prim er proyecto se est publicando una larga serie de libros y artculos
que reproduce los primeros estudios (vase Caplow y otros, 1983a, 1983b y
las citas que incluyen). La investigacin cualitativa no tiene por qu ser tan
exhaustiva, pero este gran proyecto de investigacin debera servir como
modelo de lo que se puede hacer.
Toda investigacin tendra que aspirar a ser lo ms reproducible posible:
los investigadores habran de registrar siempre los mtodos, normas y pro
cedim ientos exactos que han utilizado en la recogida de inform acin y
extraccin de inferencias para que otros pudieran hacer lo mismo y llegar
(esperam os) a la m ism a conclusin. La capacidad de reproduccin tambin
supone que los acadmicos que utilizan fuentes inditas o privadas tendran
que com prom eterse a que, en el futuro, otros pudieran acceder a este m ate
rial en condiciones sim ilares; aprovecharse de un acceso privilegiado sin
buscar que otros lo tengan im posibilita la reproduccin y pone en cuestin
la calidad cientfica del trabajo. Lo normal es que las investigaciones no
sean reproducidas, pero nuestra responsabilidad es com portarnos como si
alguien pudiera querer hacerlo. Aunque la obra no sea reproducida, aportar
los materiales para que s lo sea har posible que los lectores comprendan y
evalen nuestro trabajo.
2.4
Utilizar mejor los datos existentes
Solucionar los problemas que plantean los datos mediante la recopilacin

de otros nuevos y mejores es casi siem pre preferible a utilizar de otro modo
los datos defectuosos de que disponemos; sin embargo, no siempre es posi
ble recoger otros. Los cientficos sociales suelen enfrentarse a datos proble
mticos y a pocas posibilidades de adquirir otros mejores, de manera que
tienen que sacar el mximo partido a los que tienen.
Cmo utilizar m ejor los datos ya recogidos es el tem a principal de las
clases de m todos estadsticos y, de hecho, es la mayor aportacin de la
estadstica inferencial a las ciencias sociales. Los preceptos de este asun
to, que tan claros estn en el estudio de la estadstica inferencial, tam bin
se aplican a la investigacin cualitativa. En el resto del libro nos ocupa
mos de ellos con ms detalle, y aqu slo vamos esbozar brevemente las
directrices que hay que seguir para utilizar mejor datos recogidos con an
terioridad.
En prim er lugar, siempre que sea posible, para hacer inferencias hay que
utilizar datos que no estn sesgados, es decir, que como promedio sean
correctos. Para entender esta idea tan concreta de la investigacin estadsti
ca, imaginemos que se aplica la m ism a m etodologa (ya sea en la investiga
cin cuantitativa o en la cualitativa) para analizar y extraer conclusiones de
datos procedentes de varias m atrices de datos brutos. Es probable que, a
causa de pequeos errores en los datos o en la aplicacin del procedim ien
to, utilizar slo una vez esta m etodologa nunca dar resultados del todo co
rrectos. Un procedimiento no sesgado ser correcto si se considera como
una m edia de muchas aplicaciones; aunque, por separado, stas no sean co
rrectas. El procedim iento no inclinar sistem ticamente el resultado en una
u otra direccin.
Es evidente que la extraccin de inferencias no sesgadas depende tanto
de la prim era recogida de datos com o de su uso posterior y que, como he
mos sealado anteriorm ente, siempre es mejor prever los problemas antes
de com enzar a reunir los datos. Sin embargo, aqu mencionamos brevemen
te estas dificultades porque al utilizar los datos es preciso poner un especial
cuidado en el anlisis de posibles fuentes de sesgo que hayan pasado desa
percibidas cuando se recogan dichos datos. Una de esas fuentes, que puede
falsear las inferencias, es la del sesgo de seleccin, que consiste en elegir
observaciones de tal m anera que se distorsiona sistemticamente la pobla
cin de la que proceden. Aunque un ejemplo obvio es el de escoger a pro
psito slo aquellos casos que apoyan nuestra teora, el sesgo de seleccin
puede ser mucho m s sutil. Hay otro sesgo que puede surgir de las varia
bles omitidas y que consiste en excluir alguna variable de control que pu
diera influir en una aparente conexin causal entre las variables explicativas
y la que queremos aclarar. Entre los captulos 2 y 6 analizaremos estas y
otras posibles dificultades que se presentan en la extraccin de inferencias
no sesgadas.
La segunda directriz se basa en el concepto estadstico de eficiencia:
para que los datos se utilicen de manera eficiente hay que m axim izar la in
formacin que se ha tenido en cuenta para hacer las inferencias descriptivas
o causales. Para m axim izar la eficiencia no slo es preciso utilizar todos
nuestros datos, sino usar tambin toda la informacin relevante que hay en
ellos para mejorar las inferencias. Por ejemplo, si los datos estn desagre
gados en pequeas unidades geogrficas, tenem os que utilizarlos de esa
forma, no slo como un agregado nacional. Los agregados ms pequeos
tendrn un mayor grado de incertidumbre, pero si son, al menos en parte,
consecuencias observables de la teora, contendrn informacin que puede
traerse a colacin en el problem a inferencial.
3.
Temas de estudio de este volumen
Finalizamos este captulo general sealando los cuatro puntos importantes

en la realizacin de un diseo de investigacin que hemos planteado aqu y
que analizaremos en detalle a lo largo del libro.
3.1
La utilizacin de consecuencias observables para vincular

(a teora y los datos
En este captulo hem os subrayado que para que una teora merezca la pena
debe contem plar consecuencias relacionadas con las observaciones que es
peram os encontrar si es correcta. Estas consecuencias observables de la
teora han de guiar nuestra recogida de datos y ayudarnos a distinguir entre
hechos relevantes e irreJevantes. En el apartado 6 del captulo 2 analizamos
cmo afecta la teora a la recogida de datos y de qu manera stos discipli
nan la imaginacin terica. Aqu lo que queremos recalcar es que la teora
y la investigacin emprica deben estar estrechamente relacionadas. Cual
quier teora que de verdad trabaje para nosotros tendr consecuencias en la
investigacin emprica, y sta no podr llegar a buen puerto sin una teora
que la gue en la eleccin de sus preguntas. Tanto la teora como la recogi
da de datos son aspectos esenciales del proceso que nos lleva a decidir si
una teora puede considerarse de forma provisional verdadera o falsa, aun
que est sujeta en am bos casos a la incertidumbre que caracteriza a todas
las inferencias.
A toda teora hay que preguntarle cules son sus consecuencias observa
bles y en cualquier investigacin emprica hay que saber si las observacio
nes son relevantes para las consecuencias de la teora y, si es as, qu nos
permiten inferir sobre la correccin de la misma. En cualquier estudio so
cial cientfico las consecuencias de la teora y de la observacin de los he
chos han de ser elementos imbricados: las conclusiones de las ciencias so
ciales no pueden considerarse fiables si no se basan en teoras y datos
estrecham ente relacionados, que se hayan forjado mediante la formulacin
y anlisis de las consecuencias observables de una teora.
3.2
La maximizacin del control
El investigador que busca consecuencias adicionales para una hiptesis per

sigue uno de los objetivos ms importantes de las ciencias sociales: expli
car tanto como sea posible de la fo rm a ms escueta posible. La ciencia so
cial de calidad pretende aum entar la trascendencia de lo que se explica
mediante la inform acin utilizada en la explicacin. Si podemos exponer
con precisin, a travs de una o varias variables causales, lo que en princi-
po parece un complicado efecto, el control que tendremos sobre un proble

ma ser muy elevado. Al revs, si podemos explicar muchos efectos a partir
de una variable o de unas pocas, tambin dispondremos de un control con
siderable. En general, el control es escaso en las ciencias sociales y lo es
an ms en determinadas reas temticas. Esto puede deberse a que los in
vestigadores no saben an cmo aumentarlo, a que la naturaleza no est or
ganizada adecuadamente o a ambas razones. Las reas que se estudian ha
bitualmente de form a cualitativa suelen ser aquellas en las que hay poco
control. Para explicar cualquier cosa se suele necesitar un conjunto de va
riables explicativas: utilizamos muchos elementos para explicar poco. En
estos casos tendramos que proponernos disear investigaciones con ms
control.
Hay varias maneras de aumentar el control sobre el problema de nuestra
investigacin. La principal consiste en increm entar el nmero de conse
cuencias observables de nuestra hiptesis y buscar el modo de confirm ar
las. Como se ha descrito anteriormente, esta tarea puede suponer (1) una
mejora de la teora para que tenga ms consecuencias observables, (2) una me
jora de los datos para que realmente se detecten m s consecuencias y se
utilicen para evaluar la teora y (3) una utilizacin m s provechosa de esos
datos, con el fin de extraer ms consecuencias de aquellos que estn dispo
nibles. Ninguna de estas posibilidades, ni tampoco el concepto general de
maximizacin del control, son iguales a la idea de concisin, la cual, como
explicamos en el apartado 2.2, es un presupuesto relacionado con la natura
leza del mundo ms que una norm a para disear investigaciones.
La maximizacin del control es tan importante y tan general que reco
mendamos fervientem ente que los investigadores hagan listas constantes de
aquellas posibles consecuencias observables de sus hiptesis que pudieran
detectarse en sus datos o en otros. Quiz se puedan comprobar algunas de
esas nuevas consecuencias en la m atriz de datos brutos original, siempre
que la consecuencia no surja de los datos y sea una hiptesis que, de m a
nera independiente, indiquen la teora u otra matriz de datos. Sin embargo,
utilizar otros datos es an mejor. En este sentido, tendramos que conside
rar tambin consecuencias que pudieran aparecer en nuevos datos relati
vos a otras unidades o a otros aspectos de los que estudiamos, datos sobre
diferentes grados de agregacin y de otros perodos, como las predicciones
sobre el futuro prximo y evaluar las hiptesis en esos mbitos. Cuantas
ms pruebas encontrem os en diversos contextos, m s convincente ser
nuestra explicacin y ms confianza podremos tener nosotros y Jos dems
en las conclusiones.
En principio, algunos investigadores podran oponerse a la idea de reco
ger consecuencias observables en cualquier sitio o en niveles de agregacin
diferentes de aquel para el que se ha diseado la teora. Por ejemplo, Lie
berson (1985) aplica a la investigacin cualitativa la idea estadstica de fa
lacia ecolgica utilizar de form a incorrecta datos agregados para hacer
inferencias sobre individuos con el fin de prevenir contra las inferencias

que utilizan diferentes niveles de agregacin l2. Estamos de acuerdo en que
utilizar datos agregados puede llevarnos a hacer inferencias incorrectas so
bre los individuos: cuando son stos los que nos interesan, suele ser mejor
estudiarlos directamente si podem os hacernos con los datos adecuados. Sin
embargo, si lo que queremos es que nuestra inferencia plantee una hiptesis
con bastante validez, quiz sea mejor que nuestra teora tenga consecuen
cias en muchos niveles de anlisis diferentes y, a menudo, podremos utili
zar datos de todos para dar alguna informacin sobre ella. De este modo,
aunque lo que ms nos interese est en un nivel de anlisis agregado, con
frecuencia podremos lograr un mayor control sobre la veracidad de nuestra
teora si utilizamos datos de los otros.
Por ejemplo, si elaboramos una teora para explicar las revoluciones, ten
drem os que buscar consecuencias observables de ella no slo en los re
sultados m s generales sino en fenm enos com o las respuestas de los
revolucionarios a entrevistas en profundidad, en las reacciones de los que
residen en pequeas comunidades de zonas apartadas del pas o en declara
ciones oficiales de los cargos de los partidos. Tendramos que estar dis
puestos a incorporar cualquier inform acin que pudiramos lograr, siempre
que nos ayudara a conocer la veracidad de nuestra teora. Si podemos con
trastarla exam inando los resultados de las revoluciones, perfecto. Pero, en
la mayora de los casos, existe poca informacin a ese nivel, quiz una o
dos observaciones cuyo valor suele ser ambiguo o estar mal medido. La
existencia de una revolucin es com patible con muchas teoras diferentes.
Slo al profundizar en el caso que nos ocupa o aportando informacin rele
vante sobre otros ser posible diferenciar las teoras que ya existan con an
terioridad.
El nico problema, a la hora de utilizar informacin procedente de otros
niveles y fuentes para estudiar una teora que est diseada con un determ i
nado grado de agregacin, reside en dilucidar si tales observaciones contie
nen alguna informacin relevante para evaluar las consecuencias de nuestra
teora. Si esas nuevas observaciones ayudan a com probar la teora, habr
que utilizarlas aunque no sean consecuencias de gran inters. Por ejemplo,
quiz no nos im porten en absoluto las opiniones de los revolucionarios,
pero si sus respuestas a nuestras preguntas son compatibles con nuestra teo
ra de la revolucin, ser ms posible que sta sea correcta y la recogida de
inform acin adicional no habr sido intil. De hecho, una observacin en el
nivel de anlisis ms agregado que tenga lugar una revolucin predicha,
por ejemplo no es ms que una consecuencia observada de la teora y,
dada la poca informacin que contiene, no habra que concederle ms im
portancia que a otras consecuencias observables. Tenemos que recabar in
form acin sobre tantas consecuencias observables de nuestra teora como
sea posible.
3.3
Admitir la incertidumbre
Tanto en la investigacin cuantitativa como en la cualitativa el conocim ien

to y la inferencia son siempre inciertos. La m edicin en ambos tipos de es
tudio es propensa al error, pero sus causas pueden ser diferentes. El entre
vistador cualitativo, que hace "una larga entrevista en profundidad a una
persona cuyo contexto ha estudiado, tiene menos posibilidades de calibrar
mal la autntica ideologa poltica de ese sujeto que otro que entreviste de
form a estructurada a una persona elegida de form a aleatoria y de la que no
sepa nada (aunque lo contrario tambin es posible si, por ejem plo, el entre
vistador se fa excesivamente de un entrevistado que no es fiable). Sin em
bargo, el encuestador tiende m enos que el que investiga en profundidad a
extrapolar de form a inapropiada a una poblacin amplia, lo que slo es
aplicable a casos particulares. Ninguno de ellos es inmune a las incertidumbres de la m edicin o al inherente carcter probabilstico del mundo social.
Todos los buenos cientficos sociales ya sean cuantitativos o cualitati
vos contemplan un margen aproximado de incertidumbre en sus inferen
cias. En la ciencia poltica, quiz el problema ms importante de los estu
dios cualitativos sea la constante falta de estim aciones de incertidum bre
razonables que se observa en las inferencias de los investigadores (vase
King, 1990). Siguiendo las norm as de este libro se puede hacer una infe
rencia vlida casi en cualquier situacin, independientem ente de lo lim ita
dos que sean los datos, pero tendramos que evitar sacar conclusiones muy
ambiciosas a partir de datos poco consistentes. El problema no es que sea
imposible extraer inferencias fiables en la investigacin cualitativa, sino
que siempre habra que calcular de form a razonable el grado de incerti
dumbre que existe en cada una de ellas. Neustadt y May (1986, p. 274), al
ocuparse de campos en los que es difcil hacer estimaciones cuantitativas
precisas, proponen un m todo til para anim ar a los decisores polticos
(que a menudo se enfrentan a la necesidad de llegar a conclusiones sobre
qu poltica seguir, utilizando datos inadecuados) a juzgar la incertidumbre
de sus conclusiones. Preguntan: Cunto dinero propio pondras en ello?.
Esta pregunta tiene sentido siempre que tam bin nos planteem os: Con
qu posibilidades?.
3.4
Pensar como un cientfico social: escepticismo e hiptesis

contrapuestas
La incertidum bre de las inferencias causales tiene como consecuencia que

los buenos investigadores sociales no las acepten fcilmente. Cuando se
dice que A produce B, alguien que piense como un cientfico social se
preguntar si esa relacin es autnticam ente causal. Es fcil hacer esas pre
guntas respecto a las investigaciones ajenas, pero resulta ms importante
plantearlas en relacin a los propios proyectos. Existen m uchas razones

para tom arse una explicacin causal con escepticismo, por plausible que
pueda parecer a prim era vista. Leemos en el peridico que los japoneses
comen menos carnes rojas y que sufren menos ataques cardacos que los
estadounidenses. Esta observacin es interesante por s misma y, adems, la
explicacin resulta creble: comer demasiados filetes conduce a la alta tasa
de enfermedades cardacas de los Estados Unidos. El cientfico social es
cptico pregunta por la precisin de los datos (cmo conocemos los hbi
tos alimentarios?, qu m uestra se ha utilizado?, se clasifican los ataques
al corazn de forma parecida en Japn y en los Estados Unidos, de manera
que podam os com parar fenm enos similares?). Suponiendo que los datos
sean precisos, qu otros factores podran explicar los efectos?: hay ms
variables (otras diferencias dietticas, rasgos genticos o de forma de vida)
que puedan explicar este resultado? Acaso hemos intercambiado la causa
y el efecto sin darnos cuenta? Es difcil imaginarse que el hecho de no su
frir un ataque al corazn pueda hacer que comamos menos carne roja, pero
es posible. Quiz la gente pierda, con los aos, las ganas de comer hambur
guesas y filetes. Si asi fuera, los que (por la razn que sea) no han sufrido
un ataque al corazn viviran ms y comeran menos carne. Este hecho pro
ducira la misma relacin que llev a los expertos a la conclusin de que la
carne es la culpable de los ataques al corazn.
No pretendemos cuestionar esos estudios mdicos; simplemente quere
mos poner un ejemplo de cmo los cientficos sociales se enfrentan al pro
blem a de la inferencia causal: con escepticismo y teniendo en cuenta las
explicaciones alternativas que podran haberse pasado por alto. De este
modo, la inferencia causal se convierte en un proceso en el que cada con
clusin es una oportunidad de investigar an ms, con el fin de profundizar
en esa inferencia y ponerla a prueba. Intentaremos, mediante aproximacio
nes sucesivas, acercarnos cada vez ms a una inferencia causal precisa.
2.
La inferencia descriptiva
En las ciencias sociales, la investigacin, ya sea cuantitativa o cualitativa,

tiene dos objetivos: describir y explicar. Unos investigadores se proponen
describir el mundo y otros explicarlo, y ambos propsitos son esenciales.
No podemos dar explicaciones causales con sentido sin una buena descrip
cin, y sta, a su vez, pierde gran parte de su inters si no est vinculada a
alguna relacin causal. La descripcin suele venir primero porque es difcil
proponer explicaciones antes de saber algo acerca del mundo y qu ha de
explicarse en funcin de qu caractersticas. Sin embargo, la relacin entre
descripcin y explicacin es interactiva. A veces nuestras explicaciones nos
inducen a buscar descripciones de diferentes partes del mundo y, al contra
rio, stas pueden llevarnos a nuevas explicaciones causales.
Tanto la descripcin como la explicacin dependen de las reglas de la
inferencia cientfica. En este captulo nos centramos en la descripcin y en
la inferencia descriptiva. Describir no es en absoluto algo mecnico o ca
rente de problemas, ya que para hacerlo hay que elegir entre un nmero in
finito de hechos que podran registrarse. La descripcin cientfica tiene va
rios aspectos fundam entales. U no de ellos es que conlleva un proceso
inferencial: describir consiste, en parte, en inferir informacin sobre hechos
no observados a partir de aquellos que s se han contemplado. Otro aspecto
es su capacidad para distinguir lo que tienen de sistemtico y de no siste
mtico los hechos observados.
Debe quedar claro que no estamos de acuerdo con los que denigran la
simple descripcin. Aunque explicar relacionar causas y efectos sea
el objetivo ltimo, describir resulta determinante en toda explicacin y es

una actividad fundamental en s misma. Lo que distingue los estudios cien
tficos de otros tipos de investigacin no es el enfrentamiento entre descrip
cin y explicacin, sino el hecho de que se hagan inferencias sistemticas
segn procedimientos vlidos. La inferencia, ya sea descriptiva o causal,
cuantitativa o cualitativa, es el objetivo ltimo de toda ciencia social de ca
lidad. La recogida sistemtica de hechos es una empresa muy importante
sin la que la ciencia no sera posible, pero no es ciencia en s misma. El tra
bajo de archivo o el resumen de hechos histricos pueden conformar, si son
correctos, una buena historia descriptiva, pero ninguna de estas actividades
es suficiente para constituir ciencias sociales.
En este captulo, distinguimos entre descripcin recogida de datos e
inferencia descriptiva. En el apartado 1 analizamos la relacin entre los ob
jetivos aparentemente contradictorios de la investigacin acadmica: descu
brir conocimientos generales y conocer hechos particulares. De este modo,
en el apartado 2, podemos explicar con ms detalle el concepto de inferen
cia. En el resto del libro nuestra intencin es presentar ideas a travs de la
expresin verbal y tambin mediante modelos de investigacin algebraicos
muy simples. En el apartado 3 entramos a considerar la naturaleza de esos
modelos. Posteriormente, se analizan los relativos a la recogida de datos, al
resumen de datos histricos y a la extraccin de inferencias descriptivas
en los apartados 4, 5 y 6, respectivamente. Para terminar, en el apartado 7,
proporcionamos algunos criterios concretos para evaluar inferencias des
criptivas.
1.
El conocimiento general y los hechos particulares
El m undo que estudian los cientficos sociales se compone de elementos

particulares: votantes concretos o entidades gubernamentales especficas,
as como ciudades, tribus, grupos, estados, provincias y naciones determi
nadas. La ciencia social de calidad pretende ir ms all de estos pormeno
res para alcanzar un conocimiento ms general. Sin embargo, la generaliza
cin no quita im portancia al detalle. De hecho, el nico objetivo que
persigue ir de lo particular a lo general es aumentar nuestro conocimiento
de am bas cosas. Los integrantes especficos del mundo social o, ms
concretamente, los hechos concretos de esos integrantes son la base en la
que deben descansar las generalizaciones. Adems, casi siempre aprendemos
ms de un caso especfico cuando estudiamos conclusiones ms generales.
Si quisiramos saber por qu ha dimitido el ministro de Asuntos Exteriores
de Brasil, sera til saber por qu lo han hecho otros ministros brasileos,
por qu lo hacen los mismos cargos en otros pases o por qu las personas,
en general, dejan sus puestos en los gobiernos o incluso en otros mbitos
laborales. Cada una de estas razones nos ayudar a comprender diferentes
tipos de hechos generales y de principios de comportamiento humano, y no

dejarn de ser importantes aunque nuestro nico objetivo sea comprender
por qu ha dimitido el ltimo ministro de Asuntos Exteriores brasileo. Por
ejemplo, estudiando a otros ministros podramos saber que todo el gobierno
brasileo ha dimitido para protestar por las acciones del presidente, algo de
lo que no nos habramos dado cuenta si slo hubiramos examinado lo que
haca el de Exteriores.
En las ciencias sociales algunas investigaciones pretenden informar so
bre un tipo de acontecimientos especfico sin decir nada en particular sobre
un hecho o unidad concreta. Los estudios de comportamiento electoral que
utilizan encuestas masivas explican las decisiones del conjunto de los vo
tantes, no el sufragio de un individuo concreto. Los estudios de las finanzas
del Congreso estadounidense explican la influencia del dinero en los resul
tados electorales de todas las circunscripciones. La mayora no mencionar
la sptima circunscripcin de Pensilvania ni ninguna otra a no ser de pasada
o como una excepcin a la regla general. Estos estudios siguen la pauta de
Przeworski y Teune (1982): eliminar los nombres propios. Sin embargo,
aunque no pretendan comprender el funcionamiento de ningn distrito en
particular, no tendran que pasar por alto como, por desgracia, se hace de
vez en cuando en esta tradicin que los hechos relativos a los diversos
distritos que se incluyen en el anlisis tienen que ser precisos.
Hay otras investigaciones que intentan decimos algo acerca de un ejem
plo concreto. Se centran en la Revolucin francesa o en otro acontecimien
to importante con la intencin de explicar cmo o por qu sucedi. Los
estudios de esta tradicin seran impensables y realmente careceran de
inters para la mayora de sus lectores habituales sin nombres propios.
Un politlogo puede tratar con acierto las pautas de relacin en el conjunto
de las campaas para el Congreso estadounidense sin ocuparse de circuns
cripciones o candidatos concretos, pero imaginmonos el anlisis que hizo
Robert Caro (1983) de las elecciones tejanas de 1948 al Senado sin Lyndon
Johnson y Coke Stevenson '. Acontecimientos concretos como la Revolu
cin francesa o las primarias demcratas de 1948 para el Senado en Tejas
pueden tener un inters intrnseco: suscitan nuestra curiosidad y, si fueran
condiciones previas para que tuvieran lugar acontecimientos posteriores
(como las guerras napolenicas para la presidencia de Johnson), quiz
fuera preciso conocerlas para comprender dichos acontecimientos. Ade
ms, tener un conocimiento general sobre las revoluciones, rebeliones o
guerras civiles nos proporcionar informacin de valor incalculable para
centrar mejor nuestro estudio sobre las causas concretas de la Revolucin
francesa.
Vamos a abordar estos asuntos analizando la interpretacin, que se
presenta como alternativa a la inferencia cientfica (apartado 1.1), los con
ceptos de singularidad y complejidad del objeto de estudio (apartado 1.2) y
el rea general de los estudios de caso comparados (apartado 1.3).
En las ciencias humanas hay historiadores y antroplogos que afirm an que

lo nico que buscan son conocimientos concretos a travs de lo que deno
minan interpretacin. Los interpretacionistas tratan de encontrar sntesis
precisas de los pormenores histricos y situar los acontecimientos que des
criben en un contexto inteligible dentro del que pueda explicarse el signifi
cado de las acciones. Como ha escrito Ferejohn (en Goldstein y Keohane,
1993, p. 228): Queremos que las teoras de las ciencias sociales propor
cionen explicaciones causales de los acontecimientos [...] [y] que expliquen
las razones de la accin social o su significado. No slo queremos saber lo
que llev al agente a realizar un acto determinado, sino sus razones para
hacerlo. Geertz (1973, p. 17) tambin escribe que ... no nos interesa qui
tarle al comportamiento humano, antes de comenzar a examinarlo, precisa
mente las propiedades que nos atraen.
Los investigadores que hacen hincapi en la interpretacin pretenden
arrojar luz sobre los aspectos deliberados del comportamiento humano uti
lizando el concepto de Verstehen (empatia: comprender el significado de
las acciones e interacciones a partir del punto de vista de los que participan
en ellas [Eckstein, 1975, p. 81]). Los interpretacionistas quieren explicar
las razones de las acciones intencionadas relacionndolas con todos los
conceptos y prcticas en los que estn inmersas. Tambin emplean normas
de evaluacin: Las normas ms evidentes son la coherencia y el campo de
aplicacin: una explicacin interpretativa tiene que dar la mxima coheren
cia o inteligibilidad a un conjunto de prcticas sociales y, si lo que explica
es un conjunto de prcticas determinado, tiene que ser compatible con otras
prcticas o tradiciones de la sociedad (Moon, 1975, p. 173).
Para los interpretacionistas, quiz la recomendacin operativa ms im
portante sea que los investigadores aprendan mucho sobre una cultura antes
de elaborar preguntas de investigacin, ya que slo mediante una profunda
inmersin cultural y un intenso conocimiento de la materia se pueden plan
tear preguntas correctas y formular hiptesis tiles. Duneier (1993), por
ejemplo, estudi el comportamiento colectivo de los hombres de clase tra
bajadora negros y blancos en un bar autoservicio no segregado de Chicago.
Al sumergirse en esta cultura local durante cuatro aos, le sorprendieron
ciertas cosas que antes no se le haban ocurrido. Por ejemplo, observ que,
aunque estos hombres estaban muy en contra del Partido Republicano, su
actitud ante muchos problemas era socialmente conservadora.
Algunos investigadores llevan an ms lejos el papel de la interpreta
cin, llegando a indicar que, para las ciencias sociales, constituye un para
digma de investigacin completamente diferente, ... no una ciencia experi
m ental en busca de leyes sino otra de tipo interpretativo en busca de
significado (Geertz, 1973, p. 5). Sin embargo, para nosotros, la ciencia
(tal como la hemos definido en el apartado 1.2 del captulo 1) y la interpre
tacin no son empresas fundamentalmente diferentes que persigan objeti

vos distintos. Ambas dependen de la elaboracin de cuidadosas descripcio
nes, de una comprensin profunda del mundo, de que se planteen buenas
preguntas, de la formulacin de hiptesis falsables a partir de teoras ms
generales y de la recogida de las pruebas necesarias para evaluar tales hip
tesis. La aportacin primordial de la ciencia es un conjunto de procedi
mientos con los que se pueden dar respuestas a preguntas descriptivas y
causales elaboradas apropiadamente.
Al insistir en la metodologa inferencial no pretendemos menoscabar la
im portancia del proceso de form ulacin de preguntas fructferas. Por el
contrario, estamos de acuerdo con los interpretacionistas en que ste resulta
crucial para entender en profundidad una cultura, antes de formular hipte
sis o de disear un proyecto de investigacin sistemtico que encuentre una
respuesta. Slo queremos aadir que no se puede evaluar la veracidad de
afirmaciones basadas en mtodos como el de la observacin participante si
no se utiliza la lgica de la inferencia cientfica que nosotros describimos.
Encontrar respuestas adecuadas para preguntas errneas es un ejercicio
pueril. La interpretacin que parte del concepto de Verstehen suele ser
fuente de penetrantes hiptesis. Por ejemplo, las detalladas observaciones
que hizo Richard Fenno del Congreso estadounidense (Fenno, 1978) a tra
vs de lo que l denomina empaparse y hurgar han hecho grandes apor
taciones al estudio de esta institucin, principalmente porque han ayudado
a plantear mejores preguntas de investigacin. En su estudio de las regiones
italianas, Putnam (1993, p. 12) afirm a que para practicar el m todo de
empaparse y hurgar ... es necesario que el investigador se sumeija en
los pequeos detalles de una institucin, con el fin de participar, como los
que viven en ella a diario, en sus costumbres y prcticas, en sus xitos y
fracasos. Esta inmersin agudiza nuestras intuiciones y ofrece innumera
bles pistas sobre cmo se articula la institucin y de qu manera se adapta a
su medio. Cualquier definicin de ciencia que no deje lugar a las ideas re
lativas a la elaboracin de hiptesis ser tan frvola como una interpreta
cin a la que no le preocupe descubrir la verdad.
Sin embargo, una vez que las hiptesis se han formulado, para demos
trar que con correctas (dejando un margen a la incertidumbre) se precisan
inferencias cientficas vlidas. Adems, los procedimientos inferenciales de
los cientficos sociales interpretacionistas deben respetar las mismas reglas
que los de otros investigadores cualitativos y cuantitativos. Esto significa que,
aunque estamos de acuerdo en que las ciencias sociales de calidad necesi
tan interpretaciones penetrantes u otros mtodos para generar buenas hip
tesis, tambin hay que subrayar que la ciencia es esencial para que la inter
pretacin sea precisa. Si pudiramos entender el comportamiento humano
nicam ente a travs del concepto de Verstehen, nunca podram os falsar
nuestras hiptesis descriptivas o aportar pruebas de ellas que no formaran
parte de nuestra propia experiencia. En consecuencia, las conclusiones nunsaass?;
49
ca dejaran de ser hiptesis no comprobadas y las interpretaciones tendran

un carcter personal y no cientfico.
Uno de los mejores y ms famosos ejemplos de la tradicin interpretati
va es el anlisis que hizo Clifford Geertz del estudio de Gilbert Ryle sobre
las diferencias entre un tic nervioso y un guio. Geertz (1973, p. 6) escribe:
Pensemos en [...] dos chicos que contraen rpidam ente los prpados de sus respectivos
ojos derechos. En uno de ellos es un tic involuntario; en el otro, una seal de tipo conspirativo para un amigo. Los dos m ovim ientos son, com o tales m ovim ientos, idnticos.
Si se realizara una observacin fenomenstica de estos m ovim ientos aislados, como la
hara una cm ara fotogrfica, no se podra distinguir entre el tic y el guio o si, en reali
dad, ambos han sido una cosa u otra. Sin embargo, la diferencia que existe entre un tic
nervioso y un guio es enorme, aunque no sea fotografiable, como sabe cualquiera que
haya tenido la desgracia de que confundieran la primera con la segunda. El que guia se
est comunicando de una forma precisa y determinada: (1) deliberadam ente, (2) con al
guien en concreto, (3) para transm itir un mensaje concreto, (4) segn un cdigo social
establecido y (5) sin que lo note el resto de los presentes. Com o seala Ryle, el que gui
a hace dos cosas: contraer el prpado y guiar, m ientras que el que tiene un tic slo
hace una: contraer el prpado. Cuando existe un cdigo pblico por el que contraer los
prpados se considera una seal de tipo conspirativo. hacer este m ovim iento
es guiar.
Geertz est sealando un importante problema conceptual. Sin el con

cepto de guio, al que da sentido una teora de la comunicacin, el estu
dio ms preciso de las contracciones de los prpados en los seres huma
nos carecera de sentido para los que estudian las relaciones sociales. En
este ejemplo, la teora, que surgi de meses de empaparse y hurgar y de
minuciosos estudios culturales, resulta esencial para la pregunta bsica de
si las contracciones de los prpados pueden ser siquiera tics o guios.
Este ejemplo indica claramente la gran importancia que tiene la interpreta
cin, ya que proporciona nuevas formas de mirar el mundo (nuevos con
ceptos que considerar e hiptesis que evaluar). Sin una profunda inmersin
en una determinada circunstancia quiz ni siquiera pudiramos pensar en
qu teoras hay que sopesar. En el ejemplo anterior, si no pensramos en la
diferencia entre tics y guios, todo estara perdido. Si la interpretacin o
cualquier otra cosa nos ayuda a abordar nuevos conceptos o hiptesis,
entonces su utilidad resulta incuestionable, lo cual se ha confirmado una y
otra vez no slo en relacin a este mtodo sino a otras formas similares de
pormenorizada comprensin cultural.
El investigador, una vez que ha hecho una distincin terica relevante,
como la que afecta al guio y al tic, necesita evaluar la hiptesis que indica
que estn teniendo lugar guios. Es en esta evaluacin donde la lgica de la
inferencia cientfica no tiene rival. En otras palabras, la mejor manera de
determinar el significado de las contracciones de los prpados es la que se
basa en los mtodos sistemticos descritos en este libro. Si lo crucial fuera
distinguir entre un tic nervioso y un guio, resultara fcil disear un proce

dimiento de investigacin para hacerlo. Si, por ejemplo, creemos que cier
tas contracciones de los prpados son guios dotados de un significado po
ltico, ser posible observar entonces otras circunstancias similares, ya que
un elaborado mecanismo de sealizacin como ste (un cdigo pblico)
probablemente se utilizar de nuevo una vez desarrollado. A la vista de esta
posibilidad, podramos registrar las ocasiones en las que se contrae el pr
pado de este actor, observar si el otro actor principal le mira en el momento
adecuado y si el primero le responde. Podramos incluso disear una serie
de experimentos para ver si los individuos de esta cultura estn acostum
brados a comunicarse de esta manera. Comprender la cultura, describir cui
dadosamente el acontecimiento y estar muy familiarizados con situaciones
similares nos ayudar a plantear las preguntas correctas y nos dar incluso
ms confianza en nuestras conclusiones. Pero slo con los mtodos de la
inferencia cientfica podremos evaluar la hiptesis y determinar si es o no
correcta.
La interpretacin que da Geertz al guio se expresa mejor como una hi
ptesis causal (que definimos precisamente en el apartado 1 del captulo 3):
el hipottico efecto causal del guio sobre el otro actor poltico es la res
puesta de ste, dada la contraccin del prpado menos su reaccin a falta
de otro movimiento (y de otros cambios). Si la contraccin del prpado
fuera un guio, el efecto causal sera positivo; si slo hubiera un tic nervio
so, el efecto sera igual a cero. Si decidiramos hacer una estimacin de este
efecto causal (y, por tanto, averiguar si se ha producido un guio o un tic),
para extraer la mejor inferencia respecto a la interpretacin del comporta
miento observado, habra que entender todos los problemas inferenciales
que se analizan en profundidad en el resto del libro.
Si lo que interpretamos como guios fueran en realidad tics nerviosos
involuntarios, nuestros intentos de extraer inferencias causales de las con
tracciones de los prpados, utilizando una teora de la interaccin social vo
luntaria, fracasaran sistemticamente: no podramos generalizar, y lo sa
bram os2.
No es probable que un diseo de investigacin que se proponga distin
guir entre tics y guios sea importante para la mayora de las investigacio
nes de las ciencias polticas, pero el mismo problema metodolgico aparece
en gran parte de las reas de trabajo de los politlogos. Con frecuencia se
nos pide que interpretemos el significado de una accin. En poltica exte
rior, los que toman las decisiones se envan mensajes unos a otros. Ante un
determinado mensaje, cabe preguntarse si es una amenaza, un punto de ne
gociacin o una afirmacin destinada a atraerse al pblico del propio pas.
Conocer las normas culturales, las convenciones de las comunicaciones in
ternacionales y la historia de cada actor nos ayudar a hacer tal interpreta
cin; del mismo modo que nos ser til observar de cerca otros rasgos se
cundarios de la comunicacin. Pensemos tambin en el siguiente problema
cuantitativo: en los Estados Unidos los electores parecen estar enviando un

mensaje al no acudir a las urnas, pero qu significa esta escasa partici
pacin? Acaso refleja una alienacin respecto al sistema poltico?, repre
senta un clculo de los costes y beneficios de votar en el que los primeros
son mayores que los segundos?, muestra una decepcin respecto a los lti
mos candidatos o campaas?, podra ser consecuencia de un cambio en la
edad mnima para votar?, o una seal de que nada inquieta lo suficiente a
los votantes como para llevarlos a las urnas? El hecho de que un ciudadano
decida no votar, al igual que un guio o un mensaje diplomtico, puede sig
nificar muchas cosas. Un investigador inteligente siempre tendr que es
forzarse por plantear las preguntas adecuadas y despus para disear cui
dadosamente un estudio cientfico con el que averiguar qu significaba en
realidad una determinada accin ambigua.
Tambin nos gustara ocuparnos brevemente de las afirmaciones extre
mas que hacen unos pocos partidarios de la interpretacin cuando sealan
que los objetivos de algunas investigaciones deberan ser sentimientos y
significados sin consecuencias observables. En justicia, esta caracterizacin
no afecta ms que a una reducida minora de los investigadores de esta ten
dencia, pero sus afirmaciones son lo suficientemente efusivas como para
que valga la pena darles una contestacin explcita. Al igual que las opinio
nes excesivamente entusiastas de los primeros positivistas, que mantenan
la insostenible postura de que no haba sitio en la investigacin cientfica
para los conceptos no observables, estos argumentos resultan inapropiados
para la investigacin emprica. Psathas (1968, p. 510), por ejemplo, seala
que:
cualquier comportam iento que slo se centre en lo evidente y en lo que se m anifiesta en
actos concretos, directamente observables, es, como m nim o, ingenuo. Por lo tanto, el
desafio para el cientfico que pretende com prender la realidad social es captar el signifi
cado que, para el actor, tiene su propia accin.
Puede que Psathas tenga razn al sealar que los cientficos sociales que
slo se centran en comportamientos evidentes u observables se estn per
diendo mucho, pero cmo habram os de saber esto si no podemos ver
ms? Por ejemplo, si dos teoras sobre el concepto que uno tiene de s mis
mo tienen idnticas manifestaciones observables, ningn observador tendr
informacin suficiente para distinguirlas. Esto es as para cualquier obser
vador, independientemente de lo inteligente o sensible a factores culturales
que sea, de sus habilidades para la interpretacin, de lo bien que clasifique
sus propias suposiciones o del empeo que ponga en su empresa. La inter
pretacin, el presentimiento, la descripcin minuciosa, la observacin parti
cipante y la que no lo es, la entrevista en profundidad, la empatia, la cuantificacin y el anlisis estadstico, al igual que los dems procedimientos y
mtodos, no sirven para distinguir entre dos teoras que no tengan conse
cuencias observables diferentes. Por otra parte, si las hay, los mtodos que
describimos en este libro proporcionan formas de distinguirlas.
En la prctica, los etngrafos (y todos los buenos cientficos sociales) s
que buscan comportamientos observables con el fin de establecer diferen
cias entre las teoras. Puede que se sumerjan en la cultura, pero todos se ba
san en diversas formas de observacin, y cualquier nueva apreciacin del
contexto cultural procede directamente de ellas o de otros medios compara
bles. No siempre resulta fcil identificar observaciones relevantes. Por el
contrario, encontrar las apropiadas quiz sea la parte ms difcil de un pro
yecto de investigacin, especialmente (y necesariamente) en aquellas reas
de estudio tradicionalmente dominadas por la investigacin cualitativa.
1.2
Singularidad, complejidad y simplificacin
Algunos investigadores cualitativos rechazaran la idea de que un conoci

miento general sea necesario o til (ni siquiera posible) como punto de par
tida para comprender un determinado acontecimiento. Lo que sostienen es
que los hechos o unidades que estudian son nicos, y, en cierto sentido,
tienen razn. Slo hubo una Revolucin francesa, slo hay una Tailandia y
nadie que haya ledo las biografas pertinentes o que viviera los aos sesen
ta puede cuestionar el hecho de que slo hubo un Lyndon B. Johnson. Pero
an van ms lejos. La explicacin, segn su punto de vista, se limita a ese
nico acontecimiento o unidad: no al porqu de las revoluciones sino al de
la Revolucin francesa; no a por qu en ocasiones la democratizacin pare
ce languidecer, sino a por qu ocurre as en Tailandia; no a por qu ganan
los candidatos sino a por qu gan Johnson en 1948 y 1964. Los investiga
dores de esta tradicin creen que perderan su capacidad de explicar lo es
pecfico si intentaran ocuparse de lo general: de revoluciones, democratiza
cin o primarias del Senado estadounidense.
Sin embargo, el trm ino singularidad es engaoso. La Revolucin
francesa, Tailandia y Johnson son realmente nicos. En cierto sentido, lo
son todos los fenmenos, todos los acontecimientos; pero tambin lo fue
ron las elecciones al Congreso en la sptima circunscripcin de Pensilvania
en 1988, as como la opcin que tom cada uno de los millones de elec
tores que votaron en los comicios presidenciales de ese mismo ao. Con
siderado de forma global, cada aspecto de la realidad social es infinitamen
te complejo y se relaciona de alguna manera con acontecimientos naturales
y sociolgicos anteriores. Por lo tanto, la singularidad de las cosas forma
parte de la condicin humana: no distingue entre las situaciones que son
susceptibles de generalizacin cientfica y aquellas en las que no es posible
generalizar. De hecho, com o sealam os al analizar las teoras sobre la
extincin de los dinosaurios en el captulo 1, incluso los acontecimientos
nicos pueden estudiarse de forma cientfica si se presta atencin a las con
secuencias observables de las teoras que se han desarrollado para expli

carlos.
Lo que realmente plantea la singularidad es el problema de la compleji
dad. La cuestin no es si los acontecimientos son de por s nicos, sino el
hecho de que sea posible o no extraer de un amasijo de acontecimientos las
caractersticas principales de la realidad social que queremos comprender.
Una de las primeras, y ms difciles, tareas de la investigacin social es la
de simplificar, la cual nos expone a ser criticados por practicarla en exceso
y por omitir aspectos significativos de una situacin. No obstante, ningn
investigador puede evitar la simplificacin, que ha sido parte integrante de
todas las obras acadmicas conocidas cuantitativas y cualitativas, antro
polgicas y econmicas, de las ciencias sociales y de las naturales o fsi
cas y que probablemente siempre lo ser. Ni siquiera la descripcin ms
exhaustiva que hagan los mejores intrpretes de la cultura desde el conoci
miento profundo de un determinado contexto podr dejar de simplificar,
objetualizar y reducir de forma drstica la realidad observada. De hecho, la
diferencia que hay entre el grado de complejidad del mundo y el de la des
cripcin ms densa sigue siendo mucho ms grande que la que existe entre
dicha descripcin y el anlisis cuantitativo o form al ms abstracto. Ningu
na descripcin cualquiera que sea su densidad y ninguna explicacin
independientem ente del nm ero de factores explicativos que contem
ple pueden llegar a captar, siquiera levemente, toda la floreciente y agita
da realidad del mundo. No queda ms remedio que simplificar. La simpli
ficacin sistemtica es un paso crucial hacia el conocimiento til. Como ha
sealado un historiador econmico, si la insistencia en la singularidad se
lleva hasta el extremo de hacer caso omiso de todas las regularidades, se ne
gar a las ciencias sociales la posibilidad misma de que existan y los histo
riadores no sern ms que baladistas sin objetivos (Jones, 1981, p. 160).
El analista tiene que simplificar sus descripciones, siempre que sea posi
ble, slo despus de comprender la riqueza histrica y cultural. Puede que
los cientficos sociales, para establecer diferencias, utilicen nicamente
unos pocos elementos de la historia de ciertos grupos de acontecimientos.
No obstante, un conocimiento profundo y no estructurado del contexto his
trico y cultural de los fenmenos que quieren tratar de forma sinttica y
cientfica suele ser indispensable para evitar simplificaciones claramente
equivocadas. Poco se podra confiar en las generalizaciones de un cientfi
co social que estudiara las revoluciones o las elecciones al Senado estadou
nidense si no supiera mucho sobre la Revolucin francesa o las elecciones
de 1948 en Tejas y no le importara su ignorancia.
En resumen, creemos que, siempre que sea posible, la investigacin so
cial tiene que ser general y especfica al mismo tiempo: debe informamos
sobre los tipos de acontecimientos y tambin sobre hechos especficos en
lugares concretos. Queremos aislarnos del tiempo sin perder el vnculo con
l, y la insistencia en uno de estos objetivos puede variar de una investiga
cin a otra, aunque es probable que ambos estn presentes. Adems, ms

que opuestos son complementarios. De hecho, puede que la mejor manera
de entender un determinado acontecimiento sea utilizar tambin los mto
dos de la inferencia cientfica para estudiar pautas sistemticas en aconte
cimientos paralelos similares.
1.3
Estudios de caso comparados
En gran medida, lo que hacen los politlogos es describir de forma sistem

tica acontecimientos que son importantes desde el punto de vista poltico.
A la gente le interesa la cada de la Unin Sovitica, la reaccin popular en
los pases rabes ante la guerra autorizada por la ONU para expulsar a Irak
de Kuwait y los resultados de las ltimas elecciones al Congreso de los Es
tados Unidos. Confa en que los politlogos describan con un conocimiento
ms profundo que el de las inform aciones periodsticas la relacin que
existe entre estos y otros acontecimientos relevantes, ya sean contempor
neos o histricos. Al describir los acontecimientos tenemos que ser lo ms
precisos y sistemticos que sea posible. Esto supone que si logramos en
contrar medidas cuantitativas vlidas para lo que queremos saber, tenemos
que utilizarlas: qu proporcin de los peridicos soviticos critica las pol
ticas gubernamentales?, qu ponen de manifiesto las encuestas de opinin
llevadas a cabo en Jordania y Egipto sobre la actitud de estos pases hacia
la Guerra del Golfo?, qu porcentaje de congresistas estadounidenses fue
reelegido?
Aunque cuantificar produzca precisin, no favorece necesariamente la
exactitud, ya que inventar ndices cuantitativos que no se relacionen direc
tamente con los conceptos o acontecimientos que pretendemos medir puede
conducir a graves errores de medida y a problemas en las inferencias causa
les (vase el apartado 1 del captulo 5). Del mismo modo, existen mtodos
ms y menos precisos para describir acontecimientos no cuantificables.
Hay disciplinados cualitativistas que intentan analizar con cuidado las
constituciones y leyes, en vez de informar nicamente de lo que los obser
vadores dicen sobre ellas. Los investigadores, al realizar estudios de caso
sobre polticas gubernam entales, plantean a los entrevistados preguntas
agudas y bien definidas, cuyas respuestas sern relativamente claras, y son
dean de forma sistemtica todo comentario inesperado que pueda sugerir
hiptesis relevantes. Los estudios de caso son esenciales para la descripcin
y, por tanto, para las ciencias sociales. No tiene sentido intentar explicar lo
que antes no se ha descrito con un razonable grado de precisin.
Describir con perspicacia acontecimientos complejos no es algo trivial.
En reas como la poltica comparada o las relaciones internacionales la la
bor de descripcin es especialmente importante porque todava hay muchas
cosas que necesitamos saber, nuestra capacidad explicativa es dbil y una
buena descripcin depende en parte de una buena explicacin. Algunas de

las razones que explican esta necesidad de conocer y la debilidad de nues
tra capacidad explicativa son las mismas: en las relaciones internacionales,
por ejemplo, las pautas de poder, de alineamiento y de interdependencia
han cambiado mucho ltimamente, por lo que, al alterarse el contexto sistmico en el que tienen lugar las relaciones que se observan entre los estados,
cada vez resulta ms necesario describir correctamente las nuevas situacio
nes. La causalidad suele ser difcil de determinar porque tanto los estados
como otros actores pretenden prever y contrarrestar las acciones de los de
ms y, a la hora de explicar el comportamiento de dichos estados, las ex
pectativas pueden tener un papel tan importante como las acciones que se
observan. Pretender explicar algn aspecto de las relaciones internacionales
presuponiendo que no hay interacciones estratgicas ni previsin de reac
ciones ser mucho menos til que describir con cuidado acontecimientos
que tenemos razones para creer que son importantes y que estn interconectados. Una buena descripcin es mejor que una mala explicacin.
Una de las ventajas del estudio de caso en profundidad, que suele pasar
se por alto, es que desarrollar una buena hiptesis causal complementa una
buena descripcin, no rivaliza con ella. Encuadrar un estudio de este tipo
en una pregunta explicativa puede producir una descripcin ms centrada y
relevante, aunque al final el estudio no logre extraer una sola inferencia
causal vlida.
Nosotros afirmamos que los estudios de caso comparados pueden gene
rar inferencias causales vlidas cuando se utilizan los procedimientos des
critos en el resto del libro, aunque, tal como se practican en la actualidad,
no suelan cumplir las normas de una inferencia vlida (que explicaremos
en el captulo 3). De hecho, gran parte de lo que los cientficos sociales con
enfoque histrico o interpretativo denominan trabajo explicativo sigue
siendo fundamentalmente descriptivo porque no cumple esas normas de
aplicacin universal. Desde esta perspectiva, resulta fundamental lo que se
alan muchos investigadores cuando aconsejan que, al describir o explicar,
los estudios de caso comparados sean ms sistemticos.
Alexander George, por ejemplo, recomienda un mtodo de compara
cin estructurada y centrada que hace hincapi en la disciplina cuando se
trata de recoger datos (George y McKeown, 1985; vase tambin Verba,
1967). George y sus colaboradores subrayan la necesidad de que haya una
recogida sistemtica de la misma informacin de las mismas variables
en unidades seleccionadas cuidadosamente. Tambin insisten en que, para
que finalmente sea posible la inferencia causal, son necesarias directrices
tericas plantearse preguntas explicativas cuidadosamente elaboradas
con el fin de describir de forma sistem tica3.
El mtodo de la comparacin estructurada y centrada es una forma siste
mtica de emplear lo que George y McKeown denominan el procedimien
to de la coherencia. A travs de este sistema, el investigador define y es
tandariza las necesidades de los datos de los estudios de caso [...] formulan
do preguntas relevantes desde el punto de vista terico con el fin de dar
pautas para el anlisis de cada caso (George y McKeown, 1985, p. 41). El
problema que sealan George y McKeown est bien trado: Para hacer una
comparacin controlada mediante un tamao muestral pequeo hay que se
guir un procedimiento sistemtico de recogida de datos. Esa compara
cin estructurada y centrada precisa datos de las mismas variables en dife
rentes unidades. Por lo tanto, no es un mtodo diferente al que subrayamos
aqu, ya que constituye una forma de sistematizar la informacin en estu
dios de caso descriptivos de manera que sea factible utilizarla para hacer in
ferencias descriptivas o causales. M uchos de los valiosos consejos que,
como ste, se dan para hacer estudios de caso comparados son elementales,
pero se suelen pasar por alto.
2.
La inferencia: el fin cientfico de la recogida de datos
La inferencia es un proceso en el que se utilizan hechos que conocemos

para aprender sobre los que desconocemos. Los hechos conocidos se some
ten a las preguntas, teoras e hiptesis de nuestra investigacin y conforman
nuestros datos y observaciones de tipo cuantitativo o cualitativo.
Cuando buscamos un conocimiento general, en s mismo o para com
prender mejor determinados hechos, es preciso evitar de alguna manera que
nos apabulle el enorme mare mgnum de observaciones potenciales y rea
les que hay sobre el mundo. Por fortuna, la solucin a este problema reside
precisamente en la bsqueda del conocimiento general. Esto quiere decir
que la mejor manera cientfica de organizar los hechos es hacer que sean
consecuencias observables de alguna teora o hiptesis. La simplificacin
cientfica entraa la provechosa eleccin de una teora (o hiptesis) con el
fin de evaluarla; despus, la teora nos lleva a seleccionar los hechos que
son consecuencia de ella. Organizarlos en funcin de las consecuencias ob
servables de una determinada teora tiene importantes y beneficiosos resul
tados para el diseo y la realizacin de la investigacin. En primer lugar,
con este criterio de seleccin de los hechos podemos damos cuenta rpida
mente de que si existen ms observaciones de las consecuencias de una teo
ra no podemos ms que beneficiarnos de ello al evaluar la teora en cues
tin. Como ms informacin de este tipo no puede ser perjudicial, esos
datos nunca se desechan, y as mejora el proceso investigador.
En segundo lugar, no hay por qu poseer una teora completa antes de
recoger los datos, ni tampoco nuestra teora tiene por qu mantenerse inal
terable durante el proceso. La teora y los datos interaccionan. Al igual que
ocurre con la gallina y el huevo, siempre es necesaria alguna teora antes de
recoger los datos y tambin se precisan algunos datos antes de teorizar. Los
manuales de investigacin nos dicen que utilicemos los datos para compro
bar nuestras teoras, pero aprender de ellos puede ser un objetivo tan impor
tante como evaluar teoras e hiptesis previas. Para que se produzca este
aprendizaje hay que reorganizar los datos como consecuencias observables
de la nueva teora. Esta reorganizacin es muy habitual al principio de mu
chas investigaciones, generalmente despus de haber recogido algunos da
tos prelim inares; despus, prosigue la recogida de datos para evaluar la
nueva teora. Siempre se debe intentar seguir recogiendo datos, incluso des
pus de la reorganizacin, para contrastar la nueva teora y evitar as utili
zar el mismo material para evaluar sta y aquella de la que parti 4.
En tercer lugar, insistir en que se recojan datos que sean consecuencias
observables de una hiptesis deja mucho ms claro el territorio comn que
comparten los estilos de investigacin cuantitativo y cualitativo. De hecho,
una vez que dejamos de pensar en los casos, unidades o registros de la for
ma generalmente estrecha, e incluso ingenua, que es habitual, nos damos
cuenta de que la mayora de los estudios cualitativos podran aportar una
gran cantidad de consecuencias observables a las teoras que estamos eva
luando; sin embargo, muchas de ellas pueden pasarle desapercibidas al in
vestigador. En consecuencia, organizar los datos mediante una lista de las
observaciones especficas de una teora ayuda a poner de manifiesto el fin
cientfico esencial de gran parte de la investigacin cualitativa. En cierto
sentido, estamos pidindole al investigador que estudia un acontecimiento
concreto quiz una decisin gubernamental especfica que se pregun
te: Si mi explicacin de por qu la decisin result de una determinada
manera es correcta, que ms podra observar en el mundo real?. Se pue
den encontrar consecuencias observables adicionales en otras decisiones,
pero tambin en otros aspectos de la que se estudia, por ejemplo: cundo se
tom, cmo, o de qu manera se justific. La mxima crucial que ha de
guiar tanto la creacin de una teora como la recogida de datos es la bs
queda de ms consecuencias observables de esa teora.
Cada vez que desarrollamos una nueva teora o hiptesis resulta prove
choso hacer una lista de todas las consecuencias de la misma que, en prin
cipio, pudieran observarse. La lista, que podra despus limitarse a los ele
m entos sobre los que se han recogido datos o pudiera fcilm ente
hacerse , constituye a continuacin la gua bsica operativa para el pro
yecto de estudio. Si recoger un dato ms nos ayuda a considerar otra mane
ra de evaluar la teora, merece la pena hacerlo (siempre sujetos a los condi
cionantes de tiempo, dinero y esfuerzo). Cuando una entrevista u otro tipo
de observacin puede ser de inters, pero no es una consecuencia observa
ble potencial de esta teora (o de otra que sea relevante), entonces tiene que
ser evidente que no nos ayudar a evaluarla.
Dentro del proceso de simplificacin que se desarrolla al organizar nues
tros datos como consecuencias observables de la teora, necesitamos siste
matizar dichos datos. Podemos pensar en convertir los fenmenos brutos del
mundo real en clases que estn compuestas por unidades o en casos
que, a su vez, se compongan de atributos, variables o parmetros. La

clase podra ser de votantes; las unidades, una muestra de esos votantes
en diversas circunscripciones para las elecciones al Congreso estadouniden
se; y los atributos o variables podran ser la renta, la identificacin partidista
o cualquier otra cosa que represente una consecuencia observable de la teo
ra que se evala. La clase tambin podra ser un determinado colectivo,
como las comunidades o pases; las unidades podran ser una seleccin de
stos; y los atributos o variables podran ser el tamao de los mismos, el tipo
de gobierno, su situacin econmica, composicin tnica o cualquier otro
elemento cuantificable y de inters para el investigador. Estos conceptos, as
como elaboraciones tericas como las tipologas, estructuras y todo tipo de
clasificaciones, son tiles mecanismos temporales cuando estamos recogien
do datos, pero no plantean una hiptesis clara que evaluar. En general, no
animamos a los investigadores a que organicen sus datos de esta manera, ya
que slo necesitamos el concepto organizador inherente a nuestra teora. Es
decir, si las observaciones no son consecuencia de nuestra teora, resultan
irrelevantes. Si son irrelevantes o no observables, hay que prescindir de
ellas, pero si son relevantes, tenemos que utilizarlas. Nuestros datos no tie
nen por qu estar en el mismo nivel de anlisis. Hay datos desagregados u
observaciones sobre un perodo de tiempo diferente, o incluso sobre otra
parte del mundo, que pueden proporcionar ms consecuencias observables
de una teora. Quiz no nos interesen en absoluto estas consecuencias secun
darias, pero si concuerdan con la teora, tal como se predice, nos ayudarn a
otorgarle ms confianza a sus capacidades y aplicabilidad. Nuestros datos
tampoco necesitan ser simtricos: siempre que todos sean consecuencias
observables de nuestra teora, podremos utilizar un detallado estudio de una
provincia, una comparacin de dos pases, entrevistas personales con miem
bros de la administracin pertenecientes a un nico sector de polticas e, in
cluso, algn elemento cuantitativo. En este proceso vamos de lo particular a
lo general, ya que caracterizar ciertas unidades a partir de rasgos comunes
es un proceso generalizador. La consecuencia es que aprendemos mucho
ms acerca de las teoras generales y de los hechos concretos.
En general, lo que queremos es concentrar en nuestra hiptesis tanta in
formacin como sea posible, lo cual puede suponer la realizacin de ms
estudios de caso; pero esto suele ser demasiado difcil, requiere mucho
tiempo o es caro. Es evidente que no debemos considerar informacin irre
levante. Por ejemplo, tratar el nmero de escaos conservadores en la C
mara de los Comunes britnica como una variable mensual en vez de como
algo que cambia en las elecciones nacionales aumentara considerablemen
te el nmero de observaciones, pero no tendra sentido porque no aportara
mucha ms informacin. Por otra parte, desagregar los resultados de las
elecciones presidenciales estadounidenses por estados, e incluso por conda
dos, aumenta el nmero de casos y tambin la cantidad de informacin que
se aporta al problema.
Estos datos desagregados pueden parecer irrelevantes, ya que el objetivo

es conocer las causas de la victoria de un determinado candidato en la ca
rrera presidencial, que es una cuestin fundamentalmente agregada. Sin
embargo, la mayora de las explicaciones que se dan al resultado de las
elecciones presidenciales tienen diferentes consecuencias observables en
cada una de las unidades desagregadas. Si, por ejemplo, pronosticamos el
resultado de esta votacin en funcin de variables econmicas como el n
dice de paro, el uso de este indicador en cada estado aportar muchas ms
observaciones sobre las consecuencias de nuestra teora que el ndice agre
gado del conjunto del pas. Verificar que la teora tiene sentido en otras si
tuaciones aunque stas no tengan un inters directo aumenta la con
fianza en que la teora es correcta y en que explica adecuadamente la nica
consecuencia observable que nos interesa.
3.
Modelos formales de investigacin cualitativa
Un modelo es una simplificacin de algn aspecto del mundo y una aproxi

macin al mismo. Los modelos nunca son, netamente, verdaderos o fal
sos, aunque los buenos slo recopilan las caractersticas correctas de la
realidad que representan.
Pensemos por ejemplo en un juguete de plstico y pegamento que sea un
modelo de quince centmetros de un avin. sta es una pequea reproduccin
del autntico aparato, que no puede volar ni contiene nada y cuyos compo
nentes tampoco se mueven. Nadie la confundira con el avin real; preguntar
si cada aspecto del modelo es verdadero es como plantearse si la modelo que
pos para la Gioconda de Leonardo da Vinci tena realmente una sonrisa tan
seductora. Aunque la tuviera, no esperamos que el cuadro de Leonardo sea
una representacin exacta de nadie, ya sea una modelo real o la Virgen Ma
ra, del mismo modo que no esperamos que el modelo de un avin refleje to
das sus caractersticas reales. Sin embargo, nos gustara saber si esa repro
duccin recopila las caractersticas correctas de un avin para un problema
concreto. Si queremos ensearle a un nio cmo es realmente un avin, este
modelo podra ser adecuado. Si est hecho a escala, tambin podra ser til
para que los diseadores aeronuticos hicieran pruebas de tneles aerodin
micos. La caracterstica principal de un avin real que se aprecia en este mo
delo es la forma, y, para ciertos propsitos, ste es realmente uno de los ras
gos apropiados. Evidentemente, este modelo no refleja multitud de detalles
de un avin, entre ellos el tamao, el color, la sensacin de estar en una aero
nave, la solidez de sus diversos componentes, el nmero de plazas a bordo, la
potencia de sus motores, el tejido de los cojines de los asientos, ni tampoco
otros muchos sistemas esenciales como el elctrico, el de aire o el de conduc
cin de agua. Si queremos entender estos aspectos del avin, necesitaremos
un conjunto de modelos completamente diferente.
Podemos evaluar un modelo sin conocer qu caractersticas del objeto

queremos evaluar? Est claro que no. Por ejemplo, podramos pensar que
un modelo que se ocupara de la cantidad de desperdicios de un avin no se
ra de gran utilidad. Sin embargo, s que sera muy importante para fines
educativos o para realizar pruebas de tneles aerodinmicos. Como incluso
el polvo de las moquetas puede hacer que un avin pese ms y que, por tan
to, haya que pagar ms combustible, los modelos de este tipo son importan
tes para la industria aeronutica y se han realizado (ahorrndose as millo
nes de dlares).
Hay versiones ms o menos restrictivas de todos los modelos. Los ms
restrictivos son ms claros, concisos y abstractos, pero tambin menos rea
listas (a menos que el mundo sea realmente conciso). Los poco restrictivos
son detallados, contextales y ms realistas, pero tambin menos claros y
ms difciles de calibrar con precisin (vase King, 1989: apartado 5 del
captulo 2). En qu punto de esta gradacin decidimos construir un m ode
lo depende de nuestro objetivo y de la complejidad del problema que estu
diemos.
Existen modelos fsicos, grficos, verbales o algebraicos. Por ejemplo,
la descripcin cualitativa de los sistemas judiciales europeos en un libro
que se ocupe de ese tema constituye un modelo del mismo. Independiente
mente de lo profunda que sea la descripcin o del talento del autor, el con
tenido del libro siempre ser una abstraccin o una simplificacin de los
sistemas jurdicos reales. Como para comprender se necesita resumir, lo
que indica que un libro es bueno es tanto lo que se deja fuera de l como
lo que se incluye.
Mientras que los investigadores cualitativos a menudo emplean modelos
verbales, nosotros utilizaremos los algebraicos en el anlisis que sigue, con
el fin de estudiar los de tipo verbal y mejorarlos. Al igual que ocurre con
los juguetes aeronuticos y con los libros que se dedican en su totalidad a
estudiar la Revolucin francesa, nuestros modelos algebraicos cualitativos
no tienen que confundirse con la propia investigacin cualitativa. Su nico
propsito es sealar con especial claridad los problemas que hay que evitar
y las oportunidades que pueden aprovecharse. Adems, con frecuencia ocu
rre que nos ayudan a descubrir ideas que, de otro modo, no se nos habran
ocurrido.
Partimos de la base de que los lectores no han tenido experiencia previa
con modelos algebraicos, aunque a los que conozcan los estadsticos algu
nos de los siguientes les resultarn familiares. Sin embargo, la lgica infe
rencial de estos m odelos se aplica tanto a la investigacin cuantitativa
como a la cualitativa. El hecho de que, probablemente, los cuantitativistas
estn ms familiarizados con nuestra terminologa no significa que se les
vaya a dar mejor aplicar la lgica de la inferencia cientfica. Adems, es
tos modelos no se adaptan ms directamente a la investigacin cuantitativa
que a la cualitativa; en ambos casos representan abstracciones tiles de la
ssmms:
6V
investigacin a la que se aplican. Para facilitar su presentacin, todos los

modelos algebraicos van precedidos de descripciones verbales a las que si
guen recuadros con una notacin matemtica normalizada. Aunque no lo
recomendamos, los recuadros pueden saltarse sin que se pierda el hilo ar
gumentad
4.
Un modelo formal sobre la recogida de datos
Antes de formalizar nuestra presentacin de las inferencias descriptiva y

causal los dos objetivos principales de la investigacin social , desa
rrollaremos un modelo para la recogida y resumen de datos que es bastan
te sencillo, pero que resulta eficaz para analizar los problemas inferenciales. Nuestro modelo algebraico no es tan form al como los estadsticos,
aunque s clarifica nuestras ideas y facilita su transmisin. Con la expre
sin recogida de datos hacemos alusin a una gran variedad de mtodos,
entre los que se incluye la observacin general y la participante, las entre
vistas en profundidad, las encuestas a gran escala, la historia basada en
fuentes secundarias, los experimentos aleatorios, la etnografa, el anlisis
de contenido y cualquier otro mtodo que sirva para reunir datos fiables.
La regla ms importante para toda recogida de datos es dejar claro cmo
se han creado y de qu manera hemos accedido a ellos. Toda informacin
que recojamos tiene que concretar las consecuencias observables de nues
tra teora. Desarrollar una nueva pregunta de investigacin puede ayudar
nos, pero no servir para responder a la primera si no es una consecuencia
observable de ella.
Hacemos modelos con los datos por medio de variables, unidades y
observaciones. Un ejemplo sencillo es la renta anual de cuatro personas
diferentes. Los datos pueden representarse simplemente mediante cuatro
cantidades: 9.000, 22.000, 21.000 y 54.292 dlares. En el caso ms gene
ral, podramos etiquetar la renta de las cuatro personas (numeradas del 1
al 4) como y , y v y 2 e y A. Una variable codificada para dos entrevistas no
estructuradas podra utilizar los valores participativo, cooperador o
intransigente, y se etiquetara como v, z y r En estos ejemplos la varia
ble es y , las unidades son los individuos, y las observaciones, los valores
de las variables en cada unidad (renta en dlares o grado de cooperacin).
El smbolo y se denomina variable porque su valor cambia en cada unidad
y, en general, puede representar cualquier cosa cuyo valor se vaya alteran
do en un conjunto de unidades. Estas, dado que se puede recabar inform a
cin en un perodo de tiem po o en diferentes secciones de un rea, pueden
ser personas, pases, organizaciones, aos, elecciones o dcadas y, con
frecuencia, alguna combinacin de estas u otras unidades. Las observacio
nes pueden ser numricas, verbales, visuales o cualquier otro tipo de datos
empricos.
Supongamos, por ejemplo, que nos interesa estudiar las organizaciones

internacionales desde 1945. Antes de recoger los datos hay que decidir qu
resultados se quiere explicar. Podramos intentar comprender la influencia
en 1990 del factor tamao sobre la actividad de las organizaciones interna
cionales (que se clasificara por su campo de accin o por el propio tipo
de organizacin), los cambios en el tamao agregado de la actividad de
dichas organizaciones desde 1945 o las transformaciones ocurridas en su
actividad desde esa fecha que hubieran tenido que ver con la distribucin
de ese factor. Entre las variables que miden la actividad de las organizacio
nes internacionales podramos incluir el nmero de pases que pertenecen a
ellas en un momento dado, la cantidad de tareas que desempean o la mag
nitud de sus presupuestos y de su personal. En estos ejemplos, las unidades
de anlisis seran las organizaciones internacionales, sus campos de accin,
el nmero de pases miembros y perodos de tiempo como aos, quinque
nios o dcadas. En la fase de recogida de datos no se aplica ninguna regla
para determinar qu variables se recogen, cuntas unidades debe haber, si
stas deben ser ms numerosas que las variables o cul es el mejor mtodo
para m edir las ltimas. El nico criterio es que, en cada caso, nosotros pen
semos que lo que hacemos es importante. Cuando tenemos una idea ms
clara de cmo van a utilizarse los datos, la regla es intentar encontrar tantas
consecuencias observables de una teora como sea posible. Como subraya
mos en el captulo 1 , la investigacin emprica puede utilizarse tanto para
evaluar hiptesis previas como para plantear otras que no se haban baraja
do anteriormente, pero si sirve para el segundo propsito, hay que recoger
nuevos datos para evaluar las nuevas hiptesis.
A partir de nuestro anlisis debe quedar claro que en la mayora de las
obras que se denominan ((estudios de caso se miden numerosas variables
de muchos tipos diferentes de unidades. Aunque estas investigaciones no
suelen utilizar ms de un puado de casos, el nmero total de observacio
nes es, generalmente, inmenso. Por lo tanto, es esencial distinguir entre n
m ero de casos y de observaciones. El primero puede tener cierto inters
para ciertos fines, pero el ltimo es importante para evaluar la cantidad de
informacin que un estudio aporta a la resolucin de una pregunta terica.
Por consiguiente, reservamos la n habitual para referirnos nicamente al
nmero de observaciones y no al de casos. Slo de forma ocasional, como
cuando las observaciones individuales sean parcialmente dependientes, dis
tinguiremos entre informacin y nmero de observaciones. El uso de esta
ltima expresin procede del muestreo de encuestas, en el que n es el n
mero de personas que hay que entrevistar; sin embargo, nosotros la utiliza
remos de forma m ucho ms general. En realidad, nuestra definicin de
observacin coincide exactam ente con lo que Harry Eckstein (1975,
p. 85) denomina caso. Como seala este autor; Un estudio de seis elec
ciones generales en Gran Bretaa puede ser, pero no tiene por qu, un estudio
en el que n = I. Podra ser otro en el que n ~ 6 o tambin n = 120.000.000.
Todo depende de si el objeto de estudio son los sistemas electorales, las

elecciones o los votantes. La ambigedad sobre lo que constituye un
individuo (de ah el caso) slo puede evitarse si nos ocupamos de las
medidas de entidades concretas, y no de las propias entidades. De este
modo, un caso puede definirse tcnicamente como un fenmeno del que
slo sealamos e interpretamos una nica medida en cada variable perti
nente. La nica diferencia con nuestro uso es que, desde que Eckstein es
cribi su artculo, los investigadores han continuado utilizando la palabra
caso para referirse a un estudio de caso completo, que todava tiene una
definicin bastante imprecisa. Por lo tanto, siempre que sea posible utiliza
remos la palabra caso como lo hacen la mayora de los autores y reservare
mos el trmino observacin para hacer referencia a las medidas de una o
varias variables en una sola unidad.
En el resto del captulo queremos m ostrar de qu manera conceptos
como el de variable y unidad pueden hacer que abordemos de forma ms
clara el diseo de una investigacin, incluso cuando no sea apropiado utili
zar medidas cuantitativas para resumir la informacin de que dispongamos.
La cuestin que planteamos es: cmo podemos hacer inferencias descrip
tivas sobre la historia tal como fue sin perdemos en un mar de datos irre
levantes? Dicho de otro modo, cmo separar lo esencial de lo efmero?
5.
El resumen de los pormenores histricos
Despus de recoger los datos, el primer paso de cualquier anlisis es resu

mirlos. Los resmenes pueden describir una gran cantidad de datos pero no
estn directamente relacionados con la inferencia. Como, en realidad, lo
que nos interesa es generalizar y explicar, un resumen de los datos que van
a explicarse suele ser un buen punto de partida, pero no constituye un obje
tivo suficiente para la investigacin en las ciencias sociales.
Resumir es necesario, ya que, como nunca podemos decir todo lo que
sabemos sobre un conjunto de acontecimientos, no tendra sentido intentar
hacerlo. Los buenos historiadores comprenden cules son los datos crucia
les y, por lo tanto, en vez de perderse en digresiones, realizan estudios que
subrayan lo esencial. Para entender la historia europea de los prim eros
quince aos del siglo xix, quiz necesitemos comprender ciertos principios
de estrategia militar tal como lo hizo Napolen e, incluso, saber qu coma
su ejrcito si su avance dependa de los vveres que encontraba a su paso;
pero puede que sea irrelevante conocer el color del pelo de Napolen o si
prefera los huevos fritos a los cocidos. Los buenos textos histricos suelen
incluir, aunque no se limiten a ello, un sucinto resumen verbal de gran can
tidad de pormenores histricos.
Nuestro modelo para el proceso de resumen de los detalles histricos es
un estadstico, con el que se expresan datos de forma abreviada. Su objeti
vo es exponer caractersticas apropiadas de stos mediante un formato

til5. Por ejemplo, la media muestral, o promedio, es un estadstico:
i
y =
n
i
',+;>'2 + +:<') = 1 > ,
* i=l
en el que ^ y . es una manera cmoda de escribir y, + y 2 + y } + ... + y r. Otro

i!
estadstico es el mximo muestral. que
como -vmax :
* se etiqueta
*
-^max = Mximo (v,, y v ..., y)
(2.1)
La media muestral de las cuatro cifras de renta del ejemplo del apartado 4
(9.000, 22.000, 21.000 y 54.292 dlares) es 26.573 dlares, mientras que el
mximo muestral es 54.292. Podemos resumir los datos originales que con
tienen cuatro cifras mediante las dos cantidades que representan, respecti
vamente, la m edia y el m xim o m ustrales. Tambin podemos calcular
otras caractersticas de la muestra, como el mnimo, la mediana, la moda o
la varianza.
Cada resumen de este modelo reduce todos los datos (cuatro cifras en
este ejemplo simple o lo que conocemos de algn aspecto de la historia eu
ropea en el anterior) a un nico nmero. Comunicarse mediante resmenes
suele ser ms fcil y tiene ms sentido para el lector que utilizar todos los
datos originales. Evidentemente, si en nuestro conjunto de datos slo hu
biera cuatro nmeros, no tendra mucho sentido utilizar cinco resmenes
diferentes y sera ms sencillo presentar las cuatro cantidades originales.
Interpretar un estadstico suele ser ms fcil que comprender todo un con
junto de datos, pero siempre se pierde informacin al describir una gran
cantidad de nmeros utilizando unos pocos.
Qu normas rigen el resumen de los pormenores histricos? La primera
es que los resmenes deben centrarse en los resultados que queremos des
cribir o explicar. Si lo que nos interesa es el crecimiento de la organizacin
internacional media, no sera muy inteligente centrarse en las Naciones
Unidas; pero si lo que nos importa es cmo influye el mayor o menor tama
o en la distribucin de dichas organizaciones, las Naciones Unidas seran
seguramente una de las unidades en las que tendramos que centrarnos. La
ONU no es una organizacin representativa, pero s es importante. Para es
tudiar la tpica organizacin internacional desde el punto de vista estadsti
co examinaramos valores medios (de presupuestos, cometidos, nmero de
miembros, etc.), pero para comprender el abanico de actividades tendra
mos que examinar la varianza. El segundo precepto, igualmente evidente,
es que un resumen tiene que simplificar la informacin de que disponemos.
En trminos cuantitativos, esto significa que siempre hay que utilizar me
nos estadsticos sintetizadores que unidades hay en los datos originales,
porque, de no ser as, podra ser ms fcil presentar los datos originales sin
ningn tipo de resum en6. La sntesis que utilicemos tambin ha de ser lo

suficientemente simple como para que nuestro pblico pueda entenderla.
Ningn fenmeno puede resumirse de manera perfecta, de manera que las
normas que dictan lo que es adecuado dependen de nuestros propsitos y
del pblico. Por ejemplo, un artculo cientfico sobre guerras y alianzas po
dra incluir datos sobre 10.000 observaciones. En este trabajo, estara justi
ficado que hubiera resmenes que utilizaran cincuenta nmeros; sin em
bargo, incluso para un experto, cincuenta indicadores separados podran
resultar incomprensibles si no existe otro resumen. Para impartir una clase
sobre esta materia a uno de los primeros cursos de licenciatura, tres cifras
seran ms que suficiente.
6.
La inferencia descriptiva
La inferencia descriptiva es un proceso mediante el cual se comprende un

fenm eno no observado a partir de un conjunto de observaciones. Por
ejemplo, en las elecciones britnicas de 1979 nos podra interesar cmo
cambia en cada circunscripcin el voto a los partidos Conservador, Labo
rista y Socialdemcrata. Lo ms probable es que tengamos varias hiptesis
que evaluar; sin embargo, lo que observamos realmente son las elecciones a
la Cmara de los Comunes de ese ao en 650 circunscripciones.
Podramos pensar ingenuamente que, al registrar qu porcentaje de votos
y escaos recibieron los conservadores en cada circunscripcin, estamos ob
servando de forma directa su fuerza electoral. Sin embargo, la poltica siem
pre conlleva un cierto margen para lo aleatorio y lo impredecible, al igual
que el conjunto de la vida social y toda investigacin cientfica1. Suponga
mos que por un sbito descuido (o como deferencia hacia las ciencias socia
les) el Parlamento Britnico hubiera decidido celebrar elecciones cada se
mana en 1979 y supongamos tambin (de forma contrafctica) que stas
fueran independientes unas de otras. Aunque el apoyo subyacente a los con
servadores se mantuviera constante, cada repeticin semanal no registrara
el mismo nmero de votos por partido en cada circunscripcin. Podra cam
biar la situacin climatolgica, surgir epidemias, la gente podra tomar sus
vacaciones, y todo ello afectara a la participacin en las elecciones y a su
resultado. Adems, podran producirse acontecimientos fortuitos en el con
texto internacional o aparecer escndalos en los medios de comunicacin;
aunque estas contingencias no tuvieran importancia a largo plazo, s podran
influir en los resultados semanales. De este modo, numerosos acontecimien
tos transitorios podran producir resultados electorales ligeramente diferen
tes. Despus de todo, nuestra observacin de cualquiera de estas elecciones
no sera una medida perfecta de la fortaleza de los conservadores.
Por poner otro ejemplo, supongamos que nos interesa la intensidad del
conflicto entre los israeles (polica y residentes) y los palestinos en las co
munidades de los territorios ocupados por Israel en Cisjordania. Los infor

mes oficiales de ambos bandos parecen sospechosos o estn censurados, de
manera que decidimos llevar a cabo nuestro propio estudio. Quiz podamos
verificar la intensidad general del conflicto en diferentes comunidades me
diante entrevistas en profundidad o participando en actividades familiares o
de otros colectivos. Si hacemos ambas cosas durante una semana en cada
una de las comunidades, nuestras conclusiones sobre la intensidad del con
flicto en ellas reflejarn en parte los acontecimientos que, por casualidad,
sucedan en el perodo en que visitamos esos enclaves. Aunque nuestro es
tudio se llevara a cabo durante un ao, tampoco podramos conocer perfec
tamente el verdadero nivel de conflictividad, aunque s se reducira la incer
tidumbre sobre l.
En estos ejemplos, puede decirse que la varianza del voto conservador
en diferentes circunscripciones o la del conflicto en las comunidades cisjordanas surge de dos factores separados: de diferencias sistemticas y no sstemticas. En el ejemplo electoral, las primeras incluyen caractersticas
fundamentales y predecibles de las circunscripciones, como las diferencias
ideolgicas, de renta, de organizacin de la campaa o las referentes al
apoyo tradicional a cada partido. En hipotticas repeticiones semanales de
las mismas elecciones se mantendran las mismas diferencias sistemticas,
pero variaran las no sistemticas, como son los cambios producidos en la
participacin por las condiciones climatolgicas. En el ejemplo de Cisjor
dania, se consideraran diferencias sistemticas las profundas divergencias
culturales entre israeles y palestinos, su conocimiento mutuo y las pautas
de segregacin geogrfica de la vivienda. Si pudiramos comenzar nuestra
semana de observacin en doce ocasiones distintas, estas diferencias siste
mticas entre comunidades seguiran influyendo en la intensidad del con
flicto observado. Sin embargo, las no sistemticas, como los atentados te
rroristas o los ejemplos de brutalidad policial israel, no seran predecibles
y slo afectaran a la semana en que ocurrieran. En general, con las tcni
cas inferenciales apropiadas, podemos conocer la naturaleza de las diferen
cias sistemticas, aunque sea con la ambigedad que est presente en un
conjunto de datos de la vida real por las diferencias no sistemticas o alea
torias que contiene.
Por lo tanto, uno de los objetivos fundamentales de la inferencia es dis
tinguir entre el componente sistemtico y el no sistemtico dentro de los f e
nmenos que estudiamos. El sistemtico no es ms importante que el que
no lo es, y nuestra atencin no debera centrarse en uno a costa del otro. Sin
embargo, en las ciencias sociales resulta fundamental diferenciarlos. Una
de las formas de abordar la inferencia es considerar el conjunto de datos re
cogido como uno ms de los que son posibles, al igual que los resultados
reales de las elecciones britnicas de 1979 son slo uno de los muchos con
juntos de resultados posibles en diferentes das hipotticos en los que las
elecciones podran haber tenido lugar, o del mismo modo que una semana
de observacin en una pequea comunidad es slo una de las muchas se

manas posibles.
Con la inferencia descriptiva pretendemos comprender en qu medida
nuestras observaciones reflejan fenmenos tpicos o atpicos. Si las eleccio
nes britnicas de 1979 hubieran tenido lugar durante una epidemia de gripe
que se hubiera extendido por los hogares de clase obrera sin afectar a los de
los ricos, quiz nuestras observaciones habran calibrado bastante mal la
fuerza subyacente de los conservadores, precisamente porque el elemento
no sistemtico e imprevisto de los datos tendera a prevalecer sobre el siste
mtico o a distorsionarlo. Del mismo modo, si nuestra semana de observa
cin en Cisjordania hubiera tenido lugar inmediatamente despus de la in
vasin israel del sur del Lbano, no cabra esperar resultados indicativos de
lo que ocurre habitualmente en la zona.
En teora, el mundo poltico puede producir mltiples conjuntos de datos
para cada problema, pero no siempre atiende las necesidades de los cient
ficos sociales. Lo normal es que slo tengamos la suerte de observar un
conjunto de datos. Para construir un modelo dejaremos que este nico con
junto lo represente una variable y (los votos recibidos por los laboristas, di
gamos) que se mida en todas las unidades (n = 650), que son las circuns
cripciones: y r y v ..., y t (y,, por ejemplo, podra representar a las 23.562
personas que votaran a los laboristas en la circunscripcin 1). El conjunto
de observaciones que denominamos y es una variable realizada cuyo valor
vara en cada unidad. Adems, definimos Y como variable aleatoria porque
cambia aleatoriamente en todas las reproducciones hipotticas de las mis
mas elecciones. En consecuencia, y , es el nmero de personas que han vo
tado a los laboristas en la circunscripcin 5 e Y} es la variable aleatoria que
representa los votos en muchas elecciones hipotticas que podran haberse
celebrado en esa circunscripcin en condiciones fundamentalmente simila
res. Los votos que obtiene el Partido Laborista en la nica muestra que con
sideramos, y r y
_yjr, varan en cada circunscripcin por factores sistem
ticos y aleatorios. Esto quiere decir que, para distinguir los dos tipos de
variables, solemos utilizar la expresin variable realizada para referim os
a y y variable aleatoria para referimos a Y.
El mismo criterio se aplica a nuestro ejemplo cualitativo. N o podramos
albergar esperanza o deseo de cuantificar el grado de tensin entre israeles
y palestinos, en parte porque el conflicto es un asunto complicado que
tiene que ver con los sentimientos de numerosos individuos, la oposicin
de ciertas organizaciones, las tensiones ideolgicas y muchas otras cosas.
En esta situacin, y^ es una variable realizada que representa la totalidad del
conflicto que se ha observado en la quinta comunidad, El-B reh8. La varia
ble aleatoria Yi representa tanto lo que observamos en esta localidad como
lo que podramos haber observado; la aleatoriedad proviene de la variacin
en los acontecimientos imprevistos durante las posibles semanas que po
dramos haber elegido para hacer la observacin9.
Uno de los objetivos de la inferencia es conocer las caractersticas siste

mticas de las variables aleatorias Y{, ..., Yn (hay que sealar lo contradicto
rio de esta terminologa estndar: aunque, en general, queremos distinguir
el componente sistemtico del no sistemtico en nuestros datos, lo que pre
tendemos en un caso determinado es tomar una variable aleatoria y extraer
sus caractersticas sistemticas). Por ejemplo, podramos querer saber el
nmero de votos que se espera que obtenga el Partido Laborista en la cir
cunscripcin 5 (el promedio de votos Y5 para este partido en un gran nm e
ro de elecciones hipotticas en esa circunscripcin). Al ser sta una caracte
rstica sistemtica del sistema electoral subyacente, su valor esperado tiene
un inters considerable para los cientficos sociales. Por el contrario, los
votos para el Partido Laborista en unas elecciones observadas, y f, tienen, a
largo plazo, un valor bastante ms reducido, ya que son el resultado de ca
ractersticas sistemticas y de errores aleatoriosl.
El valor esperado (una de las caractersticas del componente sistemti
co) en la quinta comunidad de Cisjordania, El-Bireh, se expresa formal
mente como sigue:
(Y 5) = ^
donde E ( ) es la operacin del valor esperado, de la que surge la media en
un nmero infinito de reproducciones hipotticas de la semana de obser
vacin en la comunidad 5, El-Bireh. El parmetro
(la letra griega mu
con el subndice 5) representa la respuesta al clculo del valor esperado
(un nivel de conflictividad entre palestinos e israeles) para la comunidad
5. Este parmetro es parte de nuestro modelo de caracterstica sistemtica
para una variable aleatoria Yy Se podra utilizar el nivel de conflictividad
o b se rv a d o ,^ , como un clculo aproximado de
pero com o y 5 contiene
muchos elementos imprevistos, junto con informacin acerca de esta ca
racterstica sistemtica, suele haber mejores estimadores (vase el aparta
do 7).
Tambin podramos querer conocer otra caracterstica sistemtica de es
tas variables aleatorias: el nivel de conflictividad en la comunidad cisjordana m edia.
E (Y )
n
n Si
=M
(2-2)
Un estimador de fi podra ser la media de los niveles de conflictividad

observados en todas las comunidades que se estudian, y , pero tambin exis
ten otros para esta caracterstica sistemtica (hay que sealar que el mismo
resumen de datos que aparece en el anlisis del proceso de sntesis de los
pormenores histricos del apartado 5 se utiliza para hacer la estimacin de
una inferencia descriptiva). Entre las caractersticas sistemticas de las va
riables aleatorias tambin se incluye la varianza y diversos parmetros cau

sales que se presentan en el apartado 1 del captulo 3.
Todava hay otra caracterstica de estas variables aleatorias que podra
ser de inters: la variacin del nivel de conflictividad dentro de una comu
nidad aun cuando las caractersticas sistemticas no cambien, es decir, en
qu medida las observaciones de diferentes semanas (diversas aplicaciones
hipotticas de la misma variable aleatoria) producen resultados divergentes.
Dicho de otro modo, ste es el tamao del componente no sistemtico que,
formalmente, se calcula en una nica comunidad utilizando la varianza (y
no las expectativas):
F(T.) = a]
(2.3)
en donde o2 (la letra griega sigma) indica lo que se obtiene al aplicar el

operador de varianza a la variable aleatoria Y.. Vivir en una comunidad de
Cisjordania en la que hubiera un alto grado de conflictividad entre israeles
y palestinos no sera agradable, pero vivir en un lugar en el que los valores
del conflicto registraran una elevada varianza y, por tanto, fueran muy impredecibles, podra ser peor. En cualquier caso, ambas situaciones pueden
tener un inters considerable para los investigadores acadmicos.
Para comprender mejor estas cuestiones distinguimos dos puntos de vis
ta fundamentales sobre la variacin aleatoria ", que constituyen los dos ex
tremos de una gradacin. Aunque hay un nmero significativo de investiga
dores que se siente cmodo en cada uno de esos extremos, la mayora de
los politlogos tienen puntos de vista que, de alguna manera, se sitan entre
ambos polos.
Punto de vista 1: un m undo probabilstico

La variacin aleatoria existe tanto en la naturaleza com o en los m undos social y polti
co, y nunca podr elim inarse. Aunque m idiram os todas las variables sin com eter erro
res, registrram os todos los datos (en vez de slo una muestra) e incluyram os toda va
riable explicativa concebible, nuestros anlisis no podran hacer nunca predicciones
perfectas. Un investigador puede dividir el mundo en com ponentes aparentem ente siste
m ticos y no sistemticos y m ejorar con frecuencia sus predicciones, pero nada de lo
que haga para analizar los datos podr reducir de m anera significativa el grado de varia
cin no sistemtica que existe en diversas partes del mundo emprico.
Punto de vista 2: un mundo determ inista

La variacin aleatoria slo representa la parte del mundo que no podem os explicar. La
divisin entre variacin sistem tica y estocstica la impone el investigador, y depende
de qu variables explicativas se encuentren disponibles y de cules se incluya en el an

lisis. Con las variables explicativas apropiadas el mundo es com pletamente predecible.
Estos puntos de vista diferentes producen diversas ambigedades en las

inferencias de cada rea de investigacin l2. Sin embargo, en la mayora de
ellas ambas perspectivas pueden considerarse equivalentes desde el punto
de vista de la observacin. Esto es especialmente cierto si, con el punto de
vista 2 , partimos de la base de que al menos ciertas variables explicativas
seguirn sin conocerse. De este modo, la equivalencia desde el punto de
vista de la observacin tiene lugar cuando dichas variables desconocidas
del punto de vista 2 se convierten, en el punto de vista 1 , en la interpreta
cin de la variacin aleatoria. Al carecerse de cualquier consecuencia ob
servable con la que distinguir entre ellos, elegir uno u otro depende ms de
la fe o de la creencia que de la verificacin emprica.
Por poner otro ejemplo, en ambos puntos de vista determinar si un acon
tecimiento poltico o social concreto es el resultado de un proceso sistem
tico o no sistemtico depende de las opciones que tome el investigador.
Usando el punto de vista 1 podemos clasificar provisionalmente un efecto
como sistemtico o como no sistemtico, pero, a menos que logremos en
contrar otro conjunto de datos (o incluso un solo caso ms) con el que com
probar la persistencia de un efecto o pauta, ser muy difcil hacer una apre
ciacin correcta.
Si usamos la versin ms extrema del punto de vista 2, no podremos ms
que describir los datos, ya que juzgar incorrectamente que un aconteci
miento es estocstico o sistemtico es imposible o irrelevante. Una versin
ms realista de esta perspectiva acepta que el punto de vista 1 puede consi
derar de forma correcta o incorrecta que una pauta es aleatoria o sistemti
ca, pero deja cierta libertad para decidir cul ser objeto de examen en cada
estudio concreto y cul seguir sin explicarse. En este sentido, al comenzar
cualquier anlisis, todas las observaciones son consecuencia de fuerzas no
sistemticas. Por tanto, a nosotros nos corresponde demostrar que esos
acontecimientos o procesos son el resultado de fuerzas sistemticas. Deci
dir si un acontecimiento o proceso no explicado es un hecho realmente alea
torio o si procede simplemente de variables explicativas an no identifica
das queda para futuras investigaciones.
Este argumento se aplica con igual fuerza a la investigacin cualitativa
que a la cuantitativa. La primera suele ser histrica, pero es de extrema uti
lidad para las ciencias sociales cuando tambin es explcitamente inferen
cial. Para conceptualizar las variables aleatorias de las que proceden las
observaciones e intentar hacer una estimacin de sus caractersticas siste
mticas en vez de limitarse a resumir los pormenores histricos no es
preciso recoger datos a gran escala. De hecho, uno de los rasgos que defi
nen a un buen historiador es su capacidad para distinguir, en la situacin
que describe, los aspectos sistemticos de los circunstanciales. Por lo tanto,
esta defensa de la inferencia descriptiva no es en absoluto una critica a los es

tudios de caso o al trabajo del historiador. Lo que queremos decir es que, en
las ciencias sociales, cualquier tipo de investigacin tendra que cumplir
los principios inferenciales bsicos que se analizan en este libro. Demostrar
que existen caractersticas sistemticas ser ms difcil con algunos tipos de
datos, pero no deja de ser importante hacerlo.
Como ejemplo de los problemas de la inferencia descriptiva en la inves
tigacin histrica, supongamos que nos interesaran los resultados de los en
cuentros en la cumbre que mantuvieron los Estados Unidos y la Unin So
vitica entre 1955 y 1990. Nuestro fin ltimo es responder a una pregunta
de tipo causal: en qu condiciones y en qu medida condujeron esas reu
niones a una mayor cooperacin? Para contestar a esta pregunta hay que re
solver ciertas cuestiones difciles del anlisis causal, especialmente las rela
cionadas con la direccin que toma la causalidad dentro de un conjunto de
variables relacionadas de forma sistem tical3. Sin embargo, en este aparta
do, nos limitamos a tratar los problemas de la inferencia descriptiva.
Supongamos que hemos ideado una forma de calibrar mediante anli
sis histricos, expertos en encuestas, recuento de acontecimientos coope
rativos o conflictivos, o combinando estas tcnicas de medicin en
qu medida se registr despus de cada cumbre un aumento de la coopera
cin entre las superpotencias y que tenemos ciertas hiptesis sobre las con
diciones en las que aumenta la cooperacin, que se relacionan con cambios
de poder, con los ciclos electorales en los Estados Unidos, con la situacin
econmica en cada pas y con el grado de cumplimiento de las expectativas
previas de ambos bandos. Supongamos tambin que esperamos poder ex
plicar el nivel subyacente de cooperacin en cada ao, relacionndolo de
alguna manera con la presencia o ausencia de una cumbre en el perodo an
terior, asi como con nuestros propios factores explicativos.
Lo que observamos (aunque nuestros ndices de cooperacin sean per
fectos) es nicamente el grado de cooperacin que se da realmente en cada
ao. Cuando se observen niveles de cooperacin altos en los aos posterio
res a la celebracin de las cumbres, no sabremos, sin un estudio ms pro
fundo, si hay una relacin sistemtica entre ambos factores. Con un peque
o nmero de observaciones, podra ser que asociar las cum bres a la
cooperacin reflejara una aleatoriedad debida a una incertidumbre funda
mental (buena o mala suerte, segn el punto de vista 1 ) o a variables expli
cativas no identificadas por el momento (segn el punto de vista 2). Entre
estas ltimas variables se incluyen las fluctuaciones climatolgicas que po
dran producir malas cosechas en la Unin Sovitica, as como los cambios
en el equilibrio militar o en los mandatarios, circunstancias que podran ex
plicar las transformaciones en el grado de cooperacin. Si se identifican,
estas variables sern explicaciones alternativas variables omitidas que
podran recogerse o examinarse para evaluar su influencia en el resultado
de la cumbre. Si no se identifican, pueden considerarse acontecimientos no
sistemticos que podran explicar el alto grado de cooperacin observado

entre las superpotencias. Para aportar pruebas que contradigan la posibili
dad de que haya acontecimientos aleatorios (variables explicativas no iden
tificadas) que expliquen la cooperacin observada, podramos considerar
muchos otros aos. Ser extrem adam ente im probable que los aconteci
mientos y procesos aleatorios, al ser por definicin no persistentes, produz
can una cooperacin diferente en los aos en que haya cumbres y en los
que no las haya. De nuevo, llegamos a la conclusin de que slo mediante
pruebas repetidas en diferentes contextos (aos, en este caso) podremos de
cidir si es mejor definir una pauta como sistemtica o como resultante de
las consecuencias pasajeras de procesos aleatorios.
Suele ser difcil distinguir entre procesos sistemticos y no sistemticos.
Desde el punto de vista de las ciencias sociales, una epidemia de gripe que
ataque con mayor virulencia a los votantes de clase obrera que a los de cla
se media es un acontecimiento impredecible (no sistemtico) que, en una
reproduccin hipottica de las elecciones de 1979, disminuira los votos la
boristas. Sin embargo, la persistencia de un componente diferenciador de
clase en la incidencia de una discapacidad sera un efecto sistemtico que
reducira la media de votos laborista en muchas reproducciones.
En las elecciones estadounidenses, el hecho de que un candidato venza a
otro por su personalidad o por un lapsus lnguae ocurrido en un debate tele
visado podra ser un factor aleatorio que quiz hubiera influido en las pro
babilidades de cooperacin entre la URSS y los Estados Unidos durante la
Guerra Fra. Sin embargo, si la principal promesa electoral hubiera sido
la de reducir la tensin con los soviticos, las constantes victorias de los
candidatos conciliadores hubieran sido un factor sistemtico que explicara
las probabilidades de cooperacin.
Los factores sistemticos son persistentes y sus consecuencias se repiten
cuando tienen un valor determinado. Los no sistemticos son transitorios:
no podemos predecir su impacto. Sin embargo, esto no significa que los
sistemticos representen constantes. Las promesas electorales de una cam
paa pueden ser un factor sistemtico a la hora de explicar el comporta
miento electoral, pero esto no significa que dichas promesas no cambien.
En el resultado de unas elecciones, la constante de las promesas electorales
es su efecto y, si es variable, cambia de forma predecible. Cuando las rela
ciones sovitico-estadounidenses eran buenas, puede que prometer polticas
conciliadoras ganara votos en las elecciones de los Estados Unidos; cuando
eran malas, quiz ocurriera lo contrario. Del mismo modo, la climatologa
puede ser un factor aleatorio (si los cambios intermitentes e impredecibles
tienen consecuencias tambin impredecibles) o una caracterstica sistemti
ca (si el mal tiempo produce siempre menos votos para los candidatos que
estn a favor de polticas conciliadoras).
En pocas palabras, resumir los pormenores histricos es un importante
paso intermedio en el proceso de utilizacin de los datos, pero tambin te
nemos que hacer inferencias descriptivas que distingan los fenmenos alea
torios de los sistemticos. Saber qu ocurri en una ocasin concreta no es
suficiente. Si no nos esforzamos p o r determinar las caractersticas sistem
ticas de un asunto, las lecciones de la historia se perdern y nada aprende
remos de los aspectos de nuestro objeto de estudio que pueden mantenerse
o ser relevantes para estudios o acontecimientos futuros.
7.
Criterios para juzgar las inferencias descriptivas
En este ltimo apartado presentamos tres criterios explcitos que suelen uti
lizarse en estadstica para juzgar los mtodos inferenciales: falta de sesgo,
eficiencia y coherencia. Todos se basan en el marco de las variables aleato
rias que sealamos en el apartado 6 de este mismo captulo, pero tienen
consecuencias directas y profundas para la evaluacin y mejora de la inves
tigacin cualitativa. Con el fin de clarificar estos conceptos, en el presente
apartado slo damos ejemplos muy sencillos, todos ellos tomados de la in
ferencia descriptiva. Una versin simple de la inferencia conlleva la estima
cin de ciertos parmetros, incluyendo en ellos el valor esperado o la va
rianza de una variable aleatoria (ju. o o2) en una inferencia descriptiva.
Tambin utilizamos estos mismos criterios para evaluar inferencias causa
les en el siguiente captulo (vase su apartado 4). Reservamos para captu
los posteriores los consejos especficos que implican estos criterios para la
investigacin cualitativa y, en el resto del apartado, nos centramos nica
mente en conceptos.
7.1
Inferencias no sesgadas
Si aplicamos una y otra vez un mtodo inferencial obtendremos estimacio

nes que unas veces sern demasiado grandes y otras demasiado pequeas.
En un nmero elevado de aplicaciones, obtenemos, en prom edio, la res
puesta correcta? Si la contestacin es s, entonces se dice que este mtodo,
o estimador, no est sesgado. En un estimador, esta propiedad no nos
dice en qu medida cualquiera de las aplicaciones del mtodo est lejos del
promedio, pero lo deseable es que la media sea correcta.
Se obtienen estimaciones no sesgadas cuando la variacin que hay entre
la reproduccin de una medida y la que le sigue no es sistemtica y empuja
ese clculo a veces en una direccin y a veces en otra. Se produce sesgo
cuando, en un conjunto de reproducciones, hay un error sistemtico de me
dida que lleva la estimacin ms en una direccin que en otra. Si en nuestro
estudio de la conflictividad en las comunidades de Cisjordania los lderes
polticos hubieran creado tensiones con el fin de influir en el resultado de
la investigacin (quiz para impulsar sus fines), el promedio de conflictivi-
dad observado en cada comunidad estara sesgado hacia niveles altos. Si las
reproducciones de nuestras hipotticas elecciones de 1979 se hubieran he
cho todas en sbado (cuando se podran haber celebrado cualquier otro
da), las estimaciones estaran sesgadas si ese hecho ayudara sistemtica
mente a uno de los partidos y no al otro (si, por ejemplo, los conservadores
fueran ms reacios a votar en sbado por razones religiosas). Las estima
ciones reproducidas tambin podran haberse basado en informes de contabilizadores de votos corruptos que favorecieran a un partido ms que a
otro. Sin embargo, si las elecciones reproducidas se celebraran en diversos
das elegidos de una manera que no estuviera relacionada con la variable
que nos interesa, los posibles errores de medida no produciran resultados
sesgados, aunque uno u otro da favoreciera a algn partido. Por ejemplo, si
hubiera fallos en el recuento de votos por descuidos aleatorios de los encar
gados de contabilizarlos, el conjunto de estimaciones no estara sesgado.
Si, por ley, las elecciones britnicas se celebraran siempre en domingo o
si el sistema electoral tuviera un mtodo de recuento que favoreciera ms a
uno de los partidos (por la utilizacin de un determinado procedimiento o
quiz incluso por una persistente corrupcin), necesitaramos un estimador
que variara segn la media de votos que pudiera esperarse en las condicio
nes de estas caractersticas sistemticas. De este modo, el sesgo depende de
la teora que se investiga, y no slo existe en los datos. No tiene mucho
sentido decir que un determinado conjunto de datos est sesgado, aunque
est plagado de errores individuales.
En este ejemplo, puede que queramos distinguir entre nuestra definicin
de sesgo estadstico en un estimador y la de sesgo esencial en un siste
ma electoral. Un ejemplo del segundo tipo es un horario de votacin que
dificulte el ejercicio del voto a los trabajadores; sesgo esencial bastante co
mn en varios sistemas electorales. Como investigadores, quiz queramos
hacer una estimacin de la media de votos en el presente sistema electoral
(el del sesgo esencial), pero quiz queramos tambin hacer un clculo apro
ximado de este indicador en un hipottico sistema que no presente un sesgo
esencial debido a los horarios de los colegios electorales. Esto hara posible
que calculramos el grado de sesgo esencial del sistema. Cualquiera que
sea la media que estemos calculando, lo que queremos es un estimador es
tadstico sin sesgos.
Los datos de las ciencias sociales pueden sufrir un sesgo importante del
que hay que ser consciente: las personas que nos proporcionan los datos
brutos que utilizamos en nuestras inferencias descriptivas suelen tener razo
nes para hacer estimaciones que son, sistemticamente, demasiado altas o
demasiado bajas. Puede que los funcionarios quieran exagerar las conse
cuencias de un nuevo programa para pedir una mayor financiacin o calcu
lar el ndice de paro a la baja para demostrar que estn haciendo un buen
trabajo. Quiz sea necesario buscar con ms ahnco estimaciones menos
sesgadas. En el estudio cualitativo de Myron Weiner (1991) acerca de la
SSSBSM
75
educacin y el trabajo infantil en la India encontramos un expresivo ejem

plo. Al intentar explicar el reducido nivel de aceptacin de la educacin
obligatoria en la India, en comparacin con otros pases, el autor primero
tuvo que comprobar si dicho nivel era realmente bajo. Se dio cuenta de que,
en uno de los estados del pas, las estadsticas oficiales indicaban que el 98
por ciento de los nios en edad escolar acuda al colegio. Sin embargo, un
examen ms atento puso de manifiesto que la asistencia slo se meda en
una ocasin, la primera vez que los nios iban a la escuela. Despus, figu
raban en las listas de asistencia durante siete aos, aunque slo hubieran
ido un da! Un escrutinio ms minucioso mostr que la cifra de asistencia
real era mucho ms baja.
7.2
Eficiencia
Generalmente, no tenemos una oportunidad para aplicar nuestro estimador

a un gran nmero de aplicaciones esencialmente idnticas. En realidad, ex
cepto en algunos cuidados experimentos, slo lo aplicamos una vez. En
este caso, la falta de sesgo es importante, pero quisiramos estar ms segu
ros de que la nica estimacin que hacemos se acerca al valor correcto. La
eficiencia proporciona una manera de distinguir entre estimadores no ses
gados. De hecho, este criterio tambin puede ayudamos a diferenciar esti
madores alternativos con un reducido nivel de sesgo (en general, un estima
dor muy sesgado debe descartarse sin siquiera evaluar su eficiencia).
La eficiencia es un concepto relativo que se mide calculando la varianza
del estimador en las reproducciones hipotticas. En los estimadores no ses
gados, cuanto menor es la varianza, ms eficiente (mejor) es el estimador.
Una varianza pequea es mejor porque nuestra nica estimacin probable
mente estar ms cerca del verdadero valor del parmetro. No nos interesa
la eficiencia de un estimador muy sesgado porque, en esta situacin, la
presencia de una varianza reducida har improbable que la estimacin se
acerque al valor verdadero (porque la mayora de tales estimaciones consti
tuirn un apretado conglomerado cercano al valor equivocado). Como des
cribimos posteriormente, nos interesa la eficiencia si el sesgo es pequeo, y
quiz a veces estemos dispuestos a admitir un pequeo sesgo a cambio de
una mayor eficiencia.
Supongamos de nuevo que nos interesara hacer una estimacin del nivel
medio de conflictividad entre palestinos e israeles en Cisjordania y que es
tuviramos evaluando dos mtodos: una sola observacin de una nica co
munidad, elegida como tpica, y observaciones similares de, por ejemplo,
25 comunidades. Parece evidente que 25 observaciones son mejores que
una sola, siempre que se haga el mismo esfuerzo en la primera que en
cada una de las 25. Vamos a demostrar precisamente por qu es as. Este
resultado explica por qu debemos observar tantas consecuencias de nues-
Un ejemplo formal de falta de sesgo
|
i
Supongamos, por ejemplo, que quisiramos hacer una estimacin de i |

en la ecuacin (2.2) y que decidiramos utilizar la media como estimador, f
1
-i
I
|
y = Xy,~ En un nico conjunto de datos, y es la proporcin de votos la- |
'
boristas en la media de todas las circunscripciones, n = 650 (o el nivel 1

medio de conflictividad en las comunidades de Cisjordania). Sin embargo,
la media muestral se convierte en una funcin de 650 variables aleatorias, |
1
i-i
Y = K, si se considera en
unnmero in fin ito de reproducciones hipo-
tticas de las elecciones en cada circunscripcin. De este modo, la media

muestral tambin se convierte en una variable aleatoria. En algunas reproducciones hipotticas, Y producir resultados electorales que se acerquen
a / i y en otras ocasiones stos se alejarn de ella. La cuestin es si Y ser
acertada, es decir, igual a /u en la media de estas reproducciones hipotticas. Para hallar la respuesta utilizamos de nuevo la operacin del valor esperado, que nospermite determinar la mediadel infin ito nmero de hipotticas elecciones. Lasreglas de la expectativa
nospermiten realizar
los
siguientes clculos:
$
|
i
I
f
f
|
j
|
I
<2-4 )
i
i
= n
n
i
I
*
I
As, Y es un estimador no sesgado de (i (este ejemplo es un poco menos f
formal que los que aparecen en los manuales de estadstica propiamente i
dichos, pero las caractersticas principales son las mismas).
1
tra teora corno sea posible, pero tambin demuestra el concepto general de
e fic ie n cia estadstica, que es igualm ente relevante cuando estamos d e ci
diendo cm o se pueden evaluar m ejor las diferentes maneras de com binar
en una inferencia las observaciones recogidas.
L a e ficie n cia nos perm ite comparar el estim ador i del estudio de caso
en el que slo hay una observacin {n = 1) con el gran estimador que tiene
un n grande (n = 25) y que representa el nivel medio de conflictividad

encontrado en 25 estudios separados de una semana de duracin en diver
sas comunidades de Cisjordania. Ambos estimadores, si se utilizan apropia
damente, no estn sesgados. Si el mismo modelo es cierto, el estimador de
la observacin nica tendr una varianza de V( Yt.pja) = a2. Esto quiere decir
que habramos elegido una circunscripcin que consideramos tpica, la
cual, no obstante, se vera afectada por variables aleatorias. La varianza del
gran estimador n es V (Y) = a3125, o sea, la de la media muestral. De este
modo, el estimador de la observacin nica es veinticinco veces ms varia
ble (menos eficiente) que el que se obtiene cuando n = 25. De ah que ob
tengamos el resultado evidente de que es mejor tener ms observaciones.
Ms interesantes son las condiciones en las que un estudio muy detalla
do de nuestra nica comunidad pudiera arrojar resultados tan buenos como
los de la investigacin que utiliza un n grande. Esto quiere decir que, aun
que siempre son preferibles los estudios con ms observaciones (si se dis
pone de los medios para recogerlas), hay situaciones en las que un nico es
tudio de caso (como siempre, con muchas observaciones) es mejor que otro
que se basa en ms observaciones que, por separado, no son ni tan detalla
das ni tan ciertas.
En igualdad de condiciones, nuestro anlisis demuestra que cuantas ms
observaciones haya, mejor, porque as disminuye la variabilidad (y, por tan
to, la ineficiencia). De hecho, la coherencia es una propiedad que consiste
en que a medida que aumenta el nmero de observaciones, la variabilidad
se acerca a cero y la estimacin es igual al parmetro que estamos intentan
do calcular w.
Sin embargo, es frecuente que las condiciones no sean las mismas. Su
pongamos, por ejemplo, que cualquier medida individual de un fenmeno
que estemos estudiando se vea influida por factores que aumenten la proba
bilidad de que se aleje del valor verdadero (o sea, que la varianza del esti
mador es alta), y supongamos que tenemos alguna idea quiz por otros
estudios de cules pueden ser dichos factores. Supongamos, adems, que
nuestra capacidad de observar y corregir esos factores disminuye sustan
cialm ente a m edida que aumenta el nmero de comunidades estudiadas
(aunque slo sea porque carecemos del tiempo y del conocimiento sufi
cientes para corregir esos factores en un nmero elevado de observaciones).
Nos enfrentamos entonces al dilema de elegir entre un estudio de caso que
tiene observaciones adicionales dentro del propio caso y 25 casos que
contienen cada uno slo una observacin.
Si nuestro caso nico slo tiene una observacin, ser evidentemente in
ferior al estudio de 25 observaciones. Sin embargo, los investigadores que
utilizan estudios de caso disfrutan de considerables ventajas, que se entien
den mejor al formalizarlas. Por ejemplo, podramos comenzar por seleccio
nar cuidadosamente nuestra comunidad con el fin de aseguramos de que es
especialmente representativa del resto del pas o de que entendemos la rea-
cin que tiene con las dems. Podramos preguntar a unos pocos residentes
o leer informes de prensa para comprobar si es una comunidad media o si
algn factor no sistemtico ha hecho que esta observacin sea atpica; des
pus podramos ajustar el nivel de conflictividad observado para hacer una
estimacin del nivel medio, j., que se registra en Cisjordania. sta sera la
parte ms difcil del estimador del estudio de caso, y habra que tener cui
dado de que no se nos colara el sesgo. Una vez que estamos razonablemen
te seguros de haberlo m inim izado, podramos centrarnos en aumentar la
eficiencia. Para hacerlo, podramos pasar muchas semanas en la comuni
dad, llevando a cabo numerosos estudios independientes. Podramos entre
vistar a lderes comunitarios, leer los peridicos, acompaar a una familia
en su vida diaria y utilizar otras tcnicas para recabar informacin. Median
te tales procedimientos, podramos conseguir muchas ms de 25 observa
ciones dentro de esta nica comunidad y producir un estudio de caso que,
al igual que el de las 25 comunidades, no estuviera sesgado y que fuera
ms eficiente que ste.
Consideremos otro ejemplo: supongamos que estamos realizando un es
tudio sobre el problema internacional que plantean las drogas y que necesi
tamos calcular el porcentaje de tierra cultivable de una determinada regin
del mundo en el que se ha plantado cocana. Supongamos, adems, que
podemos elegir entre dos mtodos: un estudio de caso de un solo pas o una
investigacin a gran escala de tipo estadstico que se ocupe de todos los
pases de la regin. Parece mejor estudiar toda la regin, pero hay que sea
lar que, para optar por esta alternativa, es necesario (por razones prcticas)
utilizar los datos que proporcionan los gobiernos de la zona a un organismo
de la ONU. Se sabe que estas cifras tienen poca relacin con las pautas rea
les de cultivo, ya que las preparan los ministerios de asuntos exteriores y se
basan en consideraciones relativas a las relaciones pblicas. Supongamos
tambin que, mediante visitas que observaran de cerca un pas, podramos
corregir las estimaciones de su gobierno para acercarlas ms a Jas cifras
verdaderas. Qu mtodo elegiramos? Quiz decidamos estudiar slo un
pas, o quiz dos o tres; tambin podramos analizar uno en profundidad y
utilizar nuestros resultados para reinterpretar, y por tanto mejorar, los datos
gubernamentales de los otros pases. La eleccin tendra que basarse en qu
datos responden mejor a nuestras preguntas.
Por poner un ejemplo ms, supongamos que estamos estudiando la Co
munidad Europea y queremos hacer una estimacin del grado de regulacin
que se espera produzcan en un sector de toda la Comunidad las acciones de
la Comisin y del Consejo de Ministros. Podramos recabar informacin en
un gran nmero de normativas adoptadas formalmente por el sector indus
trial en cuestin, codificarlas segn su severidad y, posteriormente, hacer
una estimacin de la severidad media de una normativa. Si recogemos da
tos sobre 1 0 0 normativas que muestren, en principio, un rigor similar, la va
rianza de nuestro clculo ser el resultado de dividir la de cualquiera de las
normativas por 1 0 0 (cr2/ 1 0 0 ), o por menos si las normativas estn relaciona

das. Sin duda, la medida resultante ser mejor que la que obtendramos si
utilizramos datos sobre una sola normativa como estimador de la severi
dad reguladora para el conjunto del sector.
No obstante, para utilizar este procedimiento es preciso aceptar que la
normativa formal es equivalente a la autntica actividad reguladora en el
sector que se estudia. Sin embargo, una investigacin ms profunda de la
aplicacin de las normativas podra poner de manifiesto una importante va
riacin en su grado de implantacin real. En consecuencia, puede que las
mediciones de las normativas formales estn sistemticamente sesgadas y
que, por ejemplo, exageren la severidad reguladora. En tal caso, nos enfren
taramos de nuevo a la necesidad de alcanzar un equilibrio entre sesgo y
eficiencia, y quiz tuviera sentido realizar tres o cuatro estudios de caso en
profundidad sobre la implantacin de normativas con el fin de investigar la
relacin que existe entre las normativas formales y la actividad reguladora
real. Una de las posibilidades sera sustituir el estimador basado en 100 ca
sos por otro, menos sesgado y tambin menos eficiente, que procediera de
tres o cuatro. Sin embargo, sera ms creativo, si es factible, utilizar el estu
dio en profundidad de los tres o cuatro casos para corregir el sesgo de nues
tro indicador de 1 0 0 casos y usar despus una versin corregida de este l
timo como estimador. En este procedimiento estaramos combinando las
aportaciones de nuestros estudios de caso en profundidad con las tcnicas
que manejan un n grande, prctica que pensamos debera realizarse con
mucha ms frecuencia de lo que es habitual en las ciencias sociales con
temporneas.
La defensa de los estudios de caso que hacen aquellos que conocen bien
una determinada parte del mundo suele ser la que est implcita en el ejem
plo anterior. Puede que las investigaciones a gran escala dependan de cifras
que no comprenda del todo el ingenuo investigador que trabaja con una
base de datos (que quiz no sea consciente de cmo se elaboran las estads
ticas electorales de un determinado lugar y presuponga, equivocadamente,
que tienen una relacin real con los votos emitidos). Quien trabaja de cerca
con los materiales y comprende de dnde proceden puede hacer las correc
ciones necesarias. En los apartados siguientes intentaremos explicar cmo
se puede elegir de forma sistemtica en relacin a este asunto.
Precisamente, el anlisis formal de este problema, que aparece en el re
cuadro posterior, muestra cmo se puede determinar cul es el resultado de
alcanzar un equilibrio entre eficiencia y sesgo, cuestin que surga en el
ejemplo de las circunscripciones electorales britnicas. En cualquier ejem
plo concreto la decisin siempre ser mejor si se utiliza la lgica que apare
ce en el anlisis formal siguiente. Sin embargo, para tomar este tipo de de
cisin casi siempre se necesitarn tambin consideraciones cualitativas.
Para terminar, merece la pena plantearse de forma ms especfica las
concesiones que a veces hay que realizar para hallar un equilibrio entre ses-
La varianza de la media muestral Y se expresa como V(Y), y las reglas para f

calcular varianzas de variables aleatorias en el caso sencillo del muestreo |
aleatorio permiten que ocurra lo siguiente:
|
i
I
I
"
nzt
'
Adems, si presuponemos que la varianza en las reproducciones hipotti-

cas de las elecciones en cada circunscripcin es la misma que en una de |
cada dos y que se expresa como a 2, entonces la de la media muestral ser: f
(2-5) S
|
c^/n
En el ejemplo anterior n = 650, de manera que la varianza del estimador

de este n grande es <7^/650, y la del estimador del estudio de caso es a 2.
La estimacin estadstica ser preferible por su eficiencia, a menos que
podamos utilizar correcciones cualitativas det error aleatorio para reducir
la varianza del estimador del estudio de caso mediante un factor que val
ga, al menos, 650.
go y eficiencia. En cualquier conjunto grande de observaciones que no est

sesgado, la media muestral de las dos primeras tampoco lo estar, y lo m is
mo ocurre con la media muestral de todas ellas. Sin embargo, al utilizar
slo dos observaciones se prescinde de inform acin sustancial; esto no
afecta a la falta de sesgo, pero s reduce considerablemente la eficiencia. Si
no utilizamos tambin el criterio de eficiencia, careceremos de reglas for
males para elegir entre un estimador y otro.
Pensemos en dos estimadores, uno el de un estudio con un n grande que,

al haber sido realizado por alguien que tiene un prejuicio, est ligeramen
te sesgado y otro con un n muy pequeo que creemos que no est sesgado pero que es relativamente menos eficiente y ha sido elaborado por un
investigador imparcial. Como modelo formal de este ejemplo, supongamos
que quisiramos hacer una estimacin de
y que el estudio de n grande
produce un estimador d:
jj
I
p
|
|
|
\
Hacemos un modelo del estudio pequeo con un estimador diferente de jl, f
que es c:
en el que las circunscripciones 1 y 2 son de tipo medio, de manera que
f (ya) = MY E(Y2) = MQu estimador sera preferible? Nuestra primera respuesta es que no
deberamos utilizar ninguno de ellos y que seria mejor optar por la media
muestraly, o sea, por un estudio de n grande realizado por un investiga
dor imparcial. Sin embargo, no siempre puede aplicarse el estimador obvio
o el mejor. Para solucionar este problema, recurrimos a una evaluacin del
sesgo y de la eficiencia.
En primer lugar, calibramos el sesgo. Podemos sealar que el primer es
timador d est ligeramente sesgado segn el clculo habitual:
E(d) = E\ X Yt ~ 0,01
\ n /-i
= /x -
0 ,0 1
Tambin podemos indicar, mediante un clculo similar, que el segundo es- i

timador c no est sesgado:
EjYj + E(Y2)
2
P-+ M
=A
Utilizando slo estos clculos, elegiramos el estimador c, que repre-
senta el resultado del estudio con un n pequeo de nuestro investigador
\ imparcial, porque no est sesgado. El investigador prejuicioso obtendra

con d una respuesta que, en promedio, estara equivocada, aunque slo I
fuera levemente, en un nmero infinito de reproducciones. Con el estima- I
dor c se obtendra una media correcta.
El criterio de eficiencia presenta una situacin diferente. Comenzamos
por calcular la varianza de cada estimador:
Krf) = ^ K - o , o i
\n -i
= o*/n
= 0^/650
|
Esta varianza es la misma que la de la media muestral porque 0,03 no
cambia (tiene una varianza cero) en las diferentes muestras. Del mismo
s modo, se calcula la varianza de c como sigu e1S:
l/(c) = V1 +
En consecuencia, c es bastante menos eficiente que d porque V(c)

1/ 2 es 325 veces ms grande que V(d) = o*/650. Esto tambin debera
quedar claro intuitivamente, ya que c desecha gran parte de la informa
cin que hay en la matriz de datos.
Cul tendramos que elegir? El estimador d est sesgado pero es ms
eficiente que c, mientras que ste no tiene sesgo pero es menos eficiente.
En este caso concreto, probablemente sera preferible el estimador d. Por
tanto, estaramos dispuestos a sacrificar la falta de sesgo, ya que el sacrifi
cio es bastante pequeo (0,01), con el fin de lograr un estimador bastante
ms eficiente. Sin embargo, habr un momento en el que la mayor eficien
cia no compensar el pequeo sesgo porque acabaremos garantizando que
los clculos aproximados estn lejos de la verdad. Formalmente, la manera
de calibrar el equilibrio entre sesgo y eficiencia es calcular el error medio
cuadrtico (EMC), que es una combinacin de ambos factores. Si g es el es
timador de algn parmetro y (la letra griega gamma), EMC se definir as:
EMC(g) = V(g) + E(g - y)2
(2.6)
= varianza + sesgo a l cuadrado

Por tanto, el error medio cuadrtico es la suma de la varianza y del sesgo
al cuadrado (vase Johnston, 1984, pp. 27-28). La idea es elegir el esti
mador que tenga el mnimo error cuadrtico medio, ya que ste muestra
Supongamos que nos interesa saber si el Partido Demcrata va a ganar las

prximas elecciones presidenciales en los Estados Unidos y que preguntamos
a 2 0 estadounidenses adultos elegidos al azar a qu partido piensan votar (en
este sencillo ejemplo de seleccin aleatoria elegimos a los encuestados entre
todos los estadounidenses adultos y cada uno de ellos tiene las mismas posi
bilidades de ser seleccionado). Supongamos que alguien ha realizado un estu
dio similar con 1 . 0 0 0 ciudadanos; acaso tendramos que incorporar esas ob
servaciones adicionales a las nuestras para constituir una nica estimacin
que se basara en 1 .020 encuestados? Si las nuevas observaciones hubieran
sido seleccionadas aleatoriamente, al igual que las primeras veinte, sera fcil
decidir incorporar esos datos a los nuestros: con las nuevas observaciones el
estimador sigue sin estar sesgado y ahora es mucho ms eficiente.
Sin embargo, supongamos que slo 990 de las 1.000 nuevas observacio
nes fueran resultado de una seleccin aleatoria de la poblacin de Estados
Unidos y que las otras diez fueran congresistas demcratas que hubieran
sido incluidos, sin querer, en los datos, despus de haberse hecho la mues
tra aleatoria. Supongamos adems que nos damos cuenta de que se han in
corporado dichas observaciones a nuestros datos pero que desconocemos
cules son y que, por tanto, no podemos eliminarlas. Ahora sabemos que,
precisamente por qu un estimador con cierto sesgo puede ser preferible

si su varianza es pequea.
En nuestro ejemplo, los dos EMCs son:
EMC(</) = - ^ + ( 0 , 0 1 ) 2
(2.7)
----- + 0,0001
650
EMC(c) = - y -
(2.8)
$
De este modo, en la mayora de los valores de o2, EMC(t/) < EMC(c), y d
sera preferible como estimador de c.
En teora, siempre hay que optar por estimadores no sesgados que sean
lo ms eficientes posible (o sea, que utilicen la mayor cantidad posible de
informacin). Sin embargo, en las investigaciones reales que analizamos
en captulos posteriores, este equilibrio entre sesgo y eficiencia es bastan
te llamativo.
en principio, un estimador que se basara en los 1 . 0 2 0 encuestados exagera

ra ligeramente la posibilidad de que un demcrata ganara las elecciones
nacionales. De este modo, incluir las 1.000 observaciones adicionales ses
gara ligeramente la estimacin global pero tambin aumentara su eficien
cia de forma considerable. En consecuencia, el que incluyamos o no estas
observaciones depende de si el aumento del sesgo se compensa con el in
cremento de la eficiencia estadstica. De una manera intuitiva, parece claro
que el estimador que se base en 1 . 0 2 0 observaciones producir estimacio
nes bastante ms cercanas a la respuesta correcta con mucha ms frecuen
cia que el que utiliza slo 20. El sesgo resultante ser lo suficientemente
pequeo como para que sea preferible el estimador de la muestra ms gran
de, aunque en la prctica probablemente apliquemos los dos (adems, en
este caso, conocemos la direccin del sesgo e incluso podramos corregirlo
parcialmente).
Si se dispone de datos cuantitativos adecuados y es posible formalizar
este tipo de problemas, generalmente se puede tomar una decisin clara.
Sin embargo, aunque la naturaleza cualitativa de la investigacin haga que
evaluar este equilibrio sea difcil o imposible, entenderlo debera ayudarnos
a hacer inferencias ms fiables.
3. Causalidad
e inferencia causal
Hemos analizado dos estadios de la investigacin social: resumen de los

pormenores histricos y extraccin de inferencias descriptivas mediante la
divisin del mundo en componentes sistemticos y no sistemticos (en los
apartados 5 y 6 , respectivamente, del captulo anterior). Muchos estudiosos
de los fenmenos sociales y polticos se detendran en este punto, evitando
hacer afirmaciones causales y pidiendo a unos hechos seleccionados y bien
ordenados que hablen por s mismos.
Al igual que los historiadores, los cientficos sociales necesitan resumir los
pormenores histricos y hacer inferencias descriptivas. Sin embargo, cuando
las ciencias sociales pretenden alcanzar ciertos objetivos, si no hay inferencia
causal, el anlisis es insuficiente. Esto significa que, al igual que una inferen
cia causal es imposible sin una buena inferencia descriptiva, sta, por s mis
ma, suele resultar insatisfactoria e incompleta. No obstante, con esto no que
rem os decir que todos los cientficos sociales tengan que intentar, en
cualquiera de sus trabajos, dar explicaciones causales a los fenmenos que es
tudian. A veces la inferencia causal es demasiado difcil y en otras muchas si
tuaciones la descriptiva constituye el fin ltimo de la empresa investigadora.
Es evidente que siempre tenemos que dejar claro si el objetivo de nues
tro proyecto de investigacin es describir o explicar. Muchos cientficos so
ciales no se sienten cmodos con la inferencia causal. Les preocupa tanto la
advertencia de que correlacin no es causalidad que no plantean hipte
sis o inferencias de tipo causal y sealan que su trabajo estudia asociacio
nes y no causas. Otros caen con facilidad en afirmaciones aparentemente
causales, calificando de explicaciones hiptesis o especulaciones no eva

luadas, que se basan en diseos de investigacin imprecisos Creemos que
ambas posturas esquivan el problema de la inferencia causal.
Evitar el lenguaje causal cuando la causalidad es el autntico objeto de la
investigacin o bien hace irrelevante el estudio o bien le permite no respetar las
reglas de la inferencia cientfica. Nuestra incertidumbre acerca de las inferen
cias causales nunca desaparecer, pero esto no debe significar que evitemos
extraerlas. Por el contrario, habra que hacerlas en cualquier lugar que parez
can apropiadas, pero aportando al lector, al mismo tiempo, la mejor y ms sin
cera estimacin de su incertidumbre. Hay que ser valiente al hacer inferencias
causales, siempre que detallemos cuidadosamente su incertidumbre. Adems,
es importante que las hiptesis causales se disciplinen, acercndose lo ms po
sible a las reglas de la inferencia causal. Entre los captulos 4 y 6 casi toda
nuestra atencin se dedica a explicar las circunstancias en las que dicha infe
rencia es apropiada y a facilitar que las investigaciones de los cualitativistas
tengan ms posibilidades de aportar pruebas fiables de sus hiptesis causales.
En el apartado 1 damos una definicin rigurosa de causalidad, que sirve
igualmente para la investigacin cualitativa que para la cuantitativa; des
pus, en el apartado 2 , clarificamos algunos conceptos de causalidad alter
nativos que figuran en la bibliografa sobre el tema y demostramos que no
entran en conflicto con nuestra definicin ms fundamental. En el apartado
3 analizamos los presupuestos precisos sobre el mundo y las hiptesis que
se necesitan para hacer inferencias causales fiables. Posteriormente, en el
apartado 4, nos centramos en cmo aplicar a la inferencia causal los crite
rios que desarrollamos para juzgar la descriptiva. En el apartado 5 termina
mos el captulo con consejos ms generales sobre cmo elaborar explica
ciones, teoras e hiptesis de tipo causal.
1.
Definicin de causalidad
En este apartado, definimos la causalidad como un concepto terico que es

independiente de los datos utilizados para conocerlo. A continuacin, entra
mos a considerar la inferencia causal a partir de nuestros datos (para un anli
sis de los problemas especficos de este tipo de inferencia, vanse los captu
los 4 al 6 ). En el apartado 1.1 planteamos con todo detalle nuestra definicin
de causalidad, junto a un simple ejemplo cuantitativo, mientras que en el 1 .2
retomamos esta definicin con un caso cuantitativo ms elaborado.
1.1
Definicin y un ejemplo cuantitativo
Nuestra definicin terica de causalidad se aplica de la forma ms simple y

clara a una sola unidad2. Una unidad, tal como se defini en el apartado 4
del captulo 2 , es uno de los muchos elementos que hay que observar en un
estudio, como una persona, un pas, un ao o una organizacin poltica.

Para mayor precisin y claridad, hemos elegido un ejemplo corriente de la
investigacin cuantitativa: el efecto causal que tiene sobre la proporcin de
votos que recibe un candidato demcrata a la Cmara de Representantes es
tadounidense el hecho de que ya est en el poder (utilizar slo un candidato
demcrata simplifica el ejemplo). La variable dependiente ser la propor
cin de votos que obtienen los demcratas en el sistema bipartidista de la
Cmara. Por tanto, la variable explicativa clave es dicotmica: el demcrata
est en el poder o no lo est (para lograr una mayor sencillez, en este apar
tado slo tenemos en cuenta las circunscripciones en las que el candidato
republicano fue derrotado en los ltimos comicios).
El lenguaje causal puede ser confuso, y nuestra opcin aqu no es muy
original. A veces la variable dependiente se denomina variable de resul
tados y con frecuencia las variables explicativas son variables indepen
dientes. Dividimos las explicativas entre variable causal principal (tam
bin denom inada causa o variable de tratam iento) y variables de
control. Para terminar, la variable causal principal siempre adopta dos o
ms valores, que suelen conocerse como grupo de tratamiento y grupo
de control.
Pensemos ahora nicam ente en la cuarta circunscripcin electoral de
Nueva York para las elecciones al Congreso e imaginemos que en 1998 hu
bieran tenido lugar unos comicios en los que se hubieran enfrentado un
congresista demcrata y un aspirante republicano (no en el poder). Supon
gamos que el candidato demcrata hubiera recibido en estas elecciones una
fraccin del voto expresada como y[ (el subndice 4 indica la cuarta cir
cunscripcin de Nueva York y el superindice I el hecho de que el demcrata
sea ya congresista). Por tanto, y't es un valor de la variable dependiente.
Para definir el efecto causal (una cantidad terica), imaginemos que damos
marcha atrs en el tiempo hasta el comienzo de la campaa electoral y que
todo sigue igual, a excepcin de que el congresista demcrata decide no
presentarse a la reeleccin y que su partido nombra a otro candidato (pro
bablemente al ganador de las elecciones primarias). Expresamos la fraccin
de voto que el candidato demcrata (no congresista) recibir mediante y "
{N se refiere a un candidato demcrata que no est en el poder)3.
Esta condicin contrafctica es la esencia de la definicin de causalidad,
y la diferencia, en esta situacin hipottica, entre voto real (y') y voto pro
bable (y 4 ) es el efecto causal, concepto que definimos con mayor precisin
ms adelante. Hay que tener mucho cuidado al definir contrafcticos por
que, aunque se oponen evidentemente a los hechos, tienen que ser razo
nables: debera ser posible que el acontecimiento contrafctico hubiera ocu
rrido en unas determ inadas circunstancias. Al d efinir la condicin
contrafctica adecuada resulta esencial precisar qu se mantiene constante
cuando alteramos el valor de la variable de tratamiento. En nuestro ejem
plo, la variable causal principal (o de tratamiento) es estar en el poder, y
B n
89
cambia desde ser congresista a no ser congresista. Durante esta trans

formacin hipottica se mantienen todos los elementos constantes (la fuer
za relativa de los demcratas o los republicanos en esa circunscripcin en
elecciones anteriores, el carcter del proceso de nominacin del candidato,
las caractersticas de la circunscripcin, el contexto econmico y poltico
del momento, etc.) hasta que el Partido Demcrata decide su candidato. No
sometemos a ningn control las cualidades de los candidatos, como en qu
medida se reconoce su nombre, su visibilidad o si se sabe cmo funciona el
Congreso, ni tampoco cualquier otra consecuencia que tenga la nominacin
por parte del partido. Esto se debe a que, en parte, estos elementos son con
secuencia de nuestra variable de tratam iento: estar en el poder, lo cual
quiere decir que, entre las ventajas de esta situacin, se incluye el reconoci
miento del nombre, la visibilidad y todo lo dems. Si realmente mantuvi
ramos constantes estos elementos, estaramos controlando algunos de los
efectos ms importantes que tiene estar en el poder y, por tanto, haciendo
caso omiso de ellos. En consecuencia, malinterpretaramos su influencia
global en el conjunto del voto. De hecho, controlar un nmero suficiente de
las consecuencias que tiene estar en el poder podra llevarnos a la incorrec
ta conclusin de que dicha situacin no tiene efecto alguno4.
De manera ms formal, el efecto causal que tiene estar en el poder en la
cuarta circunscripcin de Nueva York la proporcin de votos recibida por
el candidato demcrata que puede atribuirse al hecho de que ya sea congre
sista sera la diferencia entre estas dos fracciones del voto: (y'4 - y N
4). Por
razones que pronto quedarn claras, esta diferencia la denominamos efecto
causal realizado, y, para expresarla con una notacin ms general, utiliza
mos la unidad i en vez de slo la circunscripcin 4 5:
(Efecto causal realizado en la unidad i ) = y , - y N
,
(3-1)
Es obvio que este efecto se define nicamente en teora, ya que, en cual

quier eleccin real, slo podramos observar y 4 o y 4, o ninguno de los dos,
pero nunca ambos a la vez. De este modo, esta sencilla definicin de causa
lidad demuestra que nunca podemos conocer con certeza un efecto causal.
Para Holland (1986), ste es el problema fundam ental de la inferencia cau
sal, y en verdad lo es porque, independientemente de lo perfecto que sea el
diseo de la investigacin, de la cantidad de datos que recojamos, de lo
perspicaces que sean los observadores, de lo diligentes que sean los ayu
dantes y del grado de control experimental que tengamos, nunca conocere
mos a ciencia cierta la inferencia causal. De hecho, gran parte de las cues
tiones empricas de los diseos de investigacin que se analizan en este
libro tienen que ver con este problema fundamental y casi todas las indica
ciones que damos son intentos parciales de evitarlo.
Nuestra definicin bsica de causalidad se aparta de la de Holland, ya
que en el apartado 6 del captulo 2 hemos sealado que las ciencias sociales
siempre necesitan dividir el mundo en componentes sistemticos y no siste

mticos, mientras que la definicin de Holland no establece claramente
esta distincin6. Para ver la importancia de esta divisin, pensemos en qu
ocurrira se pudiramos repetir la campaa electoral de 1998 en la cuarta
circunscripcin de Nueva York, con el congresista demcrata y el aspirante
republicano al cargo. La suma total de votos tendra un resultado ligera
mente diferente, a causa de ciertas caractersticas no sistemticas de las
campaas electorales: aspectos polticos que no se mantienen de unas cam
paas a otras, incluso si stas parten de situaciones idnticas. Entre estas
caractersticas no sistemticas se pueden incluir las meteduras de pata ver
bales, un discurso o pronunciamiento sobre un problema que concita una
atencin sorprendente, una actuacin inesperadamente desafortunada en un
debate, mal tiempo durante un mitin del candidato o el da de las elecciones
o tambin los resultados de alguna investigacin periodstica. Por lo tanto,
podemos imaginar una variable que representara los valores del voto dem
crata en diversas reproducciones hipotticas de las mismas elecciones.
Como hemos sealado anteriormente (vase el apartado 6 del captu
lo 2 ), esta variable se denomina variable aleatoria, ya que tiene caracte
rsticas no sistemticas: le afectan las variables explicativas que no contem
pla nuestro anlisis terico o contiene una variabilidad fundamentalmente
inexplicable7. Definimos la variable aleatoria que representa la proporcin
de votos recibida por el candidato demcrata que ya es congresista como y'
(obsrvese la Y mayscula), y la proporcin de los que habra recibido un
demcrata no congresista en reproducciones hipotticas, como Y".
Ahora definimos el efecto causal aleatorio en la circunscripcin 4 como
la diferencia entre estas dos variables aleatorias. Como queremos mantener
cierto carcter general, de nuevo utilizamos una notacin que se refiere a la
unidad i en vez de a la circunscripcin 4:
(Efecto causal aleatorio en la unidad /) = (Y - Y ff)
(3.2)
(Al igual que en la definicin de variable aleatoria, un efecto causal del

mismo tipo es el que cambia en cada reproduccin hipottica del mismo
experimento, pero tambin representa muchas interesantes caractersticas
sistemticas de las elecciones.) Si pudiramos observar a la vez dos propor
ciones de voto diferentes en la circunscripcin 4 la primera referida a
unas elecciones a las que se presentara un congresista demcrata y la
segunda sobre otras sin l , podramos ver directamente el efecto causal
realizado de la ecuacin (3.1). Es evidente que, a causa del problema fun
damental de inferencia causal, no podemos observar el efecto causal reali
zado; en consecuencia, en la ecuacin 3.1, dicho efecto es una nica aplica
cin no observada del efecto causal aleatorio de la ecuacin 3.2. Dicho de
otro modo, si en la circunscripcin 4 se hacen diferentes reproducciones hi
potticas de las mismas elecciones, unas con un candidato congresista de
mcrata y otras tantas con uno no congresista, el efecto causal realizado

(no observado) se convertir en un efecto causal aleatorio.
Describir la causalidad como una de las caractersticas sistemticas de
las variables aleatorias puede parecer excesivamente complicado, pero tiene
dos ventajas. La primera es que hace que nuestra definicin de causalidad
sea directamente anloga a las caractersticas sistemticas de un fenmeno
(como son la media o la varianza) que sirven de objeto a la inferencia des
criptiva: las medias y las varianzas tambin son caractersticas sistemticas
de las variables aleatorias (como en el apartado 2 del captulo anterior). La
segunda es que posibilita la divisin de un problema inferencial causal en
sus componentes sistemticos y no sistemticos. Aunque muchas de las ca
ractersticas sistemticas de una variable aleatoria puedan ser de inters, la
ms relevante para nuestro simple ejemplo es el efecto causal medio de la
unidad i. Para explicar qu significa esto retomamos nuestro ejemplo de las
elecciones en Nueva York.
Recurdese que la variable aleatoria representa la fraccin del voto reci
bida por el candidato demcrata (ya sea congresista o no) en un nmero
elevado de reproducciones hipotticas de los mismos comicios. Definimos
de la siguiente manera el valor esperado de esta variable aleatoria la me
dia de fracciones del voto en dichas reproducciones para el no congre
sista:
E(Y) =
y para el congresista como:
E(Y) =
En consecuencia, el efecto causal medio de estar en el poder para la unidad
i es una caracterstica sistemtica del efecto causal aleatorio, y se define
como la diferencia entre estos dos valores esperados (utilizamos de nuevo,
para generalizar, la unidad i en vez de la circunscripcin 4):
Efecto causal
medio en la unidad i = /?
= E (Efecto causal aleatorio en la unidad i)
= E(Y'- Y N
)
= E ( Y ') - E ( Y N
)
(3.3)
de modo que en la primera lnea de esta ecuacin, /3 (beta) expresa este

efecto causal medio. En la segunda indicamos que en la unidad i este indi
cador es slo la media (valor esperado) del efecto causal aleatorio, mientras
que en las lneas tercera y cuarta se muestra cmo calcular la media. La l
tima lnea es otra manera de expresar la diferencia entre las medias de los
dos conjuntos de elecciones hipotticas (la media de la diferencia de dos
variables aleatorias es igual a la diferencia de sus medias). Para resumirlo
con palabras: el efecto causal es la diferencia que existe entre el componen
te sistemtico de las observaciones que se hacen cuando la variable expli
cativa tiene un valor y el componente sistemtico de observaciones compa
rables cuando la variable explicativa tiene otro valor.
La ltima lnea de la ecuacin 3.3 es similar a la ecuacin 3.1, y, al ser
as, el problema fundamental de la inferencia causal existe todava en esta
frmula. De hecho, expresado de esta manera, el problema es an ms
grande, porque, aunque pudiramos esquivar el problema fundamental en
un efecto causal realizado, todava seguiramos teniendo todos los habitua
les en la inferencia, incluido el de separar los componentes sistemticos y
no sistemticos del efecto causal aleatorio. A partir de ahora, utilizaremos
la expresin de Holland, problema fundamental de la inferencia causal,
para hacer referencia a la dificultad que l identific y tambin a los pro
blemas inferenciales habituales, que hemos aadido a la formulacin de
este autor. En el recuadro de la pgina 108 mostramos una notacin ms
general de los efectos causales, que resultar til en el resto del libro.
Hay otras muchas caractersticas sistemticas de estos efectos causales
aleatorios que podran ser de inters en diversas circunstancias. Por ejem
plo, quiz queramos saber la varianza de los posibles efectos causales (rea
lizados) que tiene el hecho de estar en el poder sobre el voto demcrata en
la unidad al igual que quisimos conocer la del propio voto mediante la
ecuacin 2.3 del apartado 6 del captulo anterior. Para calcular este indica
dor del efecto causal, aplicamos la operacin de la varianza:
(varianza del efecto causal en la unidad i) = V (Y'.- YN.)
en la que evitamos introducir un nuevo smbolo que represente el resultado
del clculo de la varianza, V( Yf - YJ). Con seguridad, los nuevos congresis
tas querrn saber la variacin del efecto causal que tiene el hecho de estar
en el poder para poder evaluar en qu medida su experiencia se parecer a
la de los congresistas anteriores y hasta qu punto pueden fiarse de la esti
macin del efecto causal medio que tuvo el hecho de estar en el poder en
elecciones anteriores. Resulta especialmente importante comprender que
esta varianza del efecto causal es una parte fundamental del mundo y que no
representa una incertidumbre causada por la estimacin.
1.2
Un ejemplo cualitativo
En el apartado 1 hemos desarrollado nuestra precisa definicin de causali

dad y, al ser delicados y bastante complejos algunos de los conceptos que
se barajaban, ilustramos la explicacin con un ejemplo simple y corriente
de la investigacin cuantitativa, que nos ayud a transmitir los conceptos
que queramos recalcar sin tener que ocupamos de los detalles contextales
y de la sensibilidad cultural que caracterizan la investigacin cualitativa de
calidad. En este apartado retomamos nuestra definicin de causalidad, pero
esta vez utilizamos un ejemplo cualitativo.
Los politlogos aprenderan mucho si pudieran volver a poner en mar
cha la historia manteniendo todos sus elementos constantes, a excepcin de la
variable explicativa controlada por el investigador. Por ejem plo, una de
las cuestiones ms importantes a las que se enfrentan los que participan de la
poltica y el gobierno es la relacionada con las consecuencias de una deter
minada ley o normativa. El Congreso de los Estados Unidos aprueba una
ley impositiva para que tenga ciertas consecuencias: que conduzca a unas
inversiones concretas, incremente los ingresos en cierta cantidad y cambie
las pautas de consumo. Acaso tiene tal efecto? Podemos observar lo que
ocurre despus de que se aprueba el impuesto, para comprobar si surgen las
consecuencias deseadas, pero, aunque sea as, nunca estaremos seguros de
que provengan de la ley. El cambio en la poltica de inversiones podra
haberse producido en cualquier caso. Si fuera posible volver a poner en
marcha la historia, con y sin la nueva normativa, tendramos mucho ms
control a la hora de hacer una estimacin del efecto causal de la ley. Evi
dentemente, no podemos hacerlo, pero la lgica nos ayudar a disear una
investigacin que d una respuesta aproximada a nuestra pregunta.
Pensemos ahora en un ejemplo general de la poltica comparada. Des
pus del derrumbe del sistema sovitico numerosos gobiernos de las rep
blicas ex soviticas de Europa del Este instauraron nuevas formas de go
bierno. Ahora se hallan inm ersos y son conscientes de ello en un
importante experimento poltico: estn aprobando nuevas constituciones
con la intencin de que stas creen sistemas democrticos estables. Uno de
los dilemas constitucionales que se les presentan es elegir entre sistemas de
gobierno parlamentarios o presidenciales. Determinar cul de ellos tiene
ms posibilidades de conducir a una democracia estable ha suscitado un
considerable debate entre los acadmicos del rea (Linz, 1993; Horowitz,
1993; Lijphart, 1993). La polmica es compleja, principalmente porque hay
muchos tipos de sistemas parlamentarios y presidenciales y tambin por la
variedad de las dems disposiciones constitucionales (como la naturaleza
del rgimen electoral) que podran acompaar a este dilema e interactuar
con l. Nuestro objetivo no es analizar en profundidad estas opciones, sino
dar una versin muy simplificada del dilema que plantean, con el fin de de
finir un efecto causal dentro de este ejemplo cualitativo. De este modo, su
brayamos la diferencia que hay entre las caractersticas sistemticas y no

sistemticas del efecto causal.
El debate sobre sistemas presidenciales y parlamentarios tiene que ver
con diversas caractersticas de ambos. Nos centraremos en dos de ellas: en
qu medida representa cada ordenamiento los diversos intereses de la ciu
dadana y si favorece la existencia de un liderazgo fuerte y con capacidad
de decisin. Se suele decir que los sistemas parlamentarios permiten una
mejor representacin de todos los grupos e intereses sociales en el gobier
no, ya que hay muchos escaos que llenar y los pueden ocupar representan
tes elegidos por diversos sectores. Por el contrario, el carcter drstico
(todo o nada) de los sistemas presidenciales conlleva que algunos grupos se
sientan apartados del gobierno, le sean desafectos y generen una mayor
inestabilidad. Por otra parte, es posible que los regmenes parlamentarios
especialmente los que representan de manera adecuada a todo el arco de
grupos e intereses sociales se bloqueen y que no cuenten con un gobier
no decidido. Tambin estas caractersticas pueden conducir a la desafeccin
y la inestabilidad8.
El objetivo principal de este apartado es formular una definicin precisa
de efecto causal. Para ello, imaginemos que podemos instaurar un sistema
parlamentario y que, peridicamente, durante unos diez aos, calibramos su
grado de estabilidad democrtica (quiz la propia supervivencia o desapari
cin del sistema, as como los intentos de golpe de Estado que sufre u otros
indicadores de inestabilidad); a la vez, en el mismo pais, fundamos un sis
tema presidencial y tambin medimos su estabilidad en el mismo perodo y
con los mismos elementos. El efecto causal realizado sera la diferencia en
tre los grados de estabilidad observados en el sistema presidencial y en el
parlamentario. La imposibilidad de calibrar este efecto causal directamente
es otro ejemplo del problema fundamental que plantea la inferencia causal.
Como parte de esta definicin, tambin necesitamos distinguir los efec
tos sistemticos y no sistemticos de la forma de gobierno. Para ello, ima
ginemos que llevamos a cabo este experimento hipottico muchas veces.
Definimos el efecto causal medio como la media de los efectos causales
realizados en las reproducciones de estos experimentos. Utilizar as la me
dia hace que se anulen las caractersticas no sistemticas del problema y
perm ite que nuestro indicador incluya slo las sistemticas. Entre stas se
encuentran la indecisin en un sistema parlamentario o la desafeccin de
las minoras en uno presidencial, mientras que entre las no sistemticas se
puede incluir una repentina enfermedad del presidente que precipita el go
bierno en el caos. Este ltimo acontecimiento no sera un rasgo persistente
en un sistema presidencial; aparecera en una de las repeticiones del experi
mento, pero no en otras 9.
Otro rasgo notable de este ejemplo es la varianza del efecto causal. A
cualquier pas que se est planteando elegir entre estos sistemas polticos le
interesar conocer el efecto causal medio que tiene uno u otro sobre la esta
bilidad democrtica; sin embargo, para cada pas slo hay una oportunidad:
slo una reproduccin de este experimento. En tal situacin, puede que a
los lderes polticos les interese algo ms que el efecto causal medio. Quiz
quieran comprender cules podran ser los efectos causales mximo y mni
mo o, al menos, la varianza de los efectos causales. Por ejemplo, quiz el
sistema presidencial reduzca la estabilidad democrtica media, pero la va
riabilidad de este efecto es enorme: a veces aumenta mucho la estabilidad y
otras la disminuye de forma considerable. Esta varianza se convierte en un
riesgo para el sistema poltico. En tales circunstancias, puede que los ciu
dadanos y los lderes polticos prefieran optar por un ordenamiento que ge
nere una estabilidad m edia slo un poco menor, pero con una varianza
tambin inferior en su efecto causal, de manera que se minimicen las posi
bilidades de llegar a un resultado desastroso.
2.
Clarificacin de las definiciones alternativas

de causalidad
En el apartado 1 hemos definido la causalidad en funcin de un efecto cau

sal: el efecto causal medio es la diferencia que hay entre los componentes
sistemticos de una variable dependiente cuando la variable causal tiene
dos valores diferentes. En este apartado, utilizamos nuestra definicin de
causalidad para clarificar diversas propuestas alternativas e ideas aparente
mente complejas. Demostramos que las importantes afirmaciones con
templadas en este mismo captulo que han hecho otros autores acerca de
los mecanismos causales (apartado 2 . 1 ), la causalidad mltiple (apar
tado 2.2) y la causalidad simtrica frente a la asimtrica (apartado 2.3)
no entran en conflicto con nuestra ms bsica definicin de causalidad.
2.1
Mecanismos causales
Algunos investigadores sealan que la idea principal de la causalidad es el

conjunto de mecanismos causales que se dice que existen entre causa y
efecto (vase Little, 1991, p. 15). De form a intuitiva, este punto de vista
tiene sentido: cualquier explicacin coherente que se d a la causalidad tie
ne que precisar cmo se producen los efectos. Por ejemplo, supongamos
que a un investigador le interesen las consecuencias que puede tener un
nuevo acuerdo fiscal entre los Estados Unidos y Japn sobre el dficit de la
balanza de pagos del primer pas respecto al segundo. Segn nuestra defi
nicin de causalidad, aqu el efecto causal se basara en comparar la reduc
cin del dficit de la balanza de pagos esperado, cuando se aplique el nue
vo acuerdo fiscal, y la m ism a situacin (en igual m om ento y con los
mismos pases) sin que haya entrado en vigor el tratado. A su vez, el meca
nismo causal que opera en este proceso conllevara hasta que se produje
ra el efecto final sobre la balanza de pagos estadounidense respecto a
Japn la firm a y ratificacin del acuerdo, la informacin que dieran los
peridicos, las reuniones de los actores afectados en las compaas m ulti
nacionales y las acciones compensatorias que realizaran para reducir la car
ga fiscal de sus empresas (como el cambio en las reglas de fijacin de pre
cios de transferencia o el traslado de las fbricas de un pas a otro), as
como las acciones de otras compaas y trabajadores que quisieran aprove
charse de los movimientos de capital y de fuerza productiva entre los pa
ses, etc.
Desde el punto de vista de los procesos con los que opera la causalidad,
hacer hincapi en los mecanismos causales tiene sentido intuitivamente:
toda explicacin coherente de la causalidad tiene que explicar de qu mane
ra se producen sus efectos. Identificar mecanismos causales es una forma
habitual de hacer anlisis empricos a la que se ha denominado con expre
siones ligeramente diferentes: rastreo de procesos (que analizaremos en
el apartado 3.3 del captulo 6 ), anlisis histrico y estudios de caso de
tallados. Muchos de los pormenores de los estudios de caso bien hechos
conllevan la identificacin de mecanismos causales.
Sin embargo, para precisar cules son tales mecanismos es necesario uti
lizar la inferencia causal, empleando los mtodos que se analizan posterior
mente. Esto quiere decir que el investigador, para demostrar el carcter cau
sal de cada posible vnculo en un mecanismo como se, tendr que definir
el efecto causal subyacente y luego hacer una estimacin del mismo. Si se
quiere representar un mecanismo causal con coherencia interna es necesa
rio utilizar, para cada uno de los eslabones de la cadena de acontecimien
tos, la definicin de causalidad fundamental que hemos dado en el aparta
do 1 de este captulo.
De ah que nuestra definicin de causalidad sea, lgicamente, previa a la
identificacin de los m ecanism os causales. Adems, en las ciencias so
ciales siempre existen infinidad de pasos causales entre cualquier par de es
labones de esa cadena de m ecanism os. Si postulam os que una variable
explicativa produce otra dependiente, para utilizar un enfoque a base de
mecanismos causales tendremos que listar los vnculos causales que hay
entre ambas variables. En esta definicin tambin necesitaremos determi
nar una serie de enlaces causales, definir la causalidad en cada par de varia
bles consecutivas de la secuencia y precisar qu unin existe entre cada dos
variables, as como la conexin entre parejas diferentes. Este enfoque nos
conducir rpidamente a un regreso al infinito y en ningn momento ofrece
por s solo una definicin precisa de causalidad, relativa a una causa y un
efecto.
En el ejemplo referido al efecto que tiene un sistema presidencial o par
lamentario en la estabilidad democrtica (apartado 1 .2 ) los mecanismos
causales de la hiptesis incluyen una mayor desafeccin de las minoras en
el rgimen presidencial y una menor decisin del gobierno en el parlamen

tario. Estos efectos intervinientes que genera el ordenamiento constitu
cional y que, a su vez, influyen en la estabilidad poltica pueden obser
varse directam ente. Podram os hacer un seguim iento de las actitudes o
comportamientos de las minoras para ver de qu modo difieren en dos si
tuaciones experimentales o estudiar lo decididos que son los gobiernos en
cada uno de los sistemas. Sin embargo, aunque los efectos causales de los
sistemas presidenciales y de los parlamentarios operaran de forma diferen
te, nuestra definicin de efecto causal seguira siendo vlida. Se puede de
finir dicho concepto sin com prender todos los mecanismos causales que
conlleva, pero no determinar stos sin definir el efecto causal.
Para nosotros, identificar los mecanismos que hacen que una causa ten
ga un efecto suele servir de apoyo a una teora y es un procedimiento ope
rativo muy til. A veces, determinar mecanismos causales puede damos ms
control sobre una teora, al convertir las observaciones de otros niveles de
anlisis en consecuencias de dicha teora. El concepto tambin puede gene
rar nuevas hiptesis causales que investigar. Sin embargo, no debemos con
fundir la definicin de causalidad con el procedimiento operativo de identi
ficar mecanismos causales, que no es definitorio pero s suele ser til.
2.2
Causalidad mltiple
En un trabajo reciente, Charles Ragin (1987, pp. 34-52) aboga por una me
todologa que utilice muchas variables explicativas y pocas observaciones,
con el fin de que se pueda tener en cuenta lo que l denomina causalidad
mltiple. Esto quiere decir que El fenmeno que se investiga tiene deter
minantes alternativos; lo que Mili (1843) llamaba el problema de la plura
lidad de causas. Para la teora general de sistemas (George, 1982, p. 11),
este problem a se denom ina equifinalidad. En situaciones con causas
mltiples, estos autores sealan que un mismo resultado pueden producirlo
combinaciones de diferentes variables independientesl0.
Para Ragin, cuando diversas variables explicativas pueden explicar el
mismo resultado en una variable dependiente, hay mtodos estadsticos que
rechazan equivocadamente la hiptesis de que tales variables tengan un ca
rcter causal. Ragin tiene razn al afirmar que algunos modelos estadsti
cos (o relevantes diseos de investigacin cualitativa) quiz no alerten al in
vestigador de la existencia de una causalidad mltiple, pero s los hay
adecuados (algunos de los que Ragin analiza) para manejar con facilidad
este tipo de situaciones.
Adems, los rasgos fundamentales de la causalidad mltiple pueden
compatibilizarse con nuestra definicin de causalidad y son los mismos en
la investigacin cuantitativa y en la cualitativa. Esta idea no contiene rasgos
o requisitos tericos nuevos. Consideremos, por ejemplo, la hiptesis de
RKiSS
98
que el nivel de renta de una persona depende tanto de que culmine con xi
to estudios superiores como del hecho de que sus padres tambin lo hicie
ran. Resulta insuficiente cumplir una condicin y no la otra. En este caso,
necesitam os com parar diversas categoras de nuestra variable causal: los
encuestados que cumplen ambas condiciones, los dos grupos en los que
slo se da una u otra y aquel que no cuenta con ninguna. De este modo, el
concepto de causalidad mltiple exige ms de nuestros datos, ya que
ahora nuestras variables causales se dividen en cuatro categoras, aunque
esto no haga necesario un cambio en nuestra definicin de causalidad. Para
sta, tendramos que medir la renta esperada en la misma persona, al mis
mo tiempo y en cada una de las cuatro situaciones.
Sin embargo, qu ocurre si diferentes explicaciones causales producen
los mismos valores en la variable dependiente? Supongamos, por ejemplo,
que en una poblacin de trabajadores fabriles nuestra variable causal (dicotmica) fuera el hecho de tener o no tener una licenciatura universitaria. En
esta situacin sera bastante razonable que licenciados y no licenciados tu
vieran la misma renta (nuestra variable dependiente). Una de las razones
puede ser que esta variable explicativa (los estudios universitarios) no tiene
un efecto causal en la renta de los trabajadores fabriles, quiz porque la
educacin superior no ayuda a un mejor rendimiento. Por el contrario, hay
diversas razones que pueden explicar que ambos grupos tengan el mismo
nivel de renta. Quiz el de los licenciados tenga que ver con su ttulo y el
de los que no fueron a la universidad con sus cuatro aos de antigedad en
el puesto. En esta situacin, no podramos llegar a la conclusin de que la
educacin universitaria no tiene un efecto causal en los niveles de renta
de los que van a convertirse en trabajadores fabriles?
Por fortuna, nuestra definicin de causalidad requiere una mayor preci
sin en la condicin contrafctica. En el presente ejemplo los valores de la
variable causal principal que hay que cambiar son ( 1 ) tener un ttulo univer
sitario frente a (2) carecer de l pero llevar cuatro aos en un puesto. La va
riable dependiente es la renta anual inicial. En consecuencia, nuestro efecto
causal se define de la siguiente manera: registramos la renta de una persona
que termina su carrera y va a trabajar a una fbrica. Despus, retrocedemos
cuatro aos y ponemos al mismo individuo a trabajar en la misma fbrica,
en vez de mandarle a la universidad, y al cabo de cuatro aos medimos de
nuevo sus ingresos. La diferencia esperada entre estos dos niveles de renta
en el mismo individuo es nuestra definicin de efecto causal medio. En la
situacin actual, hemos imaginado que este efecto causal es igual a cero,
pero esto no significa que los estudios universitarios no tengan un efecto
sobre la renta, slo que la diferencia media entre los grupos de tratamien
to (1) y (2) es cero. De hecho, no hay una nica definicin lgica del efecto
causal de los estudios universitarios, ya que no se puede definir un efec
to causal sin que haya, al menos, dos condiciones. No tienen por qu ser las
que hemos mencionado, pero es preciso identificarlas claramente.
Otro posible par de condiciones causales es el que surge de comparar a

una persona con ttulo universitario con otra que carece de l pero que
tiene la misma antigedad en el puesto que la primera. En cierto sentido,
esto es poco realista, ya que el no universitario habr hecho algo en los
cuatro aos en los que no ha estudiado, pero quiz estemos dispuestos a
imaginar que en ese tiempo ha tenido otro empleo de poca importancia.
Dicho de otro modo, este contrafctico alternativo se basa en comparar el
efecto de tener estudios universitarios con el de no tenerlos, siempre que
la antigedad en la empresa sea la misma. Si este elemento no se m antie
ne constante en las dos condiciones causales, las estim aciones de cual
quier diseo de investigacin darn los resultados de nuestro primer con
trafctico, y no los de esta versin revisada. Si el objetivo es el segundo
pero no introducimos controles, nuestro anlisis emprico ser defectuoso
por el sesgo de la variable omitida (que abordamos en el apartado 2 del
captulo 5).
De este modo, las cuestiones que se agrupan bajo la etiqueta de causa
lidad mltiple no confunden nuestra definicin de causalidad, aunque exi
gen ms de los anlisis posteriores. El hecho de que algunas variables de
pendientes, y quiz todas las interesantes de este tipo que hay en las
ciencias sociales, se vean influidas por muchos factores causales no hace
problemtica nuestra definicin de causalidad. La clave para entender estas
situaciones tan habituales es definir la condicin contrafctica mediante
una precisa concepcin de cada efecto causal. En el captulo 5 demostra
mos que, para estimar el nico efecto causal que tiene inters, no es necesa
rio identificar todos los de una variable dependiente (aunque esto fuera
posible). El investigador puede centrarse en el nico efecto que le interesa,
llegar a conclusiones consistentes y pasar despus a otros efectos que pue
dan ser relevantes (vanse los apartados 2 y 3 del captulo 5 ) 11.
2.3
Causalidad simtrica y asimtrica
Stanley Lieberson (1985, pp. 63-64) distingue entre lo que clasifica como
formas de causalidad simtricas y asimtricas y se centra en las dife
rencias que se producen en los efectos causales cuando se aumenta una va
riable explicativa o cuando se reduce. Segn sus propias palabras:
Al examinar, por ejemplo, la influencia causal de X, [una variable explicativa] sobre Y
[una dependiente], tam bin hay que considerar si los cam bios producidos desde cual
quier direccin en un valor dado de X tienen las m ism as consecuencias para Y [...] Si la
relacin causal entre X s [la variable explicativa] e Y [la dependiente] es sim trica o real
mente reversible, el efecto que tendr sobre Y un aum ento de X t desaparecer si X , vuel
ve a su nivel anterior (siempre que el resto de las condiciones sea constante).
Como ejemplo de la afirm acin de Lieberson, imaginemos que en las

elecciones al Congreso estadounidense de 1998 no se hubiera presentado
ningn congresista en la cuarta circunscripcin de Nueva York y que el
candidato demcrata recibiera el 55 por cien de los votos. Lieberson defi
nira el efecto causal de estar en el poder como el aumento de votos que se
producira si el dem crata ganador en 1998 se presentara, siendo ya con
gresista, a las siguientes elecciones del ao 2000. Este efecto sera sim
trico si la ausencia de un candidato congresista en las elecciones poste
riores (las del ao 2002) hiciera que los votos volvieran a ser del 55 por
cien. El efecto podra ser asimtrico si, por ejemplo, el congresista de
mcrata reuniera dinero y mejorara la organizacin de la campaa de su
partido; en consecuencia, si ningn congresista se presentara a las eleccio
nes del 2002, el candidato demcrata podra recibir ms del 55 por cien de
los votos.
El argumento de Lieberson es inteligente y de gran importancia. Sin em
bargo, para nosotros no constituye una definicin de causalidad sino que
slo es aplicable a algunas inferencias causales: al proceso de aprendizaje
sobre un efecto causal a partir de las observaciones existentes. En el aparta
do 1 de este captulo hemos definido la causalidad en una sola unidad. En
el ejemplo actual, un efecto causal puede definirse desde el punto de vista
terico en funcin de los acontecimientos hipotticos que han tenido lugar
nicamente en las elecciones de 1998 en la cuarta circunscripcin de Nueva
York. Nuestra definicin se basa en la diferencia que se da en el componen
te sistemtico del voto en esa circunscripcin cuando se presenta un con
gresista y cuando no se presenta, si las elecciones, la fecha y la circuns
cripcin son las mismas.
Por el contrario, el ejemplo de Lieberson no incluye cantidades hipotti
cas y, por tanto, no puede ser una definicin causal. Slo se ocupa de lo
que ocurrira en dos elecciones reales si la variable explicativa pasara de ser
no congresista a congresista y de lo que sucedera si se diera el proceso
contrario de congresista a no congresista en otros dos comicios. Cual
quier anlisis emprico de este ejemplo planteara numerosos problemas inferenciales. Analizamos muchos de los problemas relativos a la inferencia
causal entre los captulos 4 y 6 . E n el presente ejemplo podramos pregun
tamos si el efecto estimado slo nos pareca mayor por no haber explicado
el hecho de que se hubieran registrado recientemente una gran cantidad de
ciudadanos en la cuarta circunscripcin, o si la oleada de apoyo para el con
gresista demcrata en las elecciones se nos antojaba ms pequea de lo que
era porque, necesariamente, descartbamos aquellas circunscripciones en
las que los demcratas haban perdido en las primeras elecciones.
De este modo, es importante considerar los conceptos de causalidad si
mtrica y asimtrica de Lieberson en el contexto de la inferencia causal.
Sin embargo, no deben confundirse con la definicin terica de causalidad,
que ya hemos dado en el apartado 1 de este captulo.
3.
Supuestos necesarios para la estimacin

de efectos causales
Cmo evitar el problema fundamental de la inferencia causal y tambin el

de separar los componentes sistemticos de los no sistemticos? Los cap
tulos que van del 4 al 6 se dedicarn ntegramente a dar una respuesta com
pleta a esta pregunta, pero aqu proporcionamos una visin general de los
dos supuestos que pueden evitarnos este problema fundamental: la homoge
neidad de las unidades (que analizaremos a continuacin en el apartado
3.1) y la independencia condicional (apartado 3.2). Al igual que cualquier
intento de esquivar el problema fundamental de la inferencia causal, tales
supuestos siempre conllevan otros que no son comprobables. Cada investi
gador tiene la responsabilidad de mostrar a los lectores con toda claridad
las consecuencias esenciales de este punto dbil de su diseo de investiga
cin. Las inferencias causales no deben parecer mgicas y los supuestos
pueden y deben justificarse mediante cualquier informacin colateral o in
vestigacin anterior que se pueda aportar, siempre que se reconozca expl
citamente.
3.1
Homogeneidad de las unidades
Si no podemos volver a poner en marcha la historia en el mismo momento

y lugar, dando diferentes valores a nuestra variable explicativa en cada oca
sin tal como requerira una autntica solucin para el problema funda
mental de la inferencia causal , s se puede partir de un segundo supuesto:
poner otra vez en marcha nuestro experimento en dos unidades diferentes
que sean hom ogneas. D os unidades son homogneas si los valores
esperados de las variables dependientes de cada una de ellas son los mis
mos cuando nuestra variable explicativa adopta un valor determ inado
(o sea, /x'J' = fj.N
2y
= /x') Por ejemplo, si observamos que X = 1 (un con
gresista) en la circunscripcin 1 y X = 0 (no congresista) en la 2, la premisa
de homogeneidad de las unidades supone que podemos utilizar las propor
ciones observadas del voto en dos circunscripciones separadas para extraer
una inferencia sobre el efecto causal /3, que presuponemos es el mismo en
ambas. En un conjunto de datos con n observaciones, la homogeneidad de
las unidades consiste en presuponer que todas las que tengan igual valor en
sus variables explicativas tendrn tambin el mismo valor esperado en la
dependiente. Es evidente que esto es slo un supuesto y que puede ser err
neo: quiz ambas circunscripciones sean diferentes por alguna razn desco
nocida que sesgue nuestra inferencia causal. De hecho, cualquier par de
circunscripciones reales diferir en ciertos sentidos, y para aplicar este su
puesto ambas tendrn que ser iguales en cuanto a la media de muchas re
producciones hipotticas de la campaa electoral. Por ejemplo, la pluviosiifo t
dad (que puede reducir la asistencia a las urnas en algunas reas) no varia
r, como promedio, de una circunscripcin a otra, a menos que haya dife
rencias climticas sistemticas entre las dos.
En la cita siguiente, Holland (1986, p. 947) da un ejemplo claro del su
puesto de homogeneidad de las unidades (definido a partir de su idea de
efecto causal realizado y no en funcin del efecto causal medio). Al no
existir apenas aleatoriedad en el experimento del siguiente ejemplo, su de
finicin y la nuestra se parecen (de hecho, como planteamos en el aparta
do 2 del captulo 4, en un pequeo nmero de unidades, el supuesto de la
homogeneidad de las unidades es ms til cuando el grado de aleatoriedad
es bastante bajo).
Si [la unidad] es la habitacin de una casa, t [de tratamiento] significa que pulso el in
terruptor de la luz en esa habitacin, c [de control] significa que no lo hago y [la varia
ble dependiente] indica si la luz est encendida o no durante un corto periodo despus
de que se aplique t o c, de manera que podra creer que se pueden conocer los valores de
[la variable dependiente, tanto en t com o en c] al pulsar el interruptor. Sin embargo, est
claro que mi creencia slo la puede com partir alguien por la plausibilidad de ciertos su
puestos relativos a la situacin. Si, por ejemplo, la luz se ha estado apagando y encen
diendo sin razn aparente mientras estoy pensando en realizar mi experimento, podra
dudar de que se puedan conocer los valores de [la variable dependiente tanto en t como
en r] despus de pulsar el interruptor, al menos hasta que fuera lo suficientemente in
genioso como para concebir un nuevo experimento!
En este ejemplo, el supuesto de homogeneidad de las unidades consiste

en que si hubiramos pulsado el interruptor (aplicado t, segn la notacin
de Holland) en ambos perodos, el valor esperado (si la luz iba a estar en
cendida o no) habra sido el mismo. La homogeneidad de las unidades tam
bin presupone que si no hubiramos apretado el interruptor (aplicado c) en
los dos perodos, el valor esperado habra sido el mismo, aunque no necesa
riamente igual a cuando se aplicara t. Hay que sealar que, para asegurar
nos de esto, tendramos que haber puesto el interruptor en la posicin de
apagado despus del primer experimento, pero tambin tendramos que ha
ber partido de un supuesto incomprobable: que pulsar el encendido del in
terruptor en el primer perodo no tiene como consecuencia los dos valores
hipotticos esperados en el siguiente (como sera el caso si se fundieran los
plomos despus de la primera pulsacin). En general, el supuesto de homo
geneidad de las unidades no puede comprobarse en una nica unidad (aun
que, en este caso, abriendo la pared e inspeccionando la instalacin elctrica
podramos generar algunas nuevas hiptesis en relacin con el mecanismo
causal).
El supuesto del efecto constante es una versin ms dbil, pero comple
tamente aceptable, de la homogeneidad de las unidades. En lugar de pre
suponer que el valor esperado de la variable dependiente es el mismo en
diferentes unidades si tambin lo es el de la variable explicativa, slo ten

dremos que presuponer que el efecto causal es constante. Esta es una ver
sin ms endeble del supuesto de homogeneidad de las unidades porque el
efecto causal no es ms que la diferencia entre los dos valores esperados. Si
los de las unidades cuya variable explicativa vale lo mismo cambian de
igual manera, se vulnerar el supuesto de homogeneidad de las unidades,
pero seguir siendo vlido el del efecto constante. Por ejemplo, en unas
elecciones al Congreso estadounidense dos circunscripciones pueden variar
en cuanto a la proporcin de voto esperada para candidatos demcratas no
congresistas (digamos, un 45% frente a un 65%), pero puede que el hecho
de tener ese cargo siga aumentando en un 1 0 % el voto a los candidatos de
mcratas en cualquier circunscripcin.
El concepto de homogeneidad de las unidades (o el supuesto de los efec
tos causales constantes, que es menos exigente) est en la raz de la investi
gacin cientfica. Por ejemplo, es la premisa que subyace en los estudios de
caso comparados. Contrastamos diversas unidades cuyas variables explica
tivas tienen diferentes valores y observamos los de las dependientes. Cree
mos que los resultados que observamos en estos ltimos valores proceden
de las diferencias que hay entre los de las variables explicativas que se rela
cionan con las observaciones. Lo que hemos planteado aqu es que, en este
caso, nuestra creencia se apoya necesariamente en el supuesto de homo
geneidad de las unidades o de los efectos constantes.
Hay que sealar que puede que busquemos unidades homogneas a lo
largo del tiempo o del espacio. Podemos comparar los votos que recibe un
candidato demcrata, cuando es congresista y cuando no lo es, en la m is
ma circunscripcin y en diferentes ocasiones, as como en varias circuns
cripciones al mismo tiempo (o combinar ambas posibilidades). Como un
efecto causal slo puede estimarse y no conocerse, no resulta sorprendente
que, en general, el supuesto de homogeneidad de las unidades no sea com
probable; sin embargo, es importante que se haga explcita su naturaleza.
En qu gama de unidades esperamos que tenga sentido nuestro supuesto
de que estar en el poder tenga un efecto uniforme?, en cualquiera de las
elecciones para el Congreso?, para el Congreso s pero no para el Sena
do?, slo en las del norte?, slo en las de los ltimos veinte aos?
Vase de qu manera el supuesto de homogeneidad de las unidades se
relaciona con el anlisis que hicimos en el apartado 1.3 del captulo 1 de la
complejidad y de la singularidad. Sealamos entonces que las generali
zaciones de las ciencias sociales dependen de nuestra capacidad para sim
plificar la realidad coherentemente. En su forma ms extrema, generalizar
de ese modo con el fin de extraer inferencias causales precisa del respeto a
las normas de homogeneidad de las unidades: para realizar el anlisis, las
observaciones que se examinan se hacen idnticas en aspectos importantes.
Con frecuencia, resulta imposible lograr la homogeneidad de las unidades;
las elecciones al Congreso, por no hablar de las revoluciones, apenas pue
den compararse con interruptores de la luz. Sin embargo, entender el grado

de homogeneidad de nuestras unidades de anlisis nos ayudar a hacer una
estimacin del nivel de incertidumbre o de otros sesgos similares que pue
dan atribuirse a nuestras inferencias.
3.2
Independencia condicional
Segn el supuesto de independencia condicional, los valores que se adjudi

can a las variables explicativas son independientes de los de las dependien
tes (la misma expresin se utiliza a veces en estadstica, pero su definicin
no es la misma que suele tener en la teora de la probabilidad). Esto quiere
decir que, despus de tener en cuenta las variables explicativas (o de con
trolarlas), el proceso de asignar valores a la variable explicativa es indepen
diente de las (en general, dos o ms) variables dependientes, Y" y. Utiliza
m os la expresin asignar valores a las variables explicativas para
describir el proceso mediante el cual stas consiguen unos valores determi
nados. En el trabajo experimental el investigador asigna realmente valores
a estas variables: unos objetos se colocan en el grupo de tratamiento y otros
en el de control, mientras que en el trabajo no experimental los pueden
asignar la naturaleza o el medio. En estos casos, lo esencial es que los
valores de las variables explicativas no sean consecuencia de las dependien
tes. En el apartado 4 del captulo 5 se describe el problema de la endoge
neidad, que aparece cuando las variables explicativas son consecuencia, al
menos parcialmente, de las dependientes.
Los anlisis de un n grande en los que hay que utilizar un sistema alea
torio, tanto de seleccin como de asignacin de valores, son la forma ms
fiable de garantizar la independencia condicional y no necesitan del su
puesto de homogeneidad de las unidades. Este sistema aleatorio de selec
cin y asignacin nos ayuda a extraer inferencias causales porque cumple
automticamente tres supuestos que subyacen en el concepto de indepen
dencia condicional: ( 1 ) que el proceso de asignacin de valores a las varia
bles explicativas es independiente de las dependientes (o sea, que no existe
problema de endogeneidad), ( 2 ) que no hay sesgo de seleccin problema
que analizamos en el apartado 3 del captulo 4 (3) y tampoco sesgo de la
variable omitida (apartado 2 del captulo 5). De este modo, si podemos
cumplir de alguna manera estas condiciones, ya sea mediante el sistema
aleatorio de seleccin y asignacin (tal como se analiza en el apartado 2 del
captulo 4) o utilizando algn otro procedimiento, podremos evitar el pro
blema fundamental de la inferencia causal.
Por fortuna, el sistema aleatorio de seleccin y asignacin no es necesa
rio para que se cumpla el supuesto de independencia condicional y, si el
proceso de asignacin de valores a las variables explicativas no es inde
pendiente de las dependientes, an podremos cumplir dicho supuesto cono
ciendo el proceso e incorporando una medida del mismo a nuestras varia

bles de control. Por ejemplo, supongamos que nos interesa hacer una esti
macin de las consecuencias que tiene el nivel de segregacin residencial
en la intensidad del conflicto entre israeles y palestinos en la Cisjordania
ocupada por los primeros. Estaram os transgrediendo considerablemente
nuestro supuesto de independencia condicional si, para hallar el efecto cau
sal, slo nos ocupramos de la relacin entre estas dos variables. La razn
es que puede que los israeles y palestinos que deciden vivir en zonas se
gregadas lo hagan en virtud de una conviccin ideolgica que determina
quin tiene realmente el derecho a estar en Cisjordania. Por lo tanto, el ex
tremismo ideolgico (en ambos bandos) puede llevar al conflicto. Una me
dida que creemos que representa la segregacin residencial quiz sea, en
realidad, un sustituto de la ideologa. La diferencia entre ambas explicacio
nes puede ser bastante importante, ya que una nueva poltica de vivienda
podra ayudar a remediar el conflicto si la segregacin residencial fuera su
autntica causa, pero sera ineficaz, e incluso contraproducente, si su fuerza
motriz es la ideologa. Podramos intentar solucionar este problema midien
do tambin de forma explcita la ideologa de los residentes y controlando
este factor. Por ejemplo, podramos informarnos de qu apoyo tienen los
partidos extremistas entre los israeles y de la afiliacin a la OLP entre los pa
lestinos. Posteriormente, se podran controlar las posibles consecuencias
engaosas de la ideologa comparando com unidades en las que haya un
mismo nivel de extremismo ideolgico pero un grado de segregacin resi
dencial distinto.
Cuando no es factible ni seleccionar ni asignar valores de manera aleato
ria y tampoco se puede controlar el proceso de asignacin y de seleccin,
tenemos que recurrir a alguna versin del supuesto de homogeneidad de las
unidades para hacer inferencias causales vlidas. Como en las investigacio
nes sociales nunca se cumplir perfectamente tal supuesto, habr que poner
un cuidado especial en especificar el grado de incertidumbre de las inferen
cias causales. Este supuesto se pondr especialmente de manifiesto cuando
analicemos, en el apartado 6 del captulo 5, los procedimientos que se utili
zan para analizar observaciones equiparables.
4.
Criterios para evaluar las inferencias causales
Recordemos que al definir la causalidad en funcin de variables aleatorias

logramos establecer una estricta analoga entre ese fenmeno y otras carac
tersticas sistemticas, como son la media o la varianza, en las que nos cen
tramos al extraer inferencias descriptivas. Esta analoga nos permite evaluar
las inferencias causales precisamente con los mismos criterios que utiliza
mos en el apartado 7 del captulo 2 para juzgar las descriptivas: la falta de
sesgo y la eficiencia. De ah que gran parte de lo que dijimos sobre este
asunto en el captulo 2 se aplique igualmente a los problemas de la inferen

cia causal que abordamos aqu. En este apartado, formalizamos brevemente
las diferencias relativamente escasas que hay entre estas dos situaciones.
En el apartado 7 del captulo 2 el objetivo de nuestra inferencia era una
media (el valor esperado de una variable aleatoria) que denominamos jl y
que conceptualizamos como un nmero fijo pero desconocido. Se dice que
un estimador de /x no est sesgado si es igual a la media de /i en muchas
reproducciones hipotticas del mismo experimento.
Al igual que entonces, seguimos conceptualizando el valor esperado de
un efecto causal aleatorio, denominado /3, como un nmero fijo pero desco
nocido. Por tanto, la falta de sesgo se define de manera anloga: un estima
dor de /3 carece de sesgo si es igual a la media de /3 en muchas reproduccio
nes hipotticas del mismo experimento. La eficiencia tambin se define de
forma parecida a la variacin que se registra de una reproduccin hipottica
a otra. stos son conceptos muy importantes que, entre los captulos 4 y 6,
nos servirn de base para estudiar muchos de los problemas de la inferencia
causal. En los dos recuadros siguientes se presentan definiciones formales.
5.
Reglas para elaborar teoras causales
Muchos consejos sensatos para mejorar la investigacin cualitativa son pre

cisos, especficos y detallados, y se refieren a un aspecto manejable y, por
tanto, delimitado de ese tipo de investigacin. Sin embargo, aun cuando es
temos enfrascados en la resolucin de multitud de problemas concretos,
hay que tener en mente una clara visin general: toda solucin especfica
debe ayudamos a solventar cualquiera que sea el problema general de la in
ferencia causal del que nos estemos ocupando. Hasta ahora, en este captu
lo hemos proporcionado una precisa definicin terica de efecto causal y
hemos analizado algunos de los problemas que conlleva la extraccin de in
ferencias causales. Ahora vamos a dar un paso atrs para ofrecer una pano
rmica ms amplia de ciertas normas relativas a la elaboracin de teoras.
Para nosotros (tal como se ha sealado en el apartado 2 del captulo 1) la
mejora de una teora no acaba cuando comienza la recogida de datos.
Las teoras causales tienen como objetivo mostrar las causas de un fe
nmeno o conjunto de fenmenos. Cualquier teora, independientemente de
que en principio haya sido deductiva o inductiva, conlleva un conjunto interrelacionado de hiptesis causales. Cada una de ellas postula la existencia
de una relacin entre variables que genera consecuencias observables: si
unas determinadas variables explicativas tienen ciertos valores, se predice
que las dependientes tendrn otros valores especficos. Para comprobar o
evaluar cualquier hiptesis causal se necesitan inferencias del mismo tipo.
La teora general, que se compone de hiptesis, ha de tener coherencia in
terna porque si no se plantearn hiptesis contradictorias.
Notacin para un modelo formal de efecto causal

Con el fin de hacer ms comprensibles los apartados siguientes, a conti
nuacin generalizamos nuestra notacin. Casi siempre tendremos n reali
zaciones de la variable Y.. En nuestro ejemplo cuantitativo corriente, n es
el nmero de circunscripciones en las elecciones al Congreso (435), mien
tras que la realizacin y f de la variable aleatoria Yj es la proporcin de vo
tos demcratas observada (como 0,56%) en la circunscripcin i, dentro
del reparto entre ambos partidos. La proporcin de votos esperada para el
demcrata no congresista en ese reparto (la media de todas las reproduc
ciones hipotticas) en la circunscripcin i es fi". Definimos la variable ex
plicativa como X y, en el presente ejemplo, la codificamos como cero
cuando en la circunscripcin i no se presenta un congresista demcrata y
como uno cuando s se presenta. De este modo, podemos expresar el efec
to causal medio en la unidad i como:
/3 = (K| X. = 1 ) - ( K | X = 0) = 4 - M "
(3.4)
(3.5)
As, cuando en la circunscripcin i no se presenta un congresista e X. = 0,

el valor esperado se ve determinado por la sustitucin de X por 0 en la
ecuacin, y la respuesta es la siguiente:
F{^|X-0)-/i*+(0)j8
Las teoras e hiptesis que se ajustan a esta descripcin abarcan una

amplsima gama. En este apartado presentamos cinco reglas que ayudan
a elaborar buenas teoras y analizarem os cada una de ellas m ediante
ejemplos.
5.1
Regla 1: elaborar teoras falsables
Con esta primera regla no slo queremos decir que una teora que no
puede estar equivocada no es tal teora, sino que las teoras hay que dise-
De la misma manera, cuando un congresista demcrata se presenta en la

circunscripcin el valor esperado es pJ'.
f(r | X = l ) = / ^ + (l)j3
-/4+0
4Sf
De este modo, la ecuacin (3.5) proporciona un modelo til de inferencia

causal, siendo /3 la diferencia entre las dos proporciones tericas
nuestro efecto causal. Para terminar, simplificamos por ltima vez esta
ecuacin para poder remitirnos a ella en el futuro. Si presuponemos que la
media de Y. es cero (o que se representa como una desviacin de esta me
dia que no lim ita en modo alguno la aplicabilidad del modelo), podremos
prescindir del trmino constante en esta ecuacin y escribirla de forma
ms simple como:
(/,)= X./3
(3.6)
El parmetro /3 sigue siendo el valor terico del efecto causal medio, una
caracterstica sistemtica de las variables aleatorias y uno de nuestros ob
jetivos en la inferencia causal. Este modelo constituye un caso especial
del anlisis de regresin que es habitual en la investigacin cuantitati
va, pero los coeficientes de regresin slo coinciden a veces con las esti
maciones de los efectos causales.
arlas para que se pueda demostrar de la forma ms rpida y fcil posible

que estn equivocadas. Es evidente que no tenemos que intentar equivocar
nos, pero incluso una teora incorrecta es mejor que una afirmacin que no
es ni falsa ni cierta. Subrayar la necesidad de que las teoras sean falsables
nos obliga a mantener una perspectiva adecuada sobre la incertidumbre y
garantiza que vamos a considerar tales teoras como algo provisional, sin
dejarlas convertirse en dogmas. Siempre hay que estar dispuesto a rechazar
las teoras si existen suficientes pruebas cientificas en su contra. Una de las
preguntas que hay que plantearse en relacin a una teora (o a cualquier hi
ptesis que se derive de ella) es simplemente: qu datos la falsaran? Esta
Un anlisis formal de la falta de sesgo

en las estimaciones causales
En este recuadro demostramos la falta de sesgo del estimador que represen
ta el parmetro del efecto causal que apareca en el apartado 1 de este ca
ptulo. La notacin y la lgica de estas ideas son bastante paralelas a las de
la definicin formal de falta de sesgo que se dio en el apartado 7 del cap
tulo 2, dentro del contexto de la inferencia descriptiva. El simple modelo li
neal que tiene una variable explicativa y otra dependiente es como sigue12:
5(K) = fiX.
Nuestra estimacin de /3 es simplemente la de regresin por mnimos cua
drados:
1YX
= - ^ ------
(3.7)
Para determinar si b es un estimador no sesgado de jS es preciso tomar el

valor esperado, haciendo su media en las reproducciones hipotticas:
IV ,
!1___ ____
E(b) =
(3.8)
1
IW ,)
i*1
*]
i*l
= /3
lo cual demuestra que b es un estimador no sesgado de /3.
pregunta debe aplicarse a cualquier teora o hiptesis, pero, sobre todo, tie
ne que hacerlo el investigador que primero formula una teora.
Karl Popper es el autor que ms se relaciona con la idea de falsabilidad
(Popper, 1968), y para l existe una asimetra fundamental entre confirmar
Un anlisis formal de la eficiencia

* A continuacin, calibramos la eficiencia del estimador estndar que repre
senta el parmetro del efecto causal 3 que apareca en el apartado 1 de
este captulo. En la ecuacin (3.8) hemos demostrado que este estimador
- no est sesgado, y ahora calculamos su varianza:
Z W
(3.9)
V(b) = V
z * 2m
zn)
ti* ,
a2
z*
/
i
En consecuencia, la varianza de este estimador es una funcin de dos
componentes. En primer lugar, cuanto ms aleatoria sea cada unidad en
nuestros datos (la mayor es a2), ms variable ser nuestro estimador b, y
esto no debera sorprendernos. Adems, cuanto mayor sea la varianza ob
servada en la variable explicativa j Z ^ j ' menos variable ser nuestra es
timacin de b. En el caso extremo de que no haya variabilidad en X, nada
podr ayudarnos a estimar el efecto que tienen los cambios producidos en
la variable explicativa sobre la dependiente, y, en este ejemplo, la frmula
pronosticar una varianza infin ita (incertidumbre completa). De manera
ms general, este componente indica que la eficiencia es mayor cuando,
en la variable explicativa, tenemos datos que proceden de una gama de
valores ms amplia. Por tanto, lo ms habitual es que sea mejor evaluar |
nuestras hiptesis causales en tantas situaciones diferentes como sea po
sible. Se puede pensar en este ltimo asunto como si consistiera en trazar
una lnea utilizando una regla, dos puntos sobre una pgina y poco pulso.
Si los dos puntos estn muy juntos (X tiene una pequea varianza), los
errores que se registren al colocar la regla sern mucho mayores que si es
tuvieran ms separados (situacin en la que X tiene una varianza grande).
i
una teora (verificacin) y desmentirla (falsacin). Lo primero es prctica

mente irrelevante, mientras que lo segundo es la clave de la ciencia. Popper
cree que una teora, una vez que se enuncia, pasa a convertirse de inmedia
to en parte integrante del cuerpo de conocimientos cientficos aceptados.
Al ser generales las teoras y especficas las hiptesis, las primeras impli
can, tcnicamente, la existencia de un nmero infinito de las segundas. Sin
embargo, slo es posible someter a pruebas empricas a un nmero limitado
de hiptesis. En este sentido, las teoras no son verificables porque nunca
podemos comprobar todas sus consecuencias observables (Popper, 1968,
p. 252). Al comprobar cada hiptesis se puede demostrar que es coherente
con la teora, pero un determinado nmero de resultados empricos cohe
rentes no cam biarn nuestra opinin, ya que la teora sigue constituyen
do un conocimiento cientfico aceptado. Por otra parte, si se demuestra que
una sola hiptesis es incorrecta y, por tanto, que no se ajusta a la teora, sta
ser falsada y dejar de pertenecer al bagaje del conocimiento humano.
Por lo tanto, la sucesin de comprobaciones no altera en absoluto la posi
cin de ninguna hiptesis, pero el fracaso de una sola de esas pruebas s
puede tener muchas consecuencias (Miller, 1988, p. 22). Popper no pre
tenda que la falsacin fuera un concepto determinista y reconoca que toda
inferencia emprica es, en cierto modo, incierta (Popper, 1982). En su anli
sis del desmentido escribi que aunque se admita la asimetra [entre falsa
cin y verificacin], sigue siendo imposible, por varias razones, que cual
quier sistema terico sea falsado de manera concluyente (Popper, 1969,
p. 42).
Las ideas de Popper nos parecen fundamentales para form ular teoras.
Siempre hay que disearlas de manera que puedan ser falsadas y tambin
debemos aprender de la insistencia de Popper en el carcter provisional de
toda ellas. Sin embargo, para evaluar las teoras existentes en las ciencias
sociales no resulta tan significativa la asimetra entre verificacin y falsa
cin. Ninguna de ellas contribuye a nuestro conocimiento cientfico. En
cierto sentido general, la cuestin no es tanto si una teora es o no falsa
casi todas las teoras sociales interesantes cuentan al menos con una
consecuencia observable que parece equivocada , sino en qu medida
nos ayuda dicha teora a explicar el mundo. Si siguiramos la regla de
Popper, las teoras que se basan en el supuesto de la eleccin racional hu
bieran sido rechazadas hace tiempo, ya que han sido falsadas en muchos
ejemplos especficos. Sin embargo, los cientficos sociales optan con fre
cuencia por mantener este supuesto, convenientemente m odificado, por
que les concede un poder considerable en muchas clases de problemas de
investigacin (vase Cook y Levi, 1990). Lo mismo puede decirse de casi
cualquier otra teora social de inters. De hecho, en las ciencias sociales,
intentar falsar teoras es buscar los lmites de su aplicabilidad. Aprende
mos cuando alguna consecuencia observable indica que la teora no se
cumple y tambin cuando funciona correctamente.
Para los cientficos (y especialmente para los sociales) que evalan teo
ras formuladas con propiedad, la asimetra fundamental de Popper resulta
prcticamente irrelevante. O Hear (1989, p. 43) hizo una afirmacin sim i
lar acerca de la aplicacin de las ideas de Popper a las ciencias fsicas:
Popper siempre suele hablar teniendo en mente explicaciones de teoras universales.
Pero hay que insistir una vez ms en que proponer y com probar teoras universales es
slo uno de los objetivos de la ciencia. Puede que, debido a condiciones que han varia
do considerablem ente a lo largo del tiem po y el espacio, no haya teoras universales
verdaderas, y sta es una posibilidad que no podem os subestimar. Sin em bargo, aunque
asi fuera, la ciencia an podra cumplir m uchos de sus objetivos, al dam os conocim ien
tos y hacer verdaderas predicciones acerca de las condiciones que constituyen y rodean
nuestro restringido m bito espacio-temporal.
Seguramente, esta misma idea puede aplicarse an con ms razn a las

ciencias sociales.
Adems, la evaluacin que hace Popper de las teoras no establece una
distincin fundamental entre las que acaban de formularse y las que ya han
resistido numerosas pruebas empricas. Cuando estamos comprobando la
distincin determinista entre verdad o ficcin en una teora universal (de
la cual no hay ejemplos interesantes), la idea de Popper es apropiada, pero
no resulta til para lo que nosotros pretendemos, que es buscar los lmites
de aplicacin de una teora. Como hemos sealado muchas veces en este li
bro, propugnamos que todas las inferencias relativas a hiptesis especficas
se hagan planteando el mejor clculo (una estimacin) y midiendo su incer
tidumbre. La conclusin a la que lleguemos respecto a si la inferencia con
cuerda o no concuerda con nuestra teora, tendr el mismo efecto sobre la
fe que tenemos en sta. Tanto la coherencia como la incoherencia aportan
informacin sobre la verdad de la teora y tienen que influir en la certidum
bre de nuestras creenciasl3.
Pensemos en la hiptesis de que las campaas electorales de los dem
cratas y de los republicanos durante las elecciones presidenciales estadou
nidenses tienen poco impacto global sobre su resultado. Esta hiptesis im
plica otras muchas de carcter ms especfico, como las que propugnan que
los anuncios televisivos y radiofnicos, as como los debates, tampoco tie
nen mucha influencia en los votantes. En realidad, cualquier comprobacin
de la teora debe contrastar una de estas hiptesis. Hay una comprobacin de
esta teora que ha demostrado que se pueden hacer pronsticos ms preci
sos del resultado utilizando las variables de que se dispone nicamente al
hacerse las convenciones y, por lo tanto, antes de las campaas (Gelman y
King, 1993). Esta comprobacin concuerda con la teora (si podemos pre
decir las elecciones antes de la campaa, no puede decirse que sta tenga
mucha importancia), pero no la verifica completamente. Puede que haya al
gn aspecto de la campaa que tenga alguna pequea influencia que expli
que ciertos errores de pronstico (y pocos investigadores dudan de ello).

Adems, la prediccin puede haber sido fruto de la suerte o quiz, en los
aos en que se han recogido los datos, las campaas no hayan incorporado
ninguna tctica innovadora (y, por tanto, impredecible).
Podramos llevar a cabo otras muchas comprobaciones, introduciendo en
el modelo de pronstico variables que midieran aspectos de la campaa,
como la cantidad relativa de espacios televisivos o radiofnicos, la elocuen
cia de los candidatos y la evaluacin de los resultados de los debates. Si to
das estas hiptesis no tuvieran ningn efecto, Popper dira que nuestra opi
nin no cambia de forma reseable, de manera que la teora de que las
campaas presidenciales no tienen impacto se mantendra. De hecho, si hi
ciramos mil comprobaciones similares y todas concordaran con la teora,
sta todava podra estar equivocada, ya que no hemos puesto a prueba to
das las infinitas variables posibles que miden una campaa. De manera
que, aunque dispusiramos de muchos resultados coherentes con la teora,
an podra ser cierto que las campaas de elecciones presidenciales influ
yen en el comportamiento del votante.
Sin embargo, si se demostrara que un nico acontecimiento de la cam
paa como una importante acusacin de comportamiento inmoral tie
ne alguna influencia en los votantes, la teora quedara falsada. Segn
Popper, aunque esta teora no se falsara de forma concluyente (lo cual reco
noci que era imposible), aprenderamos ms de esta manera que con mil
comprobaciones que concordaran con ella.
Para nosotros, no es as como se hacen las ciencias sociales o como de
beran hacerse. Despus de hacer mil comprobaciones a favor o en contra,
no prescindiramos de la teora que afirm a que las campaas no tienen im
pacto, sino que la modificaramos para decir, quiz, que las campaas nor
males carecen de impacto, a no ser que haya pruebas concluyentes de que
uno de los candidatos se ha comportado de forma inmoral. Sin embargo,
como esta modificacin hara ms restrictiva nuestra teora, necesitaramos
evaluarla con un nuevo conjunto de datos antes de confiar en su validez. La
teora seguira siendo convincente, y, de alguna manera, con cada nueva
evaluacin empirica sabramos ms sobre sus lmites. Cada prueba que
pasa una teora influye tanto en la estimacin de su validez como en la in
certidumbre de ese clculo, y el impacto puede alcanzar nuestro grado de
inters en que la teora funcione.
En el anlisis anterior hemos planteado una forma importante de abor
dar las teoras y tambin hicimos una advertencia: nuestro enfoque subraya
el carcter contingente de teoras e hiptesis. M s adelante, propugnamos
que se intente dar a ambas una aplicacin amplia. sta es una estrategia til
para investigar, pero siempre debemos recordar que no es probable que las
teoras sociales tengan una aplicacin universal. Las teoras que se dicen
aplicables a cualquier circunstancia, en cualquier lugar algunas variantes
del marxismo y de la teora de la eleccin racional son ejemplos de esta
pretensin , o bien se presentan de forma tautolgica (en cuyo caso ni son

verdaderas ni falsas) o de m anera que es posible desmentirlas emprica
mente (en cuyo caso descubriremos que hacen predicciones incorrectas).
Las teoras sociales ms tiles son vlidas en determinadas condiciones (en
campaas electorales en las que no hay pruebas concluyentes de comporta
miento inmoral por parte de ningn candidato) o en ciertos contextos (en
pases industrializados, pero no en los menos desarrollados; en las campa
as para elegir la Cmara de Representantes, pero no en las del Senado).
Siempre hay que intentar concretar los lmites de aplicacin de la teora o
hiptesis. El paso siguiente es preguntarse: por qu existen esos limites?,
qu tienen las elecciones al Senado que invalidan las generalizaciones
aplicables a las de la Cmara de Representantes?, qu hace que la indus
trializacin transforme los efectos causales?, qu variable falta en nuestro
anlisis que podra generar una teora de aplicacin ms general? Al hacer
nos estas preguntas traspasamos los lmites de nuestra teora o hiptesis
para mostrar qu factores hay que considerar con el fin de ampliar su cam
po de accin.
Sin embargo, hay que aadir una advertencia. Hemos sealado que el
proceso de evaluacin de teoras e hiptesis es flexible: ciertas comproba
ciones empricas no las confirm an ni desmienten definitivamente. Cuando
una prueba emprica no concuerda con nuestras expectativas tericas, no ti
ramos la teora inmediatamente por la borda. Podemos hacer varias cosas:
llegar a la conclusin de que quiz los datos slo son pobres por casualidad
o ajustar lo que consideramos que es el mbito de aplicacin de una teora o
hiptesis aunque no se sostenga en un caso determinado y, en virtud de ese
ajuste, seguir aceptando esa elaboracin terica. La ciencia avanza median
te tales ajustes, pero stos pueden ser peligrosos. Si los llevamos demasiado
lejos haremos que nuestras teoras sean invulnerables al desmentido. En
consecuencia, hay que tener mucho cuidado al adaptar teoras para que
concuerden con nuevos datos y no hay que forzarlas ms all de lo plausi
ble, aadiendo numerosas excepciones y casos especiales.
Si nuestro estudio desmiente algn aspecto de la teora podemos optar
por mantenerla, pero incorporando una excepcin. Este procedimiento re
sulta aceptable siempre y cuando se reconozca el hecho de que estamos
reduciendo las pretensiones de la teora. De este modo, sta ser menos va
liosa porque explica menos; segn nuestra terminologa, tendremos menos
control sobre el problema que queremos com prenderl4. Adems, este enfo
que puede producir una teora que no sea ms que una mezcolanza de di
versas excepciones y conclusiones. En algn momento hay que estar dis
puesto a prescindir por com pleto de ciertas teoras e hiptesis. Si hay
demasiadas excepciones, la teora debe rechazarse. De manera que, en s
misma, la concisin, que es la preferencia normativa p or teoras que tienen
pocos componentes, no siempre es aplicable. Lo nico que necesitamos es
nuestro concepto general de maximizacin del control, del que se deriva
completamente la idea de concisin cuando es til. Pensar que, en gran me

dida. la ciencia consiste en explicar muchos fenmenos mediante unos po
cos pone de manifiesto que las teoras de pocos componentes no son mejo
res ni peores. Para maximizar el control hay que intentar formular teoras
que expliquen lo ms posible con el menor nmero de elementos. A veces
esta formulacin se logra mediante la concisin, pero otras no. Podemos
pensar en ejemplos en los que una teora ligeramente ms complicada ex
plica una parte del mundo mucho ms amplia. En tal situacin, seguramen
te utilizaramos una teora poco concisa, ya que sta maximiza mejor el
control que la ms concisal5.
5.2
Regla 2: construir teoras que tengan coherencia interna
Una teora sin coherencia interna no slo es falsable: es falsa. De hecho,

sta es la nica situacin en la que se conoce la veracidad de una teora sin
necesidad de datos empricos: si tiene dos o ms componentes que generan
hiptesis contradictorias, no hay datos del mundo emprico que puedan sos
tenerla. No tendra que ser polmico garantizar la coherencia interna de las
teoras, pero esa cualidad suele ser difcil de alcanzar. Se puede lograr me
diante modelos formales, matemticos. Es en la economa donde ms desa
rrollada est la creacin de modelos form ales, aunque es cada vez ms ha
bitual en sociologa, psicologa, ciencia poltica, antropologa y en otras
disciplinas (vase Ordeshook, 1986). Los politlogos han desarrollado nu
merosas teoras esenciales a partir de modelos matemticos en reas como
la eleccin racional, la social, los modelos electorales espaciales, la econo
ma pblica o la teora de juegos. Con estas investigaciones se han logrado
importantes resultados y una gran cantidad de hiptesis plausibles. Una de
las aportaciones ms valiosas de los modelos formales es su capacidad para
poner de manifiesto la incoherencia de teoras planteadas mediante la ex
presin verbal.
Sin embargo, al igual que ocurre con otras hiptesis, los modelos forma
les no son explicaciones verificadas si no evalan empricamente sus pre
dicciones. En la investigacin social, la formalizacin nos ayuda a razonar
con ms claridad y garantiza realmente que nuestras ideas tengan coheren
cia interna, pero no resuelve los problemas de evaluacin emprica de las
teoras. En las ciencias sociales, los supuestos de los modelos formales sue
len ser sencillas expresiones matemticas o maneras de garantizar que se
puede llegar a un equilibrio. Hay pocos autores que crean que el mundo po
ltico es matemtico en la misma medida en que lo creen algunos fsicos
del mundo que ellos analizan. Por lo tanto, estos modelos formales no son
ms que modelos: abstracciones que hay que diferenciar del mundo que es
tudiamos. De hecho, algunas teoras formales hacen predicciones a partir
de supuestos enormemente simplificadores y a veces no tienen gran valor
emprico. Slo desde un punto de vista abstracto son ms precisas que las
teoras sociales no formales: sus predicciones acerca del mundo real no son
ms especficas porque sus condiciones no se corresponden, ni siquiera de
forma aproximada, con las reales.
Simplificar es esencial para los modelos formales, al igual que lo es en
toda investigacin, pero hay que tener cuidado con las inferencias que se
extraen de la realidad a partir de esos modelos. Por ejemplo, presuponer
que todas las variables omitidas no tienen consecuencias sobre los resulta
dos puede ser muy til al construir modelos, y, precisamente, esto es lo que
hacemos en muchos de los modelos formales cualitativos de este libro. Es
tos supuestos no suelen justificarse por ser rasgos del mundo; slo se dice
que son instrumentos tiles para construir modelos a partir de l. En conse
cuencia, sus resultados se refieren concretamente a situaciones en la que ta
les variables omitidas son irrelevantes y pueden parecerse o no a los del
mundo real. No tenemos que comprobar el supuesto para elaborar el m ode
lo y sus consecuencias, pero s es esencial que lo pongamos a prueba du
rante la evaluacin emprica. Para que el modelo formal sea til, el supues
to no tiene que ser correcto, pero no podemos emplear en la elaboracin de
diseos de investigacin em prica supuestos tericos no comprobados o
justificados. Por el contrario, para que las teoras formales sean tiles en
los estudios empricos, suele ser preciso complementarlas con otros ele
mentos.
Un buen modelo formal debe ser abstracto, de manera que los rasgos
clave del problema se pongan de manifiesto y pueda aplicarse fcilmente el
razonamiento matemtico. As, consideremos un modelo formal sobre las
consecuencias de la representacin proporcional en los sistemas de partidos
que implique que la primera fragmenta los segundos. La variable causal
clave es el ordenamiento electoral, o sea, si es un sistema de representacin
proporcional en el que los partidos obtienen escaos en funcin del porcen
taje de votos que logran o si es un sistema mayoritario en el que slo hay un
ganador en cada circunscripcin. La variable dependiente es el nmero de
partidos polticos, que suele denominarse grado de fragmentacin del sis
tema de partidos. La hiptesis principal es que los ordenamientos electo
rales que se basan en la representacin proporcional generan ms partidos
polticos que los de tipo mayoritario. Para una mayor sencillez, este modelo
podra incluir nicamente variables que midieran algunos rasgos esenciales
del sistema electoral y tambin el grado de fragmentacin del de partidos.
El modelo slo generara una hiptesis, no una conclusin, acerca de la re
lacin que existe entre la representacin proporcional y la fragmentacin
del sistema de partidos en el mundo real, y esa hiptesis habra que com
probarla utilizando mtodos cualitativos o cuantitativos empricos.
Sin embargo, aunque una de las consecuencias de este modelo sea que la
representacin proporcional fragmenta los partidos polticos y aunque no se
utilizaran otras variables en el modelo, en un anlisis emprico sera absurdo
dos. U n estudio que indique que los pases que utilizan la

representacin proporcional tienen sistemas de partidos ms fragmentados
estar dejando de lado el problema de la endogeneidad (apartado 4 del cap
tulo 5), puesto que quiz los pases que instauran sistemas electorales de tipo
proporcional lo hagan precisamente porque ya tienen un sistema de parti
dos fragmentado. Del mismo modo, el sesgo de la variable omitida sera un
problema porque tambin es probable que los pases en los que existen pro
fundas divisiones raciales, tnicas o religiosas tengan un sistema de partidos
fragmentado y que su sistema electoral sea de tipo proporcional.
De este modo, parecen cumplirse las dos condiciones para que exista
sesgo de la variable omitida (apartado 2 del captulo 5): dicha variable se
correlaciona tanto con la explicativa como con la dependiente, y, por tanto,
todo anlisis que prescinda de la variable relativa a la divisin social produ
cir inferencias sesgadas.
Tendra que quedar claro que los modelos formales son extremadamente
tiles para aclarar nuestras ideas y para desarrollar teoras con coherencia
interna. Quiz slo un modelo formal pueda poner de manifiesto y corregir
las incoherencias internas de muchas teoras especialmente complejas que
se expresan con palabras. Al mismo tiempo, no es probable que esas elabo
raciones tericas proporcionen modelos correctos para la comprobacin
emprica, y podemos asegurar que no sirven para evitar ninguno de los pro
blemas empricos de la inferencia cientfica.
u tiliz a r s o la m e n te
5.3
Regla 3: seleccionar cuidadosamente las variables dependientes
Es evidente que al investigar todo debe hacerse con cuidado, pero elegir las
variables, principalmente las dependientes, es una decisin especialmente
importante. A continuacin damos tres indicaciones (basadas en errores
que se cometen con demasiada frecuencia en escritos cuantitativos y cuali
tativos):
En primer lugar, las variables dependientes deben ser realmente depen
dientes. Elegir una variable dependiente que en realidad produce cambios
en las explicativas es un error muy habitual. Analizamos las consecuencias
especficas de la endogeneidad y ciertas maneras de esquivarla en el aparta
do 4 del captulo 5, pero hay que subrayar aqu este problema porque la for
ma ms fcil de evitarlo es elegir variables explicativas claramente exgenas y variables dependientes manifiestamente endgenas.
En segundo lugar, no hay que seleccionar observaciones que estn basa
das en la variable dependiente para que sta se mantenga constante. Esto
tambin puede parecer bastante obvio, pero hay investigadores que suelen
elegir observaciones en las que la variable dependiente no cambia en abso
luto (como en el ejemplo analizado en el apartado 3.1 del captulo 4). Aun
que el diseo de investigacin no se haga con el propsito de que esta va
riable se mantenga constante, puede resultar que lo sea. Sin embargo, esto
no supondr un problema a menos que hayamos predeterminado tal situa
cin mediante la seleccin de criterios. Por ejemplo, supongamos que se se
leccionan observaciones en dos categoras de una variable explicativa y que
resulta que la dependiente es constante en los dos grupos. ste no ser ms
que un caso en el que el efecto causal estimado es cero.
Para terminar, tenemos que elegir una variable dependiente que repre
sente la variacin que queremos explicar. Aunque esta indicacin parezca
evidente, el asunto es bastante delicado, como pone de manifiesto Stanley
Lieberson (1985, p. 100):
Un sim ple experim ento gravitatorio, presente en el Ontario Science Centre de Toronto,
inspira un ejemplo heurstico. En este montaje se deja caer una moneda y una pluma
dentro de un tubo en el que se ha hecho el vaco, y ambas llegan al fondo casi al mismo
tiem po. Como el vaco no es total, es de suponer que la moneda llegar al fondo un po
quito antes que la pluma. En cualquier caso, imaginmonos un estudio en el que se de
jen caer varios objetos, sin que se tenga el control tan frreo que otorga el vaco (que es
lo que ocurrira en una investigacin social no experimental). Si los cientficos sociales
perciben que varia el tiempo que tarda cada objeto en llegar al suelo, lo normal es que
quieran saber qu caractersticas determ inan esa diferencia. Es probable que rasgos
como la densidad y la forma de los objetos influyan en la velocidad de la cada si no
existe el vaco. Si el investigador social tiene suene, la conjuncin de esos factores ex
plicar completamente las diferencias de velocidad que presenta la cada de cada uno de
los objetos y, si es as, se pondr muy contento porque se habrn explicado todas las va
riaciones que hay entre un objeto y otro. Mediante el razonamiento habitual en las cien
cias sociales, el investigador llegar a la conclusin de que se entiende completamente
el fenmeno porque se han explicado todas las diferencias que existen entre los objetos
que se estudian. Seguramente, debe de haber algo que falla en nuestros procedimientos
si podemos abordar este problem a sin siquiera referirnos a la gravedad.
En este ejemplo, los procedimientos del investigador slo seran errneos

si la variable ms interesante fuera la gravedad. Si sta fuera la variable ex
plicativa que nos preocupara, el experimento no la cambiara (ya que slo
ocurre en un lugar) y, por tanto, no nos dara informacin sobre ella. Sin
embargo, el experimento que describe Lieberson tendra un mayor inters si
quisiramos comprender las variaciones que se producen en el tiempo que
tardan diferentes objetos en tocar el suelo, cuando se dejan caer desde una
misma altura a diferentes niveles de presin del aire. De hecho, aunque lo
supiramos todo de la gravedad, este experimento nos seguira dando una
informacin valiosa, pero si, como presupone el autor, lo que nos interesa
realmente es hacer una inferencia sobre el efecto causal de la gravedad, ne
cesitaramos una variable dependiente que cambiara nuestras observaciones
cada vez que variara el grado de atraccin de la gravedad. Del mismo
modo, en las ciencias sociales hay que asegurarse de que realmente nos in
teresa ms nuestra variable dependiente que los factores contextales que el

diseo de investigacin mantiene constantes.
En consecuencia, para obtener una estimacin no sesgada del impacto
de las variables explicativas es preciso que todo el abanico de posibles va
riaciones de la variable dependiente pueda ser resultado del experimento.
Poner lmites artificiales al abanico de posibilidades de la variable depen
diente o a sus valores genera lo que definimos (en el apartado 3 del captu
lo 4) como sesgo de seleccin. Por ejemplo, si nos interesan las condicio
nes que propician el estallido de conflictos armados, no podemos elegir
slo observaciones en las que se sea precisamente el resultado. Tal estudio
podra damos mucha informacin sobre cmo varan las observaciones de
conflictos armados (al igual que el experimento de la gravedad nos infor
maba de las que se registran en la velocidad con que caen diversos objetos),
pero no nos permitira examinar las causas de esos conflictos. Si esto es lo
que queremos entender, ser mejor utilizar un diseo en el que seleccione
mos observaciones a partir de nuestras variables explicativas, dejndole a la
dependiente la posibilidad de abarcar todas las situaciones posibles: en las
que hay poco o ningn conflicto, en las que amenaza con producirse o en
las que realmente estalla.
5.4
Regla 4: maximizar lo concreto
La cuarta regla, que surge de nuestra insistencia en la falsabilidad, la cohe

rencia y la variacin de la variable dependiente, es maximizar lo concreto.
Siempre que sea posible, hay que elegir conceptos observables en vez de no
observables. En las teoras de las ciencias sociales se utilizan con frecuen
cia conceptos abstractos, no observados, como los de utilidad, cultura, in
tenciones, motivaciones, identificacin, inteligencia o inters nacional.
Pueden ser muy tiles para form ular teoras, pero tambin una carga para la
evaluacin emprica de teoras e hiptesis, a menos que se puedan definir
de manera que sea posible observarlos y medirlos o, al menos, hacer ambas
cosas con sus consecuencias. Plantear explicaciones mediante ideas como
cultura, inters nacional o utilidad resultar sospechoso, a menos que tales
conceptos se puedan calibrar al margen de la variable dependiente que esta
mos explicando. Cuando se utilizan tales trminos en las explicaciones, es
fcil caer en la tautologa o no presentar consecuencias observables y diferenciadoras. La accin de un individuo o de una nacin puede explicarse a
partir de un deseo de maximizar la utilidad, materializar unas intenciones o
trabajar en beneficio del inters nacional; pero la prueba de que esa accin
ha logrado tales fines residir en el hecho de que el actor o la nacin hayan
participado en ella. El investigador es responsable de formular una teora
que especifique con claridad y precisin qu consecuencias observables
van a indicar su veracidad y a distinguirla de otras alternativas lgicas.
Con esta regla no queremos decir en modo alguno que conceptos como
los de intencionalidad o motivacin carezcan de importancia. Slo preten
demos sealar que, en una ciencia emprica como la nuestra, la principal
norma explicativa tiene que ser la verificacin o falsacin emprica. Siem
pre ser ms difcil y menos provechoso buscar pruebas empricas para
conceptos abstractos, inconmensurables e inobservables que para muchas
ideas especficas y concretas concebidas de manera imperfecta. Cuanto
ms abstractos sean nuestros conceptos, ms difusas sern sus consecuen
cias observables y menos posibilidades habr de falsar la teora.
Los investigadores suelen utilizar la siguiente estrategia. Parten de algn
concepto abstracto como los mencionados anteriormente, aceptan que no
pueden medirlo de forma directa y, en consecuencia, sealan indicadores
especficos de dicho concepto que s pueden medirse y los utilizan en sus
explicaciones. La eleccin de ese indicador concreto se basa en que es ob
servable. A veces, es lo nico observable (por ejemplo, slo hay datos dis
ponibles de este fenmeno o es el nico tipo de acontecimiento histrico
del que se guarda informacin). Este aspecto de la investigacin emprica
es perfectamente respetable y, de hecho, suele ser necesario.
Sin embargo, tiene una parte mala, pues con frecuencia el indicador es
pecfico est lejos del concepto original y slo se relaciona con l de forma
indirecta e incierta. Quiz no sea en absoluto un indicador vlido del con
cepto abstracto, pero el investigador, despus de pedir perdn rpidamente
por el desfase que hay entre uno y otro, adjudica al primero el nombre del
segundo y sigue adelante como si estuviera midiendo el concepto directa
mente. Por desgracia, esta objetualizacin es frecuente en las ciencias so
ciales, quiz ms en la investigacin cuantitativa que en la cualitativa, pero
demasiado habitual en ambas. Por ejemplo, el investigador utiliza las cifras
que tiene sobre correos, com ercio, turismo e intercambio de estudiantes
para elaborar un ndice de integracin social en Europa; realiza una en
cuesta para averiguar si a los entrevistados les preocupa ms el medio am
biente que ganar dinero, clasificndolos despus com o materialistas o
postmaterialistas, u observa que las instituciones federales estadouniden
ses se diferencian entre s por el perodo medio de permanencia de los tra
bajadores en sus empleos y con este dato mide la institucionalizacin de
dichos organismos.
Aqu tenemos que dejar claro lo que queremos decir. El desfase entre
concepto e indicador es inevitable en gran parte de los estudios sociales,
pero hay buenas razones para utilizar conceptos generales en vez de espec
ficos: nos permiten ampliar nuestro marco de referencia y la aplicabilidad
de las teoras. De este modo, podemos referimos al poder legislativo en vez de
utilizar categoras ms estrechas, como parlamento, o instituciones concre
tas, como el Bundestag alemn. Podemos hablar de rganos decisorios
en lugar de legislativo cuando queremos que nuestra teora sea aplicable a
una gama de instituciones an ms amplia (de hecho, en el siguiente apar
tado lo recomendamos). La ciencia se basa en estas clasificaciones abstrac

tas, si no estaramos volviendo al resumen de los pormenores histricos.
Sin embargo, nuestros trminos abstractos y generales deben relacionarse
en algn m omento con conceptos especficos y mensurables que hagan
posible la com probacin emprica. Esta relacin y la distancia que se
recorre para establecerla siempre hay que tenerla en mente y hacerla ex
plcita. Adems, el problema terico que se plantee debe justificar el deter
minado nivel de abstraccin elegido, que, a su vez, tiene que ayudar a rela
cionar una investigacin concreta en la que un determinado indicador es
el actor clave con un problema general. Para nosotros ser una responsa
bilidad ver que se llevan a cabo nuevas investigaciones, que utilizan otros
indicadores especficos, con el fin de reforzar el supuesto de que los nues
tros estn realmente relacionados con un concepto ms amplio. Los trm i
nos abstractos anteriores integracin social, postm aterialism o e
institucionalizacin pueden medirse de forma razonable con los indi
cadores especficos indicados. No negamos que haya que dar un salto desde
el indicador especfico hasta el concepto abstracto general en las ciencias
sociales esto es preciso para continuar la investigacin , pero hay que dar
lo con cuidado, justificndolo y recordando siempre de dnde se parte.
Por lo tanto, no nos oponemos a las abstracciones, pero pedimos que el
lenguaje de la investigacin social sea lo ms concreto y preciso posible.
Si, como suele ocurrir en las ciencias sociales, no hay ms remedio que uti
lizar elaboraciones tericas inobservables, al menos tendremos que elegir
ideas con consecuencias observables. Por ejemplo, la inteligencia nunca
se ha observado directamente, pero no deja de ser por ello un concepto muy
til. Existen numerosos tests y otras formas de evaluar sus implicaciones.
Por otra parte, si podemos elegir entre institucionalizacin de la presiden
cia y nmero de empleados de la Casa Blanca, suele ser mejor quedarse
con lo segundo. Podemos sealar que este concepto se relaciona con el de
institucionalizacin de la presidencia que es ms general , pero no hay
que concretar el concepto limitado hasta el punto de considerar que es idn
tico al ms amplio. Adems, si nmero de empleados significara institucio
nalizacin, tendramos que poder encontrar otras medidas de este segundo
concepto que respondieran a las mismas variables explicativas que el pri
mero. Ms adelante analizaremos cmo se maximiza el control amplian
do las variables dependientes.
Nuestra defensa de la concrecin se extiende en general a las palabras
que utilizamos para describir nuestra teora. Si el lector tiene que pasar mu
cho tiempo averiguando los significados precisos de una teora, sta tendr
menos utilidad. Al describir teoras, hay que reducir al mnimo la polmica
sobre nuestras intenciones. Para lograr esta mayor especificidad, aunque no
estem os llevando a cabo investigacin em prica, hay que dedicar cierto
tiempo a considerar, explcitamente, las consecuencias observables de la teo
ra e incluso los posibles proyectos de investigacin que podramos realizar.
Cuanto ms impreciso sea nuestro lenguaje, menos posibilidades habr de

que nos equivoquemos, pero tambin de que nuestro trabajo sea til. Es
mejor equivocarse que ser impreciso.
En nuestra opinin, al presentar la lgica de un proyecto de investiga
cin, defender su importancia y describir los acontecimientos en detalle,
hay que cultivar una redaccin elegante (y disfrutarla), prctica que consti
tuye un bien escaso en las ciencias sociales. El aburrimiento nunca ha he
cho avanzar ninguna ciencia. Sin embargo, cuando el objeto de estudio se
transforma en una inferencia causal o descriptiva, en la que nos interesan
observaciones y generalizaciones que esperamos se mantengan, es preciso
utilizar una terminologa y una forma de pensar concretas y especficasl6.
5.5
Regla 5: formular teoras de forma tan incluyente

como sea posible
Aceptando los condicionantes que implica asegurarse de que una teora es

falsable y de que maximizamos la concrecin, hay que formular tal teora
de manera que explique una parte del mundo lo ms grande posible. Nos
damos cuenta de que hay cierta tensin entre esta quinta regla y el hecho de
que antes instramos a la concrecin. Slo podemos decir que ambos obje
tivos son importantes, aunque en muchos casos pueden contraponerse y hay
que tenerlos presentes para llegar a un equilibrio.
Por ejemplo, no debemos presentar nuestra teora como si slo fuera
aplicable al Bundestag alemn, cuando hay razones para creer que pudiera
serlo en todo poder legislativo independiente. Para formularla no es preciso
dar pruebas de todas sus consecuencias, siempre que se haga una estima
cin razonable de la incertidumbre que conlleva. Puede que hayamos dado
pruebas consistentes de que la teora es aplicable al Bundestag alemn.
Aunque no las tengamos de que funciona en otros mbitos, tampoco las te
nemos de que no sea as. Un marco de referencia ms amplio resulta til si
no perdemos de vista el hecho de que es necesario evaluar su aplicabilidad.
De hecho, expresarla en relacin a un marco de referencia hipotticamente
ms amplio podra obligam os a pensar en qu rasgos estructurales de la
teora la haran aplicable o no a otros poderes legislativos independientes.
Sera adecuada, por ejemplo, para el Senado estadounidense, cuyos inte
grantes no se eligen de una sola vez sino de manera escalonada, para la
asamblea de New Hampshire, que es mucho ms numerosa en relacin al
nmero de electores, o para la Cmara de los Comunes britnica, en la que
es mucho ms fuerte el voto de partido? Presentar qu rasgos sistemticos
de la teora creemos que la hacen aplicable en diferentes reas es un impor
tante ejercicio. Quiz as nos demos cuenta de que estamos equivocados,
pero esto es bastante mejor que no formular la teora con suficiente preci
sin desde el principio.
Puede que parezca que esta regla entra en conflicto con la preferencia
que mostr Robert Merton ([1949], 1968) por las teoras de alcance m e
dio, pero incluso una lectura rpida de este autor nos indicar que no es
as. Merton estaba reaccionando contra una tradicin sociolgica en la que
haba teoras, como la de la accin de Parsons, que se formulaban de
manera tan amplia que no podan falsarse. En la ciencia poltica, la teora
de sistemas de Easton (1965) se halla en la misma tradicin (vase Ecks
tein, 1975, p. 90). ste es un ejemplo del tipo de crticas que a Merton
([1949], 1968, p. 43) le gustaba hacer: Por lo que se ve, la teora de la fi
jacin de los roles no concuerda con orientaciones tericas tan generales
como el m arxism o, el anlisis funcionalista, el conductism o social, la
sociologa integral de Sorokin o la teora de la accin de Parsons. Merton
no critica la teora de la fijacin de los roles, que consideraba de alcance
medio, sino que ataca las amplias orientaciones tericas con las que con
cuerda casi cualquier teora ms especfica u observacin emprica. Merton
est a favor de las teoras de alcance medio, pero creemos que estara de
acuerdo en que hay que formular teoras de la manera ms general posible,
siempre que sigan siendo falsables y concretas. Para retomar un concepto
que hemos mencionado anteriormente, enunciar teoras de este modo es
maximizar el control. Si la teora puede comprobarse y es evidente que el
peligro de las ms generales es que quiz estn expresadas de manera que
no se pueda , cuanto ms general sea, mejor. O sea, a mayor amplitud,
ms control.
4.
Precisar qu va
a observarse
Hasta ahora hemos sealado cules son para nosotros las normas de la infe
rencia cientfica, segn se aplican tanto a la investigacin cualitativa como
a la cuantitativa (captulo 1), hemos definido la inferencia descriptiva (ca
ptulo 2) y aclarado lo que entendemos por causalidad e inferencia causal
(captulo 3). A continuacin, vamos a plantear problemas especficos del
diseo de investigaciones. A partir de ahora, para ilustrar nuestros argu
mentos utilizaremos muchos ejemplos tomados de la bibliografa existente
o elaborados de forma hipottica. El presente captulo se ocupa de cmo te
nemos que seleccionar los casos u observaciones para nuestro anlisis. Es
tas decisiones tienen gran importancia, ya que una mala seleccin de casos
puede impedir que, en estadios posteriores, la ms imaginativa de las ini
ciativas logre extraer inferencias causales vlidas. En el captulo 5 seala
mos algunas de las principales causas de sesgo e ineficiencia que habra
que evitar o, al menos, entender para poder aquilatar nuestras estimaciones.
Posteriormente, en el captulo 6, proponemos algunas ideas para incremen
tar las observaciones disponibles, las cuales suelen encontrarse ya en los
datos que hemos recogido. A continuacin, retomamos un asunto que se in
trodujo en el captulo 1: la necesidad de extraer la mayor cantidad posible
de consecuencias observables de nuestras teoras y, en la medida de lo posi
ble, de comprobar cuantas ms mejor.
En el apartado 3.2 del captulo 3 analizamos la independencia condi
cional: supuesto que seala que se eligen las observaciones y se asignan
los valores de las variables explicativas al margen de los de las dependien
tes. Por ejemplo, esta independencia se vulnera si las variables explicativas

se eligen en funcin de reglas que se correlacionan con las variables depen
dientes o si stas producen las explicativas. Es habitual que algunos cuantitativistas que trabajan con gran cantidad de observaciones utilicen la alea
toriedad en la seleccin de unidades y en la adjudicacin de valores a las
variables explicativas, para asegurarse de que se cumple el supuesto de
independencia condicional; despus utilizan mtodos estadsticos para miti
gar el problema fundamental de la inferencia causal. Por desgracia, selec
cionar observaciones y adjudicar valores de forma aleatoria tiene graves li
mitaciones en investigaciones con un n pequeo. Si estas estrategias no
resultan apropiadas, podemos lograr la homogeneidad de las unidades se
leccionando intencionadamente las observaciones (como se analiz en el
apartado 3.1 del captulo 3). En cierto sentido, este ltimo procedimiento es
nuestra ltima lnea defensiva si queremos crear las condiciones para la
extraccin de inferencias causales vlidas.
Recordemos la base del supuesto de homogeneidad de las unidades: si
dos unidades tienen el mismo valor de la variable explicativa principal, el
valor esperado de la dependiente ser el mismo. La versin ms estricta de
este supuesto implica, por ejemplo, que si al pulsar un interruptor se en
ciende una bombilla de 60 vatios, lo mismo ocurrir si se acciona un segun
do interruptor. En este ejemplo, la posicin del interruptor es la variable
explicativa clave, y la situacin de la luz (encendida o apagada) es la depen
diente. Segn el supuesto de homogeneidad de las unidades, la situacin es
perada de cada luz ser la misma siempre que los interruptores se encuen
tren en la m ism a posicin. La versin m enos estricta de este supuesto
que suele ser ms plausible pero igualmente aceptable es la del efecto
constante, en la que una variacin similar de los valores de la variable ex
plicativa en las dos observaciones conduce al mismo efecto causal en uni
dades diferentes, aunque puede que los niveles de dichas variables no sean
los mismos. Supongamos, por ejemplo, que en nuestros interruptores haya
tres posiciones y que midamos la variable dependiente segn el voltaje
generado. Si un interruptor pasa de estar apagado a bajo y el otro
de bajo a alto, se cum plir el supuesto del efecto constante si el
aumento de voltaje es igual en las dos habitaciones, aunque en una observa
cin vaya de 0 a 60 y en la otra de 60 a 120.
Cuando no se cumpla ni el supuesto de independencia condicional ni el
de homogeneidad de las unidades, habr graves problemas en la inferencia
causal. Sin embargo, stos sern an ms acusados de hecho, no podre
mos extraer inferencias causales en absoluto cuando nuestro diseo de
investigacin sea impreciso. Un diseo de investigacin preciso es el requi
sito imprescindible de la inferencia causal; de ah que en el apartado 1 de
este captulo comencemos por analizar diseos de investigacin imprecisos.
Despus, abordamos el problema del sesgo de seleccin que surge del no
cumplimiento de los supuestos de independencia condicional y de homoge
neidad de las unidades. En el apartado 2 estudiamos los lmites que tienen

la seleccin de observaciones y la asignacin de valores de forma aleatoria
a la hora de lograr la independencia condicional. En el apartado 3 subraya
mos los peligros que conlleva seleccionar casos intencionadamente a partir
de los valores de las variables dependientes y damos ejemplos de trabajos
en los que este sesgo de seleccin ha invalidado las inferencias causales.
Para terminar, en el apartado 4 proponemos de manera sistemtica formas
de lograr la homogeneidad de las unidades a travs de una seleccin de ca
sos intencionada, no slo con el fin de dar consejos sobre cmo hacer dise
os de investigacin ideales, sino para indicar cules son las alternativas
posibles cuando no se puede lograr esa situacin ptima.
Ahora merece una especial atencin el tema principal de este captulo:
los problemas que conlleva la seleccin de casos o de observaciones para el
anlisis. Como las denominaciones pueden ser confusas, es importante re
visar desde el principio algunas cuestiones terminolgicas. Con frecuencia,
cuando se analizan diseos de investigacin cualitativa, se habla de casos
como al referirse a los estudios de caso o al mtodo de los casos. Sin
embargo, la palabra caso suele utilizarse de manera ambigua, ya que
puede significar una sola observacin. Tal como se explic en el apartado 4
del captulo 2, una observacin se define como la medida que se toma de
una variable dependiente en una unidad e incluye informacin sobre los va
lores de las variables explicativas. Sin embargo, un caso tambin puede re
ferirse a una nica unidad en la que se midan muchas variables, o incluso a
un amplio mbito de anlisis.
Por ejemplo, hay investigadores que pueden escribir sobre un estudio
de caso de la India o de la Segunda Guerra Mundial. Para ciertos propsi
tos, estos dos objetos de estudio pueden constituir observaciones nicas;
por ejemplo, en una investigacin sobre la distribucin de la poblacin por
pases o sobre el nmero de muertos en combate en las guerras contempo
rneas. Sin embargo, por lo que respecta a muchos asuntos de inters para
los cientficos sociales, tanto la India como la Segunda Guerra Mundial
contienen por separado muchas observaciones que conllevan sus propias
unidades y variables. Un investigador podra comparar los resultados elec
torales de cada partido en los estados indios o los de las batallas durante la
Segunda Guerra Mundial. En un diseo de ese tipo, podra resultar engao
so referirse a la India o a la Segunda Guerra Mundial como estudios de
caso, ya que uno y otro definen simplemente los lmites dentro de los cua
les se hace un gran nmero de observaciones.
A la hora de elegir qu se va a observar, lo que realmente nos preocupa
son las observaciones utilizadas para extraer inferencias, en cualquiera que
sea el nivel de anlisis que nos interese; de ah que recomendemos a los
cientficos sociales que se basen en las observaciones que van a poder ha
cer y no en la imprecisa terminologa de los casos. Sin embargo, los cuali
tativistas suelen comenzar por elegir lo que consideran casos observa
ciones concebidas en un nivel de anlisis muy agregado y despus se

dan cuenta de que para obtener observaciones suficientes deben desagre
garlos.
Supongamos, por ejemplo, que un investigador quiera comprender cmo
influyen las pautas de crecimiento econmico de los pases democrticos
pobres en sus instituciones polticas. En principio, quiz piense en utilizar
como nico caso la India entre 1950 y 1990, teniendo en mente observacio
nes de esa sola unidad (la India) en relacin a dos variables: la tasa de cre
cimiento econmico y un ndice de cambio o de estabilidad de las insti
tuciones polticas. Sin embargo, quiz slo pueda encontrar un nmero
escaso de democracias pobres y, en este nivel de anlisis, no disponer de
observaciones suficientes para extraer inferencias causales vlidas. Una vez
que ha reconocido este problema, quiz de forma tarda, podra optar por
utilizar cada uno de los estados indios como unidad de anlisis; quiz tam
bin dividiendo su perodo de estudio en cuatro o cinco subperodos. Si es
tas observaciones desagregadas fueran consecuencia de la misma teora que
se dispone a comprobar, el procedimiento le reportara muchas observacio
nes dentro de su estudio de caso de la India. De este modo, la investiga
cin resultante podra aportar informacin suficiente para sostener inferen
cias causales vlidas sobre la poltica india y sera muy diferente de un
estudio de caso convencional cuya estrecha concepcin parte de observa
ciones hechas en una sola unidad sobre diversas variables.
Como la observacin se ha definido con m ayor precisin que el
caso, en este captulo nos referiremos normalmente a la seleccin de
observaciones. Sin embargo, dado que los investigadores suelen comenzar
por elegir mbitos de estudio que contienen mltiples observaciones poten
ciales y que la terminologa al uso los denomina casos, con frecuencia
hablaremos de seleccin de casos en lugar de observaciones cuando nos re
firamos a la prctica de los cualitativistas.
1.
Diseos de investigacin imprecisos
Un diseo de investigacin es un plan que muestra, mediante el anlisis de

un modelo y de unos datos, de qu manera esperamos utilizar nuestro mate
rial para extraer inferencias. En la investigacin cualitativa los diseos de
investigacin no siempre estn explcitos, pero s lo estn, al menos, en
cada investigacin concreta. Sin embargo, algunos diseos son imprecisos,
o sea, que no puede saberse casi nada de sus hiptesis causales.
Por desgracia, esta prctica est muy extendida tanto en la investigacin
cuantitativa como en la cualitativa. No obstante, existe una diferencia en la
imprecisin de una y otra. Cuando la segunda es imprecisa, el problema
suele ser evidente porque el programa de ordenador no dar estimaciones '.
Sin embargo, los programas informticos no siempre funcionan como de
ben, y hay muchos ejemplos de investigaciones cuantitativas con modelos

estadsticos imprecisos que llegan a conclusiones incoherentes. Por desgra
cia, en los estudios cualitativos no disponem os de nada tan autom tico
como un programa de ordenador para descubrir diseos de investigacin
imprecisos, pero ser consciente del problema hace que sea ms fcil identi
ficar este tipo de diseos e idear soluciones. Adems, los cualitativistas
suelen tener una ventaja sobre los cuantitativistas: con frecuencia, disponen
de suficiente informacin para hacer que sus diseos sean precisos.
Supongamos que al recoger datos nos proponemos contrastar la validez
de una hiptesis. Habra que disear la investigacin para que nos diera el
mximo control al distinguir entre diversos resultados posibles que fueran
relevantes para la hiptesis. Sin embargo, hay dos situaciones en las que
un diseo de investigacin es impreciso y, por tanto, no nos concede ese
control:
1.
Cuando el nm ero de inferencias que tenem os que hacer es m ayor que el de

consecuencias observadas.
2.
Cuando en nuestros datos hay dos o m s variables explicativas que se correla

cionan perfectam ente entre s desde el punto de vista estadstico, este proble
ma se denom ina m ulticolinealidad (las variables podran incluso ser diferen
tes, pero, si podem os predecir una a partir de la otra sin error en los casos que
tenemos, el diseo es impreciso).
Hay que sealar que estas situaciones, as como el concepto general de

diseo impreciso, slo tienen que ver con el objetivo de hacer inferencias
causales. Un diseo de investigacin que pretenda resumir pormenores his
tricos no puede ser impreciso, a menos que directamente se renan obser
vaciones no relevantes. Toda recogida de datos que se haya concebido con
el fin de revelar preguntas interesantes (vase el apartado 1.1 del captu
lo 2) no puede ser imprecisa si tenemos, al menos, cierta informacin. Es
evidente que, en cualquier caso, despus puede haber imprecisin cuando
volvamos sobre nuestros datos (o recojamos otros nuevos) para contrastar
una hiptesis causal.
1.1
Ms inferencias que observaciones
Consideremos la primera situacin, aquella en la que hay ms inferencias

que consecuencias observadas. La inferencia es el proceso mediante el cual
utilizamos hechos conocidos para saber algo sobre otros desconocidos. Lo
que podemos descubrir a partir de una informacin restringida no es ilimi
tado, y resulta que la regla precisa es que un hecho (o consecuencia obser
vable) slo puede ofrecer informacin independiente acerca de otro hecho.
De manera ms general, cada observacin puede ayudamos a extraer, como
mximo, una inferencia; un nmero de observaciones n nos ayudar a hacer

una cantidad de inferencias menor que n si las observaciones no son inde
pendientes. En la prctica, se suele necesitar mucho ms que una observa
cin para hacer una inferencia causal que sea razonablemente cierta.
Tener ms inferencias que consecuencias observadas es una dificultad
habitual en los estudios de caso cualitativos. Sin embargo, no es un pro
blema inherente a este tipo de investigacin, sino al estudio que se conceptualiza u organiza inadecuadamente a partir de muchas consecuencias
observables de una teora. En prim er lugar, describiremos este problema
y, posteriormente, analizaremos las soluciones.
Supongamos, por ejemplo, que tenemos tres estudios de caso y que cada
uno describe el esfuerzo conjunto que realizan dos pases para desarro
llar una .estructura armamentstica con tecnologa muy avanzada. En cada
estudio se incluyen interesantes descripciones de dichas estructuras, de las
negociaciones que hay entre los pases y del producto final. Durante nues
tra investigacin elaboramos una lista de siete razones importantes que ha
cen que los pases tengan xito en su proyecto conjunto de construccin de
sistemas defensivos estratgicos, las cuales podran ser variables explicati
vas muy plausibles. Tambin podramos haber entrevistado a altos cargos
de los diferentes pases y as habernos dado cuenta de que ellos tambin
creen que stas son las variables importantes. Esta forma de abordar el pro
blema nos dara siete hiptesis plausibles y tambin observaciones sobre
ocho variables: las siete explicativas y la dependiente. Sin embargo, en es
tas circunstancias, aunque recogiramos los datos de la manera ms cuida
dosa, no nos libraramos de un problema fundamental. Aunque este enfo
que que, fundamentalmente, se basa en una comparacin estructurada y
bien centrada es valioso, su impreciso diseo de investigacin no nos
proporciona una metodologa para la inferencia causal. Este diseo, que
utiliza siete variables causales y slo tres observaciones, no puede determi
nar cul de las hiptesis es correcta (si es que hay alguna que lo sea).
Al enfrentarnos a explicaciones imprecisas, a veces buscamos otras cau
sas posibles para el acontecimiento que intentamos explicar. Esto es exacta
mente lo contrario de lo que la lgica de la explicacin tendra que sugerir
nos. Una descripcin mejor o ms completa de cada caso de estudio no es
la solucin, ya que, al haber ms parmetros que observaciones, casi cual
quier explicacin del impacto de cada una de las siete variables estara tan
en consonancia con los datos como las dems. Si el diseo de la investiga
cin es impreciso, no habr descripcin, por profusa y detallada que sea; ni
mtodo, aunque sea inteligente; ni investigador, independientemente de su
pericia, que pueda sacar mucho de cualquiera de las hiptesis causales. In
tentar incluir todas las variables explicativas puede llevamos a cruzar la l
nea que nos separa de un diseo de investigacin impreciso.
Un nmero mayor de estudios de caso puede ayudarnos a solucionar el
problema que plantea el diseo de investigacin del prrafo anterior, pero
incluirlos quiz cueste un tiempo y unos recursos de los que no disponemos

o quiz slo haya tres ejemplos de los fenmenos que estudiamos. El pro
blema de la imprecisin se podra solucionar reorientando la investigacin
hacia el estudio del efecto de unas determinadas variables explicativas so
bre un abanico de acciones de los estados, ms que de las causas de ciertos
conjuntos de consecuencias, como es el xito de proyectos conjuntos. Una
solucin alternativa que no cambia de manera tan drstica el centro de aten
cin del estudio consistira en aadir un nuevo conjunto de observaciones
que hubieran sido medidas en diferentes niveles de anlisis. Adems de
usar la estructura armamentstica, se podran identificar todas las decisio
nes importantes que se producen al desarrollar cada una de esas estructu
ras. Este procedimiento puede ser de bastante ayuda si en estas decisiones
hay ms inform acin relevante para la inferencia causal, y, siempre que
nuestra teora tenga alguna consecuencia sobre el carcter de tales decisio
nes, no ser necesario cambiar en absoluto el propsito del proyecto. De
este modo, si nuestra teora se especifica con propiedad podr tener muchas
consecuencias observables y nuestros datos, sobre todo los cualitativos, con
tendrn, en general, observaciones referentes a muchas de esas consecuen
cias. Si es as, cada estudio de caso puede convertirse en muchas observa
ciones si se atiende a las partes que lo componen. Al aadir nuevas
observaciones procedentes de diferentes niveles de anlisis podemos apor
tar muchas pruebas de tales consecuencias. Este mtodo es una de las for
mas ms tiles de redisear la investigacin cualitativa y de evitar (hasta
cierto punto) tanto la imprecisin como el sesgo de la variable omitida, que
analizaremos en el apartado 2 de este captulo. De hecho, el aumento del
nmero de observaciones mediante el diseo de investigacin es el tema
principal del captulo 6 (especialmente de su apartado 3).
1.2
Multicolinealidad
Supongamos que, centrndonos en los efectos de ciertas causas preseleccionadas en lugar de en las de los efectos observados, conseguimos resol
ver el problema de las pocas observaciones aadiendo otras procedentes de
diferentes niveles de anlisis o mediante algn otro cambio en el diseo
de la investigacin. Seguir siendo necesario ocuparse del otro problema
que conduce a la imprecisin de los diseos de investigacin: la multicoli
nealidad. Hemos tomado este trmino de la investigacin estadstica, es
pecialmente del anlisis de regresin, pero vamos a utilizarlo de forma mu
cho ms general. El uso que hacemos de l se refiere particularmente a
cualquier situacin en la que podamos predecir perfectamente una variable
explicativa en funcin de una o ms de las restantes. No partimos de nin
gn supuesto de linealidad, como s se hace en el significado habitual del
trmino estadstico.
Un anlisis formal del problema que se plantea

cuando hay ms inferencias que observaciones
La mejor manera de comprender este problema es mediante un caso sencilio. Con el fin de maximizar la intuicin, en la prueba siguiente evitamos generalizar; es decir, presentar la prueba ms global, lo cual no
obsta para que el carcter intuitivo del ejemplo lo haga mucho ms aplicable.
Supongamos que nos interesa hacer inferencias sobre dos parmetros
en un modelo causal que tiene dos variables explicativas y una nica variable independiente
E (Y )-X fa + X v
i
;
(4.1)
pero no tenemos ms que una observacin para hacer la estimacin (o

sea, n = 1). Supongamos adems que, para una mayor claridad, nuestra
observacin consiste en
= 3, X2 = 5 e Y = 35. Para terminar, supongamos
que en este ejemplo sucede que Y es igual a su valor esperado (lo cual
ocurrira por azar o si no hubiera variabilidad aleatoria en Y). De este
modo, E(Y) = 35. En la prctica, nunca dispondremos de esta ltima informarin (por la aleatoriedad inherente a /), de manera que si, en este
caso, tenemos problemas al hacer una estimacin de /3X y de 0 2, seguramente fracasaremos en el caso general cuando no dispongamos de dicha
informacin sobre el valor esperado.
Por tanto, el objetivo, ser hacer una estimacin de los valores de parmetro en la siguiente ecuacin:
E(Y) = X jf t + X2/32
'
j
j
F1
i
3
!
(4.2)
35 = 3/3j + 502
El problema es que esta ecuacin no tiene una nica solucin. Por ejempo, los valores
= 10, /32 = 1) la satisfacen, pero tambin Lo hacen
(jSj = 5, /32 = 4) y ( p 1 = -10, 0 2 = 13). Esto resulta bastante problemtico,
ya que los diferentes valores de los parmetros pueden sealar consecuencas esenciales muy diferentes acerca de los efectos causales de estas dos
variables; en el ltimo caso, cambia incluso un signo. En realidad, tanto
estas como un nmero in fin ito de soluciones satisfacen igualmente la
ecuacin. De este modo, no hay nada en el problema que nos ayude a distinguir entre las soluciones, porque todas ellas concuerdan con nuestra
nica observacin.
:-j
*j
a
j
!j
s
i
Supongamos, por ejemplo, que en el estudio sobre cooperacin armamentstica antes mencionado dos de las hiptesis sean: (1) es ms probable que
progrese la colaboracin entre los pases cuando sus tamaos son diferentes
que cuando son similares y (2) su xito es ms probable cuando los pases no
son vecinos que cuando s lo son. Las variables explicativas que estn detrs
de estas hiptesis se centran en el impacto negativo que tiene la rivalidad so
bre la colaboracin; ambas son bastante razonables y puede que incluso las
respalden entrevistas en profundidad o la bibliografa sobre poltica indus
trial. Sin embargo, supongamos que slo logramos identificar un pequeo
conjunto de datos en el que la unidad de anlisis sea un par de pases. Supon
gamos, adems, que nicamente recogemos dos tipos de observaciones:
(1) pases vecinos de tamao diferente y (2) pases vecinos de tamao simi
lar. Si sucediera que (por diseo o por azar) todas nuestras observaciones
pertenecieran a dichas categoras, sera imposible utilizar los datos para en
contrar prueba alguna que constatara o negara cualquiera de las hiptesis. La
razn es que las dos variables explicativas se correlacionan perfectamente:
toda observacin en la que los posibles asociados tengan un tamao similar
preocupar a los vecinos, y al revs. El tamao y la proximidad geogrfica
son variables conceptualmente muy diferentes, pero, al menos en este con
junto de datos, no se distinguen la una de la otra. En este punto, lo mejor que
podra hacerse es recoger ms observaciones en las que estados de tamao
similar fueran vecinos. Si esto fuera imposible, la nica solucin sera buscar
consecuencias observables en algn otro nivel de anlisis.
Aunque se solucione el problema de la imprecisin del diseo de inves
tigacin, puede que nuestras inferencias causales sigan siendo muy incier
tas, por cuestiones como la de un nmero insuficiente de observaciones o
la colinealidad entre las variables causales. Para tener ms confianza en las
estimaciones siempre habr que intentar maximizar el control sobre nuestro
problema. En consecuencia, siempre tendremos que observar tantas conse
cuencias de nuestra teora como sea posible. Es evidente que, en la prctica,
el tiempo y los recursos que podemos dedicar a la recogida de datos siem
pre estn condicionados, pero la necesidad de tener ms observaciones que
inferencias debe alertamos frente a situaciones en las que haya que dejar de
recabar informacin detallada sobre un caso determinado para comenzar a re
cogerla sobre otros parecidos. La preocupacin por la imprecisin tambin
tiene que influir en cmo definimos nuestra unidad de anlisis: tendremos
problemas al hacer inferencias causales vlidas si en nuestro estudio slo
disponemos de una unidad de anlisis en la que los acontecimientos son
prcticamente nicos, ya que resultar muy difcil encontrar muchos ejem
plos. Aunque lo que nos interese sea el comunismo, la Revolucin francesa
o las causas de la democracia, tambin compensar dividir el problema en
unidades manejables y ms numerosas.
Tambin recomendamos que se maximice el control limitando el nme
ro de variables explicativas con las que se quiere hacer inferencias causales.
Al lim ita r estas variables, hay que procurar no incurrir en el sesgo de la va

riable omitida (apartado 2 del captulo 5). Las reglas que aparecen en el
apartado 3 del siguiente captulo tendran que ayudarnos en este punto. Un
proyecto que logra sus fines es el que explica mucho utilizando pocos ele
mentos, y lo ideal es que se utilice una sola variable explicativa para aclarar
numerosas observaciones en las dependientes.
Un diseo de investigacin que explique mucho utilizando un gran n
mero de elementos no ser muy informativo, pero un diseo impreciso no
nos permitir separar efectos causales en absoluto. Para evitar este proble
ma hay que seleccionar observaciones de las mismas variables u otras que
sean consecuencia de nuestra teora. Despus de formalizar la multicolinealidad (vase el recuadro), nos ocuparemos con ms detalle del anlisis de
los mtodos de seleccin de observaciones y del problema del sesgo de se
leccin.
2.
Lmites de la seleccin aleatoria
En los estudios en los que n es grande evitamos el sesgo de seleccin m e

diante una seleccin aleatoria de las observaciones, porque un criterio alea
torio no se correlaciona con todas las variables explicativas o dependientes
posibles2. La aleatoriedad es un enfoque muy valioso porque ofrece un pro
cedimiento de seleccin que automticamente no se correlaciona con todas
las variables. Esto quiere decir que, cuando n es grande, las posibilidades
de que un criterio de seleccin se correlacione con cualquier variable ob
servada son extremadamente pequeas. En consecuencia, la seleccin alea
toria de observaciones elimina automticamente el sesgo de seleccin en
este tipo de estudios. En un mundo en el que hay muchas variables poten
ciales para confundimos algunas de ellas desconocidas la aleatoriedad
tiene muchas virtudes para los cientficos sociales. Si, como ocurre a m e
nudo en la investigacin politolgica, hemos de abandonar la aleatoriedad,
habr que hacerlo con cuidado.
En las ciencias sociales los experimentos controlados slo se realizan
ocasionalm ente3. Sin embargo, son un modelo til para comprender ciertos
aspectos del diseo de la investigacin no experimental. Los mejores expe
rimentos suelen combinar la seleccin de observaciones y la adjudicacin
de valores a las variables explicativas segn criterios aleatorios con un gran
nmero de observaciones (o pruebas experimentales). Aunque ningn ex
perimento consiga resolver el problema fundamental de la inferencia cau
sal, quienes los realizan suelen poder seleccionar sus observaciones (en vez
de recibirlas de los procesos sociales) y dar tratamientos (valores de las va
riables explicativas) a las unidades; de ah que merezca la pena centrarse en
estas dos ventajas de los experimentos: control sobre la seleccin de obser
vaciones y adjudicacin de valores de las variables explicativas a las uniffiKiSS
134
Un anlisis formal de la multicolinealidad

Para una mejor comprensin, utilizaremos la misma estrategia que en el
ltimo anlisis formal, es decir, dar slo una prueba de un nico caso con
creto. Tambin aqu la intuicin puede llevarnos ms all de este simple
ejemplo, que es muy sim ilar al anterior. De nuevo utilizamos un ejemplo
muy parecido al anterior. Retomamos el modelo de la ecuacin (4.1), pero
esta vez tenemos un nmero muy elevado de observaciones y cada una de
nuestras dos variables explicativas es una combinacin lineal perfecta de la
otra. De hecho, para que el problema resulte an ms transparente, supo
nemos que las dos son la misma, de manera que Xx = X2. Podramos haber
definido X t y X2 en funcin de dos variables esencialmente diferentes
(como gnero y embarazo), pero en una muestra de datos ambas podran
resultar la misma (si se diera el caso de que todas las mujeres encuestadas
estuvieran embarazadas). Podemos distinguir los efectos causales de es
tas diferentes variables?
Hay que sealar que la ecuacin (4.1) se puede escribir de la siguiente
manera:
EW -X^+XA
(4.3)
La segunda lnea de esta ecuacin debera dejar claro que, independiente

mente de lo que sean E(Y) y Xv numerosos valores de jSj y de /32 pueden
satisfacerla. (Por ejemplo, si
= 5 y jS2 = -20 satisfacen la ecuacin
(4.3), tambin ocurre as cuando /3t = -2 0 y j32 = 5.) De este modo, aun
que ahora disponemos de muchas ms observaciones que parmetros, la
multicolinealidad nos deja el mismo problema que cuando tenamos ms
parmetros que unidades: no hay ninguna forma de estimacin que nos
pueda ofrecer un solo clculo aproximado de los parmetros.
dades. En la prctica, los que experimentan no seleccionan aleatoriamente,
sino que eligen dentro de una poblacin adecuada como los estudiantes
de segundo curso de una facultad , pero aqu nos centramos en una situa
cin ideal. Analizamos la seleccin, posponiendo al final del captulo 5 el
estudio de la adjudicacin de valores de las variables explicativas.
En la investigacin cualitativa, y de hecho en gran parte de la cuantitati
va, la seleccin aleatoria puede no ser factible, porque el universo de casos
no est claramente especificado. Por ejemplo, si quisiramos elaborar una
muestra aleatoria de las lites que tienen que ver con la poltica exterior de
los Estados Unidos, no las encontraramos en una lista comparable a la de las
circunscripciones electorales para el Congreso. Podramos juntar listas pro

cedentes de varias fuentes, pero siempre correramos el riesgo de que en
ellas hubiera ciertos sesgos. Por ejemplo, el universo de seleccin podra
basarse en listas estatales de ciudadanos a los que se hubiera consultado
acerca de cuestiones de poltica exterior. Ciertamente, se podra considerar
que estas personas pertenecen a una lite de la poltica exterior, pero si el pro
blema de la investigacin tuviera que ver con la relacin que existe entre
procedencia social y preferencia por una poltica, nuestra lista podra estar
sesgada a favor de individuos de clase alta que suelen apoyar la poltica del
gobierno. Adems, quiz no pudiramos estudiar una muestra de lites to
mada aleatoriamente de una lista, porque los gastos de desplazamiento po
dran ser muy altos. Entonces, habra que seleccionar slo a los que vivie
ran en nuestra regin, lo cual introducira probablemente otros sesgos.
La seleccin aleatoria no es necesariamente la mejor tcnica, ni siquiera
cuando es factible. Es frecuente que los cualitativistas se resistan a utilizar
(con razn) el concepto de seleccin aleatoria, negndose a correr el riesgo
de no contar con casos importantes que este mtodo podra descartar (para
qu estudiar las revoluciones si no incluimos la Revolucin francesa?). En
realidad, si slo tenemos un nmero reducido de observaciones, la selec
cin aleatoria puede no resolver el problema del sesgo de seleccin y puede
ser incluso peor que otros mtodos de seleccin. Creemos que, intuitiva
mente, muchos cualitativistas se dan cuenta de esto cuando se quejan de los
que consideran descaminados sermones sobre las virtudes de la aleatorie
dad que les dirigen algunos investigadores cuantitativos. De hecho, utili
zando un modelo formal de investigacin cualitativa muy sencillo, demos
traremos a continuacin que en investigaciones con un n reducido la
seleccin aleatoria de las observaciones suele producir graves sesgos.
Supongamos que tenemos tres unidades en las que hay observaciones
sobre una variable dependiente que puede expresarse como alta, media o
baja, pero que slo dos de ellas se seleccionan para el anlisis (n = 2).
Ahora necesitamos un criterio de seleccin. Si hacemos que 1 se refiera a
una unidad seleccionada para el anlisis y que 0 indique una omitida, slo
sern posibles tres criterios de seleccin: (1,1,0), lo cual significa que to
mamos las opciones alta y media pero no la baja (0,1,1) y (1,0,1). El pro
blema es que slo el ltimo criterio de seleccin, en el que se omite la se
gunda unidad, no se correlaciona con la variable dependiente4. En este
ejemplo, en el que n tiene un valor reducido, al ser equivalentes la selec
cin aleatoria de observaciones y la eleccin aleatoria de uno de estos tres
criterios de seleccin posibles, existir una probabilidad de dos contra tres de
que la seleccin de observaciones produzca un sesgo de seleccin! Sera
mucho ms probable que una seleccin ms cuidadosa de las observacio
nes, que utilizara el conocimiento previo de los posibles valores de la varia
ble dependiente, optara por el tercer criterio de seleccin, evitando as el
sesgo.
Los cualitativistas apenas recurren abiertamente a la aleatoriedad como

criterio de seleccin, pero han de asegurarse de que los criterios que utili
zan no tengan consecuencias similares. Supongamos, por ejemplo, que a un
investigador le interesen los pases de Europa del Este con cultura catlica
que fueron dominados por la Unin Sovitica despus de la Segunda G ue
rra Mundial: Checoslovaquia, Hungra y Polonia. Se dar cuenta de que en
los aos setenta y ochenta hubo una considerable variacin en las polticas
de cada uno de estos pases: en Polonia, surgi un movimiento antiguberna
mental bien organizado (Solidaridad), en Checoslovaquia actuaba un grupo
mucho ms reducido de intelectuales (Carta 77), mientras que en Hungra
no se desarroll ningn movimiento nacional tan amplio. El problema con
siste en explicar estas discrepancias.
Para examinar la naturaleza de los movimientos antigubernamentales es
preciso estudiar en profundidad la prensa, los documentos de los partidos
comunistas recientemente desclasificados y tambin hacer muchas entre
vistas a los participantes en dichos movimientos para lo cual hay que co
nocer su idioma. Adems, la dificultad de investigar la Europa Oriental
contempornea estriba en que se necesitar un ao para estudiar cada uno
de los pases. Por lo tanto, para realizar este trabajo parece factible centrar
se slo en dos de ellos. Por fortuna, por razones no relacionadas con este
proyecto, la investigadora conoce ya el checo y el polaco, de manera que
decide estudiar Carta 77 en Checoslovaquia y Solidaridad en Polonia. R e
sulta evidente que este proceder dista mucho de ser una adjudicacin alea
toria, pero, al menos, probablemente la razn para elegir estos pases no
tenga relacin con la variable dependiente. Sin embargo, en este ejemplo
resulta que el criterio de seleccin (conocer ciertos idiomas) s se correla
ciona con la variable dependiente y que, por lo tanto, habr un sesgo de se
leccin. En este caso, si no fuera por los condicionantes lingsticos, habra
sido mejor hacer una seleccin fundamentada, no aleatoria.
Esta investigadora podra evitar el sesgo de seleccin olvidando que
sabe checo y ponindose a aprender hngaro, pero esta solucin no resulta
en absoluto atractiva! En esta observacin la alternativa ms realista sera
aprovecharse de que se conoce el sesgo para evaluar en qu direccin acta,
corregirlo al menos parcialmente y m atizar las conclusiones en consecuen
cia. Desde el principio, la investigadora sabe que ha reducido sistemtica
mente el grado de varianza de su variable dependiente, lo cual tendera a
hacer que subestimara sus estimaciones causales, al menos como promedio
(aunque esto pueden cambiarlo otros problemas de la misma investigacin).
Adems, para que cualquier variable explicativa sea plausible, tendr
que realizar, al menos, la suficiente investigacin secundaria en Hungra
como para darse cuenta de si la direccin del sesgo va a favor o en contra
de su hiptesis. Por ejemplo, sta podra sealar, partiendo de los casos
checo y polaco, que los movimientos antigubernamentales masivos surgen
cuando los regmenes comunistas tienen un carcter indulgente, relativa
mente poco represivo, y no cuando son fuertes y represivos. La investiga

dora tendra que saber que, aunque Hungra tena el rgimen comunista
ms benvolo de Europa del Este, no hubo en este pas un movimiento anti
gubernamental masivo. En consecuencia, si es posible, la investigadora ten
dr que aumentar el nmero de observaciones con el fin de evitar el sesgo
de seleccin, y, aunque no todas puedan estudiarse exhaustivamente, el he
cho de conocerlas parcialmente podr, al menos, mitigar el problema. Re
sultara muy productivo acompaar este estudio detallado de dos casos con
el de otros mucho menos pormenorizados que se basaran en fuentes secun
darias y, quiz, aadir tambin un anlisis bastante ms agregado (y necesa
riamente superficial) de un gran nmero de casos. Si los estudios de caso
detallados producen una clara hiptesis causal, puede que sea mucho ms
fcil recabar slo informacin de las pocas variables que se consideren im
portantes en un nmero mucho mayor de observaciones en varios pases
(vase el apartado 3 del captulo 4 para un anlisis similar y un tratamiento
ms formal). Otra solucin podra ser reorganizar la enorme informacin
recogida en. los dos estudios de caso para que se convirtiera en un gran n
mero de consecuencias observables de la teora. Por ejemplo, si fuera co
rrecta la teora de que la represin del rgimen impide que aumenten los
movimientos antigubernamentales, stos no hubieran podido desarrollarse
mucho en ls ciudades o regiones en las que la polica secreta era entusiasta
y eficiente, mientras que habran actuado con mayor libertad all donde el
comportamiento de esas fuerzas era ms relajado siempre teniendo en
cuenta las circunstancias de cada pas.
3.
Sesgo de seleccin
Cmo tenemos que seleccionar las observaciones para incluirlas en un es

tudio? Si queremos saber las opiniones de los cargos municipales, a cules
tenemos que entrevistar? Si estamos haciendo una comparacin entre estu
dios de caso de grandes guerras, cules hay que seleccionar? Si nos intere
san los vetos presidenciales en los Estados Unidos, hay que elegir todos?,
slo los que se han producido desde la Segunda Guerra Mundial?, hacer
una muestra aleatoria?, o acaso contar nicamente los invalidados por el
Congreso? Cuando se comienza a disear un proyecto de investigacin no
hay ninguna pregunta que est tan presente como sta: qu casos (o, ms
exactamente, qu observaciones) tenemos que incluir en nuestro estudio?
En la investigacin cualitativa la eleccin de las observaciones resulta cru
cial para el resultado del estudio y condiciona en qu medida ste puede
generar resultados precisos y fiables.
Como hemos visto en el apartado anterior, la seleccin aleatoria no suele
ser apropiada cuando abordamos investigaciones con un n reducido, pero
prescindir de este mtodo abre la puerta a muchos tipos de sesgo. El ejem-
po ms evidente se produce cuando, sabiendo el resultado que queremos

obtener de la investigacin (confirm ar la hiptesis que preferimos), selec
cionamos con ms o menos sutileza observaciones que responden a combi
naciones de las variables independientes y dependientes que constatan la
conclusin deseada. Supongamos que creemos que la inversin estadouni
dense es una causa primordial de violencia interna en los pases del Tercer
Mundo; en consecuencia, seleccionamos, por un lado, un conjunto de na
ciones que ha recibido grandes sumas de los Estados Unidos y en las que se
ha registrado mucha violencia y, por otro, un grupo en el que no ha habido
ni inversin ni violencia. Existen otras observaciones que ponen de mani
fiesto las otras combinaciones (mucha inversin y ninguna violencia o bas
tante inversin y mucha violencia), pero se dejan cmodamente de lado.
El sesgo de seleccin casi nunca es tan flagrante como en este ejemplo,
pero como en la investigacin cualitativa los criterios de seleccin suelen
estar implcitos y muchas veces se elige sin intentar evaluar conscientemen
te los sesgos potenciales, existen muchas posibilidades de que el sesgo se
filtre en nuestros procedimientos de seleccin5.
3.1
Seleccionar en fundn de la variable dependiente
En estudios con un n grande la seleccin aleatoria nos permite hacer caso

omiso de la relacin que existe en nuestro anlisis entre los criterios de se
leccin y otras variables. Al prescindir de la seleccin aleatoria, hay que
considerar de qu manera se relacionan los criterios utilizados con cada va
riable. Esto nos conduce a una regla fundamental y evidente: la seleccin
tiene que perm itir que se produzca, al menos, alguna variacin en la varia
ble dependiente. Este requisito resulta tan obvio que podra pensarse que no
es necesario mencionarlo. Cmo podramos explicar los cambios que se
producen en una variable dependiente si sta no cambia? Por desgracia, la
bibliografa est llena de obras en las que se comete precisamente el error
de no dejar que cambie: por ejemplo, investigaciones que intentan explicar
los estallidos blicos estudiando slo guerras, el comienzo de las revolucio
nes investigando nicamente estos fenmenos o las pautas de asistencia a
las urnas mediante entrevistas a los que no votan6.
En el captulo 1 sealamos que los buenos cientficos sociales suelen
crecerse cuando existen anomalas que hay que explicar. Uno de los efectos
de esta tendencia es que pueden seleccionar, especialmente los cualitativis
tas, observaciones que tienen un resultado sorprendente, como las revolu
ciones sociales que tuvieron lugar en Francia durante el siglo x v i i i y las que
ocurrieron en ese mismo pas y en China durante el xx (Skocpol, 1979).
sta es una seleccin de observaciones que se realiza en funcin de la va
riable dependiente y, por tanto, corre el riesgo de introducir el sesgo de se
leccin que analizamos en este apartado. Cuando las observaciones se eli
gen a partir de un determinado valor de la variable dependiente, no se pue

de conocer ninguna de las causas de sta sin tener en cuenta otros ejemplos
en los que adopte valores diferentes. Por ejemplo, en su investigacin, Theda Skocpol (1979) soluciona en parte este problema incluyendo unos pocos
datos sobre momentos de crisis revolucionaria (Skocpol, 1984, p. 380)
en la Inglaterra del siglo x v i i , en la Prusia/Alemania del xix y en el Japn
del mismo siglo. Considera estas observaciones casos de control, aunque
los analiza con mucho menos detalle que los principales. El hecho de que
exista un sesgo producido por seleccionar en funcin de la variable depen
diente no implica que nunca haya que tener en cuenta los valores de dicha
variable al disear investigaciones. Lo que supone es que, como se indica
ms adelante y en el captulo 6, tenemos que ser conscientes de los sesgos
que introduce esa seleccin en la variable dependiente y buscar, en la medi
da de lo posible, maneras de corregirlos.
Existe tambin una versin ms leve y ms habitual del problema que
conlleva seleccionar en funcin de la variable dependiente. En algunos ca
sos, el diseo de una investigacin contempla el cambio de esta variable
pero la trunca: es decir, nuestras observaciones se limitan a una gama de
cambios menor de la que puede alcanzar dicha variable en el mundo real. En
estas situaciones, se puede decir algo sobre las causas de la variable depen
diente, pero es probable que las inferencias estn sesgadas, ya que, como
el criterio de seleccin no tiene en cuenta las variables explicativas, cual
quier criterio de seleccin que se correlacione con la variable dependiente
atenuar la media de estimaciones de los efectos causales (vanse Achen,
1986; King, 1989, captulo 9). En la investigacin cuantitativa, esto supon
dr que las estimaciones numricas de los efectos causales estarn ms cerca
de cero que en la realidad. En la cualitativa el sesgo de seleccin implicar
que el autntico efecto causal es mayor de lo que cree el investigador (por
supuesto, a menos que ste sea consciente de lo que aqu se expone y corrija
sus estimaciones en consecuencia). Si sabemos que existe un sesgo de selec
cin y no hay forma de esquivarlo mediante una muestra mejor, esto supone
que la media de nuestra estimacin mostrar, al menos, que el verdadero
efecto causal tiene un lmite ms bajo. El grado de subestimacin de este efec
to causal depende de la gravedad del sesgo de seleccin (hasta qu punto se
correlaciona el criterio de seleccin con la variable dependiente), y de l ha
bra que tener pruebas detalladas o, por lo menos, cierta idea.
Los casos de sesgo de seleccin extremo en los que el diseo no per
mite que cambie la variable dependiente son fciles de manejar: evte
los! Si los utilizamos no conoceremos efectos causales. La forma modificada
de este tipo de sesgo, en la que las observaciones se seleccionan de forma
que estn relacionadas con la variable dependiente, puede ser ms difcil de
eliminar, ya que quiz no tengamos acceso a todas las observaciones que
queremos. Sin embargo, por fortuna, los efectos de este sesgo no son tan
devastadores, porque algo s se puede aprender; quiz nuestras inferencias
Grfico 4.1
Sesgo de seleccin
X (nmero de cursos de contabilidad)
estn sesgadas, pero de una forma previsible que podemos compensar. Los
siguientes ejemplos ilustran esta situacin.
Dado que con frecuencia nos veremos obligados a elegir observaciones
que se correlacionan con la variable dependiente y que, por tanto, contie
nen sesgo de seleccin, merece la pena comprobar si, de todos modos, po
dremos sacarles informacin valiosa. El grfico 4.1, que presenta un simple
modelo de sesgo de seleccin, demuestra que s es posible. Cada punto re
presenta un observacin (una persona, por ejemplo); el eje horizontal es la
variable explicativa (como puede ser el nmero de cursos de contabilidad
que se reciben en una escuela de negocios), y el vertical, la dependiente
(por ejemplo, el salario inicial en el primer trabajo con dedicacin exclusi
va, cifrado en unidades de 10.000 dlares estadounidenses). La lnea de re
gresin que muestra la relacin que hay entre estas dos variables es la con
tinua que cruza el diagrama de puntos. Cada curso de contabilidad tiene un
valor medio de 10.000 dlares en concepto de salario inicial. El diagrama
de puntos que rodea esta lnea continua de regresin indica que, como es
habitual, sta no se ajusta perfectamente a la situacin de todos los estu
diantes. En grficos como ste la desviacin vertical que hay entre los pun
tos y la lnea representa los errores de prediccin (dados unos determinados
valores para las variables explicativas) que, por tanto, se minimizan a la
hora de adecuar dicha lnea a los puntos.
Ahora supongamos que un alumno que acaba de matricularse en una es
cuela de negocios quiera estudiar cmo va a aumentar su renta cuando ter
mine sus estudios. Como no le han enseado lo que es el sesgo de selec

cin, opta por utilizar una muestra de anteriores estudiantes que slo se
compone de aquellos a los que les fue bien en su primer empleo: los que con
siguieron trabajos como los que l quiere. Puede parecer que si desea
aprender cmo ganar ms dinero lo m ejor es centrarse nicamente en los
que tienen salarios altos, pero este razonamiento es falaz. Para una mayor
sencillez, supongamos que en su seleccin incluya slo a aquellos que es
tn ganando, como mnimo, 100.000 dlares. En el grfico 4.1, estos crite
rios de seleccin de la muestra se expresan mediante una lnea continua ho
rizontal en la que Y = 10, de manera que en la investigacin del estudiante
slo se contemplan los puntos que aparecen por encima de ella. Ahora, en
lugar de hacer una lnea de regresin que se ajuste a todos los puntos, traza
otra (la discontinua) que slo se ajusta a los de su muestra. El sesgo de se
leccin se manifiesta en que la inclinacin de esta lnea es menor que la de
la continua. A consecuencia de este sesgo, el estudiante llegar a la conclu
sin errnea de que cada curso de contabilidad slo representa un aumento
de unos 5.000 dlares.
Este es un ejemplo concreto de cmo podemos subestim ar un efecto
causal cuando seleccionamos en funcin de la variable dependiente. Por
fortuna, si hay algo que nuestro estudiante puede hacer para solucionar este
problema. Supongamos que, despus de terminar sus estudios en la escuela
de negocios, se aburre de ganar dinero y se matricula en una facultad de
ciencias sociales en la que aprende lo que es el sesgo de seleccin. Est
muy ocupado preparando sus exmenes globales, as que no tiene tiempo
de retomar adecuadamente su investigacin. No obstante, sabe que su sala
rio inicial se habra incrementado en una cantidad considerablemente su
perior a la cifra de 5.000 dlares en que l haba valorado cada curso de
contabilidad. Ahora llega a la conclusin de que, como su criterio de selec
cin era bastante estricto (de hecho, determinista), habra ganado ms dine
ro en los negocios si se hubiera apuntado a ms cursos de contabilidad
pero, como ha decidido no maximizar sus ingresos (quin podra entrar
en una facultad con este propsito?), se alegra de no haber conocido el ses
go de seleccin antes de que cambiaran sus valores.
3.1.1
Ejemplos de sesgo de seleccin producido por e l investigador
El problema que acabamos de describir es habitual en la investigacin cua

litativa (vase Geddes, 1990) y puede surgir de un procedimiento tan apa
rentemente inocuo como seleccionar casos a partir de los datos disponibles,
cuando la disponibilidad de esos datos est relacionada con la variable de
pendiente. Supongamos, por ejemplo, que nos interesen los factores que
han determinado la participacin del presidente de los Estados Unidos en
decisiones de poltica internacional importantes durante los ltimos aos y
que nos proponemos estudiar aquellas en cuyas reuniones consta que parti
cip el presidente. El problema de este diseo de investigacin es que el
criterio de seleccin (la disponibilidad de informacin) probablemente se
correlacione con unos niveles relativamente bajos de participacin presi
dencial (la variable dependiente), ya que es probable que el presidente haya
tenido una mayor presencia en las reuniones ms secretas a las que no se
podr acceder que en aquellas cuyas deliberaciones se hayan hecho p
blicas. Por lo tanto, en el conjunto de las observaciones que se refieren a la
informacin disponible, habr una excesiva representacin de los aconteci
mientos en los que se haya registrado un participacin presidencial menor,
lo cual sesgar las inferencias que hagamos acerca de los factores determi
nantes de dicha actividad.
El razonamiento utilizado en nuestro ejemplo de la escuela de negocios
puede ayudamos a comprender las consecuencias que tendr un inevitable
sesgo de seleccin en la investigacin cualitativa. Supongamos que en el
estudio anterior nos interesara saber si los presidentes se implican ms
cuando los acontecim ientos conllevan una amenaza de utilizacin de la
fuerza que cuando sta no se plantea. Supongamos tambin que, segn las
pruebas disponibles, quiz basadas en dos docenas de observaciones, s
existe esta relacin entre los hechos pero su magnitud es sorprendentemen
te baja. Para calibrar el grado de sesgo de seleccin de este estudio, en pri
mer lugar haramos una lista de situaciones relativas a la poltica exterior en
las que el presidente hubiera actuado o hecho declaraciones pblicas, inde
pendientemente de que se disponga de alguna informacin sobre los proce
sos de toma de decisiones. Esta lista evitara una de las causas de sesgo de
seleccin que hemos identificado: el mayor secretismo en las decisiones
que conllevan una amenaza de utilizacin de la fuerza. Esta nueva lista no
incluira todos los problemas en los que se implic el presidente, ya que
no registrara las operaciones encubiertas ni aquellas en las que no se tom
ninguna medida, pero s sera una lista ms larga que la primera porque en
sta necesitbamos inform acin sobre la toma de decisiones. Podramos
despus comparar ambas listas para determinar si (tal como sospechba
mos) exista un sesgo que favoreca a aquellos casos sobre los que haba in
formacin relativa a la toma de decisiones e iba en contra de aquellos en
los que se utilizaba la fuerza o se amenazaba con utilizarla. Si fuera as, se
ra razonable inferir que, probablemente, la verdadera relacin entre los he
chos era an ms intensa de lo que pareca en nuestro primer anlisis.
El problema del sesgo de seleccin suele aparecer en la poltica compa
rada cuando los investigadores tienen que viajar a determinados lugares
para abordar su objeto de estudio. Con frecuencia, su capacidad de elegir
unidades es limitada, ya que algunos gobiernos no dan informacin a los
investigadores extranjeros. Por desgracia, esta negativa puede correlacio
narse con la variable dependiente que interesa al investigador. Alguien que
quiera explicar la liberalizacin de los regmenes autoritarios basndose en
mmm,
143^
las tcticas utilizadas por los grupos de disidentes podra obtener resultados
sesgados, especialmente si slo estudiara los lugares en los que se le ha
permitido la entrada, ya que las razones por las que el rgimen le ha conce
dido este acceso probablemente se correlacionen con la variable dependien
te, que es la liberalizacin. Es evidente que no vamos a recomendar que se
realice trabajo clandestino en lugares inhspitos, pero s aconsejamos que
se tenga en cuenta este problema y que se utilice la imaginacin para bus
car fuentes de datos alternativas cuando no se dispone de las que estn en el
lugar de los hechos. Reconocer estas dificultades tambin podra llevamos
a revisar el diseo de nuestra investigacin, con el fin de enfrentarnos a la
realidad del acceso a las fuentes para fines acadmicos en el mundo. Si no
podemos solucionar el problema de los datos, al menos podremos utilizar
nuestras indagaciones sobre el sesgo de seleccin para saber hacia dnde se
sesgarn nuestros resultados y quiz as podamos corregir parcialmente
ese inevitable sesgo de seleccin que conlleva un estudio de este tipo. Es
decir, que si esta clase de sesgo es inevitable, hay que analizarlo, determi
nar su direccin y, si es posible, su magnitud, y utilizar tambin esta infor
macin para modificar nuestras primeras estimaciones en la direccin co
rrecta.
El sesgo de seleccin es un problema tan endmico que puede que sea
til abordar algunos ejemplos ms de l. Pensemos en un trabajo reciente
de Michael Porter (1990), autor que quera conocer el origen de lo que de
nominaba ventaja competitiva en los actuales sectores industriales y em
presas. Para estudiar este tema, dise un proyecto a gran escala con diez
equipos nacionales. Al elegir los diez pases que iba a analizar opt, segn
sus palabras, por los que ya haban demostrado su capacidad de competir
en diversos sectores o, como era el caso de Corea y Singapur, los que pre
sentaban sntomas de mejora en este sentido (Porter, 1990, p. 22). En su
impaciencia por ahondar en el problema que le interesaba, Porter fue cons
ciente de que seleccionaba en funcin de la variable dependiente, haciendo
que esta variable observada fuera casi constante. En consecuencia, cual
quier intento que haga Porter, o todo aquel que utilice sus datos en este ni
vel de anlisis, para explicar el grado de xito de cada uno de los diez pa
ses producir efectos causales considerablemente sesgados.
Sin embargo, lo que hizo Porter intentar determinar las circunstancias
y polticas que se relacionan con el xito competitivo tiene que ver, en
cierto sentido, con el mtodo del compromiso de Mili. ste no es un mal
sistema para abordar el problema, ya que le permiti a Porter desarrollar al
guna hiptesis sobre las causas de la ventaja competitiva, por medio de la
observacin de las caractersticas que compartan las naciones selecciona
das; sin embargo, su diseo de investigacin le impidi evaluar efectos cau
sales concretos.
Ms grave resulta el error de lgica del mtodo: sin un grupo de control
de naciones (o sea, con la variable explicativa adscrita a otros valores) el
autor no puede determinar si la ausencia de las hipotticas variables causa

les se relaciona con el fracaso en trminos competitivos. De este modo, no
hay forma de saber si las condiciones que l relaciona con el xito no se
asocian tambin con el fracaso. En su provocativo trabajo, Porter plantea un
conjunto fascinante de hiptesis que se basa en los casos en los que s ha
habido xito competitivo, pero al no elaborar una gradacin de xitos o fra
casos en este sentido (ni una seleccin fundamentada en otra cosa que no
sea su variable dependiente), no puede saber si tiene toda la razn, ninguna,
o si est en un punto interm edio1.
En los escritos sobre poltica exterior que se ocupan de la disuasin se
encuentra un ejemplo notable de sesgo de seleccin: el uso de amenazas
para inducir a los oponentes a que se com porten de la form a deseada
(Achen y Snidal, 1989, p. 151). Los que investigan este asunto analizan con
frecuencia crisis agudas, o sea, aquellas en las que la disuasin no se ha
producido en un prim er estadio del proceso que lleva del clculo poltico a
la accin, pasando por el de emisin de ciertas seales. Para describir mejor
este enfoque, hay que caracterizarlo bien, al menos inicialmente: al igual
que ocurre cuando Porter hace hincapi en el xito competitivo, el observa
dor puede describir los episodios de inters ms significativos sin quiz lo
grar formular hiptesis sobre las causas de los resultados observados. Sin
embargo, para fundamentar inferencias (y sin una correccin adecuada),
este sesgado conjunto de observaciones presenta graves problemas porque,
de forma sistemtica, se han excluido del anlisis aquellas en las que la di
suasin funcion (en estadios preliminares del proceso). En consecuencia,
cuando se utilizan mal los casos para hacer una estimacin del ndice de
xito de la disuasin, el diseo genera un sesgo de seleccin como el que
es frecuente en los estudios de evaluacin de polticas (Achen y Snidal,
1989, p. 162).
3.1.2
Ejemplos de sesgo de seleccin producido por el mundo
Acaso nos impide evitar el sesgo de seleccin el optar por registros de ob

servaciones en vez de por una muestra? Se podra pensar que s, ya que pa
rece que en ese caso no hay en absoluto seleccin, pero no siempre ocurre
de ese modo. Por ejemplo, supongamos que queremos hacer una inferencia
descriptiva mediante una estimacin del grado de apoyo que tiene el Parti
do Liberal en el estado de Nueva York. Nuestra variable dependiente es el
porcentaje de votos que ha recibido el candidato (o candidatos) que avala
el partido en las circunscripciones en que se divide el estado para elegir su
asamblea. El problema es que en muchas circunscripciones electorales el
partido opta por no avalar a nadie y que, si no lo hace en aquellos lugares
en los que est seguro de que va a perder (y ste parece ser el caso), se pro
ducir un sesgo de seleccin cuando elijamos circunscripciones en las que
s haya avalado a algn candidato. En este ejemplo, la seleccin utilizada

form a parte del proceso poltico que estudiamos, pero sus consecuencias
para nuestra investigacin pueden ser exactamente las mismas que si hu
biramos producido el problema nosotros.
El sesgo que se produce cuando la seleccin de casos se correlaciona
con la variable dependiente es una de las dificultades ms habituales a las
que se enfrentan los investigadores que buscan pruebas en fuentes histri
cas, y entre ellos nos incluimos casi todos. La razn es que los procesos
histricos indican lo que ha de observarse en funcin de un conjunto de
criterios selectivos que no siempre se desprende claramente del registro.
Sin embargo, es esencial descubrir cmo se han producido esos datos. To
memos un ejemplo de otro campo: unas culturas crean esculturas de piedra
y otras de madera. Con el paso del tiempo, las primeras sobreviven, mien
tras que las segundas se pudren. En Europa, esta tendencia llev a algunos
historiadores del arte a subestimar la calidad y complejidad del arte africa
no antiguo, que sola utilizar madera, porque la historia haba ido elimi
nando de forma selectiva unas esculturas, a la vez que mantena otras. El
investigador cuidadoso debe siempre evaluar los sesgos de seleccin que
pudiera haber en las pruebas de que dispone: qu clase de acontecimientos
se han podido registrar? o cules es posible que se hayan dejado de lado?
Pensemos en otro ejemplo. Los cientficos sociales suelen partir de un
punto final que quieren explicar: por ejemplo, el peculiar sistema organi
zativo de los estados modernos. El investigador observa que hace bastante
tiempo (digamos, en 1500) haba una gran variedad de unidades organizati
vas en Europa, pero que, posteriormente (por ejemplo, en 1900), todas las
importantes, o casi todas, eran estados-nacin. Lo que el investigador debe
ra hacer es partir de las unidades existentes en 1500 y explicar las formas
organizativas posteriores mediante un nmero de variables limitado. Entre
los dos perodos muchas de las unidades de anlisis habrn desaparecido,
porque perdiere n guerras o fueron incorporadas a entidades mayores, mien
tras que otras hnbrn sobrevivido. Por lo tanto, mediante una categorizacin
cuidadosa, podramos obtener una variable dependiente que indicara si una
entidad que se haba convertido en estado-nacin exista todava en 1900 y,
si no era as, cundo haba desaparecido.
Sin embargo, sin darse cuenta, lo que muchos historiadores hacen es
bastante diferente. Como ha sealado Charles Tilly (1975, p. 15), comien
zan por hacer investigacin retrospectiva: seleccionan para su com pa
racin un pequeo nmero de estados de Europa occidental que todava
existan en el siglo xix o que existen en el xx. Por desgracia para esos in
vestigadores, Inglaterra, Francia, e incluso Espaa, son supervivientes de
una lucha despiadada en la que la mayora de los contendientes perdi. En
la Europa de 1500 haba unas quinientas unidades polticas, ms o menos
independientes, mientras que en la de 1900 existan alrededor de veinticin
co. No haba estado alemn en 1500, ni siquiera en 1800. Comparar, res
pecto a este punto, las historias de Francia, Alemania, Espaa, Blgica e In

glaterra (o las de cualquier otro grupo de pases en las pocas moderna y
contempornea) para arrojar luz sobre los procesos de configuracin del
Estado-nacin inclina la balanza de la investigacin hacia un cierto resulta
do que, en realidad, fue bastante excepcional.
Por lo tanto, con este procedimiento, la seleccin se realiza en funcin de
uri" valor de la variable dependiente: haber sobrevivido hasta 1900, lo cual
sesga los resultados de la investigacin reduciendo la media de efectos que se
atribuyen a las variables explicativas que distinguen los estados que han so
brevivido de los que han durado menos tiempo. Tilly y sus colegas (1975),
al darse cuenta del problema que planteaba el sesgo de seleccin, abandona
ron el enfoque retrospectivo para optar por una formulacin prospectiva del
objeto de su investigacin. Sin embargo, supongamos que no hubiera sido
posible realizar este enorme esfuerzo o que los autores hubieran deseado re
cabar los mejores datos disponibles para prepararse para un estudio ms am
plio. Podran haber vuelto a analizar los estudios retrospectivos de que dis
ponan, infiriendo que sus estimaciones de los efectos causales estaban, en
la mayora de las observaciones, sesgadas a la baja. Tendran que recordar
que, aunque los criterios antes descritos fueran completamente aplicables,
cualquier nueva utilizacin que se hiciera de ellos podra exagerar o subesti
mar el efecto causal. Sin embargo, para el verdadero efecto causal, la mejor
alternativa que poda salir de los defectuosos estudios retrospectivos era la
de subestimar, al menos, la media de los efectos causales, si se presupone
que las reglas mencionadas eran aplicables y que los criterios de seleccin
se correlacionaban con la variable dependiente.
3.2
Seleccionar en fundn de una variable explicativa
Seleccionar observaciones para un estudio mediante las categoras de la

variable explicativa principal no produce problemas inferenciales porque
nuestro procedimiento de seleccin no predetermina el resultado del estu
dio, ya que no hemos restringido el grado de variacin posible de la varia
ble dependiente. Al limitar el alcance de la variable causal clave podemos
reducir el carcter general de nuestra conclusin o la legtima certeza con la
que se puede mantener, pero no introducimos ningn sesgo. Seleccionar ca
sos a partir de los valores de esta variable nos permite controlarla dentro de
ese proceso. No se introducir sesgo, aunque la variable causal se correla
cione con la dependiente, porque ya hemos controlado esa variable explica
tiva8. De este modo, aunque la seleccin se realice en funcin de una varia
ble que se correlaciona con la dependiente, es posible evitar el sesgo si se
controla la primera en el anlisis.
Si nos remitimos al grfico 4.1 podemos ver fcilmente que seleccionar
en funcin de una variable explicativa no causa sesgo. Si restringimos esta
cifra para excluir todas aquellas observaciones en las que la variable expli
cativa es igual a uno, la lgica de esta cantidad no se ver afectada y no
cambiar la lnea que atraviesa los puntos. En cierto modo, al tener ahora
menos observaciones y menos inform acin disponible para el problema
inferencial, ser un poco menos segura, pero, como promedio, no habr
sesgo9.
En consecuencia, se puede evitar el sesgo seleccionando casos en fun
cin de la variable causal clave, pero tambin podemos lograr el mismo ob
jetivo utilizando las categoras de una variable de control (siempre que, en
trminos causales, sta preceda a la variable causal clave, como ha de ser
siempre en las variables de control). Los experimentos casi siempre selec
cionan en funcin de las variables explicativas. Las unidades se crean cuan
do se manipulan dichas variables (administrando un frmaco, por ejemplo)
y despus se observa lo que le ocurre a la variable dependiente (si mejora la
salud del paciente). En este caso, sera difcil seleccionar a partir de esta l
tima variable, ya que su valor no se conoce hasta despus del experimento.
Sin embargo, la mayora de los experimentos no son en absoluto perfectos,
y podemos cometer el error de seleccionar en funcin de la variable depen
diente, aplicando tratamientos a los pacientes que, sin que nos demos cuen
ta, se basan en la respuesta esperada.
Para dar otro ejemplo, pensemos que, si estamos investigando las conse
cuencias de la discriminacin racial en las notas escolares de los nios ne
gros, ser bastante razonable seleccionar varias escuelas en las que haya
poca discriminacin y otras en las que haya mucha. Aunque nuestro criterio
de seleccin se correlacione con la variable dependiente (los negros obtie
nen peores notas en las escuelas en las que hay segregacin), esto no ocu
rrir despus de que tengamos en cuenta el efecto de las variables explicati
vas, ya que los valores de una de ellas determinan el criterio de seleccin.
Tambin podemos evitar el sesgo haciendo la seleccin a partir de una
variable irrelevante para nuestro estudio (que no influye en nuestra variable
dependiente). Por ejemplo, para estudiar el efecto de la discriminacin en
las notas, supongamos que alguien elige todas las escuelas cuyo nombre
comienza por la letra A. Evidentemente, aunque este criterio no es reco
mendable, si la variable irrelevante no representa a alguna otra que se co
rrelaciona con la dependiente, no producir sesgo.
Cuando resulta muy til seleccionar en funcin de una variable irrele
vante hay que realizar un anlisis secundario de los datos que existen. Por
ejemplo, supongamos que nos interesan los factores que hacen que triunfe
un golpe de Estado. Nuestra hiptesis principal es que estas intentonas sue
len tener ms xito con un jefe militar que con uno civil. Supongamos que
encontramos un estudio de golpes de Estado que hubiera seleccionado los
casos en funcin de en qu medida exista en cada pas una jerarqua buro
crtica antes del golpe. Podramos utilizar tales datos aunque este factor
fuera irrelevante para nuestra investigacin. Sin embargo, para ir sobre se
guro, no sera difcil hacer que esta variable fuera un control en nuestro
anlisis de las consecuencias que genera tener lderes militares o civiles. Se
incluira este control si estudiramos con qu frecuencia triunfan los golpes
de Estado dirigidos por uno u otro tipo de lderes, en pases en los que hay
o no una jerarqua burocrtica. La presencia de este control nos ayudara a
evitar el sesgo de seleccin, y su efecto causal proporcionara informacin
quiz importante sobre el proceso que se haba utilizado realmente para se
leccionar las observaciones.
3.3
Otros tipos de sesgo de seleccin
En todos los ejemplos anteriores, el sesgo de seleccin apareca al elegir

unidades segn algn criterio que se correlacionaba con la variable depen
diente desde el principio o despus de haber tenido en cuenta las explicati
vas. Cuando la seleccin recibe este tipo de influencia, los efectos causales
estimados siempre tienen valores que estn por debajo del nivel real. Este es,
con mucho, el tipo de sesgo de seleccin ms frecuente, tanto en la investi
gacin cualitativa como en la cuantitativa. Sin embargo, hay que sealar
otro sesgo de este tipo, ya que sus consecuencias pueden ser precisamente
las contrarias y producir una sobreestimacin del efecto causal.
Supongamos que el efecto causal de alguna variable se transforma de
una observacin a otra. Esta posibilidad es real, aunque no nos hayamos
centrado en ella. En el apartado 1 del captulo 3 definimos el efecto causal
en una sola unidad y dejamos que variara en cada una de ellas. Suponga
mos, por ejemplo, que nos interesara el efecto causal que tiene la pobreza
sobre la violencia poltica en los pases de Amrica Latina. Esta relacin
podra ser ms acusada en algunos de ellos, como all donde la historia re
ciente ofrece ejemplos de este tipo de violencia. En esta situacin, en la que
los efectos causales varan de una unidad a otra, un criterio de seleccin
que se correlacione con el tamao del efecto causal conducir a un sesgo en
las estimaciones de los efectos causales medios. Por lo tanto, si slo lleva
mos a cabo nuestro estudio en pases en los que ha habido violencia polti
ca en la historia reciente, pero pretendemos generalizar nuestras conclusio
nes a toda Latinoamrica, es posible que exageremos el efecto causal que
estamos estudiando. Si seleccionamos unidades con efectos causales acusa
dos y hacemos una media de ellos durante la estimacin, el efecto causal
medio resultante ser una sobreestimacin. Del mismo modo, si selecciona
mos unidades con efectos dbiles, el clculo aproximado del efecto causal
medio tendr un valor menor que el real.
4.
Seleccin intencionada de observaciones
En la investigacin poltica, lo normal es que no tengamos control sobre los

valores de nuestras variables explicativas; los adjudica la naturaleza o la
historia, pero no nosotros. En esta situacin tan comn la principal in
fluencia que podemos recibir al disear la investigacin afecta a la selec
cin de los casos y de las observaciones. Como hemos visto en el apartado
2 de este captulo, cuando logramos centrarnos slo en un reducido nmero
de observaciones, no suele ser necesario recurrir a criterios aleatorios. En
general, la seleccin debe hacerse de una forma intencionada, que est en
consonancia con los objetivos y estrategia de nuestra investigacin.
Seleccionar de manera intencionada las observaciones implica que, como
mnimo, conocemos de antemano los valores de ciertas variables relevantes
y descartamos la seleccin aleatoria. Tendremos menos posibilidades de
equivocarnos si los casos se seleccionan a partir de categoras de las varia
bles explicativas. De este modo, la propia investigacin consistir en encon
trar los valores de la variable dependiente. Sin embargo, en la prctica, no
solemos tener ms que datos fragmentarios sobre los valores de muchas de
nuestras variables, incluso antes de seleccionar las observaciones. Esto pue
de ser peligroso, ya que sin damos cuenta podemos introducir un sesgo de
seleccin que quiz refuerce nuestra hiptesis previa. A continuacin anali
zamos los diversos mtodos de seleccin intencionada de observaciones.
4.1
Seleccionar observaciones en funcin de la variable explicativa
Tal como acabamos de sealar, los mejores diseos intencionados eligen

sus observaciones de manera que la variable explicativa (y cualquiera de las
de control) pueda cambiar, al margen de cules sean los valores de las de
pendientes. stos slo se descubren durante la investigacin; despus se ex
trae la primera inferencia causal, examinando de qu manera vara la distri
bucin de resultados en la variable dependiente si se dan ciertos valores en
las explicativas.
Supongamos, por ejemplo, que nos interesaran las consecuencias que tu
vieron durante la Guerra Fra los tratados formales de control de armamen
tos en las decisiones que tomaron los Estados Unidos y la Unin Sovitica
para conseguir armas. En consecuencia, nuestra variable causal clave sera
la existencia de un tratado formal de control de armamento que afectara al
sistema defensivo de un pas determinado. Podramos elegir un conjunto de
tipos de armas unas contempladas por las limitaciones de los tratados y
otras no que cambiara en relacin con nuestra variable explicativa. La
dependiente, que no hemos utilizado para seleccionar, podra ser \a fre
cuencia con la que se reemplaza el armamento. Si los dos conjuntos de ob
servaciones estn bien equiparados en las variables de control y se resuel
ven satisfactoriamente problemas como el de la endogeneidad, este diseo

nos perm itir extraer inferencias vlidas sobre las consecuencias de los
acuerdos de control de armamentos.
A veces slo nos interesar una de las diversas variables explicativas,
que parece influir de manera sustancial en la dependiente. Cuando se d tal
situacin, habr que controlar la variable que no es primordial (o la que no
lo es en ese momento). Un ejemplo de este procedimiento nos lo proporcio
na Jack Snyder (1991), quien hizo una seleccin de los pases que conside
raba principales competidores por el poder en la poca contempornea
con el fin de estudiar su grado de expansin excesiva (la variable depen
diente). Una variable muy importante para explicar este proceso expansivo
es el podero militar, pero esta causa es tan evidente y se halla tan bien do
cumentada que Snyder no quiso invertir ms recursos en hacer una nueva
estimacin de sus efectos. De hecho, control este factor eligiendo nica
mente naciones en las que su valor era muy alto. Al mantener prcticamen
te constante esta transcendental variable de control, Snyder no pudo hacer
inferencias sobre las consecuencias que tena el podero militar sobre el ex
ceso de expansin, pero s logr centrarse en las variables explicativas que
le interesaban sin padecer los efectos del sesgo de la variable omitida.
Aparte de estos aspectos relativos al diseo, la investigacin de Snyder tuvo
un carcter exploratorio, ya que ni siquiera identific todas sus variables
explicativas antes de comenzarla (Snyder, 1991, pp. 61-65). Probablemente,
este carcter abierto hizo que considerara ideas que, de no haber sido as,
no se hubiera planteado, pero tambin tuvo como consecuencia que, final
mente, las preguntas resueltas tuvieran una respuesta que no era tan efi
ciente como hubiera podido ser. En concreto, el abanico de variaciones po
sibles de las variables explicativas que le interesaban probablemente no fue
tan amplio como lo era en potencia. Adems, no se evalu la teora ms
que en el conjunto de datos con el que se haba formulado.
Como venimos sealando en este libro, las recomendaciones puristas
seleccionar siempre en funcin de las variables explicativas y nunca a
partir de las dependientes suelen ser poco realistas para la investigacin
cualitativa. No todo est perdido cuando hay que tener en cuenta los valores
de la variable dependiente al recoger los datos o cuando aquellos de los que
se dispone ya tienen en cuenta dichos valores. An puede obtenerse infor
macin sobre los efectos causales, pero si no tenemos mucho cuidado es
probable que aparezca algn sesgo.
4.2
Seleccionar un abanico de valores de la variable dependiente
Como alternativa a la eleccin de observaciones en funcin de la variable

explicativa, se podra partir para seleccionarlas de un abanico de valores de
la dependiente. Las investigaciones suelen comenzar del siguiente modo:
encontramos algunas fascinantes variaciones en un comportamiento que

queremos explicar. En este diseo de tipo retrospectivo (que en epidemiolo
ga se denomina estudio de control de caso), tomamos aquellas observa
ciones que adoptan valores especialm ente altos o bajos en la variable
dependiente. Como hemos subrayado, aunque este proceso de seleccin
pueda ayudamos a hacer inferencias causales, carece de utilidad para hacer
las descriptivas que se refieren a la variable dependiente. Adems, la falta
de datos descriptivos sistemticos y la mayor posibilidad de que aparezcan
otros problemas debidos a posibles no linealidades o efectos causales varia
bles hacen que las inferencias causales que genera este procedimiento no
suelan ser vlidas.
Un diseo de investigacin retrospectivo puede ayudamos a recabar in
formacin valiosa sobre la plausibilidad emprica de una inferencia causal,
ya que bien podramos darnos cuenta de que los valores altos y bajos de la
variable dependiente estn asociados, respectivamente, con los valores de
uno u otro signo que se observan en las posibles variables explicativas. Sin
embargo, para que este diseo nos conduzca a inferencias causales que ten
gan sentido aunque sean necesariamente limitadas , es esencial que se
leccionemos las observaciones sin tener en cuenta los valores de las varia
bles explicativas. No hay que buscar observaciones que se ajusten (o no se
ajusten) a nuestra teora inicial. Las observaciones han de ser tan represen
tativas como sea posible en la poblacin sobre la que queremos generalizar.
Si percibimos que los valores altos y bajos de las variables explicativas po
tenciales se corresponden, respectivamente, con uno u otro tipo de valores
en la variable dependiente, quiz tengamos que disear un estudio en el que
las observaciones slo se seleccionen a partir de la variable o variables
explicativas, con el fin de calibrar si nuestra hiptesis es correcta. Lo mni
mo es que, al principio, los resultados sean inciertos o, de lo contrario, no
aprenderemos nada. Para que la incertidumbre afecte a las inferencias cau
sales hay que dejar que los valores de nuestra variable explicativa o depen
diente se vean determinados por la situacin del estudio.
Por ejemplo, podramos observar variaciones sorprendentes en los con
flictos violentos que tienen lugar entre los estados y especular con la posi
bilidad de que los produzcan diferentes formas de gobierno. Podra valer la
pena comenzar, de forma exploratoria, con un examen cuidadoso de algu
nas relaciones bilaterales en las que la guerra es frecuente y otras que se ca
ractericen por un carcter pacfico excepcional. Supongamos que viramos
que las observaciones de guerra estn asociadas a relaciones en las que par
ticipa, al menos, una autocracia en perodo de modernizacin y que las de
paz afectan a relaciones entre dos democracias estables. Esta explicacin
exploratoria generara una hiptesis ms precisa que la inicial. No podra
mos decir que hemos confirmado nuestra hiptesis, ya que seguiramos sin
tener una visin clara de las pautas generales (al haber seleccionado las ob
servaciones a partir de la variable dependiente), pero s podramos vemos
empujados a contrastarla mediante un diseo que seleccionara las observa

ciones mediante la variable explicativa. Segn este nuevo proyecto, elegi
ramos observaciones sin tener en cuenta el grado de conflicto militar ob
servado, intentando controlar otras variables causales potencialm ente
relevantes y tratando de determ inar si la variacin en el tipo de rgimen
est asociada con el nivel de conflicto militar.
4.3
Seleccionar observaciones utilizando tanto las variables

explicativas como las dependientes
Resulta peligroso seleccionar observaciones utilizando intencionadamente

tanto las variables explicativas como las dependientes, porque, al hacerlo,
es fcil que, sin darnos cuenta, introduzcamos un sesgo en el resultado. El
error ms grande consiste en seleccionar observaciones en las que las varia
bles explicativas y la dependiente cambian al unsono de una manera que se
sabe se ajusta a la hiptesis que la investigacin trata de contrastar. Por
ejemplo, quiz queramos com probar si es cierto que los sistemas autori
tarios (que acaban con las organizaciones sindicales y con las reivindica
ciones laborales) conducen a mayores ndices de crecimiento econmico.
Podramos seleccionar observaciones que cambien en ambos tipos de varia
bles, pero seleccionndolas a propsito para que todas las relativas al au
toritarismo arrojen altos ndices de crecimiento y para que las referidas a
sistemas no autoritarios registren valores bajos en el mismo indicador. Un
diseo as no describir ni explicar nada, ya que, sin examinar un conjunto
de observaciones representativo no se puede determinar si el crecimiento
econmico es tanto o ms probable en aquellas observaciones en las que
hay un rgimen democrtico que permite la actividad sindical.
A pesar del riesgo que conlleva hacer una seleccin a partir de las varia
bles explicativas y de la dependiente, puede que haya unos pocos ejemplos
de estudios con un nmero limitado de observaciones en los que tenga cier
to sentido utilizar un mtodo que baraje informacin sobre los valores de
uno y otro tipo de variables, aunque esta tcnica sea peligrosa y haya que
tener mucho cuidado al utilizarla. Por ejemplo, supongamos que la distribu
cin de los valores de nuestra variable dependiente estuviera seriamente
sesgada, de modo que la mayora de las observaciones tomaran uno de sus
valores. Si seleccionramos los valores a partir del cambio de la variable
explicativa y dejramos que los de la dependiente cayeran donde pudie
ran, quiz no obtuviramos variacin en esta ltima. Nada en este resulta
do descalificara el anlisis de los datos. De hecho, cuando los valores de la
variable dependiente son los mismos, al margen de cules sean los de las
explicativas, nos encontraremos ante un caso claro de efecto causal cero.
Esta nica situacin slo sera preocupante si creyramos que el autntico
efecto causal es muy pequeo, pero no cero. En estudios con un n pequeo,
no es probable que podamos distinguir con mucha certeza entre un efecto

estimado con valor cero y otro efecto pequeo que no tenga este valor. En
esta situacin, la solucin ms directa ser incrementar el nmero de obser
vaciones. Tambin se pueden seleccionar observaciones que se basen en va
lores muy extremos de las variables explicativas, de manera que sea ms f
cil reconocer cualquier pequeo efecto causal. S estas medidas no son
suficientes, la seleccin a partir de las variables explicativas y de la depen
diente (pero sin utilizarlas simultneamente) puede mejorar el diseo de in
vestigacin lo suficiente como para que se encuentre el efecto que buscamos
(vase el apartado 3 del captulo 6 si se desea encontrar ms sugerencias).
Por lo tanto, quiz tenga sentido utilizar tcnicas de muestreo para elegir
observaciones partiendo primero de la variacin de la variable explicativa,
pero hacindolo de tal manera que se incluyan tambin las observaciones
que tengan el valor atpico de la variable dependiente. Sin embargo, al hacer
lo as, es importante no predeterminar el valor de la variable explicativa con
la que se asocia la dependiente. Adems, si se utiliza este procedimiento, hay
que ser consciente de las posibilidades de sesgo que introduce y, por lo tanto,
del valor limitado de nuestras inferencias. Dicho de otro modo, en estos ca
sos atpicos, podemos seleccionar en funcin de los valores de las variables
explicativas y de los de la dependiente, pero no utilizndolos a la v e z l0.
Por ejemplo, supongamos que planteramos la hiptesis de que, en cier
tas organizaciones internacionales, existe una determinada pauta de perte
nencia que inhibe de forma significativa el estallido de conflictos violentos
entre cualquier pareja de estados miembros. Siguiendo el mtodo que pre
ferimos, el de seleccionar slo en funcin de la variable explicativa, nues
tras observaciones se compondran de parejas de estados cuya pertenencia
a organizaciones internacionales cambiara de un perodo especfico a otro.
Supongamos tambin que fuera difcil determinar si existe la pauta de per
tenencia indicada, de modo que slo podramos examinar un nmero de ob
servaciones relativamente pequeo: slo algunas parejas de pases y no
cientos o miles de ellas. La dificultad para nuestro mtodo surgira si los
conflictos fueran escasos: por ejemplo, si slo se hubiera registrado uno en
tre dos pases durante el perodo de estudio. En esta situacin, podramos
seleccionar parejas de pases que cambiaran en relacin a la variable expli
cativa (pertenencia a una organizacin), pero nos daramos cuenta de que
ninguna de ellas haba sufrido conflictos violentos.
En tales condiciones, quiz fuera aconsejable algn procedimiento de
seleccin mixto. Podramos recoger observaciones a partir de algn cambio
en la variable explicativa (ciertas parejas de naciones con pautas especfi
cas de pertenencia a organizaciones y otras que no las tuvieran) y seleccio
nar un nmero de observaciones mayor del que tenamos intencin de estu
diar. D espus podram os dividir estas potenciales observaciones en dos
categoras, en funcin de si se haba registrado o no un conflicto armado
entre las naciones en un perodo concreto, y elegir despus un nmero des-
proporcionado de observaciones de la categora en la que s lo hubo, con el

fin de incluir ejemplos de am bas en el conjunto de observaciones final.
Este procedimiento habra que llevarlo a cabo de form a que fuera indepen
diente de nuestro conocimiento de las observaciones en lo relativo a la va
riable explicativa. Por ejemplo, podramos tomar observaciones de forma
aleatoria del grupo en el que no se haba registrado conflicto y seleccionar
todas las del grupo en el que s lo haba habido. Posteriormente, si en el
conjunto de observaciones final se observara una estrecha relacin entre las
pautas de pertenencia a organizaciones y el conflicto de tipo militar, podra
mos hacer inferencias causales.
El estudio que realiz Atul Kohli (1987) sobre el papel del Estado indio
en las polticas contra la pobreza pone de manifiesto los condicionantes
que sufre la seleccin de observaciones en investigaciones con un n peque
o, las consecuencias que tienen para la extraccin de inferencias causales
vlidas y algunas formas de superarlos. A Kohli le interesaba la influencia
de las estructuras de autoridad gubernamentales y de los tipos de regmenes
en la persistencia de polticas contra la pobreza en los pases en desarrollo.
Su argumento, dicho en pocas palabras, es que los regmenes cuya ideolo
ga les hace comprometerse claramente con la ayuda a los pobres, que po
nen trabas a la participacin en el poder de las clases altas y que disponen
de gran capacidad organizativa crearn polticas eficientes para alcanzar su
objetivo. Los regmenes que carecen de ese compromiso ideolgico, que
tienen apoyos interclasistas y que no disponen de una organizacin bien tra
bada no lograrn desarrollar de manera eficiente este tipo de polticas, aun
que se comprometan abiertamente a ello.
Kohli se centr en la India, que es donde estn sus intereses a la hora de
investigar y para los que cuenta con conocimientos lingsticos. Sus prime
ras observaciones fueron los estados indios. Como sealaba: El carcter
federal del sistema poltico indio permite realizar dentro del pas un anlisis
desagregado y comparativo. Por debajo del gobierno federal, los de los es
tados (o provincias) de la India tienen un papel considerable en la formula
cin y ejecucin de las polticas agrarias. Las variaciones de tipo poltico
que se producen en el nivel estatal pueden hacer que cambie el grado de
eficiencia de los programas que luchan contra la pobreza (Kohli, 1987,
pp. 3-4). El autor utiliz una versin poco estricta (pero apropiada) de la
homogeneidad de las unidades, la del efecto constante, segn la cual el
efecto causal era idntico en los estados en los que se daban diferentes ni
veles de sus factores explicativos clave (o sea, los componentes ideolgico,
de clase y organizativo que, segn la hiptesis, conducan a polticas de lu
cha contra la pobreza). Slo pudo evaluar su hiptesis causal comparando
la situacin de la variable dependiente en diferentes estados, partiendo, a la
vez, de efecto constante en cada uno de ellos.
Para Kohli, una muestra de los estados indios resultaba til porque stos
eran relativamente similares. Por lo menos se acercan ms que la mayora
ttm am
155-
de los pases independientes [...] al presupuesto que permite comparar si se

mantienen ciertas constantes (Kohli, 1987, p. 4). Pero, qu estados haba
que escoger? Las investigaciones en profundidad que quera realizar (a par
tir de dos viajes bien planificados al pas) excluan la posibilidad de ocu
parse de todos ellos. Al tener estos condicionantes, slo pudo elegir tres es
tados. H aber seleccionado estas tres unidades de m anera aleatoria no
hubiera sido inteligente, ya que este procedimiento slo ofrece garantas
cuando se utiliza en un estudio con un n grande. La mayora de los estados
indios presentaban las caractersticas que impiden el desarrollo de polticas
contra la pobreza y, por lo tanto, no solan tenerlas. De hecho, slo en el
gobierno de Bengala Occidental se observaban rasgos que pudieran impul
sarlas. Como seala Kohli, Bengala deba estar presente en la muestra.
Despus aadi dos estados ms: Uttar Pradesh, donde haba pocos progra
mas de lucha contra la pobreza, y Kamatake, que representaba un punto in
termedio entre los anteriores. Los tres estados fueron seleccionados nte
gramente a partir de la variable dependiente ... porque representan una
gradacin, desde el valor mximo al mnimo, en los esfuerzos que hacen
los gobiernos para mitigar la pobreza rural (Kohli, 1987, p. 7).
El problema de este estudio era que los valores de las variables explicati
vas tambin se conocan; de hecho, la seleccin se realiz a partir de ellas y
tambin de la variable dependiente. En estas circunstancias, el diseo era
impreciso y no daba informacin sobre la hiptesis causal. Es decir, sta no
poda evaluarse con observaciones que, desde el principio, se saba que
concordaban con ella.
Entonces, tena algn valor el estudio? No mucho si Kohli slo estaba
contrastando su hiptesis en estos tres estados. Por fortuna, hizo bastantes
ms cosas. Su estudio se conceptualiz en funcin de tres observaciones,
pero, como muchos otros que a primera vista parecen tener un n pequeo,
se barajaban muchas ms. De hecho, era un estudio con un n grande. Kohli
fue ms all del simple descubrimiento de que en el caso de los tres estados
analizados las variables explicativas y la dependiente concordaban con su
hiptesis, y lo hizo ocupndose de las numerosas consecuencias observa
bles de su hiptesis que aparecan tanto en los estados indios que estudiaba
como en otros pases. Como esta forma de abordar estudios en los que n es
aparentemente pequeo constituye el tema central del siguiente captulo, en
el apartado 3.1 del captulo 6 describiremos la estrategia que sigui Kohli
para enfrentarse a ello.
Sin embargo, en un nivel de anlisis agregado, Kohli podra haber hecho
ms para mejorar sus inferencias causales. Por ejemplo, probablemente saba,
o podra haber calibrado, los valores de sus variables explicativas y depen
diente en casi todos los estados indios. Su libro habra mejorado en gran me
dida si hubiera incluido un captulo corto para analizarlos brevemente. As ha
bra dado una idea clara de la veracidad general de su hiptesis causal y habra
podido seleccionar sus tres estudios de caso segn reglas ms sistemticas.
4.4
Seleccionar observaciones de manera que la variable causal

clave sea constante
A veces los cientficos sociales disean investigaciones de manera que la

variable explicativa que constituye la base de la seleccin se m antiene
constante. Este enfoque es claramente deficiente, porque el efecto causal de
una variable explicativa que no cambia no puede juzgarse. Por lo tanto, no
es probable que sea productivo al menos en s mismo un diseo que
pretenda mostrar el efecto que tiene un rasgo constante del medio. Sin em
bargo, la mayora de los trabajos forman parte de un cuerpo bibliogrfico o
tradicin investigadora (vase el apartado 2.1 del captulo 1), y, por consi
guiente, es probable que de antemano se disponga de cierta informacin
til. Por ejemplo, el abanico usual de valores de la variable dependiente pue
de ser muy conocido cuando la explicativa adopta un determinado valor.
Quiz el investigador que realiza un estudio para averiguar cul es ese aba
nico de valores cuando la variable explicativa tiene otro valor sea el prime
ro en hacer una estimacin del efecto causal.
Pensemos en el siguiente ejemplo, en el que una investigacin realizada
manteniendo constante el valor de la variable explicativa condujo a una hi
ptesis razonable, pero provisional, sobre el efecto causal, la cual, a su vez,
fue refutada en un estudio posterior en el que dicha variable tena otro va
lor. En un antiguo estudio sobre el impacto de la industrializacin, Inkeles
y Rossi (1956) haban comparado el prestigio que tenan ciertas ocupacio
nes en diversos pases industrializados. Se haban dado cuenta de que este
indicador era muy parecido en pases que, aparte de ser industrializados, eran
muy diferentes. Llegaron a la conclusin de que la industrializacin era la
variable causal que determinaba la especfica jerarqua del prestigio que ha
ban observado. A falta de cambios en su variable explicativa (todas las na
ciones estudiadas eran industrializadas), no hubiera resultado apropiado ha
cer una firme inferencia causal, pero s era razonable llegar a una conclusin
ms provisional que haca la hiptesis ms plausible. Sin embargo, otros in
vestigadores reprodujeron este estudio en Filipinas e Indonesia (pases no
industrializados) cambiando as el valor de la variable explicativa y en
contraron una jerarqua del prestigio similar, lo cual pona en cuestin el
efecto causal achacado a la industrializacin (vase Zelditch, 1971).
El ejemplo anterior muestra de qu manera una serie de proyectos de in
vestigacin puede superar los problemas que plantea hacer inferencias vli
das cuando el estudio original carece de cambios en la variable explicativa.
David Laitin (1986) proporciona un instructivo ejemplo de cmo un nico
investigador puede solucionar este tipo de problema en una sucesin de es
tudios. En el que realiz sobre el impacto del cambio religioso en el medio
poltico de los yoruba nigerianos, analiza por qu no haba podido superar
este problema en su investigacin anterior sobre Somalia. Segn l mismo
seala, la religin, que es su variable explicativa, es una constante en toda
H3SSS
157
Somalia y, adems, tiene una relacin multicolineal (vase el apartado 1 de

este mismo captulo) con otras variables, lo cual hace imposible que se as
le su efecto causal. La investigacin de campo en Somalia me hizo pre
guntarme sobre el impacto independiente que tena el cambio religioso en
la poltica, pero llevar a cabo ms investigacin de este tipo en el mismo
pas no me habra permitido afrontar esa pregunta de manera sistemtica.
Cmo puede calibrarse el impacto del Islam en una sociedad en la que to
dos son musulmanes? Adems, toda la poblacin habla somal y casi todos
comparten una herencia nmada. Prcticamente todos los somales han re
cibido la misma tradicin potica. Todos los rasgos comunes que les llevan
a actuar pueden atribuirse a tradiciones somales poticas, nmadas o lin
gsticas, ms que a la religiosa (1986, p. 186). Laitin supera este proble
ma centrando su atencin en los yoruba de Nigeria, que estn divididos en
tre musulmanes y cristianos. En el captulo 5 veremos cmo lo hace.
4.5
Seleccionar observaciones de manera que la variable

dependiente sea constante
Tampoco podemos aprender nada sobre el efecto causal de un estudio que

seleccione sus observaciones de modo que la variable dependiente no vare,
pero la bibliografa del rea puede aportar la suficiente informacin como
para perm itir que se hagan inferencias causales vlidas.
De ah que haya que cambiar, si es posible, un estudio acerca de por qu
nunca se lleg a un determinado resultado, para hacer que varen la variable
dependiente y las explicativas. Por ejemplo, si la pregunta de la investigacin
es por qu los terratenientes no usaban las cantidades ptimas de fertilizantes
para mantener la productividad de las plantaciones de Carolina del Sur antes
de la guerra civil estadounidense, poco podremos aprender del com
portamiento de ese estado si slo investigamos en l y si todos sus terrate
nientes se comportaban del mismo modo. En tal caso, no habra varianza en
la variable dependiente y esta falta de cambios sera por completo imputable
al investigador y, por tanto, no aportara ninguna informacin adicional. Si al
gunas plantaciones de Virginia s utilizaban fertilizantes, podra tener sentido
observar ambos estados para explicar la variacin respecto al uso del produc
to; al menos hay una diferencia entre los estados que constituirn nuestra va
riable causal que puede explicar el uso de fertilizantes. Por otra parte, si todos
los estudios anteriores se hubieran realizado en estados que no utilizaban este
producto, ocuparse de uno en el que los terratenientes s recurran a l podra
constituir una considerable aportacin a lo escrito sobre el tema. Por lo me
nos, este enfoque posibilitara una estimacin del efecto causal.
Podemos mencionar otro ejemplo: a pesar del miedo de toda una genera
cin y de los sombros pronsticos de muchos politlogos, las armas nuclea
res no se han utilizado como arma de guerra desde 1945. Sin embargo, aun
que no se haya producido un conflicto nuclear, parece interesante intentar

comprender en qu condiciones podra tener lugar. Est claro que ste es un
caso extremo de seleccin a partir de la variable dependiente en el que sta
se mantiene constante. Sin embargo, como muchos autores del rea sealan
fervientemente, puede que las armas nucleares no se hayan utilizado por
que el valor de la variable explicativa (un mundo en el que haba, al menos,
dos grandes potencias nucleares) se ha mantenido constante durante todo el
perodo. A menos que reformulemos el problema, no servir de nada hacer
una estimacin de la inferencia causal por medio de variables explicati
vas o dependientes constantes. En el apartado 6.3 del captulo 6 mostrare
mos cmo solucionar este problema en el presente ejemplo.
Los investigadores sociales a veces utilizan un enfoque retrospectivo simi
lar al de los Centros de control de enfermedades (CCE), que basan su selec
cin en valores extremos, pero constantes, de la variable dependiente. Un CCE
identifica un conglomerado cancergeno (un grupo de personas que padece
el mismo tipo de cncer en la misma rea geogrfica); despus busca en el
medio algn factor qumico o de otro tipo (la variable explicativa principal)
que pueda haber producido todos los cnceres (la variable dependiente). Estos
estudios, en los que las observaciones se seleccionan a partir de valores extre
mos de la variable dependiente, son razonablemente vlidos porque existen
bastantes datos sobre los niveles normales de las variables explicativas. Aun
que casi todos los estudios de las CCE sean negativos o poco concluyentes, a
veces s encuentran algn componente qumico sospechoso. Cuando no hay
pruebas anteriores de que ese elemento produzca cncer, el CCE suele encar
gar un estudio en el que las observaciones se seleccionan, si es posible, a partir
de la variable explicativa (variacin en la presencia o ausencia del componen
te), con el fin de que la inferencia causal sea ms fiable.
Hay veces en que los investigadores sociales utilizan este enfoque cuan
do detectan la existencia de un determinado conglomerado poltico (una
comunidad o regin en la que hay una larga tradicin de radicalismo o vio
lencia de signo poltico, o cualquier otro rasgo) e intentan encontrar lo que
tiene de especial esa rea. Al igual que en el estudio de los CCE, si en la
investigacin aparecen correlaciones sugestivas, no hay que considerar que
confirman nuestra hiptesis; nicamente que indican que merece la pena
disear un estudio que seleccione a partir de la supuesta variable explicati
va, dejando a la vez que vare la dependiente (el radicalismo o la violencia
de signo poltico).
5.
Comntanos finales
En este captulo hemos analizado cmo se pueden seleccionar observacio

nes para conseguir un diseo que minimice el sesgo relativo al proceso de
seleccin. Como no se pueden conseguir diseos perfectos, hemos criticado
los procesos de seleccin sugiriendo, a la vez, estrategias imperfectas pero

tiles que pueden damos cierto control sobre el problema que plantea el es
tudio. AI fin y al cabo, nuestro objetivo es lograr un diseo de investigacin
que seleccione en funcin de las variables explicativas presentes en nuestra
teora y que permita el cambio de la variable dependiente. Sin embargo, al
encaminarnos hacia esa meta, puede que sea til utilizar diseos que tengan
en cuenta los valores observados de la variable dependiente; pero al investi
gador que lo haga hay que aconsejarle suma cautela. Nuestro objetivo pri
mordial es obtener ms informacin relevante para contrastar nuestra teo
ra, sin por ello introducir un sesgo que ponga en peligro la calidad de las
inferencias.
5.
Entender qu debe
evitarse
En el captulo 4 analizamos cmo haba que elaborar un estudio mediante

un diseo de investigacin preciso en el que los procedimientos de selec
cin de observaciones hicieran posibles inferencias causales vlidas. Sin
embargo, realizar bien esta tarea es necesario pero no suficiente para extraer
tales inferencias, ya que hay posteriores errores de anlisis que pueden
destruir el trabajo que antes se ha hecho bien. En este captulo vamos a es
tudiar de qu manera, una vez seleccionadas las observaciones para el an
lisis, es posible comprender las causas de la ineficiencia y del sesgo y redu
cirlas a proporciones manejables. Posteriormente, nos ocuparemos de cmo
podemos controlar la investigacin con el fin de enfrentarnos adecuada
mente a estos problemas.
Para analizar la falta de eficiencia y el sesgo vamos a recordar los crite
rios de evaluacin de inferencias que presentam os en el apartado 7 del
captulo 2 y en el 4 del captulo 3. Si tenemos un diseo de investigacin
preciso, tenemos que centramos en los dos problemas clave que se van a
estudiar en este captulo: sesgo e ineficiencia. Para entender estos concep
tos resulta til imaginarse las inferencias como estimaciones de puntos con
cretos flanqueados por los extremos de un intervalo. Por ejemplo, podra
mos suponer que una persona tiene cuarenta aos, dos arriba, dos abajo.
Esta cifra es nuestro mejor clculo (la estimacin), que el intervalo que hay
entre treinta y ocho y cuarenta y dos sita en su centro, con una estimacin
de nuestra incertidumbre (la amplitud del intervalo). Queremos elegir el in
tervalo de manera que la verdadera edad est dentro de l durante mucho
s w
161
tiempo. La fa lta de sesgo tiene que ver con el hecho de centrar un intervalo
cerca de la estimacin correcta, mientras que la eficiencia se relaciona con
el estrechamiento de un intervalo que se ha centrado correctamente.
Estas definiciones de falta de sesgo y de eficiencia son siempre aplica
bles, independientemente de que se quieran hacer inferencias descriptivas
como en el ejemplo de la edad o causales. Si, por ejemplo, queremos
hacer una estimacin del efecto que tienen los estudios en la renta (los in
gresos monetarios que se perciben por cada ao de estudio), tendremos un
punto de estimacin del efecto que estar flanqueado por un intervalo que
refleja nuestra incertidumbre respecto a la cantidad exacta. Necesitaremos
un intervalo que sea lo ms estrecho posible (para una mayor eficiencia) y
cuyo centro est cerca de la estimacin correcta (para evitar sesgos); tam
bin ser necesario que el clculo aproximado del ancho del intervalo re
presente sinceramente nuestra incertidumbre.
En este captulo nos centramos en las causas del sesgo y de la ineficiencia, desde ese primer momento del estudio en el que pretendemos mejorar
la calidad de la informacin hasta cuando llegamos a extraer inferencias
causales. En el apartado 1 analizamos los errores de medida que pueden
sesgar nuestros resultados y hacerlos tambin menos eficientes. Posterior
mente, en el apartado 2, pasamos a considerar el sesgo que puede aparecer
en nuestras inferencias causales cuando hemos eliminado del anlisis varia
bles explicativas que se deberan haber incluido. En el apartado 3 aborda
mos el problema contrario: controlar las variables irrelevantes que reducen
la eficiencia de nuestro anlisis. A continuacin, estudiaremos el problema
que se plantea cuando nuestra variable dependiente afecta a las explica
tivas. Este problem a se conoce con el nombre de endogeneidad y se
aborda en l apartado 4. Para terminar, en los apartados 5 y 6 analizaremos,
respectivamente, la adjudicacin aleatoria de valores en las variables expli
cativas, as como diversos mtodos de control no experimental.
1.
Error de medida
Una vez que hemos seleccionado nuestras observaciones, tenemos que m e

dir los valores de las variables que nos interesan. Como en las ciencias so
ciales todas las observaciones y medidas son imprecisas, nos encontrare
mos enseguida con el problema del error de medida.
En la investigacin social la mayora de los anlisis intentan calcular el
nivel de error y reducirlo lo ms posible. Los estudios cuantitativos disponen
de medidas ms precisas (numricas), pero no necesariamente ms certeras.
La fiabilidad (el que diversas medidas del mismo fenmeno tengan el mis
mo resultado) a veces se obtiene sacrificando la validez (que las medidas re
flejen lo que el observador trata de calibrar). Los cualitativistas intentan ob
tener medidas certeras que, sin embargo, suelen ser un poco menos precisas.
En ciertos rasgos esenciales, la observacin cualitativa y la medicin

cuantitativa son muy parecidas. Es cierto que en la primera las categoras se
suelen etiquetar con palabras, mientras que en la segunda se asignan valo
res numricos a las categoras y medidas; sin embargo, los investigadores
de una y otra tendencia utilizan criterios nominales, ordinales y de interva
lo. Con los de tipo nominal, se conforman grupos de observaciones en los
que no se presupone que las categoras tengan un determinado orden. Las que
son de relevancia pueden basarse en el ordenamiento legal o institucional;
por ejemplo, en la poltica comparada, pueden ser de inters las pautas de
los sistemas presidenciales, parlamentarios o autoritarios en diversos pa
ses. Las categoras ordinales dividen los fenmenos siguiendo algn tipo de
orden. Por ejemplo, un investigador cualitativo puede clasificar los pases
en tres o cuatro categoras, teniendo en cuenta su grado de industrializacin
o el tamao de sus fuerzas armadas. Para terminar, la medicin a travs de
intervalos utiliza variables continuas, como se hace en los estudios de flu
jos comerciales internacionales.
Las diferencias que hay entre la medicin cuantitativa y la cualitativa
afectan a la presentacin de los datos, no a la posicin terica de dicha me
dicin. Los cualitativistas utilizan en sus medidas palabras como ms o
menos, mayor o menor, fuerte o dbil, mientras que los cuantitativistas usan nmeros.
Por ejemplo, la mayora de los investigadores cualitativos del campo de
las relaciones internacionales es muy consciente de que el nmero de
muertos en combate no tiene por qu ser un buen indicador de la impor
tancia que tienen las guerras para las tendencias posteriores de la poltica
mundial. En la teora del equilibrio de poderes se considera que, para cali
brar la estabilidad, el concepto terico relevante no es la gravedad de la
guerra sino el cambio que se produce en los principales actores a conse
cuencia de ella (vanse Gulick, 1967, y Waltz, 1979, p. 162). Sin embar
go, al querer evitar la falta de validez, el cualitativista corre el riego de que
los errores de medida le hagan no ser fiable. Cmo podemos saber lo que
se produce a consecuencia de algo si no definimos precisamente esa ex
presin? De hecho, sta parece implicar que la valoracin se hace en fun
cin de un resultado sistmico (que sesgar las estimaciones posteriores de
la relacin, llevndolas hacia la hiptesis).
No hay ninguna frmula que pueda determinar cmo se logra el equili
brio entre el uso de indicadores cuantitativos, que quiz no reflejen de for
ma vlida los conceptos subyacentes que nos interesan, y el de valoraciones
cualitativas siempre imprecisas y sujetas a sesgos inconscientes. Sin embar
go, los investigadores de una y otra tendencia tienen que hacer una estima
cin de la incertidumbre en sus inferencias. Los cuantitativistas han de pre
sentar, ju n to a sus m edidas num ricas, cules son los errores tpicos,
mientras que los cualitativistas tienen que hacer una estimacin de la incer
tidumbre, redactando cuidadosamente lo que piensan de sus observaciones.
La diferencia entre las mediciones de unos y otros estriba en su forma de

presentar ideas que, en esencia, son las mismas.
Las mediciones cualitativas y cuantitativas tambin se parecen en otro
sentido. En ambas, las categoras suelen ser mecanismos creados por el in
vestigador y no vienen dadas por la naturaleza. La clasificacin de las
naciones en regmenes democrticos y autocrticos o parlamentarios y pre
sidenciales depende de elaboraciones intelectuales, al igual que ordenarlas
segn criterios como el de mayor o menor industrializacin.
Es evidente que no existen respuestas con validez universal: todas las
mediciones dependen del problema que el investigador pretenda compren
der. Lo mejor es que los criterios que forman las categoras estn lo ms
cerca posible de las primeras ideas tericas y empricas del investigador;
sin embargo, esta misma pretensin recalca todava ms el hecho de que di
chas categoras son mecanismos al servicio de los propsitos del investiga
dor. El nmero de regmenes parlamentarios en los que la proporcionalidad
es el principal sistema de representacin depende de cmo se clasifiquen
esos regmenes parlamentarios y de lo que se entienda por sistema de re
presentacin proporcional. En el campo de las relaciones internacionales es
posible investigar los flujos monetarios registrados, pero el uso de una m e
dida continua depende de qu transacciones se haya decidido computar, de
las reglas que determinan lo que es una transaccin y de cmo se definen las
fronteras nacionales. Del mismo modo, en unas elecciones al Congreso es
tadounidense, la proporcin de voto demcrata en una circunscripcin de
pende de que, en la clasificacin que haga el investigador para su estudio,
se presuponga que las etiquetas demcrata y republicano tienen el
mismo significado en las 435 circunscripciones.
Incluso los criterios de categorizacin que hemos utilizado en este apar
tado para hacer mediciones (nominales, ordinales o de intervalo) dependen
de para qu fines tericos se utilicen stas. Por ejemplo, podra parecer evi
dente que la etnia es un prototipo de variable nominal que, en los Estados
Unidos, podra codificarse como negro, blanco, latino, indio y asitico. Sin
embargo, existe una gran diversidad dentro de estos grupos nominales, en
funcin de la intensidad con que los miembros de cada grupo se identifican
con l. Por lo tanto, podramos categorizar a los grupos tnicos segn una
escala ordinal, basndonos, por ejemplo, en la proporcin de miembros de
cada uno de esos grupos que est muy identificado con aquel al que perte
nece. Quiz nos interese tambin el tamao de estos grupos: por lo tanto,
podramos utilizar la etnia como criterio de medida para determinar ciertos
intervalos. Lo principal es utilizar a medida ms apropiada para nuestros
fin es tericos.
Los problemas de medicin ms frecuentes aparecen cuando se mide sin
hacer referencia explcita a ninguna estructura terica. Por ejemplo, a veces
los investigadores toman una variable que es continua de forma natural y
que puede medirse bien, como la edad, y establecen categoras de juventud,
mediana edad y vejez. Para ciertos fines, esta clasificacin puede ser sufi
ciente, pero, como presentacin terica de la edad de una persona, el proce
dimiento resulta innecesariamente impreciso. El error de agrupacin que
se producir ser considerable y hay que evitarlo. El hecho de librarse de
este tipo de error nos remite al principio de que no hay que descartar datos
sin que haya razn para ello.
Sin embargo, podemos cometer el error contrario: asignar valores conti
nuos y numricos de intervalo a variables que por naturaleza son discon
tinuas. En general, la medicin mediante intervalos no es mejor que la ordi
nal o nominal. Por ejemplo, en una encuesta se puede preguntar sobre la
filiacin religiosa y sobre el grado de compromiso en este sentido. La in
tensidad del segundo indicador podra medirse si las preguntas estn bien
planteadas mediante una variable ordinal, incluso utilizando intervalos,
dependiendo de cul sea la naturaleza del instrumento de medicin. Sin
embargo, no tendra mucho sentido hacer una lista numrica con las reli
giones a las que pertenece cada individuo. En este caso, probablemente no
exista una variable ordinal o continua, y este procedimiento generara un
error de medida.
Elegir entre categoras nominales, por un lado, u ordinales o de interva
lo, por otro, puede implicar un intercambio entre riqueza descriptiva y faci
lidad a la hora de comparar. Pensemos, por ejemplo, en las normas de voto
de las organizaciones internacionales. El ordenamiento institucional que las
dicta es importante porque refleja una concepcin de la soberana de los es
tados y porque tiene consecuencias sobre la clase de resoluciones que pue
de aprobarse, los recursos que se destinan a la organizacin y las expectati
vas de que se cumplan las resoluciones.
Un conjunto de categoras nom inales podra distinguir entre aquellos
sistemas en los que un nico miembro tiene la facultad de vetar cualquier
resolucin (como ocurra en el Consejo de la Sociedad de Naciones, segn
el artculo 15 de su Acta de Constitucin), aquellos en los que slo pueden
hacerlo ciertos miembros (como en el Consejo de Seguridad de las Nacio
nes Unidas), en los que se decide en funcin de algn tipo de mayora cua
lificada (com o en las decisiones que afectan al m ercado interno de la
Unin Europea) y en los que es una mayora simple la que toma las decisio
nes (como ocurre en la mayora de las votaciones de la Asamblea General
de las Naciones Unidas). Cada sistema puede generar sus propias dinmi
cas de negociacin, y, si lo que pretendemos es estudiar cmo funciona uno
de ellos en particular (aquel en el que un miembro puede ejercer el veto), es
esencial que definamos nuestras categoras para no incluir en el anlisis
otros tipos de sistemas. Las categoras nominales seran apropiadas para
este propsito.
Sin embargo, tambin podramos ver estas categoras de forma ordinal,
yendo de las ms restrictivas (en las que se requiere unanimidad) a las m e
nos (en las que se precisa mayora simple). Esta categorizacin sera nece
saria si tuviramos que comprobar proposiciones tericas que tuvieran que

ver con la relacin que existe entre lo restrictivas que son las normas de
voto y las pautas de negociacin o con el carcter distributivo de los resul
tados tpicos. No obstante, al menos dos de nuestras categoras las que
contemplan el veto de ciertos miembros y la decisin por medio de mayoras
cualificadas son bastante confusas, ya que suponen la existencia de un
abanico de diversos arreglos. La prim era categora perm ite que un solo
miembro ejerza un veto total prctica que raya en lo dictatorial y tam
bin que veten todos los miembros, a excepcin de los pocos que apenas
tienen peso; en la segunda se incluye la reglamentacin de la Unin Euro
pea, que impide que dos estados constituyan una minora de bloqueo en de
cisiones que afectan al mercado interno. La frmula que utiliza el Fondo
M onetario Internacional es, desde el punto nominal, un ejemplo de deci
sin por mayora cualificada, pero, en la prctica, concede a los Estados
Unidos y, desde hace poco, a la Unin Europea, que acta como un bloque,
la capacidad de constituir este tipo de minora de bloqueo. De ah que pue
da pertenecer a cualquiera de las dos categoras.
En consecuencia, podramos intentar dar un paso adelante y hacer una
medida intermedia que se basara en la proporcin de estados (o de recur
sos: segn el producto nacional bruto, las aportaciones a la organizacin o
la poblacin) que se precisa para aprobar resoluciones, clasificando las or
ganizaciones internacionales segn lo restrictivos que sean sus procedi
mientos de voto.
Sin embargo, con diferentes baremos por ejemplo, si se calibran los
recursos en funcin de la poblacin o del producto nacional bruto se ob
tendrn resultados diferentes, por lo que las ventajas que pueda tener la
precisin de tales medidas se vern limitadas por la arbitrariedad de los cri
terios de medicin o por la complejidad de los datos agregados. Cada cate
gora tiene ventajas e inconvenientes: los fines del investigador deben de
terminar qu opcin se toma.
En los dos siguientes subapartados vamos a analizar las consecuencias
especficas del error de medida para la investigacin cualitativa y llegare
mos a conclusiones que pueden parecer sorprendentes. Casi nadie discutira
que un error sistemtico de medida, como el que supone exagerar de mane
ra constante el valor de ciertas unidades, causa sesgo y tambin incoheren
cia, ya que dicho sesgo no puede desaparecer si se incorporan ms observa
ciones cargadas de errores. Sin embargo, si analizamos el problema con
ms atencin, veremos que slo ciertos tipos de error de medida sistemti
co sesgan nuestras inferencias causales. A dem s, las consecuencias del
error de medida no sistemtico estn menos claras. Vamos a analizar este
ltimo tipo de error en dos partes: en la variable dependiente y, despus, en
la explicativa. Tal como vamos a demostrar, el error en la variable depen
diente produce ineficiencias que pueden generar resultados incorrectos en
cualquier situacin y dificultar el rastreo de pruebas constantes de la exis-
iliif
tencia de efectos sistemticos. Dicho de otro modo, el error de medida no

sistemtico en la variable dependiente no produce sesgo, pero puede au
mentar considerablemente la ineficacia. Ms interesante resulta la presen
cia de este tipo de error en la variable causal clave, pues siempre sesga las
inferencias de forma predecible. Comprender la naturaleza de estos sesgos
nos ayudar a atenuarlos o quiz a evitarlos.
1.1
Error de medida sistemtico
En este apartado nos ocupamos de las consecuencias del error de medida

sistemtico, que consiste en exagerar de manera constante el valor de cier
tos tipos de unidades y que, a veces, puede sesgar y hacer incoherente la es
timacin de los efectos causales. Nuestro cometido es determinar qu tipos
de sesgo produce cada error de medida sistemtico. Tanto en la investiga
cin cuantitativa como en la cualitativa, este error puede derivarse del he
cho de que los investigadores tomen decisiones que hagan que los datos fa
vorezcan la constatacin de sus expectativas. En el trabajo cuantitativo,
puede que utilicen datos sesgados porque son las nicas series numricas
disponibles, mientras que en el cualitativo el error de medida sistemtico
puede provenir de evaluaciones subjetivas realizadas por investigadores que
ya tengan hiptesis formadas y que quieren demostrar que son correctas.
Debera ser evidente que cualquier error de medida sistemtico sesgar
las inferencias d e s c r ip tiv a s Pensemos, por ejemplo, en el caso ms simple
que podamos imaginar, en el que sin darnos cuenta aadimos 1 . 0 0 0 dlares
a la estimacin de renta anual de cada una de las personas que responde, a
una encuesta. Es obvio que en nuestro clculo de la renta media anual de
toda la muestra habr tambin una sobreestimacin por ese mismo valor. Si
nos interesara hacer un clculo aproximado del efecto causal que tienen los
estudios universitarios en la media de renta anual, el error de medida siste
mtico no tendra consecuencias sobre nuestra inferencia causal. Si, por
ejemplo, el grupo de personas con estudios universitarios ganara realmente
una media de 30.000 dlares, pero el grupo de control que no fue a la uni
versidad ingresara una media de 25.000, nuestra estimacin del efecto cau
sal que tienen los estudios universitarios sobre la renta anual mostrara un
incremento de 5.000 dlares. Si la renta de cada persona en ambos grupos
se hubiera sobreestimado en la misma cantidad (digamos, 1 . 0 0 0 dlares de
nuevo), nuestro efecto causal que ahora procede de restarle 26.000 dla
res a 31.000 seguira siendo 5.000. Por lo tanto, el error de medida siste
mtico que afecta a todas las unidades p or medio de una misma cantidad
constante no sesga la inferencia causal (esto puede apreciarse mejor si nos
centramos en la versin relativa a los efectos constantes del supuesto de ho
mogeneidad de las unidades que se expuso en el apartado 3.1 del cap
tulo 3).
Sin embargo, supongamos que hubiera un error sistemtico en una parte

de la muestra: los licenciados universitarios exageran sistemticamente sus
ingresos porque quieren impresionar al entrevistador, pero las cantidades
que seala el grupo de control son ms correctas. En este caso, tanto la in
ferencia descriptiva como la del efecto causal que tienen los estudios sobre
la renta estaran sesgadas. Si sabemos que existe este problema, podremos
plantear mejores preguntas en la encuesta u obtener la informacin de otro
modo. Si los datos ya se han recogido y no podemos recabar ms, podramos,
por lo menos, determ inar en qu direccin va el sesgo para corregirlo
posteriormente.
Para hacer ms hincapi en este asunto, pensemos en un ejemplo toma
do de los escritos sobre integracin regional, dentro de la bibliografa rela
tiva a las relaciones internacionales. En esta rea, ms que en cualquier otra
de las relaciones internacionales, se ha intentado contrastar hiptesis con
cretas, a veces mediante indicadores cuantitativos. Sin embargo, uno de sus
conceptos ms importantes en qu medida el control de las polticas se
transmite desde los estados-nacin a las organizaciones internacionales
no puede expresarse fcilmente con medidas cuantitativas vlidas. Por lo
tanto, los investigadores han ideado formas cualitativas de medirlo y las
han codificado utilizando su conocim iento profundo del problem a (por
ejemplo, Lindbergy Scheingold, 1970: 71, p. 71, cuadro 3.1). Han incorpo
rado a sus variables explicativas conceptos subjetivos como la complementariedad del valor de las lites o la forma de tomar decisiones (van
se Nye, 1971, o Lindberg y Scheingold, 1971), con la intencin de analizar
las relaciones que se establecen entre las variables explicativas y la depen
diente cuando en la medicin de ambas se utilizan tales conceptos.
Este enfoque responda a una preocupacin por la validez: haba investi
gadores expertos que codificaban la informacin y que podan examinar si
era relevante para los conceptos subyacentes en sus medidas. Sin embargo,
con este enfoque se corra el riesgo de cometer un error de medida subjeti
vo. Los investigadores tenan que controlarse mucho para no codificar las
variables explicativas en funcin de sus propias posturas o expectativas te
ricas. En cualquiera de los casos, puede que lo hayan hecho, pero para el
lector resulta difcil determinar hasta qu punto lograron su objetivos.
En tales circunstancias, nuestro consejo es que, en prim er lugar, se
intenten utilizar valoraciones que hayan hecho otros investigadores para
propsitos completamente diferentes. En la investigacin cuantitativa o
cualitativa, este elemento de arbitrariedad nos garantiza que las medidas no
se vern influidas por nuestras hiptesis, las cuales, cabe suponer, se han
conformado posteriormente. Esta estrategia suele seguirse en los estudios
cuantitativos el investigador toma medidas ajenas y las utiliza para sus
propsitos , pero tambin es muy buena para los cualitativos. Por ejem
plo, se puede hacer que observadores expertos codifiquen conjuntamente
ciertas variables clave para un problema mediante sus diversas interpreta
ciones y explicaciones. Aprovechando el anlisis y los conocimientos que

comparten dichos informadores, se podran organizar bancos de datos con
categoras normalizadas y despus utilizarlos para evaluar hiptesis. Si us
ted es la primera persona que usa un conjunto de variables, sera til dejar
que otros expertos codificaran las variables, sin conocer la teora que usted
tiene sobre la relacin que quiere evaluar. Enseles sus notas de trabajo y
las entrevistas grabadas para ver si sus conclusiones sobre las medidas son
las mismas que las de usted. Como la fiabilidad de una codificacin au
menta si puede reproducirse, el resultado de esta revisin de las medidas
ser m ejor cuanto ms cualificados estn los observadores que la realicen.
1.2
Error de medida no sistemtico
Otro de los problemas a los que se enfrentan todos los investigadores, ya

sea en los estudios cuantitativos o cualitativos, es el error de medida no sis
temtico 2. El error no sistemtico no sesga la medida de la variable. En
este contexto, definim os las variables que presentan errores de medida no
sistemticos, o aleatorios, como aquellas en las que se registran valores que
a veces son demasiado altos y otras demasiado bajos. Es evidente que el
error aleatorio produce ineficiencias, pero no sesgo cuando se extraen infe
rencias descriptivas. Este asunto ya se ha analizado en el apartado 7.1 del
captulo 2. Ahora vamos ms all de las consecuencias que tiene el error de
medida aleatorio en la inferencia descriptiva para ocupamos de las que pro
duce en la causal.
Cuando se hace una estimacin de efectos causales, el efecto del error
de medida aleatorio es diferente si aparece en la variable explicativa o en la de
pendiente. Cuando lo encontramos en esta ltima, reduce la eficiencia de la
estimacin causal pero no la sesga, y puede hacer que los valores de las re
laciones causales sean a veces demasiado altos y otras demasiado bajos.
Sin embargo, la media de la estimacin ser correcta. De hecho, en la va
riable dependiente este tipo de error de medida no es diferente, e incluso no
se distingue, del error aleatorio comn que, tal como se refleja en esa varia
ble, existe en el mundo.
En una variable explicativa, el error aleatorio tambin puede generar
ineficiencias que conduzcan a estimaciones vacilantes, altas o bajas. Sin
embargo, sus consecuencias tambin son diferentes a las que produce en la
variable dependiente, ya que en la explicativa el error aleatorio sesga la es
timacin de la relacin que existe entre ambas. El sesgo adopta una forma
particular: hace que la estimacin indique la existencia de una relacin cau
sal ms dbil de lo que es en realidad. Si la autntica relacin es positiva, el
error aleatorio en la variable explicativa sesgar la estimacin hacindola
ms pequea o nula. Si es negativa, la sesgar aumentndola hasta hacerla
tambin nula.
Como esta diferencia entre el efecto que tiene el error aleatorio en la va

riable explicativa y en la dependiente no resulta evidente de forma intuitiva,
ofreceremos pruebas formales de l, mostrndolo grficamente y dando un
ejemplo ilustrativo. Comenzamos por el efecto del error aleatorio en la va
riable dependiente.
1.2.1
Error de medida no sistem tico en la variable dependiente
El error de medida no sistemtico o aleatorio en una variable dependiente

no sesga la estimacin habitual del efecto causal, pero s la hace menos efi
ciente. En cualquier aplicacin, esta falta de eficiencia tendr resultados
impredecibles, indicando unas veces la existencia de inferencias causales
demasiado grandes y otras demasiado pequeas. Por consiguiente, este tipo
de error aumenta la incertidumbre de nuestras inferencias. Dicho de otro
modo, el error de medida aleatorio en una variable dependiente crea un
problema similar al que produce tener un nmero de observaciones reduci
do; en ambos casos, la cantidad de informacin que podemos utilizar para
resolver un problema es menor de lo que quisiramos. El resultado es que
el error de medida aleatorio en la variable dependiente produce estimacio
nes de los efectos causales menos eficientes y ms inciertas.
Cuando usemos diversos conjuntos de datos como habra que hacer
siempre que se pueda , las estimaciones basadas en variables dependientes
con error de medida aleatorio sern inestables. Algunos conjuntos de datos
nos darn pruebas de la existencia de intensas relaciones, mientras que
otros presentarn efectos negativos o dirn que no hay ninguno, incluso si
la verdadera relcin no h cambiado en absoluto. Esta ineficienci dificul
ta, a veces considerablemente, el hallazgo de rasgos descriptivos sistemti
cos o causales en un conjunto de datos o (quizs de forma ms evidente) en
la comparacin de varios de ellos. Con frecuencia, las estimaciones de in
certidumbre sern mayores que las que indica el tamao de las relaciones
que hay entre nuestras variables. Por consiguiente, puede que no tengamos
suficiente informacin para determ inar la existencia de un efecto causal
que est oculto por el error aleatorio en la variable dependiente (y represen
tado en la mayor incertidumbre de una inferencia). Los investigadores cua
litativos y cuantitativos que sean conscientes de este resultado general no
podrn enfrentarse a este error ms que poniendo un mayor inters en me
jorar las medidas de las observaciones de que disponen o recogiendo otras
nuevas que tengan los mismos niveles de error de medida (o menores).
Comprender lo que suponen estos resultados en un determinado nmero de
datos har que los investigadores puedan matizar ms adecuadamente sus
conclusiones, y el hecho de que se reconozca de manera tan explcita la
incertidumbre quiz les induzca a ellos u a otros a llevar a cabo estudios
complementarios que midan con ms cuidado las variables dependientes
(o que tengan un mayor nmero de observaciones). El reconocerlo as ten

dra que ser todava ms til para el diseo de la investigacin, ya que los
investigadores suelen tener que alcanzar un equilibrio entre la necesidad de
medir con ms precisin y la de obtener ms observaciones. Este ltimo
objetivo es ms importante para nuestra hiptesis: necesitamos determinar
si la informacin que sta baraja puede obtenerse mejor utilizando ms ob
servaciones de los casos actuales o si hay que recoger ms datos.
Pensemos en el siguiente ejemplo de error de medida aleatorio en una
variable dependiente. Al estudiar el efecto de la situacin econmica sobre
los delitos violentos en los pases en desarrollo o en las regiones de un solo
pas de este tipo, podemos medir la variable dependiente (violencia ilegal)
observando a cada comunidad durante un corto perodo de tiempo. Por su
puesto, estas observaciones nos darn medidas relativamente insuficientes,
ya que su media ser correcta, pero, en algunas comunidades, no podremos
conocer muchos delitos y subestimaremos el valor medio de la violencia,
m ientras que en otras veremos que hay mucha criminalidad y sobreesti
maremos ese mismo indicador.
Supongamos que nuestra medida de la variable explicativa la situacin
econmica sea el porcentaje de desempleados de la comunidad y que la
calculemos bastante bien (quiz utilizando buenos datos del gobierno). Si
estudiramos la influencia que tiene la economa tal como la representa el
porcentaje de parados en la cantidad media de delitos violentos, cabra es
perar resultados muy inciertos tambin inestables si se comparan diversas
aplicaciones , precisamente porque la variable dependiente se ha medido
de forma imperfecta, aunque, como promedio, la tcnica de medicin es co
rrecta. El saber que sta es la causa del problema y estar seguros de que la
relacin entre las variables deba ser intensa justifica suficientemente la ne
cesidad de un nuevo estudio en el que podamos observar la delincuencia que
se registra en ms comunidades o durante perodos ms largos. Una vez
ms, comprobamos que el error de medida y las pocas observaciones gene
ran problemas similares. Podramos m ejorar la eficiencia aumentando la
exactitud de nuestras observaciones (quiz recurriendo a buenas estadsticas
policiales para reducir el error de medida) o incrementando el nmero de
observaciones mal medidas en diversas comunidades. En cualquiera de estos
casos, la solucin es aumentar la cantidad de informacin que se trae a cola
cin para solucionar el problema inferencial. Este es otro ejemplo de por
qu la cantidad de informacin que barajamos en relacin con un problema
es ms importante que el nmero total de observaciones de que disponemos
(siendo esta cifra la medida de la informacin).
Para demostrar por qu es as, utilizamos una versin simplificada de
este ejemplo, primero de forma grfica y despus por medio de una prueba
ms formal. En el grfico 5.1, el eje horizontal representa el desempleo.
Imaginamos que las dos categoras (4% y 7%) se han medido bien. El
eje vertical representa una medida de los delitos violentos.
Grfico 5.1
Error de medida en la variable dependiente
X (desempleo)
En el grfico 5.1, los dos crculos negros pueden representar un estudio

sencillo en el que no hay error de medida en ninguna variable. Podemos
imaginar que disponemos de un gran nmero de observaciones y que todas
coinciden con esos densos crculos negros, de manera que se conoce bastan
te bien la posicin de ambos. Por el contrario, podemos imaginar que slo
tenemos dos observaciones y que en ellas hay poco error no sistemtico de
cualquier tipo. Evidentemente, no es probable que en la realidad ocurra nin
guno de estos casos, pero el modelo subraya los problemas esenciales que
plantea el error de medida cuando aparece en la variable dependiente de un
caso ms general y complicado.
Imaginemos ahora otro estudio en el que los delitos violentos se midan
con un error no sistemtico. Para recalcar el hecho de que la media de esas
medidas es correcta, marcamos con un punto cada uno de los crculos blan
cos que flanquean simtricamente, por arriba y por abajo, los primeros crcu
los negros3. Una nueva lnea que represente los seis crculos de datos ser
exactamente igual a la primera que hemos trazado. De nuevo, hay que sea
lar que esta lnea se traza minimizando los errores de prediccin, las des
viaciones verticales de la lnea.
Sin embargo, la nueva lnea ser ms incierta en varios sentidos. Por
ejemplo, los puntos estarn casi tan bien representados tanto si la lnea est
un poco ms empinada como si es ligeramente ms plana. Adems, su posi
cin vertical tambin ser ms incierta, y ella m isma pronosticar peor
donde habra de estar cada uno de los crculos de datos. El resultado es que
el error de medida en la variable dependiente reduce la eficiencia de las es

timaciones. Aunque stas no tengan sesgo es decir, en la media de nume
rosos estudios similares , s podran estar muy alejadas de la realidad en
cada uno de ellos.
1.2.2
Error de medida no sistem tico en una variable explicativa
Como hemos sealado antes, el error no sistemtico en la variable expli

cativa tiene las mismas consecuencias para las estimaciones del valor de
esa variable en las inferencias descriptivas que para las que afectan
al valor de la variable dependiente: a veces las medidas sern demasiado
altas, a veces demasiado bajas, pero su media ser correcta. Como ocurre
con el error no sistemtico en la variable dependiente, el error aleatorio
en la explicativa tambin puede hacer que las estimaciones de los efectos
causales sean inciertas e ineficientes. Sin embargo, cuando este error se
produce en las variables explicativas, tiene una consecuencia bastante d i
ferente de las que se registran cuando aparece en la dependiente. Cuando
es la variable explicativa la que se mide con un error aleatorio, en las esti
maciones de la relacin causal aparece un sesgo sistemtico que las incli
na hacia un valor nulo, hacia la ausencia de relacin. Dicho de otro modo,
cuando hay un verdadero vnculo causal entre la variable explicativa y la
dependiente, un error aleatorio en la prim era puede ocultar este hecho al
reducir el valor de la relacin. Si queremos contrastar nuestra hiptesis en
diversos conjuntos de datos, no slo encontraremos una gran variedad de
resultados, como ocurre cuando hay un error aleatorio en la variable de
pendiente, sino que tambin hallarem os un sesgo sistemtico en ellos que
nos inducir a pensar que la relacin que existe es ms dbil que la que
hay en realidad.
Al igual que ocurre cuando el error de medida se produce en la variable
dependiente, aunque nos demos cuenta de que tal error existe en la explica
tiva, sus consecuencias no se reducirn con un anlisis ms cuidadoso de
las variables que se han medido con errores, a menos que se sigan nuestros
consejos. Evidentemente, con mejores medidas mejorar la situacin.
Pensemos de nuevo en nuestro estudio de los efectos del desempleo en
la delincuencia que se registra en varias comunidades de un pas subdesarrollado. Sin embargo, supongamos que la situacin que reflejan los datos
sea la opuesta a la que mencionbamos anteriormente: en el pas que esta
mos estudiando las cifras de delincuencia son precisas y es fcil que las
autoridades las proporcionen, pero el desempleo es un problema poltico y,
en consecuencia, no puede medirse con exactitud. Como no se perm iten
las encuestas con muestras sistemticas, decidimos calibrar el paro m e
diante la observacin directa (al igual que antes hicimos con la delincuen
cia). Inferimos el ndice de desempleo del nmero de personas que estn
Un anlisis formal del error de
medida en y
Consideremos un sencillo ejemplo lineal con una variable dependiente me- |

dida con errores y una explicativa que carece de ellos. Nos interesa hacer |
una estimacin del parmetro de efecto (3:
|
n
I
E(Y*) = P X
Tambin especificamos un segundo rasgo de las variables aleatorias, la va- |

nanza:
la cual presuponemos que es igual en todas las unidades i = 1,

n 4.
|
Aunque estas ecuaciones definen nuestro modelo, por desgracia no ob- |
servamos Y* sino Y, donde
Y = Y* + U
Es decir, que la variable dependiente observada Y es igual a la verdadera
variable dependiente Y*, ms algn error de medida aleatorio, U. Para for
malizar la idea de que U contiene slo un error de medida no sistemtico,
necesitamos que ste desaparezca en la media de reproducciones hipotti
cas, E(U) = 0, y que no se correlacione con la verdadera variable depen
diente, C(U,Y*) = 0, ni con la explicativa, C(U,X) = O 5. Adems, presupo
nemos que el error de medida tiene una varianza V(U;) = t 2 en cada una de
las unidades i. Si r 2 vale cero, Y no contendr ningn error de medida y
ser igual a V"*; cuanto ms grande sea la varianza, ms error contendr
nuestra medida Y.
Cmo afecta el error de medida aleatorio en la variable dependiente a
la estimacin de 3? Para saberlo, utilizamos nuestro estimador habitual
con Y en vez de con Y*:
^Y . XI .I
----^1
y despus calculamos la media en las reproducciones hipotticas:
JL
E(b) = E
5^vpc^ri^3CTs-3afKnai,'jis6ryssri.i
I W ,)
*J
, +LJ)
xi
i-l
X P
S*f
-P
Este anlisis demuestra que, incluso cuando haya un error de medida
en la variable dependiente, el estimador tpico no estar sesgado (ser
igual a la media de 5), ta l como mostramos que ocurra en la ecuacin
(3.8) cuando una variable dependiente no tena error de medida.
Sin embargo, para completar este anlisis, tenemos que comprobar la
eficiencia de nuestro estimador en presencia de una variable dependiente
que se ha medido con errores. Utilizamos el procedimiento habitual:
(5.1)
V(b) = V
I* ?
a2 + r 2
" i^1*
Hay que sealar que aqu este estimador es menos eficiente que cuan
do se aplica a datos que carecen de error de medida en la variable depen
diente (comprese con la ecuacin [3.9]), por lo que respecta al nivel de
error de medida que aparece en dicha variable t 2.
Grfico 5.2
Error de medida en la variable explicativa
X (desem pleo)
de pie sin hacer nada en el centro de varios pueblos cuando pasamos en

coche. Como la hora y el da en que observamos los pueblos varan, al
igual que lo hace la situacin meteorolgica, habr un alto grado de error
aleatorio en nuestras estimaciones del ndice de paro. En un gran nmero
de pueblos nuestros clculos no sern sistemticamente altos o bajos. Una
estimacin que se basara en cualquier pareja de pueblos sera bastante ine
ficiente: quiz las observaciones para cualquiera de ellas se hayan hecho
en domingo (cuando puede que mucha gente est largo rato en la calle)
o en un da de lluvia (cuando pocos lo haran). Sin embargo, muchas ob
servaciones de parejas de pueblos que se hayan hecho en diversos m om en
tos de diferentes das, con sol o con lluvia, producirn una media correcta
de las estimaciones del efecto. N o obstante, como se ha sealado anterior
mente, la consecuencia ser muy diferente de la que produca un error si
milar en nuestra medida de la variable dependiente denom inada delitos
violentos.
El grfico 5.2 ejem plifica esta situacin. Los dos crculos negros re
presentan un estudio en el que no hay error de m edida en ninguna varia
ble 6. Por consiguiente, la inclinacin de la lnea continua representa la es
tim acin co rrecta del efecto causal que tiene el desem pleo sobre la
delincuencia. Para m ostrar las consecuencias de este error, aadimos dos
crculos ms (los blancos) a derecha e izquierda de cada uno de los ne
gros, con el fin de representar un error de medida en la variable explicati
va cuya m edia es correcta (o sea, igual a la del crculo negro). La lnea

discontinua se ajusta a los crculos blancos, y la diferencia entre las dos
lneas es el sesgo debido al error de m edida aleatorio que hay en la varia
ble explicativa. De nuevo recalcam os que las lneas se trazan de manera
que minimicen los errores que se generan al predecir la variable depen
diente (que aparecen en el grfico como desviaciones verticales de la l
nea que pasa por los crculos), segn cada uno de los valores de las varia
bles explicativas.
De este modo, el efecto estimado del desempleo, que aqu se ha calcula
do con un considerable error aleatorio, ser mucho ms pequeo que el ver
dadero (ya que la lnea discontinua est menos inclinada). Como sabemos
que existe un error de m edida en la variable explicativa, podramos infe
rir que el autntico efecto que tiene el desempleo sobre la delincuencia es
mayor que la correlacin observada en este proyecto de investigacin.
El anlisis de las consecuencias del error de medida en una variable ex
plicativa nos lleva a dos directrices de tipo prctico:
1.
Si, en principio, un anlisis indica que no hay ningn efecto, el efecto verdadero
ser muy difcil de calibrar, ya que no se sabe la direccin del sesgo; por consi
guiente, el anlisis ser bastante impreciso y as habr que describirlo. Puede
que el autntico efecto sea nulo, negativo o positivo, y que nada en los datos nos
seale cmo es.
2.
Sin em bargo, si un anlisis indica que la variable explicativa con error de m edi
da aleatorio tiene un pequeo efecto positivo, tendrem os que utilizar los resulta
dos de este apartado como justificacin para concluir que el autntico efecto
probablemente sea an m ayor que el que hem os encontrado. Del mismo m odo,
si lo que hallam os es un pequeo efecto negativo, los resultados de este aparta
do podrn utilizarse como prueba de que el efecto verdadero probablem ente in
dique la existencia de una relacin negativa an mayor.
Como el error de medida es un rasgo fundamental de todos los estudios

cualitativos, estas directrices tendran que poder aplicarse a todos ellos.
Es preciso matizar de alguna forma estas conclusiones para que los in
vestigadores sepan exactamente cundo son aplicables y cundo no lo son.
En prim er lugar, el anlisis del recuadro inferior, en el que se basan nues
tras recomendaciones, puede aplicarse a m odelos en los que slo exista
una variable explicativa. Hay resultados similares que s son aplicables a
m uchas situaciones en las que existen m ltiples variables explicativas,
pero no a todas. Del mismo modo, el anlisis tambin es aplicable si el in
vestigador tiene muchas variables explicativas, pero slo una con un consi
derable error de medida. Sin embargo, si se estn analizando de forma
simultnea las consecuencias de muchas variables y cada una de ellas pa
dece formas diferentes de error de medida, slo podremos calibrar los ti
pos de sesgo que pueden aparecer si extendemos el anlisis formal que

aparece ms abajo. Resulta que, a pesar de que los cualitativistas suelen
tener m uchas variables explicativas, lo ms habitual es que estudien el
efecto de cada una de ellas de forma secuencial ms que simultnea. Por
desgracia, como se describe en el apartado 2 , este procedimiento puede
causar problemas como el del sesgo de la variable omitida, pero hace que
resultados similares a los analizados aqu sean bastante aplicables en la in
vestigacin cualitativa.
2.
Exclusin de variables relevantes: el sesgo
La mayora de los cualitativistas se dan cuenta de la importancia de contro

lar los posibles efectos falsos de otras variables cuando se hace una estima
cin de las consecuencias que tiene una variable sobre otra. Entre las for
mas de ejercer este tipo de control se encuentran los m todos de la
diferencia y de la similitud de John Stuart Mili (1843) (a los que, irnica
mente, Przeworski y Teune [ 1982] hacen referencia calificndolos, respec
tivamente, como los sistemas de diseo ms similares y ms diferentes); la
comparacin de casos disciplinada-configuradora de Verba (1967) (que
es parecida a la comparacin estructurada-centrada de George [1982]),
as como diversas formas de utilizar supuestos en los que se mantienen casi
todos los rasgos constantes y otros contrafcticos parecidos. Estas expresio
nes se mencionan con frecuencia, pero a los investigadores les suele resul
tar difcil aplicarlas de manera eficaz. Por desgracia, los cualitativistas dis
ponen de pocas herramientas para expresar las consecuencias precisas de
no tener en cuenta ms variables en determinados momentos de una investi
gacin, o sea, de ocuparse del sesgo de la variable omitida. En este apar
tado, aportamos esas herramientas.
Comenzamos por analizar este problem a explicando con palabras las
consecuencias del sesgo de la variable omitida y continuamos despus con
un anlisis formal. Posteriormente, nos centraremos en cuestiones ms am
plias del diseo de investigacin que suscita este tipo de sesgo.
2.1
Cmo calibrar el sesgo de las variables omitidas
Supongamos que queremos hacer una estimacin del efecto causal que tie
ne nuestra variable explicativa X sobre la dependiente Y. Si estam os
haciendo un anlisis cuantitativo, este efecto causal de X x sobre Y lo expre
saremos mediante j8 (, que se puede estimar mediante una ecuacin de re
gresin 3 o utilizando otra forma de anlisis que nos d una estimacin b t
de 3r Si estamos realizando investigacin cualitativa tambin intentaremos
obtener esa estim acin del efecto causal; sin embargo, en este caso, el
clculo depender de un argumento verbal y de la valoracin del investiga

dor, que se basan en la experiencia y el criterio.
Supongamos que despus de haber hecho las estimaciones (cuantitativa
o cualitativamente) un colega eche un vistazo a nuestro anlisis y plantee la
objecin de que hemos omitido una importante variable de control, X2. He
mos estado haciendo una estimacin del efecto que tienen los gastos en las
campaas electorales sobre la proporcin de voto que recibe un candidato
al Congreso estadounidense. Para este colega, puede que nuestra conclu
sin sea falsa por el sesgo de la variable omitida. Es decir, lo que sugiere
es que nuestra estimacin b de /3 es incorrecta porque no hemos tenido en
cuenta otra variable explicativa X 2 (como medir si los candidatos son ya
congresistas). El verdadero modelo tendra que controlar el efecto de la
nueva variable.
Cmo podemos evaluar la afirmacin de nuestro colega? Especialmen
te, en qu condiciones influira sobre nuestra estimacin de las consecuen
cias que tiene el gasto en los votos el haber omitido la variable que calibra
el hecho de ostentar ya el cargo de congresista, y en qu condiciones no in
fluira? Es evidente que omitir un trmino que mida la influencia de ser ya
congresista no tendr importancia si este hecho no influye en la variable
dependiente; o sea, que si X 2 es irrelevante, porque no tiene ningn efecto
sobre Y, no producir sesgo. Este es el primer caso especial: las variables
omitidas irrelevantes no producen sesgos. De este modo, si el hecho de es
tar ya en el poder careciera de consecuencias electorales, podramos olvi
dam os de haberlo omitido.
El segundo caso especial, que tampoco produce sesgos, se da cuando la
variable om itida no se correlaciona con la explicativa incluida. De este
modo, tampoco hay sesgo si el hecho de ser ya congresista no se correla
ciona con nuestra variable explicativa, el gasto en la campaa electoral. De
forma intuitiva, podemos decir que cuando una variable omitida no se co
rrelaciona con la principal variable explicativa que nos interesa, someterla a
control no cambiar la estimacin del efecto causal que tiene sobre nuestra
variable principal, porque lo que controlamos es la parte de variacin que
las dos variables tienen en comn, si es que hay alguna. Por lo tanto, pode
mos omitir variables de control con tranquilidad, aunque tengan una gran
influencia en la variable dependiente, siempre que no cambien con la va
riable explicativa incluida en el anlisis1.
Si estos casos especiales no se sostienen a causa de alguna variable omi
tida (por ejemplo, si sta se correlaciona con la variable explicativa incluida
y tiene consecuencias en la dependiente), el no controlarla sesgar nuestra
estimacin (o percepcin) del efecto de la variable incluida. En el caso que
nos ocupa, las crticas de nuestro colega seran correctas, ya que el hecho
de ser ya congresista est relacionado con la variable dependiente y tam
bin con la independiente: los que ya estn en el poder reciben ms votos y
gastan menos.
SESK
179
Un anlisis formal del error de medida aleatorio en X |

i%
Definimos primero un modelo como sigue:
E{Y) = (JX*
en el que no se observa la verdadera variable explicativa X * sino que se ve i

X, donde
^
X = X* + U
j?
3
y el error de medida aleatorio U tiene propiedades similares a las de antes:
su media es cero, E (U) = 0, y no se correlaciona ni con la verdadera variable explicativa, C(U,X*) = 0, ni con la dependiente, C(U,Y) = 0.
Qu ocurre cuando utilizamos el estimador tpico de 3 con una X pagada de errores, en vez de con la X * no observada? Esta situacin es habtual en la investigacin cualitativa si hay un error de medida y no se hace
ningn ajuste especial en los resultados que se obtienen. Para analizar el
efecto de este procedimiento evaluamos el sesgo, que va a ser la principal
consecuencia de este tipo de problema de medida. Por lo tanto, comenzamos por aplicar el estimador tpico de la ecuacin (3.7) a las X e Y observadas en el modelo anterior.
b=
YlX I
------
3
|
i
jj
I
1
|
!
t>
i
(52)
-1
i-\
________
W + u y
xI+Y'+IZU'Y'
Esta idea puede plantearse en trminos formales, centrndose en la lti

ma lnea de la ecuacin (5.5) que aparece en el recuadro inferior:
E (b ) = /3, + F/32
(5.3)
Debera quedar claro que b estar sesgada, E(b) * j3. Adems, la media
de los dos trminos que estn entre parntesis en la ltima lnea de la
ecuacin (5.2) ser cero porque presuponemos que U e Y, as como U y
X*, no se correlacionan (o sea, que C(A,K) = E{Uf Y) = 0. Por lo tanto,
esta ecuacin se reduce aproximadamente a 8:
i-i____
Esta ecuacin con el estimador de j3 aplicado al modelo anterior slo

se diferencia de la que utiliza el estimador tpico por el trmino adicional
que
n
hay en el denominador, L/* (comprese con la ecuacin [3.7]), que re^1
presenta el grado de error de medida en X, la varianza muestral del error U.

Si no hay error de medida, este trmino ser nulo y la ecuacin se reducir
al estimador tpico de la (3.7), ya que en realidad habramos observado
los autnticos valores de la variable explicativa.
En el caso general en el que hay algn error de medida U2 ser una I

^1
suma de trminos cuadrticos y, por tanto, siempre ser positiva. Como

este trmino se suma al denominador, b se acercar a cero. Si el estimador
.correcto produjera un nmero positivo alto, el error de medida aleatorio
en la variable explicativa hara que el investigador pensara errneamente
que b tiene un valor positivo pero ms pequeo. Si la estimacin que se
basa en X * tuviera un valor alto negativo, un investigador que analizara
datos con error de medida aleatorio pensara que dicha estimacin es un
nmero negativo ms pequeo.
Sera fcil utilizar este anlisis formal para demostrar que el error de
medida aleatorio en las variables explicativas tambin causa ineficiencias,
pero el sesgo suele ser un problema ms grave y nos ocuparemos de l en
primer lugar.
>
sta es la ecuacin que se utiliza para calcular el sesgo en la estimacin

del efecto que tiene X sobre la variable dependiente Y. En esta ecuacin, F
representa el grado de correlacin que hay entre las dos variables explicati
vas, X y X 29. Si el estimador que se calcula utilizando slo X x como varia
ble explicativa ( 6 ) no estuviera sesgado, su media sera igual a /3,; o sea,
que se podra decir que E( b{) = /3r Este estimador no est sesgado en ninmmsx
181
guno de los dos casos especiales en los que el trmino que expresa el sesgo,
F/3-,, es igual a cero. Resulta fcil apreciar que esto formaliza las condicio
nes de falta de sesgo que antes hemos sealado. Es decir, que podemos
omitir una variable de control si:
La variable omitida no tiene un efecto causal sobre la dependiente (o sea, /3, = 0,
independientem ente del tipo de relacin que exista entre la variable incluida y la
excluida, F).
La variable omitida no se correlaciona con la incluida (es decir, F = 0 cualquiera
que sea el valor de /3,).
Cuando sospechemos que hay una variable omitida que puede estar ses
gando los resultados, nuestro anlisis no podr terminar aqu. Si es posible,
hay que controlar esa variable omitida y, aunque no podamos hacerlo por
falta de una buena fuente de datos acerca de ella, nuestro modelo podr
ayudarnos a determinar la direccin del sesgo, lo cual puede ser muy til.
Una sobreestimacin puede reforzar sustancialmente un argumento existen
te y una subestimacin puede debilitarlo.
Supongamos, por ejemplo, que estamos estudiando unos pocos estados
subsaharianos y que nos damos cuenta de que los golpes de Estado son ms
frecuentes en regmenes que practican la represin poltica (aquellos en los
que f i t, el efecto que tiene la represin en la probabilidad de golpe, es positi
vo). Esto significa que la variable explicativa es el grado de represin poltica
y que la dependiente corresponde a la probabilidad de que haya un golpe de
Estado. La unidad de anlisis son los pases africanos del rea subsahariana.
Incluso, podramos incorporar a la muestra otros pases africanos y llegar a la
misma conclusin. Sin embargo, supongamos que no hemos considerado los
efectos que puede tener la situacin econmica en los golpes de Estado. Aun
que quiz no dispongamos de datos sobre este indicador, sera razonable plan
tear la hiptesis de que probablemente el desempleo incrementa la probabili
dad de golpe (/?, > 0 ), y tambin parece plausible que haya una correlacin
positiva entre desempleo y represin poltica (F > 0). Tambin presupone
mos, porque es til en este ejemplo, que las condiciones econmicas son pre
vias a nuestra variable causal clave: el nivel de represin poltica. Si as fuera,
el grado de sesgo de nuestro anlisis podra ser considerable. Como el de
sempleo se correlaciona positivamente con la variable dependiente y con la
explicativa (F/32 > 0 en este caso), excluir ese factor supondra que, sin dar
nos cuenta, estaramos haciendo una estimacin del efecto que tienen la re
presin y el desempleo en la posibilidad de que haya un golpe de Estado, en
vez de hacerla nicamente de la represin (/3, + Ff32 en vez de 3^). Adems,
al ser el impacto conjunto de ambos factores mayor que el de la represin por
s sola, (/3 + F/32 es mayor que /3:), la estimacin del efecto medio de esta l
tima variable (A,) sera demasiado grande. Por lo tanto, el anlisis demuestra
que, al excluir las consecuencias del desempleo, sobreestimamos las que tie
ne la represin poltica (el impacto de esta exclusin no es el mismo que el

del error de medida en las variables explicativas, ya que el sesgo de la varia
ble omitida a veces puede tener como consecuencia que se haga una estima
cin positiva de una relacin negativa).
Omitir variables relevantes no siempre redunda en una sobreestimacin
de los efectos causales. Por ejemplo, sera razonable hacer una hiptesis
que sealara que en otros pases (quiz esto sera tema para otro estudio) la
represin poltica y el desempleo tienen una relacin inversa (F es negati
vo). En estos pases, la represin politica podra permitir al gobierno con
trolar a las facciones en lucha, imponer la paz desde arriba y dar trabajo a
la mayora de la poblacin. A su vez, esta situacin conllevara que el efec
to del sesgo que introduce la relacin negativa entre desempleo y represin
(F(32) tambin sera negativo, siempre que siguiramos estando dispuestos a
presuponer que con un mayor desempleo aumentara la probabilidad de gol
pe en esos pases. La principal consecuencia es que el efecto estimado de la
represin en la probabilidad de golpe ['(A,)] ahora sera menor que el efec
to real (/3(). De este modo, si se excluye la situacin econmica, A, tender
a subestimar el efecto de la represin poltica. Si F es lo suficientemente
negativo y /32 lo suficientem ente grande, podram os considerar que /?,
siempre ser negativo y llegar a la conclusin incorrecta de que una mayor
represin poltica disminuye la posibilidad de golpe de Estado! Aunque no
dispusiramos de informacin suficiente sobre las tasas de desempleo para
incluirla en el estudio original, un anlisis como ste seguira ayudndonos
a llegar a conclusiones razonables e importantes.
Estos ejemplos tendran que dejar claro que, en realidad, no es preciso
hacer una regresin para calcular parmetros, ni para determinar el grado y
direccin del sesgo, ni para llegar a conclusiones relativas a estos asuntos.
Las estimaciones de tipo cualitativo e intuitivo padecen el mismo tipo de
sesgos que las estrictamente cuantitativas. Este apartado demuestra que, en
ambas situaciones, la informacin que no se refiere a los datos existentes
puede ser de gran ayuda para hacer una estimacin del grado de sesgo y de
su direccin.
Si pensamos que quiz nuestro diseo de investigacin se ha visto perju
dicado por la omisin de ciertas variables pero no sabemos cules son, es
muy posible que tengamos conclusiones imperfectas (que probablemente,
en el futuro, otros investigadores detectarn). Los incentivos para profundi
zar ms en el problema son evidentes. Por fortuna, en la mayora de los ca
sos, los investigadores disponen de bastante informacin sobre las variables
que estn fuera de su anlisis. A veces, la informacin es detallada, pero
slo se refiere a ciertas unidades secundarias; es parcial pero aplicable al
conjunto de la investigacin, o incluso procede de estudios anteriores. Toda
informacin, cualquiera que sea su procedencia y aunque sea incompleta,
puede ayudarnos a determinar el posible nivel de sesgo que hay en nuestros
efectos causales y la direccin que sigue.
Es evidente que, incluso los investigadores que comprenden las conse

cuencias del sesgo de la variable omitida, pueden encontrarse con dificulta
des al identificar las variables que han podido eliminar de sus anlisis. No
hay ninguna receta para enfrentarse a este problema, pero s recomendamos
a todos los investigadores, ya sean cuantitativistas o cualitativistas, que
busquen sistemticamente variables de control omitidas y que piensen si
hay que incluirlas en sus estudios. En este apartado indicamos algunas di
rectrices para proceder a esa revisin.
Las variables omitidas pueden producir dificultades aunque se disponga
de informacin adecuada sobre las variables relevantes. A veces los investi
gadores tienen esa informacin y, creyendo que ciertas variables tienen una
relacin positiva con la variable dependiente, hacen una estimacin secuencial de los efectos causales de dichas variables, en anlisis bivariantes se
parados. Recurrir a este enfoque resulta especialmente tentador en estudios
que tienen un pequeo nmero de observaciones, ya que, como sealamos
en el apartado 1 del captulo 4, utilizar simultneamente muchas variables
explicativas genera estimaciones poco exactas e incluso puede llevarnos a
un diseo de investigacin impreciso. Sin embargo, por desgracia, cada uno
de los anlisis excluye las otras variables relevantes, y esto hace que aparez
ca el sesgo de la variable omitida en cada estimacin. La solucin ideal no
slo consiste en recabar informacin sobre las variables relevantes, sino en
controlar clara y simultneamente todas ellas. El cualitativista debe admitir
que no tener en cuenta todas las variables relevantes a la vez produce infe
rencias sesgadas. Reconocer las causas del sesgo es importante, aunque sea
imposible eliminarlo porque se dispone de un pequeo nmero de observa
ciones.
Sin embargo, la preocupacin por el sesgo de la variable omitida no de
bera llevarnos a incluir de manera automtica cualquier variable cuya omi
sin pudiera causar sesgo porque se correlaciona con la variable indepen
diente y tiene consecuencias sobre la dependiente. En general, no tenemos
que controlar una variable explicativa que sea, en parte, consecuencia de
nuestra variable causal clave.
En el siguiente ejemplo, suponemos que nos interesa el efecto causal
que tiene aumentar el valor de la renta (variable de tratamiento) en 1 0 . 0 0 0
dlares sobre la probabilidad de que un ciudadano vote, en los Estados
Unidos, a un candidato demcrata (variable dependiente). Acaso habra
que controlar el hecho de que esta persona, cinco minutos antes de llegar
al colegio electoral, afirme en una entrevista que va a votar a los demcra
tas? Esta variable de control si que influye en la dependiente y es probable
que se correlacione con la explicativa. Intuitivam ente, la respuesta a la
pregunta anterior es no, ya que, si realmente controlramos esta variable,
el efecto estimado que tendra la renta en el hecho de votar por los dem
cratas se atribuira casi por completo a la variable de control, que, en este
caso, apenas puede considerarse como una explicacin causal alternativa.
Si aplicramos ciegamente las normas antes sealadas para evitar el sesgo

de la variable omitida, podram os llegar a com eter el error de controlar
esta variable. Despus de todo, esta posible variable de control s tiene un
efecto en la dependiente (votar a los demcratas) y se correlaciona con la
explicativa clave (la renta). Sin embargo, al incluirla, estaramos atribu
yendo a la variable de control parte del efecto causal que tiene la explicati
va clave.
Para dar otro ejemplo, supongamos que nos interesa el efecto causal que
tiene un drstico incremento de los precios del crudo sobre la actitud de la
opinin pblica ante la existencia de escasez de energa. Podramos conse
guir los precios del petrleo (variable causal clave) en los peridicos y utili
zar las encuestas de opinin como variable dependiente para calibrar cmo
percibe la opinin pblica la posibilidad de que haya escasez de energa.
Sin embargo, cabra preguntarse si hay que controlar la influencia que tiene
la informacin televisiva que se refiere a los problemas energticos. Es
cierto que la atencin que presta la televisin a estos asuntos se correlacio
na tanto con la variable explicativa incluida (el precio del crudo) como con
la dependiente (la opinin pblica en relacin a la escasez de energa). No
obstante, como la informacin televisiva es, en parte, consecuencia de los
precios del crudo en el mundo real, no deberamos controlarla al valorar la
influencia causal que tienen los precios del crudo en la actitud de la opinin
pblica ante la escasez de energa. Si, en lugar de esto, nos interesara el
efecto causal de la informacin televisiva, habra que controlar los precios
del crudo, ya que stos son anteriores a la variable explicativa clave (que
ahora es la informacin televisiva)lu.
En consecuencia, para hacer una estimacin del efecto total que tiene
una variable explicativa, hay que enumerar todas aquellas variables que, se
gn nuestro modelo terico, puedan generar la dependiente. Para repetir lo
que sealamos anteriormente: en general, no tenemos que controlar una va
riable explicativa que sea, en parte, consecuencia de la variable causal cla
ve. Una vez que se han eliminado estas posibles variables explicativas, hay
que controlar otras del mismo tipo que pudieran causar sesgo de la variable
omitida (las que se correlacionan con la variable dependiente y con las ex
plicativas incluidas en el anlisis)
La idea de que no tenemos que controlar las variables que sean conse
cuencia de las variables explicativas clave tiene una importante implicacin
para el papel de la teora en nuestro diseo de investigacin. Si pensamos
en este problema, entenderemos por qu hay que partir de un modelo con
fundamento terico o al menos tender hacia l en vez de escarbar en
busca de datos, es decir, realizar regresiones o anlisis cualitativos con
cualquier variable explicativa que se nos ocurra. Sin un modelo terico no
podremos decidir qu posibles variables explicativas hay que incluir en
nuestro anlisis. De hecho, si no hay modelo, se pueden lograr los resulta
dos ms slidos utilizando una variable explicativa trivial como la intensss
185
cin de votar a los demcratas que se expresa cinco minutos antes de entrar
al colegio electoral y controlando todos los dems factores que se corre
lacionan con ella. Si no disponemos de un modelo con fundamento terico,
no podremos determinar si hay que controlar las posibles variables explica
tivas o hacer caso omiso de las que se correlacionan entre s y, adems, nos
arriesgaremos a incurrir en el sesgo de la variable omitida o a elaborar un
diseo de investigacin trivial.
No es en absoluto sencillo decidir cundo hay que incorporar ms varia
bles explicativas a nuestro anlisis. El nmero de variables adicionales es
siempre ilimitado, pero nuestros recursos no, y, sobre todo, cuantas ms va
riables de este tipo incluyamos, menos control tendremos sobre las estima
ciones de cada uno de los efectos causales. Evitar el sesgo de la variable
omitida justifica la incorporacin de ms variables explicativas. Si se omi
ten variables relevantes, nuestra capacidad de hacer estimaciones correctas
de las inferencias causales se ver limitada.
2.2
Ejemplos de sesgo de la variable omitida
En este apartado, damos algunos ejemplos cuantitativos y cualitativos, unos

hipotticos y otros tomados de investigaciones reales. Por ejemplo, el nivel
de estudios es uno de los mejores predictores de la participacin poltica.
Cuanto mayor es, ms alta es la probabilidad de que se vote y de que se
participe de otras maneras en poltica. Supongamos que as parece ser en
un nuevo conjunto de datos, pero que queremos profundizar en este, asunto
y ver si la relacin entre las dos variables es causal y, si lo es, determinar de
qu manera los estudios conducen a la participacin.
Lo primero que podramos hacer es comprobar si se han omitido varia
bles previas a los estudios que se correlacionen con este factor y que, al
mismo tiempo, produzcan participacin. Dos ejemplos de ello podran ser
el compromiso poltico de los padres de cada individuo y la raza de ste.
Puede que los padres activos en poltica hayan inculcado a sus hijos el inte
rs por participar en ella y, al mismo tiempo, puede que sean la clase de pa
dres que favorecen el xito en los estudios. Si no incluyramos esta varia
ble, podramos obtener un relacin falsa entre estudios y actividad poltica
o hacer una estimacin demasiado grande de ella.
La raza podra tener el mismo papel. En una sociedad en la que hay dis
criminacin racial, los negros pueden verse excluidos tanto de las oportuni
dades educativas como de la participacin poltica. En tal caso, no sera
real el aparente efecto que tienen los estudios sobre la participacin. Lo
mejor sera que intentramos eliminar todas las posibles variables omitidas
que justifiquen en parte o totalmente la relacin que existe entre los estu
dios y la participacin.
Un anlisis formal del sesgo de la variable omitida

Comencemos con un modelo sencillo en el que hay dos variables explicativas:
(5.4)
E( 0
Supongamos ahora que nos encontramos un importante anlisis en el que

se informa del efecto que tiene X1 sobre Y sin controlar X2. En qu cir
cunstancias habra razones para criticar este estudio o justificacin para
buscar fondos con los que repetirlo? Para contestar a esta pregunta, eva
luamos formalmente el estimador con la variable de control omitida.
El estimador de 31 en el que eliminamos X2 es:
n
Para evaluar este estimador, tomamos el valor esperado de bt en varias hi

potticas reproducciones, siguiendo el modelo de la ecuacin (5.4):
(5.5)
donde F =
, el coeficiente de la pendiente en la regresin de X y
X r La ltima lnea de esta ecuacin se reproduce en el texto de la (5.3)

y ya se ha analizado con cierto detalle anteriormente.
Sin embargo, el hecho de que la relacin entre ambos elementos dismi

nuya o desaparezca cuando controlamos una variable previa no tiene por
qu suponer que los estudios sean irrelevantes. Supongamos que nos damos
cuenta de que el vnculo entre los estudios y la participacin se debilita cuan
do controlamos la raza. Una de las razones podra ser que, como en el
ejemplo anterior, la discriminacin de los negros implique que la raza est
relacionada, por un lado, con el xito acadmico y, por otro, con la partici
pacin. En estas condiciones, no habra ningn vnculo causal real entre los
estudios y la participacin. Por otra parte, la raza podra influir en la parti
cipacin poltica a travs de los estudios, ya que la discriminacin racial
podra reducir el acceso de los negros a la educacin. A su vez, sta podra
ser el principal factor a la hora de generar participacin. En este caso, la
merma de la relacin entre educacin y participacin que se produce cuan
do el investigador incluye la raza en el anlisis no quita importancia a la
educacin. En realidad, explica cmo raza y educacin interactan para in
fluir en la participacin.
Hay que sealar que estas dos situaciones son fundamentalmente dife
rentes. Si la menor participacin de los negros fuera debida a la falta de es
tudios, cabra esperar que aumentara al registrarse un incremento del nivel
educativo medio. Sin embargo, si la razn de la menor participacin fuera
la discriminacin poltica directa que impide que los negros ejerzan sus de
rechos como ciudadanos, la mejora de la educacin sera irrelevante para la
transformacin de las pautas de participacin.
Tambin podramos buscar variables que acten a la vez que la educa
cin o posteriormente. Se podran buscar variables omitidas que muestren
que la relacin entre estudios y participacin es falsa u otras que nos ayu
den a explicar de qu manera la primera favorece a la segunda. En la prim e
ra categora podra haber una variable como la del nivel de inteligencia ge
neral del individuo (la cual podra hacer que sacara buenas notas en el
colegio y llevarle a la actividad poltica). En la segunda categora podra
haber variables que midieran aspectos educativos como la asistencia a cur
sos de educacin cvica, las oportunidades de formar parte de rganos de
gobierno estudiantiles o el aprendizaje de tcnicas bsicas de comunica
cin. Si se apreciara que la introduccin en el anlisis de una o ms varia
bles del segundo grupo disminuye la relacin entre xito en los estudios y
participacin (cuando se controlaron las tcnicas de comunicacin no se
apreci que el xito en los estudios tuviera un efecto independiente sobre la
participacin), esto no significara que los estudios fueran irrelevantes. Las
tcnicas de comunicacin necesarias se aprenden en la escuela y son dife
rentes en cada nivel educativo. Lo que el anlisis nos dira es cmo influye
la educacin en la participacin.
Una vez ms, todos estos ejemplos ponen de manifiesto por qu es nece
sario evaluar con un modelo terico en mente. No hay otra manera de elegir
qu variables vamos a utilizar en nuestro anlisis. Una teora que se ocupara
de cmo influyen los estudios en las actividades cvicas nos indicara qu

variables hay que incluir. Aunque en una investigacin cualitativa no incor
poremos ms variables a una ecuacin de regresin, la lgica es bastante pa
recida cuando decidimos qu otros factores vamos a tener en cuenta. Pense
mos en una pregunta que planteamos anteriormente: qu impacto tienen los
encuentros en la cumbre sobre la cooperacin entre las superpotencias. Su
pongamos que nos diramos cuenta de que, entre los Estados Unidos y la
URSS, este tipo de cooperacin hubiera sido mayor en los aos posteriores a
una cumbre que en los precedentes. Cmo sabramos que ese efecto es real
y que no procede de alguna variable omitida? Y, si estamos seguros de que
es real, cmo podramos profundizar en su funcionamiento?
Podramos considerar variables precedentes, relacionadas con la posibi
lidad de que se celebrara una cumbre y que tambin pudieran ser causantes
directas de la cooperacin. Quiz cuando los mandatarios de cada pas se
fan el uno del otro, las reuniones son frecuentes y los pases cooperan, o
puede que cuando las ambiciones geopolticas de ambos bandos se ven li
mitadas por razones polticas internas, programen reuniones y cooperen. En
estas circunstancias, las cumbres, en s mismas, no favoreceran directa
mente la cooperacin, aunque programar una podra ser un buen indicador
de que las cosas van bien entre las superpotencias. Tambin es posible que
las reuniones en la cumbre sean parte de una secuencia causal, al igual que la
raza poda haber influido en el nivel educativo y ste, a su vez, en la partici
pacin. Cuando los mandatarios de las superpotencias confan el uno en el
otro, convocan una cumbre para reforzar esa confianza mutua, y esa reu
nin, a su vez, conduce a la cooperacin. En este caso, la cumbre no es en
absoluto irrelevante, ya que sin ella habra menos cooperacin. Suponga
mos que tenemos en cuenta estos factores y que encontramos que las cum
bres parecen tener un papel independiente: es decir, que cuando controla
mos la confianza m utua previa que hay entre los m andatarios y sus
ambiciones geopolticas, la conclusin es que una cumbre parece conducir
a una mayor cooperacin. An podramos profundizar ms y preguntamos
cmo ocurre esto. Sera posible comparar las cumbres a partir de las carac
tersticas que pueden hacerlas ms o menos exitosas y ver si esos factores
tienen alguna relacin con el grado de cooperacin posterior. De nuevo, es
preciso seleccionar los elementos que hay que tener en cuenta, y entre ellos
se pueden incluir: el grado de preparacin, si los problemas tratados fueron
econmicos ms que de seguridad, el nivel de armona interna dentro de
cada nacin, la situacin meteorolgica durante la cumbre y tambin la co
mida. La teora habr de guiamos; dicho de oti;o modo, necesitaremos tener
una idea sobre conceptos y relaciones que nos lleve a variables explicativas
relevantes y que plantee hiptesis lgicas que estn en consonancia con la
experiencia que se tenga de sus efectos.
A los investigadores que manejen un pequeo nmero de observaciones
les resultar muy difcil evitar el sesgo de la variable omitida. En esta SituaSESS
189
cin, la ineficiencia tiene muchos costes, entre los que se puede incluir el
riesgo de que la presencia de demasiadas variables de control irrelevantes
haga que el diseo de investigacin sea impreciso (apartado 1 del captu
lo 4). Sin embargo, om itir variables de control relevantes puede producir
sesgo, y, en principio, quiz el investigador no sepa si una posible variable
es relevante o no.
En este punto, podramos caer en la tentacin de afirmar que la inferen
cia causal es imposible con un nmero escaso de observaciones. Sin embar
go, para nosotros, las lecciones que hay que sacar de todo esto son ms li
m itadas y optim istas. Com prender la dificultad que com porta extraer
inferencias causales vlidas a partir de pocas observaciones tendra que ha
cernos ms cautelosos a la hora de hacer aseveraciones causales. Como in
dicamos en el captulo 2 , las buenas descripciones e inferencias descripti
vas tienen ms valor que las inferencias causales errneas. De hecho, gran
parte de la investigacin cualitativa mejorara si se prestara ms atencin a
las inferencias descriptivas vlidas y menos mpetu a la extraccin de afir
maciones causales a partir de datos inadecuados y sin calibrar adecuada
mente la incertidum bre. No obstante, es posible avanzar un poco en la
comprensin de los problemas causales si los problemas tericos que nos
preocupan se plantean con la suficiente claridad y se vinculan a las conse
cuencias observables adecuadas. Una investigacin reciente del rea de las
relaciones internacionales puede ayudamos a incidir en este punto.
Lo que llev a Helen M ilner a escribir Resisting Protectionism (1988)
fue una perplejidad: por qu la poltica comercial de los Estados Unidos
era ms proteccionista en los aos veinte que en los setenta, a pesar de los
muchos parecidos que haba entre ambos perodos? Su hiptesis era que la
interdependencia internacional haba aumentado entre una y otra dcada y
que esto ayudaba a explicar la diferencia de comportamiento de los Estados
Unidos. Sin embargo, en este nivel de anlisis agregado, slo dispona de
las dos observaciones que le haban sorprendido, y stas no podan ayudar
le a distinguir entre su hiptesis y otras muchas explicaciones posibles que
se podan dar a la variacin observada. Por lo tanto, el grado de incertidum
bre de su teora habra sido mucho mayor si se hubiera detenido aqu. En
consecuencia, tuvo que buscar en otro sitio ms consecuencias observables
de su teora.
Lo que M ilner hizo fue describir el proceso que pensaba que produca su
efecto causal. Plante la hiptesis de que la interdependencia econmica
entre las democracias capitalistas afectaba a las preferencias nacionales
porque influa en las opciones de los sectores industriales y empresas, los
cuales, a base de presionar, conseguan que se llevaran a cabo las polticas
que queran. En consecuencia, M ilner estudi diversos sectores industriales
estadounidenses de los aos veinte y setenta, as como otros franceses en este
segundo perodo, y se dio cuenta de que aquellos que ms invertan a escala
multinacional y dependan ms de las exportaciones eran los menos protec
cionistas. Estas conclusiones le ayudaron a confirm ar su teora general

acerca de las diferencias que haba, en conjunto, en la poltica estadouni
dense de los dos perodos. Por lo tanto, su procedimiento fue coherente con
la parte principal de nuestros consejos metodolgicos: hay que especificar
cules son las consecuencias observables de la teora, aunque no se refieran
a nuestra preocupacin principal, y disear la investigacin de manera que
se puedan extraer inferencias causales sobre tales consecuencias y que sea
posible utilizarlas para evaluar la teora. De ah que el estudio de Milner
sea ejemplar en muchos sentidos.
En cuanto al diseo de investigacin, el problema ms importante al que
se enfrent M ilner era el relativo a las posibles variables omitidas. La varia
ble de control ms evidente era el grado de competencia de las importacio
nes extranjeras, ya que si ste es grande suele producir tendencias ms pro
teccionistas en las empresas. Es decir, era probable que la competencia de
las importaciones se correlacionara con la variable dependiente de Milner y
que, en la mayora de los casos, fuera anterior a sus variables explicativas
o que ocurriera a la vez que ellas. Si esta variable de control tambin se co
rrelacionaba con sus variables explicativas clave la inversin a escala
multinacional y la dependencia respecto a las exportaciones , sus resulta
dos habran estado sesgados. De hecho, segn los principios de la ventaja
competitiva, habra sido probable una correlacin negativa entre la compe
tencia de las importaciones y la dependencia respecto a las exportaciones,
de manera que este sesgo hipottico se hubiera materializado si el primero de
estos dos factores no se hubiera utilizado como control.
M ilner se enfrent a este problema seleccionando para su estudio nica
mente aquellos sectores industriales a los que afectaba de manera determi
nante la competencia extranjera. En consecuencia, mantuvo constante la in
tensidad de la com petencia de las im portaciones y elimin, o al menos
redujo considerablemente, el problema del sesgo de la variable omitida. Po
dra haber mantenido constante esta variable de control clave en otro nivel
como el de aquellos sectores en los que se registraba una moderada pe
netracin de importaciones , siempre que hubiera sido realmente constan
te en sus observaciones.
Sin embargo, una vez que haba controlado la competencia de las impor
taciones, M ilner tuvo que enfrentarse a otros problemas relacionados con
las variables omitidas. Las dos que baraj ms seriamente a partir de una
revisin de los escritos empricos y tericos del rea fueron: ( 1 ) que los
cambios registrados en el poder de los Estados Unidos Explicaban los dife
rentes resultados de los aos veinte y setenta y ( 2 ) que la explicacin se ba
saba en las transformaciones registradas en los procesos polticos internos
del pas. El intento de controlar la primera explicacin ya estaba incluido
en su primer diseo de investigacin: como la proporcin del comercio
mundial en la que participaban los Estados Unidos en la dcada de los se
tenta era prcticamente igual a la de los veinte, la investigadora control
esta dimensin del poder estadounidense en el nivel agregado de sus polti

cas. as como en el de los sectores industriales y empresariales. Sin embar
go, no control las diferencias que haba entre el aislacionismo poltico de
los Estados Unidos en los veinte y su posicin hegemnica como lder
de una alianza en los setenta; se podra profundizar ms en estos factores
para calibrar su potencial capacidad de sesgo.
Milner control los procesos polticos internos comparando sectores in
dustriales y empresas en los veinte y en los setenta, puesto que unos y otras
se haban enfrentado a las mismas estructuras gubernamentales y procesos
polticos. Evidentemente, su nuevo estudio de seis sectores industriales
franceses que competan en el mbito de las importaciones durante los aos
setenta no le ayud a mantener constantes los procesos polticos internos,
pero s le ayud a descubrir que el efecto causal que tena la dependencia
de las exportaciones sobre la tendencia al proteccionismo no variaba cuan
do lo hacan los procesos polticos internos. Al pensar cuidadosamente en
las razones potenciales que haba para incurrir en el sesgo de la variable
omitida y disear su estudio para responder a esa necesidad, Milner redujo
considerablemente este posible sesgo.
Sin embargo, no control de forma explcita otras posibles variables
omitidas. Su estudio se centr en las preferencias de los grandes grupos
comerciales y no examina directamente la influencia de la opinin pblica,
la ideologa, los sindicatos, la estructura poltica del pas ni otros posibles
factores (1988, pp. 15-16). Desde el punto de vista terico, la decisin de
no controlar estas variables omitidas se podra haber justificado alegando
que no estaban relacionadas con las principales variables causales (depen
dencia de la exportacin e inversin a escala multinacional), que, en parte,
eran consecuencia de estas ltimas o que no tenan efectos sobre la variable
dependiente (preferencia por el proteccionismo en un nivel agregado, com
puesto de empresas y sectores industriales). Sin embargo, si se podan rela
cionar tales variables omitidas tanto con las explicativas del estudio como
con la dependiente, y, desde el punto de vista causal, eran anteriores a las
explicativas, Milner tendra que haber diseado una investigacin que las
hubiera controlado explcitamente 2.
Para terminar, con su procedimiento de seleccin de sectores industria
les Milner corri el riesgo de hacer ineficientes sus inferencias causales.
Como hemos sealado, su forma de elegir los casos le permiti controlar la
causa ms importante de sesgo de la variable omitida mediante el manteni
miento en valores constantes de la competencia de las importaciones, varia
ble que, desde un punto de vista terico, se esperaba que fuera causalmente
anterior a la causal clave, que se correlacionara con ella y que influyera
tambin en las variables dependientes. Seleccion los sectores que sufran
una mayor competencia de las importaciones y no los estratific en funcin
de ninguna otra variable. Posteriormente, en cada uno de los sectores de su
muestra, y tambin en muchas empresas, estudi el grado de preferencia
por el proteccionismo (su variable dependiente) e investig el nivel de de

pendencia econmica del exterior (su variable explicativa).
Este procedimiento de seleccin result ineficiente para sus inferencias
causales porque sus variables causales clave cambiaron menos de lo que se
hubiera deseado (Milner, 1988, pp. 39-42). Aunque, en este caso, la ine
ficiencia no result ser un grave problema, s tuvo como consecuencia que
la investigadora tuviera que realizar ms estudios de caso de los necesarios
para llegar al mismo nivel de certidumbre en sus conclusiones (vase el
apartado 2 del captulo 6 ). Dicho de otro modo, si hubiera trabajado con
el mismo nmero de casos, pero eligindolos de modo que, en general, va
riaran con la variable explicativa, podra haber extrado inferencias causa
les ms slidas. Es decir, que el diseo habra sido ms eficiente si se hu
bieran seleccionado, por una parte, algunos sectores industriales y
empresas que carecan de vnculos con el extranjero y, por otra, industrias
y empresas en las que haba un alto nivel de participacin extranjera; todas
ellas haban sufrido constantes apuros econmicos y tambin la entrada de
importaciones.
Los investigadores nunca pueden rechazar del todo la posibilidad de
que las variables omitidas hayan sesgado sus anlisis. Sin embargo, M il
ner, al haber intentado controlar algunas evidentes fuentes de sesgo de la
variable omitida, pudo defender su hiptesis con ms ahnco y de modo
ms convincente. Su riguroso estudio demuestra que los cientficos socia
les que trabajan con elementos cualitativos no tienen por qu desesperarse
ante la perspectiva de extraer inferencias causales limitadas. La perfeccin
es inalcanzable, quiz incluso indefinible, pero relacionar con cuidado la
teora y el m todo puede hacer que diseem os estudios que aum enten
la plausibilidad de nuestros argumentos y que reduzcan la incertidumbre
de las inferencias causales.
3.
Inclusin de variables irrelevantes: la ineficiencia
A causa de los problemas potenciales que presenta el sesgo de la variable

omitida que hemos descrito en el apartado anterior , podramos pensar
ingenuamente que es esencial recoger todas las posibles variables explicati
vas, estimando a la vez sus efectos causales. Desde el principio hay que re
cordar que esto no es lo que se desprende del apartado 2 de este captulo,
en el que hemos sealado que omitir una variable explicativa que no se co
rrelaciona con las explicativas incluidas no genera sesgo aunque esa va
riable tenga un fuerte impacto causal en la dependiente y que es un error
controlar variables que son consecuencia de las explicativas. En consecuen
cia, nuestro argumento no debera llevar a los investigadores a recabar in
form acin sobre todas las inferencias causales posibles o a criticar los es
tudios que no lo hagan.
Por supuesto, puede darse el caso de que el investigador siga sin estar
seguro de qu variables de control previas tienen un impacto causal en las
incluidas o cules se correlacionan con stas. En tal situacin, habr inves
tigadores que intenten incorporar todas las variables de control cuya corre
lacin con las variables explicativas utilizadas sea concebible, as como to
das aquellas que, desde un punto de vista terico, se pueda esperar que
afecten a la variable dependiente. Es probable que el resultado de esto sea
una larga lista de variables y que muchas de ellas sean irrelevantes. Este en
foque, que a primera vista parece una manera cuidadosa y prudente de evi
tar el sesgo de la variable omitida, de hecho nos hara correr el riesgo de
elaborar un diseo de investigacin cuyos resultados no podran ser ms
que imprecisos. Cuando se utiliza un nmero relativamente escaso de ob
servaciones, la imprecisin, tal como se analiz en el apartado 1 del captu
lo 4, es un problema bastante grave para el que este cuidadoso diseo se
ra en realidad perjudicial. En el presente apartado analizamos los costes
que tiene incluir variables explicativas irrelevantes y mostramos reservas
fundamentales ante la pretensin de incluirlo todo. Incorporar variables
irrelevantes puede ser muy daino. Nuestra idea principal es que aunque la
variable de control no tenga ningn efecto causal en la dependiente, cuanta
mayor correlacin haya entre la variable explicativa y la irrelevante de
control, menos eficiente ser la estimacin del principal efecto causal.
Vamos a ilustrar esta afirmacin centrndonos en dos diferentes proce
dimientos (o estimadores), con el fin de calcular el efecto causal de una
variable explicativa cuya inclusin s es apropiada. La primera estimacin
de este efecto procede de un anlisis realizado sin variables de control irre
levantes; en el segundo hay una que s lo es. El anlisis formal que figura
en el recuadro posterior llega a las siguientes conclusiones respecto al valor
relativo de estos dos procedimientos y al del mtodo antes mencionado. En
primer lugar, ninguno de los estimadores est sesgado. Esto quiere decir
que, aunque se controle una variable explicativa irrelevante, el estimador
habitual seguir dndonos una respuesta media correcta. En segundo lugar,
si la variable de control irrelevante no se correlaciona con la explicativa
principal, la estimacin del efecto causal de la segunda no slo estar ses
gado, sino que resultar tan ineficiente como si no se hubiera incluido la
variable irrelevante. En realidad, si estas variables no estn correlaciona
das, se obtendr precisamente la misma inferencia. Sin embargo, si la va
riable de control irrelevante est muy correlacionada con la explicativa
principal, se registrar una ineficiencia considerable.
Por lo tanto, los costes de controlar variables irrelevantes son altos. Si lo
hacemos, es ms posible que nuestros estudios hagan estimaciones alejadas
de los autnticos efectos causales. Cuando reproduzcamos un estudio, en
un conjunto de datos que presenta una alta correlacin entre la variable ex
plicativa clave y una de control irrelevante incluida en el anlisis, probable
mente obtengamos resultados diferentes que nos lleven a otras inferencias
causales. De este modo, aunque controlemos todas las variables explicati

vas irrelevantes (sin cometer otros errores), obtendremos la respuesta me
dia correcta, pero quiz en algunos de los proyectos, o en todos, nos aleje
mos de ella. La repeticin del anlisis tendr, como promedio, el mismo
efecto, pero la variable irrelevante aumentar la ineficiencia, tal como ha
bra ocurrido si hubiramos descartado alguna de nuestras observaciones.
Las consecuencias tendran que ser claras: al incluir una variable irrelevante ejercemos ms presin sobre un conjunto de datos limitado, lo cual hace
que dispongamos de menos informacin para cada inferencia.
Como ejemplo, pensemos de nuevo en el estudio de los golpes de Esta
do en los pases africanos. Una investigacin preliminar indicaba que el
grado de represin poltica, la variable explicativa principal de inters, au
mentaba la frecuencia de dichos golpes. Supongamos que otro investiga
dor sealara que el primer estudio era incorrecto porque no haba tenido
en cuenta si cada pas haba logrado la independencia librndose del go
bierno colonial de manera violenta o negociada. Supongamos que creemos
que este investigador est equivocado y que el tipo de proceso descoloni
zador no influye en la variable dependiente, que es la frecuencia de los
golpes (despus de utilizar la principal variable explicativa, se controla la
represin poltica). Cules seran las consecuencias de controlar esta otra
variable irrelevante?
La respuesta depende de la relacin que exista entre la variable irrelevan
te, que evala el tipo de proceso descolonizador, y la explicativa principal,
que mide la represin poltica. Si la correlacin entre ambas es alta como
parece posible , incluir estas variables de control har que las estimaciones
del efecto de la represin poltica sean bastante ineficientes. Para entender
esto, hay que sealar que, para controlar de qu manera se accedi a la inde
pendencia, el investigador podra dividir sus categoras de regmenes repre
sivos y no represivos teniendo en cuenta si el proceso descolonizador haba
sido violento o negocjado. Se podra medir la frecuencia de los golpes de
Estado en cada categora para evaluar los efectos causales de la represin
poltica, mientras que se mantiene bajo control la forma de librarse del go
bierno colonial. Aunque este tipo de diseo sea una forma razonable de evi
tar el sesgo de la variable omitida, puede tener muchos costes: cuando la
nueva variable de control no influya en la dependiente pero se correlacione
con una variable explicativa incluida, se reducir el nmero de observacio
nes de cada categora y la estimacin del principal efecto causal se realizar
de forma mucho menos eficiente. Este resultado supone que se desperdicia
gran parte del trabajo del investigador, ya que reducir innecesariamente la
eficiencia equivale a descartar observaciones. La mejor solucin es siempre
recoger ms observaciones, pero, si esto no es posible, los investigadores ya
saben que tienen que identificar cules son las variables irrelevantes para no
tener en cuenta sus consecuencias.
Un anlisis formal de las ineficiencias

de la variable incluida
Supongamos que el verdadero modelo sea E(Y) = Xj/3y V(Y) = a2. Sin em
bargo, pensamos errneamente que la variable explicativa X2 tambin ha
de estar en la ecuacin; de manera que hacemos la siguiente estimacin: s
f ( J 0 - ^ 1 + X2ft
(5.6) |
sin saber que, en realidad, /32 = 0. Qu consecuencias tiene una estimacin simultnea de ambos parmetros para nuestra estimacin de (3,?
Si definimos 6, como el estimador correcto que se basa nicamente
en la regresin entre Y X, yjSj como el primer coeficiente de X. en una
regresin entre Y, por una parte, y X, y X2, por otra, es fcil mostrar que
no podemos distinguir entre estos dos estimadores utilizando la falta de
sesgo (una media correcta en muchos experimentos hipotticos), ya que
ambos carecen de l:
( > ,) - ( & ) - ,
|
|
I
|
|
|
|
(5.7) |
Sin embargo, los estimadores s difieren en cuanto a su eficiencia. El

estimador correcto tiene una varianza (calculada en la ecuacin [3.9]) de |
5.8) j
5X
M -
mientras que la del otro estimador es
V(fr) = ------------;-----
(l-'iEX
( 5 -9)
V(fct)
(1 - r y
donde la correlacin entre X, y X2 es rn (vase Goldberger, 1991, p. 245).
En la ltima lnea de la ecuacin podemos ver la relacin precisa que
existe entre las varianzas de los dos estimadores. Si la correlacin entre
las dos variables explicativas es nula, no tendr importancia si se incluye la
variable irrelevante o no, ya que ambos estimadores tendrn la misma va
rianza. Sin embargo, cuanto ms se correlacionen dos variables, mayor
ser la varianza y, por tanto, menor la eficiencia de jSj.
4.
Endogeneidad
En las ciencias polticas la investigacin experimental no es frecuente. No

solemos tener la oportunidad de manipular las variables explicativas; slo
las observamos. Una de las consecuencias de esta falta de control es la en
dogeneidad, es decir, que los valores de nuestras variables explicativas a ve
ces provienen de nuestra variable dependiente en vez de ser una de sus cau
sas. Si hay una autntica m anipulacin experimental, la direccin de la
causalidad es inequvoca. Sin embargo, en muchas reas de la investigacin
cualitativa y cuantitativa la endogeneidad es un problema habitual y gravel3.
Si el investigador no controla los valores de las variables explicativas, la
direccin de la causalidad siempre ser un problema difcil. En la investiga
cin no experimental ya sea cuantitativa o cualitativa las variables ex
plicativas y dependientes varan por la influencia de factores que escapan al
control del investigador (y que, a menudo, no se ven). Los pases invaden,
los oficiales traman golpes de Estado, la inflacin cae, las polticas de los
gobiernos se implantan, los candidatos deciden presentarse a las elecciones,
los votantes eligen entre ellos y el investigador tiene que intentar elaborar
un argumento para determinar causas y consecuencias.
Pensemos en un ejemplo tomado de la bibliografa sobre las elecciones
al Congreso estadounidense. Muchos acadmicos han sealado que el drs
tico aumento que se registr a finales de los sesenta en las ventajas electo
rales de que disponan los candidatos que ya estaban en el poder se debi
principalmente al incremento de los servicios que prestaban estos congre
sistas a su electorado. Es decir, que el franqueo gratuito, los presupuestos
para viajar a la propia circunscripcin, el personal de que se dispone en
ella para ocuparse de las peticiones concretas de los electores, la finan
ciacin de proyectos locales con fondos pblicos para lograr objetivos elec
torales, as como otros incentivos de los congresistas, han hecho posible
que stos recaben apoyos en sus circunscripciones. Muchos ciudadanos les
votan teniendo en cuenta estas cuestiones.
La hiptesis del servicio al electorado parece perfectamente razonable,
pero hay pruebas de ella? Numerosos investigadores han intentado presen
tarlas (para una revisin de esta bibliografa, vase Cain, Ferejohn y Fiorina, 1987), pero pocos son los datos que constatan tal hiptesis. El estudio
modal de esta cuestin se basa en medidas del servicio que ha dado a su
circunscripcin cada uno de los congresistas de una muestra y en las que
indican la proporcin de votos que recibe esa clase de candidatos. Poste
riormente, utilizando un anlisis de regresin, los investigadores hacen una
estimacin del impacto causal que tiene ese servicio sobre el voto. Resulta
sorprendente que muchas de esas estimaciones indiquen que el efecto es
nulo o incluso negativo.
Es probable que el problema de la endogeneidad explique esos resulta
dos paradjicos. Dicho de otro modo, los congresistas que corran un mayor
riesgo de perder el puesto en las siguientes elecciones (quiz a causa de un

escndalo o por haber atravesado una mala poca en su circunscripcin) da
rn ms servicios a sus electores, mientras que los que estn seguros de que
no van a rechazarlos se concentrarn en otras vertientes de su trabajo, como
la elaboracin de polticas en Washington. El resultado es que los congre
sistas que dan ms servicios reciben menos votos. Esto no significa que el
servicio al electorado reduzca el nmero de votos, slo que unas expectati
vas de voto altas reducen tal servicio. Si se hace caso omiso de este efecto
de retroalimentacin, las inferencias sern muy sesgadas.
David Laitin traza las lneas generales de un ejemplo de endogeneidad
que toma de uno de los clsicos de las ciencias sociales de principios de si
glo, La tica protestante y el espritu del capitalismo de Max Weber. Weber intent demostrar que las enseanzas y doctrinas protestantes provoca
ban (de forma inadvertida) un cierto tipo de comportamiento econmico: el
espritu capitalista. Sin embargo [...] Weber y sus discpulos no pudieron
responder a una de las objeciones que suscit esta tesis: que los europeos a
los que ya les interesaba rom per los lmites del espritu precapitalista bien
podan haberse apartado de la iglesia catlica, precisamente para alcanzar
ese propsito. Dicho de otro modo, se podra interpretar que los intereses
econmicos de ciertos grupos haban hecho que se desarrollara la tica pro
testante. Sin un estudio mejor controlado, se puede dar la vuelta a la lnea
de causalidad de Weber (Laitin, 1986, p. 187; vase tambin R. H. Tawney, 1935, que fue quien origin este tipo de crtica).
En lo que queda de este apartado analizaremos cinco mtodos para en
frentarse al difcil problema de la endogeneidad:
C orregir una inferencia sesgada (apartado 4.1).
Precisar cules son los com ponentes de la variable dependiente y estudiar slo
aquellos que sean consecuencia, y no causa, de la explicativa (apartado 4.2).
C onvertir un problem a de endogeneidad en un sesgo producido por una variable
om itida y controlar esta variable (apartado 4.3).
Seleccionar con cuidado al m enos algunas observaciones en las que no haya pro
blem a de endogeneidad (apartado 4.4).
Precisar cules son los com ponentes de las variables explicativas con el fin de
asegurarse de que slo entran en el anlisis los que sean realm ente exgenos
(apartado 4.5).
Cada uno de estos cinco procedimientos puede considerarse un mtodo

para evitar los problem as de endogeneidad, pero tam bin pueden verse
como formas de aclarar una hiptesis causal, puesto que las que no prestan
atencin a un problema de endogeneidad sern, finalmente, problemas te
ricos que haya que redefinir para que, al menos, sea posible que la variable
explicativa influya en la dependiente. Analizaremos las dos primeras solu
ciones que se dan a la endogeneidad mediante el ejemplo cuantitativo del
servicio al electorado y para las otras tres nos apoyaremos en ejemplos de

investigaciones cualitativas ampliados.
4.1
Corregir inferencias sesgadas
La ltima lnea de la ecuacin (5.13) que aparece en el siguiente recuadro

nos proporciona un mtodo para determinar la direccin exacta y la magni
tud del sesgo que procede de la endogeneidad. Para una mayor comodidad,
reproducimos aqu esa ecuacin:
E (b) = /3 + sesgo
Esta frmula implica que cuando hay endogeneidad no estamos hacien
do la inferencia causal deseada. Esto quiere decir que, si el trmino del ses
go es cero, la media de nuestro mtodo inferencial (o estimador b) no estar
sesgada (o sea, ser igual a /3). Sin embargo, si hay un sesgo de endogenei
dad, estaremos haciendo una estimacin de la inferencia correcta ms un
factor de sesgo. La endogeneidad es un problema porque, en general, no so
mos conscientes de la magnitud o direccin del sesgo. Este factor de sesgo
ser grande o pequeo, negativo o positivo, segn sea el ejemplo emprico
especfico. Por fortuna, aunque en principio no podamos evitar el sesgo de
endogeneidad, a veces podremos corregirlo a posteriori si determinamos la
direccin y quiz el nivel de sesgo.
La ecuacin (5.13) demuestra que el factor de sesgo depende de la corre
lacin que haya entre la variable explicativa y el trmino de error, que es la
parte de la variable dependiente que no se aclara mediante la explicativa. Por
ejemplo, si la hiptesis del servicio al electorado es correcta, el efecto causal
que tenga dicho servicio sobre los votos (/3 en la ecuacin) ser positivo. Si,
adems, el voto esperado influye en el nivel de servicio al electorado que
observamos, el trmino de sesgo ser negativo. Esto quiere decir que, inclu
so despus de que se tenga el cuenta el efecto del servicio al electorado so
bre los votos, habr una correlacin inversa entre tal servicio y el trmino de
error, porque los congresistas que esperan obtener menos votos darn ms
servicios. El resultado es que el trmino de sesgo ser negativo y que, en
este caso, las inferencias que no se hayan corregido sern estimaciones ses
gadas del efecto causal /3 (o, de forma equivalente, estimaciones sesgadas de
[/3 + sesgo]). De esta manera, aunque la hiptesis del servicio al electorado
sea cierta, el sesgo de endogeneidad nos llevar o bien a estimarlo con un
valor positivo ms pequeo del que tendra que tener, o bien a considerarlo
nulo, o incluso negativo, dependiendo de la magnitud del factor de sesgo.
Por lo tanto, podemos afirmar que la estimacin correcta del efecto del ser
vicio al electorado sobre los votos ser mayor que la calculada en un anlisis
en el que no se haya corregido la endogeneidad. En consecuencia, en este
SKH
199
anlisis no corregido, el efecto del servicio presentar un lmite ms bajo, lo

cual har que resulte ms plausible la hiptesis del servicio al electorado.
De este manera, aunque no podamos evitar el sesgo de endogeneidad, a
veces s podremos mejorar las inferencias a posteriori haciendo una estima
cin del nivel de sesgo. Como mnimo, esto nos permitir determinar su di
reccin y quiz nos indique el lmite superior o inferior de la estimacin
correcta. En el mejor de los casos, podremos utilizar esta tcnica para hacer
inferencias que no tengan sesgo alguno.
4.2
Precisar cules son los componentes de la variable dependiente
Una de las formas de evitar el sesgo de endogeneidad es redefinir la varia

ble dependiente para dotarla de sus propios componentes dependiente y ex
plicativo. Este ltimo obstaculiza nuestro anlisis a travs de un mecanismo
de retroalimentacin, es decir, influye en la variable causal (explicativa)
clave. La otra parte de nuestra variable dependiente es realmente depen
diente: es una funcin, y no una causa, de la variable explicativa. El objeti
vo de esta forma de evitar el sesgo de endogeneidad es identificar y medir
slo la parte dependiente de nuestra variable dependiente.
Por ejemplo, King (1991a), al estudiar la hiptesis del servicio al electo
rado, desgaj del total de votos recibido por un congresista estadounidense
la porcin que se deba nicamente al hecho de que ya estuviera en el po
der. En los ltimos aos, la ventaja electoral de los que ya son congresistas
se ha cifrado entre un 8 y un 1 0 % de los votos; proporcin que hay que
comparar con el 52% aproximado que constituye la base electoral de la ma
yora de los que, en este sistema bipartidista, ya ocupan un escao en el
Congreso. Posteriormente, King calcul, mediante un procedimiento esta
dstico, la ventaja que supona ser congresista elemento que era el nico
dependiente de la variable dependiente y utiliz esta cifra en lugar del
voto bruto para hacer una estimacin de los efectos que tena el servicio al
electorado. Como la ventaja de los congresistas en nmero de votos, al re
presentar slo una pequea porcin del total, no iba a tener un gran impac
to en la propensin de ese tipo de candidatos a realizar servicios para el
electorado, King evit el sesgo de endogeneidad. Sus resultados sealaban
que, si se aadan 1 0 . 0 0 0 dlares al presupuesto que tena el legislador
estatal medio para (entre otras cosas) dar servicios al electorado, se estaba
concediendo a este candidato una ventaja de 1,54 puntos (ms o menos
0,4%) en las elecciones siguientes. De esta manera, el autor estaba dando la
primera base emprica a la hiptesis del servicio al electorado.
4.3
Convertir la endogeneidad en un problema de variable omitida
Siempre se puede abordar la endogeneidad como si fuera un sesgo de la va

riable omitida, tal como demostramos a continuacin con el famoso ejem
plo del estudio sobre sistemas electorales comparados. Para las primeras
generaciones de politlogos, uno de los grandes enigmas del anlisis polti
co era la cada de la Repblica de Weimar y su sustitucin por el rgimen
nazi a principios de los aos treinta. Una de las explicaciones, que se basa
ba en algunos rigurosos y convincentes estudios de caso de la Alemania de
esa poca, sealaba que la causa principal haba sido la consagracin en la
constitucin de esa repblica de un sistema de representacin proporcional
para las elecciones. En pocas palabras, la idea es que el sistema proporcio
nal permite que estn en el parlamento los pequeos partidos que represen
tan a determinadas ideologas, intereses o grupos religiosos. En este tipo de
ordenamiento electoral los candidatos no se ven en la necesidad de nego
ciar sus posturas para tener xito en las elecciones, como s ocurre en aque
llos sistemas en los que slo hay un ganador por circunscripcin. En conse
cuencia, el parlam ento se llena de pequeos grupos ideolgicos que ni
quieren ni pueden trabajar juntos. La parlisis y la frustracin resultantes
harn posible que uno de estos grupos en este caso los nacionalsocialis
tas tome el poder (para la exposicin clsica de este teora, vase Hermens, 1941).
El argumento del prrafo anterior se fue elaborando en varios importan
tes estudios de caso que se ocuparon de la cada de la Repblica de Wei
mar. Hubo historiadores y politlogos que achacaron este hecho al xito
electoral de los pequeos partidos y a su falta de voluntad negociadora en el
Reichstag. Este planteamiento tiene muchos problemas, como siempre ocu
rre cuando se explica un resultado complejo a partir de un nico factor,
pero slo vamos a centram os en el de la endogeneidad. Detrs de esta ex
plicacin subyace un m ecanism o causal que se encadena de la. siguiente
manera: se implant la representacin proporcional y esto hizo posible que
partidos pequeos que contaban con una escasa base electoral consiguieran
escaos en el Reichstag (y en stos se incluan aquellos que, como los
nacionalsocialistas, queran acabar con dicha institucin). El resultado fue
que el funcionamiento del Reichstag alcanz un punto muerto y la frustra
cin se extendi entre las masas. A su vez, esto condujo a un golpe de Esta
do propiciado por uno de los partidos.
Sin embargo, otros estudios tanto de Alemania como de otras conse
cuencias observables sealaron que la fragmentacin de los partidos no
slo era consecuencia de la representacin proporcional. Algunos investi
gadores argumentaron que si dicha fragmentacin condujo a la implanta
cin de la representacin proporcional, tambin poda haber sido su causa.
Al aplicar la misma variable explicativa a otras observaciones (en conso
nancia con la regla que indicamos en el captulo 1 : intentar probar las hipn
201
tesis con datos diferentes a los que las produjeron), los investigadores se
dieron cuenta de que en aquellas sociedades en las que muchos grupos de
mentalidad estrecha y arraigada se oponen a otros minoritarios, tnicos o
religiosos, es ms probable que se opte por la representacin proporcional,
ya que ste es el nico sistema electoral que ambas facciones pueden acep
tar. Una mirada ms atenta a la situacin de la poltica alemana antes de
que se introdujera este tipo de representacin confirm esta idea, ya que se
localizaron muchas facciones pequeas. La representacin proporcional no
las haba creado, aunque puede que s facilitara la expresin de sus ideas en
el parlamento. Tampoco las facciones eran la nica causa de la representa
cin proporcional; sin embargo, s pareca que tanto la adopcin del siste
ma proporcional como la gran divisin del parlamento eran consecuencia
de la fragmentacin social (vase Lakeman y Lambert, 1955, p. 155, para
una de las primeras explicaciones de este argumento).
De este modo, hemos transformado un problema de endogeneidad en un
sesgo de la variable omitida. Esto quiere decir que la fragmentacin social
previa es una variable omitida que lleva a la representacin proporcional;
desde el punto de vista causal es anterior a sta y, en parte, condujo a la ca
da de Weimar. Al transformar el problema de esta manera, los acadmicos
consiguieron abordar mejor el problema, ya que podan medir de manera
explcita esta variable omitida y controlarla en estudios posteriores. En este
ejemplo, una vez que se incluy y control dicha variable omitida, los in
vestigadores se dieron cuenta de que exista una posibilidad razonable de
que la aparente relacin causal que haba entre la representacin proporcio
nal y la cada de la Repblica de Weimar fuera casi completamente falsa.
La relacin que existe entre los sistemas electorales y la democracia si
gue suscitando polmica, aunque el estudio de este tema ha avanzado mu
cho desde los primeros trabajos que se hicieron. Los investigadores han
ampliado esta rea, dejando a un lado los intensos estudios de caso, que
apenas se preocupaban de la lgica de las explicaciones, para hacer trabajos
que se basan en muchas observaciones de determinadas consecuencias y
as resolver gradualm ente algunos aspectos relacionados con la m edida
y, finalmente, con la inferencia. Con este cambio, han logrado separar de
modo ms sistemtico los efectos exgenos de los endgenos.
4.4
Seleccionar observaciones para evitar la endogeneidad
La endogeneidad es un problema muy comn en gran parte de las obras

que se ocupan del impacto que tienen las ideas en las polticas (Hall, 1989;
Goldstein y Keohane, 1993). En la medida en que las ideas reflejan las
condiciones en las que operan los actores polticos por ejemplo, las cir
cunstancias materiales que generan sus propios intereses en ese sentido ,
el anlisis del impacto que tienen sobre las polticas siempre ser suscepti
ble de incurrir en un sesgo de la variable omitida: las ideas de los actores se

correlacionan con una variable omitida anterior en sentido causal los in
tereses materiales que influye en la variable dependiente la estrategia
poltica (vase el apartado anterior). Adems, en la medida en que las ideas
funcionan como racionalizaciones de polticas que se han llevado a cabo en
otros mbitos, tambin pueden ser simples consecuencias de esas polticas,
ms que sus causas. En tales circunstancias, las ideas son endgenas: puede
parecer que explican las estrategias de los actores, pero, en realidad, son su
resultado.
Desde el punto de vista metodolgico, lo ms difcil a la hora de estudiar
el impacto de las ideas sobre las polticas es compensar la influencia que tie
nen, en un determinado problema de investigacin, el problema de la endo
geneidad y el de la variable omitida, que tan relacionados estn. Para poder
sealar la importancia causal de las ideas, hay que demostrar que algunas
ideas o un aspecto de las mismas que mantienen los que elaboran las
polticas influyen en aquellas que realmente se llevan a cabo, y que no slo
reflejan esas mismas polticas o los previos intereses materiales de sus im
pulsores. Los investigadores de esta rea tienen que ser especialmente cuida
dosos a la hora de definir el efecto causal del inters. En concreto, tienen
que comparar la variable dependiente observada (las polticas) y la explicati
va (las ideas de los individuos) con una situacin contrafctica definida
con precisin en la que la variable explicativa adopte un valor diferente:
cuando los individuos relevantes tienen ideas diferentes.
El anlisis comparado es una buena forma de determinar si un conjunto
de ideas concreto es exgeno o endgeno. Por ejemplo, en un reciente estu
dio acerca del papel de las ideas en la adopcin de polticas econmicas estalinistas en pases socialistas, Nina Halpem (1993) hace este tipo de anli
sis. Su hiptesis es que la doctrina de la planificacin estalinista, en la que
crean los mandatarios de Europa del Este y de China, ayuda a explicar las
polticas econmicas que implantaron cuando llegaron al poder en estos
pases despus de la Segunda Guerra Mundial. Esta hiptesis concuerda
con el hecho de que tales lderes tuvieran ideas estalinistas y aplicaran pol
ticas de ese tipo, pero una simple correlacin no demuestra que haya causa
lidad. En realidad, puede que la endogeneidad est funcionando: las polti
cas estalinistas podran haber generado ideas que las justificaran o prever
que habra que seguir tales polticas quiz produjera esas ideas.
Aunque Halpem no utiliza este lenguaje, s recurre a un procedimiento
similar al que se ha analizado en el apartado anterior: transformar la endo
geneidad en sesgo de la variable omitida. La principal hiptesis alternativa
que esta autora considera es que Europa del Este y los estados comunistas
de Asia slo implantaron economas centralizadas despus de la Segunda
Guerra Mundial por el podero militar y la influencia poltica de la Unin
Sovitica. El contrafctico que plantea esta hiptesis es que, aunque los eu
ropeos orientales y los chinos no hubieran credo en la conveniencia de las
economas planificadas que dictaba el estalinismo, de todas maneras se ha

bran implantado esa clase de economas y habran aparecido ideas que las
justificaran.
Posteriormente, Halpem seala que en los pases de Europa del Este que
fueron ocupados por el Ejrcito Rojo, la adopcin de una economa centrali
zada podra explicarse ms por el podero sovitico que por la creencia en la
superioridad de las doctrinas estalinistas: ... la explicacin alternativa de
que la eleccin no fue ms que una respuesta a las rdenes de Stalin es im
posible de refutar (1993, p. 89). En consecuencia, Halpem busca posibles
observaciones en las que no aparezca esta fuente de sesgo de la variable
omitida y encuentra las polticas que se implantaron en China y Yugoslavia,
los dos pases socialistas ms grandes de los no ocupados por tropas soviti
cas despus de la Segunda Guerra Mundial. Como China era un pas enorme
que haba tenido su propia revolucin, Stalin no poda indicarle qu polticas
tena que practicar. Los comunistas yugoslavos tambin haban llegado al
poder sin la ayuda del Ejrcito Rojo, y el mariscal Tito demostr su indepen
dencia respecto a las rdenes de Mosc desde el final de la guerra.
China implant una economa centralizada sin estar bajo la dominacin
poltica o militar de la Unin Sovitica y en Yugoslavia las medidas de tipo
estalinista se adoptaron a pesar de las polticas soviticas. De estos datos,
Halpem infiere que, en estos casos, el poder sovitico no explica por s solo
los cambios en las polticas. Adems, por lo que a China se refiere, tambin
considera, y rechaza, otra hiptesis alternativa segn la cual las ideas seran
endgenas: situaciones econmicas parecidas habran aconsejado transplantar los mtodos de planificacin estalinista a China.
Halpem, una vez que se plante y rechaz hiptesis alternativas que man
tenan ideas endgenas bien en relacin al poder sovitico o a las condiciones
econmicas, pudo indicar que la adopcin por parte de China (y, hasta cierto
punto y durante menos tiempo, de Yugoslavia) de la doctrina estalinista apor
taba bases para el acuerdo y resolva la incertidumbre de estos regmenes
postrevolucionarios. Aunque este tipo de anlisis sigue siendo bastante provi
sional, a causa del escaso nmero de observaciones de su propia teora que
contempl la autora, s aporta razones para creer que, en la situacin estudia
da, las ideas no eran del todo endgenas y tuvieron una funcin causal.
Este ejemplo pone de manifiesto de qu manera podemos, en primer lu
gar, trasladar una preocupacin general sobre la endogeneidad a posibles
fuentes especficas de sesgo de la variable omitida, para buscar despus un
subconjunto de observaciones en el que podran no estar presentes esas
causas de sesgo. En este caso, al transformar el problema en una cuestin
de sesgo de la variable omitida, Halpem pudo comparar otras hiptesis ex
plicativas con resultados especialmente productivos para su hiptesis prin
cipal. Se plante diversas hiptesis explicativas alternativas para explicar la
adopcin de economas planificadas y se dio cuenta de que slo en China,
y hasta cierto punto en Yugoslavia, era razonable pensar que las doctrinas
estalinistas (las ideas en cuestin) fueran en gran medida exgenas. En con

secuencia, centr su atencin en China y Yugoslavia. Si no hubiera dise
ado su estudio con cuidado para poder enfrentarse al problema de la en
dogeneidad, sus conclusiones habran sido m ucho menos convincentes;
pensemos, por ejemplo, que hubiera intentado demostrar sus planteamien
tos utilizando Polonia y Bulgaria!
4.5
Precisar cules son los componentes de la variable explicativa
En este apartado presentamos el quinto y ltimo mtodo para eliminar el

sesgo que produce la endogeneidad. Su objetivo es dividir una variable ex
plicativa potencialm ente endgena en dos componentes: uno claramente
exgeno y otro que sea, al menos en parte, endgeno. Posteriormente, el in
vestigador slo utilizar en su anlisis causal la parte exgena de la variable
explicativa.
En el estudio realizado por Verba, Schlozman, Brady y Nie (1993) sobre
participacin poltica voluntaria, encontramos un ejemplo de este mtodo.
A los autores les interesaba explicar por qu los afroamericanos son mucho
ms activos polticamente que los latinos, teniendo en cuenta que ambos
grupos estn igualmente desfavorecidos. Se dieron cuenta de que hay diver
sos factores que contribuyen a explicar la diferencia, entre ellos el poco
tiempo transcurrido desde que se ha emigrado a los Estados Unidos y el co
nocimiento del idioma. Una de sus principales variables explicativas era la
asistencia a servicios religiosos (en iglesias o sinagogas, por ejemplo). Evi
dentemente, los investigadores no podan controlar si los individuos asistan
a esas reuniones; de ah que no pudiera eliminarse la posibilidad de endo
geneidad. En realidad, sospechaban que algunos latinos, y en mayor medida
los afroamericanos, asistan a servicios religiosos porque eran polticamen
te activos. Quiz los que tenan inters en poltica entraban a formar parte
de una iglesia porque sta les daba la oportunidad de aprender o porque es
taba muy politizada. Un clero muy consciente de su labor poltica poda
adiestrar a los feligreses para ese tipo de actividad o estimularles poltica
mente. Dicho de otro modo, la orientacin de la causalidad poda ir desde
la poltica a las experiencias no polticas y no al revs.
Verba y sus colegas solucionaron este problema analizando los compo
nentes de su principal variable explicativa. Para ello, partieron de la base de
que las instituciones religiosas influyen en la participacin poltica de dos
maneras. En primer lugar, en ellas los individuos aprenden habilidades so
ciales (como dar un discurso o dirigir una reunin). A su vez, ese aprendi
zaje hace que el ciudadano sea ms competente a la hora de participar en la
vida poltica y que est ms dispuesto a hacerlo. En segundo lugar, los ciu
dadanos reciben constantes estmulos polticos (por ejemplo, a travs de
discusiones o cuando otros miembros del grupo les piden que se impliquen
directamente), y esta situacin tambin tiene que influir en su actividad po

ltica. Estos autores sealaron que el primer componente es principalmente
exgeno, mientras que el segundo es, al menos en parte, exgeno: o sea,
que procede parcialmente del grado de participacin poltica de los indivi
duos (la variable dependiente).
Posteriormente, los autores llevaron a cabo un estudio auxiliar para con
trastar su hiptesis en relacin a los componentes exgeno y endgeno de
la participacin en los servicios religiosos. Desde el principio reconocieron
que la posibilidad de que el individuo adquiera habilidades sociales en su
iglesia depende de la estructura organizativa de sta. Las que tengan una
estructura jerrquica, donde el clero sea elegido por rganos rectores cen
tralizados y los feligreses apenas puedan opinar sobre el funcionamiento
interno, ofrecern menos oportunidades de aprender habilidades sociales
que aquellas cuya base cooperativa conceda a los miembros un importante
papel en el gobierno de la organizacin. La mayora de los afroamericanos
pertenecen a iglesias protestantes que funcionan de m anera muy participativa, mientras que los latinos son miembros de congregaciones catli
cas organizadas de modo jerrquico. Los autores mostraron que esta dife
rencia es la que explica la probabilidad de que adquieran habilidades
sociales. Por ejemplo, sealaron que en estos dos grupos, as como en los
estadounidenses blancos, el factor que influye en el aprendizaje de esas ha
bilidades es el tipo de confesin religiosa y no los componentes tnicos, ni
otros rasgos sociales ni, especialmente, la participacin poltica.
Despus de convencerse de que la adquisicin de habilidades sociales
era realmente exgena a la participacin poltica, Verba y los otros autores
calibraron este factor en los servicios religiosos y lo utilizaron como varia
ble explicativa, en vez de usar para tal fin la asistencia a tales servicios.
Este procedimiento solucion el problema de la endogeneidad, ya que aho
ra se haban analizado los componentes de la variable explicativa para po
der incluir nicamente los exgenos.
Este estudio auxiliar aport ms pruebas que demostraban la resolucin
del problema de la endogeneidad, ya que la pertenencia de los latinos y
afroamericanos a las iglesias no poda explicarse de manera coherente en
funcin de su participacin poltica concreta, puesto que su vinculacin con
ellas comienza desde la infancia a travs de la familia. Las razones que ex
plican el hecho de que los afroamericanos sean en su mayora protestantes
hay que buscarlas en la historia de la esclavitud en los Estados Unidos y en
la de las organizaciones que se formaron en las plantaciones del sur, mien
tras que el catolicismo de los latinos procede de la conquista espaola de
Hispanoamrica. Tampoco puede atribuirse la diferente estructura institu
cional de las congregaciones catlicas y de las protestantes al inters que
tienen los dirigentes de cada una de ellas por participar en la poltica esta
dounidense actual. En realidad, hay que retrotraerse a la poca de la Refor
ma protestante para poder explicar tal diferencia.
5.
Asignacin de valores a la variable explicativa
En el apartado cuarto del captulo 4 sealamos que los experimentos mejor

dirigidos tienen dos ventajas: el control de la seleccin de observaciones y
de los valores que se asignan a las variables explicativas en las unidades.
Slo se analiz la seleccin en ese punto. Como en este captulo ya nos he
mos ocupado del sesgo de la variable omitida y de otros problemas metodo
lgicos, podemos enfrentarnos ahora al control de la asignacin de valores.
En un experimento mdico, los tratamientos son un frmaco que se est
probando y un placebo, los cuales se administran aleatoriamente a los pa
cientes. Aqu se da prcticamente la misma situacin que aparece con una
seleccin aleatoria de observaciones: la asignacin aleatoria es muy til
cuando existe una gran nmero de observaciones, pero no suele ser la estra
tegia ptima si n es pequeo. Cuando es grande, asignar valores aleatorios
a las variables explicativas acaba con la posible endogeneidad (porque di
chas variables no pueden verse influidas por la variable dependiente) y con
el error de medida (siempre que se registre exactamente qu tratamiento se
administra). Quiz lo ms importante sea que la asignacin de valores en
estudios con un n grande hace extremadamente improbable la aparicin de
sesgo de la variable omitida, porque una variable explicativa cuyos valores se
hayan asignado aleatoriamente no se correlacionar con ninguna variable
omitida, ni siquiera con las que influyan en la dependiente. Por lo tanto, en
estudios de n grande, la asignacin aleatoria de valores har que las varia
bles omitidas no sean dainas, que no produzcan sesgo. Sin embargo, si se
dispone de un nmero reducido de observaciones, es muy fcil que una va
riable asignada de forma aleatoria se correlacione con alguna variable omi
tida relevante y que tal correlacin produzca sesgo de la variable omitida.
De hecho, el ejemplo del sesgo de seleccin mostraba cmo una variable
asignada aleatoriam ente se correlacionaba con una variable dependiente
observada; es muy fcil que ocurra exactamente lo mismo si el nmero
de observaciones es pequeo.
Aunque al realizar experimentos muchas veces se pueden fijar los valo
res de las variables explicativas, los investigadores cualitativos no suelen te
ner esa suerte. Cuando el objeto de estudio determina el valor de sus pro
pias variables explicativas, aumentan considerablemente las posibilidades
de sesgo de seleccin, de endogeneidad y las de otros tipos de sesgo y de
ineficiencia. Por ejemplo, si en un experimento se estuviera estudiando la
eficacia poltica que tiene participar en manifestaciones, se elegira aleato
riamente a ciertas personas para que acudieran a una manifestacin y a
otras para que se quedaran en casa, con el fin de calibrar despus las dife
rencias que se registran entre los dos grupos del experimento en relacin a
la eficacia (o quiz para compararlos en funcin del cambio que registra
ese indicador en una medida realizada antes del experimento y despus de
l). Sin embargo, en el trabajo no experimental, es frecuente que los pro-
Un anlisis formal de la endogeneidad

Este modelo formal demuestra el sesgo que aparece cuando un diseo de investigacin pa.dece endogeneidad y no se hace nada por evitarlo. Supongamos que tenemos una variable explicativa X y una dependiente Y. Nos interesa el efecto causal que tiene X sobre Y, y utilizamos la siguiente ecuacin:
|
|
5
|
(5.10)
sta tambin puede expresarse como Y = Xf} + e, en la que e = Y - E(Y) se
denomina el error o trmino perturbador. Supongamos, adems, que
hay endogeneidad, o sea, que X tambin depende de /:
E (X) = Yy
(5.11)
Qu ocurre si no prestamos atencin a la parte recproca de la relacin

expresada en la ecuacin (5.11) y hacemos una estimacin de 0 como si
slo fuera cierta la ecuacin (5.10)? Dicho de otro modo, estimamos /3
(presuponiendo incorrectamente que 7 = 0 ) mediante la ecuacin habitual:
il
(5.12)
w
Para evaluar este estimador utilizamos la propiedad de falta de sesgo y,
por lo tanto, calculamos su valor esperado:
E(b) = E
(5.13)
1-1
pios objetos de estudio decidan si quieren participar. En estas circunstan

cias, hay otros rasgos individuales (como el hecho de que los individuos
sean jvenes o no, que sean estudiantes y, si lo son, la cercana del campus
al lugar de la manifestacin, etc.) que influirn en la decisin de manifes
tarse. Adems, es evidente que muchos de estos factores tambin pueden
correlacionarse con la variable dependiente, que es la eficacia poltica.
Pensemos en otro ejemplo en el que las unidades de anlisis sean ms
grandes y menos frecuentes: el clsico problema del impacto que tiene la
acumulacin de armamento en la posibilidad de guerra. El tamao del pre
supuesto nacional para esta partida aumenta las probabilidades de que el
pas participe en una guerra? La variable explicativa es el presupuesto para
!
'?
-*,>
-1_________
-0
L C M
+ -
Hl______
t m
= /3 + sesgo
donde el sesgo = 2 ^ (* >e) / X
*1
Normalmente, la covarianza de X y
el trmino perturbador e., C{X .e^ valen cero, de manera que el trmino
de sesgo tambin tendr este valor. En consecuencia, el valor esperado
de b es 3 y, por tanto, carece de sesgo. Suele ocurrir que, despus de que
se tiene en cuenta X para predecir Y, la parte que queda (e) no se corre
laciona con X. Sin embargo, en el presente ejemplo, despus de que se
contempla el efecto de X, sigue quedando alguna variacin por la retroalim entacin que procede del efecto causal de Y sobre X. De este modo, la
endogeneidad im plica que, en general, el segundo trmino de la ltima
lnea de la ecuacin (5.13) no valdr cero y que la estimacin estar ses
gada.
La direccin del sesgo depende de la covarianza, ya que la varianza de
X siempre es positiva. Sin embargo, en los pocos casos en los que sta sea
extremadamente grande, arrollar a la covarianza y har que el trmino de
sesgo resulte insignificante. En el texto se ofrece un ejemplo con una
buena interpretacin de este trmino de sesgo.
armamento (quiz el porcentaje en relacin al PNB o los cambios que ha

sufrido el propio presupuesto); la variable dependiente es la presencia o au
sencia de guerra en un perodo determinado posterior al momento en que se
ha medido la variable explicativa. En un diseo de investigacin ideal sera
el investigador el que asignara valores a la variable explicativa, eligiendo
diversos pases para su estudio y determinando el presupuesto armamentstico de cada gobierno (mediante valores aleatorios o utilizando quiz una
de las variables intencionadas que analizamos ms adelante). Es evidente
que esto no es factible. Lo que se hace en realidad es medir los valores de
la variable explicativa (el tamao del presupuesto armamentstico) que cada
gobierno se asigna. Por supuesto, el problema es que estos valores autoa-
signados de la variable explicativa no son ajenos a la dependiente la pro

babilidad de ir a la guerra , como lo hubieran sido si hubiramos podido
elegirlos nosotros. En este caso, hay un claro problema de endogeneidad: el
valor de la variable explicativa est influido por los valores que se cree ten
dr la dependiente: la amenaza de guerra percibida. La endogeneidad tam
bin plantea problemas para estudiar la relacin causal entre las alianzas y
la guerra. Las naciones eligen sus alianzas; los investigadores, sin adjudicar
pases a esas lianzas, estudian el impacto que tienen sobre las guerras. Por
lo tanto, las alianzas no tendran que considerarse variables explicativas
exgenas en los estudios blicos, ya que suelen formarse antes que la pro
pia guerra.
Estos ejemplos demuestran que la endogeneidad no siempre es un pro
blema que haya que precisar, sino que a veces constituye una parte integral
del proceso por el que el mundo genera observaciones. Con frecuencia, re
sulta bastante difcil averiguar cmo se han determinado los valores de las
variables explicativas, y no suele ser posible recurrir a ningn procedimien
to autom tica para resolver los problemas que plantea. No obstante, al in
vestigar no puede eludirse esta tarea.
Como la probabilidad de que, en cualquier prueba de un experimento hi
pottico, el uso de criterios aleatorios de seleccin o de asignacin de valo
res produzca sesgo disminuye rpidamente a medida que aumenta el nme
ro de observaciones, es til recurrir a tales procedimientos aunque no se
disponga de un gran nmero de unidades. Si la cantidad de unidades es
suficientemente grande lo cual definimos con precisin en el aparta
do 2 del captulo 6 , la seleccin aleatoria de unidades cumplir automti
camente el presupuesto de independencia condicional del apartado tercero
del captulo 3. Sin embargo, cuando slo existan unos pocos ejemplos del
fenmeno que nos interesa o nicam ente podam os recabar inform acin
acerca de un pequeo nmero de observaciones, como ocurre con frecuen
cia en la investigacin cualitativa, la respuesta no estar en la seleccin y
asignacin de valores con procedimientos aleatorios. Ni siquiera los experi
mentos controlados, si son posibles, sern una solucin cuando no se dis
ponga de un nmero suficiente de observaciones.
Los cualitativistas, al enfrentarse a estos problemas, tienen que preguntar
se si es posible aumentar el nmero de observaciones que van a investigar,
ya que, a falta de reuniras todas, el procedimiento ms fiable es recoger de
form a aleatoria datos relacionados con un gran nmero de unidades y aleatorizar la asignacin de valores para las variables explicativas. Sin embar
go, si esto no es posible, no hay que seleccionar las observaciones aleato
riamente, sino que es preciso utilizar el conocimiento que ya tenemos de las
observaciones disponibles que se basa en investigaciones anteriores, su
posiciones fundadas o valoraciones de otros expertos en el rea y hacer la
seleccin de las observaciones y (si se puede) la asignacin de valores a las
variables explicativas de tal modo que se evite el sesgo y las ineficiencias. Si
el sesgo es inevitable, al menos habr que intentar averiguar su direccin y

su posible magnitud. Si todo esto falla es decir, si sabemos que hay sesgo
pero no podemos determinar su direccin o envergadura , nuestra investi
gacin mejorar si, por lo menos, describimos nuestros resultados con un
mayor grado de incertidumbre. Si comprendemos los problemas inferenciales que aborda este libro, estaremos ms preparados que cualquier generador
de nmeros aleatorios para enfrentarnos a todos estos dilemas. En cualquier
caso, en todos los estudios tendra que haber un apartado o captulo en el
que se explicaran cuidadosamente los procesos de seleccin y de asignacin
de valores. Habra que mencionar en l qu reglas se han utilizado, incluir
un listado detallado de todas las previsibles fuentes de sesgo ocultas y sea
lar si se ha hecho algo para combatirlas.
6.
Controlar la situacin que se investiga
Si se seleccionan de forma deliberada observaciones sin tener en cuenta las

variables de control relevantes y tampoco otros problemas inferenciales, no
se cumplir el presupuesto de homogeneidad de las unidades. Tenemos que
asegurarnos de que los valores de la variable explicativa en las observacio
nes elegidas se midan con el mnimo error posible, de que no se correlacio
nen con alguna variable explicativa omitida clave y de que no estn parcial
mente determ inados por la dependiente. Es decir, hay que calibrar de
manera adecuada problemas como el error de medida, las variables omiti
das y la endogeneidad, que ya se han analizado en este captulo. Si stos
persisten, a pesar de todos nuestros esfuerzos, por lo menos tendremos que
reconocerlos, sopesarlos e intentar corregirlos.
En estudios que tienen un n pequeo los controles son de por s difciles
de disear, pero suele ser absolutamente esencial ocuparse de ellos para
evitar el sesgo. Por desgracia, hay muchos investigadores cualitativos que
apenas utilizan controles o que no lo hacen en absoluto. Por ejemplo, Bo
llen, Entwisle y Alderson (1993) han sealado, en un estudio sobre libros y
artculos sociolgicos, que alrededor de un cuarto de los investigadores no
utiliza ningn mtodo de control.
Supongamos, por ejemplo, que nos interesara el efecto causal que tiene
un ao de crcel en el grado de radicalismo poltico que muestran las per
sonas. Lo ideal sera un estudio autnticamente experimental en el que se
utilizara una muestra aleatoria de un gran nmero de ciudadanos y que a la
mitad de ellos se les adjudicara aleatoriamente un ao de prisin, para m e
dir despus la radicalidad de las ideas polticas de uno y otro grupo. El
efecto causal estimado sera la diferencia media entre las posturas de los
dos grupos al final del ao. Con un n grande, cabra presuponer la existen
cia de independencia condicional y probablemente la inferencia causal fue
ra sensata. No hace falta decir que tal estudio es imposible.
s is s m
211
Sin embargo, para continuar con nuestro argumento, supongamos que se

llevara a cabo el experimento, pero slo con pocas personas. Teniendo en
cuenta los problemas que se han analizado en el segundo apartado del cap
tulo 4, esta escasa muestra, aunque se hubiera seleccionado aleatoriamente
y la asignacin de valores tambin se hubiera hecho con este mtodo, es
probable que no cumpliera la independencia condicional y, por lo tanto, se
ra necesario aplicar algn control explcito. Una sencilla forma de hacerlo
sera medir las ideas polticas radicales antes del experimento. Despus,
nuestra estimacin causal sera la diferencia que hubiera entre los dos gru
pos en relacin al cambio operado en las ideas polticas radicales. Este pro
cedimiento nos permitira controlar una situacin en la que ambos grupos
no son idnticos respecto a esta nica variable antes de realizarse el experi
mento. Para comprender cmo hay que calcular el efecto causal en este
contexto conviene recordar el problema fundamental de la inferencia cau
sal. Lo ideal sera que tomramos a un solo individuo, esperramos durante
un ao controlando cuidadosamente su medio para mantenerlo constante,
excepto en lo relativo al paso del tiempo y a los acontecimientos del mun
do exterior, y que despus midiramos la radicalidad de sus ideas politicas.
Simultneamente, tomaramos a ese individuo en el mismo momento y lo
meteramos en la crcel durante un ao, para medir despus el mismo indi
cador. La diferencia entre estas dos medidas es la definicin del efecto cau
sal que tiene la crcel sobre las ideas polticas de esta personal4. El proble
ma fundam ental consiste que slo podem os observar las ideas de esta
persona en una de las situaciones. Es evidente que el mismo individuo no
puede estar, a la vez, dentro y fuera de la crcel.
Mediante el control se intenta evitar el problema fundamental de la ma
nera ms directa. Como no podemos observar las ideas de esta persona en
ambas situaciones, buscamos dos individuos (o, ms probablemente, dos
grupos de individuos) que sean lo ms parecidos posible, excepto en lo to
cante a la variable explicativa (que hayan ido o no a la crcel). Tampoco ha
cemos la seleccin teniendo en cuenta el grado de radicalidad de las perso
nas. En principio, podramos seleccionar una muestra de individuos que
hubieran sido puestos en libertad recientemente y buscar despus personas
equiparables a cada ex prisionero (lo ms parecido posible a ste, pero sin
haber estado en la crcel). Quiz, en primer lugar, podramos entrevistar a
alguien que hubiera salido de la crcel y, partiendo del conocimiento de su
historia y caractersticas, ir en busca de personas equiparables (que tuvieran
un perfil demogrfico similar y que quiz fueran del mismo barrio y hubie
ran ido al mismo colegio).
Por definicin, las variables con las que equiparamos a los individuos
son las mismas en todos los grupos y las controlaremos cuando calculemos
el efecto causal de la excarcelacin. Ejercer controles es un proceso difcil
porque hay que aplicarlos a todas las variables que puedan ser confusas. Si
no equiparamos en funcin de una determ inada variable, si no podemos
controlarla de ninguna otra manera e influye en la variable dependiente a la

vez que se correlaciona con la explicativa (afecta a la radicalidad de las ideas
y no es la misma en los prisioneros y en los que no lo son), la estimacin de
nuestro efecto causal estar sesgada.
Cuando se comparan pases desde el punto de vista poltico, ejercer con
troles para lograr la homogeneidad de las unidades es difcil: cualquier pa
reja de pases diferir en innumerables dimensiones. Por ejemplo, Blgica y
Holanda podran parecerle a un observador poco preparado pases muy
parecidos, en el sentido que sealan Przeworski y Teune (1982): son pe
queas democracias europeas con economas abiertas y sus vecinos no les
amenazan. Por lo tanto, en muchos sentidos, sera factible compararlos
(Katzenstein, 1985). Sin embargo, son muy diferentes desde el punto de
vista lingstico o religioso y en cuanto a sus recursos fundamentales, al
inicio de su industrializacin y a muchos otros factores polticos relevantes.
En consecuencia, cualquier diseo de investigacin comparado que preten
da estudiar el conjunto de la vida poltica en estos dos estados y que slo se
centre en ellos correr el riesgo de ser impreciso.
Si lo que pretendemos es hacer una comparacin general entre Blgica y
Holanda, se podr evitar tal imprecisin. Sin embargo, supongamos que el
investigador tenga un objetivo ms especfico: estudiar el impacto de ser
una potencia colonial sobre las estrategias polticas que siguen los gobier
nos de las pequeas democracias europeas. En ese caso, sera posible com
parar las polticas de Blgica, Holanda y Portugal con las de pequeos esta
dos no coloniales como Austria, Suecia, Suiza y Noruega. Este podra ser
un diseo de investigacin valioso, pero no estara controlando innumera
bles factores aparte de la historia colonial que hacen que estos pases
sean diferentes. Un investigador sensible al problema de la homogeneidad
de las unidades podra pensar en otro diseo quiz alternativo, aunque
sera mejor que fuera un complemento para el anterior en el que estudia
ra las polticas belgas, holandesas y portuguesas antes y despus de la pr
dida de sus respectivas colonias. En este diseo, Blgica no sera una ni
ca observacin, sino el escenario de un anlisis controlado, antes y despus
de que se concediera la independencia a sus colonias a principios de los
aos sesenta. Muchos de los factores que diferencian a Blgica de Portugal
y de Holanda y no digamos de los pases que carecen de un pasado colo
nial se controlaran automticamente en este diseo de series temporales.
En realidad, ambas comparaciones entre pases y entre diversos momen
tos de cada pas presentan problemas en cuanto a la homogeneidad de las
unidades. Las diversas naciones difieren en muchas formas no controladas
y no medidas, que podran ser relevantes para el tema de la investigacin, y
una nacin que sea observada en diferentes momentos tambin presenta es
tas disparidades. Sin embargo, las diferencias no sern las mismas. Ningu
na comparacin (ya sea en el tiempo o en el espacio) constituye, ni mucho
menos, un experimento perfectamente controlado, pero si juntamos ambos
enfoques podremos lograr ms pruebas de nuestra hiptesis que si slo uti

lizamos uno de ellos.
La estrategia de la seleccin intencionada conlleva algunos peligros
ocultos de los que los investigadores tendran que ser conscientes, especial
mente al intentar equiparar observaciones con el fin de controlar variables
potencialmente relevantes. El principal peligro se encuentra en un tipo de
sesgo de la variable omitida especialmente engaoso. Imaginmonos el si
guiente diseo de investigacin en el que se utiliza la equiparacin. Con el
fin de animar a los pases africanos que parecen encaminarse hacia una m a
yor democratizacin, el gobierno de los Estados Unidos decide enviarles
asistencia textos educativos sobre la democracia y materiales similares
a travs de un programa denominado ayuda a la democracia. El investi
gador quiere estudiar si, en cada pas, esa ayuda aumenta el nivel de demo
cracia, si lo disminuye o si no influye en l, pero no puede conceder o sus
pender la ayuda al mismo pas simultneamente. En consecuencia, opta por
un enfoque prospectivo-comparativo: compara los pases que estn a punto
de recibirla con los que no lo estn. Tambin decide, con razn, buscar uni
dades en ambos grupos que sean equiparables en cuanto a los valores de to
das las variables de control relevantes, excepto en aquella que le preocupa:
el programa de ayuda estadounidense.
El tiempo y los idiomas que conoce condicionan su investigacin, de ma
nera que slo puede estudiar dos pases (aunque los problemas que van a
m encionarse seguiran apareciendo en un estudio que tuviera un mayor
aunque todava escaso nmero de unidades). Elige un pas que recibe bas
tante ayuda del citado programa norteamericano y otro que apenas la recibe.
Acierta al situar su variable dependiente en el incremento del nivel de demo
cracia que se registra en el pas desde que comienza el programa de ayuda
hasta que se hace el estudio dos aos ms tarde. Como hay muchas otras va
riables que podran correlacionarse tanto con la variable explicativa como
con la dependiente, el investigador intenta elegir dos pases que sean muy
equiparables al respecto, con el fin de evitar el sesgo de la variable omitida.
Podra haber dos variables de control: el nivel educativo del pas y el de
violencia guerrillera contra el rgimen. Ambas pueden producir sesgo si no
se controlan, porque las dos se correlacionan tanto con la variable explicati
va como con las dependientes (recurdese el apartado segundo de este cap
tulo, que versaba del sesgo de la variable omitida). Es probable que los Es
tados Unidos den ms ayuda a aquellos pases que tienen un buen sistema
educativo (quiz porque stos podrn establecer mejores relaciones con
Washington o porque Estados Unidos impulsa la educacin), y, a veces, la
enseanza funciona como una fuerza democratizadora. Del mismo modo,
los Estados Unidos prefieren ayudar a los pases donde la actividad guerri
llera es escasa, y, por supuesto, una amenaza de este tipo hace que disminu
ya la probabilidad de democratizacin. Al equiparar en funcin de estas va
riables, el investigador espera controlar sus efectos engaosos.
Sin embargo, siempre hay otras variables omitidas que podran causar
sesgo porque se correlacionan tanto con la variable explicativa clave como
con la dependiente (y porque, desde el punto de vista causal, son anteriores
a aqulla). El problema est en que intentar equiparar dos unidades, si se
hace de forma incorrecta o incompleta, puede aumentar la probabilidad de
que haya otra variable omitida significativa que se correlacione tanto con la
variable explicativa como con la dependiente.
Por qu es as? Hay que sealar que, para equiparar pases, el investiga
dor tiene que encontrar uno que reciba bastante ayuda y otro que reciba
poca. Supongamos que elige dos pases que son similares respecto a las
otras dos variables, es decir, que tienen un alto nivel educativo y pocas
amenazas internas. El resultado sera el siguiente:
P a s A: mucha ayuda, mucha educacin, pacfico.
P a s B: poca ayuda, mucha educacin, pacifico.
Es posible que el pas B tenga algo especial. Por qu no recibe ayuda

si tiene condiciones tan favorables? Quiz lo especial sea una variable
omitida que causar sesgo porque se correlaciona con la variable explicati
va y con la dependiente. Un ejemplo de ello podra ser la existencia en B
pero no en A de un poderoso ejrcito que impulse la educacin y acabe con
los movimientos guerrilleros. Como la fuerza de los militares se correlacio
na con la variable dependiente y con la explicativa principal, omitir este
factor producir sesgo. Se puede apreciar que habra existido el mismo pro
blema si la equiparacin hubiera partido del otro extremo de las gradacio
nes de educacin y de paz interna. En ese caso, la anomala sera el pas
que registra un nivel de educacin bajo y mucha violencia y que recibe mu
cha ayuda. El problema se podra mitigar si la equiparacin se realizara uti
lizando los valores medios de las variables que se basan en la educacin y
la paz interna. Sin embargo, incluso en este caso, el investigador dispondra
de dos pases anmalos, cada uno en una direccin opuesta. Lo importante
aqu es que, a veces, la equiparacin nos induce a buscar observaciones
que, en cierto sentido, se apartan de lo que cabra esperar si se dan unos de
terminados valores en las variables de control y que esa desviacin puede
deberse a variables omitidas especialmente significativas.
Ntese de qu manera esto tendra que funcionar en el ejemplo de la cr
cel. Podramos intentar equiparar a los prisioneros segn ciertas observa
ciones: que fueran parecidos en cuanto a la procedencia social y econmi
ca, la historia de su familia, el expediente escolar y otros factores similares,
pero no en el hecho de estar en la crcel. La mejor equiparacin sera la que
se basara en personas sin pasado carcelario pero con muchas probabilida
des de haberlo tenido, por proceder de un barrio muy pobre, haber dejado
el colegio, estar en contacto con el mundo de las drogas, proceder de una
familia rota, etc. Cuanto mejor sea la equiparacin, ms podremos fiarnos
de la relacin entre encarcelamiento e ideas polticas. Sin embargo, aqu

est de nuevo el problema. Si todo estaba en contra de los no encarcelados,
puede que stos tengan algo especial que les ha mantenido fuera de la pri
sin quiz una arraigada prctica religiosa y que se correlaciona tanto
con la variable explicativa (encarcelamiento) como con la dependiente (ide
ologa poltica).
Hay otra forma de abordar este peligro de la equiparacin. Recordemos
los dos puntos de vista respecto a la variabilidad aleatoria que se describie
ron en el apartado sexto del captulo 2. En la equiparacin, tal como la he
mos trazado hasta ahora, es posible que plantee problemas una variable
omitida identificable. Sin embargo, an podramos sospechar que las dos
variables equiparadas en una larga lista de variables de control son espe
ciales en algn sentido que no podemos determinar; es decir, que existe
una variable omitida desconocida. En esta situacin, lo nico que podemos
hacer es ocuparnos de cmo la aleatoriedad inherente a nuestra variable de
pendiente influir en esta observacin. Cuanto ms se vaya alejando nues
tra medida de su verdadero valor, a causa de la variacin aleatoria, con ms
ahnco buscaremos observaciones inusuales con el fin de lograr una ma
yor equiparacin entre los grupos y, de este modo, nos arriesgaremos a caer
en un sesgo de la variable omitida.
Estas matizaciones no tendran que llevarnos a evitar diseos de investi
gacin que utilicen la equiparacin. De hecho, este procedimiento es una
de las estrategias ms valiosas cuando n es pequeo. Simplemente, habr
que ser conscientes de que con la equiparacin, al igual que con todas las
estrategias que se utilizan cuando n tiene un tamao reducido, se corren
riesgos que se hubieran evitado con la aleatorizacin y con una muestra
ms grande. Un procedimiento muy fructfero es utilizar la equiparacin
para elegir estudios de caso pero seleccionar con otros criterios las observa
ciones de cada uno de ellos.
Si lo que se quiere es evitar el sesgo de la variable omitida, la equipara
cin tiene que ver con el debate que se mantiene actualmente en la biblio
grafa sobre poltica comparada acerca de la conveniencia de seleccionar
observaciones lo ms parecidas posible (Lijphart, 1971) o lo ms diferentes
que se pueda (Przeworski y Teune, 1970). Aqu recomendamos un enfoque
diferente. Este debate sobre el diseo de investigacin, que enfrenta a los
partidarios de lo ms parecido con los de lo ms diferente, se ocupa
poco, o nada, de precisar a qu hay que parecerse. Las etiquetas suelen
ser confusas y la polmica no resulta concluyente en estos trminos: ningu
no de los dos enfoques es siempre preferible. Para nosotros, lo principal a
la hora de recoger datos es identificar observaciones que puedan maximizar
el control sobre las hiptesis causales. A veces nuestra estrategia conducir
a un plan de investigacin que podra calificarse de diseo de sistemas lo
ms parecidos posible, otras a lo que se podra denominar diseo de sis
temas lo ms diferentes posible. Sin embargo, a diferencia del debate que
contrapone ambas posibilidades, nuestro procedimiento siempre generar

datos relevantes para responder a las preguntas del investigador.
En la equiparacin, los posibles efectos de las variables omitidas se con
trolan mediante la seleccin de observaciones que tienen el mismo valor en
tales variables. Por ejemplo, el deseo de mantener constante el mayor n
mero posible de variables contextales subyace en las opciones de Seymour
M artin Lipset (1963, p. 248) al comparar el desarrollo poltico de los Esta
dos Unidos con el de otras ex colonias britnicas de habla inglesa. Lipset
indica que los Estados Unidos, Canad y Australia ... son ex colonias de
Gran Bretaa que fijaron fronteras relativamente abiertas y que hoy son es
tados federales que abarcan continentes. Adems, seala muchos otros
rasgos comunes que se mantienen constantes: el nivel de desarrollo, el rgi
men democrtico, la similitud de valores, etc.
El estudio que realiz David Laitin (1986) sobre los efectos de las creen
cias religiosas en la poltica utiliza una tcnica de equiparacin especial
mente cuidadosa. Eligi un pas, Nigeria, en el que eran muy acentuadas
tanto la tradicin musulmana como la cristiana porque quera comparar las
consecuencias que tenan ambas en la poltica. Sin embargo, las zonas mu
sulmana y cristiana de Nigeria difieren en muchos otros rasgos, adems de
en el religioso, y hacer caso omiso de ellos habra sido arriesgarse a incu
rrir en un sesgo de la variable omitida. En Nigeria, los centros islmicos
dominantes se encuentran en los estados del norte, que han tenido durante
siglos contacto directo con el mundo musulmn, una historia como pases
islmicos que precede al dominio britnico y una memoria del renacer de la
guerra santa a principios del siglo xix que unific un zona muy amplia bajo
una doctrina islm ica ortodoxa. [Por el contrario], hasta finales del si
glo xix las comunidades cristianas no arraigaron [...]. Las escuelas de las
misiones trajeron la educacin occidental y los empresarios capitalistas ani
maron a la poblacin a introducir cultivos comerciales y a entrar cada vez
ms en la economa capitalista mundial (Laitin, 1986, p. 187).
Laitin se pregunt cmo se podan controlar las diferencias nacionales,
las econmicas, las relativas al nmero de generaciones que se haban visto
influidas por una cultura abierta al mundo, las que tenan que ver con las
motivaciones para convertirse o las de tipo ecolgico; todas ellas diferentes
en los baluartes cristianos y musulmanes (1986, pp. 192-193). Opt por
elegir una determinada localidad de la regin nigeriana de Yoruba, en la
que las dos religiones se haban introducido en el mismo grupo nacional
ms o menos a la vez y donde ambos credos atraan por razones parecidas a
los posibles conversos.
La equiparacin no es completa ni en el estudio que realiz Kohli sobre
los tres estados de la India ni en el anlisis de Lipset acerca de las tres ex
colonias britnicas, ni tampoco en la investigacin de Laitin sobre los mu
sulmanes de la tierra yoruba, y nunca podra serlo. Para equiparar es nece
sario prever y especificar qu posibles variables omitidas relevantes van a
aparecer. Despus se controla la investigacin seleccionando observaciones

cuyos valores no cambian en dichas variables. Es evidente que no podre
mos saber si hemos cubierto toda la lista de posibles factores de sesgo. Sin
embargo, si tenemos ciertos objetivos analticos y al evaluar si es ade
cuado un procedimiento de seleccin que tenga como fin equiparar hay que
relacionarlo con algn objetivo de este tipo , el control que genere la
equiparacin aumentar la probabilidad de obtener inferencias vlidas.
En suma, el investigador que intente hacer inferencias causales puede
seleccionar los casos de dos maneras. La primera es la que utiliza criterios
aleatorios para seleccionar y adjudicar valores, que es til en estudios con
un n grande. En tales investigaciones, la aleatoriedad cumple automtica
mente la independencia condicional y es un procedimiento mucho ms fcil
que el de seleccionar observaciones a propsito para cumplir la homogenei
dad de las unidades. La aleatoriedad nos garantiza que no se omiten varia
bles relevantes y que la seleccin de observaciones no se est realizando
con criterios que se correlacionan con la variable dependiente (despus de
controlar las explicativas). Este procedimiento tambin nos garantiza que
los sesgos del investigador no entran en el criterio de seleccin y que, por
tanto, no influyen en los resultados. El segundo mtodo es el de la selec
cin intencionada de observaciones, que recomendamos en estudios que
tengan un n reducido. Este tipo de investigaciones, que parten de una selec
cin intencionada para hacer inferencias causales razonables, casi siempre
arrojarn inferencias ms arriesgadas que las que aplican criterios aleato
rios a grandes muestras, y dependern ms de las opiniones previas que
tenga el investigador sobre el mundo emprico; en ellas los controles pue
den introducir sesgos diversos y sutiles. No obstante, por las razones que se
han subrayado, los controles son necesarios en un estudio de n pequeo, y,
si son adecuados si las variables de control se mantienen constantes, qui
z mediante la equiparacin , quiz slo haya que calcular el efecto cau
sal de una nica variable explicativa, con lo que aumentaremos el control
que tenemos sobre un problema.
7.
Observaciones finales
Esperamos que los consejos que hemos dado en este captulo y en el ante
rior sean tiles para los investigadores cualitativos, aunque no sean recetas
que siempre puedan aplicarse fcilmente. En la realidad, los problemas no
suelen venir solos. Por ejemplo, supongamos que un investigador detecta
un sesgo de seleccin menor, un cierto error de medida en la variable de
pendiente y una importante variable de control que slo puede medirse oca
sionalmente. Si sigue los consejos que se han dado anteriormente para cada
caso, tendr cierta idea sobre lo que hay que hacer. Sin embargo, en este y
en otros casos complejos, los que realizan estudios cualitativos tienen que
reflexionar con cuidado sobre los problemas metodolgicos especficos que

aparecen en sus investigaciones. Puede serles de utilidad remitirse a mode
los formales de investigacin cualitativa parecidos a los que hemos presen
tado aqu, pero slo si estn en consonancia con los problemas de su inves
tigacin. Gran parte de las ideas que respaldan los modelos formales ms
sofisticados estn en los escritos estadsticos, de manera que no siempre es
necesario desarrollar un modelo propio.
El cualitativista, independientemente de que se ayude o no con modelos
formales, tiene que atender de manera explcita esas cuestiones metodol
gicas. stas son tan importantes para los investigadores cualitativos que
pretenden hacer inferencias causales como para los de orientacin cuanti
tativa.
6.
Aumentar el nmero
de observaciones
A lo largo de este libro hemos venido recalcando la importancia crucial que

tiene maximizar el control sobre los problemas de la investigacin. La prin
cipal forma de hacerlo es encontrar tantas consecuencias observables de
nuestra teora como sea posible y hacer observaciones acerca de ellas. Tal
como hemos subrayado, lo que puede parecer un estudio de un solo caso, o
de unos pocos, quiz contenga en realidad muchas posibles observaciones
que sean relevantes para la teora que se est contrastando y que se encuen
tren en diferentes niveles de anlisis. Al aumentar el nmero de observacio
nes, incluso sin recoger ms datos, el investigador suele poder transformar
un problema insoluble que tiene un diseo de investigacin impreciso en
algo manejable. En este ltimo captulo se dan consejos sobre cmo au
mentar el nmero de observaciones relevantes en un estudio social de tipo
cientfico.
Comenzaremos por analizar los problemas inherentes a las investigacio
nes que se ocupan de una sola observacin: el problema que se plantea
cuando n = 1. Demostraremos que, si realmente hay una sola observacin,
resulta imposible evitar el problema fundamental de la inferencia causal.
Incluso en supuestos ejemplos de comprobacin de un nico caso, el inves
tigador tiene que examinar, al menos, el pequeo nmero de observaciones
que existen dentro de los casos y compararlas. Sin embargo, una inferen
cia causal puede llegar a apoyarse en una comparacin disciplinada que se
centre en un reducido nmero de estudios de caso que ofrezcan observacio
nes equiparables.
El anlisis que hacemos en el apartado 1 de este captulo de los diseos

que se centran en una sola observacin puede parecerle pesimista al investi
gador que utilice el estudio de caso. Sin embargo, como un solo caso puede
contener en realidad muchas posibles observaciones, este pesimismo no est
justificado, aunque s est garantizada la bsqueda persistente de ms obser
vaciones. Despus de criticar los diseos que trabajan con una nica ob
servacin y, en consecuencia, dar slidas razones para que se aumente el n
mero de observaciones, pasaremos a analizar cuntas son suficientes para
alcanzar niveles de incertidumbre satisfactorios (apartado 2). Para terminar,
en el apartado 3 demostraremos que casi todos los diseos de investigacin
cualitativos pueden reformularse para darles muchas observaciones y que, si
el investigador conceptualiza adecuadamente las consecuencias observables
que ya tiene, esto suele poder hacerse sin que sea necesario llevar a cabo una
costosa recogida de datos adicionales.
1.
Inferencias causales con diseos de una sola observacin
En una investigacin el problema ms difcil se plantea cuando el investigador

slo dispone de una unidad para evaluar una teora causal, o sea, cuando
n = 1. En este apartado comenzaremos a analizar esta cuestin sealando
que es muy improbable que se pueda salir airoso de ella. En primer lugar,
estudiamos el argumento de Harry Eckstein en el artculo clsico que dedi
c a los estudios de caso cruciales (apartado 1.1). Despus, en el aparta
do 1 .2 , nos ocupamos de un ejemplo concreto, el razonamiento analgico.
1.1
Estudios de caso cruciales
Eckstein ha sealado con contundencia que, cuando no se aclaran las con

diciones en las se espera que aparezcan ciertas pautas de comportamiento,
resulta imposible comprobar bien o mal esas teoras (Eckstein, 1975). Esta
mos de acuerdo con l en que los investigadores tienen que esforzarse por
encontrar teoras que sean precisas en sus pronsticos y por contrastarlas
con datos del mundo real.
Sin embargo, Eckstein va an ms lejos y afirma que si nuestra teora
hace pronsticos precisos se podr utilizar para fines explicativos un estu
dio de caso crucial que, para l, es una investigacin que slo se basa en
una nica medida de cualquier variable pertinente (lo que nosotros deno
minamos observacin nica). Lo principal en el captulo de Eckstein es
su idea de que los estudios de caso [...] [son] ms valiosos cuando [...] se
llega al punto en el que se ponen a prueba otras posibles teoras (1975,
p. 80). En concreto, seala (1975, p. 127) que un solo caso crucial puede
dejar realmente fuera de combate a una teora. Para Eckstein, los estudios
de caso cruciales pueden refutar teoras suficientemente precisas con una

sola observacin. En particular, si un investigador elige un estudio de caso
que, en principio, no es probable que concuerde con predicciones tericas
una observacin muy poco probable y resulta que, a pesar de todo,
la teora es correcta, sta habr superado una prueba difcil y tendremos ra
zones para suscribirla con una mayor confianza. Por el contrario, si los pro
nsticos de una teora que no parece plausible coinciden con las observa
ciones de otra observacin muy probable, la teora no habr superado un
examen riguroso pero s una prueba de plausibilidad, con lo que quiz
merezca la pena seguir analizndola.
El argumento de Eckstein es bastante valioso, especialmente cuando indi
ca a los investigadores que comprendan si han de evaluar sus teoras me
diante observaciones poco probables o muy probables. La consistencia
de nuestra inferencia, en relacin a la validez de la teora, depender en gran
medida de lo difcil que haya sido la prueba que sta haya logrado o no su
perar. Sin embargo, la defensa que hace Eckstein de una comprobacin que
se base en una observacin crucial no es coherente con el problema funda
mental de la inferencia causal. Por lo tanto, si define el caso igual que no
sotros la observacin nica, creemos que est equivocado en este punto'.
Hay tres razones por las que dudamos de que un estudio que se base en
una observacin crucial pueda servir para los fines explicativos que Ecks
tein le concede: ( 1 ) hay muy pocas explicaciones que slo dependan de una
variable causal; para evaluar el impacto de ms de una variable explicativa
el investigador necesita haber observado ms de una consecuencia; (2 ) me
dir la observacin crucial es difcil y no del todo fiable; y (3) no es razona
ble abordar la realidad social partiendo de la base de que es una consecuen
cia de procesos deterministas, de manera que, aunque las medidas fueran
perfectas, habra errores aleatorios.
1.
Explicaciones alternativas
Supongam os que comenzam os un estudio de caso con la hiptesis de que un determina

do factor explicativo aclara el resultado observado. Sin embargo, durante la investiga
cin descubrim os una posible explicacin alternativa. En esta situacin, hay que hacer
una estim acin de dos efectos causales el de la primera hiptesis y el de la otra expli
cacin pero slo disponemos de una observacin y, por tanto, est claro que el diseo
de la investigacin ser impreciso (captulo 4, apartado 1). Adems, aunque hiciramos
una equiparacin (lo cual suele ser una estrategia valiosa), no podramos com probar las
explicaciones causales con una nica observacin. Supongamos que pudiramos hacer
una equiparacin perfecta utilizando todas las variables relevantes (circunstancia que es
muy improbable en las ciencias sociales). Para poder observar cualquier variacin que
se produjera en la variable explicativa seguiram os necesitando comparar, como m ni
mo, dos unidades. En consecuencia, sera imposible extraer una inferencia causal vlida
si las hiptesis alternativas slo se comprobaran con una nica comparacin.
Aunque dispusiramos de una teora que hiciera predicciones consistentes y precisas,

an tendram os que enfrentarnos al hecho de que nuestra m edida de esa prediccin,
como todas las medidas, pudiera contener un error (vase el apartado 1 del captulo 5).
Si slo tenemos una observacin, un error de m edida bien podra llevam os a rechazar
una hiptesis verdadera, o a lo contrario. Las teoras precisas pueden necesitar m edidas
m s exactas que las que permite el estado actual de nuestras inferencias descriptivas. Si
tenemos muchas observaciones podremos reducir la m agnitud e influencia del error de
medida mediante la agregacin, pero en una nica observacin siempre existir la posi
bilidad de que este tipo de error sea determinante y de que nos lleve a una conclusin
falsa.
3.
D eterm in ism o
La ltima razn, y quiz la ms decisiva, para considerar inadecuados los estudios que
slo se basan en una consecuencia observable tiene que ver con el grado de determ inis
mo que se da en el mundo. Si ste fuera determinista y la observacin produjera una
medida que no se correspondiera con la teora, podram os afirm ar con certeza que dicha
teora es falsa. Sin embargo, en toda teora social de inters siem pre existe la posibilidad
de que se omitan variables desconocidas, que podran conducir a un resultado im predecible aunque el modelo fundamental de dicha teora fuera correcto. Si slo existe una
consecuencia observada de la teora causal, carecerem os de fundam entos para determ i
nar si la observacin confirm a o desm iente una teora o si proviene de algn factor des
conocido. Aunque tuviram os dos observaciones en un experimento perfecto, varira
mos slo un factor explicativo y produjram os nicam ente una observacin para
diferenciar dos observaciones que, de otro modo, seran idnticas respecto a la variable
dependiente, tendram os que considerar la posibilidad de que, en nuestro m undo probabilstico, existiera algn factor no sistem tico, fruto del azar, que cam biara el efecto
causal que se est observando. No importa que el mundo sea inherentem ente probabilstico (en el sentido del apartado 6 del captulo 2) o que, simplemente, no podam os con
trolar todas las posibles variables om itidas. En cualquier caso, nuestras predicciones
sobre las relaciones sociales slo podrn ser precisas desde un punto de vista probabilstico. En realidad, Eckstein admite que los factores fortuitos influyen en todas las inves
tigaciones:
La posibilidad de que un resultado se deba al azar no puede descartarse en ningn
tipo de estudio; incluso en las grandes investigaciones comparadas es m s o m enos pro
bable [...]. Por lo tanto, la autntica diferencia entre los estudios de la observacin cru
cial y los comparados es que en estos ltimos, pero no en los prim eros, se pueden respe
tar ciertas convenciones para adjudicar un determinado valor a la posibilidad de que
haya resultados fortuitos (por ejemplo, significativo en el nivel de 0,05).
Eckstein tiene razn cuando afirm a que slo es habitual adm itir que existe una de
term inada posibilidad de que se produzcan resultados fortuitos en los estudios que uti
lizan un n grande. Sin em bargo, adm itirlo tiene la m ism a im portancia en todos los es
tudios, tan to en los que b a rajan m uchas o b se rv ac io n es com o en los que u tilizan
p o c a s2.
En general, podemos concluir que utilizar una sola observacin no es

til para la comprobacin de hiptesis o teoras. Sin embargo, es preciso
hacer una matizacin. Aunque tengamos un estudio puro de una sola ob
servacin, en el que slo haya realmente una para todas las variables rele
vantes, sta podr ser til para evaluar explicaciones causales si forma parte
de un programa de investigacin. Si hay otras observaciones nicas, quiz
recogidas por otros investigadores, con las que se pueda comparar, ya no
estarem os utilizando una sola observacin: esto es precisam ente lo que
queremos sealar. No hay que confundir la lgica de la explicacin con el
proceso de realizacin del estudio. Si dos investigadores llevan a cabo estu
dios de una sola observacin, puede que si presuponemos que recogen
los datos de manera sistemtica y equiparable y que comparten de alguna
forma sus resultados se obtenga una comparacin entre dos y una infe
rencia causal vlida. Tambin est claro que los estudios de una sola obser
vacin pueden hacer importantes aportaciones al resumen de los pormeno
res histricos o a la inferencia descriptiva, incluso si no hay comparacin
(vase el apartado 2 del captulo 2). Evidentemente, un estudio de caso que,
como la mayora de ellos, contenga muchas consecuencias observables no
plantear los problemas que aqu se han sealado.
1.2
Razonamiento analgico
Los peligros de los diseos que no utilizan ms que una observacin que
dan patentes cuando se hace referencia a la forma de equiparacin habitual
que usan los que elaboran polticas y algunos analistas de esa rea cuando
intentan comprender acontecimientos polticos, es decir, estamos hablando
del razonamiento analgico (vase Khong, 1992). El uso adecuado de la
analoga es fundamentalmente el mismo que el de la equiparacin que man
tiene otras variables constantes. Nuestra hiptesis causal es que si dos uni
dades son las mismas en todos los aspectos relevantes (esto quiere decir
que hemos logrado equipararlas o que, dicho de otro modo, hemos encon
trado una buena analoga), unos valores parecidos en las variables explicati
vas relevantes harn que tam bin se asem ejen los de la dependiente. Si
nuestra equiparacin fuera perfecta y no hubiera error aleatorio en el mun
do, sabramos que la situacin de crisis a la que se enfrenta en la actualidad
el pas B, que es equiparable a la del pas A el ao pasado, tendra las mis
mas consecuencias que las que se observaron en este ltimo. Si lo expresa
mos de este modo se ver que el razonamiento analgico puede ser apro
piado.
Sin embargo, este tipo de argumentacin nunca es mejor que el anlisis

comparado que conlleva. Al igual que suele ocurrir en los estudios compa
rados, siempre ser mejor (o, en ltimo extremo, no peor) partir de ms ob
servaciones para nuestra generalizacin. Por ejemplo, lo que ocurri en el
pas A podra haber sido consecuencia de factores estocsticos que habran
quedado anulados si nuestras predicciones se hubieran basado en las crisis
ocurridas en otros cinco pases equiparables. Como ocurre en todos los es
tudios que utilizan equiparaciones, la analoga slo es tan buena como la
propia equiparacin. Si sta es incompleta si se han omitido variables re
levantes , puede que al calcular los efectos causales cometamos errores.
De este modo, al igual que en toda investigacin social o pronstico, es im
portante aclarar lo ms posible el grado de incertidumbre que acompaa
nuestra prediccin. En general, siempre es preciso ir ms all de una sola
observacin anloga, al margen de lo similar que nos parezca. Es decir, el
mtodo comparado en el que se combinan datos de muchas observacio
nes, aunque algunos de ellos no sean analogas cercanas a la situacin
que nos ocupa es, como mnimo, siempre tan bueno como la analoga, y
lo normal es que sea mejor. La razn es sencilla: la analoga utiliza slo una
observacin para predecir otra, mientras que el mtodo comparado emplea
una combinacin bien sopesada de un nmero mayor de observaciones. s
tas nos ayudarn a realizar un pronstico ms preciso y eficiente, siempre
que contengan ciertos rasgos que se parezcan de algn modo aunque sea
poco al acontecimiento que estamos pronosticando y que utilicemos la in
formacin adicional de manera razonable. Por lo tanto, si nos tienta el uso
de analogas, tendremos que abordarlas desde un punto de vista comparativo
y ms general, tal como se analiza ms adelante en el apartado 3 3.
2.
Cuntas observaciones son suficientes?
Al llegar a este punto el investigador cualitativo podra plantearse una cues

tin cuantitativa: cuntas observaciones son suficientes? La pregunta tiene
importantes consecuencias para la evaluacin de los estudios existentes y
para el diseo de nuevas investigaciones. La respuesta depende en gran me
dida del diseo del estudio, de qu inferencia causal se intente calcular y de
algunos rasgos del mundo que el investigador no puede controlar.
Aqu respondemos a esta pregunta mediante otro sencillo modelo formal
tomado de la investigacin cualitativa. Al utilizar el mismo modelo de re
gresin lineal al que nos remitimos constantemente en los captulos 4 y 5,
centramos nuestra atencin en el efecto causal de una variable (j :,). Todas
las dems se consideran controles que son importantes para evitar el sesgo
de la variable omitida u otros problemas. Se puede expresar fcilmente el
nmero de unidades que se precisan en una determinada situacin mediante
una frmula sencilla:
cuyo contenido pasamos a explicar.

El smbolo n, por supuesto, representa el nmero de observaciones sobre
las que hay que recoger datos, y en este modelo formal se calcula a partir
de <j 2, V(b,), R] y S 2 . El significado de cada una de estas cantidades es im
portante, y todas influyen en el nmero de observaciones que el investiga
dor cualitativo debe recoger para llegar a una inferencia vlida. Hacemos la
ecuacin ( 6 . 1 ) sin ms premisas que las que ya se haban introducido4.
Ahora las describimos segn un orden fijado por la posibilidad de que el
investigador pueda influir en ellas: ( 1 ) variabilidad fundamental a 2, ( 2 ) incertidumbre de la inferencia causal V(b,), (3) colinealidad relativa entre la
variable causal y las variables de control R\ y (4) varianza de los valores de
la variable causal clave S .rl
2, 5.
1.
Variabilidad fundam ental o2
Cuanto m ayor sea la variabilidad fundamental, o variabilidad no explicada de la varia

ble dependiente (tal como se describi en el apartado 6 del captulo 2), ms observacio
nes habr que recoger para hacer una inferencia causal fiable. Esto debera ser relativa
m ente intuitivo, ya que si hay ms ruido en el sistema ser ms difcil encontrar una
seal clara m ediante un nm ero fijo de observaciones. Recoger datos sobre ms unida
des puede increm entar nuestro control lo suficiente como para perm itim os encontrar
pautas causales sistemticas.
Mediante una analoga directa podem os decir que un estim ador ms eficiente tam
bin necesitar que se recojan ms datos. Un ejemplo de esta situacin aparece cuando
en la variable dependiente hay un error de medida aleatorio (apartado 1.2.1 del captu
lo 5). Desde el punto de vista del analista, este tipo de error de medida suele equivaler a
una m ayor variabilidad adicional, ya que no siempre se puede distinguir entre ambos fe
nmenos. De este m odo, si hay una variabilidad fundamental m ayor (o, su equivalente,
estim aciones m enos eficientes), habr que recabar ms datos.
Aunque el investigador no puede influir en la variabilidad fundamental del mundo,
esta informacin es bastante im portante en dos sentidos. En primer lugar, cuanto ms
sepamos sobre un objeto de estudio, m s pequea ser (es de suponer que hasta cierto
lmite positivo) esta variabilidad fundamental (o no explicada), de manera que no ser
necesario recoger tantas observaciones para saber algo nuevo. Por ejemplo, si supira
mos mucho acerca de lo que decidi el resultado de ciertas batallas en la guerra de inde
pendencia de los Estados Unidos, necesitaram os un nm ero relativamente pequeo de
observaciones (batallas) para hacer una estimacin del efecto causal de alguna nueva
variable explicativa que hubiera generado una hiptesis.
En segundo lugar, aunque com prender el grado de variabilidad fundamental no nos
ayude a reducir el nmero de observaciones sobre las que tenem os que recoger datos, s
ser bastante til para calibrar con precisin la incertidum bre de las inferencias que se
hagan. Esto tendra que quedar claro con la ecuacin (6.1), ya que se puede solucionar
la incertidum bre del efecto causal V(bt) considerndola una funcin de las otras cuatro
cantidades (si conocemos n y el resto de las cantidades, excepto en lo relativo a la incer
tidumbre de la estimacin causal). Esto significa que m ediante este m odelo formal po
demos calcular tanto el grado de incertidumbre de una inferencia causal, utilizando in
formacin sobre varias observaciones, como la variabilidad fundamental, la varianza de
la variable explicativa causal y la relacin que existe entre sta y las de control.
2.
Incertidumbre de la inferencia causal V(bt)
La presencia de V(b{) en el denom inador de la ecuacin (6.1) dem uestra que es obvio
que cuanta ms incertidumbre estemos dispuestos a tolerar, menos observaciones habr que
recoger. En aquellas reas en las que cualquier nueva informacin sea crucial, quiz po
damos hacer aportaciones importantes con un nm ero relativamente pequeo de obser
vaciones. En otros casos en los que ya se haya profundizado ms en el tema y un estu
dio slo pueda ser relevante con un grado de certidum bre considerable, necesitaremos
un nm ero relativamente m ayor de observaciones para convencer de la existencia de un
nuevo efecto causal (vase el apartado 2.1 del captulo 1).
3.
Colinealidad entre la variable causal y las de control /?j
Si la variable causal no se correlaciona con otras variables que estem os controlando, in

cluir stas lo cual puede ser necesario para evitar el sesgo de la variable om itida u
otros problem as no influir en el nmero de observaciones que hay que recoger. Sin
embargo, cuanto m s alta sea la correlacin entre la variable causal y cualquier otra que
estem os controlando, ms le estar pidiendo a los datos el diseo de investigacin y, por
lo tanto, m ayor ser el nmero de observaciones que haya que recabar para alcanzar el
mismo nivel de certidumbre.
Por ejemplo, supongamos que estamos realizando un estudio para comprobar si las mu
jeres reciben igual salario por el mismo trabajo en algn sector. No tenemos acceso a datos
oficiales y, por tanto, slo podemos hacer entrevistas de tipo informal. Nuestra variable de
pendiente es el sueldo anual de un empleado, y la explicativa clave, el gnero. Una de las
variables de control importantes es la raza. En un caso extremo, si todos los hombres del
estudio fueran negros y todas las mujeres blancas, no tendramos control sobre la inferencia
causal: sera imposible hallar las consecuencias del gnero despus de haber controlado el
factor raza. En consecuencia, el gnero se hace constante en esta muestra; de ahi que ste
sea un ejemplo de multicolinealidad, un diseo de investigacin impreciso (apartado 1 del
captulo 4); sin embargo, hay que fijarse en lo que ocurre cuando la colinealidad es alta
pero no perfecta. Supongamos, por ejemplo, que recogemos informacin sobre quince em
pleados y que, de stos, todos los hombres, excepto uno, son negros y todas las mujeres
blancas. En esta situacin, el efecto que tiene el gnero, al controlar el factor raza, se basa
completamente en la nica observacin que no es perfectamente colineal.
Por lo tanto, en la situacin general, al igual que en este ejemplo, cuanta m s colinealidad haya entre la variable causal explicativa y las de control, m s observaciones des
perdiciaremos. En consecuencia, sern necesarias ms para alcanzar un determinado ni
vel de incertidumbre. Este asunto tiene una gran im portancia prctica para el diseo de
investigaciones, ya que suele ser posible seleccionar observaciones para m antener baja
la correlacin entre la variable causal y las de control. En el ejemplo actual, para reducir
esta correlacin slo necesitaram os entrevistar a un nm ero suficiente de mujeres ne
gras y de hom bres blancos.
4.
Varianza de los valores de la variable explicativa causal 5*,
Para term inar, cuanto m ayor sea la varianza de los valores de la variable explicativa
causal, menos observaciones necesitarem os recabar para alcanzar un determinado nivel
de certidum bre en relacin a la inferencia causal.
Este resultado, al igual que el ltimo que hem os m encionado, tiene consecuencias
prcticas, ya que, si seleccionam os apropiadam ente las observaciones, podrem os reducir
la necesidad de que tengan que ser muchas. Slo necesitam os centram os en elegir aque
llas que presenten una am plia gama de valores en relacin a la variable causal clave. Si
nos interesa saber el efecto que tiene el nivel de estudios medio de una comunidad sobre
la delincuencia, lo m ejor ser elegir algunas com unidades que registren niveles muy al
tos de este indicador y otras que los tengan muy bajos. Si se hace as, ser m enor el tra
bajo necesario para extraer una inferencia causal que tenga un determinado nivel de cer
tidumbre porque habr que recoger m enos observaciones.
El presente modelo formal presupone que el efecto que estamos estu

diando es lineal. Es decir, cuanto mayores sean los valores de las variables
explicativas, ms alto (o ms bajo) ser el valor esperado de la variable de
pendiente. Lo mismo ocurrir si la relacin no es lineal pero s bastante
uniforme (o sea, no decreciente). Si, por el contrario, el efecto es claramen
te no lineal, puede que los valores medios de la variable explicativa presen
ten un resultado completamente diferente. Por ejemplo, supongamos que un
estudio que slo se basara en los valores extremos de la variable explicativa
llegara a la conclusin de que no existe ningn efecto: el nivel educativo de
la comunidad no influye en la delincuencia. Sin embargo, de hecho, podra
ser que slo los niveles educativos medios redujeran el grado de delincuen
cia de una comunidad. En la mayora de los problemas esta matizacin no
es cierta, pero, al disear la investigacin, hay que procurar especificar
exactamente nuestras premisas.
Si prestamos atencin a la variabilidad fundamental, a la incertidumbre,
a la colinealidad y a la varianza de los valores de la variable causal, podre
mos lograr ms control con pocas unidades. Sin embargo, no deja de ser ra
zonable hacerse la pregunta que da ttulo a este apartado: cuntas observa
ciones son suficientes? No podem os responder a esta cuestin con una
respuesta precisa que siempre sea aplicable. Como hemos demostrado con
el ltimo modelo formal, la respuesta depende de cuatro informaciones di
ferentes, que variarn en cada diseo de investigacin. Adems, la mayora
de las situaciones que son objeto de investigacin cualitativa no se ajusta
rn exactamente a este modelo formal, aunque, en un sentido ms general,
las intuiciones fundamentales s sean aplicables.
Cuantas ms observaciones, mejor, pero cuntas son necesarias? En la
situacin ms sencilla en la que hay niveles de variabilidad escasos, va
rianza alta en la variable causal, ninguna correlacin entre sta y las de
control y se requieren niveles bastante bajos de certidumbre se necesita
rn pocas observaciones: probablemente ms de cinco pero menos de vein
te. De nuevo, la respuesta precisa depende de la exacta especificacin del
modelo formal y del valor exacto de cada uno de sus componentes. Lamen
tablemente, la investigacin cualitativa, por definicin, no suele ser precisa
y, en consecuencia, no siempre podem os reducir este aspecto a una sola
respuesta.
Por fortuna, s suele ser posible evitar estos problemas aumentando el
nmero de observaciones. A veces esto supone recoger ms datos, pero,
como sealamos en el apartado siguiente, suele ser posible reconceptualizar
un diseo de investigacin cualitativo para sacarle muchas ms observacio
nes y darle as una estructura ms consistente. A continuacin nos ocupa
mos de este asunto.
3.
Aumentar el nmero de observaciones a partir

de unas pocas
Ya hemos hecho hincapi en las dificultades que conlleva investigar con un

pequeo nmero de observaciones y hemos sealado ciertas medidas que
se pueden tomar para mejorar el diseo en esos casos. Sin embargo, quiz
el lector se haya dado cuenta de que consideramos todos estos consejos
soluciones de recambio, que son tiles cuando la cantidad de observacio
nes es limitada pero que no lo son tanto como estrategia para aum entarla6.
Tal como sealamos, estas soluciones de recambio son valiosas porque a
veces no podemos recoger ms observaciones del tipo que queremos anali
zar: quiz slo haya unos pocos ejemplos del fenmeno que nos interesa o
puede que sea demasiado caro o arduo investigar ms observaciones que
las pocas que ya tenemos. En este apartado analizamos diversas formas de
aumentar el nmero de nuestras observaciones que resultan tiles cuando
nos encontramos con lo que parece un nmero escaso de ellas y no dispo
nemos del tiempo o de los recursos para recoger ms. Sealamos varias for
mas de aumentar el nmero de observaciones relevantes para nuestra teora
mediante la redefinicin de las mismas. Estas estrategias de investigacin
aumentan n a la vez que mantienen la atencin en la bsqueda de pruebas
que constaten o refuten la teora. Tal como hemos recalcado anteriormente,

suelen ser tiles incluso despus de que se ha terminado la recogida de
datos.
Como sealamos en el apartado cuatro del captulo 2, para Harry Ecks
tein (1975) un caso es un fenmeno del que slo sealamos e interpreta
m os una nica m edida en cada variable pertinente. Como la palabra
caso se ha utilizado de muchas formas diferentes en las ciencias sociales,
preferimos centrarnos en las observaciones, que hemos definido como cada
una de las medidas de una variable dependiente en una unidad (y de tantas
variables explicativas como se disponga para esa m ism a unidad). Las
observaciones son el componente fundamental de la investigacin social
emprica: las reunimos con el fin de presentar pruebas que consideramos
fiables para evaluar nuestras teoras. En realidad, como sealamos en el ca
ptulo 2 , en los proyectos de investigacin no se estudian fenmenos globa
les como Francia, la Revolucin francesa, las elecciones estadounidenses
de 1992 o la decisin iraqu de invadir Kuwait, sino que lo que se hace es
seleccionar aspectos de esos fenmenos conjuntos de variables explicati
vas y dependientes y concretarlos en nuestras teoras. Identificamos uni
dades en las que funcionan tales variables y hacemos observaciones de s
tas en las prim eras1.
En consecuencia, lo que utilizamos para evaluar nuestras teoras es un
conjunto de observaciones referidas a ciertas unidades que, a su vez, tienen
que ver con unas variables relevantes. Aqu lo que nos interesa es aumentar
el nmero de observaciones, y todas las formas de hacerlo parten de la teo
ra o hiptesis que estamos comprobando. Tenemos que preguntarnos cu
les son las posibles consecuencias observables de nuestra teora o hiptesis
y cuntos ejemplos podemos encontrar para contrastarlas. Si necesitamos
ms observaciones para realizar esta comprobacin, hay tres formas de
conseguirlas: podemos observar ms unidades, medirlas otra vez de dife
rente manera o hacer ambas cosas (es decir, observar ms unidades y utili
zar, a la vez, otras medidas). Dicho de otro modo, podemos hacer medidas
similares en otras unidades (lo cual describimos en el apartado 3.1), utilizar
las mismas unidades cambiando las medidas (apartado 3.2) o cambiar tan
to las medidas como las unidades (apartado 3.3). El primer mtodo puede
considerarse una reproduccin completa de nuestra hiptesis: utilizamos las
mismas variables explicativas e independientes con nuevos ejemplos. El se
gundo conlleva una reproduccin parcial de nuestra teora o hiptesis, en la
que se utiliza una nueva variable dependiente con las mismas variables ex
plicativas. Para terminar, en el tercero se plantea una hiptesis nueva (o
muy revisada) que estaba implcita en nuestra teora original y que utiliza
otra variable dependiente para aplicarla a nuevos ejem plos8. Si se utili
zan estos mtodos se pueden observar muchas consecuencias diferentes de
nuestra teora, incluso en aquellas investigaciones que se denominan con
vencionalmente estudios de caso nico. De hecho, en un nico caso sue
le haber mltiples medidas de las variables principales; de ah que, por de

finicin, contenga mltiples observaciones9.
3.1
Las mismas medidas con otras unidades
Obtener ms observaciones a partir del mismo mtodo de medida es la for

ma habitual de incrementar el nmero de observaciones. Se aplica la misma
teora o hiptesis, ms o menos con las mismas variables, a ms ejemplos
del proceso que describe dicha teora. Las dos formas principales de encon
trar ms ejemplos observables del proceso que aborda nuestra teora se ba
san en transformaciones en el espacio o en el tiempo.
El mtodo fundamental para obtener ms observaciones en el espacio
es buscar otras unidades similares: aadir Pakistn, Bangladesh y Sri Lanka a la India en la propia base de datos. Si se tiene suficiente tiempo, di
nero y conocimientos, esta forma de proceder es vlida. El trabajo llevado
a cabo por Kohli en la India (que se analiz en el apartado 4.3 del cap
tulo 4) es un ejemplo de esta situacin y tambin pone de manifiesto una
de las maneras que l utiliz para superar el problema que planteaba estu
diar tres estados indios, que se haban seleccionado en funcin de valores
conocidos de la variable dependiente y de las explicativas. El autor se ocu
p de otras dos unidades nacionales. Una de ellas era el Chile de Allende,
en el que los programas de ayuda a los pobres fracasaron. Kohli seal
que a este fracaso haba contribuido la ausencia de una de las tres caracte
rsticas que, para l, llevan al xito de tales programas (en el caso chileno,
la falta de un partido poltico reformista bien organizado)l0. El otro pas
que consider era el Zimbabue de Robert Mugabe, que haba llegado al
poder, cuando Kohli estaba escribiendo su libro, con un programa de re
duccin de la pobreza parecido al de Bengala occidental. Los resultados,
aunque provisionales, parecian constatar la teora de Kohli. Estos dos ca
sos los trat por encima, pero no se equivoc al considerarlos consecuen
cias observables de su teora.
Sin embargo, no es necesario que rebasemos los lmites de la unidad que
hemos estado estudiando. Una teora que, en principio, se centre en un estado-nacin puede contrastarse en las unidades geogrficas que lo componen,
ya sean estados, condados, ciudades, regiones, etc. Evidentemente, esto au
menta el margen de variabilidad tanto de las variables explicativas como de
la dependiente. Supongamos que quisiramos comprobar una teora de la
inestabilidad social que relacionara este problema con los precios agrcolas.
Una unidad podra ser la nacin denominada India, pero, si tenemos en
cuenta las diferentes partes del pas, este caso aportar numerosas observa
ciones sobre la relacin que nos interesa. Sin salir de l podemos aumentar
el nmero de observaciones, buscando reproducciones del proceso que se
est estudiando.
Los que estudian las polticas sociales suelen ocuparse de unidades ad

ministrativas que, en realidad, son subunidades del estado-nacin en el que
les quieren comprobar sus hiptesis acerca del origen de diversos tipos de
polticas. El anlisis que llev a cabo Kohli de tres estados de la India es un
ejemplo de una tendencia habitual en este tipo de estudios, que consiste en
comparar estados, ciudades o regiones. Sin embargo, para Kohli, el conjun
to de observaciones original eran los tres estados indios. Como hemos se
alado, el autor los seleccion de forma que no se podan utilizar para com
probar su hiptesis sobre el efecto de la estructura del rgim en en las
polticas contra la pobreza en la India. Sin embargo, igual que utiliz otras
naciones como unidades de observacin, tambin solucion gran parte del
problema que haba en su primera seleccin de unidades mediante el uso de
subunidades. Partiendo de los tres estados indios con los que haba comen
zado, descendi a otro nivel de observacin para aplicar su hiptesis a los
panchayats (consejos de gobierno locales de los distritos, bloques y pue
blos), que son subunidades de los estados. Los panchayats diferan consi
derablemente en cuanto al compromiso de sus dirigentes con las polticas
contra la pobreza y a la estructura organizativa local. De este modo, se
pudo comprobar el impacto que tena esa diversidad en los resultados de la
poltica que el autor utilizaba como variables dependientes.
Las subunidades que aportan ms observaciones no tienen por qu ser
de tipo geogrfico. Las teoras que son aplicables al estado-nacin tam
bin pueden contrastarse en organizaciones gubernamentales o en el m ar
co de determ inadas decisiones, lo cual puede hacerse sin tener que ir a
otro pas. En un trabajo de Verba y otros autores (1993) se puede apreciar
cmo se buscan ms consecuencias observables de la propia hiptesis en
otras unidades no geogrficas. En el ejemplo que presentamos en el apar
tado 4 del captulo 5, estos investigadores explicaban que el hecho de que
los afroamericanos aprendan ms habilidades sociales que los latinos se
explica por el tipo de iglesia a la que acuden unos y otros; es probable que
el primer grupo vaya a iglesias protestantes que tienen una organizacin
de tipo comunitario, mientras que el segundo suele acudir a congregacio
nes catlicas con un funcionamiento jerrquico. Los autores sealan que,
si su hiptesis sobre la influencia que tiene la organizacin de la iglesia es
correcta, el mismo tipo de diferencia que aparece entre fieles catlicos y
protestantes debera apreciarse al comparar otras unidades religiosas, es
pecialmente las sectas protestantes que difieren en cuanto a su forma de
organizarse. Les parece que los episcopalanos, cuya iglesia tiene una es
tructura jerrquica, son bastante parecidos a los catlicos en cuanto a la
adquisicin de habilidades sociales a travs de su congregacin. El hecho
de que los episcopalanos suelan tener ms estudios y recursos que, por
ejemplo, los baptistas aunque en su iglesia demuestren menos sus habi
lidades sociales concede un mayor grado de control a la confirmacin
de esta hiptesis causal.
Hay que tener cuidado al decidir si las nuevas unidades son apropiadas
para reproducir nuestra hiptesis, es decir, si en ellas puede tener lugar el
proceso que implica dicha hiptesis. La validez que tenga la aplicacin de
la hiptesis a otras clases de unidades depender de la teora e hiptesis que
se estn utilizando, as como del tipo de unidades. Si la variable dependien
te es la poltica de proteccin social, los estados o provincias sern adecua
dos si pueden implantar ese tipo de polticas, pero si lo que estamos estu
diando es la poltica arancelaria y todas las decisiones al respecto las toma
el gobierno central, quiz las unidades estatales o provinciales no sean las
indicadas. Del mismo modo, no tendra sentido estudiar los gobiernos loca
les de la India o de Pakistn para comprobar una teora relativa a las condi
ciones en las que una unidad poltica decide desarrollar armamento nuclear,
ya que este tipo de eleccin la realiza el gobierno central. Para dar otro
ejemplo, podemos sealar que se puede comprobar el impacto que tiene el
cambio de los precios agrcolas sobre la inestabilidad social en los estados
indios, pero que no es factible utilizar varias organizaciones del gobierno in
dio para verificar esta relacin, ya que este proceso no tiene lugar dentro de
ellas. Dicho en pocas palabras, el hecho de que las subunidades sean luga
res apropiados para observar una teora en accin depende de esa misma
teora. Esta es la razn por la que aconsejamos que se comience por elabo
rar una lista de las consecuencias observables de nuestra teora y no bus
cando montones de posibles unidades, independientemente de la teora que
se utilice. Slo podremos elegir las unidades de estudio una vez que haya
mos especificado cul es la teora.
Un enfoque alternativo es considerar observaciones a lo largo del tiem
po. La India actual y la de hace una dcada pueden ser dos ejemplos del
proceso que nos interesa. De hecho, en la mayora de las investigaciones
que se consideran estudios de caso hay mltiples medidas de una hipte
sis a lo largo del tiempo.
Creemos que aconsejar que se aumente el nmero de observaciones bus
cando ms ejemplos en las subunidades o teniendo en cuenta ms situacio
nes a lo largo del tiempo es una de las indicaciones ms tiles que podemos
dar a los investigadores cualitativos. Soluciona el problema que plantea un
n pequeo porque lo aumenta sin que sea necesario, por ejemplo, viajar a
otro pas o analizar una decisin completamente nueva. Sin embargo, es un
consejo que hay que seguir con cuidado: la teora o hiptesis tiene que ser
aplicable a la nueva situacin, es decir, la subunidad debe contener real
mente una consecuencia observable de dicha teora. No tiene por qu ser
(ni siquiera aproximadamente) la consecuencia observable que nos interese
en ese preciso momento; siempre que sea una consecuencia de la misma teo
ra, los datos que organicemos nos darn un mayor control sobre la inferen
cia causal.
Hay que ser consciente de otro problema. Queremos utilizar estos nue
vos ejemplos para someter nuestra teora a otras pruebas, pero las subuni-
dades o los diversos ejemplos que hemos encontrado a lo largo del tiempo
quiz no sean com probaciones independientes de dicha teora. De este
modo, como reconoce George (1982, pp. 20-23), cada nuevo caso no nos
aportar tanta informacin sobre el problema como lo hara si las observa
ciones fueran independientes. El hecho de que las observaciones dependan
unas de otras no descalifica las comprobaciones, a menos que esa depen
dencia sea perfecta, es decir, a menos que se puedan predecir totalmente los
nuevos datos a partir de los existentes. Si no se da este caso improbable, al
menos s habr nueva informacin en los nuevos datos que nos ayude a
analizarlos. Estas nuevas observaciones, que se basan en informacin no
independiente, no aportarn tanta informacin como las que son completa
mente independientes, pero, de todos modos, pueden ser tiles.
Esta conclusin tiene dos consecuencias prcticas. En primer lugar, al
barajar observaciones parcialmente dependientes tenemos que tener cuida
do de no exagerar la certeza de las conclusiones. Especialmente, no hay
que considerar que esos datos nos ofrecen tantas observaciones como ten
dramos si las observaciones fueran independientes. En segundo lugar, es
preciso analizar con precaucin por qu las observaciones dependen unas
de otras. Con frecuencia, la dependencia proceder de una o de algunas va
riables omitidas interesantes que pueden inducir a confusin. Por ejemplo,
supongamos que nos interesa la participacin poltica de los ciudadanos en
los condados de los Estados Unidos. Quiz los condados contiguos no sean
independientes porque la gente va a trabajar cada da de unos a otros, por la
movilidad residencial o por los valores socioeconmicos similares que tie
nen las personas que viven en ellos. Recabar datos en condados vecinos s
aportar ms informacin al estudio, aunque no tanta como se podra espe
rar de condados que fueran completamente independientes de aquellos en
los que ya habamos recogido datos.
Para dar otro ejemplo, pensemos en la relacin que existe entre el cam
bio de los precios agrcolas y la inestabilidad social. Podramos comprobar
si se da esta relacin en varios estados indios, calculando estos precios y la
inestabilidad social. Sin embargo, los estados no son unidades experimenta
les aisladas. Los valores de la variable dependiente pueden verse afectados
no slo por los que adopten las variables explicativas dentro de cada uni
dad, sino por los de las omitidas que estn fuera. En un estado el detonador
de la inestabilidad social pueden ser los precios agrcolas (tal como predice
la teora), pero esa alteracin del orden social puede influir directamente en
que se genere una situacin parecida en un estado contiguo (lo cual har que
sta slo sea una demostracin parcialmente independiente de nuestra teo
ra). Sera posible enfrentarse al problema controlando adecuadamente esta
propagacin. Algo similar puede ocurrir con la influencia que ejerce cierto
perodo sobre otro posterior. Podramos reproducir nuestro anlisis en la In
dia una dcada despus, pero la inestabilidad social del primer perodo qui
z tuviera un efecto directo en la del segundo.
S"
235
Estos ejemplos ponen de manifiesto que la reproduccin de un anlisis

sobre nuevas unidades no siempre produce un nuevo estudio importante. Se
pueden utilizar las observaciones que estn dentro del estudio actual y que
tengan la misma forma que las ya utilizadas para comprobar la hiptesis.
De este modo, el investigador del estudio de caso podr darse cuenta de
que existen muchas ms observaciones de las que pensaba1'.
3.2
Nuevas medidas con las mismas unidades
Se pueden obtener ms ejemplos para comprobar una teora o hiptesis con

la misma unidad de observacin pero cambiando la variable dependiente.
Para utilizar este mtodo hay que buscar muchos efectos de la misma cau
sa, lo cual constituye una tcnica muy convincente para comprobar una hi
ptesis. Una vez ms, partimos de una teora o hiptesis, que suponemos es
correcta, y nos preguntamos: aparte de la variable dependiente actual, en
qu otras cosas cabe esperar que influyan nuestras variables explicativas?
Este ejercicio nos puede sugerir indicadores alternativos de la variable de
pendiente. En el captulo 1 sealamos que una determinada teora acerca de
la extincin de los dinosaurios estaba relacionada con la composicin qu
mica de las rocas. De ah que, incluso una teora causal que explique un
acontecimiento prehistrico singular, tenga mltiples consecuencias obser
vables que puedan evaluarse.
En el ejemplo de las fluctuaciones de los precios agrcolas y la inestabi
lidad social puede que hayamos medido el segundo factor utilizando la can
tidad de desrdenes pblicos. Adems de la inestabilidad social, podramos
preguntarnos qu ms cabra esperar si la teora es correcta. Quiz haya
otras medidas vlidas de ese desorden social (comportamientos desviados
de uno u otro tipo). Esta investigacin podra llevamos a la hiptesis de que
hay otras variables que se veran afectadas, como son el comportamiento
electoral, la inversin empresarial o la emigracin. El mismo proceso que
hace que la fluctuacin de los precios agrcolas genere inestabilidad podra
vincular el primer factor con los otros resultados mencionados.
La obra de Putnam (1993) sobre el impacto de los recursos sociales en el
comportamiento de los gobiernos locales en Italia participa de un enfoque
similar. El comportamiento de las regiones no es una medida nica. En rea
lidad, Putnam utiliza una amplia gama de variables dependientes para ex
plicar de dnde surge la eficiencia en el comportamiento democrtico de
las regiones italianas. Dispone de doce indicadores de comportamiento ins
titucional que, ocupndose de las polticas, pretenden medir su proceso de
elaboracin, las declaraciones que suscitan y su puesta en prctica. Ade
ms, utiliza encuestas para calibrar cmo evalan los ciudadanos la actua
cin del gobierno. Cada una de estas medidas representa una consecuencia
observable de su teora.
Como hemos indicado anteriormente, la utilizacin de unidades admi

nistrativas subnacionales para estudiar una determinada poltica arancelaria
no sera apropiada si este tipo de impuestos los fijara el gobierno central.
Aunque las variables explicativas por ejemplo, el tipo de sector industrial
o de producto agrcola varen en diferentes estados o provincias, el pro
ceso por el que se fijan los niveles arancelarios (que es lo que le interesa a
la hiptesis que se est comprobando) no tiene lugar dentro de las unidades
subnacionales. Sin embargo, si la variable dependiente pasa a ser el voto de
los representantes de diversos estados o provincias en cuestiones comercia
les o arancelarias, s ser posible estudiar el problema. De este modo, pode
mos aumentar el nmero de ejemplos en el que opera el proceso terico.
3.3
Nuevas medidas con nuevas unidades
Tambin podemos salim os del conjunto de variables explicativas y depen

dientes que se han aplicado a un determinado conjunto de variables para
buscar otras consecuencias observables que m anejen nuevas variables y
unidades. Puede que las medidas que utilicemos para comprobar hiptesis,
que son fundamentalmente nuevas aunque se deriven de las primeras, sean
bastante diferentes de las utilizadas hasta el momento. El proceso que des
cribe la nueva teora quiz no sea aplicable al tipo de unidad que se estudia,
sino a otro (con frecuencia, a una unidad que est en un nivel de agregacin
inferior o superior). La hiptesis general sobre la relacin que existe entre
los precios agrcolas y la inestabilidad social puede sugerir otras relativas a
la incertidumbre y a la inestabilidad en tipos de unidades diferentes, como
son las empresas o los entes pblicos. Tambin puede llevarnos a hiptesis
que se ocupen del comportamiento de los individuos. En este mismo ejem
plo podramos preguntarnos: si nuestra teora acerca del efecto que tienen
las fluctuaciones de precios en la estabilidad social (que ya hemos compro
bado en diversas unidades polticas) es correcta, qu es lo que esto supone
para el comportamiento de las empresas, de las cooperativas agrcolas o de
los individuos (quiz en el mismo conjunto de unidades polticas)? Qu
consecuencias tendra si tiene alguna sobre cmo deciden las organiza
ciones gubernamentales la asignacin de recursos? Qu reaccin psicolgi
ca cabra esperar que suscitara la incertidumbre en los individuos y qu in
fluencia podra tener en sus posibles comportamientos desviados?.
Este enfoque resulta especialmente til cuando no hay casos observables
de un proceso social potencialmente significativo. En el estudio de la gue
rra nuclear hay un ejemplo de ello. Como nunca ha tenido lugar un enfren
tamiento con este tipo de armamento entre dos potencias que dispongan de
l, no podemos observar los efectos de las variables explicativas en el esta
llido de este tipo de guerra. Supongamos que, segn nuestra teora, la pre
sencia de las arm as nucleares en am bos bandos ha evitado una guerra
abierta. Aunque no haya ejemplos observables de nuestra hiptesis funda

mental, plantear otra ms especfica podra conllevar otras posibles obser
vaciones. Por ejemplo, podramos pensar que nuestra teora implica que el
hecho de que ambos bandos posean armas nucleares tendra que evitar la
existencia de amenazas serias de guerra abierta. Posteriormente, al estudiar
la frecuencia y severidad de las amenazas entre parejas de pases con capa
cidad nuclear y entre los que carecen de ella, y al analizar esas amenazas a
medida que la probabilidad de guerra pareciera aumentar durante las crisis,
podram os encontrar, y com probar, otras consecuencias observables de
nuestra teora.
Para llegar a la nueva teora o hiptesis, que es diferente de la original
pero que parte de ella, suele ser necesario desplazarse a un nivel de agrega
cin ms bajo y a un nuevo tipo de unidad: esto no supone trasladarse des
de una unidad poltica como la nacin a otro nivel de agregacin inferior
como es la provincia, sino desplazarse desde esas naciones o provincias
hasta los individuos que viven en las unidades o hasta las decisiones que to
man dentro de ellas. Cada teora puede implicar diversas conexiones entre
variables que conducen a un determinado resultado; es decir, diversas for
mas de producirse un fenmeno (Dessler, 1991, p. 345). Antes de disear
comprobaciones empricas, quiz tengamos que describir un mecanismo
causal en el que haya series de hiptesis causales relacionadas que indi
quen de qu manera se conectan las variables. D efinir esos mecanismos
causales diversos y buscarlos puede hacer que encontremos una gran varie
dad de nuevas consecuencias observables de una teora (en el apartado 2 . 1
del captulo 3 sealamos las diferencias que hay entre el concepto de meca
nismo causal y nuestra definicin fundamental de causalidad, que es ms
general).
Este desplazamiento hacia un nuevo tipo de observacin otra clase
de unidad social, un individuo, una decisin puede conllevar que se
introduzcan variables explicativas no aplicables a la unidad original. Con
frecuencia, plantear una hiptesis o teora sobre unidades polticas supone
hacer otra elaboracin terica acerca de cmo se produce el resultado con
creto que se observa en el nivel de la unidad. En concreto, la hiptesis que
se refiere a sta puede entraar otras hiptesis referidas a las actitudes y
comportamientos que se registran en el nivel de los individuos que viven
dentro de las unidades. Estas segundas hiptesis pueden comprobarse utili
zando datos sobre esos individuos. Si nos desplazamos al nivel individual,
podremos centrarnos en variables psicolgicas o en aspectos de la expe
riencia o la posicin social que carecen de sentido si se aplican a las unida
des polticas.
Pensemos en el ejemplo de la relacin entre precios agrcolas e inestabi
lidad social. Podramos plantear una hiptesis referida a una unidad admi
nistrativa, como es una nacin o provincia. El ejemplo podra ser el si
guiente: cuanto mayor es la fluctuacin de los precios agrcolas en una
unidad, ms probabilidades hay de que se registre inestabilidad social. A su

vez, esta hiptesis sugiere otras acerca de los individuos que viven dentro
de esas unidades. Por ejemplo, podramos plantear que hay una mayor pro
babilidad de que participen de comportamientos sociales perturbadores los
ms vulnerables a la fluctuacin de los precios (los que cultivan ciertos pro
ductos o aquellos que slo pueden abastecerse adecuadamente si los ali
mentos son baratos). Para comprobar esta hiptesis quiz tuviramos que
medir factores psicolgicos como la alienacin o el comportamiento indivi
dual desviado.
Los estudios que dan explicaciones culturales a los fenmenos polticos
dependen a menudo de este tipo de anlisis que se hace en el nivel indivi
dual l2. El estudio que realiz Weiner sobre las polticas de educacin y de
trabajo infantil en la India se basa en una explicacin cultural: que la razn
de que este pas sea casi el nico del mundo que no tenga una legislacin
eficiente para imponer la educacin universal y que tambin carezca de le
yes que prohban el trabajo infantil tiene que ver con valores sociales que
comparte el ciudadano medio con las lites gobernantes (Weiner, 1991). La
India es un nico pas, y puede decirse que en el estudio de Weiner n es
slo 1. El autor evita este problem a de diversas maneras. Para empezar,
compara la India con otros pases que han desarrollado un sistema de edu
cacin universal. Tambin realiza comparaciones menores entre los estados
indios; dicho de otro modo, cambia las unidades. Sin embargo, la hiptesis
sobre la cultura y las polticas de la India implica, a su vez, otras hiptesis
relativas a los valores de los individuos y a lo que piensan de las polticas.
En este sentido, los ms importantes son los miembros de las lites que
participan en la elaboracin de las polticas de educacin y de trabajo in
fantil. De este modo, la principal comprobacin a que se somete la hipte
sis de Weiner tiene lugar en el plano individual. El autor entrevist en pro
fundidad a las lites para extraer informacin sobre lo que pensaban acerca
de los valores relativos a la educacin y el trabajo infantil. Estas opiniones,
adems de expresar lo que pensaban los entrevistados de las polticas, cons
tituan las consecuencias observables de la hiptesis global de Weiner.
Esta forma de hacerse con ms consecuencias observables de una teora
a partir de unidades que estn en un nivel de agregacin inferior tambin
puede aplicarse a los anlisis de las decisiones. George y McKeown men
cionan un enfoque denominado rastreo de procesos, en el que el investi
gador se fija con atencin en el proceso decisorio por el que varias condi
ciones iniciales se transforman en resultados (George y McKeown, 1985,
p. 3 5 ) l3. En lugar de considerar que el resultado final (por ejemplo, de una
crisis internacional) es la variable independiente, se construyen otras nue
vas. De manera que, por ejemplo, se convierte en una nueva variable cada
decisin dentro de una secuencia o cada conjunto mensurable de percepcio
nes que los encargados de decidir tengan de acciones o intenciones ajenas.
Este enfoque llega con frecuencia al nivel del actor individual. Una teora
=350
239
que vincule las condiciones iniciales con los resultados a menudo implicar
que en esos actores se d un determinado conjunto de motivaciones o per
cepciones. Por consiguiente, el rastreo de procesos conllevar una bsqueda
de pruebas coherentes con la teora causal general relativas a los pro
cesos decisorios que han producido los resultados. Para utilizar este proce
dimiento quiz se necesite entrevistar a los actores o leer lo que han escrito
para explicar las razones de sus actos.
Por ejemplo, en las relaciones internacionales, la cooperacin entre esta
dos puede producirse por muchas razones: porque se espere obtener benefi
cios de la reciprocidad, porque funcione una disuasin con amenazas de
destruccin o porque haya unos intereses comunes en cierto conjunto de re
sultados. En cada uno de estos mecanismos causales participarn muchas
variables explicativas, pero en cada uno de los mecanismos posibles el con
junto de variables ser diferente, y tambin lo sern las relaciones entre
ellas. Un estudio atento del proceso que lleva a las naciones a cooperar qui
z nos permita determinar qu mecanismo causal es ms posible que est
funcionando. Esto puede conllevar el estudio, entre otros asuntos, de las
motivaciones expresadas por los actores o del tipo de comunicacin que
hay entre ellos.
Desde nuestra perspectiva, el rastreo de procesos y otras formas de ela
borar mecanismos causales aumentan el nmero de observaciones relevan
tes desde el punto de vista tericol4. Estas estrategias vinculan el trabajo te
rico y el emprico porque utilizan consecuencias observables de una teora
para indicar nuevas observaciones que habra que hacer para evaluarla. Este
mtodo, al aportar ms observaciones relevantes para las consecuencias de
una teora, puede ayudarnos a superar los dilemas que plantean los estudios
de n pequeo y hacer posible que tanto los investigadores como los lectores
tengan ms confianza en los hallazgos de las ciencias sociales. En cada su
cesin de acontecimientos, el rastreo de procesos produce muchas observa
ciones. As ocurre tambin, dentro de cada unidad poltica, cuando se anali
zan actitudes o com portam ientos individuales. Adems, el investigador
controla las variables que son aplicables a todas las observaciones porque
se relacionan con la sucesin de acontecimientos o con el conjunto de la
unidad. En general, un enfoque que slo preste atencin al resultado final
har que el investigador no disponga ms que de un nmero muy escaso de
observaciones para resolver el dilema que se presenta cuando se encuentra
o bien sesgo de la variable omitida o imprecisin. Al revisar mltiples ob
servaciones relativas a las actitudes o comportamientos individuales, el in
vestigador puede calibrar qu mecanismos causales se han activado.
No es probable que este tipo de anlisis produzca inferencias causales
consistentes porque se puede poner en m archa ms de un mecanismo y,
dentro de cada uno de ellos, quiz no est clara la fuerza relativa de las va
riables explicativas. Sin embargo, s que servir, en cierta m edida, para
contrastar hiptesis, ya que una elaboracin terica que explique resultados
tambin puede tener consecuencias para el proceso que lleva a que stos se
produzcan. Por lo tanto, buscar mecanismos causales aporta observaciones
que podran refutar la hiptesis. Quiz este enfoque tambin permita al in
vestigador hacer alguna generalizacin descriptiva sobre la frecuencia con
que se activa cada posible mecanismo causal y puede que tales generaliza
ciones descriptivas sirvan de base para futuros anlisis de otros mecanis
mos causales relacionados y de las condiciones en las que cada uno de ellos
se pone en marcha.
Para nosotros, el rastreo de procesos y la bsqueda de los fundamentos
psicolgicos que sustentan una hiptesis desarrollada en un nivel de agre
gacin superior son enfoques muy valiosos. Sin embargo, constituyen ex
tensiones de la lgica analtica fundamental que hemos venido utilizando y
no formas de evitarla. Los estudios de este tipo, si quieren hacer alguna
aportacin a la inferencia causal, tendrn que enfrentarse a todos sus pro
blemas: la homogeneidad de las unidades, la endogeneidad y el sesgo. Para
alcanzar inferencias causales vlidas es preciso que, en el nivel del indivi
duo que toma las decisiones, nos planteemos las preguntas que surgen al di
sear una investigacin y que las respondamos. Habr que calibrar con pre
cisin las razones que nos d ese individuo, seleccionar las observaciones
de manera que sean independientes del resultado que se ha producido (si
no, tendrem os problem as de endogeneidad) y evitar que haya variables
omitidas relevantes. Tambin es importante recalcar aqu que los mecanis
mos causales que se rastreen de este modo tendrn que hacer que nuestra
teora sea ms, y no menos, restrictiva: este tipo de tcnicas ha de aumen
tar, y no evadir, las posibilidades de refutacin de una teora. En suma, el
rastreo de procesos y otros anlisis de subunidades son tiles para encon
trar hiptesis plausibles sobre mecanismos causales que, a su vez, pueden
favorecer la elaboracin de generalizaciones descriptivas y allanar el cami
no hacia la inferencia causal. Sin embargo, este enfoque tiene que enfren
tarse a todos los problemas del anlisis causal.
4.
Observaciones finales
En principio y en la prctica, tanto en los estudios cuantitativos como en

los cualitativos se plantean los mismos problemas inferenciales. Las inves
tigaciones que se disean para ayudamos a entender la realidad social slo
pueden lograr su propsito mediante la lgica de la inferencia cientfica.
Esta mxima es aplicable a los estudios cualitativos, cuantitativos, con n
grande o pequeo, experimentales, de observacin, histricos, etnogrficos,
a los que utilizan la observacin participante y a todos los dems que inves
tigan la sociedad de manera cientfica. Sin embargo, como este captulo
tendra que haber dejado claro, los problemas fundamentales de las inferen
cias descriptiva y causal suelen ser ms difciles de evitar cuando se utiliza
un n pequeo que cuando ste es grande. En este libro se han sealado for
mas de incrementar el nmero de observaciones para un estudio y tambin
cmo hacer inferencias a partir de una cantidad de observaciones relativa
mente pequea.
Tanto los investigadores cuantitativos como los cualitativos pueden ha
cer ms eficiente un estimador aumentando la cantidad de informacin que
se utiliza para resolver un problema con frecuencia mediante el incre
mento del nmero de observaciones (apartado 7.2 del captulo 2) y, a ve
ces, recurrir a procedimientos aleatorios de seleccin y adjudicacin de va
lores con el fin de evitar autom ticam ente el sesgo. Gran parte de los
anlisis de este libro pretendan ayudar a los cualitativistas a tener estima
dores ms precisos, pero las tcnicas que hemos sealado son diversas y,
con frecuencia, hay que llegar a un equilibrio entre varios objetivos de in
vestigacin vlidos; de ah que sea difcil concentrar nuestras indicaciones
en enunciados concisos que se correspondan con las ecuaciones formales
que prefiere la investigacin cuantitativa.
Los investigadores que, en el anlisis de los fenmenos sociales, deciden
prescindir de los procedimientos cuantitativos formales no pueden hacer
caso omiso de los sesgos e ineficiencias que crean los diseos de investiga
cin metodolgicamente irreflexivos. Sus temas de estudio son tan impor
tantes, y a veces ms, que los que analizan los cuantitativistas. Las inferen
cias descriptivas y causales que hacen los cualitativistas merecen ser tan
sensatas como las de cualquier otro investigador, y para que sean vlidas
sus autores van a necesitar acercarse ms que antes a las cuestiones meto
dolgicas. Tambin deben ser ms contenidos al disear sus estudios y ms
explcitos al plantear resultados importantes. Los lectores no tienen por qu
reformular los estudios cualitativos publicados para hacerlos cientficamen
te vlidos. Si un autor conceptualiza un proyecto de investigacin de nume
rosas consecuencias observables utilizando slo dos de ellas y doce hipte
sis causales, no ser responsabilidad de quien lo lea o resee el explicar que
el diseo implcito del autor era mejor que el explcito. Lo que es an ms
fundamental, los investigadores que comprendan y expliquen la lgica de
sus anlisis producirn estudios ms valiosos. Por fortuna, las cuestiones
m etodolgicas que los cualitativistas tienen que comprender son, preci
samente, las mismas que el resto de los investigadores cientficos debe res
petar. Una inferencia vlida slo es posible si se entiende y respeta la lgica
interna que subyace en todas las investigaciones sociales de tipo cientfico.
Notas
Captulo 1
1 Rechazam os el concepto de sem iexperim ento o, al menos, la expresin. Un diseo

de investigacin o bien conlleva un control por parte del investigador de las observacio
nes y valores de las principales variables causales (en cuyo caso es un experimento) o
no tiene este control (entonces es una investigacin de carcter no experimental). A m
bos tipos de investigacin tienen sus ventajas e inconvenientes, y no puede decirse que
uno sea siempre m ejor que el otro.
2 Aunque nos ocupem os de casi todas las reglas importantes de la inferencia cient
fica, no puede decirse que stas sean completas. De hecho, casi todos los filsofos estn
de acuerdo en que, incluso como principio, es imposible llegar a una lgica inductiva
com pleta y exhaustiva.
3 Sin embargo, una hiptesis alternativa, que postula que la extincin fue producida
por erupciones volcnicas, tam bin puede explicar la presencia del iridio, y parece que
concuerda m ejor con el descubrim iento de que todas las extinciones de especies no ocu
rrieron simultneamente.
4 Este dilem a no es otro que al que se enfrentan los que estudian las ciencias natura
les a la hora de decidir si llevan a cabo investigacin aplicada o bsica. Por ejemplo, la
aplicada que tenga como objeto un determinado frm aco o enfermedad puede mejorar, a
corto plazo, la atencin mdica sin aportar gran cosa al conocimiento general de los m e
canism os biolgicos subyacentes. La investigacin bsica puede tener consecuencias
opuestas. La m ayora de los investigadores sealaran, al igual que se hace en las cien
cias sociales, que esta dicotom a es falsa y que la investigacin bsica conduce final
mente a eficaces resultados prcticos. Sin embargo, todos estaran de acuerdo en que
el m ejor diseo de investigacin es aquel que de alguna manera se las arregla para parti
cipar directam ente en la resolucin de problemas del mundo real y profundizar en los
objetivos de lo escrito en una determ inada rea cientfica.
5 ste es el principio de falsabilidad (Popper, 1968), asunto sobre el que hay diver
sas opiniones en la filosofa de la ciencia. Sin embargo, pocos cuestionan la idea de que
las teoras deban enunciarse con la m ayor claridad posible, de forma que pueda revelar
se que estn equivocadas.
6 Probablemente, sta sea la pregunta que se plantea ms a m enudo en las entrevis
tas de trabajo de nuestro departamento y de m uchos otros.
7 Esta frase es conocida como el postulado de sim plicidad de Jeffreys-W rinch. El
concepto es sim ilar al de la navaja de Occam.
8 Si hemos elegido un asunto de importancia para el m undo real y/o ste hace algu
na aportacin a lo escrito en un rea de estudio, la naturaleza social de la academia co
rregir cualquier posible error: alguien reproducir nuestro estudio con otro conjunto de
datos y demostrar que estbamos equivocados.
9 Nos hemos dado cuenta de que m uchos estudiantes de doctorado tienen un miedo
innecesario a com partir los datos y la informacin precisa para reproducir sus resulta
dos. Tem en que alguien les robe su preciado trabajo o que incluso demuestre que estn
equivocados. Son tem ores habituales, pero pocas veces estn justificados. Publicar (o, al
menos, enviar copias de lo escrito sobre la investigacin a otros acadm icos) y com par
tir los datos es la m ejor forma de darle credibilidad a nuestra aportacin. Adems, com
partir los datos no har m s que facilitar que otros sigan el camino trazado con la inves
tigacin que uno ha comenzado. Una vez que sta se publique, citarn nuestro esfuerzo
e incrementarn nuestra visibilidad y reputacin.
10 Podemos com probar nosotros m ism os la fiabilidad m idiendo una m ism a canti
dad dos veces y fijndonos en si el resultado es igual. A veces esto parece fcil, como
en el caso de hacer exactam ente la misma pregunta en diferentes ocasiones durante una
entrevista; sin embargo, plantearla una vez puede influir en el entrevistado para que en
la segunda ocasin responda de una forma coherente con la anterior, de m odo que hay
que tener cuidado de que las dos m ediciones sean realmente independientes.
11 Ejemplo de ello es la utilizacin de m s de un codificador para la extraccin de
informacin sistemtica de las transcripciones de entrevistas en profundidad. Si dos per
sonas utilizan las m ism as norm as de codificacin, podem os observar con cunta fre
cuencia emiten el m ismo juicio. Si no se obtienen m edidas fiables, se pueden elaborar
normas de codificacin ms precisas e intentarlo de nuevo. Al final, suele ser posible
crear un conjunto de norm as para que la aplicacin de un m ism o procedim iento por di
ferentes codificadores arroje el mismo resultado.
12 La expresin falacia ecolgica es confusa porque el razonamiento que lleva de
los niveles agregados a los individuales no es ni ecolgico ni falaz. N o es muy afortuna
do utilizar el trmino ecolgico para describir un anlisis de tipo agregado. Aunque
Robinson (1990) lleg a la conclusin, en su prim er articulo sobre este asunto, de que
utilizar el anlisis agregado para hacer razonam ientos sobre individuos es una falacia,
m uchos cuantitativistas de las ciencias sociales y tam bin estadsticos reconocen ahora
que en niveles agregados de anlisis s existe cierta informacin sobre los individuos, y
se han desarrollado m uchos mtodos de inferencia ecolgica no sesgados.
Captulo 2
1 T am poco podem os rechazar a Caro por pertenecer a otra profesin: la de p erio

dista/bigrafo, cuyos objetivos son diferentes a los del cientfico social. Su obra se cen
tra en algunos problemas de los que podra ocuparse un politlogo, como qu lleva al
xito o al fracaso en una campaa electoral?, cul es el papel del dinero y de la finan-
dacin de la cam paa en el xito electoral?, qu motiva a los que dan dinero para la
cam paa? El anlisis se centra en una determinada candidatura de una circunscripcin
concreta, pero el problem a y las cuestiones que plantea se solapan con lo que es habitual
en la ciencia poltica.
2 Con el fin de com pletar esta explicacin, m erece la pena sealar que podram os
im aginar una teora completamente diferente en la que una contraccin del prpado no
fuera un guio pero tuviera, a pesar de todo, un efecto causal en otros actores. Por ejem
plo, el tic podra haberse m alinterpretado. Si tam bin nos interesara si la persona que
contrae el prpado pretenda hacer un guio, tendramos que buscar otras consecuencias
observables de esta m isma teora.
3 La bibliografa sobre los estudios de caso com parados es enorme. Para com ple
m entarla, algunas de las m ejores obras son las de Eckstein (1975), Lijphart (1971) y Collier (1991).
4 Coom bs (1964), por ejem plo, demostr que casi todas las colecciones de datos
tiles requieren o implican un cierto grado de teora, o de miniteora. Sin embargo,
hay m uchos datos cuantitativos, e histricos de tipo cualitativo, que se recogen con el
propsito explcito de anim ar a futuros investigadores a que los utilicen para fines no
previstos anteriormente. Quince m inutos con el Statistical A bstract o f the United States
(Resum en estadstico de los Estados Unidos) convencer a la m ayora de este hecho.
Las labores de recogida de datos tam bin difieren por el grado de rigidez con que los in
vestigadores siguen sus presupuestos previos.
5 Form alm ente, para un conjunto de unidades n en el que se m ide la variable y
(y,, ..., y ), un estadstico h es una funcin con un valor real que se define com o:
h = h(y) = h(yl, . . . , y i) .
6 Este asunto est m uy relacionado con el concepto de diseo de investigacin im
preciso, que analizamos en el apartado 1 del captulo 4.
7 Vase Popper (1982) para un libro entero dedicado a la defensa del indeterminismo.
8 Evidentemente, lo m ism o puede aplicarse a todas las com unidades que podramos
estudiar.
9 Hay que sealar que la aleatoriedad no tiene que ver exactam ente con diferentes
sem anas reales, ya que tanto los acontecimientos imprevistos como las diferencias siste
m ticas podran explicar las divergencias observadas. Por lo tanto, creamos una situa
cin lo ms ideal posible en la que podamos im aginar que ponemos en m archa el m un
do de nuevo con cara cte rstica s sistem ticas constantes y dejando que varen los
factores imprevistos.
10 Por supuesto, v5 puede tener m ucho inters para los habitantes de la circuns
cripcin 5 en ese ao y, por tanto, puede valer la pena estudiar los componentes aleato
rio y sistemtico de ese acontecimiento. No obstante, siem pre tendram os que intentar
distinguir lo aleatorio de lo sistemtico.
11 Vase K ing (1991b) para una elaboracin de esta distincin.
12 Los econom istas tienden a estar ms cerca del punto de vista 1, mientras que los
estadsticos estn m s prxim os al 2. El primero tam bin es especialm ente comn en la
rama de la ingeniera que se denom ina control de calidad. Los fsicos han llegado a
debatir esta distincin dentro de la m ecnica cuntica. En esta rea, los primeros que
propusieron el punto de vista 2 fueron los partidarios de la teora de la variable ocul
ta. Sin em bargo, las obras m s recientes tienden a constatar el punto de vista 1: el
m undo fsico parece intrnsecam ente probabilstico. Todos esperam os la resolucin de
las num erosas contradicciones que quedan en esta im portante teora y en sus consecuen
cias para la naturaleza del m undo fsico. Sin embargo, esta disputa dentro de la fsica,
aunque sola justificar gran parte de la filosofa de las ciencias sociales, probablemente
no influir en la lgica inferencial de stas o en la prctica de sus investigaciones.
13 En nuestro lenguaje, como analizarem os m s adelante en el apartado 5 del cap
tulo 3, ste es un problem a de endogeneidad. El prever la cooperacin podra conducir a
que se convocaran reuniones en la cumbre, de modo que no seran estas cum bres las que
explicaran la cooperacin, sino que sta parecera el resultado de tal previsin, lo cual
no sera m uy sorprendente si los actores son racionales!
14 Hay que sealar que el estim ador puede no estar sesgado pero s ser incoherente.
Por ejem plo,
es un estim ador no sesgado de i, pero es incoherente porque no mejora
cuando va dism inuyendo el nmero de unidades (o, en realidad, no cam bia en absoluto).
Un estim ador tam bin puede ser coherente pero estar sesgado. Por ejem plo Y - Sin est
sesgado, pero es coherente porque 5n se convierte en cero a m edida que n se acerca al
infinito.
15 En la segunda lnea de este clculo y en los siguientes presuponem os que no
existe una correlacin espacial entre los distritos.
Captulo 3
1 A la vista de la preferencia que m uestran algunos cientficos sociales por la explica

cin, en vez de por la simple descripcin, no resulta sorprendente que los que estu
dian acontecim ientos com plicados pretendan envolver su trabajo con los atavos de la
jerga explicativa. Tem en que si no lo hacen as se considerar que su trabajo es inferior.
En esencia, una autntica explicacin siem pre se basa en inferencias causales. Creem os
que los argum entos de la bibliografa sobre explicacin no causal tienen una term ino
loga confusa y que, en casi todos los casos, se refieren en realidad a la explicacin cau
sal o carecen de coherencia interna. Si la incapacidad de explicar que tienen los cientfi
cos sociales no se debe a investigaciones dbiles o a una falta de imaginacin sino a la
naturaleza de los difciles pero significativos problem as que estudian, esos sentimientos
de inferioridad no estn justificados. D escribir bien acontecim ientos im portantes es me
jo r que explicar mal cualquier cosa.
2 N uestro punto de partida en este apartado es el artculo de Holland (1986) sobre
causalidad y lo que l denomina modelo de Rubin. Holland se basa en la obra de nu
m erosos autores. En esta materia, la de D onald Rubin (1974, 1978) fue la que tuvo una
relevancia ms inmediata, pero Holland tam bin cita, entre otros, a Aristteles, Locke,
Hum e, M ili, Suppes, G ranger, Fisher y N eym an. Aqu extendem os la definicin de
efecto causal de Holland utilizando algunas ideas, que expresaron claram ente Suppes
(1970) y otros autores, en relacin a la causalidad probabilstica. Esta am pliacin nos
ha parecido necesaria porque ninguno de los enfoques que existen puede definir la cau
salidad en relacin a una sola unidad, perm itiendo, a la vez, que se dividan los efectos
causales en componentes sistemticos y no sistemticos.
3 Para ms informacin sobre este ejem plo, vase G elm an y King (1990). De forma
m s general, I y N pueden representar el grupo de tratam iento y el de control, o
cualquiera de los dos tratam ientos que se han experimentado, de hecho o en teora. E vi
dentem ente, si se utiliza este lenguaje, denom inar, dentro de una variable explicativa, a
un valor tratam iento y al otro control es una decisin completamente arbitraria.
4 Jon Elster (1983, pp. 34-36) ha sealado que existen muchas situaciones, com o en
las que hay un tercer factor que explica tanto la variable aparentem ente explicativa
como la dependiente, en que el significado de la causalidad no puede expresarse me-
laasaa
246
diante enunciados contrafcticos. Segn nuestro lenguaje, E lster no hace m s que

m encionar problem as habituales en las inferencias que, en cierta medida, son siempre
inciertas. Sin embargo, estas dificultades de la inferencia no invalidan una definicin de
causalidad que se base en contrafcticos. A pesar de sus objeciones, Elster reconoce que
este tipo de enunciados tienen un importante papel en el anlisis causal (Elster, 1983,
p. 36); de ah que, para nosotros, su argumento sea m s convincente si se considera
como un conjunto de valiosas advertencias contra la utilizacin descuidada de los con
trafcticos que com o una crtica de su im portancia fundamental para la definicin de
conceptos en el razonamiento causal.
5 Podemos lim itar el sentido de la siguiente ecuacin a esta circunscripcin sustitu
yendo i por 4.
6 Probablem ente, la razn sea que Holland es un estadstico que est muy prximo
a una versin extrema de la variacin aleatoria segn el punto de vista 2 que se ha
descrito en el apartado 6 del captulo 2. Al explicar la solucin estadstica para el pro
blem a de la inferencia causal, se acerca mucho a nuestra definicin de efecto causal,
pero su planteam iento tiene que ver sobre todo con la utilizacin de diferentes unidades
para resolver el problema fundamental, ms que con preservar la definicin de causalidad
en una sola. En concreto, su operador de valor esperado hace una m edia de las unidades,
m ientras que nosotros (com o se describe posteriorm ente) hacemos una media de las re
producciones hipotticas del m ism o experimento en una sola unidad (vase Holland,
1986, p. 947).
7 Como indicamos con ms detalle en el apartado 2 del captulo anterior, esta ex
presin puede llevar a engao. Una variable aleatoria tiene un cierto componente sis
tem tico y, por tanto, no siempre es del todo impredecible. Por desgracia, este lenguaje
tiene un significado especfico en estadstica, y los conceptos que im plica son importan
tes. La razn primordial para utilizar esta terminologa es que la aleatoriedad no significa
que todo vale o que puede pasar cualquier cosa. En realidad, hace referencia a un
proceso probabilstico m uy bien especificado que se extrae de entre los muchos que son
posibles. Por ejemplo, el proceso aleatorio que determina qu cara de una moneda queda
mirando hacia arriba despus de arrojarla al aire es muy diferente al que afecta al cre
cimiento de la burocracia de la Unin Europea o a las inciertas consecuencias polticas
de un cambio en el sistema electoral italiano. La clave de nuestra representacin es que
todos estos procesos aleatorios tienen componentes sistemticos y probabilsticos.
8 Estas m ismas distinciones son objeto de debate. Hay autores que sealan que un
sistema presidencial puede ser ms representativo, y otros, que los regm enes parlam en
tarios son m s decididos.
9 La distincin entre caracterstica sistemtica y no sistemtica no est en absoluto
clara en todas las ocasiones. La repentina enfermedad de un presidente parece un rasgo no
sistemtico del sistema presidencial. Por otra parte, la vulnerabilidad general de este tipo
de ordenamiento ante las fluctuaciones de salud y personalidad de un nico individuo es
un efecto sistemtico que posibilita la aparicin de alguna caracterstica no sistemtica.
10 Con frecuencia, esta idea se explica afirmando que no hay variable explicativa
que sea necesaria o suficiente para que una dependiente tenga un determinado valor. Sin
embargo, sta es una term inologa engaosa porque la distincin entre condiciones ne
cesarias y suficientes desaparece en gran m edida cuando concedemos a las causas la po
sibilidad de ser probabilisticas. Com o explica Little (1991, p. 27): Pensemos en la afir
m acin de que una m ala com unicacin entre las superpotencias durante una crisis
aumenta la posibilidad de guerra. sta es una afirm acin probabilstica, ya que identifi
ca una variable causal (la m ala comunicacin) y sostiene que con ella aumenta la proba
bilidad de que se produzca un determinado resultado (una guerra). Sin embargo, no pue
de convertirse en una afirm acin acerca de las condiciones necesarias y suficientes para
que haya una guerra, por lo que es irreductiblem ente probabilstica.
11 El insistir en la necesidad de diferenciar los componentes sistemticos de los no
sistem ticos en las observaciones que son objeto de inferencia causal refleja nuestra
idea general de que el mundo, al menos tal como lo conocemos, es m s probabilstico
que determinstico. De ahi que tampoco estem os de acuerdo con la premisa de Ragin
(1987, p. 15), segn la cual las explicaciones que surgen de aplicar el mtodo com pa
rado no se conciben de forma probabilstica porque, si es posible, cada uno de los ejem
plos de un fenmeno se examina y explica. Aunque se pudiera hacer una especie de
censo con la informacin de cada uno de los ejem plos de un fenmeno, as com o con
cada permutacin y combinacin de los valores de las variables explicativas, el mundo,
de todas formas, producira esos datos mediante algn proceso probabilstico (tal como
se defini en el apartado 6 del captulo 2). Esto parece invalidar el enfoque del lgebra
booleana de Ragin com o forma general de disear explicaciones tericas o extraer in
ferencias. Para aprender de los datos es necesario utilizar la m ism a lgica de la inferen
cia cientfica que analizamos en este libro. Sin embargo, el enfoque de este autor s pue
de ser valioso como un tipo de teora formal (vase el apartado 5.2 del captulo 3), ya
que posibilita que el investigador concrete una teora y sus consecuencias mucho ms
fcilmente que si se careciera de l.
12 Con el fin de evitar la utilizacin de un trm ino constante, presuponem os que to
das las variables tienen una m edia igual a cero. Esto sim plifica la presentacin, pero no
limita en modo alguno nuestras conclusiones.
13 Se nos podra llam ar (o acusar de!) justificacionistas o incluso justificacionistas probabilsticos (vase Lakatos, 1970), pero si nos han de poner una etiqueta,
preferimos la ms coherente y filosfica de bayesianos (vanse Leamer, 1978; Zellner, 1971; y Bam ett, 1982). De hecho, nuestros objetivos son lo que m s nos diferencia
de Popper. Si el objetivo es concretam ente el suyo, estamos de acuerdo con el procedi
miento; si es el nuestro, quiz l estuviera de acuerdo con nosotros. Sin embargo, cree
m os que nuestros objetivos estn ms cerca de los que se plantean en las ciencias socia
les y tambin de los que es m s probable alcanzar.
14 Como siempre, cuando m odificam os una teora para que concuerde con los datos
que hemos recogido, hay que evaluar dicha teora (o la parte a la que se refieren nues
tros datos) en un contexto diferente o en otro conjunto de datos.
15 O tra formulacin de las ideas de Popper es la de que no es posible demostrar
una negacin. Para este autor, no es posible porque el hecho de que un resultado con
cuerde con la hiptesis puede proceder, sim plem ente, de una com probacin equivocada.
Quien intente demostrar negaciones siempre se encontrar con este problem a. De he
cho, las dificultades no slo sern tericas, sino tam bin profesionales, ya que las revis
tas acadmicas tienden a publicar ms resultados positivos que negativos.
Esto ha llevado a lo que se denomina problem a del archivador, que donde m s cla
ram ente se m anifiesta es en la bibliografa cuantitativa. Supongam os que no existen
pautas en el mundo. De manera que cinco de cada cien comprobaciones a las que se so
m eta cualquiera de ellas se apartarn del 95% que constituye el intervalo de confianza y
que, por tanto, generarn inferencias incorrectas. Si partim os de la base de que las revis
tas acadmicas publican resultados positivos en vez de negativos, slo publicarn ese
5% que es significativo, o sea, nicam ente conclusiones equivocadas, por lo que
nuestros archivadores estarn llenos de artculos que llegan a conclusiones acertadas!

(vase Iyengar y Greenhouse (1988) para una revisin de la bibliografa estadstica que
se ocupa de este problema). De hecho, los investigadores conocen bien estos incentivos
y es probable que tam bin influyan en su trabajo. Aunque el ndice de aceptacin en las
principales publicaciones acadm icas sea m s o menos del 5%, la situacin no es tan
grave, aunque no deja de ser un im portante problem a. D esde nuestro punto de vista, el
problem a del archivador podra solucionarse si todos adoptaran nuestra posicin alter
nativa. Un resultado negativo es tan til como uno positivo; los dos pueden aportar la
misma cantidad de informacin sobre el mundo. Estaremos sobre seguro siem pre que
presentemos nuestras estim aciones y m idam os la incertidumbre.
16
La regla para hacer las m ejores preguntas en una entrevista es casi la m ism a que
se utiliza al explicar: ser lo ms concreto posible. No hay que preguntar a un estadouni
dense blanco y conservador: es usted racista?, sino ms bien le importara que su
hija se casara con un hom bre negro?. No se debe preguntar a la gente si sabe de polti
ca; hay que pedirle que nos diga los nom bres del secretario de Estado y del presidente
de la Cmara de Representantes. En general, y siempre que sea posible, no hay que p e
dir a l entrevistado que nos haga el trabajo. Es m ejor no pedir la estim acin de un efec
to causal; tenem os que preguntar por m edidas de las variables explicativa y dependiente
para hacer la estim acin nosotros. No tenem os que pedir motivaciones, sino hechos.
Esta regla no implica que no haya que preguntarle a alguien por qu hizo tal cosa.
De hecho, preguntar las m otivaciones suele ser muy til para generar hiptesis. Las m o
tivaciones que uno admite tam bin pueden constituir un valioso conjunto de consecuen
cias observables. Sin embargo, hay que interpretar las contestaciones com o una reac
cin del entrevistado a las preguntas del investigador, y no necesariam ente como una
respuesta correcta. Para que las preguntas de este tipo sirvan de algo, hay que disear el
estudio de m anera que una determ inada respuesta obtenida (independientem ente de las
justificaciones, adornos, m entiras o recuerdos selectivos que nos encontremos) sea una
consecuencia observable.
Captulo 4
1 En econom etra y estadstica a la bibliografa sobre la identificacin le interesa de

term inar cundo es impreciso el diseo de investigacin en la investigacin cuantitativa
y cmo se puede corregir el modelo o recoger diferentes tipos de datos para afrontar el
problema. Vanse Hsiao (1983) y K ing (1989, apartado 8.1).
2 Subrayamos de nuevo que no hay que confundir aleatoriedad con azar. En este
contexto, hacer una seleccin aleatoria significa que cada unidad potencial tiene la m is
ma probabilidad de ser seleccionada para nuestra m uestra y que las sucesivas elecciones
son independientes; com o cuando extraem os nombres de un sombrero y despus volve
mos a introducirlos en l. sta es slo la forma ms sim ple de aleatoriedad, pero todas
ellas dependen de procesos probabilsticos.
3 Algunos ejem plos pueden encontrarse en: Roth (1988), Iyengar y K inder (1987),
Fiorina y Plott (1978), Plott y Levine (1978) y Palfrey (1991).
4 El criterio de seleccin (1,1,0) om ite el extremo inferior de la escala (la unidad
baja) y el segundo (0,1,1) prescinde de la unidad que est en el extremo superior (uni
dad alta). Slo el tercer caso, en el que no se selecciona media, no se correlaciona con
la variable dependiente.
5 ste es un buen ejem plo de lo que caracteriza a la ciencia. Cuando introducimos
este sesgo para confirm ar nuestra conclusin, no nos comportam os como tiene que ha
cerlo un cientfico social, sino com o suele ser habitual cuando, al discutir de poltica,
defendemos nuestras profundas convicciones seleccionando con frecuencia ejem plos
que refuerzan nuestros argumentos. Al investigar, si es posible, hay que intentar tener
todas las observaciones. Si se precisa una seleccin, hay que procurar obtener las obser
vaciones que sean esenciales para decidir cul es la pregunta que tiene inters, y no slo
las que concuerdan con nuestra posicin.
6 En este apartado, no contem plam os la posibilidad de que ciertos proyectos de in
vestigacin que se disean para no dejar que cam bie en absoluto la variable dependiente
sean parte de un program a de estudio m ayor y que, por tanto, puedan aportar inform a
cin til sobre las hiptesis causales. Explicam os esta cuestin en el apartado 4 del ca
ptulo 4.
7 Porter afirm a que tiene m uchos ejem plos de pases que no han alcanzado el xito
competitivo; sin embargo, stos entran en su anlisis m ediante una eleccin selectiva de
ancdotas y no se estudian con m todos parecidos a los de sus prim eras diez naciones.
Cuando los ejem plos que corroboran nuestro argumento se extraen de form a no sistem
tica de un infinito abanico de posibilidades que incluye elem entos que nos favorecen y
otros que no, resulta demasiado fcil hacer el ridculo encontrando relaciones que no
existen. No vamos a valorar si las hiptesis de Porter son correctas; slo querem os sea
lar que la informacin necesaria para decidir sobre este punto debe recabarse de m anera
m s sistemtica.
8 En general, el sesgo de seleccin tiene lugar cuando sta se realiza a partir de la
variable dependiente, despus de tener en cuenta (o controlar) las variables explicativas.
Como una de ellas es el mtodo de seleccin, lo controlam os y no introducim os sesgo.
9 La inferencia tam bin ser un poco m enos segura si el abanico de valores de las
variables explicativas se lim ita m ediante la seleccin. V ase el apartado 2 del cap
tulo 6.
10 Dicho de otra form a diferente, si seleccionam os en funcin de las distribuciones
m arginales de la variable dependiente y de las explicativas, podrem os seguir aprendien
do algo sobre su distribucin conjunta al hacer el estudio.
Captulo 5
1 Una excepcin a esta regla se produce cuando los errores sistem ticos positivos anu
lan los negativos, pero es m s correcto definir este caso inusual como un tipo de error
de medida no sistemtico.
2 Este error, independientem ente de que se produzca por nuestra incapacidad de
medir el mundo real con precisin o por la aleatoriedad de la naturaleza, siempre nos
plantear una pregunta filosfica que puede responderse de varias m aneras (apartado 6
del captulo 2). C ualquiera que sea la posicin que aceptemos, la consecuencia ser la
misma.
3 Imaginamos de nuevo que los cuatro crculos blancos representan o bien un gran
nmero de observaciones que coinciden exactam ente con ellos o bien una escasa varia
cin estocstica.
4 Los lectores versados en estadstica reconocern que esto corresponde a la propie
dad de hom ocedasticidad, o varianza constante.
5 Estos supuestos de error implican que el valor esperado de la variable dependiente
observada es igual al esperado para la verdadera variable dependiente:
E (Y ) = E (Y* + U )= E (Y*) + E (U ) = E (Y*) = X
8250
6 Seguimos presuponiendo aqu que cada crculo representa o bien datos en los que
apenas hay variacin estocstica o bien una situacin en la que num erosos puntos coin
ciden en el m ismo lugar. Al igual que en el apartado 1 de este m ismo captulo, el prop
sito de este supuesto es centram os en el problema.
7 Es preciso sealar la diferencia que hay entre los dos casos en los que resulta
aceptable om itir una variable. En el primero, donde la variable omitida no tiene relacin
con la dependiente, no existe sesgo y no perdem os ninguna capacidad de predecir los
valores futuros de esta ltim a variable. En el segundo caso, en el que la variable omitida
no tiene relacin con la independiente pero s con la dependiente, tampoco aparece ses
go en nuestra estim acin de la relacin entre la variable explicativa incluida en el anli
sis y la dependiente, pero s perdem os cierta capacidad de pronosticar con exactitud los
valores futuros de la segunda. Por lo tanto, si el estar ya en el poder no tuviera relacin
con los gastos de la campaa electoral, omitir este factor no sesgara nuestra estimacin de
la relacin que hay entre ese gasto y los votos. Pero si nuestro objetivo fuera pronosti
car, tendram os que representar todas las variaciones sistemticas de la variable depen
diente, y om itir el hecho de estar ya en el poder nos lo impedira, porque estaramos de
ja n d o de lado una im portante v ariable causal. Sin em bargo, aunque a largo plazo
nuestro objetivo fuera explicar el voto de la forma ms completa y sistemtica, podra
resultar difcil confiar en varios efectos causales que estuvieran encuadrados dentro de
un solo estudio. Por lo tanto, quiz necesitramos centram os en un nico efecto causal
(o slo en unos pocos), cualquiera que fuera nuestro objetivo ltimo.
8 Para decirlo de una form a ms precisa, F es la estimacin del coeficiente que se
produce cuando se hace una regresin entre X t y A",.
9 Como esta ecuacin slo es exactamente aplicable cuando hay grandes muestras, en
realidad estamos analizando la coherencia en vez de la falta de sesgo (apartado 7.1 del ca
ptulo 2). Para ser ms exactos, los trminos que aparecen entre parntesis en la ecuacin
(5.2) se desvanecen al dividirlos por n, a medida que este valor se acerca al infinito.
10 M erece la pena considerar lo que supone ocuparse del efecto causal estimado de
los precios del crudo sobre la actitud d la opinin pblica ante la escasez de energa,
controlando a la vez la cantidad de informacin televisiva al respecto. Pensem os en dos
descripciones que son importantes porque posibilitan anlisis y estudios ms profundos de
los procesos causales. En prim er lugar, este efecto estimado slo representa la influen
cia que tiene el elem ento de los precios del crudo que afecta directamente a la actitud de
la opinin pblica ante la escasez de energa, y que es diferente del que influye en la au
diencia de m anera indirecta cuando cambia la informacin televisiva. En resumen, es el
efecto directo que tiene el crudo sobre la opinin pblica y no el indirecto. El efecto to
tal puede encontrarse si no se controla en absoluto la cantidad de informacin televisiva
que hay acerca de la escasez de energa. Este efecto tambin se puede describir como el
que tienen los precios de la energa sobre la variable opinin pblica en relacin a la
escasez de energa si se registran unos niveles fijos de informacin televisiva al respec
to. Como ejemplo de esta posibilidad, imaginem os un experimento en el que control
ramos la informacin que dan las cadenas de televisin sobre la escasez de crudo, m an
teniendo esta variable constante m ientras varan, lgicamente, los precios del petrleo.
Como la cantidad de informacin es constante en este experimento, se controla este fac
tor sin recurrir a ningn otro procedimiento explcito. Aunque no pudiramos llevar a
cabo un experimento, s podram os hacer una estimacin del efecto condicional que tie
nen los precios del crudo sobre lo que piensa la opinin pblica de la escasez de ener
ga. controlando la inform acin televisiva.
11 Adems, podra interesamos nicamente el efecto directo o indirecto de una va

riable o, incluso, qu efecto causal tiene alguna otra en una ecuacin. Si es as, es per
fectamente razonable realizar varios anlisis diferentes con los m ismos datos, siempre
que entendam os las diferencias que hay en la interpretacin.
12 M ilner se enfrent al posible sesgo de la variable omitida, pero su razonamiento
era incorrecto: Al considerar diferentes sectores industriales, en diversos pases, [el di
seo de investigacin] permite que cambien [las variables de control om itidas], a la vez
que muestra que el argumento fundamental sigue teniendo base (1988, p. 15). En reali
dad, la nica manera de mantener constantes las variables de control es impedir real
m ente que varen. Si, mediante otras teoras plausibles, M ilner hubiera detectado la im
portancia de esas variables, habra podido incorporar un conjunto de observaciones que
cambiaban en su variable explicativa clave (grado de dependencia econm ica del pas o
sector industrial respecto al exterior), pero no en esas variables de control.
13 Los cualitativistas a veces s manipulan variables explicativas mediante la obser
vacin participante. Incluso las entrevistas en profundidad pueden ser un tipo de experi
mento si plantean de manera sistemtica diferentes cuestiones o cambian ciertas condi
ciones en diversas entrevistas. De hecho, experim entar puede llegar a ser un problem a
para los que realizan este tipo de entrevistas, ya que quiz se sientan ms cmodos al
aplicar tratamientos experimentales (hacer determinadas preguntas) a ciertas personas
que no han sido seleccionadas de forma aleatoria. Los experimentadores tienen sus pro
pios problemas, y son muchos, pero la endogeneidad no se cuenta entre ellos.
14 Para seguir estrictamente los m todos del captulo 3, habra que llevar a cabo
este experimento varias veces y considerar que la m eda de ellas es el efecto causal m e
dio del tratam iento aplicado. Tambin podra interesarnos la varianza del efecto causal
en este individuo.
Captulo 6
1 Sin embargo, como sealaremos ms adelante, Eckstein parece reconocer la debilidad

de un argumento que, en realidad, no le lleva a refutar la nica observacin, sino a bus
car muchas observaciones.
2 El estudio de sociologa comparada de Bollen, Entw isle y Alderson (1993) de
m uestra que prcticamente todos los libros y artculos que ellos analizaron concedan al
gn papel al azar, incluso aquellos que explcitam ente utilizaban el mtodo de la dife
rencia de Mili.
3 Kahneman, Slovic y Tversky (1982) describen una falacia psicolgica del razona
miento que tiene lugar cuando los decisores sometidos a incertidumbre eligen analogas
que se basan en hechos recientes o disponibles, lo cual hace que sus valoraciones estn
sistemticam ente sesgadas. A este fenmeno lo denominan la heurstica de la disponi
bilidad. Vase tam bin Keane (1988).
4 Las premisas son que E (Y) = X lf} + X3, V(Y) = o2, no existe m ulticolinealidad e
im plcitam ente todas las expectativas dependen de A".
5 Tcnicamente, cr es la varianza de la variable dependiente, que est condicionada
por todas las variables explicativas V(Y | X); V(b{) es el cuadrado del error tpico de la
estimacin del efecto causal de X t; R] es R : calculada a partir de una regresin auxiliar
de X t y de todas las variables de control, y 5", es la varianza muestral de X t.
6 En la bibliografa relativa al mtodo comparado se plantea habitualm ente la con
veniencia de aum entar el nmero de observaciones. Lijphart (1971) insiste de forma es
pecial en este punto.
7 Estamos de acuerdo con lo que seala W illiam Baumol (1990, p. 1715) en rela
cin a la historia econmica: M uchos historiadores econm icos se tienden a s m ismos
una absurda tram pa cuando pretenden explicar com pletam ente una determinada evolu
cin histrica. Quien intente describir las cinco causas principales del punto critico al
que lleg Gran Bretaa a finales del siglo xix o las de la depresin econm ica europea
de 1847 estar embarcndose en una empresa imposible. Las ciencias naturales, a pesar de
sus m uchos avances y conocim iento acum ulado, siguen basndose en gran m edida en
experim entos controlados que, com o tales, se centran en la influencia sim ultnea de una
o varias variables. En realidad, los cientficos buscan derivaciones parciales, ms que
explicaciones globales para fenmenos complejos de la realidad.
8 Tam bin podemos m antener la misma variable dependiente pero cam biando las
explicativas. Sin em bargo, en la m ayora de las situaciones, esta estrategia se utiliza
para evitar el error de medida, utilizndose m edidas m ltiples de la misma variable ex
plicativa subyacente.
9 A veces, los investigadores realizan estudios que se describen como reproduccio
nes de otros anteriores y en los que no se incluyen nuevas observaciones. Fundam en
talm ente, lo que reproducen o intentan reproducir son estudios ajenos, con el fin de
com probar si los resultados se repiten. U n cuantitativista intentar repetir el anlisis
de un estudio anterior utilizando los mismos datos. Un historiador revisar las fuentes
utilizadas por otro historiador. Un etngrafo escuchar las entrevistas grabadas para
com probar si las conclusiones originales eran sensatas. Este tipo de actividad es muy
til porque las pruebas cientficas deben ser reproducibles; sin embargo, no es lo que
planteam os en este apartado, ya que no conlleva la utilizacin de nuevas observaciones.
10 Ciertas fuerzas extem as tam bin favorecieron el fracaso de Allende, pero Kohli
concede ms importancia a las internas.
11 Los cuantitativistas han desarrollado una enorme coleccin de elaboradas tcni
cas estadsticas para analizar datos en los que aparecen las denominadas propiedades de
las series temporales o de la autocorrelacin espacial. N o slo consiguen corregir estos
problem as, sino que han logrado sacar una extraordinaria inform acin de los datos.
Vanse Granger y Newbold (1977), Anselin (1988), Beck (1991) y King (1989, 1991c).
12 La utilizacin de la cultura como variable explicativa en las investigaciones
sociales es objeto de un gran debate, pero no es el tem a de este libro. Slo sealarem os
que las explicaciones de este tipo deben som eterse a las mismas comprobaciones lgi
cas y de m edida que se aplican al resto de las investigaciones.
13 Donald M oon denom ina explicacin de los fundam entos a una versin de este
enfoque o, por utilizar una expresin de otros autores, anlisis de las razones (Moon,
1975).
14 Lo que George y M cKeown denominan explicacin dentro de la observacin
constituye, siguiendo a Eckstein, una estrategia de redefinicin de la unidad de anli
sis, con el fin de aum entar el nmero de observaciones. George y M cKeown (1985,
p. 36) afirm an que en los estudios de caso el comportam iento del sistem a no se resume
en un solo punto de datos, sino en una serie de puntos o de curvas que se van trazando a
travs del tiem po. En nuestra terminologa, que tom am os de Eckstein (1975), este m
todo consiste en aum entar el nm ero de observaciones, ya que una sola observacin se
define como un fenmeno del que slo sealamos e interpretamos una nica medida
en cada variable pertinente.
Bibliografa
Aden, C'hrisloplicr II. (1986): S tatisticaf Anatyxix o f Q uaxi-Exper im ents. Berkeley,

Univcrsity o f California Press,
, y Dimcan Snklal (1989): Rational Dctcrrcncc Thcory and Comparativo Case
Stmltcs. World l'tilUicx 41, nm, 2 (enero), pp. 143-169.
lvnrcz, Wallcr, y Frank Asaro (1990): An Extralerrestrial Impact. S cien tific
Am erican (octubre), pp, 78-84.
Ansclin, Luc (1988): S/?atial E conom etrics: M ethods a n d M odeh. Boston, Kluwer
Acncmic Publisbers.
HnrncU, Vic (19R2): C om parative Stattstical (nference. 2 ed., Nueva York, Wiley.
Uiumol. Wiltiam J. (1990): St. John versus ihe llicksians, or a Thcorist Malgr
Lu?. The Journal o f E conom ic U lera ture 28, nm. 4, pp. i 708-1715.
Ucck. Nalhanicl (1991): Allernative Dynam ic Slruclure. ftriitic a i A nalysis 3,
pp. 51-87.
Hcckcr, I lownrtl S. <196fi): W hosc Slclc Are Wc On7. S o c ia l P rohtem s 14,
pp. 239-247.
, y Charles C. Rogin (1992): What Ix a Case? E xploring the F oundadons o f S o
cio! Itufuirv. Nueva York, Cambridge Univcrsity Press.
Htatney. ( coTrcy (1973): The Causes o f War. Nueva York, Prce Press.
Bollen, Kcnnelh A., Barbara Rntwislc y Arthur S. Alderson (1993): Macrocomparalivc Research M clhods. I:n Jmlilh Blnke (etl.), M acrocotnparaU ve Re~
seatvh Mcthmlx. Palo Alto, Calif. Annunl Revrcws, Ine,
( .im. Bruce. John Pcrcjohn y Morris Fiorinn ( I9R7): The P ersonal Vate: C onxti'
t u t w y S tw ie e and E lectom l mfepetuience. Cambridge, Harvard University Press.
C'nplow, Thcodorc. llow ard M. Bahr, Bruce A. Chadwick y D w ight W. Moover
(1983a): Alt a ith fu l Pcople: C hange andC onlinuH y in M id d leto w n s Religin,
Minncapolis, Univcrsity o f Minnesota Press.
(1 9 8 3 b ); MitUHetown f'am ilies: 'ifiy Years o f C hance titnf Continaiiy. N ueva

York, B an tam B o o k s.
C aro , R obcrt ( I9H 3): The Yearx o f Lyndon Johnson. N ueva Y ork. V inlagc I looks.
C oU icr, D avid (1 9 9 1 ): T h e C o m p a ra tiv o M e th o d : Iwo D e c a d c s !' C h an p c . F.n
D ankw art A . R n sto w y K cim eth Paul (ctls.). Comparan ec Polical Ihu a m ics:
Cilohttl Research Perspectives. N ueva York, I la rp c r C 'ollins
( 1993): The C om parativo M elhod. lirt A da W. F n illc rte d .), l'olitical S n c n ic The
State o f he Discipline. W ashington, D.C., A m erican Politcal Scicncc A ssuciaiion.
C o o k . K arcn Schvvccrs, y M arg are! I.cvi (c d s .) (1 9 9 0 ): The U m ita ofliationtihiy.
C hicag o , U n iv e rsity o f C h ic a g o Press.
C o o m h s, C lyde IL (1 9 6 4 ): A Thearv o / Dula. N ueva Yotk, W iley.
C o o rlillo l, V in ccn l L. (1 9 9 0 ): A V olcanic lru p lio n . Scienti(c A m a n a n (<kHibre), p|). 78 -8 4 .
D ahl. R obcrt (1 9 6 1 ): iVho (oyeras? Detnocracy atiil Power in un A m c u tu n City.
N ew I laven, Yate U n iv ersity Press.
D cssler, D avid (1 9 9 1 ): B ey m id C o rre la tio n s: T o w a id a C a u s a l lh o > iy ni Vy'ar,
International Siutlies {fuarierty 3. m u. 35 (s e p tie m b re ), p|>. A37-.155.
Dcwnkl, William G ., Jcrry C!. Tlmrsby y Richard (!. Andcrson (1986): The Joiunal
o f Moncy, Crcdit and Banking Project. A m erican l im o m ic Kcyicw 76, num. 4
(septiembre), pp. 5H 7-603.
D iam ond, Larry. y M are lr. P la ltn e r (cd s.) (1 9 9 3 ): The (lohal Kcsiagcnce o f f)cmt>cracy. B altim o re , Jo h n s H o p k in s U n iv crsity P ress.
D uncicr, M itch cll (1 9 9 3 ): S lim x Tahlc. C h ic ag o . U n iv crsity o l . In c a lo P ress.
F aslon , D avid ( 19 6 5 ): A System s A n lisis o f Political l.ifc N u ev a York, W iley,
E c k ste in , Ila rry (1 9 6 9 ): A n th o rily R clalio n s a n d G o v c rn m e iita l P e rfo rm a n ce .
Comparativc l'olitical Stialies 2, pp. 2 6 9-325.
()9 7 5 ): C ase S lu d y and T h c o ry in Polilicid S cien ce , I:n I r e d I. t rceitstein y
N clso n W. P o lsby (cd s.). Ilandbook o f Political Science, vo). 1, l'olitical Scien
ce: Scopc a n d Thcory. R ca d in g . M ass.. A d d iso n -W cslcy .
Elster, Jon (1983): Explaining Technical Chance: A Case Stm ly in the PhUosophy
o f Science. N u e v a York. C a m b rid g e IJn iv ersity P ress [cd. c a ste lla n a : // cambio
tecnolgico: investigaciones sobre la racionalidad y la transform acin social.
B arcelo n a: G c d isa , 1992).
F e a ro n , Jam e s D. (1 9 9 1 ): C o u n tc ra c lu a ls a n d lly p o th e s is T c s lin g in P o ltica)
S eicn cc , IVnrltl Politics 4 3 . n m . 2 (en ero ), pp. 169-195.
Fenno, R ichard F. ( I97K ): (lom e Stve. B oston. I.ittle , B row n,
F c rc jo h n , John (1 9 9 3 ): S tru c tu re an d Id eo lo g y : C h an g o in P a rlia m e n t in liarly
S tu a rt E n g lan d . lin Judilli G o ld stc in y R o b crt O. K co liane (cds.). Ideas tmd
Forcign Policy: Deliefs, Institiitions atul Politicat Ctumge. Ithaca. C o rn e ll U n i
v crsiiy Press.
F crguson. Yate II,, y R ich ard W. M an sh ach ( I9KK): The U a stvc {Jnest: Thcory oml
International Politics. C o lo m b ia . U m v crsity o lS o u th C a ro lin a .
F c y n m a n , R ic h a r d P. ( 1 9 6 5 ) : T he ('h a r a c te r o f P h y sic a l l.a w C a m b r id g e .
M ass., M IT P ress [cd. c a ste lla n a: K carcter de la ley (sica. B arcelona: O rbis.
1987],
Fiorina. M orris, y C h a rle s R. Plott (I97K ): ( o m m iite c D rc is m n s im der M ajo n ty
R ule. Anterictat Poltica} Science Itcvie it* 72, m un. 2 (jmiiio). p|>. 575-59K.
I;ishcr, Ronald A. (19 3 5 ): The Design o f Kxfterimeais. N ueva ^'oik. Ila ln e r Pubhshtng.
Fogcl, R ohcrl W tllia m (19 8 9 ): iVithout Cansen! or C o ntra ef Ih e Rise and hall <>f
Am erican Slavery. N ueva Y ork, W. W. N orton.
Fricdrich. Cari J. (1958): Political Philosophy and (he Science o f Politics. Hn Ro

la nd Yotmg (c d ). Appi-oochex lo th e S tu d y o f Politics. Chicago, Univenity o f
Chicago Press.
I mlcnbcrg, Drcw, y Jcnn Timlc (1989): Noncooperalive gatnc theory for industrial organi/.aiion: tm introduclion and overview. Rn Richard Schmalensce y Robert D. Wllim ^ts.). /tdiufhook o f Industrial Orjsanizattan, vt>l. t. Amsterdam, North Holland.
(arlinkcl, M. ( 1964): Studies o f the Routine Grounds o f tiveryday Activities. S o citi! P m h/ents 11, pp. 225-250.
Ccdlcs, Darbara (1990): llo w Ihc Cases Yon Choosc ATccl (he Answers You Get:
Sclcclior Das in Comparativo Politics. /'o /itira l A na/ysis 2. pp. 13 1- 152.
(.ccrtz, Clillord (1973): An In terp reta ro n o f Cultures Nueva York, Basic Books
Jed. castellana: Interpretacin d e las rid tio n s. IW celona: Gedisa. I9RR],
- (19X 3): L o c a l K n o w le d g e: Fact an d L a w in C o m p a ra tiv o P crspeclive. Fn Clif*
lord (c c rl/. (c d .), I.m-iil Knowledge; F urther Exsayx in Intcipretlve A nthm pa logy. N u ev a Y ork. H asrc B o o k s (cd. cnsleH ann: Conocim iento local: ensayos soh iv to h tterpfvtacin d e las culturas, B a rc e lo n a : P n id s, I9 9 4 |.
(ichnan. Andrew. y (ii*ry Ktng (1990): listim ating Incimihcncy Advantnge withmil ilias. A m erican Jo u rn a l n f P olticaI Science 34, m'im. 4 (noviembre),
p p 1 1 4 2 -I I 6 4 .
{ 19'J.t): W hy Are U.S. Prcsidcrttiat F.lection Polis So Variable Whcn the Vote Is
So Ired dable. flritish Jo u rn a l o f P oltica! Science.
Gcorge. Alcxandcr L. (1982): Case Studies and Theory Development. Trabajo
presentado en el segundo sim posio antial sobre el proceso de la informacin en
las organizaciones, Carncgie-M cllon University (octubre), pp. 15-16.
, y Timothy J. McKeown (1985): C ase Studies and Thcories o f Organizalional Decisin Making. A dvancex in Inform ation Processing in Organ2ations 2,
pp. 2 1-58.
, y Richard Sm oke (1974); D eterrence in A m erican Foreign Policy. Nueva York,
Colombia University Press.

Ctigcrcnzcr, Cierd, Zeno Swtjtnk, Theodore Porter. Lorraine Daston. John Beatty y
Lorenz Krugcr (198 9): T he E m p ire o f C hance: flo w P rahahility C hanged
Science a n d Hverytfay Life. Nueva York, Cambridge University Press.
<>ilpm, Rohcrt (19X1): War a n d C hange in World Politics. Nueva York, Cambridge
University Press.
Coldbcrger. Arllmr (1991): A Courxe in Econom etricx. Cambridge, Mass., Harvard
University Press.
Cioldstein. JmJilh, y Roberl O. Keohane (cds.) (1993): deas and Foreign Policy:
Hctieft. h tstitutions a nd Political Change. Uhaca, CorneH University Press.
( oiild, Xtephen J. (1989a): W onderful Life: The Biirgess Shafe and the Nature o f
Ilistan'. Nueva York, Norton [cd. castellana: La vida maravillosa. Barcelona:
Mimtladori, I995|.
- ( 1989b): T h e llo r n o fT r ilo n . N atural Ilix to ty (d ic ie m b re ), pp, 18-27.
( ir.iiijicr, (. W. )., y P. Ncwbold (1977): F orecasting E cnnontic Time Series. Nueva
Yntk, Acadcmic Press.
(ritlick. F.dward V (1967): E ntripes C lstica! Balance n f Pmt'er. Nueva York. Norton.
H all. Ic lc r A. (c d .) (19 8 9 ): The Poltica! Power o f Econom ic deas: Kcynesianism
A entss Nations. P rin cc lo n . P rin c c lo n U n iv e rs ity Press.
Ilalpem , Nina (1993): Stniinisl Political Economy. En Judith Goldstein y Robeit
O. Keohane (cds.) (9 9 3 ), Ideas a n d Foreign Policy: B eliefs . nstitutions and
Paliticol Change. Itliaca, Cornell University Press.
H c rm c n s, F. A. (1 9 4 1 ): Oem ocracy o r Anarchv: A Study o jP r o p o t ttonul Representation. Scmlh B cn d , h u .. U n iv e rsity o f N o lrc l>anc Press.
IfirscJm ian , Alt>crt . (1 9 7 0 ): The S c a rc h fo r P a ra d ig m s a s a llim h a n c c lo U nd c rsln n d in g , World Pofitics 2 2 , n im . 3 (a b ril). p p. 3 2 9 -3 4 3 .
1loT m ann, S tan ley (1 9 6 0 ): C 'ontem poivty Theory in In tern a tio n a l llefations. I ng lc w o o d CliTs, P rc n tic c -lln ll Jctl. c a ste lla n a: Teoras contem porneas sane las
relaciones internacionales. M a d rid : T ccnos. 1979),
H olland , Paul (1 9 8 6 ): S la tis tic s a n d C au sa l In fcrcn c c . Jo u rn a l o f the American
Stafistical A ssociation 8 1 , pp. 9 4 5 -9 6 0 .
H orow ilz, D o n ald (1 9 9 3 ): C o m p a rin g D c m o cratic S y slc m s . I-n l.a r ry D inm nm l y
M arc ). P ln ltn cr fe d s .). The (ilolu/l R esurgente o f f>cnunni< y. Ila llm tirc . Jolins
llo p k in s U n iv e rsity Press.
Jlsia o , C . (19 8 3 ): Id c n lilic a lio n . l-.n / v i (rilc h e s y M ich a c l In irilig u to r (cds.),
vol. I, / landhook o fl-ononietrics. A m slcrd am . N orlh-I lo lla m l.
1 lulh . Paul (19X8): K x tc n d cd D c lc rrc n c c an d lite O u ib rc a k o f W ;ir. ,1 u ru m Po
ltica! Science R vview X2. n m . 2 (ju n io ). p|>, 4 2 3 -4 4 3 .
, y B ru c e R n ssctl (1 9 9 0 ): T c slin g D c lcrrc n cc T h e o ry : R ig o r M a k c s a UilVcrctv
cc . World PoUtics 4 2 , n m . 4 (ju lio ), pp. 4 6 6 -5 0 1 .
in k e lc s, A lcx , y Peler R o ssi ( l >56): N a lio n a l C o m p a riso n s ol O c c u p a lio n a l Prcstig c . Am erican Jo u rn a l o f Soviolngy 6 1. pp. 329*339.
Iyengar, S a ls, y Jo el I). G re c n h o u se (19X 8): S e lc c o n M o d c ls a n d ihe I ile Drawer
P ro b lcm . S iatistica! Science 3 . n m . I (feb rero ), p. 1 0 9 -135.
Iyeng ar. S h a n to , y D o n n ld K in d e r (1 9 8 7 ): News That M ultis. C h ic a g o , U nivcrsily
o f C h ic a g o P ress.
JcT rcys. Ila ro ld (1 9 6 1 ): Theoty o f Pm hahility. O x fo rd . C la rc n d o n Press.
J c rv is, R o b crl (1 9 7 6 ): P en eptio n antl M ispercepiion in Internatinnol Politicx. Princ c lo n , P rin cc lo n U n iv c rsily P ress.
, R ic h ard N cd L e b o w y Jan ic c C iross S lcin (1 9 8 5 ): P sycluilttgy a n d Deterence.
B altim o re , J o h n s 1 lo p k in s U n iv c rsily Press.
J o n e s. C. L. (1 9 8 1 ): Tlie E tuopean M inele: linvironments. Ecotunnies. and (ieopolitics in thc llis lo r v o f liuropc a n d Asia. C a m b rid g e , C a m b r id g e U n iv c rsily
P ress (cd , c a s te lla n a : E i m ilagro europea. M ad rid : A lia n /a , I 9 9 4 .
Jo b n slo n , J. (1 9 8 4 ): Hconometric M ethads. 3.* c d ., N u ev a Y ork, M c irn w Mili [cd.
ca ste lla n a : M todos d e econam etria. B arcelo n a: V ic cn s-V iv e s, 1994).
K a h n c m n n , D a n iel. P a u l S lo v ik y A m o s T v e rs k y (c d s .) (1 9 X 2 ): Judem e? under
U ncrrtainty: H eu ristics a n d Piases. N ueva Y ork. C a m b rid g e U n iv c rs ily Press.
K a tzc n stc in , Peler J. (1 9 8 5 ): Sm till States in World M urkets: Industrial Policy in hnrope. i (haca. C o rn c ll U n iv crsily P re ss [cd. casi el lana: P equeos estadas en m er
cados mundiales: poltica industrial en lim pa. M ad rid : M in is te rio de T rabajo
y S e g u rid a d S o c ia l. I987J.
K canc. M ark T. (I9XX ): A nalgica/ P m hlrm So/ving. C 'h ich cslcr. 1 ,11is llo rw o o d ,
K ennedy, Paul (1 9 8 7 ); The Rise a n d hall o f the (irvat Powcrs. N u e v a York, R and o m M ottse [cd. c a s te lla n a : A uge r cuida de fas grandes potencias. U arcclona:
Plaza y Jan.s, 19971.
K colianc, R obcrt O. (1 9 8 0 ): T h e T h e o ry o f I Icg cn io n ic S la b ilib y and C liangcs m
In lc m a lio n a l r.c o n o m ic R cg im cs, 1 9 67-1977. I;.n O le R. I lo ls ii, R andolph M.
S iv c rso n y A lc x a iu lc r L. e o r g e (c d s .). Changa in the In tcn u itia n n l System.
D ouldcr, W cstv icw P ress.
(19X4): A ftcr ffeg em on y; Cooperatiim iind D isconl in thc li'orhl / nlitical Economy. P rin cc lo n , P rin c c lo n U n iv c rsily Press.
(1988): Intcriiational Instilutions: Two Appronchcs. Internatio na l S tu d ies

(fnarterly 32. p, 379,
( 1989): International Instilutions a n d State t\m v r : Hxsavs in International Reh n o fts Theory, Moulder, Wcstvicw,
- , y Joscpli S. Nyc. Jr. (1977): f t m v r a n d Intenlejw ndence: tVorld P olitics in
Tnmsition. Boston, U tllc, IJrown.
Khong. Yucn lroong (1992): A nalogies at Ba r: Korea, Munich, Oten Bien Phu, and
the Vietnam Decisin* o f 1965. Princcton, Princcton University Press.
King, (ary (|9R 9): U nifying P o ltica l M ethodology: The L iketih oo d T h eo ry o f
Statisticol fnfetvnce. Nueva York, Cambridge University Press.
( IW3>: T h e Methodology o f P res itiene y Kescure li. |{n ( corgc llwnrds III,
Jo h n II. Kcssel y Hcrt A. Rock man (cils.), R cseaivhing the P tvsidency: Vital
(Jutytinn.s. New Appnwchcs. Pittshurgli. Umversity o f Pillshiirgh Press.
(I99ln ): Constitucncy Service and Incumbcncy Advantnge. British Jo u rn a l
n f l\>litical Science 2 1, tunn, I (enero), pp. 1 19-128,
( 199 ib): Siochnstic Varintion: A Com mcnt on L cw is-lcck and Skaleban's
*Tlu- ll-Stpiare. Political A n a lysis 2, pp. 1K5-200.
( 1 9 9 le): O Political Methodology, fh litic id A nalysis 2. pp. 1*30,
Kolili. Atnl (1987): The State a n d Poverty in Indio: The l'olitics o f Reform. Nueva
York, Cambridge University Press.
Kreps, David M. (1990): Corporntc Culture nd r.conomic TUcory. En lam es E.
Alt y Kcnnelh Shcpslc (cds.), Perspectives o n Positive Political Econony. Nueva
York. Cambridge University Press.
I.litio, David IX (IVftfi): H egcm ony a n d C u ltm v: l*olitics a n d R eligious C hange
anum fi the Yoruha. Chicago, University o f Chicago Press.
l.itkiUos. tmrc (1970): FMsiricntion nnd the M ethodology o f Scicntific Rcsenrch
Programs, lin I. I.tknfm y A. M u grave (cds.). {'riticism a n d the (in tw th o f
Kitowlcdxe, Cambridge, Cambridge University Press led. castellana: La critica
r desarrollo d e l conocimiento. Barcelona: Grijalbo-Mondadori, I974J.
Liikcmnn, lnid. y James t). Lambcrt (1955): l'oting in Democracies. Londres, Fabcr and l;nbcr.
Lciimcr. lidward P (1978): S/tecification Searvhes: A d Ilo e Infetvnce Vith N onexp erim etttal Data. Nuevo York, W ilcy [cd. castellana: B squedas d e e s p e c ifi
cacin: inferencia and hoc con datos no experim entales. Uilbao: Editorial Espa
ola Dcsclcc de Brotiwcr, 19831 11983): l.e fs Take Ihc Con Oiit o f Economctrics. Am erican Kconomlc R eview
73, nim. I (marzo), pp. 31-43.
Lev y. Jnek S. (1985); TJieorics o f General Wnr. World f\}fitics 37, nm. 3 (abril),
pp. 344-374,
(Juantilniivc Studies o f Dclerrcnce Success nnd l:niltirc. fin Paul C. Stern,
Uol>crl A.xelnxl, Robert Jcrvis y Roy Radner (cds.), Persfteetives on D eterrence.
Nticvn York. Oxford University Press,
Ijeherson. Stanley (1985): M aking It Count: The (m pw vcm ent ofS<Kal R esearch
atut Theory. Herkclcy, University o f California Press,
- (1992): linstcin. Rcnoir and Crcelcy: Som c Thonghts abonl Evidence in S o
cio! ogy. Am erican S o cio bf(icnl R cview 56 (febrero), pp. 1*15.
I .ijpltnri. Arcml (1971): Compara) i ve Politics and Comparntive Method. A m erican
PolitUal Scietwe Revie\v(5, nm. 3 (septiembre), pp. 6R2-69R.
Limlbcrg. l.eon N., y Stuart A. Chengold (1970): fiu m p e V Would-Re Ptdity: Potte m s o f Change in the E u m pean Commtmify. F.nglcwood CliTs, Prentice-Hall.
5551
(1 9 7 1 ): Regional httegnaion: Thcory and licseaivh. C a m b rid g e . H arvard U m v e rsity Press.

LittZ, Ju an J. (1 9 9 3 ): Tito Pcrils til P rcsid o u tia lism . Ltt L arry D ia m o n d y M arc l\
P lattn cr (cds. J, The (ilohal R esurgente o f Denaicmcy. Il.d tm n w e . Jolius Ifopkins
U n iv ersity P ress, p p. I0K-I2<*.
L ip set. S c y in o u r M a rtin (19631: The H rsl New Nato: The U nited States ti Comparo ti ve and H istrica! I erspeclive, N ueva Y ork. I Inste U ooks.
L iitlc. D aniel (1 9 9 1 ): Utricfiex o f Social Explanation: An Introihution to the Philo.w phy o f Social Science. lU ndder, W cstvew .
L o n g in o . Ite le n . (1 9 9 0 ): Scicncc as Social Knowletlgc; laluc.s a n d Ohjcctivity in
Scicntific bu/uirv. P rin cc lo n , P rin cetn n U n iv e rsity Press.
L o w cn th al. A b ra h a m l:. (19 7 2 ): The Dominica Intcrvention. C am b rid g e . H arvard
U n iv ersity P ress.
M ankivv, N. O rc g o ry (1 9 9 0 ): A Q u iek U e lre sh e r C o n rse in M a c m c c o ito m ie s .
Journal n f ficotiontic Litera ture 2X, nm . 4 (d ic ie m b re ), pp. 1M 5 - lf>>0.
M a rtin . L isa L. (1 9 9 2 ): C aen ve CInopcraiian. P rin c c h m , P r in c c lo n U n v e rs ily
Press.
M erck & Ci>., Inc. (19X 9): Anim ai R epon. Kayway. N ew Jersey. M erck { ( ' lite.,
1989.
M erlo. U obert K. [I 9 'I9 ] (I9(>X): Social Theorv a n d So< iol Strut une. Nuevi Wn k ,
l;ree Press.
M ili, Jo h n S luarl (1 8 4 3 ): A System o f Logic S. e. ed. c a ste lla n a : Sistem a tic ogiva
inductiva y deductiva. M adrid: Jn an Pueyo,
M iller, D avid (I9KX): C o n je cln ral K now lcdj;e: P o p p c rs S n ln iin n o f the ProM em
o f In d n elion . Lti Paul l.ev in so n (c d ,). In P m su it of'Prnth. A lla n lic I li^ h la n d s.
llu n ia n itie s P ress.
M ilner. H elen V. ( I9XK): Hesi.sting Protectionism: (ilo ha l Industries atul the Politics
o f International Tntdc. Prin cclo n , P rin cclo n U n iv ersity P ress.
M oc. T crry M . (1 9 9 0 ): T h e Politics o f Struclurnl C h o ice: T m vatd a T h c o ry o f Public
H urcnucracy. Un O liv er W illiam so n (ed .). (Jrg u ntzution Thcory: 'rom 'hester
Harnuni to the Presen! atul lieyoml. N ueva York. O x fo rd U n iv ersity Press.
M o o n . D orm id J. (1 9 7 5 ): T h e L ogic o f P o litical Inq o iry : A S y n th e s is o fO p p o s c tl
P ersp ectiv es . Hn P red I. G rc e n ste in y N clso n W. Polsby (c d s .). Ihnulhook o f
Political Scicncc, vol. I, Political Science: Scope and Thcory. U cadin^, M ass..
A d d iso n -W cslcy .
N c u stn d t, R ich ard U., y F.arncst K. M ay ( !9Hf>): Thinking in Time: The (fses o fllis to rv /o r Decision-M akers. N ueva York. I r e e P ress.
N ye. Jo se p h S. (1 9 7 1 ): Peaee in Parts. B o sto n , L illle, Urown.
O Jcar, A n tho ny (1 9 8 9 ): Introducta! to the P hosophv o] Scicncc. O xford. C laren d o n Press.
O rd e sh o o k . Pcier C. (19X 6): (ame Thcory and Political Thcory: An huroductum.
N u ev a York. C a m b rid g e U niversity Press.
Palfrcy, T ilom as k . ( c d .H 1991): .ahoraore Researc h in Pf>li/i<a Econotav. A un
A rb o r. IJn iv ersily o f M ichigan Press.
P earso n , K art (1 ^ 9 2 ): The ( rainnutr of 'Scicncc. t.o itd irs . J. M . Dcni A: S o n s . J.id.
PIolI, Ch a r l e s R,. y Mi el i ael 1,. l . cvi ne (197X): A Mo d e l til A f o n d a li t l l ucnce
on C o m m i l t e c Dc ci s i ons . Aniei ican E.canonttc Ue\ /< n >X. mmi 1 I i i mi / h] ,
pp. Mi-IM).
Popper, Karl R. (I9(>S): The Logic of'Scientifir Hisctu-ery. N ueva York, lla r p o an<l
R ow [cd. castellan a: Lgica tic lo investigacin cientfica. M .idtul: Icenos, l')X5[.
(19X2): T h e O p e n U n iv c rs c : A A rp u m c n l fo r In clctcrm in ism . E n W. W. O ar1ley 1(1 ( c d ) , Tin' Posiscripl lo fhe f.otiic >/ S cien tiftc Ifisctnvrv. T oto w n , N. J.,
K uw m an a n d I.iltlc lie ld .
P o rtcr, M ic h a e l E. (1 9 9 0 ): The C o m p eilive A ti van/age o f Norton*. N u e v a Y ork,
I ice P ress )cd . c aste lla n a; Ventaja camfyeiiliva de fax tuiciones. B a rce lo n a : P laza
y Jan es, 1*791).
P rzc w o rsk i. A d a n i, y H c n ry T c u n c <1982): The Logic n f Com parntive S o cia l Inquhy. M a la b a r, F lorida. K ric g c r PtiK Iishing C o m p an y .
P saih as. (i'co rj!c (1 9 6 8 ): E lh n o m c tlio d s n n d P h c n o m c n o ltg y . Soda! Reseanft 35,
pp. 5 0 0 -5 2 0 .
P tilnatn. K oberl I)., co n R o h crt L c o n a rd i y UafTacHa Y. N a n c lli (1993): M aking D e m o e tm y lli> ii: t i v i c T m dithm x in M otlern Italy. P rin c c lo n , P rin cc lo n U n iv e rsily Press.
U ajiit, ( lia rle s ( '. (19X 7): The C om paratise M elhotl: M oving heyand QuaU tative
<nu/ {fu a n iiu itive Stm tegiex. U crk clcy . U n iv c rs ily o f C a lifo rn ia P ress.
Uivors. D o u p la s. y M o rris I* F io rin n (19X 9): C o n slilu e n c y S e rv ic e . R cp u ta lio n , a nd
(he in c iim b c n c y A dvm iaj;c. E n M o rris P. ( orina y D av id U ohdc (c d s .), H om e
SVi /r' m iil W ashington IIUil. A m i Arb<r. U n iv c rsily o f M ich ig an Press.
K d bin sn u , NVilliam S. (1 9 9 0 ): E c o lo g ic a ! C o rre la lio n s a n d thc U clinvior o f In d iv i
du is , A m erican Sociolagicnl R cvirw 15, p p. 3 5 1 -3 5 7 .
R oô w sk i, lo n n ld (19X 7): T ra d c a n d ih c V aricly o f D c m o c ra lic In stifu tio n s . Inteniationa! (h fta n i:u tin n 4 I, n m , 2 (p rim a v e ra ), pp. 20.1-224.
ltisetiau , P a u lin o ( I W d ) : O n e c A g n in tilo th c Fray: hxlcrnnliouM R c tn lio m C o n fionts ilic I lu m a n ilic s . A fillvnium : Jo u rn a l o f h ito nalional Siudie.t 19, n m . I
(p rim a v era), p p . 8 3 -1 1 0 .
lo se n M o n c , S lc v c n l. (19X 3): fh r e c a s d n g P resitleniial Efections. N e w I la v e n ,
Y:ile U n iv c rsily P ress.
R o lh , A Ivh E . (1 9 8 8 ): L a b o ra to ry E x p e rim e n ta l ion in E c o n o m ic s : A M c th o d o lo y ieat O v c rv ic w . TIte E conom ice Journal 9 8 (d ic ie m b re ), pp. 9 7 4 - 1 0 3 1.
U ubin, D o n ald I). (1 9 7 4 ): E s lim a tin g C a u s a l ETccts o f T rca ln ic n ls in R an d o rp iz ed
atuf N o n n u u lo m izcil S tudics. Journal o f Educational l'sychology 66, pp. 6 8 8 -7 0 1 .
(1 9 7 8 ): lla y c s ia n In fcren c c fo r C a u s a l EITccls: T h e R o le o f R an d o m iza tio n ,
The Antuds o fS ta fistic s (>, p p . 3 4 -5 8 .
K u ss e d . H ru c c (1 9 7 8 ) : T h e M a r g in a l U lilily o f In c o m c T ra n s fe rs to th e T h ird
W orld. Internationa! Organ'uation 3 2 . n m . 4 , p p . 9 1 3 -9 2 8 .
Nanday, lq rg y R e v e s (1 9 8 3 ): T h e E lh n o g ra p h ic Paradij>nH s). En John V an M a a ncn (c d .), Q nalitativc M ethodologv. S a p c . le v c rly Mills.
S c h im ip c le r. .lo scp li A . [1 9 3 6 ] ( 1 9 9 1 ) : C a n C a p itn lis m S ttrv iv c ? . En R ic h a rd
S w c d b e r|t (e d .), The E conom ics o f Socio! r>>v a n d Capiiolixm. P rin cc lo n , P rin c e o n U n iv crsily P ress.
S h c p s lc . K en n efh A . (19X 6): In s lilu lto n a l F ju ilih ritim nn d E q u ilib riu m In slrlu tio n s . ln lle r b e r l F. W cisbcrf* (c d .), l'o litic a ! Science: The Science n f ftiliti y . N ueva Y ork. A fjathnn P ress.
S ln v ely , \V P h iH ip s (1 991)): The Croft of P oltico! Research. 3 . ctl , f'n g lc w o o d
( lili*. P ie n iic c -I lall.
S im n . O erbei l A. (I9 K 5 ): H u m a n N a lu re in P o litics: T h e D ialo g u e o f P s y c h o lo g y
w iih P o li eal S c ie n c e . / huerico Polilicol Science Revicw 79. nm . 2 (ju n io ),
pp. 2 9 3 -305.
S k o c p o l. T heda (1 9 7 9 ): States a n d Social Revohttions. C a m b rid g e U niversity P ress.
(19X4): E m crg in g A g e n d a s aiul R ec u rra ! S lra le g ic s in I listo ric a l S w in lo g y .

F.n Thecln S k n c p o l (c d .) . Vision tul M ethod in Iisto rica l Sociolo\\y. N ueva
York, C am b rid g e U n iv e rsity P ress |e d . c aste lla n a: !.<>s eshulos y la \ rcvotnno.
ncx sociales: un estudio conifw nitivo de Francia. R usia y China. M xico: Pondo
de C u ltu ra E c o n m ic a , 1984),
Snydcr, G lcn n II., y Paul D ie sin g (1 9 7 7 ): on/lici ainong Nations: Huriuiininy,, D e
cisin Mafiiitf and System Sln icntre in International l Vises. P rin c c lo n . Imiiccton U n iv ersity Press.
Snydcr. Jac k (19 9 1 ): A fyths o f f '.m/iitv: D om estic Politics and International Antbition. Mitaca. C o rn ell U n iv e rsity P ress.
S obcr. E lliol (19XH): Reconstnictiny, the l asi: l'arsiinony. Fvolution <uul ii/cren<c.
C am b rid g e . M1T P ress.
S up pes. Palrick C. (1 9 7 0 ): /I 1'roballiMic I heory o l a usahty A m sicrila in , N m llillo lln n il.
Taw ncy, R. II. (1935): R eligin tniil the Hise ofC a/nitilisnt. Nucvi York, I la ic im tl,
llra c c & C o.
Tilly, C h a rle s ( c d .) (1 9 7 5 ): The b onnation t>f N ational States in ile \ie rn Enrope.
P rin ccto n , P rin ccto n U n iv e rsiy P ress.
V erba. S id n c y ( l% 7 ) : S o m e l)ilem m is o l Political Research**. Horld l olitics 2<J
(o c tu b re ). pp. 1 1 1-12K.
, K ay L. Se h lobina), lle n r y IVratly y N o rm a n Nic ( I W J ) : H ace, l-'tlinicity. and
Political R eso u rces: P a rlic ip a tio n in th e U nited S ta te s . llritish .h n n n a l of f'nlilia d Science 23. pp. 4 5 3 -4 9 7 .
W all/., K cnneth N. (19 7 9 ): Theory of Internatioiud l'olities. K cading, M ass.. A ddisnnW cslcy.
W chb, F.ugene J., I). T. C a m p b e ll. K. I>. S c h w a rt/. y I.. S c c h ie st ( 19f>6>: ih ia htm sivc M ensures. C h ic a g o . R an d M cN ally.
, y K arl II. W cick (19X3): U tio b lm siv e M easures in O ig a iti/a tio n a l I lieory: A lcmindcD). Un John Van M aancn (cd .), Qualitative Mvthodoloy,) S ag e. Ilevcrly I lilis.
W cbcr. M ax [1 9 0 5 ] (1 9 4 9 ): C ritic a l S lm lic s in th e L o g ic o Ihc C u tlu r.il S c ie n
c es . En M ax W cb cr (c d .). The M ethodohtfiy o f the Socio! Sciences. T raducido
y e d ita d o p o r H dw ard A. S h ils y I le n ry A . Phich. NuCva York, I r c e Press.
W ciner, M y ro n (1 9 9 1 ): The Child a n d the State in India. P rin cc to n , P rin cclon U niv ersity Press.
WcncJt, A lc x a n d c r (1 9 9 2 ): A n a rc h y is W h a t S tates M ak c o f It: T h e Social C onstru c tio n o f Pow er P o litics . International O rânization 64. n m . 2 (p rim avera),
pp. 3 9 1 -4 2 6 .
W o lfin g er. R aytnond. y S tc v e n R o se n sio n e (19X0): iVho li/r.v. N ew ll:iven. Yale
U n iversity Press.
W o ods. Jo h n , y D o n la s W alto n (19X 2): A rgum ent: The l.oîc o f the baftucies.
N uev a Y ork. M cC raw -H ill R y erso n Lid.
Z eld ilch , M o rris Jr. (1 9 7 1 ): I n te lig ib le Com parisonsv. Fn Ivan V atlier (etl ). Cotnp a m tiv e M ethods in S o c io h ^y . IJe rk e ley y Los n g e le s , U n iv ersiy o l C a lifo r
nia P ress.
Z c lln c r, A rn o ld (1 9 7 1 ): A n Introdnction lo Hayesian Inicent e in Fconomctrics.
N uev a Y ork. W ilcy.
(19X 4): Ihtsic Issnes in liconom etrics. C h ic ag o . U n iv ersity ol C h ic a g o Press.
Indice analtico
Achcn. Chrislophcr, 140, 145,255

acontecimientos nicos, estudio de los,
21-22, 5.1-55. 104-5
Altlersou, Arllmr, 2 1 1, 252 n, 2, 255
Alemania Je Wcimar, 201-2
lgebra boulcana, enfoque del, 248 n. 11
alianza. 210
Alvarcz, l.uis, 22
lvarcz. Wallcr, 22, 255
anlisis bivnriante, 184
anlisis contra Tctico, 21, 89*90, 99
10(1.203
anlisis de regresin, 109, 140-42, 178-
7')
anlisis racional, 253 n. 13
Amlcrsoit, Richard, 256
Ansclin, Luc. 253 n. 11. 255
a t ir(acin i los escritos cicnti Ticos, 2728
ren de las relaciones internacionales,
necesidad de describir en el, 55-56
armas nucleares, 158-59
Asaro, Irank, 255
asignacin aleatoria de valores, 105,
126, 2 0 7 -1 1,2 42
asignacin de valores, 105, 125-26,

20 7 .2 4 2
mmenlo de las observaciones, 230-42
Australia. 217
autocorrelacin espacial, 253 n. 11
autocorrelacin, 253 n. 11
Bahr, I lownrd, 255
BarncU, Vic, 248 n. 13, 255
fioumol, William, 253 n. 7 ,2 5 5
Bcatty. John, 257
Bcck, Nathaniel, 253 n. 11,255
Rcckcr, lloward, 255
Blnincy, (icoll'rcy, 255
Bollen. Kcnnclh, 2 11, 252 n. 2. 255
Can, Bruce, 197, 255
Campbell, 1). T., 262
Canad, 2 17
Cnplow, Thcodorc, 37, 255
carnes rojas en Japn. 43
Caro, Robcrt, 47
casos. 63-64. 127-28, 221-25
cmisnlidad asimtrica, 100-1
causalidad mltiple, 98-100
causalidad probabi lis tica, 246 n. 2

causalidad simtrica, 10 0 -1
causalidad, 88-101
Chadwick, llrucc, 255
Chile, 232
ciencia como labor social, 19-20
ciencias naturales, 2)
Cisjordoiia, 67-70, J06
codificacin de entrevistas, 244 n. I 1
codificacin, 168
coherencia inlerna, 107. 112, I 16-18
colincalidad, 227-29
idase tambin multcolincalidad
Collicr, David. 256
com plejidad de los acontecim ientos,
2 0 -2 1 ,5 4 , 104-5
com ponente estocas!ico, 66-74, 91-9.1,
95. 247 n. 9
componente no sistemtico. 66-74, 9193, 95, 247 n. 9
componente sistemtico, 45-46, 55-56,
6 6 -7 4 .9 1 -9 3 .9 5 .2 4 7 n. 9
Vase tambin componente estocas*
tico
comprobacin de nn nico caso, 22,1 -25
V a se tam bin casos; estudios de
caso; observaciones
concisin, 3 0 ,4 0 , 115-16
concretar, 122
consecuencias observables, 39, 52, 107,
120-23, 190-91,236-37
subunidades de las. 234
constantes, seleccin tic, 157*59
control de calidad. 245 n. 12
control, 134, 178. 197,207-18
de lo que se investiga. 2 11 - 1H
y problemas del n pequeo, 207-1 )
C'ook, Karcn. 112, 256
Coornbs, Clyde, 245 . 4, 256
cooperacin entre las superpolencias,
1X9
cooperacin internacional, 15
Courtillot, Vmceiil, 256
creencias religiosas, 217
crisis agudas, 145
cristianismo en Nigeria, 158, 217
cultura, 120, 239
poltica, 203, 239
cumbre sovitica, 72-73

cursos de contabilidad. 14 1-42
Dald, UobcM.256
Dastou, l.onaine, 257
datos, recogida de, 62-63
cuantificucin cu la. 55
directrices para mejorarla. 33-36,
57-58
Habilidad como objetivo. 36
garantizar la fiabilidad en la. 36,
162
nivel de agregacin, 61). I2X
para compensar la variabilidad fun
damental, 227
para mnximizar el control. 216-17
proyectos piloto antes de la. 33
registrar el proceso de. 33-34
reproduccin com o objetivo, 36-37
utilizacin de m odelos formales
para In. 62-(*4, I 16-17
y eficiencia, 227
y el problema del n pequeo, 226-30
datos. uti/Hciu de los, 37-38
al resumir, 64-65
con error de medida. 176-77
descartar. 165, 195
para aumentar el control, 41. 11516. 133, 216-17
para aumentar el nmero de obser
vaciones, 230-32
para comprobar teoras. 24. 30-33,
39-4 1 .5 7 -6 0 . 108-16
para garantizar ta falla de sesgo. 373 8 .7 4 -7 6 , 106. 110
para maximi/.ar la eficien cia. 38.
76-85. 106-7. I I I
delincuencia, 171-73. 176-77
demostracin, 210
descripcin detallada, 48-53. 54
desempleo, consecuencias snbtc la d e
lincuencia, 171-73, 176-77
desfase entre concepto c indicador.
121-22
Dcsslcr, David, 238. 256

detalles de los hechos, 48-5-1
Va.\t tambin in lc ie n c ta
d c s c tip liv a
clclcrnitii.st.-i. punto de vista, 70-71,

224-25. 248 n. 11
Dewald. Willnm, 36, 256
I );iinimd. I .arry. 256
l>iesii>g, )*ml. 2(>2
dinosaurios, extincin de los, 21-22, 53,
236
diseo de investigacin impreciso. 1283 4 .1 5 6
diseo de la investigacin, 24, 28, 12834. 144, 1X5. 226-30. 241
disuasin, teora tic la, 34-35
Ihuteier. M itchcll. 48, 256
Jiaston, IJavid. 124. 256
Kckstcn, Ilarry, 4 8 , 6 3 -6 4, 124, 2222 4 ,2 3 1 .2 5 3 n. 1 4 ,2 5 6
educacin obligatoria en In India, 76
electo causal aleatorio, 91-93
efecto causal roal/ado, 90-92. 95
electo causal, 92-93. 95-96, 99-100
modelo formal del. 108-9
sobreestimarlo, 149
electo renta/ingresos, 184-85
eficiencia. 38. 76-85, 106-7, II i, 16162, 192-96
comparada con el sesgo. 80-85
modelo formal de. 81, 1 11
y error de medida, 170. 227
y recogida le datos, 227, 242
l'instcin. Albert, 17
elecciones presidenciales, 84
lites de la poltica exterior. 135-36
I Isler, Jon. 2 46-47 n. 4. 256
empaparse y hurgar, 48-53. 54
encuestas. 16, 42
en d o g en e id a d . 105. 118. 19 7-2 06 , 241,
24f> n. I 3
com o problema tic la variable om iti

da, 201-2
c o m o p ro d u c to n a tu ra l tic los p ro c e
sos p o ltic o s , 210
m odelo fo rm a l tic. 20K
y e le cc i n tic o b s e rv a c io n e s , 2 0 2 -5
e n fo q u e c o m p a ra ti o, 226
e n fo q u e g lo b a liz a d o r ( in c lu ir lo to d o ),
194
e n tre v istas. 249 n. 16, 252 n. 13
Entwislc, Harbara, 211, 252 n. 2, 255

cquifnaltlnd. 98
error nlcatorio. 66-74, 91-93, 169-78,
180-81, 95
error tic agrupacin, 165
error de medida. 162*78. 180-81
m odelos formales de. 174-75, 178,
180-81
no sistemtico, 169-78. 180-81
sistemtico, 167-69
y los estudios de un solo cnso, 224
error m edio ettadrlteo (EM C), 84*85
errores tic prediccin, 141
escarbar en busca de datos, 185
especificacin, 198
estadsticos, definicin de los, 64-65
estados europeos, 146-47
listados Unidos. 2 17
estimadores. 194
estrategias en cam paas electorales,
I 13-15
estudio de control de caso, 152
estudios de caso cruciales. 222-25
estudios de cnso, utilizacin de, 16, 555 7 .6 3 -6 4 .7 1 -7 2 .7 8 -7 9
cruciales, 221-25
de la Repblica de Wcmar, 201-2
de un solo cnso, 221-25. 253 n. 14
m edidas m ltiples a lo largo det
tiempo. 234
y efectos causales constantes, 104
y hom ogeneidad de las unidades,
104
y m ecanism os causales. 9 6 -9 8 , 238
y sesgo de seleccin, 126
estudios.
efecto sobre la renta, 99-100
en la India, 76
filien >mtcsfante y e! espritu d el capi
talism o, 198
P.uropa del liste. 137-38
Kuropa occidental. 146-47
exclu sin de variables relevantes, 7273, 100, 105. 118. 133-34, 178-93
m odelo formal de, 179-83, 186-87
y asignacin aleatoria de valores,
207
y endogeneidad, 201-2
y esludios de un solo caso. 223-36

y seleccin intencionada, 214-15
explicacin de los fundamentos, 253 n.
13
explicacin dentro de una observacin,
253 n. 14
explicacin, 87-88
falacia ecolgica, 40, 244 n. 12
falsabilidad, 30. 10R-10, 1 )2 -1 6 ,2 4 1
falla de sesgo, mi.vr sesgo
Fearon, James, 256
Fcnno, Richard. 49, 256
Fercjolm, John. 48. 255, 256
Fcrguson. Yalc, 256
fertilizantes, uso de, 158
Fcynman, Richnril 256
Fiorina, Morris, 197. 249 n. 3, 25<r>
Fisher, Ronald, 255. 256, 261
Fogcl, Robcrt. 257
Fricdrich, Cari. 257
Futlcnborg. Drew, 35. 257
fuentes histricas, 146
Garfinkel, II.. 257
Gediles. Barbara, 142, 257
Gccrtz, CliTonL, 4K. 5 0 -5 1, 257
Gclman. Andrew, 113. 246 n. 3, 257
generalizacin. 2 1 -2 2 , 4 6 -4 7 , 5 3 -5 4 ,
5 7 -6 0 ,1 0 4 -5 .2 4 S
Vase tambin inferencia causal; in
ferencia descriptiva
G eorge, Alexamlcr, 56-57. 9 8 , 178,
235. 239.2 53 n. 14,257
Gigcrcnzcr, Geni, 257
Gilpin. Robcrt. 257
Golilbcrgcr, Arthur. 257
Golilslein, Judith, 48, 202, 257
Gould. Stephcn J 2 1. 257
Grangcr. G. W. J., 253 n. 11, 257
Orcenhousc, Jocl, 249 n. 15
guerra. 20
guiar y parpadear. 5 0 -5 1
Gulick. dward, 163.258
I Ic rm c n s, F. A .. 2 0 1. 258
h e u rstic a de la d is p o n ib ilid a d . 252 n. 3
h ip te s is c au sa l. 5 1
h ip te s is, 29
a p licaci n a la reco g id a y a n lisis de
d a lo s. 23. 2 9 -3 0 . 3 9 -4 0 , 5 6 , 576 0 . 1 8 5 .2 0 3 -4 ,2 3 9 - 4 1
c o m p ro b a rla s c o n d a to s, 2 3 , 30-33.
3 9 -4 1 .5 7 -6 0 . 113-16
c o n cisi n c o m o o b je tiv o d e la s, 30
c o nlrol d e las, 4 0 , 115
e sp e c ific id a d c o m o o b je liv o de las.
30
h a ce rla m s re s tric tiv a , 3 1 -3 2 , 241
papel (lo las, 2 0 - 2 1
p royectos p ilo to a i-c o m p ro b a rla s , 33
reg las para c o n stru irla s . 107-24
su falsabilidad. 3 0
u tiliz a c i n d e m o d e lo s fo rm a le s
para e v alu arlas. I[ i-I7 .
y a u m c n lo d e o b s e r v a c io n e s , 2 3 1 .
234
y cm logcncidad. I9X
I lirsc h m a n , A lb crl (> ..2 1 . 2 5 8
h is to ria e c o n m ic a . 253 n. 7
I in flu a n . Sl.m lcy, 258
H u llan d . Paul. 9 3 . 103. 246 n. 2, 247 ii,
6 . 258
homoccdaslicidad, 250 n. 4
'homogeneidad de las unidades. 102-5,
126-27,241
I loover. Dwigtn. 255
llorowitz, Dona Id. 94. 258
Ils ia o .C .,249 n. 1.258
I lulh. laul, 34, 258
id e a s c om o variab le e x p lic ativ a, 2(1.1
id e n tific a c i n . 2 4 9 n. I
id io m a s,
c o n o cim ien to d e . 137
in cc rlid u m h rc . 170. 226-29
e n la in v e s tig a c i n c i e n t f i c a . 19.
93
in fo rm a r d e s u e x is te n c ia , 4 2 , 88,
106.163
hacha, ejemplo del. 17
Hall. Pcter, 202, 258
Halpcrn, Nina, 203-4, 258
in c lu si n de v a ria b le s irre le v a n ie s. 193-
96
m o d elo form al d e . 196
independencia condicional, 102, 105-6,

125-26
ludia, 155-56, 2 1 7 ,2 3 2 , 239
educacin en In. 76
y sii papel en las polticas contra la
pobreza, 155-56
inferencia causal, IR, 2 9 , 42-43, 87124. 126-27
con error de medida, 167
correccin del sesgo en la. 199-200
crilcrios le cvalluicin, 106-7, llt,
IIi
inccrlidiimhrc de la. 226-29
supuestos, 102-7
y esludios de caso, 57
inferencia cicnlffica, 18, 29, 42*43, 87*
t 2 4 , 126
con error de medula, 167-68
correccin del sesgo en In, 199-200
criterios para juzgarlas, 106-7, 111
su incertidumbre, 227-29
supuestos ile la, 102-7
y los estudios de caso, 56
Vase tambin inferencia descripti
va; inferencia,
inJctcncia descriptiva, 18, 26, 29, 45*
57, 64, 66-85
con sesg o de seleccin, 15 1
criterios para evaluarla, 74-85
e interpretacin, 48-53, 54
importancia en la cien cia poltica,
55-56
inferencia, 5 7 -6 0 .2 4 1 -4 2
correccin del sesgo en la, 199-200
de las relacion es sistem ticas, 454 6 ,9 1 - 9 3 ,9 5 , 247 n, 9
eficien cia com o criterio de la, 38,
76-85, 106-7, 161*62
en la investigacin cientfica, IR
la i la de se sg o com o criterio de la,
3K, 74-76. 106-7, 110, 161-62
incerlklimihrc de la, |9 , R8, 93, 106,
1 6 3 .1 7 0
u lili/a ci n to reglas en la. 16-17,
19. 88
Vase tambin inferencia causal; in

ferencia descriptiva
y detalles de los hechos, 48-53,64-66
InVeles, Alex, 157,258
instituciones, erecto de tas, 26
integracin regional, 168
interpretacin, 4 7 ,4 8 -5 3 .5 4
interruptor de la lux, 126
investigacin aplicada, 243 n. 4
investigacin bsica, 243 n. 4
investigacin cualitativa, 15-16, 71-72
c inferencia cnusnl, 94*96
estilo de la, 14
manipulacin de variables explicati
vas. 252 n. 13
problem as en la, 4 2 , 55, 162*63,
241-42
investigacin cuantitativa,
estilo de la, 14
problemas de la, 55, 162-63, 241-42
investigacin prospectiva, 147
investigacin,
carcter social de la, 19-20
com o procedimiento pblico, 18-19
definicin de. 17-20
diseo de la. 23-24, 28-29, 128-34,
144, 185,226-30. 240
importancia esencial del mtodo en
la. 19
incertidumbre. 19, 8 8 ,9 3 , 106
mejorar la teora mediante la, 29*33
retrospectiva, 146-47, 152, 159
ser exp lcito com o objetivo de la,
18*19
sobre acontecim ientos com p lejos,
16*17, 20-23
sobre nconlecimicntos nicos, 20*23
Vase tambin recogida de datos; ge
neralizaciones; investigacin cua
litativa: investigacin cuantitativa;
preguntas de una investigacin
Italia, 16, 236
poltica en, 16, 236
lycngar. Satis, 249 n, 15 cap. 3, 249 n. 3
cap. 4. 258
Jetlreys. Iliirotd. 30, 258
Jervis, Robert, 258
Johnston, J., 258

Jones, E. L., 54, 258
Kahncman, Daniel, 253 n. 3, 258
Katzenstcin. Peler, 213, 25X
Keane. Mark. 253 n. 3, 258
Kennedy, Paul, 259
Keohanc, Robert O.. 48. 202, 257, 259
Khong. Yucn Poong, 225, 259
Kinder, Donald. 249 n. 3, 25X
King. Gary. 42. 61. 113, 140. 200. 245
n. 11, 246 n. 3, 249 it. I. 253 . I I .
257,259
Kohli, Alul. 155-56. 217, 232-33, 259
Krcps, David 25J
Knigcr, Lorenz, 257
Lnititi, David 157-58. 198, 217. 259
Lakntos, Inirc. 22. 24X n. 13. 259
Lakcman, U n id 202. 259
Lambcrt, James. 202, 259
Leamer, Edward, 24X, 259
Lebow. Richard 258
Lconardi, Robert. 261
Levi, Margare!, I 12. 256
Levinc, M ichacl. 249 n. 3
Levy, Jaek, 26, 259-60
Lieberson, Stanley, 29, 40, 100-1, 119,
260
Lijphart, A rend 94. 216. 252 n. 6, 260
Lindb'crg, Len. 168,260
Linz, Juan, 94, 260
Lipsct, Seymour Martin, 2 17, 260
Lilltc, Daniel, 96. 247 n. 10. 260
lgica del anlisis. 16-17, 19, 88. 241
Longino, Hclcn, 260
Lowentfinl. Abraliam, 260
Lynd Robcrt y J lelcn, 37
manchas de tinta, 3 1
Mankiw, N. Grcgory, 28. 260
Mansbach, Richard, 256
Martin, Lisa L.. 15, 260
mximo muestra!, 65
mximo. 65
May, Earnest. 42
McKeown, Timothy, 56-57. 239, 253 n.
14,257
mecanismos causales. 96-9X. 23X

media mi test ral. 65. 77. 92-93
meda. 65. 77. 92-93
inedia, 65, 77, 92-93
medicin de variables, 163-65
medidas con intervalos. l(*3-65
medidas nominales, 163-65
medidas ordinales, 163-66
Merck & (Jo., 260
Mcrlon. Kobert, IX, 124, 200
mtodo histrico. 48-53, 54
I 'i'asc liirn/iiiwi meca nisnii >s causa
les; inl ciencia descriptiva; inves
tigacin cualitativa
mtodo,
de la diferencia. 178
de la similitud. 17X
del compromiso. 144
importancia esencial para la investi
gacin cientfica, IV
Middlelnwn, 37
M ili, Jol 11 Shunt, 98, 144, 178, 252
n. 2. 260
Miller. D avid 112. 260.

Milner. Me Ion. 19091, 260
modelo de avin. {>0-61
modelos formales, 60-64, 219
aplicados a la recogida de calos. 6264, I 16-17
de eficiencia. K l. I I I
de endogeneidad. 208
de ineficieneias de la variable in
cluida, 196
de investigacin cualitativa, 136
de la J al la de sesgo. 77, 107, 110
de iinilticolinealidad, 134. 135
del electo causal medio. 107. UlX-9
del error de medida, 174-75, 178.
180-81
del nmero de unidades. 226-27
del problema del n pequeo, 130.
132, 227-28
del s e s g o de la v a r i a bl e o mi t i d a .
IX2-X3, 186-88
relevancia para la investigacin cua
litativa. 6 I
su utilidad para las teoras. I 16-17
Moc, Terry, 260
moneda y pluma. 119

Moon. l>onaUL48, 253 n. 13. 260
m otivaciones personales para investi
gar. 25
muestren |wr orden alfabtico, (48
Mugabc. Robcrt. 232
m ulticolincalidad, 131, 133-34, 135,
158. 252 n. 4
colincalidad relativa. 227-29
m odelo Cornial de Ja. 134-35
naci onalsocialistas. 2 0 1-2
Nanclli. H a l l a d l a . 261
N cnsladi. Richard, 42. 2 6 0
Ncwb ok l. I*. 2 5 3 . 2 5 7
N igeria. I5X, 217
nota cin m a te m tic a . 6 4 -6 5 . 68*70
Nyc. Jo sc plt, 1 6 8 . 2 5 9 . 2 6 1
O I Icar. Anthony. 113, 261

observaciones equiparables, 106, 212IK .225-26
observaciones ms probables, 223
observaciones menos probables, 223
obser vaciones, (>2-63, 68, 127-28, 221*
25
crear muchas a partir de pocas, 23042
dependencia entre las, 235
y reduccin de la endogeneidad,
202-5
Ordesliook, Pcter, 116, 261
organizaciones internacionales, 63
lalfrcy. T ilo m as . 249 n. 3, 261
/.parecerse n qu?, 216
p a rp a d e a r y guiar, 50-5 I
p a rti c ip a cin volunta ria, 2 0 5 - 6
lear so n. Karl. 19. 261
pers on a e qui para ble , 212
PhiHiicr. M arc. 256
Plotl, C h a r le s, 249 n. 3. 256. 261
poltica c o m p a ra d a , rea de la
i m p o r t a n c i a d e la d e s c r i p c i n e n ,
55-5 6
liipper. Karl. 24. 1 10, I 12-14. 244 n. 5,
245 n. 7. 24H n. 13 y 15, 261
Porter, M ic h a e l. 144-45, 261
lorlcr. Thcodorc. 257

postulado de se n c illez de JefTreysWrincli, 30
postulado de sencillez, 244 n. 7
precios del petrleo. 185
precisar los componentes,
de la variable dependiente. 200
de la variable explicativa, 205-6
preguntas de la investigacin, 24-29
criterios para elegirlas. 25
su contribucin a los escritos cient
ficos, 27-28
y estructuracin de los estudios de
caso. 56-57
problema de tener m is inferencias que
ob servacion es. 129-31. 132, 136,
155. 207. 221-42
m odelo formal del, 132
nmero de observaciones que se ne
cesitan para superarlo, 226-30
y diseo de la investigacin, 226-42
y equiparacin, 216-18
y subunidades, 233-34
y teora de las ciencias sociales, 240
problema de tener mrts parmetros que
unidades, vase problema de tener
mAs inferencias que observaciones
problema del archivador, 248 n. 15
problema del n pequeo, 130, 132, 136,
155-56, 207.221-42
m odelo formal del, 130, 132,227*28
nmero de observaciones necesario
para superarlo, 226-30
y diseo de la investigacin, 226-42
y equiparacin. 216-18
y subunidades. 233-34
y teora de las ciencias sociales, 240
problema fundamental de la inferencia
causal. 90-91. 93. 102, 105, 134.
2 1 2 .2 2 1 -2 3
procedimiento de la coherencia, 56-57.
251 n. 9
pronstico, 25 I n. 7
proteccionismo, 190-93
proyectos piloto. 33
Przeworski. Adnm, 47, 178, 213, 216,
261
Psathas, George, 52, 261
pblico, 66
punto de vista probabilistico, 7(1
Putnnm, Robcrl D., 16, 49, 236, 261
Ragin. Charles. 98. 24K n. I I . 255. 2 6 1
rastreo tic procesos, 97-98, 238-41
razonam iento analgico, 225-26
recogida de dalos. 62-63
cuantilieadn en la, 55
d irectrices para m ejo rarla, 3.1-36.
57-58
fiabilidad como objetivo. 3(>
garantizar la fiabilidad en la. 36,
162
nivel de agregacin. 60. 128
para compensar la variabilidad fun
damental, 227
para maximi/.iir el control, 216-17
proyectos piloto antes tic la, 33
registrar c proceso de, 33-34
reproduccin corno objetivo, 36-37
u tilizacin de m odelos form ales
para la. 62-64. I 16-17
y eficiencia, 227, 242
y el problema del n pequeo. 226-30
rgimen nazi. 201-2
reglas de la inferencia, 16-17. 19. XX
representacin proporcional, I17-IK ,
1 6 4,2 0 0 .2 01 -2
reproduccin, como objetivo de la reco
gida de datos. 36.37
Kcsisfin/ Pm iectionixni, 190-93
resumir Jos dalos, 64-66
estadsticos para. 64*65
reuniones en la cumbre, 189
revoluciones sociales europeas. 139-40
revoluciones. 21
Rivers, Douglas. 261
Robinson, Willinm, 244 n. 12. 2 6 1
Rogowski, Rpnald, 261
Roscnau, Pnuline. 261
Roscnstone. Slevcn, 261, 263
Rossi, Pcter, 157, 258
Roth, Alvin, 249 n, 3. 261
Rubin. Donald. 246 n. 2, 261
Russetl. lrucc, 25H, 261
Ryle, Gilbcrt. 50
sanciones econm icas, 15

sanciones internacionales. 15
Sanday, Pcggy, 262
Schcingold, Stiiart, 16H, 2<>0
Schumpcter, Josepli. 17, 262
Scliwartz, K. I>.. 262
Scchresl, i... 2>2
Segunda (iuerra Mnmlal, 127
seleccin aleatoiia. 105, 126, 242
e investigacin con n pequeo, 136,
155-56, 207
sus limites, 13-1-38
seleccin,
de variables constantes. 157-59
e inferencia descriptiva. 152
en funcin de la variable causal cla
ve. 157-58
en funcin de la variable dependien
te. 139-<t7, 151-5**
en funcin tic la variable indepen
diente. 147-49, 150-59
intencionada, 150-59, 214
y sesjii) ilc la variable omitida. ZM
K'yf.v' Itim hirn seleccin al caln a
ser explcito, com o objetivo de la inves
tigacin cicntifica. 18-19
series temporales, 253 n, I l
sesgo de la variable om itida, 72-73.
100, 1 0 5 ,1 18.134. 178-93
m odelo formal del. 182-83. 186-88
y asignacin aleatoria de valores,
207
y endogeneidad. 201-2
y estudios tic un solo caso, 223-35
y seleccin intencionada. 214-15
sesgo de seleccin, 105, 119. 127. 136-49
e inferencia descriptiva, 152
hacer ajustes para combatirlo, 14244. 146-47
inducido por el mundo. 145-47
y fuentes histricas, 145-47
J'V/.vr in nihirn seleccin aleatoria
sesgo. 38. 74-76. 106-7. 161-62.207
comparado con la eficiencia, K0-X5
ejem plo formal de. 77. I 10
y endogeneidad. 206
y error de medida, 173-78
y sesgo sustancial, 75
Shcpslc, Kenncth, 262

Shivcly, W. Phillips. 2 6 ,2 6 2
Simn. I lerberl, 262
sim p lificacin , 2 0 -2 1 , 4 6 -4 7, 53-55,
57-60, 104-5, 241
.sistemas electorales, sesgo en los, 75
Skoepol. Thcda. 15. 139-40,262
Sloviv, Iaul. 252, 25H
Smoke. Richard, 257
Sttidal, Duncan, 145.255
Nnyder. ( leo. 151. 262
Suydcr, Jack, 262
Sobcr. llliol. 30, 262
Somalia. 157
Slfin, .Ionice. 258
sulnmidatles, 233-34
Suppes, lalrick, 246 n. 2, 262
su pues lo del efecto coiis(mlc. 103-4, 126
Nwilik, 7.cno. 257
Tawncy, R, H., 198, 262
lemas que investigar, 24-29
criterios para elegirlos, 26
su aportacin a los escritos cien tfi
cos, 27-2H
y estructuracin de los estudios de
caso, 56-57
leona de la variable oculta, 224-25, 245
n. 12, 24X n. 11
teora en las ciencias sociales, 29-30
aplicacin a la recogida y anlisis de
datos, 2 3 -2 4 , 29-31, 3 9 , 5 7 -6 0 ,
1X5,240-41
comprobarla con datos, 2 3 -2 4, 3033. 39-41, 5 7 -6 0 ,1 1 2 -1 6
concisin com o objetivo de 1a, 30
control de la, 40. 115
e incremento de observaciones, 231234
especificid ad co m o objetivo de la,
30
Itaccrla ms rcslricliva. 3 1-33 , 241
proyectos piloto al comprobarla, 33
reglas pata elaborarla, 107-24
su ftdsabilidnd, 30-31
su tunein, 21
utilizacin de m odelos form ales
para evaluarla, 1 16-17
y endogeneidad, 19$
teoras causales, 107-8
reglas para construirlas, 107-24
Teunc. Ilenry, 47, 178, 213, 2 16, 261
Tluirshy, Jerry, 256
Tilly, Charles, 146-47,262
Tirle, Jciin, 35, 257
tradiciones m usulm anas en N igeria,
I5X .2I7
Tvcrsky, Amos, 252 n. 3, 258
unidad de la ciencia. 19
unidad de observacin, 62-63, 68, 88X9
y subunidades para mtmcular las ob
servaciones, 233-34
utilizacin de subtinidadcs para aumen
tar las observaciones, 233-34
validez. 35
validez, construir la, 35
valores alpieos, 68
valores esperados, 69
variabilidad fundamental, 70, 224, 2272X. 248 n. 11
variable causal clave. 89
seleccionaren funcin de la, 157
variables aleatorias, 62-63, 6 8-69, 91,
247 n. 7
variables de control, 89
variables tic resullatlo. 89,1 1 8 -2 0
con error de medida. 169-75
precisar sus componentes, 200
seleccionar en funcin de las, 13947. 151-56
su variabilidad fundamental, 227-28
variacin tic las. 139-40,144
variables dependientes, 8 9 ,1 1 8 -2 0
con error de medida, 169*75
precisar sus componentes. 200
seleccionar a partir de las, 139-47,
151-56
su variabilidad fundamental, 227-28
variacin en tas. 139-40, 144
variables explicativas, 89, 133-34
asignacin 1c valores para las, 2 0 7 -11
con error de medida, 169-70, 17378,1X0*81
precisar sus componentes, 205-6

seleccio n a ren funcin to, 147-49,
150-59
variables independientes, 89. 133
con error de medida, 169, I73-7K,
180-81
precisar sus componentes. 205-6
seleccionar en funcin tic las, 14749 ,1 5 0 -6 0
variables rrclevanlcs, 193-96
modelo formnl para las. 1%
variables relevantes, 72-73, 100. 105,
118, 133-34, 178-93
modelo formal de las, 182-83, 186-88
y asignacin aleatoria de valores, 207
y endogeneidad. 201*2
y esludios de un solo caso. 223-36
y seleccin intencionada. 214-15
variables, 62-64, 68, 91. 247 n. 7
variacin aleatoria. 70-71
varianza, 69-70, 92. 227-30
de la variable causal clave, 22X-30
m m
272
de los d e c io s causales. 93, 95-96,
111
ventaja competitiv;. 144
ventaja electoral Id que ya est en el
poder. 89-93
Verba, Siditey, 56. I7K. 205-6. 233. 262
i'tr,\(chcn, 48-49, 52
velo, procedimientos de. 165-66
voto en (Irn Biela a, 66-69
Walton. Donlas, 2'>, 261
W.lt/.. Kennetb. 163. 262
Webb, liigcnc, 262
Weber, Max. 2 1, 198.262
Wciek. Karl, 262
Weiner, Myron, 75. 239. 262
Wendt, Alcxamler, 263
Wolfinger, Kayinoiul, 263
Woods. John. 29. 263
/.clditcli, Morris. 157, 263
/.cllncr. Anm M 30. 248 n. 13. 263
Zimbabtic. 232

Diseño Investiga Social

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Diseño Investiga Social

Enviado por

Direitos autorais:

Formatos disponíveis

Gary King, Robert 0.

Versin de Jess Cullar Menezo

de la traduccin: Jess C ullar M enezo. 2000

Polgono L as M onjas; 28850 T orrejn de A rdoz (M adrid)

L a c ie n cia en las cie n cia s s o c ia le s ..........................................................................

La inrcrcncia: el fin cien tfico de l;i recocida de d a lo s..... .......................

3. Causalidad c inHcrencia ca u sa l..............................................................................

5. Reglas pan elaborar Icorns causales........................... ........................

Regla I : elaborar teoras lalsables...........................................................

4.5 Seleccionar observaciones de manera que la variable dependiente

5. Unlendcr que ilebe evitarse............ ........................................................................

6. A mentar el nmero de ob servacion es................................................................

lliblm grafr.i................................................. .............................. ........................... ............

indico analtico............................................................................................. ......................

t;u este libro se propone un m ism o enfoque para la extraccin de inferen*

M artin. Ilclen M ilncr, G erardo L. M unck. Trnwthy P. N okken, Joseph S.

Cam bridge, Massachusetts

Este libro trata de la investigacin en las ciencias sociales y tiene un objeti

Dos formas de investigar, una sola lgica inferendal

Nuestro principal objetivo es relacionar las tradiciones de lo que se suele de

cho, a veces se consideran enfrentadas. Para nosotros, tales diferencias slo

(1993), Robert D. Putnam y sus colegas entrevistaron a 112 parlamentarios

Adems, nada en nuestro conjunto de reglas implica que tengamos que

Definicin de investigacin cientfica en las ciencias sociales

Nuestra definicin de investigacin cientfica es un ideal al que toda in

gacin, y para ello utilizam os la palabra cientfica como calificativo

E l o b je tiv o es la in fe ren cia

El diseo de la investigacin cientfica tiene com o objetivo la extraccin de inferencias

servaciones y hacen inferencias sobre causas y consecuencias. Si el m todo y la lgica

La inferencia es, por definicin, un proceso im perfecto. Su objetivo es utilizar datos

Para term inar, la investigacin cientfica propugna un conjunto de norm as inferenciales

A su vez, estas cuatro caractersticas tienen otra consecuencia: cuando la

Comprender el carcter social de la ciencia puede resultar liberador, ya que

acontecim ientos y de fuerzas, cuyas causas son independientes entre s,

su desaparicin no se ajusta con propiedad al tipo de acontecimientos que

realizacin de un cuidadoso diseo de investigacin. Si recogemos datos

Principales componentes del diseo de investigacin

Cuando la investigacin social es de calidad, constituye un proceso creativo

Siempre que sea posible, los investigadores deben tambin perfeccionar

Mejorar las preguntas de la investigacin

A lo largo de este libro se plantea qu hacer una vez que identificamos el

cenuw.w^ Mu t nene para la com unidad cientfica una empresa investigadora.

Eligiendo una hiptesis que los estudiosos consideren im portante en la biblio

Eligiendo una hiptesis aceptada en la bibliografa que sospechem os es falsa (o

Intentando resolver o presentando m s pruebas a favor de uno de los bandos en

D iseando investigaciones que arrojen luz o evalen prem isas no cuestionadas

Sealando que en la bibliografa no se ha concedido atencin a un asunto im

Sealando que las teoras o pruebas relativas a cierto objetivo en un cam po po

Si nos preocupamos demasiado por hacer una aportacin a la bibliogra

dremos que preguntam os cmo puede estudiarse con mtodos cientficos

En las ciencias sociales, una teora es una especulacin razonada y precisa

u>-;>ciiiuiiu ue 1a teora suele presentarse como el primer paso de la in

y continuar como si esa m atizacin hubiera demostrado que nuestra teora

para determ inar si nuestras especulaciones son correctas. Este ejercicio

Mejorar la calidad de los datos

m ientos norm alizados de anlisis producir inferencias sesgadas. Slo si

Siempre que se carezca de datos suficientes sobre la disuasin en polti

Nuestra cuarta directriz es: asegurarse de que los mtodos de recogida

as se anim ara tambin a otros a tomar notas de campo ms detalladas. A l

Utilizar mejor los datos existentes

Solucionar los problemas que plantean los datos mediante la recopilacin

Temas de estudio de este volumen

Finalizamos este captulo general sealando los cuatro puntos importantes

La utilizacin de consecuencias observables para vincular