Gary King, Robert O. Keohane, Sidney Verba Designing Social Inquiry 1994

Machine Translated by Google
Projetando a Investigação Social

INFERÊNCIA CIENTÍFICA EM
PESQUISA QUALITATIVA
Gary King
Robert O. Keohane
Sidney Verba
PRINCETON UNIVERSITY PRESS
PRINCETON, NOVA JERSEY

Copyright ÿ 1994 pela Princeton University Press

Publicado pela Princeton University Press, 41 William Street,
Princeton, Nova Jersey 08540
No Reino Unido: Princeton University Press,
Chichester, West Sussex
Todos os direitos reservados
Dados de Catalogação na Publicação da Biblioteca do
Congresso King, Gary.

Projetando a investigação social: inferência científica na
pesquisa qualitativa / Gary King, Robert O. Keohane, Sidney
Verba. pág. cm.
Inclui referências bibliográficas e índice ISBN
0-691-03470-2 (tecido: papel alk.)
ISBN 0-691-03471-0 (pbk.: papel alk.)
1. Ciências sociais—Metodologia. 2. Ciências sociais—
Investigação. 3. Inferência
I. Keohane, Robert Owen.
II. Verba, Sidney. III. Título.
H61.K5437 1994 93-39283 300ÿ.72—
dc20 CIP
Este livro foi composto em Adobe Palatino
Os livros da Princeton University Press são

impressos em papel sem ácido e atendem
às diretrizes de permanência e durabilidade do
Committee on Production Guidelines for Book
Longevity of the Council on Library Resources
Impresso nos Estados Unidos da América
10 9 8 7 6 5 4 3
Terceira impressão, com correções e índice ampliado, 1995

Conteúdo
Prefácio ix
1 A Ciência nas Ciências Sociais 3

1.1 Introdução 3
1.1.1 Dois estilos de pesquisa, uma lógica de inferência 1.1.2 3
Definindo a pesquisa científica em ciências sociais 1.1.3 Ciência 7
e complexidade 1.2 Principais 9
componentes do projeto de pesquisa 1.2.1 Melhorando 12
as questões de pesquisa 1.2.2 Melhorando 14
a teoria 1.2.3 Melhorando a 19
qualidade dos dados 1.2.4 Melhorando 23
o uso dos dados existentes 27
1.3 Temas deste Volume 28
1.3.1 Usando implicações observáveis para conectar teoria e dados

1.3.2 28
Maximizando a alavancagem 29
1.3.3 Relatando a incerteza 1.3.4 31
Pensando como um cientista social: ceticismo e hipóteses
rivais 32
2 Inferência Descritiva 2.1 34
Conhecimento Geral e Fatos Particulares 2.1.1 35
“Interpretação” e Inferência 2.1.2 36

“Singularidade”, Complexidade e Simplificação 2.1.3 Estudos 42
de Caso Comparativos 43
2.2 Inferência: o propósito científico da coleta de dados 2.3 Modelos 46
formais de pesquisa qualitativa 2.4 Um modelo formal de 49

coleta de dados 51
2.5 Resumindo detalhes históricos 2.6 53
Inferência descritiva 2.7 Critérios 55
para julgar inferências descritivas 63
2.7.1 Inferências imparciais 63

2.7.2 Eficiência 66
vi · Conteúdo
3 Causalidade e Inferência Causal 3.1 75
Definindo Causalidade 76
3.1.1 A Definição e um Exemplo Quantitativo 3.1.2 Um 76

Exemplo Qualitativo 82
3.2 Esclarecendo Definições Alternativas de Causalidade 85
3.2.1 “Mecanismos causais” 85

3.2.2 “Causalidade Múltipla” 87
3.2.3 Causalidade “simétrica” e “assimétrica” 3.3 Suposições 89
necessárias para estimar efeitos causais 3.3.1 Homogeneidade de unidade 91
3.3.2 Independência condicional 91

3.4 Critérios para julgar inferências 94
causais 3.5 Regras para construir teorias causais 3.5.1 97
Regra 1: Construir teorias falsificáveis 3.5 .2 Regra 2: 99
Construa teorias que sejam internamente consistentes 100

3.5.3 Regra 3: Selecione as variáveis dependentes cuidadosamente 3.5.4 105
Regra 4: Maximize a concretude 3.5.5 Regra 5: Estabeleça 107
teorias da maneira mais abrangente possível 109
113
4 Determinando o que observar 115
4.1 Projetos de Pesquisa Indeterminados 118
4.1.1 Mais inferências do que observações 4.1.2 119

Multicolinearidade 4.2 Os 122
limites da seleção aleatória 124
4.3 Viés de Seleção 128
4.3.1 Seleção na variável dependente 4.3.2 Seleção 129

na variável explicativa 4.3.3 Outros tipos de viés de 137
seleção 4.4 Seleção intencional de 138
observações 139
4.4.1 Selecionando observações sobre a variável explicativa 4.4.2 140

Selecionando uma faixa de valores causais da variável dependente 4.4.3 141
Selecionando observações sobre variáveis explicativas e
dependentes 4.4.4 142
Selecionando observações para que a variável chave seja constante
4.4.5 146
Selecionando observações para que a variável dependente é
constante 147
4.5 Considerações Finais 149

Conteúdo · vii
5 Entendendo o que evitar 150

5.1 Erro de Medição 151
5.1.1 Erro de medição sistemático 5.1.2 Erro 155

de medição não sistemático 157
5.2 Excluindo Variáveis Relevantes: Viés 168

5.2.1 Medindo o viés de variáveis omitidas 5.2.2 168
Exemplos de viés de variável omitida 5.3 176
Incluindo variáveis irrelevantes: ineficiência 5.4 Endogeneidade 182

185
5.4.1 Corrigindo inferências tendenciosas 187

5.4.2 Analisando a variável dependente 5.4.3 188
Transformando a endogeneidade em um problema de
variável omitida 189
5.4.4 Seleção de observações para evitar endogeneidade 191
5.4.5 Análise da variável explicativa 5.5 193
Atribuição de valores da variável explicativa 5.6 Controle da 196
situação de pesquisa 5.7 Considerações finais 199

206
6 Aumentando o Número de Observações 208
6.1 Projetos de Observação Única para Inferência Causal 209

6.1.1 Estudos de caso “cruciais” 209
6.1.2 Raciocínio por analogia 6.2 212
Quantas observações são suficientes? 213
6.3 Fazendo muitas observações de poucas 6.3.1 217
Mesmas medidas, novas unidades 6.3.2 219

Mesmas unidades, novas medidas 6.3.3 223
Novas medidas, novas unidades 6.4 224
Observações finais 229
Referências 231
Índice 239
Prefácio
NESTE LIVRO desenvolvemos uma abordagem unificada para inferência

descritiva e causal válida em pesquisa qualitativa, onde a medição numérica
é impossível ou indesejável. Argumentamos que a lógica de bons projetos de
pesquisa quantitativa e boa qualitativa não difere fundamentalmente. Nossa
abordagem se aplica igualmente a essas formas aparentemente diferentes
de erudição.
Nosso objetivo ao escrever este livro é encorajar os pesquisadores
qualitativos a levar a sério a inferência científica e a incorporá-la em seu
trabalho. Esperamos que nossa lógica unificada de inferência, e nossa
tentativa de demonstrar que essa lógica unificada pode ser útil para
pesquisadores qualitativos, ajude a melhorar o trabalho em nossa disciplina e
talvez também auxilie a pesquisa em outras ciências sociais. Assim,
esperamos que este livro seja lido e considerado criticamente por cientistas
políticos e outros cientistas sociais de todas as persuasões e estágios de
carreira - de pesquisadores de campo qualitativos a analistas estatísticos, de
alunos avançados de graduação e alunos do primeiro ano de pós-graduação
a acadêmicos seniores. Usamos alguma notação matemática porque é
especialmente útil para esclarecer conceitos em métodos qualitativos; no
entanto, não assumimos nenhum conhecimento prévio de matemática ou
estatística, e a maior parte da notação pode ser ignorada sem perda de continuidade.
Os administradores universitários costumam falar da complementaridade
entre ensino e pesquisa. De fato, o ensino e a pesquisa são quase
coincidentes, pois ambos implicam a aquisição de novos conhecimentos e
sua comunicação a outros, embora de formas ligeiramente diferentes. Este
livro testa a natureza síncrona dessas atividades. Desde 1989, trabalhamos
neste livro e ministramos juntos o seminário de pós-graduação “Métodos
qualitativos em ciências sociais” no Departamento de Governo da
Universidade de Harvard. O seminário foi muito animado e muitas vezes se
espalhou pelos corredores e pelas páginas de longos memorandos trocados
entre nós e nossos alunos. Nossas batalhas intelectuais sempre foram
amistosas, mas nossas regras de engajamento significavam que "concordar
em discordar" e transigir eram crimes graves. Se um de nós não estava
verdadeiramente convencido de um ponto, assumimos como nossa obrigação
continuar o debate. No final, cada um de nós aprendeu muito sobre pesquisa
qualitativa e quantitativa uns com os outros e com nossos alunos e mudamos
muitas de nossas posições iniciais. Além de seus objetivos principais, este
livro é uma declaração de nossa posição unânime, duramente conquistada,
sobre a inferência científica na pesquisa qualitativa.
x · Prefácio
Concluímos a primeira versão deste livro em 1991 e a revisamos

extensivamente desde então. Gary King foi o primeiro a sugerir que
escrevêssemos este livro, rascunhou as primeiras versões da maioria dos
capítulos e liderou o longo processo de revisão. No entanto, o livro foi reescrito
tão extensivamente por Robert Keohane e Sidney Verba, bem como por Gary
King, que seria impossível para nós identificar a autoria de muitas passagens
e seções de forma confiável.
Durante esse longo processo, distribuímos rascunhos a colegas nos
Estados Unidos e somos gratos a eles pela extraordinária generosidade de
seus comentários. Também somos gratos aos alunos de pós-graduação que
tiveram acesso a este manuscrito tanto em Harvard quanto em outras
universidades e cujas reações foram importantes para nós ao fazermos
revisões. Tentar listar todos os indivíduos que foram úteis em um projeto
como este é notoriamente perigoso (estimamos a probabilidade de omitir
inadvertidamente alguém cujos comentários foram importantes para nós em
0,92). Gostaríamos de agradecer às seguintes pessoas: Christopher H.
Achen, John Aldrich, Hayward Alker, Robert H. Bates, James Battista,
Nathaniel Beck, Nancy Burns, Michael Cobb, David Collier, Gary Cox, Michael
C. Desch, David Dessler, Jorge Domínguez, George Downs, Mitchell Duneier,
Matthew Evangelista, John Ferejohn, Andrew Gelman, Alexander George,
Joshua Goldstein, Andrew Green, David Green, Robin Hanna, Michael Hiscox,
James E.
Jones, Sr., Miles Kahler, Elizabeth King, Alexander Kozhemiakin, Stephen D.
Krasner, Herbert Kritzer, James Kuklinski, Nathan Lane, Peter Lange, Tony
Lavelle, Judy Layzer, Jack S. Levy, Daniel Little, Sean Lynn-Jones , Lisa L.
Martin, Helen Milner, Gerardo L. Munck, Timothy P. Nokken, Joseph S. Nye,
Charles Ragin, Swarna Rajagopalan, Sha mara Shantu Riley, David Rocke,
David Rohde, Frances Rosenbluth, David Schwieder, Collins G. Shackelford
Jr., Kenneth Shepsle, Daniel Walsh, Carolyn Warner, Steve Aviv Yetiv, Mary
Zerbinos e Mi chael Zürn. Agradecemos a Steve Voss pela preparação do
índice e à equipe da Princeton University Press, Walter Lippin Scott, Malcolm
DeBevoise, Peter Dougherty e Alessandra Bocco. Nossos agradecimentos
também vão para a National Science Foundation pela bolsa de pesquisa
SBR-9223637 para Gary King. Robert O. Keohane agradece à John Simon
Guggenheim Memorial Foundation pela bolsa durante a qual o trabalho neste
livro foi concluído.
Nós (em várias permutações e combinações) também fomos extremamente

afortunados por termos tido a oportunidade de apresentar versões anteriores
deste livro em seminários e painéis nas reuniões da Associação de Ciência
Política do Centro-Oeste (Chicago, 2–6 de abril de 1990), a Metodologia
Política Reuniões de grupo (Duke University, 18–20 de julho de 1990), o American
Prefácio · xi
Encontros da Political Science Association (Washington, DC, 29 de agosto

a 1º de setembro de 1991), o Seminário de Metodologia e Filosofia das
Ciências Sociais (Harvard University, Center for International Af fairs, 25
de setembro de 1992), o Colloquium Series of the Interdisci plinary
Consortium for Statistical Applications (Indiana University, 4 de dezembro
de 1991), a série de seminários do Institute for Global Cooperation and
Change (Universidade da Califórnia, Berkeley, 15 de janeiro de 1993) e a
University of Illinois, Urbana-Champaign (18 de março de 1993).
Gary King
Robert O. Keohanne
Sidney Verba
Cambridge, Massachusetts

CAPÍTULO 1
A Ciência nas Ciências Sociais
1.1 INTRODUÇÃO
ESTE LIVRO é sobre a pesquisa nas ciências sociais. Nosso objetivo é

prático: projetar pesquisas que produzirão inferências válidas sobre a vida
social e política. Nós nos concentramos na ciência política, mas nosso
argumento se aplica a outras disciplinas, como sociologia, antropologia,
história, economia e psicologia, e a áreas não disciplinares de estudo, como
evidências legais, pesquisa educacional e raciocínio clínico.
Este não é um trabalho de filosofia das ciências sociais nem um guia para
tarefas específicas de pesquisa, como o planejamento de pesquisas, a
condução de trabalhos de campo ou a análise de dados estatísticos. Em
vez disso, este é um livro sobre design de pesquisa: como fazer perguntas
e modelar pesquisas acadêmicas para fazer inferências descritivas e
causais válidas. Como tal, ocupa um meio-termo entre os debates filosóficos
abstratos e as técnicas práticas do pesquisador e se concentra na lógica
essencial subjacente a toda pesquisa científica social.
1.1.1 Dois estilos de pesquisa, uma lógica de

inferência Nosso principal objetivo é conectar as tradições do que se
convencionou chamar de pesquisa “quantitativa” e “qualitativa”, aplicando
uma lógica unificada de inferência a ambas. As duas tradições parecem
bem diferentes; na verdade, eles às vezes parecem estar em guerra. Nossa
visão é que essas diferenças são principalmente de estilo e técnica
específica. A mesma lógica subjacente fornece a estrutura para cada abordagem de pesquisa.
Essa lógica tende a ser explicada e formalizada claramente nas discussões
dos métodos de pesquisa quantitativa. Mas a mesma lógica de inferência
está por trás da melhor pesquisa qualitativa, e todos os pesquisadores
qualitativos e quantitativos se beneficiariam de uma atenção mais explícita
a essa lógica ao planejar a pesquisa.
Os estilos de pesquisa quantitativa e qualitativa são muito diferentes.
A pesquisa quantitativa usa números e métodos estatísticos. Tende a se
basear em medições numéricas de aspectos específicos de fenômenos;
abstrai de instâncias particulares para buscar uma descrição geral ou para
testar hipóteses causais; busca medições e análises facilmente replicáveis
por outros pesquisadores.
4 · A Ciência nas Ciências Sociais
A pesquisa qualitativa, em contraste, abrange uma ampla gama de

abordagens, mas, por definição, nenhuma dessas abordagens se baseia em
medições numéricas. Tal trabalho tende a se concentrar em um ou em um
pequeno número de casos, a usar entrevistas intensivas ou análises profundas
de materiais históricos, a ser discursivo no método e a se preocupar com um
relato completo ou abrangente de algum evento ou unidade. Embora tenham
um pequeno número de casos, os pesquisadores qualitativos geralmente
extraem enormes quantidades de informações de seus estudos. Às vezes, esse
tipo de trabalho nas ciências sociais está vinculado a estudos de área ou de
caso em que o foco está em um determinado evento, decisão, instituição, local,
questão ou legislação. Como também é o caso da pesquisa quantitativa, o
exemplo costuma ser importante por si só: uma grande mudança em uma
nação, uma eleição, uma decisão importante ou uma crise mundial. Por que o
regime da Alemanha Oriental entrou em colapso tão repentinamente em 1989?
De maneira mais geral, por que quase todos os regimes comunistas do Leste
Europeu ruíram em 1989? Às vezes, mas certamente nem sempre, o evento
pode ser escolhido como exemplar de um determinado tipo de evento, como
uma revolução política ou a decisão de uma determinada comunidade de rejeitar
um depósito de lixo. Às vezes, esse tipo de trabalho está vinculado a estudos
de área em que o foco é a história e a cultura de uma parte específica do
mundo. O local ou evento específico é analisado de perto e em todos os detalhes.
Por várias décadas, os cientistas políticos têm debatido os méritos dos

estudos de caso versus estudos estatísticos, estudos de área versus estudos
comparativos e estudos “científicos” da política usando métodos quantitativos
versus investigações “históricas” baseadas em rica compreensão textual e
contextual. Alguns pesquisadores quantitativos acreditam que a análise
estatística sistemática é o único caminho para a verdade nas ciências sociais.
Os defensores da pesquisa qualitativa discordam veementemente. Essa
diferença de opinião leva a um debate animado; mas, infelizmente, também
bifurca as ciências sociais em um ramo quantitativo-sistemático-generalizante
e um ramo qualitativo-humanístico-discursivo. À medida que o primeiro se torna
cada vez mais sofisticado na análise de dados estatísticos (e seu trabalho se
torna menos compreensível para aqueles que não estudaram as técnicas), o
segundo se torna cada vez mais convencido da irrelevância de tais análises
para os aparentemente não replicáveis. e eventos não generalizáveis nos quais
seus praticantes estão interessados.
Um dos principais objetivos deste livro é mostrar que as diferenças entre as

tradições quantitativa e qualitativa são apenas estilísticas e são metodológica e
substancialmente sem importância. Toda boa pesquisa pode ser entendida - na
verdade, é melhor compreendida - como derivada da mesma lógica subjacente
de inferência. Tanto quantitativo como qualitativo
Introdução · 5
a pesquisa pode ser sistemática e científica. A pesquisa histórica pode ser

alítica, buscando avaliar explicações alternativas por meio de um processo de
inferência causal válida. A história, ou sociologia histórica, não é incompatível
com a ciência social (Skocpol 1984: 374-86).
Quebrar essas barreiras requer que comecemos questionando o próprio
conceito de pesquisa “qualitativa”. Usamos o termo em nosso título para
sinalizar nosso assunto, não para sugerir que a pesquisa “qualitativa” seja
fundamentalmente diferente da pesquisa “quantitativa”, exceto no estilo.
A maioria das pesquisas não se encaixa claramente em uma categoria ou

outra. O melhor geralmente combina características de cada um. No mesmo
projeto de pesquisa, podem ser coletados alguns dados passíveis de análise
estatística, enquanto outras informações igualmente significativas não o são.
Padrões e tendências de comportamento social, político ou econômico são
mais facilmente submetidos à análise quantitativa do que o fluxo de ideias
entre as pessoas ou a diferença feita por uma liderança individual excepcional.
Se quisermos entender o mundo social em rápida mudança, precisaremos
incluir informações que não podem ser facilmente quantificadas, bem como aquelas que podem.
Além disso, toda ciência social requer comparação, o que implica julgamentos
sobre quais fenômenos são “mais” ou “menos” semelhantes em grau (isto é,
diferenças quantitativas) ou em espécie (isto é, diferenças qualitativas).
Dois excelentes estudos recentes exemplificam esse ponto. Em Coercive
Cooperation (1992), Lisa L. Martin procurou explicar o grau de cooperação
internacional em sanções econômicas analisando quantitativamente noventa e
nove casos de tentativas de sanções econômicas na era pós-Segunda Guerra
Mundial. Embora essa análise quantitativa tenha gerado muitas informações
valiosas, certas inferências causais sugeridas pelos dados eram ambíguas;
portanto, Martin realizou seis estudos de caso detalhados de episódios de
sanções em uma tentativa de reunir mais evidências relevantes para sua
inferência causal. Para Making Democracy Work (1993), Robert D. Putnam e
seus colegas entrevistaram 112 conselheiros regionais italianos em 1970, 194
em 1976 e 234 em 1981–1982, e 115 líderes comunitários em 1976 e 118 em
1981–1982. Eles também enviaram um questionário por correio para mais de
500 líderes comunitários em todo o país em 1983. Quatro pesquisas de massa
em todo o país foram realizadas especialmente para este estudo. Não
obstante, entre 1976 e 1989, Putnam e seus colegas conduziram estudos de
caso detalhados da política de seis regiões. Buscando satisfazer o “teste
traumático interocular”, os investigadores “obtiveram um conhecimento íntimo
das manobras políticas internas e das personalidades que animaram a política
regional nas últimas duas décadas” (Putnam 1993:190).
As lições desses esforços devem ser claras: nem a pesquisa quantitativa

nem a qualitativa são superiores às outras, independentemente da pesquisa
problema sendo abordado. Uma vez que muitos assuntos de interesse para os
cientistas sociais não podem ser significativamente formulados de forma a
permitir testes estatísticos de hipóteses com dados quantitativos, não desejamos
encorajar o uso exclusivo de técnicas quantitativas. Não estamos tentando tirar
todos os cientistas sociais da biblioteca e colocá-los no centro de computação, ou
substituir conversas idiossincráticas por entrevistas estruturadas. Em vez disso,
argumentamos que a pesquisa não estatística produzirá resultados mais confiáveis
se os pesquisadores prestarem atenção às regras da inferência científica —
regras que às vezes são mais claramente definidas no estilo da pesquisa
quantitativa. Métodos estatísticos precisamente definidos que sustentam a
pesquisa quantitativa representam modelos formais abstratos aplicáveis a todos
os tipos de pesquisa, mesmo aquela para a qual as variáveis não podem ser
medidas quantitativamente. A natureza muito abstrata e até irrealista dos modelos
estatísticos é o que faz as regras de inferência brilharem tão claramente.
As regras de inferência que discutimos não são relevantes para todas as

questões importantes para os cientistas sociais. Muitas das questões mais
importantes relativas à vida política – sobre conceitos como agência, obrigação,
legitimidade, cidadania, soberania e a relação adequada entre as sociedades
nacionais e a política internacional – são filosóficas e não empíricas. Mas as
regras são relevantes para todas as pesquisas em que o objetivo é aprender fatos
sobre o mundo real. De fato, a característica distintiva que separa a ciência social
da observação casual é que a ciência social procura chegar a inferências válidas
pelo uso sistemático de procedimentos de investigação bem estabelecidos. Nosso
foco aqui na pesquisa empírica significa que evitamos muitas questões na filosofia
da ciência social, bem como controvérsias sobre o papel do pós-modernismo, a
natureza e existência da verdade, relativismo e assuntos relacionados. Assumimos
que é possível ter algum conhecimento do mundo externo, mas que tal
conhecimento é sempre incerto.
Além disso, nada em nosso conjunto de regras implica que devemos executar
o experimento perfeito (se tal coisa existisse) ou coletar todos os dados relevantes
antes de podermos fazer inferências científicas sociais válidas. Vale a pena
estudar um tópico importante, mesmo que haja pouca informação disponível.
O resultado da aplicação de qualquer projeto de pesquisa nessa situação serão
conclusões relativamente incertas, mas contanto que relatemos honestamente
nossa incerteza, esse tipo de estudo pode ser muito útil. A informação limitada é
muitas vezes uma característica necessária da investigação social. Como o
mundo social muda rapidamente, as análises que nos ajudam a entender essas
mudanças exigem que as descrevamos e procuremos entendê-las
contemporaneamente, mesmo quando a incerteza sobre nossas conclusões é
alta. A urgência de um problema pode ser tão grande que os dados coletados
pelos métodos científicos mais úteis podem se tornar obsoletos antes que possam
ser acumulados. Se uma pessoa perturbada está correndo em nossa direção brandindo um machado, administre
Introdução · 7
responder a um questionário de cinco páginas sobre psicopatia pode não ser

a melhor estratégia. Joseph Schumpeter certa vez citou Albert Einstein, que
disse “até onde nossas proposições são certas, elas não dizem nada sobre a
realidade, e até onde elas dizem algo sobre a realidade, elas não são
certas” (Schumpeter [1936] 1991:298 –99). Ainda que a certeza seja inatingível,
podemos melhorar a confiabilidade, validade, certeza e honestidade de nossas
conclusões prestando atenção às regras de inferência científica. A ciência
social que adotamos procura fazer inferências descritivas e causais sobre o
mundo. Aqueles que não compartilham as suposições de cognoscibilidade
parcial e imperfeita e a aspiração por compreensão descritiva e causal terão
que procurar inspiração em outro lugar ou batalhas paradigmáticas nas quais
se engajar.
Em suma, não fornecemos receitas para pesquisas empíricas científicas.
Oferecemos uma série de preceitos e regras, mas estes são destinados a
disciplinar o pensamento, não sufocá-lo. Tanto na pesquisa quantitativa quanto
na qualitativa, nos envolvemos na aplicação imperfeita de padrões teóricos de
inferência a projetos de pesquisa e dados empíricos inerentemente imperfeitos.
Quaisquer regras significativas admitem exceções, mas podemos pedir que as
exceções sejam justificadas explicitamente, que suas implicações para a
confiabilidade da pesquisa sejam avaliadas e que a incerteza das conclusões
seja relatada. Não buscamos dogmas, mas pensamento disciplinado.
1.1.2 Definindo a pesquisa científica nas ciências sociais
Nossa definição de “pesquisa científica” é um ideal do qual qualquer pesquisa

quantitativa ou qualitativa real, mesmo a mais cuidadosa, é apenas uma
aproximação. No entanto, precisamos de uma definição de boa pesquisa, para
a qual usamos a palavra “científico” como nosso descritor.1 Essa palavra vem
com muitas conotações que são injustificadas ou inapropriadas ou totalmente
incendiárias para alguns pesquisadores qualitativos. Portanto, fornecemos uma
definição explícita aqui. Como deve ficar claro, não consideramos a pesquisa
quantitativa mais científica do que a pesquisa qualitativa.
A boa pesquisa, isto é, a pesquisa científica, pode ter um estilo quantitativo
ou qualitativo. No design, no entanto, a pesquisa científica tem as seguintes
quatro características:
1. O objetivo é a inferência. A pesquisa científica é projetada para fazer inferências

descritivas ou explicativas com base em informações empíricas sobre o mundo.
Descrições cuidadosas de fenômenos específicos são muitas vezes indispensáveis
1 Rejeitamos o conceito, ou pelo menos a palavra, “quase-experimento”. Ou um projeto de

pesquisa envolve o controle do investigador sobre as observações e valores das principais
variáveis causais (caso em que é um experimento) ou não (caso em que é uma pesquisa não
experimental). Tanto a pesquisa experimental quanto a não experimental têm suas vantagens
e desvantagens; um não é melhor em todas as situações de pesquisa do que o outro.
capaz de pesquisa científica, mas o acúmulo de fatos por si só não é suficiente. Os

fatos podem ser coletados (por pesquisadores qualitativos ou quantitativos) mais ou
menos sistematicamente, e o primeiro é obviamente melhor que o último, mas nossa
definição particular de ciência requer o passo adicional de tentar inferir além dos
dados imediatos para algo mais amplo que não é observado diretamente. Esse algo
pode envolver inferência descritiva – usando observações do mundo para aprender
sobre outros fatos não observados. Ou que algo pode envolver inferência causal –
aprender sobre efeitos causais a partir dos dados observados. O domínio da
inferência pode ser restrito no espaço e no tempo – comportamento eleitoral nas
eleições americanas desde 1960, movimentos sociais na Europa Oriental desde
1989 – ou pode ser extenso – comportamento humano desde a invenção da
agricultura. Em ambos os casos, a principal marca distintiva da pesquisa científica é
o objetivo de fazer inferências que vão além das observações particulares coletadas.
2. Os procedimentos são públicos. A pesquisa científica usa métodos explícitos,

codificados e públicos para gerar e analisar dados cuja confiabilidade pode,
portanto, ser avaliada. Muita pesquisa social no estilo qualitativo segue menos
regras precisas de procedimento de pesquisa ou de inferência. Como Robert K.
Merton ([1949] 1968:71-72) afirmou: “A análise sociológica de dados qualitativos
geralmente reside em um mundo privado de insights penetrantes, mas insondáveis,
e entendimentos inefáveis. . . . [No entanto,] ciência. . . é público, não privado”. A
afirmação de Merton não é verdadeira para todos os pesquisadores qualitativos (e
infelizmente ainda é verdadeira para alguns analistas quantitativos), mas muitos
agem como se não tivessem método – às vezes como se o uso de métodos
explícitos diminuísse sua criatividade. No entanto, eles não podem deixar de usar
algum método. De alguma forma, eles observam fenômenos, fazem perguntas,
inferem informações sobre o mundo a partir dessas observações e fazem inferências
sobre causa e efeito. Se o método e a lógica das observações e inferências de um
pesquisador forem deixados implícitos, a comunidade acadêmica não terá como
julgar a validade do que foi feito. Não podemos avaliar os princípios de seleção que
foram usados para registrar as observações, as formas pelas quais as observações
foram processadas e a lógica pela qual as conclusões foram tiradas. Não podemos
aprender com seus métodos ou replicar seus resultados. Tal pesquisa não é um ato
público . Seja ou não uma boa leitura, não é uma contribuição para a ciência social.
Todos os métodos — explícitos ou não — têm limitações. A vantagem da clareza

é que essas limitações podem ser compreendidas e, se possível, abordadas. Além
disso, os métodos podem ser ensinados e compartilhados. Esse processo permite
que os resultados da pesquisa sejam comparados entre pesquisadores separados
e os estudos dos projetos de pesquisa sejam replicados e os acadêmicos aprendam.
3. As conclusões são incertas. Por definição, a inferência é um processo imperfeito.
Seu objetivo é usar dados quantitativos ou qualitativos para aprender sobre o mundo
que os produziu. Chegar a conclusões perfeitamente certas
Introdução · 9
a partir de dados incertos é obviamente impossível. De fato, a incerteza é um aspecto

central de toda pesquisa e todo conhecimento sobre o mundo. Sem uma estimativa razoável
de incerteza, uma descrição do mundo real ou uma inferência sobre um efeito causal no
mundo real não pode ser interpretada. Um pesquisador que não consegue enfrentar a
questão da incerteza diretamente está afirmando que conhece tudo perfeitamente ou que
não tem ideia de quão certos ou incertos são os resultados. De qualquer forma, inferências
sem estimativas de incerteza não são ciência como a definimos.
4. O conteúdo é o método. Finalmente, a pesquisa científica segue um conjunto de regras de

inferência das quais depende sua validade. Explicar as regras mais importantes é a
principal tarefa deste livro.2 O conteúdo da “ciência” é principalmente os métodos e regras,
não o assunto, já que podemos usar esses métodos para estudar praticamente qualquer
coisa. Este ponto foi reconhecido há mais de um século, quando Karl Pearson (1892: 16)
explicou que “o campo da ciência é ilimitado; seu material é infinito; todo grupo de
fenômenos naturais, toda fase da vida social, todo estágio do desenvolvimento passado
ou presente é material para a ciência. A unidade de toda ciência consiste apenas em seu
método, não em seu material”.
Essas quatro características da ciência têm uma implicação adicional: a

ciência, em sua melhor forma, é um empreendimento social. Todo pesquisador
ou equipe de pesquisadores trabalha sob limitações de conhecimento e
percepção, e erros são inevitáveis, mas tais erros provavelmente serão
apontados por outros. Compreender o caráter social da ciência pode ser
libertador, pois significa que nosso trabalho não precisa estar acima da crítica
para fazer uma contribuição importante – seja para a descrição de um
problema ou sua conceituação, para a teoria ou para a avaliação da teoria.
Desde que nosso trabalho aborde explicitamente (ou tente redirecionar) as
preocupações da comunidade de estudiosos e use métodos públicos para
chegar a inferências consistentes com as regras da ciência e as informações
à nossa disposição, é provável que faça uma contribuição . E a contribuição
de até mesmo um artigo menor é maior do que a do “grande trabalho” que fica
para sempre na gaveta de uma escrivaninha ou dentro dos limites de um computador.
1.1.3 Ciência e Complexidade
A ciência social constitui uma tentativa de dar sentido a situações sociais que
percebemos como mais ou menos complexas. Precisamos reconhecer,
entretanto, que o que percebemos como complexidade não é inteiramente
inerente aos fenômenos: o mundo não é naturalmente dividido em simples e complexo.
2 Embora abordemos a grande maioria das regras importantes da inferência científica, elas
não são completas. De fato, a maioria dos filósofos concorda que uma lógica indutiva
completa e exaustiva é impossível, mesmo em princípio.
conjuntos complexos de eventos. Pelo contrário, a complexidade percebida de

uma situação depende em parte de quão bem podemos simplificar a realidade, e
nossa capacidade de simplificar depende se podemos especificar resultados e
variáveis explicativas de maneira coerente. Ter mais observações pode nos ajudar
nesse processo, mas geralmente é insuficiente. Assim, a “complexidade” é
parcialmente condicional ao estado de nossa teoria.
Os métodos científicos podem ser tão valiosos para eventos intrinsecamente
complexos quanto para os mais simples. É provável que a complexidade torne
nossas inferências menos certas, mas não deve torná-las menos científicas. A
incerteza e os dados limitados não devem nos levar a abandonar a pesquisa científica.
Pelo contrário: a maior recompensa por usar as regras da inferência científica
ocorre precisamente quando os dados são limitados, as ferramentas de observação
são falhas, as medições não são claras e as relações são incertas.
Com relacionamentos claros e dados inequívocos, o método pode ser menos
importante, uma vez que mesmo regras de inferência parcialmente falhas podem
produzir respostas aproximadamente corretas.
Considere alguns eventos complexos e, em certo sentido, únicos, com enormes
ramificações. O colapso do Império Romano, a Revolução Francesa, a Guerra Civil
Americana, a Primeira Guerra Mundial, o Holo caust e a reunificação da Alemanha
em 1990 são exemplos de tais eventos. Esses eventos parecem ser o resultado de
complexas interações de muitas forças cuja conjuntura parece crucial para que o
evento tenha ocorrido. Isto é, sequências de eventos e forças causadas
independentemente convergiram em um determinado lugar e tempo, sua interação
parecendo trazer os eventos que estão sendo observados (Hirschman 1970). Além
disso, muitas vezes é difícil acreditar que esses eventos foram produtos inevitáveis
de forças históricas de grande escala: alguns parecem ter dependido, em parte, de
idiossincrasias de personalidades, instituições ou movimentos sociais. De fato, do
ponto de vista de nossas teorias, o acaso muitas vezes parece ter desempenhado
um papel: fatores fora do escopo da teoria forneceram elos cruciais nas sequências
de eventos.
Uma maneira de entender tais eventos é buscar generalizações: conceituar cada

caso como um membro de uma classe de eventos sobre os quais podem ser feitas
generalizações significativas. Esse método geralmente funciona bem para guerras
ou revoluções comuns, mas algumas guerras e revoluções, sendo muito mais
extremas do que outras, são “extremos” na distribuição estatística. Além disso, as
primeiras guerras ou revoluções notáveis podem exercer um impacto tão forte
sobre os eventos subseqüentes da mesma classe - pensemos novamente na
Revolução Francesa - que é necessário cautela ao compará-los com seus
sucessores, que podem ser até certo ponto produto de imitação. . Expandir a classe
de eventos pode ser útil, mas nem sempre é apropriado.
Outra forma de lidar cientificamente com eventos raros e de grande escala é se

engajar na análise contrafactual: “a construção mental de um
Introdução · 11
curso de eventos que é alterado através de modificações em uma ou mais

'condições'” (Weber [1905] 1949:173). A aplicação dessa ideia de maneira
sistemática e científica é ilustrada em um exemplo particularmente extremo
de um evento raro da geologia e da biologia evolutiva, ambas ciências
naturais de orientação histórica. Stephen J. Gould sugeriu que uma maneira
de distinguir as características sistemáticas da evolução dos eventos
aleatórios estocásticos pode ser imaginar como seria o mundo se todas as
condições até um ponto específico fossem fixadas e então o resto da história
fosse repetido. Ele afirma que se fosse possível “repetir a fita da vida”,
deixar a evolução ocorrer novamente desde o início, os organismos do
mundo hoje seriam completamente diferentes (Gould 1989a).
Um evento único no qual os estudiosos da evolução se concentraram

recentemente é a extinção repentina dos dinossauros há 65 milhões de anos.
Gould (1989a:318) diz: “devemos assumir que a consciência não teria
evoluído em nosso planeta se uma catástrofe cósmica não tivesse feito
vítimas aos dinossauros”. Se essa afirmação for verdadeira, a extinção dos
dinossauros foi tão importante quanto qualquer evento histórico para os
seres humanos; no entanto, a extinção dos dinossauros não se enquadra
perfeitamente em uma classe de eventos que poderiam ser estudados de
maneira sistemática e comparativa por meio da aplicação de leis gerais de
maneira direta.
No entanto, a extinção dos dinossauros pode ser estudada cientificamente:
hipóteses alternativas podem ser desenvolvidas e testadas com relação às
suas implicações observáveis. Uma hipótese para explicar a extinção dos
dinossauros, desenvolvida por Luis Alvarez e colaboradores em Berkeley
no final dos anos 1970 (W. Alvarez e Asaro, 1990), postula uma colisão
cósmica: um meteorito caiu na Terra a cerca de 72.000 quilômetros por
hora, criando uma explosão maior do que a de uma guerra nuclear em
grande escala. Se esta hipótese estiver correta, ela teria a implicação
observável de que o irídio (um elemento comum em meteoritos, mas raro
na Terra) deveria ser encontrado na camada particular da crosta terrestre
que corresponde ao sedimento depositado sessenta e cinco milhões de
anos atrás; de fato, a descoberta de irídio em camadas preditas na terra foi
tomada como evidência parcial de confirmação da teoria. Embora este seja
um evento inequivocamente único, existem muitas outras implicações
observáveis. Por exemplo, deve ser possível encontrar a cratera do metorito
em algum lugar da Terra (e vários candidatos já foram encontrados).3
A questão da(s) causa(s) da extinção dos dinossauros permanece sem
solução, embora a controvérsia tenha gerado muitas pesquisas valiosas. Para
3
No entanto, uma hipótese alternativa, de que a extinção foi causada por erupções
vulcânicas, também é consistente com a presença de irídio e parece mais consistente do
que a hipótese do meteorito com o achado de que todas as extinções de espécies não
ocorreram simultaneamente.

Para nossos propósitos, o ponto deste exemplo é que as generalizações científicas são
úteis no estudo de eventos altamente incomuns que não se enquadram em uma grande
classe de eventos. A hipótese de Alvarez não pode ser testada com referência a um
conjunto de eventos comuns, mas tem implicações observáveis para outros fenômenos que
podem ser avaliados. Devemos notar, no entanto, que uma hipótese não é considerada
uma explicação razoavelmente certa até que tenha sido avaliada empiricamente e tenha
passado por uma série de testes exigentes. No mínimo, suas implicações devem ser
consistentes com nosso conhecimento do mundo externo; na melhor das hipóteses,
deveria prever o que Imre Lakatos (1970) chama de “novos fatos”, isto é, aqueles
anteriormente não observados.
A questão é que mesmo eventos aparentemente únicos, como a extinção dos

dinossauros, podem ser estudados cientificamente se prestarmos atenção para melhorar
a teoria, os dados e nosso uso dos dados. Melhorar nossa teoria por meio de esclarecimentos
conceituais e especificação de variáveis pode gerar implicações mais observáveis e até
mesmo testar teorias causais de eventos únicos, como a extinção dos dinossauros. Melhorar
nossos dados nos permite observar mais dessas implicações observáveis, e melhorar
nosso uso de dados permite que mais dessas implicações sejam extraídas dos dados
existentes. O fato de um conjunto de eventos a serem estudados ser altamente complexo
não torna irrelevante o planejamento cuidadoso da pesquisa. Quer estudemos muitos
fenômenos ou poucos - ou mesmo um - o estudo será melhorado se coletarmos dados
sobre o maior número possível de implicações observáveis de nossa teoria.
1.2 PRINCIPAIS COMPONENTES DO PROJETO DE PESQUISA
A pesquisa em ciências sociais, no seu melhor, é um processo criativo de percepção e

descoberta que ocorre dentro de uma estrutura bem estabelecida de investigação científica.
O cientista social de primeira linha não considera um projeto de pesquisa como um projeto
para um processo mecânico de coleta e avaliação de dados. Ao contrário, o estudioso
deve ter flexibilidade mental para derrubar velhas formas de ver o mundo, fazer novas
perguntas, revisar projetos de pesquisa de forma adequada e, então, coletar mais dados
de um tipo diferente do originalmente pretendido. No entanto, para que as descobertas do
pesquisador sejam válidas e aceitas pelos estudiosos desse campo, todas essas revisões
e reconsiderações devem ocorrer de acordo com procedimentos explícitos consistentes
com as regras de inferência. Um processo dinâmico de investigação ocorre dentro de uma
estrutura estável de regras.
Os cientistas sociais geralmente iniciam a pesquisa com um projeto considerado,

coletam alguns dados e tiram conclusões. Mas esse processo raramente é tranquilo e nem
sempre é melhor feito nesta ordem: as conclusões raramente seguem facilmente um projeto
de pesquisa e os dados coletados de acordo com
Principais componentes do projeto de pesquisa · 13
dançar com ele. Uma vez que um investigador tenha coletado os dados
fornecidos por um projeto de pesquisa, ele frequentemente encontrará um ajuste
imperfeito entre as principais questões de pesquisa, a teoria e os dados
disponíveis. Nesta fase, os pesquisadores muitas vezes ficam desanimados.
Eles acreditam erroneamente que outros cientistas sociais encontram ajustes
próximos e imediatos entre os dados e a pesquisa. Essa percepção se deve ao
fato de que os investigadores costumam desmontar os andaimes depois de
erguer seus prédios intelectuais, deixando poucos vestígios da agonia e da
incerteza da construção. Assim, o processo de investigação parece mais
mecânico e direto do que realmente é.
Alguns de nossos conselhos são direcionados a pesquisadores que estão
tentando fazer conexões entre teoria e dados. Às vezes, eles podem projetar
procedimentos de coleta de dados mais apropriados para avaliar melhor uma
teoria; em outros momentos, eles podem usar os dados que possuem e
reformular uma questão teórica (ou mesmo colocar uma questão totalmente
diferente que não foi originalmente prevista) para produzir um projeto de
pesquisa mais importante. A pesquisa, se aderir às regras de inferência, ainda
será científica e produzirá inferências confiáveis sobre o mundo.
Sempre que possível, os pesquisadores também devem melhorar seus
projetos de pesquisa antes de realizar qualquer pesquisa de campo. No entanto,
os dados têm uma maneira de disciplinar o pensamento. É extremamente
comum descobrir que o melhor projeto de pesquisa desmorona quando as
primeiras observações são coletadas – não é que a teoria esteja errada, mas
que os dados não são adequados para responder às questões originalmente
colocadas. Entender desde o início o que pode e o que não pode ser feito nesse
estágio posterior pode ajudar o pesquisador a antecipar pelo menos alguns dos
problemas ao planejar a pesquisa pela primeira vez.
Para fins analíticos, dividimos todos os projetos de pesquisa em quatro
componentes: a questão de pesquisa, a teoria, os dados e o uso dos dados.
Esses componentes geralmente não são desenvolvidos separadamente e os
estudiosos não os atendem em nenhuma ordem predeterminada. De fato, para
pesquisadores qualitativos que iniciam seu trabalho de campo antes de escolher
uma questão de pesquisa precisa, os dados vêm primeiro, seguidos pelos outros.
No entanto, essa divisão específica, que explicamos nas seções 1.2.1–1.2.4, é
particularmente útil para entender a natureza dos projetos de pesquisa. Para
esclarecer precisamente o que poderia ser feito se os recursos fossem
redirecionados, nosso conselho no restante desta seção assume que os
pesquisadores têm tempo e recursos ilimitados. É claro que, em qualquer
situação real de pesquisa, deve-se sempre fazer concessões. Acreditamos que
entender os conselhos nas quatro categorias a seguir ajudará os pesquisadores
a fazer essas concessões de forma a melhorar ao máximo seus projetos de
pesquisa, mesmo quando, de fato, sua pesquisa está sujeita a restrições
externas.
1.2.1 Melhorando as questões de
pesquisa Ao longo deste livro, consideramos o que fazer uma vez que
identificamos o objeto de pesquisa. Dada uma questão de pesquisa, quais
são as maneiras de conduzir essa pesquisa para que possamos obter
explicações válidas de fenômenos sociais e políticos? Nossa discussão
começa com uma questão de pesquisa e então prossegue para os estágios
de planejamento e condução da pesquisa. Mas de onde se originam as
questões de pesquisa? Como um estudioso escolhe o tema para análise? Não
há resposta simples para esta pergunta. Como outros, Karl Popper (1968:32)
argumentou que “não existe um método lógico para se ter novas ideias. . . . A
descoberta contém 'um elemento irracional' ou uma 'intuição criativa'”. As
regras de escolha nos primeiros estágios do processo de pesquisa são menos
formalizadas do que as regras para outras atividades de pesquisa. Há textos
sobre a elaboração de experimentos de laboratório sobre escolha social,
critérios estatísticos sobre a seleção de uma amostra para uma pesquisa de
atitudes em relação a políticas públicas e manuais sobre como conduzir a
observação participante de um escritório burocrático. Mas não existe uma
regra para escolher qual projeto de pesquisa realizar, nem se devemos decidir
realizar um trabalho de campo, existem regras que regem onde devemos realizá-lo.
Podemos propor formas de selecionar uma amostra de comunidades a fim
de estudar o impacto de políticas educacionais alternativas, ou formas de
conceituar o conflito étnico de maneira que conduza à formulação e teste de
hipóteses quanto à sua incidência. Mas não há regras que nos digam se
devemos estudar política educacional ou conflito étnico. Em termos de
métodos de ciências sociais, há maneiras melhores e piores de estudar o
colapso do governo da Alemanha Oriental em 1989, assim como há maneiras
melhores e piores de estudar a relação entre a posição de um candidato
sobre impostos e a probabilidade de sucesso eleitoral. Mas não há como
determinar se é melhor estudar o colapso do regime da Alemanha Oriental ou
o papel dos impostos na política eleitoral dos Estados Unidos.
O tópico específico que um cientista social estuda pode ter uma origem
pessoal e idiossincrática. Não é por acaso que a pesquisa sobre grupos
específicos provavelmente será iniciada por pessoas desse grupo: as mulheres
muitas vezes lideraram o caminho na história das mulheres, os negros na
história dos negros, os imigrantes na história da imigração. Os tópicos também
podem ser influenciados por inclinações e valores pessoais. O estudioso da
política do terceiro mundo tende a ter um maior desejo de viajar e uma maior
tolerância para com as difíceis condições de vida do que o estudioso da
formulação de políticas do Congresso; o analista de cooperação internacional
pode ter uma aversão particular por conflitos violentos.
Essas experiências e valores pessoais geralmente fornecem a motivação
tornar-se um cientista social e, posteriormente, escolher uma determinada

questão de pesquisa. Como tal, eles podem constituir as razões “reais” para se
engajar em um determinado projeto de pesquisa – e apropriadamente. Mas, não
importa quão pessoais ou idiossincráticas sejam as razões para a escolha de
um tópico, os métodos da ciência e as regras de inferência discutidas neste livro
ajudarão os estudiosos a elaborar projetos de pesquisa mais poderosos. Do
ponto de vista de uma possível contribuição para as ciências sociais, razões
pessoais não são justificativas necessárias nem suficientes para a escolha de
um tema. Na maioria dos casos, eles não deveriam aparecer em nossos escritos
acadêmicos. Para colocar de forma mais direta, mas bastante indelicada,
ninguém se importa com o que pensamos – a comunidade acadêmica só se
importa com o que podemos demonstrar.
Embora não existam regras precisas para a escolha de um tópico, existem
maneiras – além das preferências individuais – de determinar o valor provável
de um empreendimento de pesquisa para a comunidade acadêmica. Idealmente,
todos os projetos de pesquisa em ciências sociais devem satisfazer dois critérios.
Primeiro, um projeto de pesquisa deve colocar uma questão que seja “importante”
no mundo real. O tópico deve ser importante para a vida política, social ou
econômica, para a compreensão de algo que afeta significativamente a vida de
muitas pessoas ou para a compreensão e previsão de eventos que podem ser
prejudiciais ou benéficos (ver Shively 1990:15). Em segundo lugar, um projeto
de pesquisa deve fazer uma contribuição específica para uma literatura
acadêmica identificável, aumentando nossa capacidade coletiva de construir
explicações científicas verificadas de algum aspecto do mundo. Este último
critério não implica que toda pesquisa que contribui para nosso estoque de
explicações das ciências sociais de fato visa diretamente a fazer inferências
causais. Às vezes, o estado do conhecimento em um campo é tal que muita
descoberta de fatos e descrições são necessárias antes que possamos enfrentar
o desafio da explicação. Frequentemente, a contribuição de um único projeto
será uma inferência descritiva. Às vezes, o objetivo pode nem ser uma inferência
descritiva, mas sim a observação atenta de eventos particulares ou o resumo
de detalhes históricos. Estes, no entanto, atendem ao nosso segundo critério
porque são pré-requisitos para a explicação.
Nosso primeiro critério direciona nossa atenção para o mundo real da política
e dos fenômenos sociais e para o registro atual e histórico dos eventos e
problemas que moldam a vida das pessoas. Se uma questão de pesquisa atende
a esse critério é essencialmente um julgamento social. O segundo critério
direciona nossa atenção para a literatura acadêmica das ciências sociais, para
os quebra-cabeças intelectuais ainda não colocados, para os quebra-cabeças
que ainda precisam ser resolvidos e para as teorias e métodos científicos
disponíveis para resolvê-los.
Os cientistas políticos não têm dificuldade em encontrar assuntos que
atende ao nosso primeiro critério. Dez grandes guerras durante os últimos

quatrocentos anos mataram quase trinta milhões de pessoas (Levy 1985:372);
algumas “guerras limitadas”, como aquelas entre os Estados Unidos e o Vietnã do
Norte e entre o Irã e o Iraque, cada uma custou mais de um milhão de vidas; e
uma guerra nuclear, caso ocorresse, poderia matar bilhões de seres humanos. A
má administração política, tanto doméstica quanto internacional, levou à privação
econômica global – como na década de 1930 – bem como à depressão regional e
local, como evidenciado pelas trágicas experiências de grande parte da África e
da América Latina durante a década de 1980. Em geral, a variação internacional
nas instituições políticas está associada a uma grande variação nas condições da
vida humana comum, que se refletem nas diferenças na expectativa de vida e na
mortalidade infantil entre países com níveis semelhantes de desenvolvimento
econômico (Russett 1978:913–28 ). Nos Estados Unidos, os programas destinados
a aliviar a pobreza ou a desorganização social parecem ter variado muito em sua
eficácia. Não há dúvida de que a pesquisa que contribui, mesmo que
marginalmente, para a compreensão dessas questões é importante.
Embora os cientistas sociais tenham uma abundância de questões significativas

que podem ser investigadas, as ferramentas para entendê-las são escassas e
bastante rudimentares. Muito foi escrito sobre a guerra ou a miséria social que
pouco acrescenta à compreensão dessas questões porque falha em descrever
esses fenômenos sistematicamente ou em fazer inferências causais ou descritivas
válidas. Insights brilhantes podem contribuir para a compreensão ao gerar novas
hipóteses interessantes, mas o brilhantismo não é um método de pesquisa
empírica. Todas as hipóteses precisam ser avaliadas empiricamente antes que
possam contribuir para o conhecimento.
Este livro não oferece conselhos sobre como se tornar brilhante. O que ela pode
fazer, entretanto, é enfatizar a importância da realização de pesquisas para que
se constituam uma contribuição ao conhecimento.
Nosso segundo critério para escolher uma questão de pesquisa, “fazer uma
contribuição”, significa localizar explicitamente um projeto de pesquisa dentro da
estrutura da literatura científica social existente. Isso garante que o investigador
entenda o “estado da arte” e minimiza a chance de duplicar o que já foi feito.
Também garante que o trabalho feito será importante para os outros, melhorando
assim o sucesso da comunidade de estudiosos como um todo. Fazer uma
contribuição explícita para a literatura pode ser feito de muitas maneiras diferentes.
Listamos aqui algumas das possibilidades:
1. Escolha uma hipótese considerada importante pelos estudiosos na literatura,

mas para a qual ninguém concluiu um estudo sistemático. Se encontrarmos
evidências a favor ou contra a hipótese favorecida, estaremos dando uma
contribuição.
2. Escolher uma hipótese aceita na literatura que suspeitamos ser falsa (ou uma que
acreditamos não ter sido adequadamente confirmada) e investigar se ela é realmente
falsa ou se alguma outra teoria está correta.
3. Tentativa de resolver ou fornecer mais evidências de um lado de uma controvérsia na
literatura - talvez demonstrar que a controvérsia era infundada desde o início.
4. Projete pesquisas para iluminar ou avaliar suposições não questionadas em

a literatura.
5. Argumente que um tópico importante foi negligenciado na literatura e
em seguida, prossiga para contribuir com um estudo sistemático para a área.
6. Mostrar que teorias ou evidências projetadas para algum propósito em uma literatura
podem ser aplicadas em outra literatura para resolver um problema existente, mas
aparentemente não relacionado.
Concentrar-se demais em fazer uma contribuição para uma literatura

acadêmica sem alguma atenção aos tópicos que têm importância no mundo
real corre o risco de cair em questões politicamente insignificantes. Por
outro lado, a atenção à agenda política atual sem considerar as questões
da receptividade de um assunto ao estudo sistemático dentro da estrutura
de um corpo de conhecimento das ciências sociais leva a um trabalho
descuidado que pouco acrescenta à nossa compreensão mais profunda.
Nossos dois critérios para escolher questões de pesquisa não são
necessariamente opostos um ao outro. A longo prazo, a compreensão dos
fenômenos do mundo real é aprimorada pela geração e avaliação de
hipóteses explicativas por meio do uso do método científico. Mas, a curto
prazo, pode haver uma contradição entre a utilidade prática e o valor
científico a longo prazo. Por exemplo, Mankiw (1990) aponta que a teoria
macroeconômica e a macroeconomia aplicada divergiram acentuadamente
durante os anos 1970 e 1980: modelos que se mostraram teoricamente
incoerentes ainda eram usados para prever a direção da economia dos EUA,
enquanto os novos modelos teóricos de assinados para corrigir essas
falhas permaneceram especulativos e não foram suficientemente refinados
para fazer previsões precisas.
Os critérios de aplicabilidade prática ao mundo real e contribuição para o
progresso científico podem parecer opostos quando um pesquisador escolhe
um tema. Alguns pesquisadores começarão com um problema do mundo
real de grande significado social: a ameaça de uma guerra nuclear, a
diferença de renda entre homens e mulheres, a transição para a democracia
na Europa Oriental. Outros podem começar com um problema intelectual
gerado pela literatura de ciências sociais: uma contradição entre vários
estudos experimentais de tomada de decisão sob incerteza ou uma
inconsistência entre teorias de votação no Congresso e resultados eleitorais
recentes. A distinção entre os critérios é, obviamente,
não duro e rápido. Algumas questões de pesquisa satisfazem ambos os critérios

desde o início, mas ao planejar a pesquisa, os pesquisadores muitas vezes
começam mais perto de um do
que do outro.4 Onde quer que comece, o processo de planejar a pesquisa para
responder a uma questão específica deve seguir em direção à satisfação de nossos
dois critérios. E obviamente nossa direção de movimento dependerá de onde
começamos. Se formos motivados por um quebra-cabeça científico social, devemos
perguntar como tornar esse tópico de pesquisa mais relevante para os tópicos de
importância do mundo real - por exemplo, como os experimentos de laboratório
podem iluminar melhor as escolhas estratégicas do mundo real pelos tomadores de
decisões políticas ou, quais consequências comportamentais a teoria pode ter. Se
começarmos com um problema do mundo real, devemos perguntar como esse
problema pode ser estudado com métodos científicos modernos para que contribua
para o estoque de explicações da ciência social. Pode ser que decidamos que nos
afastarmos demais de um critério ou de outro não é a abordagem mais frutífera.
Experimentadores de laboratório podem argumentar que a busca por referências
externas é prematura e que mais progressos serão feitos ao refinar a teoria e o
método no ambiente mais controlado do laboratório.
E em termos de um programa de pesquisa de longo prazo, eles podem estar certos.
Por outro lado, o estudioso motivado por um problema do mundo real pode
argumentar que uma descrição precisa é necessária antes de passar para a
explicação. E tal pesquisador também pode estar certo. A descrição precisa é um
passo importante em programas de pesquisa explicativa.
Em ambos os casos, um programa de pesquisa e, se possível, um projeto de
pesquisa específico, deve visar a satisfazer nossos dois critérios: deve lidar com um
tópico significativo do mundo real e ser projetado para contribuir, direta ou
indiretamente, para uma literatura acadêmica específica. Uma vez que nossa
principal preocupação neste livro é tornar a pesquisa qualitativa mais científica,
abordaremos principalmente o pesquisador que começa com a perspectiva do
“mundo real”. Mas nossa análise é relevante para ambos os tipos de investigador.
Se começarmos com um problema significativo do mundo real em vez de uma
literatura estabelecida, é essencial elaborar um plano viável para estudá-lo. Um
tópico proposto que não pode ser refinado em um projeto de pesquisa específico
que permita inferências descritivas ou causais válidas deve ser modificado ao longo
do caminho ou abandonado. Um tópico proposto que não fará nenhuma contribuição
4 O dilema não é diferente daquele enfrentado pelos cientistas naturais ao decidirem conduzir
pesquisa aplicada ou básica. Por exemplo, a pesquisa aplicada em relação a uma determinada
droga ou doença pode, a curto prazo, melhorar a assistência médica sem contribuir tanto para
o conhecimento geral dos mecanismos biológicos subjacentes. A pesquisa básica pode ter a
consequência oposta. A maioria dos pesquisadores argumentaria, como fazemos com as
ciências sociais, que a dicotomia é falsa e que a pesquisa básica acabará levando a poderosos
resultados aplicados. No entanto, todos concordam que o melhor projeto de pesquisa é aquele
que, de alguma forma, consegue ser diretamente relevante para resolver problemas do mundo
real e promover os objetivos de uma literatura científica específica.
mas a referência a alguma literatura acadêmica deve ser alterada da mesma

forma. Tendo escolhido provisoriamente um tema, entramos em diálogo com a literatura.
Que questões de interesse para nós já foram respondidas? Como podemos
formular e refinar nossa pergunta para que ela pareça ser respondida com as
ferramentas disponíveis? Podemos começar com uma questão candente, mas
teremos que lidar tanto com a literatura das ciências sociais quanto com os
problemas de inferência.
1.2.2 Aperfeiçoamento da
teoria Uma teoria das ciências sociais é uma especulação fundamentada e precisa
sobre a resposta a uma questão de pesquisa, incluindo uma declaração sobre por
que a resposta proposta está correta. As teorias geralmente implicam várias
hipóteses descritivas ou causais mais específicas. Uma teoria deve ser consistente
com evidências anteriores sobre uma questão de pesquisa. “Uma teoria que ignora
as evidências existentes é um oxímoro. Se tivéssemos o equivalente à legislação
da 'verdade na propaganda', tal oxímoro não deveria ser chamado de
teoria” (Lieberson 1992:4; ver também Woods e Walton 1982).
O desenvolvimento de uma teoria é frequentemente apresentado como o primeiro
passo da pesquisa. Às vezes vem primeiro na prática, mas não precisa. De fato,
não podemos desenvolver uma teoria sem o conhecimento de trabalhos anteriores
sobre o assunto e a coleta de alguns dados, pois até mesmo a questão de
pesquisa seria desconhecida. No entanto, apesar da quantidade de dados já
coletados, existem algumas maneiras gerais de avaliar e melhorar a utilidade de
uma teoria. Apresentamos brevemente cada um deles aqui, mas reservamos uma
discussão mais detalhada para capítulos posteriores.
Primeiro, escolha as teorias que podem estar erradas. Na verdade, muito mais
se aprende com teorias que estão erradas do que com teorias que são apresentadas
de forma tão ampla que não poderiam estar erradas nem mesmo em princípio.5
Precisamos ser capazes de dar uma resposta direta à pergunta: Que evidências
nos convenceriam de que estamos errados?6 Se não há resposta para essa
pergunta, então não temos uma teoria.
Em segundo lugar, para garantir que uma teoria seja falsificável, escolha uma
que seja capaz de gerar tantas implicações observáveis quanto possível. Essa
escolha permitirá mais testes da teoria com mais dados e uma maior variedade de
dados, colocará a teoria em risco de ser falsificada mais vezes e possibilitará
coletar dados para construir evidências fortes para a teoria.
5 Este é o princípio da falseabilidade (Popper 1968). É uma questão sobre a qual há posições
variadas na filosofia da ciência. No entanto, muito poucos deles discordam do princípio de que as
teorias devem ser apresentadas com clareza suficiente para que possam estar erradas.
6 Esta é provavelmente a pergunta mais comum em entrevistas de emprego em nosso
departamento e em muitos outros.
Em terceiro lugar, ao projetar teorias, seja o mais concreto possível. Teorias e

hipóteses vagamente formuladas não servem para nada além de ofuscar. As
teorias que são expressas com precisão e fazem previsões específicas podem
ser mais facilmente mostradas como erradas e, portanto, melhores.
Alguns pesquisadores recomendam seguir o princípio da “parcimônia”.
Infelizmente, a palavra tem sido usada de tantas maneiras em conversas casuais
e escritos acadêmicos que o princípio se tornou obscuro (ver Sober [1988] para
uma discussão completa). A definição mais clara de parcimônia foi dada por
Jeffreys (1961:47): “Teorias simples têm probabilidades a priori mais altas”. . O
princípio de escolha de teorias que impliquem um mundo simples é uma regra
que se aplica claramente em situações onde há um alto grau de certeza de que
o mundo é de fato simples. Os estudiosos da física parecem achar a parcimônia
apropriada, mas os da biologia costumam considerá-la absurda. Nas ciências
sociais, alguns defendem vigorosamente a parcimônia em seus subcampos (por
exemplo, Zellner 1984), mas acreditamos que seja apropriado apenas
ocasionalmente. Dada a definição precisa de parcimônia como uma suposição
sobre o mundo, nunca devemos insistir na parcimônia como um princípio geral
de design de teorias, mas é útil naquelas situações em que temos algum
conhecimento da simplicidade do mundo que estamos estudando.
Nosso ponto é que não aconselhamos os pesquisadores a buscar a parcimônia

como um bem essencial, pois parece haver poucos motivos para adotá-la, a
menos que já saibamos muito sobre um assunto. Nem mesmo precisamos de
parcimônia para evitar teorias excessivamente complicadas, já que isso está
diretamente implícito na máxima de que a teoria deve ser tão complicada quanto
sugerem todas as nossas evidências. Situações com evidências insuficientes
em relação à complexidade da teoria que está sendo investigada podem levar
ao que chamamos de “desenhos de pesquisa indeterminados” (ver seção 4.1),
mas esses são problemas de desenho de pesquisa e não suposições sobre o mundo.
Todos os nossos conselhos até agora se aplicam se ainda não coletamos
nossos dados e iniciamos qualquer análise. No entanto, se já coletamos os
dados, certamente podemos usar essas regras para modificar nossa teoria e
coletar novos dados e, assim, gerar novas implicações observáveis da nova
teoria. Obviamente, esse processo é caro, demorado e provavelmente desperdiça
os dados já coletados. E quanto à situação em que nossa teoria precisa
obviamente de melhorias, mas não podemos nos dar ao luxo de coletar dados
adicionais? Essa situação – na qual os pesquisadores frequentemente se
encontram – exige muita cautela e autoconfiança.
7 Essa frase ficou conhecida como o “Postulado da Simplicidade de Jeffreys-Wrinch”. O

conceito é semelhante à navalha de Occam.
restrição. Qualquer estudioso inteligente pode apresentar uma teoria “plausível”

para qualquer conjunto de dados após o fato, mas fazer isso não demonstra
nada sobre a veracidade da teoria. A teoria se ajustará perfeitamente aos dados
e, ainda assim, pode estar extremamente errada — na verdade,
comprovadamente errada com a maioria dos outros dados. Os seres humanos
são muito bons em reconhecer padrões, mas não muito bons em reconhecer
não-padrões. (A maioria de nós até vê padrões em manchas de tinta aleatórias!)
Ajustes ad hoc em uma teoria que não se ajusta aos dados existentes devem
ser usados
raramente e com considerável disciplina.8 Ainda há o problema do que fazer
quando terminamos nossos dados coleta e análise e deseja trabalhar para melhorar uma teoria.
Nessa situação, recomendamos seguir duas regras: primeiro, se nossa
previsão estiver condicionada a várias variáveis e estivermos dispostos a
abandonar uma das condições, podemos fazê-lo. Por exemplo, se originalmente
supuséssemos que países democráticos com sistemas avançados de bem-
estar social não lutam entre si, seria permissível estender essa hipótese a todas
as democracias modernas e, assim, avaliar nossa teoria em relação a mais
casos e aumentar suas chances de ser falsificada. O ponto geral é que, depois
de ver os dados, podemos modificar nossa teoria de modo a aplicá-la a uma
gama maior de fenômenos. Uma vez que tal alteração em nossa tese a expõe
mais plenamente à falsificação, modificações nesse sentido não devem levar
a explicações ad hoc que meramente parecem “salvar” uma teoria inadequada,
restringindo seu alcance a fenômenos que já foram observados como estando
em de acordo com isso.
A prática oposta, no entanto, é geralmente inapropriada. Depois de observar
os dados, não devemos apenas adicionar uma condição restritiva e então
proceder como se nossa teoria, com aquela qualificação, tivesse se mostrado
correta. Se nossa teoria original era que as democracias modernas não travam
guerras entre si devido a seus sistemas constitucionais, seria menos permissível,
tendo encontrado exceções à nossa “regra”, restringir a proposição a
democracias com sistemas avançados de bem-estar social uma vez que Foi
verificado pela inspeção dos dados que tal qualificação pareceria tornar nossa
proposição correta. Ou suponha que nossa teoria original fosse que as
revoluções ocorrem apenas sob condições de severa depressão econômica,
mas descobrimos que isso não é verdade em um de nossos estudos de caso.
Nesta situação, não seria razoável simplesmente acrescentar condições gerais
como, as revoluções nunca ocorrem durante os períodos de prosperidade,
exceto quando os militares são fracos, a liderança política é repressiva, a
economia é baseada em um pequeno número de produtos.
8 Se escolhemos um tópico de importância real e/ou que traz alguma contribuição

para a literatura acadêmica, a natureza social da academia corrigirá essa situação:
alguém replicará nosso estudo com outro conjunto de dados e demonstrará que
estavam errados.
dutos e o clima é quente. Tal formulação é apenas uma maneira elegante (e

enganosa) de dizer “minha teoria está correta, exceto no país x”. Como já
descobrimos que nossa teoria é incorreta para o país x, não adianta transformar
essa falsificação em uma generalização espúria. Sem esforços para coletar novos
dados, não teremos evidências admissíveis para apoiar a nova versão da teoria.
Portanto, nossa regra básica com respeito a alterar nossa teoria depois de
observar os dados é: podemos tornar a teoria menos restritiva (para que cubra
uma gama mais ampla de fenômenos e seja exposta a mais oportunidades de
falsificação), mas não devemos torná-la mais restritivo sem coletar novos dados
para testar a nova versão da teoria. Se não pudermos coletar dados adicionais,
estaremos presos; e não propomos nenhuma maneira mágica de desembaraçar.
Em algum momento, decidir que estamos errados é o melhor; de fato, achados
negativos podem ser bastante valiosos para uma literatura acadêmica. Quem não
preferiria uma descoberta negativa sólida a qualquer número de descobertas
positivas frágeis baseadas em teorias ad hoc?
Além disso, se estivermos errados, não precisamos parar de escrever depois
de admitir a derrota. Podemos adicionar uma seção ao nosso artigo ou um
capítulo ao nosso livro sobre pesquisas empíricas futuras e especulações teóricas
atuais. Neste contexto, temos consideravelmente mais liberdade. Podemos
sugerir condições adicionais que podem ser plausivelmente associadas à nossa
teoria, se acreditarmos que elas podem resolver o problema, propor uma
modificação de outra teoria existente ou propor uma série de teorias totalmente
diferentes. Nesta situação, não podemos concluir nada com muita certeza (exceto
talvez que a teoria que afirmamos no início esteja errada), mas temos o luxo de
inventar novos projetos de pesquisa ou projetos de coleta de dados que possam
ser usados para decidir se nossas especulações estão corretas. Estes podem
ser muito valiosos, especialmente para sugerir áreas onde futuros pesquisadores
podem procurar.
Reconhecidamente, como discutimos acima, a ciência social não opera
estritamente de acordo com regras: a necessidade de criatividade às vezes exige
que o livro didático seja descartado! E os dados podem disciplinar o pensamento.
Portanto, os pesquisadores às vezes, depois de confrontar os dados, têm
inspirações sobre como deveriam ter construído a teoria em primeiro lugar. Tal
modificação, mesmo que restritiva, pode valer a pena se pudermos convencer a
nós mesmos e aos outros de que modificar a teoria da maneira que propomos é
algo que poderíamos ter feito antes de coletar os dados, se tivéssemos pensado
nisso. Mas até que seja testado com novos dados, o status de tal teoria
permanecerá muito incerto e deve ser rotulado como tal.
Uma consequência importante dessas regras é que os projetos-piloto costumam

ser muito úteis, especialmente em pesquisas em que os dados devem ser
coletados por meio de entrevistas ou outros meios particularmente caros. A
coleta preliminar de dados pode nos levar a alterar as questões de pesquisa ou modificar o
teoria. Assim, novos dados podem ser reunidos para testar a nova teoria, e o
problema de usar os mesmos dados para gerar e testar uma teoria pode ser
evitado.
1.2.3 Melhorando a qualidade
dos dados “Dados” são elementos de informação coletados sistematicamente

sobre o mundo. Eles podem ser qualitativos ou quantitativos em estilo. Às vezes,
os dados são coletados para avaliar uma teoria muito específica, mas não tão
raramente, os estudiosos coletam dados antes de saber exatamente o que estão
interessados em descobrir. Além disso, mesmo que os dados sejam coletados
para avaliar uma hipótese específica, os pesquisadores podem acabar se
interessando por questões que não haviam ocorrido a eles anteriormente.
Em ambos os casos – quando os dados são coletados para um propósito
específico ou quando os dados são usados para algum propósito que não estava
claro quando foram coletados – certas regras irão melhorar a qualidade desses
dados. Em princípio, podemos pensar nessas regras para melhorar os dados
separadamente das regras da seção 1.2.2 para melhorar a teoria. Na prática,
qualquer esforço de coleta de dados requer algum grau de teoria, assim como a
formulação de qualquer teoria requer alguns dados (ver Coombs 1964).
Nossa primeira e mais importante diretriz para melhorar a qualidade dos dados
é: registrar e relatar o processo pelo qual os dados são gerados. Sem essas
informações, não podemos determinar se o uso de procedimentos padrão na
análise dos dados produzirá inferências tendenciosas. Somente conhecendo o
processo pelo qual os dados foram gerados poderemos produzir inferências
descritivas ou causais válidas. Em uma pesquisa de opinião quantitativa, registrar
o processo de geração de dados requer que conheçamos o método exato pelo
qual a amostra foi extraída e as perguntas específicas que foram feitas. Em um
estudo de caso comparativo qualitativo, é crítico relatar as regras precisas pelas
quais escolhemos o pequeno número de casos para análise. Fornecemos
orientações adicionais no capítulo 6 para a seleção de casos em pesquisa
qualitativa, mas ainda mais importante do que escolher um bom método é ter o
cuidado de registrar e relatar qualquer método usado e todas as informações
necessárias para que outra pessoa o aplique.9
Na seção 1.2.2 defendemos teorias que são capazes de gerar
9 Descobrimos que muitos alunos de pós-graduação têm medo desnecessário de compartilhar

dados e informações necessárias para replicar seus resultados. Eles têm medo de que alguém roube
seu trabalho árduo ou até mesmo prove que eles estavam errados. Todos esses são medos comuns,
mas quase sempre injustificados. A publicação (ou pelo menos o envio de cópias de trabalhos de
pesquisa para outros estudiosos) e o compartilhamento de dados é a melhor maneira de garantir o
crédito pelas contribuições de alguém. Além disso, compartilhar dados só ajudará outras pessoas a
acompanhar a pesquisa que você iniciou. Quando a pesquisa deles for publicada, eles citarão seu
esforço e promoverão sua visibilidade e reputação.
muitas implicações observáveis. Nossa segunda diretriz para melhorar a

qualidade dos dados é, para melhor avaliar uma teoria, coletar dados sobre o
máximo possível de suas implicações observáveis. Isso significa coletar o
máximo de dados em tantos contextos diversos quanto possível. Cada
implicação adicional de nossa teoria que observamos fornece outro contexto
para avaliar sua veracidade. Quanto mais implicações observáveis forem
consistentes com a teoria, mais poderosa será a explicação e mais certos
serão os resultados.
Ao adicionar dados sobre novas implicações observáveis de uma teoria,
podemos (a) coletar mais observações sobre a mesma variável dependente
ou (b) registrar variáveis dependentes adicionais. Podemos, por exemplo,
desagregar em períodos de tempo mais curtos ou áreas geográficas menores.
Também podemos coletar informações sobre variáveis dependentes de
interesse menos direto; se os resultados forem os previstos pela teoria,
teremos mais confiança na teoria.
Por exemplo, considere a teoria da dissuasão racional: potenciais
iniciadores de guerra calculam os custos e benefícios de atacar outros
estados, e esses cálculos podem ser influenciados por ameaças críveis de
retaliação. O teste mais direto dessa teoria seria avaliar se, dadas as ameaças
de guerra, as decisões de ataque estão associadas a fatores como o equilíbrio
de forças militares entre o atacante potencial e o defensor ou os interesses
em jogo para o defensor (Huth 1988). No entanto, embora usar apenas casos
em que ameaças são emitidas constitua um conjunto de implicações
observáveis da teoria, elas são apenas parte das observações que poderiam
ser coletadas (e usadas isoladamente podem levar a um viés de seleção),
pois situações em que as próprias ameaças são dissuadidos seriam excluídos
do conjunto de dados. Portanto, pode valer a pena também coletar dados
sobre uma variável dependente adicional (ou seja, um conjunto diferente de
implicações observáveis) com base em uma medição de se as ameaças são
feitas por estados que têm alguns incentivos para fazê-lo.
Na medida em que faltam dados bons e suficientes sobre dissuasão na

política internacional, também pode ser útil testar uma teoria diferente, uma
com suposições motivacionais semelhantes, para uma variável dependente
diferente sob condições diferentes, mas que ainda é uma implicação
observável da mesma teoria. Por exemplo, poderíamos construir um
experimento de laboratório para ver se, sob condições simuladas, as
“ameaças” são dissuadidas em vez de acentuadas pelo poder militar e pelo
comportamento firme de negociação. Ou poderíamos examinar se outros
atores em situações análogas, como empresas oligopolistas competindo por
participação de mercado ou famílias do crime organizado competindo por
território, usam estratégias de dissuasão e quão bem-sucedidas são sob
condições variadas. De fato, os economistas que trabalham no campo da organização industrial têm usado não
a teoria dos jogos cooperativos, na qual também se baseia a teoria da dissuasão, para
estudar problemas como entrada em mercados e estratégias de preços (Fudenberg e
Tirole 1989). Dada a estreita semelhança entre as teorias, a evidência empírica que
apoia as previsões da teoria dos jogos sobre o comportamento da empresa aumentaria
a plausibilidade de hipóteses relacionadas sobre o comportamento do estado na política
internacional. A incerteza permaneceria sobre a aplicabilidade das conclusões de um
domínio para outro, mas a questão é importante o suficiente para garantir tentativas de
obter insights e evidências onde quer que possam ser encontradas.
Obviamente, coletar dados para sempre sem fazer nenhuma análise impediria, em
vez de facilitar, a conclusão de uma pesquisa útil. Na prática, tempo e recursos limitados
sempre limitarão os esforços de coleta de dados. Embora mais informações, casos
adicionais, entrevistas extras, outra variável e outras formas relevantes de coleta de
dados sempre melhorem a certeza de nossas inferências até certo ponto, promissores,
estudiosos em potencial podem ser arruinados por muita informação tão facilmente
quanto por excesso de informação. pequeno. Insistir em ler mais um livro ou obter mais
um conjunto de dados sem nunca escrever uma palavra é uma receita para ser
improdutivo.
Nossa terceira diretriz é: maximizar a validade de nossas medições. Validade refere-

se a medir o que pensamos estar medindo. A taxa de desemprego pode ser um bom
indicador do estado da economia, mas os dois não são sinônimos. Em geral, é mais fácil
maximizar a validade aderindo aos dados e não permitindo que conceitos não
observados ou não mensuráveis atrapalhem. Se um informante responde à nossa
pergunta indicando ignorância, então sabemos que ele disse que era ignorante. Disso,
temos uma medida válida. No entanto, o que ele realmente quis dizer é um conceito
totalmente diferente — um que não pode ser medido com um alto grau de confiança.
Por exemplo, em países com governos repressivos, expressar ignorância pode ser uma
forma de fazer uma declaração política crítica para algumas pessoas; para outros, é
uma forma de dizer “não sei”.
Nossa quarta diretriz é: garantir que os métodos de coleta de dados sejam confiáveis.
Confiabilidade significa que aplicar o mesmo procedimento da mesma maneira produzirá
sempre a mesma medida. Quando um procedimento confiável é aplicado em momentos
diferentes e nada aconteceu nesse meio tempo para alterar o estado “verdadeiro” do
objeto que estamos medindo, o mesmo resultado será observado.10 Medidas confiáveis
também produzem a mesma precisão.
10 Podemos verificar a confiabilidade medindo a mesma quantidade duas vezes e verificando

se as medidas são as mesmas. Às vezes isso parece fácil, como literalmente fazer a mesma
pergunta em momentos diferentes durante uma entrevista. No entanto, fazer a pergunta uma
vez pode influenciar o respondente a responder de maneira consistente na segunda vez,
portanto, precisamos ter cuidado para que as duas medições sejam realmente independentes.
resultados quando aplicados por diferentes pesquisadores, e esse resultado

depende, é claro, da existência de procedimentos explícitos que possam ser
seguidos.11 Nossa diretriz final é: todos os dados e análises devem, na medida do

possível, ser replicáveis. A replicabilidade se aplica não apenas aos dados, para
que possamos ver se nossas medidas são confiáveis, mas a todo o processo de
raciocínio usado na produção de conclusões. Com base em nosso relatório de
pesquisa, um novo pesquisador deve ser capaz de duplicar nossos dados e traçar
a lógica pela qual chegamos às nossas conclusões. A replicabilidade é importante,
mesmo que ninguém realmente reproduza nosso estudo. Somente relatando o
estudo com detalhes suficientes para que ele possa ser replicado é possível avaliar
os procedimentos seguidos e os métodos utilizados.
A replicabilidade dos dados pode ser difícil ou impossível em alguns tipos de
pesquisa: os entrevistados podem morrer ou desaparecer e as observações diretas
de eventos do mundo real por testemunhas ou participantes não podem ser repetidas.
A replicabilidade também passou a significar coisas diferentes em diferentes
tradições de pesquisa. Na pesquisa quantitativa, os estudiosos se concentram em
replicar a análise depois de começar com os mesmos dados. Como qualquer
pessoa que já tentou replicar os resultados quantitativos até mesmo de trabalhos
publicados proeminentes sabe bem, geralmente é muito mais difícil do que deveria
ser e sempre mais valioso do que parece no início (ver Dewald et al. 1986 sobre
replicação em métodos quantitativos). pesquisar).
A analogia na pesquisa qualitativa tradicional é fornecida por notas de rodapé e
ensaios bibliográficos. Usando essas ferramentas, os estudiosos subsequentes
devem ser capazes de localizar as fontes usadas no trabalho publicado e fazer
suas próprias avaliações das inferências reivindicadas a partir dessas informações.
Para pesquisas baseadas em observação direta, a replicação é mais difícil.
Um estudioso poderia pegar emprestado as notas de campo de outro ou entrevistas
gravadas em fita para ver se elas apóiam as conclusões feitas pelo investigador
original. Uma vez que grande parte dos dados na pesquisa de campo envolve
conversas, impressões e outras informações participativas não registradas, essa
reanálise dos resultados usando os mesmos dados não é feita com frequência.
No entanto, alguns avanços importantes poderiam ser alcançados se mais
estudiosos tentassem esse tipo de replicação, e provavelmente também encorajaria
outros a manter notas de campo mais completas. Ocasionalmente, todo um projeto
de pesquisa, incluindo a coleta de dados, foi replicado. Como não podemos voltar
no tempo, a replicação não pode ser perfeita, mas pode ser bastante valiosa.
Talvez a replicação mais extensa de
11 Um exemplo é o uso de mais de um codificador para extrair informações sistemáticas de transcrições

de entrevistas em profundidade. Se duas pessoas usam as mesmas regras de codificação, podemos ver
com que frequência elas produzem o mesmo julgamento. Se eles não produzirem medidas confiáveis,
podemos tornar as regras de codificação mais precisas e tentar novamente. Eventualmente, muitas vezes
um conjunto de regras pode ser gerado para que a aplicação do mesmo procedimento por diferentes
codificadores produza o mesmo resultado.
um estudo qualitativo é o estudo sociológico de Middletown, Indiana, iniciado

por Robert e Helen Lynd. Seu primeiro estudo “Middletown” foi publicado em
1929 e foi replicado em um livro publicado em 1937.
Mais de cinquenta anos após o estudo original, uma longa série de livros e
artigos está sendo publicada, replicando esses estudos originais (ver Caplow
et al., 1983a, 1983b e as citações nele contidas). Toda replicação qualitativa
não precisa ser tão extensa, mas este grande projeto de pesquisa deve servir
como um exemplo do que é possível.
Toda pesquisa deve tentar alcançar o máximo de replicabilidade possível:
os estudiosos devem sempre registrar os métodos, regras e procedimentos
exatos usados para coletar informações e fazer inferências para que outro
pesquisador possa fazer a mesma coisa e extrair (espera-se) os resultados.
mesma conclusão. A replicabilidade também significa que os estudiosos que
usam registros não publicados ou privados devem se esforçar para garantir
que futuros estudiosos tenham acesso ao material em termos semelhantes;
aproveitar o acesso privilegiado sem buscar o acesso de outros impede a
replicação e põe em xeque a qualidade científica do trabalho. Normalmente
nosso trabalho não será replicado, mas temos a responsabilidade de agir como
se alguém desejasse fazê-lo. Mesmo que o trabalho não seja replicado,
fornecer os materiais para tal replicação permitirá que os leitores entendam e
avaliem o que fizemos.
1.2.4 Melhorando o uso de dados existentes
Corrigir problemas de dados por meio da coleta de dados novos e melhores é

quase sempre uma melhoria na tentativa de usar dados existentes e falhos de
maneiras melhores; no entanto, a primeira abordagem nem sempre é possível.
Os cientistas sociais muitas vezes se deparam com dados problemáticos e
poucas chances de adquirir algo melhor; assim, eles têm que fazer o melhor
com o que têm.
Melhorar o uso de dados previamente coletados é o principal tópico ensinado
nas aulas de métodos estatísticos e é, de fato, a principal contribuição da
estatística inferencial para as ciências sociais. Os preceitos sobre esse tema,
tão claros no estudo da estatística inferencial, também se aplicam à pesquisa
qualitativa. O restante deste livro trata desses preceitos mais completamente.
Aqui fornecemos apenas um breve esboço das diretrizes para melhorar o uso
dos dados coletados anteriormente.
Primeiro, sempre que possível, devemos usar os dados para gerar inferências
que sejam “imparciais”, ou seja, corretas na média. Para entender essa ideia
muito específica da pesquisa estatística, imagine aplicar a mesma metodologia
(em pesquisa quantitativa ou qualitativa) para analisar e tirar conclusões de
dados em muitos conjuntos de dados. Devido a pequenos erros nos dados ou
na aplicação do procedimento, uma única aplicação desta metodologia
provavelmente nunca seria exatamente
rect. Um procedimento “imparcial” estará correto quando tomado como uma

média em muitas aplicações – mesmo que nenhuma aplicação esteja correta.
O procedimento não inclinará sistematicamente o resultado em uma direção
ou outra.
Alcançar inferências imparciais depende, é claro, tanto da coleta original
dos dados quanto de seu uso posterior; e, como apontamos anteriormente,
é sempre melhor antecipar os problemas antes de iniciar a coleta de dados.
No entanto, mencionamos essas questões brevemente aqui porque, ao usar
os dados, precisamos ser particularmente cuidadosos para analisar se as
fontes de viés foram negligenciadas durante a coleta de dados. Uma dessas
fontes, que pode levar a inferências tendenciosas, é o viés de seleção:
escolher observações de uma maneira que distorça sistematicamente a
população da qual foram extraídas. Embora um exemplo óbvio seja a escolha
deliberada apenas de casos que apoiem nossa teoria, o viés de seleção
pode ocorrer de maneiras muito mais sutis. Outra dificuldade pode resultar
do viés de variável omitida, que se refere à exclusão de alguma variável de
controle que possa influenciar uma aparente conexão causal entre nossas
variáveis explicativas e aquilo que queremos explicar.
Discutimos essas e muitas outras armadilhas potenciais na produção de
inferências imparciais nos capítulos 2–6.
A segunda diretriz é baseada no conceito estatístico de “eficiência”: um
uso eficiente dos dados envolve maximizar as informações usadas para
inferência descritiva ou causal. Maximizar a eficiência requer não apenas
usar todos os nossos dados, mas também usar todas as informações
relevantes nos dados para melhorar as inferências. Por exemplo, se os dados
forem desagregados em pequenas unidades geográficas, devemos usá-los
dessa forma, não apenas como um agregado nacional. Os agregados
menores terão maiores graus de incerteza associados a eles, mas se forem,
pelo menos em parte, implicações observáveis da teoria, eles conterão
alguma informação que pode ser utilizada no problema de inferência.
1.3 TEMAS DESTE VOLUME
Concluímos este capítulo de visão geral destacando os quatro temas

importantes no desenvolvimento de projetos de pesquisa que discutimos aqui
e desenvolveremos ao longo deste livro.
1.3.1 Usando implicações observáveis para conectar teoria e dados

Neste capítulo, enfatizamos que toda teoria, para valer a pena, deve ter
implicações sobre as observações que esperamos encontrar se a teoria
estiver correta. Essas implicações observáveis da teoria
Temas deste volume · 29

deve orientar nossa coleta de dados e ajudar a distinguir fatos relevantes de
irrelevantes. No capítulo 2.6, discutimos como a teoria afeta a coleta de dados,
bem como como os dados disciplinam a imaginação teórica. Aqui, queremos
enfatizar que a teoria e a pesquisa empírica devem estar estreitamente
conectadas. Qualquer teoria que funcione de verdade para nós tem implicações
para a investigação empírica; nenhuma investigação empírica pode ser bem-
sucedida sem a teoria para guiar sua escolha de questões. A teoria e a coleta de
dados são aspectos essenciais do processo pelo qual procuramos decidir se uma
teoria deve ser provisoriamente considerada verdadeira ou falsa, sujeita como está
em ambos os casos à incerteza que caracteriza toda inferência.
Devemos perguntar a qualquer teoria: Quais são suas implicações observáveis?
Devemos perguntar sobre quaisquer investigações empíricas: as observações
são relevantes para as implicações de nossa teoria e, em caso afirmativo, o que
elas nos permitem inferir sobre a correção da teoria? Em qualquer estudo científico
social, as implicações da teoria e da observação dos fatos precisam se mesclar:
as conclusões das ciências sociais não podem ser consideradas confiáveis se não
forem baseadas em teoria e dados em forte conexão entre si e forjadas pela
formulação e examinar as implicações observáveis de uma teoria.
1.3.2 Maximizando a
alavancagem O estudioso que procura implicações adicionais de uma hipótese

está buscando uma das conquistas mais importantes de todas as ciências sociais:
explicar o máximo possível com o mínimo possível. A boa ciência social procura
aumentar o significado do que é explicado em relação à informação usada na
explicação. Se pudermos explicar com precisão o que a princípio parece ser um
efeito complicado com uma única variável causal ou algumas variáveis, a influência
que temos sobre um problema é muito alta. Por outro lado, se pudermos explicar
muitos efeitos com base em uma ou algumas variáveis, também teremos uma alta
alavancagem. A alavancagem é baixa nas ciências sociais em geral e ainda mais
em áreas específicas. Isso pode ocorrer porque os estudiosos ainda não sabem
como aumentá-la ou porque a natureza não está organizada de maneira
conveniente ou por ambas as razões. As áreas convencionalmente estudadas
qualitativamente são muitas vezes aquelas em que a alavancagem é baixa. A
explicação de qualquer coisa parece exigir uma infinidade de variáveis explicativas:
usamos muito para explicar pouco. Nesses casos, nosso objetivo deve ser projetar
pesquisas com mais alavancagem.
Existem várias maneiras pelas quais podemos aumentar nossa influência sobre
um problema de pesquisa. A maneira principal é aumentar o número de implicações
observáveis de nossa hipótese e buscar a confirmação dessas implicações. Como
descrevemos acima, esta tarefa pode envolver
(1) melhorar a teoria para que ela tenha implicações mais observáveis, (2)
melhorar os dados para que mais dessas implicações sejam realmente
observadas e usadas para avaliar a teoria e (3) melhorar o uso dos dados
para que mais essas implicações são extraídas de dados existentes. Nenhum
deles, nem o conceito geral de alavancagem maximizada, é o mesmo que o
conceito de parcimônia, que, como explicamos na seção 1.2.2, é uma
suposição sobre a natureza do mundo, e não uma regra para projetar
pesquisas.
Maximizar a alavancagem é tão importante e tão geral que recomendamos
enfaticamente que os pesquisadores listem rotineiramente todas as possíveis
implicações observáveis de suas hipóteses que possam ser observadas em
seus dados ou em outros dados. Pode ser possível testar algumas dessas
novas implicações no conjunto de dados original – desde que a implicação
não “saia” dos dados, mas seja uma hipótese sugerida independentemente
pela teoria ou por um conjunto de dados diferente. Mas é melhor ainda recorrer
a outros dados. Portanto, também devemos considerar as implicações que
podem aparecer em outros dados – como dados sobre outras unidades, dados
sobre outros aspectos das unidades em estudo, dados de diferentes níveis de
agregação e dados de outros períodos de tempo, como previsões sobre o
futuro próximo. — e avaliar a hipótese nessas configurações. Quanto mais
evidências pudermos encontrar em contextos variados, mais poderosa se
tornará nossa explicação e mais confiança nós e outros devemos ter em nossas conclusões.
À primeira vista, alguns pesquisadores podem se opor à ideia de coletar
implicações observáveis de qualquer fonte ou em qualquer nível de agregação
diferente daquele para o qual a teoria foi projetada. Por exemplo, Lieberson
(1985) aplica à pesquisa qualitativa a ideia estatística de “falácia ecológica” –
usando incorretamente dados agregados para fazer inferências sobre
indivíduos – para alertar contra a inferência entre níveis.12 Certamente
concordamos que podemos usar dados agregados fazer inferências incorretas
sobre indivíduos: se estivermos interessados em indivíduos, então estudá-los
geralmente é uma estratégia melhor se pudermos obter esses dados. No
entanto, se a inferência que procuramos fazer for mais do que uma hipótese
muito restrita, nossa teoria pode ter implicações em muitos níveis de análise,
e muitas vezes seremos capazes de usar dados de todos esses níveis para
fornecer algumas informações sobre nossa teoria. Assim, mesmo se estivermos
interessados principalmente em um nível agregado de análise, podemos
12 A expressão “falácia ecológica” é confusa porque o processo de raciocínio de
processos de nível agregado para individual não é ecológico nem uma falácia. “Ecológico”
é uma escolha infeliz de palavra para descrever o nível agregado de análise. Embora
Robinson (1990) tenha concluído em seu artigo original sobre esse tópico que usar a
análise agregada para raciocinar sobre indivíduos é uma falácia, cientistas sociais
quantitativos e estatísticos agora reconhecem amplamente que algumas informações
sobre indivíduos existem em níveis agregados de análise, e muitas métodos de inferência
“ecológica” imparcial foram desenvolvidos.
Temas deste Volume · 31

muitas vezes ganha vantagem sobre a veracidade de nossa teoria olhando para os
dados desses outros níveis.
Por exemplo, se desenvolvermos uma teoria para explicar as revoluções,
devemos procurar implicações observáveis dessa teoria não apenas em todos os
resultados, mas também em fenômenos como as respostas a entrevistas
aprofundadas de revolucionários, as reações de pessoas em pequenas
comunidades em partes menores do país e declarações oficiais de líderes
partidários. Devemos estar dispostos a aceitar qualquer informação que possamos
adquirir, desde que nos ajude a aprender sobre a veracidade de nossa teoria. Se
pudermos testar nossa teoria examinando os resultados das revoluções, tudo bem.
Mas, na maioria dos casos, existe muito pouca informação nesse nível, talvez
apenas uma ou algumas observações, e seus valores raramente são inequívocos
ou medidos sem erros. Muitas teorias diferentes são consistentes com a existência
de uma revolução. Somente aprofundando no presente caso, ou trazendo
informações relevantes existentes em outros casos, é possível distinguir entre
teorias anteriormente indistinguíveis.
A única questão em usar informações em outros níveis e de outras fontes para
estudar uma teoria projetada em um nível agregado é se essas novas observações
contêm alguma informação relevante para avaliar as implicações de nossa teoria.
Se essas novas observações ajudarem a testar nossa teoria, elas devem ser
usadas mesmo que não sejam as implicações de maior interesse. Por exemplo,
podemos não nos importar com os pontos de vista dos revolucionários, mas se
suas respostas às nossas perguntas forem consistentes com nossa teoria das
revoluções, então a teoria em si terá mais chances de estar correta e a coleta de
informações adicionais será têm sido úteis. Na verdade, uma observação no nível
mais agregado de análise de dados – a ocorrência de uma revolução prevista, por
exemplo – é meramente uma implicação observada da teoria e, devido à pequena
quantidade de informações nela contida, não deve ser privada. sobre outras
implicações observáveis. Precisamos coletar informações sobre o maior número
possível de implicações observáveis de nossa teoria.
1.3.3 Relatando a incerteza
Todo conhecimento e toda inferência – em pesquisas quantitativas e qualitativas –

é incerto. A medição qualitativa é propensa a erros, assim como a quantitativa, mas
as fontes de erro podem diferir. O entrevistador qualitativo conduzindo uma
entrevista longa e profunda com um entrevistado cujo histórico ele estudou tem
menos probabilidade de medir erroneamente a verdadeira ideologia política do
sujeito do que um pesquisador de pesquisa conduzindo uma entrevista estruturada
com um entrevistado selecionado aleatoriamente sobre o qual ele não sabe nada. .
(Embora o oposto também seja possível se, por exemplo, ele confiar muito em um
informante que não é confiável).
digno.) No entanto, é menos provável que o pesquisador de pesquisa generalize

inadequadamente a partir dos casos particulares entrevistados para a população
mais ampla do que o pesquisador aprofundado. Nenhum dos dois está imune
às incertezas da medição ou à natureza probabilística subjacente do mundo
social.
Todos os bons cientistas sociais - sejam nas tradições quantitativas ou
qualitativas - relatam estimativas da incerteza de suas inferências. Talvez o
problema mais sério com a pesquisa qualitativa em ciência política seja a falha
generalizada em fornecer estimativas razoáveis da incerteza das inferências do
investigador (ver King 1990). Podemos fazer uma inferência válida em quase
todas as situações, não importa quão limitadas sejam as evidências, seguindo
as regras deste livro, mas devemos evitar forjar conclusões precipitadas a partir
de dados fracos. A questão não é que inferências confiáveis sejam impossíveis
na pesquisa qualitativa, mas sim que devemos sempre relatar uma estimativa
razoável do grau de certeza que temos em cada uma de nossas inferências.
Neustadt e May (1986:274), lidando com áreas em que estimativas quantitativas
precisas são difíceis, propõem um método útil para encorajar os formuladores
de políticas (que muitas vezes se deparam com a necessidade de chegar a
conclusões sobre qual política seguir a partir de dados inadequados) a julgar a
incerteza de suas conclusões. Eles perguntam: “Quanto do seu próprio dinheiro
você apostaria nisso?” Isso faz sentido, desde que também perguntemos: "Com
que chances?"
1.3.4 Pensando como um cientista social: ceticismo

e hipóteses rivais
A incerteza das inferências causais significa que bons cientistas sociais não as
aceitam facilmente. Quando se diz que A causa B, alguém que “pensa como um
cientista social” pergunta se essa conexão é realmente causal. É fácil fazer
essas perguntas sobre a pesquisa de outras pessoas, mas é mais importante
perguntar sobre nossa própria pesquisa. Existem muitas razões pelas quais
podemos ser céticos em relação a uma explicação causal, embora pareça
plausível à primeira vista. Lemos no jornal que os japoneses comem menos
carne vermelha e têm menos ataques cardíacos do que os americanos. Esta
observação por si só é interessante. Além disso, a explicação – bife demais
leva ao alto índice de doenças cardíacas nos Estados Unidos – é plausível. O
cientista social cético pergunta sobre a precisão dos dados (como sabemos
sobre os hábitos alimentares? que amostra foi usada? os ataques cardíacos
são classificados de maneira semelhante no Japão e nos Estados Unidos, de
modo que estamos comparando fenômenos semelhantes?). Supondo que os
dados sejam precisos, o que mais poderia explicar os efeitos: existem outras
variáveis (outras diferenças dietéticas, características genéticas, condições de vida?
Temas deste Volume · 33
características de estilo) que possam explicar o resultado? Poderíamos ter

invertido causa e efeito intencionalmente? É difícil imaginar como não ter um
ataque cardíaco pode fazer com que alguém coma menos carne vermelha, mas
é possível. Talvez as pessoas percam o apetite por hambúrgueres e bifes mais
tarde na vida. Se fosse esse o caso, quem não tivesse um ataque cardíaco (por
qualquer motivo) viveria mais e comeria menos carne. Esse fato produziria a
mesma relação que levou os pesquisadores a concluir que a carne era a
culpada dos ataques cardíacos.
Não é nosso propósito questionar tais estudos médicos.
Em vez disso, desejamos apenas ilustrar como os cientistas sociais abordam a
questão da inferência causal: com ceticismo e uma preocupação com
explicações alternativas que podem ter sido negligenciadas. A inferência causal
torna-se, assim, um processo pelo qual cada conclusão se torna a ocasião para
pesquisas adicionais para refiná-la e testá-la. Por meio de aproximações
sucessivas, tentamos chegar cada vez mais perto de uma inferência causal precisa.
CAPÍTULO 2
Inferência Descritiva
A PESQUISA EM CIÊNCIAS SOCIAIS, seja quantitativa ou qualitativa, envolve

os objetivos duplos de descrever e explicar. Alguns estudiosos começaram a
descrever o mundo; outros para explicar. Cada um é essencial. Não podemos
construir explicações causais significativas sem uma boa descrição; a descrição,
por sua vez, perde a maior parte de seu interesse a menos que esteja vinculada
a algumas relações causais. A descrição geralmente vem primeiro; é difícil
desenvolver explicações antes de sabermos algo sobre o mundo e o que precisa
ser explicado com base em quais características. Mas a relação entre descrição
e explicação é interativa. Algumas vezes nossas explicações nos levam a
buscar descrições de diferentes partes do mundo; inversamente, nossas
descrições podem levar a novas explicações causais.
A descrição e a explicação dependem de regras de inferência científica. Neste

capítulo, nos concentramos na descrição e na inferência descritiva. A descrição
está longe de ser mecânica ou sem problemas, pois envolve a seleção de um
número infinito de fatos que poderiam ser registrados. Existem vários aspectos
fundamentais da descrição científica.
Uma é que envolve inferência: parte da tarefa descritiva é inferir informações
sobre fatos não observados a partir dos fatos que observamos.
Outro aspecto envolve a distinção entre o que é sistemático sobre os fatos
observados e o que é não sistemático.
Como deve ficar claro, discordamos daqueles que denigrem a “mera”
descrição. Mesmo que a explicação – conectar causas e efeitos – seja o objetivo
final, a descrição tem um papel central em toda explicação e é fundamentalmente
importante por si só. Não é a descrição versus explicação que distingue a
pesquisa científica de outras pesquisas; é se a inferência sistemática é
conduzida de acordo com procedimentos válidos. A inferência, seja descritiva
ou causal, quantitativa ou qualitativa, é o objetivo final de toda boa ciência
social. A coleta sistemática de fatos é um esforço muito importante sem o qual
a ciência não seria possível, mas que por si só não constitui ciência. Um bom
trabalho de arquivo ou resumos bem feitos de fatos históricos podem constituir
uma boa história descritiva, mas nenhum deles é suficiente para constituir
ciência social.
Neste capítulo, distinguimos a descrição — a coleção de fatos — da inferência

descritiva. Na seção 2.1 discutimos a relação
Conhecimentos Gerais e Fatos Particulares · 35

entre os objetivos aparentemente contraditórios da erudição: descobrir
conhecimento geral e aprender sobre fatos particulares. Podemos então
explicar com mais detalhes o conceito de inferência na seção 2.2.
Nossa abordagem no restante do livro é apresentar ideias verbalmente e por
meio de modelos algébricos muito simples de pesquisa. Na seção 2.3
consideramos a natureza desses modelos. Em seguida, discutimos modelos
para coleta de dados, para resumir detalhes históricos e para inferência
descritiva nas seções 2.4, 2.5 e 2.6, respectivamente. Finalmente, fornecemos
alguns critérios específicos para julgar inferências descritivas na seção 2.7.
2.1 CONHECIMENTO GERAL E FATOS PARTICULARES
O mundo que os cientistas sociais estudam é feito de particulares: eleitores

individuais, agências governamentais específicas, cidades específicas, tribos,
grupos, estados, províncias e nações. A boa ciência social tenta ir além
desses detalhes para um conhecimento mais geral. A generalização,
entretanto, não elimina a importância do particular. Na verdade, o próprio
propósito de passar do particular para o geral é melhorar nossa compreensão
de ambos. As entidades específicas do mundo social – ou, mais precisamente,
fatos específicos sobre essas entidades – fornecem a base sobre a qual as
generalizações devem se apoiar. Além disso, quase sempre aprendemos
mais sobre um caso específico estudando conclusões mais gerais. Se
quisermos saber por que o ministro das Relações Exteriores do Brasil
renunciou, será útil saber por que outros ministros renunciaram no Brasil,
por que os ministros das Relações Exteriores de outros países renunciaram
ou por que as pessoas em geral renunciam a empregos governamentais ou mesmo não-governamentais.
Cada um deles nos ajudará a entender diferentes tipos de fatos e princípios
gerais do comportamento humano, mas eles são muito importantes mesmo
que nosso único objetivo seja entender por que o mais recente chanceler
brasileiro renunciou. Por exemplo, ao estudar outros ministros, podemos
descobrir que todos os ministros do Brasil renunciaram para protestar contra
as ações do presidente, algo que talvez não tenhamos percebido examinando
apenas as ações do chanceler.
Algumas pesquisas em ciências sociais tentam dizer algo sobre uma
classe de eventos ou unidades sem dizer nada em particular sobre um
evento ou unidade específica. Estudos de comportamento eleitoral usando
pesquisas de massa explicam as decisões de voto das pessoas em geral,
não o voto de qualquer indivíduo em particular. Estudos de finanças do
Congresso explicam o efeito do dinheiro nos resultados eleitorais em todos
os distritos do Congresso. A maioria desses estudos não mencionaria o
Sétimo Distrito Congressional na Pensilvânia ou qualquer outro distrito,
exceto, talvez, de passagem ou como exceções a uma regra geral. Esses estudos seguem a liminar de
36 · Inferência Descritiva
Przeworski e Teune (1982): eliminar nomes próprios. No entanto, embora
esses estudos possam não buscar entender nenhum distrito em particular,
eles não devem ignorar - como às vezes infelizmente é feito nesta tradição -
a exigência de que os fatos sobre os vários distritos que entram na análise
geral devem ser precisos.
Outras pesquisas tentam nos dizer algo sobre uma determinada postura.
Ele se concentra na Revolução Francesa ou em algum outro evento
“importante” e tenta fornecer uma explicação de como ou por que esse
evento ocorreu. A pesquisa nesta tradição seria impensável - certamente
desinteressante para a maioria dos leitores habituais de tal pesquisa - sem
nomes próprios. Um cientista político pode escrever efetivamente sobre os
padrões de relacionamento em todo o conjunto de campanhas do Congresso
sem olhar para distritos ou candidatos específicos, mas imagine a discussão
de Robert Caro (1983) sobre a corrida para o Senado em 1948 no Texas
sem Lyndon Johnson e Coke Stevenson.1 Eventos particulares como a
Revolução Francesa ou as primárias do Senado democrata no Texas em
1948 podem de fato ser de interesse intrínseco: eles despertam nossa
curiosidade e, se foram pré-condições para eventos subsequentes (como
as Guerras Napoleônicas ou a presidência de Johnson), podemos precisar
saber sobre eles para entender esses eventos posteriores. Além disso, o
conhecimento sobre revolução, rebelião ou guerra civil em geral fornecerá
informações valiosas para qualquer estudo mais focado das causas da
Revolução Francesa em particular.
Consideraremos essas questões discutindo a “interpretação”, uma alegada
alternativa à inferência científica (seção 2.1.1); os conceitos de singularidade
e complexidade do objeto de estudo (seção 2.1.2); e a área geral de estudos
de caso comparativos (seção 2.1.3).
2.1.1 “Interpretação” e Inferência

Nas ciências humanas, alguns pesquisadores históricos e antropológicos
afirmam buscar apenas o conhecimento específico por meio do que chamam
de “interpretação”. Os interpretativistas buscam resumos precisos de
detalhes históricos. Eles também procuram colocar os eventos que
descrevem em um contexto inteligível dentro do qual o significado das ações
se torna explicável. Como Ferejohn (em Goldstein e Keohane 1993:228) escreveu: “Queremos
1 Tampouco podemos descartar Caro como alguém em outro ramo: uma jornalista/biógrafa
cujo objetivo difere daquele do cientista social. Seu trabalho aborda algumas das mesmas
questões que um cientista político abordaria: o que leva ao sucesso ou ao fracasso em uma
campanha eleitoral? Qual é o papel do dinheiro e do financiamento de campanha no sucesso
eleitoral? O que motiva os colaboradores da campanha? A discussão se concentra em uma
candidatura específica em um distrito específico, mas o assunto e os quebra-cabeças colocados
se sobrepõem à ciência política padrão.

teorias das ciências sociais para fornecer explicações causais de eventos. . .
[e] dar conta das razões ou significados da ação social.
Queremos saber não apenas o que levou o agente a realizar algum ato, mas
também as razões do agente para praticar a ação.” Geertz (1973:17) também
escreve que “não é do nosso interesse descorar o comportamento humano das
próprias propriedades que nos interessam antes de começarmos a examiná-lo”.
Estudiosos que enfatizam a “interpretação” buscam iluminar os aspectos
intencionais do comportamento humano empregando Verstehen (“em phathy:
compreensão do significado das ações e interações dos próprios pontos de
vista dos membros” [Eckstein 1975:81]). Os interpretativistas procuram explicar
as razões da ação intencional em relação a todo o conjunto de conceitos e
práticas em que ela está inserida. Eles também empregam padrões de
avaliação: “Os padrões mais óbvios são coerência e escopo: um relato
interpretativo deve fornecer coerência ou inteligibilidade máxima a um conjunto
de práticas sociais, e um relato interpretativo de um conjunto particular de
práticas deve ser consistente com outros. práticas ou tradições da
sociedade” (Moon 1975: 173).
Talvez a recomendação operacional mais importante dos interpretativistas
seja que os pesquisadores devem aprender muito sobre uma cultura antes de
formular questões de pesquisa. Pois somente com uma profunda imersão
cultural e compreensão de um assunto um pesquisador pode fazer as perguntas
certas e formular hipóteses úteis. Por exemplo, Duneier (1993) estudou a vida
coletiva de homens negros e brancos da classe trabalhadora em uma cafeteria
integrada em Chicago. Ao mergulhar nessa cultura local por quatro anos, ele
percebeu vários quebra-cabeças que antes não lhe haviam ocorrido. Por
exemplo, ele observou que, embora esses homens fossem altamente
antagônicos ao Partido Republicano, eles articulavam posições socialmente
conservadoras em muitas questões.
Alguns estudiosos levam o papel da interpretação ainda mais longe,
chegando ao ponto de sugerir que é um paradigma de investigação totalmente
diferente para as ciências sociais, “não uma ciência experimental em busca da
lei, mas uma ciência interpretativa em busca de significado” (Geertz 1973:5).
Em nossa opinião, no entanto, a ciência (como a definimos na seção 1.1.2) e
a interpretação não são empreendimentos fundamentalmente diferentes
voltados para objetivos divergentes. Ambos se baseiam na preparação de
descrições cuidadosas, na compreensão profunda do mundo, na formulação de
boas perguntas, na formulação de hipóteses falsificáveis com base em teorias
mais gerais e na coleta das evidências necessárias para avaliar essas
hipóteses. A contribuição distintiva da ciência é apresentar um conjunto de
procedimentos para descobrir as respostas para questões descritivas e causais adequadamente enquadradas.
Nossa ênfase na metodologia de inferência não pretende denegrir o
significado do processo pelo qual perguntas frutíferas são formuladas. Pelo
contrário, concordamos com os interpretativistas que
é crucial entender profundamente uma cultura antes de formular hipóteses

ou projetar um projeto de pesquisa sistemática para encontrar uma
resposta. Queremos apenas acrescentar que a avaliação da veracidade
de afirmações com base em métodos como a observação participante só
pode ser realizada por meio da lógica da inferência científica, que
descrevemos. Encontrar as respostas certas para as perguntas erradas é
uma atividade inútil. A interpretação baseada em Verstehen costuma ser
uma rica fonte de hipóteses perspicazes. Por exemplo, as observações
de Richard Fenno do Congresso (Fenno 1978), feitas por meio do que ele
chama de “encharcar e cutucar”, deram grandes contribuições ao estudo
dessa instituição, particularmente ajudando a formular melhores questões
para pesquisa. “Soaking and cutucando”, diz Putnam em um estudo sobre
as regiões italianas (1993:12), “exige que o pesquisador se marinhe nas
minúcias de uma instituição – para experimentar seus costumes e práticas,
seus sucessos e fracassos, como aqueles que viva todos os dias faça.
Essa imersão aguça nossas intuições e fornece inúmeras pistas sobre
como a instituição se encaixa e como se adapta ao seu ambiente.”
Qualquer definição de ciência que não inclua espaço para ideias sobre a
geração de hipóteses é tão tola quanto um relato interpretativo que não
se preocupa em descobrir a verdade.
No entanto, uma vez formuladas as hipóteses, demonstrar sua correção
(com uma estimativa de incerteza) requer inferências científicas válidas.
Além disso, os procedimentos de inferência seguidos por cientistas sociais
interpretativistas devem incorporar os mesmos padrões seguidos por
outros pesquisadores qualitativos e quantitativos. Ou seja, embora
concordemos que uma boa ciência social requer uma interpretação
perspicaz ou outros métodos para gerar boas hipóteses, também insistimos
que a ciência é essencial para uma interpretação precisa. Se pudéssemos
entender o comportamento humano apenas por meio de Verstehen, nunca
seríamos capazes de falsificar nossas hipóteses descritivas ou fornecer
evidências para elas além de nossa experiência. Nossas conclusões
nunca passariam do status de hipóteses não testadas, e nossas
interpretações permaneceriam pessoais e não científicas.
Um dos melhores e mais famosos exemplos na tradição interpretativa
é a análise de Clifford Geertz da discussão de Gilbert Ryle sobre a
diferença entre uma contração e uma piscadela. Geertz (1973:6) escreve
Considere. . . dois meninos contraindo rapidamente as pálpebras do olho direito. Em

um, trata-se de uma contração involuntária; no outro, um sinal conspiratório para um
amigo. Os dois movimentos são, como movimentos, idênticos; a partir de uma
câmera do tipo eu-sou-uma, observação “fenomenalística” apenas deles, não se
poderia dizer qual era contração e qual era piscadela, ou mesmo se ambas ou uma
delas era contração ou piscadela. No entanto, a diferença, por mais impossível de ser fotografada,
entre uma contração e uma piscadela é vasto; como qualquer pessoa infeliz o
suficiente para ter o primeiro levado para o segundo sabe. O pisca-pisca está
se comunicando, e de fato se comunicando de maneira precisa e especial: (1)
deliberadamente, (2) para alguém em particular, (3) para transmitir uma
mensagem específica, (4) de acordo com um código socialmente estabelecido
e (5) ) sem conhecimento do restante da empresa. Como aponta Ryle, o
piscador fez duas coisas, contraiu as pálpebras e piscou, enquanto o
estremecido fez apenas uma, contraiu as pálpebras. Contrair as pálpebras de
propósito quando existe um código público em que isso conta como sinal de conspiração é piscar.
Geertz está levantando uma questão conceitual importante. Sem o conceito

de “piscar”, dado significado por uma teoria da comunicação, o estudo
quantitativo mais preciso da “contração das pálpebras por seres humanos” não
teria sentido para os estudiosos das relações sociais. Neste exemplo, a teoria,
que emergiu de meses de “imersão e cutucada” e estudo cultural detalhado, é
essencial para a questão adequada de saber se a contração da pálpebra
poderia ser “contrações” ou “piscadas”. A magnífica importância da interpretação
sugerida por esse exemplo é clara: ele fornece novas formas de ver o mundo
— novos conceitos a serem considerados e hipóteses a serem avaliadas. Sem
imersão profunda em uma situação, podemos nem pensar nas teorias certas
para avaliar. No presente exemplo, se não pensássemos na diferença entre
twiches e winks, tudo estaria perdido. Se a interpretação – ou qualquer outra
coisa – nos ajuda a chegar a novos conceitos ou hipóteses, então ela é
inquestionavelmente útil, e a interpretação e formas similares de compreensão
cultural detalhada foram comprovadas repetidas vezes.
Tendo feito uma distinção teórica relevante, como aquela entre uma piscadela
e uma contração, o pesquisador precisa então avaliar a hipótese de que está
ocorrendo uma piscadela. É nessa avaliação que a lógica da inferência científica
é insuperável. Ou seja, a melhor forma de determinar o significado das
contrações palpebrais é por meio dos métodos sistemáticos descritos neste
livro. Se distinguir uma contração de uma piscadela fosse fundamental,
poderíamos facilmente projetar um procedimento de pesquisa para fazê-lo. Se,
por exemplo, acreditamos que determinadas contrações palpebrais são
piscadelas imbuídas de significado político, então outros casos semelhantes
também devem ser observados, uma vez que um sofisticado dispositivo de
sinalização como este (um “código público”), uma vez desenvolvido,
provavelmente ser usado novamente. Dada essa probabilidade, podemos
registrar todos os casos em que a pálpebra desse ator se contrai, observar se
o outro ator-chave está olhando no momento certo e se ele responde.
Poderíamos até planejar uma série de experimentos para ver se os indivíduos
dessa cultura estão acostumados a se comunicar dessa maneira. Compreender a cultura, cuidadosamente de-
descrever o evento e ter uma profunda familiaridade com situações
semelhantes nos ajudará a fazer as perguntas certas e até mesmo nos dará
confiança adicional em nossas conclusões. Mas somente com os métodos de
inferência científica poderemos avaliar a hipótese e ver se ela está correta.
A interpretação da piscadela de Geertz é melhor expressa como uma

hipótese causal (que definimos precisamente na seção 3.1): o efeito causal
hipotético da piscadela no outro ator político é a resposta do outro ator dada a
contração da pálpebra menos sua resposta se não houvesse movimento
mento (e nenhuma outra alteração). Se a contração da pálpebra fosse uma
piscadela, o efeito causal seria positivo; se fosse apenas uma contração, o
efeito causal seria zero. Se decidíssemos estimar esse efeito causal (e, assim,
descobrir se foi uma piscadela ou uma contração), todos os problemas de
inferência discutidos extensamente no restante deste livro precisariam ser
entendidos se quiséssemos chegar à melhor solução. inferência a respeito da
interpretação do comportamento observado.
Se o que interpretamos como piscadelas fossem realmente espasmos
involuntários, nossas tentativas de derivar inferências causais sobre a
contração das pálpebras com base em uma teoria de interação social
voluntária seriam rotineiramente malsucedidas: não seríamos capazes de
generalizar
e saberíamos disso.2 Projetar pesquisas para distinguir piscadelas e
espasmos provavelmente não é uma parte importante da maioria das pesquisas
em ciência política, mas a mesma questão metodológica surge em grande
parte da área de estudo em que os cientistas políticos trabalham. Muitas vezes
somos chamados a interpretar o significado de um ato. Os tomadores de
decisão da política externa enviam mensagens uns aos outros. Uma mensagem
específica é uma ameaça, um ponto de negociação, uma declaração destinada
a atrair um público doméstico? O conhecimento das normas culturais, das
convenções nas comunicações internacionais e da história de determinados
atores, bem como a observação atenta das características auxiliares da
comunicação, nos ajudarão a fazer tal interpretação. Ou considere o seguinte
quebra-cabeça na pesquisa quantitativa: os eleitores nos Estados Unidos
parecem estar enviando uma mensagem ao não comparecer às urnas. Mas o
que significa a baixa participação? Reflete a alienação com o sistema político?
Um cálculo dos custos e benefícios de votar com os custos sendo maiores?
Decepção com datas recentes de candidatos ou campanhas recentes? Poderia
ser uma consequência de uma mudança na idade mínima para votar? Ou um sinal de que nada está suficientemente em alta
2 Por uma questão de completude, vale a pena notar que poderíamos imaginar uma teoria
totalmente diferente na qual uma contração da pálpebra não fosse uma piscadela, mas ainda
assim tivesse um efeito causal sobre outros atores. Por exemplo, a contração pode ter sido mal
interpretada. Se também estivéssemos interessados em saber se a pessoa com contração
palpebral pretendia piscar, precisaríamos procurar outras consequências observáveis dessa mesma teoria.

para levá-los às urnas? A decisão de um cidadão de não votar, como uma piscadela
ou uma mensagem diplomática, pode significar muitas coisas. O pesquisador
sofisticado deve sempre trabalhar duro para fazer as perguntas certas e, em
seguida, planejar cuidadosamente a pesquisa científica para descobrir o que o ato
ambíguo de fato significou.
Também gostaríamos de abordar brevemente as reivindicações extremas de
alguns proponentes da interpretação que argumentam que o objetivo de algumas
pesquisas deve ser sentimentos e significados sem consequências observáveis.
Esta não é uma caracterização justa de todos, exceto de uma pequena minoria de
pesquisadores nesta tradição, mas as reivindicações são feitas com força suficiente
para que pareçam valer a pena abordá-las explicitamente. Como as alegações
excessivamente entusiasmadas dos primeiros positivistas, que assumiram a posição
insustentável de que conceitos inobserváveis não tinham lugar na pesquisa
científica, esses argumentos acabaram sendo inadequados para a pesquisa
empírica. Por exemplo, Psathas (1968:510) argumenta que
qualquer comportamento centrado apenas naquela parte que é aberta e

manifestada em atos concretos e diretamente observáveis é ingênuo, para dizer
o mínimo. O desafio para o cientista social que busca entender a realidade
social, então, é entender o significado que o ato do ator tem para ele.
Os psathas podem estar corretos ao dizer que os cientistas sociais que se
concentram apenas em comportamentos evidentes e observáveis estão perdendo
muito, mas como podemos saber se não podemos ver? Por exemplo, se duas
teorias de autoconcepção têm manifestações observáveis idênticas, então nenhum
observador terá informação suficiente para distinguir as duas. Isso é verdade, não
importa quão inteligente ou culturalmente sensível seja o observador, quão habilidoso
ele seja na interpretação, quão bem ele “coloca entre parênteses” suas próprias
pressuposições, ou quão arduamente ele tente. Interpretação, sentimento, descrição
densa, observação participante, observação não participante, entrevista em
profundidade, empatia, quantificação e análise estatística e todos os outros
procedimentos e métodos são inadequados para a tarefa de distinguir duas teorias
sem consequências observáveis diferentes. Por outro lado, se as duas teorias têm
algumas manifestações observáveis que diferem, então os métodos que
descrevemos neste livro fornecem maneiras de distinguir entre elas.
Na prática, os etnógrafos (e todos os outros bons cientistas sociais) procuram o
comportamento observável para distinguir entre suas teorias. Eles podem mergulhar
na cultura, mas todos contam com várias formas de observação. Qualquer
“compreensão” adicional do contexto cultural vem diretamente dessas ou de outras
observações comparáveis. Identificar observações relevantes nem sempre é fácil.
Pelo contrário, encontrar as observações apropriadas é talvez a parte mais difícil
de um projeto de pesquisa, especialmente (e necessariamente) para as áreas de
investigação tradicionalmente dominadas pela pesquisa qualitativa.
2.1.2 “Singularidade”, Complexidade e Simplificação
Alguns pesquisadores orientados qualitativamente rejeitariam a posição de que

o conhecimento geral é necessário ou útil (talvez até possível) como base para
a compreensão de um evento particular. A posição deles é que os eventos ou
unidades que estudam são “únicos”. Em certo sentido, eles estão certos. Houve
apenas uma Revolução Francesa e há apenas uma Tailândia. E ninguém que
tenha lido os relatos biográficos ou que tenha vivido a década de 1960 pode
duvidar do fato de que houve apenas um Lyndon B. Johnson. Mas eles vão
mais longe. A explicação, de acordo com sua posição, limita-se a esse único
evento ou unidade: não por que as revoluções acontecem, mas por que a
Revolução Francesa aconteceu; não por que a democratização às vezes
parece atrasar, mas por que ela atrasa na Tailândia; não por que os candidatos
vencem, mas por que LBJ venceu em 1948 ou 1964. Os pesquisadores dessa
tradição acreditam que perderiam a capacidade de explicar o específico se
tentassem lidar com o geral - com revoluções, democratização ou primárias
senatoriais.
“Singularidade”, no entanto, é um termo enganoso. A Revolução Francesa e
a Tailândia e LBJ são, de fato, únicas. Todos os fenômenos, todos os eventos,
são em certo sentido únicos. A Revolução Francesa certamente foi; mas também
foi a eleição para o Congresso no Sétimo Distrito da Pensilvânia em 1988 e
também foi a decisão de voto de cada um dos milhões de eleitores que votaram
na eleição presidencial daquele ano.
Visto de forma holística, cada aspecto da realidade social é infinitamente
complexo e conectado de alguma forma a eventos naturais e sociológicos
anteriores. A singularidade inerente, portanto, faz parte da condição humana:
ela não distingue situações passíveis de generalizações científicas daquelas
sobre as quais generalizações não são possíveis. De fato, como mostramos ao
discutir as teorias da extinção dos dinossauros no capítulo 1, até mesmo eventos
únicos podem ser estudados cientificamente prestando atenção às implicações
observáveis das teorias desenvolvidas para explicá-los.
A verdadeira questão levantada pela questão da singularidade é o problema
da complexidade. A questão não é se os eventos são inerentemente únicos,
mas se as características-chave da realidade social que queremos entender
podem ser abstraídas de uma massa de fatos. Uma das primeiras e mais difíceis
tarefas da pesquisa em ciências sociais é esse ato de simplificação. É uma
tarefa que nos torna vulneráveis à crítica da simplificação e da omissão de
aspectos significativos da situação. No entanto, tal simplificação é inevitável
para todos os pesquisadores. A simplificação tem sido parte integrante de todos
os trabalhos acadêmicos conhecidos – quantitativos e qualitativos, antropológicos
e econômicos, nas ciências sociais e nas ciências naturais e físicas – e
provavelmente

maneiras de ser. Mesmo a descrição mais abrangente feita pelos melhores intérpretes
culturais com a compreensão contextual mais detalhada simplificará, reificará e
reduzirá drasticamente a realidade observada. De fato, a diferença entre a quantidade
de complexidade no mundo e a mais densa das descrições ainda é muito maior do
que a diferença entre essa mais densa das descrições e a análise quantitativa ou
formal mais abstrata. Nenhuma descrição, não importa o quão densa seja, e nenhuma
explicação, não importa quantos fatores explanatórios sejam incluídos, chega perto
de capturar toda a realidade “florescente e vibrante” do mundo. Não há escolha a não
ser simplificar. A simplificação sistemática é um passo crucial para o conhecimento
útil. Como disse um historiador econômico, se a ênfase na singularidade “é levada ao
extremo de ignorar todas as regularidades, a própria possibilidade da ciência social é
negada e os historiadores são reduzidos à falta de objetivo dos baladeiros” (Jones
1981:160).
Sempre que possível, os analistas devem simplificar suas descrições somente

depois de obterem uma compreensão da riqueza da história e da cultura. Os
cientistas sociais podem usar apenas algumas partes da história de algum conjunto
de eventos para fazer inferências. No entanto, um conhecimento rico e não estruturado
do contexto histórico e cultural dos fenômenos com os quais eles querem lidar de
forma simplificada e científica costuma ser um requisito para evitar simplificações
simplesmente erradas. Poucos de nós confiariam nas generalizações de um cientista
social sobre revoluções ou eleições senatoriais se esse investigador soubesse pouco
e se importasse menos com a Revolução Francesa ou a eleição de 1948 no Texas.
Em suma, acreditamos que, sempre que possível, a pesquisa em ciências sociais

deve ser geral e específica: ela deve nos dizer algo sobre classes de eventos, bem
como sobre eventos específicos em lugares particulares.
Queremos ser atemporais e limitados ao tempo ao mesmo tempo. A ênfase em
qualquer um dos objetivos pode variar de empreendimento de pesquisa para
empreendimento de pesquisa, mas é provável que ambos estejam presentes. Além
disso, ao invés de os dois objetivos serem opostos um ao outro, eles se apoiam
mutuamente. De fato, a melhor maneira de entender um determinado evento pode
ser usando os métodos de inferência científica também para estudar padrões
sistemáticos em eventos paralelos semelhantes.
2.1.3 Estudos de caso comparativos
Muito do que os cientistas políticos fazem é descrever sistematicamente eventos

politicamente importantes. As pessoas se preocupam com o colapso da União
Soviética, com as reações do público nos países árabes à guerra autorizada pela
ONU para expulsar o Iraque do Kuwait e com os resultados das últimas eleições
para o Congresso nos Estados Unidos. E eles confiam na ciência política
busca descrições que reflitam uma consciência mais abrangente da relação
entre esses e outros eventos relevantes – contemporâneos e históricos – do
que os relatos jornalísticos. Nossas descrições de eventos devem ser tão
precisas e sistemáticas quanto possível.
Isso significa que, quando formos capazes de encontrar medidas quantitativas
válidas do que queremos saber, devemos usá-las: que proporção de jornais
soviéticos critica a política do governo? O que as pesquisas de opinião pública
na Jordânia e no Egito revelam sobre as atitudes da Jordânia e do Egito em
relação à Guerra do Golfo? Que porcentagem dos parlamentares em exercício
foram reeleitos?
Se a quantificação produz precisão, ela não necessariamente encoraja a
exatidão, uma vez que inventar índices quantitativos que não se relacionam
intimamente com os conceitos ou eventos que pretendemos medir pode levar a
sérios erros de medição e problemas para inferência causal (ver seção 5.1). Da
mesma forma, existem maneiras mais e menos precisas de descrever eventos
que não podem ser quantificados. Pesquisadores qualitativos disciplinados
tentam analisar cuidadosamente constituições e leis, em vez de meramente
relatar o que os observadores dizem sobre elas. Ao fazer estudos de caso de
políticas governamentais, os pesquisadores fazem a seus informantes perguntas
incisivas e bem especificadas, cujas respostas serão relativamente inequívocas,
e eles acompanham sistematicamente comentários improvisados feitos por um
entrevistado que sugerem hipóteses relevantes. Os estudos de caso são
essenciais para a descrição e são, portanto, fundamentais para a ciência social.
É inútil tentar explicar o que não descrevemos com um grau razoável de precisão.
Fornecer uma descrição perspicaz de eventos complexos não é uma tarefa

trivial. Em campos como política comparada ou relações internacionais, o
trabalho descritivo é particularmente importante porque ainda há muito que
precisamos saber, porque nossas habilidades explicativas são fracas e porque
uma boa descrição depende em parte de uma boa explicação. Algumas das
fontes de nossa necessidade de conhecimento e fraqueza explicativa são as
mesmas: na política mundial, por exemplo, padrões de poder, alinhamentos e
interdependência internacional têm mudado rapidamente recentemente, ambos
aumentando a necessidade de uma boa descrição de novas situações e
alterando o contexto sistêmico dentro do qual ocorrem as interações observadas
entre os estados. Uma vez que os estados e outros atores procuram antecipar
e contrariar as ações dos outros, a causalidade é muitas vezes difícil de
estabelecer, e as expectativas podem desempenhar um papel tão importante
quanto as ações observadas na explicação do comportamento do estado. Uma
suposta explicação de algum aspecto da política mundial que assume a ausência
de interação estratégica e reações antecipadas será muito menos útil do que
uma descrição cuidadosa que se concentra em eventos que temos motivos para acreditar que são.

importantes e interligados. Uma boa descrição é melhor do que uma explicação
ruim.
Uma das vantagens frequentemente negligenciadas do método de estudo de
caso aprofundado é que o desenvolvimento de boas hipóteses causais é
complementar a uma boa descrição, em vez de competir com ela. Enquadrar
um estudo de caso em torno de uma questão explicativa pode levar a uma
descrição mais focada e relevante, mesmo que o estudo seja frustrado em sua
tentativa de fornecer até mesmo uma única inferência causal válida.
Estudos de caso comparativos podem, argumentamos, produzir inferências
causais válidas quando os procedimentos descritos no restante deste livro são
usados, embora, conforme praticados atualmente, muitas vezes não atendam
aos padrões de inferência válida (que explicamos no capítulo 3). . De fato, muito
do que é chamado de trabalho “explicativo” por cientistas sociais historicamente
orientados ou interpretativos permanece essencialmente descritivo porque não
atende a esses padrões universalmente aplicáveis. A partir dessa perspectiva,
é fundamental o conselho de vários estudiosos de que os estudos de caso
comparativos devem ser mais sistemáticos para descrição ou explicação.
Por exemplo, Alexander George recomenda um método de “comparação

estruturada e focada” que enfatize a disciplina na forma como se coleta dados
(George e McKeown 1985; ver também Verba 1967).
George e seus colaboradores enfatizam a necessidade de uma coleta sistemática
das mesmas informações – as mesmas variáveis – em unidades cuidadosamente
selecionadas. E eles enfatizam a necessidade de orientação teórica - para fazer
perguntas explicativas cuidadosamente pensadas - a fim de realizar essa
descrição sistemática, se a inferência causal for possível.3
O método de comparação estruturada e focada é uma maneira sistemática

de empregar o que George e McKeown chamam de procedimento de congruência.
Usando esse método, o investigador “define e padroniza os requisitos de dados
dos estudos de caso. . . formulando questões gerais teoricamente relevantes
para guiar o exame de cada caso” (George e McKeown 1985:41). O argumento
de George e McKeown (1985: 43) é bem aceito: “A comparação controlada de
um n pequeno deve seguir um procedimento de compilação sistemática de
dados”. Essa “comparação focada estruturada” requer a coleta de dados sobre
as mesmas variáveis nas unidades. Assim, não é um método diferente daquele
que enfatizamos aqui, mas sim uma forma de sistematizar a informação em
estudos de caso descritivos de tal forma que possa concebivelmente
3 A literatura sobre estudos de caso comparativos é vasta. Algumas das melhores obras adicionais
são Eckstein (1975), Lijphart (1971) e Collier (1991).
ser usado para inferência descritiva ou causal. Muitos conselhos valiosos sobre
como fazer estudos de caso comparativos, como este, são rudimentares, mas
frequentemente ignorados.
2.2 INFERÊNCIA: A FINALIDADE CIENTÍFICA DA COLETA

DE DADOS
A inferência é o processo de usar os fatos que conhecemos para aprender sobre

fatos que não conhecemos. Os fatos que não conhecemos são os objetos de nossas
questões de pesquisa, teorias e hipóteses. Os fatos que conhecemos formam
nossos dados ou observações (quantitativos ou qualitativos).
Ao buscar o conhecimento geral, por si só ou para entender melhor fatos
particulares, devemos de alguma forma evitar ser oprimidos pela enorme cacofonia
de observações potenciais e reais sobre o mundo. Felizmente, a solução para esse
problema está justamente na busca do conhecimento geral. Ou seja, a melhor forma
científica de organizar os fatos é como implicações observáveis de alguma teoria ou
hipótese. A simplificação científica envolve a escolha produtiva de uma teoria (ou
hipótese) para avaliar; a teoria então nos guia para a seleção daqueles fatos que
são implicações da teoria. Organizar fatos em termos de implicações observáveis
de uma teoria específica produz vários resultados importantes e benéficos no
planejamento e condução de pesquisas. Em primeiro lugar, com esse critério de
seleção de fatos, podemos reconhecer rapidamente que mais observações das
implicações de uma teoria só ajudarão a avaliar a teoria em questão. Como mais
informações desse tipo não fazem mal, esses dados nunca são descartados e o
processo de pesquisa melhora.
Em segundo lugar, não precisamos ter uma teoria completa antes de coletar
dados, nem nossa teoria deve permanecer fixa o tempo todo. Teoria e dados
interagem. Assim como com o ovo e a galinha, alguma teoria é sempre necessária
antes da coleta de dados e alguns dados são necessários antes de qualquer
teorização. Os livros didáticos de pesquisa nos dizem que usamos nossos dados
para testar nossas teorias. Mas aprender com os dados pode ser um objetivo tão
importante quanto avaliar teorias e hipóteses anteriores. Tal aprendizado envolve
a reorganização de nossos dados em implicações observáveis da nova teoria.
Essa reorganização é muito comum no início de muitos processos de pesquisa,
geralmente após a coleta de alguns dados preliminares; após a reorganização, a
coleta de dados continua para avaliar a nova teoria. Devemos sempre tentar
continuar coletando dados mesmo após a reorganização para testar a nova teoria e
assim evitar usar os mesmos dados para avaliar a teoria que usamos para
desenvolvê-la.4
4 Por exemplo, Coombs (1964) demonstrou que virtualmente toda coleta de dados útil
Inferência · 47
Em terceiro lugar, a ênfase na coleta de fatos como implicações observáveis

de uma hipótese torna muito mais claro o terreno comum entre os estilos
quantitativo e qualitativo de pesquisa. Na verdade, uma vez que deixamos de
pensar em casos, unidades ou registros no sentido usual muito estreito ou até
mesmo ingênuo, percebemos que a maioria dos estudos qualitativos fornece
potencialmente um número muito grande de implicações observáveis para as
teorias que estão sendo avaliadas, embora muitas delas observações podem
passar despercebidas pelo investigador. Organizar os dados em uma lista
das implicações observáveis específicas de uma teoria ajuda a revelar o
propósito científico essencial de muitas pesquisas qualitativas. De certa forma,
estamos pedindo ao estudioso que está estudando um evento específico –
uma decisão governamental específica, talvez – que pergunte: “Se minha
explicação estiver correta sobre por que a decisão saiu do jeito que saiu, o que
mais posso esperar observar no mundo real?” Essas implicações observáveis
adicionais podem ser encontradas em outras decisões, mas também podem
ser encontradas em outros aspectos da decisão que está sendo estudada: por
exemplo, quando foi tomada, como foi tomada, como foi justificada. A máxima
crucial para guiar tanto a criação da teoria quanto a coleta de dados é: busca
por implicações mais observáveis da teoria.
Cada vez que desenvolvemos uma nova teoria ou hipótese, é produtivo
listar todas as implicações da teoria que poderiam, em princípio, ser observadas.
A lista, que poderia então ser limitada aos itens para os quais os dados foram
ou poderiam ser facilmente coletados, forma o guia operacional básico para
um projeto de pesquisa. Se coletar um dado adicional ajudará a fornecer uma
maneira adicional de avaliar uma teoria, então (sujeito às restrições usuais de
tempo, dinheiro e esforço) vale a pena fazê-lo. Se uma entrevista ou outra
observação pode ser interessante, mas não é uma implicação observável
potencial desta (ou de alguma outra teoria relevante), então deve ser óbvio
que isso não nos ajudará a avaliar nossa teoria.
Como parte do processo de simplificação realizado pela organização de
nossos dados em implicações observáveis de uma teoria, precisamos
sistematizar os dados. Podemos pensar em converter a matéria-prima dos
fenômenos do mundo real em “classes” compostas por “unidades” ou “casos”
que, por sua vez, são constituídos por “atributos” ou “variáveis” ou “parâmetros”.
A classe pode ser “eleitores”; as unidades podem ser uma amostra de
“eleitores” em vários distritos congressionais; e os atributos ou
tarefa requer ou implica algum grau de teoria, ou “miniteoria”. No entanto, muitos dados
quantitativos e histórico qualitativo são coletados com o propósito explícito de encorajar futuros
pesquisadores a usá-los para propósitos previamente imprevistos. Quinze minutos com o resumo
estatístico dos Estados Unidos convencerão a maioria das pessoas deste ponto. Os esforços
de coleta de dados também diferem no grau em que os pesquisadores seguem rigidamente as
crenças anteriores.
as variáveis podem ser renda, identificação partidária ou qualquer coisa que seja
uma implicação observável da teoria que está sendo avaliada. Ou a classe pode
ser um tipo particular de coletividade, como comunidades ou países, as unidades
podem ser uma seleção delas, e os atributos ou variáveis podem ser seu tamanho,
o tipo de governo, suas circunstâncias econômicas, sua composição étnica. , ou
o que mais for mensurável e de interesse do pesquisador. Esses conceitos, assim
como vários outros construtos, como tipologias, estruturas e todo tipo de
classificação, são úteis como dispositivos temporários quando estamos coletando
dados, mas não temos hipóteses claras a serem avaliadas. No entanto, em geral,
encorajamos os pesquisadores a não organizar seus dados dessa maneira.
Em vez disso, precisamos apenas do conceito organizador inerente à nossa teoria.

Isto é, nossas observações ou são implicações de nossa teoria ou são irrelevantes.
Se forem irrelevantes ou não observáveis, devemos ignorá-los.
Se forem relevantes, devemos usá-los. Nossos dados não precisam estar todos
no mesmo nível de análise. Dados desagregados ou observações de um período
de tempo diferente, ou mesmo de uma parte diferente do mundo, podem fornecer
implicações observáveis adicionais de uma teoria. Podemos não estar nem um
pouco interessados nessas implicações subsidiárias, mas se forem consistentes
com a teoria, conforme previsto, elas nos ajudarão a construir confiança no poder
e na aplicabilidade da teoria. Nossos dados também não precisam ser “simétricos”:
podemos ter um estudo detalhado de uma província, um estudo comparativo de
dois países, entrevistas pessoais com líderes governamentais de apenas um setor
político e até mesmo um componente quantitativo – contanto que cada uma é
uma consequência observável de nossa teoria.
Nesse processo, vamos além do particular para o geral, pois a caracterização de
unidades particulares com base em características comuns é um processo
generalizante. Como resultado, aprendemos muito mais sobre teorias gerais e
fatos particulares.
Em geral, desejamos trazer o máximo possível de informações para sustentar
nossa hipótese. Isso pode significar fazer estudos de caso adicionais, mas isso
geralmente é muito difícil, demorado ou caro. Obviamente, não devemos trazer
informações irrelevantes. Por exemplo, tratar o número de cadeiras ocupadas por
conservadores na Câmara dos Comuns britânica como uma variável mensal em
vez de uma variável que muda a cada eleição nacional aumentaria substancialmente
o número de observações, mas não faria sentido, pois poucas informações novas
seria adicionado. Por outro lado, desagregar os resultados das eleições
presidenciais dos Estados Unidos em nível estadual ou mesmo municipal aumenta
tanto o número de casos quanto a quantidade de informações trazidas para lidar
com o problema.
Essas informações desagregadas podem parecer irrelevantes, pois o objetivo é
aprender sobre as causas da vitória de um determinado candidato em uma corrida
à presidência – uma questão fundamentalmente de nível agregado. Como-
Modelos Formais de Pesquisa Qualitativa · 49
No entanto, a maioria das explicações sobre o resultado da eleição presidencial

tem diferentes implicações observáveis para as unidades desagregadas. Se,
por exemplo, predizermos o resultado da eleição presidencial com base em
variáveis econômicas como a taxa de desemprego, o uso das taxas de
desemprego estado a estado fornece muito mais observações sobre as
implicações de nossa teoria do que faz a taxa agregada para a nação como um
todo. Ao verificar se a teoria é válida nessas outras situações - mesmo que
essas outras situações não sejam de interesse direto - aumentamos a confiança
de que a teoria está correta e que explica corretamente a única consequência
observável da teoria que é de interesse.
2.3 MODELOS FORMAIS DE PESQUISA QUALITATIVA
Um modelo é uma simplificação e aproximação de algum aspecto do mundo.

Os modelos nunca são literalmente “verdadeiros” ou “falsos”, embora bons
modelos abstraiam apenas as características “certas” da realidade que representam.
Por exemplo, considere um modelo de brinquedo de seis polegadas de um
avião feito de plástico e cola. Este modelo é uma pequena fração do tamanho
do avião real, não tem partes móveis, não pode voar e não tem conteúdo.
Nenhum de nós confundiria esse modelo com o real; perguntar se algum
aspecto da modelo é verdadeiro é como perguntar se a modelo que posou para
a Mona Lisa de Leonardo DaVinci realmente tinha um sorriso tão sedutor.
Mesmo que o fizesse, não esperaríamos que a pintura de Leonardo fosse uma
representação exata de alguém, seja o modelo real ou a Virgem Maria, assim
como não esperaríamos que um modelo de avião refletisse totalmente todas as
características de uma aeronave. No entanto, gostaríamos de saber se este
modelo abstrai as características corretas de um avião para um determinado
problema. Se quisermos comunicar a uma criança como é um avião real, este
modelo pode ser adequado. Se construído em escala, o modelo também pode
ser útil para projetistas de aviões para testes em túneis de vento.
A principal característica de um avião real que este modelo abstrai é sua forma.
Para alguns propósitos, este é certamente um dos recursos certos. É claro que
este modelo deixa escapar uma miríade de detalhes sobre um avião, incluindo
tamanho, cor, sensação de estar no avião, resistência de suas várias partes,
número de assentos a bordo, potência de seus motores, tecido das almofadas
do assento e elétrica, hidráulica, hidráulica e vários outros sistemas críticos. Se
quiséssemos entender esses aspectos do plano, precisaríamos de um conjunto
de modelos totalmente diferente.
Podemos avaliar um modelo sem saber quais características do assunto
desejamos estudar? Claramente não. Por exemplo, poderíamos pensar que um
modelo que apresentasse a quantidade de sujeira de um avião não seria de
grande utilidade. De fato, para fins de ensino de crianças ou vento
testes de túnel, seria em grande parte irrelevante. No entanto, como até a poeira
do carpete pode fazer com que um avião pese mais e, portanto, use combustível
mais caro, modelos desse tipo são importantes para a indústria aérea e foram
construídos (e economizaram milhões de dólares).
Todos os modelos variam entre versões restritivas e irrestritas. Os modelos
restritivos são mais claros, mais parcimoniosos e mais abstratos, mas também
são menos realistas (a menos que o mundo seja realmente parcimonioso).
Modelos irrestritos são detalhados, contextuais e mais realistas, mas também
são menos claros e mais difíceis de estimar com precisão (ver King 1989: seção
2.5). Onde neste continuum escolhemos construir um modelo depende do
propósito para o qual ele será colocado e da complexidade do problema que
estamos estudando.
Enquanto alguns modelos são físicos, outros são pictóricos, verbais ou
algébricos. Por exemplo, a descrição qualitativa dos sistemas judiciários
europeus em um livro sobre esse assunto é um modelo desse evento. Não
importa quão densa seja a descrição ou talentoso o autor, o relato do livro
sempre será uma abstração ou simplificação em comparação com o sistema
judicial atual. Como a compreensão requer alguma abstração, o sinal de um
bom livro é tanto o que fica de fora quanto o que se inclui.
Embora os pesquisadores qualitativos geralmente usem modelos verbais,

usaremos modelos algébricos em nossa discussão abaixo para estudar e
melhorar esses modelos verbais. Assim como com modelos de aviões de
brinquedo e estudos de livros sobre a Revolução Francesa, nossos modelos
algébricos de pesquisa qualitativa não devem ser confundidos com a própria
pesquisa qualitativa. Eles destinam-se apenas a fornecer declarações
especialmente claras de problemas a serem evitados e oportunidades a serem
exploradas. Além disso, muitas vezes descobrimos que eles nos ajudam a
descobrir ideias que não teríamos pensado de outra forma.
Assumimos que os leitores não tiveram nenhuma experiência anterior com
modelos algébricos, embora aqueles com exposição a modelos estatísticos
achem alguns dos modelos a seguir familiares. Mas a lógica da inferência nesses
modelos se aplica tanto à pesquisa quantitativa quanto à qualitativa.
Só porque os pesquisadores quantitativos provavelmente estão mais familiarizados
com nossa terminologia, não significa que sejam melhores em aplicar a lógica da
inferência científica. Além disso, esses modelos não se aplicam mais de perto à
pesquisa quantitativa do que à pesquisa qualitativa; em ambos os casos, os
modelos são abstrações úteis da pesquisa à qual são aplicados. Para facilitar
sua introdução, apresentamos todos os modelos algébricos com descrições
verbais, seguidos de uma caixa onde usamos a notação algébrica padrão.
Embora desencorajemos isso, as caixas podem ser puladas sem perda de
continuidade.
Um modelo formal de coleta de dados · 51
2.4 UM MODELO FORMAL DE COLETA DE DADOS
Antes de formalizar nossa apresentação de inferência descritiva e causal – os

dois objetivos principais da pesquisa em ciências sociais – desenvolveremos um
modelo para os dados a serem coletados e para resumir esses dados. Este modelo
é bastante simples, mas é uma ferramenta poderosa para analisar problemas de
inferência. Nosso modelo algébrico não será tão formal quanto o da estatística,
mas mesmo assim torna nossas ideias mais claras e fáceis de transmitir. Por
coleta de dados, nos referimos a uma ampla gama de métodos, incluindo
observação, observação participante, entrevistas intensivas, pesquisas de amostra
em grande escala, história registrada de fontes secundárias, experimentos
aleatórios, etnografia, análises de conteúdo e qualquer outro método de coleta
confiável evidência. A regra mais importante para toda coleta de dados é relatar
como os dados foram criados e como chegamos a possuí-los. Cada pedaço de
informação que reunimos deve contribuir para especificar as implicações
observáveis de nossa teoria. Pode nos ajudar a desenvolver uma nova questão de
pesquisa, mas será inútil responder à presente questão se não for uma implicação
observável da questão que procuramos responder.
Modelamos dados com variáveis, unidades e observações. Um exemplo

simples é a renda anual de cada uma das quatro pessoas. Os dados podem ser
representados simplesmente por quatro números: $ 9.000, $ 22.000, $ 21.000 e $
54.292. No caso mais geral, poderíamos rotular a renda de quatro pessoas
(numeradas 1, 2, 3 e 4) como y1, y2, y3 e y4. Uma variável codificada para duas
entrevistas não estruturadas pode assumir os valores “participativa”, “cooperativa”
ou “intransigente” e pode ser rotulada como y1 e y2. Nesses exemplos, a variável
é y; as unidades são as pessoas individuais; e as observações são os valores das
variáveis para cada unidade (receita por dólares ou grau de cooperação). O
símbolo y é chamado de variável porque seus valores variam ao longo das
unidades e, em geral, uma variável pode representar qualquer coisa cujos valores
mudam ao longo de um conjunto de unidades.
Como podemos coletar informações ao longo do tempo ou em áreas seccionais,
as unidades podem ser pessoas, países, organizações, anos, eleições ou décadas
e, frequentemente, alguma combinação dessas ou de outras unidades. As
observações podem ser numéricas, verbais, visuais ou qualquer outro tipo de
dados empíricos.
Por exemplo, suponha que estamos interessados em organizações
internacionais desde 1945. Antes de coletarmos nossos dados, precisamos decidir
quais resultados queremos explicar. Poderíamos procurar entender a distribuição
do tamanho da atividade organizacional internacional (por área temática ou por
organização) em 1990; mudanças no tamanho agregado da atividade organizacional
internacional desde 1945; ou mudanças na distribuição de tamanho de
atividade organizacional internacional desde 1945. As variáveis que medem
a atividade organizacional podem incluir o número de países pertencentes
a organizações internacionais em um determinado momento, o número de
tarefas executadas por organizações internacionais ou o tamanho dos
orçamentos e equipes. Nesses exemplos, as unidades de análise incluiriam
organizações internacionais, áreas temáticas, membros de países e
períodos de tempo como anos, períodos de cinco anos ou décadas. No
estágio de coleta de dados, nenhuma regra formal se aplica a quais variáveis
coletar, quantas unidades devem existir, se as unidades devem ser mais
numerosas que as variáveis ou quão bem as variáveis devem ser medidas.
A única regra é o nosso julgamento sobre o que será importante. Quando
temos uma ideia mais clara de como os dados serão usados, a regra passa
a ser encontrar o máximo possível de implicações observáveis de uma
teoria. Como enfatizamos no capítulo 1, a pesquisa empírica pode ser usada
tanto para avaliar hipóteses a priori quanto para sugerir hipóteses não
consideradas anteriormente; mas se a última abordagem for seguida, novos
dados devem ser coletados para avaliar essas hipóteses.
Deve ficar muito claro em nossa discussão que a maioria dos trabalhos
rotulados como “estudos de caso” tem inúmeras variáveis medidas em
muitos tipos diferentes de unidades. Embora a pesquisa de estudo de caso
raramente use mais do que um punhado de casos, o número total de
observações é geralmente imenso. Portanto, é essencial distinguir entre o
número de casos e o número de observações. O primeiro pode ser de
algum interesse para alguns propósitos, mas apenas o último é importante
para julgar a quantidade de informação que um estudo traz para uma
questão teórica. Portanto, reservamos o n comumente usado para se referir
apenas ao número de observações e não ao número de casos. Apenas
ocasionalmente, como quando observações individuais são parcialmente
dependentes, distinguiremos entre informação e número de observações.
A terminologia do número de observações vem da amostragem por
pesquisa, onde n é o número de pessoas a serem entrevistadas, mas nós a
aplicamos de maneira muito mais geral. De fato, nossa definição de
“observação” coincide exatamente com a definição de Harry Eckstein
(1975:85) do que ele chama de “caso”. Como Eckstein argumenta, “Um
estudo de seis eleições gerais na Grã-Bretanha pode ser, mas não precisa
ser, um estudo n = 1. Também pode ser um estudo n = 6. Também pode
ser um estudo n = 120.000.000. Depende se o objeto de estudo são
sistemas eleitorais, eleições ou eleitores”. A “ambiguidade sobre o que
constitui um 'indivíduo' (portanto, 'caso') só pode ser dissipada não olhando
para entidades concretas, mas para as medidas feitas delas. Com base
nisso, um 'caso' pode ser definido tecnicamente como um fenômeno para
o qual relatamos e interpretamos apenas uma única medida em qualquer
variável pertinente. A única diferença em nosso uso é que, desde o artigo de Eckstein, os estudiosos continuaram a usar o
Resumindo Detalhes Históricos · 53

palavra “caso” para se referir a um estudo de caso completo, que ainda tem uma
definição bastante imprecisa. Portanto, sempre que possível, usamos a palavra “caso”
como a maioria dos escritores faz e reservamos a palavra “observação” para nos
referirmos a medidas de uma ou mais variáveis em exatamente uma unidade.
No restante deste capítulo, tentamos mostrar como conceitos como variáveis e
unidades podem aumentar a clareza de nosso pensamento sobre o projeto de
pesquisa, mesmo quando pode ser inapropriado confiar em medidas quantitativas
para resumir as informações à nossa disposição. A questão que colocamos é: como
podemos fazer inferências descritivas sobre “a história como ela realmente foi” sem
nos perdermos em um mar de detalhes irrelevantes? Em outras palavras, como
separar o essencial do efêmero?
2.5 RESUMO DE DETALHES HISTÓRICOS
Depois que os dados são coletados, o primeiro passo em qualquer análise é fornecer
resumos dos dados. Os resumos descrevem o que pode ser uma grande quantidade
de dados, mas não estão diretamente relacionados à inferência. Uma vez que
estamos interessados em generalização e explicação, um resumo dos fatos a serem
explicados geralmente é um bom ponto de partida, mas não é uma meta suficiente
para os estudos em ciências sociais.
A sumarização é necessária. Nunca podemos dizer “tudo o que sabemos” sobre
qualquer conjunto de eventos; seria inútil tentar fazê-lo. Bons historiadores entendem
quais eventos foram cruciais e, portanto, constroem relatos que enfatizam o essencial
em vez de digressões. Para entender a história européia durante os primeiros quinze
anos do século XIX, podemos precisar entender os princípios da estratégia militar
como Napoleão os entendia, ou mesmo saber o que seu exército comia se “viajasse
de barriga para baixo”. pode ser irrelevante saber a cor do cabelo de Napoleão ou se
ele preferia ovos fritos a ovos cozidos. Uma boa escrita histórica inclui, embora não se
limite a, um resumo verbal comprimido de uma confusão de detalhes históricos.
Nosso modelo do processo de resumir detalhes históricos é uma estatística. Uma

estatística é uma expressão de dados de forma abreviada. Seu objetivo é exibir as
características apropriadas dos dados em um formato conveniente.5 Por exemplo,
uma estatística é a média da amostra ou média:
y¯ = __(y1
1n
+ y2 +...+ yn) = __yi 1n _
eu = 1
5 Formalmente, para um conjunto de n unidades nas quais uma variável y é medida (y1,..., yn), uma estatística
h é uma função de valor real definida da seguinte forma: h = h(y) = h(y1,..., yn).
onde i=1 yin é uma maneira conveniente de escrever y1 + y2 + y3 +...+ yn. Uma
outra estatística é o máximo da amostra, denominado ymax:
ymax = Maximum(y1, y2,..., yn) (2.1)
A média amostral das quatro rendas do exemplo da seção 2.4 (US$ 9.000, US$
22.000, US$ 21.000 e US$ 54.292) é de US$ 26.573. O valor máximo da amostra
é $ 54.292. Podemos resumir os dados originais contendo quatro números com
esses dois números representando a média e o máximo da amostra. Também
podemos calcular outras características da amostra, como o mínimo, a mediana, a
moda ou a variância.
Cada resumo neste modelo reduz todos os dados (quatro números neste exemplo
simples, ou nosso conhecimento de algum aspecto da história europeia no outro) a
um único número. Comunicar-se com resumos costuma ser mais fácil e significativo
para um leitor do que usar todos os dados originais. Claro, se tivéssemos apenas
quatro números em um conjunto de dados, faria pouco sentido usar cinco resumos
diferentes; apresentar os quatro números originais seria mais simples. Interpretar
uma estatística geralmente é mais fácil do que entender todo o conjunto de dados,
mas necessariamente perdemos informações ao descrever um grande conjunto de
números com apenas alguns.
Que regras regem o resumo dos detalhes históricos? A primeira regra é que os
resumos devem se concentrar nos resultados que desejamos descrever ou explicar.
Se estivéssemos interessados no crescimento da organização internacional média,
não seria sensato focar nas Nações Unidas; mas se estivéssemos preocupados
com a distribuição do tamanho das organizações internacionais, de grandes a
pequenas, as Nações Unidas certamente seriam uma das unidades em que
deveríamos nos concentrar. As Nações Unidas não são uma organização
representativa, mas são importantes. Em termos estatísticos, para investigar a
organização internacional típica, examinaríamos os valores médios (de orçamentos,
tarefas, filiações, etc.), mas para compreender o âmbito da atividade, gostaríamos
de examinar a variância. Um segundo preceito igualmente óbvio é que um resumo
deve simplificar as informações à nossa disposição. Em termos quantitativos, esta
regra significa que devemos sempre usar menos estatísticas de resumo do que
unidades nos dados originais, caso contrário, poderíamos facilmente apresentar
todos os dados originais sem nenhum resumo.6 Nosso resumo também deve ser
suficientemente simples para pode ser entendido por nosso público. Nenhum
fenômeno pode ser resumido perfeitamente, então os padrões de adequação
devem depender de nossos propósitos e do público. por ex
6 Este ponto está intimamente relacionado com o conceito de projetos de pesquisa indeterminados, que
discutimos na seção 4.1.
Inferência Descritiva · 55
De maneira ampla, um artigo científico sobre guerras e alianças pode incluir
dados envolvendo 10.000 observações. Em tal papel, os resumos dos dados
usando cinquenta números podem ser justificados; no entanto, mesmo para um
especialista, cinquenta indicadores separados podem ser incompreensíveis sem
algum resumo adicional. Para uma palestra sobre o assunto para uma turma de
graduação, três gráficos podem ser superiores.
2.6 INFERÊNCIA DESCRITIVA
A inferência descritiva é o processo de compreensão de um fenômeno não

observado com base em um conjunto de observações. Por exemplo, podemos
estar interessados em compreender as variações no voto distrital para os partidos
Conservador, Trabalhista e Social-Democrata na Grã-Bretanha em 1979.
Presumivelmente, temos algumas hipóteses a avaliar; no entanto, o que realmente
observamos são 650 eleições distritais para a Câmara dos Comuns naquele ano.
Ingenuamente, poderíamos pensar que estávamos observando diretamente a

força eleitoral dos conservadores ao registrar sua parcela de votos por distrito e
sua parcela geral de assentos. Mas um certo grau de aleatoriedade ou
imprevisibilidade é inerente à política, assim como a toda a vida social e a toda a
investigação científica.7 Suponha que, num súbito ataque de distração (ou em
deferência à ciência social), o Parlamento britânico tivesse concordado em
eleições todas as semanas durante 1979 e suponha (contrafactualmente) que
essas eleições foram independentes umas das outras. Mesmo que o apoio
subjacente aos conservadores permanecesse constante, cada repetição semanal
não produziria o mesmo número de votos para cada partido em cada distrito. O
clima pode mudar, epidemias podem estourar, férias podem ser tiradas – todas
essas ocorrências afetariam o comparecimento dos eleitores e os resultados
eleitorais. Além disso, eventos fortuitos podem acontecer no ambiente
internacional, ou escândalos podem atingir a mídia de massa; mesmo que não
tenham significado a longo prazo, podem afetar os resultados semanais. Assim,
numerosos eventos transitórios podem afetar conjuntos ligeiramente diferentes
de resultados eleitorais.
Afinal, nossa observação de qualquer eleição não seria uma medida perfeita da
força conservadora.
Como outro exemplo, suponha que estejamos interessados no grau de conflito
entre israelenses (polícia e residentes) e palestinos em comunidades na
Cisjordânia ocupada por Israel no Rio Jordão. Relatórios oficiais de ambos os
lados parecem suspeitos ou são censurados, então decidimos conduzir nosso
próprio estudo. Talvez possamos averiguar o nível geral de conflito em diferentes
comunidades por meio de entrevistas intensivas ou participação
7 Ver Popper (1982) para uma defesa do indeterminismo no tamanho de um livro.

ção em eventos familiares ou de grupo. Se fizermos isso durante uma semana
em cada comunidade, nossas conclusões sobre o nível de conflito em cada uma
delas serão uma função, em parte, de quaisquer eventos casuais que ocorram
na semana que visitamos. Mesmo que conduzamos o estudo ao longo de um ano,
ainda não saberemos perfeitamente o verdadeiro nível do conflito, embora nossa
incerteza sobre ele diminua.
Nesses exemplos, a variação no voto conservador nos distritos ou a variação
no conflito entre as comunidades da Cisjordânia pode ser conceituada como
decorrente de dois fatores separados: diferenças sistemáticas e não sistemáticas .
Diferenças sistemáticas em nosso exemplo de eleitor incluem características
fundamentais e previsíveis dos distritos, como diferenças de ideologia, de renda,
de organização de campanha ou de apoio tradicional a cada um dos partidos. Em
hipotéticas replicações semanais das mesmas eleições, as diferenças sistemáticas
persistiriam, mas as diferenças não sistemáticas, como variações de
comparecimento devido ao clima, variariam. Em nosso exemplo da Cisjordânia,
as diferenças sistemáticas incluiriam as profundas diferenças culturais entre
israelenses e palestinos, o conhecimento mútuo de cada um e os padrões
geográficos de segregação residencial. Se pudéssemos começar nossa semana
de observação uma dúzia de vezes diferentes, essas diferenças sistemáticas
entre as comunidades continuariam a afetar o nível de conflito observado. No
entanto, diferenças não sistemáticas, como incidentes terroristas ou casos de
brutalidade policial israelense, não seriam previsíveis e afetariam apenas a
semana em que ocorreram. Com técnicas inferenciais apropriadas, geralmente
podemos aprender sobre a natureza das diferenças sistemáticas, mesmo com a
ambigüidade que ocorre em um conjunto de dados reais devido a diferenças não
sistemáticas ou aleatórias.
Assim, um dos objetivos fundamentais da inferência é distinguir o componente

sistemático do componente não sistemático dos fenômenos que estudamos. O
componente sistemático não é mais importante do que o componente não
sistemático, e nossa atenção não deve se concentrar em um em detrimento do
outro. No entanto, distinguir entre os dois é uma tarefa essencial da ciência social.
Uma maneira de pensar sobre inferência é considerar o conjunto de dados que
compilamos como apenas um dos muitos conjuntos de dados possíveis - assim
como os resultados reais da eleição britânica de 1979 constituem apenas um dos
muitos conjuntos possíveis de resultados para diferentes dias hipotéticos em que
as eleições poderiam ter ocorrido. realizada, ou assim como nossa semana de
observação em uma pequena comunidade é uma das muitas semanas possíveis.
Na inferência descritiva, procuramos entender o grau em que nossas
observações refletem fenômenos típicos ou discrepantes. Se as eleições britânicas
de 1979 tivessem ocorrido durante uma epidemia de gripe que varreu as casas da
classe trabalhadora, mas tendeu a poupar os ricos, nossas observações poderiam
ser medidas bastante pobres de conservadorismo subjacente.
força, precisamente porque o elemento aleatório não sistemático dos dados
tenderia a sobrepujar ou distorcer o elemento sistemático. Se nossa semana de
observação tivesse ocorrido imediatamente após a invasão israelense do sul do
Líbano, também não esperaríamos resultados indicativos do que geralmente
acontece na Cisjordânia.
O mundo político é teoricamente capaz de produzir múltiplos conjuntos de
dados para cada problema, mas nem sempre segue as necessidades dos
cientistas sociais. Normalmente, temos a sorte de observar apenas um conjunto
de dados. Para fins de modelo, deixaremos que esse conjunto de dados seja
representado por uma variável y (digamos, o voto para o Trabalho) medida sobre
todas as n = 650 unidades (distritos): y1, y2, ..., yn (para por exemplo, y1 pode ser
de 23.562 pessoas votando no Partido Trabalhista no distrito 1). O conjunto de
observações que rotulamos de y é uma variável realizada. Seus valores variam ao longo das n unidades.
Além disso, definimos Y como uma variável aleatória porque varia aleatoriamente
em replicações hipotéticas da mesma eleição. Assim, y5 é o número de pessoas
que votaram no Partido Trabalhista no distrito 5 e Y5 é a variável aleatória que
representa o voto em muitas eleições hipotéticas que poderiam ter ocorrido no
distrito 5 essencialmente nas mesmas condições. Os votos observados para o
Partido Trabalhista na amostra que observamos, y1, y2,..., yn, diferem entre os
constituintes por causa de fatores sistemáticos e aleatórios. Ou seja, para
distinguir as duas formas de “variáveis”, frequentemente usamos o termo variável
realizada para nos referirmos a y e variável aleatória para nos referirmos a Y.
O mesmo arranjo se aplica ao nosso exemplo qualitativo. Não teríamos

esperança ou desejo de quantificar o nível de tensão entre israelenses e
palestinos, em parte porque “conflito” é uma questão complicada que envolve os
sentimentos de vários indivíduos, oposições organizacionais, conflitos ideológicos
e muitas outras características.
Nesta situação, y5 é uma variável realizada que representa o conflito total
observado durante nossa semana na quinta comunidade, digamos El-Bireh.8 A
variável aleatória Y5 representa tanto o que observamos em El-Bireh quanto o que
poderíamos ter observado ; a aleatoriedade vem da variação em eventos aleatórios
ao longo das semanas possíveis que poderíamos ter escolhido para observar.9
Um dos objetivos da
inferência é aprender sobre as características sistemáticas das variáveis
aleatórias Y1,..., Yn. (Observe a terminologia contraditória, mas padrão: embora
em geral desejemos distinguir componentes sistemáticos de não sistemáticos em
nossos dados, em um caso específico desejamos
8
Obviamente, o mesmo se aplica a todas as outras comunidades que podemos estudar.
9 Observe que a aleatoriedade não ocorre exatamente em diferentes semanas reais, uma vez que
tanto eventos aleatórios quanto diferenças sistemáticas podem explicar as diferenças observadas.
Portanto, criamos a situação mais ideal na qual imaginamos governar o mundo novamente com
características sistemáticas mantidas constantes e fatores aleatórios permitidos para variar.
pegue uma variável aleatória e extraia suas características sistemáticas.) Por
exemplo, podemos querer saber o valor esperado do voto trabalhista no distrito 5
(o voto trabalhista médio Y5 em um grande número de eleições hipotéticas neste
distrito). Uma vez que esta é uma característica sistemática do sistema eleitoral
subjacente, o valor esperado é de considerável interesse para os cientistas
sociais. Em contraste, o voto trabalhista em uma eleição observada, y5, é de
interesse de longo prazo consideravelmente menor, pois é uma função de
características sistemáticas e erro aleatório.10 O valor
esperado (uma característica do componente sistemático) no quinto oeste A
comunidade bancária, El-Bireh, é expressa formalmente da seguinte forma:
E(Y5) = m5
onde E(·) é a operação de valor esperado, produzindo a média em um número

infinito de replicações hipotéticas da semana que observamos na comunidade 5,
El-Bireh. O parâmetro m5 (a letra grega mu com um subscrito 5) representa a
resposta para o cálculo do valor esperado (um nível de conflito entre palestinos e
israelenses) para a comunidade 5. Esse parâmetro faz parte de nosso modelo
para uma característica sistemática do aleatório variável Y5. Pode-se usar o nível
de conflito observado, y5, como uma estimativa de m5, mas como y5 contém
muitos elementos aleatórios junto com informações sobre essa característica
sistemática, geralmente existem estimadores melhores (consulte a seção 2.7).
Outra característica sistemática dessas variáveis aleatórias que podemos

querer saber é o nível de conflito na comunidade média da Cisjordânia:
n n
1
__E(Yi) = __mi = m (2.2)
n 1n
i=1 i=1
Um estimador de m pode ser a média dos níveis de conflito observados em todas

as comunidades estudadas, y¯, mas também existem outros estimadores para
essa característica sistemática. (Observe que o mesmo resumo de dados em
nossa discussão de resumo de detalhes históricos da seção 2.5 é usado com o
propósito de estimar uma inferência descritiva.) Outras características sistemáticas
das variáveis aleatórias incluem a variância e uma variedade de parâmetros
causais introduzidos na seção 3.1 .
Ainda outra característica sistemática dessas variáveis aleatórias que pode ser
de interesse é a variação no nível de conflito dentro de uma comunidade.
10 É claro que y5 pode ser de grande interesse para as pessoas do distrito 5 naquele ano
e, portanto, vale a pena estudar os componentes aleatórios e sistemáticos desse evento. No
entanto, devemos sempre tentar distinguir o aleatório do sistemático.
nidade mesmo quando as características sistemáticas não mudam: até que ponto
as observações ao longo de diferentes semanas (diferentes realizações hipotéticas
da mesma variável aleatória) produzem resultados divergentes. Isto é, em outras
palavras, o tamanho do componente não sistemático. Formalmente, isso é
calculado para uma única comunidade usando a variância (em vez da expectativa):
V(Yi) = s2 eu
(2.3)
onde s2 (a letra grega sigma) denota o resultado da aplicação do operador de

variância à variável aleatória Yi. Viver em uma comunidade da Cisjordânia com
alto nível de conflito entre israelenses e palestinos não seria agradável, mas viver
em uma comunidade com alta variação e, portanto, imprevisibilidade, pode ser
pior. De qualquer forma, ambos podem ser de interesse considerável para
pesquisadores acadêmicos.
Para entender melhor essas questões, distinguimos duas visões fundamentais
da variação aleatória.11 Essas duas perspectivas são extremos em um continuum.
Embora seja possível encontrar um número significativo de estudiosos que se
sentem confortáveis com cada extremo, a maioria dos cientistas políticos tem
pontos de vista em algum lugar entre os dois.
Perspectiva 1: Um Mundo Probabilístico. A variação aleatória existe na natureza e

nos mundos social e político e nunca pode ser eliminada. Mesmo que medissemos
todas as variáveis sem erro, coletássemos um censo (em vez de apenas uma
amostra) de dados e incluíssemos todas as variáveis explanatórias concebíveis,
nossas análises ainda assim nunca gerariam previsões perfeitas. Um pesquisador
pode dividir o mundo em componentes aparentemente sistemáticos e aparentemente
não sistemáticos e muitas vezes melhorar as previsões, mas nada que um
pesquisador faça para analisar dados pode ter qualquer efeito na redução da
quantidade fundamental de variação não sistemática existente em várias partes do mundo empírico.
Perspectiva 2: Um mundo determinístico. A variação aleatória é apenas aquela

parte do mundo para a qual não temos explicação. A divisão entre variação
sistemática e variação estocástica é imposta pelo analista e depende de quais
variáveis explicativas estão disponíveis e incluídas na análise. Dadas as variáveis
explicativas corretas, o mundo é totalmente previsível.
Essas diferentes perspectivas produzem várias ambiguidades nas inferências

em diferentes campos de investigação.12 No entanto, para a maioria dos propósitos
11 Ver King (1991b) para uma elaboração dessa distinção.

12 Os economistas tendem a estar mais próximos da Perspectiva 1, enquanto os estatísticos
estão mais próximos da Perspectiva 2. A Perspectiva 1 também é especialmente comum no campo
da engenharia chamado “controle de qualidade”. Os físicos até debateram essa distinção no campo
da mecânica quântica. Os primeiros proponentes da Perspectiva 2 subscreveram a “teoria da variável oculta”
essas duas perspectivas podem ser consideradas observacionalmente
equivalentes. Isso é especialmente verdadeiro se assumirmos, sob a Perspectiva
2, que pelo menos algumas variáveis explicativas permanecem desconhecidas.
Assim, a equivalência observacional ocorre quando essas variáveis explicativas
desconhecidas na Perspectiva 2 tornam-se a interpretação para a variação
aleatória na Perspectiva 1. Devido à falta de quaisquer implicações observáveis
com as quais distinguir entre elas, uma escolha entre as duas perspectivas
depende de fé ou crença em vez de verificação empírica.
Como outro exemplo, com ambas as perspectivas, distinguir se um
determinado evento político ou social é o resultado de um processo sistemático
ou não sistemático depende das escolhas do pesquisador.
Do ponto de vista da Perspectiva 1, podemos classificar provisoriamente um
efeito como sistemático ou não sistemático. Mas, a menos que possamos
encontrar outro conjunto de dados (ou mesmo apenas outro caso) para verificar
a persistência de um efeito ou padrão, é muito difícil fazer o julgamento correto.
Da versão extrema da Perspectiva 2, não podemos fazer mais do que
descrever os dados – julgar “incorretamente” um evento como estocástico ou
sistemático é impossível ou irrelevante. Uma versão mais realista dessa
perspectiva admite a atribuição correta ou incorreta de um padrão pela
Perspectiva 1 como aleatório ou sistemático, mas nos permite alguma latitude
para decidir o que será objeto de exame em qualquer estudo particular e o que
permanecerá inexplicado. Desta forma, começamos qualquer análise com
todas as observações sendo o resultado de forças “não sistemáticas”. Nosso
trabalho é então fornecer evidências de que determinados eventos ou processos
são o resultado de forças sistemáticas. Se um evento ou processo inexplicável
é uma ocorrência verdadeiramente aleatória ou apenas o resultado de variáveis
explicativas ainda não identificadas, isso é assunto para pesquisas futuras.
Esse argumento se aplica com igual força a pesquisadores qualitativos e
quantitativos. A pesquisa qualitativa é muitas vezes histórica, mas é mais útil
como ciência social quando também é explicitamente inferencial. Conceituar
as variáveis aleatórias a partir das quais as observações são geradas e tentar
estimar suas características sistemáticas – em vez de simplesmente resumir os
detalhes históricos – não requer coletas de dados em grande escala. De fato,
uma marca de um bom historiador é a capacidade de distinguir os aspectos
sistemáticos da situação que está sendo descrita dos idiossincráticos. Este
argumento para inferência descritiva, portanto, certamente não é uma crítica de
estudos de caso ou trabalho histórico. Em vez de,
da mecânica quântica. No entanto, trabalhos mais modernos parecem fornecer uma

verificação fundamental da Perspectiva 1: o mundo físico parece intrinsecamente probabilístico.
Todos nós esperamos a resolução das numerosas contradições remanescentes desta
importante teoria e suas implicações para a natureza do mundo físico. No entanto, essa
disputa na física, embora usada para justificar grande parte da filosofia das ciências sociais,
dificilmente afetará a lógica da inferência ou a prática de pesquisa nas ciências sociais.
qualquer tipo de pesquisa em ciências sociais deve satisfazer os princípios
básicos de inferência discutidos neste livro. Encontrar evidências de
características sistemáticas será mais difícil com alguns tipos de evidências,
mas não é menos importante.
Como um exemplo de problemas de inferência descritiva na pesquisa
histórica, suponha que estamos interessados nos resultados das reuniões de
cúpula EUA-União Soviética entre 1955 e 1990. Nosso objetivo final é
responder a uma questão causal: em que condições e em que medida as
cimeiras conduzem a uma maior cooperação? Responder a essa pergunta
requer a resolução de várias questões difíceis de análise causal, particularmente
aquelas que envolvem a direção da causalidade entre um conjunto de variáveis
sistematicamente relacionadas.13 Nesta seção, entretanto, nos restringimos
a problemas de inferência descritiva.
Suponhamos que tenhamos inventado uma maneira de avaliar – por meio
de análise histórica, levantamento de especialistas, contagem de eventos
“cooperativos” e “conflituosos” ou uma combinação dessas técnicas de
medição – até que ponto as cúpulas foram seguidas de maior cooperação
entre as potências. E temos algumas hipóteses sobre as condições para
maior cooperação – condições que dizem respeito a mudanças de poder,
ciclos eleitorais nos Estados Unidos, condições econômicas em cada país e
até que ponto as expectativas anteriores de ambos os lados foram atendidas.
Suponha também que esperamos explicar o nível subjacente de cooperação
em cada ano e associá-lo de alguma forma à presença ou ausência de uma
reunião de cúpula no período anterior, bem como a nossos outros fatores
explicativos.
O que observamos (mesmo que nossos índices de cooperação sejam
perfeitos) é apenas o grau de cooperação efetivamente ocorrido em cada ano.
Se observarmos altos níveis de cooperação nos anos seguintes às reuniões
de cúpula, não saberemos, sem um estudo mais aprofundado, se as cúpulas
e a cooperação subsequente estão sistematicamente relacionadas entre si.
Com um pequeno número de observações, pode ser que a associação entre
cúpulas e cooperação reflita a aleatoriedade devido à incerteza fundamental
(boa ou má sorte na Perspectiva 1) ou a variáveis explicativas ainda não
identificadas (na Perspectiva 2). Exemplos de tais variáveis explicativas não
identificadas incluem flutuações climáticas levando a quebras de safra na
União Soviética, mudanças no equilíbrio militar ou mudanças de liderança,
todas as quais poderiam explicar mudanças na extensão da cooperação. Se
identificadas, essas variáveis são explicações alternativas - variáveis omitidas
que poderiam ser coletadas ou examinadas
13 Em nossa linguagem, como discutiremos na seção 3.5 abaixo, a questão é de

endogeneidade. A cooperação antecipada poderia levar à convocação de reuniões de cúpula,
caso em que, em vez de reuniões de cúpula explicando a cooperação, a cooperação antecipada
explicaria a cooperação real - dificilmente uma descoberta surpreendente se os atores forem racionais!
para avaliar sua influência no resultado da cúpula. Se não identificadas, essas
variáveis podem ser tratadas como eventos não sistemáticos que poderiam
explicar o alto grau observado de cooperação entre as superpotências. Para
fornecer evidências contra a possibilidade de que eventos aleatórios (variáveis
explicativas não identificadas) expliquem a cooperação observada, podemos
examinar muitos outros anos. Uma vez que eventos e processos aleatórios são,
por definição, não persistentes, será extremamente improvável que produzam
cooperação diferencial em anos com e sem cúpulas de superpotências. Mais
uma vez, somos levados à conclusão de que apenas testes repetidos em
diferentes contextos (anos, neste caso) nos permitem decidir se devemos definir
um padrão como sistemático ou apenas devido às consequências transitórias
de processos aleatórios.
Distinguir processos sistemáticos de processos não sistemáticos é muitas
vezes difícil. Do ponto de vista da ciência social, uma epidemia de gripe que
atinge mais fortemente os eleitores da classe trabalhadora do que os da classe
média é um evento imprevisível (não sistemático) que, em uma replicação
hipotética da eleição de 1979, diminuiria o voto trabalhista. Mas um padrão
persistente de diferenças de classe na incidência de uma doença incapacitante
seria um efeito sistemático diminuindo o nível médio de votação trabalhista em
muitas replicações.
A vitória de um candidato sobre outro em uma eleição nos Estados Unidos
com base na personalidade do vencedor ou um lapso acidental da língua
durante um debate televisionado pode ser um fator aleatório que pode ter
afetado a probabilidade de cooperação entre a URSS e os Estados Unidos.
Estados durante a Guerra Fria. Mas se o apelo de campanha mais eficaz aos
eleitores tivesse sido a promessa de tensões reduzidas com a URSS, vitórias
consistentes de candidatos conciliadores teriam constituído um fator sistemático
para explicar a probabilidade de cooperação.
Os fatores sistemáticos são persistentes e têm consequências consistentes
quando os fatores assumem um determinado valor. Fatores não sistemáticos
são transitórios: não podemos prever seu impacto. Mas isso não significa que
os fatores sistemáticos representam constantes. Os apelos de campanha
podem ser um fator sistemático para explicar o comportamento eleitoral, mas
esse fato não significa que os próprios apelos de campanha não mudem. É o
efeito dos apelos de campanha em um resultado eleitoral que é constante – ou,
se for variável, está mudando de forma previsível. Quando as relações soviético-
americanas eram boas, as promessas de políticas conciliatórias podem ter
conquistado votos nas eleições americanas; quando as relações eram ruins, o
inverso pode ter acontecido. Da mesma forma, o clima pode ser um fator
aleatório (se choques intermitentes e imprevisíveis têm consequências
imprevisíveis) ou uma característica sistemática (se o mau tempo sempre leva
a menos votos para candidatos a favor de políticas conciliatórias).
Em suma, resumir detalhes históricos é um importante intermediário
Julgando inferências descritivas · 63

passo no processo de uso de nossos dados, mas também devemos fazer
inferências descritivas distinguindo entre fenômenos aleatórios e sistemáticos.
Saber o que aconteceu em uma determinada ocasião não é suficiente por si só. Se
não fizermos nenhum esforço para extrair as características sistemáticas de um
assunto, as lições da história serão perdidas e não aprenderemos nada sobre
quais aspectos de nosso assunto provavelmente persistirão ou serão relevantes
para eventos ou estudos futuros.
2.7 CRITÉRIOS PARA JULGAR INFERÊNCIAS DESCRITIVAS
Nesta seção final, apresentamos três critérios explícitos que são comumente
usados em estatísticas para julgar os métodos de fazer inferências - imparcialidade,
eficiência e consistência. Cada um se baseia na estrutura de variável aleatória
apresentada na seção 2.6, mas tem implicações diretas e poderosas para avaliar e
melhorar a pesquisa qualitativa. Para esclarecer esses conceitos, fornecemos
apenas os exemplos mais simples possíveis nesta seção, todos a partir de
inferência descritiva. Uma versão simples de inferência envolve a estimativa de
parâmetros, incluindo o valor esperado ou a variância de uma variável aleatória (m
ou s2) para uma inferência descritiva. Também usamos esses mesmos critérios
para julgar inferências causais no próximo capítulo (ver seção 3.4). Deixamos para
capítulos posteriores conselhos específicos sobre como fazer pesquisa qualitativa
que está implícita nesses critérios e nos concentramos apenas nos conceitos para
o restante desta seção.
2.7.1 Inferências imparciais
Se aplicarmos um método de inferência repetidas vezes, obteremos estimativas

que às vezes são muito grandes e às vezes muito pequenas. Em um grande número
de aplicativos, obtemos a resposta certa em média? Se sim, então este método, ou
“estimador”, é considerado imparcial. Essa propriedade de um estimador não diz
nada sobre quão longe da média qualquer aplicação do método pode estar, mas é
desejável estar correto na média.
As estimativas imparciais ocorrem quando a variação de uma replicação de uma

medida para a seguinte não é sistemática e move a estimativa algumas vezes para
um lado, às vezes para o outro. O viés ocorre quando há um erro sistemático na
medida que desloca a estimativa mais em uma direção do que em outra ao longo
de um conjunto de replicações. Se em nosso estudo de conflito nas comunidades
da Cisjordânia, os líderes tivessem criado conflito para influenciar os resultados do
estudo (talvez para promover seus objetivos políticos), então o nível de conflito que
observamos em cada comunidade seria tendencioso para um conflito maior, em
média. Se as replicações de nosso
hipotéticas eleições de 1979 fossem todas feitas em um domingo (quando
poderiam ter sido em qualquer dia), haveria um viés nas estimativas se esse
fato sistematicamente ajudasse um lado e não o outro (se, por exemplo, os
conservadores fossem mais relutante em votar no domingo por motivos
religiosos). Ou nossas estimativas replicadas podem ser baseadas em relatórios
de contadores de votos corruptos que favorecem um partido em detrimento do outro.
Se, no entanto, as eleições replicadas fossem realizadas em vários dias
escolhidos de maneira não relacionada à variável que nos interessa, qualquer
erro de medição não produziria resultados enviesados, mesmo que um dia ou
outro pudesse favorecer um partido. Por exemplo, se houvesse erros de
contagem devido a desleixo aleatório por parte dos contadores de votos, o
conjunto de estimativas seria imparcial.
Se as eleições britânicas fossem sempre realizadas por lei aos domingos ou
se um método de contagem de votos que favorecesse um partido em detrimento
de outro fosse incorporado ao sistema eleitoral (através do uso de um esquema
de votação específico ou, talvez, até mesmo de corrupção persistente),
estaríamos queremos um estimador que varie com base na votação média que
poderia ser esperada nas circunstâncias que incluíam esses recursos
sistemáticos. Assim, o viés depende da teoria que está sendo investigada e não
existe apenas nos dados. Faz pouco sentido dizer que um determinado conjunto
de dados é tendencioso, mesmo que possa estar repleto de muitos erros individuais.
Neste exemplo, podemos querer distinguir nossa definição de “viés
estatístico” em um estimador de “viés substantivo” em um sistema eleitoral. Um
exemplo disso são os horários de votação que tornam mais difícil para os
trabalhadores votarem – um viés substantivo não incomum de vários sistemas
eleitorais. Como pesquisadores, podemos desejar estimar a média de votos do
sistema eleitoral real (aquele com viés substantivo), mas também podemos
estimar a média de um sistema eleitoral hipotético que não tem viés substantivo
devido ao horas em que as urnas estão abertas. Isso nos permitiria estimar a
quantidade de viés substantivo no sistema. Seja qual for a média que estamos
estimando, desejamos ter um estimador estatisticamente imparcial.
Os dados das ciências sociais são suscetíveis a uma importante fonte de

viés, da qual devemos ser cautelosos: as pessoas que fornecem as informações
brutas que usamos para inferências descritivas geralmente têm motivos para
fornecer estimativas que são sistematicamente altas ou baixas demais.
Funcionários do governo podem querer superestimar os efeitos de um novo
programa a fim de reforçar seus pedidos de mais financiamento ou subestimar
a taxa de desemprego para demonstrar que estão fazendo um bom trabalho.
Talvez precisemos nos aprofundar para encontrar estimativas menos
tendenciosas. Um exemplo revelador está no estudo qualitativo de Myron
Weiner sobre educação e trabalho infantil na Índia (1991). Ao tentar explicar o
baixo nível de comprometimento com a educação obrigatória na Índia em comparação com outros países,

ele teve que primeiro determinar se o nível de comprometimento era realmente baixo.
Em um estado da Índia, ele encontrou estatísticas oficiais que indicavam que 98% das
crianças em idade escolar frequentam a escola. No entanto, um olhar mais atento revelou
que a frequência era medida uma vez, quando as crianças entravam na escola. Eles
foram então alistados como freqüentadores por sete anos, mesmo que sua freqüência
fosse apenas por um dia! Um exame mais minucioso mostrou que o número real de
atendimento é muito menor.
Um Exemplo Formal de Imparcialidade. Suponha, por exemplo, que desejemos

estimar m na equação (2.2) e decidamos usar a média como 1_ nn i=1 yi. Em um
= média dos eleitores único conjunto de dados, y¯ é a proporção de um estimador, y¯
trabalhistas em todos os n = 650 distritos eleitorais (ou o nível médio de conflito entre
as comunidades da Cisjordânia). Mas considerando um número infinito de replicações
hipotéticas da eleição em cada eleitorado, a média amostral torna-se uma função de
650 1_ nn i=1Yi. Assim, a média amostral torna-se uma variável aleatória, Y¯ = variável
Y¯ produzirá retornos aleatória também. Para algumas replicações hipotéticas,
eleitorais próximos de m e outras vezes mais distantes. A questão é se Y¯ estará
certo, ou seja, igual a m, na média dessas replicações hipotéticas. Para determinar a
resposta, usamos novamente a operação de valor esperado, que nos permite
determinar a média entre o número infinito de eleições hipotéticas. As regras das
expectativas nos permitem fazer os seguintes cálculos:
n
ÿ ÿ1
E(Y¯) = E __Yi ÿn ÿ (2.4)
i=1
n
1
= __E(Yi)
n
i=1
1 =__nm n
=m
Assim, Y¯ é um estimador imparcial de m. (Este é um exemplo um pouco menos

formal do que aparece em textos estatísticos formais, mas as principais características
são as mesmas.)
2.7.2 Eficiência
Geralmente não temos oportunidade de aplicar nosso estimador a um grande
número de aplicações essencialmente idênticas. De fato, exceto por alguns
experimentos inteligentes, nós o aplicamos apenas uma vez. Nesse caso,
a imparcialidade é interessante, mas gostaríamos de ter mais confiança de
que a única estimativa que obtivemos esteja próxima da correta. A eficiência
fornece uma maneira de distinguir entre estimadores imparciais. De fato, o
critério de eficiência também pode ajudar a distinguir entre estimadores
alternativos com um pequeno viés. (Um estimador com um viés grande
geralmente deve ser descartado mesmo sem avaliar sua eficiência.)
A eficiência é um conceito relativo medido pelo cálculo da variância do
estimador em replicações hipotéticas. Para estimadores não viesados,
quanto menor a variância, mais eficiente (melhor) o estimador. Uma pequena
variação é melhor porque nossa estimativa provavelmente estará mais
próxima do valor real do parâmetro. Não estamos interessados na eficiência
de um estimador com um viés grande porque a baixa variância nessa
situação tornará improvável que a estimativa esteja próxima do valor
verdadeiro (porque a maioria das estimativas seria agrupada em torno do
valor errado). Conforme descrevemos a seguir, estamos interessados em
eficiência no caso de uma pequena quantidade de viés, e muitas vezes
podemos estar dispostos a incorrer em uma pequena quantidade de viés em
troca de um grande ganho de eficiência.
Suponha novamente que estamos interessados em estimar o nível médio
de conflito entre palestinos e israelenses na Cisjordânia e estamos avaliando
dois métodos: uma única observação de uma comunidade, escolhida para
ser típica, e observações semelhantes de, por exemplo, vinte e cinco
comunidades. Deveria ser óbvio que 25 observações são melhores do que
uma única observação - desde que o mesmo esforço seja aplicado tanto na
coleta de cada uma das 25 quanto na única observação.
Demonstraremos aqui exatamente por que isso ocorre. Esse resultado
explica por que devemos observar o maior número possível de implicações
de nossa teoria, mas também demonstra o conceito mais geral de eficiência
estatística, que também é relevante sempre que estamos decidindo a melhor
maneira de avaliar diferentes maneiras de combinar observações coletadas
em um inferência.
A eficiência nos permite comparar o estimador de estudo de caso de
observação única (n = 1) de m com o estimador de n grande (n = 25), que é
o nível médio de conflito encontrado em vinte e cinco estudos separados de
uma semana em diferentes comunidades da Cisjordânia. Se aplicados
adequadamente, ambos os estimadores são imparciais. Se o mesmo modelo
se aplicar, o estimador de observação única terá uma variância de V(Ytípico)
= s2. Ou seja, teríamos escolhido o que pensávamos ser um bairro “típico”,

que, no entanto, seria afetado por variáveis aleatórias. A variância do
estimador de n grande é V(Y¯) = s2/25, ou seja, a variância da média da
amostra. Assim, o estimador de observação única é vinte e cinco vezes
mais variável (ou seja, menos eficiente) do que a estimativa quando n = 25.
Portanto, temos o resultado óbvio de que mais observações são melhores.
Mais interessantes são as condições sob as quais um estudo mais
detalhado de nossa comunidade produziria resultados tão bons ou melhores
quanto nosso estudo de n grande. Ou seja, embora devamos sempre
preferir estudos com mais observações (dados os recursos necessários
para coletá-las), há situações em que um estudo de caso único (como
sempre, contendo muitas observações) é melhor do que um estudo
baseado em mais observações , cada um dos quais não é tão detalhado ou certo.
Sendo todas as condições iguais, nossa análise mostra que quanto mais
observações, melhor, porque a variabilidade (e, portanto, a ineficiência)
diminui. Na verdade, a propriedade de consistência é tal que, à medida
que o número de observações aumenta muito, a variabilidade diminui para
zero e a estimativa é igual ao parâmetro que estamos
tentando estimar.14 Mas, muitas vezes, nem todas as condições são
iguais. Suponha, por exemplo, que qualquer medida única do fenômeno
que estamos estudando esteja sujeita a fatores que tornam a medida
provavelmente distante do valor verdadeiro (ou seja, o estimador tem alta
variância). E suponha que tenhamos alguma compreensão - de outros
estudos, talvez - do que esses fatores podem ser. Suponha ainda que
nossa capacidade de observar e corrigir esses fatores diminua
substancialmente com o aumento do número de comunidades estudadas
(se, por nenhuma outra razão, não temos tempo e conhecimento para fazer
correções para tais fatores em um grande número de observações).
Somos então confrontados com um trade-off entre um estudo de caso que
tem observações adicionais internas ao caso e vinte e cinco casos em que
cada um contém apenas uma observação.
Se nosso estudo de caso único for composto de apenas uma observação,
então ele é obviamente inferior ao nosso estudo de 25 observações. Mas
os pesquisadores de estudos de caso têm vantagens significativas, que
são mais fáceis de entender se formalizadas. Por exemplo, podemos
primeiro selecionar nossa comunidade com muito cuidado para garantir
que ela seja especialmente representativa do resto do país ou que
entendamos a relação dessa comunidade com as outras. Podemos
perguntar a alguns moradores ou olhar para os jornais para ver se era uma comunidade média ou se
14 Observe que um estimador pode ser imparcial, mas inconsistente. Por exemplo, Y1 é um
estimador não viesado de m, mas é inconsistente porque, à medida que o número de unidades
aumenta, esse estimador não melhora (ou, na verdade, não muda). Um estimador também pode ser
consistente, mas tendencioso. Por exemplo, Y¯ ÿ 5/n é tendencioso, mas é consistente porque 5/n
torna-se zero quando n se aproxima do infinito.
algum fator não sistemático fez com que a observação fosse atípica, e então
podemos ajustar o nível de conflito observado para chegar a uma estimativa
do nível médio de conflito na Cisjordânia, m. Essa seria a parte mais difícil
do estimador de estudo de caso, e precisaríamos ter muito cuidado para que
o viés não se insinuasse. Quando estivermos razoavelmente confiantes de
que o viés foi minimizado, poderíamos nos concentrar em aumentar a
eficiência. Para fazer isso, podemos passar muitas semanas na comunidade
conduzindo vários estudos separados. Poderíamos entrevistar líderes
comunitários, cidadãos comuns e professores. Poderíamos conversar com
crianças, ler jornais, acompanhar uma família em sua vida cotidiana e usar
várias outras técnicas de coleta de informações.
Seguindo esses procedimentos, poderíamos coletar muito mais do que
vinte e cinco observações dentro desta comunidade e gerar um estudo de
caso que também não é tendencioso e mais eficiente do que o estudo de
vinte e cinco comunidades.
Considere outro exemplo. Suponha que estamos conduzindo um estudo
sobre o problema internacional das drogas e queremos uma medida da
porcentagem de terras agrícolas nas quais a cocaína está sendo cultivada
em uma determinada região do mundo. Suponha ainda que haja uma
escolha de dois métodos: um estudo de caso de um país ou um estudo
estatístico em larga escala de todos os países da região. Parece melhor estudar toda a região.
Mas digamos que para realizar tal estudo é necessário (por razões práticas)
usar dados fornecidos a uma agência da ONU pelos governos da região.
Sabe-se que esses números têm pouca relação com os padrões reais de
colheita, uma vez que foram preparados no Ministério das Relações
Exteriores e baseados em considerações de relações públicas. Suponha,
além disso, que pudéssemos, visitando e observando de perto um país,
fazer as correções nas estimativas do governo que trariam essa estimativa
particular muito mais perto de um número real. Qual método escolheríamos?
Talvez decidíssemos estudar apenas um país, ou talvez dois ou três. Ou
podemos estudar um país intensivamente e usar nossos resultados para
reinterpretar e, assim, melhorar os dados fornecidos pelo governo de outros
países. Nossa escolha deve ser guiada por quais dados respondem melhor
às nossas perguntas.
Para dar ainda outro exemplo, suponha que estamos estudando a
Comunidade Européia e queremos estimar o grau esperado de
regulamentação de uma indústria em toda a Comunidade que resultará das
ações da Comissão e do Conselho de Ministros. Poderíamos coletar dados
sobre um grande número de regras formalmente adotadas para o setor
industrial em questão, codificar essas regras em termos de seu rigor e,
então, estimar o rigor médio de uma regra. Se coletarmos dados sobre 100
regras com rigor semelhante a priori, a variação de nosso

medida será a variância de qualquer regra dada dividida por 100 (s2/100), ou
menos se as regras estiverem relacionadas. Sem dúvida, esta será uma
medida melhor do que usar dados sobre uma regra como o estimador de
rigor regulatório para a indústria como um todo.
No entanto, este procedimento obriga-nos a aceitar a regra formal como
equivalente à actividade regulatória real no sector em análise.
Uma investigação mais aprofundada da aplicação das regras, no entanto,
pode revelar uma grande variação na medida em que as regras nominais são
realmente aplicadas. Portanto, medidas de regras formais podem ser
sistematicamente tendenciosas – por exemplo, em favor de exagerar o rigor
regulatório. Nesse caso, enfrentaríamos o trade-off viés-eficiência mais uma
vez, e pode fazer sentido realizar três ou quatro estudos de caso intensivos
de implementação de regras para investigar a relação entre regras formais e
atividade regulatória real. Uma possibilidade seria substituir um estimador
baseado nesses três ou quatro casos – menos tendencioso e também menos
eficiente – pelo estimador baseado em 100 casos. No entanto, pode ser mais
criativo, se viável, usar o trabalho de estudo de caso intensivo para os três ou
quatro casos para corrigir o viés de nosso indicador de 100 casos e, em
seguida, usar uma versão corrigida do indicador de 100 casos. como nosso
estimador. Nesse procedimento, estaríamos combinando os insights de nossos
estudos de caso intensivos com técnicas de n grande, uma prática que
achamos que deveria ser seguida com muito mais frequência do que no caso
da ciência social contemporânea.
O argumento para estudos de caso feito por aqueles que conhecem bem
uma parte específica do mundo é frequentemente apenas aquele implícito no
exemplo anterior. Estudos em larga escala podem depender de números que
não são bem compreendidos pelo pesquisador ingênuo que trabalha em um
banco de dados (que pode não saber como as estatísticas eleitorais são
coletadas em um determinado local e assume, incorretamente, que elas têm
algum valor real). relação aos votos expressos). O pesquisador que trabalha
de perto com os materiais e entende sua origem pode fazer as correções
necessárias. Nas seções subseqüentes, tentaremos explicar como tais
escolhas podem ser feitas de forma mais sistemática.
Nossa análise formal desse problema no quadro abaixo mostra
precisamente como decidir quais são os resultados do trade-off no exemplo
dos constituintes eleitorais britânicos. A decisão em qualquer exemplo
particular sempre será melhor ao usar lógica como a mostrada na análise
formal abaixo. No entanto, decidir essa questão quase sempre exigirá
também julgamentos qualitativos.
Finalmente, vale a pena pensar mais especificamente sobre os trade-offs
que às vezes existem entre viés e eficiência. A média amostral das duas
primeiras observações em qualquer conjunto maior de observações imparciais é
Comparações formais de eficiência. A variância da média amostral Y¯ é denotada

como V(Y¯), e as regras para calcular as variâncias de variáveis aleatórias no caso
simples de amostragem aleatória permitem o seguinte:
n
ÿ ÿ1
V(Y¯) = V __Yi ÿn ÿ
i=1
n
1
= __V(Yi)
2n
i=1
Além disso, se assumirmos que a variância na replicação hipotética de cada eleição

distrital é a mesma de todos os outros distritos e é denotada por s2, então a variância
da média amostral é
n
1
V (Y¯) = __V(Yi)
2n
(2.5)
i=1
n
= 1 __s2
2n
i=1
1 = __
ns2 n2
= s2/n
No exemplo acima, n = 650, então o estimador de n grande tem variância s2/650 e

o estimador de estudo de caso tem variância s2. A menos que possamos usar
correções qualitativas de erros aleatórios para reduzir a variância do estimador do
estudo de caso por um fator de pelo menos 650, a estimativa estatística deve ser
preferida com base na eficiência.
também imparcial, assim como é a média amostral de todas as observações. No

entanto, usar apenas duas observações descarta informações substanciais; isso não
altera a imparcialidade, mas reduz substancialmente a eficiência. Se não usássemos
também o critério de eficiência, não teríamos critérios formais para escolher um
estimador em detrimento de outro.
Suponha que estamos interessados em saber se os democratas venceriam

a próxima eleição presidencial, e perguntamos a vinte adultos americanos
selecionados aleatoriamente em qual partido eles planejam votar. (Em nossa
versão simples de seleção aleatória, escolhemos os respondentes da pesquisa
entre todos os americanos adultos, cada um com a mesma probabilidade de
seleção.) Suponha que outra pessoa também tenha feito um estudo semelhante com 1.000 cidadãos.
Devemos incluir essas observações adicionais com as nossas para criar uma
única estimativa com base em 1.020 entrevistados? Se as novas observações
fossem selecionadas aleatoriamente, assim como as primeiras vinte, deveria ser
uma decisão fácil incluir os dados adicionais com os nossos: com as novas
observações, o estimador ainda é imparcial e agora muito mais eficiente.
No entanto, suponha que apenas 990 das 1.000 novas observações foram
extraídas aleatoriamente da população dos Estados Unidos e as outras dez eram
membros democratas do Congresso que foram inadvertidamente incluídos nos
dados após a amostra aleatória ter sido extraída. Suponha ainda que descobrimos
que essas observações adicionais foram incluídas em nossos dados, mas não
sabíamos quais eram e, portanto, não poderíamos removê-las. Agora sabemos a
priori que um estimador baseado em todos os 1.020 entrevistados produziria uma
leve superestimação da probabilidade de um democrata ganhar a votação
nacional. Assim, a inclusão dessas 1.000 observações adicionais enviesaria
ligeiramente a estimativa geral, mas também melhoraria substancialmente sua
eficiência. Se devemos incluir as observações, portanto, depende se o aumento
no viés é superado pelo aumento na eficiência estatística.
Intuitivamente, parece claro que o estimador baseado em 1.020 observações

produzirá estimativas bastante próximas da resposta certa com muito mais
frequência do que o estimador baseado em apenas vinte observações. O viés
introduzido seria pequeno o suficiente, então preferiríamos o estimador de amostra
maior, embora na prática provavelmente aplicaríamos ambos. (Além disso,
sabemos a direção do viés nesse caso e podemos corrigi-lo parcialmente).
Se dados quantitativos adequados estiverem disponíveis e formos capazes de

formalizar problemas como esses, geralmente podemos tomar uma decisão clara.
No entanto, mesmo que a natureza qualitativa da pesquisa torne difícil ou
impossível avaliar esse trade-off, entendê-lo deve nos ajudar a fazer inferências
mais confiáveis.
Comparações formais de viés e eficiência. Considere dois estimadores, um

um estudo de n grande por alguém com um preconceito, que é, portanto,
ligeiramente tendencioso, e o outro um estudo de n muito pequeno que
acreditamos ser imparcial, mas relativamente menos eficiente e feito por um
investigador imparcial. Como um modelo formal deste exemplo, suponha que
desejamos estimar m e o estudo grande n produz estimador d:
n
ÿn ÿ ÿ 1
ÿ d = __Yi ÿ 0,01
i=1
Modelamos o estudo de n pequeno com um estimador diferente de m, c:
ÿ ÿA1 + A2
c = _______ ÿ 2 ÿ
onde os distritos 1 e 2 são constituintes médios, de modo que E(Y1) = me E(Y2) = m.
Qual estimador devemos preferir? Nossa primeira resposta é que não usaríamos
nenhum dos dois e preferiríamos a média amostral y¯; ou seja, um estudo de n grande
feito por um investigador imparcial. No entanto, o estimador óbvio ou melhor nem sempre
é aplicável. Para responder a essa pergunta, nos voltamos para uma avaliação de viés e
eficiência.
Primeiro, vamos avaliar o viés. Podemos mostrar que o primeiro estimador d é
ligeiramente enviesado de acordo com o cálculo usual:
n
ÿ ÿ1E(d) = E __Yi ÿ
0,01 ÿ n ÿ
i=1
ÿ 1 = E __Yi ÿ E(0,01) ÿ
ÿ ÿn i=1
= m ÿ 0,01
Também podemos mostrar que o segundo estimador c não é viesado por um cálculo
semelhante:
ÿ ÿA1 + A2
E(c) = E _______ ÿ 2 ÿ
E(Y1) + E(Y2)
= _____________
2
m+m
= _____
2
=m

Apenas por esses cálculos, escolheríamos o estimador c, resultado dos esforços do
estudo pequeno-n de nosso investigador imparcial, uma vez que é imparcial. Em média,
em um número infinito de replicações hipotéticas, para o investigador com preconceito,
d daria a resposta errada, embora apenas ligeiramente. O estimador c daria a resposta
correta em média.
O critério de eficiência conta uma história diferente. Para começar, calculamos a

variância de cada estimador:
n
ÿ1
ÿ V(d) = V __Yi
ÿ 0,01 ÿn ÿ
i=1
ÿ 1 = V __Yi ÿ V(0,01) ÿ
ÿ ÿn i=1
= s2/n
= s2/650
Essa variação é a mesma que a variação da média da amostra porque 0,01 não muda
(tem variação zero) entre as amostras. Da mesma forma, calculamos a variância de c
da seguinte forma:15
ÿ A1
ÿ + A2
V(c) = V _______ ÿ 2 ÿ
= __[V(Y1) + V(Y2)]
14
1 = __
2s2 4
= s2/2
Assim, c é consideravelmente menos eficiente que d porque V(c) = s2/2 é 325 vezes
maior que V(d) = s2/650. Isso também deve ser intuitivamente claro, pois c descarta a
maior parte das informações do conjunto de dados.
Qual devemos escolher? O estimador d é tendencioso, mas mais eficiente
15 Assumimos a ausência de correlação espacial entre os distritos na segunda linha de

os cálculos anteriores e posteriores.
do que c, enquanto c é imparcial, mas menos eficiente. Neste caso particular,
provavelmente preferiríamos o estimador d. Estaríamos, portanto, dispostos a
sacrificar a imparcialidade, já que o sacrifício é bastante pequeno (0,01), para
obter um estimador significativamente mais eficiente. Em algum momento,
porém, mais eficiência não compensará um pouco de viés, pois acabamos
garantindo que as estimativas estarão mais distantes da verdade. A maneira
formal de avaliar o trade-off de eficiência de viés é calcular o erro quadrático
médio (MSE), que é uma combinação de viés e eficiência. Se g é um estimador
para algum parâmetro g (a letra grega Gama), o MSE é definido da seguinte
forma:
MSE(g) = V(g) + E(g ÿ g)2 (2.6)
= variância + tendência ao quadrado
O erro quadrático médio é, portanto, a soma da variância e do viés quadrado

(ver Johnston 1984:27–28). A ideia é escolher o estimador com o menor erro
quadrático médio, pois mostra precisamente como um estimador com algum
viés pode ser preferido se tiver uma variável menor.
ance.
Para o nosso exemplo, os dois MSEs são os seguintes:
s2
MSE(d) = ___
650+ (0,01)2 (2.7)
s2
= ___ + 0,0001
650
s2
__
MSE(c) = 2 (2.8)
Assim, para a maioria dos valores de s2, MSE(d) < MSE(c) e preferimos d como
estimador a c.
Em teoria, devemos sempre preferir estimativas imparciais que sejam tão
eficientes quanto possível (ou seja, que usem o máximo de informações). No
entanto, nas situações reais de pesquisa que analisamos nos capítulos
seguintes, esse trade-off entre viés e eficiência é bastante saliente.
CAPÍTULO 3
Causalidade e Inferência Causal
DISCUTIMOS dois estágios da pesquisa em ciências sociais: resumindo

detalhes históricos (seção 2.5) e fazendo inferências descritivas dividindo o
mundo em componentes sistemáticos e não sistemáticos (seção 2.6). Muitos
estudiosos de fenômenos sociais e políticos parariam neste ponto, evitando
declarações causais e pedindo a seus fatos selecionados e bem ordenados
que “falassem por si mesmos”.
Como os historiadores, os cientistas sociais precisam resumir os detalhes
históricos e fazer inferências descritivas. Para alguns propósitos científicos
sociais, no entanto, a análise é incompleta sem inferência causal. Ou seja,
assim como a inferência causal é impossível sem uma boa inferência descritiva,
a inferência descritiva por si só costuma ser insatisfatória e incompleta.
Dizer isso, no entanto, não é afirmar que todos os cientistas sociais devem, em
todo o seu trabalho, procurar conceber explicações causais para os fenômenos
que estudam. Às vezes, a inferência causal é muito difícil; em muitas outras
situações, a inferência descritiva é o objetivo final do esforço de pesquisa.
Claro, devemos sempre ser explícitos ao esclarecer se o objetivo de um

projeto de pesquisa é a descrição ou a explicação. Muitos cientistas sociais se
sentem desconfortáveis com a inferência causal. Eles são tão cautelosos com o
aviso de que “correlação não é causalidade” que não formulam hipóteses
causais ou tiram inferências causais, referindo-se a suas pesquisas como
“estudando associação e não causalidade”. Outros fazem declarações causais
aparentes com facilidade, rotulando hipóteses não avaliadas ou especulações
como “explicações” com base em projetos de pesquisa indeterminados.1
Acreditamos que cada uma dessas posições evita o problema da inferência
causal.
1 Tendo em vista a preferência de alguns cientistas sociais pela explicação em detrimento da “mera
descrição”, não surpreende que os estudiosos de eventos complicados procurem vestir seu trabalho
com as armadilhas do jargão explicativo; caso contrário, eles temem ser considerados como fazendo
um trabalho inferior. Em sua essência, a explicação real é sempre baseada em inferências causais.
Consideramos os argumentos na literatura sobre “explicação não causal” como uma terminologia
confusa; em praticamente todos os casos, esses argumentos são realmente sobre explicação causal
ou são internamente inconsistentes. Se as falhas dos cientistas sociais em explicar não se devem a
pesquisas deficientes ou falta de imaginação, mas sim à natureza dos problemas difíceis, mas
significativos, que estão examinando, tais sentimentos de inferioridade são injustificados. Uma boa
descrição de eventos importantes é melhor do que uma explicação ruim de qualquer coisa.
76 · Causalidade e Inferência Causal
Evitar a linguagem causal quando a causalidade é o assunto real da investigação

torna a pesquisa irrelevante ou permite que ela permaneça indisciplinada pelas regras da
inferência científica. Nossa incerteza sobre inferências causais nunca será eliminada. Mas
essa incerteza não deve sugerir que evitemos tentativas de inferência causal. Em vez
disso, devemos fazer inferências causais onde elas parecerem apropriadas, mas também
fornecer ao leitor a melhor e mais honesta estimativa da incerteza dessa inferência. É
apropriado ser ousado ao fazer inferências causais, desde que sejamos cautelosos ao
detalhar a incerteza da inferência. É importante, ainda, que as hipóteses causais sejam
disciplinadas, aproximando-se o mais possível das regras de inferência causal. Nosso
propósito em grande parte dos capítulos 4 a 6 é explicar as circunstâncias sob as quais a
inferência causal é apropriada e possibilitar que os pesquisadores qualitativos aumentem
a probabilidade de que suas pesquisas forneçam evidências confiáveis sobre suas
hipóteses causais.
Na seção 3.1 fornecemos uma definição rigorosa de causalidade apropriada para

pesquisa qualitativa e quantitativa, então na seção 3.2 esclarecemos várias noções
alternativas de causalidade na literatura e demonstramos que elas não entram em conflito
com nossa definição mais fundamental. Na seção 3.3, discutimos as suposições precisas
sobre o mundo e as hipóteses necessárias para fazer inferências causais confiáveis.
Em seguida, consideramos na seção 3.4 como aplicar à inferência causal os critérios que
desenvolvemos para julgar a inferência descritiva. Na seção 3.5, concluímos este capítulo
com conselhos mais gerais sobre como construir explicações, teorias e hipóteses causais.
3.1 DEFININDO A CAUSALIDADE
Nesta seção, definimos a causalidade como um conceito teórico independente dos dados
usados para aprender sobre ela. Posteriormente, consideramos a inferência causal de
nossos dados. (Para discussões de problemas específicos de inferência causal, consulte
os capítulos 4–6.) Na seção 3.1.1, apresentamos nossa definição de causalidade em
todos os detalhes, juntamente com um exemplo quantitativo simples, e na seção 3.1.2
revisitamos nossa definição ao longo com um exemplo qualitativo mais sofisticado.
3.1.1 A Definição e um Exemplo Quantitativo Nossa
definição teórica de causalidade aplica-se de forma mais simples e clara a uma única
unidade.2 Conforme definido na seção 2.4, uma unidade é um dos muitos elementos a
serem observados em um estudo, como uma pessoa , país, ano ou
2 Nosso ponto de partida nesta seção é o artigo de Holland (1986) sobre causalidade e
Definindo Causalidade · 77
Organização política. Para precisão e clareza, escolhemos um único
exemplo contínuo de pesquisa quantitativa: o efeito causal do status de
incumbência de um candidato democrata à Câmara dos Deputados dos
Estados Unidos sobre a proporção de votos que esse candidato recebe.
(Usar apenas um candidato democrata simplifica o exemplo.) Deixe a
variável dependente ser a proporção democrata do voto de dois partidos
para a Câmara. A variável explicativa causal chave é então dicotômica,
ou o democrata é um titular ou não. (Para simplificar ao longo desta
seção, consideramos apenas os distritos onde o Republi pode candidatar-
se à derrota na última eleição.)
A linguagem causal pode ser confusa e nossa escolha aqui
dificilmente é única. A “variável dependente” às vezes é chamada de
“variável de resultado”. “Variáveis explicativas” são muitas vezes
referidas como “variáveis independentes”. Dividimos as variáveis
explicativas em “variável causal chave” (também chamada de “causa”
ou “variável de tratamento”) e “variáveis de controle”. Por fim, a variável
causal chave sempre assume dois ou mais valores, que geralmente são
denotados por “grupo de tratamento” e “grupo de controle”.
Agora considere apenas o Quarto Distrito Congressional em Nova
York e imagine uma eleição em 1998 com um candidato democrata e
um candidato republicano (não titular). Suponha que o candidato
democrata tenha recebido y41 fração dos votos nesta eleição (o subscrito
4 denota o Quarto Distrito em Nova York e o sobrescrito I refere-se ao
fato de que o democrata é um titular). y4 I é entãoum valor da variável
dependente. Para definir o efeito causal (uma quantidade teórica ),
imagine que voltemos no tempo para o início da campanha eleitoral e
tudo continue igual, exceto que o atual democrata decide não concorrer
à reeleição e o Partido Democrata indica outro candidato (presumivelmente
o vencedor da eleição primária). Representamos a fração dos votos que
o candidato democrata (não titular) receberia em y4 (onde N denota um
candidato democrata que não é titular).3 N
Essa condição contrafactual é a essência por trás dessa definição de

causalidade, e a diferença entre o voto real (y4 I) e o provável
o que ele chama de “Modelo de Rubin”. Holland baseia suas ideias no trabalho de numerosos
estudiosos. O trabalho de Donald Rubin (1974, 1978) sobre o assunto foi imediatamente
relevante, mas ele também cita Aristóteles, Locke, Hume, Mill, Suppes, Granger, Fisher, Neyman e outros.
Estendemos a definição de efeito causal de Holland usando algumas ideias expressas claramente
por Suppes (1970) e outras sobre “causalidade probabilística”. Achamos essa extensão
necessária, uma vez que nenhuma abordagem existente sozinha é capaz de definir a causalidade
com relação a uma única unidade e ainda permitir a divisão dos efeitos causais em componentes
sistemáticos e não sistemáticos.
3 Veja Gelman e King (1990) para detalhes deste exemplo. De forma mais geral, I e N podem
representar o grupo “tratamento” e “controle” ou quaisquer dois tratamentos experimentais

voto nesta situação contrafactual (y4 N) é o efeito causal, um conceito
que definimos mais precisamente abaixo. Devemos ter muito cuidado
ao definir contrafactuais; embora sejam obviamente contrários aos
fatos, devem ser razoáveis e deve ser possível que o evento
contrafactual tenha ocorrido em circunstâncias precisas. Uma parte
fundamental da definição da condição contrafactual apropriada é
esclarecer com precisão o que estamos mantendo constante enquanto
alteramos o valor da variável de tratamento. No presente exemplo, a
principal variável causal (ou tratamento) é o status do titular e muda de
“titular” para “não titular”. Durante essa mudança hipotética, mantemos
tudo constante até o momento da decisão de nomeação do Partido
Democrata - a força relativa dos democratas e republicanos nas
eleições anteriores neste distrito, a natureza do processo de nomeação,
as características da rejeição do Congresso trito, e o clima econômico
e político da época, etc. Não controlamos as qualidades dos candidatos,
como reconhecimento de nome, visibilidade e conhecimento do
funcionamento do Congresso, ou qualquer outra coisa que se segue à
indicação do partido. A razão é que essas são, em parte, consequências
de nossa variável de tratamento, incumbência. Ou seja, as vantagens
da incumbência incluem reconhecimento de nome, visibilidade e assim
por diante. Se mantivéssemos essas constantes, estaríamos
controlando e, portanto, desconsiderando alguns dos efeitos mais
importantes da incumbência e, como resultado, interpretaríamos
erroneamente seu efeito geral no total de votos. Na verdade, controlar
o suficiente das consequências da incumbência poderia fazer alguém
acreditar
incorretamente que a incumbência não teve nenhum efeito.4 Mais
formalmente, o efeito causal da incumbência no Quarto Distrito em
Nova York - a proporção dos votos recebidos por o candidato do
Partido Democrata que é atribuível ao status de incumbência - seria a EU
diferença entre essas duas frações de votos: (y4 ÿ y4 N). Por razões que ficarão claras em breve, nos referimos a essa difer
administrado de fato ou em teoria. É claro que a decisão de chamar um valor de uma variável explicativa
de tratamento e o outro de controle é totalmente arbitrária, se é que essa linguagem é usada. 4
Jon Elster (1983:34-36) afirmou que “o significado de causalidade não pode ser prestado por
declarações contrafactuais” em muitas situações, como aquelas em que um terceiro fator é responsável
pelas variáveis explicativas e dependentes aparentes. Em nossa linguagem, Elster está simplesmente
apontando para problemas comuns de inferências, que são sempre incertas até certo ponto. No entanto,
essas dificuldades de inferência não invalidam uma definição de causalidade em termos de contrafactuais.
Apesar de suas objeções, Elster reconhece que declarações contrafactuais “têm um papel importante na
análise causal” (Elster 1983:36).
Portanto, pensamos que o argumento de Elster é mais convincente como um conjunto de advertências
valiosas contra o uso descuidado de contrafactuais do que como uma crítica de sua importância definicional
fundamental no raciocínio causal.
efeito causal e escreva-o em uma notação mais geral para a unidade i em vez de
apenas para o distrito 4:5
EU
N (3.1)
(Efeito Causal Realizado para a unidade i) = yi ÿ yi
É claro que esse efeito é definido apenas em teoria, pois em qualquer eleição real
EU
N
podemos observar y4 ou nenhum, mas nunca ambos. ou y4 Assim, esta simples
definição de causalidade demonstra que nunca podemos esperar conhecer um efeito
causal com certeza. Holland (1986) refere-se a este problema como o problema
fundamental da inferência causal, e é de fato um problema fundamental , pois não
importa quão perfeito seja o projeto de pesquisa, não importa quantos dados coletemos,
não importa quão perceptivos sejam os observadores, não importa quão diligentes são
os assistentes de pesquisa, e não importa quanto controle experimental tenhamos,
nunca saberemos com certeza uma inferência causal. De fato, a maioria das questões
empíricas de projetos de pesquisa que discutimos neste livro envolve esse problema
fundamental, e a maioria de nossas sugestões constituem tentativas parciais de evitá-lo.
Nossa definição operacional de causalidade difere da de Holland, pois na seção 2.6

argumentamos que a ciência social sempre precisa dividir o mundo em componentes
sistemáticos e não sistemáticos, e a definição de Holland não faz essa distinção
claramente.6 Para ver a importância dessa divisão , pense no que aconteceria se
pudéssemos repetir a campanha eleitoral de 1998 no Quarto Distrito de Nova York, com
um candidato democrata e um candidato republicano. O resultado seria um total
ligeiramente diferente de votos, devido às características não sistemáticas das
campanhas eleitorais – aspectos da política que não persistem de uma campanha para
a seguinte, mesmo que as campanhas comecem em bases idênticas. Algumas dessas
características não sistemáticas podem incluir uma gafe verbal, um discurso ou posição
surpreendentemente popular sobre um assunto, um desempenho inesperadamente
ruim em um debate, mau tempo durante o comício de um candidato ou no dia da eleição,
ou os resultados de algum jornalismo investigativo. Podemos, portanto, imaginar uma
variável que expressasse os valores do voto democrata através de replicações
hipotéticas dessa mesma eleição.
5 Podemos especializar o distrito 4 substituindo “4” por “i” na equação a seguir.

6 A razão para isso provavelmente é que Holland é um estatístico que se aproxima muito de
uma versão extrema da variação aleatória da “Perspectiva 2”, descrita na seção 2.6. Em sua
descrição da “solução estatística” para o problema da inferência causal, ele se aproxima mais
de nossa definição de efeito causal, mas essa definição é principalmente sobre o uso de
diferentes unidades para resolver o Problema Fundamental, em vez de reter a definição de
causalidade em apenas um. Em particular, seu operador de valor esperado calcula a média
sobre unidades, enquanto o nosso (descrito abaixo) calcula a média sobre replicações
hipotéticas do mesmo experimento para apenas uma única unidade (ver Holland 1986:947).

Conforme observado acima (consulte a seção 2.6), essa variável é chamada de
“variável aleatória”, pois possui características não sistemáticas: é afetada por variáveis
explicativas não incluídas em nossa análise teórica ou contém variabilidade
fundamentalmente inexplicável.7 Definimos a variável aleatória representando a
proporção de votos recebidos pelo candidato democrata em exercício como Y4 (observe
EU
o Y maiúsculo) e a proporção de votos que seriam recebidos em replicações hipotéticas

por um democrata não titular como Y4 N.
Agora definimos o efeito causal aleatório para o distrito 4 como a diferença entre
essas duas variáveis aleatórias. Como desejamos manter alguma generalidade,
mudamos novamente a notação do distrito 4 para a unidade i:
(3.2)
EU
(Efeito causal aleatório para a unidade i)=(Yi ÿ Yi N)
(Assim como na definição de uma variável aleatória, um efeito causal aleatório é um

efeito causal que varia ao longo de replicações hipotéticas do mesmo experimento, mas
também representa muitas características sistemáticas interessantes das eleições.) Se
pudéssemos observar duas proporções de votos separadas no distrito 4 ao mesmo
tempo, uma de uma eleição com e outra sem um candidato democrata concorrendo,
então poderíamos observar diretamente o efeito causal realizado na equação (3.1).
Claro, por causa do Problema Fundamental da Inferência Causal, não podemos
observar o efeito causal realizado. Assim, o efeito causal realizado na equação 3.1 é
uma única realização não observada do efeito causal aleatório na equação 3.2. Em
outras palavras, em muitas replicações hipotéticas da mesma eleição no distrito 4 com
um candidato democrata, e em muitas replicações hipotéticas da mesma eleição, mas
com um democrata não titular, o efeito causal realizado (não observado) torna-se um
efeito causal aleatório .
Descrever a causalidade como uma das características sistemáticas das variáveis

aleatórias pode parecer excessivamente complicado. Mas tem duas virtudes. Primeiro,
torna nossa definição de causalidade diretamente análoga àquelas características
sistemáticas (como uma média ou variação) de um fenômeno que serve
7 Como explicamos com mais detalhes na seção 2.2, essa frase pode ser confusa. Uma
“variável aleatória” contém algum componente sistemático e, portanto, nem sempre é
totalmente imprevisível. Infelizmente, esta linguagem tem um significado específico em
estatística e os conceitos subjacentes a ela são importantes. A razão original para a
terminologia é que a aleatoriedade não significa “vale tudo” ou “tudo pode acontecer”. Em
vez disso, refere-se a um dos muitos possíveis processos probabilísticos muito bem
especificados. Por exemplo, o processo aleatório que governa qual lado de uma moeda cai
para cima quando é lançado no ar é um processo aleatório muito diferente daquele que
governa o crescimento da burocracia da Comunidade Econômica Européia ou a consequência
política incerta de uma mudança no sistema eleitoral da Itália. . A chave para nossa
representação é que cada um desses processos “aleatórios” tem componentes sistemáticos e probabilísticos.
como objetos de inferência descritiva: médias e variâncias também são características
sistemáticas de variáveis aleatórias (como na seção 2.2). Em segundo lugar, permite-nos
dividir um problema de inferência causal em componentes sistemáticos e não sistemáticos.
Embora muitos recursos sistemáticos de uma variável aleatória possam ser interessantes, o
mais relevante para nosso exemplo em execução é o efeito causal médio para a unidade i.
Para explicar o que queremos dizer com isso, voltamos ao nosso exemplo da eleição em
Nova York.
Lembre-se de que a variável aleatória se refere à fração de votos recebidos pelo
democrata (titular ou não) em um grande número de replicações hipotéticas da mesma
eleição. Definimos o valor esperado dessa variável aleatória - a média da fração de votos
entre essas replicações - para o não titular como
N
E(Y4 N) = m4
e para o titular como
E(Y4 I) = m4.
EU
Então, o efeito causal médio da incumbência na unidade i é uma característica sistemática

do efeito causal aleatório e é definido como a diferença entre esses dois valores esperados
(novamente generalizado para a unidade i em vez do distrito 4):
Efeito Causal Médio para a unidade i ÿ b (3.3)
= E(Efeito causal aleatório para unidade i)
EU
= E(Yi ÿ Yi N)
= E(Yi ) ÿ E(Yi N)
EU
N
= mi ÿ mi
EU
onde na primeira linha desta equação, b (beta) refere-se a este efeito causal médio. Na
segunda linha, indicamos que o efeito causal médio para a unidade i é apenas a média (valor
esperado) do efeito causal aleatório, e na terceira e quarta linhas mostramos como calcular
a média.
A última linha é outra maneira de escrever a diferença nas médias dos dois conjuntos de
eleições hipotéticas. (A média da diferença entre duas variáveis aleatórias é igual à diferença
das médias.)
Para resumir em palavras: o efeito causal é a diferença entre o componente sistemático das
observações feitas quando a variável explicativa leva

um valor e o componente sistemático de observações comparáveis quando a variável
explicativa assume outro valor.
A última linha da equação 3.3 é semelhante à equação 3.1 e, como tal, o Problema
Fundamental da Inferência Causal ainda existe nesta formulação. De fato, o problema
expresso desta forma é ainda mais formidável porque mesmo que pudéssemos
contornar o Problema Fundamental para um efeito causal realizado, ainda teríamos
todos os problemas usuais de inferência, incluindo o problema de separar componentes
sistemáticos e não sistemáticos de o efeito causal aleatório. Daqui em diante, usamos a
expressão de Holland, o Problema Fundamental da Inferência Causal, para nos
referirmos ao problema que ele identificou, bem como a esses problemas padrão de
inferência, que adicionamos à sua formulação.
No quadro da página 95, fornecemos uma notação mais geral para efeitos causais, que
será útil ao longo deste livro.
Muitas outras características sistemáticas desses efeitos causais aleatórios podem
ser de interesse em várias circunstâncias. Por exemplo, podemos querer saber a
variação nos possíveis efeitos causais (realizados) do status de incumbência sobre o
voto democrata na unidade i, assim como a variação no próprio voto que descrevemos
na equação 2.3 na seção 2.6. Para calcular a variância do efeito causal, aplicamos a
operação de variância
EU
(variância do efeito causal na unidade i) = V(Yi ÿ Yi N)
no qual evitamos introduzir um novo símbolo para o resultado do cálculo da variância,

EU
V(Yi ÿ Yi N). Certamente os novos incumbentes gostariam de saber a variação no efeito

causal da incumbência para que possam julgar o quão próximo sua experiência será da
dos incumbentes anteriores e quanto confiar em seu efeito causal médio estimado de
incumbência de eleições anteriores. É especialmente importante entender que essa
variação no efeito causal é uma parte fundamental do mundo e não é uma incerteza
devido à estimativa.
3.1.2 Um exemplo qualitativo
Desenvolvemos nossa definição precisa de causalidade na seção 3.1. Como alguns dos
conceitos dessa seção são sutis e bastante sofisticados, ilustramos nossos pontos com
um exemplo muito simples da pesquisa quantitativa. Este exemplo nos ajudou a
comunicar os conceitos que desejávamos enfatizar sem também ter que atender aos
detalhes contextuais e à sensibilidade cultural que caracterizam uma boa pesquisa
qualitativa. Nesta seção, prosseguimos com nossa definição de causalidade novamente,
mas desta vez por meio de um exemplo qualitativo.
Os cientistas políticos aprenderiam muito se pudessem repassar a história com tudo

constante, exceto por uma explicação controlada pelo investigador.
variável. Por exemplo, uma das principais questões enfrentadas pelos
envolvidos com política e governo tem a ver com as consequências de uma
determinada lei ou regulamentação. O Congresso aprova uma lei tributária
destinada a ter uma consequência específica – levar a investimentos
específicos, aumentar a receita em uma determinada quantia e mudar os
padrões de consumo. Tem este efeito? Podemos observar o que acontece
depois que o imposto é aprovado para ver se as consequências pretendidas
aparecem; mas mesmo que o façam, nunca é certo que resultem da lei. A
mudança na política de investimentos poderia ter acontecido de qualquer
maneira. Se pudéssemos repassar a história com e sem a nova
regulamentação, teríamos muito mais influência para estimar o efeito causal
dessa lei. Claro, não podemos fazer isso. Mas a lógica nos ajudará a
projetar a pesquisa para nos dar uma resposta aproximada à nossa pergunta.
Considere agora o seguinte exemplo estendido de política comparada.
Na esteira do colapso do sistema soviético, numerosos governos nas ex-
repúblicas soviéticas e na Europa Oriental instituíram novas formas de
governo. Eles estão engajados – como eles mesmos percebem – em um
grande experimento político: eles estão introduzindo novas constituições,
constituições que eles esperam que tenham o efeito pretendido de criar
sistemas democráticos estáveis. Uma das escolhas constitucionais é entre
as formas parlamentar e presidencial de governo. Qual sistema tem maior
probabilidade de levar a uma democracia estável é assunto de considerável
debate entre os estudiosos da área (Linz 1993; Horowitz 1993; Lijphart
1993). O debate é complexo, até por causa dos numerosos tipos de
sistemas parlamentar e presidencial e da variedade de outras disposições
constitucionais que podem acompanhar e interagir com essa escolha (como
a natureza do sistema eleitoral). Não é nosso propósito fornecer uma
análise completa dessas escolhas, mas sim uma versão bastante
simplificada da escolha para definir um efeito causal no contexto desse
exemplo qualitativo.
Ao fazê-lo, destacamos a distinção entre características sistemáticas e
não sistemáticas de um efeito causal.
O debate sobre os sistemas presidencial versus parlamentar envolve
características variadas dos dois sistemas. Vamos nos concentrar em dois:
até que ponto cada sistema representa os diversos interesses da cidadania
e encoraja uma liderança forte e decisiva. O argumento é que os sistemas
parlamentaristas representam melhor toda a gama de grupos sociais e
interesses no governo, uma vez que há muitos assentos legislativos a
serem preenchidos, e eles podem ser preenchidos por representantes
eleitos de vários grupos. Em contraste, o caráter tudo ou nada dos sistemas
presidencialistas significa que alguns grupos se sentirão excluídos do
governo, ficarão insatisfeitos e causarão maior instabilidade. Por outro lado,
os sistemas parlamentaristas – especialmente se representarem
adequadamente toda a gama de grupos e interesses sociais – provavelmente serão

impasse e ineficaz em fornecer governo decisivo. Essas características
também podem levar à insatisfação e instabilidade.8
O principal objetivo desta seção é formular uma definição precisa de um
efeito causal. Para fazer isso, imagine que poderíamos instituir um sistema
parlamentar e, periodicamente ao longo da próxima década, medir o grau
de estabilidade democrática (talvez pela sobrevivência real ou o fim da
democracia, tentativas de golpe ou outros indicadores de instabilidade) e
no mesmo país e ao mesmo tempo, instituir um sistema presidencialista,
medindo também a sua estabilidade no mesmo período com as mesmas
medidas. O efeito causal percebido seria a diferença entre o grau de
estabilidade observado sob um sistema presidencialista e sob um sistema
parlamentarista. A impossibilidade de medir esse efeito causal diretamente
é outro exemplo do problema fundamental da inferência causal.
Como parte dessa definição, também precisamos distinguir entre efeitos

sistemáticos e não sistemáticos da forma de governo. Para fazer isso,
imaginamos executar esse experimento hipotético várias vezes.
Definimos o efeito causal médio como sendo a média dos efeitos causais
realizados nas replicações desses experimentos. Tirar a média dessa
maneira faz com que as características não sistemáticas desse problema
sejam anuladas e deixa o efeito causal médio para incluir apenas
características sistemáticas. Características sistemáticas incluem indecisão
em um sistema parlamentar ou descontentamento entre as minorias em
um presidencial. Características não sistemáticas podem incluir a doença
repentina de um presidente que lança o governo no caos. O último evento
não seria uma característica persistente de um sistema presidencialista;
apareceria em uma tentativa do
experimento, mas não em outras.9 Outra característica interessante
desse exemplo é a variação do efeito causal. Qualquer país que pensasse
em escolher um desses sistemas políticos estaria interessado em seu
efeito causal médio sobre a estabilidade democrática; no entanto, esse
país tem apenas uma chance - apenas uma replicação desse experimento.
Dada esta situação, os líderes políticos podem estar interessados em mais
do que o efeito causal médio. Eles podem querer entender quais podem
ser os efeitos causais máximos e mínimos, ou pelo menos a variação dos
efeitos causais. Por exemplo, pode ser que o presidencialismo reduza a estabilidade democrática em média
8 Essas distinções são elas mesmas debatidas. Alguns argumentam que um sistema presidencial pode
fazer um trabalho de representação melhor. E outros argumentam que os sistemas parlamentares podem
ser mais decisivos.
9 A distinção entre uma característica sistemática e não sistemática nem sempre é
clara. A doença repentina de um presidente parece ser uma característica não sistemática
do sistema presidencial. Por outro lado, a vulnerabilidade geral dos sistemas
presidencialistas aos caprichos da saúde e da personalidade de um único indivíduo é um
efeito sistemático que aumenta a probabilidade de que algum aspecto não sistemático apareça.
Definições Alternativas de Causalidade · 85
mas que a variabilidade desse efeito é enorme - às vezes aumentando muito

a estabilidade, às vezes diminuindo-a substancialmente. Essa variação se
traduz em risco para uma política. Nesta circunstância, pode ser que os
cidadãos e os líderes políticos prefiram escolher uma opção que produz
apenas um pouco menos de estabilidade em média, mas tem uma variação
menor no efeito causal e, portanto, minimiza a chance de um resultado
desastroso.
3.2 ESCLARECENDO DEFINIÇÕES ALTERNATIVAS DE CAUSALIDADE
Na seção 3.1, definimos causalidade em termos de um efeito causal: o efeito

causal médio é a diferença entre o componente sistemático de uma variável
dependente quando a variável causal assume dois valores diferentes. Nesta
seção, usamos nossa definição de causalidade para esclarecer várias
propostas alternativas e ideias aparentemente complicadas. Mostramos que
os pontos importantes levantados por outros autores sobre “mecanismos
causais” (seção 3.2.1), causalidade “múltipla” (seção 3.2.2) e causalidade
“simétrica” versus “assimétrica” (seção 3.2.3) não conflito com nossa
definição mais básica de causalidade.
3.2.1 “Mecanismos causais”
Alguns estudiosos argumentam que a ideia central de causalidade é a de um

conjunto de “mecanismos causais” que existe entre causa e efeito (ver Little
1991:15). Essa visão faz sentido intuitivo: qualquer explicação coerente da
causalidade precisa especificar como os efeitos são exercidos. Por exemplo,
suponha que um pesquisador esteja interessado no efeito de um novo tratado
tributário bilateral na redução do déficit em conta corrente dos Estados Unidos
com o Japão. De acordo com nossa definição de causalidade, o efeito causal
aqui é a redução do déficit esperado em conta corrente com o tratado
tributário em vigor em comparação com a mesma situação (ao mesmo tempo
e para os mesmos países), com a exceção de que o tratado foi não está em vigor.
O mecanismo causal que opera aqui incluiria, por sua vez, a assinatura e
ratificação do tratado tributário, reportagens jornalísticas do evento, reuniões
dos atores relevantes dentro de grandes empresas multinacionais, ações
compensatórias para reduzir sua carga tributária internacional total (como
mudar suas regras de preços de transferência ou mudança de fábricas entre
países), outras ações de outras empresas e trabalhadores para aproveitar os
movimentos de capital e trabalho entre países, e assim por diante, até
chegarmos ao efeito final no balanço de pagamentos entre Estados Unidos
e Japão.
Do ponto de vista dos processos pelos quais a causalidade opera, uma
ênfase nos mecanismos causais faz sentido intuitivo: qualquer coerência

Uma explicação abrangente da causalidade precisa especificar como seus efeitos são exercidos.
Identificar mecanismos causais é uma maneira popular de fazer análises empíricas. Foi chamado,
em formas ligeiramente diferentes, “rastreamento de processo” (que discutiremos na seção
6.3.3), “análise histórica” e “estudos de caso detalhados”. Muitos dos detalhes de estudos de
caso bem feitos envolvem a identificação desses mecanismos causais.
No entanto, identificar os mecanismos causais requer inferência causal, usando os métodos

discutidos abaixo. Isto é, para demonstrar o status causal de cada ligação potencial em tal
mecanismo postulado, o investigador teria que definir e então estimar o efeito causal subjacente
a ele. Retratar um mecanismo causal internamente consistente requer o uso de nossa definição
mais fundamental de causalidade oferecida na seção 3.1 para cada elo na cadeia de eventos
causais.
Portanto, nossa definição de causalidade é logicamente anterior à identificação de

mecanismos causais. Além disso, sempre existe nas ciências sociais uma infinidade de etapas
causais entre quaisquer dois elos na cadeia de mecanismos causais. Se postularmos que uma
variável explicativa causa uma variável dependente, uma abordagem de “mecanismos causais”
exigiria que identificássemos uma lista de vínculos causais entre as duas variáveis.
Essa definição também exigiria que identificássemos uma série de idades de ligação causal,
para definir a causalidade para cada par de variáveis consecutivas na sequência e para identificar
as ligações entre quaisquer duas dessas variáveis e as conexões entre cada par de variáveis.
Essa abordagem leva rapidamente a uma regressão infinita e em nenhum momento ela sozinha
dá uma definição precisa de causalidade para qualquer causa e efeito.
Em nosso exemplo do efeito de um sistema presidencial versus parlamentar na estabilidade

democrática (seção 3.1.2), os mecanismos causais hipotéticos incluem maior descontentamento
minoritário sob um regime presidencial e menor determinação governamental sob um regime
parlamentar. Esses efeitos intervenientes – causados pelo sistema constitucional e, por sua vez,
afetando a estabilidade política – podem ser observados diretamente. Poderíamos monitorar as
atitudes ou comportamentos das minorias para ver como elas diferem sob as duas condições
experimentais ou estudar a determinação dos governos em cada sistema. No entanto, mesmo
que o efeito causal dos sistemas presidencial versus parlamentar pudesse operar de maneiras
diferentes, nossa definição do efeito causal permaneceria válida. Podemos definir um efeito
causal sem entender todos os mecanismos causais envolvidos, mas não podemos identificar
mecanismos causais sem definir o conceito de efeito causal.
A nosso ver, a identificação dos mecanismos pelos quais uma causa tem seu efeito muitas
vezes dá sustentação a uma teoria e é um procedimento operacional muito útil. A identificação
de mecanismos causais pode às vezes nos dar mais influência sobre uma teoria, fazendo
observações em um ponto de vista diferente.

nível de análise em implicações da teoria. O conceito também pode criar
novas hipóteses causais para investigar. No entanto, não devemos confundir
uma definição de causalidade com o procedimento operacional não definidor,
embora frequentemente útil, de identificar mecanismos causais.
3.2.2 “Causalidade Múltipla”
Charles Ragin, em trabalho recente (1987:34-52), defende uma metodologia

com muitas variáveis explicativas e poucas observações para que se possa
levar em conta o que ele chama de “causação múltipla”. Ou seja, “O fenômeno
sob investigação tem determinantes alternativos – o que Mill (1843) chamou
de problema da 'pluralidade de causas'”. 11). Em situações de causação
múltipla, esses autores argumentam que o mesmo resultado pode ser
causado por combinações de diferentes variáveis independentes.10
Sob condições nas quais diferentes variáveis explicativas podem contar

para o mesmo resultado em uma variável dependente, de acordo com Ragin,
alguns métodos estatísticos rejeitarão falsamente a hipótese de que essas
variáveis têm status causal. Ragin está correto ao dizer que alguns modelos
estatísticos (ou projetos de pesquisa qualitativa relevantes) podem falhar em
alertar um investigador para a existência de “causalidade múltipla”, mas
modelos estatísticos apropriados podem facilmente lidar com situações como
essas (algumas das quais Ragin discute).
Além disso, as características fundamentais da “causalidade múltipla” são
compatíveis com nossa definição de causalidade. Eles também não são
diferentes para pesquisas quantitativas e qualitativas. A ideia não contém
novos recursos ou requisitos teóricos. Por exemplo, considere a hipótese de
que o nível de renda de uma pessoa depende tanto da alta escolaridade
quanto dos pais altamente qualificados. Ter um, mas não os dois, é insuficiente.
Nesse caso, precisamos comparar as categorias de nossa variável causal:
entrevistados com alto nível educacional e pais altamente qualificados, os dois
grupos que têm um, mas não o outro, e o grupo sem nenhum dos dois. Assim,
o conceito de “causação múltipla” exige mais de nossos dados, pois agora
temos quatro categorias
10 Essa ideia é frequentemente explicada em termos de nenhuma variável explicativa ser

necessária ou suficiente para que um determinado valor de uma variável dependente ocorra. No
entanto, esta é uma terminologia enganosa porque a distinção entre condições necessárias e
suficientes desaparece em grande parte quando permitimos a possibilidade de que as causas sejam probabilísticas.
Como explica Little (1991:27), “Considere a alegação de que a má comunicação entre as
superpotências durante a crise aumenta a probabilidade de guerra. Esta é uma afirmação
probabilística; identifica uma variável causal (falta de comunicação) e afirma que essa variável
aumenta a probabilidade de um determinado resultado (guerra). Entretanto, não pode ser traduzido
em uma afirmação sobre as condições necessárias e suficientes para a guerra; é irredutivelmente probabilístico”.

egorias de nossas variáveis causais, mas não requer uma modificação de
nossa definição de causalidade. Para nossa definição, precisaríamos medir
a renda esperada para a mesma pessoa, ao mesmo tempo, experimentando
cada uma das quatro condições.
Mas o que acontece se diferentes explicações causais geram os mesmos
valores da variável dependente? Por exemplo, suponha que consideremos
se alguém se formou ou não na faculdade como nossa variável causal
(dicotômica) em uma população de operários fabris. Nesta situação, ambos
os grupos poderiam razoavelmente ganhar a mesma renda (nossa variável
dependente). Uma razão pode ser que esta variável explanatória (frequência
universitária) não tem efeito causal sobre a renda entre os trabalhadores da
fábrica, talvez porque uma educação universitária não ajude a pessoa a ter
um desempenho melhor. Alternativamente, diferentes explicações podem
levar ao mesmo nível de renda para os educados e não educados. Os
graduados universitários podem ganhar um determinado nível de renda por
causa de sua educação, enquanto aqueles que não tiveram educação
universitária podem ganhar o mesmo nível de renda por causa de seus
quatro anos adicionais de antiguidade no trabalho. Nesta situação não
seríamos levados a concluir que a “educação universitária” não tem efeito
causal sobre os níveis de renda daqueles que se tornarão trabalhadores fabris?
Felizmente, nossa definição de causalidade exige que especifiquemos
com mais cuidado a condição contrafactual. No presente exemplo, os valores
da variável causal chave a serem variados são (1) educação universitária,
em comparação com (2) nenhuma educação universitária, mas quatro anos
adicionais de antiguidade no trabalho. A variável dependente é a renda anual
inicial. Nosso efeito causal é então definido da seguinte forma: registramos
a renda de uma pessoa que se forma na faculdade e vai trabalhar em uma
fábrica. Então, voltamos quatro anos no tempo, colocamos essa mesma
pessoa para trabalhar na mesma fábrica em vez de na faculdade e, ao final
de quatro anos, medimos sua renda “de novo”. A diferença esperada entre
esses dois níveis de renda para esse indivíduo é nossa definição de efeito
causal médio. Na situação atual, imaginamos que esse efeito causal é zero.
Mas isso não significa que “a educação universitária não tem efeito sobre a
renda”, apenas que a diferença média entre os grupos de tratamento (1) e
(2) é zero. Na verdade, não existe uma definição logicamente única de “o
efeito causal da educação universitária”, uma vez que não se pode definir
um efeito causal sem pelo menos duas condições. As condições não
precisam ser as duas listadas aqui, mas devem ser claramente identificadas.
Um par alternativo de condições causais é comparar um graduado

universitário com alguém sem um diploma universitário, mas com o mesmo
nível de antiguidade no trabalho que o graduado universitário. Em certo
sentido, isso é irreal, já que o graduado não universitário teria que fazer algo pelo
quatro anos sem frequentar a faculdade, mas talvez estejamos dispostos a

imaginar que essa pessoa teve um emprego diferente e irrelevante durante
esses quatro anos. Em outras palavras, esse contrafactual alternativo é o
efeito de uma educação universitária em comparação com nenhuma, com o
tempo de serviço mantido constante. A falha em manter a antiguidade
constante nas duas condições causais faria com que qualquer projeto de
pesquisa produzisse estimativas de nosso primeiro contrafactual em vez
deste revisado. Se o último fosse o objetivo, mas nenhum controle fosse
introduzido, nossa análise empírica seria falha devido ao “viés de variável
omitida” (que introduzimos na seção 5.2).
Assim, as questões abordadas sob o rótulo de “causação múltipla” não
confundem nossa definição de causalidade, embora possam exigir maiores
exigências em nossas análises subsequentes. O fato de algumas variáveis
dependentes, e talvez todas as variáveis dependentes de ciências sociais
interessantes, serem influenciadas por muitos fatores causais não torna nossa
definição de causalidade problemática. A chave para entender essas situações
muito comuns é definir as condições contrafactuais que compõem cada efeito
causal com muita precisão. Demonstramos no capítulo 5 que os pesquisadores
não precisam identificar “todos” os efeitos causais em uma variável dependente
para fornecer estimativas de um efeito causal de interesse (mesmo que isso
fosse possível). Um pesquisador pode se concentrar em apenas um efeito de
interesse, estabelecer conclusões firmes e depois passar para outros que
possam ser de interesse (consulte as seções 5.2 e 5.3).11
3.2.3 Causalidade “simétrica” e “assimétrica”
Stanley Lieberson (1985:63–64) distingue entre o que ele chama de formas

“simétricas” e “assimétricas” de causalidade. Ele está interessado em efeitos
causais que diferem quando uma variável explicativa é aumentada em
comparação com quando é diminuída. Em suas palavras,
Ao examinar a influência causal de X1 [uma variável explicativa] em Y [uma

variável dependente], por exemplo, deve-se também considerar se mudanças para
um determinado valor de X1 em qualquer direção têm as mesmas consequências
para Y.Se
. . a. relação causal entre X1 [uma variável explicativa] e Y
11 Nossa ênfase em distinguir componentes sistemáticos de não sistemáticos de

observações sujeitas a inferência causal reflete nossa visão geral de que o mundo, pelo
menos como o conhecemos, é probabilístico em vez de determinístico. Portanto, também
discordamos da premissa de Ragin (1987:15) de que “as explicações que resultam das
aplicações do método comparativo não são concebidas em termos probabilísticos porque
cada ocorrência de um fenômeno é examinada e considerada, se possível”. Mesmo que
fosse possível coletar um censo de informações sobre cada instância de um fenômeno e
cada permutação e combinação de valores das variáveis explicativas, o mundo ainda teria
produzido esses dados de acordo com algum processo probabilístico (conforme definido na seção 2.6). ). Esse
[uma variável dependente] é simétrica ou verdadeiramente reversível, então o efeito

sobre Y de um aumento em X1 desaparecerá se X1 voltar ao seu nível anterior
(assumindo que todas as outras condições são constantes).
Como exemplo do argumento de Lieberson, imagine que o Quarto

Distrito do Congresso em Nova York não tivesse titular em 1998 e que o
candidato democrata recebesse 55% dos votos. Lieberson definiria o
efeito causal da incumbência como o aumento de votos se o democrata
vencedor em 1998 concorrer como titular na próxima eleição no ano
2000. Esse efeito seria “simétrico” se a ausência de um titular na eleição
subsequente eleição (no ano de 2002) fez com que a votação voltasse a
55 por cento. O efeito pode ser “assimétrico” se, por exemplo, o atual
democrata arrecadar dinheiro e melhorar a organização da campanha
do partido democrata; como resultado, se nenhum titular estivesse
concorrendo em 2002, o candidato democrata poderia receber mais de
55% dos votos.
O argumento de Lieberson é inteligente e muito importante. No entanto,
em nossa opinião, seu argumento não constitui uma definição de
causalidade, mas se aplica apenas a algumas inferências causais – o
processo de aprender sobre um efeito causal a partir de observações
existentes. Na seção 3.1, definimos causalidade para uma única unidade.
No presente exemplo, um efeito causal pode ser definido teoricamente
com base em eventos hipotéticos ocorridos apenas na eleição de 1998
no Quarto Distrito de Nova York. A nossa definição é a diferença na
componente sistemática da votação neste distrito com titular nesta
eleição e sem titular na mesma eleição, época e distrito.
Em contraste, o exemplo de Lieberson não envolve quantidades
hipotéticas e, portanto, não pode ser uma definição causal. Este exemplo
envolve apenas o que realmente ocorreria se a variável explicativa
mudasse em duas eleições reais de não titular para titular, versus titular
para não titular em duas outras eleições. Qualquer análise empírica
deste exemplo envolveria numerosos problemas de inferência.
Discutimos muitos desses problemas de inferência causal nos capítulos
4-6. No presente exemplo, podemos perguntar se o efeito estimado
parece maior apenas porque deixamos de contabilizar um grande número
de cidadãos recém-registrados no Quarto Distrito. Ou o aumento do
apoio ao democrata na eleição em que ele ou ela era titular
parece invalidar a abordagem de “álgebra booleana” de Ragin como uma forma geral de
projetar explicações teóricas ou fazer inferências; aprender com dados requer a mesma
lógica de inferência científica que discutimos neste livro. No entanto, sua abordagem ainda
pode ser valiosa como uma forma de teoria formal (ver seção 3.5.2): ela permite ao
investigador especificar uma teoria e suas implicações de uma forma que pode ser muito
mais difícil sem ela.
Estimando efeitos causais · 91

parece menor do que deveria porque necessariamente descartamos distritos
onde o democrata perdeu a primeira eleição?
Assim, é importante considerar os conceitos de Lieberson de causalidade
“simétrica” e “assimétrica” no contexto da inferência causal.
No entanto, eles não devem ser confundidos com uma definição teórica de
causalidade, que damos na seção 3.1.
3.3 PREMISSAS NECESSÁRIAS PARA ESTIMAR OS

EFEITOS CAUSAIS
Como evitamos o problema fundamental da inferência causal e também o

problema de separar os componentes sistemáticos dos não sistemáticos? A
resposta completa a essa pergunta consumirá os capítulos 4 a 6, mas
fornecemos aqui uma visão geral do que é necessário em termos das duas
hipóteses possíveis que nos permitem contornar o problema fundamental. Estes
são a homogeneidade da unidade (que discutimos na seção 3.3.1) e a
independência condicional (seção 3.3.2). Essas suposições, como qualquer
outra tentativa de contornar o problema fundamental da inferência causal,
sempre envolvem algumas suposições não testáveis. É responsabilidade de
todos os pesquisadores tornar as implicações substantivas desse ponto fraco
em seus projetos de pesquisa extremamente claros e visíveis para os leitores.
Inferências causais não devem aparecer como mágica. As suposições podem
e devem ser justificadas com quaisquer informações secundárias ou pesquisas
anteriores que possam ser reunidas, mas sempre devem ser explicitamente reconhecidas.
3.3.1 Homogeneidade da
Unidade Se não pudermos repetir a história ao mesmo tempo e no mesmo lugar

com diferentes valores de nossa variável explicativa a cada vez – como exigiria
uma verdadeira solução para o Problema Fundamental da Inferência Causal –
podemos tentar fazer uma segunda -melhor hipótese: podemos refazer nosso
experimento em duas unidades diferentes que são “homogêneas”. Duas
unidades são homogêneas quando os valores esperados das variáveis
dependentes de cada unidade são os mesmos quando nossa variável explicativa
N EU EU
assume um determinadoNvalor. (Isto1 é,

e m1 = m2 = m1 .) Por exemplo, se observarmos X =
m2 (um titular) no distrito 1 e X = 0 (sem titular) no distrito 2, uma suposição de
unidade homogênea significa que podemos usar as proporções observadas da
votação em dois distritos separados para inferência sobre o efeito causal b, que
supomos ser o mesmo em ambos os distritos. Para um conjunto de dados com
n observações, a homogeneidade da unidade é a suposição de que todas as
unidades com o mesmo valor das variáveis explicativas têm o mesmo valor
esperado da variável dependente. Claro, isso é apenas uma suposição e pode
estar errado: os dois distritos podem diferir em
alguma maneira desconhecida que viesaria nossa inferência causal. De fato,

quaisquer dois distritos reais serão diferentes em alguns aspectos; a aplicação
dessa suposição exige que esses distritos sejam os mesmos em média ao longo
de muitas replicações hipotéticas da campanha eleitoral. Por exemplo, os padrões
de chuva (que podem inibir a participação eleitoral em algumas áreas) não
difeririam entre os distritos, em média, a menos que houvesse diferenças
climáticas sistemáticas entre as duas áreas.
Na citação a seguir, Holland (1986:947) fornece um exemplo claro da suposição
de unidade de homogeneidade (definida a partir de sua perspectiva de um efeito
causal realizado em vez do efeito causal médio). Como existe muito pouca
aleatoriedade no experimento do exemplo a seguir, sua definição e a nossa são
próximas. (Na verdade, como mostramos na seção 4.2, com um pequeno número
de unidades, a suposição de homogeneidade da unidade é mais útil quando a
quantidade de aleatoriedade é razoavelmente baixa.)
Se [a unidade] for um cômodo de uma casa, t [para 'tratamento'] significa que eu

aciono o interruptor de luz naquele cômodo, c [para 'controle'] significa que não, e
[a variável dependente] indica se a luz está acesa ou não pouco tempo depois de
aplicar t ou c, então posso estar inclinado a acreditar que posso saber os valores
de [a variável dependente para t e c] simplesmente apertando o botão. Está claro,
porém, que é apenas por causa da plausibilidade de certas suposições sobre a
situação que essa minha crença pode ser compartilhada por qualquer outra pessoa.
Se, por exemplo, a luz estiver acendendo e apagando sem motivo aparente
enquanto eu estiver pensando em iniciar este experimento, posso duvidar que
saberia os valores de [a variável dependente para t e c] depois de apertar o botão
— pelo menos até que eu fosse inteligente o suficiente para descobrir um novo
experimento!
Neste exemplo, a suposição de homogeneidade da unidade é que, se

tivéssemos acionado o interruptor (na notação de Holland, aplicado t) em ambos
os períodos, o valor esperado (de saber se a luz estaria acesa) seria o mesmo.
A homogeneidade da unidade também assume que, se não tivéssemos acionado
o interruptor (aplicado c) em ambos os períodos, o valor esperado seria o mesmo,
embora não necessariamente o mesmo de quando t é aplicado. Observe que
teríamos que redefinir a chave para a posição desligada após o primeiro
experimento para garantir isso, mas também teríamos que fazer a suposição não
testável de que ligar a chave no primeiro período não afeta os dois valores
hipotéticos esperados no próximo período (como se um fusível queimasse após a
primeira virada). Em geral, a suposição de homogeneidade da unidade não pode
ser testada para uma única unidade (embora, neste caso, possamos gerar várias
novas hipóteses sobre o mecanismo causal rasgando a parede e inspecionando
a fiação).
Uma versão mais fraca, mas também totalmente aceitável, da homogeneidade
da unidade é a suposição de efeito constante . Em vez de assumir que o esperado

valor da variável dependente é o mesmo para diferentes unidades com o mesmo valor da
variável explicativa, basta assumir que o efeito causal é constante. Esta é uma versão
mais fraca da hipótese de homogeneidade da unidade, uma vez que o efeito causal é
apenas a diferença entre os dois valores esperados. Se os dois valores esperados para
unidades com o mesmo valor da variável explicativa variassem da mesma forma, a
suposição de homogeneidade da unidade seria violada, mas a suposição de efeito
constante ainda seria válida. Por exemplo, dois distritos congressionais podem variar na
proporção esperada de votos para democratas não titulares (digamos, 45 por cento contra
65 por cento), mas a incumbência ainda pode acrescentar dez por cento adicionais ao
voto de um candidato democrata de qualquer um dos distritos.
A noção de homogeneidade unitária (ou a suposição menos exigente de efeitos causais

constantes) está na base de toda pesquisa científica. É, por exemplo, o pressuposto
subjacente ao método dos estudos de caso comparativos. Comparamos várias unidades
que têm valores variados em nossas variáveis explicativas e observamos os valores das
variáveis dependentes. Acreditamos que as diferenças que observamos nos valores das
variáveis dependentes são resultado das diferenças nos valores das variáveis explicativas
que se aplicam às observações. O que mostramos aqui é que nossa “crença” neste caso
depende necessariamente de uma suposição de homogeneidade unitária ou efeitos
constantes.
Observe que podemos buscar unidades homogêneas no tempo ou no espaço. Podemos

comparar a votação para o candidato democrata quando há um titular democrata
concorrendo com a votação quando não há nenhum titular democrata no mesmo distrito
em momentos diferentes ou em distritos diferentes ao mesmo tempo (ou alguma
combinação dos dois). Uma vez que um efeito causal só pode ser estimado em vez de
conhecido, não devemos nos surpreender que a suposição de homogeneidade unitária
seja geralmente não testável. Mas é importante que a natureza da suposição seja
explicitada. Em que faixa de unidades esperamos que nossa suposição de um efeito de
incumbência uniforme se mantenha? Todas as corridas para o Congresso?
corridas para o Congresso, mas não para o Senado? Corridas apenas no Norte? Corridas
nas últimas duas décadas apenas?
Observe como a suposição de homogeneidade da unidade se relaciona com nossa
discussão na seção 1.1.3 sobre complexidade e “unicidade”. Lá, argumentamos que a
generalização da ciência social depende de nossa capacidade de simplificar a realidade
de forma coerente. No limite, simplificar a realidade para fins de inferências causais implica
atender aos padrões de homogeneidade da unidade: as observações analisadas tornam-
se, para fins de análise, idênticas em aspectos relevantes. Muitas vezes é impossível
atingir a homogeneidade da unidade; as eleições para o Congresso, para não falar das
revoluções, dificilmente são analogias próximas dos interruptores de luz. mas entender

o grau de heterogeneidade em nossas unidades de análise nos ajudará a
estimar o grau de incerteza ou prováveis vieses a serem atribuídos a nossas
inferências.
3.3.2 Independência condicional

Independência condicional é a suposição de que valores são atribuídos a
variáveis explanatórias independentemente dos valores assumidos pelas
variáveis dependentes. (O termo às vezes é usado em estatística, mas não
tem a mesma definição que comumente tem na teoria da probabilidade.) Ou
seja, depois de levar em conta as variáveis explicativas (ou controlá-las), o
processo de atribuição de valores a a variável explicativa é independente de
ambas (ou, em geral, duas ou mais) variáveis dependentes, Yi N e Yi as
variáveis explicativas para . Usamos o termo “atribuir valores” para
EU
descrever o processo pelo qual essas variáveis obtêm os valores particulares

que possuem. No trabalho experimental, o pesquisador realmente atribui
valores às variáveis explicativas; alguns sujeitos são designados para o
grupo de tratamento e outros para o grupo de controle. No trabalho não
experimental, os valores que as variáveis explicativas assumem podem ser
“atribuídos” pela natureza ou pelo ambiente. O que é crucial nesses casos é
que os valores das variáveis explicativas não são causados pelas variáveis
dependentes. O problema de “endogeneidade” que existe quando as variáveis
explicativas são causadas, pelo menos em parte, pelas variáveis dependentes
é descrito na seção 5.4.
As análises de n grande que envolvem os procedimentos de seleção e
atribuição aleatória constituem a maneira mais confiável de garantir a
independência condicional e não requerem a suposição de homogeneidade da unidade.
A seleção e a atribuição aleatórias nos ajudam a fazer inferências causais
porque satisfazem automaticamente três suposições que fundamentam o
conceito de independência condicional: (1) que o processo de atribuição de
valores às variáveis explanatórias é independente das variáveis dependentes
(ou seja, não há problema de endogeneidade); (2) esse viés de seleção, que
discutimos na seção 4.3, está ausente; e (3) que o viés da variável omitida
(seção 5.2) também está ausente. Assim, se formos capazes de atender a
essas condições de alguma forma, seja por meio de seleção aleatória e
como sinalização (conforme discutido na seção 4.2) ou por meio de algum
outro procedimento, podemos evitar o Problema Fundamental da Inferência Causal.
Felizmente, a seleção e a atribuição aleatórias não são necessárias para
atender à suposição de independência condicional. Se o processo pelo qual
os valores das variáveis explanatórias são “atribuídos” não depende das
variáveis dependentes, ainda podemos atender à suposição de independência
condicional se aprendermos sobre esse processo e

incluir uma medida dele entre nossas variáveis de controle. Por exemplo,
suponha que estamos interessados em estimar o efeito do grau de segregação
residencial na extensão do conflito entre israelenses e palestinos em
comunidades na Cisjordânia ocupada por Israel. Nossa suposição de
independência condicional seria gravemente violada se olhássemos apenas
para a associação entre essas duas variáveis para encontrar o efeito causal. A
razão é que os israelenses e palestinos que escolhem viver em bairros
segregados podem fazê-lo por uma crença ideológica sobre quem, em última
análise, tem direitos sobre a Cisjordânia. O extremismo ideológico (de ambos
os lados) pode, portanto, levar a conflitos. Uma medida que acreditamos ser a
segregação residencial pode realmente ser um substituto para a ideologia. A
diferença entre as duas explicações pode ser bastante importante, pois uma
nova política habitacional poderia ajudar a remediar o conflito se a segregação
residencial fosse a causa real, enquanto essa política seria ineficaz ou mesmo
contraproducente se a ideologia fosse realmente a força motriz. Podemos
corrigir o problema aqui também medindo explicitamente a ideologia dos
residentes e controlando-a. Por exemplo, poderíamos aprender como os partidos
políticos extremistas são populares entre os israelenses e a afiliação à OLP
entre os palestinos. Poderíamos então controlar os efeitos possivelmente
confusos da ideologia comparando comunidades com o mesmo nível de
extremismo ideológico, mas com diferentes níveis de segregação residencial.
Quando a seleção e a atribuição aleatórias são inviáveis e não podemos

controlar o processo de atribuição e seleção, temos que recorrer a alguma
versão da suposição de homogeneidade da unidade para fazer inferências
causais válidas. Uma vez que essa suposição será atendida apenas de forma
imperfeita na pesquisa em ciências sociais, teremos que ser especialmente
cuidadosos para especificar nosso grau de incerteza sobre inferências causais.
Essa suposição ficará particularmente aparente quando discutirmos os
procedimentos usados nas observações de “correspondência” na seção 5.6.
Notação para um Modelo Formal de um Efeito Causal. Agora generalizamos

nossa notação para conveniência das seções posteriores. Em geral, teremos
n realizações de uma variável aleatória Yi. Em nosso exemplo quantitativo
contínuo, n é o número de distritos congressionais (435), e a realização yi da
variável aleatória Yi é a proporção democrática observada do voto bipartidário
no distrito i (como 0,56). A proporção democrata não titular esperada do voto
de dois partidos (a média sobre todas as replicações hipotéticas) no distrito i
é mi N. Definimos a variável explicativa como Xi, que é codificada no presente
exemplo como zero quando o distrito i não tem candidato democrata -

dobrado e como um quando o distrito i tem um titular democrata. Então, podemos denotar
o efeito causal médio na unidade i como
ÿ miN (3.4)
EU
b = E(YiXi = 1) ÿ E(YiXi = 0) = mi
e incorporá-lo no seguinte modelo formal simples:
E(Yi) = mi N + Xi(mi EU
ÿ mi N) (3.5)
= mi N + Xib
Assim, quando o distrito i não tem titular, e Xi = 0, o valor esperado é determinado

substituindo Xi por zero na equação (3.5), e a resposta é a anterior:
N + (0)b
E(YiX = 0) = mi
N
= mi
Da mesma forma, quando um candidato democrata está concorrendo no distrito i, o valor

esperado é mi eu :
N + (1)b
E(YiX = 1) = mi
= mi N +b
= mi N + (mim ÿ mi N) EU
EU
= mi
Assim, a equação (3.5) fornece um modelo útil de inferência causal, e b — a diferença

entre as duas proporções teóricas — é nosso efeito causal. Finalmente, para referência
futura, simplificamos a equação (3.5) uma última vez. Se assumirmos que Yi tem uma
média zero (ou é escrito como um desvio de sua média, o que não limita a aplicabilidade
do modelo de forma alguma), podemos retirar o intercepto dessa equação e escrevê-lo de
maneira mais simples como
E(Yi) = Xib (3.6)
O parâmetro b ainda é o valor teórico do efeito causal médio, uma característica

sistemática das variáveis aleatórias e um de nossos objetivos na inferência causal. Este
modelo é um caso especial de “regressão
Julgando inferências causais · 97

análise”, que é comum em pesquisas quantitativas, mas os coeficientes de
regressão só às vezes coincidem com as estimativas de efeitos causais.
3.4 CRITÉRIOS PARA JULGAR INFERÊNCIAS CAUSAIS
Lembre-se de que, ao definir a causalidade em termos de variáveis aleatórias,

conseguimos traçar uma analogia estrita entre ela e outras características
sistemáticas dos fenômenos, como uma média ou uma variância, nas quais nos
concentramos ao fazer inferências descritivas. Essa analogia nos permite usar
precisamente os mesmos critérios para julgar inferências causais que usamos
para julgar inferências descritivas na seção 2.7: imparcialidade e eficiência.
Portanto, a maior parte do que dissemos sobre esse assunto no Capítulo 2 aplica-
se igualmente bem aos problemas de inferência causal com os quais lidamos
aqui. Nesta seção, formalizamos brevemente as relativamente poucas diferenças
entre essas duas situações.
Na seção 2.7, o objeto de nossa inferência foi uma média (o valor esperado
de uma variável aleatória), que designamos como m. Conceituamos m como
um número fixo, mas desconhecido. Diz-se que um estimador de m é imparcial
se for igual a m em média ao longo de muitas replicações hipotéticas do mesmo
experimento.
Como acima, continuamos a conceituar o valor esperado de um efeito causal
aleatório, denotado como b, como um número fixo, mas desconhecido. A
imparcialidade é então definida de forma análoga: um estimador de b não é
enviesado se for igual a b em média ao longo de muitas replicações hipotéticas
do mesmo experimento. A eficiência também é definida analogamente como a
variabilidade entre essas replicações hipotéticas. Esses são conceitos muito
importantes que servirão de base para nossos estudos de muitos dos problemas
de inferência causal nos capítulos 4-6. As duas caixas a seguir fornecem
definições formais.
Uma análise formal da imparcialidade das estimativas causais. Nesta

caixa, demonstramos a imparcialidade do estimador do parâmetro de efeito
causal da seção 3.1. A notação e a lógica dessas ideias se aproximam muito
daquelas da definição formal de imparcialidade no contexto da inferência
descritiva na seção 2.7. O modelo linear simples com uma variável explicativa
e uma variável dependente é o seguinte:12
12 Para evitar o uso de um termo constante, assumimos que todas as variáveis têm zero
significar. Isso simplifica a apresentação, mas não limita nossas conclusões de forma alguma.
E(Yi) = bXi
Nossa estimativa de b é simplesmente a estimativa de regressão de mínimos quadrados:
n
i=1YiXi
b = _________ (3.7)
n
2
i=1Xi
Para determinar se b é um estimador imparcial de b, precisamos obter o valor esperado,

calculando a média das replicações hipotéticas: ÿ n i=1XiYi
_________ÿ
E(b) = Eÿ ÿ n
(3.8)
2 ÿÿ
i=1Xi
n
i=1XiE(Yi)
= ___________
n
2
i=1Xi
n
i=1Xi 2b
= _________
n
2
i=1Xi
=b
o que prova que b é um estimador imparcial de b.
Uma Análise Formal de Eficiência. Aqui, avaliamos a eficiência do estimador padrão do

parâmetro de efeito causal b da seção 3.1. Provamos na equação (3.8) que esse estimador
é imparcial e agora calculamos sua variância:
ÿ_________ÿ
n
i=1XiYi
V(b) = Vÿ ÿ n
(3.9)
2 ÿÿ
i=1Xi
n
1
= __________Xi 2V(Yi)
2
i=1
(n i=1Xi 2)
V(Yi)
= ________
n
2
i=1Xi
Construindo Teorias Causais · 99
s2
= ________
n
2
i=1Xi
Assim, a variância desse estimador é uma função de dois componentes.

Primeiro, quanto mais aleatória for cada unidade em nossos dados (quanto
maior for s2) , mais variável será nosso estimador b; isso não deveria ser
surpresa. Além disso, quanto maior a variância observada na variável
explicativa (n i=1Xi 2), menos variável será nossa estimativa de b. No caso
extremo de nenhuma variabilidade em X, nada pode nos ajudar a estimar o
efeito das mudanças na variável explicativa na variável dependente, e a
fórmula prevê uma variação infinita (incerteza total) neste caso. De forma
mais geral, esse componente indica que a eficiência é maior quando temos
evidências de uma faixa maior de valores da variável explicativa. Em geral,
então, é melhor avaliar nossas hipóteses causais em tantas situações quanto
possível. Uma maneira de pensar neste último ponto é pensar em desenhar
uma linha com uma régua, dois pontos em uma página e uma mão trêmula.
Se os dois pontos estiverem muito próximos (pequena variação de X), os erros
na colocação da régua serão muito maiores do que se os pontos estiverem
mais afastados (situação de grande variação de X).
3.5 REGRAS PARA CONSTRUIR TEORIAS CAUSAIS
Muitos conselhos sensatos sobre como melhorar a pesquisa qualitativa são

precisos, específicos e detalhados; envolve um aspecto administrável e, portanto,
estreito da pesquisa qualitativa. No entanto, mesmo no meio da solução de uma
série de problemas individuais, devemos manter o quadro geral em mente: cada
solução específica deve ajudar a resolver qualquer que seja o problema geral de
inferência causal que se pretenda resolver. Até agora neste capítulo, fornecemos
uma definição teórica precisa de um efeito causal e discutimos algumas das
questões envolvidas em fazer inferências causais.
Damos um passo para trás agora e fornecemos uma visão geral mais ampla de
algumas regras relacionadas à construção de teorias. Conforme discutimos (e
discutimos na seção 1.2), o aprimoramento da teoria não termina quando a
coleta de dados começa.
As teorias causais são projetadas para mostrar as causas de um fenômeno ou
conjunto de fenômenos. Quer originalmente concebida como dedutiva ou
indutiva, qualquer teoria inclui um conjunto inter-relacionado de hipóteses causais.
Cada hipótese especifica uma relação postulada entre variáveis que cria
implicações observáveis: se as variáveis explicativas especificadas

assumir certos valores, outros valores especificados são previstos para as
variáveis dependentes. Testar ou avaliar qualquer hipótese causal requer
inferência causal. A teoria geral, da qual as hipóteses são partes, deve ser
internamente consistente, ou então podem ser geradas hipóteses que se
contradizem.
As teorias e hipóteses que se encaixam nessas definições têm um alcance
enorme. Nesta seção, fornecemos cinco regras que ajudarão na formulação
de boas teorias e apresentamos uma discussão de cada uma delas com exemplos.
3.5.1 Regra 1: Construir teorias falsificáveis
Por esta primeira regra, não queremos apenas dizer que uma “teoria” incapaz
de estar errada não é uma teoria. Também queremos dizer que devemos
projetar as teorias de modo que possam ser mostradas como erradas o mais
fácil e rapidamente possível. Obviamente, não devemos realmente tentar estar
errados, mas mesmo uma teoria incorreta é melhor do que uma afirmação que
não é nem errada nem certa. A ênfase em teorias falsificáveis nos obriga a
manter a perspectiva correta sobre a incerteza e garante que tratemos as
teorias como tentativas e não as deixemos se tornar dogmas. Devemos
sempre estar preparados para rejeitar teorias diante de evidências científicas
suficientes contra elas. Uma pergunta que deve ser feita sobre qualquer teoria
(ou de qualquer hipótese derivada da teoria) é simplesmente: que evidência a
falsificaria? A pergunta deve ser feita a todas as teorias e hipóteses, mas,
acima de tudo, o pesquisador que apresenta a teoria em primeiro lugar deve
fazê-la por conta própria.
Karl Popper é mais estreitamente identificado com a ideia de falsificabilidade
(Popper 1968). Na visão de Popper, existe uma assimetria fundamental entre
confirmar uma teoria (verificação) e refutá-la (falsificação). O primeiro é quase
irrelevante, enquanto o último é a chave para a ciência. Popper acredita que
uma teoria, uma vez declarada, torna-se imediatamente parte do corpo de
conhecimento científico aceito. Uma vez que as teorias são gerais e as
hipóteses específicas, as teorias implicam tecnicamente um número infinito de
hipóteses. No entanto, testes empíricos só podem ser conduzidos em um
número finito de hipóteses. Nesse sentido, “as teorias não são verificáveis”
porque nunca podemos testar todas as implicações observáveis de uma teoria
(Popper 1968:252). Cada hipótese testada pode ser consistente com a teoria,
mas qualquer número de resultados empíricos consistentes não mudará nossas
opiniões, uma vez que a teoria continua sendo um conhecimento científico
aceito. Por outro lado, mesmo que uma única hipótese se mostre errada e,
portanto, inconsistente com a teoria, a teoria é falsificada e removida de nossa
coleção de conhecimento científico. “A aprovação nos testes, portanto, não faz
a mínima diferença para o status de qualquer hipótese, embora a reprovação
em apenas um teste possa
fazem muita diferença” (Miller 1988:22). Popper não quis dizer que a falsificação é
um conceito determinístico. Ele reconheceu que qualquer inferência empírica é até
certo ponto incerta (Popper 1982). Em sua discussão sobre a desconfirmação, ele
escreveu: “mesmo que a assimetria [entre falsificação e verificação] seja admitida,
ainda é impossível, por várias razões, que qualquer sistema teórico seja
conclusivamente falsificado” (Popper 1968:42). .
A nosso ver, as ideias de Popper são fundamentais para a formulação de teorias.

Devemos sempre projetar teorias que sejam vulneráveis à falsificação.
Devemos também aprender com a ênfase de Popper na natureza experimental de
qualquer teoria. No entanto, para avaliar as teorias científicas sociais existentes, a
assimetria entre verificação e falsificação não é tão significativa. Qualquer um
contribui para o nosso conhecimento científico. A questão é menos se, em algum
sentido geral, uma teoria é falsa ou não – praticamente toda teoria interessante da
ciência social tem pelo menos uma implicação observável que parece errada – do
que quanto do mundo a teoria pode nos ajudar a explicar. Pela regra de Popper, as
teorias baseadas no pressuposto da escolha racional teriam sido rejeitadas há muito
tempo, pois foram falsificadas em muitos casos específicos. No entanto, os cientistas
sociais geralmente optam por manter a suposição, devidamente modificada, porque
ela fornece um poder considerável em muitos tipos de problemas de pesquisa (ver
Cook e Levi, 1990). O mesmo ponto se aplica a praticamente todas as outras teorias
de interesse das ciências sociais. O processo de tentar falsificar teorias nas ciências
sociais é, na verdade, um processo de busca de seus limites de aplicabilidade. Se
alguma implicação observável indica que a teoria não se aplica, aprendemos algo;
da mesma forma, se a teoria funciona, aprendemos algo também.
Para os cientistas (e especialmente para os cientistas sociais) que avaliam

teorias adequadamente formuladas, a assimetria fundamental de Popper parece
amplamente irrelevante. O'Hear (1989:43) fez uma observação semelhante sobre
a aplicação das ideias de Popper às ciências físicas:
Popper sempre tende a falar em termos de explicações de teorias universais .

Mas, mais uma vez, temos que insistir que propor e testar teorias universais é apenas
parte do objetivo da ciência. Pode não haver verdadeiras teorias universais, devido a
condições que diferem acentuadamente no tempo e no espaço; esta é uma possibilidade
que não podemos ignorar. Mas mesmo que assim fosse, a ciência ainda poderia
cumprir [sic] muitos de seus objetivos ao nos dar conhecimento e previsões verdadeiras
sobre as condições dentro e ao redor de nosso nicho espaço-temporal.
Certamente este mesmo ponto se aplica ainda mais fortemente às ciências sociais.
nces.
Além disso, a avaliação de teorias de Popper não distingue fundamentalmente
entre uma teoria recém-formulada e uma que foi

resistiu a numerosos testes empíricos. Quando estamos testando a
distinção determinística entre a verdade ou a ficção de uma teoria
universal (da qual não existem exemplos interessantes), a visão de
Popper é apropriada, mas de nossa perspectiva de buscar os limites da
aplicabilidade de uma teoria, sua visão é menos útil. Como indicamos
muitas vezes neste livro, exigimos que todas as inferências sobre
hipóteses específicas sejam feitas declarando uma melhor suposição
(uma estimativa) e uma medida da incerteza dessa suposição. Quer
descubramos que a inferência é consistente com nossa teoria ou
inconsistente, nossa conclusão terá o mesmo efeito em nossa crença na
teoria. Tanto a consistência quanto a inconsistência fornecem informações
sobre a veracidade da teoria e devem afetar a
certeza de nossas crenças.13 Considere a hipótese de que as
estratégias de campanha democrata e republicana durante as eleições
presidenciais americanas têm um pequeno efeito líquido sobre o resultado
da eleição. Numerosas hipóteses mais específicas estão implícitas nessa
hipótese, como a de que comerciais de televisão, comerciais de rádio e
debates têm pouco efeito sobre os eleitores. Qualquer teste da teoria
deve ser realmente um teste de uma dessas hipóteses. Um teste da
teoria mostrou que as previsões do resultado podem ser feitas com muita
precisão com variáveis disponíveis apenas no momento das convenções
- e, portanto, antes da campanha (Gelman e King 1993). Este teste é
consistente com a teoria (se podemos prever a eleição antes da
campanha, dificilmente se pode dizer que a campanha teve muito
impacto), mas não a verifica de forma absoluta. Algum aspecto da
campanha pode ter um pequeno efeito que explica alguns dos erros de
previsão (e poucos pesquisadores duvidam que isso seja verdade). Além
disso, a previsão pode ter sido sorte, ou a campanha pode não ter
incluído nenhuma tática inovadora (e, portanto, imprevisível) durante os anos para os quais os dados foram coletados.
Poderíamos realizar vários outros testes incluindo variáveis no modelo
de previsão que medem aspectos da campanha, como quantidades
relativas de tempo de TV e rádio, habilidade de falar dos candidatos e
julgamentos sobre os resultados dos debates. Se todas essas hipóteses
não mostrarem nenhum efeito, então Popper diria que nossa opinião não
mudou de maneira interessante: a teoria de que as campanhas
presidenciais não têm efeito ainda está de pé. De fato, se fizéssemos mil
13 Alguns podem nos chamar (ou nos acusar de ser!) “justificacionistas” ou mesmo “justificacionistas
probabilísticos” (ver Lakatos 1970), mas se devemos ser rotulados, preferimos o rótulo bayesiano
filosófico mais coerente (ver Leamer 1978; Zellner 1971; e Barnett 1982). Na verdade, nossa principal
diferença com Popper são nossos objetivos. Dado seu objetivo preciso, concordamos com seu
procedimento; dado o nosso objetivo, talvez ele possa concordar com o nosso. No entanto, acreditamos
que nossos objetivos estão mais próximos daqueles em uso nas ciências sociais e também mais próximos
daqueles que provavelmente serão bem-sucedidos.

testes semelhantes e todos consistentes com a teoria, a teoria ainda pode
estar errada, pois não tentamos todas as infinitas variáveis possíveis que
medem a campanha. Portanto, mesmo com muitos resultados consistentes
com a teoria, ainda pode ser verdade que as campanhas presidenciais
influenciam o comportamento do eleitor.
No entanto, se um único evento de campanha – como acusações
substanciais de comportamento imoral – tiver algum efeito sobre os
eleitores, a teoria seria falsificada. Segundo Popper, embora essa teoria
não tenha sido conclusivamente falsificada (o que ele reconheceu como
impossível), aprendemos mais com ela do que os mil testes consistentes
com a teoria.
Para nós, não é assim que a ciência social é ou deveria ser conduzida.
Depois de mil testes a favor e um contra, mesmo que o teste negativo
parecesse válido com alto grau de certeza, não abandonaríamos a teoria
de que as campanhas não surtem efeito. Em vez disso, podemos modificá-
la para dizer talvez que as campanhas normais não tenham efeito, exceto
quando há evidências consideráveis de comportamento imoral por parte
de um dos candidatos – mas como essa modificação tornaria nossa teoria
mais restritiva, precisaríamos avaliá-la com um novo conjunto de dados
antes de ter certeza de sua validade. A teoria ainda seria muito poderosa
e saberíamos um pouco mais sobre os limites aos quais a teoria se aplica
a cada avaliação empírica que passa. Cada teste de uma teoria afeta tanto
a estimativa de sua validade quanto a incerteza dessa estimativa; e
também pode afetar até que ponto desejamos que a teoria se aplique.
Na discussão anterior, sugerimos uma abordagem importante da teoria,

bem como emitimos uma advertência. A abordagem que recomendamos
é de sensibilidade à natureza contingente de teorias e hipóteses.
Abaixo, defendemos a busca de ampla aplicação para nossas teorias e
hipóteses. Essa é uma estratégia de pesquisa útil, mas devemos sempre
lembrar que é improvável que as teorias nas ciências sociais sejam
universais em sua aplicabilidade. As teorias apresentadas como aplicáveis
a tudo, em todos os lugares – algumas versões do marxismo e da teoria
da escolha racional são exemplos de teorias que foram apresentadas com
reivindicações de tal universalidade – são apresentadas de maneira
tautológica (nesse caso, eles não são verdadeiros nem falsos) ou de uma
forma que permite a refutação empírica (caso em que descobriremos que
eles fazem previsões incorretas). As teorias mais úteis das ciências
sociais são válidas sob condições particulares (em campanhas eleitorais
sem fortes evidências de comportamento imoral de um candidato) ou em
contextos particulares (em nações industrializadas, mas não menos
industrializadas, em campanhas para a Câmara, mas não para o Senado).
Devemos sempre tentar especificar os limites de aplicabilidade da teoria ou hipótese. O próximo passo é

levantar a questão: Por que esses limites existem? O que há nas disputas para o
Senado que invalida as generalizações que são verdadeiras para as disputas na Câmara?
O que há na industrialização que altera os efeitos causais? Que variável está faltando
em nossa análise que poderia produzir uma teoria de aplicação mais geral? Ao fazer
essas perguntas, vamos além dos limites de nossa teoria ou hipótese para mostrar
quais fatores precisam ser considerados para expandir seu escopo.
Mas uma nota de cautela deve ser adicionada. Sugerimos que o processo de
avaliação de teorias e hipóteses é flexível: testes empíricos específicos não os
confirmam nem os refutam de uma vez por todas. Quando um teste empírico é
inconsistente com nossas expectativas baseadas na teoria, não descartamos
imediatamente a teoria. Podemos fazer várias coisas: podemos concluir que a
evidência pode ter sido fraca devido apenas ao acaso; podemos ajustar o que
consideramos ser o âmbito de aplicabilidade de uma teoria ou hipótese, mesmo que
não se aplique a um caso particular e, por meio desse ajuste, manter nossa aceitação
da teoria ou hipótese. A ciência procede por tais ajustes; mas podem ser perigosos.
Se os levarmos longe demais, tornaremos nossas teorias e hipóteses invulneráveis
à refutação. A lição é que devemos ter muito cuidado ao adaptar teorias para serem
consistentes com novas evidências. Devemos evitar esticar a teoria além de toda
plausibilidade, acrescentando numerosas exceções e casos especiais.
Se nosso estudo refuta algum aspecto de uma teoria, podemos optar por reter a
teoria, mas acrescentar uma exceção. Tal procedimento é aceitável desde que
reconheçamos o fato de que estamos reduzindo as reivindicações que fazemos para
a teoria. A teoria, porém, é menos valiosa porque explica menos; em nossa
terminologia, temos menos influência sobre o problema que procuramos entender.14
Além disso, tal abordagem pode produzir uma “teoria” que é apenas uma miscelânea
inútil de várias exceções e exclusões. Em algum momento devemos estar dispostos
a descartar inteiramente as teorias e hipóteses. Exceções demais, e a teoria deveria
ser rejeitada. Assim, por si só, a parcimônia, a preferência normativa por teorias com
menos partes, não é geralmente aplicável. Tudo o que precisamos é nossa noção
mais geral de alavancagem maximizada, da qual a ideia de parcimônia pode ser
totalmente derivada quando for útil. A ideia de que a ciência é em grande parte um
processo de explicar muitos fenômenos com apenas alguns deixa claro que as teorias
com menos partes não são melhores ou piores. Para maximizar a alavancagem,
devemos tentar formular teorias que expliquem o máximo possível com o mínimo
possível. Às vezes, essa formulação é obtida por meio de parcimônia, mas às vezes
não. podemos enganar
14 Como sempre, quando modificamos uma teoria para torná-la consistente com as evidências que
coletamos, a teoria (ou aquela parte dela sobre a qual nossas evidências se baseiam) deve ser avaliada
em um contexto diferente ou em um novo conjunto de dados.

Temos exemplos pelos quais uma teoria um pouco mais complicada explicará
muito mais do mundo. Em tal situação, certamente usaríamos a teoria não
parcimoniosa, uma vez que maximiza a alavancagem mais do que a teoria
mais parcimoniosa.15
3.5.2 Regra 2: Construir teorias que sejam internamente

consistentes Uma teoria que é internamente inconsistente não é apenas
falsificável – ela é falsa. De fato, esta é a única situação em que a veracidade
de uma teoria é conhecida sem qualquer evidência empírica: se duas ou
mais partes de uma teoria geram hipóteses que se contradizem, então
nenhuma evidência do mundo empírico pode sustentar a teoria. Garantir que
as teorias sejam internamente consistentes deve ser totalmente incontroverso,
mas a consistência é frequentemente difícil de alcançar. Um método de
produzir teorias internamente consistentes é com modelagem matemática
formal. A modelagem formal é uma prática mais desenvolvida na economia,
mas cada vez mais comum na sociologia, psicologia, ciência política,
antropologia e em outros lugares (ver Ordeshook 1986). Na ciência política,
os estudiosos construíram inúmeras teorias substantivas a partir de modelos
matemáticos em escolha racional, escolha social, modelos espaciais de
eleições, economia pública e teoria dos jogos. Esta pesquisa produziu muitos
resultados importantes e um grande número de hipóteses plausíveis.
Uma das contribuições mais importantes da modelagem formal é revelar a
inconsistência interna em teorias expressas verbalmente.
No entanto, como acontece com outras hipóteses, os modelos formais não
constituem explicações verificadas sem avaliação empírica de sua previsão.
15 Outra formulação da visão de Popper é que “você não pode provar uma negativa”. Você
não pode, ele argumenta, porque um resultado consistente com a hipótese pode significar apenas
que você fez o teste errado. Quem tenta provar a negativa sempre se deparará com esse
problema. De fato, seus problemas não serão apenas teóricos, mas também profissionais, uma
vez que os periódicos têm mais probabilidade de publicar resultados positivos do que negativos.
Isso levou ao que é chamado de problema da gaveta de arquivo, que é mais claro na literatura
quantitativa. Suponha que não existam padrões no mundo. Então, cinco em cada cem testes de
qualquer padrão cairão fora do intervalo de confiança de 95% e, portanto, produzirão inferências
incorretas. Se supusermos que os periódicos publicam resultados positivos em vez de resultados
negativos, eles publicarão apenas os 5% que são “significativos”; isto é, eles publicarão apenas os
artigos que chegarem às conclusões erradas, e nossas gavetas de arquivos serão preenchidas com
todos os artigos que chegarem às conclusões corretas! (Ver Iyengar e Greenhouse (1988) para uma
revisão da literatura estatística sobre esse problema.) Na verdade, esses incentivos são bem
conhecidos pelos pesquisadores e provavelmente também afetam seus comportamentos.
Embora a taxa de aceitação em muitos dos principais periódicos de ciências sociais seja de
aproximadamente 5%, a situação não é tão ruim assim, mas ainda é um problema sério. A nosso
ver, o problema da gaveta de arquivos poderia ser resolvido se todos adotassem nossa posição
alternativa. Um resultado negativo é tão útil quanto um positivo; ambos podem fornecer tanta
informação sobre o mundo. Enquanto apresentarmos nossas estimativas e uma medida de nossa
incerteza, estaremos em terreno seguro.

ções. A formalidade nos ajuda a raciocinar com mais clareza e certamente
garante que nossas ideias sejam internamente consistentes, mas não resolve
questões de avaliação empírica das teorias das ciências sociais. Uma suposição
em um modelo formal nas ciências sociais é geralmente uma conveniência para
a simplicidade matemática ou para garantir que um equilíbrio possa ser
encontrado. Poucos acreditam que o mundo político é matemático da mesma
forma que alguns físicos acreditam que o mundo físico é. Assim, modelos formais
são meramente modelos – abstrações que devem ser diferenciadas do mundo
que estudamos. De fato, algumas teorias formais fazem previsões que
dependem de suposições que são extremamente simplificadas, e essas teorias
às vezes não têm muito valor empírico. Elas são apenas mais precisas no
abstrato do que as teorias informais das ciências sociais: elas não fazem
previsões mais específicas sobre o mundo real, uma vez que as condições que
especificam não correspondem, nem mesmo aproximadamente, às condições
reais.
Simplificações são essenciais na modelagem formal, assim como em todas
as pesquisas, mas precisamos ser cautelosos sobre as inferências que podemos
tirar sobre a realidade a partir dos modelos. Por exemplo, assumir que todas as
variáveis omitidas não têm efeito nos resultados pode ser muito útil na modelagem.
Em muitos dos modelos formais de pesquisa qualitativa que apresentamos ao
longo deste livro, fazemos exatamente isso. Suposições como essa geralmente
não são justificadas como uma característica do mundo; eles são oferecidos
apenas como uma característica conveniente de nosso modelo de mundo. Os
resultados, então, se aplicam exatamente à situação em que essas variáveis
omitidas são irrelevantes e podem ou não ser semelhantes aos resultados do
mundo real. Não precisamos verificar a suposição para elaborar o modelo e suas
implicações, mas é essencial que verifiquemos a suposição durante a avaliação
empírica. A suposição não precisa estar correta para que o modelo formal seja
útil. Mas não podemos tomar suposições teóricas não testadas ou não
justificadas e usá-las na construção de projetos de pesquisa empírica. Em vez
disso, devemos geralmente complementar uma teoria formal com características
adicionais para torná-la útil para o estudo empírico.
Um bom modelo formal deve ser abstrato para que as principais características
do problema possam ser aparentes e o raciocínio matemático possa ser
facilmente aplicado. Considere, então, um modelo formal do efeito da
representação proporcional nos sistemas de partidos políticos, o que implica
que a representação proporcional fragmenta os sistemas partidários. A principal
variável causal é o tipo de sistema eleitoral – seja um sistema de representação
proporcional com assentos atribuídos aos partidos com base em sua proporção
de votos ou um sistema distrital uninominal no qual um único vencedor é eleito
em cada distrito. A variável dependente é o número de partidos políticos, muitas
vezes referido como o grau de fragmentação do sistema partidário. A principal
hipótese é que os sistemas eleitorais

baseados na representação proporcional geram mais partidos políticos do que
os sistemas eleitorais distritais. Para simplificar, tal modelo pode incluir apenas
variáveis que medem algumas características essenciais do sistema eleitoral
e o grau de fragmentação do sistema partidário. Tal modelo geraria apenas
uma hipótese, não uma conclusão, sobre a relação entre a representação
proporcional e a fragmentação do sistema partidário no mundo real. Tal
hipótese teria que ser testada através do uso de métodos empíricos qualitativos
ou quantitativos.
No entanto, embora uma implicação desse modelo seja que a representação

proporcional fragmenta os partidos políticos, e mesmo que nenhuma outra
variável tenha sido usada no modelo, usar apenas duas variáveis em uma
análise empírica seria uma tolice. Um estudo que indique que países com
representação proporcional têm sistemas partidários mais fragmentados
ignoraria o problema da endogeneidade (seção 5.4), uma vez que países que
estabelecem sistemas eleitorais baseados em uma distribuição proporcional
de assentos para os partidos podem muito bem ter feito isso por causa de seus
já existentes sistemas partidários fragmentados. O viés da variável omitida
também seria um problema, uma vez que países com profundas divisões
raciais, étnicas ou religiosas provavelmente também têm sistemas partidários
fragmentados, e países com divisões desse tipo têm maior probabilidade de ter
representação proporcional.
Assim, ambos os requisitos para viés de variável omitida (seção 5.2) parecem
ser atendidos: a variável omitida está correlacionada tanto com a variável
explanatória quanto com a variável dependente, e qualquer análise que ignore
a variável de divisão social produziria, portanto, inferências viesadas.
O ponto deve ser claro: os modelos formais são extremamente úteis para
esclarecer nosso pensamento e desenvolver teorias internamente consistentes.
Para muitas teorias, especialmente teorias complexas, formuladas verbalmente,
pode ser que apenas um modelo formal seja capaz de revelar e corrigir
inconsistências internas. Ao mesmo tempo, é improvável que os modelos
formais forneçam o modelo empírico correto para testes empíricos. Eles
certamente não nos permitem evitar nenhum dos problemas empíricos da
inferência científica.
3.5.3 Regra 3: Selecione as variáveis dependentes
com cuidado É claro que devemos fazer tudo na pesquisa com cuidado, mas
escolher variáveis, especialmente variáveis dependentes, é uma decisão
particularmente importante. Oferecemos as três sugestões a seguir (com base
em erros que ocorrem com muita frequência nas literaturas quantitativa e
qualitativa):
Primeiro, as variáveis dependentes devem ser dependentes. Um erro muito
comum é escolher uma variável dependente que de fato causa mudanças em nosso
Variáveis explicativas. Analisamos as consequências específicas da

endogeneidade e algumas formas de contornar o problema na seção 5.4, mas
enfatizamos isso aqui porque a maneira mais fácil de evitá-la é escolher
variáveis explicativas que sejam claramente exógenas e variáveis dependentes
que sejam endógenas.
Em segundo lugar, não selecione observações com base na variável
dependente para que a variável dependente seja constante. Isso também pode
parecer um pouco óbvio, mas os estudiosos geralmente escolhem observações
nas quais a variável dependente não varia (como no exemplo discutido na seção 4.3.1).
Mesmo que não planejemos deliberadamente a pesquisa de modo que a
variável dependente seja constante, ela pode acabar assim. Mas, desde que
não tenhamos predeterminado esse fato por nossos critérios de seleção, não
há problema. Por exemplo, suponha que selecionamos observações em duas
categorias de uma variável explicativa, e a variável dependente acaba sendo
constante nos dois grupos. Este é apenas um caso em que o efeito causal
estimado é zero.
Finalmente devemos escolher uma variável dependente que represente a
variação que queremos explicar. Embora este ponto pareça óbvio, na verdade
é bastante sutil, conforme ilustrado por Stanley Lieberson (1985:100):
Uma exibição gravitacional simples no Ontario Science Centre em Toronto em

pináculos é um exemplo heurístico. Na exposição, uma moeda e uma pena são
liberadas do topo de um tubo de vácuo e chegam ao fundo praticamente ao
mesmo tempo. Como o vácuo não é total, presumivelmente a moeda atinge o
fundo um pouco antes da pena. De qualquer forma, suponha que visualizemos
um estudo no qual uma variedade de objetos é derrubada sem o benefício de
um controle tão forte quanto o vácuo – exatamente como ocorreria na pesquisa
social não experimental. Se os pesquisadores sociais descobrirem que os
objetos diferem no tempo que levam para atingir o solo, normalmente eles vão
querer saber quais características determinam essas diferenças. Provavelmente,
tais características dos objetos, como sua densidade e forma, afetarão a
velocidade da queda em uma situação sem vácuo. Se o pesquisador social tiver
sorte, esses fatores juntos serão totalmente responsáveis por todas as diferenças
entre os objetos na velocidade de sua queda. Se assim for, o pesquisador social
ficará muito feliz porque toda a variação entre os objetos será contabilizada. O
investigador, aplicando o pensamento padrão da pesquisa social, concluirá que
há uma compreensão completa do fenômeno porque todas as diferenças entre
os objetos em estudo foram consideradas. Certamente deve haver alguma
falha em nossos procedimentos se podemos abordar tal problema sem sequer
considerar a própria gravidade.
Os procedimentos do investigador neste exemplo seriam falhos apenas se a

variável de interesse fosse a gravidade. Se a gravidade fosse a variável
explicativa com a qual nos preocupássemos, nosso experimento não a variaria (já que o

experimento ocorre em apenas um local) e, portanto, não nos diz nada
sobre isso. No entanto, o experimento descrito por Lieberson seria de
grande interesse se procurássemos entender as variações no tempo que
diferentes tipos de objetos levam para atingir o solo quando são lançados
da mesma altura sob diferentes condições de pressão do ar. De fato,
mesmo que soubéssemos tudo sobre a gravidade, esse experimento ainda
renderia informações valiosas. Mas se, como supõe Lieberson, estivéssemos
realmente interessados em uma inferência sobre o efeito causal da
gravidade, precisaríamos de uma variável dependente que variasse em
observações com diferentes graus de atração gravitacional. Da mesma
forma, nas ciências sociais, devemos ter cuidado para garantir que estamos
realmente interessados em entender nossa variável dependente, em vez
dos fatores de fundo que nosso projeto de pesquisa mantém constantes.
Assim, precisamos que todo o intervalo de variação na variável
dependente seja um resultado possível do experimento para obter uma
estimativa imparcial do impacto das variáveis explicativas. Limites artificiais
na faixa ou valores da variável dependente produzem o que definimos (na
seção 4.3) como viés de seleção. Por exemplo, se estivermos interessados
nas condições em que um conflito armado eclode, não podemos escolher
como observações apenas aquelas instâncias em que o resultado é um
conflito armado. Tal estudo pode nos dizer muito sobre as variações entre
as observações do conflito armado (como o experimento da gravidade nos
fala sobre as variações na velocidade de queda de vários objetos), mas
não nos capacitará a explorar as fontes do conflito armado. Um projeto
melhor, se quisermos entender as fontes do conflito armado, seria aquele
que selecionasse as observações de acordo com nossas variáveis
explicativas e permitisse à variável dependente a possibilidade de cobrir
toda a gama, desde a existência de pouca ou nenhuma ameaça de conflito
até a situação de ameaça. ções para o conflito real.
3.5.4 Regra 4: Maximize a Concretude
Nossa quarta regra, decorrente de nossa ênfase na falsificabilidade,

consistência e variação na variável dependente, é maximizar a concretude.
Devemos escolher conceitos observáveis, em vez de inobserváveis, sempre
que possível. Conceitos abstratos e não observados, como utilidade, cultura,
intenções, motivações, identificação, inteligência ou interesse nacional, são
frequentemente usados nas teorias das ciências sociais. Eles podem
desempenhar um papel útil na formulação de teorias; mas podem ser um
obstáculo para a avaliação empírica de teorias e hipóteses, a menos que
possam ser definidas de forma tal que, ou pelo menos suas implicações,
possam ser observadas e medidas. Explicações envolvendo conceitos como
cultura, interesse nacional, utilidade ou motivação são suspeitas, a menos que possamos

medir o conceito independentemente da variável dependente que estamos
explicando. Quando tais termos são usados em explicações, é muito fácil usá-
los de maneiras que são tautológicas ou não têm implicações observáveis e
diferenciadoras. Um ato de um indivíduo ou de uma nação pode ser explicado
como resultado de um desejo de maximizar a utilidade, cumprir intenções ou
atingir o interesse nacional. Mas a evidência de que o ato maximizou a utilidade
ou cumpriu as intenções ou alcançou o interesse nacional é o fato de que o ator
ou a nação se envolveu nele. Cabe ao pesquisador que formula a teoria
especificar clara e precisamente quais implicações observáveis da teoria
indicariam sua veracidade e a distinguiriam de alternativas lógicas.
De modo algum pretendemos com essa regra insinuar que conceitos como
intenções e motivações não são importantes. Desejamos apenas reconhecer
que o padrão de explicação em qualquer ciência empírica como a nossa deve
ser a verificação ou falsificação empírica . A tentativa de encontrar evidências
empíricas de conceitos abstratos, imensuráveis e inobserváveis será
necessariamente mais difícil e menos bem-sucedida do que para muitos
conceitos específicos e concretos concebidos de maneira imperfeita. Quanto
mais abstratos forem nossos conceitos, menos claras serão as consequências
observáveis e menos passível de falsificação será a teoria.
Os pesquisadores costumam usar a seguinte estratégia. Eles começam com
um conceito abstrato do tipo listado acima. Eles concordam que não pode ser
medido diretamente; assim, eles sugerem indicadores específicos do conceito
abstrato que podem ser medidos e os utilizam em suas explicações. A escolha
do indicador específico do conceito mais abstrato justifica-se por ser observável.
Às vezes, é a única coisa observável (por exemplo, é o único fenômeno para o
qual há dados disponíveis ou o único tipo de evento histórico para o qual foram
mantidos registros). Este é um aspecto perfeitamente respeitável, na verdade
geralmente necessário, da investigação empírica.
Às vezes, porém, tem um lado infeliz. Muitas vezes, o indicador específico

está longe do conceito original e tem apenas uma relação indireta e incerta com
ele. Pode não ser um indicador válido do conceito abstrato. Mas, após uma
rápida desculpa pela lacuna entre o conceito abstrato e o indicador específico,
o pesquisador rotula o indicador com o conceito abstrato e prossegue como se
estivesse medindo diretamente aquele conceito. Infelizmente, tal reificação é
comum no trabalho das ciências sociais, talvez com mais frequência na pesquisa
quantitativa do que na qualitativa, mas muito comum em ambas. Por exemplo,
o investigador tem dados sobre correio, comércio, turismo e intercâmbios
estudantis e utiliza-os para compilar um índice de “integração social” na Europa.
Ou o pesquisador faz algumas perguntas de pesquisa sobre se

os entrevistados estão mais preocupados com o meio ambiente ou com
ganhar dinheiro e rotulam diferentes entrevistados como “materialistas” e
“pós-materialistas”. Ou o pesquisador observa que os órgãos federais diferem
no tempo médio de emprego de seus trabalhadores e converte isso em uma
medida da “institucionalização” dos órgãos.
Devemos ser claros sobre o que queremos dizer aqui. A lacuna entre
conceito e indicador é inevitável em muitos trabalhos de ciências sociais. E
usamos termos gerais em vez de específicos por boas razões: eles nos
permitem expandir nosso quadro de referência e a aplicabilidade de nossas
teorias. Assim, podemos falar de legislaturas em vez de categorias
legislativas definidas de forma mais restrita, como parlamentos ou
instituições específicas, como o Bundestag alemão. Ou podemos falar de
“órgãos de tomada de decisão” em vez de legislaturas quando queremos
que nossa teoria se aplique a uma gama ainda maior de instituições. (Na
próxima seção, de fato, recomendamos isso.) A ciência depende de tais
classificações abstratas - ou então voltamos a resumir detalhes históricos.
Mas nossos termos abstratos e gerais devem ser conectados a conceitos
mensuráveis específicos em algum ponto para permitir testes empíricos. O
fato dessa conexão - e a distância que deve ser percorrida para fazê-la -
deve sempre ser mantido em mente e explicitado. Além disso, a escolha de
um alto nível de abstração deve ter uma justificativa real em termos do
problema teórico em questão. Deve ajudar a fazer a conexão entre a
pesquisa específica em questão – na qual o indicador particular é o ator
principal – e o problema mais geral. E nos sobrecarrega ver que pesquisas
adicionais usando outros indicadores específicos são realizadas para
reforçar a suposição de que nossos indicadores específicos realmente se
relacionam com algum conceito mais amplo. Os termos abstratos usados
nos exemplos acima – “integração social”, “pós-materialismo” e
“institucionalização” – podem ser medidos razoavelmente pelos indicadores
específicos citados. Não negamos que o salto do indicador específico para
o conceito abstrato geral deva ser feito – temos que dar esse salto para
realizar a pesquisa em ciências sociais. O salto deve, no entanto, ser feito
com cuidado, com justificação e com uma “memória” constante de onde o
salto começou.
Assim, não argumentamos contra as abstrações. Mas defendemos uma
linguagem de pesquisa social que seja tão concreta e precisa quanto possível.
Se não temos alternativa ao uso de construtos não observáveis, como é
geralmente o caso nas ciências sociais, então devemos pelo menos escolher
ideias com consequências observáveis. Por exemplo, “inteligência” nunca
foi observada diretamente, mas ainda assim é um conceito muito útil. Temos
inúmeros testes e outras formas de avaliar as implicações da inteligência.
Por outro lado, se pudermos escolher entre “a instituição

“nacionalização da presidência” e “tamanho da equipe da Casa Branca”,
geralmente é melhor escolher o último. Podemos argumentar que o tamanho da
equipe da Casa Branca está relacionado ao conceito geral de institucionalização
da presidência, mas não devemos reificar o conceito mais restrito como idêntico
ao mais amplo. E, se o tamanho da equipe significa institucionalização,
devemos ser capazes de encontrar outras medidas de institucionalização que
respondam às mesmas variáveis explicativas que o tamanho da equipe. Abaixo,
discutiremos “maximizar a alavancagem” expandindo nossas variáveis
dependentes.
Nosso apelo à concretude se estende, em geral, às palavras que usamos
para descrever nossa teoria. Se um leitor tiver que gastar muito tempo extraindo
os significados precisos da teoria, a teoria será menos útil. Deve haver o mínimo
de controvérsia possível sobre o que queremos dizer quando descrevemos
uma teoria. Para ajudar nesse objetivo de especificidade, mesmo que não
estejamos conduzindo pesquisas empíricas, devemos gastar tempo
considerando explicitamente as implicações observáveis da teoria e até mesmo
os possíveis projetos de pesquisa que poderíamos conduzir. Quanto mais vaga
nossa linguagem, menor a chance de estarmos errados - mas menor a chance
de nosso trabalho ser útil. É melhor estar errado do que vago.
Em nossa opinião, a escrita eloqüente – um bem escasso nas ciências
sociais – deve ser encorajada (e saboreada) ao apresentar a justificativa de um
projeto de pesquisa, defendendo sua importância e fornecendo ricas descrições
de eventos. O tédio nunca avançou nenhuma ciência. No entanto, assim que o
assunto se torna inferência causal ou descritiva, onde estamos interessados em
observações e generalizações que se espera que persistam, exigimos
concretude e especificidade na linguagem e no pensamento.16
16 As regras que regem as melhores perguntas a serem feitas nas entrevistas são quase as
mesmas usadas na elaboração de explicações: Seja o mais concreto possível. Não devemos
perguntar aos americanos brancos conservadores: “Você é racista?”, mas sim: “Você se
importaria se sua filha se casasse com um homem negro?” Não devemos perguntar a alguém
se ele ou ela tem conhecimento sobre política; devemos pedir os nomes do Secretário de Estado
e do Presidente da Câmara. Em geral e sempre que possível, não devemos pedir a um
entrevistado que faça o nosso trabalho por nós. É melhor não pedir estimativas de efeitos causais;
devemos pedir medidas das variáveis explanatórias e dependentes e estimar nós mesmos o
efeito causal. Não devemos pedir motivações, mas sim fatos.
Esta regra não significa que nunca devemos perguntar às pessoas por que elas fizeram
alguma coisa. De fato, perguntar sobre as motivações costuma ser um meio produtivo de gerar
hipóteses. Motivações autorrelatadas também podem ser um conjunto útil de implicações observáveis.
No entanto, a resposta dada deve ser interpretada como a resposta do entrevistado à pergunta
do pesquisador, não necessariamente como a resposta correta. Se perguntas como essas forem
úteis, devemos planejar a pesquisa de modo que uma resposta específica dada (com quaisquer
justificativas, enfeites, mentiras ou memórias seletivas que possamos encontrar) seja uma
implicação observável.
3.5.5 Regra 5: Estabeleça teorias da forma mais abrangente

possível Dentro das restrições de garantir que a teoria seja falsificável e que
maximizemos a concretude, a teoria deve ser formulada de modo que
explique o máximo possível do mundo. Percebemos que há alguma tensão
entre esta quinta regra e nossa injunção anterior para sermos concretos.
Podemos apenas dizer que ambos os objetivos são importantes, embora em
muitos casos possam entrar em conflito, e precisamos ser sensíveis a ambos
para encontrar um equilíbrio.
Por exemplo, não devemos apresentar nossa teoria como se ela se
aplicasse apenas ao Bundestag alemão quando há motivos para acreditar
que ela pode se aplicar a todas as legislaturas independentes. Não precisamos
fornecer evidências para todas as implicações da teoria a fim de enunciá-la,
desde que forneçamos uma estimativa razoável da incerteza que a
acompanha. Pode ser que tenhamos fornecido fortes evidências a favor da
teoria no Bundestag alemão. Embora não tenhamos evidências de que
funcione em outro lugar, também não temos evidências contra. A referência
mais ampla é útil se permanecermos cientes da necessidade de avaliar sua
aplicabilidade. De fato, expressá-la como uma referência hipoteticamente
mais ampla pode nos obrigar a pensar sobre os traços estruturais da teoria
que a fariam se aplicar ou não a outras legislaturas independentes. Por
exemplo, isso se aplicaria ao Senado dos Estados Unidos, onde os mandatos
são escalonados, à Assembléia de New Hampshire, que é muito maior em
relação ao número de constituintes, ou à Câmara dos Comuns britânica, na
qual a votação partidária é muito mais forte? Um exercício importante é
afirmar o que pensamos serem características sistemáticas da teoria que a
tornam aplicável em diferentes áreas. Podemos descobrir que estávamos
errados, mas isso é consideravelmente melhor do que não ter declarado a
teoria com precisão suficiente em primeiro lugar.
Essa regra pode parecer conflitante com a preferência de Robert Merton
([1949] 1968) por “teorias de médio alcance”, mas mesmo uma leitura
superficial de Merton deve indicar que não é assim. Merton estava reagindo
a uma tradição em sociologia em que “teorias” como a “teoria da ação” de
Parson eram apresentadas de forma tão ampla que não podiam ser
falsificadas. Na ciência política, a “teoria dos sistemas” de Easton (1965)
segue essa mesma tradição (ver Eckstein 1975:90). Como um exemplo do
tipo de crítica que gostava de fazer, Merton ([1949] 1968: 43) escreveu: “Até
onde se pode dizer, a teoria dos conjuntos de papéis não é inconsistente com
orientações teóricas tão amplas quanto a teoria marxista. , análise funcional,
behaviorismo social, sociologia integral de Sorokin ou teoria da ação de
Parson. Merton não é crítico da teoria dos conjuntos de papéis, que ele
chamou de teoria de médio alcance, ao contrário, ele está argumentando contra essas “amplas orientações teóricas”.

ções”, com as quais quase qualquer teoria mais específica ou observação
empírica é consistente. Merton favorece as teorias de “médio alcance”, mas
acreditamos que ele concordaria que as teorias devem ser formuladas da forma
mais ampla possível, desde que permaneçam falsificáveis e concretas. Expor
as teorias da forma mais ampla possível é, voltando a uma noção levantada
anteriormente, uma forma de maximizar a alavancagem. Se a teoria for testável
- e o perigo de teorias muito amplas é, claro, que elas possam ser formuladas
de maneiras que não são testáveis - então, quanto mais ampla, melhor; ou seja,
quanto mais amplo, maior a alavancagem.
CAPÍTULO 4
Determinando o que observar
ATÉ ESTE PONTO, apresentamos nossa visão dos padrões de inferência

científica conforme eles se aplicam à pesquisa qualitativa e quantitativa (capítulo
1), definimos a inferência descritiva (capítulo 2) e esclarecemos nossa noção de
causalidade e inferência causal (capítulo 3 ). Passamos agora a considerar
problemas práticos específicos de projeto de pesquisa qualitativa. Neste e nos
próximos dois capítulos, usaremos muitos exemplos, tanto extraídos da literatura
quanto construídos hipoteticamente, para ilustrar nossos pontos. Este capítulo
se concentra em como devemos selecionar casos, ou observações, para nossa
análise. Muita coisa gira em torno dessas decisões, uma vez que a má seleção
de casos pode viciar até mesmo as tentativas mais engenhosas, em um estágio
posterior, de fazer inferências causais válidas. No capítulo 5, identificamos
algumas das principais fontes de viés e ineficiência que devem ser evitadas, ou
pelo menos compreendidas, para que possamos ajustar nossas estimativas.
Então, no capítulo 6, desenvolvemos algumas ideias para aumentar o número
de observações disponíveis para nós, muitas vezes já disponíveis nos dados
que coletamos. Assim, perseguimos um tema introduzido no capítulo 1: devemos
buscar derivar o máximo possível de implicações observáveis de nossas teorias
e testar o máximo possível delas.
Na seção 3.3.2, discutimos a “independência condicional”: a suposição de
que as observações são escolhidas e os valores atribuídos às variáveis
explanatórias independentemente dos valores assumidos pelas variáveis
dependentes. Tal independência é violada, por exemplo, se as variáveis
explicativas são escolhidas por regras que estão correlacionadas com as
variáveis dependentes ou se as variáveis dependentes causam as variáveis explicativas.
A aleatoriedade na seleção de unidades e na atribuição de valores a variáveis
explanatórias é um procedimento comum usado por alguns pesquisadores
quantitativos que trabalham com grande número de observações para garantir
que a suposição de independência condicional seja atendida. Métodos
estatísticos são então usados para mitigar o Problema Fundamental da
Inferência Causal. Infelizmente, a seleção e a atribuição aleatórias têm sérias
limitações na pesquisa de n pequeno . Se a seleção aleatória e a atribuição não
forem estratégias apropriadas, podemos buscar a homogeneidade da unidade
por meio do uso da seleção intencional de observações (conforme discutido na
seção 3.3.1). Em certo sentido, a seleção intencional de observações é nossa
“última linha de defesa” para alcançar condições para uma inferência causal válida.
116 · Determinando o que observar

Lembre-se da essência da suposição de homogeneidade da unidade: se
duas unidades tiverem o mesmo valor da variável explicativa chave, o valor
esperado da variável dependente será o mesmo. A versão mais estrita da
suposição de homogeneidade da unidade implica, por exemplo, que se ligar
um interruptor de luz acende uma lâmpada de 60 watts, o mesmo acontecerá
ao girar um segundo interruptor de luz para a posição “ligado”. Neste exemplo,
a posição do interruptor é a variável explicativa chave e o estado da luz (ligado
ou desligado) é a variável dependente. A suposição de homogeneidade da
unidade exige que o status esperado de cada luz seja o mesmo, desde que
as chaves estejam nas mesmas posições. A versão menos estrita da suposição
de homogeneidade da unidade - muitas vezes mais plausível, mas igualmente
aceitável - é a suposição de efeito constante, na qual uma variação
semelhante nos valores da variável explicativa para as duas observações leva
ao mesmo efeito causal em diferentes unidades, mesmo que os níveis das
variáveis possam ser diferentes. Suponha, por exemplo, que nossos
interruptores de luz tenham três configurações e medimos a variável
dependente de acordo com a potência gerada. Se um interruptor for alterado
de “desligado” para “baixo” e o outro de “baixo” para “alto”, a suposição de
efeito constante é atendida se o aumento de potência for o mesmo nas duas
salas, embora em uma observação vai de zero a 60, no outro de 60 a 120.
Quando nem a suposição de independência condicional nem a suposição

de homogeneidade da unidade são atendidas, enfrentamos sérios problemas
na inferência causal. No entanto, enfrentamos problemas ainda mais sérios -
na verdade, não podemos literalmente fazer inferências causais válidas -
quando nosso projeto de pesquisa é indeterminado. Um projeto de pesquisa
determinado é a condição sine qua non da inferência causal. Portanto,
começamos na seção 4.1 discutindo projetos de pesquisa indeterminados.
Após nossa discussão sobre projetos de pesquisa indeterminados,
consideramos o problema do viés de seleção como resultado da violação das
suposições de independência condicional e homogeneidade da unidade. Na
seção 4.2, analisamos os limites do uso de seleção e atribuição aleatórias
para alcançar a independência condicional. Na seção 4.3, enfatizamos os
perigos de selecionar casos intencionalmente com base em valores de
variáveis dependentes e fornecemos exemplos de trabalho em que tal viés
de seleção invalidou inferências causais. Finalmente, na seção 4.4,
consideramos sistematicamente maneiras de alcançar a homogeneidade da
unidade por meio da seleção intencional de casos, buscando não apenas
fornecer conselhos sobre projetos de pesquisa ideais, mas também oferecer
sugestões sobre abordagens “segundas melhores” quando o ideal não pode ser alcançado.
O assunto principal deste capítulo: questões envolvidas na seleção de
casos, ou observações, para análise merece ênfase especial aqui. Desde ter-
Determinando o que observar · 117

minologia pode ser confusa, é importante revisar algumas questões terminológicas
desde o início. Muitas discussões sobre projetos de pesquisa qualitativa falam de
“casos” – como nas discussões de estudos de caso ou do “método de caso”. No
entanto, a palavra “caso” é frequentemente usada de forma ambígua. Pode significar
uma única observação. Conforme explicado na seção 2.4, uma “observação” é
definida como uma medida em uma unidade para uma variável dependente e inclui
informações sobre os valores das variáveis explicativas.
No entanto, um caso também pode se referir a uma única unidade, na qual muitas
variáveis são medidas, ou mesmo a um grande domínio para análise.
Por exemplo, os analistas podem escrever sobre um “estudo de caso da Índia”
ou da Segunda Guerra Mundial. Para alguns propósitos, a Índia e a Segunda
Guerra Mundial podem constituir observações únicas; por exemplo, em um estudo
da distribuição populacional dos países ou do número de mortos em guerras modernas.
Mas com relação a muitas questões de interesse para os cientistas sociais, a Índia
e a Segunda Guerra Mundial contêm, cada uma, muitas observações que envolvem
várias unidades e variáveis. Um investigador poderia comparar resultados eleitorais
de partidos em todos os estados indianos ou os resultados de batalhas durante a
Segunda Guerra Mundial. Em tal projeto, pode ser enganoso referir-se à Índia ou à
Segunda Guerra Mundial como estudos de caso, uma vez que eles apenas definem
os limites dentro dos quais um grande número de observações é feito.
Ao pensar em escolher o que observar, o que realmente nos interessa são as
observações usadas para fazer inferências em qualquer nível de análise que nos
interesse. Portanto, recomendamos que os cientistas sociais pensem em termos
das observações que serão capazes de fazer, e não na terminologia mais flexível
dos casos. No entanto, o que muitas vezes acontece na pesquisa qualitativa é que
os pesquisadores começam escolhendo o que consideram “casos”, concebidos
como observações em um nível altamente agregado de análise, e então descobrem
que, para obter observações suficientes, devem desagregar suas casos.
Suponha, por exemplo, que um pesquisador procure entender como as variações

nos padrões de crescimento econômico em países democráticos pobres afetam as
instituições políticas. O investigador pode começar pensando na Índia entre 1950 e
1990 como um único caso, pelo qual ele pode ter em mente observações para uma
unidade (Índia) sobre duas variáveis – a taxa de crescimento econômico e uma
medida de mudança ou estabilidade na política. instituições cal. No entanto, ele
pode encontrar apenas um número muito pequeno de democracias pobres e, nesse
nível de análise, ter poucas observações para fazer qualquer inferência causal
válida. Reconhecendo esse problema, talvez tardiamente, ele poderia decidir usar
cada um dos estados indianos como uma unidade de análise, talvez também
desagregando seu período de tempo em quatro ou cinco subperíodos. Se essas
observações desagregadas fossem implicações da mesma teoria que ele se propôs
a testar, tal procedimento

daria a ele muitas observações dentro de seu “estudo de caso” da Índia.
O estudo resultante poderia, então, fornecer informações suficientes para apoiar
inferências causais válidas sobre a política indiana e seria muito diferente de um
estudo de caso convencional que é estritamente concebido em termos de observações
em uma unidade para diversas variáveis.
Uma vez que “observação” é definida com mais precisão do que “caso”, neste
capítulo normalmente escreveremos sobre “seleção de observações”. No entanto, uma
vez que os investigadores muitas vezes começam escolhendo domínios para estudo
que contêm múltiplas observações potenciais, e a terminologia convencional
caracteristicamente os denota como “casos”, muitas vezes falamos de selecionar
casos em vez de observações quando nos referimos à prática real de pesquisadores
qualitativos.
4.1 DESENHOS DE PESQUISA INDETERMINADOS
Um projeto de pesquisa é um plano que mostra, por meio de uma discussão de nosso
modelo e dados, como esperamos usar nossas evidências para fazer inferências. Os
projetos de pesquisa na pesquisa qualitativa nem sempre são explícitos, mas pelo
menos estão implícitos em cada parte da pesquisa. No entanto, alguns projetos de
pesquisa são indeterminados; isto é, virtualmente nada pode ser aprendido sobre as
hipóteses causais.
Infelizmente, projetos de pesquisa indeterminados são comuns tanto em pesquisas
quantitativas quanto qualitativas. Há, no entanto, uma diferença entre indeterminação
em pesquisa quantitativa e qualitativa.
Quando a pesquisa quantitativa é indeterminada, o problema costuma ser óbvio: o
programa de computador não produzirá estimativas.1 No entanto, os programas de
computador nem sempre funcionam como deveriam e muitos exemplos podem ser
citados de pesquisadores quantitativos com modelos estatísticos indeterminados que
fornecem conclusões substantivas.
Infelizmente, nada tão automático quanto um programa de computador está disponível
para descobrir projetos de pesquisa indeterminados na pesquisa qualitativa. No
entanto, estar ciente desse problema torna mais fácil identificar projetos de pesquisa
indeterminados e conceber soluções. Além disso, os pesquisadores qualitativos
geralmente têm uma vantagem sobre os pesquisadores quantitativos, pois geralmente
têm informações suficientes para fazer algo que torne seus projetos de pesquisa
determinantes.
Suponha que nosso propósito ao coletar informações seja examinar a validade de
uma hipótese. A pesquisa deve ser projetada de forma que tenhamos o máximo de
influência para distinguir entre as várias saídas possíveis.
1 A literatura sobre “identificação” em econometria e estatística preocupa-se em
determinar quando os projetos de pesquisa quantitativa são indeterminados e como
ajustar o modelo ou coletar diferentes tipos de dados para lidar com o problema. Ver
Hsiao (1983) e King (1989: seção 8.1).
Projetos de pesquisa indeterminados · 119
é relevante para a hipótese. Existem duas situações, no entanto, em que um projeto

de pesquisa é indeterminado e, portanto, não nos dá tal alavancagem:
1. Temos mais inferências a fazer do que implicações observadas.

2. Temos duas ou mais variáveis explicativas em nossos dados que estão
perfeitamente correlacionadas entre si – em termos estatísticos, esse é o
problema da multicolinearidade. (As variáveis podem até diferir, mas se
pudermos prever uma a partir da outra sem erro nos casos que temos, então
o design é indeterminado).
Observe que essas situações e o conceito de projetos de pesquisa indeterminados

em geral se aplicam apenas ao objetivo de fazer inferências causais.
Um projeto de pesquisa para resumir detalhes históricos não pode ser
indeterminado, a menos que literalmente não coletemos observações relevantes.
Os esforços de coleta de dados destinados a encontrar perguntas interessantes a
serem feitas (consulte a seção 2.1.1) não podem ser indeterminados se tivermos
pelo menos alguma informação. Claro, a indeterminação ainda pode ocorrer mais
tarde ao reconceitualizar nossos dados (ou coletar novos dados) para avaliar uma hipótese causal.
4.1.1 Mais inferências do que observações

Considere a primeira instância, na qual temos mais inferências do que implicações
observadas. A inferência é o processo de usar fatos que conhecemos para aprender
algo sobre fatos que não conhecemos. Há um limite para o quanto podemos
aprender com informações limitadas. Acontece que a regra exata é que um fato
(ou implicação observável) não pode fornecer informações independentes sobre
mais de um outro fato. De maneira mais geral, cada observação pode nos ajudar a
fazer no máximo uma inferência; n observações nos ajudarão a fazer menos de n
inferências se as observações não forem independentes. Na prática, geralmente
precisamos de muito mais do que uma observação para fazer uma inferência
causal razoavelmente certa.
Ter mais inferências do que implicações observadas é um problema comum em
estudos de caso qualitativos. No entanto, o problema não é inerente à pesquisa
qualitativa, apenas àquela pesquisa que é conceituada de forma inadequada ou
organizada em muitas implicações observáveis de uma teoria. Primeiro
descreveremos esse problema e depois discutiremos as soluções.
Por exemplo, suponha que temos três estudos de caso, cada um dos quais
descreve os esforços conjuntos de dois países para construir um sistema de armas
de alta tecnologia. Os três estudos de caso incluem uma descrição muito
interessante dos sistemas de armas, das negociações entre os países e do produto
final. No decorrer do projeto, listamos sete motivos importantes que levam os
países a uma colaboração conjunta bem-sucedida

em projetos de defesa de capital. Todas essas podem ser variáveis explicativas
muito plausíveis. Poderíamos também ter entrevistado tomadores de decisão
em diferentes países e descoberto que eles também concordaram que essas
são as variáveis importantes. Tal abordagem nos daria não apenas sete
hipóteses plausíveis, mas também observações sobre oito variáveis: as sete
variáveis explicativas e a variável dependente. Entretanto, nesta circunstância,
a coleta mais cuidadosa de dados não nos permitiria evitar um problema
fundamental. Valiosa como é, tal abordagem – que é essencialmente o método
de comparação estruturada e focada – não fornece uma metodologia para
inferência causal com um projeto de pesquisa indeterminado como este. Com
sete variáveis causais e apenas três observações, o projeto de pesquisa não
pode determinar qual das hipóteses, se houver, está correta.
Diante de explicações indeterminadas, às vezes procuramos considerar

possíveis causas adicionais do evento que estamos tentando explicar.
Isso é exatamente o oposto do que a lógica da explicação deveria nos levar a
fazer. Uma descrição melhor ou mais completa de cada estudo de caso não é
a solução, pois com mais parâmetros do que observações, quase todas as
respostas sobre o impacto de cada uma das sete variáveis são tão consistentes
com os dados quanto qualquer outra. Nenhuma quantidade de descrição,
independentemente de quão densa e detalhada seja; nenhum método, por mais
inteligente que seja; e nenhum pesquisador, por mais habilidoso que seja, pode
extrair muito sobre qualquer uma das hipóteses causais com um projeto de
pesquisa indeterminado. Uma tentativa de incluir todas as variáveis explicativas
possíveis pode nos empurrar rapidamente para um projeto de pesquisa indeterminado.
Um grande número de estudos de caso adicionais pode resolver o problema
do projeto de pesquisa no parágrafo anterior, mas isso pode levar mais tempo
e recursos do que temos à nossa disposição, ou pode haver apenas três
exemplos dos fenômenos que estão sendo estudados. Uma solução para o
problema da indeterminação seria reorientar o estudo sobre os efeitos de
variáveis explicativas particulares em uma gama de ações estatais, em vez de
nas causas de um conjunto particular de efeitos, como o sucesso em projetos
conjuntos. Uma solução alternativa que não muda o foco do estudo tão
drasticamente pode ser adicionar um novo conjunto de observações medidas
em um nível diferente de análise. Além de usar o sistema de armas, pode ser
possível identificar cada decisão importante na construção de cada sistema de
armas. Esse procedimento poderia ajudar consideravelmente se houvesse
informações adicionais significativas nessas decisões relevantes para a
inferência causal. E, desde que nossa teoria tenha alguma implicação sobre
como essas decisões deveriam ser, não precisaríamos mudar o propósito do
projeto de forma alguma. Se devidamente especificada, então, nossa teoria
pode ter muitas implicações observáveis e nossos dados, especialmente se
qualitativos, podem geralmente conter observações para muitos dos
essas implicações. Nesse caso, cada estudo de caso pode ser convertido em
muitas observações, observando-se suas subpartes. Ao adicionar novas
observações de diferentes níveis de análise, podemos gerar vários testes
dessas implicações. Esse método é uma das maneiras mais úteis de
replanejar a pesquisa qualitativa e de evitar (até certo ponto) tanto a
indeterminação quanto o viés de variável omitida, que serão discutidos na
seção 5.2. De fato, expandir nossas observações por meio do planejamento
de pesquisa é o tema principal do capítulo 6 (especialmente a seção 6.3).
Uma análise formal do problema de mais inferências do que

observações. A maneira mais fácil de entender esse problema é tomando
um caso muito simples. Evitamos a generalidade na prova a seguir para
maximizar a intuição. Embora não forneçamos a prova mais geral aqui, a
intuição transmitida por esse exemplo se aplica de maneira muito mais
geral.
Suponha que estamos interessados em fazer inferências sobre dois
parâmetros em um modelo causal com duas variáveis explicativas e uma
única variável dependente
E(Y) = X1b1 + X2b2, (4.1)
mas temos apenas uma única observação para fazer a estimativa (ou seja,
n = 1). Suponha ainda que, para fins de clareza, nossa observação consista
em X1 = 3, X2 = 5 e Y = 35. Finalmente, suponhamos que neste caso Y
seja igual ao seu valor esperado (o que ocorreria por acaso ou se não
houvesse variabilidade aleatória em Y). Assim, E(Y) = 35. Nunca sabemos
esta última informação na prática (devido à aleatoriedade inerente a Y),
portanto, se tivermos problemas para estimar b1 e b2 neste caso,
certamente falharemos no caso geral quando não temos essa informação
sobre o valor esperado.
O objetivo, então, é estimar os valores dos parâmetros na seguinte

equação:
E(Y) = X1b1 + X2b2 (4.2)
35 = 3b1 + 5b2
O problema é que essa equação não tem solução única. Por exemplo, os
valores (b1 = 10, b2 = 1) satisfazem esta equação, mas também (b1 = 5,
b2 = 4) e (b1 = –10, b2 = 13). Isso é bastante preocupante, pois os
diferentes valores dos parâmetros podem indicar

implicações substantivas sobre os efeitos causais dessas duas variáveis;
no último caso, até um sinal mudou. De fato, essas soluções e um número
infinito de outras satisfazem essa equação igualmente bem.
Assim, nada no problema pode nos ajudar a distinguir entre as soluções
porque todas elas são igualmente consistentes com nossa única
observação.
4.1.2 Multicolinearidade
Suponha que conseguimos resolver o problema de poucas observações
focando nos efeitos de causas pré-escolhidas, em vez de nas causas dos
efeitos observados, adicionando observações em diferentes níveis de análise
ou por alguma outra mudança na projeto de pesquisa. Ainda precisaremos
nos preocupar com o outro problema que leva a projetos de pesquisa
indeterminados – a multicolinearidade. Tomamos a palavra “multicolinearidade”
da pesquisa estatística, especialmente da análise de regressão, mas
pretendemos aplicá-la de forma muito mais geral. Em particular, nosso uso
inclui qualquer situação em que podemos prever perfeitamente uma variável
explicativa de uma ou mais variáveis explicativas restantes. Não aplicamos
nenhuma suposição de linearidade, como no significado usual desta palavra
em pesquisa estatística.
Por exemplo, suponha que duas das hipóteses no estudo da colaboração
armamentista mencionadas acima sejam as seguintes: (1) a colaboração
entre países de tamanho diferente tem mais probabilidade de ser bem-
sucedida do que a colaboração entre países de tamanho semelhante; e (2)
a colaboração é mais bem-sucedida entre países não vizinhos do que entre
países vizinhos. As variáveis explicativas por trás dessas duas hipóteses se
concentram no impacto negativo da rivalidade na colaboração; ambos são
bastante razoáveis e podem até ter sido justificados por entrevistas
intensivas ou pela literatura sobre política industrial. No entanto, suponha
que conseguimos identificar apenas um pequeno conjunto de dados onde a
unidade de análise é um par de países. Suponha, além disso, que coletamos
apenas dois tipos de observações: (1) países vizinhos de tamanho diferente
e (2) países não vizinhos de tamanho semelhante. Se todas as nossas
observações (por design ou acaso) caírem nessas categorias, seria
impossível usar esses dados para encontrar qualquer evidência para apoiar
ou negar qualquer uma das hipóteses. A razão é que as duas variáveis
explicativas estão perfeitamente correlacionadas: toda observação em que
os potenciais parceiros são de tamanho semelhante diz respeito a países
vizinhos e vice-versa. Tamanho e proximidade geográfica são variáveis
conceitualmente muito diferentes, mas, pelo menos neste conjunto de dados, elas não podem ser distinguidas uma da outra.
outro. O melhor curso de ação neste ponto seria coletar observações

adicionais em que estados de tamanho semelhante fossem vizinhos. Se isso
for impossível, a única solução é procurar implicações observáveis em algum
outro nível de análise.
Mesmo que o problema de um projeto de pesquisa indeterminado tenha
sido resolvido, nossas inferências causais podem permanecer altamente
incertas devido a problemas como número insuficiente de observações ou
colinearidade entre nossas variáveis causais. Para aumentar a confiança em
nossas estimativas, devemos sempre procurar maximizar a alavancagem
sobre nosso problema. Assim, devemos sempre observar o máximo possível
de implicações de nossa teoria. Claro, sempre teremos restrições práticas
quanto ao tempo e recursos que podemos dedicar à coleta de dados. Mas a
necessidade de mais observações do que inferências deve nos sensibilizar
para as situações em que devemos parar de coletar informações detalhadas
sobre um caso particular e começar a coletar informações sobre outros casos
semelhantes. As preocupações com a indeterminação também devem
influenciar a maneira como definimos nossa unidade de análise: teremos
problemas para fazer inferências causais válidas se eventos quase únicos
forem a única unidade de análise em nosso estudo, pois será difícil encontrar
muitos exemplos. Mesmo que estejamos interessados no comunismo, na
Revolução Francesa ou nas causas da democracia, também valerá a pena
dividir o problema em unidades administráveis e mais numerosas.
Outra recomendação é maximizar a alavancagem limitando o número de
variáveis explicativas para as quais queremos fazer inferências causais. Ao
limitar as variáveis explicativas, devemos ter cuidado para evitar o viés da
variável omitida (seção 5.2). As regras da seção 5.3 devem ajudar nisso. Um
projeto de sucesso é aquele que explica muito com pouco. Na melhor das
hipóteses, o objetivo é usar uma única variável explicativa para explicar
inúmeras observações sobre variáveis dependentes.
Um projeto de pesquisa que explica muito com muito não é muito
informativo, mas um projeto indeterminado não nos permite separar os efeitos
causais de forma alguma. A solução é selecionar observações sobre as
mesmas variáveis ou outras que sejam implicações de nossa teoria para
evitar o problema. Depois de formalizar a multicolinearidade (ver caixa),
passaremos a uma análise mais detalhada dos métodos de seleção de
observações e do problema do viés de seleção.
Uma Análise Formal de Multicolinearidade. Usaremos a mesma

estratégia que fizemos na última análise formal, fornecendo uma prova de
apenas um caso específico para esclarecer o entendimento. A intuição
também se aplica muito além do simples exemplo aqui. Também usamos
um exemplo muito semelhante ao anterior.

Vamos usar o modelo da equação (4.1), mas desta vez temos um número muito
grande de observações e nossas duas variáveis explicativas são combinações
lineares perfeitas uma da outra. De fato, para tornar o problema ainda mais
transparente, suponha que as duas variáveis sejam iguais, de modo que X1 = X2.
Podemos ter codificado X1 e X2 como duas variáveis substancialmente diferentes
(como gênero e gravidez), mas em uma amostra de dados elas podem se revelar
iguais (se todas as mulheres pesquisadas estivessem grávidas). Podemos
distinguir os efeitos causais dessas diferentes variáveis?
Note que a equação (4.1) pode ser escrita da seguinte forma:
E(Y) = X1b1 + X2b2 , (4.3)
= X1(b1 + b2)
Como deve ser óbvio a partir da segunda linha desta equação, independentemente
do que E(Y) e X1 são, vários valores de b1 e b2 podem satisfazê-lo. (Por exemplo,
se b1 = 5 e b2 = –20 satisfazem a equação (4.3), então b1 = –20 e b2 = 5.) Assim,
embora agora tenhamos muito mais observações do que parâmetros, a
multicolinearidade nos deixa com a mesma problema como quando tínhamos mais
parâmetros do que unidades: nenhum método de estimativa pode nos dar
estimativas únicas dos parâmetros.
4.2 OS LIMITES DA SELEÇÃO ALEATÓRIA
Evitamos o viés de seleção em estudos de n grandes se as observações forem

selecionadas aleatoriamente, porque uma regra aleatória não está correlacionada
com todas as possíveis variáveis explicativas ou dependentes.2 A aleatoriedade é
uma abordagem poderosa porque fornece um procedimento de seleção que não está
automaticamente correlacionado com todas as variáveis . Isto é, com um grande n,
as chances de uma regra de seleção correlacionada com qualquer variável observada
são extremamente pequenas. Como resultado, a seleção aleatória de observações
elimina automaticamente o viés de seleção em estudos com n grandes. Em um
mundo em que existem muitas variáveis potencialmente confusas, algumas delas
desconhecidas, a aleatoriedade tem muitas virtudes para os cientistas sociais. Se
tivermos que abandonar a aleatoriedade, como costuma acontecer na pesquisa em
ciência política, devemos fazê-lo com cautela.
2 Enfatizamos novamente que não devemos confundir aleatoriedade com casualidade.

A seleção aleatória neste contexto significa que cada unidade potencial tem uma probabilidade igual
de seleção em nossa amostra e as escolhas sucessivas são independentes, exatamente como quando
os nomes são escolhidos de uma cartola com substituições. Esta é apenas a versão mais simples da
aleatoriedade, mas todas requerem processos probabilísticos específicos.
Limites da Seleção Aleatória · 125
Experimentos controlados são construídos apenas ocasionalmente nas

ciências sociais.3 No entanto, eles fornecem um modelo útil para entender
certos aspectos do projeto de pesquisa não experimental. Os melhores
experimentos geralmente combinam seleção aleatória de observações e
atribuições aleatórias de valores das variáveis explicativas com um grande
número de observações (ou tentativas experimentais). Mesmo que nenhum
experimento possa resolver o Problema Fundamental da Inferência Causal, os
experimentadores muitas vezes são capazes de selecionar suas observações
(em vez de tê-las fornecidas por meio de processos sociais) e podem atribuir
tratamentos (valores das variáveis explicativas) às unidades. Portanto, vale a
pena focar nessas duas vantagens dos experimentos: controle sobre a seleção
de observações e atribuição de valores das variáveis explicativas às unidades.
Na prática, os experimentadores geralmente não selecionam aleatoriamente,
escolhendo em vez disso a partir de uma população conveniente, como alunos
do segundo ano da faculdade, mas aqui nos concentramos na situação ideal.
Discutimos a seleção aqui, adiando nossa discussão sobre a atribuição de
valores das variáveis explicativas até o final do capítulo 5.
Na pesquisa qualitativa, e na verdade em muitas pesquisas quantitativas, a
seleção aleatória pode não ser viável porque o universo de casos não é
claramente especificado. Por exemplo, se quiséssemos uma amostra aleatória
de elites de política externa nos Estados Unidos, não encontraríamos uma
lista disponível de todas as elites comparável à lista de distritos congressionais.
Poderíamos reunir listas de várias fontes, mas sempre haveria o perigo de que
essas listas tivessem vieses embutidos. Por exemplo, o universo para seleção
pode ser baseado em listas governamentais de cidadãos que foram consultados
sobre questões de política externa. Certamente tais cidadãos poderiam ser
considerados membros de uma elite de política externa.
Mas se o problema de pesquisa tivesse a ver com a relação entre origem social
e preferências políticas, poderíamos ter uma lista com viés para indivíduos de
alto status que geralmente apóiam as políticas governamentais. Além disso,
podemos não ser capazes de estudar uma amostra de elites escolhidas
aleatoriamente em uma lista porque os custos de viagem podem ser muito
altos. Poderíamos ter que selecionar apenas aqueles que viviam na região
local - possivelmente introduzindo outros vieses.
Mesmo quando a seleção aleatória é viável, não é necessariamente uma
técnica sensata a ser usada. Pesquisadores qualitativos muitas vezes hesitam
(apropriadamente) com a noção de seleção aleatória, recusando-se a arriscar
perder casos importantes que podem não ter sido escolhidos por seleção
aleatória. (Por que estudar revoluções se não incluímos a Revolução Francesa?)
De fato, se tivermos apenas um pequeno número de observações, a seleção
aleatória pode não resolver o problema do viés de seleção, mas pode até ser pior do que
3 Para alguns exemplos, ver Roth (1988), Iyengar e Kinder (1987), Fiorina e
Plott (1978), Plott e Levine (1978) e Palfrey (1991).

outros métodos de seleção. Acreditamos que muitos pesquisadores
qualitativos entendem esse ponto intuitivamente quando se queixam do que
percebem como pregação equivocada de alguns pesquisadores quantitativos
sobre as virtudes da aleatoriedade. De fato, usando um modelo formal muito
simples de pesquisa qualitativa, provaremos agora que a seleção aleatória de
observações em pesquisas de n pequeno geralmente causará vieses muito
sérios.
Suponha que temos três unidades que têm observações sobre a variável
dependente de (Alta, Média, Baixa), mas apenas duas dessas três devem ser
selecionadas para a análise ( n = 2). Agora precisamos de uma regra de
seleção. Se deixarmos 1 denotar uma unidade selecionada na análise e 0
denotar uma unidade omitida, então apenas três regras de seleção são
possíveis: (1,1,0), o que significa que selecionamos as opções Alto e Médio,
mas não o caso Baixo , (0,1,1) e (1,0,1). O problema é que apenas a última
regra de seleção, na qual a segunda unidade é omitida, não está
correlacionada com a variável dependente.4 Como a seleção aleatória de
observações é equivalente a uma escolha aleatória de uma dessas três regras
de seleção possíveis, a seleção aleatória as unidades neste exemplo de n
pequeno produzirão viés de seleção com probabilidade de dois terços! Uma
seleção mais cuidadosa de observações usando conhecimento a priori dos
valores prováveis da variável dependente pode ser capaz de escolher a
terceira regra de seleção com probabilidade muito maior e, assim, evitar o viés.
Pesquisadores qualitativos raramente recorrem explicitamente à
aleatoriedade como regra de seleção, mas devem ter cuidado para garantir
que os critérios de seleção realmente empregados não tenham efeitos
semelhantes. Suponha, por exemplo, que um pesquisador esteja interessado
nos países do Leste Europeu com herança católica que foram dominados pela
União Soviética após a Segunda Guerra Mundial: Tchecoslováquia, Hungria e
Polônia. Este pesquisador observa variações substanciais em suas políticas
durante as décadas de 1970 e 1980: na Polônia, surgiu um movimento
antigovernamental bem organizado (Solidariedade); na Tchecoslováquia, um
grupo muito menor de intelectuais estava ativo (Carta 77); enquanto na
Hungria, nenhum grande movimento nacional se desenvolveu. O problema é explicar essa discrepância.
Explorar a natureza dos movimentos antigovernamentais requer uma
análise minuciosa de jornais, documentos recentemente desclassificados do
Partido Comunista e muitas entrevistas com os participantes – portanto,
conhecimento da língua. Além disso, a dificuldade de fazer pesquisa na
Europa Oriental contemporânea significa que será necessário um ano de
pesquisa para estudar cada país. Parece viável, portanto, estudar apenas dois
4 A regra de seleção (1,1,0) omite a extremidade inferior da escala (a unidade Baixa), e a

segunda (0,1,1) omite a unidade na extremidade superior (a unidade Alta). Apenas o terceiro caso,
em que “Medium” não é selecionado, não está correlacionado com a variável dependente.
Limites da Seleção Aleatória · 127
países para este trabalho. Felizmente, por motivos alheios a este projeto, a
investigadora já conhece checo e polaco, pelo que decide estudar Charter
77 na Checoslováquia e Solidariedade na Polónia. Isso é obviamente
diferente da atribuição aleatória, mas pelo menos a razão para selecionar
esses países provavelmente não está relacionada à variável dependente.
No entanto, em nosso exemplo, verifica-se que sua regra de seleção
(conhecimento linguístico) está correlacionada com sua variável dependente
e, portanto, ela encontrará viés de seleção. Nesse caso, uma seleção não
aleatória e informada poderia ter sido melhor – não fosse o requisito
linguístico.
Essa pesquisadora poderia evitar o viés de seleção esquecendo seu
conhecimento de tcheco e aprendendo húngaro. Mas esta solução
dificilmente parecerá uma opção atraente! Nesta observação, a alternativa
mais realista é que ela use sua consciência do viés de seleção para julgar a
direção do viés, pelo menos parcialmente corrigi-la e qualificar suas
conclusões apropriadamente. A princípio, ela sabe que reduziu o grau de
variância de sua variável dependente de maneira sistemática, o que deveria
levá-la a subestimar suas estimativas causais, pelo menos na média (embora
outros problemas com a mesma pesquisa possam mudar isso). ).
Além disso, ela deve pelo menos fazer pesquisa secundária suficiente
sobre a Hungria para saber, para qualquer variável explicativa plausível, se
a direção do viés de seleção será a favor ou contra sua hipótese.
Por exemplo, ela pode levantar a hipótese, com base nos casos tchecos e
poloneses, de que movimentos antigovernamentais de massa surgem sob
regimes comunistas brandos e relativamente não repressivos, mas não sob
regimes comunistas fortes e repressivos. Ela deveria saber que, embora a
Hungria tivesse o governo comunista mais brando do Leste Europeu, faltava-
lhe um movimento antigovernamental de massa. Assim, se possível, o
pesquisador deve ampliar o número de observações para evitar viés de
seleção; mas mesmo que mais observações não possam ser estudadas
minuciosamente, algum conhecimento de observações adicionais pode pelo
menos mitigar o problema. Uma estratégia muito produtiva seria
complementar esses dois estudos de caso detalhados com alguns casos
muito menos detalhados baseados em dados secundários e, talvez, uma
análise muito mais agregada (e necessariamente superficial) de um grande
número de casos. Se os estudos de caso detalhados produzirem uma
hipótese causal clara, pode ser muito mais fácil coletar informações apenas
sobre aquelas poucas variáveis identificadas como importantes para um
número muito maior de observações entre os países. (Veja a seção 4.3 para
uma discussão análoga e um tratamento mais formal.) Outra solução pode
ser reorganizar as informações massivas coletadas em cada um dos dois
estudos de caso em numerosas implicações observáveis da teoria. Por exemplo, se a teoria de que a repressão do governo

inibir totalmente o crescimento de movimentos antigovernamentais estava
correto, tais movimentos deveriam ter se saído mal em cidades ou regiões onde
a polícia secreta era zelosa e eficiente, em comparação com as áreas em que a
polícia secreta era mais negligente – controlando o país envolvido.
4.3 VIÉS DE SELEÇÃO
Como devemos selecionar observações para inclusão em um estudo? Se estamos

entrevistando autoridades municipais, quais devemos entrevistar? Se estivermos
fazendo estudos de caso comparativos de grandes guerras, quais guerras
devemos selecionar? Se estamos interessados em vetos presidenciais, devemos
selecionar todos os vetos, todos desde a Segunda Guerra Mundial, uma amostra
aleatória, ou apenas aqueles derrubados pelo Congresso? Nenhuma questão é
tão onipresente no início da fase de planejamento de um projeto de pesquisa
quanto a questão: quais casos (ou mais precisamente, quais observações)
devemos selecionar para estudo? Na pesquisa qualitativa, a decisão sobre quais
observações selecionar é crucial para o resultado da pesquisa e o grau em que
ela pode produzir resultados determinados e confiáveis.
Como vimos na seção 4.2, a seleção aleatória geralmente não é apropriada
em pesquisas de n pequeno. Mas abandonar a aleatoriedade abre a porta para
muitas fontes de viés. O exemplo mais óbvio é quando nós, sabendo o que
queremos ver como resultado da pesquisa (a confirmação de uma hipótese
favorita), sutilmente ou não tão sutilmente selecionamos observações com base
em combinações de variáveis independentes e dependentes que suportam a
conclusão desejada. Suponha que acreditemos que o investimento americano
em países do terceiro mundo é a principal causa da violência interna e, então,
selecionamos um conjunto de nações com grandes investimentos americanos
nas quais houve muita violência interna e outro conjunto de nações onde há nem
investimento nem violência. Existem outras observações que ilustram as outras
combinações (grande investimento e nenhuma violência, ou nenhum pequeno
investimento e grande violência), mas elas são “convenientemente” deixadas de
fora. A maioria dos vieses de seleção não é tão flagrante quanto isso, mas como
os critérios de seleção na pesquisa qualitativa geralmente são implícitos e a
seleção geralmente é feita sem qualquer tentativa autoconsciente de avaliar
possíveis vieses, há muitas oportunidades para permitir que o viés sutilmente se
intrometa em nossa seleção. procedimentos.5
5 Este exemplo é uma boa ilustração do que torna a ciência distinta. Quando introduzimos esse viés
para sustentar a conclusão que queremos, não estamos nos comportando como os cientistas sociais
deveriam se comportar, mas sim como muitos de nós nos comportamos quando estamos em argumentos
políticos em que defendemos uma posição política que defendemos. estimar. Frequentemente
selecionamos exemplos que provam nosso ponto. Quando nos envolvemos em pesquisa, devemos tentar obter todos os
Viés de Seleção · 129
4.3.1 Seleção na variável dependente A

seleção aleatória com n grande nos permite ignorar a relação entre os
critérios de seleção e outras variáveis em nossa análise. Uma vez que nos
afastamos da seleção aleatória, devemos considerar como os critérios
usados se relacionam com cada variável. Isso nos leva a uma regra
básica e óbvia: a seleção deve permitir a possibilidade de pelo menos
alguma variação na variável dependente. Este ponto parece tão óbvio que
achamos que nem precisa ser mencionado. Como podemos explicar
variações em uma variável dependente se ela não varia? Infelizmente, a
literatura está cheia de trabalhos que cometem exatamente esse erro de
deixar a variável dependente variar; por exemplo, pesquisas que tentam
explicar a eclosão de uma guerra com estudos apenas de guerras, o início
de revoluções com estudos apenas de revoluções ou padrões de
participação eleitoral com entrevistas apenas de não-votantes.6
Dissemos no capítulo 1 que bons cientistas sociais frequentemente
prosperam em anomalias que precisam ser explicadas. Uma consequência
dessa orientação é que os investigadores, particularmente os
pesquisadores qualitativos, podem selecionar observações com um
resultado comum e intrigante, como as revoluções sociais que ocorreram
na França no século XVIII e as que ocorreram na França e na China no
século XX. (Skocpol 1979). Tal escolha de observações representa a
seleção da variável dependente e, portanto, arrisca o viés de seleção
discutido nesta seção. Quando as observações são selecionadas com
base em um determinado valor da variável dependente, nada pode ser
aprendido sobre as causas da variável dependente sem levar em conta
outras instâncias em que a variável dependente assume outros valores.
Por exemplo, Theda Skocpol (1979) resolve parcialmente esse problema
em sua pesquisa, incluindo explicitamente algumas informações limitadas
sobre “momentos de crise revolucionária” (Skocpol 1984:380) na Inglaterra
do século XVII, na Prússia/Alemanha do século XIX e no século XIX.
Japão do século. Ela vê essas observações como “casos de controle”,
embora sejam discutidos com muito menos detalhes do que seus casos
principais. O viés induzido pela seleção da variável dependente não implica
que nunca devemos levar em conta os valores da variável dependente ao
projetar a pesquisa. O que isso significa, como nós
observações, se possível. Se a seleção for necessária, devemos tentar obter as observações

que são cruciais para decidir a questão de interesse, não aquelas que meramente apóiam
nossa posição.
6 Nesta seção, não consideramos a possibilidade de que um projeto de pesquisa específico,
projetado para não permitir que a variável dependente mude, faça parte de um programa de
pesquisa mais amplo e, portanto, possa fornecer informações úteis sobre hipóteses causais.
Explicamos este ponto na seção 4.4.

discutir abaixo e no capítulo 6, é que devemos estar cientes dos vieses
introduzidos por tal seleção na variável dependente e buscar, na medida
do possível, corrigir esses vieses.
Há também uma versão mais branda e comum do problema de seleção
na variável dependente. Em alguns casos, o projeto de pesquisa permite
variação na variável dependente, mas essa variação é truncada: ou seja,
limitamos nossas observações a menos do que a faixa total de variação na
variável dependente que existe no mundo real. Nesses casos, algo pode
ser dito sobre as causas da variável dependente; mas as inferências
provavelmente serão tendenciosas, pois, se as variáveis explicativas não
levarem em conta a regra de seleção, qualquer regra de seleção
correlacionada com a variável dependente atenuará as estimativas de
efeitos causais em média (ver Achen, 1986; King 1989: capítulo 9) . Na
pesquisa quantitativa, esse resultado significa que as estimativas numéricas
dos efeitos causais estarão mais próximas de zero do que realmente estão.
Na pesquisa qualitativa, o viés de seleção significará que o verdadeiro
efeito causal é maior do que o pesquisador qualitativo é levado a acreditar
(a menos, é claro, que o pesquisador esteja ciente de nosso argumento e
ajuste suas estimativas de acordo). Se soubermos que existe um viés de
seleção e não tivermos como contorná-lo desenhando uma amostra melhor,
esses resultados indicam que nossa estimativa fornece, pelo menos, em
média, um limite inferior para o verdadeiro efeito causal. Até que ponto
subestimamos o efeito causal depende da gravidade do viés de seleção
(até que ponto a regra de seleção está correlacionada com a variável
dependente), sobre a qual devemos ter pelo menos alguma ideia, se não evidências detalhadas.
Os casos de viés de seleção extremo - onde não há, por design,
nenhuma variação na variável dependente - são fáceis de lidar: evite-os!
Não aprenderemos sobre efeitos causais com eles. A forma modificada de
viés de seleção, na qual as observações são selecionadas de maneira
relacionada à variável dependente, pode ser mais difícil de evitar, pois
podemos não ter acesso a todas as observações que desejamos. Mas,
felizmente, os efeitos desse viés não são tão devastadores, pois podemos
aprender alguma coisa; nossas inferências podem ser tendenciosas, mas
o serão de uma forma previsível que podemos compensar . Os exemplos
a seguir ilustram esse ponto.
Dado que muitas vezes seremos forçados a escolher observações de
maneira correlacionada com a variável dependente e, portanto, temos viés
de seleção, vale a pena ver se ainda podemos extrair alguma informação
útil. A Figura 4.1, um modelo pictórico simples de viés de seleção, mostra
que podemos. Cada ponto é uma observação (uma pessoa, por exemplo).
O eixo horizontal é a variável explicativa (por exemplo, número de cursos
de contabilidade feitos na faculdade de administração). O eixo vertical é a
variável dependente (por exemplo, salário inicial no primeiro
Figura 4.1 Viés de seleção
trabalho de tempo integral, em unidades de $ 10.000). A linha de regressão

que mostra a relação entre essas duas variáveis é a linha sólida ajustada à
dispersão de pontos. Cada curso adicional de contabilidade vale, em média,
cerca de US$ 10.000 adicionais no salário inicial. A dispersão de pontos ao
redor dessa linha indica que, como sempre, a linha de regressão não se ajusta
perfeitamente à situação de cada aluno. Em figuras como essas, os desvios
verticais entre os pontos e a reta representam os erros de previsão (dados
valores particulares das variáveis explicativas) e são, portanto, minimizados
no ajuste de uma reta aos pontos .
Agora suponha que um aluno de uma escola de administração esteja
interessado em estudar como poderia aumentar seu salário inicial após a formatura.
Não tendo aprendido sobre o viés de seleção, esse aluno decide escolher
para estudo uma amostra de ex-alunos composta apenas por aqueles que se
saíram bem no primeiro emprego – aqueles que receberam empregos que ele
gostaria. Pode parecer que, se ele quer aprender a ganhar mais dinheiro, seria
melhor focar apenas naqueles com altos rendimentos, mas esse raciocínio é
falacioso. Para simplificar, suponha que a escolha inclua apenas aqueles que
ganham pelo menos $ 100.000. Essa regra de seleção de amostra é
representada na figura 4.1 por uma linha horizontal sólida em Y = 10, onde
apenas os pontos acima da linha são incluídos no estudo desse aluno. Agora,
em vez de ajustar uma linha de regressão a todos os pontos, ele ajusta uma
linha (a linha tracejada) apenas aos pontos de sua amostra. O viés de seleção
exerce seu efeito diminuindo a inclinação dessa linha em comparação com a da linha sólida.
Como resultado do viés de seleção, esse aluno concluiria incorretamente que cada
curso adicional de contabilidade vale apenas cerca de US$ 5.000.
Este é um exemplo específico de como podemos subestimar um efeito causal

quando temos seleção na variável dependente.
Felizmente, há algo que nosso aluno pode fazer a respeito de seu problema.
Suponha que depois que esse aluno conclui a faculdade de administração, ele fica
entediado em ganhar dinheiro e faz pós-graduação em uma das ciências sociais,
onde aprende sobre o viés de seleção. Ele está muito ocupado se preparando para
exames abrangentes, então não tem tempo para refazer seu estudo adequadamente.
No entanto, ele sabe que seu salário inicial teria aumentado significativamente mais
do que sua estimativa de $ 5.000 para cada aula adicional de contabilidade. Como
sua regra de seleção era bastante severa (na verdade era determinista), ele conclui
que teria ganhado mais dinheiro nos negócios se tivesse tido aulas adicionais de
contabilidade - mas tendo decidido não maximizar sua renda (que entraria na pós-
graduação com isso em mente?) — ele é grato por não ter aprendido sobre o viés
de seleção até que seus valores tivessem mudado.
4.3.1.1 EXEMPLOS DE VIÉS DE SELEÇÃO INDUZIDO PELO INVESTIGADOR
O problema que acabamos de descrever é comum na pesquisa qualitativa (ver

Geddes 1990). Pode surgir de um procedimento aparentemente tão inócuo quanto
a seleção de casos com base nos dados disponíveis, se a disponibilidade de dados
estiver relacionada à variável dependente. Por exemplo, suponha que estamos
interessados nos determinantes do envolvimento presidencial em decisões
significativas de política externa nos últimos anos e que nos propomos a estudar
aquelas decisões sobre as quais informações sobre a participação do presidente
em reuniões estão disponíveis. O problema com esse desenho de pesquisa é que a
regra de seleção (disponibilidade de informações) provavelmente está correlacionada
com níveis relativamente baixos de envolvimento presidencial (a variável dependente),
uma vez que as reuniões mais secretas, que não estarão disponíveis para nós,
provavelmente envolveram o presidente mais plenamente do que aqueles cujas
deliberações se tornaram públicas. Portanto, o conjunto de observações sobre as
quais a informação está disponível irá super-representar eventos com menor
envolvimento presidencial, distorcendo assim nossas inferências sobre os
determinantes do envolvimento presidencial.
O raciocínio usado em nosso exemplo da escola de administração pode nos
ajudar a aprender sobre as consequências do inevitável viés de seleção na pesquisa
qualitativa. Suponha que, no estudo que acabamos de mencionar, estivéssemos
interessados em saber se os presidentes estão mais envolvidos quando os eventos
envolvem ameaças de força do que quando tais ameaças não foram feitas. Suponha
também que a evidência existente, baseada em talvez duas dúzias de observações, indi-
indica que tal relação existe, mas que sua magnitude é surpreendentemente
pequena. Para avaliar o grau de viés de seleção nesta pesquisa, primeiro
compilaríamos uma lista de situações de política externa em que o presidente agiu
ou fez pronunciamentos públicos, independentemente de termos informações sobre
os processos de tomada de decisão. Essa lista evitaria uma fonte de viés de
seleção que havíamos identificado: maior sigilo com relação à tomada de decisões
envolvendo ameaças de força. Nossa nova lista não seria um censo completo de
questões em que o presidente estava envolvido, pois perderia as operações
secretas e aquelas nas quais nenhuma ação foi tomada, mas seria uma lista maior
do que a original, que exigia informações sobre a decisão -fazendo.
Poderíamos, então, comparar as duas listas para verificar se (como suspeitamos)

os casos sobre os quais tínhamos informações para a tomada de decisões eram
tendenciosos contra aqueles em que a força foi usada ou ameaçada. Nesse caso,
poderíamos razoavelmente inferir que a verdadeira relação era provavelmente
ainda mais forte do que parecia em nossa análise original.
O problema do viés de seleção aparece frequentemente na política comparada
quando os pesquisadores precisam viajar para determinados lugares para estudar
seu assunto. Eles geralmente têm opções limitadas quando se trata de escolher
quais unidades estudar, pois alguns governos restringem o acesso de acadêmicos
estrangeiros. Infelizmente, a recusa de acesso pode estar correlacionada com a
variável dependente que interessa ao bolsista. Um pesquisador que queira explicar
a liberalização de regimes autoritários com base nas táticas utilizadas por grupos
dissidentes pode produzir resultados tendenciosos, principalmente se estudar
apenas os lugares que lhe permitiram entrar, pois os fatores que levaram o regime
a permitir que ela entrasse provavelmente estaria correlacionada com a variável
dependente, liberalização. Obviamente não aconselhamos pesquisas clandestinas
em locais inóspitos. Mas aconselhamos a consciência autoconsciente desses
problemas e a imaginação para encontrar fontes alternativas de dados quando os
dados no local não estiverem disponíveis. O reconhecimento dessas dificuldades
também pode levar à revisão de nossos projetos de pesquisa para lidar com as
realidades do acesso acadêmico em todo o mundo. Se nenhuma solução de dados
estiver disponível, poderemos usar esses resultados no viés de seleção pelo menos
para saber em que direção nossos resultados serão tendenciosos - e, assim, talvez
fornecer uma correção parcial para o inevitável viés de seleção em um estudo
como este.
Ou seja, se o viés de seleção for inevitável, devemos analisar o problema e
determinar a direção e, se possível, a magnitude do viés e, então, usar essa
informação para ajustar nossas estimativas originais na direção certa.
O viés de seleção é um problema tão endêmico que pode ser útil considerar
mais alguns exemplos. Considere um trabalho recente de Michael Porter (1990).
Porter estava interessado nas fontes do que chamou de

“vantagem competitiva” para indústrias e empresas contemporâneas. Ele
elaborou um projeto de pesquisa em larga escala com dez equipes nacionais
para estudar o assunto. Ao selecionar as dez nações para análise, ele
escolheu, em suas palavras, “aquelas que já competem com sucesso em
uma série de tais indústrias, ou, no caso da Coréia e Cingapura, mostram
sinais de uma capacidade crescente de fazê-lo” (Porter 1990:22). Em sua
ânsia de explorar o quebra-cabeça que o interessava, Porter selecionou
intencionalmente sua variável dependente, tornando sua variável dependente
observada quase constante. Como resultado, qualquer tentativa de Porter,
ou de qualquer outra pessoa que use esses dados nesse nível de análise,
para explicar as variações de sucesso entre seus dez países produzirá efeitos
causais seriamente enviesados.
Mas o que Porter fez - tentar determinar as circunstâncias e políticas
associadas ao sucesso competitivo - estava de certa forma relacionado ao
método de acordo de Mill. Esse método não é uma primeira tentativa ruim de
resolver o problema, pois permitiu que Porter desenvolvesse algumas
hipóteses sobre as causas da vantagem competitiva ao ver o que essas
nações têm em comum; no entanto, seu projeto de pesquisa tornou
impossível avaliar qualquer efeito causal individual.
Mais grave é a falha lógica do método: sem um grupo de controle de
nações (ou seja, com sua variável explicativa definida para outros valores),
ele não pode determinar se a ausência das variáveis causais hipotéticas está
associada ao fracasso competitivo. Assim, ele não tem como saber se as
condições que associou ao sucesso também não estão associadas ao
fracasso. Em seu trabalho provocativo, Porter apresentou um conjunto
fascinante de hipóteses baseadas em seus casos de sucesso, mas sem uma
gama de sucessos e fracassos competitivos (ou seleção baseada em algo
diferente de sua variável dependente) ele não tem como saber se está
totalmente certo, completamente errado ou algo intermediário.7 Um exemplo
marcante de viés de
seleção é encontrado na literatura de política externa que trata da
dissuasão: isto é, “o uso de ameaças para induzir os oponentes a se
comportarem de maneiras desejáveis” (Achen e Snidal 1989: 151). Os
estudiosos da dissuasão muitas vezes examinaram “crises agudas” – isto é,
aquelas que não foram dissuadidas em um estágio anterior do processo de
cálculo político, sinalização e ação. Para fins descritivos
7 Porter afirma ter numerosos exemplos de países que não tiveram sucesso; no entanto,
estes são introduzidos em suas análises por meio de anedotas escolhidas seletivamente e
não são estudados com métodos semelhantes aos dez originais. Ao selecionar exemplos não
sistemáticos de suporte a partir da gama infinita de possibilidades de suporte e não suporte, é
muito fácil enganar a nós mesmos para encontrar um relacionamento quando não existe
nenhum. Não tomamos posição sobre se as hipóteses de Porter estão corretas e apenas
desejamos apontar que as informações necessárias para tomar essa decisão devem ser
coletadas de forma mais sistemática.
coloca, há muito a ser dito para tal foco, pelo menos inicialmente: como na ênfase de
Porter no sucesso competitivo, o observador é capaz de descrever os episódios de
interesse mais significativos e pode formular hipóteses sobre as causas do observado
resultados. Mas, como base para inferência (e sem correções apropriadas), tal conjunto
de observações tendenciosas é seriamente falho porque casos em que a dissuasão
funcionou (em estágios iniciais do processo) foram sistematicamente excluídos do conjunto
de observações a serem analisadas. . “Quando os casos são mal utilizados para estimar
a taxa de sucesso da dissuasão, o projeto induz um 'viés de seleção' do tipo familiar da
pesquisa de avaliação de políticas” (Achen e Snidal 1989:162).
4.3.1.2 EXEMPLOS DE VIÉS DE SELEÇÃO INDUZIDOS PELO MUNDO
A escolha de um censo de observações, em vez de uma amostra, nos permite evitar

viés de seleção? Podemos pensar assim, já que aparentemente não houve nenhuma
seleção, mas isso nem sempre é correto. Por exemplo, suponha que desejamos fazer uma
inferência descritiva estimando a força do apoio ao partido Liberal no estado de Nova
York. Nossa variável dependente é a porcentagem de votos nos distritos da Assembléia
do Estado de Nova York para o candidato (ou candidatos) endossados pelo partido
Liberal. O problema aqui é que o partido muitas vezes opta por não endossar candidatos
em muitos distritos eleitorais. Se eles não endossam candidatos em distritos onde eles
têm certeza de que perderão (o que parece ser o caso), então teremos um viés de seleção
mesmo se escolhermos todos os distritos nos quais o partido Liberal fez um endosso.
O processo de seleção neste exemplo é realizado como parte do processo político que
estamos estudando, mas pode ter exatamente as mesmas consequências para o nosso
estudo como se nós mesmos causássemos o problema.
Esse problema de viés quando a seleção de casos é correlacionada com a variável
dependente é uma das dificuldades mais gerais enfrentadas pelos estudiosos que usam o
registro histórico como fonte de sua evidência, e eles incluem praticamente todos nós. A
razão é que os processos de “história” selecionam diferencialmente aquilo que resta a
ser observado de acordo com um conjunto de regras que nem sempre são claras a partir
do registro. No entanto, é essencial descobrir o processo pelo qual esses dados são
produzidos. Tomemos um exemplo de outro campo: algumas culturas criaram esculturas
em pedra, outras em madeira. Com o tempo, os primeiros sobrevivem, os últimos decaem.
Esse padrão levou alguns estudiosos de arte europeus a subestimar a qualidade e a
sofisticação da arte africana primitiva, que tendia a ser feita de madeira, porque a “história”
havia eliminado seletivamente alguns exemplos de escultura enquanto mantinha outros.
O estudioso cuidadoso deve sempre avaliar os possíveis vieses de seleção nas evidências
disponíveis: que tipos de eventos são

provável de ter sido registrado; que tipos de eventos provavelmente foram
ignorados?
Considere outro exemplo. Os cientistas sociais geralmente começam com
um ponto final que desejam “explicar” – por exemplo, as configurações
organizacionais peculiares dos Estados modernos. O investigador observa
que em um ponto inicial do tempo (digamos, 1500 d.C.) uma grande
variedade de unidades organizacionais existia na Europa, mas em um
momento posterior (digamos, 1900 d.C.), todas ou quase todas as unidades
importantes eram estados nacionais. . O que o pesquisador deve fazer é
começar com as unidades em 1500 e explicar as formas organizacionais
posteriores em termos de um número limitado de variáveis. Muitas das
unidades de análise teriam desaparecido nesse ínterim, porque perderam
guerras ou foram amalgamadas em entidades maiores; outros teriam
sobrevivido. A categorização cuidadosa poderia, assim, produzir uma variável
dependente que indicaria se a entidade que se tornou um estado nacional ainda existia em 1900; ou se não, quando desapareceu.
No entanto, o que muitos pesquisadores históricos fazem inadvertidamente
é bem diferente. Eles começam, como Charles Tilly (1975: 15) observou,
fazendo uma pesquisa retrospectiva : selecionando “um pequeno número de
estados da Europa Ocidental ainda existentes nos séculos XIX e XX para
comparação”. Infelizmente para esses investigadores, “Inglaterra, França e
até a Espanha são sobreviventes de uma competição implacável na qual a
maioria dos competidores perdeu”. A Europa de 1500 incluía cerca de
quinhentas unidades políticas mais ou menos independentes, a Europa de
1900 cerca de vinte e cinco. O estado alemão não existia em 1500, ou mesmo em 1800.
Comparar as histórias da França, Alemanha, Espanha, Bélgica e Inglaterra
(ou, nesse caso, qualquer outro conjunto de países modernos da Europa
Ocidental) para iluminar os processos de criação de estado pondera toda a
investigação em direção a um certo tipo de resultado. o que era, de fato,
bastante raro.
Tal procedimento, portanto, seleciona com base em um valor da variável
dependente - a sobrevivência no ano de 1900. Ele influenciará os resultados
do investigador, reduzindo em média os efeitos atribuídos das variáveis
explicativas que distinguem os estados sobreviventes de suas contrapartes
menos duráveis . Tilly e seus colegas (1975), reconhecendo o problema do
viés de seleção, passaram de uma retrospectiva para uma formulação
prospectiva de seu problema de pesquisa. Suponha, no entanto, que um
esforço tão grande não tenha sido possível, ou suponha que eles desejassem
coletar as melhores evidências disponíveis em preparação para seu estudo maior.
Eles poderiam ter reanalisado os estudos retrospectivos disponíveis, inferindo
que as estimativas de efeitos causais desses estudos eram, na maioria das
observações, enviesadas para baixo. Eles precisam lembrar que, mesmo que
os critérios descritos acima se apliquem exatamente, qualquer aplicação
pode superestimar ou subestimar o efeito causal. O melhor
palpite do verdadeiro efeito causal, com base nos estudos retrospectivos falhos,
no entanto, seria que os efeitos causais foram subestimados, pelo menos em
média - se assumirmos que as regras acima se aplicam e os critérios de seleção
foram correlacionados com a variável dependente .
4.3.2 Seleção de uma variável explicativa A
seleção de observações para inclusão em um estudo de acordo com as

categorias da variável explicativa causal chave não causa problemas de
inferência. A razão é que nosso procedimento de seleção não predetermina o
resultado de nosso estudo, uma vez que não restringimos o grau de variação
possível na variável dependente. Ao limitar o alcance de nossa variável causal
chave, podemos limitar a generalidade de nossa conclusão ou a certeza com a
qual podemos sustentá-la legitimamente, mas não introduzimos viés.
Ao selecionar casos com base nos valores dessa variável, podemos controlar
essa variável em nossa seleção de caso. O viés não é introduzido mesmo se a
variável causal estiver correlacionada com a variável dependente, pois já
controlamos essa variável explicativa.8 Assim, é possível evitar o viés ao
selecionar uma variável que está correlacionada com a variável dependente,
desde que conforme controlamos essa variável na análise.
É fácil ver que a seleção de uma variável explicativa não causa nenhum viés,
referindo-se novamente à figura 4.1. Se restringirmos esta figura para excluir
todas as observações para as quais a variável explicativa é igual a um, a lógica
desta figura permaneceria inalterada, e a linha correta ajustada aos pontos não
mudaria. A linha seria um pouco menos certa, já que agora temos menos
observações e menos informações para suportar o problema de inferência,
mas, em média, não haveria viés.9 Assim, pode-se evitar o viés selecionando
casos
com base na variável causal chave , mas também podemos atingir o mesmo
objetivo selecionando de acordo com as categorias de uma variável de controle
(desde que seja causalmente anterior à variável causal chave, como todas as
variáveis de controle deveriam ser). Os experimentos quase sempre selecionam
as variáveis explicativas. As unidades são criadas quando manipulamos as
variáveis explicativas (administração de um medicamento, por exemplo) e
observamos o que acontece com a variável dependente (se a saúde do
paciente melhora). Seria difícil selecionar a variável dependente neste caso, já
que seu valor não é sequer
8 Em geral, o viés de seleção ocorre ao selecionar a variável dependente, após

levar em consideração (ou controlar) as variáveis explicativas. Como uma dessas
variáveis explicativas é o método de seleção, nós o controlamos e não introduzimos viés.
9 A inferência também seria menos certa se a faixa de valores das variáveis
explicativas fosse limitada por essa seleção. Consulte a seção 6.2.

conhecido até depois do experimento. No entanto, a maioria dos experimentos
está longe de ser perfeita, e podemos cometer o erro de selecionar a variável
dependente dando inadvertidamente alguns tratamentos aos pacientes com base
em sua resposta esperada.
Para dar outro exemplo, se estivermos pesquisando o efeito da discriminação
racial nas notas escolares de crianças negras, seria bastante razoável selecionar
várias escolas com pouca discriminação e algumas com muita discriminação.
Ainda que nossa regra de seleção esteja correlacionada com a variável
dependente (negros tiram notas mais baixas em escolas com mais discriminação),
ela não estará correlacionada com a variável dependente após levar em conta o
efeito das variáveis explicativas, pois a regra de seleção é determinado pelos
valores de uma das variáveis explicativas.
Também podemos evitar o viés selecionando uma variável explicativa que seja
irrelevante para nosso estudo (e não tenha efeito sobre nossa variável
dependente). Por exemplo, para estudar os efeitos da discriminação nas notas,
suponha que alguém escolha todas as escolas cujos nomes começam com a
letra “A”. Isso, é claro, não é recomendado, mas não causaria nenhum viés,
desde que essa variável irrelevante não seja uma proxy para alguma outra
variável correlacionada com a variável dependente.
Uma situação em que a seleção por uma variável irrelevante pode ser muito
útil envolve a análise secundária dos dados existentes. Por exemplo, suponha
que estejamos interessados no que contribui para um golpe de Estado bem-sucedido.
Nossa hipótese-chave é que os golpes são mais bem-sucedidos quando liderados
por um líder militar do que por um civil. Suponhamos que encontremos um estudo
de tentativas de golpe que selecionou casos com base na extensão em que o
país tinha uma burocracia hierárquica antes de um golpe. Poderíamos usar esses
dados mesmo que a burocratização hierárquica seja irrelevante para nossa
pesquisa. Para garantir, porém, seria fácil incluir essa variável como um controle
em nossa análise dos efeitos de líderes militares versus líderes civis. Incluiríamos
esse controle estudando a frequência do sucesso do golpe para líderes militares
versus líderes civis em países com e sem burocratização hierárquica. A presença
desse controle nos ajudará a evitar o viés de seleção e seu efeito causal indicará
algumas informações possivelmente relevantes sobre o processo pelo qual as
observações foram realmente selecionadas.
4.3.3 Outros tipos de viés de seleção
Em todos os exemplos anteriores, o viés de seleção foi introduzido quando as

unidades foram escolhidas de acordo com alguma regra correlacionada com a
variável dependente ou correlacionada com a variável dependente após a ex-
Seleção Intencional · 139
variáveis planatórias foram levadas em conta. Com esse tipo de efeito de

seleção, os efeitos causais estimados são sempre subestimados. Este é de
longe o tipo mais comum de viés de seleção em pesquisas qualitativas e
quantitativas. No entanto, vale mencionar outro tipo de viés de seleção, pois
seus efeitos podem ser exatamente o oposto e causar superestimação de um
efeito causal.
Suponha que o efeito causal de alguma variável varie ao longo das
observações. Embora não tenhamos focado nessa possibilidade, ela é real.
Na seção 3.1, definimos um efeito causal para uma única unidade e permitimos
que o efeito diferesse entre as unidades. Por exemplo, suponha que
estivéssemos interessados no efeito causal da pobreza sobre a violência política
nos países latino-americanos. Essa relação pode ser mais forte em alguns
países, como aqueles com histórico recente de violência política, do que em
outros. Nessa situação, onde os efeitos causais variam ao longo das unidades,
uma regra de seleção correlacionada com o tamanho do efeito causal induziria
viés nas estimativas dos efeitos causais médios . Portanto, se conduzíssemos
nosso estudo apenas em países com histórias recentes de violência política,
mas procurássemos generalizar nossas descobertas para a América Latina
como um todo, provavelmente superestimaríamos o efeito causal sob
investigação. Se selecionássemos unidades com grandes efeitos causais e
calculássemos a média desses efeitos durante a estimativa, obteríamos uma
superestimativa do efeito causal médio. Da mesma forma, se selecionássemos
unidades com efeitos pequenos, a estimativa do efeito causal médio seria menor do que deveria ser.
4.4 SELEÇÃO INTENCIONAL DE OBSERVAÇÕES
Na pesquisa em ciência política, normalmente não temos controle sobre os

valores de nossas variáveis explicativas; eles são atribuídos por “natureza” ou
“história” e não por nós. Nessa situação comum, a principal influência que
podemos ter nesse estágio do projeto de pesquisa é a seleção de casos e
observações. Como vimos na seção 4.2, quando somos capazes de focalizar
apenas um pequeno número de observações, raramente devemos recorrer à
seleção aleatória de observações. Normalmente, a seleção deve ser feita de
forma intencional , consistente com nossos objetivos e estratégia de pesquisa.
A seleção intencional de observações implica que conhecemos

antecipadamente os valores de pelo menos algumas das variáveis relevantes e
que a seleção aleatória de observações é descartada. É menos provável que
sejamos enganados quando os casos são selecionados com base nas categorias
das variáveis explicativas. A própria pesquisa, então, envolve descobrir os
valores da variável dependente. No entanto, na prática, muitas vezes temos
evidências fragmentárias sobre os valores de muitas de nossas variáveis, mesmo antes de

seleção de observações. Isso pode ser perigoso, pois podemos inadvertidamente
e inconscientemente introduzir um viés de seleção, talvez favorecendo nossa
hipótese anterior. Discutiremos agora os vários métodos de seleção intencional
de observações.
4.4.1 Selecionando observações na variável explicativa
Como acabamos de observar, o melhor projeto “intencional” seleciona

observações para garantir a variação na variável explicativa (e quaisquer
variáveis de controle) sem levar em conta os valores das variáveis dependentes.
Somente durante a pesquisa descobrimos os valores da variável dependente e
então fazemos nossa inferência causal inicial examinando as diferenças na
distribuição dos resultados na variável dependente para determinados valores
das variáveis explicativas.
Por exemplo, suponha que estejamos interessados no efeito dos tratados
formais de controle de armas nas decisões dos Estados Unidos e da União
Soviética de adquirir armamentos durante a Guerra Fria. Nossa principal
variável causal, então, é a existência de um tratado formal de controle de armas
que abranja um determinado sistema de armas em um país. Poderíamos
escolher um conjunto de tipos de armas – algumas das quais são cobertas por
limitações de tratados e outras não – que variam em relação à nossa variável
explicativa. Nossa variável dependente, que não selecionamos, pode ser a
taxa de variação na aquisição de armas. Na medida em que os dois conjuntos
de observações foram bem combinados nas variáveis de controle e se
problemas como o de endogeneidade forem resolvidos com sucesso, tal projeto
poderia permitir inferências válidas sobre os efeitos dos acordos de controle de armas.
Às vezes, estamos interessados em apenas uma das várias variáveis
explicativas que parecem ter um efeito substancial na variável dependente. Em
tal situação, é apropriado controlar a variável na qual não estamos principalmente
(ou atualmente) interessados. Um exemplo desse procedimento foi fornecido
por Jack Snyder (1991). Snyder selecionou nações que descreveu como os
“principais candidatos ao poder” na era moderna para estudar seu grau de
“superexpansão” (sua variável dependente). Uma variável muito importante
que afeta a superexpansão é o poder militar, mas essa causa é tão óbvia e bem
documentada que Snyder não estava interessado em investir mais recursos
para estimar novamente seus efeitos. Em vez disso, ele controlou o poder militar
escolhendo apenas nações com altos níveis dessa variável. Ao manter essa
importante variável de controle quase constante, Snyder não pôde fazer
nenhuma inferência sobre o efeito da potência na superexpansão, mas pôde se
concentrar nas variáveis explicativas de seu interesse sem sofrer os efeitos do
viés da variável omitida. Além desses aspectos de seu projeto de pesquisa, o
de Snyder foi um estudo exploratório. Ele não identificou todas as suas
explicações
variáveis atórias antes de iniciar sua pesquisa (Snyder 1991:61-65).

Tal projeto de pesquisa aberto provavelmente o levou a ideias que ele não
teria considerado de outra forma, mas também significou que as perguntas
que ele finalmente fez não foram respondidas com a eficiência que poderiam
ter sido. Em particular, o intervalo de variação nas variáveis explicativas que
o interessavam provavelmente não era tão grande quanto poderia ser. Além
disso, ele não avaliou a teoria em um conjunto de dados diferente daquele
em que foi formulada.
Como enfatizamos ao longo deste livro, conselhos “puristas” – sempre
selecionar variáveis explanatórias, nunca variáveis dependentes – muitas
vezes não são realistas para a pesquisa qualitativa. Quando devemos levar
em conta os valores da variável dependente na coleta de dados, ou quando
os dados disponíveis já levam em conta esses valores, nem tudo está perdido.
Informações sobre efeitos causais ainda podem ser obtidas. Mas é provável
que o viés seja introduzido se não formos especialmente cuidadosos.
4.4.2 Selecionando um intervalo de valores da variável

dependente Uma alternativa para escolher observações na variável explicativa
seria selecionar nossas observações em um intervalo de valores da variável
dependente. A pesquisa geralmente começa assim: encontramos alguns
exemplos fascinantes de variação no comportamento que queremos explicar.
Nesse projeto de pesquisa retrospectiva (em epidemiologia, isso é chamado
de estudo de “caso-controle”), selecionamos observações com valores
particularmente altos e particularmente baixos da variável dependente. Como
enfatizamos, embora esse processo de seleção possa ajudar nas inferências
causais, esse delineamento é inútil para fazer inferências descritivas sobre a
variável dependente. Além disso, a ausência de dados descritivos
sistemáticos e a maior possibilidade de outros problemas causados por
possíveis não linearidades ou efeitos causais variáveis significam que esse
procedimento geralmente não produzirá inferências causais válidas.
Um projeto de pesquisa retrospectiva pode nos ajudar a obter algumas
informações valiosas sobre a plausibilidade empírica de uma inferência
causal , pois podemos descobrir que valores altos e baixos da variável
dependente estão associados a valores altos e baixos, respectivamente, de
variáveis explicativas potenciais. . No entanto, se esse projeto levar a
inferências causais significativas – embora necessariamente limitadas –, é
crucial selecionar observações sem considerar os valores das variáveis
explicativas. Não devemos buscar aquelas observações que se encaixam
(ou não se encaixam) em nossa teoria a priori. As observações devem ser
tão representativas quanto possível da população de observações para a
qual desejamos generalizar. Se descobrimos que valores altos e baixos de
variáveis explicativas potenciais estão associados a valores altos e baixos da variável dependente, nós

pode então querer projetar um estudo no qual as observações são selecionadas
apenas na(s) variável(is) explicativa(s) para avaliar se nossa hipótese está
correta. No mínimo, os resultados devem ser incertos no início ou então não
podemos aprender nada. Para ter incerteza sobre inferências causais, devemos
deixar que os valores da variável explicativa ou dependente sejam determinados
pela situação de pesquisa.
Por exemplo, podemos observar variações intrigantes nos conflitos violentos
entre os Estados e especular que foram causadas por diferentes formas de
governo. Pode valer a pena começar, de forma exploratória, examinando
cuidadosamente algumas relações bilaterais nas quais a guerra foi frequente e
outras que se caracterizaram por graus excepcionais de paz. Suponha que
descobrimos que as observações de guerra estavam associadas a
relacionamentos envolvendo pelo menos uma autocracia em modernização e
que as observações de paz estavam associadas a ambos os estados serem
democracias estáveis. Tal investigação exploratória geraria uma hipótese mais
precisa do que começamos. Não poderíamos declarar nossa hipótese
confirmada, pois ainda não teríamos uma imagem clara dos padrões gerais
(tendo selecionado observações sobre a variável dependente), mas poderíamos
ser encorajados a testá-la com um projeto que selecionasse observações com
base em a variável explicativa. Em tal projeto, escolheríamos observações sem
considerar o grau de conflito militar observado. Procuraríamos controlar outras
variáveis causais potencialmente relevantes e tentar determinar se as variações
no tipo de regime estavam associadas ao grau de conflito militar.
4.4.3 Selecionando observações em variáveis explicativas

e dependentes
É perigoso selecionar observações intencionalmente com base nas variáveis

explanatórias e dependentes, porque ao fazer isso, é fácil influenciar o resultado
inadvertidamente. O erro mais flagrante é selecionar observações nas quais as
variáveis explanatórias e dependentes variam juntas de maneiras conhecidas
por serem consistentes com a hipótese que a pesquisa pretende testar. Por
exemplo, podemos querer testar se é verdade que o governo autoritário (que
suprime a organização trabalhista e as demandas trabalhistas) leva a altas
taxas de crescimento econômico. Podemos selecionar observações que variam
em ambas as variáveis, mas selecioná-las deliberadamente para que todas as
observações autoritárias tenham altas taxas de crescimento e todas as
observações não autoritárias tenham baixas taxas de crescimento. Tal projeto
de pesquisa não pode descrever ou explicar nada, pois sem examinar um
conjunto representativo de observações, podemos
não determina se o crescimento econômico pode ser tão ou mais provável em

observações onde um regime democrático permite a organização do trabalho.
Apesar do risco envolvido na seleção de variáveis explanatórias e
dependentes, pode haver casos raros em estudos de observação limitada em
que faz algum sentido seguir procedimentos que levem em consideração
informações sobre os valores das variáveis dependentes e explanatórias.
embora esta seja uma técnica perigosa que requer muita cautela na execução.
Por exemplo, suponha que a distribuição dos valores de nossa variável
dependente seja altamente assimétrica, de modo que a maioria das observações
assuma um valor dessa variável. Se selecionássemos as observações com
base na variação da variável explicativa e permitíssemos que os valores da
variável dependente “caíssem onde pudessem”, poderíamos ficar sem variação
na última. Nada neste resultado desqualificaria a análise dos dados. De fato,
quando os valores da variável dependente acabam sendo os mesmos
independentemente dos valores das variáveis explicativas, temos um caso claro
de efeito causal zero. A única situação em que isso pode ser preocupante é se
acreditarmos que o verdadeiro efeito causal é muito pequeno, mas não zero.
Na pesquisa de n pequenos , é improvável que sejamos capazes de distinguir
nosso efeito zero estimado de um efeito pequeno, mas diferente de zero, com
muita certeza. A solução mais direta nesta situação é aumentar o número de
observações. Outra possibilidade é selecionar observações com base em
valores muito extremos das variáveis explicativas, de modo que um pequeno
efeito causal seja mais fácil de detectar. Se estes não forem suficientes, então
a seleção nas variáveis explanatórias e dependentes (mas não ambas
simultaneamente) poderia aumentar o poder do projeto de pesquisa o suficiente
para encontrar o efeito que estamos procurando. (Consulte a seção 6.3 para
sugestões adicionais.)
Assim, pode fazer sentido usar técnicas de amostragem para escolher

observações com base primeiro na variação da variável explicativa, mas
também de modo que um número de observações com o valor raro da variável
dependente seja incluído. Ao fazê-lo, no entanto, é importante não predeterminar
o valor da variável explicativa à qual a variável dependente está associada.
Além disso, ao usar esse procedimento, devemos estar cientes do potencial
introduzido para viés e, portanto, do valor limitado de nossas inferências. Ou
seja, nesses raros casos, podemos selecionar com base nos valores das
variáveis explicativas e nos valores da variável dependente, mas não em ambos
simultaneamente.10
10 Em outras palavras, se selecionarmos com base nas distribuições marginais das

variáveis dependentes e explanatórias, ainda podemos aprender sobre a distribuição conjunta
fazendo o estudo.

Por exemplo, suponha que levantamos a hipótese de que um determinado
padrão de participação conjunta em certas organizações internacionais inibiu
significativamente a eclosão de conflitos violentos entre qualquer par de estados.
Seguindo nosso método preferido de seleção apenas na variável explicativa,
nossas observações seriam pares de nações que variaram em períodos de
tempo específicos em seus membros organizacionais internacionais. Suponha
também que seja difícil estabelecer se os padrões de associação especificados
existem, de modo que só podemos examinar um número relativamente pequeno
de observações – não centenas ou milhares, mas apenas dezenas de pares de
estados. A dificuldade para o nosso método preferido surgiria se o conflito fosse
raro - por exemplo, ele irrompeu no período de tempo especificado para apenas
um par de estados em mil. Em tal situação, podemos selecionar pares de
nações que variam na variável explicativa (filiação institucional), mas descobrir
que nenhum par selecionado de estados experimentou conflito violento.
Sob tais condições, um procedimento de seleção mista pode ser sensato.

Podemos escolher observações com base em alguma variação na variável
explanatória (alguns pares de nações com padrões específicos de filiação e
outras sem) e selecionar mais observações do que pretendíamos estudar.
Poderíamos então dividir essas observações potenciais em duas categorias
com base em se houve conflito armado entre as nações em um determinado
período de tempo e então escolher números desproporcionais de observações
na categoria com conflito armado para obter exemplos de cada um em nosso
conjunto final de observações. Tal procedimento teria que ser realizado de
alguma forma que fosse independente de nosso conhecimento sobre as
observações em termos da variável explicativa. Por exemplo, podemos escolher
entre as observações sem conflito aleatoriamente e selecionar todas as
observações com conflito. Então, se houvesse uma forte associação entre
padrões de filiação organizacional e conflito militar no conjunto final de
observações, poderíamos estar dispostos a fazer inferências causais
experimentais.
O estudo de Atul Kohli sobre o papel do estado na política de pobreza na
Índia (1987) ilustra as restrições na seleção de observações em pesquisa de n
pequeno, as consequências dessas restrições para inferência causal válida e
algumas formas de superar as restrições. Kohli estava interessado no efeito das
estruturas de autoridade governamental e tipos de regime na prevalência de
políticas para aliviar a pobreza nos países em desenvolvimento. Seu argumento,
resumido, é que os regimes que têm um compromisso ideológico claro de ajudar
os pobres, que barram a participação de grupos de classe alta no regime e que
têm uma forte capacidade organizacional criarão políticas eficazes para atingir
seu objetivo. .
Regimes que carecem desse compromisso ideológico, que têm uma ampla
base de classe e que carecem de uma organização rígida serão ineficazes no

desenvolvimento de tais políticas, mesmo que ostensivamente comprometidos com isso.
Kohli concentra-se na Índia, onde residem seus interesses de pesquisa e para o qual
possui habilidades linguísticas. Suas observações primárias são os estados indianos.
Como ele observa, “A natureza federal da política indiana permite uma análise desagregada
e comparativa dentro da Índia. Abaixo do governo federal, os governos estaduais (ou
provinciais) na Índia desempenham um papel significativo na formulação e execução de
políticas agrárias.
Variações na natureza do governo político no nível estadual podem levar a eficácia
diferenciada na busca de programas antipobreza”
(1987:3–4). Kohli assume uma versão menos estrita (mas apropriada) da homogeneidade
da unidade, a do “efeito constante”: que o efeito causal é idêntico em estados com diferentes
níveis de seus principais fatores explicativos – isto é, o grau de ideologia, base de classe e
organização hipotetizada como favorável a políticas antipobreza. Ele pode avaliar sua
hipótese causal apenas comparando sua variável dependente em diferentes estados
enquanto faz essa suposição de “efeito constante” em cada um.
Uma amostra dos estados indianos é útil, argumenta ele, porque são, relativamente
falando, semelhantes. Pelo menos eles “se aproximam da suposição ceteris paribus. . .
melhor do que a maioria das nações independentes” (Kohli 1987:4).
Mas quais estados escolher? Os estudos intensivos que ele queria realizar (baseados em
duas viagens de campo planejadas há muito tempo para a Índia) impediram o estudo de
todos os estados. Dadas suas restrições, três estados eram tudo o que ele podia escolher.
Ter selecionado os três estados aleatoriamente teria sido imprudente, pois a seleção
aleatória só é garantida para ajudar com um n grande. A maioria dos estados indianos tem
regimes com características que impedem o desenvolvimento de políticas de redução da
pobreza e, portanto, têm poucas dessas políticas. De fato, apenas a Bengala Ocidental tem
um regime com características que promoveriam políticas antipobreza. Como aponta Kohli,
West Bengal tinha que estar em sua amostra. Ele então acrescentou mais dois estados,
Uttar Pradesh, que tem poucos programas antipobreza e Karna Take, um estado entre
esses dois extremos. Esses estados foram selecionados inteiramente com base na variável
dependente “porque representam um contínuo de esforços governamentais máximos a
mínimos para mitigar a pobreza rural” (Kohli 1987:7).
O problema do estudo é que os valores das variáveis explicativas também são

conhecidos; a seleção, com efeito, é tanto nas variáveis explanatórias quanto nas variáveis
dependentes. Nessas circunstâncias, o projeto é indeterminado e não fornece nenhuma
informação sobre sua hipótese causal. Ou seja, a hipótese não pode ser avaliada com
observações selecionadas de uma maneira conhecida de antemão para se adequar à
hipótese.
O estudo, então, tem algum valor? Não muito, se Kohli for apenas avaliador

sua hipótese ao nível desses três estados. Felizmente, ele faz consideravelmente mais.
Ele conceitua seu estudo como tendo apenas três observações, mas como acontece com
muitos estudos que a princípio parecem ter um n pequeno, ele tem muito mais observações.
É, de fato, um estudo de n grande.
Kohli vai além da simples constatação de que as variáveis explicativas e dependentes no
nível estadual nos três casos são consistentes com sua hipótese. Ele o faz examinando
as numerosas implicações observáveis de sua hipótese tanto nos estados que estuda
quanto em outros países. Uma vez que essas abordagens para pesquisa de n
aparentemente pequeno formam o assunto do próximo capítulo, descreveremos sua
estratégia para lidar com um n pequeno na seção 6.3.1.
No nível agregado da análise, entretanto, Kohli poderia ter feito mais para melhorar
suas inferências causais. Por exemplo, ele provavelmente sabia ou poderia ter determinado
os valores de suas variáveis explicativas e dependentes para praticamente todos os
estados indianos. Uma adição valiosa a seu livro teria sido um capítulo curto que
examinasse brevemente todos os estados. Isso teria fornecido uma boa noção da
veracidade geral de sua hipótese causal, além de possibilitar a seleção de seus três
estudos de caso de acordo com regras mais sistemáticas.
4.4.4 Selecionando observações para que a variável causal chave

seja constante
Às vezes, os cientistas sociais projetam a pesquisa de forma que a variável explicativa

que forma a base da seleção seja constante. Tal abordagem é obviamente deficiente: o
efeito causal de uma variável explicativa que não varia não pode ser avaliado. Portanto, é
improvável que um projeto de pesquisa que pretenda mostrar o efeito de uma característica
constante do ambiente seja muito produtivo – pelo menos por si só. No entanto, a maioria
das pesquisas faz parte de uma literatura ou tradição de pesquisa (consulte a seção 1.2.1)
e, portanto, é provável que algumas informações anteriores úteis sejam conhecidas. Por
exemplo, o intervalo usual da variável dependente pode ser muito bem conhecido quando
a variável explicativa assume, por exemplo, um determinado valor. O pesquisador que
conduz um estudo para descobrir o alcance da variável dependente para um outro valor
diferente da variável explicativa pode ser o primeiro a estimar o efeito causal.
Considere o seguinte exemplo onde a pesquisa conduzida sem variação na variável

explicativa levou a uma hipótese razoável, embora provisória, para um efeito causal, que
por sua vez foi refutada por pesquisas posteriores nas quais a variável explicativa assumiu
outro valor. Em algumas pesquisas iniciais sobre o impacto da industrialização, Inkeles e
Rossi (1956) compararam várias nações industrializadas em termos do prestígio atribuído
a várias ocupações. Eles encontraram um grande negócio
de similaridade em um conjunto de nações bastante variado, exceto pelo fato de todas

serem industrializadas. Eles concluíram que a industrialização foi a variável causal que
levou à hierarquia de prestígio particular que observaram. Na ausência de variação em
sua variável explicativa (todas as nações estudadas eram industrializadas), uma inferência
firme de causalidade teria sido inadequada, embora uma conclusão mais provisória que
tornasse a hipótese mais plausível fosse razoável. No entanto, outros pesquisadores
replicaram o estudo nas Filipinas e na Indonésia (que não são industrializadas) – variando
assim o valor da variável explicativa – e encontraram uma hierarquia de prestígio
semelhante, questionando assim o efeito causal da industrialização (ver Zelditch 1971 ).
O exemplo anterior mostra como uma sequência de projetos de pesquisa pode superar
os problemas de inferência válida quando a pesquisa original carecia de variação na
variável explicativa. David Laitin (1986) fornece um exemplo esclarecedor de como um
único pesquisador pode, em uma sequência de estudos, superar tal problema. Em seu
estudo sobre o impacto da mudança religiosa na política entre os iorubás na Nigéria,
Laitin discute por que não foi capaz de lidar com essa questão em seu estudo anterior
sobre a Somália. Como ele aponta, a religião, sua variável explicativa, é uma constante
em toda a Somália e é, além disso, multicolinear (ver seção 4.1) com outras variáveis,
tornando assim impossível isolar seu efeito causal. “A pesquisa de campo na Somália me
levou a levantar a questão do impacto independente da mudança religiosa na política;
mas mais pesquisas de campo na Somália não teriam me permitido abordar essa questão
sistematicamente. Como medir o impacto do Islã em uma sociedade onde todos são
muçulmanos? Todos lá também falam somali. Quase todos compartilham uma herança
nômade.
Quase todo somali foi exposto à mesma tradição poética.

Qualquer orientação comum para a ação poderia ser atribuída às tradições poéticas,
nômades ou lingüísticas dos somalis, e não à sua tradição religiosa” (1986:186). Laitin
supera esse problema voltando sua atenção de pesquisa para os iorubás da Nigéria, que
estão divididos em muçulmanos e cristãos. Veremos no capítulo 5 como ele faz isso.
4.4.5 Selecionando observações para que a variável dependente

seja constante
Também não podemos aprender nada sobre um efeito causal de um estudo que seleciona
observações de modo que a variável dependente não varie. Mas informações suficientes
podem existir na literatura para usar com este estudo para produzir uma inferência causal
válida.
Assim, um estudo de por que um determinado resultado possível nunca ocorreu

deve, se possível, ser alterado para criar variações nas variáveis dependentes
e explicativas. Por exemplo, se a questão da pesquisa é por que os proprietários
de plantações da Carolina do Sul anteriores à guerra falharam em usar
fertilizantes em quantidades ideais para manter a fertilidade do solo, podemos
aprender pouco no nível do estado a partir de um estudo limitado à Carolina do
Sul se todos os proprietários de plantações se comportou dessa maneira. Não
haveria, nesse caso, variação na variável dependente, e a falta de variação
seria inteiramente devida ao pesquisador e, portanto, não traria nenhuma informação nova.
Se algumas plantações da Virgínia usaram fertilizantes, faria sentido olhar para
ambos os estados para explicar a variação no uso de fertilizantes – pelo menos
uma diferença entre os estados, que seria nossa principal variável causal,
poderia explicar o uso de fertilizantes. Por outro lado, se todos os estudos
anteriores tivessem sido conduzidos em estados que não usam fertilizantes,
uma contribuição substancial para a literatura poderia ser feita estudando um
estado em que os agricultores usam fertilizantes. Isso pelo menos aumentaria
a possibilidade de estimar um efeito causal.
Como outro exemplo, apesar dos temores de uma geração e do prognóstico
sombrio de muitos cientistas políticos, as armas nucleares não explodiram em
guerra desde 1945. Mesmo que a guerra nuclear nunca tenha ocorrido, parece
valioso tentar entender as condições sob qual poderia ocorrer. Este é claramente
um caso extremo de seleção na variável dependente onde a variável parece
constante. Mas, como muitos na literatura argumentam fervorosamente, as
armas nucleares podem não ter sido usadas porque o valor de uma variável
explicativa chave (um mundo com pelo menos duas superpotências nucleares)
permaneceu constante durante todo esse período. Tentar estimar uma inferência
causal com “variáveis” explicativas e dependentes que são ambas constantes
é inútil, a menos que reconceituemos o problema. Mostraremos como resolver
este problema, para o presente exemplo, na seção 6.3.3.
Pesquisadores de ciências sociais às vezes seguem uma abordagem

retrospectiva exemplificada pelos Centros de Controle de Doenças (CDC). Ele
seleciona com base em valores extremos, mas constantes, de uma variável
dependente. O CDC pode identificar um “grupo de câncer” – um grupo de
pessoas com o mesmo tipo de câncer na mesma localização geográfica. O
CDC então procura por alguma substância química ou outro fator no ambiente
(a variável explicativa chave) que possa ter causado todos os cânceres (a
variável dependente). Esses estudos, nos quais as observações são
selecionadas com base em valores extremos da variável dependente, são
razoavelmente válidos porque existem dados consideráveis sobre os níveis
normais dessas variáveis explicativas. Embora quase todos os estudos do CDC
sejam negativos ou inconclusivos, eles ocasionalmente encontram algum
produto químico suspeito. Se não houver evidências anteriores de que esse
produto químico cause câncer, o CDC geralmente encomendará um estudo no qual observar
Considerações Finais · 149

variações são selecionadas, se possível, na variável explicativa (variação
na presença ou ausência deste produto químico) para ter mais confiança
na inferência causal.
Pesquisadores de ciências sociais às vezes adotam essa abordagem.
Notamos um “cluster político” específico – uma comunidade ou região em
que há uma longa história de radicalismo político, violência política ou outra
característica e procuramos descobrir o que há de “especial” nessa região.
Como na pesquisa do CDC, se tal estudo revelar correlações sugestivas,
não devemos considerá-las como confirmando a hipótese, mas apenas
como fazendo valer a pena projetar um estudo que selecione com base na
suposta variável explanatória, deixando a variáveis dependentes –
radicalismo político ou violência política – variam.
CONSIDERAÇÕES FINAIS
Neste capítulo, discutimos como podemos selecionar observações a fim de

alcançar um projeto de pesquisa determinado que minimize o viés como
resultado do processo de seleção. Uma vez que projetos perfeitos são
inatingíveis, combinamos nossa crítica dos processos de seleção com
sugestões de estratégias imperfeitas, mas úteis, que podem fornecer alguma
alavancagem em nosso problema de pesquisa. Em última análise, queremos
ser capazes de projetar um estudo que selecione com base nas variáveis
explicativas sugeridas por nossa teoria e deixe a variável dependente
variar. No entanto, no caminho para esse objetivo, pode ser útil empregar
projetos de pesquisa que levem em conta os valores observados da variável
dependente; mas para qualquer pesquisador fazendo isso, aconselhamos
o máximo cuidado. Nosso objetivo principal é obter mais informações
relevantes para a avaliação de nossa teoria sem introduzir tanto viés que
comprometa a qualidade de nossas inferências.
CAPÍTULO 5
Entendendo o que evitar
NO CAPÍTULO 4, discutimos como construir um estudo com um desenho de

pesquisa determinado no qual os procedimentos de seleção de observação tornam
possíveis inferências válidas. Realizar essa tarefa com sucesso é necessário, mas
não suficiente, se quisermos fazer inferências válidas: erros analíticos posteriores
no processo de pesquisa podem destruir o bom trabalho que fizemos anteriormente.
Neste capítulo, discutimos como, uma vez selecionadas as observações para
análise, podemos entender as fontes de ineficiência e viés e reduzi-las a proporções
administráveis. Em seguida, consideraremos como podemos controlar a pesquisa
de forma a lidar efetivamente com esses problemas.
Ao discutir ineficiência e viés, vamos relembrar nossos critérios que introduzimos

nas seções 2.7 e 3.4 para julgar inferências. Se tivermos um projeto de pesquisa
determinado, precisamos nos preocupar com os dois problemas-chave que
discutiremos neste capítulo: viés e eficiência. Para entender esses conceitos, é útil
pensar em qualquer inferência como uma estimativa de um ponto particular com
um intervalo ao seu redor.
Por exemplo, podemos supor que a idade de alguém é de quarenta anos, mais ou
menos dois anos. Quarenta anos é nosso melhor palpite (a estimativa) e o intervalo
de 38 a 42 inclui nosso melhor palpite no centro, com uma estimativa de nossa
incerteza (a largura do intervalo).
Queremos escolher o intervalo de modo que a idade verdadeira caia dentro dele
uma grande proporção do tempo. Imparcialidade refere-se a centralizar o intervalo
em torno da estimativa correta, enquanto eficiência refere-se a estreitar um
intervalo adequadamente centrado.
Essas definições de imparcialidade e eficiência se aplicam independentemente
de estarmos procurando fazer uma inferência descritiva, como no exemplo sobre
idade ou uma inferência causal. Se fôssemos, por exemplo, estimar o efeito da
educação sobre a renda (o número de dólares recebidos para cada ano adicional
de educação), teríamos uma estimativa pontual do efeito cercada por um intervalo
refletindo nossa incerteza como para a quantidade exata. Queremos um intervalo o
mais estreito possível (para eficiência) e centrado em torno da estimativa correta
(para imparcialidade). Também queremos que a estimativa da largura do intervalo
seja uma representação honesta de nossa incerteza.
Neste capítulo, nos concentramos em quatro fontes de viés e ineficiência,

começando com o estágio de pesquisa em que buscamos melhorar o
Erro de Medição · 151
qualidade da informação e proceder através da realização de inferências causais.

Na seção 5.1, discutimos o erro de medição, que pode influenciar nossos resultados,
bem como torná-los menos eficientes. Em seguida, consideramos na seção 5.2 o
viés em nossas inferências causais que pode resultar quando omitimos variáveis
explicativas que deveríamos ter incluído na análise. Na seção 5.3 abordamos o
problema inverso: controlar variáveis irrelevantes que reduzem a eficiência de
nossa análise. Finalmente, estudamos o problema que resulta quando nossa
variável “dependente” afeta nossas variáveis “explicativas”. Esse problema é
conhecido como endogeneidade e é apresentado na seção 5.4. Finalmente, nas
seções 5.5 e 5.6 discutimos, respectivamente, atribuição aleatória de valores das
variáveis explicativas e vários métodos de controle não experimental.
5.1 ERRO DE MEDIÇÃO
Uma vez selecionadas nossas observações, temos que medir os valores das
variáveis nas quais estamos interessados. Uma vez que toda observação e
medição nas ciências sociais é imprecisa, somos imediatamente confrontados com
questões de erro de medição.
Muitas análises na pesquisa em ciências sociais tentam estimar a quantidade
de erro e reduzi-la tanto quanto possível. A pesquisa quantitativa produz medidas
(numéricas) mais precisas, mas não necessariamente mais precisas. A
confiabilidade – diferentes medições do mesmo fenômeno produzem os mesmos
resultados – às vezes é adquirida em detrimento da validade – as medições
refletem o que o investigador está tentando medir. Pesquisadores qualitativos
tentam obter medidas precisas, mas geralmente têm um pouco menos de precisão.
A medição quantitativa e a observação qualitativa são, em aspectos essenciais,

muito semelhantes. Para ter certeza, os pesquisadores qualitativos normalmente
rotulam suas categorias com palavras, enquanto os pesquisadores quantitativos
assinam valores numéricos para suas categorias e medidas. Mas tanto os
pesquisadores quantitativos quanto os qualitativos usam medidas nominais,
ordinais e de intervalo. Com categorias nominais, as observações são agrupadas
em um conjunto de categorias sem a suposição de que as categorias estejam em
qualquer ordem específica. As categorias relevantes podem ser baseadas em
formas legais ou institucionais; por exemplo, estudantes de política comparada
podem estar interessados em padrões de governo presidencial, parlamentar e
autoritário entre os países. As categorias ordinais dividem os fenômenos de acordo
com algum esquema de ordenação. Por exemplo, um pesquisador qualitativo
pode dividir as nações em três ou quatro categorias de acordo com seu grau de
industrialização ou o tamanho de suas forças militares.
Finalmente, a medição de intervalo usa variáveis contínuas, como em estudos de
fluxos de transações através das fronteiras nacionais.
152 · Compreendendo o que evitar

As diferenças entre medição quantitativa e qualitativa envolvem como os
dados são representados, não o status teórico da medição. Pesquisadores
qualitativos usam palavras como “mais” ou “menos”, “maior” ou “menor” e
“forte” ou “fraco” para medições; pesquisadores quantitativos usam números.
Por exemplo, a maioria dos pesquisadores qualitativos em relações

internacionais está perfeitamente ciente de que o “número de mortes em
batalhas” não é necessariamente um bom índice de quão significativas são
as guerras para os padrões subsequentes da política mundial. Na teoria do
equilíbrio de poder, não a gravidade da guerra, mas uma mudança
“conseqüente” nos principais atores é vista como o conceito teórico relevante
de instabilidade a ser medido (ver Gulick 1967 e Waltz 1979:162). No
entanto, ao evitar a invalidade, o pesquisador qualitativo muitas vezes corre
o risco de não ser confiável devido a erros de medição. Como saber o que
conta como “conseqüente”, se esse termo não for definido com precisão?
De fato, a própria linguagem parece implicar que tal julgamento será feito
dependendo do resultado sistêmico – o que influenciaria as estimativas
subseqüentes da relação na direção da hipótese.
Nenhuma fórmula pode especificar as compensações entre o uso de
indicadores quantitativos que podem não refletir validamente os conceitos
subjacentes nos quais estamos interessados, ou julgamentos qualitativos
que são inerentemente imprecisos e sujeitos a vieses inconscientes. Mas
ambos os tipos de pesquisadores devem fornecer estimativas da incerteza
de suas inferências. Pesquisadores quantitativos devem fornecer erros
padrão juntamente com suas medições numéricas; os pesquisadores
qualitativos devem oferecer estimativas de incerteza na forma de julgamentos
cuidadosamente redigidos sobre suas observações. A diferença entre
medição quantitativa e qualitativa está no estilo de representação de
essencialmente as mesmas ideias.
Medições qualitativas e quantitativas são semelhantes de outra maneira.
Para cada um, as categorias ou medidas usadas são geralmente artefatos
criados pelo investigador e não são “dados” na natureza. A divisão das
nações em regimes democráticos e autocráticos ou em regimes
parlamentares e presidencialistas depende de categorias que são construtos
intelectuais, assim como a ordenação das nações segundo dimensões como
mais ou menos industrializadas.
Obviamente, não existe uma resposta universalmente correta: toda
medição depende do problema que o investigador busca entender. Quanto
mais próximo o esquema categórico estiver das ideias teóricas e empíricas
originais do investigador, melhor; no entanto, esse mesmo fato enfatiza o
fato de que as categorias são artefatos dos propósitos do investigador. O
número de regimes parlamentaristas em que a representação proporcional
é o principal sistema de representação depende da classificação do
investigador de “regimes parlamentares” e de
o que conta como um sistema de representação proporcional. Os

pesquisadores em relações internacionais podem procurar estudar os fluxos
monetários registrados através das fronteiras nacionais, mas seu uso de
uma medida contínua depende de decisões sobre que tipos de transações
devem ser contabilizados, de regras sobre o que constitui uma única
transação e de definições de na. fronteiras nacionais. Da mesma forma, a
proporção de votos que é democrata em um distrito do Congresso é baseada
em classificações feitas pelo analista assumindo que os rótulos de partido
“Democrata” e “Republicano” têm o mesmo significado, para seus propósitos,
em todos os 435 congressos distritos regionais.
Mesmo os esquemas de categorização que usamos nesta seção para
medidas (nominais, ordinais e intervalares) dependem do propósito teórico
para o qual uma medida é usada. Por exemplo, pode parecer óbvio que a
etnia é uma variável nominal prototípica, que pode ser codificada nos Estados
Unidos como negro, branco, latino, nativo americano e asiático-americano.
No entanto, há uma grande variação entre grupos étnicos nominais em quão
fortemente os membros de tais grupos se identificam com seu grupo particular.
Poderíamos, portanto, categorizar grupos étnicos em uma escala ordinal em
termos, por exemplo, da proporção de membros de um grupo que se
identificam fortemente com ele. Ou podemos estar interessados no tamanho
de um grupo étnico, caso em que a etnia pode ser usada como uma medida
de nível de intervalo. O ponto chave é usar a medida que é mais adequada
aos nossos propósitos teóricos.
Os problemas de medição ocorrem com mais frequência quando medimos
sem referência explícita a qualquer estrutura teórica. Por exemplo, os
pesquisadores às vezes pegam uma variável naturalmente contínua que pode
ser bem medida, como a idade, e a categorizam em jovem, meia-idade e
velho. Para alguns propósitos, essas categorias podem ser suficientes, mas
como representação teórica da idade de uma pessoa, esse é um procedimento
desnecessariamente impreciso. O erro de agrupamento criado aqui seria
bastante substancial e deveria ser evitado. Evitar erros de agrupamento é um
caso especial do princípio: não descarte dados desnecessariamente.
No entanto, podemos cometer o erro oposto - atribuir valores numéricos
contínuos e de nível de intervalo a variáveis naturalmente discretas.
A medição em nível de intervalo geralmente não é melhor do que a medição
ordinal ou nominal. Por exemplo, uma pergunta de pesquisa pode solicitar
afiliação religiosa e também a intensidade do compromisso religioso. A
intensidade do compromisso religioso poderia - se as perguntas forem feitas
adequadamente - ser medida como uma variável ordinal, talvez até mesmo
um intervalo, dependendo da natureza do instrumento de medição. Mas faria
menos sentido atribuir uma classificação numérica à religião específica à qual
um indivíduo pertencia. Nesse caso, uma variável ordinal ou contínua
provavelmente não existe e um erro de medição seria criado por tal
procedimento.
154 · Entendendo o que evitar

A escolha entre categorias nominais, por um lado, e ordinais ou intervalares,
por outro, pode envolver um tradeoff entre riqueza descritiva e facilidade de
comparação. Por exemplo, considere as regras de votação usadas por
organizações internacionais. A regra institucional que rege o voto é importante
porque reflete concepções de soberania do Estado e porque tem implicações
para os tipos de resoluções que podem ser aprovadas, para os recursos
alocados à organização e para as expectativas de cumprimento dos mandatos
da organização.
Um conjunto de categorias nominais poderia distinguir entre sistemas nos
quais um único membro pode vetar qualquer resolução (como no Conselho da
Liga das Nações agindo sob as provisões do Artigo 15 do Pacto); em que
apenas alguns membros podem vetar resoluções (como no Conselho de
Segurança das Nações Unidas); em que prevaleça alguma forma de votação
por supermaioria (como nas decisões relativas ao mercado interno da
Comunidade Européia); e em que a votação por maioria simples é a regra (como
para muitos votos na Assembléia Geral das Nações Unidas). É provável que
cada um desses sistemas gere dinâmicas de negociação distintas e, se nosso
propósito é estudar a dinâmica de um desses sistemas (como um sistema no
qual qualquer membro pode exercer o poder de veto), é essencial definir nossas
categorias , para que não incluamos de forma inadequada outros tipos de
sistemas em nossa análise. Categorias nominais seriam apropriadas para tal
projeto.
No entanto, também poderíamos ver essas categorias de maneira ordinal,
desde a mais restritiva (requer unanimidade) até a menos restritiva (maioria simples).
Tal categorização seria necessária se testássemos proposições teóricas sobre a
relação entre a restritividade de uma regra de votação e os padrões de barganha
ou as características distributivas de resultados típicos. No entanto, pelo menos
duas de nossas categorias – vetos de alguns membros e votação por maioria
qualificada – são bastante indistintas porque incluem uma gama de arranjos
diferentes. A primeira categoria inclui o veto total de apenas um membro, que
beira a ditadura, e o veto de todos, exceto alguns membros inconseqüentes; a
segunda inclui a regra da Comunidade Européia que impede que dois Estados
quaisquer tenham uma minoria de bloqueio em questões envolvendo o mercado
interno. A fórmula utilizada no Fundo Monetário Internacional é nominalmente um
caso de votação por maioria qualificada, mas dá tal minoria de bloqueio tanto
aos Estados Unidos quanto, recentemente, à Comunidade Européia em bloco.
Portanto, parece pertencer a ambas as categorias.
Podemos, portanto, querer dar um passo adiante para gerar uma medida de
nível de intervalo com base na proporção de estados (ou a proporção de recursos,
com base no produto nacional bruto, contribuições para a organização ou
população representada por estados) necessário para passagem
de resoluções, medindo organizações internacionais em uma escala de

restrição de voto.
No entanto, diferentes bases para tal medida – por exemplo, se a
população ou o produto nacional bruto foram usados como medida de
recursos – gerariam resultados diferentes. Portanto, as vantagens da
precisão em tais medições podem ser compensadas pelas responsabilidades
da arbitrariedade na base de medição ou da complexidade das medidas
agregadas. Cada categoria tem vantagens e limitações: o objetivo do
pesquisador deve determinar a escolha feita.
Nas duas subseções seguintes, analisaremos as consequências

específicas do erro de medição para a pesquisa qualitativa e chegaremos
a algumas conclusões que podem parecer surpreendentes. Poucos
discordariam de que o erro sistemático de medição, como uma
superestimativa consistente de certas unidades, causa viés e, uma vez que
o viés não desaparece com mais observações carregadas de erros,
inconsistência. No entanto, uma análise mais detalhada mostra que apenas
alguns tipos de erros sistemáticos de medição influenciarão nossas
inferências causais. Além disso, as consequências do erro de medição não
sistemático podem ser menos claras. Discutiremos o erro de medição não
sistemático em duas partes: na variável dependente e depois na variável
explicativa. Como demonstraremos, o erro na variável dependente causa
ineficiências, que provavelmente produzirão resultados incorretos em
qualquer instância e dificultarão a localização de evidências persistentes
de efeitos sistemáticos. Em outras palavras, o erro de medição não
sistemático na variável dependente não causa viés, mas pode aumentar
substancialmente a ineficiência. Mais interessante é o erro não sistemático
na variável causal chave, que infalivelmente distorce as inferências de
maneiras previsíveis. Compreender a natureza desses vieses ajudará a amenizá-los ou possivelmente evitá-los.
5.1.1 Erro sistemático de medição

Nesta seção, abordamos as consequências do erro sistemático de medição.
Erros sistemáticos de medição, como uma medida sendo uma
superestimativa consistente para certos tipos de unidades, às vezes podem
causar viés e inconsistência na estimativa de efeitos causais. Nossa tarefa
é descobrir quais tipos de erro sistemático de medição resultam em quais
tipos de viés. Tanto na pesquisa quantitativa quanto na qualitativa, o erro
sistemático pode derivar de escolhas por parte dos pesquisadores que
distorcem os dados em favor das expectativas anteriores do pesquisador.
No trabalho quantitativo, o pesquisador pode usar esses dados tendenciosos
porque é a única série numérica disponível. Na pesquisa qualitativa, o erro
de medição sistemático pode resultar de avaliações subjetivas feitas por investigadores que têm

já formularam suas hipóteses e que desejam demonstrar sua correção.
Deveria ser óbvio que qualquer erro sistemático de medição influenciaria as

inferências descritivas.1 Considere, por exemplo, o caso mais simples possível
em que inadvertidamente superestimamos o valor da renda anual de cada
respondente da pesquisa em US$ 1.000. Nossa estimativa da renda anual
média para toda a amostra obviamente será superestimada pelo mesmo
número. Se estivéssemos interessados em estimar o efeito causal de uma
educação universitária sobre a renda anual média, o erro sistemático de
medição não teria efeito sobre nossa inferência causal. Se, por exemplo, nosso
grupo universitário realmente ganha $ 30.000 em média, mas nosso grupo de
controle de pessoas que não foi para a faculdade ganha em média $ 25.000,
nossa estimativa do efeito causal de uma educação universitária em uma
renda anual seria de $ 5.000. Se a renda de cada pessoa em ambos os grupos
fosse superestimada na mesma quantia (digamos, US$ 1.000 novamente),
então nosso efeito causal – agora calculado como a diferença entre US$
31.000 e US$ 26.000 – ainda seria de US$ 5.000. Assim, o erro sistemático
de medição que afeta todas as unidades pela mesma quantidade constante
não causa nenhum viés na inferência causal. (Isso é mais fácil de ver focando
na versão de efeitos constantes da suposição de homogeneidade da unidade
descrita na seção 3.3.1.)
No entanto, suponha que haja um erro sistemático em uma parte da
amostra: os graduados da faculdade relatam sistematicamente sua renda
exageradamente porque querem impressionar o entrevistador, mas o grupo de
controle relata sua renda com mais precisão. Nesse caso, tanto a inferência
descritiva quanto nossa inferência sobre o efeito causal da educação sobre a
renda seriam enviesadas. Se soubéssemos do problema de relatórios,
poderíamos fazer perguntas de pesquisa melhores ou extrair as informações
de outras maneiras. Se a informação já foi coletada e não temos oportunidade
de coletar mais, podemos pelo menos ser capazes de determinar a direção do
viés para fazer uma correção post hoc.
Para reforçar esse ponto, considere um exemplo da literatura sobre
integração regional nas relações internacionais. Essa literatura buscou, mais
do que a maioria dos trabalhos em relações internacionais, testar hipóteses
específicas, às vezes com indicadores quantitativos. No entanto, um dos
conceitos mais importantes da literatura – o grau em que a autoridade política
é transferida dos Estados-nação para uma organização internacional – não é
facilmente passível de medição quantitativa válida. Os pesquisadores,
portanto, criaram medidas qualitativas dessa variável, que eles codificaram
com base em seu próprio conhecimento detalhado de
1 Uma exceção é quando os erros sistemáticos positivos cancelam os sistemáticos negativos,

mas esse caso estranho é mais apropriadamente descrito como um tipo de medição não sistemática
erro.
as questões envolvidas (por exemplo, Lindberg e Scheingold 1970:71, tabela 3.1).

Suas variáveis explicativas incluíam categorizações subjetivas de tais variáveis
como “complementaridade de valor de elite” e “estilo de tomada de decisão” (ver
Nye 1971 ou Lindberg e Sheingold 1971). Eles tentaram examinar as associações
entre as variáveis explanatórias e dependentes, quando as variáveis foram
medidas dessa maneira.
Essa abordagem foi uma resposta às preocupações com a validade:
pesquisadores especialistas codificaram as informações e puderam examinar se
eram relevantes para os conceitos subjacentes às suas medições. Mas a
abordagem corria o risco de erro de medição subjetivo. Os pesquisadores tiveram
que exercer grande autodisciplina no processo e abster-se de codificar suas
variáveis explicativas à luz de suas posições teóricas ou expectativas. Em
qualquer caso, eles podem ter feito isso, mas é difícil para seus leitores saber até
que ponto eles foram bem-sucedidos.
Nosso conselho nessas circunstâncias é, primeiro, tentar usar julgamentos
feitos para propósitos totalmente diferentes por outros pesquisadores. Esse
elemento de arbitrariedade na medição qualitativa ou quantitativa garante que as
medidas não serão influenciadas por suas hipóteses, que presumivelmente não
foram formadas até mais tarde. Essa estratégia é freqüentemente seguida na
pesquisa quantitativa – um pesquisador toma as medidas de outra pessoa e as
aplica a seus próprios propósitos – mas também é uma excelente estratégia na
pesquisa qualitativa. Por exemplo, pode ser possível organizar a codificação
conjunta de variáveis-chave por observadores informados com diferentes
interpretações e explicações preferidas dos fenômenos. Bancos de dados
qualitativos com categorias padrão podem ser construídos com base em
conhecimento e discussão compartilhados. Eles podem então ser usados para
avaliar hipóteses. Se você for a primeira pessoa a usar um conjunto de variáveis,
é útil permitir que outras pessoas informadas codifiquem suas variáveis sem
conhecer sua teoria da relação que deseja avaliar. Mostre a eles suas notas de
campo e entrevistas gravadas e veja se as conclusões deles sobre as medidas
são as mesmas que as suas.
Como a replicabilidade na codificação aumenta a confiança nas variáveis
qualitativas, quanto mais observadores altamente qualificados verificarem suas
medidas, melhor.
5.1.2 Erro de medição não sistemático O
erro de medição não sistemático, seja quantitativo ou qualitativo, é outro problema

enfrentado por todos os pesquisadores.2 O erro não sistemático não influencia a
medição da variável. No contexto atual, podemos
2 Se isso se deve à nossa incapacidade de medir o mundo real com precisão ou à

aleatoriedade da natureza, é uma questão filosófica para a qual diferentes respostas podem
ser dadas. (seção 2.6). Qualquer que seja a posição que aceitemos, a consequência é a mesma.
definir variáveis com erro de medição não sistemático ou aleatório como tendo
valores às vezes muito altos e às vezes muito baixos, mas corretos na média.
Erros aleatórios obviamente criam ineficiências, mas não vieses ao fazer
inferências descritivas. Este ponto já foi discutido na seção 2.7.1. Aqui, vamos
além da consequência do erro de medição aleatório para inferência descritiva
para sua consequência para inferência causal.
Na estimativa de efeitos causais, o erro de medição aleatório tem um efeito

diferente quando o erro está em uma variável explicativa do que quando o erro
está na variável dependente. O erro de medição aleatório na variável
dependente reduz a eficiência da estimativa causal, mas não a distorce. Isso
pode levar a estimativas de relações causais que são às vezes muito altas e
às vezes muito baixas. No entanto, a estimativa será, em média, correta. De
fato, o erro de medição aleatório em uma variável dependente não é diferente
ou mesmo geralmente distinguível do erro aleatório usual presente no mundo
conforme refletido na variável dependente.
O erro aleatório em uma variável explicativa também pode produzir

ineficiências que levam a estimativas incertamente altas ou baixas. Mas
também tem um efeito muito diferente do erro aleatório na variável dependente:
o erro aleatório em uma variável explicativa produz viés na estimativa da
relação entre a variável explicativa e a variável dependente. Esse viés assume
uma forma particular: resulta na estimativa de uma relação causal mais fraca
do que é o caso. Se a relação verdadeira for positiva, o erro aleatório na
variável explicativa irá influenciar a estimativa para baixo em direção a uma
relação menor ou nula. Se a relação for negativa, ela influenciará a relação
para cima em direção a
zero.
Como essa diferença entre o efeito do erro aleatório em uma variável
explicativa e o erro aleatório em uma variável dependente não é intuitivamente
óbvia, apresentamos provas formais de cada efeito, bem como uma
apresentação gráfica e um exemplo ilustrativo. Começamos com o efeito do
erro aleatório em uma variável dependente.
5.1.2.1 ERRO DE MEDIÇÃO NÃO SISTEMATICA NA
VARIÁVEL DEPENDENTE
O erro de medição não sistemático ou aleatório em uma variável dependente

não distorce a estimativa usual do efeito causal, mas torna a estimativa menos
eficiente. Em qualquer aplicação, essa ineficiência produzirá resultados
imprevisíveis, às vezes dando inferências causais muito grandes e às vezes
muito pequenas. O erro de medição na variável dependente aumenta, portanto,
a incerteza de nossas inferências. Em outras palavras, erro de medição
aleatório em um dependente
variável cria um problema semelhante ao criado por um pequeno número de

observações; em ambos os casos, a quantidade de informação que podemos
trazer para um problema é menor do que gostaríamos. O resultado é que o erro
de medição aleatório na variável dependente produz estimativas de efeitos
causais que são menos eficientes e mais incertas.
Quando usamos vários conjuntos de dados, como deveríamos fazer quando
possível, as estimativas baseadas em variáveis dependentes com erro de
medição aleatório serão instáveis. Alguns conjuntos de dados produzirão
evidências de relacionamentos fortes, enquanto outros produzirão efeitos
inexistentes ou negativos, mesmo que o relacionamento verdadeiro não tenha
mudado. Essa ineficiência torna mais difícil, às vezes consideravelmente mais
difícil, encontrar características descritivas ou causais sistemáticas em um
conjunto de dados ou (talvez mais obviamente) em diferentes conjuntos de
dados. As estimativas de incerteza geralmente serão maiores do que o tamanho
estimado das relações entre nossas variáveis. Assim, podemos ter informações
insuficientes para concluir que existe um efeito causal quando ele pode
realmente estar presente, mas mascarado por erro aleatório na variável
dependente (e representado no aumento da incerteza de uma inferência).
Pesquisadores qualitativos e quantitativos que estão cientes desse resultado
geral não terão ferramentas adicionais para lidar com erros de medição - exceto
um ímpeto mais forte para melhorar as medições das observações que eles têm
ou coletar novas observações com os mesmos (ou inferiores) níveis de
medição. erro. Entender esses resultados com uma quantidade fixa de dados
permitirá que os estudiosos qualifiquem suas conclusões de maneira mais
apropriada. Esse reconhecimento explícito da incerteza pode motivar esses
investigadores ou outros a realizar estudos de acompanhamento com variáveis
dependentes medidas com mais cuidado (ou com um número maior de
observações). Deve ser ainda mais útil no planejamento da pesquisa, uma vez
que os estudiosos freqüentemente enfrentam uma compensação entre obter
precisão adicional para cada medição e obter mais observações. O objetivo é
obter mais informações relevantes para nossa hipótese: precisamos fazer
julgamentos sobre se essas informações podem ser melhor obtidas por mais
observações em casos existentes ou coletando mais dados.
Considere o seguinte exemplo de erro de medição aleatório na variável
dependente. Ao estudar os efeitos do desempenho econômico sobre o crime
violento em países em desenvolvimento ou nas regiões de um único país em
desenvolvimento, podemos medir a variável dependente (violência ilegal)
observando cada comunidade por um curto período de tempo.
É claro que essas observações serão medidas relativamente ruins: corretas em
média, mas, em algumas comunidades, perderemos muitos crimes e
subestimaremos a violência média; em outras comunidades, veremos muito
crime e superestimaremos a violência média.
Suponha que nossa medição de nossa variável explicativa - o estado de

a economia - é a porcentagem de desempregados na comunidade e nós a
medimos muito bem (talvez a partir de bons dados do governo). Se estudássemos
o efeito da economia conforme indicado pelo percentual de desempregados sobre
a quantidade média de crimes violentos, esperaríamos resultados muito incertos
– resultados que também são instáveis em várias aplicações – exatamente
porque a variável dependente foi medida imperfeitamente, embora a técnica de
medição estava correta em média. Nossa consciência de que essa era a fonte do
problema, combinada com a crença contínua de que deveria haver uma forte
relação, fornece uma boa justificativa para um novo estudo no qual podemos
observar o crime comunitário em mais locais ou por períodos de tempo mais
longos. Mais uma vez, vemos que erros de medição e poucas observações levam
a problemas semelhantes. Poderíamos melhorar a eficiência aumentando a
precisão de nossas observações (talvez usando bons registros policiais e, assim,
reduzindo o erro de medição) ou aumentando o número de observações medidas
imperfeitamente em diferentes comunidades. Em ambos os casos, a solução é
aumentar a quantidade de informações que trazemos para esse problema de
inferência. Este é outro exemplo de por que a quantidade de informação que
trazemos para lidar com um problema é mais importante do que o número bruto
de observações que temos (o número de observações sendo nossa medida de
informação).
Para mostrar por que esse é o caso, usamos uma versão simplificada desse
exemplo primeiro em uma apresentação gráfica e depois oferecemos uma prova
mais formal. Na figura 5.1, o eixo horizontal representa o desemprego. Imaginamos
que as duas categorias (“4 por cento” e “7 por cento”) são perfeitamente medidas.
O eixo vertical é uma medida de crimes violentos.
Na figura 5.1, os dois círculos sólidos podem ser vistos como um exemplo de
estudo simples sem erro de medição em nenhuma das variáveis. Podemos
imaginar que temos um grande número de observações, todas caindo exatamente
nos dois pontos sólidos, de modo que conhecemos muito bem a posição de cada
ponto. Alternativamente, podemos imaginar que temos apenas duas observações,
mas elas têm muito poucos erros não sistemáticos de qualquer tipo. É claro que
nenhum desses casos provavelmente ocorrerá na realidade, mas esse modelo
destaca os problemas essenciais de erro de medição em uma variável
dependente para o caso mais geral e complicado. Observe como a linha sólida
se ajusta a esses dois pontos.
Agora imagine outro estudo em que crimes violentos foram medidos com erro
não sistemático. Para enfatizar que essas medidas estão corretas em média,
plotamos os quatro círculos abertos, cada um simetricamente acima e abaixo dos
círculos sólidos originais.3 Uma nova linha ajustada a todos os seis dados 3
Imaginamos novamente que os círculos abertos são um grande número de
observações que caiam exatamente nesses quatro pontos ou que haja pouca
variabilidade estocástica.
Figura 5.1 Erro de Medição na Variável Dependente
pontos é exatamente a mesma linha originalmente traçada. Observe novamente que esta
linha é desenhada minimizando os erros de previsão, os desvios verticais da linha.
No entanto, a nova linha é mais incerta em vários aspectos. Por exemplo, uma linha
com uma inclinação moderadamente mais íngreme ou mais plana se encaixaria nesses
pontos quase tão bem. Além disso, a posição vertical da linha também é mais incerta e a
própria linha fornece previsões piores de onde os pontos de dados individuais devem estar.
O resultado é que o erro de medição na variável dependente produz estimativas mais
ineficientes. Mesmo que ainda sejam imparciais - isto é, em média em vários estudos
semelhantes - eles podem estar longe em qualquer estudo.
Uma análise formal do erro de medição em y. Considere um modelo linear simples

com uma variável dependente medida com erro e uma variável explicativa sem erro.
Estamos interessados em estimar o parâmetro de efeito b:
E(Y*) = bX
Também especificamos uma segunda característica das variáveis aleatórias, a variável

ance:
V(Yi *) = s2
que assumimos ser o mesmo para todas as unidades i = 1, . . . , 4 n.
Embora essas equações definam nosso modelo, infelizmente não observamos

Y*, mas sim Y, onde
Y = Y* + U
Ou seja, a variável dependente observada Y é igual à variável dependente

verdadeira Y* mais algum erro de medição aleatório U. Para formalizar a ideia
de que U contém apenas erros de medição não sistemáticos , exigimos que o
erro seja cancelado em média nas replicações hipotéticas, E(U) = 0, e que não
está correlacionada com a verdadeira variável dependente, C(U,Y*) = 0, e com a
variável explanatória, C(U,X) = 0,5 Além disso, assumimos que o erro de
medição tem variância V(Ui) = t2 para toda e qualquer unidade i. Se t2 for zero,
Y não contém erro de medição e é igual a Y*; quanto maior essa variância, mais
erro nossa medida Y contém.
Como o erro de medição aleatório na variável dependente afeta as estimativas

de b? Para ver, usamos nosso estimador usual, mas com Y em vez de Y*:
n
i=1YiXi
b = _________
n
2
i=1Xi
e então calcule a média entre as replicações hipotéticas: ÿ n i=1XiYi
_________ÿ
E(b) = Eÿ n
2
ÿ i=1Xi ÿÿ
n
i=1XiE(Yi)
= ___________
n
2
i=1Xi
n
i=1XiE(Yi + U)
= _______________
n
2
i=1Xi
4 Os leitores estatísticos reconhecerão isso como propriedade da homoscedasticidade, ou

variância constante.
5 Essas suposições de erro implicam que o valor esperado do dependente observado
variável é o mesmo que o valor esperado da variável dependente verdadeira:
E(Y) = E(Y* + U) = E(Y*) + E(U) = E(Y*) = bX
n
i=1Xi 2b
= _________
n
2
i=1Xi
=b
Essa análise demonstra que mesmo com erro de medida na variável

dependente, o estimador padrão será imparcial (igual a b na média), assim
como mostramos para uma variável dependente sem erro de medida na
equação (3.8).
No entanto, para completar esta análise, devemos avaliar a eficiência do
nosso estimador na presença de uma variável dependente medida com erro.
Usamos o procedimento usual:
ÿn
_________ÿ
i=1XiYi
V(b) = Vÿ n (5.1)
ÿ 2 ÿÿ
i=1Xi
n
1
= __________Xi 2V(Yi * + U)
2
i=1
(n i=1Xi 2)
s2 + t2
= ________
n
2
i=1Xi
Observe que esse estimador é menos eficiente que o mesmo estimador

aplicado a dados sem erro de medida na variável dependente (compare
equação [3.9]) pelo valor do erro de medida na variável dependente t2.
5.1.2.2 ERRO DE MEDIÇÃO NÃO SISTEMATICA EM UM
VARIÁVEL EXPLICATIVA
Como apontamos acima, o erro não sistemático na variável explicativa tem as

mesmas consequências para estimativas do valor dessa variável - para inferências
descritivas - como para estimativas do valor da variável dependente: as medidas
às vezes serão muito altas, às vezes muito baixo, mas na média eles estarão
certos. Assim como o erro não sistemático na variável dependente, o erro aleatório
na variável explanatória também pode tornar as estimativas de efeitos causais
incertas e ineficientes. Mas o erro aleatório na variável explicativa tem outra
consequência, bem diferente do caso em que o erro aleatório está na variável
dependente. Quando é o explicativo

variável que é medida com erro aleatório, há um viés sistemático nas
estimativas da relação causal, um viés na direção de zero ou nenhuma
relação. Em outras palavras, quando há uma conexão causal verdadeira
entre uma variável explicativa e uma variável dependente, o erro aleatório
na primeira pode servir para mascarar esse fato ao deprimir a relação. Se
fôssemos testar nossa hipótese em vários conjuntos de dados, encontraríamos
não apenas uma grande variação nos resultados, como com erro aleatório
na variável dependente, mas também encontraríamos um viés sistemático
entre os vários conjuntos de dados em direção a uma relação mais fraca do
que é de fato o caso.
Assim como com o erro de medição na variável dependente, mesmo que
reconheçamos a presença de erro de medição nas variáveis explicativas,
uma análise mais cuidadosa das variáveis medidas com erro não amenizará
as consequências desse erro de medição, a menos que sigamos o conselho
dado aqui . Medições melhores certamente melhorariam a situação.
Considere novamente nosso estudo sobre os efeitos do desemprego

sobre o crime em várias comunidades de um país subdesenvolvido. No
entanto, suponha que a situação dos dados seja oposta à mencionada
acima: no país que estamos estudando, os relatórios criminais são precisos
e fáceis de obter nos escritórios do governo, mas o desemprego é uma
questão política e, portanto, não é mensurável com precisão. Como
pesquisas sistemáticas por amostragem não são permitidas, decidimos
medir o desemprego por observação direta (exatamente como em nosso
exemplo anterior, em que medimos o crime por observação direta). Inferimos
a taxa de desemprego a partir do número de pessoas que permanecem
ociosas no centro de várias aldeias enquanto passamos por elas. Como a
hora e o dia em que observamos as aldeias variam, assim como o clima,
teríamos muitos erros aleatórios em nossas estimativas do grau de
desemprego. Em um grande número de aldeias, nossas estimativas não
seriam sistematicamente altas ou baixas. Uma estimativa baseada em
qualquer par de aldeias seria bastante ineficiente: qualquer par poderia ser
baseado em observações no domingo (quando muitas pessoas podem ficar
do lado de fora) ou em um dia chuvoso (quando poucas o fariam). Mas
muitas observações de pares de aldeias em momentos diferentes em dias
diferentes, com chuva ou sol, produziriam, em média, estimativas corretas
do efeito. No entanto, conforme indicado acima, a consequência será muito
diferente da consequência de erro semelhante em nossa medida da variável dependente, crime violento.
A Figura 5.2 ilustra esta situação. Os dois pontos sólidos representam um
estudo sem erro de medição em nenhuma das variáveis.6 A inclinação do
6 Também continuamos assumindo que cada ponto representa dados com quase
nenhuma variação estocástica ou numerosos pontos que caem no mesmo lugar. Assim
como na seção 5.1, o propósito dessa suposição é manter o foco no problema.
Figura 5.2 Erro de Medida na Variável Explicativa
linha sólida é então a estimativa correta do efeito causal do desemprego

sobre o crime. Para mostrar as consequências do erro de medição,
adicionamos dois pontos adicionais (círculos abertos) à direita e à
esquerda de cada um dos pontos sólidos, para representar o erro de
medição na variável explicativa que é correto em média (ou seja, igual
ao ponto preenchido em média). A linha tracejada é ajustada aos círculos
abertos, e a diferença entre as duas linhas é o viés devido ao erro de
medição aleatório na variável explicativa. Ressaltamos novamente que
as retas são traçadas de forma a minimizar os erros de previsão da
variável dependente (os erros aparecem na figura como desvios verticais
da reta a ser ajustada), dado cada valor das variáveis explicativas.
Assim, o efeito estimado do desemprego, feito aqui com considerável
erro de medição aleatória, será muito menor (já que a linha tracejada é
mais achatada) do que o efeito real. Poderíamos inferir do nosso
conhecimento da existência de erro de medida na variável explicativa
que o verdadeiro efeito do desemprego sobre a criminalidade é maior do
que a correlação observada encontrada neste projeto de pesquisa.
A análise das consequências do erro de medição em uma variável
explicativa leva a duas orientações práticas:
1. Se uma análise sugere nenhum efeito para começar, então o verdadeiro
efeito é difícil de determinar, pois a direção do viés é desconhecida; a
análise será então largamente indeterminada e deve ser descrita como tal. A verdade

efeito pode ser zero, negativo ou positivo, e nada nos dados fornecerá
uma indicação de qual é.
2. No entanto, se uma análise sugere que a variável explicativa com erro de medição
aleatório tem um pequeno efeito positivo, devemos usar os resultados desta seção
como justificativa para concluir que o verdadeiro efeito é provavelmente ainda maior
do que encontramos. Da mesma forma, se encontrarmos um pequeno efeito
negativo, os resultados desta seção podem ser usados como evidência de que o
verdadeiro efeito é provavelmente uma relação negativa ainda maior.
Como o erro de medição é uma característica fundamental de toda pesquisa

qualitativa, essas diretrizes devem ser amplamente aplicáveis.
Devemos qualificar essas conclusões de alguma forma para que os
pesquisadores saibam exatamente quando elas se aplicam e quando não se
aplicam. Em primeiro lugar, a análise da caixa abaixo, na qual se baseia o nosso
conselho, aplica-se a modelos com apenas uma única variável explicativa.
Resultados semelhantes se aplicam a muitas situações com múltiplas variáveis
explicativas, mas não a todas. A análise se aplica da mesma forma se um
pesquisador tiver muitas variáveis explicativas, mas apenas uma com erro de
medição aleatório substancial. No entanto, se alguém tiver múltiplas variáveis
explicativas e estiver analisando simultaneamente seus efeitos, e se cada uma
tiver diferentes tipos de erro de medição, só podemos determinar os tipos de
vieses que provavelmente surgirão estendendo a análise formal abaixo.
Acontece que, embora os pesquisadores qualitativos geralmente tenham muitas
variáveis explicativas, eles estudam com mais frequência o efeito de cada
variável sequencialmente, em vez de simultaneamente. Infelizmente, como
descrevemos na seção 5.2, esse procedimento pode causar outros problemas,
como viés de variável omitida, mas significa que resultados semelhantes aos
aqui analisados se aplicam amplamente em pesquisas qualitativas.
Uma análise formal do erro de medição aleatória em X. Primeiro, definimos

um modelo da seguinte forma:
E(Y) = bX*
onde não observamos a verdadeira variável explicativa X*, mas em vez disso
observamos X onde
X = X* + U
e o erro de medição aleatório U tem propriedades semelhantes às anteriores:

é zero em média, E(U) = 0 e não está correlacionado com a verdadeira
variável explicativa, C(U,X*) = 0, e com a variável dependente , C(U,Y) = 0.
O que acontece quando usamos o estimador padrão para b com o X cheio de erros, em
vez do X* não observado? Essa situação corresponde à usual na pesquisa qualitativa, na
qual temos erros de medição, mas não fazemos nenhum ajuste especial para os resultados
que se seguem. Para analisar as consequências desse procedimento, avaliamos o viés,
que será a principal consequência desse tipo de problema de medição. Assim, começamos
com o estimador padrão na equação (3.7) aplicado aos X e Y observados para o modelo
acima.
n
i=1XiYi
b = _________ (5.2)
n
2
i=1Xi
n
i=1 (Xi * + Ui)Yi
= _______________
n
i=1 (Xi * + Ui)2
n
i=1Xi *Yi + (n i=1UiYi)
= ________________________________
n
2
i=1Xi*2 +n i=1Ui + (2n i=1Xi *Ui)
Deve ficar claro que b será tendencioso, E(b) ÿ b. Além disso, os dois termos entre
parênteses na última linha da equação (5.2) serão zero em média porque assumimos que
U e Y, e U e X*, não são correlacionados (ou seja, C(Ui,Yi) = E( Ui,Yi) = 0). Esta equação,
portanto, reduz-se a aproximadamente 7
n
i=1Xi *Yi
b ÿ _________________
n
2
i=1Xi*2 +n i=1Ui
Esta equação para o estimador de b no modelo acima é a mesma que a padrão, exceto
pelo termo extra no denominador, (compare a equação [3.7]). Este termo representa a
n 2
i=1Ui quantidade de erro de medição em X, a variância amostral do erro U. Na
ausência de erro de medição, este termo é zero, e a equação se reduz ao estimador
padrão na equação (3.7), pois teríamos realmente observaram os verdadeiros valores da
variável explicativa.
n
No caso geral com algum erro de medição, 2 é uma soma i=1Ui de termos
e, quadrados
portanto, será sempre positivo. Como esse termo é adicionado ao denominador, b se
aproximará de zero. Se a estimativa correta
7 Como essa equação é válida apenas em grandes amostras, estamos realmente analisando a
consistência em vez da imparcialidade (seção 2.7.1). Mais precisamente, os termos entre parênteses
na equação (5.2), quando divididos por n, desaparecem quando n se aproxima do infinito.

Se o motor produzisse um grande número positivo, o erro de medição
aleatório na variável explicativa faria o pesquisador pensar incorretamente que
b era positivo, mas menor. Se a estimativa baseada em X* fosse um grande
número negativo, um pesquisador analisando dados com erro de medição
aleatório pensaria que a estimativa era um número negativo menor.
Seria direto usar essa análise formal para mostrar que o erro de medição
aleatório nas variáveis explanatórias também causa ineficiências, mas o viés
geralmente é um problema mais sério, e vamos lidar com isso primeiro.
5.2 EXCLUINDO VARIÁVEIS RELEVANTES: VIÉS
A maioria dos cientistas sociais qualitativos aprecia a importância de controlar

os possíveis efeitos espúrios de outras variáveis ao estimar o efeito de uma
variável sobre outra. Formas de efetuar esse controle incluem, entre outros, os
métodos de diferença e similaridade de John Stuart Mill (1843) (que, ironicamente,
são referidos por Przeworski e Teune (1982) como projetos de sistemas mais
semelhantes e mais diferentes, respectivamente), métodos de Verba (1967)
“comparações de casos disciplinados-configurativos” (que são semelhantes às
“comparações focadas na estrutura” de George [1982]) e diversas maneiras de
usar suposições ceteris paribus e contrafactuais semelhantes. Essas frases são
frequentemente invocadas, mas os pesquisadores muitas vezes têm dificuldade
em aplicá-las de forma eficaz. Infelizmente, os pesquisadores qualitativos têm
poucas ferramentas para expressar as consequências precisas de não levar em
conta variáveis adicionais em situações particulares de pesquisa: isto é, de “viés
de variável omitida”. Fornecemos essas ferramentas nesta seção.
Começamos nossa discussão dessa questão com uma análise verbal das
consequências do viés de variável omitida e seguimos com uma análise formal
desse problema. Em seguida, nos voltaremos para questões mais amplas de
projeto de pesquisa levantadas pelo viés de variável omitida.
5.2.1 Medindo o viés de variáveis omitidas
Suponha que desejamos estimar o efeito causal de nossa variável explanatória

X1 em nossa variável dependente Y. Se estivermos realizando uma análise
quantitativa, denotamos esse efeito causal de X1 em Y como b1. Uma maneira
de estimar b1 é executando uma equação de regressão ou outra forma de
análise, que produz uma estimativa de b1 de b1. Se estivermos realizando uma
pesquisa qualitativa, também procuraremos fazer essa estimativa do
Excluindo Variáveis Relevantes · 169

efeito causal; no entanto, essa estimativa dependerá do argumento verbal
e da avaliação do investigador, com base na experiência e no julgamento.
Suponha que, depois de fazermos essas estimativas (quantitativa ou
qualitativamente), um colega dê uma olhada em nossa análise e objete
que omitimos uma importante variável de controle, X2. Estimamos o efeito
dos gastos de campanha sobre a proporção de votos recebidos por um
candidato ao Congresso. Nosso colega conjectura que nossa descoberta
é espúria devido ao “viés de variável omitida”. Ou seja, ela sugere que
nossa estimativa b1 de b1 está incorreta, pois não levamos em consideração
outra variável explicativa X2 (como uma medida de se o candidato é ou
não um titular). O verdadeiro modelo deve presumivelmente controlar o
efeito da nova variável.
Como devemos avaliar sua afirmação? Em particular, em que condições
nossa omissão da variável que mede a incumbência afetaria nossa
estimativa do efeito dos gastos com votos e em que condições ela não
teria efeito? Claramente, a omissão de um termo que meça a incumbência
não importará se a incumbência não tiver efeito sobre a variável
dependente; ou seja, se X2 for irrelevante, porque não tem efeito sobre Y,
não causará viés. Este é o primeiro caso especial: variáveis omitidas
irrelevantes não causam viés. Assim, se a incumbência não tivesse
consequências eleitorais, poderíamos ignorar o fato de que ela foi omitida.
O segundo caso especial, que também não produz viés, ocorre quando
a variável omitida não está correlacionada com a variável explicativa
incluída. Assim, também não há viés se o status do cargo não estiver
correlacionado com nossa variável explicativa, gastos de campanha.
Intuitivamente, quando uma variável omitida não está correlacionada com
a variável explicativa principal de interesse, controlá-la não mudaria nossa
estimativa do efeito causal de nossa variável principal, pois controlamos a
parte da variação que as duas variáveis têm em comum, caso existam.
Assim, podemos omitir com segurança variáveis de controle, mesmo que
tenham forte influência sobre a variável dependente, desde que não
variem com a variável explicativa incluída. 8
8 Observe a diferença entre os dois casos em que a omissão de uma variável é aceitável.
No primeiro caso, em que a variável omitida não está relacionada à variável dependente,
não há viés e não perdemos o poder de prever os valores futuros da variável dependente.
No último caso, em que a variável omitida não está relacionada à variável independente,
mas relacionada à variável dependente, não temos viés em nossa estimativa do
relacionamento da variável explicativa incluída e da variável dependente, mas perdemos
alguma precisão na previsão. valores futuros da variável dependente. Assim, se a
incumbência não estivesse relacionada aos gastos de campanha, omiti-la não prejudicaria
nossa estimativa da relação entre gastos de campanha e votos. Mas se nosso objetivo
fosse a previsão, gostaríamos de mapear toda a variação sistemática na variável
dependente, e omitir a incumbência impediria isso, pois estamos deixando de fora uma
importante variável causal. No entanto, mesmo que nosso objetivo de longo prazo fosse a explicação sistemática mais completa do
Se esses casos especiais não valem para alguma variável omitida (ou seja,
essa variável está correlacionada com a variável explanatória incluída e tem um
efeito sobre a variável dependente), então a falha em controlá-la irá enviesar
nossa estimativa (ou percepção) do efeito da variável incluída.
No caso em questão, nossa colega estaria certa em sua crítica, pois a
incumbência está relacionada tanto à variável dependente quanto à variável
independente: os titulares obtêm mais votos e gastam mais.
Esse insight pode ser colocado em termos formais, concentrando-se na
última linha da equação (5.5) do quadro abaixo:
E(b1) = b1 + Fb2 (5.3)
Esta é a equação utilizada para calcular o viés na estimativa do efeito de X1

sobre a variável dependente Y. Nesta equação, F representa o grau de
correlação entre as duas variáveis explicativas X1 e X2. 9 Se o estimador
calculado usando apenas X1 como variável explicativa (ou seja, b1) fosse
imparcial, seria igual a b1 em média; ou seja, seria verdade que E(b1) = b1.
Este estimador é imparcial nos dois casos especiais em que o termo de viés
Fb2 é igual a zero. É fácil ver que isso formaliza as condições de imparcialidade
que afirmamos acima.
Ou seja, podemos omitir uma variável de controle se
• A variável omitida não tem efeito causal sobre a variável dependente (ou seja,
b2 = 0, independentemente da natureza da relação entre as variáveis incluídas
e excluídas F); ou
• A variável omitida não está correlacionada com a variável incluída (ou seja, F =
0, independentemente do valor de b2.)
Se descobrirmos uma variável omitida que suspeitamos estar influenciando

nossos resultados, nossa análise não deve terminar aqui. Se possível, devemos
controlar a variável omitida. E mesmo que não possamos, porque não temos
uma boa fonte de dados sobre a variável omitida, nosso modelo pode nos
ajudar a determinar a direção do viés, o que pode ser extremamente útil.
Subestimar ou superestimar pode reforçar ou enfraquecer substancialmente um
argumento existente.
Por exemplo, suponha que estudemos alguns estados da África subsaariana
e descubramos que os golpes de estado aparecem com mais frequência em
regimes politicamente repressivos – que b1 ( o efeito da repressão na
probabilidade de um golpe) é positivo. Ou seja, a variável explicativa é o grau de po
voto, pode ser difícil ter muita confiança em vários efeitos causais dentro da estrutura de um único
estudo. Assim, pode valer a pena focar em um efeito causal (ou apenas em alguns), qualquer que
seja nosso objetivo de longo prazo.
9 Mais precisamente, F é a estimativa do coeficiente produzida quando X1 é regredido em X2.

repressão política, e a variável dependente é a probabilidade de golpe. A
unidade de análise são os países da África subsaariana. Podemos até expandir
a amostra para outros estados africanos e chegar à mesma conclusão. No
entanto, suponha que não consideramos os possíveis efeitos das condições
econômicas sobre os golpes. Embora possamos não ter dados sobre as
condições econômicas, é razoável supor que o desemprego provavelmente
aumentaria a probabilidade de um golpe de estado (b2 > 0), e também parece
provável que o desemprego esteja positivamente correlacionado com a
repressão política (F > 0). Também assumimos, para fins desta ilustração, que
as condições econômicas são anteriores à nossa principal variável causal, o
grau de repressão política. Se for esse o caso, o grau de viés em nossa análise
pode ser grave. Como o desemprego tem uma correlação positiva tanto com a
variável dependente quanto com a variável explicativa (Fb2 > 0 neste caso),
excluir essa variável significaria que estivéssemos inadvertidamente estimando
o efeito da repressão e do desemprego sobre a probabilidade de golpe em vez
de apenas repressão (b1 + Fb2 em vez de b1). Além disso, como o impacto
conjunto da repressão e do desemprego é maior do que o efeito da repressão
isoladamente (b1 + Fb2 é maior que b1), a estimativa do efeito da repressão
(b1) será, em média, muito grande. Portanto, essa análise mostra que, ao
excluir os efeitos do desemprego, superestimamos os efeitos da repressão
política. (Isso é diferente das consequências do erro de medição nas variáveis
explanatórias, pois o viés da variável omitida pode, às vezes, fazer com que
uma relação negativa seja estimada como positiva.)
A omissão de variáveis relevantes nem sempre resulta em superestimativas

dos efeitos causais. Por exemplo, poderíamos razoavelmente supor que em
alguns outros países (talvez objeto de um novo estudo), a repressão política e
o desemprego estivessem inversamente relacionados (que F é negativo).
Nesses países, a repressão política pode permitir que o governo controle as
facções em guerra, imponha a paz de cima e coloque a maioria das pessoas
para trabalhar. Isso, por sua vez, significa que o efeito do viés introduzido pela
relação negativa entre desemprego e repressão (Fb2) também será negativo,
desde que estejamos dispostos a supor que mais desemprego aumentará a
probabilidade de golpe nesses países. A consequência substantiva é que o
efeito estimado da repressão sobre a probabilidade de golpe (E(b1)) será agora
menor do que o efeito real (b1). Assim, se as condições econômicas forem
excluídas, b1 geralmente será uma subestimação do efeito da repressão
política. Se F for suficientemente negativo e b2 for suficientemente grande,
então podemos estimar rotineiramente que um b1 positivo seja negativo e
concluir incorretamente que mais repressão política diminui a probabilidade de
um golpe de estado! Mesmo que tivéssemos informações insuficientes sobre
as taxas de desemprego

para incluí-lo no estudo original, uma análise como essa ainda pode nos ajudar
a gerar conclusões substantivas razoáveis.
Como esses exemplos devem deixar claro, não precisamos realmente
executar uma regressão para estimar parâmetros, para avaliar os graus e
direções de viés ou para chegar a tais conclusões. As estimativas qualitativas
e intuitivas estão sujeitas aos mesmos tipos de vieses que as estritamente
quantitativas. Esta seção mostra que, em ambas as situações, informações fora
dos dados existentes podem ajudar substancialmente a estimar o grau e a
direção do viés.
Se sabemos que nosso projeto de pesquisa pode sofrer de variáveis
omitidas, mas não sabemos quais são essas variáveis, então podemos muito
bem ter conclusões falhas (e é provável que algum futuro pesquisador as
encontre). Os incentivos para saber mais são óbvios. Felizmente, na maioria
dos casos, os pesquisadores possuem informações consideráveis sobre as
variáveis fora de sua análise. Às vezes, essas informações são detalhadas, mas
disponíveis apenas para algumas subunidades, ou parciais, mas amplamente
aplicáveis, ou mesmo de pesquisas anteriores. Qualquer que seja a fonte,
mesmo informações completas podem ajudar a focar no provável grau e
direção do viés em nossos efeitos causais.
Claro, mesmo os estudiosos que entendem as consequências do viés de
variável omitida podem encontrar dificuldades em identificar variáveis que
podem ser omitidas de sua análise. Nenhuma fórmula pode ser fornecida para
lidar com esse problema, mas aconselhamos que todos os pesquisadores,
quantitativos e qualitativos, procurem sistematicamente as variáveis de controle
omitidas e considerem se elas devem ser incluídas na análise.
Sugerimos algumas diretrizes para tal revisão nesta seção.
As variáveis omitidas podem causar dificuldades mesmo quando temos
informações adequadas sobre todas as variáveis relevantes. Os estudiosos às
vezes têm essas informações e, acreditando que as diversas variáveis estão
positivamente relacionadas à variável dependente, estimam os efeitos causais
dessas variáveis sequencialmente, em análises “bivariadas” separadas. É
particularmente tentador usar essa abordagem em estudos com um pequeno
número de observações, uma vez que incluir muitas variáveis explicativas
simultaneamente cria estimativas muito imprecisas ou mesmo um desenho de
pesquisa indeterminado, conforme discutido na seção 4.1. Infelizmente, porém,
cada análise exclui as outras variáveis relevantes, e essa omissão leva a um
viés de variável omitida em cada estimativa. A solução ideal não é meramente
coletar informações sobre todas as variáveis relevantes, mas explicitamente e
simultaneamente controlar todas as variáveis relevantes. O pesquisador
qualitativo deve reconhecer que deixar de levar em consideração todas as
variáveis relevantes ao mesmo tempo leva a inferências tendenciosas. O
reconhecimento das fontes de viés é valioso, mesmo que um pequeno número
de observações torne impossível removê-las.

A preocupação com o viés da variável omitida, no entanto, não deve nos
levar a incluir automaticamente todas as variáveis cuja omissão pode causar
viés porque está correlacionada com a variável independente e tem efeito
sobre a variável dependente. Em geral, não devemos controlar uma variável
explicativa que seja, em parte, uma consequência de nossa variável causal chave.
Considere o seguinte exemplo. Suponha que estejamos interessados no
efeito causal de $ 10.000 adicionais na renda (nossa variável de tratamento)
sobre a probabilidade de um cidadão votar no candidato democrata (nossa
variável dependente). Devemos controlar se esse cidadão relata que planeja
votar nos democratas em uma entrevista cinco minutos antes de chegar às
urnas? Essa variável de controle certamente afeta a variável dependente e
provavelmente está correlacionada com a variável explicativa. Intuitivamente,
a resposta é não. Se o controlássemos, o efeito estimado da renda em votar
nos democratas seria quase inteiramente atribuído à variável de controle, que
neste caso dificilmente é uma explicação causal alternativa. Uma aplicação
cega das regras de viés da variável omitida, acima, pode levar incorretamente
ao controle dessa variável. Afinal, essa possível variável de controle certamente
tem efeito sobre a variável dependente – voto democrata – e está correlacionada
com a variável explicativa chave – renda. Mas incluir essa variável atribuiria
parte do efeito causal de nossa variável explicativa chave à variável de controle.
Para dar outro exemplo, suponha que estejamos interessados no efeito

causal de um forte aumento nos preços do petróleo na opinião pública sobre a
existência de uma escassez de energia. Poderíamos obter medidas dos preços
do petróleo (nossa principal variável causal) de jornais e usar pesquisas de
opinião como nossa variável dependente para avaliar a percepção do público
sobre se há escassez de energia. Mas podemos perguntar se devemos
controlar os efeitos da cobertura televisiva dos problemas energéticos.
Certamente a cobertura televisiva dos problemas energéticos está
correlacionada tanto com a variável explicativa incluída (preços do petróleo
bruto) quanto com a variável dependente (opinião pública sobre a escassez
de energia). No entanto, uma vez que a cobertura televisiva é em parte
consequência dos preços do petróleo no mundo real, não devemos controlar
essa cobertura ao avaliar a influência causal dos preços do petróleo na opinião
pública sobre uma era de escassez de energia. Se, em vez disso, estivéssemos
interessados no efeito causal da cobertura televisiva, controlaríamos os preços
do petróleo, uma vez que esses preços vêm antes da variável explicativa chave (que agora é a cobertura).10
10 Vale a pena considerar exatamente o que significa examinar o efeito causal estimado
dos preços do petróleo bruto na opinião pública sobre a escassez de energia, enquanto se
controla a quantidade de cobertura televisiva sobre a escassez de energia. Considere duas
descrições, ambas importantes porque nos permitem analisar e estudar os processos causais
em maior profundidade. Primeiro, esse efeito estimado é apenas o efeito desse aspecto do óleo

Assim, para estimar o efeito total de uma variável explicativa, devemos
listar todas as variáveis que, de acordo com nosso modelo teórico, poderiam
causar a variável dependente. Para repetir o ponto feito acima: em geral,
não devemos controlar uma variável explicativa que seja em parte uma
consequência de nossa variável explicativa chave. Tendo eliminado essas
possíveis variáveis explicativas, devemos então controlar outras possíveis
variáveis explicativas que, de outra forma, causariam viés de variável omitida
- aquelas que estão correlacionadas tanto com a variável dependente
quanto com as variáveis explicativas incluídas.11 O
argumento de que não devemos controlar para variáveis explicativas que
são consequências de nossas principais variáveis explicativas tem uma
implicação muito importante para o papel da teoria no projeto de pesquisa.
Pensando sobre essa questão, podemos ver por que devemos começar ou
pelo menos trabalhar em direção a um modelo teoricamente motivado em
vez de “mineração de dados”: executando regressões ou análises qualitativas
com quaisquer variáveis explicativas que possamos imaginar. Sem um
modelo teórico, não podemos decidir quais potenciais variáveis explicativas
devem ser incluídas em nossa análise. De fato, na ausência de um modelo,
podemos obter os resultados mais fortes usando uma variável explicativa
trivial – como a intenção de votar nos democratas cinco minutos antes de
entrar no local de votação – e controlando todos os outros fatores
correlacionados a ela. Não podemos determinar se devemos controlar ou
ignorar possíveis variáveis explicativas que estão correlacionadas umas
com as outras sem um modelo teoricamente motivado, sem o qual corremos
sérios perigos de viés de variável omitida ou trivialidade no projeto de pesquisa.
Escolher quando adicionar variáveis explicativas adicionais à nossa
análise não é nada simples. O número de variáveis adicionais é sempre
ilimitado, nossos recursos são limitados e, sobretudo, quanto mais
preços que afetam diretamente a opinião pública sobre a escassez de energia, além do aspecto
do efeito causal que afeta indiretamente a opinião pública com a mudança da cobertura
televisiva. Ou seja, é o efeito direto e não indireto do petróleo na opinião. O efeito total pode ser
encontrado não controlando a extensão da cobertura televisiva da escassez de energia. Uma
descrição alternativa desse efeito é o efeito dos preços da energia na variável “opinião pública
sobre a escassez de energia, dado um grau fixo de cobertura televisiva sobre a escassez de
energia”. Como exemplo deste último, imagine o experimento em que controlamos a cobertura
da rede de televisão sobre a escassez de petróleo e a forçamos a permanecer no mesmo nível
enquanto os preços do petróleo bruto variavam naturalmente. Como a cobertura é uma constante
neste experimento, ela é controlada sem qualquer outro procedimento explícito. Mesmo que não
pudéssemos fazer um experimento, ainda poderíamos estimar esse efeito condicional dos
preços do petróleo na opinião pública sobre escassez de energia controlando a cobertura televisiva.
11 Além disso, podemos estar interessados apenas no efeito direto ou indireto de uma
variável, ou mesmo no efeito causal de alguma outra variável em uma equação. Nessa situação,
um procedimento perfeitamente razoável é executar várias análises diferentes nos mesmos
dados, desde que entendamos as diferenças de interpretação.

variáveis explicativas que incluímos, menos influência temos para estimar qualquer
um dos efeitos causais individuais. Evitar o viés de variável omitida é um motivo para
adicionar variáveis explicativas adicionais. Se as variáveis relevantes forem omitidas,
nossa capacidade de estimar inferências causais corretamente é limitada.
Uma análise formal do viés de variável omitida. Comecemos com um modelo

simples com duas variáveis explicativas
E(Y) = X1b1 + X2b2 (5.4)
Suponha agora que chegamos a uma análise importante que relata o efeito de X1
sobre Y sem controlar X2. Em que circunstâncias teríamos fundamento para criticar
este trabalho ou justificativa para buscar recursos para refazer o estudo? Para
responder a essa questão, avaliamos formalmente o estimador com a variável de
controle omitida.
O estimador de b1 onde omitimos X2 é
n
i=1X1iYi
b1 = _________
n
2
i=1X1i
Para avaliar esse estimador, tomamos a expectativa de b1 em replicações

hipotéticas sob o modelo na equação (5.4):
ÿn
_________ÿ i=1X1iYi
E(b1) = Eÿ n
(5.5)
ÿ 2
ÿ i=1X1i ÿ
n
i=1X1iE(Yi)
= ____________
n
i=1X1i2
n
i=1X1i(X1ib1 + X2ib2)
= _____________________ n
i=1X1i2
n
i=1X1i2 b1 +n i=1X1iX2ib2)
= ________________________
n
i=1X1i2
= b1 + Fb2

n
i=1X1iX2i
onde F = __________, o coeficiente de inclinação da regressão de
n 2
i=1X1i
X1 em X2. A última linha desta equação é reproduzida no texto na
equação (5.3) e é discutida com algum detalhe acima.
5.2.2 Exemplos de viés de variável

omitida Nesta seção, consideramos vários exemplos quantitativos e
qualitativos, alguns hipotéticos e outros de pesquisas reais. Por exemplo, o
nível educacional é um dos melhores preditores de participação política.
Aqueles que têm níveis mais altos de educação são mais propensos a votar
e a participar da política de várias outras maneiras. Suponha que
descobrimos que esse é o caso em um novo conjunto de dados, mas
queremos ir além e ver se a relação entre as duas variáveis é causal e, em
caso afirmativo, como a educação leva à participação.
A primeira coisa que poderíamos fazer seria verificar se existem variáveis
omitidas antecedentes à educação que estão correlacionadas com a
educação e ao mesmo tempo causam participação. Dois exemplos podem
ser o envolvimento político dos pais do indivíduo e a raça do indivíduo. Pais
ativos na política podem inculcar interesse em participação em seus filhos
e, ao mesmo tempo, ser o tipo de pais que promovem o sucesso educacional
de seus filhos. Se não incluíssemos essa variável, poderíamos ter uma
relação espúria entre educação e atividade política ou uma estimativa da
relação muito forte.
A raça pode desempenhar o mesmo papel. Em uma sociedade racialmente

discriminatória, os negros podem ser impedidos tanto de oportunidades
educacionais quanto de participação política. Nesse caso, o efeito aparente
da educação na participação não seria real. Idealmente, gostaríamos de
eliminar todas as possíveis variáveis omitidas que poderiam explicar parte
ou toda a relação entre educação e participação.
Mas o fato de que a relação entre educação e participação diminui ou
desaparece quando controlamos uma variável antecedente não significa
necessariamente que a educação seja irrelevante. Suponha que descobrimos
que o vínculo educação-participação diminuiu quando controlamos a raça.
Uma razão pode ser, como no exemplo acima, que a discriminação contra
os negros significava que a raça estava associada separadamente tanto
com o nível educacional quanto com a participação. Nessas condições, não
existiria nenhuma relação causal real entre educação e participação. Por
outro lado, a raça pode afetar a participação política

através da educação. A discriminação racial pode reduzir o acesso dos
negros à educação. A educação pode, por sua vez, ser o principal fator que
leva à participação. Nesse caso, a redução da relação entre educação e
participação que se introduz quando o pesquisador acrescenta raça à
análise não diminui a importância da educação. Em vez disso, explica como
raça e educação interagem para afetar a participação.
Observe que essas duas situações são fundamentalmente diferentes. Se

a menor participação dos negros se devia à falta de escolaridade,
poderíamos esperar que a participação aumentasse se aumentasse o nível
médio de escolaridade. Mas se o motivo da menor participação fosse a
discriminação política direta que impedia a participação dos negros como
cidadãos, a melhoria educacional seria irrelevante para as mudanças nos
padrões de participação.
Também podemos procurar por variáveis que são simultâneas com a
educação ou que a seguiram. Podemos procurar variáveis omitidas que
mostram que a relação entre educação e participação é espúria.
Ou podemos procurar variáveis que ajudem a explicar como a educação
funciona para promover a participação. Na primeira categoria pode estar
uma variável como o nível geral de inteligência do indivíduo (que pode levar
a um bom desempenho escolar e à atividade política). Na última categoria
podem estar variáveis que medem aspectos da educação, como a exposição
a cursos cívicos, oportunidades de participar do governo estudantil e
aprendizagem de habilidades básicas de comunicação. Se for descoberto
que um ou mais destes últimos, quando incluídos na análise, reduziram a
relação entre o nível educacional e a participação (quando controlamos as
habilidades de comunicação, não houve efeito independente do nível
educacional sobre a participação), esse achado não significaria que a
educação fosse irrelevante. As habilidades de comunicação necessárias
foram aprendidas na escola e haveria uma diferença nessas habilidades
entre os níveis educacionais. O que a análise nos diria seria como a
educação influenciava a participação.
Todos esses exemplos ilustram mais uma vez porque é necessário ter
um modelo teórico em mente para avaliar. Não há outra maneira de escolher
quais variáveis usar em nossa análise. Uma teoria de como a educação
afetou a atividade cívica nos guiaria para as variáveis a serem incluídas.
Embora não adicionemos variáveis adicionais a uma equação de regressão
na pesquisa qualitativa, a lógica é praticamente a mesma quando decidimos
quais outros fatores levar em conta. Considere a questão de pesquisa que
levantamos anteriormente: o impacto das reuniões de cúpula na cooperação
entre as superpotências. Suponha que descobrimos que a cooperação
entre os Estados Unidos e a URSS foi maior nos anos seguintes a uma cúpula

do que o anterior. Como saberíamos que o efeito é real e não o resultado
de alguma variável omitida? E se estivermos convencidos de que é real,
podemos explicar melhor como funciona?
Podemos querer considerar variáveis antecedentes que estariam
relacionadas à probabilidade de uma cúpula e também podem ser causas
diretas de cooperação. Talvez quando os líderes de cada país confiam uns
nos outros, eles se encontram com frequência e seus países cooperam. Ou
talvez quando as ambições geopolíticas de ambos os lados são limitadas
por razões políticas domésticas, eles agendam reuniões e cooperam. Em
tais circunstâncias, as próprias cúpulas não desempenhariam um papel
direto na promoção da cooperação, embora o agendamento de uma cúpula
pudesse ser um bom indicador de que as coisas estavam indo bem entre as superpotências.
Também é possível que as cúpulas façam parte de uma sequência causal,
assim como a raça pode ter afetado o nível educacional que, por sua vez,
afetou a participação. Quando os líderes das superpotências confiam uns
nos outros, eles convocam uma cúpula para reforçar essa confiança mútua.
Isso, por sua vez, leva à cooperação. Nesse caso, a cúpula está longe de
ser irrelevante. Sem ela, haveria menos cooperação. Confiança e cúpulas
interagem para criar cooperação. Suponha que levemos esses fatores em
consideração e descubramos que as cúpulas parecem desempenhar um
papel independente – ou seja, quando controlamos a confiança mútua
anterior dos líderes e suas ambições geopolíticas, a conclusão é que uma
cúpula parece levar a mais cooperação. Ainda podemos ir mais longe e
perguntar como isso acontece. Podemos comparar as cúpulas em termos
de características que podem torná-las mais ou menos bem-sucedidas e ver
se tais fatores estão relacionados ao grau de cooperação que se segue.
Mais uma vez, temos que selecionar fatores a serem considerados, e estes
podem incluir: o grau de preparação, se as questões eram econômicas e
não de segurança, o grau de harmonia doméstica em cada nação, o clima
no cume e a comida. A teoria teria de nos guiar; ou seja, precisaríamos de
uma visão de conceitos e relações que apontasse para variáveis explicativas
relevantes e propusesse hipóteses consistentes com a lógica e a experiência
sobre seus efeitos.
Para pesquisadores com um pequeno número de observações, o viés de
variável omitida é muito difícil de evitar. Nessa situação, a ineficiência é
muito cara; incluir muitas variáveis de controle irrelevantes pode tornar um
projeto de pesquisa indeterminado (seção 4.1). Mas a omissão de variáveis
de controle relevantes pode introduzir viés. E a priori o pesquisador pode
não saber se uma variável candidata é relevante ou não.
Podemos ser tentados neste ponto a concluir que a inferência causal é
impossível com um pequeno número de observações. A nosso ver, porém,
as lições a serem aprendidas são mais limitadas e mais otimistas.
Compreender a dificuldade de fazer inferências causais válidas com poucas observações

As descrições devem nos tornar cautelosos ao fazer afirmações causais.
Conforme indicado no capítulo 2, boas descrições e inferências descritivas são
mais valiosas do que inferências causais defeituosas. Muitas pesquisas
qualitativas seriam de fato melhoradas se houvesse mais atenção à inferência
descritiva válida e menos impulso para fazer afirmações causais com base em
evidências inadequadas com avaliações incorretas de sua incerteza. No
entanto, um progresso limitado na compreensão de questões causais é, no
entanto, possível, se as questões teóricas com as quais estamos preocupados
forem colocadas com clareza suficiente e ligadas a implicações observáveis
apropriadas. Um exemplo recente da pesquisa de relações internacionais pode
ajudar a esclarecer esse ponto.
O estudo de Helen Milner, Resisting Protectionism (1988), foi motivado por
um enigma: por que a política comercial dos Estados Unidos era mais
protecionista na década de 1920 do que na de 1970, apesar das inúmeras
semelhanças entre os dois períodos? Sua hipótese era que a interdependência
internacional aumentou entre as décadas de 1920 e 1970 e ajudou a explicar a
diferença no comportamento dos Estados Unidos. Nesse nível agregado de
análise, no entanto, ela tinha apenas as duas observações que motivaram seu
quebra-cabeça, o que não poderia ajudá-la a distinguir sua hipótese de muitas
outras explicações possíveis dessa variação observada. O nível de incerteza
em sua teoria teria sido, portanto, muito alto se ela parasse aqui. Por isso ela
teve que procurar em outro lugar implicações observáveis adicionais de sua
teoria.
A abordagem de Milner foi elaborar o processo pelo qual seu efeito causal foi
pensado para ocorrer. Ela levantou a hipótese de que a interdependência
econômica entre as democracias capitalistas afeta as preferências nacionais
ao influenciar as preferências das indústrias e empresas, que fazem lobby com
sucesso por suas políticas preferidas. Milner, portanto, estudou uma variedade
de indústrias americanas nas décadas de 1920 e 1970 e indústrias francesas
na década de 1970 e descobriu que aquelas com grandes investimentos
multinacionais e mais dependência de exportação eram as menos protecionistas.
Essas descobertas ajudaram a confirmar sua teoria mais ampla das diferenças
em toda a política dos EUA entre as décadas de 1920 e 1970. Seus
procedimentos foram, portanto, consistentes com uma parte fundamental de
nosso conselho metodológico: especificar as implicações observáveis da teoria,
mesmo que não sejam os objetos de preocupação principal, e projetar a
pesquisa de modo que inferências possam ser feitas sobre essas implicações e
usadas para avaliar a teoria. Portanto, o estudo de Milner é exemplar em muitos aspectos.
O problema mais sério de projeto de pesquisa que Milner enfrentou envolvia
potenciais variáveis omitidas. A variável de controle mais óbvia é o grau de
competição das importações, uma vez que uma competição mais intensa das
importações estrangeiras tende a produzir preferências firmes mais protecionistas.
Ou seja, é provável que a concorrência das importações esteja correlacionada com

A variável dependente de Milner é, na maioria dos casos, antecedente ou
simultânea com suas variáveis explicativas. Se esta variável de controle também
fosse correlacionada com suas principais variáveis explicativas causais,
investimento multinacional e dependência de exportação, seus resultados seriam
enviesados. De fato, uma correlação negativa entre a concorrência de importações
e a dependência de exportações teria parecido provável com base nos princípios
da vantagem comparativa, de modo que esse viés hipotético teria se tornado real
se a concorrência de importações não fosse incluída como um controle.
Milner lidou com esse problema selecionando para estudo apenas as indústrias
que foram severamente afetadas pela concorrência estrangeira. Portanto, ela
manteve constante a severidade da competição de importação e eliminou, ou pelo
menos reduziu bastante, esse problema de viés de variável omitida. Ela poderia
ter mantido essa variável-chave de controle constante em um nível diferente -
como apenas indústrias com níveis moderadamente altos de penetração de
importações - desde que fosse de fato constante para suas observações.
Tendo controlado a concorrência das importações, no entanto, Milner ainda
enfrentava outras questões de variáveis omitidas. Os dois principais candidatos
que ela considerou mais seriamente, com base em uma revisão da literatura
teórica e empírica em seu campo, foram (1) que as mudanças no poder dos EUA
seriam responsáveis pelas diferenças entre os resultados nas décadas de 1920 e
1970 e (2 ) que mudanças nos processos políticos domésticos dos Estados
Unidos fariam isso. Sua tentativa de controlar o primeiro fator foi construída em
seu projeto de pesquisa original: uma vez que a proporção do comércio mundial
envolvendo os Estados Unidos na década de 1970 era aproximadamente
semelhante ao seu envolvimento comercial na década de 1920, ela controlou
essa dimensão do poder americano em o nível agregado da política dos EUA,
bem como o nível da indústria e da empresa. No entanto, ela não controlou as
diferenças entre o isolacionismo político dos Estados Unidos na década de 1920
e sua posição hegemônica como líder da aliança na década de 1970; esses
fatores poderiam ser analisados mais a fundo para verificar seus efeitos
potencialmente tendenciosos.
Milner controlou os processos políticos domésticos comparando indústrias e
empresas nas décadas de 1920 e 1970, uma vez que todas as empresas desses
grupos enfrentavam as mesmas estruturas governamentais e processos políticos.
Seu estudo adicional de seis indústrias concorrentes de importações na França
durante a década de 1970 obviamente não a ajudou a manter constantes os
processos políticos domésticos, mas a ajudou a descobrir que o efeito causal da
dependência das exportações nas preferências por protecionismo não variava
com as mudanças na economia. processos políticos domésticos. Ao considerar
cuidadosamente várias fontes potenciais de viés de variável omitida e projetar
seu estudo de acordo, Milner reduziu bastante o potencial de viés.

No entanto, Milner não controlou explicitamente várias outras possíveis
variáveis omitidas. Seu estudo se concentrou “nas preferências comerciais
corporativas e não examina diretamente a influência da opinião pública,
ideologia, trabalho organizado, estrutura política doméstica ou outros fatores
possíveis” (1988: 15–16). Sua decisão de não controlar essas variáveis
poderia ter sido justificada com base teórica de que essas variáveis omitidas
não estão relacionadas ou são em parte conseqüências das principais
variáveis causais (dependência de exportação e investimento multinacional)
ou não têm efeito sobre o dependente. variável (preferências por
protecionismo ao nível da firma, agregadas às indústrias). No entanto, se
essas variáveis omitidas estivessem plausivelmente ligadas às suas
variáveis explicativas e dependentes e fossem causalmente anteriores à
sua variável explicativa, ela teria que projetar seu estudo explicitamente
para
controlá-las.12 Finalmente, o procedimento de Milner para selecionar
indústrias corria o risco de tornar suas inferências causais são ineficientes.
Como observamos, seu procedimento de seleção de caso permitiu que ela
controlasse a fonte potencial mais séria de viés de variável omitida,
mantendo constante a concorrência de importação, que, em termos teóricos,
esperava-se ser causalmente anterior e correlacionada com sua variável
causal chave e influenciar suas variáveis dependentes. Ela selecionou as
indústrias que tinham os níveis mais altos de competição de importação e
não estratificou por nenhuma outra variável. Ela então estudou as
preferências de cada indústria em sua amostra, e de muitas firmas, por
preferências de protecionismo (sua variável dependente) e pesquisou o
grau de dependência econômica internacional (sua variável explicativa).
Esse procedimento de seleção é ineficiente em relação às suas
inferências causais porque suas principais variáveis causais variaram menos
do que seria desejável (Milner 1988:39-42). Embora essa ineficiência não
tenha sido um problema grave em seu caso, significou que ela teve que
fazer mais estudos de caso do que o necessário para atingir o mesmo nível
de certeza sobre suas conclusões (consulte a seção 6.2). Dito de outra
forma, com o mesmo número de casos, escolhidos de forma que variassem
amplamente em sua variável explicativa, ela poderia ter produzido causalidade mais certa em
12 Milner aborda o potencial de viés de variável omitida, mas seu raciocínio é falho: “Ao olhar
para diferentes setores, em diferentes momentos e em diferentes países, [o desenho da
pesquisa] permite que essas [variáveis de controle omitidas] variem, enquanto mostra que o
argumento básico ainda se mantém” (1988:15). Na verdade, a única maneira de “manter
constantes as variáveis de controle” é realmente mantê-las constantes, não deixá-las variar. Se
as teorias concorrentes plausíveis tivessem identificado essas variáveis como importantes, ela
poderia ter olhado para um conjunto de observações que diferiam em sua principal variável
explicativa (grau de dependência econômica internacional do país, indústria ou empresa), mas
não nessas variáveis de controle. .

referências. Ou seja, seu projeto teria sido mais eficiente se ela tivesse escolhido
algumas indústrias e empresas sem vínculos com o exterior e algumas com altos
níveis de envolvimento estrangeiro, todas as quais sofriam de níveis constantes
de dificuldades econômicas e penetração de importações.
Os pesquisadores nunca podem rejeitar conclusivamente a hipótese de que
variáveis omitidas influenciaram suas análises. No entanto, Milner foi capaz de
apresentar um argumento mais forte e convincente para sua hipótese do que
poderia ter feito se não tivesse tentado controlar algumas fontes evidentes de
viés de variável omitida. O estudo rigoroso de Milner indica que os cientistas
sociais que trabalham com material qualitativo não precisam se desesperar em
fazer inferências causais limitadas. A perfeição é inatingível, talvez até indefinível;
mas uma ligação cuidadosa entre teoria e método pode permitir que os estudos
sejam planejados de forma a melhorar a plausibilidade de nossos argumentos e
reduzir a incerteza de nossas inferências causais.
5.3 INCLUINDO VARIÁVEIS IRRELEVANTES: INEFICIÊNCIA
Devido aos problemas potenciais com viés de variável omitida descritos na seção
5.2, podemos ingenuamente pensar que é essencial coletar e estimar
simultaneamente os efeitos causais de todas as possíveis variáveis explicativas.
De início, devemos lembrar que esta não é a implicação da seção 5.2.
Mostramos ali que omitir uma variável explicativa não correlacionada com as
variáveis explicativas incluídas não cria viés, mesmo que a variável tenha um
forte impacto causal na variável dependente, e que controlar por variáveis que
são consequências de variáveis explicativas é um erro . Portanto, nosso
argumento não deve levar os pesquisadores a coletar informações sobre todas
as influências causais possíveis ou a criticar pesquisas que falham em fazê-lo.
Claro, um pesquisador ainda pode estar incerto sobre quais variáveis de

controle antecedentes têm impacto causal ou estão correlacionadas com as
variáveis incluídas. Nesta situação, alguns pesquisadores podem tentar incluir
todas as variáveis de controle que são concebivelmente correlacionadas com as
variáveis explanatórias incluídas, bem como todas aquelas que podem ser
esperadas em bases teóricas para afetar a variável dependente. É provável que
seja uma longa lista de variáveis, muitas das quais podem ser irrelevantes. Tal
abordagem, que à primeira vista parece ser um meio cauteloso e prudente de
evitar o viés de variável omitida, correria, de fato, o risco de produzir um projeto
de pesquisa que só poderia produzir resultados indeterminados. Em pesquisas
com relativamente poucas observações, a indeterminação, conforme discutido
na seção 4.1, é um problema particularmente sério, e tal projeto “cauteloso” seria
realmente prejudicial. Esta seção discute os custos de incluir variáveis explicativas
irrelevantes e fornece qualificações essenciais para a abordagem de “incluir
tudo”.
Incluindo Variáveis Irrelevantes · 183

A inclusão de variáveis irrelevantes pode ser muito custosa. Nosso ponto chave é
que mesmo que a variável de controle não tenha efeito causal sobre a variável
dependente, quanto mais correlacionada a variável explicativa principal estiver com
a variável de controle irrelevante, menos eficiente será a estimativa do efeito causal
principal.
Para ilustrar, vamos nos concentrar em dois procedimentos diferentes (ou
“estimadores”) para calcular uma estimativa do efeito causal de uma variável
explicativa incluída apropriadamente. A primeira estimativa desse efeito é de uma
análise sem variáveis de controle irrelevantes; o segundo inclui uma variável de
controle irrelevante. A análise formal no quadro abaixo fornece as seguintes
conclusões sobre o valor relativo desses dois procedimentos, além do já
mencionado. Primeiro, ambos os estimadores são imparciais. Ou seja, mesmo ao
controlar uma variável explicativa irrelevante, o estimador usual ainda dá uma
resposta certa na média. Em segundo lugar, se a variável de controle irrelevante
não está correlacionada com a variável explicativa principal, a estimativa do efeito
causal desta última não é apenas imparcial, mas é tão eficiente como se a variável
irrelevante não tivesse sido incluída. De fato, se essas variáveis não estiverem
correlacionadas, resultará exatamente a mesma inferência. No entanto, se a
variável de controle irrelevante estiver altamente correlacionada com a variável
explicativa principal, ocorrerá uma ineficiência substancial.
Os custos de controle de variáveis irrelevantes são, portanto, altos.

Quando fazemos isso, cada estudo que realizamos tem muito mais probabilidade
de produzir estimativas distantes dos verdadeiros efeitos causais. Quando
replicamos um estudo em um novo conjunto de dados em que há uma alta
correlação entre a variável explicativa chave e uma variável de controle irrelevante
incluída, provavelmente encontraremos resultados diferentes, o que sugeriria
diferentes inferências causais. Assim, mesmo se controlarmos todas as variáveis
explicativas irrelevantes (e não cometermos outros erros), obteremos a resposta
certa em média, mas podemos estar longe da resposta certa em qualquer projeto
único e possivelmente em todos eles. Em média, a reanálise produzirá o mesmo
efeito, mas a variável irrelevante aumentará a ineficiência, como se tivéssemos
descartado algumas de nossas observações. A implicação deve ser clara: ao incluir
uma variável irrelevante, estamos colocando mais demandas em nosso conjunto
de dados finito, resultando em menos informações disponíveis para cada inferência.
Como exemplo, considere novamente o estudo dos golpes de estado nos

estados africanos. Um estudo preliminar indicou que o grau de repressão política,
principal variável explicativa de interesse, aumentou a frequência dos golpes.
Suponha que outro estudioso argumentasse que o estudo original era falho porque
não controlava se o estado conquistou a independência em uma ruptura violenta
ou negociada do domínio colonial. Suponha que acreditamos que este segundo
estudioso está errado e que a natureza do

a ruptura com o domínio colonial não teve efeito sobre a variável dependente
— a frequência dos golpes (após o controle da principal variável explicativa, a
repressão política). Quais seriam as consequências de controlar essa variável
adicional irrelevante?
A resposta depende da relação entre a variável irrelevante, que mede a
natureza da ruptura com o domínio colonial, e a principal variável explicativa,
que mede a repressão política. Se a correlação entre essas variáveis for alta —
como parece plausível —, incluir essas variáveis de controle produziria
estimativas bastante ineficientes do efeito da repressão política. Para entender
isso, observe que, para controlar como a independência foi alcançada, o
pesquisador pode dividir suas categorias de regimes repressivos e não
repressivos conforme eles romperam com o domínio colonial violentamente ou
por negociação. A frequência de golpes em cada categoria pode ser contada
para avaliar os efeitos causais da repressão política, enquanto os meios de
romper com o domínio colonial são controlados. Embora esse tipo de projeto
seja uma maneira razoável de evitar o viés de variável omitida, ele pode ter
custos elevados: quando a variável de controle adicional não tem efeito sobre
a variável dependente, mas está correlacionada com uma variável explicativa
incluída, o número de observações em cada categoria é reduzido e o principal
efeito causal é estimado com muito menos eficiência. Esse resultado significa
que muito do trabalho árduo do pesquisador foi desperdiçado, uma vez que
reduzir desnecessariamente a eficiência equivale a descartar observações. A
melhor solução é sempre coletar mais observações, mas se isso não for
possível, os pesquisadores são aconselhados a identificar variáveis irrelevantes
e não controlá-las.
Uma análise formal das ineficiências variáveis incluídas. Suponha que o

modelo verdadeiro seja E(Y) = X1b e V(Y) = s2. No entanto, pensamos
incorretamente que uma segunda variável explicativa X2 também pertence
à equação. Então nós estimamos
E(Y) = X1b1 + X2b2 (5.6)
sem saber que de fato b2 = 0. Que consequência uma estimativa simultânea

de ambos os parâmetros tem para nossa estimativa de b1?
Defina b1 como o estimador correto, baseado apenas em uma regressão
de Y em X1, e bˆ1 como o primeiro coeficiente em Xi de uma regressão de Y
em X1 e X2. É fácil mostrar que não podemos distinguir entre esses dois
estimadores com base na imparcialidade (sendo corretos em média em
muitos experimentos hipotéticos), uma vez que ambos são não enviesados:
Endogeneidade · 185
E(b1) = E(bˆ1) = b1 (5.7)
Os estimadores diferem, no entanto, no que diz respeito à eficiência. O

estimador correto tem uma variância (calculada na equação [3.9]) de
s2
________
V(b1) = (5.8)
n
i=1X1i2
enquanto o outro estimador tem variância
s2
V(bˆ1) = _______________ (5.9)
2
(1 ÿ r2 12)n i=1X1i
V(b1)
= ________
(1 ÿ r2 12)
onde a correlação entre X1 e X2 é r12 (ver Goldberger 1991:245).
A partir da última linha da equação (5.9), podemos ver a relação precisa entre as
variâncias dos dois estimadores. Se a correlação entre as duas variáveis explicativas
for zero, não faz diferença incluir ou não a variável irrelevante, pois ambos os
estimadores têm a mesma variância. No entanto, quanto mais correlacionadas duas
variáveis estiverem, maior a variância e, portanto, menor a eficiência de bˆ1.
5.4 ENDOGENEIDADE
A pesquisa em ciência política raramente é experimental. Normalmente não temos a

oportunidade de manipular as variáveis explicativas; nós apenas os observamos. Uma
consequência dessa falta de controle é a endogeneidade - os valores que nossas
variáveis explicativas assumem às vezes são uma consequência, e não uma causa, de
nossa variável dependente. Com a verdadeira manipulação experimental, a direção da
causalidade é inequívoca. Mas para muitas áreas de pesquisa qualitativa e quantitativa,
a endogeneidade é um problema comum e sério.13
13 Pesquisadores qualitativos às vezes manipulam variáveis explicativas por meio da observação
participante. Mesmo entrevistas em profundidade podem ser uma forma de experimento se diferentes
perguntas forem feitas sistematicamente ou outras condições forem alteradas em diferentes entrevistas.
Na verdade, pode até ser um problema até mesmo para entrevistas em profundidade, já que um
pesquisador pode se sentir mais confortável aplicando “tratamentos” experimentais (fazendo certas perguntas).

Na ausência de controle do investigador sobre os valores das variáveis
explicativas, a direção da causalidade é sempre uma questão difícil. Na pesquisa
não experimental — quantitativa ou qualitativa — as variáveis explicativas e
dependentes variam por causa de fatores fora do controle (e muitas vezes fora
do campo de visão) do pesquisador. Estados invadem; oficiais do exército
tramam golpes; a inflação cai; políticas governamentais são promulgadas; os
candidatos decidem concorrer ao cargo; os eleitores escolhem entre os
candidatos. Um estudioso deve tentar reunir um argumento sobre o que está
causando o quê.
Um exemplo é fornecido pela literatura sobre as eleições para o Congresso
dos Estados Unidos. Muitos estudiosos têm argumentado que o dramático
aumento da vantagem eleitoral do mandato durante o final da década de 1960
deveu-se em grande parte ao aumento do serviço eleitoral prestado por
membros do Congresso. Ou seja, o privilégio de franquia, orçamentos para
viagens ao distrito, funcionários no distrito para lidar com solicitações específicas
de constituintes, projetos de pork barrel e outros privilégios do cargo permitiram
que congressistas em cargos acumulassem apoio em seus distritos. Muitos
cidadãos votam em candidatos incumbentes com base nisso.
Essa hipótese de serviço público parece perfeitamente razoável, mas as
evidências a suportam? Numerosos estudiosos tentaram fornecer tal evidência
(para uma revisão desta literatura, veja Cain, Fere john e Fiorina 1987), mas a
evidência positiva é escassa. O estudo modal dessa questão é baseado em
medidas do serviço eleitoral realizadas por uma amostra de parlamentares e da
proporção de votos para o candidato titular. Os pesquisadores então estimam o
impacto causal do serviço na votação por meio de análise de regressão.
Surpreendentemente, muitas dessas estimativas indicam que o efeito é zero ou

mesmo negativo.
Parece provável que o problema da endogeneidade explique esses resultados
paradoxais. Em outras palavras, os membros com maior risco de perder a
próxima eleição (talvez por causa de um escândalo ou tempos difíceis em seu
distrito) prestam serviço extra ao eleitorado. Os titulares que se sentem seguros
em serem reeleitos provavelmente se concentram em outros aspectos de seus
cargos, como a elaboração de políticas em Washington. O resultado é que os
titulares que prestam mais serviços recebem menos votos. Isso não significa que
o serviço eleitoral reduza o voto, apenas que uma forte expectativa de voto
reduz o serviço. Ao ignorar o efeito de feedback, as inferências de alguém serão
fortemente tendenciosas.
David Laitin descreve um exemplo de um problema de endogeneidade em um
dos clássicos da ciência social do início do século XX, The Protestant Ethic and
the Spirit of Capitalism, de Max Weber. “Weber tentou
ções) para determinados entrevistados, selecionados de forma não aleatória. Os experimentadores têm
inúmeros problemas próprios, mas a endogeneidade geralmente não é um deles.
demonstram que um tipo específico de comportamento econômico – o espírito

capitalista – foi (inadvertidamente) induzido por ensinamentos e doutrinas
protestantes. Mas . . . Weber e seus seguidores não puderam responder a
uma objeção levantada contra suas teses: a saber, que os europeus que já
tinham interesse em romper os grilhões do espírito pré-capitalista poderiam
muito bem ter deixado a igreja justamente para esse propósito. Em outras
palavras, os interesses econômicos de certos grupos poderiam ser vistos
como indutores do desenvolvimento da ética protestante. Sem um estudo mais
bem controlado, a linha de causalidade de Weber poderia ser invertida.” (Laitin
1986:187; veja também RH Tawney 1935 que originou a crítica).
No restante desta seção, discutiremos cinco métodos para lidar com o
difícil problema da endogeneidade:
• Corrigindo uma inferência tendenciosa (seção
5.4.1); • Analisar a variável dependente e estudar apenas as partes que são
consequências, e não causas, da variável explicativa (seção 5.4.2);
• Transformar um problema de endogeneidade em viés devido a uma variável omitida

capaz e controlando esta variável (seção 5.4.3);
• Selecionar cuidadosamente pelo menos algumas observações sem problemas de
endogeneidade (seção
5.4.4); e • Analisar as variáveis explicativas para garantir que apenas as partes
verdadeiramente exógenas estejam na análise (seção 5.4.5).
Cada um desses cinco procedimentos pode ser visto como um método para
evitar problemas de endogeneidade, mas também como uma forma de
esclarecer uma hipótese causal. Pois uma hipótese causal que ignora um
problema de endogeneidade é, no final das contas, um problema teórico,
exigindo reespecificação para que seja pelo menos possível que as variáveis
explicativas possam influenciar a variável dependente. Discutiremos as duas
primeiras soluções para a endogeneidade no contexto de nosso exemplo
quantitativo de serviços constituintes e as três restantes com a ajuda de
exemplos estendidos da pesquisa qualitativa.
5.4.1 Corrigindo inferências
tendenciosas A última linha da equação (5.13) na caixa abaixo fornece um

procedimento para avaliar a direção exata e o grau de viés devido à endogeneidade.
Por conveniência, reproduzimos a equação (5.13) aqui:
E(b) = b + Viés
Essa equação implica que, se a endogeneidade estiver presente, não estamos

fazendo a inferência causal que desejamos. Ou seja, se o termo de viés for
zero, nosso método de inferência (ou estimador b) será imparcial na média (que

é, igual a b). Mas se tivermos viés de endogeneidade, estamos estimando a
inferência correta mais um fator de viés. A endogeneidade é um problema
porque geralmente desconhecemos o tamanho ou a direção do viés. Esse
fator de viés será grande ou pequeno, negativo ou positivo, dependendo do
exemplo empírico específico. Felizmente, mesmo que não possamos evitar o
viés de endogeneidade em primeiro lugar, às vezes podemos corrigi-lo após o
fato, verificando a direção e talvez o grau do viés.
A equação (5.13) demonstra que o fator de viés depende da correlação

entre a variável explicativa e o termo de erro – a parte da variável dependente
não explicada pela variável explicativa.
Por exemplo, se a hipótese do serviço eleitoral estiver correta, então o efeito
causal do serviço eleitoral sobre a votação (b na equação) é positivo. Se, além
disso, o voto esperado afetar o nível de serviço ao eleitorado que observamos,
então o viés será negativo. Ou seja, mesmo após o efeito do serviço eleitoral
na votação ser levado em consideração, o serviço eleitoral será inversamente
correlacionado com o termo de erro porque os titulares com votos esperados
mais baixos prestarão mais serviço. O resultado é que o termo de viés é
negativo e as inferências não corrigidas neste caso são estimativas viesadas
do efeito causal b (ou, de forma equivalente, estimativas não viesadas de [b +
viés]). Assim, mesmo que a hipótese constituinte-serviço seja verdadeira, o
viés de endogeneidade nos levaria a estimar o efeito do serviço como um
número positivo menor do que deveria ser, como zero, ou mesmo como
negativo, dependendo do tamanho do fator de viés. Assim, podemos concluir
que a estimativa correta do efeito do serviço no voto é maior do que estimamos
em uma análise realizada sem correção de endogeneidade. Como resultado,
nossa análise não corrigida produz um limite inferior no efeito do serviço,
tornando a hipótese do serviço público mais plausível.
Assim, mesmo que não possamos evitar o viés de endogeneidade, às vezes

podemos melhorar nossas inferências após o fato, estimando o grau de viés.
No mínimo, isso nos permite determinar a direção do viés, talvez fornecendo
um limite superior ou inferior para a estimativa correta. Na melhor das
hipóteses, podemos usar essa técnica para produzir inferências totalmente imparciais.
5.4.2 Analisando a variável dependente
Uma maneira de evitar o viés de endogeneidade é reconceituar a variável

dependente como ela mesma contendo um componente dependente e um
explicativo. O componente explicativo da variável dependente interfere em
nossa análise por meio de um mecanismo de feedback, ou seja, influenciando
nossa variável causal (explicativa) chave. O outro componente de nossa
variável dependente é verdadeiramente dependente, uma função, e não
uma causa, de nossa variável explicativa. O objetivo desse método de

evitar viés de endogeneidade é identificar e medir apenas o componente
dependente de nossa variável dependente.
Por exemplo, em um estudo sobre a hipótese de serviço eleitoral, King
(1991a) separou do total de votos para um membro do Congresso a
parcela devida apenas ao status de incumbência. Nos últimos anos, a
vantagem eleitoral do status de titular é de cerca de 8 a 10 pontos
percentuais dos votos, em comparação com uma base para muitos
titulares de aproximadamente 52% dos votos bipartidários. Por meio de
um procedimento estatístico, King estimou a vantagem do cargo, que era
um componente exclusivamente dependente da variável dependente, e
usou esse valor no lugar do voto bruto para estimar os efeitos do serviço
eleitoral. Uma vez que a vantagem de voto do titular, sendo uma parcela
tão pequena do total de votos, não teria muito efeito sobre a propensão
dos legisladores em exercício a se engajarem no serviço eleitoral, ele
evitou o viés de endogeneidade. Seus resultados indicaram que $ 10.000
extras adicionados ao orçamento do legislador estadual médio para
serviço eleitoral (entre outras coisas) dão a esse titular uma vantagem
adicional de 1,54 ponto percentual (mais ou menos cerca de 0,4%) na
próxima eleição, proporcionando assim a primeira suporte empírico para
a hipótese do serviço público.
5.4.3 Transformando a endogeneidade em um problema de

variável omitida Podemos sempre pensar na endogeneidade como um
caso de viés de variável omitida, como demonstra o seguinte exemplo
famoso do estudo de sistemas eleitorais comparativos. Um dos grandes
enigmas da análise política para uma geração anterior de cientistas
políticos foi a queda da República de Weimar e sua substituição pelo
regime nazista no início dos anos 1930. Uma explicação, apoiada por
alguns estudos de caso detalhados e convincentes da Alemanha de
Weimar, era que a causa principal era a imposição da representação
proporcional como modo de eleição na Constituição de Weimar. O
argumento, resumido, é que a representação proporcional permite que
pequenos partidos que representam grupos ideológicos, de interesse ou
religiosos específicos obtenham representação no parlamento. Sob tal
sistema eleitoral, não há necessidade de um candidato comprometer sua
posição a fim de obter sucesso eleitoral, como ocorre sob um sistema
eleitoral de distrito único, onde o vencedor leva tudo. Portanto, o
parlamento estará cheio de pequenos grupos ideológicos sem vontade e
incapazes de trabalhar juntos. O impasse e a frustração permitiriam que
um desses grupos – neste caso, os nacional-socialistas – tomasse o
poder. (Para a declaração clássica desta teoria, veja Hermens 1941).

O argumento do parágrafo acima foi elaborado em vários estudos de
caso importantes sobre a queda da República de Weimar. Historiadores e
cientistas políticos atribuíram o colapso de Weimar ao sucesso eleitoral
de pequenos partidos ideológicos e sua relutância em fazer concessões
no Reichstag. Há muitos problemas com a explicação, como certamente
haveria para uma explicação de um resultado complexo baseado em uma
única instância, mas vamos olhar apenas para o problema da
endogeneidade. A explicação subjacente envolvia um mecanismo causal
com os seguintes elos na cadeia causal: a representação proporcional foi
introduzida e permitiu que pequenos partidos com bases eleitorais estreitas
ganhassem assentos no Reichstag (incluindo partidos dedicados à sua
derrubada, como os nacional-socialistas). . Como resultado, o Reichstag
estava em um impasse e a população estava frustrada. Isso, por sua vez,
levou a um golpe de uma das partes.
Mas um estudo mais aprofundado - da Alemanha, bem como de outras
implicações observáveis - indicou que a fragmentação partidária não era
apenas o resultado da representação proporcional. Os estudiosos
argumentaram que, se a fragmentação partidária levasse à adoção da
representação proporcional, também seria a causa. Aplicando a mesma
variável explicativa a outras observações (seguindo nossa regra do capítulo
1 de que evidências devem ser buscadas para hipóteses em dados
diferentes daqueles em que foram geradas), os estudiosos descobriram
que sociedades com um grande número de grupos com visões estreitas e
intensas em oposição a outros grupos – grupos minoritários, étnicos ou
religiosos, por exemplo – são mais propensos a adotar a representação
proporcional, uma vez que é o único sistema eleitoral com o qual as várias
facções da sociedade podem concordar. Um exame mais atento da política
alemã antes da introdução da representação proporcional confirmou essa
ideia ao localizar muitas pequenas facções. A representação proporcional
não criou essas facções, embora possa ter facilitado sua expressão
parlamentar. As facções também não eram a única causa da representação
proporcional; no entanto, tanto a adoção da representação proporcional
quanto a fragmentação parlamentar parecem ter sido efeitos da
fragmentação social. (Veja Lakeman e Lambert 1955:155 para uma explicação inicial deste argumento.)
Assim, transformamos um problema de endogeneidade em viés de
variável omitida. Ou seja, a fragmentação social anterior é uma variável
omitida que causa a representação proporcional, é causalmente anterior a
ela e levou em parte à queda de Weimar. Ao transformar o problema dessa
maneira, os estudiosos conseguiram lidar melhor com o problema, pois
podiam medir explicitamente essa variável omitida e controlá-la em
estudos subseqüentes. Neste exemplo, uma vez que a variável omitida foi
incluída e controlada, os estudiosos descobriram que havia um razoável
probabilidade de que a aparente relação causal entre a representação
proporcional e a queda da República de Weimar fosse quase inteiramente
espúria.
O tema da relação entre sistemas eleitorais e democracia ainda é altamente
contestado, embora seu estudo tenha progredido muito desde esses primeiros
estudos. Os estudiosos expandiram o estudo de estudos de caso concentrados
sem muita preocupação com a lógica da explicação para estudos baseados
em muitas observações de dadas implicações e gradualmente resolveram
alguns aspectos de medição e, finalmente, de inferência. Ao fazê-lo, eles
conseguiram separar os efeitos exógenos dos endógenos de forma mais
sistemática.
5.4.4 Selecionando observações para evitar a
endogeneidade A endogeneidade é um problema muito comum em muitos

trabalhos sobre o impacto de ideias sobre políticas (Hall 1989; Goldstein e
Keohane 1993). Na medida em que as ideias refletem as condições sob as
quais os atores políticos operam – por exemplo, suas circunstâncias materiais,
que geram seus interesses materiais – a análise do impacto das ideias na
política está sujeita ao viés variável omitido: as ideias dos atores são
correlacionadas com um variável omitida – interesses materiais – que afeta a
variável dependente – estratégia política (Ver seção 5.4.3). E na medida em
que as ideias servem como racionalizações de políticas adotadas por outros
motivos, as ideias podem ser meras consequências e não causas da política.
Nessas circunstâncias, as ideias são endógenas: podem parecer explicar as
estratégias dos atores, mas na verdade resultam dessas estratégias.
A tarefa metodológica mais difícil no estudo do impacto das ideias na política
é compensar os problemas intimamente relacionados de viés de variável
omitida e endogeneidade, pois afetam um determinado problema de pesquisa.
Para mostrar que as ideias são causalmente importantes, deve-se demonstrar
que um determinado conjunto de ideias mantidas pelos formuladores de
políticas, ou algum aspecto delas, afeta as políticas adotadas e não
simplesmente reflete essas políticas ou seus interesses materiais anteriores.
Pesquisadores dessa área devem ter cuidado especial na definição do efeito
causal de interesse. Em particular, a variável dependente observada (políticas)
e a variável explicativa (ideias dos indivíduos) devem ser comparadas com
uma situação contrafactual definida com precisão na qual a variável explicativa
assume um valor diferente: os indivíduos relevantes tinham ideias diferentes.
A análise comparativa é uma boa maneira de determinar se um determinado
conjunto de ideias é exógeno ou endógeno. Por exemplo, em um estudo
recente sobre o papel das ideias na adoção de políticas econômicas stalinistas em

outros países socialistas, Nina Halpern (1993) faz tal análise. Sua hipótese
é que a doutrina de planejamento stalinista – ideias nas quais os líderes
do Leste Europeu e da China acreditavam – ajuda a explicar suas políticas
econômicas quando assumiram o poder após a Segunda Guerra Mundial.
Essa hipótese é consistente com o fato de que esses líderes tinham ideias
stalinistas e implementaram a política stalinista, mas uma mera correlação
não demonstra causalidade. De fato, a endogeneidade pode estar em
ação: as políticas stalinistas podem ter gerado ideias que justificam essas
políticas, ou a antecipação de que as políticas stalinistas teriam de ser
seguidas pode ter gerado tais ideias.
Embora Halpern não use essa linguagem, ela procede de maneira
semelhante à discutida na seção 5.4.3, transformando endogeneidade em
viés de variável omitida. A principal hipótese alternativa que ela considera
é que a Europa Oriental e os estados comunistas asiáticos desenvolveram
economias de comando após a Segunda Guerra Mundial apenas como
resultado do poderio militar soviético e da influência política. A alegação
contrafactual dessa hipótese é que, mesmo que os europeus orientais e
os chineses não tivessem acreditado nas ideias stalinistas sobre a
conveniência de economias planejadas, as economias de comando ainda
teriam sido implementadas em seus países e teriam aparecido ideias que
as justificassem.
Halpern então argumenta que nos países da Europa Oriental ocupados
pelo Exército Vermelho, o poder soviético, em vez de ideias sobre a
superioridade das doutrinas stalinistas, pode muito bem ter sido
responsável por sua adoção de economias de comando: “a explicação
alternativa de que as escolhas foram puramente resposta às ordens de
Stalin é impossível de refutar” (1993:89). Por isso, ela procura observações
potenciais às quais essa fonte de viés de variável omitida não se aplica e
encontra as políticas seguidas na China e na Iugoslávia, os dois maiores
países socialistas não ocupados por tropas soviéticas após a Segunda
Guerra Mundial. Como a China era um país enorme que tinha uma
revolução nativa, Stalin não podia ditar a política para ela. Os comunistas
na Iugoslávia também alcançaram o poder sem a ajuda do Exército
Vermelho, e o Marechal Tito demonstrou sua independência das ordens
de Moscou desde o final da Segunda Guerra Mundial.
A China instituiu uma economia de comando sem estar sob o domínio
político ou militar da União Soviética; e na Iugoslávia, medidas stalinistas
foram adotadas apesar da política soviética. Halpern infere de tais
evidências que, nesses casos, o poder soviético por si só não explica a
mudança de política. Além disso, com relação à China, ela também
considera e rejeita outra hipótese alternativa pela qual as ideias seriam
endógenas: que situações econômicas semelhantes tornaram apropriado
o transplante de métodos de planejamento stalinistas para a China.
Tendo considerado e rejeitado as hipóteses alternativas que sustentam as

ideias como endógenas ao poder soviético ou às condições econômicas,
Halpern pode então apresentar seu argumento de que a adoção da doutrina
stalinista pelos chineses (e, até certo ponto e por um período mais curto,
pela iugoslava) forneceu uma base para o acordo e a resolução da incerteza
para esses regimes pós-revolucionários. Embora tal análise permaneça
bastante experimental por causa do pequeno número de implicações de sua
teoria que ela observou, ela fornece razões para acreditar que as idéias não
eram inteiramente endógenas nessa situação - que elas desempenhavam
um papel causal.
Este exemplo ilustra como podemos primeiro traduzir uma preocupação
geral sobre endogeneidade em fontes potenciais específicas de viés de
variável omitida e, em seguida, procurar um subconjunto de observações em
que essas fontes de viés não poderiam ser aplicadas. Nesse caso, ao
transformar o problema em um viés de variável omitida, Halpern foi capaz
de comparar hipóteses explicativas alternativas de maneira especialmente
produtiva para sua hipótese substantiva. Ela considerou várias hipóteses
explicativas alternativas para explicar a adoção de políticas de economia de
comando e descobriu que apenas na China, e até certo ponto na Iugoslávia,
era razoável considerar a doutrina stalinista (as ideias em questão) como
amplamente exógena. Conseqüentemente, ela concentrou sua pesquisa na
China e na Iugoslávia. Se ela não tivesse planejado cuidadosamente seu
estudo para lidar com o problema da endogeneidade, suas conclusões
seriam muito menos convincentes – considere, por exemplo, se ela tivesse
tentado provar seu caso com os exemplos da Polônia e da Bulgária!
5.4.5 Analisando a variável explicativa

Nesta seção, introduzimos um quinto e último método para eliminar o viés
devido à endogeneidade. O objetivo deste método é dividir uma variável
explicativa potencialmente endógena em dois componentes: um que é
claramente exógeno e outro que é pelo menos parcialmente endógeno. O
pesquisador então usa apenas a porção exógena da variável explicativa em
uma análise causal.
Um exemplo dessa solução para a endogeneidade vem de um estudo
sobre participação voluntária na política de Verba, Schlozman e Brady (em
andamento). Esses autores estavam interessados em explicar por que os
afro-americanos são muito mais politicamente ativos do que os latinos, visto
que os dois grupos são igualmente desfavorecidos. Os autores descobrem
que uma variedade de fatores contribui para a diferença, incluindo o tempo
recente de imigração para os Estados Unidos e habilidades linguísticas. Uma
de suas principais variáveis explicativas era a frequência a serviços religiosos
(igreja, sinagoga, etc.). Os investigadores obviamente não tinham controle sobre

se os indivíduos frequentavam esses serviços e, portanto, o potencial de
endogeneidade não poderia ser descartado. Na verdade, eles suspeitavam
que alguns latinos e muito mais afro-americanos frequentavam serviços
religiosos porque eram politicamente ativos. Alguém interessado em ser
politicamente ativo pode ingressar em uma igreja porque oferece uma chance
de aprender tais habilidades ou porque é altamente politizado. Um clero
politizado pode treinar fiéis para a atividade política ou fornecer-lhes
estímulos políticos. Em outras palavras, a seta causal pode ir da política para
as experiências não-políticas, e não vice-versa.
Verba et al. resolveram esse problema analisando sua variável explicativa
chave. Eles fizeram isso argumentando que as instituições religiosas afetam
a participação política de duas maneiras. Primeiro, os indivíduos aprendem
habilidades cívicas nessas instituições (por exemplo, como fazer um discurso
ou como conduzir uma reunião). A aquisição de tais habilidades, por sua
vez, torna o cidadão mais competente e disposto a participar da vida política.
Em segundo lugar, os cidadãos são expostos a estímulos políticos (por
exemplo, discussão de assuntos políticos ou pedidos diretos de outros
associados à instituição para se tornarem politicamente ativos). E essa
exposição também deve afetar a atividade política. Os autores argumentaram
que o primeiro componente é em grande parte exógeno, enquanto o segundo
é pelo menos parcialmente endógeno: isto é, é parcialmente devido à medida
em que os indivíduos são politicamente ativos (a variável dependente).
Os autores então realizaram um estudo auxiliar para avaliar essa hipótese
sobre os componentes exógenos e endógenos da participação em serviços
religiosos. Eles começaram reconhecendo que a probabilidade de um
indivíduo adquirir habilidades cívicas na igreja depende da estrutura
organizacional da igreja. Uma igreja que é organizada de maneira hierárquica,
onde o clero é nomeado pelos oficiais da igreja central e onde os
congregantes desempenham um papel pequeno na governança da igreja,
oferece menos oportunidades para o membro individual da igreja aprender
habilidades cívicas participativas do que uma igreja organizada em uma
base organizada. base gregária onde os fiéis desempenham um papel
significativo na governança da igreja. A maioria dos afro-americanos pertence
a igrejas protestantes organizadas em uma base congregacional, enquanto
a maioria dos latinos pertence a igrejas católicas organizadas em uma base
hierárquica. Os autores mostraram que é essa diferença na afiliação religiosa
que explica a probabilidade de adquirir habilidades cívicas. Eles mostraram,
por exemplo, que para ambos os grupos, assim como para os americanos
anglo-brancos, é a natureza da denominação que afeta a aquisição de
habilidades cívicas, não a etnia, outras características sociais ou, especialmente, a participação política.
Tendo se convencido de que a aquisição de habilidades cívicas era
realmente exógena à participação política, Verba et al. mediu a aquisição de
habilidades cívicas em serviços religiosos e usou essa variável
capaz, ao invés de frequência a serviços religiosos, como sua variável

explicativa. Essa abordagem resolveu o problema de endogeneidade, pois
agora eles haviam analisado sua variável explicativa para incluir apenas seu
componente exógeno.
Este estudo auxiliar forneceu mais evidências de apoio de que eles
resolveram seu problema de endogeneidade, uma vez que a afiliação religiosa
de latinos e afro-americanos não pode ser explicada de forma plausível por
seus envolvimentos políticos particulares; a filiação à igreja é, na maioria dos
casos, adquirida quando criança através da família. As razões pelas quais os
afro-americanos são em sua maioria protestantes são encontradas nas
histórias da escravidão americana e nas instituições que se desenvolveram
nas plantações do sul. As razões pelas quais os latinos são católicos estão
enraizadas na conquista espanhola da América Latina. A diferença entre a
estrutura institucional das igrejas católica e protestante também não pode ser
atribuída aos interesses dos oficiais da igreja em se envolver na atual política americana.
Em vez disso, é preciso voltar à Reforma para encontrar a fonte da diferença
na estrutura organizacional.
Uma Análise Formal de Endogeneidade. Esse modelo formal demonstra

o viés criado se um projeto de pesquisa é afetado pela endogeneidade e
nada é feito a respeito. Suponha que temos uma variável explicativa X e
uma variável dependente Y. Estamos interessados no efeito causal de X
em Y e usamos a seguinte equação:
E(Y) = Xb (5.10)
Isso também pode ser escrito como Y = Xb + e, onde e = Y ÿ E(Y) é

chamado de termo de erro ou distúrbio. Suponha ainda que haja
endogeneidade; ou seja, X também depende de Y:
E(X) = Yg (5.11)
O que acontece se ignorarmos a parte recíproca da relação na equação

(5.11) e estimarmos b como se apenas a equação (5.10) fosse verdadeira?
Em outras palavras, estimamos b (assumindo incorretamente que g = 0)
com a equação usual:
n
b = _________
i=1XiYi
(3.7)
n
2
i=1Xi
Para avaliar esse estimador, usamos a propriedade de imparcialidade

e, portanto, calcule seu valor esperado:
ÿ_________ÿ
n
i=1XiYi
E(b) = Eÿ n
(5.13)
ÿ 2 ÿÿ
i=1Xi
ÿ n
i=1Xi(Xib + ei)
_______________ÿ
=
n
Eÿÿ 2 ÿÿ
i=1Xi
n
i=1C(Xi,ei)
= b + ____________
n
i=1V(Xi)
= b + Viés
onde Bias = n i=1C(Xi,ei)/ n i=1V(Xi). Normalmente, a covariância de Xi e o termo

de perturbação ei, C(Xi,ei), é zero, de modo que o termo de viés é zero. Assim, o
valor esperado de b é b e, portanto, imparcial. Geralmente é verdade que depois
de levarmos em conta X na previsão de Y, a porção que nos resta (e) não está
correlacionada com X. No entanto, na situação atual, depois de levarmos em
conta o efeito de X, ainda há algum variação deixada devido ao feedback do
efeito causal de Y em X. Assim, endogeneidade significa que o segundo termo
na última linha da equação (5.13) geralmente não será zero e a estimativa será
viesada.
A direção do viés depende da covariância, pois a variância de X é sempre

positiva. No entanto, nos casos incomuns em que a variância de X é extremamente
grande, ela sobrepujará a covariância e tornará o termo de viés insignificante. O
texto dá um exemplo com uma interpretação substantiva desse termo tendencioso.
5.5 ATRIBUIÇÃO DE VALORES DA VARIÁVEL EXPLICATIVA
Apontamos na seção 4.4 que os melhores experimentos controlados têm duas

vantagens: controle sobre a seleção de observações e controle sobre a atribuição
de valores das variáveis explicativas às unidades. Nós apenas discutimos a seleção
naquele ponto. Agora que analisamos o viés de variável omitida e as outras
armadilhas metodológicas neste capítulo, podemos abordar a questão do controle
sobre a atribuição.
Em um experimento médico, uma droga sendo testada e um placebo constituem
os tratamentos, que são distribuídos aleatoriamente aos pacientes. Basicamente,
existe aqui a mesma situação da seleção aleatória de observações: a atribuição
aleatória é muito útil com grandes números de observações.
Valores da Variável Explicativa · 197

vações, mas é improvável que seja uma estratégia ótima com um pequeno n.
Com um grande n, a atribuição aleatória de valores das variáveis explicativas
elimina a possibilidade de endogeneidade (uma vez que não podem ser
influenciadas pela variável dependente) e erro de medição (desde que registremos
com precisão qual tratamento é administrado). Talvez o mais importante seja que
a atribuição aleatória em estudos de n grande torna o viés de variável omitida
extremamente improvável, porque a variável explicativa com valores atribuídos
aleatoriamente não estará correlacionada com todas as variáveis omitidas, mesmo
aquelas que influenciam a variável dependente. A atribuição aleatória, portanto,
torna as variáveis omitidas inofensivas - elas não causam viés - em estudos de n
grandes. No entanto, com um pequeno número de observações, é muito fácil
para uma variável atribuída aleatoriamente ser correlacionada com alguma
variável omitida relevante, e essa correlação causa viés de variável omitida. De
fato, o exemplo do viés de seleção mostrou como uma variável atribuída
aleatoriamente estava correlacionada com uma variável dependente observada;
exatamente da mesma maneira, uma variável explicativa atribuída aleatoriamente
poderia ser facilmente correlacionada com alguma variável omitida se o número
de observações for pequeno.
Embora os experimentadores muitas vezes possam estabelecer valores para
suas variáveis explicativas, os pesquisadores qualitativos raramente são tão
afortunados. Quando os sujeitos selecionam os valores de suas próprias variáveis
explicativas ou quando outros fatores influenciam a escolha, as possibilidades de
viés de seleção, endogeneidade e outras fontes de viés e ineficiência aumentam muito.
Por exemplo, se uma experimentalista estivesse estudando o impacto na eficácia
política da participação em uma manifestação, ela designaria aleatoriamente
alguns sujeitos para participar de uma manifestação e outros para ficar em casa
e, então, medir a diferença de eficácia entre os dois grupos experimentais. (ou,
talvez, comparar os grupos em termos de mudança na eficácia entre uma medida
tomada antes e depois do experimento.) Na pesquisa não experimental, porém,
os próprios sujeitos frequentemente escolhem se querem participar. Nessas
condições, outras características individuais (como se o indivíduo é jovem ou
não, estudante ou não e assim por diante) afetarão a escolha de demonstrar,
assim como outros fatores, como, para os alunos, a proximidade do campus ao
local das manifestações. E, claro, muitos desses fatores podem estar
correlacionados com a variável dependente, a eficácia política.
Considere outro exemplo em que as unidades de análise são maiores e menos

frequentes: a questão clássica do impacto de um acúmulo de armas na
probabilidade de guerra. O tamanho do orçamento de armamento de uma nação
aumenta a probabilidade de que essa nação se envolva posteriormente em uma
guerra? A variável explicativa é o orçamento das armas (talvez em percentagem
do PNB ou, alternativamente, alterações no orçamento); o depen-

variável determinante é a presença ou ausência de guerra em algum período de
tempo designado após a medição da variável explicativa. O desenho experimental
ideal envolveria a atribuição de valores à variável explicativa pelo pesquisador:
ela escolheria várias nações para estudar e determinar o orçamento de
armamento de cada governo (atribuindo os valores aleatoriamente ou, talvez,
usando uma das técnicas “intencionais” discutimos abaixo). Obviamente, isso
não é viável! O que realmente fazemos é medir os valores da variável explicativa
(o tamanho do orçamento de armas) que o governo de cada nação escolhe para
si.
O problema, claro, é que esses valores autoatribuídos à variável explicativa não
são independentes da variável dependente – a probabilidade de ir para a guerra
– como seriam se pudéssemos escolhê-los. Nesse caso, há um claro problema
de endogeneidade: o valor da variável explicativa é influenciado por antecipações
do valor da variável dependente – a percepção da ameaça de guerra. A
endogeneidade também é um problema para estudos da relação causal entre
alianças e guerra. As nações escolhem alianças; os investigadores não os
assinam para alianças e estudam o impacto na guerra. As alianças não devem,
portanto, ser consideradas como variáveis explicativas exógenas em estudos de
guerra, na medida em que muitas vezes são formadas em antecipação a
guerra.
Esses exemplos mostram que a endogeneidade nem sempre é um problema

a ser resolvido, mas muitas vezes é parte integrante do processo pelo qual o
mundo produz nossas observações. Determinar o processo pelo qual os valores
das variáveis explicativas foram determinados é geralmente muito difícil e
normalmente não podemos recorrer a nenhum procedimento automático para
resolver problemas relacionados a ela. É, no entanto, uma tarefa de pesquisa
que não pode ser evitada.
Como a probabilidade de seleção aleatória ou atribuição aleatória causando
viés em qualquer tentativa de um experimento hipotético cai muito rapidamente
à medida que o número de observações aumenta, é útil empregar procedimentos
aleatórios mesmo com um número moderado de unidades. Se o número de
unidades for “suficientemente grande”, o que definimos precisamente na seção
6.2, a seleção aleatória de unidades satisfará automaticamente a suposição de
independência condicional da subseção 3.3. No entanto, quando existem apenas
alguns exemplos do fenômeno de interesse ou podemos coletar informações em
apenas um pequeno número de observações, como é comum na pesquisa
qualitativa, a seleção aleatória e a atribuição não são uma resposta.
Mesmo experimentos controlados, quando são possíveis, não são solução sem
um número adequado de observações.
Diante desses problemas, como pesquisadores qualitativos, devemos nos
perguntar se podemos aumentar o número de observações que investigamos,
pois, aquém de coletar todas as observações, o mais confiável
Controlando a Pesquisa · 199

A prática é coletar dados aleatoriamente em um grande número de unidades e
randomizar a atribuição de valores das variáveis explicativas. No entanto, se isso
não for possível, não devemos selecionar observações aleatoriamente. Em vez
disso, devemos usar nosso conhecimento a priori das observações disponíveis -
conhecimento baseado em pesquisas anteriores, nossas melhores suposições ou
julgamentos de outros especialistas na área - e fazer a seleção de observações e (se
possível) atribuir os valores das variáveis explicativas. de forma a evitar
enviesamentos e ineficiências. Se o viés é inevitável, devemos pelo menos tentar
entender sua direção e provável ordem de magnitude. Se tudo mais falhar – isto é,
se sabemos que há viés, mas não podemos determinar sua direção ou magnitude
– nossa pesquisa será melhor se pelo menos aumentarmos o nível de incerteza que
usamos na descrição de nossos resultados. Compreendendo os problemas de
inferência discutidos neste livro, estaremos mais aptos a fazer essas escolhas do
que qualquer gerador de números aleatórios. Em qualquer caso, todos os estudos
devem incluir uma seção ou capítulo explicando cuidadosamente os processos de
atribuição e seleção. Essa discussão deve incluir as regras usadas, uma listagem de
todas as fontes ocultas previsíveis de viés e o que, se houver, foi feito a respeito de
cada uma delas.
5.6 CONTROLANDO A SITUAÇÃO DE PESQUISA
A seleção intencional de observações sem considerar as variáveis de controle

relevantes e outros problemas de inferência não satisfará a homogeneidade da
unidade. Precisamos garantir que as observações escolhidas tenham valores da
variável explicativa que sejam medidos com o menor erro possível, que não sejam
correlacionados com alguma variável explicativa omitida e que não sejam
determinados em parte pela variável dependente. Ou seja, temos de lidar
efetivamente com os problemas de erro de medição, variáveis omitidas e
endogeneidade discutidos anteriormente neste capítulo. Na medida em que esses
problemas ainda existem após nossos melhores esforços para evitá-los, devemos
pelo menos reconhecê-los, avaliá-los e tentar corrigi-los.
Os controles são inerentemente difíceis de projetar com estudos de campo

pequenos , mas a atenção a eles geralmente é absolutamente essencial para evitar vieses.
Infelizmente, muitos pesquisadores qualitativos incluem poucos ou nenhum controle.
Por exemplo, Bollen, Entwisle e Alderson (no prelo) descobriram em uma pesquisa
de livros e artigos sociológicos que mais de um quarto dos pesquisadores não usava
nenhum método de controle.
Por exemplo, suponha que estamos interessados no efeito causal de um ano de
encarceramento sobre o grau em que as pessoas adotam crenças políticas radicais.
O projeto ideal envolveria um estudo genuinamente experimental no qual
selecionamos aleatoriamente um grande grupo de cidadãos, aleatoriamente
atribuímos metade deles à prisão por um ano e, em seguida, medimos os raios.

das crenças políticas de cada grupo. O efeito causal estimado seria a diferença
média nas crenças desses dois grupos no final do ano. Com um n grande,
poderíamos presumir de forma plausível a independência condicional, e essa
inferência causal provavelmente seria sólida. Desnecessário dizer que tal
estudo está fora de questão.
Mas, para fins de argumentação, vamos assumir que tal experimento foi
conduzido, mas com apenas algumas pessoas. Devido aos problemas
discutidos na seção 4.2, um pequeno número de pessoas, mesmo que
selecionadas e designadas aleatoriamente, provavelmente não satisfaria a
independência condicional e, portanto, precisaríamos de algum controle
explícito. Um controle simples seria medir as crenças políticas radicais antes
do experimento. Então, nossa estimativa causal seria a diferença na mudança
de crenças políticas radicais entre os dois grupos. Esse procedimento
controlaria uma situação em que os dois grupos não fossem idênticos nessa
variável antes de executar o experimento. Para entender como estimar o efeito
causal nesta situação, lembre-se do Problema Fundamental da Inferência
Causal. Idealmente, gostaríamos de pegar um único indivíduo, esperar um ano
sob condições cuidadosamente controladas que mantivessem seu ambiente
idêntico, exceto pela passagem do tempo e eventos no mundo exterior, e medir
a radicalidade de suas crenças políticas. Simultaneamente, pegaríamos o
indivíduo ao mesmo tempo, o mandaríamos para a prisão por um ano e
mediríamos a radicalidade de suas crenças políticas. A diferença entre essas
duas medidas é a definição de um efeito causal do encarceramento sobre as
crenças políticas dessa pessoa.14 O problema fundamental é que podemos
observar as crenças dessa pessoa em apenas uma dessas situações.
Obviamente, o mesmo indivíduo não pode estar dentro e fora da prisão ao
mesmo tempo.
O controle é uma tentativa de contornar o problema fundamental da maneira
mais direta. Como não podemos observar as crenças dessa pessoa em ambas
as situações, procuramos por dois indivíduos (ou, mais provavelmente, dois
grupos de indivíduos) que sejam semelhantes em tantos aspectos quanto
possível, exceto pela variável explicativa chave - se eles foram ou não para
prisão. Também não selecionamos com base em seu grau de radicalidade.
Poderíamos primeiro selecionar uma amostra de pessoas recentemente
libertadas da prisão e, então, para cada ex-prisioneiro, rastrear uma pessoa
correspondente - alguém que fosse semelhante em todos os aspectos possíveis,
exceto pelo fato de não ter ido para a prisão. Talvez possamos primeiro
entrevistar uma pessoa libertada da prisão e, com base em nosso conhecimento
de sua história e características, procurar pessoas compatíveis - pessoas com características semelhantes
14 Para seguir rigorosamente os procedimentos do capítulo 3, precisaríamos realizar

esse experimento várias vezes e tomar a média como medida do efeito causal médio do
tratamento experimental. Também podemos estar interessados na variância do efeito
causal para esse indivíduo.

perfis demográficos, talvez do mesmo bairro e escola.
As variáveis nas quais combinamos os indivíduos são, por definição,

constantes entre os grupos. Quando estimarmos o efeito causal do
encarceramento, estes serão controlados. O controle é um processo difícil, pois
precisamos controlar todas as variáveis plausivelmente confusas. Se não
correspondermos a uma variável e não pudermos controlá-la de outra forma, e
se esta variável influenciar a variável dependente enquanto estiver correlacionada
com a variável explicativa (afeta a radicalidade das crenças e não é a mesma
para os prisioneiros e não prisioneiros), a estimativa de nosso efeito causal
será tendenciosa.
Em pesquisas políticas que comparam países entre si, é difícil controlar para
alcançar a unidade homogênea: quaisquer dois países variam em inúmeras
dimensões. Por exemplo, a Bélgica e a Holanda podem parecer ao observador
não treinado como os países “mais semelhantes” no sentido de Przeworski e
Teune (1982): ambos são pequenas democracias europeias com economias
abertas e não são ameaçados por seus vizinhos . Para muitos propósitos,
portanto, eles podem ser comparados de forma viável (Katzenstein 1985). No
entanto, eles diferem com respeito a padrões linguísticos, religião, base de
recursos, data de industrialização e muitos outros fatores relevantes para sua
política. Qualquer projeto de pesquisa para estudo comparativo de suas
políticas como um todo que se concentre apenas nesses dois estados correrá,
portanto, o risco de ser indeterminado.
Se nosso propósito é comparar a Bélgica e a Holanda em geral, tal

indeterminação não pode ser evitada. Mas suponha que o pesquisador tenha
um objetivo mais específico: estudar o impacto de ser uma potência colonial
nas estratégias políticas seguidas por governos de pequenas democracias
europeias. Nesse caso, seria possível comparar as políticas da Bélgica,
Holanda e Portugal com as de pequenos estados não coloniais como Áustria,
Suécia, Suíça e Noruega. Isso pode muito bem ser um projeto de pesquisa
valioso; mas ainda não controlaria os inúmeros fatores, além da história colonial,
que diferenciam esses países uns dos outros. A pesquisadora sensível a
problemas de homogeneidade unitária poderia considerar um outro desenho
de pesquisa – talvez como uma alternativa, mas preferencialmente como um
complemento ao primeiro – no qual ela estudaria as políticas da Bélgica,
Holanda e Portugal antes e depois de sua perda de colônias. Nesse projeto, a
Bélgica não é “uma observação única”, mas é o locus para uma análise
controlada – antes e depois da independência concedida às suas colônias no
início dos anos 1960. Muitos dos fatores que diferenciam a Bélgica de Portugal
e da Holanda – muito menos dos países sem história colonial – são
automaticamente considerados.

controlado neste projeto de série temporal. Na verdade, ambas as comparações –
entre nações e dentro da mesma nação em diferentes momentos – enfrentarão
problemas de unidade homogênea. As várias nações diferem de muitas maneiras não
controladas e não medidas que podem ser relevantes para o problema de pesquisa,
mas o mesmo acontece com uma única nação medida em momentos diferentes. Mas
as diferenças serão diferentes. Nenhuma das duas comparações (nem através do
espaço nem através do tempo) constitui um experimento perfeitamente controlado –
longe disso – mas as duas abordagens juntas podem fornecer evidências muito mais
fortes para nossas hipóteses do que qualquer abordagem isoladamente.
A estratégia de seleção intencional envolve alguns perigos ocultos dos quais os

pesquisadores devem estar cientes, especialmente ao tentar combinar observações
para controlar variáveis potencialmente relevantes. O perigo primário é uma forma
particularmente insidiosa de viés de variável omitida.
Imagine o seguinte projeto de pesquisa, que utiliza correspondência. Buscando
encorajar os países da África que parecem caminhar na direção de uma maior
democratização, o governo dos Estados Unidos institui um programa denominado
“ajuda à democracia”, no qual a ajuda americana aos esforços de democratização –
na forma de materiais educativos sobre democracia e semelhantes - é enviado para
nações africanas. O pesquisador quer estudar se essa ajuda aumenta, diminui ou não
faz diferença o nível de democracia de uma nação. O pesquisador não pode dar e
retirar ajuda da mesma nação ao mesmo tempo. Assim, ele escolhe uma abordagem
comparativa prospectiva: isto é, ele compara nações que estão prestes a receber
ajuda com outras que não estão. Ele também decide corretamente encontrar unidades
nos dois grupos que correspondam aos valores de todas as variáveis de controle
relevantes, exceto aquela com a qual ele está preocupado - o programa de ajuda dos
Estados Unidos.
O tempo e as habilidades linguísticas restringem sua pesquisa de modo que ele

possa, de fato, estudar apenas duas nações (embora os problemas a serem
mencionados existissem em um estudo com um número maior, mas ainda pequeno, de unidades).
Ele escolhe uma nação que recebe bastante ajuda do programa dos EUA e outra que
recebe muito pouco. A variável dependente é sabiamente escolhida para ser o ganho
em grau de democracia desde o início do programa dos EUA até o momento, dois
anos depois, quando o estudo é conduzido. E como existem muitas outras variáveis
que podem estar correlacionadas tanto com a variável explicativa quanto com a
variável dependente, o pesquisador tenta escolher dois países que tenham
correspondência próxima para eliminar o viés da variável omitida.
Duas dessas variáveis de controle podem ser o nível de educação da nação e a

extensão da violência da guerrilha anti-regime. Cada uma delas é uma variável que
pode causar viés se não for controlada porque cada uma está correlacionada com as
variáveis explanatórias e dependentes (re-

chame a seção 5.2 sobre viés de variável omitida). Os Estados Unidos
provavelmente darão mais ajuda a países com bons sistemas educacionais
(talvez porque essas nações possam estabelecer melhores relações com
Washington ou porque os Estados Unidos favorecem a educação), e a
educação às vezes é uma força democratizadora. Da mesma forma, os
Estados Unidos preferem dar ajuda a nações onde há pouca atividade de
guerrilha e, claro, tais ameaças diminuem a probabilidade de democratização.
Ao combinar essas variáveis, o pesquisador espera controlar seus efeitos de confusão.
No entanto, sempre há outras variáveis que são omitidas e que podem
causar viés porque estão correlacionadas tanto com a variável explicativa
chave quanto com a variável dependente (e causalmente anteriores à variável
causal chave). E o problema é que a tentativa de combinar as unidades, se
for feita de maneira imprópria ou incompleta, pode aumentar a probabilidade
de que haja outra variável significativa omitida correlacionada tanto com a
variável explanatória quanto com a variável dependente.
Por que esse é o caso? Observe que, para comparar as nações, o
pesquisador precisa encontrar uma nação que receba bastante ajuda e outra
que receba pouco. Suponha que ele escolha duas nações semelhantes nas
outras duas variáveis - duas nações com altos níveis de educação e baixos
níveis de ameaça interna. O resultado é o seguinte:
País A: Alta ajuda, alta educação, pacífico.

País B: Baixa ajuda, alta educação, pacífico.
As chances são de que algo seja “especial” no País B. Por que ele não está
recebendo ajuda se tem condições tão favoráveis? E, as chances são de que
algo que é “especial” seja uma variável omitida que causará viés ao ser
correlacionada com as variáveis explicativas e dependentes. Um exemplo
pode ser a existência em B, mas não em A, de um exército forte que promova
a educação e reprima os movimentos de guerrilha. Uma vez que a força dos
militares está correlacionada com a variável dependente e a variável
explicativa chave, sua omissão causará viés. Podemos ver que o mesmo
problema teria existido se a correspondência viesse do extremo oposto dos
continuums de educação e paz interna. Nesse caso, a anomalia seria a nação
com baixa escolaridade e alta violência que recebia bastante ajuda. O
problema pode ser amenizado combinando no meio das distribuições de
educação e paz interna. No entanto, mesmo nesse caso, o pesquisador teria
duas nações, cada uma delas um pouco anômala em uma direção oposta. O
ponto geral é que o emparelhamento algumas vezes nos leva a buscar
observações que são um tanto divergentes do que esperaríamos, dados seus
valores nas variáveis de controle - e esse desvio pode ser devido a variáveis
omitidas especialmente significativas.

Observe como isso funcionaria em nosso exemplo da prisão. Podemos buscar
observações combinadas para os prisioneiros que entrevistamos – semelhantes em
antecedentes socioeconômicos, histórico familiar, histórico escolar e outros, exceto
que eles não estão na prisão. A correspondência mais eficaz seria encontrar não-
prisioneiros que tivessem o maior potencial possível de encarceramento – eles vêm
de um bairro pobre, abandonaram a escola, foram expostos a drogas, vêm de um lar
desfeito, etc. Quanto melhor a correspondência, mais confiança teríamos na conexão
entre encarceramento e crenças políticas. Mas aqui está novamente o problema.
Com tudo isso indo contra eles, talvez haja algo especial sobre os não-prisioneiros
que os manteve fora da prisão – talvez um forte compromisso religioso – que esteja
correlacionado tanto com a variável explicativa (encarceramento) quanto com a
variável dependente (ideologia política).
Há outra maneira de ver esse perigo na correspondência. Lembre-se das duas

perspectivas sobre variabilidade aleatória que descrevemos na seção 2.6. O problema
potencial com a correspondência, como descrevemos até agora, envolve uma
variável omitida que podemos identificar. No entanto, ainda podemos suspeitar que
duas observações que são combinadas em uma longa lista de variáveis de controle
são “especiais” de alguma forma que não podemos identificar: isto é, que existe uma
variável desconhecida omitida. Nessa situação, a única coisa que podemos fazer é
nos preocupar em como a aleatoriedade inerente à nossa variável dependente
afetará essa observação. Como nossa medida pode se afastar de seu valor real,
devido à variabilidade aleatória, mais difícil será procurar observações “incomuns”
para obter uma correspondência próxima entre os grupos e, assim, correr o risco de
viés de variável omitida.
Essas qualificações não devem nos levar a evitar projetos de pesquisa que usam
correspondência. Na verdade, a correspondência é uma das estratégias de small n
mais valiosas . Precisamos apenas estar cientes de que o emparelhamento, como
todas as estratégias de n pequeno , está sujeito a perigos que a aleatoriedade e um
n grande teriam eliminado. Uma estratégia muito produtiva é escolher estudos de
caso por meio de correspondência, mas observações dentro de casos de acordo
com outros critérios.
A correspondência, com o objetivo de evitar viés de variável omitida, está
relacionada à discussão na literatura de política comparada sobre se os pesquisadores
devem selecionar observações que sejam tão semelhantes quanto possível (Lijphart
1971) ou tão diferentes quanto possível (Przeworski e Teune 1970). Recomendamos
uma abordagem diferente. O debate do projeto de pesquisa “mais semelhante”
versus “mais diferente” presta pouca ou nenhuma atenção à questão do “semelhante
em relação a quê”. Os rótulos costumam ser confusos e o debate é inconclusivo
nesses termos: nenhuma dessas abordagens deve ser sempre preferida. Para nós,
a máxima chave para

a coleta de dados é identificar observações potenciais que maximizam a influência
sobre a hipótese causal. Às vezes, nossa estratégia produz um projeto de pesquisa
que pode ser rotulado como “projeto de sistemas mais semelhantes” e, às vezes, pode
ser como “projetos de sistemas mais diferentes”. Mas, diferentemente do debate “mais
parecido” versus “mais diferente”, nossa estratégia sempre produzirá dados relevantes
para responder às questões levantadas pelo pesquisador.
Na correspondência, os possíveis efeitos de variáveis omitidas são controlados pela

seleção de observações que tenham os mesmos valores nessas variáveis. Por
exemplo, o desejo de manter constantes tantas variáveis de fundo quanto possível
está por trás da escolha de Seymour Martin Lipset (1963:248) de comparar o
desenvolvimento político dos Estados Unidos com outras ex-colônias da Grã-Bretanha
de língua inglesa. Os Estados Unidos, o Canadá e a Austrália, aponta ele, “são ex-
colônias da Grã-Bretanha, que estabeleceram uma fronteira continental relativamente
aberta e são hoje estados federais que abrangem todo o continente”. E, aponta muitos
outros traços comuns que se mantêm constantes: nível de desenvolvimento, regime
democrático, semelhanças de valores, etc.
O estudo de David Laitin (1986) sobre os efeitos das crenças religiosas na política
usa uma técnica de correspondência particularmente cuidadosa. Ele escolheu uma
nação, a Nigéria, com fortes tradições muçulmanas e cristãs, pois desejava comparar
os efeitos das duas tradições na política. Mas as áreas muçulmana e cristã da Nigéria
diferem em muitos aspectos além de seus compromissos religiosos, aspectos que, se
ignorados, correriam o risco de omitir viés variável. “Na Nigéria, os centros dominantes
do Islã estão nos estados do norte, que tiveram séculos de contato direto com o
mundo islâmico, uma história de estruturas de estado islâmico anteriores ao domínio
britânico e uma memória de uma jihad revivalista no início do século XIX. que unificou
uma grande área sob a doutrina islâmica ortodoxa. [Em contraste,] não foi até o final
do século XIX que as comunidades cristãs criaram raízes. . . . As escolas missionárias
trouxeram educação ocidental, e os empresários capitalistas encorajaram as pessoas
a plantar colheitas comerciais e a se associarem cada vez mais com a economia
capitalista mundial.
(Laitin 1986:187).
Como, perguntou Laitin, “alguém poderia controlar as diferenças de nacionalidade,
ou economia, ou o número de gerações expostas a uma cultura mundial, ou as
motivações para a conversão, ou na ecologia – todas as quais são diferentes na
cultura cristã? e fortalezas muçulmanas?” (1986: 192–93). Sua abordagem foi escolher
um local específico na área Yoruba da Nigéria, onde as duas religiões foram
introduzidas no mesmo grupo de nacionalidade mais ou menos na mesma época, e
onde as duas religiões apelaram para potenciais convertidos por razões semelhantes.
Nem no estudo de Kohli sobre três estados indianos nem na análise de Lipset sobre

três ex-colônias britânicas nem a pesquisa de Laitin sobre cristãos e
muçulmanos em Yorubaland é a correspondência completa; nunca poderia ser.
A correspondência exige que antecipemos e especifiquemos quais podem ser
as possíveis variáveis omitidas relevantes. Em seguida, controlamos
selecionando observações que não variam neles. Claro, nunca sabemos que
cobrimos toda a lista de possíveis fatores de viés. Mas para certos propósitos
analíticos – e a avaliação da adequação de um procedimento de seleção de
pareamento deve ser feita em relação a algum propósito analítico – o controle
produzido pelo pareamento melhora a probabilidade de obtenção de inferências
válidas.
Em suma, o pesquisador que tenta fazer inferências causais pode selecionar
casos de duas maneiras. A primeira é a seleção e atribuição aleatórias, que
são úteis em estudos com n grandes . A aleatoriedade em tais estudos satisfaz
automaticamente a independência condicional; é um procedimento muito mais
fácil do que selecionar observações intencionalmente para satisfazer a
homogeneidade da unidade. A aleatoriedade nos garante que nenhuma variável
relevante é omitida e que não estamos selecionando observações por alguma
regra correlacionada com a variável dependente (depois de controlar as
variáveis explicativas). O procedimento também garante que os vieses do
pesquisador não entrem no processo de seleção e, assim, enviesem os
resultados. O segundo método é de seleção intencional de observações, que
recomendamos para estudos pequenos . As inferências em estudos de n
pequenos que dependem da seleção intencional para fazer inferências causais
razoáveis quase sempre serão mais arriscadas e mais dependentes das
opiniões anteriores do investigador sobre o mundo empírico do que as
inferências em estudos de n grandes usando aleatoriedade. E os controles podem introduzir uma variedade de vieses sutis.
No entanto, pelas razões expostas, os controles são necessários com um
pequeno estudo n. Com controles apropriados - nos quais as variáveis de
controle são mantidas constantes, talvez por correspondência - podemos
precisar estimar o efeito causal de apenas uma única variável explicativa,
aumentando assim a alavancagem que temos sobre um problema.
5.7 CONSIDERAÇÕES FINAIS
Esperamos que os conselhos que oferecemos neste e no capítulo anterior

sejam úteis para pesquisadores qualitativos, mas não constituem receitas que
sempre podem ser aplicadas de forma simples. Problemas reais geralmente
vêm em grupos, em vez de sozinhos. Por exemplo, suponha que um
pesquisador tenha um viés de seleção menor, algum erro de medição aleatório
na variável dependente e uma importante variável de controle que pode ser
medida apenas ocasionalmente. Seguir os conselhos acima sobre o que fazer
em cada caso fornecerá algumas orientações sobre como proceder. Mas neste
e em outros casos complicados, os estudiosos se engajaram em pesquisas qualitativas.

precisam refletir cuidadosamente sobre os problemas metodológicos
específicos levantados em suas pesquisas. Pode ser útil para eles considerar
modelos formais de pesquisa qualitativa semelhantes aos que fornecemos
aqui, mas que estejam sintonizados com os problemas específicos de suas
pesquisas. Grande parte do insight por trás desses modelos formais mais
sofisticados existe na literatura estatística e, portanto, nem sempre é
necessário desenvolvê-lo por conta própria.
Auxiliado ou não por modelos formais, o pesquisador qualitativo deve dar
atenção explícita a essas questões metodológicas. Questões metodológicas
são tão relevantes para pesquisadores qualitativos que buscam fazer
inferências causais quanto para seus colegas orientados quantitativamente.
CAPÍTULO 6
Aumentando o Número de Observações
NESTE LIVRO enfatizamos a importância crucial de maximizar a influência

sobre os problemas de pesquisa. A principal maneira de fazer isso é encontrar
o maior número possível de implicações observáveis de sua teoria e fazer
observações dessas implicações. Como enfatizamos, o que pode parecer um
estudo de caso único, ou um estudo de apenas alguns casos, pode de fato
conter muitas observações potenciais, em diferentes níveis de análise, que
são relevantes para a teoria que está sendo avaliada. Ao aumentar o número
de observações, mesmo sem mais coleta de dados, o pesquisador pode
muitas vezes transformar um problema intratável que tem um projeto de
pesquisa indeterminado em um problema tratável. Este capítulo final oferece
conselhos sobre como aumentar o número de observações relevantes em
um estudo científico social.
Começaremos analisando os problemas inerentes envolvidos na pesquisa
que lidam com apenas uma única observação - o problema n = 1. Mostramos
que se realmente houver apenas uma única observação, é impossível evitar
o Problema Fundamental da Inferência Causal. Mesmo em instâncias
supostas de teste de caso único, o pesquisador deve examinar pelo menos
um pequeno número de observações dentro de “casos” e fazer comparações
entre eles. No entanto, a comparação disciplinada até mesmo de um pequeno
número de estudos de caso comparáveis, produzindo observações
comparáveis, pode sustentar a inferência causal.
Nossa análise de projetos de observação única na seção 6.1 pode parecer
pessimista para o pesquisador de estudo de caso. No entanto, como um
caso pode realmente conter muitas observações potenciais, o pessimismo é
realmente injustificado, embora uma busca persistente por mais observações
seja de fato justificada. Depois de termos criticado projetos de observação
única e, assim, fornecido uma forte motivação para aumentar o número de
observações, discutiremos quantas observações são suficientes para atingir
níveis satisfatórios de certeza (seção 6.2). Finalmente, na seção 6.3,
mostraremos que quase qualquer projeto de pesquisa qualitativa pode ser
reformulado em um com muitas observações, e que isso pode ser feito com
frequência sem a coleta de dados dispendiosa adicional se o pesquisador
conceituar apropriadamente as implicações observáveis que já foram
coletadas. .
Projetos de observação única · 209
6.1 PROJETOS DE OBSERVAÇÃO ÚNICA PARA

INFERÊNCIA CAUSAL
O problema mais difícil em qualquer pesquisa ocorre quando o analista tem apenas
uma única unidade com a qual avaliar uma teoria causal, ou seja, onde n = 1.
Começaremos uma discussão desse problema nesta seção e argumentaremos que
lidar com ele com sucesso é extremamente improvável. Fazemos isso primeiro
analisando o argumento do artigo clássico de Harry Eckstein sobre estudos de caso
cruciais (seção 6.1.1). Passaremos então a um caso especial disso, raciocinando
por analogia, na seção 6.1.2.
6.1.1 Estudos de Caso “Cruciais”
Eckstein argumentou convincentemente que deixar de especificar claramente as

condições sob as quais padrões específicos de comportamento são esperados torna
impossível que os testes de tais teorias falhem ou sejam bem-sucedidos (Eckstein 1975).
Concordamos com Eckstein que os pesquisadores precisam buscar teorias que façam
previsões precisas e precisam testá-las em dados do mundo real.
No entanto, Eckstein vai além, afirmando que, se tivermos uma teoria que faça
previsões precisas, um estudo de “caso crucial” – com o que ele quer dizer um estudo
baseado apenas em “uma única medida em qualquer variável pertinente” (o que
chamamos de observação única) - pode ser usado para fins explicativos. O ponto
principal do capítulo de Eckstein é seu argumento de que “estudos de caso . . . [são]
mais valiosos em . . . o estágio no qual as teorias candidatas são 'testadas'” (1975:80).
Em particular, ele argumenta (1975:127) que “um único caso crucial pode certamente
marcar um nocaute limpo sobre uma teoria”. Estudos de casos cruciais, para
Eckstein, podem permitir que teorias suficientemente precisas sejam refutadas por
uma observação. Em particular, se o investigador escolher um estudo de caso que,
a priori, pareça improvável estar de acordo com as previsões teóricas – uma
observação “menos provável” – mas a teoria se mostrar correta independentemente
disso, a teoria terá passado por um teste difícil. , e teremos motivos para apoiá-lo com
maior confiança. Por outro lado, se as previsões do que parece ser uma teoria
implausível estão de acordo com as observações de uma observação “mais provável”,
a teoria não terá passado por um teste rigoroso, mas terá sobrevivido a uma
“sondagem de plausibilidade” e pode ser digna de um exame mais minucioso. .
O argumento de Eckstein é bastante valioso, particularmente o conselho que os

investigadores devem entender se devem avaliar sua teoria em uma observação
“menos provável” ou “mais provável”. Quão forte será nossa inferência sobre a
validade de nossa teoria depende em grande parte da dificuldade do teste em que a
teoria passou ou falhou.
No entanto, o argumento de Eckstein para testar usando uma observação crucial
210 · Aumentando o Número de Observações

ção é inconsistente com o Problema Fundamental da Inferência Causal.
Portanto, acreditamos que o argumento de Eckstein está errado se “caso” for
usado como ele define esse termo, o que chamamos de observação única.1
Por três razões, duvidamos que um estudo de observação crucial possa
servir ao propósito explicativo que Eckstein lhe atribui: (1) muito poucas
explicações dependem de apenas uma variável causal; para avaliar o impacto
de mais de uma variável explicativa, o investigador precisa de mais de uma
implicação observada; (2) a medição é difícil e não perfeitamente confiável; e
(3) a realidade social não é razoavelmente tratada como sendo produzida por
processos determinísticos, então erros aleatórios apareceriam mesmo se a
medição fosse perfeita.
1. Explicações Alternativas. Suponha que começamos um estudo de caso com

a hipótese de que um fator explicativo particular é responsável pelo resultado
observado. No entanto, no decorrer de nossa pesquisa, descobrimos uma
possível explicação alternativa para o resultado. Nesta situação, precisamos
estimar dois efeitos causais – o efeito hipotético original e a explicação
alternativa – mas temos apenas uma observação e, portanto, claramente, um
projeto de pesquisa indeterminado (seção 4.1). Além disso, mesmo se usarmos
a abordagem de correspondência (que geralmente é uma estratégia valiosa),
não podemos testar explicações causais com uma única observação. Suponha
que pudéssemos criar uma correspondência perfeita em todas as variáveis
relevantes (uma circunstância que é muito improvável nas ciências sociais).
Ainda precisaríamos, no mínimo, comparar duas unidades para observar
qualquer variação na variável explicativa; uma inferência causal válida que
testa hipóteses alternativas com base em apenas uma comparação seria, portanto, impossível.
2. Erro de medição. Mesmo se tivéssemos uma teoria que fizesse previsões
fortes e determinadas, ainda enfrentaríamos o problema de que nossa medição
relativa a essa previsão é, como todas as medições, provavelmente conter
erros de medição (consulte a seção 5.1). Em uma única observação, um erro
de medição pode nos levar a rejeitar uma hipótese verdadeira, ou vice-versa.
Teorias precisas podem exigir medições mais precisas do que o estado atual
de nossas inferências descritivas permite. Se tivermos muitas observações,
podemos reduzir a magnitude e a consequência do erro de medição por meio
da agregação; mas em uma única observação, sempre há alguma possibilidade
de que o erro de medição seja crucial para levar a uma conclusão falsa.
3. Determinismo. A razão final e talvez a mais decisiva para a inadequação dos

estudos baseados em uma única implicação observável diz respeito à medida
em que o mundo é determinístico. Se o mundo fosse determinado
1 No entanto, como argumentaremos abaixo, Eckstein parece reconhecer a fraqueza de
seu argumento, o que o leva a realmente pedir não a refutação de observação única, mas
observações múltiplas.
Projetos de observação única · 211
tic e a observação produziu uma medida inconsistente com a teoria, então poderíamos
dizer com certeza que a teoria era falsa. Mas para qualquer teoria social interessante,
sempre existe a possibilidade de algumas variáveis desconhecidas omitidas, o que
pode levar a um resultado imprevisível, mesmo que o modelo básico da teoria esteja
correto. Com apenas uma implicação da teoria causal observada, não temos base
para decidir se a observação confirma ou refuta uma teoria ou é o resultado de algum
fator desconhecido. Mesmo tendo duas observações e um experimento perfeito,
variando apenas um fator explicativo e gerando apenas uma observação de diferença
entre duas observações idênticas sobre a variável dependente, teríamos que
considerar a possibilidade de que, em nosso mundo probabilístico, algumas
observações não sistemáticas, fator acaso levou à diferença no efeito causal que é
observado. Não importa se o mundo é inerentemente probabilístico (no sentido da
seção 2.6) ou simplesmente se não podemos controlar todas as possíveis variáveis
omitidas. Em ambos os casos, nossas previsões sobre relacionamentos sociais
podem ser apenas probabilisticamente precisas. Eckstein, de fato, concorda que
fatores aleatórios afetam qualquer estudo:
A possibilidade de um resultado ser devido ao acaso nunca pode ser descartada

em nenhum tipo de estudo; mesmo em amplo estudo comparativo, é apenas mais
ou menos provável. . . . A diferença real entre o estudo de observação crucial e o
estudo comparativo, portanto, é que no último caso, mas não no primeiro, podemos
atribuir por várias convenções um número específico à probabilidade de resultados
aleatórios (por exemplo, “significativo no nível 0,05 ”).
Eckstein certamente está certo ao dizer que é uma prática comum relatar a
probabilidade específica de um achado casual apenas para estudos de n grandes.
No entanto, é essencial considerar as chances de ocorrências aleatórias em todos os
estudos com grande ou pequeno número de observações.2
Em geral, concluímos, a observação isolada não é uma técnica útil para

testar hipóteses ou teorias. Há, no entanto, uma qualificação. Mesmo
quando temos um estudo “puro” de observação única com apenas uma
observação em todas as variáveis relevantes, uma única observação pode
ser útil para avaliar explicações causais se fizer parte de um programa de
pesquisa. Se houver outras observações únicas, talvez coletadas por
outros pesquisadores, com as quais possa ser comparada, não é mais
uma observação única - mas esse é apenas o nosso ponto. Não devemos
confundir a lógica da explicação com o processo pelo qual a pesquisa é
feita. Se dois pesquisadores conduzem estudos de observação única,
podemos ficar com uma comparação pareada e uma inferência causal válida – se assumirmos
2 A pesquisa de sociologia comparada conduzida por Bollen, Entwisle e Alderson (no
prelo) mostra que praticamente todos os livros e artigos que eles analisaram atribuíram
algum papel ao acaso, mesmo aqueles que conscientemente usam o método da diferença de Mill.

que reúnam material de maneira sistemática e comparável e que compartilhem
seus resultados de alguma forma. E, claro, os estudos de observação única
também podem fazer contribuições importantes para resumir detalhes
históricos ou inferência descritiva, mesmo sem a comparação (ver seção 2.2).
Obviamente, um estudo de caso que contém muitas implicações observáveis,
como a maioria, não está sujeito aos problemas discutidos aqui.
6.1.2 Raciocínio por analogia
Os perigos de projetos de observação única são particularmente bem ilustrados

por referência a uma forma comum de correspondência usada por formuladores
de políticas e alguns analistas políticos que buscam entender eventos políticos:
raciocínio por analogia (ver Khong 1992). O uso adequado de uma analogia é
essencialmente o mesmo que manter outras variáveis constantes por meio de
correspondência. Nossa hipótese causal é que, se duas unidades são iguais
em todos os aspectos relevantes (ou seja, nós as combinamos com sucesso
ou - em outras palavras - encontramos uma boa analogia), valores semelhantes
nas variáveis explicativas relevantes resultarão em valores semelhantes em a
variável dependente. Se nossa correspondência fosse perfeita, e se não
houvesse erro aleatório no mundo, saberíamos que a situação de crise que o
País B enfrenta atualmente (que coincide com a situação do País A no ano
passado) causará o mesmo efeito observado no País A .
Expressando desta forma, podemos ver que o “raciocínio analógico” pode ser
apropriado.
No entanto, o raciocínio analógico nunca é melhor do que a análise
comparativa que o envolve. Assim como nos estudos comparativos em geral,
sempre fazemos melhor (ou, no extremo, não pior) com mais observações
como base de nossa generalização. Por exemplo, o que aconteceu no país A
pode ser o resultado de fatores estocásticos que poderiam ter ocorrido se
tivéssemos baseado nossas previsões em crises em cinco outras nações
correspondentes. E como em todos os estudos que usam pareamento, a
analogia é tão boa quanto o pareamento. Se a correspondência estiver
incompleta – se houver variáveis relevantes omitidas – nossas estimativas dos efeitos causais podem estar erradas.
Assim, como em todas as pesquisas em ciências sociais e em todas as
previsões, é importante que sejamos o mais explícito possível sobre o grau de
incerteza que acompanha nossa previsão. Em geral, somos sempre bem
aconselhados a olhar além de uma única observação análoga, por mais
próxima que pareça. Ou seja, a abordagem comparativa – na qual combinamos
evidências de muitas observações, mesmo que algumas delas não sejam
analogias muito próximas da situação atual – é sempre pelo menos tão boa e
geralmente melhor do que a analogia. A razão é simples: a analogia usa uma
única observação para prever outra, enquanto a abordagem comparativa usa uma
Quantos são suficientes? · 213

combinação ponderada de um grande número de outras observações. Desde
que essas observações adicionais tenham algumas características semelhantes
de alguma forma, embora pequenas, ao evento que estamos prevendo e
estejamos usando essas informações adicionais de maneira razoável, elas
ajudarão a fazer uma previsão mais precisa e eficiente. Portanto, se formos
tentados a usar analogias, devemos pensar de forma mais ampla em termos
comparativos, conforme discutimos abaixo na seção 2.1.3.3
6.2 QUANTAS OBSERVAÇÕES SÃO SUFICIENTES?
Nesse ponto, o pesquisador qualitativo pode fazer a pergunta quantitativa:

quantas observações são suficientes? A questão tem implicações substanciais
para avaliar os estudos existentes e projetar novas pesquisas. A resposta
depende muito do projeto de pesquisa, da inferência causal que o investigador
está tentando estimar e de algumas características do mundo que não estão
sob o controle do investigador.
Respondemos a essa pergunta aqui com outro modelo formal muito simples
de pesquisa qualitativa. Usando o mesmo modelo de regressão linear que
usamos extensivamente nos capítulos 4 e 5, focamos a atenção no efeito causal
de uma variável (x1). Todas as outras variáveis são tratadas como controles,
que são importantes para evitar viés de variável omitida ou outros problemas. É
fácil expressar o número de unidades necessárias em uma determinada situação
por meio de uma fórmula simples
s2
n = ______________ (6.1)
(1 ÿ R2 1)S2 x1V(b1)
cujo conteúdo explicamos agora.

O símbolo n, é claro, é o número de observações nas quais os dados devem
ser coletados. É calculado neste modelo formal com base em s2, V(b1), R2
Cada uma dessas 1, e S2 x1.
quatro quantidades tem significados muito importantes e
cada uma afeta o número de observações que o pesquisador qualitativo deve
coletar para chegar a uma inferência válida.
Derivamos a equação (6.1) sem suposições além daquelas que já introduzimos.4
Descrevemos estas agora em ordem crescente de possibilidade de sermos
influenciados pelo pesquisador: (1) A variabilidade fundamental s2, (2) incerteza
da inferência causal V (b1), (3) relativo
3 Kahneman, Slovic e Tversky (1982) descrevem uma falácia psicológica de raciocínio que ocorre
quando os tomadores de decisão, sob incerteza, escolhem analogias com base na atualidade ou na
disponibilidade, portanto julgamentos sistematicamente enviesados. Eles chamam isso de “heurística de
disponibilidade”. Ver também Keane (1988).
4 As suposições são de que E(Y) = X1b1 + Xb, V(Y) = s2, não há multicolinearidade,
e todas as expectativas são implicitamente condicionadas a X.
colinearidade entre a variável causal e as variáveis de controle R2 e (4) a variância

1,
dos valores da variável causal chave S2 5x1 .
1. Variabilidade fundamental ÿ2. Quanto maior a variabilidade fundamental, ou

variabilidade inexplicável na variável dependente (conforme descrito na seção
2.6), mais observações devem ser coletadas para alcançar uma inferência
causal confiável. Isso deve ser relativamente intuitivo, pois mais ruído no sistema
torna mais difícil encontrar um sinal claro com um número fixo de observações.
A coleta de dados em mais unidades pode aumentar nossa alavancagem o
suficiente para encontrarmos padrões causais sistemáticos.
De maneira diretamente análoga, um estimador mais ineficiente também
exigirá mais coleta de dados. Um exemplo dessa situação é quando a variável
dependente possui erro de medição aleatório (seção 5.1.2.1).
Do ponto de vista do analista, esse tipo de erro de medição geralmente equivale
a uma variabilidade fundamental adicional, uma vez que nem sempre os dois
podem ser distinguidos. Assim, uma variabilidade mais fundamental (ou, de
forma equivalente, estimativas menos eficientes) exige que coletemos mais dados.
Embora o pesquisador não possa ter influência sobre a variabilidade
fundamental existente no mundo, essa informação é bastante relevante em dois
aspectos. Primeiro, quanto mais sabemos sobre um assunto, menor é essa
variabilidade fundamental (ou inexplicável) (presumivelmente até algum limite
positivo); assim, menos observações precisam ser coletadas para aprender algo
novo. Por exemplo, se soubéssemos muito sobre as causas dos resultados de
várias batalhas durante a guerra revolucionária americana, precisaríamos de
relativamente menos observações (batalhas) para estimar o efeito causal de
alguma variável explicativa recém-hipotetizada.
Em segundo lugar, mesmo que a compreensão do grau de variabilidade
fundamental não nos ajude a reduzir o número de observações para as quais
devemos coletar dados, seria de grande ajuda para avaliar com precisão a
incerteza de qualquer inferência feita. Isso deve ficar claro na equação (6.1),
pois podemos resolver facilmente a incerteza no efeito causal V(b1) como uma
função das outras quatro quantidades (se conhecermos n e as outras
quantidades, exceto a incerteza do estimativa causal). Isso significa que com
esse modelo formal podemos calcular o grau de incerteza de uma inferência
causal usando informações sobre o número de observações, a variabilidade
fundamental, a variância da variável explicativa causal e a relação entre essa
variável e as variáveis de controle.
2. Incerteza da Inferência Causal V(b1). V(bj) no denominador da equação (6.1)
demonstra o ponto óbvio de que quanto mais incerteza estamos dispostos a
tolerar, menos observações precisamos coletar. Em
5
Tecnicamente, s2 é a variância da variável dependente, condicionada a todas as
variáveis explicativas V(YX); V(b1) é o quadrado do erro padrão da estimativa de 2 é o
todo o efeito causal de R2 calculado a partir de uma regressão auxiliar de X1 sobre
X1; R1 as variáveis de controle; e S2
x1 é a variância amostral de X1.
Quantos são suficientes? · 215
áreas onde qualquer novo conhecimento adquirido é muito importante, podemos

ser capazes de fazer contribuições sérias coletando relativamente poucas
observações. Em outras situações onde já se sabe muito, e um novo estudo
dará uma contribuição importante apenas se tiver certeza considerável,
precisaremos de relativamente mais observações para convencer as pessoas
de um novo efeito causal (ver seção 1.2.1).
3. Colinearidade entre a variável causal e as variáveis de controle Se a variável
R21.causal não estiver correlacionada com quaisquer outras variáveis para as
quais estamos controlando, incluir essas variáveis de controle, que podem ser
necessárias para evitar viés de variável omitida ou outros problemas, não afeta
o número de observações que precisam ser coletadas.
No entanto, quanto maior a correlação entre a variável causal e quaisquer outras
variáveis que estamos controlando, mais demandas o projeto de pesquisa está
colocando nos dados e, portanto, maior o número de observações que precisam
ser coletadas para alcançar o mesmo nível de certeza.
Por exemplo, suponha que estamos conduzindo um estudo para ver se as

mulheres recebem salário igual para trabalho igual em alguma empresa. Não
temos acesso oficial e, portanto, só podemos entrevistar as pessoas
informalmente. Nossa variável dependente é o salário anual de um funcionário,
e a principal variável explicativa é o gênero. Uma das variáveis de controle
importantes é a raça. No extremo, se todos os homens no estudo forem negros
e todas as mulheres forem brancas, não teremos influência para fazer a inferência
causal: será impossível encontrar qualquer efeito de gênero após o controle de
raça. O gênero torna-se assim uma constante nesta amostra. Portanto, este é
um exemplo de multicolinearidade, um desenho de pesquisa indeterminado
(seção 4.1); mas observe o que acontece quando a colinearidade é alta, mas
não perfeita. Suponha, por exemplo, que coletamos informações sobre quinze
funcionários e todos os homens, exceto um, são negros e todas as mulheres
são brancas. Nessa situação, o efeito do gênero, enquanto a raça é controlada,
baseia-se inteiramente na única observação restante que não é perfeitamente colinear.
Portanto, na situação geral, como neste exemplo, quanto mais colinearidade
entre a variável explicativa causal e as variáveis de controle, mais desperdiçamos
observações. Assim, precisamos de mais observações para atingir um nível fixo
de incerteza. Este ponto fornece conselhos práticos importantes para o
planejamento da pesquisa, uma vez que muitas vezes é possível selecionar
observações de modo a manter baixa a correlação entre a variável causal e as
variáveis de controle. No presente exemplo, precisaríamos apenas entrevistar
mulheres negras e homens brancos em número suficiente para reduzir essa
correlação.
4. A Variância dos Valores da Variável Explicativa Causal S2 x1.
Finalmente, quanto maior a variância dos valores da variável explicativa causal,
menos observações precisamos coletar para atingir um nível fixo de certeza em
relação a uma inferência causal.
Este resultado, como o anterior, tem implicações práticas, pois, selecionando

adequadamente as observações, podemos reduzir a necessidade de um grande
número de observações. Precisamos apenas nos concentrar na escolha de
observações com uma ampla gama de valores na variável causal chave. Se
estivermos interessados no efeito sobre o crime da educação mediana em uma
comunidade, é melhor escolher algumas comunidades com valores de educação
muito baixos e alguns com valores muito altos. Seguir este conselho significa que
podemos produzir uma inferência causal com um nível fixo de certeza com menos
trabalho coletando menos observações.
O modelo formal aqui assume que o efeito que estamos estudando é linear. Ou
seja, quanto maiores os valores das variáveis explicativas, maior (ou menor) é o
valor esperado da variável dependente. Se a relação não for linear, mas ainda
aproximadamente monotônica (ou seja, não decrescente), os mesmos resultados
se aplicam. Se, em vez disso, o efeito for distintamente não linear, pode ser que os
níveis intermediários da variável explicativa tenham um resultado totalmente diferente.
Por exemplo, suponha que o estudo baseado apenas em valores extremos da
variável explicativa não encontre efeito: o nível educacional de uma comunidade não
tem efeito sobre o crime. Mas, de fato, pode ser que apenas níveis médios de
educação reduzam os níveis de criminalidade em uma comunidade. Para a maioria
dos problemas, essa qualificação não se aplica, mas devemos ter o cuidado de
especificar exatamente as suposições que estamos afirmando ao planejar a pesquisa.
Ao prestar atenção à variabilidade fundamental, incerteza, colinearidade e à

variância dos valores da variável causal, podemos obter uma alavancagem
consideravelmente maior de um pequeno número de unidades. No entanto, ainda é
razoável fazer a pergunta que dá título a esta seção: quantas observações são
suficientes? Para esta pergunta, não podemos fornecer uma resposta precisa que
sempre se aplicará. Como mostramos com o modelo formal discutido aqui, a resposta
depende de quatro informações separadas, cada uma das quais varia de acordo
com os projetos de pesquisa.
Além disso, a maioria das situações de pesquisa qualitativa não se encaixa
exatamente nesse modelo formal, embora as intuições básicas se apliquem de
maneira muito mais geral.
Quanto mais melhor, mas quantos são necessários? Na situação menos
complicada, aquela com baixos níveis de variabilidade fundamental, alta variância na
variável causal, nenhuma correlação entre a variável causal e as variáveis de
controle e uma exigência de níveis razoavelmente baixos de certeza, poucas
observações serão necessárias - provavelmente mais de cinco, mas menos de vinte.
Novamente, uma resposta precisa depende de uma especificação precisa do modelo
formal e de um valor preciso para cada um de seus componentes. Infelizmente, a
pesquisa qualitativa quase nunca é, por definição, tão precisa e, portanto, nem
sempre podemos reduzi-la a uma única resposta.
Fazendo Muitos de Poucos · 217

Felizmente, muitas vezes é possível evitar esses problemas aumentando o
número de observações. Às vezes, esse aumento envolve a coleta de mais
dados, mas, como argumentamos na próxima seção, um projeto de pesquisa
qualitativa pode frequentemente ser reconceituado para extrair muito mais
observações dele e, assim, produzir um projeto muito mais poderoso, um
assunto ao qual agora vez.
6.3 FAZENDO MUITAS OBSERVAÇÕES DE POUCOS
Enfatizamos as dificuldades inerentes à pesquisa baseada em um pequeno

número de observações e fizemos várias sugestões para melhorar os projetos
de tal pesquisa. No entanto, o leitor deve ter notado que descrevemos a maioria
dessas sugestões como “segundas melhores” – úteis quando o número de
observações é limitado, mas não tão valiosas quanto a estratégia de aumentar
o número de observações.6 Como apontamos, essas soluções de segunda
melhor são valiosas porque muitas vezes não podemos reunir mais observações
do tipo que queremos analisar: pode haver apenas algumas instâncias do
fenômeno em que estamos interessados, ou pode ser muito caro ou árduo
investigar mais do que o algumas observações que reunimos. Nesta seção,
discutimos várias abordagens para aumentar o número de nossas observações.
Essas abordagens são úteis quando nos deparamos com o que parece ser um
pequeno número de observações e não temos tempo ou recursos para continuar
coletando observações adicionais. Especificamos várias maneiras pelas quais
podemos aumentar o número de observações relevantes para nossa teoria,
redefinindo sua natureza. Essas estratégias de pesquisa aumentam o n
enquanto ainda mantêm o foco diretamente nas evidências a favor ou contra a
teoria. Como enfatizamos, muitas vezes eles são úteis mesmo depois de
terminarmos a coleta de dados.
Conforme discutimos na seção 2.4, Harry Eckstein (1975) define um caso
como “um fenômeno para o qual relatamos e interpretamos apenas uma única
medida em qualquer variável pertinente”. Como a palavra “caso” tem sido usada
de tantas maneiras diferentes nas ciências sociais, preferimos nos concentrar
nas observações. Definimos uma observação como uma medida de uma
variável dependente em uma unidade (e para quantas medidas de variáveis
explicativas estiverem disponíveis nessa mesma unidade). As observações são
os componentes fundamentais da pesquisa empírica em ciências sociais: nós
as agregamos para fornecer as evidências nas quais confiamos para avaliar
nossas teorias. Como indicamos no capítulo 2, em qualquer projeto de pesquisa
não estudamos de fato fenômenos completos como a França, a Rev.
6 A conveniência de aumentar o número de observações é comumente expressa na

literatura sobre o método comparativo. Lijphart (1971) faz uma análise particularmente forte
caso.

solução, a eleição americana de 1992 ou a decisão do Iraque de invadir o
Kuwait. Em vez disso, abstraímos aspectos desses fenômenos – conjuntos de
variáveis explicativas e dependentes – que são especificados por nossas
teorias; identificamos as unidades às quais essas variáveis se aplicam; e
fazemos observações de nossas
variáveis, nas unidades.7 O material que usamos para avaliar nossas teorias
consiste, portanto, em um conjunto de observações de unidades com relação a
variáveis relevantes. A questão abordada aqui é como aumentar o número de
observações. Todas as maneiras de fazer isso começam com a teoria ou hipótese que estamos testando.
O que devemos fazer é perguntar: quais são as possíveis implicações
observáveis de nossa teoria ou hipótese? E quantas instâncias podemos
encontrar nas quais essas implicações observáveis podem ser testadas? Se
quisermos mais observações para testar a teoria ou hipótese, podemos obtê-las
de uma das três maneiras: podemos observar mais unidades, fazer novas e
diferentes medidas das mesmas unidades, ou ambos - observar mais unidades
usando novas medidas. Em outras palavras, podemos realizar medidas
semelhantes em unidades adicionais (que descrevemos na seção 6.3.1),
podemos usar as mesmas unidades, mas alterar as medidas (seção 6.3.2), ou
podemos alterar as medidas e as unidades ( seção 6.3.3). A primeira abordagem
pode ser considerada uma replicação completa de nossa hipótese: usamos as
mesmas variáveis explanatórias e dependentes e as aplicamos a novas
instâncias. A segunda abordagem envolve uma replicação parcial de nossa
teoria ou hipótese que usa uma nova variável dependente, mas mantém as
mesmas variáveis explicativas. E a terceira abordagem sugere uma nova (ou
bastante revisada) hipótese implícita em nossa teoria original que usa uma nova
variável dependente e aplica a hipótese a novas instâncias . estudo de caso”
para observar muitas implicações separadas de nossa teoria. De fato, um único
caso geralmente envolve várias medidas das variáveis-chave; portanto, por
nossa definição, contém múltiplas observações.9
7 Concordamos com as observações de William Baumol (1990:1715) sobre a história

econômica: “Muitos historiadores econômicos armam uma armadilha para si mesmos
quando tentam explicar desenvolvimentos históricos particulares em sua totalidade. O
escritor que procura descrever as “cinco causas principais” do climatério britânico do final
do século XIX, ou da depressão econômica européia de 1847, assume uma tarefa impossível.
As ciências naturais, com todas as suas realizações e conhecimentos acumulados, ainda
depositam grande confiança em experimentos controlados e , portanto, concentram-se na
influência de uma ou algumas variáveis de cada vez. Os cientistas concentram sua busca
no que são, de fato, derivadas parciais, em vez de procurar explicar fenômenos complexos
da realidade em sua totalidade”.
8 Também podemos manter a mesma variável dependente, mas alterar as variáveis explicativas.
No entanto, na maioria das situações, essa estratégia é usada para evitar erros de medição
usando várias medidas da mesma variável explicativa subjacente.
9 Às vezes, os pesquisadores conduzem estudos que são descritos como réplicas de estudos anteriores
6.3.1 Mesmas Medidas, Novas Unidades
Obter observações adicionais usando a mesma estratégia de medição é a maneira padrão

de aumentar o número de observações. Aplicamos a mesma teoria ou hipótese, usando
essencialmente as mesmas variáveis, a mais instâncias do processo que a teoria descreve.
As duas principais maneiras pelas quais podemos encontrar instâncias mais observáveis
do processo implícito em nossa teoria são por meio de variações “através do espaço” e por
meio de variações ao longo do tempo.
A abordagem usual para obter mais observações “através do espaço” é procurar outras
unidades semelhantes: adicionar Paquistão, Bangladesh e Sri Lanka à base de dados junto
com a Índia. Com tempo, dinheiro e habilidades suficientes, esse curso faz sentido. O
trabalho de Kohli sobre a Índia (discutido na seção 5.6) fornece um exemplo. Também
ilustra uma maneira pela qual ele supera o problema associado ao uso de três estados
indianos selecionados com base em valores conhecidos das variáveis independentes e
dependentes. Ele olha para duas outras unidades nacionais. Um deles é o Chile de Allende,
onde os programas de ajuda aos pobres falharam. Kohli argumenta que a ausência de uma
das três características que, segundo sua teoria, levam a programas de combate à pobreza
bem-sucedidos (no caso chileno, a ausência de um partido de reforma política bem
organizado) contribuiu para esse fracasso.10 A outra nação é o Zimbábue sob Robert
Mugabe, que, na época em que Kohli estava escrevendo seu livro, havia chegado ao poder
com um regime cujas características lembravam a orientação de redução da pobreza em
Bengala Ocidental. Os resultados, embora provisórios, pareciam consistentes com a teoria
de Kohli. Seu tratamento desses dois casos é superficial, mas eles são usados de maneira
apropriada como implicações observáveis adicionais de sua teoria.
Não é necessário, entretanto, que saiamos dos limites da unidade que estamos
estudando. Uma teoria cujo foco original fosse o estado-nação pode ser testada em
subunidades geográficas dessa nação: em estados, condados, cidades, regiões etc.
variável. Suponha que queremos testar uma teoria de agitação social que relaciona
pesquisa e não envolvem novas observações. Essencialmente, eles duplicam - ou tentam duplicar
- a pesquisa de outros para ver se os resultados podem ser reproduzidos. Pesquisadores
quantitativos tentarão reproduzir a análise de dados em um estudo anterior usando os mesmos
dados. Um historiador pode verificar as fontes usadas por outro historiador. Um etnógrafo pode
ouvir entrevistas gravadas em fita e verificar se as conclusões originais eram sólidas. Essa
atividade é muito útil, pois as evidências científicas devem ser reprodutíveis, mas não se enquadra
no que estamos sugerindo nestas seções, pois não implica novas observações.
10 Forças externas também levaram ao fracasso de Allende, mas Kohli atribui um papel
importante às internas.

mudanças nos preços agrícolas à agitação social. Uma unidade pode ser uma
única nação chamada “Índia”. Mas a “Índia” como um caso pode fornecer
inúmeras observações sobre a relação entre os preços agrícolas e a agitação
social se considerarmos as diferentes partes da Índia. Sem sair do país que
estamos estudando, podemos aumentar o número de observações encontrando
replicações dentro daquele país do processo que está sendo estudado.
Estudantes de políticas sociais muitas vezes podem olhar para unidades

governamentais que são subunidades do estado nacional em que estão
interessados para testar suas hipóteses sobre as origens de vários tipos de
políticas. A análise de Kohli de três estados na Índia é um exemplo de uma
tendência comum em estudos de política para comparar estados, cidades ou
regiões. O conjunto original de observações de Kohli, no entanto, foram os três
estados indianos. Como indicamos, eles foram selecionados de tal forma que
não podem ser usados para testar sua hipótese sobre o efeito da estrutura do
regime na política de pobreza na Índia. No entanto, assim como ele usou outras
nações como unidades de observação, Kohli também supera muito do problema
de sua escolha original de unidades seguindo a estratégia de usar subunidades.
Ele desce para um nível de observação abaixo dos três estados indianos com
os quais começou aplicando sua hipótese aos panchayats locais (conselhos
governamentais locais no nível de distrito, quarteirão e aldeia), que são
subunidades dos estados. Os Panchayats variam consideravelmente em termos
de comprometimento dos líderes políticos com a política de pobreza e a
estrutura organizacional local. Assim, eles permitem testar o impacto dessa
variação nos resultados da política que ele usa como suas variáveis dependentes.
Subunidades que fornecem observações adicionais não precisam ser
geográficas. As teorias que se aplicam ao estado-nação também podem ser
testadas em agências governamentais ou no âmbito de decisões específicas –
o que pode ser feito sem a necessidade de visitar outro país. Um exemplo de
busca de implicações observáveis adicionais de uma hipótese em unidades não
geográficas adicionais pode ser encontrado em Verba et al. (em andamento).
No exemplo que apresentamos na seção 5.4, eles explicam o fato de que os
afro-americanos aprendem mais habilidades cívicas na igreja do que os latinos
com base na natureza das igrejas que frequentam; os primeiros frequentam
igrejas protestantes organizadas congregacionalmente, os últimos frequentam
igrejas católicas organizadas hierarquicamente. Os autores argumentam que,
se sua hipótese sobre o impacto da organização da igreja estiver correta, uma
diferença semelhante àquela entre fiéis católicos e protestantes deveria aparecer
se compararmos entre outras unidades da igreja, em particular entre
denominações protestantes diferenciadas pela organização da denominação.
Eles acham que os episcopais, que frequentam uma igreja hierarquicamente
organizada, são bastante semelhantes aos católicos na aquisição de habilidades
cívicas na igreja. O

O fato de que os episcopais são, em geral, um grupo mais educado e rico do que,
por exemplo, os batistas, mas praticam menos habilidades cívicas na igreja
acrescenta uma alavancagem adicional para confirmar sua hipótese causal.
Devemos ser cautelosos ao decidir se as novas unidades são apropriadas para
a replicação de nossa hipótese - isto é, se são unidades dentro das quais o
processo acarretado pela hipótese pode ocorrer. A validade da aplicação da
hipótese a outros tipos de unidades depende da teoria e hipótese envolvidas, bem
como da natureza das unidades. Se a variável dependente for a política de bem-
estar social, então os estados ou províncias são apropriados se puderem fazer tais
políticas.
Mas se estivermos estudando a política tarifária e todas as decisões tarifárias
forem tomadas pelo governo central, a unidade estadual ou provincial pode não
ser apropriada. Da mesma forma, não faria sentido estudar governos locais na
Índia ou no Paquistão para testar uma teoria sobre as condições sob as quais uma
unidade política escolhe desenvolver uma capacidade de armas nucleares – já
que o processo de fazer tais escolhas ocorre no governo central. . Para dar outro
exemplo, é plausível testar o impacto da mudança dos preços agrícolas na agitação
social nos estados indianos, mas implausível usar várias agências do governo
indiano para testar a relação. O processo em estudo não ocorre dentro das
agências. Em suma, se as subunidades são instâncias apropriadas para observar
uma teoria “em ação” depende da teoria. É por isso que aconselhamos começar
listando as implicações observáveis de nossa teoria, não procurando muitas
unidades possíveis independentemente da teoria. Só depois de especificada a
teoria é que podemos escolher as unidades a estudar.
Uma abordagem alternativa é considerar as observações ao longo do tempo. A

Índia de hoje e a Índia de uma década atrás podem fornecer dois exemplos do
processo de interesse. De fato, a maioria dos trabalhos descritos como “estudos
de caso” envolve múltiplas medidas de uma hipótese ao longo do tempo.
Acreditamos que nosso conselho para expandir o número de observações
procurando por mais instâncias em subunidades ou considerando instâncias ao
longo do tempo é um dos conselhos mais úteis que temos para a pesquisa
qualitativa. Ele resolve o problema de n pequeno aumentando o n — sem exigir
viagens para outra nação, análise de uma decisão totalmente nova etc. No entanto,
é um conselho que deve ser seguido com cautela. Já expressamos uma
advertência: a nova instância deve ser aquela à qual a teoria ou hipótese se aplica,
ou seja, a subunidade deve de fato conter uma implicação observável da teoria.
Não precisa ser exatamente (ou mesmo aproximadamente) a implicação observável
na qual estamos imediatamente interessados; contanto que seja uma implicação
da mesma teoria, os dados organizados dessa maneira darão uma influência
adicional sobre a inferência causal.

Há outro problema do qual devemos estar cientes. Queremos usar essas
instâncias adicionais como novos testes de nossa teoria, mas as subunidades
ou as várias instâncias encontradas ao longo do tempo podem não representar
testes independentes da teoria. Assim, como George (1982:20-23) reconhece,
cada novo “caso” não traz tanta informação nova para lidar com o problema
como traria se as observações fossem independentes umas das outras. A
dependência entre as observações não desqualifica esses novos testes, a
menos que a dependência seja perfeita — isto é, a menos que possamos prever
perfeitamente os novos dados a partir dos dados existentes. Além desse caso
improvável, existem pelo menos algumas novas informações nos novos dados
e isso ajudará a analisar esses dados. Essas novas observações, baseadas
em informações não independentes, não acrescentam tanta informação quanto
as observações totalmente independentes, mas ainda podem ser úteis.
Esta conclusão tem duas implicações práticas. Primeiro, ao lidar com
observações parcialmente dependentes, devemos ter cuidado para não exagerar
a certeza das conclusões. Em particular, não devemos tratar esses dados como
fornecendo tantas observações quanto teríamos obtido de observações
independentes. Em segundo lugar, devemos analisar cuidadosamente as razões
da dependência entre as observações. Freqüentemente, a dependência resultará
de uma ou de uma série de variáveis omitidas muito interessantes e
possivelmente confusas. Por exemplo, suponha que estejamos interessados na
participação política dos cidadãos nos condados dos Estados Unidos. Os
condados vizinhos podem não ser independentes devido ao deslocamento
transfronteiriço, à mobilidade residencial ou aos valores socioeconômicos e
políticos semelhantes das pessoas que vivem nos condados vizinhos.
A coleta de dados de municípios vizinhos certamente agregará alguma
informação a um estudo, embora não tanto quanto se os municípios fossem
totalmente independentes daqueles sobre os quais já coletamos dados.
Para outro exemplo, considere a relação entre mudanças nos preços agrícolas
e agitação social. Podemos testar essa relação em vários estados indianos. Em
cada um medimos os preços agrícolas, bem como a agitação social. Mas os
estados não são unidades experimentais isoladas. Os valores da variável
dependente podem ser afetados, não apenas pelos valores das variáveis
explicativas que medimos dentro de cada unidade, mas também pelos valores
das variáveis omitidas fora da unidade. A agitação social em um estado pode
ser desencadeada pelos preços agrícolas (como previsto por nossa teoria), mas
essa agitação social pode influenciar diretamente a agitação social em um
estado vizinho (tornando-se apenas um teste parcialmente independente de
nossa teoria). Esta situação pode ser tratada controlando adequadamente esta
propagação. Um problema semelhante pode existir para a influência de um
período de tempo anterior em um período de tempo posterior. Poderíamos
replicar nossa análise na Índia uma década depois, mas o

a agitação social do período anterior pode ter um efeito direto no período posterior.
Esses exemplos ilustram que a replicação de uma análise em novas unidades nem
sempre implica um novo estudo importante. Se existirem observações adicionais dentro do
estudo atual que sejam da mesma forma que as observações já usadas para testar a
hipótese, elas podem ser usadas. Dessa forma, o pesquisador com um “estudo de caso”
pode descobrir que há muito mais observações do que ele pensou.11
6.3.2 Mesmas Unidades, Novas Medidas
Instâncias adicionais para o teste de uma teoria ou hipótese podem ser geradas mantendo
a mesma unidade de observação, mas alterando a variável dependente. Essa abordagem
envolve procurar muitos efeitos da mesma causa – uma técnica poderosa para testar uma
hipótese. Mais uma vez, começamos com uma teoria ou hipótese e perguntamos: supondo
que nossa teoria ou hipótese esteja correta, o que mais esperaríamos que nossas variáveis
explanatórias influenciassem além da variável dependente atual? Tal exercício pode sugerir
indicadores alternativos da variável dependente.
No capítulo 1, apontamos que uma determinada teoria da extinção dos dinossauros tem
implicações para a composição química das rochas. Portanto, mesmo uma teoria causal de
um único evento pré-histórico tinha múltiplas implicações observáveis que poderiam ser
avaliadas.
No exemplo que estamos usando de flutuação de preços agrícolas e agitação social,
podemos ter medido a agitação social pelo número de distúrbios públicos. Além da agitação
social, podemos perguntar o que mais se pode esperar se a teoria estiver correta. Talvez
existam outras medidas válidas de inquietação social — comportamento desviante de um
tipo ou de outro. Esta indagação poderá levar à hipótese de que outras variáveis seriam
afetadas, como o comportamento eleitoral, o investimento empresarial ou a emigração. O
mesmo processo que leva a flutuação de preços a gerar inquietação pode vincular a
flutuação de preços a esses outros resultados.
O trabalho de Robert Putnam (1993) sobre o impacto dos recursos sociais no desempenho
dos governos regionais na Itália adota uma abordagem semelhante. O desempenho
regional não é uma medida única. Em vez disso, Putnam usa uma ampla gama de variáveis
dependentes em sua tentativa de explicar as fontes de desempenho democrático efetivo
nas regiões italianas. Ele possui doze indicadores de desempenho institucional que buscam
medir
11 Pesquisadores quantitativos desenvolveram uma enorme variedade de técnicas
estatísticas poderosas para analisar dados que exibem o que é chamado de propriedades de
séries temporais ou autocorrelação espacial . Eles não apenas são capazes de corrigir esses
problemas, mas também encontraram maneiras de extrair informações exclusivas desses
dados. Ver Granger e Newbold (1977), Anselin (1988), Beck (1991) e King (1989; 1991c).

processos de políticas, pronunciamentos de políticas e implementação de políticas.
Além disso, ele usa medidas baseadas em pesquisas de avaliação dos cidadãos sobre o
desempenho do governo. Cada uma dessas medidas representa uma implicação
observável de sua teoria.
Como sugerimos anteriormente, o uso de unidades do governo subnacional para um
estudo da política tarifária seria inapropriado se as tarifas fossem fixadas pelo governo
central. Embora as variáveis explicativas – por exemplo, a natureza da indústria ou do
produto agrícola – possam variar entre os estados ou províncias, o processo de
determinação dos níveis tarifários (que é o que diz respeito à hipótese testada) não
ocorre nas unidades subnacionais. No entanto, se mudarmos a variável dependente para
ser o comportamento de voto dos representantes de diferentes estados ou províncias
em questões comerciais e tarifárias, podemos estudar o assunto. Dessa forma, podemos
acrescentar às instâncias em que opera o processo teórico.
6.3.3 Novas Medidas, Novas Unidades
Também podemos olhar além do conjunto de variáveis explicativas e dependentes que

foram aplicadas a um determinado conjunto de unidades para outras implicações
observáveis envolvendo novas variáveis e novas unidades. As medidas usadas para
testar o que são essencialmente novas hipóteses derivadas das originais podem ser bem
diferentes daquelas usadas até agora. O processo descrito pela nova teoria pode não se
aplicar ao tipo de unidade em estudo, mas sim a algum outro tipo de unidade - muitas
vezes a uma unidade em um nível de agregação inferior ou superior. A hipótese geral
sobre a ligação entre preços agrícolas e agitação pode sugerir hipóteses sobre incerteza
e agitação em outros tipos de unidades, como empresas ou agências governamentais.
Também pode sugerir hipóteses sobre o comportamento dos indivíduos. No exemplo da
relação entre flutuação de preços agrícolas e agitação social, podemos perguntar: “Se
nossa teoria sobre o efeito das flutuações de preços na agitação social (que já testamos
em várias unidades políticas) está correta, o que isso implica? para o comportamento de
empresas ou cooperativas agrícolas ou indivíduos (talvez no mesmo conjunto de
unidades políticas)? O que isso pode implicar, se houver, para a maneira como as
decisões de alocação são tomadas pelas agências governamentais? O que podemos
esperar em termos de reações psicológicas individuais à incerteza e o impacto de tais
estados psicológicos no comportamento desviante individual?”
Essa abordagem é particularmente útil quando não há instâncias de um processo

social potencialmente significativo para observarmos. Um exemplo está no estudo da
guerra nuclear. Desde uma guerra nuclear entre dois

poderes nunca ocorreu, não podemos observar os efeitos das variáveis
explicativas sobre a eclosão de tal guerra. Suponha que nossa teoria diga
que a presença de armas nucleares em ambos os lados impediu a guerra
total. Embora não haja instâncias a observar em relação à nossa hipótese
básica, uma hipótese mais específica pode implicar outras observações
potenciais. Por exemplo, podemos refletir que uma implicação de nossa
teoria é que a existência de armas nucleares em ambos os lados deveria
inibir ameaças severas de guerra total. Então, estudando a frequência e a
gravidade das ameaças entre díades nucleares e não nucleares e analisando
as ameaças conforme a probabilidade de guerra parecia aumentar durante
as crises, poderíamos encontrar outras implicações observáveis de nossa
teoria, que poderiam ser testadas.
O desenvolvimento de uma nova teoria ou hipótese, diferente mas
vinculada à teoria original, muitas vezes envolve mover-se para um nível
inferior de agregação e um novo tipo de unidade: não de uma unidade
política, como uma nação, para outra unidade política em um nível inferior.
nível de agregação, como uma província, mas de unidades políticas, como
nações ou províncias, para indivíduos que vivem dentro das unidades ou
para decisões individuais tomadas dentro das unidades. Diferentes teorias
podem implicar diferentes conexões entre variáveis que levam a um
determinado resultado: isto é, diferentes processos pelos quais o fenômeno foi produzido (Dessler 1991:345).
Antes de projetar testes empíricos, podemos ter que especificar um
“mecanismo causal”, envolvendo séries vinculadas de hipóteses causais que
indicam como as conexões entre as variáveis são feitas. Definir e, em
seguida, pesquisar esses diferentes mecanismos causais pode nos levar a
encontrar uma pletora de novas implicações observáveis para uma teoria.
(Na seção 3.2.1, distinguimos o conceito de mecanismos causais de nossa
definição mais fundamental de causalidade.)
O movimento para um novo tipo de “observação” – um tipo diferente de
unidade social, um indivíduo, uma decisão – pode envolver a introdução de
variáveis explicativas não aplicáveis à unidade original. Freqüentemente,
uma hipótese ou teoria sobre unidades políticas implica uma hipótese ou
teoria sobre o processo pelo qual ocorre o resultado particular observado no
nível da unidade; em particular, a hipótese ao nível da unidade pode implicar
hipóteses sobre atitudes e comportamentos ao nível dos indivíduos que
vivem nessas unidades. Estes podem então ser testados usando dados
sobre indivíduos. Se passarmos para o nível do indivíduo, podemos nos
concentrar em variáveis psicológicas ou em aspectos de experiência ou
status individual, variáveis que não fazem sentido se aplicadas a unidades
políticas.
Considere nosso exemplo da relação entre preços agrícolas e agitação
social. Poderíamos ter uma hipótese no nível de um

unidade governamental, como uma nação ou província. Um exemplo seria o
seguinte: quanto maior a flutuação dos preços agrícolas de uma unidade, maior
a probabilidade de agitação social. Essa hipótese, por sua vez, sugere outras
hipóteses sobre os indivíduos que vivem nessas unidades. Por exemplo,
podemos formular a hipótese de que aqueles que são mais vulneráveis aos
efeitos da flutuação de preços – cultivadores de determinadas culturas ou
pessoas dependentes de preços agrícolas baixos para suprimento adequado
de alimentos – teriam maior probabilidade de se envolver em comportamento socialmente disruptivo.
Um teste de tal hipótese pode envolver medidas de estados psicológicos, como
alienação ou medidas de comportamento desviante individual.
Estudos que se baseiam em explicações culturais de fenômenos políticos
muitas vezes dependem de tais análises no nível individual.12 O estudo de
Weiner sobre educação e políticas de trabalho infantil na Índia depende de uma
explicação cultural: que a razão pela qual a Índia, quase sozinha entre as
nações do mundo , não tem leis efetivas que obriguem a educação universal e
nenhuma lei efetiva que proíba o trabalho infantil reside nos valores da
sociedade, valores compartilhados pelo cidadão comum e pelas elites
governantes (Weiner 1991). A Índia é um país e o estudo de Weiner pode ser
descrito como tendo um n de um. Ele contorna esse problema de várias
maneiras. Por um lado, ele compara a Índia com outros países que
desenvolveram a educação universal. Ele também faz algumas comparações
limitadas entre os estados indianos – em outras palavras, ele varia as unidades.
Mas a hipótese sobre a cultura indiana e a política indiana implica hipóteses
sobre os valores e as posições políticas dos indivíduos; os mais importantes
são as elites que estão envolvidas na elaboração de políticas de educação e
trabalho infantil. Assim, o principal teste de Weiner para sua hipótese é o
indivíduo. Ele usa entrevistas intensivas com elites para obter informações
sobre suas crenças sobre seus valores em relação à educação e ao trabalho
infantil – crenças que são implicações observáveis de sua hipótese macro sobre
a Índia, bem como de suas visões políticas.
Esse meio de adquirir implicações mais observáveis de uma teoria de

unidades em um nível inferior de agregação também pode ser aplicado a
análises de decisões. George e McKeown referem-se a uma abordagem
chamada “rastreamento de processo” na qual o pesquisador observa
atentamente “o processo de decisão pelo qual várias condições iniciais são
traduzidas em resultados” (George e McKeown, 1985:35).13 Em vez de tratar as últimas
12 O uso de “cultura” como variável explicativa na pesquisa em ciências sociais é um assunto
de muita controvérsia, mas não é o assunto deste livro. Nosso único comentário é que as
explicações culturais devem passar pelos mesmos testes de lógica e medição que aplicamos a
todas as pesquisas.
13 Donald Moon chama uma versão dessa abordagem de explicação racional ou, como outros
chamam, análise racional (Moon 1975).

resultado correspondente (por exemplo, de uma crise internacional) como a
variável dependente, novas variáveis dependentes são construídas: por
exemplo, cada decisão em uma sequência, ou cada conjunto de percepções
mensuráveis pelos tomadores de decisão das ações e intenções dos outros,
torna-se uma nova variável. Essa abordagem geralmente atinge o nível do
ator individual. Uma teoria que liga as condições iniciais aos resultados
geralmente implica um conjunto particular de motivações ou percepções por parte desses atores.
O rastreamento do processo envolverá a busca de evidências - evidências
consistentes com a teoria causal geral - sobre o processo decisório pelo qual
o resultado foi produzido. Este procedimento pode significar entrevistar atores
ou ler seu registro escrito quanto às razões de sua ação.
Por exemplo, a cooperação entre os Estados na política internacional pode

ser produzida de várias maneiras: por expectativas de benefícios positivos
como resultado da reciprocidade; pela operação de dissuasão, envolvendo
ameaças de destruição; ou como resultado de interesses comuns em um
determinado conjunto de resultados. Muitas variáveis explicativas estariam
envolvidas em cada um desses mecanismos causais, mas o conjunto de
variáveis em cada mecanismo possível seria diferente e teria diferentes
relações entre si. Um estudo minucioso do processo pelo qual as nações
chegam à cooperação pode permitir escolher qual desses diferentes
mecanismos causais é o mais plausível. Isso pode envolver um estudo das
motivações expressas pelos atores, a natureza do fluxo de comunicação entre
eles e assim por diante.
De nossa perspectiva, o rastreamento de processos e outras abordagens
para a elaboração de mecanismos causais aumentam o número de
observações teoricamente relevantes.14 Tais estratégias ligam teoria e
trabalho empírico usando as implicações observáveis de uma teoria para
sugerir novas observações que devem ser feitas para avaliar o teoria. Ao
fornecer mais observações relevantes para as implicações de uma teoria, tal
método pode ajudar a superar os dilemas da pesquisa de n pequeno e permitir
que os investigadores e seus leitores aumentem sua confiança nas descobertas
da ciência social. Dentro de cada sequência de eventos, o rastreamento do
processo produz muitas observações. Dentro de cada unidade política,
análises de atitudes ou comportamentos individuais produzem muitas observações. Pelagem
14 O que George e McKeown chamam de “explicação dentro da observação” constitui, nos

termos de Eckstein, uma estratégia de redefinição da unidade de análise para aumentar o
número de observações. George e McKeown (1985:36) afirmam que em estudos de caso, “o
comportamento do sistema não é resumido por um único ponto de dados, mas por uma série de
pontos ou curvas traçadas ao longo do tempo”. Em nossa terminologia, emprestada de Eckstein
(1975), esse método é o de expandir o número de observações, uma vez que uma única
observação é definida como “um fenômeno para o qual relatamos e interpretamos apenas uma
única medida em qualquer variável pertinente”.

além disso, o investigador controla aquelas variáveis que se aplicam a todas as
observações porque pertencem à sequência de eventos ou à unidade como um
todo. Um foco limitado ao resultado final geralmente restringiria o investigador a
poucas observações para resolver o dilema de encontrar viés de variável omitida
ou indeterminação. Ao examinar múltiplas observações sobre atitudes ou
comportamentos individuais, o investigador pode ser capaz de avaliar quais
mecanismos causais são ativados.
É improvável que tal análise produza fortes inferências causais porque mais
de um mecanismo pode ser ativado e, dentro de cada mecanismo, a força
relativa das variáveis explicativas pode não ser clara. Mas fornece algum teste
de hipóteses, uma vez que uma hipótese que explica os resultados provavelmente
também terá implicações para o processo pelo qual esses resultados ocorrem.
A busca por mecanismos causais, portanto, fornece observações que podem
refutar a hipótese. Essa abordagem também pode permitir que o pesquisador
desenvolva algumas generalizações descritivas sobre a frequência com que
cada mecanismo causal potencial é ativado; e essas generalizações descritivas
podem fornecer a base para análise posterior dos mecanismos causais
vinculados e das condições sob as quais cada um provavelmente será ativado.
A nosso ver, o rastreamento de processos e a busca dos fundamentos

psicológicos de uma hipótese desenvolvida para unidades em um nível mais
alto de agregação são abordagens muito valiosas. Eles são, no entanto,
extensões da lógica mais fundamental de análise que temos usado, não
maneiras de contorná-la. Estudos desse tipo devem confrontar todo o conjunto
de questões da inferência causal, como unidade de homogeneidade,
endogeneidade e viés, se quiserem contribuir para a inferência causal. No nível
do tomador de decisão individual, devemos levantar e responder a todas as
questões do projeto de pesquisa se quisermos alcançar uma inferência causal
válida. Devemos medir com precisão as razões dadas e selecionar as
observações de modo que sejam independentes do resultado alcançado (ou
teremos problemas de endogeneidade) e que não haja variáveis relevantes
omitidas. Também é importante enfatizar aqui que os mecanismos causais que
são rastreados dessa maneira devem tornar nossa teoria mais, e não menos,
restritiva: técnicas como o rastreamento de processos devem fornecer mais
oportunidades para refutar uma teoria, não mais oportunidades para fugir da
refuta . ção. Em suma, o rastreamento de processos e outras análises de
subunidades são úteis para encontrar hipóteses plausíveis sobre mecanismos
causais que podem, por sua vez, promover generalizações descritivas e preparar
o caminho para a inferência causal. Mas essa abordagem deve enfrentar todo o
conjunto de questões da análise causal.
6.4 CONSIDERAÇÕES FINAIS
Em princípio e na prática, os mesmos problemas de inferência existem na

pesquisa quantitativa e qualitativa. A pesquisa projetada para nos ajudar a
entender a realidade social só pode ter sucesso se seguir a lógica da inferência
científica. Essa máxima se aplica à observação qualitativa, quantitativa, de n
grande, de n pequeno, experimental, observacional, histórica, etnográfica,
participante e a todas as outras pesquisas científicas sociais. No entanto, como
deve ficar claro a partir deste capítulo, os problemas fundamentais da inferência
descritiva e causal são geralmente mais difíceis de evitar com um projeto de
pesquisa de n pequeno do que com um projeto de pesquisa de n grande . Este
livro apresentou maneiras de expandir o número de observações em um estudo
e de fazer inferências a partir de um número relativamente pequeno de observações.
Pesquisadores quantitativos e qualitativos podem melhorar a eficiência de
um estimador aumentando a quantidade de informações que trazem para um
problema, muitas vezes aumentando o número de observações (seção 2.7.2),
e às vezes podem recorrer a procedimentos como seleção aleatória e atribuição
para evitar viés automaticamente. Grande parte da discussão neste livro foi
dedicada a ajudar os pesquisadores qualitativos a melhorar a precisão de
seus estimadores; mas as técnicas que sugerimos são variadas e muitas vezes
existem compensações entre objetivos de pesquisa válidos. Portanto, é difícil
encapsular nosso conselho em declarações concisas para corresponder às
equações formais favorecidas na pesquisa quantitativa.
Pesquisadores comprometidos com o estudo de fenômenos sociais que

optam por não usar procedimentos quantitativos formais não podem se dar ao
luxo de ignorar fontes de viés e ineficiência criadas por projetos de pesquisa
metodologicamente não reflexivos. Os tópicos que eles estudam são tão
importantes, e muitas vezes mais importantes, do que aqueles analisados por
estudiosos quantitativos. As inferências descritivas e causais feitas por
pesquisadores qualitativos merecem ser tão sólidas quanto as feitas por
qualquer outro pesquisador. Para fazer inferências válidas, os pesquisadores
qualitativos precisarão estar mais sintonizados com as questões metodológicas
do que tradicionalmente. Eles também devem ser mais autoconscientes ao
projetar pesquisas e mais explícitos ao relatar resultados substantivos. Os
leitores não devem ter que reformular estudos qualitativos publicados para
torná-los cientificamente válidos. Se um autor conceitua um projeto de pesquisa
com numerosas implicações observáveis como tendo apenas duas observações
e doze hipóteses causais, então não deve ser responsabilidade dos leitores ou
revisores explicar que o autor teve um projeto de pesquisa implícito melhor do
que explícito. Mais fundamentalmente, os autores que entendem e explicam a
lógica de suas análises produzirão mais

pesquisas valiosas. Felizmente, as questões metodológicas apropriadas
para os pesquisadores qualitativos entenderem são precisamente aquelas
que todos os outros pesquisadores científicos precisam seguir. A inferência
válida só é possível enquanto a lógica inerente subjacente a toda pesquisa
científica social for compreendida e seguida.
Referências
Achen, Christopher H. 1986 Análise estatística de quase-experimentos. Berkeley:

Imprensa da Universidade da Califórnia.
Achen, Christopher H. e Duncan Snidal. 1989. “Rational Deterrence Theory and
Comparative Case Studies.” Política Mundial 41, n. 2 (janeiro): 143-69.
Alvarez, Walter e Frank Asaro. 1990. "Um impacto extraterrestre." Científico

Americano (outubro): 78–84.
ANSELIN, Luc. 1988. Econometria Espacial: Métodos e Modelos. Boston: Kluwer
Academic Publishers.
Barnett, Vic. 1982. Inferência Estatística Comparativa. 2ª ed. Nova York: Wiley.
Baumol, William J. 1990. “St. John contra os hicksianos, ou um teórico Malgré Lui? O
Jornal de Literatura Econômica 28, no. 4: 1708–15.
Beck, Nathaniel. 1991. “Estruturas Dinâmicas Alternativas”. Análise Política 3:
51–87.
Becker, Howard S. 1966. “De que lado estamos?” Problemas sociais 14: 239–47.
Becker, Howard S. e Charles C. Ragin. 1992. O que é um caso? Explorando os
fundamentos da investigação social. Nova York: Cambridge University Press.
Blainey, Geoffrey. 1973. As Causas da Guerra. Nova York: Free Press.
Bollen, Kenneth A., Barbara Entwisle e Arthur S. Alderson. 1993. “Métodos de pesquisa
macro comparativa”. Em Judith Blake, ed. Métodos de Pesquisa Macrocomparativa
Palo Alto, Calif. Annual Reviews, Inc.
Cain, Bruce, John Ferejohn e Morris Fiorina. 1987. The Personal Vote: Constit uency
Service and Electoral Independence. Cambridge: Harvard University Press.
Caplow, Theodore, Howard M. Bahr, Bruce A. Chadwick e Dwight W.

Aspirador. 1983a. Todas as pessoas fiéis: mudança e continuidade na religião de
Middletown. Minneapolis: University of Minnesota Press.
______. 1983b. Famílias de Middletown: Cinquenta Anos de Mudança e Continuidade. Novo
York: Bantam Books.
Caro, Roberto. 1983. Os anos de Lyndon Johnson. Nova York: Vintage Books.
COLIER, David. 1991. “O Método Comparativo: Duas Décadas de Mudança.” Em
Dankwart A. Rustow e Kenneth Paul, eds. Dinâmica Política Comparada: Perspectivas
Globais de Pesquisa. Nova York: Harper Collins.
______. 1993. “O Método Comparativo”. Em Ada W. Finifter, ed. Ciência Política: O
Estado da Disciplina. Washington, DC: Associação Americana de Ciência Política.
Cook, Karen Schweers e Margaret Levi, eds. 1990. Os Limites da Racionalidade.

Chicago: University of Chicago Press.
Coombs, Clyde H. 1964. Uma Teoria dos Dados. Nova York: Wiley.
Courtillot, Vincent E. 1990. “Uma erupção vulcânica.” Scientific American (outubro
ber): 78–84.
232 · Referências
DAHL, Robert. 1961. Quem Governa? Democracia e poder em uma cidade americana.
New Haven: Yale University Press.
Desler, David. 1991. "Beyond Correlations: Toward a Causal Theory of War."
Estudos Internacionais Quarterly 3, no. 35 (setembro): 337–55.
Dewald, William G., Jerry G. Thursby e Richard G. Anderson. 1986. “The Journal of Money,
Credit and Banking Project.” American Economic Review 76, no. 4 (setembro): 587–603.
Diamond, Larry e Marc F. Plattner, eds. 1993, O Ressurgimento Global da De

mocracy. Baltimore: Johns Hopkins University Press.
Dunier, Mitchell. 1993. Mesa de Slim. Chicago: University of Chicago Press.
Easton, David. 1965. Uma Análise de Sistemas da Vida Política. Nova York: Wiley.
Eckstein, Harry. 1969. “Relações de Autoridade e Desempenho Governamental”.
Estudos Políticos Comparativos 2: 269–325.
______. 1975. "Estudo de Caso e Teoria em Ciência Política." Em Fred I. Greenstein e
Nelson W. Polsby, eds. Manual de Ciência Política, vol. 1, Ciência Política: Escopo e
Teoria. Reading, Massachusetts: Addison-Wesley.
Elster, Jon. 1983. Explicando a Mudança Técnica: Um Estudo de Caso na Filosofia da
Ciência Nova York: Cambridge University Press.
Fearon, James D. 1991. “Contrafactuals and Hypothesis Testing in Political Science.” Política
Mundial (janeiro) 43, n. 2: 169–95.
Fenno, Richard F. 1978. Home Style. Boston: Pequeno, Brown.
Ferejohn, John. 1993. “Estrutura e Ideologia: Mudança no Parlamento no início da Inglaterra
Stuart.” Em Judith Goldstein e Robert O. Keohane, eds. Ideias e Política Externa: Crenças,
Instituições e Mudança Política. Ithaca: Cornell University Press.
Ferguson, Yale H. e Richard W. Mansbach. 1988. The Elusive Quest: Teoria e Política
Internacional. Columbia: Universidade da Carolina do Sul.
Feynman, Richard P. 1965. O caráter da lei física. Cambridge, Massachusetts:
Imprensa MIT.
Fiorina, Morris e Charles R. Plott. 1978. “Committee Decisions under Majority Rule.”
American Political Science Review 72, no. 2 (junho): 575–98.
Fisher, Ronald A. 1935. O Projeto de Experimentos. Nova York: Hafner Pub
lising.
FOGEL, Robert William. 1989. Sem consentimento ou contrato: a ascensão e queda de
Escravidão Americana. Nova York: WW Norton.
Friedrich, Carl J. 1958. “Political Philosophy and the Science of Politics.” Em Roland Young,
ed. Abordagens ao Estudo da Política. Chicago: University of Chicago Press.
Fudenberg, Drew e Jean Tirole. 1989. "Teoria dos jogos não cooperativos para organização
industrial: uma introdução e visão geral." Em Richard Schma lensee e Robert D. Willig,
eds. Manual de Organização Industrial, vol. 1 Amsterdã: Holanda do Norte.
Garfinkel, H. 1964. “Studies of the Routine Grounds of Everyday Activities.”

Problemas sociais 11: 225–50.
GEDDES, Bárbara. 1990. "How the Cases You Choose Affect the Answers You Get:
Selection Bias in Comparative Politics." Análise Política, 2:131–52.
GEERTZ, Clifford. 1973. Uma Interpretação das Culturas. Nova York: Basic Books.
Referências · 233
______. 1983. “Conhecimento Local: Fato e Lei em Perspectiva Comparada,”

Em Clifford Geertz, ed. Conhecimento Local: Mais Ensaios em Antropologia
Interpretativa. Nova York: Basic Books.
Gelman, Andrew e Gary King. 1990. “Estimating Incumbency Advantage without Bias.”
American Journal of Political Science 34, no. 4 (novembro): 1142–1164.
______. 1993. “Por que as pesquisas eleitorais presidenciais dos EUA são tão variáveis
quando a votação é tão previsível.” British Journal of Political Science (no prelo).
George, Alexander L. 1982. “Estudos de caso e desenvolvimento de teoria”. Documento
apresentado no Segundo Simpósio Anual sobre Processamento de Informações em
Organizações, Carnegie-Mellon University, 15–16 de outubro.
George, Alexander L. e Timothy J. McKeown. 1985. “Estudos de Caso e As Teorias da
Tomada de Decisão Organizacional. Avanços no processamento de informações em
organizações 2: 21–58.
George, Alexander L. e Richard Smoke. 1974. Dissuasão no Exterior Americano
Política. Nova York: Columbia University Press.
Gigerenzer, Gerd, Zeno Swijtink, Theodore Porter, Lorraine Daston, John Beatty e
Lorenz Kruger. 1989. The Empire of Chance: How Probability Changed Science and
Everyday Life. Nova York: Cambridge University Press.
Gilpin, Roberto. 1981. Guerra e Mudança na Política Mundial. Nova York: Cambridge
University Press.
Goldberger, Artur. 1991. Um Curso de Econometria. Cambridge, Massachusetts: Harvard
University Press.
Goldstein, Judith e Robert O. Keohane, eds. 1993. Ideias e Política Externa: Crenças,
Instituições e Mudança Política. Ithaca: Cornell University Press.
Gould, Stephen J. 1989a. Wonderful Life: The Burgess Shale and the Nature of His
tory. Nova York: Norton.
______. 1989b. “O Chifre de Tritão.” História Natural (dezembro): 18–27.
Granger, GWJ e P. Newbold. 1977. Previsão de Séries Temporais Econômicas. Nova
York: Academic Press.
Gulick, Edward V. 1967. O Equilíbrio de Poder Clássico da Europa. Nova York: Norton.
Salão, Peter A., ed. 1989. O Poder Político das Idéias Econômicas: Keynesianismo
Através das Nações. Princeton: Princeton University Press.
Halpern, Nina, 1993. “Stalinist Political Economy,” em Judith Goldstein e Robert O.
Keohane, eds. 1993. Ideias e Política Externa: Crenças, Instituições e Mudança
Política. Ithaca: Cornell University Press.
Hermens, FA 1941. Democracy or Anarchy: A Study of Proporcional Representation.
South Bend, Indiana: University of Notre Dame Press.
Hirschman, Albert O. 1970. “The Search for Paradigms as a Hindrance to Un
entendendo.” Política Mundial 22, n. 3 (abril): 329–43.
Hoffmann, Stanley. 1960. Teoria Contemporânea em Relações Internacionais. Engle
Wood Cliffs, NJ: Prentice-Hall.
Holanda, Paulo. 1986. "Estatísticas e Inferência Causal." Jornal da Associação Estatística
Americana 81: 945–60.
HOROWITZ, Donald. 1993. “Comparando Sistemas Democráticos.” Em Larry Diamond
e Marc F. Plattner, eds. O Ressurgimento Global da Democracia. Balti mais: Johns
Hopkins University Press.
234 · Referências
Hum, Paulo. 1988. “Extended Deterrence and the Outbreak of War.” americano
Revisão de Ciência Política 82: não. 2 (junho): 423–43.
Huth, Paul e Bruce Russet. 1990. “Testando a Teoria da Dissuasão: O Rigor Faz
uma diferença." Política Mundial 42, n. 4 (julho): 466–501.
Hsiao, C. 1983. “Identificação”. Em Zvi Griliches e Michael Intriligator, eds.
vol. 1, Manual de Econometria. Amsterdam: North-Holland.
Inkeles, Alex e Peter Rossi. 1956. “National Comparisons of Occupational Prestige.” American
Journal of Sociology 61: 329-39.
Iyengar, Satis e Joel B. Greenhouse. 1988. “Modelos de Seleção e o Problema da Gaveta de
Arquivos”. Ciência Estatística 3, no. 1 (fevereiro): 109–35.
Iyengar, Shanto e Donald Kinder. 1987. Notícias que importam. Chicago: University of Chicago
Press.
Jeffreys, Harold. 1961. Teoria da Probabilidade. Oxford: Clarendon Press.
Jervis, Robert. 1976. Percepção e Equívoco na Política Internacional. Princeton: Princeton
University Press.
Jervis, Robert, Richard Ned Lebow e Janice Gross Stein. 1985. Psicologia
e Dissuasão. Baltimore: Johns Hopkins University Press.
Jones, EL 1981. O Milagre Europeu: Ambientes, Economias e Geopolítica na História da Europa
e da Ásia. Cambridge: Cambridge University Press.
Johnston, J. 1984. Métodos econométricos. edição 3d. Nova York: McGraw Hill.
Kahneman, Daniel, Paul Slovik e Amos Tversky, eds. 1982. Julgamento sob Incerteza:
Heurísticas e Vieses. Nova York: Cambridge University Press.
Katzenstein, Peter J. 1985. Small States in World Markets: Industrial Policy in Europe. Ithaca:
Cornell University Press.
Keane, Mark T. 1988. Resolução Analógica de Problemas. Chichester, West Sussex: Ellis
Horwood.
Kennedy, Paulo. 1987. A ascensão e queda das grandes potências. Nova York: aleatório
Casa.
Keohane, Robert O. 1980. “The Theory of Hegemonic Stability and Changes in International
Economic Regimes, 1967–1977.” Em Ole R. Holsti, Randolph M.
Siverson, Alexander L. George, editores. Mudança no Sistema Internacional. Boulevard:
Westview Press.
______. 1984. Depois da Hegemonia: Cooperação e Discórdia na Economia Política Mundial
o meu. Princeton: Princeton University Press.
______. 1988. “Instituições Internacionais: Duas Abordagens”. Estudo Internacional
32º trimestre : 379.
______. 1989. Instituições Internacionais e Poder do Estado: Ensaios na Teoria das Relações
Internacionais. Pedregulho: Westview.
Keohane, Robert O. e Joseph S. Nye, Jr. 1977. Poder e Interdependência: Política Mundial em
Transição. Boston: Pequeno, Brown.
Khong, Yuen Foong. 1992. Analogy at War: Korea, Munich, Dien Bien Phu, and the Vietnam
Decisions of 1965. Princeton: Princeton University Press.
Rei, Gary. 1989. Metodologia Política Unificadora: A Teoria da Verossimilhança das Estatísticas
inferência cal. Nova York: Cambridge University Press.
______. 1993. “The Methodology of Presidency Research,” em George Edwards III, John H.
Kessel e Bert A. Rockman, eds. Pesquisando a Presi-
Referências · 235
dência: Questões Vitais, Novas Abordagens. Pittsburgh: University of Pittsburgh Press.
______. 1991a. “Serviço de constituintes e vantagem de incumbência.” Britânico

Jornal de Ciência Política 21, no. 1 (janeiro): 119–28.
______. 1991b. “Variação estocástica: um comentário sobre Lewis-Beck e Skala
ban's 'The R-Square'.” Análise Política 2: 185–200.
______. 1991c. “Sobre Metodologia Política”. Análise Política 2: 1–30.
Kohli, Atul. 1987. O Estado e a Pobreza na Índia: A Política da Reforma. Nova York:
Cambridge University Press.
Kreps, David M. 1990. “Corporate Culture and Economic Theory,” In James E. Alt e
Kenneth Shepsle, eds. Perspectivas sobre Economia Política Positiva. Nova York:
Laitin, David D. 1986. Hegemonia e Cultura: Política e Mudança Religiosa entre os
Yoruba. Chicago: University of Chicago Press.
Lakatos, Imre. 1970. “Falsificação e a Metodologia dos Programas de Pesquisa Científica”.
Em I. Lakatos e A. Musgrave, eds. A crítica e o crescimento do conhecimento.
Cambridge: Cambridge University Press.
Lakeman, Enid e James D. Lambert. 1955. Votação em Democracias. Londres: Faber e
Faber.
Leamer, Edward E. 1978. Pesquisas de Especificação: Inferência Ad Hoc com Nonexper
Dados mentais. Nova York: Wiley.
______. 1983. “Vamos tirar o engodo da econometria.” econômica americana
Revisão 73, n. 1 (março): 31–43.
Levy, Jack S. 1985. “Theories of General War.” Política Mundial 37, n. 3 (abril):
344–74.
______. “Estudos quantitativos de sucesso e fracasso da dissuasão.” Em Paulo C.
Stern, Robert Axelrod, Robert Jervis e Roy Radner, eds. Perspectivas da Dissuasão.
Nova York: Oxford University Press.
Lieberson, Stanley. 1985. Fazendo valer a pena: A melhoria da pesquisa social e da
teoria. Berkeley: University of California Press.
______. 1992. “Einstein, Renoir e Greeley: Algumas reflexões sobre evidências em
sociologia”. American Sociological Review 56 (fevereiro): 1–15.
LIJPHART, Arend. 1971. “Política Comparativa e Método Comparativo,”
American Political Science Review 65, no. 3 (setembro): 682–98.
Lindberg, Leon N. e Stuart A. Scheingold. 1971. Integração Regional: Teoria
e Pesquisa. Cambridge: Harvard University Press.
Lindberg, Leon N. e Stuart A. Scheingold. 1970. Pretensa Política da Europa: Padrões de
Mudança na Comunidade Européia. Englewood Cliffs, NJ: Prentice-Hall.
Linz, Juan J. 1993. “The Perils of Presidentialism.” Em Diamond, Larry e Marc F. Plattner,
eds. O Ressurgimento Global da Democracia. Baltimore: Johns Hopkins University
Press. 108–26.
Lipset, Seymour Martin. 1963. The First New Nation: The United States in Com parative
and Historical Perspective. Nova York: Basic Books.
Pequeno, Daniel. 1991. Variedades de Explicação Social: Uma Introdução ao Philoso
phy de Ciências Sociais. Boulder Colo.: Westview.
236 · Referências
Longino, Helen E. 1990. Ciência como Conhecimento Social: Valores e Objetividade na

Investigação Científica. Princeton: Princeton University Press.
Lowenthal, Abraham F. 1972. A intervenção dominicana. Cambridge: Harvard University Press.
Mankiw, N. Gregory. 1990. “A Quick Refresher Course in Macroeconomics,”

Journal of Economic Literature (dezembro) 28, no. 4: 1645–60.
Martin, Lisa L. 1992. Cooperação coercitiva. Princeton: Universidade de Princeton
Imprensa.
Merck & Co., Inc., 1989. Relatório Anual. Rayway, Nova Jersey: Merck & Co., Inc.,
1989.
Merton, Robert K. [1949] 1968. Teoria Social e Estrutura Social. Reimprimir. Nova York: Free
Press.
Mill, John Stuart. 1843. Um Sistema de Lógica. Editor desconhecido.
Miller, David. 1988. "Conjectural Knowledge: Popper's Solution of the Problem of Induction."
Em Paul Levinson, ed. Em Busca da Verdade. Atlantic Highlands, NJ: Humanities Press.
Milner, Helen V. 1988. Resistindo ao Protecionismo: Indústrias Globais e a Política do Comércio

Internacional. Princeton: Princeton University Press.
Moe, Terry M. 1990. “The Politics of Structural Choice: Toward a Theory of Public Burocracia.”
Em Oliver Williamson, ed. Teoria da organização: de Chester Barnard ao presente e além.
Nova York: Oxford University Press.
Moon, Donald J. 1975. “The Logic of Political Inquiry: A Synthesis of Opposed Perspectives.”
Em Fred I. Greenstein e Nelson W. Polsby, eds. Manual de Ciência Política, vol. 1, Ciência
Política: Escopo e Teoria. Reading, Mass.: Ad Dison-Wesley.
Neustadt, Richard E. e Earnest R. May. 1986. Pensando no Tempo: Os Usos da História para
Tomadores de Decisão. Nova York: Free Press.
Nye, Joseph S. 1971. Peace in Parts. Boston: Pequeno, Brown.
O'Hear, Anthony. 1989. Introdução à Filosofia da Ciência. Oxford: Claren
não pressione.
Ordeshook, Peter C. 1986. Teoria dos Jogos e Teoria Política: Uma Introdução.
Nova York: Cambridge University Press.
Palfrey, Thomas R., ed. 1991. Laboratório de Pesquisa em Economia Política. Ann Arbor:
Imprensa da Universidade de Michigan.
Pearson, Karl. 1892. A gramática da ciência. Londres: JM Dent & Sons,
Ltda.
Plott, Charles R. e Michael E. Levine. 1978. “Um Modelo de Influência da Agenda nas Decisões
do Comitê”. American Economic Review 68, no. 1 (março): 146-60.
Popper, Karl R. 1968. A Lógica da Descoberta Científica. Nova York: Harper e

Linha.
______. 1982. “O Universo Aberto: Um Argumento para o Indeterminismo.” Em WW
Bartley III, ed. O Pós-escrito à Lógica da Descoberta Científica. Totowa, NJ: Rowman e
Littlefield.
Porter, Michael E. 1990. A Vantagem Competitiva das Nações. Nova York: Grátis
Imprensa.
Referências · 237
Przeworski, Adam e Henry Teune. 1982. The Logic of Comparative Social In

inquérito. Malabar, Flórida: Krieger Publishing Company.
Psathas, George. 1968. “Etnométodos e Fenomenologia”. Pesquisa social
35: 500–20.
Putnam, Robert D., com Robert Leonardi e Raffaella Y. Nanetti, 1993. Fazendo funcionar
a democracia: tradições cívicas na Itália moderna. Princeton: Princeton University Press.
Ragin, Charles C. 1987. O Método Comparativo: Indo além das Estratégias Qualitativas e
Quantitativas. Berkeley: University of California Press.
Rivers, Douglas e Morris P. Fiorina. 1989. “Constituency Service, Reputation, and the
Incumbency Advantage”, em Morris P. Fiorina e David Rohde, eds. Home Style e
Washington Work. Ann Arbor: Imprensa da Universidade de Michigan.
Robinson, William S. 1990. “Ecological Correlations and the Behavior of Individuals.”

American Sociological Review 15: 351-57.
ROGOWSKI, Ronald. 1987. "Comércio e a Variedade de Instituições Democráticas."
Organização Internacional 41, no. 2 (Primavera): 203–24.
Rosenau, Paulina. 1990. “Mais uma vez na briga: as relações internacionais confrontam
as humanidades.” Millenium: Journal of International Studies 19, no. 1 (Primavera): 83–
110.
Rosenstone, Steven R. 1983. Previsão de eleições presidenciais. New Haven: Yale
University Press.
Roth, Alvin E. 1988. "Experimentação de laboratório em economia: uma visão geral
metodológica." The Economics Journal 98 (dezembro): 974–1031.
Rubin, Donald B. 1974. “Estimating Causal Effects of Treatments in Randomized and
Nonrandomized Studies.” Journal of Educational Psychology 66: 688–701.
______. 1978. "Inferência Bayesiana para Efeitos Causais: O Papel da Randomização."

The Annals of Statistics 6: 34–58.
RUSSET, Bruce. 1978. “A Utilidade Marginal das Transferências de Renda para o Terceiro
Mundo." Organização Internacional 32, no. 4: 913–28.
Sanday, Peggy Reves. 1983. “O(s) Paradigma(s) Etnográfico(s).” Em John Van Maanen,
ed. Metodologia Qualitativa. Sábio: Beverly Hills.
Schumpeter, Joesph A. [1936] 1991. “Can Capitalism Survive?” Em Richard Swedberg,
ed. A Economia da Sociologia e do Capitalismo, Princeton: Princeton University Press.
Shepsle, Kenneth A. 1986. “Institutional Equilibrium and Equilibrium Institutions.” Em

Herbert F. Weisberg, ed. Ciência Política: A Ciência da Política.
Nova York: Agathon Press.
Shivamente, W. Phillips. 1990. O ofício da pesquisa política. edição 3d. Englewood Cliffs,
NJ: Prentice-Hall.
Simon, Herbert A. 1985. “Human Nature in Politics: The Dialogue of Psychology with
Political Science.” Revisão de ciência política americana. 79, nº. 2 (junho): 293–305.
Skocpol, Theda. 1979. Estados e Revoluções Sociais. Universidade de Cambridge

Imprensa.
______. 1984. “Agendas emergentes e estratégias recorrentes na sociedade histórica

238 · Referências
logia”. Em Theda Skocpol, ed. Visão e Método na Sociologia Histórica. Nova York:
Snyder, Glenn H. e Paul Diesing. 1977. Conflito entre Nações: Negociação, Tomada de
Decisão e Estrutura do Sistema em Crises Internacionais. Princeton: Princeton University
Press.
Snyder, Jack. 1991. Mitos do Império: Política Doméstica e Ambição Internacional.
Ithaca: Cornell University Press.
Sóbrio, Elliot. 1988. Reconstruindo o Passado: Parcimônia, Evolução e Inferência.
Cambridge: MIT Press.
Suppes, Patrick C. 1970. Uma teoria probabilística da causalidade. Amsterdã: Norte
Holanda.
Tawney, RH 1935. Religião e a Ascensão do Capitalismo. Nova York: Harcourt,
Brace & Co.
Tilly, Charles, ed. 1975. A Formação dos Estados Nacionais na Europa Ocidental.
Princeton: Princeton University Press.
Verba, Sidney. 1967. “Alguns dilemas da pesquisa política”. Política Mundial 20 (outubro):
111–28.
Verba, Sidney, Kay L. Schlozman, Henry Brady e Norman Nie. 1993. “Raça, etnia e
recursos políticos: participação nos Estados Unidos.” British Journal of Political Science
23: 453-97.
Waltz, Kenneth N. 1979. Teoria da Política Internacional. Leitura, Missa: Ad
dison-Wesley.
Webb, Eugene J., DT Campbell, RD Schwartz e L. Sechrest. 1966. Unob
Medidas invasivas. Chicago: Rand McNally.
Webb, Eugene J. e Karl E. Weick. 1983. “Unobtrusive Measures in Organizational Theory:
A Reminder.” Em John Van Maanen, ed. Metodologia Qualitativa. Sábio: Beverly Hills.
Weber, Max. [1905] 1949. “Estudos Críticos na Lógica das Ciências Culturais.” Em Max
Weber, ed. A Metodologia das Ciências Sociais. Traduzido e editado por Edward A. Shils
e Henry A. Fluch. Nova York: Free Press.
Weiner, Myron. 1991. A Criança e o Estado na Índia. Princeton: Universidade de Princeton
Verity Press.
Wendt, Alexandre. 1992. “Anarquia é o que os Estados fazem dela: a construção social da
política de poder.” Organização Internacional 64, no. 2 (Primavera): 391–426.
Wolfinger, Raymond e Steven Rosenstone. 1980. Quem vota. New Haven: Yale University
Press.
Woods, John e Douglas Walton. 1982. Argumento: A Lógica das Falácias.
Nova York: McGraw-Hill Ryerson Ltd.
Zelditch, Morris Jr. 1971. “Intelligible Comparisons.” Em Ivan Vallier, ed. Métodos
Comparativos em Sociologia. Berkeley e Los Angeles: University of Cali fornia Press.
Zellner, Arnold. 1971. Uma Introdução à Inferência Bayesiana em Econometria. Novo

Iorque: Wiley.
______. 1984. Problemas Básicos em Econometria. Chicago: University of Chicago Press.
Índice
cursos de contabilidade, 130–32 Caro, Robert, 36

Achen, Christopher, 130, 134–35, 231 crises estudos de caso-controle,
agudas, 134–35 modelo 141 estudos de caso, uso de, 5, 43–46, 52–53,
de avião, 49 60, 67–68
Alderson, Arthur, 199, 211, 231 e mecanismos causais, 85–87, 225 e
aliança, 199 efeitos causais constantes, 93
Álvarez, Luís, 11–12 cruciais, 208–12
Alvarez, Walter, 11, 231 medidas múltiplas ao longo do tempo,
analogia, raciocínio por, 212–13 221 e viés de seleção, 117
Anderson, Ricardo, 232 único, 208–12, 227n e
Anselin, Luc, 223, 231 unidade homogênea, 93 da
pesquisa aplicada, 18n República de Weimar, 189– 91
Asaro, Frank, 231 casos, 52–53, 116–17, 208–12
atribuição, 94, 115, 196–97, 229 efeito causal, 81–82, 84, 88
causalidade assimétrica, 89–91 modelo formal para, 95–97
audiência, 55 superestimação, 139
Austrália, 205 hipótese causal, 40
autocorrelação, 223n inferência causal, 8, 18, 32–33, 75– 114, 116
disponibilidade heurística, 213n suposições para, 91–97 e
média, 53, 65, 80–81 estudos de caso, 45
machado, exemplo de, 6 correção tendenciosa, 187–88
critérios para julgamento, 97–
Bahr, Howard, 231 99 com erro de medição, 156
Barnett, Vic, 102, 231 incerteza de, 213–15
pesquisa básica, 18n mecanismos causais, 85–87, 225
Baumol, William, 218, 231 teorias causais, 99 –100
Beatty, João, 233 regras para construir, 99–114
Beck, Nathaniel, 223, 231 causalidade, 76–91
Becker, Howard, 231 Chadwick, Bruce, 231
viés, 27–28, 63–65, 97–99, 150–51 em Chile, 219
comparação com a eficiência, 70– Tradições cristãs na Nigéria, 147, 186–87, 205–6
74 e endogeneidade, 195–96 codificação,
exemplo formal de, 65, 97–99 e 157 moedas
erro de medição, 161– 65 e viés e penas, 108 coleta de
substantivo, 64 dados, 51 para
análise bivariada, 172 compensar a variabilidade fundamental, 214 e
Blainey, Geoffrey, 231 eficiência,
Bollen, Kenneth, 199, 211, 231 214 garantia de
Abordagem da Álgebra Booleana, 90n confiabilidade, 25–26, 151 usando
votação britânica, 55-59 modelos formais para , 51–53, 105–
106
Cain, Bruce, 186, 231 diretrizes para melhorar, 23–26, 46–47 nível
estratégias de campanha, 102– de agregação, 48–49, 117 para
3 Campbell, DT, 238 maximizar a alavancagem, 204–205
Canadá, 205 projetos-piloto anteriores, 22–23
Caplow, Theodore, 27, 231 quantificação em, 43–44
240 · Índice
coleta de dados (cont.) replicabilidade como meta, 26–27

processo de registro de, 23 e problema de n pequeno, 213–17
confiabilidade como meta, 25– dados, uso de, 27–28
26 replicabilidade como meta, 26– descartando, 153, 184
27 e problema de n pequeno , 213– para garantir imparcialidade, 27–28, 63–65,
17 Collier, David, 231 97–99
colinearidade, 213–15. Veja também para aumentar a alavancagem, 30, 104, 123,
abordagem 204–5 para aumentar o número de
comparativa multicolinearidade, 212–
13 campo de política observações, 217–18 para maximizar a eficiência, 28, 66–74, 97–
comparativa importância da descrição em, 99
44–45 vantagem competitiva, 134 para testar teorias, 13, 20–23, 28–31, 46–49,
complexidade dos eventos, 9–10, 42–43, 93– 101–5
94 com erro de medição, 165–66
educação obrigatória na Índia, 64 lacunas resumindo, 53–55 mineração
de conceito e indicador, 110–11 de dados, 174
concretizam, 112 demonstração, 198
independência condicional, 91, 94–95, 115 variáveis dependentes, 77, 107–9
procedimento de congruência, 45– variabilidade fundamental, 214
46 consistência, com erro de medição, 158–63 análise,
167n suposição de efeito constante, 92–93, 188–89
116 constantes, seleção de, 146–49 selecionando, 129–37, 141–46
validade de construto, 25 variação em, 129–30, 134
contribuição para a literatura científica, 16–17 inferência descritiva, 8, 15, 18, 34–46, 53, 55–74
controle, 125, 168, 185, 196–201 critérios
da situação de pesquisa, 199–206 e para julgar, 63–74 importância
problemas pequenos , 196–200 na ciência política, 44–45 e interpretação , 36–
variáveis de controle, 77 41, 43 com erro de medição, 156
Cook, Karen, 101, 231 com viés de seleção, 141
Coombs, Clyde, 46, 231
análise contrafactual, 10–11, 77–78, 88– design of research, 13, 18, 118–24, 133, 174, 213–17, 228
89, 192
Courtillot, Vincent, 231 Dessler, David, 225, 232
crime, 159–61, 164–65 visão determinista, 59, 89n, 210–11 teoria
estudos de caso cruciais, 209–12 da dissuasão, 24
cultura, 109–10, 191–92, 226 Dewald, Guilherme, 26, 232
Diamante, Larry, 232
Dahl, Robert, 232 Morrendo, Paul, 238
Daston, Lorraine, 233 extinção de dinossauros, 11–12, 42, 223
dados, coleta de, 51 para dinossauros, 11
compensar a variabilidade fundamental, 214 Duneier, Mitchell, 37, 232
e eficiência,
214 garantindo Europa Oriental, 126–27
confiabilidade, 25–26, 151 usando Easton, David, 113, 232
modelos formais para, 51–53, 105–6 diretrizes Eckstein, Harry, 37, 51, 52–53, 113, 209–
para melhorar, 23– 26, 46–47 nível de 12, 217–18, 227, 232
agregação, 48–49, 117 para maximizar falácia ecológica, 30, 30n
a alavancagem, 204–5 projetos- história econômica, 218
piloto antes, 22–23 quantificação sanções econômicas, 5
em, 43–44 processo de efeito da
gravação de, 23 confiabilidade educação nos rendimentos,
como meta, 25–26 87–89 na Índia, 64
Índice · 241
eficiência, 28, 66–74, 97–99, 150–51, 181– Fogel, Robert, 232

85 previsões, 169n
em comparação com viés, elites de política externa,
70-74 e coleta de dados, 214, 125 modelos formais, 49–53,
229 modelo formal de, 70, 207 aplicando-se à coleta de dados,
98-99 e erro de medição, 158-59, 214 51–
Einstein, Albert, 7 53, 105–6 de eficiência,
sistemas eleitorais, bias in, 64 70, 98–99 de
Elster, Jon, 78, 78n, 232 endogeneidade, 195–96 de inclusão ineficiências variáveis, 184–
endogeneidade, 61n, 94, 107–8, 185–96, 228 85
e escolhendo observações, 191–93 de efeito causal médio, 95–97
modelo formal de, 195–96 de erro de medição, 161–63, 166–68 de
como um produto natural de processos multicolinearidade, 123–24 e
políticos, número de unidades, 213–14 de
198 como um problema de variável omitida, 189– viés de variável omitida, 170–71, 175–
91 76
Entwisle, Barbara, 199, 211, 231 de pesquisa qualitativa, 126
equifinalidade, relevância para pesquisa qualitativa, 50
87 erros na previsão, 131 de problema pequeno , 119–22, 213–14
estimadores, 183 de imparcialidade, 65, 97–98
revoluções sociais europeias, 129 utilidade para teorias de, 105–6
estados europeus, 136 Friedrich, Carl, 232
excluindo variáveis relevantes, 61–62, 89, Fudenberg, Drew, 25, 232
94, 107, 123, 168–82 problema fundamental da inferência causal, 79–
e endogeneidade, 189–91 80, 82, 91, 94, 125, 200, 208–10
modelo formal de, 170–71, 175–76 e variabilidade fundamental, 59, 89n, 210–11,
seleção intencional, 202–3 e 213–14
atribuição aleatória , 197 e
estudos de caso único, 210–22 Garfinkel, H., 232
valores esperados, 58 Geddes, Barbara, 132, 232
explicação, 75 Geertz, Clifford, 37, 38–40, 232, 233
variáveis explicativas, 77, 123 Gelman, Andrew, 77, 102, 233
atribuição de valores de, 196– generalização, 10–11, 35–36, 42–43, 46 –
99 com erro de medição, 158, 163–68 49, 93–94, 228. Ver também inferência
análise, 193–95 causal; inferência
seleção, 137– 38, 140–49 descritiva George, Alexander, 45–46, 87,
explicitação, como objetivo da pesquisa 168, 222,
científica, 226–28, 233 Gigerenzer,
8 extinção dos dinossauros, 11 Gerd, 233 Gilpin,
Robert, 233 Goldberger,
detalhe factual, 36–41, 43. Ver também Arthur, 233 Goldstein, Judith, 36,
falseabilidade 191, 233 Gould, Stephen J. ,
de inferência descritiva, 19, 19n, 100– 11, 233 Granger, GWJ, 223,
105, 228 Fearon, 233 Greenhouse, Joel,
James, 232 Fenno, 105 erro de
Richard, 38, 232 Ferejohn, John, 36, agrupamento, 153 Gulick, Edward, 152, 233
182, 231, 232
Ferguson, Yale, Hall, Peter, 191, 233
232 uso de fertilizantes, Halpern, Nina, 191–93, 233
148 Feynman, Richard, 232 Hermens, FA, 189–91, 233
problema de gaveta de arquivo, 105 Fiorina, teoria da variável oculta, 59, 89n, 210–11
Morris, 125, 186, 231, 232, 237 Fisher, Ronald, 232 Hirschman, Albert O., 10, 233
242 · Índice
método histórico, 36–41, 43. Ver também e detalhes factuais, 36–41, 53–55 com
mecanismos causais; inferência descritiva; erro de medição, 165–66 em pesquisa
pesquisa qualitativa registro científica, 7–8 de relações
histórico, 135 Hoffman, sistemáticas, 34, 79–82, 84, 84n imparcialidade
Stanley, 233 Holland, Paul, como
76n, 79n, 82, 92, 233 homocedasticidade, critério de, 27–28, 63– 65, 97–99, 150–51
162n Hoover, Dwight, 231
Horowitz, Donald, 83, 233 incerteza de, 8–9, 76, 82, 95, 152, 158 uso de
Hsiao, C., 118, 234 Huth, Paul , regras, 6–7, 9, 76
24, 234 hipóteses, 19 Veja também inferência causal; borrões de
aplicando-se à coleta e tinta de
análise de dados, inferência descritiva, 21
13, 19–20, 28–29, 45, 46–49, 174, 227–28 Inkeles, Alex, 146–47, 234
alterando a restrição de, 21–22, instituições, efeito de, 16
consistência interna, 100, 105
cooperação internacional, 5
228 organizações internacionais, 51–52 campo
e endogeneidade, 187 de relações internacionais, necessidade de descrição
falsificabilidade de, 19 em, 44–45 sanções
uso de modelos formais para avaliar, 105–6 internacionais, 5 interpretação,
36–41, 43 medidas de intervalo,
e observações crescentes, 218, 221 alavancagem 151, 153–54 codificação de entrevistas,
de, 29–30, 104 parcimônia 26 entrevistas, 112n, 185n
como meta de, 20 projetos-piloto variáveis irrelevantes, 182–85
ao testar, 22–23 função de, 10 regras para modelo formal para, 184–85
construção,
99–114 Política italiana, 5, 223–24
especificidade como objetivo de, 20 Itália, 5, 223–24
testes com dados, 13, 20–23, 28–31, 46– Iyengar, Satis, 105, 125, 234
49, 101–5
Carne vermelha japonesa, 32–
ideias como uma variável explicativa, 191–92 33 Jeffreys, Harold, 20, 234
identificação, 118n Postulado de simplicidade de Jeffreys-Wrinch, 20
incluem tudo abordagem, 183 incluindo Jervis, Robert, 234
variáveis irrelevantes, 182–85 modelo formal de, Johnston, J., 234
184–85 efeito de renda, 173 Jones, EL, 43, 234
observações crescentes,
217–30 vantagem de incumbência, 77– Kahneman, Daniel, 213, 234
82 variáveis independentes, 77, 123 Katzenstein, Peter, 201, 234 Keane,
com erro de medição, 158, 163–68 Mark, 213, 234 Kennedy,
análise, 193–95 seleção em, 137–38, 140–49 Paul, 234 Keohane,
projeto de pesquisa Robert O., 36, 191, 233, 234 variável causal
indeterminado, 118–24, chave, 77 seleção, 146
Khong, Yuen Foong,
145 212, 234 Kinder, Donald, 125, 234
Índia, 144–46, 205–6, 219, 226 King, Gary, 32, 50, 59, 77, 102,
educação em, 64 e 118, 130, 189, 223, 233, 234, 235 Kohli, Atul, 144–
papel na política de pobreza, 144–46 46, 205– 6, 219, 220,
inferência, 46–49, 229
correção tendenciosa, 187–88 235
eficiência como critério de, 28, 66–74 , 97–99, Kreps, David, 235
150–51 Kruger, Lorenz, 233
Índice · 243
Laitin, David, 147, 186–87, 205–6, 235 método de similaridade, 168

Lakatos, Imre, 12, 102, 235 Middletown, 27
Lakeman, Enid, 190, 235 Mill, John Stuart, 87, 134, 168, 211, 236
Lambert, James, 190, 235 Miller, David, 101, 236
Milner, Helen, 179–82, 236
conhecimento do idioma, 127 modelos, 49–53, 207
Leamer, Edward, 102, 235 aplicando-se à coleta de dados, 51–53,
observações menos prováveis, 209–10 105–
Lebow, Ricardo, 234 6 de eficiência, 70, 98–99
Leonardi, Roberto, 237 de endogeneidade, 195–
Levi, Margarida, 101, 231 96 de ineficiências de variáveis incluídas,
Levine, Michael, 125 184–
Levy, Jack, 16, 235 85 de efeito causal médio, 95-97
Lieberson, Stanley, 19, 30, 89–91, 108–9, de erro de medição, 161-63, 166-68 de
235 multicolinearidade, 123-24 e
interruptor de luz, 116 número de unidades, 213-14 de
Lijphart, Arend, 83, 204, 217, 235 viés de variável omitida, 170-71, 175-
Lindberg, Leon, 157, 235 76
Linz, Juan, 83, 235 de pesquisa qualitativa, 126
Lipset, Seymour Martin, 205–6, 235 relevância para pesquisa qualitativa, 50
Little, Daniel, 85, 87, 235 de problema pequeno , 119–22, 213–14
lógica da análise, 6–7, 9, 76, 228 de imparcialidade, 65, 97–98
Longino, Helena, 236 utilidade para teorias de, 105–6
Lowenthal, Abraham, 235 Moe, Terry, 236
Lynd, Robert e Helen, 27 Moon, Donald, 37, 226, 236
mais inferências do que observações
McKeown, Timothy, 45, 226–27, 233 problema, 119–22, 126, 144–45, 196–
Mankiw, N. Gregory, 17, 236 97, 208–
Mansbach, Richard, 232 30 modelo formal de, 121–
Martin, Lisa L., 5, 236 22 e correspondência,
observações correspondentes, 95, 200–206, 204–6 número de observações necessárias para
212 pessoas superar, 213–17 e
correspondentes, 200 notações design de pesquisa, 213–30 e
matemáticas , teoria das ciências sociais, 227 e
53–54, 57–59 subunidades, 220–21
máximo, 54 de maio, mais parâmetros do que problemas de unidades.
Earnest, 32 média, 53, 65, 80–81 Veja mais inferências do que
efeito causal médio, 81–82,
84, 88 modelo formal observações problema observações
para, 95–97 superestimando, 139 mais prováveis, 209–10
erro quadrático médio ( MSE), Mugabe, Robert, 219 multicolinearidade,
74 erros de medição, 151–68 modelos 122–24, 147, 213n modelo
formais de, 161–63, 166– formal de, 123–24 colinearidade relativa, 213–15
68 não sistemáticos, 157–68 e causalidade múltipla, 87-89
estudos de caso único, 210 sistemáticos, 155–57 Tradições muçulmanas na Nigéria, 147, 186–87,
medição de variáveis, 151, 153 Merck & 205–6
Co., 236 Merton,
Robert, 8, 113–14, 236 centralidade Nanetti, Raffaella, 237
do Nacional Socialistas, 189-91
método para pesquisa científica, 9 ciências naturais, 11
método de concordância, 134 regime nazista, 189-91
método de diferença, 168 Neustadt, Ricardo, 32, 236
244 · Índice
Newbold, P., 223, 233 causalidade probabilística, 77n

Nigéria, 147, 186–87, 205–6 visão probabilística, 59, 89n
medidas nominais, 151, 153–54 rastreamento de processo, 85–87,
componente não sistemático, 55–63, 79–82, 84, 225–28 representação proporcional, 106–7,
notação 152– 53,
84n, 53–54, 57–59 armas 189–91 pesquisa prospectiva,
nucleares, 148 Nye, 136 protecionismo, 179–82
Joseph, 157, 234, 236 Ética Protestante e o Espírito do Capitalismo,
186–87
implicações observáveis, 28–29, 41, 99–100, Przeworski, Adam, 36, 168, 201, 204, 237
109–12, 179, 223–24 Psathas, George, 41, 237
subunidades de, Putnam, Robert D., 5, 38, 223–24, 237
221 observações, 51–52, 57, 117, 208–12
dependência entre, 222 pesquisa qualitativa, 5–6, 60–61 e
fazendo muitos de poucos, 217– 30 e inferência causal, 82–85
reduzindo a endogeneidade, 191-93 manipulação de variáveis explicativas,
O'Hear, Anthony, 101, 236 185n
preços do problemas em, 32, 44, 151, 229
petróleo, 173 viés variável omitido, 61-62, 89, estilo de, 4
94, 107, 123, controle de qualidade,
168-82 e endogeneidade, 59n problemas de
189-91 modelo formal de, 170-71, pesquisa quantitativa em, 44,
175-76 e seleção intencional, 202–3 151, 229 estilo de, 3
e atribuição aleatória, 197 e
estudos de caso único, 210–22 Ragin, Charles, 87, 89n, 90, 231, 237
Ordeshook, Peter, 105, 236 atribuição aleatória, 94, 115, 196–97, 229 efeito
medidas ordinais, 151, 153–54 causal aleatório, 80–82 erro
variáveis de resultado, 77, 107–9 aleatório, 55–63, 79–82, 84, 84n, 157–
variabilidade fundamental, 214 68
com erro de medição, 158–63 análise, seleção aleatória, 94, 115, 229
188–89 seleção, limites de, 124–28
129–37, 141–46 variação em, e pesquisa de n pequeno , 126, 144–45, 196–
129–30, 134 outliers, 56–57 97
variáveis aleatórias, 51–52, 57, 80, 80n
variação aleatória, 59–60
Palfrey, Thomas, 125, 236 explicação racional, 226n efeito
parcimônia, 20, 29–30, 104 causal percebido, 78–80, 84 análise
racional, 226n raciocínio
analisando a variável dependente, 188– por analogia, 212–13 integração
89 a variável explicativa, 193–95 regional, 156–57 análise de
Pearson, Karl, 9, 236 regressão , 96–97, 130–32, 168–
motivações pessoais para pesquisa, 14– 69
15 variáveis relevantes, 61–62, 89, 94, 107, 123,
projetos-piloto, 22–23 168–82
Platner, Marc, 232 e endogeneidade, 189–91
Plott, Charles, 125, 232, 236 modelo formal de, 170–71, 175–76 e
cultura política, 109–10, 191–92, 226 seleção intencional, 202–3 e atribuição
Popper, Karl, 14, 19, 55, 100–102, 105, aleatória, 197 e single- estudos de
236 caso, 210–22 crenças religiosas, 205
Porter, Michael, 133–34, 236 replicabilidade, como
Porter, Theodore, 233 objetivo da coleta de dados,
eleição presidencial, 70 26–27
Índice · 245
com erro de medição, 156 Ver

centralidade do método de também inferência descritiva;
pesquisa em, 9 em eventos inferência
complexos, 6–7, 10– pesquisa científica
12 definição de, 7–9 design de, 13, 18, 118– centralidade do método em,
24, 133, 9 em eventos complexos, 6–7, 10–
174, 213– 17, 228 12 definição de, 7–
explicitação como objetivo de, 8 9 design de, 13, 18, 118–24, 133, 174,
melhorando a teoria com, 213–17, 228
19–23 como um explicitação como objetivo
procedimento público, 8 natureza de , 8 melhorando a teoria com,
social de, 9 incerteza de, 8–9, 76, 82, 95 em eventos únicos,
19–23 como
10–12um procedimento
Veja também dados, coleção de; público, 8 natureza
generalizações; pesquisa qualitativa; social de, 9 incerteza de, 8–9, 76,
pesquisa quantitativa; questões de 82, 95 sobre eventos únicos,
pesquisa projeto de pesquisa, 13, 18, 118–24, 10–12 Veja também dados, coleção de ;
133, 174, generalizações; pesquisa qualitativa;
213–17, 228 questões de pesquisa quantitativa; questões de
pesquisa
pesquisa, 14–19 contribuindo para a literatura científica, 16– Sechrest,
17 L., 238
critérios de escolha, 15 e seleção de variáveis constantes,
estruturação de estudos de caso, 45 146–49 e inferência descritiva, 141
Resistindo ao protecionismo, 179– sobre variável dependente, 129–37, 141–49
82 pesquisa retrospectiva, 136, 141, 148–49 intencional, 139–49, 202
revoluções, 10 sobre variável independente, 137–38, 140–
Rios, Douglas, 237 49
Robinson, Guilherme, 30, 237 na variável causal chave, 146 e
Rogowski, Ronald, 237 no viés da variável omitida, 202–3
Rosenau, Pauline, 237 Veja também viés de seleção
Rosenstone, Steven, 237, 238 aleatória, 94, 108, 117, 126–38
Rossi, Pedro, 146, 234 ajustando para, 132–33, 136–37
Roth, Alvin, 125, 237 e inferência descritiva, 141 e o
Rubin, Donald, 77n, 237 registro histórico, 135–36
regras de inferência, 6–7, 9, 76, 228 P induzido pelo mundo, 135–37
Russett, Bruce, 234, 237 Veja também seleção aleatória
Ryle, Gilberto, 38 Shepsle, Kenneth, 237
Shively, W. Phillips, 15, 237
amostra máxima, 54 semelhante ao que,
amostra média, 53, 65, 80–81 204 Simon, Herbert,
amostra alfabeticamente, 138 237 postulado de
Sanday, Peggy, 237 simplicidade, 20 simplificação, 10–11, 35–36, 42–
Scheingold, Stuart, 157, 235 43, 46–49,
Schumpeter, Joseph, 7, 237 93–94, 228 testes de caso único, 208–12. Veja
Schwartz, RD, 238 também casos; estudos de
ciência como empresa social, 9 caso; observações Skocpol,
inferência científica , 8, 18, 32–33, 75–114, Theda, 5, 129, 237
116 Slovic, Paul, 213, 234 problema de n
suposições para, 91–97 e pequeno , 119–
estudos de caso, 45 22, 126, 144–45, 196–97,
correção tendenciosa, 187– 208–30 modelo formal
88 critérios para julgar, 97–99 de, 121–22 e correspondência, 204 –6 número de observações necessárias para
incerteza de, 213–15 superado, 213-17
246 · Índice
problema de n pequeno teoria, 19

(cont.) e projeto de pesquisa, 213– aplicando-se à coleta e análise de dados, 13,
30 e teoria das ciências sociais, 227 19–20, 28–29, 45, 46–49, 174, 227–28
e subunidades, 220–21 alterando
Fumaça, Ricardo, 233 a restrição de, 21–22,
Snidal, Duncan, 134–35, 231 228
Snyder, Glen, 238 e endogeneidade, 187
Snyder, Jack, 140–41, 238 falsificabilidade de,
encharcando e cutucando, 36–41, 43 19 uso de modelos formais para avaliar,
Sober, Elliot, 20, 238 105–6
teoria das ciências sociais, e observações crescentes, 218, 221
19 aplicando-se à coleta e análise de dados, alavancagem de, 29–30,
13, 19–20, 28–29, 45, 46–49, 174, 227–28 104 parcimônia como meta de,
alterando 20 projetos-piloto ao testar, 22–23 função
a restrição de, 21–22 , de, 10
228 regras para construção, 99–114
e endogeneidade, 187 especificidade como meta de,
falsificabilidade de, 20 testes com dados, 13, 20–23, 28–31, 46–
19 uso de modelos formais para avaliar, 49, 101–5
105–6 descrição completa, 36–41, 43
e observações crescentes, 218, 221 Thursby, Jerry, 232
alavancagem de, 29–30, Tilly, Charles, 136, 238
104 parcimônia como meta de, séries temporais, 223n
20 projetos-piloto ao testar, 22–23 função Tirole, Jean, 25, 232
de, 10 tópicos para pesquisa, 14–19
regras para construção, 99–114 contribuindo para a literatura científica, 16–
especificidade como meta de, 17
20 testes com dados, 13, 20–23, 28–31, 46– critérios de escolha, 15 e
49, 101–5 estruturação de estudos de caso, 45
Somália, 147 Tversky, Amos, 213, 234
Cimeira soviética, 61–62 contrair e piscar, 38–40
autocorrelação espacial,
especificação 223n, imparcialidade, 27–28, 63–65, 97–99, 150–
187 estatísticas, definição de, 53 51
Stein, Janice, 234 em comparação com a eficiência,
componente estocástico, 55–63, 79–82, 84, 70-74 e endogeneidade,
84n 195-96 exemplo formal de, 65,
subunidades, 220– 97-99 e erro de medição, 161-65 e
21 dados resumidos, 53–55 viés substantivo, 64
estatísticas para, incerteza, 158, 213–15
53 reuniões de cúpula, 177–78 relatórios, 31–32, 76, 95, 152 em
cooperação entre superpotências, 177– pesquisa científica, 8–9, 82
78 Suppes, Patrick, 77, 238 desemprego, efeito sobre o crime, 159–61, 164–
pesquisa de levantamento, 5, 65
31–32 Swijtink, Zeno, eventos únicos, estudo de, 10–12, 42–43, 93–
233 causalidade simétrica , 89– 94
91 componente sistemático, 34, 43–44, 55–63, unidade de homogeneidade, 91-94, 116-17,
79–82, 84, 84n. Veja também 228 unidade de observação, 51-52, 57, 76-77
componente estocástico e subunidades para aumentar as observações,
220–21
Tawney, RH, 187, 238 Estados Unidos, 205
Teune, Henry, 36, 168, 201, 204, 237 unidade da ciência, 9
Índice · 247
usando subunidades para aumentar as observações, Webb, Eugene, 238

220–21 Weber, Max, 11, 186–87, 238
Weick, Karl, 238
validade, 25 Alemanha de Weimar, 189–91
variáveis, 51–52, 57, 80, 80n Weiner, Myron, 64, 226, 238
variância, 58–59, 80–81, 213–17 Wendt, Alexandre, 238
da variável causal chave, 214–17 Cisjordânia, 55–59, 95
variância dos efeitos causais, 82, 84–85, 98–99 Europa Ocidental, 135–36
Verba, Sidney, 45, 168, 193–95, 220–21, piscar e contrair, 38–40 explicação dentro da
238 observação, 227n
verstehen, 36–41, 43 Wolfinger, Raymond, 238
procedimentos de veto, Woods, John, 19, 238
154 participação voluntária, 193–95 Segunda Guerra Mundial, 117
Walton, Douglas, 19, 238 Zelditch, Morris, 147, 238

Valsa, Kenneth, 152, 238 guerra, Zellner, Arnold, 20, 102, 238
10 Zimbábue, 219

Gary King, Robert O. Keohane, Sidney Verba Designing Social Inquiry 1994

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Gary King, Robert O. Keohane, Sidney Verba Designing Social Inquiry 1994

Enviado por

Direitos autorais:

Formatos disponíveis

Machine Translated by Google

Projetando a Investigação Social

Projetando a Investigação Social

PRINCETON UNIVERSITY PRESS

PRINCETON, NOVA JERSEY

Copyright ÿ 1994 pela Princeton University Press

Todos os direitos reservados

Dados de Catalogação na Publicação da Biblioteca do

Congresso King, Gary.

Este livro foi composto em Adobe Palatino

Os livros da Princeton University Press são

Terceira impressão, com correções e índice ampliado, 1995

1 A Ciência nas Ciências Sociais 3

1.1.1 Dois estilos de pesquisa, uma lógica de inferência 1.1.2 3

Definindo a pesquisa científica em ciências sociais 1.1.3 Ciência 7

e complexidade 1.2 Principais 9

componentes do projeto de pesquisa 1.2.1 Melhorando 12

as questões de pesquisa 1.2.2 Melhorando 14

a teoria 1.2.3 Melhorando a 19

qualidade dos dados 1.2.4 Melhorando 23

o uso dos dados existentes 27

1.3 Temas deste Volume 28

1.3.1 Usando implicações observáveis para conectar teoria e dados

2 Inferência Descritiva 2.1 34

Conhecimento Geral e Fatos Particulares 2.1.1 35

“Interpretação” e Inferência 2.1.2 36

2.2 Inferência: o propósito científico da coleta de dados 2.3 Modelos 46

formais de pesquisa qualitativa 2.4 Um modelo formal de 49

2.5 Resumindo detalhes históricos 2.6 53

Inferência descritiva 2.7 Critérios 55

para julgar inferências descritivas 63

2.7.1 Inferências imparciais 63

3 Causalidade e Inferência Causal 3.1 75

3.1.1 A Definição e um Exemplo Quantitativo 3.1.2 Um 76

3.2 Esclarecendo Definições Alternativas de Causalidade 85

3.2.1 “Mecanismos causais” 85

necessárias para estimar efeitos causais 3.3.1 Homogeneidade de unidade 91

3.3.2 Independência condicional 91

causais 3.5 Regras para construir teorias causais 3.5.1 97

Regra 1: Construir teorias falsificáveis 3.5 .2 Regra 2: 99

Construa teorias que sejam internamente consistentes 100

4 Determinando o que observar 115

4.1 Projetos de Pesquisa Indeterminados 118

4.1.1 Mais inferências do que observações 4.1.2 119

limites da seleção aleatória 124

4.3 Viés de Seleção 128

4.3.1 Seleção na variável dependente 4.3.2 Seleção 129

4.4.1 Selecionando observações sobre a variável explicativa 4.4.2 140

4.5 Considerações Finais 149

5 Entendendo o que evitar 150

5.1.1 Erro de medição sistemático 5.1.2 Erro 155

5.2 Excluindo Variáveis Relevantes: Viés 168

Incluindo variáveis irrelevantes: ineficiência 5.4 Endogeneidade 182

5.4.1 Corrigindo inferências tendenciosas 187

Atribuição de valores da variável explicativa 5.6 Controle da 196

situação de pesquisa 5.7 Considerações finais 199

6 Aumentando o Número de Observações 208

6.1 Projetos de Observação Única para Inferência Causal 209

Quantas observações são suficientes? 213

6.3 Fazendo muitas observações de poucas 6.3.1 217

Mesmas medidas, novas unidades 6.3.2 219

Observações finais 229

NESTE LIVRO desenvolvemos uma abordagem unificada para inferência

Concluímos a primeira versão deste livro em 1991 e a revisamos