Escolar Documentos
Profissional Documentos
Cultura Documentos
INFERÊNCIA CIENTÍFICA EM
PESQUISA QUALITATIVA
Gary King
Robert O. Keohane
Sidney Verba
10 9 8 7 6 5 4 3
Conteúdo
Prefácio ix
vi · Conteúdo
Definindo Causalidade 76
113
observações 139
Conteúdo · vii
Referências 231
Índice 239
Machine Translated by Google
Machine Translated by Google
Prefácio
x · Prefácio
Prefácio · xi
Gary King
Robert O. Keohanne
Sidney Verba
Cambridge, Massachusetts
Machine Translated by Google
Machine Translated by Google
CAPÍTULO 1
1.1 INTRODUÇÃO
Introdução · 5
problema sendo abordado. Uma vez que muitos assuntos de interesse para os
cientistas sociais não podem ser significativamente formulados de forma a
permitir testes estatísticos de hipóteses com dados quantitativos, não desejamos
encorajar o uso exclusivo de técnicas quantitativas. Não estamos tentando tirar
todos os cientistas sociais da biblioteca e colocá-los no centro de computação, ou
substituir conversas idiossincráticas por entrevistas estruturadas. Em vez disso,
argumentamos que a pesquisa não estatística produzirá resultados mais confiáveis
se os pesquisadores prestarem atenção às regras da inferência científica —
regras que às vezes são mais claramente definidas no estilo da pesquisa
quantitativa. Métodos estatísticos precisamente definidos que sustentam a
pesquisa quantitativa representam modelos formais abstratos aplicáveis a todos
os tipos de pesquisa, mesmo aquela para a qual as variáveis não podem ser
medidas quantitativamente. A natureza muito abstrata e até irrealista dos modelos
estatísticos é o que faz as regras de inferência brilharem tão claramente.
Além disso, nada em nosso conjunto de regras implica que devemos executar
o experimento perfeito (se tal coisa existisse) ou coletar todos os dados relevantes
antes de podermos fazer inferências científicas sociais válidas. Vale a pena
estudar um tópico importante, mesmo que haja pouca informação disponível.
O resultado da aplicação de qualquer projeto de pesquisa nessa situação serão
conclusões relativamente incertas, mas contanto que relatemos honestamente
nossa incerteza, esse tipo de estudo pode ser muito útil. A informação limitada é
muitas vezes uma característica necessária da investigação social. Como o
mundo social muda rapidamente, as análises que nos ajudam a entender essas
mudanças exigem que as descrevamos e procuremos entendê-las
contemporaneamente, mesmo quando a incerteza sobre nossas conclusões é
alta. A urgência de um problema pode ser tão grande que os dados coletados
pelos métodos científicos mais úteis podem se tornar obsoletos antes que possam
ser acumulados. Se uma pessoa perturbada está correndo em nossa direção brandindo um machado, administre
Machine Translated by Google
Introdução · 7
Introdução · 9
A ciência social constitui uma tentativa de dar sentido a situações sociais que
percebemos como mais ou menos complexas. Precisamos reconhecer,
entretanto, que o que percebemos como complexidade não é inteiramente
inerente aos fenômenos: o mundo não é naturalmente dividido em simples e complexo.
2 Embora abordemos a grande maioria das regras importantes da inferência científica, elas
não são completas. De fato, a maioria dos filósofos concorda que uma lógica indutiva
completa e exaustiva é impossível, mesmo em princípio.
Machine Translated by Google
Introdução · 11
dançar com ele. Uma vez que um investigador tenha coletado os dados
fornecidos por um projeto de pesquisa, ele frequentemente encontrará um ajuste
imperfeito entre as principais questões de pesquisa, a teoria e os dados
disponíveis. Nesta fase, os pesquisadores muitas vezes ficam desanimados.
Eles acreditam erroneamente que outros cientistas sociais encontram ajustes
próximos e imediatos entre os dados e a pesquisa. Essa percepção se deve ao
fato de que os investigadores costumam desmontar os andaimes depois de
erguer seus prédios intelectuais, deixando poucos vestígios da agonia e da
incerteza da construção. Assim, o processo de investigação parece mais
mecânico e direto do que realmente é.
Alguns de nossos conselhos são direcionados a pesquisadores que estão
tentando fazer conexões entre teoria e dados. Às vezes, eles podem projetar
procedimentos de coleta de dados mais apropriados para avaliar melhor uma
teoria; em outros momentos, eles podem usar os dados que possuem e
reformular uma questão teórica (ou mesmo colocar uma questão totalmente
diferente que não foi originalmente prevista) para produzir um projeto de
pesquisa mais importante. A pesquisa, se aderir às regras de inferência, ainda
será científica e produzirá inferências confiáveis sobre o mundo.
Sempre que possível, os pesquisadores também devem melhorar seus
projetos de pesquisa antes de realizar qualquer pesquisa de campo. No entanto,
os dados têm uma maneira de disciplinar o pensamento. É extremamente
comum descobrir que o melhor projeto de pesquisa desmorona quando as
primeiras observações são coletadas – não é que a teoria esteja errada, mas
que os dados não são adequados para responder às questões originalmente
colocadas. Entender desde o início o que pode e o que não pode ser feito nesse
estágio posterior pode ajudar o pesquisador a antecipar pelo menos alguns dos
problemas ao planejar a pesquisa pela primeira vez.
Para fins analíticos, dividimos todos os projetos de pesquisa em quatro
componentes: a questão de pesquisa, a teoria, os dados e o uso dos dados.
Esses componentes geralmente não são desenvolvidos separadamente e os
estudiosos não os atendem em nenhuma ordem predeterminada. De fato, para
pesquisadores qualitativos que iniciam seu trabalho de campo antes de escolher
uma questão de pesquisa precisa, os dados vêm primeiro, seguidos pelos outros.
No entanto, essa divisão específica, que explicamos nas seções 1.2.1–1.2.4, é
particularmente útil para entender a natureza dos projetos de pesquisa. Para
esclarecer precisamente o que poderia ser feito se os recursos fossem
redirecionados, nosso conselho no restante desta seção assume que os
pesquisadores têm tempo e recursos ilimitados. É claro que, em qualquer
situação real de pesquisa, deve-se sempre fazer concessões. Acreditamos que
entender os conselhos nas quatro categorias a seguir ajudará os pesquisadores
a fazer essas concessões de forma a melhorar ao máximo seus projetos de
pesquisa, mesmo quando, de fato, sua pesquisa está sujeita a restrições
externas.
Machine Translated by Google
pesquisa Ao longo deste livro, consideramos o que fazer uma vez que
identificamos o objeto de pesquisa. Dada uma questão de pesquisa, quais
são as maneiras de conduzir essa pesquisa para que possamos obter
explicações válidas de fenômenos sociais e políticos? Nossa discussão
começa com uma questão de pesquisa e então prossegue para os estágios
de planejamento e condução da pesquisa. Mas de onde se originam as
questões de pesquisa? Como um estudioso escolhe o tema para análise? Não
há resposta simples para esta pergunta. Como outros, Karl Popper (1968:32)
argumentou que “não existe um método lógico para se ter novas ideias. . . . A
descoberta contém 'um elemento irracional' ou uma 'intuição criativa'”. As
regras de escolha nos primeiros estágios do processo de pesquisa são menos
formalizadas do que as regras para outras atividades de pesquisa. Há textos
sobre a elaboração de experimentos de laboratório sobre escolha social,
critérios estatísticos sobre a seleção de uma amostra para uma pesquisa de
atitudes em relação a políticas públicas e manuais sobre como conduzir a
observação participante de um escritório burocrático. Mas não existe uma
regra para escolher qual projeto de pesquisa realizar, nem se devemos decidir
realizar um trabalho de campo, existem regras que regem onde devemos realizá-lo.
Podemos propor formas de selecionar uma amostra de comunidades a fim
de estudar o impacto de políticas educacionais alternativas, ou formas de
conceituar o conflito étnico de maneira que conduza à formulação e teste de
hipóteses quanto à sua incidência. Mas não há regras que nos digam se
devemos estudar política educacional ou conflito étnico. Em termos de
métodos de ciências sociais, há maneiras melhores e piores de estudar o
colapso do governo da Alemanha Oriental em 1989, assim como há maneiras
melhores e piores de estudar a relação entre a posição de um candidato
sobre impostos e a probabilidade de sucesso eleitoral. Mas não há como
determinar se é melhor estudar o colapso do regime da Alemanha Oriental ou
o papel dos impostos na política eleitoral dos Estados Unidos.
O tópico específico que um cientista social estuda pode ter uma origem
pessoal e idiossincrática. Não é por acaso que a pesquisa sobre grupos
específicos provavelmente será iniciada por pessoas desse grupo: as mulheres
muitas vezes lideraram o caminho na história das mulheres, os negros na
história dos negros, os imigrantes na história da imigração. Os tópicos também
podem ser influenciados por inclinações e valores pessoais. O estudioso da
política do terceiro mundo tende a ter um maior desejo de viajar e uma maior
tolerância para com as difíceis condições de vida do que o estudioso da
formulação de políticas do Congresso; o analista de cooperação internacional
pode ter uma aversão particular por conflitos violentos.
Essas experiências e valores pessoais geralmente fornecem a motivação
Machine Translated by Google
2. Escolher uma hipótese aceita na literatura que suspeitamos ser falsa (ou uma que
acreditamos não ter sido adequadamente confirmada) e investigar se ela é realmente
falsa ou se alguma outra teoria está correta.
3. Tentativa de resolver ou fornecer mais evidências de um lado de uma controvérsia na
literatura - talvez demonstrar que a controvérsia era infundada desde o início.
4 O dilema não é diferente daquele enfrentado pelos cientistas naturais ao decidirem conduzir
pesquisa aplicada ou básica. Por exemplo, a pesquisa aplicada em relação a uma determinada
droga ou doença pode, a curto prazo, melhorar a assistência médica sem contribuir tanto para
o conhecimento geral dos mecanismos biológicos subjacentes. A pesquisa básica pode ter a
consequência oposta. A maioria dos pesquisadores argumentaria, como fazemos com as
ciências sociais, que a dicotomia é falsa e que a pesquisa básica acabará levando a poderosos
resultados aplicados. No entanto, todos concordam que o melhor projeto de pesquisa é aquele
que, de alguma forma, consegue ser diretamente relevante para resolver problemas do mundo
real e promover os objetivos de uma literatura científica específica.
Machine Translated by Google
1.2.2 Aperfeiçoamento da
teoria Uma teoria das ciências sociais é uma especulação fundamentada e precisa
sobre a resposta a uma questão de pesquisa, incluindo uma declaração sobre por
que a resposta proposta está correta. As teorias geralmente implicam várias
hipóteses descritivas ou causais mais específicas. Uma teoria deve ser consistente
com evidências anteriores sobre uma questão de pesquisa. “Uma teoria que ignora
as evidências existentes é um oxímoro. Se tivéssemos o equivalente à legislação
da 'verdade na propaganda', tal oxímoro não deveria ser chamado de
teoria” (Lieberson 1992:4; ver também Woods e Walton 1982).
O desenvolvimento de uma teoria é frequentemente apresentado como o primeiro
passo da pesquisa. Às vezes vem primeiro na prática, mas não precisa. De fato,
não podemos desenvolver uma teoria sem o conhecimento de trabalhos anteriores
sobre o assunto e a coleta de alguns dados, pois até mesmo a questão de
pesquisa seria desconhecida. No entanto, apesar da quantidade de dados já
coletados, existem algumas maneiras gerais de avaliar e melhorar a utilidade de
uma teoria. Apresentamos brevemente cada um deles aqui, mas reservamos uma
discussão mais detalhada para capítulos posteriores.
Primeiro, escolha as teorias que podem estar erradas. Na verdade, muito mais
se aprende com teorias que estão erradas do que com teorias que são apresentadas
de forma tão ampla que não poderiam estar erradas nem mesmo em princípio.5
Precisamos ser capazes de dar uma resposta direta à pergunta: Que evidências
nos convenceriam de que estamos errados?6 Se não há resposta para essa
pergunta, então não temos uma teoria.
Em segundo lugar, para garantir que uma teoria seja falsificável, escolha uma
que seja capaz de gerar tantas implicações observáveis quanto possível. Essa
escolha permitirá mais testes da teoria com mais dados e uma maior variedade de
dados, colocará a teoria em risco de ser falsificada mais vezes e possibilitará
coletar dados para construir evidências fortes para a teoria.
5 Este é o princípio da falseabilidade (Popper 1968). É uma questão sobre a qual há posições
variadas na filosofia da ciência. No entanto, muito poucos deles discordam do princípio de que as
teorias devem ser apresentadas com clareza suficiente para que possam estar erradas.
6 Esta é provavelmente a pergunta mais comum em entrevistas de emprego em nosso
departamento e em muitos outros.
Machine Translated by Google
Portanto, nossa regra básica com respeito a alterar nossa teoria depois de
observar os dados é: podemos tornar a teoria menos restritiva (para que cubra
uma gama mais ampla de fenômenos e seja exposta a mais oportunidades de
falsificação), mas não devemos torná-la mais restritivo sem coletar novos dados
para testar a nova versão da teoria. Se não pudermos coletar dados adicionais,
estaremos presos; e não propomos nenhuma maneira mágica de desembaraçar.
Em algum momento, decidir que estamos errados é o melhor; de fato, achados
negativos podem ser bastante valiosos para uma literatura acadêmica. Quem não
preferiria uma descoberta negativa sólida a qualquer número de descobertas
positivas frágeis baseadas em teorias ad hoc?
Além disso, se estivermos errados, não precisamos parar de escrever depois
de admitir a derrota. Podemos adicionar uma seção ao nosso artigo ou um
capítulo ao nosso livro sobre pesquisas empíricas futuras e especulações teóricas
atuais. Neste contexto, temos consideravelmente mais liberdade. Podemos
sugerir condições adicionais que podem ser plausivelmente associadas à nossa
teoria, se acreditarmos que elas podem resolver o problema, propor uma
modificação de outra teoria existente ou propor uma série de teorias totalmente
diferentes. Nesta situação, não podemos concluir nada com muita certeza (exceto
talvez que a teoria que afirmamos no início esteja errada), mas temos o luxo de
inventar novos projetos de pesquisa ou projetos de coleta de dados que possam
ser usados para decidir se nossas especulações estão corretas. Estes podem
ser muito valiosos, especialmente para sugerir áreas onde futuros pesquisadores
podem procurar.
Reconhecidamente, como discutimos acima, a ciência social não opera
estritamente de acordo com regras: a necessidade de criatividade às vezes exige
que o livro didático seja descartado! E os dados podem disciplinar o pensamento.
Portanto, os pesquisadores às vezes, depois de confrontar os dados, têm
inspirações sobre como deveriam ter construído a teoria em primeiro lugar. Tal
modificação, mesmo que restritiva, pode valer a pena se pudermos convencer a
nós mesmos e aos outros de que modificar a teoria da maneira que propomos é
algo que poderíamos ter feito antes de coletar os dados, se tivéssemos pensado
nisso. Mas até que seja testado com novos dados, o status de tal teoria
permanecerá muito incerto e deve ser rotulado como tal.
teoria. Assim, novos dados podem ser reunidos para testar a nova teoria, e o
problema de usar os mesmos dados para gerar e testar uma teoria pode ser
evitado.
a teoria dos jogos cooperativos, na qual também se baseia a teoria da dissuasão, para
estudar problemas como entrada em mercados e estratégias de preços (Fudenberg e
Tirole 1989). Dada a estreita semelhança entre as teorias, a evidência empírica que
apoia as previsões da teoria dos jogos sobre o comportamento da empresa aumentaria
a plausibilidade de hipóteses relacionadas sobre o comportamento do estado na política
internacional. A incerteza permaneceria sobre a aplicabilidade das conclusões de um
domínio para outro, mas a questão é importante o suficiente para garantir tentativas de
obter insights e evidências onde quer que possam ser encontradas.
Obviamente, coletar dados para sempre sem fazer nenhuma análise impediria, em
vez de facilitar, a conclusão de uma pesquisa útil. Na prática, tempo e recursos limitados
sempre limitarão os esforços de coleta de dados. Embora mais informações, casos
adicionais, entrevistas extras, outra variável e outras formas relevantes de coleta de
dados sempre melhorem a certeza de nossas inferências até certo ponto, promissores,
estudiosos em potencial podem ser arruinados por muita informação tão facilmente
quanto por excesso de informação. pequeno. Insistir em ler mais um livro ou obter mais
um conjunto de dados sem nunca escrever uma palavra é uma receita para ser
improdutivo.
Nossa quarta diretriz é: garantir que os métodos de coleta de dados sejam confiáveis.
Confiabilidade significa que aplicar o mesmo procedimento da mesma maneira produzirá
sempre a mesma medida. Quando um procedimento confiável é aplicado em momentos
diferentes e nada aconteceu nesse meio tempo para alterar o estado “verdadeiro” do
objeto que estamos medindo, o mesmo resultado será observado.10 Medidas confiáveis
também produzem a mesma precisão.
1.3.2 Maximizando a
Existem várias maneiras pelas quais podemos aumentar nossa influência sobre
um problema de pesquisa. A maneira principal é aumentar o número de implicações
observáveis de nossa hipótese e buscar a confirmação dessas implicações. Como
descrevemos acima, esta tarefa pode envolver
Machine Translated by Google
(1) melhorar a teoria para que ela tenha implicações mais observáveis, (2)
melhorar os dados para que mais dessas implicações sejam realmente
observadas e usadas para avaliar a teoria e (3) melhorar o uso dos dados
para que mais essas implicações são extraídas de dados existentes. Nenhum
deles, nem o conceito geral de alavancagem maximizada, é o mesmo que o
conceito de parcimônia, que, como explicamos na seção 1.2.2, é uma
suposição sobre a natureza do mundo, e não uma regra para projetar
pesquisas.
Maximizar a alavancagem é tão importante e tão geral que recomendamos
enfaticamente que os pesquisadores listem rotineiramente todas as possíveis
implicações observáveis de suas hipóteses que possam ser observadas em
seus dados ou em outros dados. Pode ser possível testar algumas dessas
novas implicações no conjunto de dados original – desde que a implicação
não “saia” dos dados, mas seja uma hipótese sugerida independentemente
pela teoria ou por um conjunto de dados diferente. Mas é melhor ainda recorrer
a outros dados. Portanto, também devemos considerar as implicações que
podem aparecer em outros dados – como dados sobre outras unidades, dados
sobre outros aspectos das unidades em estudo, dados de diferentes níveis de
agregação e dados de outros períodos de tempo, como previsões sobre o
futuro próximo. — e avaliar a hipótese nessas configurações. Quanto mais
evidências pudermos encontrar em contextos variados, mais poderosa se
tornará nossa explicação e mais confiança nós e outros devemos ter em nossas conclusões.
À primeira vista, alguns pesquisadores podem se opor à ideia de coletar
implicações observáveis de qualquer fonte ou em qualquer nível de agregação
diferente daquele para o qual a teoria foi projetada. Por exemplo, Lieberson
(1985) aplica à pesquisa qualitativa a ideia estatística de “falácia ecológica” –
usando incorretamente dados agregados para fazer inferências sobre
indivíduos – para alertar contra a inferência entre níveis.12 Certamente
concordamos que podemos usar dados agregados fazer inferências incorretas
sobre indivíduos: se estivermos interessados em indivíduos, então estudá-los
geralmente é uma estratégia melhor se pudermos obter esses dados. No
entanto, se a inferência que procuramos fazer for mais do que uma hipótese
muito restrita, nossa teoria pode ter implicações em muitos níveis de análise,
e muitas vezes seremos capazes de usar dados de todos esses níveis para
fornecer algumas informações sobre nossa teoria. Assim, mesmo se estivermos
interessados principalmente em um nível agregado de análise, podemos
12 A expressão “falácia ecológica” é confusa porque o processo de raciocínio de
processos de nível agregado para individual não é ecológico nem uma falácia. “Ecológico”
é uma escolha infeliz de palavra para descrever o nível agregado de análise. Embora
Robinson (1990) tenha concluído em seu artigo original sobre esse tópico que usar a
análise agregada para raciocinar sobre indivíduos é uma falácia, cientistas sociais
quantitativos e estatísticos agora reconhecem amplamente que algumas informações
sobre indivíduos existem em níveis agregados de análise, e muitas métodos de inferência
“ecológica” imparcial foram desenvolvidos.
Machine Translated by Google
A incerteza das inferências causais significa que bons cientistas sociais não as
aceitam facilmente. Quando se diz que A causa B, alguém que “pensa como um
cientista social” pergunta se essa conexão é realmente causal. É fácil fazer
essas perguntas sobre a pesquisa de outras pessoas, mas é mais importante
perguntar sobre nossa própria pesquisa. Existem muitas razões pelas quais
podemos ser céticos em relação a uma explicação causal, embora pareça
plausível à primeira vista. Lemos no jornal que os japoneses comem menos
carne vermelha e têm menos ataques cardíacos do que os americanos. Esta
observação por si só é interessante. Além disso, a explicação – bife demais
leva ao alto índice de doenças cardíacas nos Estados Unidos – é plausível. O
cientista social cético pergunta sobre a precisão dos dados (como sabemos
sobre os hábitos alimentares? que amostra foi usada? os ataques cardíacos
são classificados de maneira semelhante no Japão e nos Estados Unidos, de
modo que estamos comparando fenômenos semelhantes?). Supondo que os
dados sejam precisos, o que mais poderia explicar os efeitos: existem outras
variáveis (outras diferenças dietéticas, características genéticas, condições de vida?
Machine Translated by Google
CAPÍTULO 2
Inferência Descritiva
36 · Inferência Descritiva
Przeworski e Teune (1982): eliminar nomes próprios. No entanto, embora
esses estudos possam não buscar entender nenhum distrito em particular,
eles não devem ignorar - como às vezes infelizmente é feito nesta tradição -
a exigência de que os fatos sobre os vários distritos que entram na análise
geral devem ser precisos.
Outras pesquisas tentam nos dizer algo sobre uma determinada postura.
Ele se concentra na Revolução Francesa ou em algum outro evento
“importante” e tenta fornecer uma explicação de como ou por que esse
evento ocorreu. A pesquisa nesta tradição seria impensável - certamente
desinteressante para a maioria dos leitores habituais de tal pesquisa - sem
nomes próprios. Um cientista político pode escrever efetivamente sobre os
padrões de relacionamento em todo o conjunto de campanhas do Congresso
sem olhar para distritos ou candidatos específicos, mas imagine a discussão
de Robert Caro (1983) sobre a corrida para o Senado em 1948 no Texas
sem Lyndon Johnson e Coke Stevenson.1 Eventos particulares como a
Revolução Francesa ou as primárias do Senado democrata no Texas em
1948 podem de fato ser de interesse intrínseco: eles despertam nossa
curiosidade e, se foram pré-condições para eventos subsequentes (como
as Guerras Napoleônicas ou a presidência de Johnson), podemos precisar
saber sobre eles para entender esses eventos posteriores. Além disso, o
conhecimento sobre revolução, rebelião ou guerra civil em geral fornecerá
informações valiosas para qualquer estudo mais focado das causas da
Revolução Francesa em particular.
Consideraremos essas questões discutindo a “interpretação”, uma alegada
alternativa à inferência científica (seção 2.1.1); os conceitos de singularidade
e complexidade do objeto de estudo (seção 2.1.2); e a área geral de estudos
de caso comparativos (seção 2.1.3).
1 Tampouco podemos descartar Caro como alguém em outro ramo: uma jornalista/biógrafa
cujo objetivo difere daquele do cientista social. Seu trabalho aborda algumas das mesmas
questões que um cientista político abordaria: o que leva ao sucesso ou ao fracasso em uma
campanha eleitoral? Qual é o papel do dinheiro e do financiamento de campanha no sucesso
eleitoral? O que motiva os colaboradores da campanha? A discussão se concentra em uma
candidatura específica em um distrito específico, mas o assunto e os quebra-cabeças colocados
se sobrepõem à ciência política padrão.
Machine Translated by Google
38 · Inferência Descritiva
entre uma contração e uma piscadela é vasto; como qualquer pessoa infeliz o
suficiente para ter o primeiro levado para o segundo sabe. O pisca-pisca está
se comunicando, e de fato se comunicando de maneira precisa e especial: (1)
deliberadamente, (2) para alguém em particular, (3) para transmitir uma
mensagem específica, (4) de acordo com um código socialmente estabelecido
e (5) ) sem conhecimento do restante da empresa. Como aponta Ryle, o
piscador fez duas coisas, contraiu as pálpebras e piscou, enquanto o
estremecido fez apenas uma, contraiu as pálpebras. Contrair as pálpebras de
propósito quando existe um código público em que isso conta como sinal de conspiração é piscar.
Tendo feito uma distinção teórica relevante, como aquela entre uma piscadela
e uma contração, o pesquisador precisa então avaliar a hipótese de que está
ocorrendo uma piscadela. É nessa avaliação que a lógica da inferência científica
é insuperável. Ou seja, a melhor forma de determinar o significado das
contrações palpebrais é por meio dos métodos sistemáticos descritos neste
livro. Se distinguir uma contração de uma piscadela fosse fundamental,
poderíamos facilmente projetar um procedimento de pesquisa para fazê-lo. Se,
por exemplo, acreditamos que determinadas contrações palpebrais são
piscadelas imbuídas de significado político, então outros casos semelhantes
também devem ser observados, uma vez que um sofisticado dispositivo de
sinalização como este (um “código público”), uma vez desenvolvido,
provavelmente ser usado novamente. Dada essa probabilidade, podemos
registrar todos os casos em que a pálpebra desse ator se contrai, observar se
o outro ator-chave está olhando no momento certo e se ele responde.
Poderíamos até planejar uma série de experimentos para ver se os indivíduos
dessa cultura estão acostumados a se comunicar dessa maneira. Compreender a cultura, cuidadosamente de-
Machine Translated by Google
40 · Inferência Descritiva
descrever o evento e ter uma profunda familiaridade com situações
semelhantes nos ajudará a fazer as perguntas certas e até mesmo nos dará
confiança adicional em nossas conclusões. Mas somente com os métodos de
inferência científica poderemos avaliar a hipótese e ver se ela está correta.
2 Por uma questão de completude, vale a pena notar que poderíamos imaginar uma teoria
totalmente diferente na qual uma contração da pálpebra não fosse uma piscadela, mas ainda
assim tivesse um efeito causal sobre outros atores. Por exemplo, a contração pode ter sido mal
interpretada. Se também estivéssemos interessados em saber se a pessoa com contração
palpebral pretendia piscar, precisaríamos procurar outras consequências observáveis dessa mesma teoria.
Machine Translated by Google
42 · Inferência Descritiva
44 · Inferência Descritiva
busca descrições que reflitam uma consciência mais abrangente da relação
entre esses e outros eventos relevantes – contemporâneos e históricos – do
que os relatos jornalísticos. Nossas descrições de eventos devem ser tão
precisas e sistemáticas quanto possível.
Isso significa que, quando formos capazes de encontrar medidas quantitativas
válidas do que queremos saber, devemos usá-las: que proporção de jornais
soviéticos critica a política do governo? O que as pesquisas de opinião pública
na Jordânia e no Egito revelam sobre as atitudes da Jordânia e do Egito em
relação à Guerra do Golfo? Que porcentagem dos parlamentares em exercício
foram reeleitos?
Se a quantificação produz precisão, ela não necessariamente encoraja a
exatidão, uma vez que inventar índices quantitativos que não se relacionam
intimamente com os conceitos ou eventos que pretendemos medir pode levar a
sérios erros de medição e problemas para inferência causal (ver seção 5.1). Da
mesma forma, existem maneiras mais e menos precisas de descrever eventos
que não podem ser quantificados. Pesquisadores qualitativos disciplinados
tentam analisar cuidadosamente constituições e leis, em vez de meramente
relatar o que os observadores dizem sobre elas. Ao fazer estudos de caso de
políticas governamentais, os pesquisadores fazem a seus informantes perguntas
incisivas e bem especificadas, cujas respostas serão relativamente inequívocas,
e eles acompanham sistematicamente comentários improvisados feitos por um
entrevistado que sugerem hipóteses relevantes. Os estudos de caso são
essenciais para a descrição e são, portanto, fundamentais para a ciência social.
É inútil tentar explicar o que não descrevemos com um grau razoável de precisão.
3 A literatura sobre estudos de caso comparativos é vasta. Algumas das melhores obras adicionais
são Eckstein (1975), Lijphart (1971) e Collier (1991).
Machine Translated by Google
46 · Inferência Descritiva
ser usado para inferência descritiva ou causal. Muitos conselhos valiosos sobre
como fazer estudos de caso comparativos, como este, são rudimentares, mas
frequentemente ignorados.
Em segundo lugar, não precisamos ter uma teoria completa antes de coletar
dados, nem nossa teoria deve permanecer fixa o tempo todo. Teoria e dados
interagem. Assim como com o ovo e a galinha, alguma teoria é sempre necessária
antes da coleta de dados e alguns dados são necessários antes de qualquer
teorização. Os livros didáticos de pesquisa nos dizem que usamos nossos dados
para testar nossas teorias. Mas aprender com os dados pode ser um objetivo tão
importante quanto avaliar teorias e hipóteses anteriores. Tal aprendizado envolve
a reorganização de nossos dados em implicações observáveis da nova teoria.
Essa reorganização é muito comum no início de muitos processos de pesquisa,
geralmente após a coleta de alguns dados preliminares; após a reorganização, a
coleta de dados continua para avaliar a nova teoria. Devemos sempre tentar
continuar coletando dados mesmo após a reorganização para testar a nova teoria e
assim evitar usar os mesmos dados para avaliar a teoria que usamos para
desenvolvê-la.4
4 Por exemplo, Coombs (1964) demonstrou que virtualmente toda coleta de dados útil
Machine Translated by Google
Inferência · 47
tarefa requer ou implica algum grau de teoria, ou “miniteoria”. No entanto, muitos dados
quantitativos e histórico qualitativo são coletados com o propósito explícito de encorajar futuros
pesquisadores a usá-los para propósitos previamente imprevistos. Quinze minutos com o resumo
estatístico dos Estados Unidos convencerão a maioria das pessoas deste ponto. Os esforços
de coleta de dados também diferem no grau em que os pesquisadores seguem rigidamente as
crenças anteriores.
Machine Translated by Google
48 · Inferência Descritiva
as variáveis podem ser renda, identificação partidária ou qualquer coisa que seja
uma implicação observável da teoria que está sendo avaliada. Ou a classe pode
ser um tipo particular de coletividade, como comunidades ou países, as unidades
podem ser uma seleção delas, e os atributos ou variáveis podem ser seu tamanho,
o tipo de governo, suas circunstâncias econômicas, sua composição étnica. , ou
o que mais for mensurável e de interesse do pesquisador. Esses conceitos, assim
como vários outros construtos, como tipologias, estruturas e todo tipo de
classificação, são úteis como dispositivos temporários quando estamos coletando
dados, mas não temos hipóteses claras a serem avaliadas. No entanto, em geral,
encorajamos os pesquisadores a não organizar seus dados dessa maneira.
50 · Inferência Descritiva
testes de túnel, seria em grande parte irrelevante. No entanto, como até a poeira
do carpete pode fazer com que um avião pese mais e, portanto, use combustível
mais caro, modelos desse tipo são importantes para a indústria aérea e foram
construídos (e economizaram milhões de dólares).
Todos os modelos variam entre versões restritivas e irrestritas. Os modelos
restritivos são mais claros, mais parcimoniosos e mais abstratos, mas também
são menos realistas (a menos que o mundo seja realmente parcimonioso).
Modelos irrestritos são detalhados, contextuais e mais realistas, mas também
são menos claros e mais difíceis de estimar com precisão (ver King 1989: seção
2.5). Onde neste continuum escolhemos construir um modelo depende do
propósito para o qual ele será colocado e da complexidade do problema que
estamos estudando.
Enquanto alguns modelos são físicos, outros são pictóricos, verbais ou
algébricos. Por exemplo, a descrição qualitativa dos sistemas judiciários
europeus em um livro sobre esse assunto é um modelo desse evento. Não
importa quão densa seja a descrição ou talentoso o autor, o relato do livro
sempre será uma abstração ou simplificação em comparação com o sistema
judicial atual. Como a compreensão requer alguma abstração, o sinal de um
bom livro é tanto o que fica de fora quanto o que se inclui.
52 · Inferência Descritiva
atividade organizacional internacional desde 1945. As variáveis que medem
a atividade organizacional podem incluir o número de países pertencentes
a organizações internacionais em um determinado momento, o número de
tarefas executadas por organizações internacionais ou o tamanho dos
orçamentos e equipes. Nesses exemplos, as unidades de análise incluiriam
organizações internacionais, áreas temáticas, membros de países e
períodos de tempo como anos, períodos de cinco anos ou décadas. No
estágio de coleta de dados, nenhuma regra formal se aplica a quais variáveis
coletar, quantas unidades devem existir, se as unidades devem ser mais
numerosas que as variáveis ou quão bem as variáveis devem ser medidas.
A única regra é o nosso julgamento sobre o que será importante. Quando
temos uma ideia mais clara de como os dados serão usados, a regra passa
a ser encontrar o máximo possível de implicações observáveis de uma
teoria. Como enfatizamos no capítulo 1, a pesquisa empírica pode ser usada
tanto para avaliar hipóteses a priori quanto para sugerir hipóteses não
consideradas anteriormente; mas se a última abordagem for seguida, novos
dados devem ser coletados para avaliar essas hipóteses.
Deve ficar muito claro em nossa discussão que a maioria dos trabalhos
rotulados como “estudos de caso” tem inúmeras variáveis medidas em
muitos tipos diferentes de unidades. Embora a pesquisa de estudo de caso
raramente use mais do que um punhado de casos, o número total de
observações é geralmente imenso. Portanto, é essencial distinguir entre o
número de casos e o número de observações. O primeiro pode ser de
algum interesse para alguns propósitos, mas apenas o último é importante
para julgar a quantidade de informação que um estudo traz para uma
questão teórica. Portanto, reservamos o n comumente usado para se referir
apenas ao número de observações e não ao número de casos. Apenas
ocasionalmente, como quando observações individuais são parcialmente
dependentes, distinguiremos entre informação e número de observações.
A terminologia do número de observações vem da amostragem por
pesquisa, onde n é o número de pessoas a serem entrevistadas, mas nós a
aplicamos de maneira muito mais geral. De fato, nossa definição de
“observação” coincide exatamente com a definição de Harry Eckstein
(1975:85) do que ele chama de “caso”. Como Eckstein argumenta, “Um
estudo de seis eleições gerais na Grã-Bretanha pode ser, mas não precisa
ser, um estudo n = 1. Também pode ser um estudo n = 6. Também pode
ser um estudo n = 120.000.000. Depende se o objeto de estudo são
sistemas eleitorais, eleições ou eleitores”. A “ambiguidade sobre o que
constitui um 'indivíduo' (portanto, 'caso') só pode ser dissipada não olhando
para entidades concretas, mas para as medidas feitas delas. Com base
nisso, um 'caso' pode ser definido tecnicamente como um fenômeno para
o qual relatamos e interpretamos apenas uma única medida em qualquer
variável pertinente. A única diferença em nosso uso é que, desde o artigo de Eckstein, os estudiosos continuaram a usar o
Machine Translated by Google
Depois que os dados são coletados, o primeiro passo em qualquer análise é fornecer
resumos dos dados. Os resumos descrevem o que pode ser uma grande quantidade
de dados, mas não estão diretamente relacionados à inferência. Uma vez que
estamos interessados em generalização e explicação, um resumo dos fatos a serem
explicados geralmente é um bom ponto de partida, mas não é uma meta suficiente
para os estudos em ciências sociais.
A sumarização é necessária. Nunca podemos dizer “tudo o que sabemos” sobre
qualquer conjunto de eventos; seria inútil tentar fazê-lo. Bons historiadores entendem
quais eventos foram cruciais e, portanto, constroem relatos que enfatizam o essencial
em vez de digressões. Para entender a história européia durante os primeiros quinze
anos do século XIX, podemos precisar entender os princípios da estratégia militar
como Napoleão os entendia, ou mesmo saber o que seu exército comia se “viajasse
de barriga para baixo”. pode ser irrelevante saber a cor do cabelo de Napoleão ou se
ele preferia ovos fritos a ovos cozidos. Uma boa escrita histórica inclui, embora não se
limite a, um resumo verbal comprimido de uma confusão de detalhes históricos.
y¯ = __(y1
1n
+ y2 +...+ yn) = __yi 1n _
eu = 1
5 Formalmente, para um conjunto de n unidades nas quais uma variável y é medida (y1,..., yn), uma estatística
h é uma função de valor real definida da seguinte forma: h = h(y) = h(y1,..., yn).
Machine Translated by Google
54 · Inferência Descritiva
onde i=1 yin é uma maneira conveniente de escrever y1 + y2 + y3 +...+ yn. Uma
outra estatística é o máximo da amostra, denominado ymax:
A média amostral das quatro rendas do exemplo da seção 2.4 (US$ 9.000, US$
22.000, US$ 21.000 e US$ 54.292) é de US$ 26.573. O valor máximo da amostra
é $ 54.292. Podemos resumir os dados originais contendo quatro números com
esses dois números representando a média e o máximo da amostra. Também
podemos calcular outras características da amostra, como o mínimo, a mediana, a
moda ou a variância.
Cada resumo neste modelo reduz todos os dados (quatro números neste exemplo
simples, ou nosso conhecimento de algum aspecto da história europeia no outro) a
um único número. Comunicar-se com resumos costuma ser mais fácil e significativo
para um leitor do que usar todos os dados originais. Claro, se tivéssemos apenas
quatro números em um conjunto de dados, faria pouco sentido usar cinco resumos
diferentes; apresentar os quatro números originais seria mais simples. Interpretar
uma estatística geralmente é mais fácil do que entender todo o conjunto de dados,
mas necessariamente perdemos informações ao descrever um grande conjunto de
números com apenas alguns.
Que regras regem o resumo dos detalhes históricos? A primeira regra é que os
resumos devem se concentrar nos resultados que desejamos descrever ou explicar.
Se estivéssemos interessados no crescimento da organização internacional média,
não seria sensato focar nas Nações Unidas; mas se estivéssemos preocupados
com a distribuição do tamanho das organizações internacionais, de grandes a
pequenas, as Nações Unidas certamente seriam uma das unidades em que
deveríamos nos concentrar. As Nações Unidas não são uma organização
representativa, mas são importantes. Em termos estatísticos, para investigar a
organização internacional típica, examinaríamos os valores médios (de orçamentos,
tarefas, filiações, etc.), mas para compreender o âmbito da atividade, gostaríamos
de examinar a variância. Um segundo preceito igualmente óbvio é que um resumo
deve simplificar as informações à nossa disposição. Em termos quantitativos, esta
regra significa que devemos sempre usar menos estatísticas de resumo do que
unidades nos dados originais, caso contrário, poderíamos facilmente apresentar
todos os dados originais sem nenhum resumo.6 Nosso resumo também deve ser
suficientemente simples para pode ser entendido por nosso público. Nenhum
fenômeno pode ser resumido perfeitamente, então os padrões de adequação
devem depender de nossos propósitos e do público. por ex
6 Este ponto está intimamente relacionado com o conceito de projetos de pesquisa indeterminados, que
discutimos na seção 4.1.
Machine Translated by Google
Inferência Descritiva · 55
De maneira ampla, um artigo científico sobre guerras e alianças pode incluir
dados envolvendo 10.000 observações. Em tal papel, os resumos dos dados
usando cinquenta números podem ser justificados; no entanto, mesmo para um
especialista, cinquenta indicadores separados podem ser incompreensíveis sem
algum resumo adicional. Para uma palestra sobre o assunto para uma turma de
graduação, três gráficos podem ser superiores.
56 · Inferência Descritiva
ção em eventos familiares ou de grupo. Se fizermos isso durante uma semana
em cada comunidade, nossas conclusões sobre o nível de conflito em cada uma
delas serão uma função, em parte, de quaisquer eventos casuais que ocorram
na semana que visitamos. Mesmo que conduzamos o estudo ao longo de um ano,
ainda não saberemos perfeitamente o verdadeiro nível do conflito, embora nossa
incerteza sobre ele diminua.
Nesses exemplos, a variação no voto conservador nos distritos ou a variação
no conflito entre as comunidades da Cisjordânia pode ser conceituada como
decorrente de dois fatores separados: diferenças sistemáticas e não sistemáticas .
Diferenças sistemáticas em nosso exemplo de eleitor incluem características
fundamentais e previsíveis dos distritos, como diferenças de ideologia, de renda,
de organização de campanha ou de apoio tradicional a cada um dos partidos. Em
hipotéticas replicações semanais das mesmas eleições, as diferenças sistemáticas
persistiriam, mas as diferenças não sistemáticas, como variações de
comparecimento devido ao clima, variariam. Em nosso exemplo da Cisjordânia,
as diferenças sistemáticas incluiriam as profundas diferenças culturais entre
israelenses e palestinos, o conhecimento mútuo de cada um e os padrões
geográficos de segregação residencial. Se pudéssemos começar nossa semana
de observação uma dúzia de vezes diferentes, essas diferenças sistemáticas
entre as comunidades continuariam a afetar o nível de conflito observado. No
entanto, diferenças não sistemáticas, como incidentes terroristas ou casos de
brutalidade policial israelense, não seriam previsíveis e afetariam apenas a
semana em que ocorreram. Com técnicas inferenciais apropriadas, geralmente
podemos aprender sobre a natureza das diferenças sistemáticas, mesmo com a
ambigüidade que ocorre em um conjunto de dados reais devido a diferenças não
sistemáticas ou aleatórias.
Inferência Descritiva · 57
força, precisamente porque o elemento aleatório não sistemático dos dados
tenderia a sobrepujar ou distorcer o elemento sistemático. Se nossa semana de
observação tivesse ocorrido imediatamente após a invasão israelense do sul do
Líbano, também não esperaríamos resultados indicativos do que geralmente
acontece na Cisjordânia.
O mundo político é teoricamente capaz de produzir múltiplos conjuntos de
dados para cada problema, mas nem sempre segue as necessidades dos
cientistas sociais. Normalmente, temos a sorte de observar apenas um conjunto
de dados. Para fins de modelo, deixaremos que esse conjunto de dados seja
representado por uma variável y (digamos, o voto para o Trabalho) medida sobre
todas as n = 650 unidades (distritos): y1, y2, ..., yn (para por exemplo, y1 pode ser
de 23.562 pessoas votando no Partido Trabalhista no distrito 1). O conjunto de
observações que rotulamos de y é uma variável realizada. Seus valores variam ao longo das n unidades.
Além disso, definimos Y como uma variável aleatória porque varia aleatoriamente
em replicações hipotéticas da mesma eleição. Assim, y5 é o número de pessoas
que votaram no Partido Trabalhista no distrito 5 e Y5 é a variável aleatória que
representa o voto em muitas eleições hipotéticas que poderiam ter ocorrido no
distrito 5 essencialmente nas mesmas condições. Os votos observados para o
Partido Trabalhista na amostra que observamos, y1, y2,..., yn, diferem entre os
constituintes por causa de fatores sistemáticos e aleatórios. Ou seja, para
distinguir as duas formas de “variáveis”, frequentemente usamos o termo variável
realizada para nos referirmos a y e variável aleatória para nos referirmos a Y.
8
Obviamente, o mesmo se aplica a todas as outras comunidades que podemos estudar.
9 Observe que a aleatoriedade não ocorre exatamente em diferentes semanas reais, uma vez que
tanto eventos aleatórios quanto diferenças sistemáticas podem explicar as diferenças observadas.
Portanto, criamos a situação mais ideal na qual imaginamos governar o mundo novamente com
características sistemáticas mantidas constantes e fatores aleatórios permitidos para variar.
Machine Translated by Google
58 · Inferência Descritiva
pegue uma variável aleatória e extraia suas características sistemáticas.) Por
exemplo, podemos querer saber o valor esperado do voto trabalhista no distrito 5
(o voto trabalhista médio Y5 em um grande número de eleições hipotéticas neste
distrito). Uma vez que esta é uma característica sistemática do sistema eleitoral
subjacente, o valor esperado é de considerável interesse para os cientistas
sociais. Em contraste, o voto trabalhista em uma eleição observada, y5, é de
interesse de longo prazo consideravelmente menor, pois é uma função de
características sistemáticas e erro aleatório.10 O valor
esperado (uma característica do componente sistemático) no quinto oeste A
comunidade bancária, El-Bireh, é expressa formalmente da seguinte forma:
E(Y5) = m5
n n
1
__E(Yi) = __mi = m (2.2)
n 1n
i=1 i=1
10 É claro que y5 pode ser de grande interesse para as pessoas do distrito 5 naquele ano
e, portanto, vale a pena estudar os componentes aleatórios e sistemáticos desse evento. No
entanto, devemos sempre tentar distinguir o aleatório do sistemático.
Machine Translated by Google
Inferência Descritiva · 59
nidade mesmo quando as características sistemáticas não mudam: até que ponto
as observações ao longo de diferentes semanas (diferentes realizações hipotéticas
da mesma variável aleatória) produzem resultados divergentes. Isto é, em outras
palavras, o tamanho do componente não sistemático. Formalmente, isso é
calculado para uma única comunidade usando a variância (em vez da expectativa):
V(Yi) = s2 eu
(2.3)
60 · Inferência Descritiva
essas duas perspectivas podem ser consideradas observacionalmente
equivalentes. Isso é especialmente verdadeiro se assumirmos, sob a Perspectiva
2, que pelo menos algumas variáveis explicativas permanecem desconhecidas.
Assim, a equivalência observacional ocorre quando essas variáveis explicativas
desconhecidas na Perspectiva 2 tornam-se a interpretação para a variação
aleatória na Perspectiva 1. Devido à falta de quaisquer implicações observáveis
com as quais distinguir entre elas, uma escolha entre as duas perspectivas
depende de fé ou crença em vez de verificação empírica.
Como outro exemplo, com ambas as perspectivas, distinguir se um
determinado evento político ou social é o resultado de um processo sistemático
ou não sistemático depende das escolhas do pesquisador.
Do ponto de vista da Perspectiva 1, podemos classificar provisoriamente um
efeito como sistemático ou não sistemático. Mas, a menos que possamos
encontrar outro conjunto de dados (ou mesmo apenas outro caso) para verificar
a persistência de um efeito ou padrão, é muito difícil fazer o julgamento correto.
Da versão extrema da Perspectiva 2, não podemos fazer mais do que
descrever os dados – julgar “incorretamente” um evento como estocástico ou
sistemático é impossível ou irrelevante. Uma versão mais realista dessa
perspectiva admite a atribuição correta ou incorreta de um padrão pela
Perspectiva 1 como aleatório ou sistemático, mas nos permite alguma latitude
para decidir o que será objeto de exame em qualquer estudo particular e o que
permanecerá inexplicado. Desta forma, começamos qualquer análise com
todas as observações sendo o resultado de forças “não sistemáticas”. Nosso
trabalho é então fornecer evidências de que determinados eventos ou processos
são o resultado de forças sistemáticas. Se um evento ou processo inexplicável
é uma ocorrência verdadeiramente aleatória ou apenas o resultado de variáveis
explicativas ainda não identificadas, isso é assunto para pesquisas futuras.
Esse argumento se aplica com igual força a pesquisadores qualitativos e
quantitativos. A pesquisa qualitativa é muitas vezes histórica, mas é mais útil
como ciência social quando também é explicitamente inferencial. Conceituar
as variáveis aleatórias a partir das quais as observações são geradas e tentar
estimar suas características sistemáticas – em vez de simplesmente resumir os
detalhes históricos – não requer coletas de dados em grande escala. De fato,
uma marca de um bom historiador é a capacidade de distinguir os aspectos
sistemáticos da situação que está sendo descrita dos idiossincráticos. Este
argumento para inferência descritiva, portanto, certamente não é uma crítica de
estudos de caso ou trabalho histórico. Em vez de,
Inferência Descritiva · 61
qualquer tipo de pesquisa em ciências sociais deve satisfazer os princípios
básicos de inferência discutidos neste livro. Encontrar evidências de
características sistemáticas será mais difícil com alguns tipos de evidências,
mas não é menos importante.
Como um exemplo de problemas de inferência descritiva na pesquisa
histórica, suponha que estamos interessados nos resultados das reuniões de
cúpula EUA-União Soviética entre 1955 e 1990. Nosso objetivo final é
responder a uma questão causal: em que condições e em que medida as
cimeiras conduzem a uma maior cooperação? Responder a essa pergunta
requer a resolução de várias questões difíceis de análise causal, particularmente
aquelas que envolvem a direção da causalidade entre um conjunto de variáveis
sistematicamente relacionadas.13 Nesta seção, entretanto, nos restringimos
a problemas de inferência descritiva.
Suponhamos que tenhamos inventado uma maneira de avaliar – por meio
de análise histórica, levantamento de especialistas, contagem de eventos
“cooperativos” e “conflituosos” ou uma combinação dessas técnicas de
medição – até que ponto as cúpulas foram seguidas de maior cooperação
entre as potências. E temos algumas hipóteses sobre as condições para
maior cooperação – condições que dizem respeito a mudanças de poder,
ciclos eleitorais nos Estados Unidos, condições econômicas em cada país e
até que ponto as expectativas anteriores de ambos os lados foram atendidas.
Suponha também que esperamos explicar o nível subjacente de cooperação
em cada ano e associá-lo de alguma forma à presença ou ausência de uma
reunião de cúpula no período anterior, bem como a nossos outros fatores
explicativos.
O que observamos (mesmo que nossos índices de cooperação sejam
perfeitos) é apenas o grau de cooperação efetivamente ocorrido em cada ano.
Se observarmos altos níveis de cooperação nos anos seguintes às reuniões
de cúpula, não saberemos, sem um estudo mais aprofundado, se as cúpulas
e a cooperação subsequente estão sistematicamente relacionadas entre si.
Com um pequeno número de observações, pode ser que a associação entre
cúpulas e cooperação reflita a aleatoriedade devido à incerteza fundamental
(boa ou má sorte na Perspectiva 1) ou a variáveis explicativas ainda não
identificadas (na Perspectiva 2). Exemplos de tais variáveis explicativas não
identificadas incluem flutuações climáticas levando a quebras de safra na
União Soviética, mudanças no equilíbrio militar ou mudanças de liderança,
todas as quais poderiam explicar mudanças na extensão da cooperação. Se
identificadas, essas variáveis são explicações alternativas - variáveis omitidas
que poderiam ser coletadas ou examinadas
62 · Inferência Descritiva
para avaliar sua influência no resultado da cúpula. Se não identificadas, essas
variáveis podem ser tratadas como eventos não sistemáticos que poderiam
explicar o alto grau observado de cooperação entre as superpotências. Para
fornecer evidências contra a possibilidade de que eventos aleatórios (variáveis
explicativas não identificadas) expliquem a cooperação observada, podemos
examinar muitos outros anos. Uma vez que eventos e processos aleatórios são,
por definição, não persistentes, será extremamente improvável que produzam
cooperação diferencial em anos com e sem cúpulas de superpotências. Mais
uma vez, somos levados à conclusão de que apenas testes repetidos em
diferentes contextos (anos, neste caso) nos permitem decidir se devemos definir
um padrão como sistemático ou apenas devido às consequências transitórias
de processos aleatórios.
Distinguir processos sistemáticos de processos não sistemáticos é muitas
vezes difícil. Do ponto de vista da ciência social, uma epidemia de gripe que
atinge mais fortemente os eleitores da classe trabalhadora do que os da classe
média é um evento imprevisível (não sistemático) que, em uma replicação
hipotética da eleição de 1979, diminuiria o voto trabalhista. Mas um padrão
persistente de diferenças de classe na incidência de uma doença incapacitante
seria um efeito sistemático diminuindo o nível médio de votação trabalhista em
muitas replicações.
A vitória de um candidato sobre outro em uma eleição nos Estados Unidos
com base na personalidade do vencedor ou um lapso acidental da língua
durante um debate televisionado pode ser um fator aleatório que pode ter
afetado a probabilidade de cooperação entre a URSS e os Estados Unidos.
Estados durante a Guerra Fria. Mas se o apelo de campanha mais eficaz aos
eleitores tivesse sido a promessa de tensões reduzidas com a URSS, vitórias
consistentes de candidatos conciliadores teriam constituído um fator sistemático
para explicar a probabilidade de cooperação.
Os fatores sistemáticos são persistentes e têm consequências consistentes
quando os fatores assumem um determinado valor. Fatores não sistemáticos
são transitórios: não podemos prever seu impacto. Mas isso não significa que
os fatores sistemáticos representam constantes. Os apelos de campanha
podem ser um fator sistemático para explicar o comportamento eleitoral, mas
esse fato não significa que os próprios apelos de campanha não mudem. É o
efeito dos apelos de campanha em um resultado eleitoral que é constante – ou,
se for variável, está mudando de forma previsível. Quando as relações soviético-
americanas eram boas, as promessas de políticas conciliatórias podem ter
conquistado votos nas eleições americanas; quando as relações eram ruins, o
inverso pode ter acontecido. Da mesma forma, o clima pode ser um fator
aleatório (se choques intermitentes e imprevisíveis têm consequências
imprevisíveis) ou uma característica sistemática (se o mau tempo sempre leva
a menos votos para candidatos a favor de políticas conciliatórias).
Em suma, resumir detalhes históricos é um importante intermediário
Machine Translated by Google
Nesta seção final, apresentamos três critérios explícitos que são comumente
usados em estatísticas para julgar os métodos de fazer inferências - imparcialidade,
eficiência e consistência. Cada um se baseia na estrutura de variável aleatória
apresentada na seção 2.6, mas tem implicações diretas e poderosas para avaliar e
melhorar a pesquisa qualitativa. Para esclarecer esses conceitos, fornecemos
apenas os exemplos mais simples possíveis nesta seção, todos a partir de
inferência descritiva. Uma versão simples de inferência envolve a estimativa de
parâmetros, incluindo o valor esperado ou a variância de uma variável aleatória (m
ou s2) para uma inferência descritiva. Também usamos esses mesmos critérios
para julgar inferências causais no próximo capítulo (ver seção 3.4). Deixamos para
capítulos posteriores conselhos específicos sobre como fazer pesquisa qualitativa
que está implícita nesses critérios e nos concentramos apenas nos conceitos para
o restante desta seção.
64 · Inferência Descritiva
hipotéticas eleições de 1979 fossem todas feitas em um domingo (quando
poderiam ter sido em qualquer dia), haveria um viés nas estimativas se esse
fato sistematicamente ajudasse um lado e não o outro (se, por exemplo, os
conservadores fossem mais relutante em votar no domingo por motivos
religiosos). Ou nossas estimativas replicadas podem ser baseadas em relatórios
de contadores de votos corruptos que favorecem um partido em detrimento do outro.
Se, no entanto, as eleições replicadas fossem realizadas em vários dias
escolhidos de maneira não relacionada à variável que nos interessa, qualquer
erro de medição não produziria resultados enviesados, mesmo que um dia ou
outro pudesse favorecer um partido. Por exemplo, se houvesse erros de
contagem devido a desleixo aleatório por parte dos contadores de votos, o
conjunto de estimativas seria imparcial.
Se as eleições britânicas fossem sempre realizadas por lei aos domingos ou
se um método de contagem de votos que favorecesse um partido em detrimento
de outro fosse incorporado ao sistema eleitoral (através do uso de um esquema
de votação específico ou, talvez, até mesmo de corrupção persistente),
estaríamos queremos um estimador que varie com base na votação média que
poderia ser esperada nas circunstâncias que incluíam esses recursos
sistemáticos. Assim, o viés depende da teoria que está sendo investigada e não
existe apenas nos dados. Faz pouco sentido dizer que um determinado conjunto
de dados é tendencioso, mesmo que possa estar repleto de muitos erros individuais.
Neste exemplo, podemos querer distinguir nossa definição de “viés
estatístico” em um estimador de “viés substantivo” em um sistema eleitoral. Um
exemplo disso são os horários de votação que tornam mais difícil para os
trabalhadores votarem – um viés substantivo não incomum de vários sistemas
eleitorais. Como pesquisadores, podemos desejar estimar a média de votos do
sistema eleitoral real (aquele com viés substantivo), mas também podemos
estimar a média de um sistema eleitoral hipotético que não tem viés substantivo
devido ao horas em que as urnas estão abertas. Isso nos permitiria estimar a
quantidade de viés substantivo no sistema. Seja qual for a média que estamos
estimando, desejamos ter um estimador estatisticamente imparcial.
n
ÿ ÿ1
E(Y¯) = E __Yi ÿn ÿ (2.4)
i=1
n
1
= __E(Yi)
n
i=1
1 =__nm n
=m
66 · Inferência Descritiva
2.7.2 Eficiência
Geralmente não temos oportunidade de aplicar nosso estimador a um grande
número de aplicações essencialmente idênticas. De fato, exceto por alguns
experimentos inteligentes, nós o aplicamos apenas uma vez. Nesse caso,
a imparcialidade é interessante, mas gostaríamos de ter mais confiança de
que a única estimativa que obtivemos esteja próxima da correta. A eficiência
fornece uma maneira de distinguir entre estimadores imparciais. De fato, o
critério de eficiência também pode ajudar a distinguir entre estimadores
alternativos com um pequeno viés. (Um estimador com um viés grande
geralmente deve ser descartado mesmo sem avaliar sua eficiência.)
A eficiência é um conceito relativo medido pelo cálculo da variância do
estimador em replicações hipotéticas. Para estimadores não viesados,
quanto menor a variância, mais eficiente (melhor) o estimador. Uma pequena
variação é melhor porque nossa estimativa provavelmente estará mais
próxima do valor real do parâmetro. Não estamos interessados na eficiência
de um estimador com um viés grande porque a baixa variância nessa
situação tornará improvável que a estimativa esteja próxima do valor
verdadeiro (porque a maioria das estimativas seria agrupada em torno do
valor errado). Conforme descrevemos a seguir, estamos interessados em
eficiência no caso de uma pequena quantidade de viés, e muitas vezes
podemos estar dispostos a incorrer em uma pequena quantidade de viés em
troca de um grande ganho de eficiência.
Suponha novamente que estamos interessados em estimar o nível médio
de conflito entre palestinos e israelenses na Cisjordânia e estamos avaliando
dois métodos: uma única observação de uma comunidade, escolhida para
ser típica, e observações semelhantes de, por exemplo, vinte e cinco
comunidades. Deveria ser óbvio que 25 observações são melhores do que
uma única observação - desde que o mesmo esforço seja aplicado tanto na
coleta de cada uma das 25 quanto na única observação.
Demonstraremos aqui exatamente por que isso ocorre. Esse resultado
explica por que devemos observar o maior número possível de implicações
de nossa teoria, mas também demonstra o conceito mais geral de eficiência
estatística, que também é relevante sempre que estamos decidindo a melhor
maneira de avaliar diferentes maneiras de combinar observações coletadas
em um inferência.
A eficiência nos permite comparar o estimador de estudo de caso de
observação única (n = 1) de m com o estimador de n grande (n = 25), que é
o nível médio de conflito encontrado em vinte e cinco estudos separados de
uma semana em diferentes comunidades da Cisjordânia. Se aplicados
adequadamente, ambos os estimadores são imparciais. Se o mesmo modelo
se aplicar, o estimador de observação única terá uma variância de V(Ytípico)
= s2. Ou seja, teríamos escolhido o que pensávamos ser um bairro “típico”,
Machine Translated by Google
14 Observe que um estimador pode ser imparcial, mas inconsistente. Por exemplo, Y1 é um
estimador não viesado de m, mas é inconsistente porque, à medida que o número de unidades
aumenta, esse estimador não melhora (ou, na verdade, não muda). Um estimador também pode ser
consistente, mas tendencioso. Por exemplo, Y¯ ÿ 5/n é tendencioso, mas é consistente porque 5/n
torna-se zero quando n se aproxima do infinito.
Machine Translated by Google
68 · Inferência Descritiva
algum fator não sistemático fez com que a observação fosse atípica, e então
podemos ajustar o nível de conflito observado para chegar a uma estimativa
do nível médio de conflito na Cisjordânia, m. Essa seria a parte mais difícil
do estimador de estudo de caso, e precisaríamos ter muito cuidado para que
o viés não se insinuasse. Quando estivermos razoavelmente confiantes de
que o viés foi minimizado, poderíamos nos concentrar em aumentar a
eficiência. Para fazer isso, podemos passar muitas semanas na comunidade
conduzindo vários estudos separados. Poderíamos entrevistar líderes
comunitários, cidadãos comuns e professores. Poderíamos conversar com
crianças, ler jornais, acompanhar uma família em sua vida cotidiana e usar
várias outras técnicas de coleta de informações.
Seguindo esses procedimentos, poderíamos coletar muito mais do que
vinte e cinco observações dentro desta comunidade e gerar um estudo de
caso que também não é tendencioso e mais eficiente do que o estudo de
vinte e cinco comunidades.
Considere outro exemplo. Suponha que estamos conduzindo um estudo
sobre o problema internacional das drogas e queremos uma medida da
porcentagem de terras agrícolas nas quais a cocaína está sendo cultivada
em uma determinada região do mundo. Suponha ainda que haja uma
escolha de dois métodos: um estudo de caso de um país ou um estudo
estatístico em larga escala de todos os países da região. Parece melhor estudar toda a região.
Mas digamos que para realizar tal estudo é necessário (por razões práticas)
usar dados fornecidos a uma agência da ONU pelos governos da região.
Sabe-se que esses números têm pouca relação com os padrões reais de
colheita, uma vez que foram preparados no Ministério das Relações
Exteriores e baseados em considerações de relações públicas. Suponha,
além disso, que pudéssemos, visitando e observando de perto um país,
fazer as correções nas estimativas do governo que trariam essa estimativa
particular muito mais perto de um número real. Qual método escolheríamos?
Talvez decidíssemos estudar apenas um país, ou talvez dois ou três. Ou
podemos estudar um país intensivamente e usar nossos resultados para
reinterpretar e, assim, melhorar os dados fornecidos pelo governo de outros
países. Nossa escolha deve ser guiada por quais dados respondem melhor
às nossas perguntas.
Para dar ainda outro exemplo, suponha que estamos estudando a
Comunidade Européia e queremos estimar o grau esperado de
regulamentação de uma indústria em toda a Comunidade que resultará das
ações da Comissão e do Conselho de Ministros. Poderíamos coletar dados
sobre um grande número de regras formalmente adotadas para o setor
industrial em questão, codificar essas regras em termos de seu rigor e,
então, estimar o rigor médio de uma regra. Se coletarmos dados sobre 100
regras com rigor semelhante a priori, a variação de nosso
Machine Translated by Google
70 · Inferência Descritiva
n
ÿ ÿ1
V(Y¯) = V __Yi ÿn ÿ
i=1
n
1
= __V(Yi)
2n
i=1
n
1
V (Y¯) = __V(Yi)
2n
(2.5)
i=1
n
= 1 __s2
2n
i=1
1 = __
ns2 n2
= s2/n
72 · Inferência Descritiva
n
ÿn ÿ ÿ 1
ÿ d = __Yi ÿ 0,01
i=1
ÿ ÿA1 + A2
c = _______ ÿ 2 ÿ
Qual estimador devemos preferir? Nossa primeira resposta é que não usaríamos
nenhum dos dois e preferiríamos a média amostral y¯; ou seja, um estudo de n grande
feito por um investigador imparcial. No entanto, o estimador óbvio ou melhor nem sempre
é aplicável. Para responder a essa pergunta, nos voltamos para uma avaliação de viés e
eficiência.
Primeiro, vamos avaliar o viés. Podemos mostrar que o primeiro estimador d é
ligeiramente enviesado de acordo com o cálculo usual:
n
ÿ ÿ1E(d) = E __Yi ÿ
0,01 ÿ n ÿ
i=1
ÿ 1 = E __Yi ÿ E(0,01) ÿ
ÿ ÿn i=1
= m ÿ 0,01
Também podemos mostrar que o segundo estimador c não é viesado por um cálculo
semelhante:
ÿ ÿA1 + A2
E(c) = E _______ ÿ 2 ÿ
E(Y1) + E(Y2)
= _____________
2
m+m
= _____
2
=m
Machine Translated by Google
n
ÿ1
ÿ V(d) = V __Yi
ÿ 0,01 ÿn ÿ
i=1
ÿ 1 = V __Yi ÿ V(0,01) ÿ
ÿ ÿn i=1
= s2/n
= s2/650
Essa variação é a mesma que a variação da média da amostra porque 0,01 não muda
(tem variação zero) entre as amostras. Da mesma forma, calculamos a variância de c
da seguinte forma:15
ÿ A1
ÿ + A2
V(c) = V _______ ÿ 2 ÿ
= __[V(Y1) + V(Y2)]
14
1 = __
2s2 4
= s2/2
Assim, c é consideravelmente menos eficiente que d porque V(c) = s2/2 é 325 vezes
maior que V(d) = s2/650. Isso também deve ser intuitivamente claro, pois c descarta a
maior parte das informações do conjunto de dados.
Qual devemos escolher? O estimador d é tendencioso, mas mais eficiente
74 · Inferência Descritiva
do que c, enquanto c é imparcial, mas menos eficiente. Neste caso particular,
provavelmente preferiríamos o estimador d. Estaríamos, portanto, dispostos a
sacrificar a imparcialidade, já que o sacrifício é bastante pequeno (0,01), para
obter um estimador significativamente mais eficiente. Em algum momento,
porém, mais eficiência não compensará um pouco de viés, pois acabamos
garantindo que as estimativas estarão mais distantes da verdade. A maneira
formal de avaliar o trade-off de eficiência de viés é calcular o erro quadrático
médio (MSE), que é uma combinação de viés e eficiência. Se g é um estimador
para algum parâmetro g (a letra grega Gama), o MSE é definido da seguinte
forma:
s2
MSE(d) = ___
650+ (0,01)2 (2.7)
s2
= ___ + 0,0001
650
s2
__
MSE(c) = 2 (2.8)
Assim, para a maioria dos valores de s2, MSE(d) < MSE(c) e preferimos d como
estimador a c.
Em teoria, devemos sempre preferir estimativas imparciais que sejam tão
eficientes quanto possível (ou seja, que usem o máximo de informações). No
entanto, nas situações reais de pesquisa que analisamos nos capítulos
seguintes, esse trade-off entre viés e eficiência é bastante saliente.
Machine Translated by Google
CAPÍTULO 3
1 Tendo em vista a preferência de alguns cientistas sociais pela explicação em detrimento da “mera
descrição”, não surpreende que os estudiosos de eventos complicados procurem vestir seu trabalho
com as armadilhas do jargão explicativo; caso contrário, eles temem ser considerados como fazendo
um trabalho inferior. Em sua essência, a explicação real é sempre baseada em inferências causais.
Consideramos os argumentos na literatura sobre “explicação não causal” como uma terminologia
confusa; em praticamente todos os casos, esses argumentos são realmente sobre explicação causal
ou são internamente inconsistentes. Se as falhas dos cientistas sociais em explicar não se devem a
pesquisas deficientes ou falta de imaginação, mas sim à natureza dos problemas difíceis, mas
significativos, que estão examinando, tais sentimentos de inferioridade são injustificados. Uma boa
descrição de eventos importantes é melhor do que uma explicação ruim de qualquer coisa.
Machine Translated by Google
Em seguida, consideramos na seção 3.4 como aplicar à inferência causal os critérios que
desenvolvemos para julgar a inferência descritiva. Na seção 3.5, concluímos este capítulo
com conselhos mais gerais sobre como construir explicações, teorias e hipóteses causais.
Nesta seção, definimos a causalidade como um conceito teórico independente dos dados
usados para aprender sobre ela. Posteriormente, consideramos a inferência causal de
nossos dados. (Para discussões de problemas específicos de inferência causal, consulte
os capítulos 4–6.) Na seção 3.1.1, apresentamos nossa definição de causalidade em
todos os detalhes, juntamente com um exemplo quantitativo simples, e na seção 3.1.2
revisitamos nossa definição ao longo com um exemplo qualitativo mais sofisticado.
definição teórica de causalidade aplica-se de forma mais simples e clara a uma única
unidade.2 Conforme definido na seção 2.4, uma unidade é um dos muitos elementos a
serem observados em um estudo, como uma pessoa , país, ano ou
2 Nosso ponto de partida nesta seção é o artigo de Holland (1986) sobre causalidade e
Machine Translated by Google
Definindo Causalidade · 77
Organização política. Para precisão e clareza, escolhemos um único
exemplo contínuo de pesquisa quantitativa: o efeito causal do status de
incumbência de um candidato democrata à Câmara dos Deputados dos
Estados Unidos sobre a proporção de votos que esse candidato recebe.
(Usar apenas um candidato democrata simplifica o exemplo.) Deixe a
variável dependente ser a proporção democrata do voto de dois partidos
para a Câmara. A variável explicativa causal chave é então dicotômica,
ou o democrata é um titular ou não. (Para simplificar ao longo desta
seção, consideramos apenas os distritos onde o Republi pode candidatar-
se à derrota na última eleição.)
A linguagem causal pode ser confusa e nossa escolha aqui
dificilmente é única. A “variável dependente” às vezes é chamada de
“variável de resultado”. “Variáveis explicativas” são muitas vezes
referidas como “variáveis independentes”. Dividimos as variáveis
explicativas em “variável causal chave” (também chamada de “causa”
ou “variável de tratamento”) e “variáveis de controle”. Por fim, a variável
causal chave sempre assume dois ou mais valores, que geralmente são
denotados por “grupo de tratamento” e “grupo de controle”.
Agora considere apenas o Quarto Distrito Congressional em Nova
York e imagine uma eleição em 1998 com um candidato democrata e
um candidato republicano (não titular). Suponha que o candidato
democrata tenha recebido y41 fração dos votos nesta eleição (o subscrito
4 denota o Quarto Distrito em Nova York e o sobrescrito I refere-se ao
fato de que o democrata é um titular). y4 I é entãoum valor da variável
dependente. Para definir o efeito causal (uma quantidade teórica ),
imagine que voltemos no tempo para o início da campanha eleitoral e
tudo continue igual, exceto que o atual democrata decide não concorrer
à reeleição e o Partido Democrata indica outro candidato (presumivelmente
o vencedor da eleição primária). Representamos a fração dos votos que
o candidato democrata (não titular) receberia em y4 (onde N denota um
candidato democrata que não é titular).3 N
o que ele chama de “Modelo de Rubin”. Holland baseia suas ideias no trabalho de numerosos
estudiosos. O trabalho de Donald Rubin (1974, 1978) sobre o assunto foi imediatamente
relevante, mas ele também cita Aristóteles, Locke, Hume, Mill, Suppes, Granger, Fisher, Neyman e outros.
Estendemos a definição de efeito causal de Holland usando algumas ideias expressas claramente
por Suppes (1970) e outras sobre “causalidade probabilística”. Achamos essa extensão
necessária, uma vez que nenhuma abordagem existente sozinha é capaz de definir a causalidade
com relação a uma única unidade e ainda permitir a divisão dos efeitos causais em componentes
sistemáticos e não sistemáticos.
3 Veja Gelman e King (1990) para detalhes deste exemplo. De forma mais geral, I e N podem
representar o grupo “tratamento” e “controle” ou quaisquer dois tratamentos experimentais
Machine Translated by Google
diferença entre essas duas frações de votos: (y4 ÿ y4 N). Por razões que ficarão claras em breve, nos referimos a essa difer
administrado de fato ou em teoria. É claro que a decisão de chamar um valor de uma variável explicativa
de tratamento e o outro de controle é totalmente arbitrária, se é que essa linguagem é usada. 4
Jon Elster (1983:34-36) afirmou que “o significado de causalidade não pode ser prestado por
declarações contrafactuais” em muitas situações, como aquelas em que um terceiro fator é responsável
pelas variáveis explicativas e dependentes aparentes. Em nossa linguagem, Elster está simplesmente
apontando para problemas comuns de inferências, que são sempre incertas até certo ponto. No entanto,
essas dificuldades de inferência não invalidam uma definição de causalidade em termos de contrafactuais.
Apesar de suas objeções, Elster reconhece que declarações contrafactuais “têm um papel importante na
análise causal” (Elster 1983:36).
Portanto, pensamos que o argumento de Elster é mais convincente como um conjunto de advertências
valiosas contra o uso descuidado de contrafactuais do que como uma crítica de sua importância definicional
fundamental no raciocínio causal.
Machine Translated by Google
Definindo Causalidade · 79
efeito causal e escreva-o em uma notação mais geral para a unidade i em vez de
apenas para o distrito 4:5
EU
N (3.1)
(Efeito Causal Realizado para a unidade i) = yi ÿ yi
É claro que esse efeito é definido apenas em teoria, pois em qualquer eleição real
EU
N
podemos observar y4 ou nenhum, mas nunca ambos. ou y4 Assim, esta simples
definição de causalidade demonstra que nunca podemos esperar conhecer um efeito
causal com certeza. Holland (1986) refere-se a este problema como o problema
fundamental da inferência causal, e é de fato um problema fundamental , pois não
importa quão perfeito seja o projeto de pesquisa, não importa quantos dados coletemos,
não importa quão perceptivos sejam os observadores, não importa quão diligentes são
os assistentes de pesquisa, e não importa quanto controle experimental tenhamos,
nunca saberemos com certeza uma inferência causal. De fato, a maioria das questões
empíricas de projetos de pesquisa que discutimos neste livro envolve esse problema
fundamental, e a maioria de nossas sugestões constituem tentativas parciais de evitá-lo.
Agora definimos o efeito causal aleatório para o distrito 4 como a diferença entre
essas duas variáveis aleatórias. Como desejamos manter alguma generalidade,
mudamos novamente a notação do distrito 4 para a unidade i:
(3.2)
EU
7 Como explicamos com mais detalhes na seção 2.2, essa frase pode ser confusa. Uma
“variável aleatória” contém algum componente sistemático e, portanto, nem sempre é
totalmente imprevisível. Infelizmente, esta linguagem tem um significado específico em
estatística e os conceitos subjacentes a ela são importantes. A razão original para a
terminologia é que a aleatoriedade não significa “vale tudo” ou “tudo pode acontecer”. Em
vez disso, refere-se a um dos muitos possíveis processos probabilísticos muito bem
especificados. Por exemplo, o processo aleatório que governa qual lado de uma moeda cai
para cima quando é lançado no ar é um processo aleatório muito diferente daquele que
governa o crescimento da burocracia da Comunidade Econômica Européia ou a consequência
política incerta de uma mudança no sistema eleitoral da Itália. . A chave para nossa
representação é que cada um desses processos “aleatórios” tem componentes sistemáticos e probabilísticos.
Machine Translated by Google
Definindo Causalidade · 81
como objetos de inferência descritiva: médias e variâncias também são características
sistemáticas de variáveis aleatórias (como na seção 2.2). Em segundo lugar, permite-nos
dividir um problema de inferência causal em componentes sistemáticos e não sistemáticos.
Embora muitos recursos sistemáticos de uma variável aleatória possam ser interessantes, o
mais relevante para nosso exemplo em execução é o efeito causal médio para a unidade i.
Para explicar o que queremos dizer com isso, voltamos ao nosso exemplo da eleição em
Nova York.
Lembre-se de que a variável aleatória se refere à fração de votos recebidos pelo
democrata (titular ou não) em um grande número de replicações hipotéticas da mesma
eleição. Definimos o valor esperado dessa variável aleatória - a média da fração de votos
entre essas replicações - para o não titular como
N
E(Y4 N) = m4
E(Y4 I) = m4.
EU
EU
= E(Yi ÿ Yi N)
= E(Yi ) ÿ E(Yi N)
EU
N
= mi ÿ mi
EU
onde na primeira linha desta equação, b (beta) refere-se a este efeito causal médio. Na
segunda linha, indicamos que o efeito causal médio para a unidade i é apenas a média (valor
esperado) do efeito causal aleatório, e na terceira e quarta linhas mostramos como calcular
a média.
A última linha é outra maneira de escrever a diferença nas médias dos dois conjuntos de
eleições hipotéticas. (A média da diferença entre duas variáveis aleatórias é igual à diferença
das médias.)
Para resumir em palavras: o efeito causal é a diferença entre o componente sistemático das
observações feitas quando a variável explicativa leva
Machine Translated by Google
No quadro da página 95, fornecemos uma notação mais geral para efeitos causais, que
será útil ao longo deste livro.
Muitas outras características sistemáticas desses efeitos causais aleatórios podem
ser de interesse em várias circunstâncias. Por exemplo, podemos querer saber a
variação nos possíveis efeitos causais (realizados) do status de incumbência sobre o
voto democrata na unidade i, assim como a variação no próprio voto que descrevemos
na equação 2.3 na seção 2.6. Para calcular a variância do efeito causal, aplicamos a
operação de variância
EU
Desenvolvemos nossa definição precisa de causalidade na seção 3.1. Como alguns dos
conceitos dessa seção são sutis e bastante sofisticados, ilustramos nossos pontos com
um exemplo muito simples da pesquisa quantitativa. Este exemplo nos ajudou a
comunicar os conceitos que desejávamos enfatizar sem também ter que atender aos
detalhes contextuais e à sensibilidade cultural que caracterizam uma boa pesquisa
qualitativa. Nesta seção, prosseguimos com nossa definição de causalidade novamente,
mas desta vez por meio de um exemplo qualitativo.
Definindo Causalidade · 83
variável. Por exemplo, uma das principais questões enfrentadas pelos
envolvidos com política e governo tem a ver com as consequências de uma
determinada lei ou regulamentação. O Congresso aprova uma lei tributária
destinada a ter uma consequência específica – levar a investimentos
específicos, aumentar a receita em uma determinada quantia e mudar os
padrões de consumo. Tem este efeito? Podemos observar o que acontece
depois que o imposto é aprovado para ver se as consequências pretendidas
aparecem; mas mesmo que o façam, nunca é certo que resultem da lei. A
mudança na política de investimentos poderia ter acontecido de qualquer
maneira. Se pudéssemos repassar a história com e sem a nova
regulamentação, teríamos muito mais influência para estimar o efeito causal
dessa lei. Claro, não podemos fazer isso. Mas a lógica nos ajudará a
projetar a pesquisa para nos dar uma resposta aproximada à nossa pergunta.
Considere agora o seguinte exemplo estendido de política comparada.
Na esteira do colapso do sistema soviético, numerosos governos nas ex-
repúblicas soviéticas e na Europa Oriental instituíram novas formas de
governo. Eles estão engajados – como eles mesmos percebem – em um
grande experimento político: eles estão introduzindo novas constituições,
constituições que eles esperam que tenham o efeito pretendido de criar
sistemas democráticos estáveis. Uma das escolhas constitucionais é entre
as formas parlamentar e presidencial de governo. Qual sistema tem maior
probabilidade de levar a uma democracia estável é assunto de considerável
debate entre os estudiosos da área (Linz 1993; Horowitz 1993; Lijphart
1993). O debate é complexo, até por causa dos numerosos tipos de
sistemas parlamentar e presidencial e da variedade de outras disposições
constitucionais que podem acompanhar e interagir com essa escolha (como
a natureza do sistema eleitoral). Não é nosso propósito fornecer uma
análise completa dessas escolhas, mas sim uma versão bastante
simplificada da escolha para definir um efeito causal no contexto desse
exemplo qualitativo.
Ao fazê-lo, destacamos a distinção entre características sistemáticas e
não sistemáticas de um efeito causal.
O debate sobre os sistemas presidencial versus parlamentar envolve
características variadas dos dois sistemas. Vamos nos concentrar em dois:
até que ponto cada sistema representa os diversos interesses da cidadania
e encoraja uma liderança forte e decisiva. O argumento é que os sistemas
parlamentaristas representam melhor toda a gama de grupos sociais e
interesses no governo, uma vez que há muitos assentos legislativos a
serem preenchidos, e eles podem ser preenchidos por representantes
eleitos de vários grupos. Em contraste, o caráter tudo ou nada dos sistemas
presidencialistas significa que alguns grupos se sentirão excluídos do
governo, ficarão insatisfeitos e causarão maior instabilidade. Por outro lado,
os sistemas parlamentaristas – especialmente se representarem
adequadamente toda a gama de grupos e interesses sociais – provavelmente serão
Machine Translated by Google
8 Essas distinções são elas mesmas debatidas. Alguns argumentam que um sistema presidencial pode
fazer um trabalho de representação melhor. E outros argumentam que os sistemas parlamentares podem
ser mais decisivos.
9 A distinção entre uma característica sistemática e não sistemática nem sempre é
clara. A doença repentina de um presidente parece ser uma característica não sistemática
do sistema presidencial. Por outro lado, a vulnerabilidade geral dos sistemas
presidencialistas aos caprichos da saúde e da personalidade de um único indivíduo é um
efeito sistemático que aumenta a probabilidade de que algum aspecto não sistemático apareça.
Machine Translated by Google
Essa definição também exigiria que identificássemos uma série de idades de ligação causal,
para definir a causalidade para cada par de variáveis consecutivas na sequência e para identificar
as ligações entre quaisquer duas dessas variáveis e as conexões entre cada par de variáveis.
Essa abordagem leva rapidamente a uma regressão infinita e em nenhum momento ela sozinha
dá uma definição precisa de causalidade para qualquer causa e efeito.
A nosso ver, a identificação dos mecanismos pelos quais uma causa tem seu efeito muitas
vezes dá sustentação a uma teoria e é um procedimento operacional muito útil. A identificação
de mecanismos causais pode às vezes nos dar mais influência sobre uma teoria, fazendo
observações em um ponto de vista diferente.
Machine Translated by Google
parece invalidar a abordagem de “álgebra booleana” de Ragin como uma forma geral de
projetar explicações teóricas ou fazer inferências; aprender com dados requer a mesma
lógica de inferência científica que discutimos neste livro. No entanto, sua abordagem ainda
pode ser valiosa como uma forma de teoria formal (ver seção 3.5.2): ela permite ao
investigador especificar uma teoria e suas implicações de uma forma que pode ser muito
mais difícil sem ela.
Machine Translated by Google
3.3.1 Homogeneidade da
corridas para o Congresso, mas não para o Senado? Corridas apenas no Norte? Corridas
nas últimas duas décadas apenas?
Observe como a suposição de homogeneidade da unidade se relaciona com nossa
discussão na seção 1.1.3 sobre complexidade e “unicidade”. Lá, argumentamos que a
generalização da ciência social depende de nossa capacidade de simplificar a realidade
de forma coerente. No limite, simplificar a realidade para fins de inferências causais implica
atender aos padrões de homogeneidade da unidade: as observações analisadas tornam-
se, para fins de análise, idênticas em aspectos relevantes. Muitas vezes é impossível
atingir a homogeneidade da unidade; as eleições para o Congresso, para não falar das
revoluções, dificilmente são analogias próximas dos interruptores de luz. mas entender
Machine Translated by Google
ÿ miN (3.4)
EU
b = E(YiXi = 1) ÿ E(YiXi = 0) = mi
E(Yi) = mi N + Xi(mi EU
ÿ mi N) (3.5)
= mi N + Xib
N + (0)b
E(YiX = 0) = mi
N
= mi
N + (1)b
E(YiX = 1) = mi
= mi N +b
= mi N + (mim ÿ mi N) EU
EU
= mi
12 Para evitar o uso de um termo constante, assumimos que todas as variáveis têm zero
significar. Isso simplifica a apresentação, mas não limita nossas conclusões de forma alguma.
Machine Translated by Google
E(Yi) = bXi
n
i=1YiXi
b = _________ (3.7)
n
2
i=1Xi
_________ÿ
E(b) = Eÿ ÿ n
(3.8)
2 ÿÿ
i=1Xi
n
i=1XiE(Yi)
= ___________
n
2
i=1Xi
n
i=1Xi 2b
= _________
n
2
i=1Xi
=b
ÿ_________ÿ
n
i=1XiYi
V(b) = Vÿ ÿ n
(3.9)
2 ÿÿ
i=1Xi
n
1
= __________Xi 2V(Yi)
2
i=1
(n i=1Xi 2)
V(Yi)
= ________
n
2
i=1Xi
Machine Translated by Google
s2
= ________
n
2
i=1Xi
Por esta primeira regra, não queremos apenas dizer que uma “teoria” incapaz
de estar errada não é uma teoria. Também queremos dizer que devemos
projetar as teorias de modo que possam ser mostradas como erradas o mais
fácil e rapidamente possível. Obviamente, não devemos realmente tentar estar
errados, mas mesmo uma teoria incorreta é melhor do que uma afirmação que
não é nem errada nem certa. A ênfase em teorias falsificáveis nos obriga a
manter a perspectiva correta sobre a incerteza e garante que tratemos as
teorias como tentativas e não as deixemos se tornar dogmas. Devemos
sempre estar preparados para rejeitar teorias diante de evidências científicas
suficientes contra elas. Uma pergunta que deve ser feita sobre qualquer teoria
(ou de qualquer hipótese derivada da teoria) é simplesmente: que evidência a
falsificaria? A pergunta deve ser feita a todas as teorias e hipóteses, mas,
acima de tudo, o pesquisador que apresenta a teoria em primeiro lugar deve
fazê-la por conta própria.
Karl Popper é mais estreitamente identificado com a ideia de falsificabilidade
(Popper 1968). Na visão de Popper, existe uma assimetria fundamental entre
confirmar uma teoria (verificação) e refutá-la (falsificação). O primeiro é quase
irrelevante, enquanto o último é a chave para a ciência. Popper acredita que
uma teoria, uma vez declarada, torna-se imediatamente parte do corpo de
conhecimento científico aceito. Uma vez que as teorias são gerais e as
hipóteses específicas, as teorias implicam tecnicamente um número infinito de
hipóteses. No entanto, testes empíricos só podem ser conduzidos em um
número finito de hipóteses. Nesse sentido, “as teorias não são verificáveis”
porque nunca podemos testar todas as implicações observáveis de uma teoria
(Popper 1968:252). Cada hipótese testada pode ser consistente com a teoria,
mas qualquer número de resultados empíricos consistentes não mudará nossas
opiniões, uma vez que a teoria continua sendo um conhecimento científico
aceito. Por outro lado, mesmo que uma única hipótese se mostre errada e,
portanto, inconsistente com a teoria, a teoria é falsificada e removida de nossa
coleção de conhecimento científico. “A aprovação nos testes, portanto, não faz
a mínima diferença para o status de qualquer hipótese, embora a reprovação
em apenas um teste possa
Machine Translated by Google
fazem muita diferença” (Miller 1988:22). Popper não quis dizer que a falsificação é
um conceito determinístico. Ele reconheceu que qualquer inferência empírica é até
certo ponto incerta (Popper 1982). Em sua discussão sobre a desconfirmação, ele
escreveu: “mesmo que a assimetria [entre falsificação e verificação] seja admitida,
ainda é impossível, por várias razões, que qualquer sistema teórico seja
conclusivamente falsificado” (Popper 1968:42). .
Certamente este mesmo ponto se aplica ainda mais fortemente às ciências sociais.
nces.
Além disso, a avaliação de teorias de Popper não distingue fundamentalmente
entre uma teoria recém-formulada e uma que foi
Machine Translated by Google
13 Alguns podem nos chamar (ou nos acusar de ser!) “justificacionistas” ou mesmo “justificacionistas
probabilísticos” (ver Lakatos 1970), mas se devemos ser rotulados, preferimos o rótulo bayesiano
filosófico mais coerente (ver Leamer 1978; Zellner 1971; e Barnett 1982). Na verdade, nossa principal
diferença com Popper são nossos objetivos. Dado seu objetivo preciso, concordamos com seu
procedimento; dado o nosso objetivo, talvez ele possa concordar com o nosso. No entanto, acreditamos
que nossos objetivos estão mais próximos daqueles em uso nas ciências sociais e também mais próximos
daqueles que provavelmente serão bem-sucedidos.
Machine Translated by Google
Mas uma nota de cautela deve ser adicionada. Sugerimos que o processo de
avaliação de teorias e hipóteses é flexível: testes empíricos específicos não os
confirmam nem os refutam de uma vez por todas. Quando um teste empírico é
inconsistente com nossas expectativas baseadas na teoria, não descartamos
imediatamente a teoria. Podemos fazer várias coisas: podemos concluir que a
evidência pode ter sido fraca devido apenas ao acaso; podemos ajustar o que
consideramos ser o âmbito de aplicabilidade de uma teoria ou hipótese, mesmo que
não se aplique a um caso particular e, por meio desse ajuste, manter nossa aceitação
da teoria ou hipótese. A ciência procede por tais ajustes; mas podem ser perigosos.
Se os levarmos longe demais, tornaremos nossas teorias e hipóteses invulneráveis
à refutação. A lição é que devemos ter muito cuidado ao adaptar teorias para serem
consistentes com novas evidências. Devemos evitar esticar a teoria além de toda
plausibilidade, acrescentando numerosas exceções e casos especiais.
Se nosso estudo refuta algum aspecto de uma teoria, podemos optar por reter a
teoria, mas acrescentar uma exceção. Tal procedimento é aceitável desde que
reconheçamos o fato de que estamos reduzindo as reivindicações que fazemos para
a teoria. A teoria, porém, é menos valiosa porque explica menos; em nossa
terminologia, temos menos influência sobre o problema que procuramos entender.14
Além disso, tal abordagem pode produzir uma “teoria” que é apenas uma miscelânea
inútil de várias exceções e exclusões. Em algum momento devemos estar dispostos
a descartar inteiramente as teorias e hipóteses. Exceções demais, e a teoria deveria
ser rejeitada. Assim, por si só, a parcimônia, a preferência normativa por teorias com
menos partes, não é geralmente aplicável. Tudo o que precisamos é nossa noção
mais geral de alavancagem maximizada, da qual a ideia de parcimônia pode ser
totalmente derivada quando for útil. A ideia de que a ciência é em grande parte um
processo de explicar muitos fenômenos com apenas alguns deixa claro que as teorias
com menos partes não são melhores ou piores. Para maximizar a alavancagem,
devemos tentar formular teorias que expliquem o máximo possível com o mínimo
possível. Às vezes, essa formulação é obtida por meio de parcimônia, mas às vezes
não. podemos enganar
14 Como sempre, quando modificamos uma teoria para torná-la consistente com as evidências que
coletamos, a teoria (ou aquela parte dela sobre a qual nossas evidências se baseiam) deve ser avaliada
em um contexto diferente ou em um novo conjunto de dados.
Machine Translated by Google
15 Outra formulação da visão de Popper é que “você não pode provar uma negativa”. Você
não pode, ele argumenta, porque um resultado consistente com a hipótese pode significar apenas
que você fez o teste errado. Quem tenta provar a negativa sempre se deparará com esse
problema. De fato, seus problemas não serão apenas teóricos, mas também profissionais, uma
vez que os periódicos têm mais probabilidade de publicar resultados positivos do que negativos.
Isso levou ao que é chamado de problema da gaveta de arquivo, que é mais claro na literatura
quantitativa. Suponha que não existam padrões no mundo. Então, cinco em cada cem testes de
qualquer padrão cairão fora do intervalo de confiança de 95% e, portanto, produzirão inferências
incorretas. Se supusermos que os periódicos publicam resultados positivos em vez de resultados
negativos, eles publicarão apenas os 5% que são “significativos”; isto é, eles publicarão apenas os
artigos que chegarem às conclusões erradas, e nossas gavetas de arquivos serão preenchidas com
todos os artigos que chegarem às conclusões corretas! (Ver Iyengar e Greenhouse (1988) para uma
revisão da literatura estatística sobre esse problema.) Na verdade, esses incentivos são bem
conhecidos pelos pesquisadores e provavelmente também afetam seus comportamentos.
Embora a taxa de aceitação em muitos dos principais periódicos de ciências sociais seja de
aproximadamente 5%, a situação não é tão ruim assim, mas ainda é um problema sério. A nosso
ver, o problema da gaveta de arquivos poderia ser resolvido se todos adotassem nossa posição
alternativa. Um resultado negativo é tão útil quanto um positivo; ambos podem fornecer tanta
informação sobre o mundo. Enquanto apresentarmos nossas estimativas e uma medida de nossa
incerteza, estaremos em terreno seguro.
Machine Translated by Google
Um bom modelo formal deve ser abstrato para que as principais características
do problema possam ser aparentes e o raciocínio matemático possa ser
facilmente aplicado. Considere, então, um modelo formal do efeito da
representação proporcional nos sistemas de partidos políticos, o que implica
que a representação proporcional fragmenta os sistemas partidários. A principal
variável causal é o tipo de sistema eleitoral – seja um sistema de representação
proporcional com assentos atribuídos aos partidos com base em sua proporção
de votos ou um sistema distrital uninominal no qual um único vencedor é eleito
em cada distrito. A variável dependente é o número de partidos políticos, muitas
vezes referido como o grau de fragmentação do sistema partidário. A principal
hipótese é que os sistemas eleitorais
Machine Translated by Google
com cuidado É claro que devemos fazer tudo na pesquisa com cuidado, mas
escolher variáveis, especialmente variáveis dependentes, é uma decisão
particularmente importante. Oferecemos as três sugestões a seguir (com base
em erros que ocorrem com muita frequência nas literaturas quantitativa e
qualitativa):
Primeiro, as variáveis dependentes devem ser dependentes. Um erro muito
comum é escolher uma variável dependente que de fato causa mudanças em nosso
Machine Translated by Google
De modo algum pretendemos com essa regra insinuar que conceitos como
intenções e motivações não são importantes. Desejamos apenas reconhecer
que o padrão de explicação em qualquer ciência empírica como a nossa deve
ser a verificação ou falsificação empírica . A tentativa de encontrar evidências
empíricas de conceitos abstratos, imensuráveis e inobserváveis será
necessariamente mais difícil e menos bem-sucedida do que para muitos
conceitos específicos e concretos concebidos de maneira imperfeita. Quanto
mais abstratos forem nossos conceitos, menos claras serão as consequências
observáveis e menos passível de falsificação será a teoria.
Os pesquisadores costumam usar a seguinte estratégia. Eles começam com
um conceito abstrato do tipo listado acima. Eles concordam que não pode ser
medido diretamente; assim, eles sugerem indicadores específicos do conceito
abstrato que podem ser medidos e os utilizam em suas explicações. A escolha
do indicador específico do conceito mais abstrato justifica-se por ser observável.
Às vezes, é a única coisa observável (por exemplo, é o único fenômeno para o
qual há dados disponíveis ou o único tipo de evento histórico para o qual foram
mantidos registros). Este é um aspecto perfeitamente respeitável, na verdade
geralmente necessário, da investigação empírica.
16 As regras que regem as melhores perguntas a serem feitas nas entrevistas são quase as
mesmas usadas na elaboração de explicações: Seja o mais concreto possível. Não devemos
perguntar aos americanos brancos conservadores: “Você é racista?”, mas sim: “Você se
importaria se sua filha se casasse com um homem negro?” Não devemos perguntar a alguém
se ele ou ela tem conhecimento sobre política; devemos pedir os nomes do Secretário de Estado
e do Presidente da Câmara. Em geral e sempre que possível, não devemos pedir a um
entrevistado que faça o nosso trabalho por nós. É melhor não pedir estimativas de efeitos causais;
devemos pedir medidas das variáveis explanatórias e dependentes e estimar nós mesmos o
efeito causal. Não devemos pedir motivações, mas sim fatos.
Esta regra não significa que nunca devemos perguntar às pessoas por que elas fizeram
alguma coisa. De fato, perguntar sobre as motivações costuma ser um meio produtivo de gerar
hipóteses. Motivações autorrelatadas também podem ser um conjunto útil de implicações observáveis.
No entanto, a resposta dada deve ser interpretada como a resposta do entrevistado à pergunta
do pesquisador, não necessariamente como a resposta correta. Se perguntas como essas forem
úteis, devemos planejar a pesquisa de modo que uma resposta específica dada (com quaisquer
justificativas, enfeites, mentiras ou memórias seletivas que possamos encontrar) seja uma
implicação observável.
Machine Translated by Google
CAPÍTULO 4
Um projeto de pesquisa é um plano que mostra, por meio de uma discussão de nosso
modelo e dados, como esperamos usar nossas evidências para fazer inferências. Os
projetos de pesquisa na pesquisa qualitativa nem sempre são explícitos, mas pelo
menos estão implícitos em cada parte da pesquisa. No entanto, alguns projetos de
pesquisa são indeterminados; isto é, virtualmente nada pode ser aprendido sobre as
hipóteses causais.
Infelizmente, projetos de pesquisa indeterminados são comuns tanto em pesquisas
quantitativas quanto qualitativas. Há, no entanto, uma diferença entre indeterminação
em pesquisa quantitativa e qualitativa.
Quando a pesquisa quantitativa é indeterminada, o problema costuma ser óbvio: o
programa de computador não produzirá estimativas.1 No entanto, os programas de
computador nem sempre funcionam como deveriam e muitos exemplos podem ser
citados de pesquisadores quantitativos com modelos estatísticos indeterminados que
fornecem conclusões substantivas.
Infelizmente, nada tão automático quanto um programa de computador está disponível
para descobrir projetos de pesquisa indeterminados na pesquisa qualitativa. No
entanto, estar ciente desse problema torna mais fácil identificar projetos de pesquisa
indeterminados e conceber soluções. Além disso, os pesquisadores qualitativos
geralmente têm uma vantagem sobre os pesquisadores quantitativos, pois geralmente
têm informações suficientes para fazer algo que torne seus projetos de pesquisa
determinantes.
Suponha que nosso propósito ao coletar informações seja examinar a validade de
uma hipótese. A pesquisa deve ser projetada de forma que tenhamos o máximo de
influência para distinguir entre as várias saídas possíveis.
1 A literatura sobre “identificação” em econometria e estatística preocupa-se em
determinar quando os projetos de pesquisa quantitativa são indeterminados e como
ajustar o modelo ou coletar diferentes tipos de dados para lidar com o problema. Ver
Hsiao (1983) e King (1989: seção 8.1).
Machine Translated by Google
Por exemplo, suponha que temos três estudos de caso, cada um dos quais
descreve os esforços conjuntos de dois países para construir um sistema de armas
de alta tecnologia. Os três estudos de caso incluem uma descrição muito
interessante dos sistemas de armas, das negociações entre os países e do produto
final. No decorrer do projeto, listamos sete motivos importantes que levam os
países a uma colaboração conjunta bem-sucedida
Machine Translated by Google
essas implicações. Nesse caso, cada estudo de caso pode ser convertido em
muitas observações, observando-se suas subpartes. Ao adicionar novas
observações de diferentes níveis de análise, podemos gerar vários testes
dessas implicações. Esse método é uma das maneiras mais úteis de
replanejar a pesquisa qualitativa e de evitar (até certo ponto) tanto a
indeterminação quanto o viés de variável omitida, que serão discutidos na
seção 5.2. De fato, expandir nossas observações por meio do planejamento
de pesquisa é o tema principal do capítulo 6 (especialmente a seção 6.3).
mas temos apenas uma única observação para fazer a estimativa (ou seja,
n = 1). Suponha ainda que, para fins de clareza, nossa observação consista
em X1 = 3, X2 = 5 e Y = 35. Finalmente, suponhamos que neste caso Y
seja igual ao seu valor esperado (o que ocorreria por acaso ou se não
houvesse variabilidade aleatória em Y). Assim, E(Y) = 35. Nunca sabemos
esta última informação na prática (devido à aleatoriedade inerente a Y),
portanto, se tivermos problemas para estimar b1 e b2 neste caso,
certamente falharemos no caso geral quando não temos essa informação
sobre o valor esperado.
35 = 3b1 + 5b2
O problema é que essa equação não tem solução única. Por exemplo, os
valores (b1 = 10, b2 = 1) satisfazem esta equação, mas também (b1 = 5,
b2 = 4) e (b1 = –10, b2 = 13). Isso é bastante preocupante, pois os
diferentes valores dos parâmetros podem indicar
Machine Translated by Google
4.1.2 Multicolinearidade
Suponha que conseguimos resolver o problema de poucas observações
focando nos efeitos de causas pré-escolhidas, em vez de nas causas dos
efeitos observados, adicionando observações em diferentes níveis de análise
ou por alguma outra mudança na projeto de pesquisa. Ainda precisaremos
nos preocupar com o outro problema que leva a projetos de pesquisa
indeterminados – a multicolinearidade. Tomamos a palavra “multicolinearidade”
da pesquisa estatística, especialmente da análise de regressão, mas
pretendemos aplicá-la de forma muito mais geral. Em particular, nosso uso
inclui qualquer situação em que podemos prever perfeitamente uma variável
explicativa de uma ou mais variáveis explicativas restantes. Não aplicamos
nenhuma suposição de linearidade, como no significado usual desta palavra
em pesquisa estatística.
Por exemplo, suponha que duas das hipóteses no estudo da colaboração
armamentista mencionadas acima sejam as seguintes: (1) a colaboração
entre países de tamanho diferente tem mais probabilidade de ser bem-
sucedida do que a colaboração entre países de tamanho semelhante; e (2)
a colaboração é mais bem-sucedida entre países não vizinhos do que entre
países vizinhos. As variáveis explicativas por trás dessas duas hipóteses se
concentram no impacto negativo da rivalidade na colaboração; ambos são
bastante razoáveis e podem até ter sido justificados por entrevistas
intensivas ou pela literatura sobre política industrial. No entanto, suponha
que conseguimos identificar apenas um pequeno conjunto de dados onde a
unidade de análise é um par de países. Suponha, além disso, que coletamos
apenas dois tipos de observações: (1) países vizinhos de tamanho diferente
e (2) países não vizinhos de tamanho semelhante. Se todas as nossas
observações (por design ou acaso) caírem nessas categorias, seria
impossível usar esses dados para encontrar qualquer evidência para apoiar
ou negar qualquer uma das hipóteses. A razão é que as duas variáveis
explicativas estão perfeitamente correlacionadas: toda observação em que
os potenciais parceiros são de tamanho semelhante diz respeito a países
vizinhos e vice-versa. Tamanho e proximidade geográfica são variáveis
conceitualmente muito diferentes, mas, pelo menos neste conjunto de dados, elas não podem ser distinguidas uma da outra.
Machine Translated by Google
= X1(b1 + b2)
Como deve ser óbvio a partir da segunda linha desta equação, independentemente
do que E(Y) e X1 são, vários valores de b1 e b2 podem satisfazê-lo. (Por exemplo,
se b1 = 5 e b2 = –20 satisfazem a equação (4.3), então b1 = –20 e b2 = 5.) Assim,
embora agora tenhamos muito mais observações do que parâmetros, a
multicolinearidade nos deixa com a mesma problema como quando tínhamos mais
parâmetros do que unidades: nenhum método de estimativa pode nos dar
estimativas únicas dos parâmetros.
3 Para alguns exemplos, ver Roth (1988), Iyengar e Kinder (1987), Fiorina e
Plott (1978), Plott e Levine (1978) e Palfrey (1991).
Machine Translated by Google
países para este trabalho. Felizmente, por motivos alheios a este projeto, a
investigadora já conhece checo e polaco, pelo que decide estudar Charter
77 na Checoslováquia e Solidariedade na Polónia. Isso é obviamente
diferente da atribuição aleatória, mas pelo menos a razão para selecionar
esses países provavelmente não está relacionada à variável dependente.
No entanto, em nosso exemplo, verifica-se que sua regra de seleção
(conhecimento linguístico) está correlacionada com sua variável dependente
e, portanto, ela encontrará viés de seleção. Nesse caso, uma seleção não
aleatória e informada poderia ter sido melhor – não fosse o requisito
linguístico.
Essa pesquisadora poderia evitar o viés de seleção esquecendo seu
conhecimento de tcheco e aprendendo húngaro. Mas esta solução
dificilmente parecerá uma opção atraente! Nesta observação, a alternativa
mais realista é que ela use sua consciência do viés de seleção para julgar a
direção do viés, pelo menos parcialmente corrigi-la e qualificar suas
conclusões apropriadamente. A princípio, ela sabe que reduziu o grau de
variância de sua variável dependente de maneira sistemática, o que deveria
levá-la a subestimar suas estimativas causais, pelo menos na média (embora
outros problemas com a mesma pesquisa possam mudar isso). ).
Além disso, ela deve pelo menos fazer pesquisa secundária suficiente
sobre a Hungria para saber, para qualquer variável explicativa plausível, se
a direção do viés de seleção será a favor ou contra sua hipótese.
Por exemplo, ela pode levantar a hipótese, com base nos casos tchecos e
poloneses, de que movimentos antigovernamentais de massa surgem sob
regimes comunistas brandos e relativamente não repressivos, mas não sob
regimes comunistas fortes e repressivos. Ela deveria saber que, embora a
Hungria tivesse o governo comunista mais brando do Leste Europeu, faltava-
lhe um movimento antigovernamental de massa. Assim, se possível, o
pesquisador deve ampliar o número de observações para evitar viés de
seleção; mas mesmo que mais observações não possam ser estudadas
minuciosamente, algum conhecimento de observações adicionais pode pelo
menos mitigar o problema. Uma estratégia muito produtiva seria
complementar esses dois estudos de caso detalhados com alguns casos
muito menos detalhados baseados em dados secundários e, talvez, uma
análise muito mais agregada (e necessariamente superficial) de um grande
número de casos. Se os estudos de caso detalhados produzirem uma
hipótese causal clara, pode ser muito mais fácil coletar informações apenas
sobre aquelas poucas variáveis identificadas como importantes para um
número muito maior de observações entre os países. (Veja a seção 4.3 para
uma discussão análoga e um tratamento mais formal.) Outra solução pode
ser reorganizar as informações massivas coletadas em cada um dos dois
estudos de caso em numerosas implicações observáveis da teoria. Por exemplo, se a teoria de que a repressão do governo
Machine Translated by Google
5 Este exemplo é uma boa ilustração do que torna a ciência distinta. Quando introduzimos esse viés
para sustentar a conclusão que queremos, não estamos nos comportando como os cientistas sociais
deveriam se comportar, mas sim como muitos de nós nos comportamos quando estamos em argumentos
políticos em que defendemos uma posição política que defendemos. estimar. Frequentemente
selecionamos exemplos que provam nosso ponto. Quando nos envolvemos em pesquisa, devemos tentar obter todos os
Machine Translated by Google
Como resultado do viés de seleção, esse aluno concluiria incorretamente que cada
curso adicional de contabilidade vale apenas cerca de US$ 5.000.
indica que tal relação existe, mas que sua magnitude é surpreendentemente
pequena. Para avaliar o grau de viés de seleção nesta pesquisa, primeiro
compilaríamos uma lista de situações de política externa em que o presidente agiu
ou fez pronunciamentos públicos, independentemente de termos informações sobre
os processos de tomada de decisão. Essa lista evitaria uma fonte de viés de
seleção que havíamos identificado: maior sigilo com relação à tomada de decisões
envolvendo ameaças de força. Nossa nova lista não seria um censo completo de
questões em que o presidente estava envolvido, pois perderia as operações
secretas e aquelas nas quais nenhuma ação foi tomada, mas seria uma lista maior
do que a original, que exigia informações sobre a decisão -fazendo.
O viés de seleção é um problema tão endêmico que pode ser útil considerar
mais alguns exemplos. Considere um trabalho recente de Michael Porter (1990).
Porter estava interessado nas fontes do que chamou de
Machine Translated by Google
coloca, há muito a ser dito para tal foco, pelo menos inicialmente: como na ênfase de
Porter no sucesso competitivo, o observador é capaz de descrever os episódios de
interesse mais significativos e pode formular hipóteses sobre as causas do observado
resultados. Mas, como base para inferência (e sem correções apropriadas), tal conjunto
de observações tendenciosas é seriamente falho porque casos em que a dissuasão
funcionou (em estágios iniciais do processo) foram sistematicamente excluídos do conjunto
de observações a serem analisadas. . “Quando os casos são mal utilizados para estimar
a taxa de sucesso da dissuasão, o projeto induz um 'viés de seleção' do tipo familiar da
pesquisa de avaliação de políticas” (Achen e Snidal 1989:162).
O processo de seleção neste exemplo é realizado como parte do processo político que
estamos estudando, mas pode ter exatamente as mesmas consequências para o nosso
estudo como se nós mesmos causássemos o problema.
Esse problema de viés quando a seleção de casos é correlacionada com a variável
dependente é uma das dificuldades mais gerais enfrentadas pelos estudiosos que usam o
registro histórico como fonte de sua evidência, e eles incluem praticamente todos nós. A
razão é que os processos de “história” selecionam diferencialmente aquilo que resta a
ser observado de acordo com um conjunto de regras que nem sempre são claras a partir
do registro. No entanto, é essencial descobrir o processo pelo qual esses dados são
produzidos. Tomemos um exemplo de outro campo: algumas culturas criaram esculturas
em pedra, outras em madeira. Com o tempo, os primeiros sobrevivem, os últimos decaem.
Esse padrão levou alguns estudiosos de arte europeus a subestimar a qualidade e a
sofisticação da arte africana primitiva, que tendia a ser feita de madeira, porque a “história”
havia eliminado seletivamente alguns exemplos de escultura enquanto mantinha outros.
O estudioso cuidadoso deve sempre avaliar os possíveis vieses de seleção nas evidências
disponíveis: que tipos de eventos são
Machine Translated by Google
palpite do verdadeiro efeito causal, com base nos estudos retrospectivos falhos,
no entanto, seria que os efeitos causais foram subestimados, pelo menos em
média - se assumirmos que as regras acima se aplicam e os critérios de seleção
foram correlacionados com a variável dependente .
É fácil ver que a seleção de uma variável explicativa não causa nenhum viés,
referindo-se novamente à figura 4.1. Se restringirmos esta figura para excluir
todas as observações para as quais a variável explicativa é igual a um, a lógica
desta figura permaneceria inalterada, e a linha correta ajustada aos pontos não
mudaria. A linha seria um pouco menos certa, já que agora temos menos
observações e menos informações para suportar o problema de inferência,
mas, em média, não haveria viés.9 Assim, pode-se evitar o viés selecionando
casos
com base na variável causal chave , mas também podemos atingir o mesmo
objetivo selecionando de acordo com as categorias de uma variável de controle
(desde que seja causalmente anterior à variável causal chave, como todas as
variáveis de controle deveriam ser). Os experimentos quase sempre selecionam
as variáveis explicativas. As unidades são criadas quando manipulamos as
variáveis explicativas (administração de um medicamento, por exemplo) e
observamos o que acontece com a variável dependente (se a saúde do
paciente melhora). Seria difícil selecionar a variável dependente neste caso, já
que seu valor não é sequer
Também podemos evitar o viés selecionando uma variável explicativa que seja
irrelevante para nosso estudo (e não tenha efeito sobre nossa variável
dependente). Por exemplo, para estudar os efeitos da discriminação nas notas,
suponha que alguém escolha todas as escolas cujos nomes começam com a
letra “A”. Isso, é claro, não é recomendado, mas não causaria nenhum viés,
desde que essa variável irrelevante não seja uma proxy para alguma outra
variável correlacionada com a variável dependente.
Uma situação em que a seleção por uma variável irrelevante pode ser muito
útil envolve a análise secundária dos dados existentes. Por exemplo, suponha
que estejamos interessados no que contribui para um golpe de Estado bem-sucedido.
Nossa hipótese-chave é que os golpes são mais bem-sucedidos quando liderados
por um líder militar do que por um civil. Suponhamos que encontremos um estudo
de tentativas de golpe que selecionou casos com base na extensão em que o
país tinha uma burocracia hierárquica antes de um golpe. Poderíamos usar esses
dados mesmo que a burocratização hierárquica seja irrelevante para nossa
pesquisa. Para garantir, porém, seria fácil incluir essa variável como um controle
em nossa análise dos efeitos de líderes militares versus líderes civis. Incluiríamos
esse controle estudando a frequência do sucesso do golpe para líderes militares
versus líderes civis em países com e sem burocratização hierárquica. A presença
desse controle nos ajudará a evitar o viés de seleção e seu efeito causal indicará
algumas informações possivelmente relevantes sobre o processo pelo qual as
observações foram realmente selecionadas.
Uma amostra dos estados indianos é útil, argumenta ele, porque são, relativamente
falando, semelhantes. Pelo menos eles “se aproximam da suposição ceteris paribus. . .
melhor do que a maioria das nações independentes” (Kohli 1987:4).
Mas quais estados escolher? Os estudos intensivos que ele queria realizar (baseados em
duas viagens de campo planejadas há muito tempo para a Índia) impediram o estudo de
todos os estados. Dadas suas restrições, três estados eram tudo o que ele podia escolher.
Ter selecionado os três estados aleatoriamente teria sido imprudente, pois a seleção
aleatória só é garantida para ajudar com um n grande. A maioria dos estados indianos tem
regimes com características que impedem o desenvolvimento de políticas de redução da
pobreza e, portanto, têm poucas dessas políticas. De fato, apenas a Bengala Ocidental tem
um regime com características que promoveriam políticas antipobreza. Como aponta Kohli,
West Bengal tinha que estar em sua amostra. Ele então acrescentou mais dois estados,
Uttar Pradesh, que tem poucos programas antipobreza e Karna Take, um estado entre
esses dois extremos. Esses estados foram selecionados inteiramente com base na variável
dependente “porque representam um contínuo de esforços governamentais máximos a
mínimos para mitigar a pobreza rural” (Kohli 1987:7).
No nível agregado da análise, entretanto, Kohli poderia ter feito mais para melhorar
suas inferências causais. Por exemplo, ele provavelmente sabia ou poderia ter determinado
os valores de suas variáveis explicativas e dependentes para praticamente todos os
estados indianos. Uma adição valiosa a seu livro teria sido um capítulo curto que
examinasse brevemente todos os estados. Isso teria fornecido uma boa noção da
veracidade geral de sua hipótese causal, além de possibilitar a seleção de seus três
estudos de caso de acordo com regras mais sistemáticas.
O exemplo anterior mostra como uma sequência de projetos de pesquisa pode superar
os problemas de inferência válida quando a pesquisa original carecia de variação na
variável explicativa. David Laitin (1986) fornece um exemplo esclarecedor de como um
único pesquisador pode, em uma sequência de estudos, superar tal problema. Em seu
estudo sobre o impacto da mudança religiosa na política entre os iorubás na Nigéria,
Laitin discute por que não foi capaz de lidar com essa questão em seu estudo anterior
sobre a Somália. Como ele aponta, a religião, sua variável explicativa, é uma constante
em toda a Somália e é, além disso, multicolinear (ver seção 4.1) com outras variáveis,
tornando assim impossível isolar seu efeito causal. “A pesquisa de campo na Somália me
levou a levantar a questão do impacto independente da mudança religiosa na política;
mas mais pesquisas de campo na Somália não teriam me permitido abordar essa questão
sistematicamente. Como medir o impacto do Islã em uma sociedade onde todos são
muçulmanos? Todos lá também falam somali. Quase todos compartilham uma herança
nômade.
Também não podemos aprender nada sobre um efeito causal de um estudo que seleciona
observações de modo que a variável dependente não varie. Mas informações suficientes
podem existir na literatura para usar com este estudo para produzir uma inferência causal
válida.
Assim, um estudo de por que um determinado resultado possível nunca ocorreu
Machine Translated by Google
CONSIDERAÇÕES FINAIS
CAPÍTULO 5
Uma vez selecionadas nossas observações, temos que medir os valores das
variáveis nas quais estamos interessados. Uma vez que toda observação e
medição nas ciências sociais é imprecisa, somos imediatamente confrontados com
questões de erro de medição.
Muitas análises na pesquisa em ciências sociais tentam estimar a quantidade
de erro e reduzi-la tanto quanto possível. A pesquisa quantitativa produz medidas
(numéricas) mais precisas, mas não necessariamente mais precisas. A
confiabilidade – diferentes medições do mesmo fenômeno produzem os mesmos
resultados – às vezes é adquirida em detrimento da validade – as medições
refletem o que o investigador está tentando medir. Pesquisadores qualitativos
tentam obter medidas precisas, mas geralmente têm um pouco menos de precisão.
Podemos, portanto, querer dar um passo adiante para gerar uma medida de
nível de intervalo com base na proporção de estados (ou a proporção de recursos,
com base no produto nacional bruto, contribuições para a organização ou
população representada por estados) necessário para passagem
Machine Translated by Google
definir variáveis com erro de medição não sistemático ou aleatório como tendo
valores às vezes muito altos e às vezes muito baixos, mas corretos na média.
Erros aleatórios obviamente criam ineficiências, mas não vieses ao fazer
inferências descritivas. Este ponto já foi discutido na seção 2.7.1. Aqui, vamos
além da consequência do erro de medição aleatório para inferência descritiva
para sua consequência para inferência causal.
VARIÁVEL DEPENDENTE
Para mostrar por que esse é o caso, usamos uma versão simplificada desse
exemplo primeiro em uma apresentação gráfica e depois oferecemos uma prova
mais formal. Na figura 5.1, o eixo horizontal representa o desemprego. Imaginamos
que as duas categorias (“4 por cento” e “7 por cento”) são perfeitamente medidas.
O eixo vertical é uma medida de crimes violentos.
Na figura 5.1, os dois círculos sólidos podem ser vistos como um exemplo de
estudo simples sem erro de medição em nenhuma das variáveis. Podemos
imaginar que temos um grande número de observações, todas caindo exatamente
nos dois pontos sólidos, de modo que conhecemos muito bem a posição de cada
ponto. Alternativamente, podemos imaginar que temos apenas duas observações,
mas elas têm muito poucos erros não sistemáticos de qualquer tipo. É claro que
nenhum desses casos provavelmente ocorrerá na realidade, mas esse modelo
destaca os problemas essenciais de erro de medição em uma variável
dependente para o caso mais geral e complicado. Observe como a linha sólida
se ajusta a esses dois pontos.
Agora imagine outro estudo em que crimes violentos foram medidos com erro
não sistemático. Para enfatizar que essas medidas estão corretas em média,
plotamos os quatro círculos abertos, cada um simetricamente acima e abaixo dos
círculos sólidos originais.3 Uma nova linha ajustada a todos os seis dados 3
Imaginamos novamente que os círculos abertos são um grande número de
observações que caiam exatamente nesses quatro pontos ou que haja pouca
variabilidade estocástica.
Machine Translated by Google
pontos é exatamente a mesma linha originalmente traçada. Observe novamente que esta
linha é desenhada minimizando os erros de previsão, os desvios verticais da linha.
No entanto, a nova linha é mais incerta em vários aspectos. Por exemplo, uma linha
com uma inclinação moderadamente mais íngreme ou mais plana se encaixaria nesses
pontos quase tão bem. Além disso, a posição vertical da linha também é mais incerta e a
própria linha fornece previsões piores de onde os pontos de dados individuais devem estar.
O resultado é que o erro de medição na variável dependente produz estimativas mais
ineficientes. Mesmo que ainda sejam imparciais - isto é, em média em vários estudos
semelhantes - eles podem estar longe em qualquer estudo.
E(Y*) = bX
V(Yi *) = s2
Y = Y* + U
n
i=1YiXi
b = _________
n
2
i=1Xi
_________ÿ
E(b) = Eÿ n
2
ÿ i=1Xi ÿÿ
n
i=1XiE(Yi)
= ___________
n
2
i=1Xi
n
i=1XiE(Yi + U)
= _______________
n
2
i=1Xi
n
i=1Xi 2b
= _________
n
2
i=1Xi
=b
ÿn
_________ÿ
i=1XiYi
V(b) = Vÿ n (5.1)
ÿ 2 ÿÿ
i=1Xi
n
1
= __________Xi 2V(Yi * + U)
2
i=1
(n i=1Xi 2)
s2 + t2
= ________
n
2
i=1Xi
VARIÁVEL EXPLICATIVA
E(Y) = bX*
onde não observamos a verdadeira variável explicativa X*, mas em vez disso
observamos X onde
X = X* + U
O que acontece quando usamos o estimador padrão para b com o X cheio de erros, em
vez do X* não observado? Essa situação corresponde à usual na pesquisa qualitativa, na
qual temos erros de medição, mas não fazemos nenhum ajuste especial para os resultados
que se seguem. Para analisar as consequências desse procedimento, avaliamos o viés,
que será a principal consequência desse tipo de problema de medição. Assim, começamos
com o estimador padrão na equação (3.7) aplicado aos X e Y observados para o modelo
acima.
n
i=1XiYi
b = _________ (5.2)
n
2
i=1Xi
n
i=1 (Xi * + Ui)Yi
= _______________
n
i=1 (Xi * + Ui)2
n
i=1Xi *Yi + (n i=1UiYi)
= ________________________________
n
2
i=1Xi*2 +n i=1Ui + (2n i=1Xi *Ui)
Deve ficar claro que b será tendencioso, E(b) ÿ b. Além disso, os dois termos entre
parênteses na última linha da equação (5.2) serão zero em média porque assumimos que
U e Y, e U e X*, não são correlacionados (ou seja, C(Ui,Yi) = E( Ui,Yi) = 0). Esta equação,
portanto, reduz-se a aproximadamente 7
n
i=1Xi *Yi
b ÿ _________________
n
2
i=1Xi*2 +n i=1Ui
Esta equação para o estimador de b no modelo acima é a mesma que a padrão, exceto
pelo termo extra no denominador, (compare a equação [3.7]). Este termo representa a
n 2
i=1Ui quantidade de erro de medição em X, a variância amostral do erro U. Na
ausência de erro de medição, este termo é zero, e a equação se reduz ao estimador
padrão na equação (3.7), pois teríamos realmente observaram os verdadeiros valores da
variável explicativa.
n
No caso geral com algum erro de medição, 2 é uma soma i=1Ui de termos
e, quadrados
portanto, será sempre positivo. Como esse termo é adicionado ao denominador, b se
aproximará de zero. Se a estimativa correta
7 Como essa equação é válida apenas em grandes amostras, estamos realmente analisando a
consistência em vez da imparcialidade (seção 2.7.1). Mais precisamente, os termos entre parênteses
na equação (5.2), quando divididos por n, desaparecem quando n se aproxima do infinito.
Machine Translated by Google
Seria direto usar essa análise formal para mostrar que o erro de medição
aleatório nas variáveis explanatórias também causa ineficiências, mas o viés
geralmente é um problema mais sério, e vamos lidar com isso primeiro.
Começamos nossa discussão dessa questão com uma análise verbal das
consequências do viés de variável omitida e seguimos com uma análise formal
desse problema. Em seguida, nos voltaremos para questões mais amplas de
projeto de pesquisa levantadas pelo viés de variável omitida.
8 Observe a diferença entre os dois casos em que a omissão de uma variável é aceitável.
No primeiro caso, em que a variável omitida não está relacionada à variável dependente,
não há viés e não perdemos o poder de prever os valores futuros da variável dependente.
No último caso, em que a variável omitida não está relacionada à variável independente,
mas relacionada à variável dependente, não temos viés em nossa estimativa do
relacionamento da variável explicativa incluída e da variável dependente, mas perdemos
alguma precisão na previsão. valores futuros da variável dependente. Assim, se a
incumbência não estivesse relacionada aos gastos de campanha, omiti-la não prejudicaria
nossa estimativa da relação entre gastos de campanha e votos. Mas se nosso objetivo
fosse a previsão, gostaríamos de mapear toda a variação sistemática na variável
dependente, e omitir a incumbência impediria isso, pois estamos deixando de fora uma
importante variável causal. No entanto, mesmo que nosso objetivo de longo prazo fosse a explicação sistemática mais completa do
Machine Translated by Google
Se esses casos especiais não valem para alguma variável omitida (ou seja,
essa variável está correlacionada com a variável explanatória incluída e tem um
efeito sobre a variável dependente), então a falha em controlá-la irá enviesar
nossa estimativa (ou percepção) do efeito da variável incluída.
No caso em questão, nossa colega estaria certa em sua crítica, pois a
incumbência está relacionada tanto à variável dependente quanto à variável
independente: os titulares obtêm mais votos e gastam mais.
Esse insight pode ser colocado em termos formais, concentrando-se na
última linha da equação (5.5) do quadro abaixo:
• A variável omitida não tem efeito causal sobre a variável dependente (ou seja,
b2 = 0, independentemente da natureza da relação entre as variáveis incluídas
e excluídas F); ou
• A variável omitida não está correlacionada com a variável incluída (ou seja, F =
0, independentemente do valor de b2.)
voto, pode ser difícil ter muita confiança em vários efeitos causais dentro da estrutura de um único
estudo. Assim, pode valer a pena focar em um efeito causal (ou apenas em alguns), qualquer que
seja nosso objetivo de longo prazo.
9 Mais precisamente, F é a estimativa do coeficiente produzida quando X1 é regredido em X2.
Machine Translated by Google
10 Vale a pena considerar exatamente o que significa examinar o efeito causal estimado
dos preços do petróleo bruto na opinião pública sobre a escassez de energia, enquanto se
controla a quantidade de cobertura televisiva sobre a escassez de energia. Considere duas
descrições, ambas importantes porque nos permitem analisar e estudar os processos causais
em maior profundidade. Primeiro, esse efeito estimado é apenas o efeito desse aspecto do óleo
Machine Translated by Google
preços que afetam diretamente a opinião pública sobre a escassez de energia, além do aspecto
do efeito causal que afeta indiretamente a opinião pública com a mudança da cobertura
televisiva. Ou seja, é o efeito direto e não indireto do petróleo na opinião. O efeito total pode ser
encontrado não controlando a extensão da cobertura televisiva da escassez de energia. Uma
descrição alternativa desse efeito é o efeito dos preços da energia na variável “opinião pública
sobre a escassez de energia, dado um grau fixo de cobertura televisiva sobre a escassez de
energia”. Como exemplo deste último, imagine o experimento em que controlamos a cobertura
da rede de televisão sobre a escassez de petróleo e a forçamos a permanecer no mesmo nível
enquanto os preços do petróleo bruto variavam naturalmente. Como a cobertura é uma constante
neste experimento, ela é controlada sem qualquer outro procedimento explícito. Mesmo que não
pudéssemos fazer um experimento, ainda poderíamos estimar esse efeito condicional dos
preços do petróleo na opinião pública sobre escassez de energia controlando a cobertura televisiva.
11 Além disso, podemos estar interessados apenas no efeito direto ou indireto de uma
variável, ou mesmo no efeito causal de alguma outra variável em uma equação. Nessa situação,
um procedimento perfeitamente razoável é executar várias análises diferentes nos mesmos
dados, desde que entendamos as diferenças de interpretação.
Machine Translated by Google
Suponha agora que chegamos a uma análise importante que relata o efeito de X1
sobre Y sem controlar X2. Em que circunstâncias teríamos fundamento para criticar
este trabalho ou justificativa para buscar recursos para refazer o estudo? Para
responder a essa questão, avaliamos formalmente o estimador com a variável de
controle omitida.
n
i=1X1iYi
b1 = _________
n
2
i=1X1i
ÿn
_________ÿ i=1X1iYi
E(b1) = Eÿ n
(5.5)
ÿ 2
ÿ i=1X1i ÿ
n
i=1X1iE(Yi)
= ____________
n
i=1X1i2
n
i=1X1i(X1ib1 + X2ib2)
= _____________________ n
i=1X1i2
n
i=1X1i2 b1 +n i=1X1iX2ib2)
= ________________________
n
i=1X1i2
= b1 + Fb2
Machine Translated by Google
Devido aos problemas potenciais com viés de variável omitida descritos na seção
5.2, podemos ingenuamente pensar que é essencial coletar e estimar
simultaneamente os efeitos causais de todas as possíveis variáveis explicativas.
De início, devemos lembrar que esta não é a implicação da seção 5.2.
Mostramos ali que omitir uma variável explicativa não correlacionada com as
variáveis explicativas incluídas não cria viés, mesmo que a variável tenha um
forte impacto causal na variável dependente, e que controlar por variáveis que
são consequências de variáveis explicativas é um erro . Portanto, nosso
argumento não deve levar os pesquisadores a coletar informações sobre todas
as influências causais possíveis ou a criticar pesquisas que falham em fazê-lo.
Endogeneidade · 185
s2
________
V(b1) = (5.8)
n
i=1X1i2
s2
V(bˆ1) = _______________ (5.9)
2
(1 ÿ r2 12)n i=1X1i
V(b1)
= ________
(1 ÿ r2 12)
A partir da última linha da equação (5.9), podemos ver a relação precisa entre as
variâncias dos dois estimadores. Se a correlação entre as duas variáveis explicativas
for zero, não faz diferença incluir ou não a variável irrelevante, pois ambos os
estimadores têm a mesma variância. No entanto, quanto mais correlacionadas duas
variáveis estiverem, maior a variância e, portanto, menor a eficiência de bˆ1.
5.4 ENDOGENEIDADE
participante. Mesmo entrevistas em profundidade podem ser uma forma de experimento se diferentes
perguntas forem feitas sistematicamente ou outras condições forem alteradas em diferentes entrevistas.
Na verdade, pode até ser um problema até mesmo para entrevistas em profundidade, já que um
pesquisador pode se sentir mais confortável aplicando “tratamentos” experimentais (fazendo certas perguntas).
Machine Translated by Google
ções) para determinados entrevistados, selecionados de forma não aleatória. Os experimentadores têm
inúmeros problemas próprios, mas a endogeneidade geralmente não é um deles.
Machine Translated by Google
Endogeneidade · 187
Cada um desses cinco procedimentos pode ser visto como um método para
evitar problemas de endogeneidade, mas também como uma forma de
esclarecer uma hipótese causal. Pois uma hipótese causal que ignora um
problema de endogeneidade é, no final das contas, um problema teórico,
exigindo reespecificação para que seja pelo menos possível que as variáveis
explicativas possam influenciar a variável dependente. Discutiremos as duas
primeiras soluções para a endogeneidade no contexto de nosso exemplo
quantitativo de serviços constituintes e as três restantes com a ajuda de
exemplos estendidos da pesquisa qualitativa.
E(b) = b + Viés
Endogeneidade · 189
Endogeneidade · 191
probabilidade de que a aparente relação causal entre a representação
proporcional e a queda da República de Weimar fosse quase inteiramente
espúria.
O tema da relação entre sistemas eleitorais e democracia ainda é altamente
contestado, embora seu estudo tenha progredido muito desde esses primeiros
estudos. Os estudiosos expandiram o estudo de estudos de caso concentrados
sem muita preocupação com a lógica da explicação para estudos baseados
em muitas observações de dadas implicações e gradualmente resolveram
alguns aspectos de medição e, finalmente, de inferência. Ao fazê-lo, eles
conseguiram separar os efeitos exógenos dos endógenos de forma mais
sistemática.
Endogeneidade · 193
Endogeneidade · 195
E(Y) = Xb (5.10)
E(X) = Yg (5.11)
ÿ_________ÿ
n
i=1XiYi
E(b) = Eÿ n
(5.13)
ÿ 2 ÿÿ
i=1Xi
ÿ n
i=1Xi(Xib + ei)
_______________ÿ
=
n
Eÿÿ 2 ÿÿ
i=1Xi
n
i=1C(Xi,ei)
= b + ____________
n
i=1V(Xi)
= b + Viés
guerra.
Essas qualificações não devem nos levar a evitar projetos de pesquisa que usam
correspondência. Na verdade, a correspondência é uma das estratégias de small n
mais valiosas . Precisamos apenas estar cientes de que o emparelhamento, como
todas as estratégias de n pequeno , está sujeito a perigos que a aleatoriedade e um
n grande teriam eliminado. Uma estratégia muito produtiva é escolher estudos de
caso por meio de correspondência, mas observações dentro de casos de acordo
com outros critérios.
A correspondência, com o objetivo de evitar viés de variável omitida, está
relacionada à discussão na literatura de política comparada sobre se os pesquisadores
devem selecionar observações que sejam tão semelhantes quanto possível (Lijphart
1971) ou tão diferentes quanto possível (Przeworski e Teune 1970). Recomendamos
uma abordagem diferente. O debate do projeto de pesquisa “mais semelhante”
versus “mais diferente” presta pouca ou nenhuma atenção à questão do “semelhante
em relação a quê”. Os rótulos costumam ser confusos e o debate é inconclusivo
nesses termos: nenhuma dessas abordagens deve ser sempre preferida. Para nós,
a máxima chave para
Machine Translated by Google
O estudo de David Laitin (1986) sobre os efeitos das crenças religiosas na política
usa uma técnica de correspondência particularmente cuidadosa. Ele escolheu uma
nação, a Nigéria, com fortes tradições muçulmanas e cristãs, pois desejava comparar
os efeitos das duas tradições na política. Mas as áreas muçulmana e cristã da Nigéria
diferem em muitos aspectos além de seus compromissos religiosos, aspectos que, se
ignorados, correriam o risco de omitir viés variável. “Na Nigéria, os centros dominantes
do Islã estão nos estados do norte, que tiveram séculos de contato direto com o
mundo islâmico, uma história de estruturas de estado islâmico anteriores ao domínio
britânico e uma memória de uma jihad revivalista no início do século XIX. que unificou
uma grande área sob a doutrina islâmica ortodoxa. [Em contraste,] não foi até o final
do século XIX que as comunidades cristãs criaram raízes. . . . As escolas missionárias
trouxeram educação ocidental, e os empresários capitalistas encorajaram as pessoas
a plantar colheitas comerciais e a se associarem cada vez mais com a economia
capitalista mundial.
(Laitin 1986:187).
Como, perguntou Laitin, “alguém poderia controlar as diferenças de nacionalidade,
ou economia, ou o número de gerações expostas a uma cultura mundial, ou as
motivações para a conversão, ou na ecologia – todas as quais são diferentes na
cultura cristã? e fortalezas muçulmanas?” (1986: 192–93). Sua abordagem foi escolher
um local específico na área Yoruba da Nigéria, onde as duas religiões foram
introduzidas no mesmo grupo de nacionalidade mais ou menos na mesma época, e
onde as duas religiões apelaram para potenciais convertidos por razões semelhantes.
Nem no estudo de Kohli sobre três estados indianos nem na análise de Lipset sobre
Machine Translated by Google
CAPÍTULO 6
O problema mais difícil em qualquer pesquisa ocorre quando o analista tem apenas
uma única unidade com a qual avaliar uma teoria causal, ou seja, onde n = 1.
Começaremos uma discussão desse problema nesta seção e argumentaremos que
lidar com ele com sucesso é extremamente improvável. Fazemos isso primeiro
analisando o argumento do artigo clássico de Harry Eckstein sobre estudos de caso
cruciais (seção 6.1.1). Passaremos então a um caso especial disso, raciocinando
por analogia, na seção 6.1.2.
seu argumento, o que o leva a realmente pedir não a refutação de observação única, mas
observações múltiplas.
Machine Translated by Google
tic e a observação produziu uma medida inconsistente com a teoria, então poderíamos
dizer com certeza que a teoria era falsa. Mas para qualquer teoria social interessante,
sempre existe a possibilidade de algumas variáveis desconhecidas omitidas, o que
pode levar a um resultado imprevisível, mesmo que o modelo básico da teoria esteja
correto. Com apenas uma implicação da teoria causal observada, não temos base
para decidir se a observação confirma ou refuta uma teoria ou é o resultado de algum
fator desconhecido. Mesmo tendo duas observações e um experimento perfeito,
variando apenas um fator explicativo e gerando apenas uma observação de diferença
entre duas observações idênticas sobre a variável dependente, teríamos que
considerar a possibilidade de que, em nosso mundo probabilístico, algumas
observações não sistemáticas, fator acaso levou à diferença no efeito causal que é
observado. Não importa se o mundo é inerentemente probabilístico (no sentido da
seção 2.6) ou simplesmente se não podemos controlar todas as possíveis variáveis
omitidas. Em ambos os casos, nossas previsões sobre relacionamentos sociais
podem ser apenas probabilisticamente precisas. Eckstein, de fato, concorda que
fatores aleatórios afetam qualquer estudo:
Eckstein certamente está certo ao dizer que é uma prática comum relatar a
probabilidade específica de um achado casual apenas para estudos de n grandes.
No entanto, é essencial considerar as chances de ocorrências aleatórias em todos os
estudos com grande ou pequeno número de observações.2
s2
n = ______________ (6.1)
(1 ÿ R2 1)S2 x1V(b1)
3 Kahneman, Slovic e Tversky (1982) descrevem uma falácia psicológica de raciocínio que ocorre
quando os tomadores de decisão, sob incerteza, escolhem analogias com base na atualidade ou na
disponibilidade, portanto julgamentos sistematicamente enviesados. Eles chamam isso de “heurística de
disponibilidade”. Ver também Keane (1988).
4 As suposições são de que E(Y) = X1b1 + Xb, V(Y) = s2, não há multicolinearidade,
e todas as expectativas são implicitamente condicionadas a X.
Machine Translated by Google
5
Tecnicamente, s2 é a variância da variável dependente, condicionada a todas as
variáveis explicativas V(YX); V(b1) é o quadrado do erro padrão da estimativa de 2 é o
todo o efeito causal de R2 calculado a partir de uma regressão auxiliar de X1 sobre
X1; R1 as variáveis de controle; e S2
x1 é a variância amostral de X1.
Machine Translated by Google
O modelo formal aqui assume que o efeito que estamos estudando é linear. Ou
seja, quanto maiores os valores das variáveis explicativas, maior (ou menor) é o
valor esperado da variável dependente. Se a relação não for linear, mas ainda
aproximadamente monotônica (ou seja, não decrescente), os mesmos resultados
se aplicam. Se, em vez disso, o efeito for distintamente não linear, pode ser que os
níveis intermediários da variável explicativa tenham um resultado totalmente diferente.
Por exemplo, suponha que o estudo baseado apenas em valores extremos da
variável explicativa não encontre efeito: o nível educacional de uma comunidade não
tem efeito sobre o crime. Mas, de fato, pode ser que apenas níveis médios de
educação reduzam os níveis de criminalidade em uma comunidade. Para a maioria
dos problemas, essa qualificação não se aplica, mas devemos ter o cuidado de
especificar exatamente as suposições que estamos afirmando ao planejar a pesquisa.
Essas abordagens são úteis quando nos deparamos com o que parece ser um
pequeno número de observações e não temos tempo ou recursos para continuar
coletando observações adicionais. Especificamos várias maneiras pelas quais
podemos aumentar o número de observações relevantes para nossa teoria,
redefinindo sua natureza. Essas estratégias de pesquisa aumentam o n
enquanto ainda mantêm o foco diretamente nas evidências a favor ou contra a
teoria. Como enfatizamos, muitas vezes eles são úteis mesmo depois de
terminarmos a coleta de dados.
Conforme discutimos na seção 2.4, Harry Eckstein (1975) define um caso
como “um fenômeno para o qual relatamos e interpretamos apenas uma única
medida em qualquer variável pertinente”. Como a palavra “caso” tem sido usada
de tantas maneiras diferentes nas ciências sociais, preferimos nos concentrar
nas observações. Definimos uma observação como uma medida de uma
variável dependente em uma unidade (e para quantas medidas de variáveis
explicativas estiverem disponíveis nessa mesma unidade). As observações são
os componentes fundamentais da pesquisa empírica em ciências sociais: nós
as agregamos para fornecer as evidências nas quais confiamos para avaliar
nossas teorias. Como indicamos no capítulo 2, em qualquer projeto de pesquisa
não estudamos de fato fenômenos completos como a França, a Rev.
A abordagem usual para obter mais observações “através do espaço” é procurar outras
unidades semelhantes: adicionar Paquistão, Bangladesh e Sri Lanka à base de dados junto
com a Índia. Com tempo, dinheiro e habilidades suficientes, esse curso faz sentido. O
trabalho de Kohli sobre a Índia (discutido na seção 5.6) fornece um exemplo. Também
ilustra uma maneira pela qual ele supera o problema associado ao uso de três estados
indianos selecionados com base em valores conhecidos das variáveis independentes e
dependentes. Ele olha para duas outras unidades nacionais. Um deles é o Chile de Allende,
onde os programas de ajuda aos pobres falharam. Kohli argumenta que a ausência de uma
das três características que, segundo sua teoria, levam a programas de combate à pobreza
bem-sucedidos (no caso chileno, a ausência de um partido de reforma política bem
organizado) contribuiu para esse fracasso.10 A outra nação é o Zimbábue sob Robert
Mugabe, que, na época em que Kohli estava escrevendo seu livro, havia chegado ao poder
com um regime cujas características lembravam a orientação de redução da pobreza em
Bengala Ocidental. Os resultados, embora provisórios, pareciam consistentes com a teoria
de Kohli. Seu tratamento desses dois casos é superficial, mas eles são usados de maneira
apropriada como implicações observáveis adicionais de sua teoria.
Não é necessário, entretanto, que saiamos dos limites da unidade que estamos
estudando. Uma teoria cujo foco original fosse o estado-nação pode ser testada em
subunidades geográficas dessa nação: em estados, condados, cidades, regiões etc.
variável. Suponha que queremos testar uma teoria de agitação social que relaciona
pesquisa e não envolvem novas observações. Essencialmente, eles duplicam - ou tentam duplicar
- a pesquisa de outros para ver se os resultados podem ser reproduzidos. Pesquisadores
quantitativos tentarão reproduzir a análise de dados em um estudo anterior usando os mesmos
dados. Um historiador pode verificar as fontes usadas por outro historiador. Um etnógrafo pode
ouvir entrevistas gravadas em fita e verificar se as conclusões originais eram sólidas. Essa
atividade é muito útil, pois as evidências científicas devem ser reprodutíveis, mas não se enquadra
no que estamos sugerindo nestas seções, pois não implica novas observações.
10 Forças externas também levaram ao fracasso de Allende, mas Kohli atribui um papel
importante às internas.
Machine Translated by Google
Para outro exemplo, considere a relação entre mudanças nos preços agrícolas
e agitação social. Podemos testar essa relação em vários estados indianos. Em
cada um medimos os preços agrícolas, bem como a agitação social. Mas os
estados não são unidades experimentais isoladas. Os valores da variável
dependente podem ser afetados, não apenas pelos valores das variáveis
explicativas que medimos dentro de cada unidade, mas também pelos valores
das variáveis omitidas fora da unidade. A agitação social em um estado pode
ser desencadeada pelos preços agrícolas (como previsto por nossa teoria), mas
essa agitação social pode influenciar diretamente a agitação social em um
estado vizinho (tornando-se apenas um teste parcialmente independente de
nossa teoria). Esta situação pode ser tratada controlando adequadamente esta
propagação. Um problema semelhante pode existir para a influência de um
período de tempo anterior em um período de tempo posterior. Poderíamos
replicar nossa análise na Índia uma década depois, mas o
Machine Translated by Google
Esses exemplos ilustram que a replicação de uma análise em novas unidades nem
sempre implica um novo estudo importante. Se existirem observações adicionais dentro do
estudo atual que sejam da mesma forma que as observações já usadas para testar a
hipótese, elas podem ser usadas. Dessa forma, o pesquisador com um “estudo de caso”
pode descobrir que há muito mais observações do que ele pensou.11
Instâncias adicionais para o teste de uma teoria ou hipótese podem ser geradas mantendo
a mesma unidade de observação, mas alterando a variável dependente. Essa abordagem
envolve procurar muitos efeitos da mesma causa – uma técnica poderosa para testar uma
hipótese. Mais uma vez, começamos com uma teoria ou hipótese e perguntamos: supondo
que nossa teoria ou hipótese esteja correta, o que mais esperaríamos que nossas variáveis
explanatórias influenciassem além da variável dependente atual? Tal exercício pode sugerir
indicadores alternativos da variável dependente.
No capítulo 1, apontamos que uma determinada teoria da extinção dos dinossauros tem
implicações para a composição química das rochas. Portanto, mesmo uma teoria causal de
um único evento pré-histórico tinha múltiplas implicações observáveis que poderiam ser
avaliadas.
No exemplo que estamos usando de flutuação de preços agrícolas e agitação social,
podemos ter medido a agitação social pelo número de distúrbios públicos. Além da agitação
social, podemos perguntar o que mais se pode esperar se a teoria estiver correta. Talvez
existam outras medidas válidas de inquietação social — comportamento desviante de um
tipo ou de outro. Esta indagação poderá levar à hipótese de que outras variáveis seriam
afetadas, como o comportamento eleitoral, o investimento empresarial ou a emigração. O
mesmo processo que leva a flutuação de preços a gerar inquietação pode vincular a
flutuação de preços a esses outros resultados.
O trabalho de Robert Putnam (1993) sobre o impacto dos recursos sociais no desempenho
dos governos regionais na Itália adota uma abordagem semelhante. O desempenho
regional não é uma medida única. Em vez disso, Putnam usa uma ampla gama de variáveis
dependentes em sua tentativa de explicar as fontes de desempenho democrático efetivo
nas regiões italianas. Ele possui doze indicadores de desempenho institucional que buscam
medir
estatísticas poderosas para analisar dados que exibem o que é chamado de propriedades de
séries temporais ou autocorrelação espacial . Eles não apenas são capazes de corrigir esses
problemas, mas também encontraram maneiras de extrair informações exclusivas desses
dados. Ver Granger e Newbold (1977), Anselin (1988), Beck (1991) e King (1989; 1991c).
Machine Translated by Google
É improvável que tal análise produza fortes inferências causais porque mais
de um mecanismo pode ser ativado e, dentro de cada mecanismo, a força
relativa das variáveis explicativas pode não ser clara. Mas fornece algum teste
de hipóteses, uma vez que uma hipótese que explica os resultados provavelmente
também terá implicações para o processo pelo qual esses resultados ocorrem.
A busca por mecanismos causais, portanto, fornece observações que podem
refutar a hipótese. Essa abordagem também pode permitir que o pesquisador
desenvolva algumas generalizações descritivas sobre a frequência com que
cada mecanismo causal potencial é ativado; e essas generalizações descritivas
podem fornecer a base para análise posterior dos mecanismos causais
vinculados e das condições sob as quais cada um provavelmente será ativado.
Referências
232 · Referências
DAHL, Robert. 1961. Quem Governa? Democracia e poder em uma cidade americana.
New Haven: Yale University Press.
Desler, David. 1991. "Beyond Correlations: Toward a Causal Theory of War."
Estudos Internacionais Quarterly 3, no. 35 (setembro): 337–55.
Dewald, William G., Jerry G. Thursby e Richard G. Anderson. 1986. “The Journal of Money,
Credit and Banking Project.” American Economic Review 76, no. 4 (setembro): 587–603.
Ferguson, Yale H. e Richard W. Mansbach. 1988. The Elusive Quest: Teoria e Política
Internacional. Columbia: Universidade da Carolina do Sul.
Feynman, Richard P. 1965. O caráter da lei física. Cambridge, Massachusetts:
Imprensa MIT.
Fiorina, Morris e Charles R. Plott. 1978. “Committee Decisions under Majority Rule.”
American Political Science Review 72, no. 2 (junho): 575–98.
Fisher, Ronald A. 1935. O Projeto de Experimentos. Nova York: Hafner Pub
lising.
FOGEL, Robert William. 1989. Sem consentimento ou contrato: a ascensão e queda de
Escravidão Americana. Nova York: WW Norton.
Friedrich, Carl J. 1958. “Political Philosophy and the Science of Politics.” Em Roland Young,
ed. Abordagens ao Estudo da Política. Chicago: University of Chicago Press.
Fudenberg, Drew e Jean Tirole. 1989. "Teoria dos jogos não cooperativos para organização
industrial: uma introdução e visão geral." Em Richard Schma lensee e Robert D. Willig,
eds. Manual de Organização Industrial, vol. 1 Amsterdã: Holanda do Norte.
Referências · 233
______. 1993. “Por que as pesquisas eleitorais presidenciais dos EUA são tão variáveis
quando a votação é tão previsível.” British Journal of Political Science (no prelo).
George, Alexander L. 1982. “Estudos de caso e desenvolvimento de teoria”. Documento
apresentado no Segundo Simpósio Anual sobre Processamento de Informações em
Organizações, Carnegie-Mellon University, 15–16 de outubro.
George, Alexander L. e Timothy J. McKeown. 1985. “Estudos de Caso e As Teorias da
Tomada de Decisão Organizacional. Avanços no processamento de informações em
organizações 2: 21–58.
George, Alexander L. e Richard Smoke. 1974. Dissuasão no Exterior Americano
Política. Nova York: Columbia University Press.
Gigerenzer, Gerd, Zeno Swijtink, Theodore Porter, Lorraine Daston, John Beatty e
Lorenz Kruger. 1989. The Empire of Chance: How Probability Changed Science and
Everyday Life. Nova York: Cambridge University Press.
Gilpin, Roberto. 1981. Guerra e Mudança na Política Mundial. Nova York: Cambridge
University Press.
Goldberger, Artur. 1991. Um Curso de Econometria. Cambridge, Massachusetts: Harvard
University Press.
Goldstein, Judith e Robert O. Keohane, eds. 1993. Ideias e Política Externa: Crenças,
Instituições e Mudança Política. Ithaca: Cornell University Press.
Gould, Stephen J. 1989a. Wonderful Life: The Burgess Shale and the Nature of His
tory. Nova York: Norton.
______. 1989b. “O Chifre de Tritão.” História Natural (dezembro): 18–27.
Granger, GWJ e P. Newbold. 1977. Previsão de Séries Temporais Econômicas. Nova
York: Academic Press.
Gulick, Edward V. 1967. O Equilíbrio de Poder Clássico da Europa. Nova York: Norton.
Salão, Peter A., ed. 1989. O Poder Político das Idéias Econômicas: Keynesianismo
Através das Nações. Princeton: Princeton University Press.
Halpern, Nina, 1993. “Stalinist Political Economy,” em Judith Goldstein e Robert O.
Keohane, eds. 1993. Ideias e Política Externa: Crenças, Instituições e Mudança
Política. Ithaca: Cornell University Press.
Hermens, FA 1941. Democracy or Anarchy: A Study of Proporcional Representation.
South Bend, Indiana: University of Notre Dame Press.
Hirschman, Albert O. 1970. “The Search for Paradigms as a Hindrance to Un
entendendo.” Política Mundial 22, n. 3 (abril): 329–43.
Hoffmann, Stanley. 1960. Teoria Contemporânea em Relações Internacionais. Engle
Wood Cliffs, NJ: Prentice-Hall.
Holanda, Paulo. 1986. "Estatísticas e Inferência Causal." Jornal da Associação Estatística
Americana 81: 945–60.
HOROWITZ, Donald. 1993. “Comparando Sistemas Democráticos.” Em Larry Diamond
e Marc F. Plattner, eds. O Ressurgimento Global da Democracia. Balti mais: Johns
Hopkins University Press.
Machine Translated by Google
234 · Referências
Hum, Paulo. 1988. “Extended Deterrence and the Outbreak of War.” americano
Revisão de Ciência Política 82: não. 2 (junho): 423–43.
Huth, Paul e Bruce Russet. 1990. “Testando a Teoria da Dissuasão: O Rigor Faz
uma diferença." Política Mundial 42, n. 4 (julho): 466–501.
Hsiao, C. 1983. “Identificação”. Em Zvi Griliches e Michael Intriligator, eds.
vol. 1, Manual de Econometria. Amsterdam: North-Holland.
Inkeles, Alex e Peter Rossi. 1956. “National Comparisons of Occupational Prestige.” American
Journal of Sociology 61: 329-39.
Iyengar, Satis e Joel B. Greenhouse. 1988. “Modelos de Seleção e o Problema da Gaveta de
Arquivos”. Ciência Estatística 3, no. 1 (fevereiro): 109–35.
Iyengar, Shanto e Donald Kinder. 1987. Notícias que importam. Chicago: University of Chicago
Press.
Jeffreys, Harold. 1961. Teoria da Probabilidade. Oxford: Clarendon Press.
Jervis, Robert. 1976. Percepção e Equívoco na Política Internacional. Princeton: Princeton
University Press.
Jervis, Robert, Richard Ned Lebow e Janice Gross Stein. 1985. Psicologia
e Dissuasão. Baltimore: Johns Hopkins University Press.
Jones, EL 1981. O Milagre Europeu: Ambientes, Economias e Geopolítica na História da Europa
e da Ásia. Cambridge: Cambridge University Press.
Johnston, J. 1984. Métodos econométricos. edição 3d. Nova York: McGraw Hill.
Kahneman, Daniel, Paul Slovik e Amos Tversky, eds. 1982. Julgamento sob Incerteza:
Heurísticas e Vieses. Nova York: Cambridge University Press.
Katzenstein, Peter J. 1985. Small States in World Markets: Industrial Policy in Europe. Ithaca:
Cornell University Press.
Keane, Mark T. 1988. Resolução Analógica de Problemas. Chichester, West Sussex: Ellis
Horwood.
Kennedy, Paulo. 1987. A ascensão e queda das grandes potências. Nova York: aleatório
Casa.
Keohane, Robert O. 1980. “The Theory of Hegemonic Stability and Changes in International
Economic Regimes, 1967–1977.” Em Ole R. Holsti, Randolph M.
Siverson, Alexander L. George, editores. Mudança no Sistema Internacional. Boulevard:
Westview Press.
______. 1984. Depois da Hegemonia: Cooperação e Discórdia na Economia Política Mundial
o meu. Princeton: Princeton University Press.
______. 1988. “Instituições Internacionais: Duas Abordagens”. Estudo Internacional
32º trimestre : 379.
______. 1989. Instituições Internacionais e Poder do Estado: Ensaios na Teoria das Relações
Internacionais. Pedregulho: Westview.
Keohane, Robert O. e Joseph S. Nye, Jr. 1977. Poder e Interdependência: Política Mundial em
Transição. Boston: Pequeno, Brown.
Khong, Yuen Foong. 1992. Analogy at War: Korea, Munich, Dien Bien Phu, and the Vietnam
Decisions of 1965. Princeton: Princeton University Press.
Rei, Gary. 1989. Metodologia Política Unificadora: A Teoria da Verossimilhança das Estatísticas
inferência cal. Nova York: Cambridge University Press.
______. 1993. “The Methodology of Presidency Research,” em George Edwards III, John H.
Kessel e Bert A. Rockman, eds. Pesquisando a Presi-
Machine Translated by Google
Referências · 235
Linz, Juan J. 1993. “The Perils of Presidentialism.” Em Diamond, Larry e Marc F. Plattner,
eds. O Ressurgimento Global da Democracia. Baltimore: Johns Hopkins University
Press. 108–26.
Lipset, Seymour Martin. 1963. The First New Nation: The United States in Com parative
and Historical Perspective. Nova York: Basic Books.
Pequeno, Daniel. 1991. Variedades de Explicação Social: Uma Introdução ao Philoso
phy de Ciências Sociais. Boulder Colo.: Westview.
Machine Translated by Google
236 · Referências
Merck & Co., Inc., 1989. Relatório Anual. Rayway, Nova Jersey: Merck & Co., Inc.,
1989.
Merton, Robert K. [1949] 1968. Teoria Social e Estrutura Social. Reimprimir. Nova York: Free
Press.
Mill, John Stuart. 1843. Um Sistema de Lógica. Editor desconhecido.
Miller, David. 1988. "Conjectural Knowledge: Popper's Solution of the Problem of Induction."
Em Paul Levinson, ed. Em Busca da Verdade. Atlantic Highlands, NJ: Humanities Press.
Moon, Donald J. 1975. “The Logic of Political Inquiry: A Synthesis of Opposed Perspectives.”
Em Fred I. Greenstein e Nelson W. Polsby, eds. Manual de Ciência Política, vol. 1, Ciência
Política: Escopo e Teoria. Reading, Mass.: Ad Dison-Wesley.
Neustadt, Richard E. e Earnest R. May. 1986. Pensando no Tempo: Os Usos da História para
Tomadores de Decisão. Nova York: Free Press.
Nye, Joseph S. 1971. Peace in Parts. Boston: Pequeno, Brown.
O'Hear, Anthony. 1989. Introdução à Filosofia da Ciência. Oxford: Claren
não pressione.
Ordeshook, Peter C. 1986. Teoria dos Jogos e Teoria Política: Uma Introdução.
Nova York: Cambridge University Press.
Palfrey, Thomas R., ed. 1991. Laboratório de Pesquisa em Economia Política. Ann Arbor:
Imprensa da Universidade de Michigan.
Pearson, Karl. 1892. A gramática da ciência. Londres: JM Dent & Sons,
Ltda.
Plott, Charles R. e Michael E. Levine. 1978. “Um Modelo de Influência da Agenda nas Decisões
do Comitê”. American Economic Review 68, no. 1 (março): 146-60.
Referências · 237
Ragin, Charles C. 1987. O Método Comparativo: Indo além das Estratégias Qualitativas e
Quantitativas. Berkeley: University of California Press.
Rivers, Douglas e Morris P. Fiorina. 1989. “Constituency Service, Reputation, and the
Incumbency Advantage”, em Morris P. Fiorina e David Rohde, eds. Home Style e
Washington Work. Ann Arbor: Imprensa da Universidade de Michigan.
238 · Referências
logia”. Em Theda Skocpol, ed. Visão e Método na Sociologia Histórica. Nova York:
Cambridge University Press.
Snyder, Glenn H. e Paul Diesing. 1977. Conflito entre Nações: Negociação, Tomada de
Decisão e Estrutura do Sistema em Crises Internacionais. Princeton: Princeton University
Press.
Snyder, Jack. 1991. Mitos do Império: Política Doméstica e Ambição Internacional.
Ithaca: Cornell University Press.
Sóbrio, Elliot. 1988. Reconstruindo o Passado: Parcimônia, Evolução e Inferência.
Cambridge: MIT Press.
Suppes, Patrick C. 1970. Uma teoria probabilística da causalidade. Amsterdã: Norte
Holanda.
Tawney, RH 1935. Religião e a Ascensão do Capitalismo. Nova York: Harcourt,
Brace & Co.
Tilly, Charles, ed. 1975. A Formação dos Estados Nacionais na Europa Ocidental.
Princeton: Princeton University Press.
Verba, Sidney. 1967. “Alguns dilemas da pesquisa política”. Política Mundial 20 (outubro):
111–28.
Verba, Sidney, Kay L. Schlozman, Henry Brady e Norman Nie. 1993. “Raça, etnia e
recursos políticos: participação nos Estados Unidos.” British Journal of Political Science
23: 453-97.
Waltz, Kenneth N. 1979. Teoria da Política Internacional. Leitura, Missa: Ad
dison-Wesley.
Webb, Eugene J., DT Campbell, RD Schwartz e L. Sechrest. 1966. Unob
Medidas invasivas. Chicago: Rand McNally.
Webb, Eugene J. e Karl E. Weick. 1983. “Unobtrusive Measures in Organizational Theory:
A Reminder.” Em John Van Maanen, ed. Metodologia Qualitativa. Sábio: Beverly Hills.
Weber, Max. [1905] 1949. “Estudos Críticos na Lógica das Ciências Culturais.” Em Max
Weber, ed. A Metodologia das Ciências Sociais. Traduzido e editado por Edward A. Shils
e Henry A. Fluch. Nova York: Free Press.
Weiner, Myron. 1991. A Criança e o Estado na Índia. Princeton: Universidade de Princeton
Verity Press.
Wendt, Alexandre. 1992. “Anarquia é o que os Estados fazem dela: a construção social da
política de poder.” Organização Internacional 64, no. 2 (Primavera): 391–426.
Wolfinger, Raymond e Steven Rosenstone. 1980. Quem vota. New Haven: Yale University
Press.
Woods, John e Douglas Walton. 1982. Argumento: A Lógica das Falácias.
Nova York: McGraw-Hill Ryerson Ltd.
Zelditch, Morris Jr. 1971. “Intelligible Comparisons.” Em Ivan Vallier, ed. Métodos
Comparativos em Sociologia. Berkeley e Los Angeles: University of Cali fornia Press.
Índice
240 · Índice
Índice · 241
242 · Índice
método histórico, 36–41, 43. Ver também e detalhes factuais, 36–41, 53–55 com
mecanismos causais; inferência descritiva; erro de medição, 165–66 em pesquisa
pesquisa qualitativa registro científica, 7–8 de relações
histórico, 135 Hoffman, sistemáticas, 34, 79–82, 84, 84n imparcialidade
Stanley, 233 Holland, Paul, como
76n, 79n, 82, 92, 233 homocedasticidade, critério de, 27–28, 63– 65, 97–99, 150–51
162n Hoover, Dwight, 231
Horowitz, Donald, 83, 233 incerteza de, 8–9, 76, 82, 95, 152, 158 uso de
Hsiao, C., 118, 234 Huth, Paul , regras, 6–7, 9, 76
24, 234 hipóteses, 19 Veja também inferência causal; borrões de
aplicando-se à coleta e tinta de
análise de dados, inferência descritiva, 21
13, 19–20, 28–29, 45, 46–49, 174, 227–28 Inkeles, Alex, 146–47, 234
alterando a restrição de, 21–22, instituições, efeito de, 16
consistência interna, 100, 105
cooperação internacional, 5
228 organizações internacionais, 51–52 campo
e endogeneidade, 187 de relações internacionais, necessidade de descrição
falsificabilidade de, 19 em, 44–45 sanções
uso de modelos formais para avaliar, 105–6 internacionais, 5 interpretação,
36–41, 43 medidas de intervalo,
e observações crescentes, 218, 221 alavancagem 151, 153–54 codificação de entrevistas,
de, 29–30, 104 parcimônia 26 entrevistas, 112n, 185n
como meta de, 20 projetos-piloto variáveis irrelevantes, 182–85
ao testar, 22–23 função de, 10 regras para modelo formal para, 184–85
construção,
99–114 Política italiana, 5, 223–24
especificidade como objetivo de, 20 Itália, 5, 223–24
testes com dados, 13, 20–23, 28–31, 46– Iyengar, Satis, 105, 125, 234
49, 101–5
Carne vermelha japonesa, 32–
ideias como uma variável explicativa, 191–92 33 Jeffreys, Harold, 20, 234
identificação, 118n Postulado de simplicidade de Jeffreys-Wrinch, 20
incluem tudo abordagem, 183 incluindo Jervis, Robert, 234
variáveis irrelevantes, 182–85 modelo formal de, Johnston, J., 234
184–85 efeito de renda, 173 Jones, EL, 43, 234
observações crescentes,
217–30 vantagem de incumbência, 77– Kahneman, Daniel, 213, 234
82 variáveis independentes, 77, 123 Katzenstein, Peter, 201, 234 Keane,
com erro de medição, 158, 163–68 Mark, 213, 234 Kennedy,
análise, 193–95 seleção em, 137–38, 140–49 Paul, 234 Keohane,
projeto de pesquisa Robert O., 36, 191, 233, 234 variável causal
indeterminado, 118–24, chave, 77 seleção, 146
Khong, Yuen Foong,
145 212, 234 Kinder, Donald, 125, 234
Índia, 144–46, 205–6, 219, 226 King, Gary, 32, 50, 59, 77, 102,
educação em, 64 e 118, 130, 189, 223, 233, 234, 235 Kohli, Atul, 144–
papel na política de pobreza, 144–46 46, 205– 6, 219, 220,
inferência, 46–49, 229
correção tendenciosa, 187–88 235
eficiência como critério de, 28, 66–74 , 97–99, Kreps, David, 235
150–51 Kruger, Lorenz, 233
Machine Translated by Google
Índice · 243
244 · Índice
Índice · 245
246 · Índice
Índice · 247