Escolar Documentos
Profissional Documentos
Cultura Documentos
Uma vez determinada a unidade de anlise para uma determinada computao, voc pode
faz-la facilmente usando o arquivo de dados correspondente.
Desenhos Bsicos de Surveys
Aps especificar os objetivos e as unidades de anlise do seu survey, voc pode
escolher entre diversos desenhos diferentes. Nesta seo, discutiremos SURVEYS INTERSECCIONAIS [cross-sectional] e SURVEYS LONGITUDINAIS, e o uso de surveys interseccionais como aproximao de surveys longitudinais. Na seo seguinte, discutiremos
variaes destes desenhos bsicos.
Surveys Inter-seccionais
Num survey inter-seccional, dados so colhidos, num certo momento, de uma
amostra selecionada para descrever alguma populao maior na mesma ocasio. Tal survey
pode ser usado no s para descrever, mas tambm para determinar relaes entre variveis
na poca do estudo.
Uma pesquisa para determinar intenes de votos um exemplo de pesquisa interseccional. Vale a pena notar que, tipicamente, se indaga aos entrevistados: Se a eleio
fosse hoje, em quem voc votaria? Os resultados so apropriadamente relatados assim:
Se a eleio fosse hoje, o candidato X venceria disparado. Um survey para determinar
taxa de desemprego descreveria o desemprego da populao na poca do estudo.
Do mesmo modo, um survey inter-seccional da relao entre religiosidade e
preconceito relataria esta relao na poca do estudo. Voc pode relatar que pessoas
religiosas so mais preconceituosas do que pessoas irreligiosas, mas reconhecendo que esta
relao pode mudar posteriormente. Um survey subsequente poderia encontrar uma relao
bem diferente. (Em geral, porm, tais relaes tendem a persistir mais tempo do que as
descries.)
Surveys Longitudinais
Alguns desenhos de survey - descritivos ou explicativos - permitem anlise de dados
ao longo do tempo. Dados so coletados em tempos diferentes e se relatam mudanas de
descries e de explicaes. Os principais desenhos longitudinais so ESTUDOS DE
TENDNCIAS, ESTUDOS DE COORTES e ESTUDOS DE PAINEL.
ESTUDOS DE TENDNCIAS. Uma populao pode ser amostrada e estudada em
ocasies diferentes. Ainda que pessoas diferentes sejam estudadas em cada survey, cada
amostra representa a mesma populao. As pesquisas eleitorais no decorrer de uma
campanha poltica so um bom exemplo de estudos de tendncias. Diversas vezes, durante
a campanha, amostras de eleitores so selecionados e perguntados em quem votaro.
Comparando os resultados das vrias pesquisas, os pesquisadores podem determinar
mudanas nas intenes de voto.
No estudo constante do preconceito nos EUA, freqentemente os entrevistados so
indagados se acham que crianas negras e brancas deveriam estudar na mesma escola. Com
o passar dos anos, os percentuais a favor de escolas racialmente integradas vm
aumentando consistentemente. Tais dados permitem que pesquisadores observem
tendncias nas atitudes com relao integrao racial.
Deve ser ressaltado que estudos de tendncias muitas vezes envolvem longos
perodos de coleta de dados. Tipicamente, voc no colhe pessoalmente todos os dados
usados num estudo de tendncias mas, ao invs, faz uma anlise secundria de dados
coletados ao longo do tempo por vrios outros pesquisadores.
At agora comentamos apenas estudos descritivos de tendncias, mas no h
motivos para um pesquisador no examinar tendncias nas relaes entre variveis. Um
exemplo a relao entre filiao religiosa e preferncia poltica. Tradicionalmente,
catlicos e judeus nos EUA tendem a votar no Partido Democrata mais do que os
protestantes, mas esta relao pode ser examinada ao longo do tempo.
ESTUDOS DE COORTES. Estudos de tendncias se baseiam em descries de
uma populao geral (como eleitores americanos) ao longo do tempo, embora mudem os
integrantes daquela populao. Pessoas vivas e representadas no primeiro estudo podem ter
morrido por ocasio do segundo e pessoas ainda no nascidas quando do primeiro estudo
podem estar representadas no segundo. Assim, um estudo de tendncias de atitudes entre
estudantes numa universidade reflete uma populao diferente de estudantes cada vez que
um survey feito.
Um estudo de coortes focaliza a mesma populao especfica cada vez que os dados
so coletados, embora as amostras estudadas possam ser diferentes. Por exemplo, podemos
selecionar uma amostra de estudantes se formando na universidade em 1990, para medir
suas atitudes em relao ao trabalho. Cinco anos depois, selecionamos e estudamos outra
amostra da mesma turma. A amostra diferente a cada vez, mas continuamos descrevendo
a turma de 1990. (Se estudssemos os formandos de 1995 na segunda vez, teramos um
estudo de tendncias de turmas de formandos e no um estudo de coorte da turma de 1990.)
O exemplo seguinte ilustra um tipo diferente de estudo de coorte. Num momento,
voc pode selecionar uma amostra de todos os americanos entre vinte e trinta anos de idade.
Dez anos mais tarde, a amostra ser de pessoas dos trinta aos quarenta, e assim por diante.
Isto um estudo de coorte de um determinado grupo de idade. O mesmo estudo pode ser
feito atravs de anlise secundria de dados previamente colhidos. Numa ocasio, voc
pode analisar os entrevistados com vinte anos no estudo de 1970, os de trinta num estudo
em 1980, os com quarenta num estudo em 1990 e assim por diante.
ESTUDOS DE PAINEL. Tanto os estudos de tendncias como os de coorte
permitem anlise de processo e mudana no tempo, o que difcil num survey interseccional. Mas esses mtodos tm severas desvantagens. Um estudo de tendncias pode
determinar que os eleitores, como um grupo, esto mudando do Candidato A para o B, mas
no indica quais pessoas esto mudando, atrapalhando tentativas de explicar porque est
ocorrendo esta mudana.
Estudos de painis envolvem a coleta de dados, ao longo do tempo, da mesma
amostra de respondentes, que se chama painel. Num estudo poltico, voc pode reentrevistar todos os membros do seu painel em intervalos mensais durante a campanha
eleitoral. Cada vez voc pergunta em quem votariam; se ocorrer mudana, voc saber
quais pessoas mudaram em qual direo. Analisando outras caractersticas de quem muda e
de quem no muda, talvez voc possa explicar as razes da mudana. (Claro que voc
tambm perguntaria aos membros do painel por que haviam mudado as intenes de voto.)
Exceto em certos casos limite, estudos de painel tm de ser realizados como parte
de um programa de pesquisas. Enquanto estudos de tendncias e de coortes podem ser
feitos atravs de anlise secundria de dados coletados previamente, estudos de painel no
Usando o exemplo das amostras paralelas, dados colhidos dos pais podem ser
usados para descrever seus filhos. Um aluno pode ser descrito como filho de pai
politicamente liberal, de me idosa, etc., e estes dados serem ento usados na anlise das
atitudes do estudante.
Ao estudar membros de igrejas, voc pode coletar dados sobre a igreja a que
pertence cada um e, talvez, sobre o ministro da mesma. Um membro da igreja pode ser
ento descrito como pertencendo a uma igreja rica e grande no centro da cidade, com um
ministro abaixo dos quarenta anos.
Entretanto, tais anlises exigem que os dados colhidos sobre os contextos dos
respondentes sejam identificados com eles, de forma a serem includos nos seus arquivos de
dados. Isto no pode ser feito enviando questionrios annimos amostra de estudantes e
pais. Os estudantes tm de ser identificados no questionrio (por nome ou nmero) e os pais
serem identificados de alguma forma que os ligasse aos filhos.
Estudos Sociomtricos
Tipicamente, surveys estudam uma amostra de uma determinada populao,
coletando dados sobre os indivduos na amostra, para descrever e explicar a populao que
representam. Todavia, o formato bsico do survey pode ser usado para um exame mais
abrangente de algum grupo, observando as interrelaes entre seus membros. Um bom
exemplo o ESTUDO SOCIOMTRICO.
Suponha que voc queira aprender algo sobre a seleo de amigos ntimos entre
crianas na escola. Voc pode fazer um survey convencional entre uma amostra de alunos
e pedir-lhes vrias informaes sobre os amigos mais prximos. Num desenho
sociomtrico, voc estudaria todos os alunos numa sala e pediria a cada um que
identificasse os amigos pelo nome. Desta forma, voc pode descobrir que Jack escolheu
Bill como melhor amigo, mas Bill, por sua vez, escolheu Frank. Voc pode tambm
descobrir que cinco alunos da sala escolheram Mary como sua melhor amiga e ningum
escolheu Ruth. Estas espcies de anlises podem crescer em complexidade, para possibilitar
um exame abrangente de toda uma rede de amizades. Procurando explicar porque certos
estudantes foram mais escolhidos do que outros, voc teria um corpo de dados sobre os
estudantes escolhidos, a partir dos auto-relatos de caractersticas, incluindo quem eles
escolheram.
Deste modo, voc pode examinar vrios possveis fatores que governam a formao
de amizades, incluindo variveis como sexo, raa, status econmico e inteligncia. A coleta
de dados de todos os membros do grupo poupa ao pesquisador ter que pedir aos
participantes descrever detalhadamente suas selees; alm disto, voc teria acesso rede
de amizades. Variantes desta tcnica podem ser usadas com qualquer grupo e a pesquisa
pode ser conduzido ao longo do tempo ou de forma inter-seccional.
Escolhendo o Desenho Apropriado
Dadas as vrias opes disponveis ao pesquisador de surveys, a questo Qual
desenho devo escolher? Esta pergunta no pode ser respondida em abstrato, porque
diferentes problemas de pesquisa requerem desenhos diferentes. Mesmo assim, pode-se dar
algumas diretrizes gerais.
Primeiro, se seu objetivo for uma descrio de tempo nico, um survey interseccional provavelmente o desenho mais apropriado. Voc identifica a populao
relevante, seleciona uma amostra de respondentes e faz o survey. A mesma opo se aplica
a uma pesquisa na qual interessa descrever subconjuntos. Caso voc pretenda documentar
diferenas de atitudes polticas entre homens e mulheres, pode consegui-lo com um survey
inter-seccional.
Mais comumente, porm, voc se interessa em examinar algum tipo de processo
dinmico, com mudanas ao longo do tempo. Por exemplo, ao lidar com as fontes e/ou
conseqncias da religiosidade, a questo da mudana no tempo fica implcita, se no
explcita. Implicitamente se supe que algumas pessoas se tornam religiosas e que ser
religioso tem efeitos subsequentes em atitudes e/ou comportamentos. O ideal selecionar
uma amostra de respondentes num ponto da vida antes de desenvolverem uma orientao
religiosa e estud-los ao longo do tempo, cobrindo o perodo durante o qual alguns deles se
tornam religiosos, acompanhando-os durante o perodo em que a religiosidade tem efeitos
sobre outros aspectos de suas vidas.
Um estudo assim leva anos para se completar. Provavelmente, voc comea com
uma amostra de pr-adolescentes e os segue atravs da meia-idade at se tornarem idosos.
O tempo e custo exigidos por um estudo assim provavelmente o inviabilizariam. Por isto,
tais temas so mais freqentemente trabalhados em surveys inter-seccionais. Ao invs de
observar os efeitos de vrias condies e experincias sociais enquanto ocorrem, voc
examina seus possveis efeitos comparando respondentes que passaram por estas condies
e experincias no passado com aqueles que no passaram.
Por exemplo, pessoas casadas geralmente so menos religiosas que as no casadas.
O estudo de painel permite observar o declnio de religiosidade em alguns participantes
aps o casamento. Mas o survey inter-seccional permite comparar os nveis de religiosidade
entre casados e no casados num dado momento, observando menos religiosidade em geral
nos respondentes casados. Embora voc no possa observar o efeito do casamento na
religiosidade na poca do casamento, pode querer inferir este efeito com base na diferena
neste tempo nico. (3) (A Parte Quatro aborda a lgica destas inferncias.)
Surveys de painel so mais viveis quando o fenmeno estudado tem durao
relativamente curta. Uma campanha eleitoral um exemplo. Como uma campanha deve
durar menos de um ano, possvel fazer diversas ondas de entrevistas com o painel do
survey durante a campanha, monitorando mudanas nas intenes de votos neste perodo e
coletando dados relevantes explicao destas mudanas. Com to curta durao, devem
ser reduzidas as dificuldades de esgotamento do painel e fica mais fcil localizar os
respondentes. (Num perodo mais longo, muitos respondentes podem se mudar da cidade e
fica mais difcil localiz-los).
Resumindo, sempre que o problema de pesquisa envolver o exame de mudanas individuais
no tempo, o survey de painel seria teoricamente o desenho mais apropriado. Se o processo
de mudana ocorrer durante um tempo relativamente curto, o survey de painel pode ser
vivel. Mais comumente, porm, o pesquisador obrigado a depender de dados interseccionais para inferir o processo de mudana nos indivduos com o passar do tempo.
Se, por outro lado, o problema de pesquisa tratar pouco de amplas tendncias
temporais - do ponto de vista descritivo -, as dificuldades sero menores na maioria dos
casos. Em muitas situaes, voc ver que outros pesquisadores j coletaram e relataram
todos os dados que voc precisa. Por exemplo, se tiver interesse nas mudanas gerais de
atitudes com relao guerra da Indochina, voc vai descobrir que pesquisadores
acadmicos e comerciais vm colhendo informaes relevantes h anos. Sua tarefa, ento,
pode ser apenas localizar tais estudos, comparar a natureza dos itens de questionrio e os
desenhos de amostras, para discutir as mudanas observadas. Em outras situaes, voc
pode verificar que s um survey colheu dados relevantes ao seu interesse de pesquisa ou
que o ltimo estudo realizado j est defasado. Em tal caso, voc pode querer fazer um
novo survey inter-seccional - comparvel em desenho amostral e itens de questionrio afim de fornecer uma nova medio visando um exame de tendncias.
Resumo
So estes ento os desenhos bsicos e as variaes mais comuns disponveis ao
pesquisador de survey. A discusso anterior de modo algum exaure as possibilidades de
desenho, mas deve oferecer-lhe estmulo e orientao suficientes para construir o desenho
de estudo mais apropriado s suas necessidades de pesquisa.
Os melhores estudos muitas vezes so os que combinam mais de um desenho, j
que cada desenho d uma perspectiva diferente ao assunto estudado. Ao mesmo tempo,
voc deve se precaver contra desenhar um survey to complexo que no haja tempo nem
dinheiro para execut-lo. J enfatizamos no Captulo 3 que todos os desenhos de survey
representam compromissos. O bom pesquisador consegue o melhor compromisso possvel.
Notas de Rodap do Captulo 4
(1) Para uma discusso mais abrangente deste tpico, vide W. S. Robinson, Ecological
Correlations and the Behavior of Individuals, American Sociological Review, junho de
1950, pg. 351 - 357.
(2) Deve-se reconhecer que o pesquisador s vezes no tem condies de conduzir uma
investigao usando as unidades de anlise mais apropriadas. Nestes casos, uma anlise
ecolgica pode ser a nica abordagem vivel para o assunto no momento. O famoso estudo
de Durkheim sobre suicdio um excelente exemplo. Para uma discusso de como
Durkheim evitou a falcia ecolgica, vide Hanan Selvin, Durkheims Suicide and Problems
of Empirical Research, American Journal of Sociology, maio de 1958, pg. 607 - 619.
Outro exemplo Samuel A. Stouffer, Effects of the Depression on the Family, em
Samuel A. Stouffer, ed., Social Research to Test Ideas (New York: Free Press, 1962), pg.
134 - 153.
(3) Reconhece-se, evidentemente, que esta inferncia a partir de dados inter-seccionais est
sempre sujeita a questionamento. Neste caso, pode-se argumentar que pessoas religiosas
tm menor probabilidade de se casarem, ou seja, que a direo causal oposta que foi
inferida.
CAPTULO 5
A LGICA DA AMOSTRAGEM DO SURVEY
Neste livro, como em muitos outros, o termo survey tem sido usado com o sentido
implcito de survey por amostragem, por oposio ao estudo de todos os componentes de
uma populao ou grupo. Tipicamente, mtodos de survey so usados para estudar um
segmento ou parcela - uma amostra - de uma populao, para fazer estimativas sobre a
natureza da populao total da qual a amostra foi selecionada. Embora a prtica de usar
amostras seja aceita mais ou menos tacitamente, as razes para amostrar, em geral, no so
conhecidas. Consideremos brevemente estas razes, antes de nos voltarmos para a lgica e
as tcnicas da amostragem.
Por que fazer amostragem?
H duas razes para justificar a amostragem: tempo e custo. Uma entrevista de um
survey domiciliar abrangente pode exigir de uma a trs horas e de $40 a $100. A economia
de estudar 2.000 pessoas ao invs de, digamos, 500.000 bvia. Portanto, amostrar muitas
vezes torna possvel um projeto, enquanto a recusa em amostrar acabaria com a pesquisa.
No entanto, a amostragem no deve ser vista como um mal necessrio. Em geral
no se reconhece que surveys por amostragem so muitas vezes mais precisos do que
entrevistar todos os componentes de uma populao. Este fato aparentemente bizarro
resulta de diversas caractersticas da logstica do survey por entrevista.
Primeiro, um grande projeto de entrevistas requer um nmero enorme de
entrevistadores. Pesquisadores caracteristicamente tentam limitar seu pessoal aos melhores
entrevistadores disponveis, e um grande projeto provavelmente exige contratar qualquer
pessoa disponvel, resultando que a qualidade geral dos entrevistadores mais baixa do
que a habitual. A qualidade dos dados coletados se reduz pela menor qualidade dos
entrevistadores. Alm disso, uma pesquisa em menor escala permite procedimentos de
acompanhamento mais severos, aumentando a taxa de entrevistas completas.
Segundo, j que entrevistar todos os membros de uma populao grande requer uma
fase de entrevistas longa, fica difcil e mesmo impossvel especificar a poca qual se
referem os dados. Se a pesquisa visar medir o nvel de desemprego numa grande cidade, o
ndice de desemprego fornecido pelos dados do survey no se referem cidade, seja do
incio, seja do fim das entrevistas. Ao invs, tem que dar alguma data hipottica ao ndice
de desemprego, talvez o ponto mdio do perodo de entrevistas. (Pedir aos entrevistados
para responder sobre uma data especificada uniforme introduz o problema da recordao
imprecisa.) O problema da atribuio do tempo inerente a qualquer projeto de entrevistas
no executado num s momento, e a gravidade do problema cresce com a durao do
perodo de entrevistas. Se entrevistar tomar dez meses - com os ndices de desemprego
variando neste perodo - o ndice resultante no ter significado.
Finalmente, os requisitos administrativos de um grande survey so muito maiores do
que os em geral encontradas pelos pesquisadores por surveys. A superviso, os relatrios, o
treinamento e assim por diante so muito mais difceis num grande survey e a qualidade dos
dados coletados pode ser menor do que a obtida num trabalho menor e mais manejvel.
(Vale a pena observar que o Bureau do Censo nos EUA produz um survey por amostragem
aps o censo decenal para avaliar os dados colhidos na enumerao total.)
Dados Por Amostragem So Realmente Exatos ?
Apesar da discusso anterior, talvez voc ainda sinta algum desconforto quanto
amostragem. Uma vez que possvel uma amostra representar erroneamente a populao
da qual obtida, o pesquisador que usa mtodos de amostragem enfrenta um perigo
inevitvel. No entanto, como mostraremos neste captulo, procedimentos de amostragem
bem estabelecidos podem tornar aceitvel esse perigo. Surveys por amostragem podem
permitir estimativas muito precisas sobre as populaes que retratam. Mas o pesquisador de
surveys por amostragem deve estar preparado para tolerar uma certa ambigidade, uma vez
que raramente possvel determinar o grau de preciso dos achados de uma amostra.
Pesquisadores de opinio poltica representam um grupo de pesquisadores por
surveys a quem dada a oportunidade de verificar a preciso dos achados das suas
amostras. O dia da eleio o do julgamento final para eles, e suas experincias so
instrutivas em relao questo mais geral da preciso dos surveys por amostragem.
A maioria dos crticos dos mtodos de survey por amostragem lembra a votao do
Literary Digest de 1936, que previu a vitria de Alfred M. Landon sobre Franklin D.
Roosevelt por maioria absoluta. Pesquisando uma amostra de mais de 2 milhes de
eleitores pelo correio, o Digest previu que Landon derrotaria Roosevelt em quase 15 pontos
percentuais. A razo principal deste fracasso foi a MOLDURA DE AMOSTRAGEM usada
pelos pesquisadores (discutiremos este conceito depois). A amostra do Digest foi tirada de
catlogos telefnicos e listas de registros de automveis, um procedimento de amostragem
que foi suficiente nas eleies de 1920, 1924, 1928 e 1932, mas que em 1936 no forneceu
um corte representativo dos eleitores americanos. No rastro da Depresso, e no meio do
New Deal, nmeros sem precedentes de americanos pobres apareceram para votar, e estas
pessoas pobres no estavam adequadamente representadas pelos catlogos telefnicos e
listas de registros de automveis. (1)
Em 1936, George Gallup previu corretamente que Roosevelt ganharia um segundo
mandato. Os procedimentos de amostragem de Gallup diferiam dos do Literary Digest. O
Instituto Americano de Opinio Pblica de Gallup foi pioneiro no uso da AMOSTRAGEM
POR COTAS (descrita posteriormente neste captulo), que garantia a todos os tipos de
eleitores, ricos e pobres igualmente, adequada representao na amostra. Onde a pesquisa
do Digest falhou em encontrar e interrogar os eleitores pobres - predominantemente
Democratas -, a amostragem por cotas de Gallup o fez.
Doze anos depois, Gallup e a maioria dos outros pesquisadores de opinio poltica
passaram pelo constrangimento de prever a vitria de Thomas Dewey sobre Harry Truman.
Como observou Goodman Ace, acidamente: Todos acreditam nas pesquisas de opinio
pblica. Todos, desde o homem da rua ... at o Presidente Thomas E. Dewey. (2) Vrios
fatores conspiraram para causar o fiasco da pesquisa de 48. Para comear, a maioria dos
pesquisadores terminou sua pesquisa cedo demais, apesar de uma tendncia constante em
direo a Truman no transcorrer da campanha. Grande nmero dos eleitores que disseram
no saber em quem votariam foram predominantemente para Truman. Mais importante,
contudo - o fracasso de 48 apontou uma srie de falhas inerentes amostragem por cotas, o
mesmo mtodo que fora um avano considervel sobre os mtodos de amostragem do
Literary Digest. Em 1948, diversos pesquisadores acadmicos de survey estavam
No lugar dos 2 milhes de eleitores avaliados pelo Literary Digest em 1936, estas
quatro pesquisas de boca de urna amostraram entre 6.000 e 20.000 eleitores para predizer a
votao dos mais de 90 milhes de americanos que foram s urnas. Os resultados destas
pesquisas no foram surpreendentes, apenas confirmaram a tendncia relatada nas
pesquisas feitas na semana anterior eleio. O que as grandes pesquisas tinham a dizer,
em geral baseadas em amostras de 2.000 ou menos entrevistados, est apresentado na
Tabela 5-2.
Tabela 5-2 Pesquisas de opinio polticas antes da eleio de 1988_______________
Bush
Dukakis_____
CBS News / New York Times (4-5/11/88)
55%
45%
Pesquisa Gallup (3-5/11/88)
56%
44%
USA Today / CNN (3-6/11/88)
55%
45%
Pesquisa Harris (2-5/11/88)
53%
47%
ABC News / Washington Post (2-5/11/88)
55%
45%
NBC News / Wall Street Journal (1-5/11/88)
53%
47%_______
Fonte: Dados tirados de Public Opinion, nov./dez. 1988, pag. 39. Todos os dados foram refeitos para excluir
as respostas no.
probabilstica ser representativa da populao da qual extrada do que uma amostra noprobabilstica.
Segundo, e mais importante, a teoria da probabilidade permite estimar a preciso ou
representatividade da amostra. concebvel que voc, por meios totalmente aleatrios,
selecione uma amostra que represente quase perfeitamente a populao maior. No entanto,
muito mais provvel que no o faa, e voc no tem como avaliar a probabilidade de ter
atingido a representatividade. Por outro lado, a amostra probabilstica pode fornecer uma
estimativa precisa do seu sucesso ou fracasso. Aps apresentar uma breve taxonomia da
terminologia da amostragem, examinaremos os meios pelos quais se pode estimar a
representatividade da sua amostra.
Conceitos e Terminologia de Amostragem
As seguintes discusses da teoria e prtica da amostragem usam vrios termos
tcnicos. Para facilitar a compreenso das discusses, importante defini-los. Na maior
parte, usaremos termos habitualmente usados em manuais sobre amostragem e estatstica.
Ao apresentar esta taxonomia sobre terminologia e conceitos de amostragem, quero
reconhecer uma dvida para com Leslie Kish e seu excelente manual sobre o survey por
amostragem.4 Embora eu tenha modificado algumas das convenes usadas por Kish, a sua
apresentao a mais importante fonte para a nossa discusso.
Elemento
Um ELEMENTO a unidade sobre a qual a informao coletada, e que serve de
base para a anlise. Tipicamente, na pesquisa de survey, os elementos so pessoas ou certos
tipos de pessoas. Entretanto, outros tipos de unidades - famlias, clubes, corporaes, etc. podem tambm constituir os elementos de um survey.
Universo
Um UNIVERSO a agregao terica e hipottica de todos os elementos definidos
num survey. Se o americano individual for o elemento do survey, ento americanos sero
o universo. Porm, um universo de survey totalmente no especificado quanto a tempo e
lugar e essencialmente um termo intil.
Populao
POPULAO a agregao teoricamente especificada de elementos do survey.
Embora o termo vago americanos possa constituir o universo de um survey, delinear a
populao inclui definir o elemento americano (por exemplo, cidadania e residncia) e o
referencial de tempo para a pesquisa (americanos desde quando?). Traduzir o universo
nova-iorquinos adultos para uma populao trabalhvel requer especificar a idade,
definindo adulto, as fronteiras de Nova Iorque, etc. Especificar o termo estudante
universitrio inclui levar em conta estudantes de horrio integral e parcial, candidatos a
diplomas ou no, estudantes dos cursos de graduao e ps-graduao, e atributos
similares.
As razes para usar mtodos de seleo aleatria, ou seja, tabelas de nmeros aleatrios ou
programas de computador, so duas. Primeiro, este procedimento funciona como antdoto
aos vieses conscientes ou inconscientes do pesquisador. O pesquisador que seleciona casos
de forma intuitiva pode muito bem selecionar casos que apoiam expectativas ou hipteses
de pesquisa preexistentes. Segundo, a seleo aleatria d acesso teoria da probabilidade,
que a base para as estimativas sobre parmetros populacionais e as estimativas de erro.
Passemos agora ao exame deste segundo aspecto.
Distribuio Binomial da Amostragem
A forma mais clara de discutir o conceito da distribuio amostral usar um
exemplo simples de survey. Suponha que queremos estudar a populao estudantil de uma
universidade para medir a aprovao ou rejeio de um cdigo de conduta estudantil
proposto pela administrao. A populao do survey ser a agregao de estudantes
relacionados numa listagem de alunos (a moldura de amostragem). Os elementos sero os
estudantes individuais da universidade. A varivel considerada ser atitudes quanto ao
cdigo, uma varivel binomial - aprovar ou rejeitar. Selecionaremos uma amostra aleatria
de estudantes para estimar todo o corpo estudantil.
A Figura 5-1 apresenta uma eixo de ordenadas representando todos os valores
possveis deste parmetro na populao - de 0 at 100 % de aprovao. O ponto mdio do
eixo - 50 % - representa a situao na qual metade dos alunos aprova o cdigo, enquanto a
outra metade rejeita-o.
Vamos supor que demos um nmero a cada aluno da listagem, e que selecionamos
100 nmeros de uma tabela de nmeros aleatrios. Os 100 estudantes cujos nmeros forem
selecionados so entrevistados e perguntados quanto sua atitude em relao ao cdigo
estudantil - se aprovam ou rejeitam. Suponhamos que esta operao nos d 48 alunos que
aprovam o cdigo e 52 que rejeitam. Podemos representar esta estatstica marcando a
ordenada no ponto correspondente a 48%.
Agora suponha que selecionamos outra amostra de 100 alunos exatamente da
mesma forma, e que medimos sua aprovao/rejeio do cdigo estudantil e que 51
estudantes desta amostra aprovem o cdigo; esse resultado pode ser representado por outra
marca no local apropriado da ordenada. Repetindo o processo, podemos descobrir, que,
numa terceira amostra, 52 alunos aprovam o cdigo.
Figura 5-1
|__________________________________|___________________________________|
0
50
100
Porcentagem de alunos que aprovam o cdigo estudantil
A Figura 5-2 mostra as trs diferentes estatsticas representando as porcentagens de
alunos em cada uma das trs amostras aleatrias que aprovam o cdigo estudantil. A regra
bsica da amostragem aleatria que as amostras extradas de uma populao fornecem
estimativas do parmetro relativo populao total. Portanto, cada amostra aleatria d
uma estimativa da porcentagem de estudantes em todo o corpo estudantil que aprovam o
cdigo de estudantes. No entanto, infelizmente selecionamos trs amostras e agora temos
trs estimativas distintas.
Figura 5-2
Figura 5-3
Para escapar deste dilema, vamos extrair mais e mais amostras de 100 alunos cada,
perguntar a cada uma das amostras sobre sua aprovao/rejeio do cdigo, e marcar as
novas estatsticas no nosso grfico de resumo. Ao extrair muitas amostras, vamos descobrir
que algumas das novas amostras repetem as estimativas dadas por amostras anteriores. Para
explicar esta situao, acrescentemos um eixo de abcissas figura, representando o nmero
de amostras que fornecem estimativas. A Figura 5-3 mostra o produto dos nossos novos
esforos amostrais.
A distribuio das estatsticas amostrais, mostrada na Figura 5-3, chamada
DISTRIBUIO AMOSTRAL. Ao aumentar o nmero de amostras selecionadas e
entrevistadas, tambm aumentamos a extenso das estimativas fornecidas pela operao de
amostragem. Num sentido, agravamos nosso dilema de tentar adivinhar o parmetro da
populao. No entanto, a teoria da probabilidade oferece certas regras importantes relativas
distribuio de amostras mostrada na Figura 5-3.
Primeiro, se muitas amostras aleatrias independentes so extradas de uma
populao, as estatsticas amostrais fornecidas por estas amostras estaro distribudas em
torno do parmetro populacional de uma forma conhecida. Embora haja uma ampla faixa
de estimativas, a maioria est mais prxima dos 50 % do que de outra parte do grfico.
Portanto, a teoria da probabilidade nos diz que o valor real est prximo aos 50 %.
Segundo, a teoria da probabilidade nos d uma frmula para estimar quo prximo
as estatsticas da amostragem esto aglomeradas em torno do valor real. Esta frmula
contm trs fatores: o parmetro, o tamanho da amostra e o ERRO PADRO (uma medida
do erro da amostragem).
Frmula: S =
PQ
n
omisses e corrigi-las se possvel. (Naturalmente, talvez voc possa ignorar, sem prejuzo,
um pequeno nmero de omisses de difcil correo.)
3. Para poder generalizar populao que compe a moldura de amostragem,
necessrio que todos os elementos tenham representao igual nela; cada elemento deve
aparecer uma s vez. Do contrrio, elementos que aparecem mais de uma vez tero maior
probabilidade de seleo, e a amostra, no geral, sobre-representar estes elementos.
Outros assuntos mais prticos, relacionados s populaes e molduras de
amostragem, so tratados em outros captulos. Por exemplo, o formato da moldura de
amostragem - uma lista numa publicao, um arquivo em fichas 3x5, placas
addressograph, cartes IBM, fitas magnticas, disquetes - muito importante. Tais
consideraes freqentemente ganham precedncia sobre consideraes cientficas; uma
lista mais fcil poder ser escolhida contra uma lista mais difcil, mesmo que esta seja
mais apropriada populao alvo. No devemos ser dogmticos a este respeito; os
pesquisadores devem pesar cuidadosamente as vantagens e as desvantagens relativas destas
alternativas. O mais importante que voc esteja ciente - e deve informar seu leitor - das
deficincias de qualquer moldura de amostragem que escolher.
Tipos de Desenhos de Amostragem
Introduo
Talvez, a essa altura, voc esteja apavorado com a importncia e as dificuldades
para organizar sua moldura de amostragem; um sentimento correto e saudvel. Aps
estabelecer a moldura de amostragem, voc deve selecionar uma amostra de elementos para
estudo.
At agora, focalizamos a AMOSTRAGEM ALEATRIA SIMPLES. De fato, as
estatsticas usadas em geral pelos pesquisadores de survey supem tal amostra. Mas, como
logo veremos, h diversas opes para fazer a amostragem, e raramente se opta pela
aleatria simples, por duas razes. Primeiro, a amostragem aleatria simples s possvel
com as molduras de amostragem mais simples. Segundo, a amostragem aleatria simples
pode no ser o mtodo melhor (o mais preciso). Discutiremos agora a amostragem aleatria
simples e outros tipos de desenhos de amostragem.
Amostragem Aleatria Simples
A amostragem aleatria simples [AAS] o mtodo de amostragem bsico suposto
pelos clculos estatsticos do survey. A matemtica da amostragem aleatria
particularmente complexa, e nos desviaremos dela, preferindo descrever os mtodos de
campo que empregam este mtodo.
Uma vez estabelecida uma moldura de amostragem de acordo com a discusso
anterior, voc numera cada elemento da lista, atribuindo um e s um nmero a cada um,
sem saltar nenhum nmero. A seguir, usa uma tabela de nmeros aleatrios para selecionar
os elementos da amostra.
Se sua moldura de amostragem est em formato prprio para computadores, como
um disquete, uma amostra aleatria simples pode ser extrada automaticamente, usando um
programa de computador relativamente simples. Com efeito, o computador pode numerar
mltiplo. Neste caso, a amostra poderia incluir apenas apartamentos do lado noroeste, ou s
apartamentos perto dos elevadores. Se estes tipos de apartamentos tiverem alguma
caracterstica peculiar em comum (por exemplo, aluguel mais elevado), a amostra seria
tendenciosa. Risco semelhante pode surgir numa amostragem sistemtica de casas numa
subdiviso organizada com o mesmo nmero de casas num quarteiro.
Ao considerar uma amostra sistemtica a partir de uma lista, voc deve examinar
cuidadosamente a natureza da lista. Se os elementos esto arranjados nalguma ordem
particular, certifique-se se aquela ordem no enviesa a amostra a ser selecionada e tome
medidas para contrabalanar qualquer possvel vis (por exemplo, tirar uma amostra
aleatria simples de pores cclicas).
Em resumo, a amostragem sistemtica, em geral, superior amostragem aleatria
simples, pelo menos em convenincia. Os problemas na ordenao dos elementos da
moldura de amostragem geralmente podem ser remediados com facilidade.
Amostragem Estratificada
Nas duas sees precedentes, discutimos dois mtodos alternativos de seleo de
amostras a partir de uma lista. A AMOSTRAGEM ESTRATIFICADA no uma
alternativa a estes mtodos, mas representa uma possvel modificao no seu uso.
As amostragens aleatria simples e sistemtica so importantes no sentido de
garantirem um grau de representatividade e permitirem uma estimativa de erro. A
amostragem estratificada um mtodo para obter maior grau de representatividade,
reduzindo o provvel erro amostral. Para compreender porque, voltemos rapidamente
teoria bsica da distribuio amostral.
Lembre que o erro amostral reduzido por dois fatores no desenho da amostra.
Primeiro, uma amostra maior produz menor erro amostral do que uma amostra menor.
Segundo, uma populao homognea produz amostras com menores erros amostrais do que
uma populao heterognea. Se 99 % da populao concordam com determinado
enunciado, improvvel que qualquer amostra probabilstica interprete erroneamente a
extenso da concordncia. Se, por outro lado, a populao est dividida meio a meio quanto
ao enunciado, ento o erro amostral ser muito maior.
A amostragem estratificada baseia-se neste segundo fator na teoria de amostragem.
Ao invs de selecionar a amostra da populao total em geral, voc garante que quantidades
apropriadas de elementos sejam tirados de subconjuntos homogneos da populao. Por
exemplo, estudando estudantes universitrios, voc pode organizar sua populao por
turmas, tirando de cada uma quantidades apropriadas. Numa amostra no estratificada, a
representao por turma estaria sujeita ao mesmo erro amostral que outras variveis. Na
amostra estratificada por turma, o erro amostral quanto a esta varivel reduz-se a zero.
Voc pode querer usar um mtodo de estratificao ainda mais complexo. Alm de
estratificar por turma, pode tambm estratificar por gnero, por mdia de notas, etc. Assim,
talvez voc garanta que sua amostra tenha nmeros apropriados de alunos da turma A com
nota mdia 4,0; tambm nmeros apropriados de alunas dessa turma com mdia 4,0, etc.
Portanto, a funo ltima da estratificao organizar a populao em subconjuntos
homogneos (com heterogeneidade entre os subconjuntos) e selecionar o nmero
apropriado de elementos de cada subconjunto. J que os subconjuntos so homogneos nas
variveis de estratificao, tambm podem ser homogneos quanto a outras variveis. Por
exemplo, se idade estiver fortemente relacionada a turma, uma amostragem estratificada
por turma tambm ser mais representativa em termos de idade. Como aspiraes
ocupacionais esto relacionadas a sexo, uma amostra estratificada por sexo ser mais
representativa em termos das aspiraes ocupacionais.
A escolha das variveis de estratificao depende em geral de quais variveis esto
disponveis. Sexo pode muitas vezes ser determinado atravs de uma lista de nomes. As
listas universitrias so tipicamente organizadas por turma. As listas de professores podem
indicar sua lotao por departamento. Arquivos de organizaes governamentais podem
estar organizados por regio geogrfica. Listas de registros de eleitores esto organizadas
por sees e zonas eleitorais.
No entanto, ao selecionar as variveis de estratificao das listas disponveis, voc
deve se preocupar sobretudo com as que se relacionam, presumivelmente, com as variveis
que voc quer representar com preciso. Como sexo est relacionado a muitas variveis e
muitas vezes est disponvel para estratificao, acaba sendo usado freqentemente.
Escolaridade est relacionada a muitas variveis, mas freqentemente no est disponvel
para estratificao. Localizao geogrfica numa cidade, estado ou nao est relacionada a
muitas coisas. Dentro de uma cidade, a estratificao por lugar geogrfico, em geral,
aumenta a representatividade em reas como classe social e grupo tnico. Dentro de uma
nao, aumenta a representatividade em uma vasta gama de atitudes bem como na classe
social e na etnia.
Os mtodos de estratificao na amostragem variam. Quando se trabalha com uma
lista simples de todos os elementos na populao, dois mtodos predominam. Primeiro,
pode-se agrupar os elementos da populao em grupos discretos com base nas variveis de
estratificao usadas. Com base na proporo relativa de um grupo na populao,
seleciona-se - aleatria ou sistematicamente - um nmero de elementos daquele grupo na
mesma proporo do tamanho de amostra desejado. Por exemplo, se alunos da turma A
com mdia 4,0 so 1 % da populao estudantil e voc quer uma amostra de 1.000
estudantes, selecione 10 estudantes dos alunos da turma A com mdia 4,0.
Como mtodo alternativo, pode-se agrupar estudantes como descrito acima e pr
esses vrios grupos juntos, numa lista contnua comeando com todos os alunos da turma A
com mdia 4,0 e terminando, digamos, com todas as alunas da turma Z com mdia 1,0 ou
menos. Seleciona-se ento uma amostra sistemtica, com incio aleatrio, de toda a lista.
Dada a organizao de lista, uma amostra sistemtica selecionaria nmeros adequados
(dentro de uma margem de erro de 1 ou 2) de cada subgrupo. (Nota: Uma amostra aleatria
simples retirada de tal lista composta cancelaria a estratificao).
O efeito da estratificao garantir a representao adequada das variveis de
estratificao para a aumentar a representao de outras variveis relacionadas a elas.
Portanto, tomada como um todo, uma amostra estratificada tem possibilidade de ser mais
representativa num certo nmero de variveis do que no caso de uma amostra aleatria
simples. Embora a amostra aleatria simples ainda seja vista como algo sagrado, deve estar
claro que muitas vezes h coisa melhor.
Estratificao Implcita na Amostragem Sistemtica
Mencionei antes que a amostragem sistemtica pode, em certas condies, ser mais
precisa do que a amostragem aleatria simples. o caso sempre que o arranjo da lista cria
uma estratificao implcita. Como assinalei, se a lista de estudantes universitrios est
organizada por turma, uma amostra sistemtica produzir a estratificao por perodo, ao
contrrio de uma amostra aleatria simples. Outros arranjos tpicos de elementos em listas
podem ter o mesmo efeito.
Se uma lista de nomes que compe uma moldura de amostragem est em ordem
alfabtica, ela um pouco estratificada por origem tnica. Por exemplo, todos os
McTavishes esto reunidos, bem como os Lees, Wongs, Yamamuras, Schmidts, Whitehalls,
Weinsteins, Gonzaleses, etc. Na medida em que qualquer destes subgrupos forma um
subconjunto substancial da populao total, estar adequadamente representado numa
amostra sistemtica retirada de uma lista alfabtica.
Num estudo de estudantes da Universidade do Hava, depois de estratificados por
turma, os estudantes foram organizados pelos nmeros de identidade estudantil. No entanto,
estes nmeros eram seus nmeros de Seguro Social. Os primeiros trs dgitos do nmero de
Seguro Social indicam o estado onde foi emitido. Portanto, dentro de cada turma, os
estudantes estavam organizados pelo estado onde havia sido emitido seu nmero de Seguro
Social, fornecendo uma estratificao aproximada por origem geogrfica.
Uma lista ordenada de elementos pode ser mais til do que uma lista no ordenada,
aleatria. Enfatizo este ponto para combater a crena infeliz de que listas devem ser
randomizadas antes de ocorrer a amostragem sistemtica. A lista s deve ser reordenada se
o arranjo apresenta o problema da periodicidade j discutido.
Amostragem por Conglomerados em Mltiplas Etapas, Geral
As quatro sees precedentes lidaram com procedimentos razoavelmente simples de
amostragem a partir de listas de elementos, que representam a situao ideal. Entretanto,
infelizmente muita pesquisa social interessante requer selecionar amostras de populaes
que no podem ser facilmente listadas para fins de amostragem, tais como a populao de
uma cidade, de um estado ou da nao, todos os estudantes universitrios nos Estados
Unidos, etc. Nestes casos, necessrio criar e executar um desenho de amostra mais
complexo. Este desenho tipicamente envolve a amostragem inicial de grupos de elementos,
conhecidos como CONGLOMERADOS [clusters], seguida pela seleo de elementos de
cada conglomerado selecionado. As variedades e procedimentos da AMOSTRAGEM POR
CONGLOMERADOS EM MLTIPLAS ETAPAS so dissecadas em detalhe nos
exemplos de amostragem no Captulo 6. Entretanto, vamos deline-los aqui.
Pode-se fazer amostragem por conglomerados quando no possvel ou prtico
compilar uma lista exaustiva dos elementos da populao alvo. Todos os membros de
igrejas nos Estados Unidos exemplificam uma populao assim. Contudo, muitas vezes os
elementos da populao j esto agrupados em subpopulaes, e uma lista destas
subpopulaes existe ou pode ser criada de forma prtica. Por exemplo, membros de igrejas
nos Estados Unidos pertencem a igrejas especficas, e possvel descobrir ou criar uma
lista dessas igrejas. Seguindo um formato de amostragem por conglomerado, a lista de
igrejas amostrada numa das maneiras descritas nas sees anteriores (por exemplo, uma
amostra estratificada sistemtica). Em seguida, obtm-se listas de membros de cada uma
das igrejas selecionadas e amostra-se cada uma das listas, de forma a ter amostras de
membros de igreja para estudo.6
Outra situao tpica a amostragem em reas habitadas, como uma cidade. Embora
no haja uma lista nica da populao de uma cidade, os cidados residem em quarteires
separados ou zonas de recenseamento. Portanto, possvel comear selecionando uma
amostra de quarteires, criar uma lista de pessoas morando nos quarteires selecionados e,
finalmente, subamostrar pessoas em cada quarteiro.
Num desenho mais complexo, voc pode amostrar os quarteires, listar as
residncias em cada quarteiro selecionado, amostr-las, listar as pessoas residindo em cada
uma e, finalmente, amostrar as pessoas em cada residncia selecionada. Este desenho de
amostragem em mltiplas etapas leva seleo final de uma amostra de indivduos sem
requerer a listagem inicial de todos os indivduos que compem a populao da cidade.
Portanto, tambm na amostragem por conglomerados em mltiplas etapas repetemse dois passos bsicos: listar e amostrar. A lista de unidades primrias de amostragem
(igrejas ou quarteires, por exemplo) compilada e talvez estratificada para amostragem.
Uma amostra dessas unidades selecionada. As unidades primrias de amostragem
selecionadas so, ento, listadas e talvez estratificadas. A lista de unidades secundrias de
amostragem amostrada, e assim por diante. Os mtodos de listagem e amostragem so
apresentadas detalhadamente nos exemplos do Captulo 6.
A amostragem por conglomerados altamente recomendada pela eficincia, embora
s custas da preciso. Enquanto uma amostra aleatria simples extrada de uma lista
populacional est sujeita a um nico erro amostral, uma amostra por conglomerados em
duas etapas est sujeita a dois. Primeiro, a amostra inicial dos conglomerados representa a
populao de conglomerados somente dentro de uma faixa de erro amostral. Segundo, a
amostra de elementos extrada de um conglomerado representa todos os elementos dele
apenas dentro de uma faixa de erro amostral. Assim, por exemplo, h o risco de selecionar
uma amostra de quarteires desproporcionalmente ricos, bem como uma amostra de
residncias desproporcionalmente ricas dentro destes quarteires. A melhor soluo ao
problema est no nmero de conglomerados selecionados no incio e o nmero de
elementos selecionados em cada conglomerado.
Em geral, estamos restritos a um tamanho mximo de amostra; por exemplo,
podemos ter o limite de 2.000 entrevistas numa cidade. Dada esta limitao maior, temos
vrias opes para desenhar a amostra por conglomerado. Num extremo, podemos escolher
um conglomerado e selecionar 2.000 elementos dentro dele, noutro escolher 2.000
conglomerados e selecionar um elemento em cada um. Naturalmente, nenhum
aconselhvel, mas h muitas opes entre estes extremos. Felizmente, a lgica das
distribuies amostrais prov uma diretriz geral a seguir.
Lembre que o erro amostral reduzido por dois fatores: o aumento do tamanho da
amostra e uma maior homogeneidade dos elementos a serem amostrados. Estes fatores
operam em cada nvel do desenho da amostra em mltiplas etapas. Uma amostra por
conglomerados representar melhor todos os conglomerados se um grande nmero for
selecionado e se todos eles forem bastante semelhantes. Uma amostra de elementos
representar melhor todos os elementos de um conglomerado se um grande nmero de
elementos for selecionado do conglomerado, e se todos os elementos forem bastante
semelhantes.
Entretanto, dado um tamanho mximo da amostra, se o nmero de conglomerados
aumentar, o nmero de elementos num conglomerado deve diminuir. Neste sentido, a
representatividade dos conglomerados aumenta s custas da menor representao dos
elementos de cada um, e vice-versa. Felizmente, podemos usar o fator da homogeneidade
para aliviar esta dificuldade.
proporo maior da populao total. Assim, alguns poucos grandes quarteires podem
conter uma proporo grande da populao de uma cidade, enquanto o nmero maior de
quarteires menores de fato contm apenas uma pequena parcela da populao.
Selecionar conglomerados com igual probabilidade, retirando uma proporo fixa
de elementos dos conglomerados selecionados, resulta no seguinte: (1) Seleciona-se um
nmero relativamente pequeno de conglomerados grandes na primeira etapa da
amostragem. (2) Os elementos selecionados para representar todos os elementos dos
grandes aglomerados so retirados de muito poucos desse conglomerados. Na situao
extrema, toda a populao da cidade residindo em dez grandes quarteires poderia ser
representada pelas pessoas vivendo em apenas um deles.
A seo sobre a amostragem por conglomerados discutiu a maior eficincia inerente
seleo de muitos conglomerados, com poucos elementos sendo retirados de cada um.
Este princpio posto em prtica atravs do mtodo de AMOSTRAGEM DE
PROBABILIDADE PROPORCIONAL AO TAMANHO (PPT), que permite selecionar
maior nmero de conglomerados, garante a representao dos elementos de conglomerados
grandes, e d a cada elemento na populao igual chance de seleo.
Na primeira etapa de amostragem, dada a cada conglomerado oportunidade de
seleo proporcional ao seu tamanho (em nmero de elementos). Grandes conglomerados
tm maior chance de seleo do que os menores. Mas, na segunda etapa de amostragem, o
mesmo nmero de elementos escolhido de cada conglomerado selecionado. O efeito
destes dois procedimentos igualar as probabilidades ltimas de seleo de todos os
elementos, j que elementos em conglomerados maiores tm uma oportunidade de seleo
menor dentro do seu aglomerado do que elementos em conglomerados menores. Por
exemplo, um quarteiro com 100 residncias ter dez vezes mais chance de seleo do que
um quarteiro com apenas 10. Se ambos os quarteires forem selecionados, e o mesmo
nmero de residncias for selecionado de cada quarteiro, as casas no quarteiro maior
tero dez vezes menos chance de seleo do que as casas no quarteiro menor. A frmula
abaixo indica a probabilidade de seleo de um elemento num desenho de amostragem
PPT.
[nmero de
[probabilidade = aglomerados X [porte do aglomerado]
X
do elemento ]
selecionados] [ tamanho da populao]
aglomerado]
[elementos selecionados
por aglomerado]
[tamanho do
dos quais sendo selecionados para estudo. Pode-se usar a ponderao para compensar o
elemento 0,2 que, logicamente, no tinha como ser selecionado.
4. Dez elementos de um conglomerado podem ter sido selecionados, mas dois no
tiveram como ser estudados (por exemplo, recusaram a entrevista). Pressupondo
homogeneidade dentro do aglomerado, voc pode atribuir peso 1,25 a cada um dos
elementos estudados para compensar os dois que no o foram.
Todos estes usos de ponderao so ilustrados no exemplo final de amostragem do
Captulo 6. Entretanto, com a exceo do caso 4 acima, voc pode derivar seu prprio
procedimento de ponderao, determinando cuidadosamente a probabilidade de seleo,
passo a passo, para cada elemento da amostra, e atribuindo um peso igual ao inverso
daquela probabilidade. Trs outros aspectos da ponderao devem ser discutidos antes de
passarmos a outro tema.
Graus de Preciso na Ponderao
Em qualquer desenho complexo de amostra, h diversas opes em relao
ponderao, em conexo com a amostragem intencional e/ou inadvertidamente
desproporcional. Podemos computar pesos para cada elemento at vrias casas decimais, ou
atribuir pesos aproximados para dar conta apenas das instncias mais grosseiras de
amostragem desproporcional. No caso anterior da cidade com a regio suburbana
sobreamostrada, improvvel que a populao daquela regio seja exatamente um quarto
da populao da cidade; pode de fato ser 0,25001, 0,2600 ou 0,2816 da populao total. No
primeiro caso, provavelmente escolheremos aplicar a ponderao geral aproximada de
casos descrita, se no houver outra amostragem desproporcional envolvida noutras etapas
do desenho da amostra. Talvez tambm faamos o mesmo no segundo e terceiro casos. A
preciso que buscamos na ponderao deve ser comensurvel com a preciso que queremos
nos nossos achados. Se nossos objetivos de pesquisa podem tolerar erros de poucos pontos
percentuais, provavelmente no perderemos tempo e esforo fazendo ponderaes exatas.
Alm disso, ao decidirmos o grau de preciso requerido, devemos levar em conta o grau de
erro a ser esperado da distribuio normal de amostragem mais todos os diversos tipos de
erro no-amostrais.
Em ltima anlise, no h uma diretriz firme a seguir quando se determina a
preciso a ser buscada na ponderao. Como em vrios outros aspectos do desenho de
surveys, desfrutamos de considervel latitude. Ao mesmo tempo, porm, devemos lembrar
da nossa deciso de ponderao ao informarmos os resultados. No devemos empregar um
procedimento de ponderao aproximada e depois sugerirmos que os achados so precisos
dentro de uma faixa minscula de erro.
Mtodos de Ponderao
Tendo delineado as preocupaes cientficas quanto a determinar o grau de preciso
desejado na ponderao, devemos assinalar que a escolha muitas vezes feita com base nos
mtodos disponveis para ponderar. Os trs mtodos bsicos para a ponderao so.
1. Para a ponderao aproximada de amostras extradas de subpopulaes, tabelas
com pesos podem ser construdas das tabelas sem pesos, para cada uma das subamostras.
No exemplo acima, voc pode criar uma tabela simples de distribuies para a amostra
suburbana e para a amostra no suburbana separadamente, triplicar o nmero de casos em
cada clula da tabela no suburbana, somar os casos nas duas tabelas e computar as
porcentagens para a tabela composta.
2. Para uma ponderao mais extensa e rpida, embora ainda aproximada, os
conjuntos de dados para certos casos podem ser clonados. No exemplo anterior, podem ser
feitas duas cpias adicionais para cada residncia suburbana (totalizando trs), o conjunto
ampliado de casos no suburbanos podendo ento ser combinado com os casos suburbanos,
e o conjunto ampliado de dados pode ser analisado como se trs vezes mais casas no
suburbanas tivessem sido estudadas.
3. Muitos programas de computador para anlise de dados so desenhados para
atribuir um peso exato para cada caso no arquivo de dados original. Este mtodo o nico
apropriado para a ponderao refinada, porque impossvel clonar fraes de casos, com
algum significado.
Como em outras instncias, tambm na ponderao as preocupaes cientficas em
geral submetem-se a razes prticas. Se a anlise for conduzida, por exemplo, atravs de
cartes IBM, a ponderao deve, necessariamente, ser aproximada ao invs de precisa.
Ponderao e Inferncia Estatstica
Advirto que os procedimentos de ponderao descritos tm efeitos srios na maioria
dos clculos relacionados inferncia estatstica. Se suas finalidades de pesquisa exigem
inferncias estatsticas precisas (por exemplo, estimativas de populao), feitas com base
em dados cuidadosamente ponderados, voc deve consultar uma fonte especial sobre este
assunto7 ou, melhor ainda, consultar um estatstico de amostragem antes da amostragem
ser desenhada.
Panorama da Amostragem Probabilstica
A longa e detalhada discusso precedente foi dedicada ao mtodo chave de
amostragem usado na pesquisa de survey: amostragem probabilstica. Em cada uma das
variaes examinadas, vimos que os elementos so escolhidos de uma populao, com base
na seleo aleatria e com probabilidades no-zero conhecidas.
Dependendo da situao de campo, a amostragem probabilstica pode ser muito
simples ou extremamente difcil, demorada e cara. No entanto, independente da situao,
continua sendo o mtodo mais eficiente para a seleo de elementos para estudo, por duas
razes. Primeiro, a amostragem probabilstica evita o VIS consciente ou inconsciente na
seleo de elementos por parte do pesquisador. Se todos os elementos da populao tm
chance igual (ou desigual, com ponderao posterior) de seleo, h uma boa chance da
amostra assim selecionada representar bastante bem a populao. Segundo, a amostragem
probabilstica permite estimativas de erro amostral. Embora nenhuma amostragem
probabilstica seja perfeitamente representativa em todos os aspectos, mtodos controlados
de seleo permitem estimar o grau de erro esperado.
Tendo discutido a amostragem de probabilidade em algum detalhe, examinemos
agora, mais sucintamente, alguns mtodos comuns de amostragem no-probabilstica.
Amostragem No-probabilstica
Como disse antes, a amostragem por cotas comea com uma matriz descrevendo as
caractersticas da populao alvo. Por exemplo, voc deve saber qual proporo da
populao masculina e qual feminina; para cada sexo, saber qual proporo nas vrias
categorias de idade e assim por diante. Ao estabelecer uma amostra nacional por cotas,
voc deve saber qual proporo da populao nacional , digamos, urbana, do leste,
masculina, abaixo de vinte e cinco anos, branca, da classe operria, e outros semelhantes,
bem como todas as outras permutaes nessa matriz.
Aps a criao da matriz, com uma proporo relativa atribuda a cada clula,
colhe-se dados de pessoas com todas as caractersticas de uma dada clula. Todas as
pessoas nesta clula, ento, recebem um peso apropriado sua poro na populao total.
Quando todos os elementos da amostra estiverem ponderados assim, os dados como um
todo devem resultar numa representao razovel da populao total.
H vrios problemas inerentes amostragem por cotas. Primeiro, a moldura das
cotas (a proporo que as diferentes clulas representam) deve ser precisa, e muitas vezes
difcil obter informao atualizada para este fim. A falha do Gallup em prever a vitria de
Truman em 1948 deveu-se em parte a este problema.
Segundo, pode haver vieses na seleo dos elementos da amostra de uma clula,
mesmo que se estime com preciso sua proporo na populao. Um entrevistador instrudo
a entrevistar cinco pessoas que se encaixam num dado conjunto complexo de caractersticas
pode, ainda assim, evitar pessoas que moram nos andares de cima de um prdio com sete
andares de escadas, ou pessoas em habitaes muito precrias e/ou com ces ferozes.
Muitas vezes se usa uma variante da amostragem por cotas em conexo aos
GRUPOS FOCAIS na pesquisa de mercado. Nesta tcnica, grupos de aproximadamente
doze pessoas so, tipicamente, reunidos para discusses focalizadas sobre produtos ou
comerciais. Recomenda-se reunir vrios grupos de tipos diferentes de pessoas ou misturas
especificas de pessoas.
Confiana em Sujeitos Disponveis
Pesquisadores universitrios freqentemente fazem surveys com estudantes
matriculados em grandes salas de aula. A facilidade e baixo custo deste mtodo explica sua
popularidade, mas estes surveys raramente produzem dados com algum valor genrico.
Embora sirva finalidade de pr-testar um questionrio, este mtodo de amostragem no
deve ser usado para um estudo pretendendo descrever os alunos como um todo.
Parar pessoas numa esquina ou outro lugar quase nunca um mtodo de
amostragem adequado, embora seja empregado com demasiada freqncia, como no caso
de pesquisas de mercado em estacionamentos de supermercados. Este survey s se justifica
se voc quiser estudar as caractersticas de pessoas passando naquele ponto em particular
em horas determinadas.
O termo entrevista por interceptao em shoppings s vezes usado em referncia
a um survey no qual consumidores andando em shoppings so interceptados e solicitados a
participar. Obviamente, concebvel que tais respondentes potenciais seriam apropriados a
alguns surveys especficos - um estudo de consumidores daquele shopping, por exemplo.
Entretanto, nestes casos, outro problema de amostragem que a maior parte daqueles que
so abordados se recusa a participar. Mas, num estudo num shopping em Chicago, Hornik e
Ellis observaram que as taxas de resposta cresciam quando os entrevistadores olhavam e
grandes eventos que esto ocorrendo, falar com o maior nmero de participantes possvel, e
assim por diante. No entanto, obviamente ningum consegue observar tudo; alguma
seletividade inevitvel. Se tal seletividade for incontrolada, h o risco de reunir um
conjunto de observaes tendenciosas, tal como um pesquisador de survey inepto ao
selecionar uma amostra tendenciosa de entrevistados.
Embora no queira sugerir que todos os observadores participantes em todos os
lugares em todas as situaes de pesquisa devam buscar estabelecer mtodos de
amostragem rigorosos, estou convencido que um observador participante bem versado na
lgica e, talvez, em alguns dos mtodos da amostragem de survey tem maior probabilidade
de obter um conjunto representativo de observaes. Ao avaliar o humor de estudantes
reunidos para uma demonstrao de protesto, um observador participante deve ter o
cuidado de no falar apenas com os lderes da demonstrao, devendo considerar a possvel
diferena entre estudantes que aparentemente comparecem sozinhos e os que vo com
amigos, conversar com estudantes em locais diversos da reunio e procurar conversar com
os que chegam cedo e os que chegam atrasados. Embora o observador no tenha condies
de estratificar de forma rigorosa a amostra de entrevistados, ele pode ficar mais sensvel a
reparar diferenas relacionadas s variveis citadas, refinando as observaes de forma
correspondente.
Resumo
Este longo captulo buscou familiariz-lo com as consideraes mais importantes na
lgica da amostragem de survey e com as tcnicas mais comuns de amostragem. Esta
discusso no basta para equip-lo para cada situao de campo que voc enfrentar, mas
espero que uma compreenso da lgica da amostragem lhe permitir chegar a julgamentos
razoveis e seguros por conta prpria.
O captulo seguinte descreve quatro amostras de survey com as quais estou
intimamente familiarizado. Ao apresentar detalhes especficos destes desenhos de amostras
um tanto diferentes e das muitas decises tomadas na sua execuo, espero dar-lhe alguma
experincia concreta de amostragem. Repito que estes exemplos no podem ser exaustivos
em relao s situaes com as quais voc se deparar, mas eles foram escolhidos para
representar as situaes de amostragem mais comuns encontradas na pesquisa de survey.
Notas de Rodap
1) Para uma discusso recente, ver Peverill Squire, Why the 1936 Literary Digest
Poll Failed, Public Opinion Quarterly, vol. 52, primavera de 1988, pg. 125 - 133.
2) Citada na Newsweek, 8 de julho de 1968, pg. 24.
3) Logo veremos que o tamanho da amostra selecionada e as caractersticas reais
da populao maior afetam o grau de representatividade.
4) Leslie Kish, Survey Sampling (New York: John Wiley & Sons, 1965).
elementos produz uma definio de status social plenamente satisfatria para algum
pesquisador, muito menos para todos os pesquisadores.
Muitas vezes se diz que tais conceitos no especificados tm riqueza de
significado, no sentido de combinarem uma variedade de elementos, sumariando um
fenmeno complexo. Embora o termo status social evoque diferentes imagens para
pesquisadores diferentes, estas imagens provavelmente parecem a todos eles importantes e
significativas. Tais conceitos gerais devem ser especificados para a pesquisa emprica
rigorosa, ou seja, reduzidos a indicadores empricos especficos. A operacionalizao de
conceitos inevitavelmente insatisfatria, tanto para os pesquisadores quantos para suas
audincias. Em ltima anlise, conceitos ricos em significado devem ser reduzidos a
indicadores empricos simplificados e superficiais.
Penso que a maioria dos conceitos interessantes para os pesquisadores sociais no
tem significado real, nem definio ltima. Status social um bom exemplo. O conceito
geral de status social seguramente antigo. Embora no o tenham verbalizado em termos
abstratos, os primeiros humanos reconheceram que alguns deles tinham status social maior
do que outros. Alguns eram mais poderosos, alguns eram mais respeitados, e outros
recebiam maior autoridade sobre seus pares. O reconhecimento destas diferenas persistiu
no decorrer da histria humana. Max Weber extraiu muitas implicaes dessas diferenas.
Karl Marx derivou uma teoria da sociedade com base nelas. W. Lloyd Warner e outros
socilogos americanos dos anos 30 e 40 observaram as mesmas diferenas entre moradores
de pequenas cidades, e descobriram que membros de uma comunidade podiam identificar
os vizinhos com maior ou menor status social.
A existncia de diferenas de status entre membros de uma sociedade clara.
Ademais, tais diferenas parecem importantes para compreender outros aspectos da
sociedade. Em vista disso, o termo status social tem sido aceito como uma anotao
resumida do fenmeno. Mas o que realmente significa o termo status social? Uma vez
que apenas um termo para denotar um conceito geral, no tem significado ltimo. Por si,
status social s existe como uma assinalao conveniente para uma diversidade de
observaes empricas. Deste ponto de vista, nenhum pesquisador pode pesquisar status
social correta ou incorretamente; pode apenas fazer medies mais ou menos teis.
Neste sentido, os cientistas nunca coletam dados, eles criam dados. Esta idia
essencialmente o mesmo sentimento expresso pelo filsofo da cincia Alfred North
Whitehead, quando escreveu o seguinte:
A natureza recebe crdito pelo que deveria estar reservado para ns; a rosa
pelo seu perfume; o rouxinol pelo seu canto; e o sol pela sua radiao. Os
poetas esto totalmente enganados. Deviam enderear sua lrica para si
prprios, fazendo dela odes de auto-congratulao pela excelncia da mente
humana. A natureza assunto sem graa, sem som, sem cor; meramente o
apressar da matria, de forma interminvel e sem significado. (1)
Quando faz vrias perguntas e combina as respostas num ndice que chama de
classe social, voc criou uma medida de classe social; voc realmente criou um
agrupamento e uma hierarquia de classe social entre seus respondentes. Voc no
descobriu, apenas, um agrupamento e uma hierarquia que j existia, num sentido real.
Talvez as medidas criadas tenham utilidade, ajudando-o a entender os dados que
tem, ou ajudando-o a desenvolver teorias sobre classes sociais. Entretanto, no tem sentido
perguntar se voc realmente mediu classe social, num sentido vlido em ltima anlise,
porque o conceito s existe em nossas mentes.
A noo de que pesquisadores criam dados e no os coletam at mais fundamental
do que sugere o exemplo do status social. Nos primeiros dias da Segunda Guerra Mundial,
Hadley Cantril fez dois surveys nacionais do povo americano.(2) O desenho das amostras e
a checagem cruzada das suas caractersticas indicavam que ambos forneciam boas
estimativas da populao americana. Num dos surveys, foi perguntado aos respondentes Voc acha que os Estados Unidos conseguiro ficar fora da guerra? A maioria (55 % dos
que opinaram) disse sim. No outro survey, a pergunta foi - Voc acha que os Estados
Unidos entraro na guerra antes que ela termine? A maioria (59 % dos que opinaram)
disse sim.
Estes itens so muitas vezes citados como exemplo dos efeitos de perguntas
tendenciosas. Entretanto, sempre que mostrado a estudantes, eles perguntam - Qual
pergunta forneceu a resposta correta sobre as expectativas americanas quanto a entrar na
guerra? Esta pergunta no pode ser respondida. Podemos apenas concluir que, em 1939,
no havia algo como a atitude americana sobre a probabilidade de entrarmos na guerra.
Nenhuma porcentagem representava a proporo que realmente pensava que entraramos
na guerra. Portanto, no se podia coletar tais dados; podia-se apenas cri-los fazendo
perguntas, e a forma pela qual as perguntas eram feitas tinha um impacto sobre as respostas
recebidas.
Nunca conseguimos fazer medidas precisas, apenas medidas teis. Mas esta
suposio no deve ser tomada como justificativa para a anarquia cientfica. Pesquisa
rigorosa ainda possvel; simplesmente mais difcil do que se imagina. O resto deste
captulo ocupa-se da lgica e das habilidades requeridas na feitura de medidas teis.
Um Quadro de Referncias de Operacionalizao
Como sugere a discusso anterior, conceitos so codificaes gerais da experincia
e das observaes. Observamos pessoas vivendo em tipos diferentes de estruturas
residenciais e desenvolvemos o conceito de unidade residencial. Observamos diferenas em
posio social e desenvolvemos o conceito de status social. Notamos diferenas no grau de
compromisso religioso das pessoas e desenvolvemos o conceito de religiosidade.
Entretanto, imperativo reconhecer que todos estes conceitos so anotaes resumidas da
experincia e das observaes.
Na cincia, tais conceitos muitas vezes assumem a forma de VARIVEIS reunindo
uma coleo de ATRIBUTOS relacionados. Assim, o conceito de gnero resume dois
atributos distintos: masculino e feminino. Perodo escolar uma varivel composta pelos
atributos calouro e veterano. Filiao religiosa pode incluir atributos como protestante,
catlico, judeu, budista e assim por diante.
Muitos dos conceitos mais interessantes na cincia social representam VARIVEIS
ORDINAIS feitas de valores dispostos ao longo de uma DIMENSO. Por exemplo, o
conceito de status social implica uma hierarquia de valores como status elevado, status
mdio, status inferior, etc. Religiosidade, preconceito, alienao, sofisticao
intelectual, liberalismo e conceitos similares implicam tambm um conjunto de valores
hierarquizados.
A OPERACIONALIZAO o processo pelo qual pesquisadores especificam
observaes empricas que podem ser tomadas como indicadores dos atributos contidos
pessoas so muito religiosas e outras no religiosas; outras so anti-religiosas. Como antireligiosidade pode variar em intensidade, voc deve determinar a amplitude de variao
conceitual da varivel. Talvez optando por uma medida de religiosidade variando de baixa
a alta, agrupando os anti-religiosos e os que apenas no so positivamente religiosos. Ou
talvez estendendo a varivel de muito religioso a muito anti-religioso. Em qualquer caso, os
itens usados na medida devem basear-se na sua deciso sobre a amplitude. Considere o
seguinte exemplo de um item de questionrio:
Por favor, diga se voc concorda ou discorda da seguinte declarao: A religio
organizada causa mais mal do que bem.
Concordncia indicaria uma orientao anti-religiosa. Por outro lado, a discordncia
no indicaria necessariamente religiosidade. Embora as respostas certamente estejam
fortemente correlacionadas com medidas de religiosidade, o item propriamente dito no
mede religiosidade, apenas anti-religiosidade.
Este exemplo ilustra um problema comum na medida de dimenses. Ao invs de
medir uma varivel de baixo a alto, muitas vezes medimos dois polos opostos. Por
exemplo, raramente medimos graus de conservadorismo poltico, medindo ao invs
variaes entre liberalismo e conservadorismo. Num estudo sobre cincia e medicina, tentei
medir graus diversos de compromisso com perspectivas cientficas entre mdicos, mas me
vi constantemente envolvido em questes sobre perspectivas anti-cientficas. (4)
Este problema no tem soluo simples. Os interesses de pesquisa variam demais
para permitir a elucidao de regras adequadas de procedimentos. O nico conselho, agora,
realizar o exerccio demorado de listar todas as possveis subdimenses da varivel,
anotando as dimenses a serem excludas do conceito, e especificando os pontos
conceituais extremos da dimenso que descreve o conceito. Cada item do questionrio
examinado deve ser avaliado segundo estas decises. Voc deve se perguntar quais seriam
as implicaes de cada possvel resposta: como esta resposta reflete o conceito bsico?
Apenas atravs deste processo voc pode gerar dados relevantes para uma anlise posterior
significativa.
Tipos de Dados
O formato de pesquisa de survey gera vrios tipos de dados teis para a pesquisa
social, dos quais esta seo oferece uma viso geral.
Embora o captulo tenha comeado afirmando que os dados s existem atravs do
processo cientfico de ger-los, mesmo assim tem sentido ver alguns tipos de dados como
fatos. Por fatos, queremos dizer itens de informao que o respondente acredita
representarem a verdade e que voc, em geral, aceita como sendo verdade. As
caractersticas demogrficas dos respondentes se encaixam nesta categoria. Quando pede
aos entrevistados para indicarem seu sexo como masculino ou feminino, eles acreditam que
as respostas representam fatos indiscutveis, e voc os aceita como tal. O mesmo pode ser
dito das informaes sobre idade, raa, regio de origem, etc.
s vezes pede-se aos respondentes dar informaes que eles aceitam como
declaraes verdadeiras mas que voc no aceita necessariamente como tal. Por exemplo,
pode-se perguntar se Deus existe. Respondendo sim ou no, eles dizem o que acreditam ser
a verdade sobre o tema. J voc v estas respostas apenas como descries dos
se voc est analisando a relao entre duas variveis nominais, algumas tcnicas analticas
so inadequadas.
Ao mesmo tempo, importante compreender que uma varivel pode ser tratada de
forma diferente em termos dos nveis de medio. Lembre, por exemplo, que idade uma
medida de razo. Portanto, voc pode calcular uma equao de regresso associando idade
e altura (outra medida de razo). Mas, suponha que voc est estudando uma amostra de
estudantes variando de quatorze a vinte anos. Dentro desta faixa limitada, voc pode
aproveitar os intervalos iguais entre as idades mas no o carter de razo da varivel.
Noutro tipo de estudo, voc pode escolher juntar idades nas seguintes categorias: menos de
quarenta anos = jovem; quarenta a sessenta anos = meia idade; acima de sessenta = idoso.
Finalmente, idade pode ser convertida em medida nominal para certos fins. Respondentes
podem ser categorizados como membros do baby boom ps Segunda Guerra Mundial ou
no; podem ser categorizados como tendo nascido durante a Depresso dos anos 30 ou no.
(Outra medida nominal - baseada na data do nascimento e no na idade - a classificao
por signos astrolgicos.)
Ao desenhar o questionrio, considere o tipo de anlise que far aps a coleta dos
dados. Voc deve determinar se e como pode medir cada varivel, de forma a permitir a
anlise requerida. Se a anlise requer dados na forma de medidas de razo, voc no deve
construir seus questionrios de forma a criar apenas variveis nominais.
Guias para a Elaborao de Questes
Ao construir itens do questionrio, h vrias opes. A experincia passada dos
pesquisadores de survey fornece muitas diretrizes que podem ajud-lo a gerar dados teis
para anlise. Esta seo lida com os dois temas.
Questes e Declaraes
A pesquisa de survey habitualmente vista como fazer perguntas, mas o exame de
um survey tpico provavelmente mostrar tantas declaraes quanto perguntas. Isto tem
suas razes. Muitas vezes voc quer determinar o quanto os respondentes apoiam
determinada atitude ou perspectiva. Se for capaz de resumir a atitude numa declarao
curta, voc pode apresent-la aos respondentes e perguntar-lhes se concordam ou
discordam dela. Rensis Likert formalizou este procedimento com a ESCALA LIKERT, um
formato no qual solicita-se aos entrevistados concordar fortemente, concordar,
discordar, discordar fortemente ou aprovar fortemente, aprovar, etc.
Questes e declaraes podem ser usadas vantajosamente numa pesquisa de survey.
O uso de ambas d mais flexibilidade ao desenho dos itens e pode tornar o questionrio
mais interessante.
Perguntas Abertas e Fechadas
H duas opes para fazer perguntas. Voc pode fazer perguntas ABERTAS,
solicitando aos respondentes darem suas prprias respostas. Por exemplo, pode perguntar
Qual tema voc considera mais importante para o pas hoje?, dando espao para escrever
a resposta (ou solicitando resposta verbal ao entrevistador).
Com freqncia, os pesquisadores pedem uma resposta nica para uma combinao
de perguntas. Esta situao parece ocorrer com mais freqncia quando o pesquisador se
identifica pessoalmente com uma posio complexa. Por exemplo, voc pode pedir aos
respondentes para concordar ou discordar da declarao Os Estados Unidos devem
abandonar seu programa espacial e gastar dinheiro com programas domsticos. Embora
muitas pessoas concordem e outros discordem de forma inequvoca desta declarao, outros
no conseguem responder. Alguns podem querer abandonar o programa espacial e devolver
o dinheiro aos contribuintes. Outros podem querer continuar com o programa espacial e
tambm aplicar mais dinheiro em programas domsticos. Estes ltimos no podem
concordar nem discordar da declarao.
Como regra geral, sempre que a palavra e aparece numa pergunta ou declarao,
voc deve checar se no est fazendo uma pergunta dupla.
Garantindo a Competncia dos Entrevistados em Responder
Ao pedir informaes, voc deve sempre se perguntar se os respondentes so
capazes de faz-lo de forma confivel. Num estudo sobre a criao de crianas, voc pode
pedir aos respondentes para informar a idade em que as crianas primeiro responderam
aos pais. Alm do problema de definir o que responder aos pais, duvidoso que a
maioria se lembre isso com preciso.
Em outro exemplo, lderes estudantis governamentais ocasionalmente pedem aos
seus constituintes para indicar como as mensalidades dos alunos devem ser gastas.
Tipicamente, pede-se aos respondentes para indicar qual porcentagem dos fundos
disponveis deve ser gasta numa longa lista de atividades. Sem um bom conhecimento da
natureza destas atividades e dos custos de cada uma, eles no tm como dar respostas com
sentido. (Custos administrativos recebero pouco apoio, embora esta categoria seja
essencial para o programa como um todo).
Um grupo de pesquisadores que pesquisava a experincia ao volante de
adolescentes insistia em fazer uma pergunta aberta quanto ao nmero de quilmetros
dirigidos desde o momento da habilitao. Embora os consultores advertissem que poucos
motoristas estimariam esta informao com alguma preciso, a pergunta foi feita assim
mesmo. Alguns adolescentes afirmaram haver dirigido centenas de milhares de
quilmetros.
Fazendo Perguntas Relevantes
Da mesma forma, as perguntas devem ser relevantes para a maioria dos
respondentes. Quando se pede atitudes sobre um tema sobre o qual poucos pensam ou se
importam, os resultados tm pouca possibilidade de serem teis. Ademais, os respondentes
podem expressar atitudes mesmo nunca tendo pensado sobre o assunto, e voc corre o risco
de se equivocar.
Este ponto evidenciado quando pesquisadores pedem respostas sobre pessoas e
temas fictcios. Numa pesquisa de opinio que fiz para um candidato, perguntei aos
respondentes se conheciam quinze figuras polticas da comunidade. Como exerccio
metodolgico, inventei um nome: Tom Sakumoto. 9 % dos respondentes disseram que o
conheciam. Destes, metade relatou t-lo visto na televiso e lido sobre ele nos jornais.
Validade
No uso convencional, a VALIDADE se refere ao grau com que uma medida
emprica reflete adequadamente o significado real do conceito considerado. A primeira
considerao sobre a VALIDADE APARENTE. Certas medidas empricas podem ou no
coincidir com nossos convenes e imagens mentais associadas a um conceito. Podemos
discutir quanto adequao de medir religiosidade atravs de comparecimento igreja,
mas concordaramos que ir igreja tem pelo menos alguma relevncia para a religiosidade.
Segundo, os pesquisadores chegaram a acordos concretos sobre a melhor forma de
medir alguns conceitos. O Bureau do Recenseamento, por exemplo, criou definies
operacionais de conceitos como famlia, residncia e status empregatcio que parecem ter
validade operacional na maioria dos estudos que usam aqueles conceitos.
Edward Carmines e Richard Zeller8 discutem trs tipos adicionais de validade:
validade relacionada a critrio, validade de contedo e validade de construo. A
VALIDADE RELACIONADA A CRITRIO s vezes chamada de validade preditiva e
baseia-se em algum critrio externo. Por exemplo, a validade do conselho de faculdade
evidenciada por sua capacidade de prever o sucesso dos alunos. A validade de um teste
escrito para motoristas evidenciada pela relao entre as notas que as pessoas obtm no
teste e sua competncia para dirigir. Nestes exemplos, sucesso escolar e competncia ao
volante so os critrios. Em geral, o comportamento pode servir como padro da validade
de critrio para muitas medidas de atitude em pesquisa social (p. ex., pessoas
preconceituosas de fato discriminam contra as minorias?), embora a relao entre atitudes
e comportamento seja tambm assunto importante de estudo por si prpria.
A VALIDADE DE CONTEDO refere-se ao grau com que uma medio cobre a
amplitude de significados includos no conceito. Por exemplo, um teste de capacidade
matemtica no pode se limitar apenas adio, tambm precisando cobrir a subtrao, a
multiplicao, a diviso, etc. Em outro exemplo, se dizemos que estamos medindo
preconceito em geral, nossas medidas refletem o preconceito contra grupos raciais e
tnicos, minorias religiosas, mulheres, idosos, etc.?
Finalmente, a VALIDADE DE CONSTRUO baseia-se no modo como uma
medida se relaciona a outras variveis num sistema de relaes tericas. Por exemplo,
suponha que voc quer estudar as fontes e conseqncias da satisfao conjugal,
desenvolva uma medida de satisfao conjugal e deseje avaliar sua validade. Alm da
medida, voc ter desenvolvido tambm certas expectativas tericas sobre como a varivel
satisfao conjugal se relaciona a outras. Por exemplo, voc pode ter concludo que
maridos satisfeitos tm menos probabilidade de espancarem suas mulheres do que maridos
no satisfeitos. Se sua medida de satisfao conjugal se relaciona ao espancamento de
mulheres da forma esperada, este resultado constitui evidncia da validade de construo da
sua medida. Mas, se maridos satisfeitos e insatisfeitos tiverem igual probabilidade de
espancar suas mulheres, este resultado desafiar a validade da sua medida.
Tenso entre Confiabilidade e Validade
Com rodap destas discusses, deve ser assinalado que muitas vezes h uma certa
tenso entre os critrios de confiabilidade e validade. Muitas vezes parece que fazemos uma
troca entre as duas.
A maioria dos conceitos realmente interessantes que queremos estudar tem muitas
nuanas sutis, e difcil especificar precisamente o que queremos dizer com eles. Os
pesquisadores muitas vezes falam desses conceitos como tendo riqueza de significado. Se
voc duvida, tente criar definies satisfatrias e medidas para conceitos como preconceito,
satisfao, alienao, religiosidade e liberalismo.
Entretanto, a cincia precisa ser especfica para poder gerar medies confiveis.
Portanto, com muita freqncia, a especificao de definies operacionais e medies
confiveis parece roubar de tais conceitos a riqueza de significado. Religiosidade mais do
que freqentar a igreja; preconceito mais do que a expresso de uma atitude
preconceituosa num questionrio. Esta situao um dilema persistente e inevitvel para o
pesquisador, e voc estar bem preparado para isso se estiver de sobreaviso. Esteja
preparado e lide com isso. Se voc no chegar a um acordo claro sobre como medir um
conceito, mea-o de vrias formas diferentes. Se o conceito tiver vrias dimenses
diferentes, mea todas. Acima de tudo, saiba que o conceito no tem qualquer significado
alm daquele que voc lhe atribuiu, e que a nica justificativa para dar um significado
particular a um conceito a utilidade. A meta medir conceitos de forma a nos ajudar a
entender o mundo que nos cerca.
Formato Geral dos Questionrios
O formato de um questionrio pode ser to importante quanto a natureza e a redao
das perguntas. Um questionrio mal formatado pode levar os respondentes a saltar
perguntas, confundi-las quanto natureza dos dados pedidos e, no limite, lev-los a jog-lo
fora. Vamos sugerir diretrizes tanto gerais quanto especficas.
Como regra geral, o questionrio deve estar bem distribudo e no amontoado. Voc
deve maximizar o espao em branco. Pesquisadores inexperientes tendem a temer que
seus questionrios possam parecer muito longos e, por isso, apertam vrias perguntas na
mesma linha, abreviam perguntas, e tentam usar o menor nmero de pginas possvel. Tudo
isso desaconselhvel e mesmo perigoso. Mais de uma pergunta por linha levar as
pessoas a saltarem a segunda. Abreviar perguntas resulta em ms interpretaes. Em geral,
se os respondentes observarem que terminaram rapidamente as primeiras pginas de um
questionrio que, a princpio, parecia longo, se sentiro menos desmoralizados do que se
tiverem gasto um longo tempo na primeira pgina do que parecia um questionrio curto.
Ademais, cometero menos erros e no sero forados a reler perguntas confusas e
abreviadas, nem tero sido forados a escrever uma resposta longa em espao pequeno.
No h como exagerar a valia de espalhar as perguntas num questionrio.
Questionrios espremidos so desastrosos, seja em surveys por correio ou por entrevistas.
Formatos para Respostas
H vrios mtodos para apresentar uma srie de categorias para o respondente
marcar em resposta a uma pergunta. Minha experincia diz que caixas espaadas
adequadamente so a melhor escolha. Se o questionrio for composto em tipografia ou
formatado num bom sistema de processamento de textos, as caixas podem ser geradas de
forma fcil e limpa. Tambm possvel fazer caixas numa mquina de escrever.
Se o questionrio for datilografado em mquina de escrever com chaves, caixas
excelentes podem ser produzidas com uma chave esquerda, um espao e uma chave direita:
Formatos de Respostas
[ ] Sim
[ ] No
[ ] No sei
( ) Sim
( ) No
( ) No sei
1. Sim
2. No
3. No sei
Questes Contingentes
Muitas vezes, na pesquisa de survey, certas perguntas sero claramente relevantes
apenas para um subconjunto de respondentes. Voc pode perguntar-lhes se esto
familiarizados com certo assunto, e depois perguntar aos que responderem sim o que
pensam a respeito. Voc pode querer saber o status de recrutamento de jovens, sabendo que
apenas homens tero este status. Ou voc pode perguntar se o respondente pertence a uma
certa organizao e, se a resposta for positiva, se j tiveram algum cargo nela.
A segunda pergunta em cada exemplo denominada PERGUNTA
CONTINGENTE, significando que a segunda pergunta contingente quanto resposta
primeira. Portanto, a pergunta sobre atitude quanto a determinada questo contingente
familiaridade do respondente com ela.
O uso apropriado de perguntas contingentes pode facilitar a tarefa de responder um
questionrio e tambm melhorar a qualidade dos dados produzidos. A alternativa s
perguntas contingentes deve ser evitada pelas mesmas razes. No pergunte Se alguma
vez pertenceu APP, voc j teve algum cargo nela? Este formato forar todos os
respondentes a ler a pergunta, embora seja irrelevante para muitos. Aqueles para quem a
pergunta irrelevante sero forados a decidir se saltam a pergunta, escrever no se
aplica, responder no, ou jogar fora o questionrio. (Esta ltima escolha bastante
comum.)
H vrios formatos de perguntas contingentes. Acho que o melhor aquele em que
as perguntas contingentes so recuadas no questionrio, postas em caixas e conectadas
pergunta base por setas a partir das respostas apropriadas. A Figura 7-2 ilustra uma destas
perguntas. Usados adequadamente, conjuntos complexos de perguntas contingentes podem
ser construdos sem confundir o respondente, como ilustrado na Figura 7-3.
Embora os exemplos acima se refiram primariamente a questionrios autoadministrados, a apresentao apropriada de perguntas contingentes ainda mais
importante em questionrios por entrevistas. O respondente num questionrio pelo correio
pode, mesmo com certa insatisfao, reler a pergunta, mas se o entrevistador ficar confuso
e fizer perguntas imprprias, toda a entrevista ficar prejudicada.
Questes Matriciais
Com freqncia, voc far vrias perguntas com o mesmo conjunto de categorias de
respostas. Este o caso tpico sempre que categorias de respostas do tipo Likert forem
usadas. Em tais casos, muitas vezes possvel construir uma QUESTO MATRICIAL,
como ilustrado na Figura 7-5.
Este formato tem numerosas vantagens. Primeiro, usa espao de forma eficiente.
Segundo, os respondentes provavelmente acharo mais rpido completar um conjunto de
perguntas apresentadas desta forma. Terceiro, o formato pode facilitar a comparabilidade
das respostas dadas a perguntas diferentes tanto para o entrevistado como para o
pesquisador. Como os respondentes podem rever rapidamente suas respostas a itens
anteriores neste conjunto, podem escolher entre, digamos, concorda fortemente e
concorda com uma declarao, comparando a fora da concordncia com as respostas
anteriores.
Instrues Gerais
Todo questionrio auto-administrado deve comear com instrues bsicas sobre o
preenchimento. Embora muitos respondentes estejam familiarizados com tcnicas de survey
normais, til comear instruindo-os a indicar as respostas a certas perguntas com uma
marca ou um X na caixa ao lado da resposta apropriada, ou escrevendo as respostas
quando solicitados. Se muitas questes abertas forem usadas, os respondentes devem ser
orientados sobre o tamanho esperado das respostas. Se voc encorajar respostas escritas,
permitindo elaborar respostas a questes fechadas, deve assinalar esta possibilidade.
Introdues
Se um questionrio est ordenado em subsees por contedos - por exemplo,
atitudes polticas, atitudes religiosas, dados bsicos - til introduzir cada seo com uma
declarao curta sobre seu contedo e finalidade. Eis um exemplo de introduo possvel:
Nesta seo, gostaramos de saber quais problemas comunitrios as pessoas por aqui
consideram os mais importantes. Itens demogrficos no fim de um questionrio autoadministrado podem ser introduzidos assim: Finalmente, gostaramos de saber um pouco
sobre voc para podermos ver o que diferentes tipos de pessoas acham sobre o temas que
estivemos examinando.
Introdues curtas como estas ajudam o respondente a dar sentido ao questionrio, e
o tornam menos catico, particularmente quando ele aborda uma variedade de dados.
Tambm ajudam a pr o respondente no contexto mental apropriado para responder as
perguntas.
Instrues Especficas
Algumas perguntas podem requerer instrues especiais para facilitar a resposta
adequada, especialmente se uma pergunta difere das instrues gerais ao questionrio como
um todo. Alguns casos especficos ilustram esta situao.
Apesar de ser desejvel ter categorias de respostas mutuamente excludentes em
questes fechadas, muitas vezes mais de uma resposta se aplicar a alguns respondentes. Se
voc quiser uma resposta nica, deve deix-lo bem claro na pergunta. Por exemplo, Na
lista abaixo, marque por favor a razo principal da sua deciso de freqentar a faculdade.
Muitas vezes a pergunta principal pode ser seguida de uma nota entre parnteses, por
exemplo, Por favor, marque a melhor resposta. Se, por outro lado, voc quer que o
entrevistado marque tantas respostas quanto for o caso, tambm deve deixar isto claro.
Quando um conjunto de categorias de respostas tiver de ser ordenado pelo
respondente, as instrues devem deix-lo claro, e um tipo diferente de formato de
respostas deve ser usado (por exemplo, espaos vazios ao invs de caixas). As instrues
devem indicar quantas respostas devem ser ordenadas (por exemplo, todas, a primeira e a
segunda, a primeira e a ltima, a mais e a menos importante) e qual a ordem de hierarquia
(por exemplo, Coloque um 1 ao lado da mais importante, um 2 ao lado da segunda mais
importante, e assim por diante).
Ordenar uma lista de itens muitas vezes difcil para os respondentes, porque talvez
tenham de ler a lista vrias vezes. Alm disso, em geral se consegue os mesmos resultados
pedindo para valorar os itens (por exemplo, Muito importante, Importante, etc.). Como
(1) Alfred North Whitehead, Science and the Modern World (New York: The Macmillan
Company, 1925), pg. 56.
(2) Citado em Claire Selltiz, et al., Research Methods in Social Relations, New York:
Holt, Rinehart & Winston, 1959), pg. 564.
(3) Charles Y. Glock e Rodney Stark, Religion and Society in Tension (Chicago: Rand
McNally, 1965), pgs. 18-38.
(4) Earl Babbie, Science and Morality in Medicine (Berkeley: University of California
Press, 1970).
(5) Encontra-se um tratamento excelente deste tema em James A. Davis, Elementary
Survey Analysis (Englewood Cliffs, NJ: Prentice-Hall, 1971), pgs. 9 e ss. A maioria dos
tratamentos destes nveis de medio usam o termo escala (ex., escala nominal), seguindo
o exemplo de S. S. Stevens, On the Theory of Scales os Measurement, Science, vol. 103
(1946), pgs. 677-680. Como este livro usa o termo escala em sentido diferente (ver captulo
8), evitamos seu uso neste contexto.
(6) George F. Bishop, Alfred J. Tuchfarber e Robert W. Oldendick, Opinions on Fictitious
Issues: The Pressure to Answer Survey Questions, Public Opinion Quaterly, vol. 50
(Summer 1986), pgs. 240-250.
(7) Tom Smith, That Which We Call Welfare by Any Other Name Would Smell Sweeter,
Public Opinion Quaterly, vol. 51 (Spring 1987), pgs. 75-83.
(8) Edward G. Carmines e Richard A. Zeller, Reliability and Validity Assessment
(Beverly Hills, CA: Sage, 1979.
(9) Jon A. Krosnick e Duane F. Alwin, A Test of the Form-resistant Correlation
Hypothesis: Ratings, Rankings, and the Measurement of Values, Public Opinion Quaterly,
vol. 52 (Winter 1988), pgs. 526-538.
(10) Um roteiro no seria apropriado para uma entrevista no estruturada, num estudo
exploratrio. Neste caso, o entrevistador deve receber um esboo dos temas a cobrir, e
talvez um conjunto de questes possveis.