Pesquisa de Levantamento Floyd J Fowler JR Compress

4ª edição
Pesquisa de
levantamento
Floyd J. Fowler Jr.
Sobre o Autor
Floyd J. Fowler, Jr., é graduado pela Wesleyan University e PhD pela University of
Michigan em 1966. É Senior Research Fellow do Center for Survey Research da University
of Massachusetts Boston desde 1971. Foi diretor do Center por 14 anos. Dr. Fowler é o
autor (ou coautor) de quatro livros-texto sobre pesquisa de levantamento, bem como
de inúmeros trabalhos de pesquisa e monografias. Seu recente trabalho se focou nos
estudos da formulação de questões e nas técnicas de avaliação da pesquisa de métodos
de levantamento aos estudos de tratamentos médicos.
F785p Fowler, Floyd J., Jr.

Pesquisa de levantamento [recurso eletrônico] / Floyd J.
Fowler, Jr. ; tradução: Rafael Padilha Ferreira ; revisão técnica:
Dirceu da Silva. – 4. ed. – Dados eletrônicos. – Porto Alegre :
Penso, 2011.
Editado também como livro impresso em 2011.

ISBN 978-85-63899-20-0
1. Pesquisa científica – Métodos de pesquisa. I. Título.
CDU 001.891
Catalogação na publicação: Ana Paula M. Magnus – CRB 10/2052

Floyd J. Fowler, Jr.
University of Massachusetts Boston
Pesquisa de
levantamento
Tradução:
Rafael Padilha Ferreira
Consultoria, supervisão e revisão técnica desta obra:
Dirceu da Silva
Doutor em Educação pela Universidade de São Paulo.
Professor na Universidade Estadual de Campinas.
Versão impressa
desta obra: 2011
2011
Obra originalmente publicada sob o título
Survey Research Methods, 4th Edition.
ISBN 978-1-4129-5841-7
© 2009, Sage Publications, Inc.
Sage Publications are the original publishers in the United States,
London and New Delhi. Sage Publications são editores do título original.
This translation is published by arrangement with Sage Publications.
Tradução autorizada por acordo firmado com Sage Publications.
Capa: Paola Manica
Leitura final: Marcos Vinícius Martim da Silva
Editora sênior – Ciências Humanas: Mônica Ballejo Canto
Editora responsável por esta obra: Carla Rosa Araujo
Editoração eletrônica: Formato Artes Gráficas
Reservados todos os direitos de publicação, em língua portuguesa, à

ARTMED® EDITORA S.A.
Av. Jerônimo de Ornelas, 670 – Santana
90040-340 Porto Alegre RS
Fone (51) 3027-7000 Fax (51) 3027-7070
É proibida a duplicação ou reprodução deste volume, no todo ou em parte,

sob quaisquer formas ou por quaisquer meios (eletrônico, mecânico, gravação,
fotocópia, distribuição na Web e outros), sem permissão expressa da Editora.
SÃO PAULO
Av. Embaixador Macedo Soares, 10.735 – Pavilhão 5 – Cond. Espace Center
Vila Anastácio 05095-035 São Paulo SP
Fone (11) 3665-1100 Fax (11) 3667-1333
SAC 0800 703-3444
IMPRESSO NO BRASIL
PRINTED IN BRAZIL
Sumário
Prefácio................................................................................................... 7
1 Introdução.......................................................................................... 11
2 Tipos de erros em levantamentos..................................................... 22
3 Amostragem...................................................................................... 30
4 Ausência de resposta: implementando um projeto de amostra...... 64
5 Método de coleta de dados.............................................................. 87
6 Formulando questões para que sejam boas medidas..................... 108
7 Avaliando questões e instrumentos de levantamento...................... 140
8 Entrevista de levantamento............................................................... 155
9 Preparando os dados do levantamento para análise....................... 177
10 Analisando os dados do levantamento............................................. 188
11 Problemas éticos em pesquisas de levantamento........................... 196
12 Fornecendo informações sobre os métodos de levantamento........ 204
13 Erros de levantamento em perspectiva............................................ 209
Referências............................................................................................. 217
Índice onomástico.................................................................................. 225
Índice remissivo..................................................................................... 228
Esta página foi deixada em branco intencionalmente.
Prefácio
O objetivo desta quarta edição de Pesquisa de levantamento, bem

como de seus predecessores, é produzir um resumo dos conceitos básicos
e do conhecimento atual acerca da fonte dos erros em levantamentos para
aquelas pessoas que não são profissionais da estatística ou da metodolo-
gia. Os levantamentos são fundamentalmente o fato de perguntar a uma
amostra de pessoas de uma população um conjunto de perguntas e usar as
respostas para descrever tal população. Aspectos tais como a seleção de
amostras, as perguntas elaboradas e os procedimentos utilizados para co-
letar os dados têm o potencial de afetar a probabilidade de o estudo atin-
gir seus objetivos. Se alguém se encarregar de um levantamento ou usar
dados coletados por terceiros, é importante entender essas questões e
como elas afetam os resultados da pesquisa. Os leitores irão compreender
isso quando terminarem a leitura deste livro.
Esforços consideráveis foram feitos para tornar esta obra acessível ao
público geral. Apesar de a familiaridade com pesquisa em ciência social e
com conceitos de estatística ser algo importante, nenhum conhecimento es-
pecial deve ser necessário para compreender o material contido neste livro.
Esta obra também foi concebida para ser comparativamente breve.
Escolhas foram feitas acerca do nível de profundidade dada aos vários
tópicos. Por todo o livro há sugestões de leituras complementares para
aqueles interessados em ir além do nível introdutório.
8 Floyd J. Fowler Jr.
NOVIDADES DA QUARTA EDIÇÃO
Esta edição contém dois novos capítulos que não estavam nas edi-
ções anteriores. Erros em levantamentos são potencialmente confusos
porque há, pelo menos, quatro tipos diferentes destes e a metodologia
de pesquisa usada para minimizá-los. Quando eu ensinava metodologia
de pesquisa, normalmente dedicava uma aula exclusiva para o tópico so-
bre a natureza dos erros. Nas edições anteriores, tais conceitos eram dis-
tribuídos pelo livro de acordo com sua relevância. O novo Capítulo 2,
“Tipos de erro em levantamentos”, introduz esses conceitos agora.
De forma parecida, as implicações do projeto da amostra e da ausên-
cia de resposta para a análise dos dados da pesquisa foram discutidas de
acordo com sua relevância ao longo das primeiras edições. Uma vez que es-
sas questões normalmente são abordadas depois que os dados foram coleta-
dos, o novo Capítulo 10, “Analisando os dados do levantamento”, concentra
a discussão de como abordar essas questões durante a análise, depois que
todos os tópicos sobre coleta de dados foram abordados.
Nos seis anos desde que a terceira edição foi publicada, um dos maio-
res problemas que surgiu na metodologia de pesquisa é sobre o futuro au-
mento das entrevistas por telefone como a principal forma de coleta de da-
dos acerca de populações gerais. Ao mesmo tempo, há um maior esforço em
tentar entender como usar a internet de forma mais efetiva. Tais meios são
trabalhos em desenvolvimento enquanto esta edição é concluída, mas ela
reflete o esforço de colocá-los em perspectiva, mesmo sabendo que práticas
continuarão sendo desenvolvidas. Além disso, é claro, esta edição integra
novos estudos e publicações dos últimos seis anos.
AGRADECIMENTOS
Finalmente, fazer justiça às pessoas que contribuíram para fazer deste

livro o que é fica cada vez mais difícil, já que a lista inevitavelmente cresce a
cada edição. Ainda penso que é apropriado começar com as três pessoas que
provavelmente têm o maior efeito sobre o meu entendimento quanto aos
métodos de pesquisa de levantamento: Robert Kahn, Morris Axelrod e Char-
les Cannel. Em muitos aspectos, a tarefa do livro é reunir e resumir o que
outras pessoas escreveram e aprenderam, assim, as referências e, em parti-
cular, as sugestões de leituras complementares foram fundamentais. Contu-
do, o nome de Robert Groves é provavelmente tão encontrado quanto ne-
Pesquisa de levantamento 9
nhum outro nesta edição, o que certamente reflete sua ampla e variada con-
tribuição para o campo da pesquisa de levantamento.
Também gostaria de agradecer especificamente a Tony Roman,
Mary Ellen Colten, Trish Gallangher e Dragana Bolcic-Jankovic por suas
revisões e por seus comentários úteis em vários capítulos. Gostaríamos
de agradecer aos revisores Mark Berends, Vanderbilt University; Adam
Berinsky, Massachusetts Institute of Technology; Amie L. Nielson, Uni-
versity of Miami; e Patric R. Spence, Western Kentucky University, que fi-
zeram comentários sobre a edição anterior, colaborando, assim, com a
formulação da presente edição. O Center for Survey Research prestou
serviços de apoio. Judy Chambliss, como sempre, teve um papel crucial,
ajudando-me a manter a saúde mental que este esforço exigiu. Agradeço
a esses e a outros por suas contribuições, mas a responsabilidade do pro-
duto final, boa ou ruim, é basicamente minha.
Jack Fowler
Introdução 1
Este livro versa sobre padrões e procedimentos práticos para levantamentos

feitos a fim de fornecer descrições estatísticas de pessoas por meio de pergun-
tas, normalmente aplicadas em uma amostra. Pesquisa abrange amostra-
gem, com formulação de questões e com métodos de coleta de dados. Aqueles
que querem coletar, analisar ou ler sobre dados de pesquisa aprenderão
como os detalhes de cada aspecto de uma pesquisa podem afetar sua exati-
dão, sua precisão e sua credibilidade.
O assunto deste livro é a coleta de dados em pesquisas sociais. Isso in-

clui os procedimentos comuns, os padrões para boa prática e as implicações
das diversas decisões de projetos para a qualidade do levantamento de da-
dos. A proposta deste livro é fornecer uma base sólida para a avaliação dos
procedimentos de coleta de dados para aqueles que querem coletar, analisar
ou ler sobre dados de pesquisa. Os leitores virão a entender as formas pelas
quais os detalhes da coleta de dados estão relacionados com a confiança que
se pode ter em números e estatísticas baseados em levantamentos.
Existem vários processos de coleta de dados e de medidas que são
chamados de levantamento. Este livro foca naquelas pesquisas que têm
as seguintes características:
• O objetivo do levantamento é produzir estatísticas, isto é, descri-
ções quantitativas ou numéricas sobre alguns aspectos de uma
população.
• A principal forma de coletar informação é por meio de perguntas
feitas às pessoas; suas respostas constituem os dados a serem ana-
lisados.
• Em geral, a informação é coletada apenas sobre uma fração da po-

pulação, isto é, uma amostragem, e não sobre cada membro dela.
RAZÕES PARA LEVANTAMENTOS
Na constituição dos Estados Unidos, está especificado que uma pes-

quisa que siga os critérios aqui citados deve ser realizada a cada 10 anos.
No censo decenal, estatísticas sobre uma população são produzidas por
meio de perguntas feitas às pessoas. Nenhuma amostragem, contudo, está
envolvida; os dados são coletados sobre casa pessoa da população.
O propósito do censo decenal é contar as pessoas como a base
para garantir uma representação apropriada na House of Representatives*.
O censo, contudo, também se tornou a maior fonte de informação para
vários outros propósitos. Além de simplesmente contar, ele coleta dados
sobre raça, idade, composição familiar, educação, tipo de habitação e vá-
rias outras características.
O conteúdo do censo decenal expandiu-se para atender às necessi-
dades dos órgãos governamentais e dos pesquisadores por dados descri-
tivos. Isso, contudo, cobre apenas uma pequena parte do que se quer sa-
ber sobre as populações, e seu valor é limitado porque ocorre apenas
uma vez por década. Para fornecer dados que preencham essas lacunas
de informação, pesquisas com finalidade específica tornaram-se parte
predominante da vida americana desde a década de 1930.
A maioria das pessoas está familiarizada com três usos das técni-
cas de pesquisa: a medição da opinião pública para artigos de jornais e
revistas, a medição do ponto de vista político e das opiniões para ajudar
os candidatos nas eleições, e as pesquisas de mercado, destinadas a des-
cobrir as preferências e os interesses do consumidor. Cada um desses
programas bem desenvolvidos de pesquisa de levantamento é destinado
principalmente a escutar os sentimentos subjetivos do público. Há, além
disso, numerosos fatos sobre comportamentos e sobre situações que só
podem ser obtidos por meio de perguntas feitas a uma amostra de pessoas
sobre elas mesmas. Provavelmente não há área de políticas públicas a
que a metodologia de pesquisa de levantamento não tenha sido aplicada.
A seguir, há uma lista abreviada de algumas das principais aplicações:
*
N. de T.: The House of Representatives é a maior e menos poderosa parte do Congresso
dos Estados Unidos. É a organização que faz as leis naquele país. Podemos compará-la
com as câmaras de deputados.
• Taxas de desemprego, conforme divulgadas rotineiramente pelo

Bureau of Labor Statistics*, bem como várias outras estatísticas
sobre empregos e trabalho, são baseadas em pesquisas domicilia-
res realizadas pela Bureau of the Census**. Pesquisas paralelas
sobre atividade comercial e industrial são realizadas para descre-
ver a produção e a necessidade de mão de obra.
• O rendimento das pessoas e a forma como elas gastam seu di-
nheiro constitui outra área na qual apenas levantamentos podem
fornecer dados confiáveis. Os padrões de gastos dos consumido-
res e suas expectativas revelaram-se importantes na previsão das
tendências na economia.
• A National Health Interview Survey*** vem sendo realizada pela
Bureau of the Census para o National Center for Health Statistics
desde o final da década de 1950. Essa pesquisa coleta dados bá-
sicos sobre condições de saúde, sobre o uso dos serviços de saú-
de e sobre os comportamentos que afetam o risco de doenças.
Todos esses são tópicos para os quais apenas bons levantamentos
podem fornecer dados adequados.
• A principal fonte de dados sobre eventos criminais vem sendo tradi-
cionalmente os registros do departamento de polícia. Os registros
policiais, contudo, incluem apenas as ocorrências que são informa-
das pelas pessoas à polícia. Para a maioria dos crimes envolvendo
vítimas, as pesquisas fornecem medidas mais confiáveis das taxas
de ocorrência dos crimes e das características das vítimas. O Levan-
tamento Nacional do Crime foi lançado na década de 1970 para
fornecer tais dados. Além disso, os levantamentos são a única forma
de medir as preocupações e os medos das pessoas sobre o crime.
• Uma das solicitações de levantamentos mais antigas é do Ministério
da Agricultura dos Estados Unidos. O Ministério entrevista agricul-
tores para estimar a taxa na qual diferentes culturas (crops) serão
plantadas e para prever a disponibilidade de produtos alimentícios.
*
N. de T.: The Bureau of Labor Statistics é uma agência de pesquisa do Ministério do Tra-
balho dos Estados Unidos que compila estatísticas sobre horas de trabalho, sobre índices
de emprego e desemprego, sobre preços ao consumidor e sobre outras variáveis.
**
N. de T.: The Bureau of the Census é a agência governamental responsável pelo censo
nos Estados Unidos.
***
N. de T.: O National Health Interview Survey é uma entrevista familiar administrada
pelo National Center for Health Statistics (NCHS), que é a principal fonte de informa-
ções sobre a saúde da população dos Estados Unidos.
• A saúde mental, as necessidades de transporte e padrões de uso,

o comportamento político, as características de habitação, bem
como seu custo e sua adequação às necessidades familiares e a
satisfação do trabalhador são outros exemplos de áreas nas quais
levantamentos são amplamente utilizados. O maior coletor de
dados de pesquisa nos Estados Unidos é indubitavelmente o go-
verno federal, particularmente a Bureau of Census e o Ministério
da Agricultura. Além disso, milhares de pesquisas são feitas a
cada ano por universidades, sem fins lucrativos, e por organiza-
ções de pesquisa que oferecem seus serviços.
Patrocinar a coleta de dados de uma pesquisa com um objetivo

específico é uma solução um tanto cara para um problema de informa-
ção. Antes de empenhar tal esforço, deve-se explorar a fundo a possibi-
lidade de colher a mesma informação em registros existentes ou de ou-
tras fontes. Embora algumas pessoas pensem em um levantamento co
mo primeiro esforço para tentar estudar alguma coisa sobre uma popu-
lação, um estudo de amostragem deve ser realizado apenas depois de
ser garantido que a informação não pode ser obtida de outras formas.
Mesmo tendo uma abordagem conservadora, é comum achar que ape-
nas uma pesquisa com objetivo específico pode fornecer as informações
necessárias. Além de atender as necessidades de dados que não estão
disponíveis em outro lugar, há três propriedades potenciais dos dados
de uma levantamento corretamente feito que devem fazê-los preferíveis
aos dados de outras fontes:
• A probabilidade da amostragem permite ter a confiança de que a
amostra não é tendenciosa e estimar quão precisas podem ser as
informações. Dados advindos de uma amostra corretamente es-
colhida são muito melhores do que os de uma amostra composta
por aqueles que comparecem a encontros, falam mais alto, escre-
vem cartas e que aparentam ser convenientes à sondagem.
• As medidas padronizadas que são constantes em todos os res-
pondentes garantem que a informação comparada é obtida sobre
todos os que são descritos. Sem tais medidas, estatísticas signifi-
cativas não podem ser produzidas.
• Para atender necessidades de análise, uma pesquisa com objetivo
específico deve ser a única forma de garantir que todos os dados
necessários para uma análise de dados estejam disponíveis e pos-
sam ser relacionados. Mesmo que haja informação sobre algum
conjunto de eventos, isso não deve ser comparado com outras ca-
racterísticas necessárias para realizar a análise pretendida. Por
exemplo, os registros de alta hospitalar invariavelmente carecem
de informações sobre a entrada de pacientes. Por isso uma pesqui-
sa que colete informações sobre os dados de entrada e de hospita-
lização desses indivíduos é necessária para estudar a relação entre
o ingresso de uma pessoa e sua experiência hospitalar.
Há sempre algumas informações disponíveis em um dado tópico do

que as pessoas dizem, das impressões ou de registros; há também sempre
imperfeições em tais dados. Além de uma avaliação das informações ne-
cessárias, a decisão de fazer uma pesquisa também deve depender da dis-
ponibilidade dos recursos humanos. A menos que o pessoal necessário e
que o conhecimento especializado, ou os recursos para comprá-los, este-
jam disponíveis, o resultado da pesquisa pode não ser muito bom. Isso nos
leva ao tópico da próxima seção: O que constitui uma boa pesquisa?
COMPONENTES DOS LEVANTAMENTOS
Como as medidas de todas as ciências, as medições de pesquisas

sociais também não estão livres de erros. Os procedimentos usados para
conduzir uma pesquisa têm um efeito importante na probabilidade de os
dados resultantes descreverem exatamente o que pretendem descrever.
Uma pesquisa por amostra reúne três metodologias: amostragem,
formulação de questões e coleta de dados. Cada uma dessas atividades
possui várias aplicações fora da pesquisa por amostra, mas sua combina-
ção é essencial para a concepção de uma boa pesquisa.
Amostragem
Um censo significa reunir informações sobre cada indivíduo de
uma população. O maior desenvolvimento no processo de fazer levanta-
mentos úteis foi aprender como coletar amostras: selecionar um peque-
no subgrupo de uma população que represente toda a população. As
chaves para uma boa amostragem são encontrar uma forma de dar a to-
dos (ou a quase todos) os membros da população a mesma chance de
ser selecionado e usar métodos de probabilidade para escolher a amos-
tra. Os primeiros levantamentos e sondagens basearam-se em amostras
de conveniência ou em amostragens que excluíam parcelas significativas

da população. Isso não forneceu números confiáveis e com credibilidade.
O Ministério da Agricultura dos Estados Unidos atualmente desenvol-
ve os procedimentos para esboçar as amostragens de probabilidades abran-
gentes necessárias para fornecer descrições estatisticamente confiáveis de po-
pulações que vivem em uma determinada área. Os procedimentos envolvidos
do trabalho projetado para amostragens de áreas de terra para prever os ren-
dimentos da colheita; a amostragem de unidades habitacionais e as pessoas
que vivem nessas habitações eram simplesmente uma extensão daquele tra-
balho. Durante a Segunda Guerra Mundial, um grupo de cientistas sociais foi
abrigado neste Ministério para fazer pesquisas sociais relacionadas ao esforço
da guerra. Foi então que a área da amostragem probabilística tornou-se fir-
memente arraigada à amostragem geral de populações em pesquisas sociais.
A área da amostragem probabilística ainda é o método de escolha para pes-
quisas de entrevista social de famílias. Converse (1987) promoveu uma exce-
lente descrição da evolução dos métodos de pesquisa nos Estados Unidos.
As estratégias para a seleção da amostragem vêm sendo refinadas
desde 1950. O maior avanço foi o desenvolvimento da discagem aleatória
de dígitos (random-digit dialing – RDD), que permitiu a inclusão nas pesqui-
sas por telefone das famílias que não tinham os seus números de telefone
cadastrados (Waksberg, 1978). Os princípios de uma boa prática de amos-
tragem, contudo, vêm sendo bem desenvolvidos por um longo tempo.

Formulação de questões
Usar questões como medida é outra parte essencial do processo de
pesquisa. Os primeiros esforços de levantamento, que representam ex-
tensões do jornalismo, não foram cuidadosos acerca da forma como as
questões foram colocadas. Logo se tornou evidente, contudo, que enviar
um entrevistador com um conjunto de questões sem fornecer termos es-
pecíficos para as questões produziu diferenças significativas nas respos-
tas que foram obtidas. Desta maneira, no início do século XX, os pesqui-
sadores começaram a formular questões padrão para medir fenômenos
subjetivos. Mais uma vez, os pesquisadores do Ministério da Agricultura
dos Estados Unidos receberam o crédito por estender o uso das questões
padrão, na década de 1940, para situações nas quais informações fac-
tuais ou objetivas foram solicitadas. Payne (1951) publicou um livro de
referência fornecendo diretrizes para formular questões claras que os en-
trevistadores pudessem administrar. Likert (1932) recebeu os créditos
por construir uma ponte entre as elaboradas técnicas de escala desenvol-

vidas por psicólogos psicofísicos* para medir fenômenos subjetivos (por
exemplo, Thurstone e Chave, 1929) e as necessidades práticas da pes-
quisa de levantamento social aplicada.
O maior avanço na formulação de questões dos últimos 20 anos
foi a melhoria das estratégias de avaliação das questões. Mais do que an-
tes, os pesquisadores agora avaliam as questões para descobrir se elas
são bem compreendidas e se as respostas têm sentido (ver Press et al.,
2004). Pré-testes de pesquisas vêm sendo mais sistemáticos, usando aná-
lises de entrevistas gravadas para identificar questões problemáticas.
Como resultado, a escolha dos termos da questão está se tornando mais
objetiva e menos uma questão de juízo de investigação.
Entrevista
Embora nem todos os levantamentos envolvam entrevistas (como
alguns nos quais os participantes respondem a questões autoadministra-
das), certamente é comum usar uma entrevista para fazer perguntas e gra-
var as respostas. Quando entrevistadores são usados, é importante evitar
que eles influenciem as respostas dadas pelos respondentes e ao mesmo
tempo maximizar a precisão com que as perguntas são respondidas.
O primeiro passo importante para melhorar a coerência dos entre-
vistadores foi dar a eles questões-padrão. Posteriormente se descobriu que
também era necessário treinar os entrevistadores para aplicar uma pesqui-
sa de modo que evitassem introduzir vieses importantes nas respostas que
obtinham (Friedman, 1942). Hyman, Feldman e Stember (1954) publica-
ram uma série de estudos documentando outras formas pelas quais os en-
trevistadores poderiam influenciar as respostas obtidas. Seu trabalho con-
duz ao treinamento mais elaborado dos entrevistadores no que diz respei-
to às estratégias de sondagem quando respostas incompletas são dadas e à
manipulação dos aspectos interpessoais da entrevista de forma imparcial.
Cannell, Oksenberg e Converse (1977) avançaram o processo de tentar re-
duzir a variação entre entrevistadores especificando o roteiro de apresen-
tações e de estímulo que estes dão aos entrevistados ao limitar uma dis-
cussão não estruturada. A importância do treinamento e da supervisão dos
entrevistadores para garantir a qualidade dos dados tem agora sido bem
documentada (Billiet e Loosveldt, 1988; Fowler e Mangione, 1990).
*
N. de R.T.: Psicologia Psicofísica é um ramo da psicologia que estuda a relação dos
estímulos com a resposta dos indivíduos . É uma área da psicologia experimental.
Formas de coleta de dados

Até a década de 1970, a maioria das pesquisas acadêmicas e go-
vernamentais era feita pessoalmente a domicílio por entrevistadores.
Quando ter um telefone tornou-se quase universal nos Estados Unidos,
as entrevistas por meio deste tornaram-se a maior forma de coleta de da-
dos. A atual fronteira para tal atividade é a internet. Seu uso é limitado
porque muitas pessoas não têm acesso à ela e porque as listas de estraté-
gias para a formulação de amostragens de endereços de e-mail é limita-
da. Contudo, conforme o acesso à rede mundial de computadores au-
menta e as estratégias de amostragem evoluem, o uso da internet para
coletar dados de levantamento também aumenta.
Planejamento total do levantamento

Em muitos aspectos os princípios para uma boa prática de pesqui-
sa foram bem desenvolvidos na década de 1950. Contudo, naturalmente,
os procedimentos e ferramentas mudaram em resposta às novas tecnolo-
gias e aos avanços científicos. Em alguns casos, necessitamos de bons es-
tudos sobre como coletar dados para um propósito específico. Porém,
mesmo quando as melhores práticas são estabelecidas, há variação na
qualidade dos procedimentos que são usados.
Existem várias razões para a variação de qualidade. Para algumas
pesquisas, números imprecisos serão suficientes. A falta de financiamen-
to e de pessoal adequado, bem como a falta de conhecimento metodoló-
gico, sem dúvida contribuem para uma prática pobre em alguns casos.
Também há algumas controvérsias sobre o valor da amostragem provável
rigorosa e da formulação padronizada de questões (ver Converse, 1987;
Groves, 1989; Schober e Conrad, 1997; Turner e Martin, 1984). Uma ca-
racterística do modelo de pesquisa de levantamento que é parcialmente
culpada, contudo, é a falha dos pesquisadores em unir procedimentos de
alta qualidade em todas as três áreas salientes; não é incomum ver pes-
quisadores atenderem cuidadosamente alguns aspectos da boa pesquisa
enquanto negligenciam outros. A orientação crítica deste livro é a cha-
mada perspectiva total do projeto de levantamento.
Todo levantamento envolve um número de decisões que tem o po-
tencial de melhorar ou de desvirtuar a exatidão (ou precisão) das esti-
mativas da pesquisa. Em geral, as decisões que levariam a ter dados me-
lhores envolvem mais dinheiro, mais tempo ou outros recursos. Desta
forma, o projeto de uma pesquisa envolve um conjunto de decisões para

otimizar o uso dos recursos. Um projeto ideal levará em conta todos os
aspectos salientes do processo de pesquisa.
Em relação à amostragem, questões críticas incluem o seguinte:
• a escolha de usar ou não uma amostra probabilística;
• a estrutura de amostra (aquelas pessoas que realmente têm a
chance de ser parte da amostra);
• o tamanho da amostra;
• o formulação da amostra (a estratégia particular usada para se-
lecionar pessoas ou grupos familiares);
• a taxa de resposta (o percentual de amostras para o qual os da-
dos são efetivamente coletados).
No que diz respeito à formulação das questões, o pesquisador deve

decidir até que ponto a literatura disponível garante a confiabilidade e a
validade do projeto do questionário, o uso a ser feito dos consultores que
são especialistas em formulação de questões e o investimento a ser feito
no pré-teste e na avaliação das questões. Em relação aos entrevistadores,
os pesquisadores têm escolhas a fazer acerca dos tipos de treinamento e
da supervisão a dar. Uma decisão de projeto que atravessa todas essas
áreas é o modo de coleta de dados: não importa se o pesquisador coleta
dados por telefone, por correspondência, por entrevista pessoal, pela
internet ou por alguma outra forma, e nem como ele os coleta ou se
computadores vão estar envolvidos. A decisão sobre qual modo de coleta
de dados usar tem implicações importantes no custo da pesquisa e afeta
a qualidade dos dados que serão coletados.
Essas partes, em conjunto, constituem o que é chamado de projeto
total de levantamento. Os componentes do projeto são inter-relacionados
de duas formas importantes. Primeiro, a qualidade dos dados não será
melhor do que a maioria das características dos erros prováveis do proje-
to de pesquisa. No passado, algumas vezes os pesquisadores focaram em
uma ou duas características do levantamento, tais como o tamanho da
amostra ou a taxa de resposta, para avaliar a qualidade provável dos da-
dos. As melhores práticas atuais, contudo, necessitam de uma análise de
todas as características de projeto anteriormente citadas. Se há um com-
promisso importante ou uma fraqueza em algum aspecto do projeto de
pesquisa, maiores investimentos em outras partes desta não são sensa-
tos. Por exemplo, se são feitas perguntas que os entrevistados provavel-
mente não estão aptos a responder com grande precisão, uma grande
amostra que visa reduzir o erro de amostragem ao mínimo provavelmen-

te será injustificada. De forma semelhante, e talvez até mesmo mais co-
mum, um grande número de respostas não melhorará a credibilidade se
a amostra é malconcebida, se a taxa de respostas é tão baixa que faz a
amostra improvável de ser representativa ou se os entrevistadores são
precariamente treinados e supervisionados.
Para os formuladores e para os usuários de pesquisas de levanta-
mento, o projeto total de levantamento aborda perguntas significativas
sobre todas essas características, não apenas algumas, quando tentam
avaliar a qualidade de uma pesquisa e a credibilidade de um determina-
do conjunto de dados.
PROPÓSITOS E OBJETIVOS DESTE TEXTO
Este texto apresenta uma discussão das decisões importantes que

acompanham a formulação de qualquer projeto de pesquisa de levanta-
mento, as opções disponíveis para os pesquisadores e o significado po-
tencial das várias opções para a quantidade de erros e a credibilidade
das estimativas do levantamento. Quando apropriado, um conjunto de
procedimentos que podem constituir para uma boa prática de pesquisa é
apresentado. Um grande esforço é feito para discutir as realidades e os
problemas práticos com os quais os pesquisadores terão de lutar, bem
como as questões teóricas e metodológicas que estão em jogo; muitas
das deficiências nas coletas de dados originam-se da má execução de de-
talhes, não da falta de entendimento geral.
Um livro relativamente pequeno como este obviamente tem que re-
fletir sobre um conjunto de escolhas. Livros inteiros podem ser, e têm sido,
dedicados a tópicos como amostragem, formulação de questionários e pes-
quisa sobre os entrevistadores. Pessoas que planejam conduzir projetos de
pesquisa de levantamento vão querer ler mais. Além disso, ler um livro
como este (ou qualquer outro) não substitui o aprendizado prático e o
treinamento com especialistas que possuem sólidos conhecimentos meto-
dológicos e larga experiência na formulação e na execução de pesquisas.
No entanto, há um papel importante que este livro, por si só, pode repre-
sentar: o de fornecer uma visão abrangente da fonte dos erros e do alcan-
ce das questões metodológicas na coleta de dados de pesquisa.
Há várias pessoas para quem tal conhecimento será apropriado e
valioso. Certamente, os cientistas sociais que utilizam dados coletados
por terceiros em seus trabalhos devem ter um entendimento sofisticado

das fontes de erro. Da mesma forma, pessoas que leem sobre estatísticas
baseadas em pesquisas precisam entender os processos usados para a co-
leta de dados. Este livro identifica as questões que as pessoas que usam
os dados precisam perguntar e obter resposta. Além disso, fornece um
panorama daquilo que aqueles que estão pensando em comprar ou enco-
mendar uma pesquisa precisam ter. Em suma, este livro tem a intenção
de fornecer perspectiva e entendimento para aqueles que serão formula-
dores ou usuários de pesquisas de levantamento, ao mesmo tempo em
que fornece um sólido primeiro passo para aqueles que realmente que-
rem saber sobre coleta de dados.

2 Tipos de erros em levantamentos
Levantamentos são formulados para produzir estatísticas sobre uma popula-

ção-alvo. O processo pelo qual isso é feito apoia-se na inferência de caracterís-
ticas da população-alvo a partir das respostas fornecidas por uma amostra de
entrevistados. Este capítulo delineia os dois tipos necessários de inferências.
Também descreve os dois tipos de erro, viés e variabilidade, que podem limitar
a precisão de tais inferências.
Dois dos principais objetivos da metodologia de pesquisa são mini-

mizar o erro nos dados coletados por levantamentos e medir o erro que
necessariamente é parte de toda pesquisa. Os capítulos 3 a 9 descrevem
em detalhes estratégias para minimizar e medir erros. Para compreender
esses capítulos, e para entender a metodologia dos levantamentos, pri-
meiro é necessário entender o que consideramos por erro.
Como dissemos, o propósito de uma pesquisa é fornecer estimativas
estatísticas das características de uma população-alvo, de um conjunto de
pessoas. Para fazer isso, designamos um subgrupo de pessoas, uma amos-
tra, de quem tentamos coletar informações. Uma premissa fundamental
do processo de pesquisa é que descrevendo a amostra de pessoas que realmen-
te respondem, descreve-se a população-alvo. Espera-se que as características
as quais a pesquisa se designa a descrever estejam presentes no mesmo
grau, e estejam distribuídas da mesma forma, na amostra respondente
como o são na população-alvo como um todo.
A outra característica que define uma pesquisa é que os entrevis-
tados respondem a questões. As respostas às questões são usadas para
descrever experiências, opiniões e outras características daqueles que as
respondem. Uma segunda premissa fundamental do processo de pesquisa de

levantamento é que as respostas que as pessoas dão podem ser usadas para
descrever precisamente as características dos entrevistados. O grau para o
qual tais respostas não são medidas precisas é a segunda fonte fundamen-
tal de erros em pesquisas.
A Figura 2.1 mostra graficamente a forma de análise com a qual os
dados de pesquisa trabalham e as inferências sobre as quais isso é baseado. O
objetivo é estudar as características da população-alvo. O material com o qual
trabalhamos consiste das respostas dadas pelos entrevistados nas pesquisas.
Tabulamos as respostas e gostaríamos de supor que elas são medidas exatas
das características dos respondentes que estamos tentando medir. Gostaría-
mos, então, de estar aptos a supor que por descrever a amostra de responden-
tes, estamos descrevendo exatamente toda a população-alvo.
Características
da população
Questão
Quão proximamente a
amostra respondente
reflete a população
Amostra dos membros

da população que
responde às questões
Questão
Quão bem as respostas
medem as características
a ser descritas
Respostas dadas pelos

respondentes
Figura 2.1 Interferência na pesquisa de levantamento.
Alguns aspectos da metodologia de pesquisa são formulados para

abordar quão estreitamente uma amostra reflete a população. Outros são
projetados para abordar quão bem as respostas para as questões coletadas
na pesquisa servem como medida para o que elas têm a intenção de me-
dir. O projeto da pesquisa e a forma como a coleta de dados é conduzida
podem afetar uma ou ambas dessas fontes potenciais de erros.
ERRO ASSOCIADO A QUEM RESPONDE
Toda vez que uma amostra é retirada de uma população maior, há

alguma chance de talvez a amostra diferir da população total de onde foi
retirada. Um exemplo simples que os estatísticos gostam de usar é lançar
uma moeda, que é cara de um lado e coroa do outro. Mesmo se a moeda for
perfeita, uma amostra de 10 lançamentos não produzirá sempre 5 caras e 5
coroas. Enquanto 5 caras e 5 coroas serão mais comuns, um certo número
de amostras de 10 lançamentos produzirá 6 caras ou 4 caras; 3 e 7 caras
serão menos comuns; 8 ou 2 caras serão ainda menos comuns; distribuições
ainda mais extremas serão cada vez menos comuns, mas até mesmo essas
ocorrerão se amostras suficientes de 10 lançamentos de uma moeda forem
realmente tentadas. Da mesma forma, se uma população consiste 50% de
homens e 50% de mulheres, qualquer amostra específica pode ter mais ou
menos mulheres do que se esperaria da população como um todo.
Em uma pesquisa por amostra, normalmente temos apenas uma
única amostra a partir da qual generalizar. Por acaso, a amostra pode
e irá diferir ligeiramente do que pareceria se refletisse perfeitamente a
distribuição de características na população. Um objetivo da metodologia
de pesquisa é minimizar as diferenças aleatórias entre a amostra e a po-
pulação. A forma como a amostra é projetada e selecionada pode afetar
em quão estreitamente a amostra é provável de refletir as características
da população de onde foi retirada.
Um erro preocupante para os metodologistas de pesquisa é essa
variação aleatória das verdadeiras características de uma população. Essa
variação, o possível erro que decorre unicamente do fato de os dados
serem coletados de uma amostra e não de cada membro da população, é
chamado de erro de amostragem. Esse é um tipo de erro que os metodolo-
gistas de pesquisa tentam minimizar.
Um segundo tipo de erro que afeta a relação entre uma amostra de
respondentes e a população é o viés. Viés significa que de alguma forma
sistemática as pessoas que respondem a uma pesquisa são diferentes da
população-alvo como um todo.
Há três passos no processo de coleta de dados de uma amostra, cada
um dos quais poderia, potencialmente, introduzir vieses na amostra:
1. O primeiro passo envolve escolher a estrutura de amostra, aque-
les que realmente têm a chance de ser selecionados. Se há algu-
mas pessoas na população-alvo que não têm nenhuma chance de
ser selecionadas para a amostra, e se elas são de alguma forma
consistentemente diferentes daquelas que têm a chance de ser

selecionadas, o amostra resultante será tendenciosa dessa for-
ma. Como exemplo, a maioria das pesquisas nos Estados Unidos
exclui pessoas que vivem em instalações residenciais supervisio-
nadas, como prisões, conventos e casas de repouso, e excluem
as pessoas que não têm endereço fixo. A maioria das pesquisas
por telefone não apenas excluem aqueles sem este serviço, mas
também aquelas famílias que possuem apenas celulares. Para as
variáveis nas quais essas pessoas que estão incluídas são diferen-
tes daquelas que são sistematicamente excluídas, as amostras das
quais os dados são coletados serão também tendenciosas.
2. Se de alguma forma o processo de seleção de quem está na amos-
tra não é aleatório, o resultado pode ser uma amostra de respon-
dentes que são diferentes da população-alvo como um todo. Por
exemplo, se uma amostra é formada por pessoas que são volun-
tárias para estar em uma pesquisa, elas provavelmente têm um
perfil de interesses diferente daquelas que não são voluntárias.
3. Finalmente, a falta em coletar respostas de todos os selecionados
para estar na amostra é a terceira fonte potencial de vieses. Al-
gumas pessoas não estão disponíveis para responder questões;
algumas são incapazes de fazê-lo, devido a sua saúde ou a suas
competências linguísticas; algumas se recusam a responder. Na
medida em que aqueles que estão indisponíveis, incapazes ou in-
dispostos a responder questões são diferentes do resto da popula-
ção de formas que afetam as respostas da pesquisa, os resultados
desta poder ser tendenciosos.
É importante entender a distinção entre os dois tipos de erros em

dados. O erro de amostragem, o primeiro tipo de erro que foi discutido, é
um erro aleatório. Às vezes, por acaso, haverá várias mulheres na amos-
tra, às vezes poucas, mas em média, uma série de amostras devidamente
coletadas terá muita proximidade com a mesma porcentagem de mulhe-
res que a população como um todo. Um desafio para os metodologistas é
minimizar a variabilidade de amostra para amostra para aumentar a pro-
babilidade de que qualquer amostra dada é muito próxima da população
como um todo.
Em contraste, aspectos do projeto ou da execução de uma pesqui-
sa que enviesam as amostras produzirão, em média, estimativas que são
consistentemente diferentes da população-alvo como um todo. Portanto,
quando as amostras são retiradas apenas daqueles que vivem em grupos

familiares, excluindo os sem-teto e os que vivem em albergues, a renda
média provavelmente será maior naqueles que respondem do que entre
aqueles que não tiveram a chance de responder. Aqueles que vivem em
família também muito provavelmente serão casados e terão empregos di-
ferentemente que aqueles sem casa. As estimativas dos que responderam
a pesquisas baseadas em famílias irão sistematicamente superestimar a
porcentagem da população completa que tem essas características.
Um último ponto a salientar é que a variabilidade aleatória da
estimativa da amostra, o erro de amostragem, e os vieses associados à
amostra, não são necessariamente relacionadas a tudo. Se um plano de
pesquisa sistematicamente exclui, ou representa de maneira menor, algu-
mas pessoas que são distintivas de forma relevante para os objetivos da
pesquisa, é bem possível ter uma estimativa muito consistente e estável,
com erros de amostragem muito pequenos, que é consistentemente ten-
denciosas e sub ou superestima algumas características da população.
ERRO ASSOCIADO ÀS RESPOSTAS
A fim de entender os erros associados às respostas para questões de

pesquisa, primeiro precisa-se saber o que está sendo medido. Na teoria,
pode-se dividir o que a pesquisa tenta medir em duas categorias: fatos
objetivos e estados subjetivos. Fatos objetivos incluem a altura da pessoa,
se ela está ou não empregada e se ela votou ou não na última eleição.
Estados subjetivos incluem quanto do tempo a pessoa se sentiu cansada e
se ela tem ou não uma visão política liberal ou conservadora.
Conceitualmente, a forma como avaliamos as respostas para uma
questão é para mensurar quão bem elas correspondem à verdade. Se es-
tamos perguntando aos respondentes da pesquisa sobre fatos objetivos,
como sua altura ou se estão ou não empregados, teoricamente podería-
mos obter informações independentes contra as quais as respostas serão
avaliadas para a questão da pesquisa. Poderíamos medir a altura dos res-
pondentes; poderíamos verificar o status do emprego olhando os regis-
tros. Poderíamos avaliar diretamente o quão precisas eram as respostas.
Em contraste, não há forma objetiva de verificar ou de avaliar o relato da
pessoa sobre o quanto do tempo ela se sentiu cansada.
Psicometristas, aqueles especializados na medição dos estados psi-
cológicos, pensam nas respostas como sendo formadas por dois componen-
tes: o valor verdadeiro, o que um respondente perfeito com conhecimentos

perfeitos poderia dar como resposta, mais alguns elementos de erro.
Xi = ti + ei
Onde
xi é a resposta dada pelo indivíduo i
ti é o valor verdadeiro para o indivíduo i
ei é o erro na resposta dada pelo indivíduo i
Os erros podem ser causados por todos os tipos de coisas: o não

entendimento da questão, não ter a informação necessária para responder
e distorcer as respostas para que pareçam boas são apenas alguns exem-
plos. Alguns entrevistados talvez não saibam exatamente a sua altura;
outros podem arredondar sua altura para cima ou para baixo, pensando
que ser mais alto ou mais baixo pode ser mais atrativo. As estimativas dos
respondentes de quão cansados eles estiveram durante a última semana
podem ser afetadas por quão cansados eles estão no momento em que
respondem às questões. O ponto é que na medida em que as respostas são
afetadas por outros fatores que não os fatores sobre os quais a resposta
deveria ser baseada, há erro na resposta.
Validade é o termo que os psicólogos usam para descrever a relação
entre uma resposta e alguma medida do escore verdadeiro. Olhando para
a equação anterior, o objetivo do psicometrista e do metodologista de pes-
quisa é fazer o erro de termo (e) tão pequeno quanto possível para que as
respostas reflitam principalmente o escore verdadeiro (ou resposta).
De certa forma, o erro de termo em psicometrias é similar ao erro
de amostragem discutido anteriormente. Se o erro associado a respostas
é aleatório, resultando em respostas que algumas vezes erram em uma
direção, algumas vezes em outra, o resultado é menos certo de confiança
em quão bem as respostas estão medindo o que queremos que meçam.
Quanto maior o valor de e (na equação anterior), maior a chance de que
alguma resposta dos indivíduos estará errada. Contudo, em muitas res-
postas entre os indivíduos, a resposta média deve ser a mesma que o valor
verdadeiro médio.
Para questões formuladas para medir fatos objetivos, mas não esta-
dos subjetivos, há também o potencial de que as questões serão inclinadas.
De uma forma completamente análoga a vieses com respeito às amostras,
o que viés significa nesse contexto é que em média os erros nas respostas,
a forma pela qual as respostas diferem dos escores verdadeiros, são mais
prováveis de estar em uma direção do que em outra. Como exemplos,

respondentes em média subnotificam quantos cigarros eles fumam e a
quantidade de álcool que bebem, enquanto tendem a exagerar se votaram
ou não. Estimativas desses comportamentos são enviesados – sistematica-
mente diferentes dos escores verdadeiros.
A ideia de validade para medidas subjetivas não pode ser observada
diretamente, mas é inferida de estudos de como as respostas são relatadas
para outras medidas similares. Os cálculos são mais complicados, mas o re-
sultado final de estimativas de validade são os mesmos: uma estimativa de
quão bem as respostas refletem o constructo que são projetadas para medir.
(Cronbach e Meehl, 1955; Saris e Andrews, 1991). Em contraste, uma vez
que não podemos medir diretamente o valor verdadeiro dos estados subje-
tivos, também não podemos medir vieses – o grau para o qual as respostas
sistematicamente diferem do escore verdadeiro em um sentido.
RECAPITULANDO A NATUREZA DOS ERROS EM LEVANTAMENTOS
Portanto, para ambas as inferências-chave que são cruciais para a

qualidade das estimativas da pesquisa, a inferência de que as respostas
podem ser usadas para descrever precisamente uma amostra de respon-
dentes e que podemos generalizar precisamente a partir dela para uma
população inteira, há dois tipos análogos de erros: a variabilidade alea-
tória ao redor dos valores verdadeiros e diferenças sistemáticas (envie-
sadas) entre as amostras que respondem a questões e a população como
um todo ou entre as respostas dadas e os valores verdadeiros para aque-
les que estão respondendo. Ao longo de todo o livro, como o erro vem
sendo discutido, os leitores precisam estar certos de que sabem qual tipo
de erro é implicado. É este o problema da generalização da amostra de
respondentes para a população ou da generalização das respostas para
a realidade que queremos descrever? É a preocupação com respeito ao
erro focada em minimizar a variação aleatória, variação que pode, por
acaso, fazer nossas amostras ou nossas respostas diferentes dos valores
verdadeiros da população, ou há algum tipo de erro sistemático (envie-
sado) em nossos dados, decorrentes tanto de ter alguns elementos da
população subrepresentados em nossa amostra de respondentes ou de
alguma distorção sistemática de respostas a questões que colocamos? O
Quadro 2.1 exibe graficamente quatro tipos de erros que afetam nossas
estimativas de pesquisa.
Quando se tenta avaliar a confiança que se pode ter nas estimati-

vas baseadas em levantamentos, é importante não esquecer todos esses
quatro tipos de erros. Eles são diferentes, normalmente resultam de as-
pectos diferentes da forma como a pesquisa é executada, e têm impactos
diferentes sobre a capacidade da pesquisa de abordar as questões que foi
formulada para responder.
Dando esta orientação para os vários significados de erro, continuamos
a discutir a importância da forma como uma pesquisa é formulada e executa-
da para a confiança que se pode ter nos resultados do levantamento.
Quadro 2.1 Exemplos de erro por tipos de erro e tipo de inferência

Tipos de erro
Inferência Aleatório Enviesado
Da amostra Erro de amostragem Exemplo:
para a população Aqueles que têm mais de 65 anos são
regularmente menos prováveis de responder
a pesquisas por telefone, e, portanto, são
subapresentados em dados de levantamento
por telefone
Das respostas para as Sem validez Exemplo:
características verdadeiras O número de cigarros fumados é
regularmente subrelatado em pesquisas
Leituras COMPLEMENTARES
Groves, R. M. (1989). Survey errors and survey costs. New York: John Wiley.
Groves, R. M., Fowler, F.J., Couper, M.P., Lepkowski, J. M., Singer, E., & Tou-
rangeau, R. (2004). Survey methodology (Chap. 2). New York: John Wiley.
Lessler, J.T., & Kalsbeek, W. D. (1992). Nonsampling error in surveys. New York:
John Wiley.
3 Amostragem
O quão bem uma amostra representa uma população depende da estrutura

da amostra, do tamanho da amostra e da forma específica da seleção de pro-
cedimentos. Se procedimentos de amostragem probabilísticas são usados, a
precisão das estimativas da amostra pode ser calculada. Este capítulo descreve
diversos procedimentos de amostragem e seus efeitos sobre a representativida-
de e a precisão das estimativas da amostra. Duas das formas mais comuns de
amostragens de populações, amostras probabilísticas de área e de discagem
aleatória de dígitos, são descritas em detalhes.
Há ocasiões em que o objetivo da coleta de informações não é gerar

estatísticas sobre a população, mas descrever um conjunto de pessoas de
uma forma mais geral. Jornalistas, pessoas que desenvolvem produtos,
líderes políticos e outros, às vezes, querem apenas fazer ideia dos senti-
mentos das pessoas sem se interessar por precisões numéricas. Pesquisa-
dores fazem estudos-piloto para medir o alcance das ideias ou opiniões
que as pessoas têm ou a forma com que as variáveis parecem assumir
juntas. Para esses propósitos, pessoas que estão prontamente disponíveis
(amigos, colegas de trabalho) ou pessoas que se oferecem (levantamentos
feitos por revistas, pessoas que ligam para talk shows) podem ser úteis.
Nem todo esforço para coletar informações requer uma amostra de levan-
tamento com probabilidade rigorosa. Na maioria das ocasiões em que le-
vantamentos são empreendidos, contudo, o objetivo é desenvolver esta-
tísticas sobre a população. Este capítulo é sobre a amostragem quando o
objetivo é produzir números que podem ser submetidos apropriadamente
à variedade de técnicas estatísticas disponíveis às ciências sociais. Embora
muitos dos princípios gerais sejam aplicados a qualquer problema de

amostragem, este capítulo foca na amostragem de pessoas.
A maneira de avaliar uma amostra não é por meio dos resultados,
das características da amostra, mas pelo exame do processo pelo qual ela
foi selecionada. Há três aspectos-chave da seleção da amostra:
1. A estrutura da amostra é o conjunto de pessoas que têm a chance
de ser selecionadas, dada pela abordagem da amostragem que é
escolhida. Estatisticamente falando, uma amostra só pode ser re-
presentativa da população incluída no formado da amostra. Uma
questão importante é quão bem a estrutura da amostra corres-
ponde à população que o pesquisador quer descrever.
2. Procedimentos de amostragem probabilística devem ser usados para
designar unidades individuais para a inclusão em uma amostra. Cada
pessoa deve ter uma chance conhecida de seleção estabelecida pelo
procedimento de amostragem. Se o critério do pesquisador ou as
características do respondente, como disponibilidade ou iniciativa,
afetam as chances de seleção, não existe base estatística para avaliar
quão bem ou quão pobremente a amostra representa a população;
abordagens comumente usadas para calcular intervalos de confiança
em torno de estimativas de amostra não são aplicáveis.
3. Os detalhes do formato da amostra, seu tamanho e os procedi-
mentos específicos usados para selecionar unidades influencia-
rão na precisão das estimativas da amostra, ou seja, quão minu-
ciosamente uma amostra é provável de se aproximar das caracte-
rísticas da população como um todo.
Esses detalhes do processo de amostragem, juntamente com a pro-

porção em que a informação é de fato obtida daqueles selecionados, cons-
titui os fatos necessários para avaliar uma amostra de levantamento.
Taxas de resposta são discutidas no Capítulo 4, que também inclui
uma breve discussão sobre cota de amostragem, uma alteração comum da
amostragem probabilística que produz amostras não probabilísticas. Neste
capítulo, procedimentos de estrutura de amostragem e de amostragem
probabilística são discutidos. Várias das estratégias práticas de amostra-
gem de pessoas mais comuns são descritas. Os leitores interessados vão
encontrar muito mais informações sobre amostragem em Kish (1965),
Subman (1976), Kalton (1983), Groves (1989), Henry (1990) e Lohr
(1998). Os pesquisadores que planejam conduzir uma pesquisa quase
sempre seriam bem aconselhados a obter a ajuda de um estatístico de amos-
tragem. Este capítulo, contudo, pretende familiarizar os leitores com ques-

tões com as quais eles devem tratar e com as quais provavelmente vão se
deparar quando avaliarem a amostragem feita para um levantamento.
A ESTRUTURA DA AMOSTRA
Qualquer procedimento de seleção de amostra dará a alguns indiví-

duos a chance de ser incluído na amostra enquanto exclui outros. Aquelas
pessoas que têm a chance de ser selecionadas constituem a estrutura da
amostra. O primeiro passo na avaliação da qualidade de uma amostra é
definir a estrutura da amostra. A maioria dos esquemas de amostragem se
divide em três classes gerais:
1. A amostragem é feita de uma lista mais ou menos completa de
indivíduos na população a ser estudada.
2. A amostragem é feita de um conjunto de pessoas que vão a algum
lugar ou fazem alguma coisa que as habilita a participar da amos-
tra (por exemplo, pessoas que receberam assistência médica, ou
que compareceram a um encontro). Nesses casos, não há uma lista
prévia a partir da qual a amostragem ocorre; a criação da lista e o
processo de amostragem devem ocorrer simultaneamente.
3. A amostragem é feita em dois ou mais estágios, com o primeiro
estágio de amostragem envolvendo algo diferente dos indivíduos
que serão finalmente selecionados. Em um ou mais passos, essas
unidades primárias são recolhidas, e eventualmente uma lista de
indivíduos (ou outras unidades de amostragem) é criada, a partir
da qual uma seleção final de amostra é feita. Um dos mais comuns
desses esquemas de amostragem é selecionar unidades habitacio-
nais, sem informações prévias de quem vive nelas, como um pri-
meiro estágio para selecionar uma amostra de pessoas que vivem
nessas unidades habitacionais. Esses procedimentos multiestágio
serão descritos em detalhes mais adiante neste capítulo.
Há três características da estrutura da amostra que um pesquisador

deve avaliar:
1. Abrangência, ou seja, quão completamente isso cobre a popula-
ção-alvo.
2. Se pode ou não ser calculada a probabilidade de seleção de uma
pessoa.
3. Eficiência, ou a taxa em que os membros de uma população-alvo

podem ser encontrados entre aqueles da estrutura.
Abrangência. Uma amostra apenas pode ser representativa de uma

estrutura da amostra, ou seja, a população que realmente teve a chance
de ser selecionada. A maioria das abordagens de amostragem deixa de
fora pelo menos algumas pessoas de uma população que o pesquisador
deseja estudar. Por exemplo, amostras baseadas em famílias excluem pes-
soas que vivem em instalações residenciais supervisionadas, como dormi-
tórios, prisões e asilos, bem como as que são sem-teto. As listas gerais
disponíveis, como as de pessoas com habilitação para dirigir, eleitores re-
gistrados e proprietários, são ainda mais exclusivas. Embora elas cubram
grandes segmentos de algumas populações, também omitem importantes
segmentos com características peculiares. Como um exemplo específico,
as listas telefônicas publicadas omitem aqueles sem telefones fixos, aque-
les que solicitaram que o seu telefone não seja publicado e aqueles que
assinaram uma linha telefônica desde que a lista telefônica mais recente
foi publicada. Em algumas grandes cidades, tais exclusões somam quase
50% de todas as famílias. Em tais cidades, uma amostra extraída de uma
lista telefônica seria representativa de apenas cerca da metade da popula-
ção, e a metade que é representada pode facilmente ser esperada de dife-
rir de várias formas da metade que não o é.
Uma ameaça crescente para os levantamentos por telefone é o au-
mento do uso de celulares. A maioria dos levantamentos por telefone tem
dependido de amostragens de números de telefone que possam ser ligados
a famílias. Casas que não têm nenhum “telefone fixo” são excluídas usando
as técnicas mais comuns para desenhar amostras por levantamentos feitos
pelo telefone. Aquelas famílias que têm apenas celulares são, portanto, dei-
xadas de fora de tais amostras (Blumberg, Lake e Cynamon, 2006).
Endereços de e-mail fornecem outro bom exemplo. Há algumas po-
pulações, como as do cenário da empresa ou da escola, que têm pratica-
mente acesso universal ao e-mail, e listas mais ou menos completas desses
endereços provavelmente estão disponíveis. Por outro lado, como uma
abordagem às amostragens feitas com famílias em populações gerais, tirar
amostra daqueles com endereços de e-mail deixa de fora muitas pessoas e
produz uma amostra que é muito diferente da população como um todo
de muitas maneiras importantes. Além disso, não há atualmente uma for-
ma de criar uma boa lista de todos ou pelo menos da maioria dos que têm
um endereço de e-mail.
Duas inovações recentes, impulsionadas pelo desejo de realizar le-

vantamentos pela internet, merecem destaque. Primeiro, um grande núme-
ro de pessoas têm sido recrutadas via internet para participar de levanta-
mentos ou estudos de pesquisas. Essas pessoas preenchem questionários
iniciais de base que cobrem um amplo número de características. As respos-
tas a essas questões podem então ser usadas para “criar” uma amostra a
partir do conjunto total de voluntários que dificilmente combina com a po-
pulação total que o pesquisador quer estudar. Quando uma “amostra” é le-
vantada, os resultados podem ou não produzir informações exatas sobre a
população total. Obviamente, ninguém que não use a internet ou que não
esteja interessado em participar como voluntário no levantamento é incluí-
do em tal amostra. Frequentemente, as mesmas pessoas participam de vá-
rios levantamentos, por isso aumentar ainda mais as questões sobre quão
bem os respondentes simbolizam a população geral (Couper, 2007).
Em um esforço para enfrentar algumas dessas preocupações, outra
abordagem é conduzir um levantamento por telefone para recrutar um gru-
po de voluntários para levantamentos via internet. Um computador pode
ser fornecido àqueles que não têm acesso a um computador para uso. Mes-
mo com tais esforços, a “estrutura da amostra” é constituída por aquele
subconjunto da população que vive em um domicílio com serviço de telefo-
ne fixo e que concorda em ser parte de um grupo para estudos de pesquisa.
De uma perspectiva estatística, estatísticas baseadas em amostras advindas
daquele grupo não necessariamente se aplicam ao equilíbrio da população.
Em vez disso, em ambos os exemplos anteriores, aqueles que respondem a
um levantamento podem apenas ser ditos representativos das populações
que voluntariaram ou concordaram em estar nessas listas (Couper, 2007).
A extensão a qual eles são prováveis de ser como o resto da população deve
ser avaliada independentemente do processo de amostragem.
Uma parte fundamental da avaliação de qualquer esquema de amos-
tragem é determinar o percentual da população que se quer descrever que
tem uma chance de ser selecionado e a extensão em que aqueles excluídos
são distintivos. Muito comumente um pesquisador precisa fazer uma esco-
lha entre um caminho mais fácil ou menos caro de formular a amostra de
uma população que deixa de fora algumas pessoas e uma estratégia mais
cara que também é mais abrangente. Se um pesquisador está considerando
formular uma amostra a partir de uma lista, é particularmente importante
avaliar a lista para descobrir em detalhes como ela foi compilada, como e
quando adições e exclusões são feitas e o número e características das pes-
soas que são prováveis de ser deixadas de fora da lista.
Probabilidade de seleção. É possível calcular a probabilidade de sele-

ção de cada pessoa amostrada? Um procedimento que amostre os regis-
tros de visitas ao médico durante um ano fornecerá aos indivíduos que
visitam o médico várias vezes uma maior chance de seleção do que àque-
les que veem o médico apenas uma vez. Não é necessário que um esque-
ma de amostragem dê a todos os membros da estrutura de amostragem a
mesma chance de seleção, como seria o caso se cada indivíduo aparecesse
uma vez e apenas uma vez em uma lista. É essencial, contudo, que o pes-
quisador seja capaz de descobrir a probabilidade de seleção para cada
indivíduo selecionado. Isso pode ser feito no momento da seleção da
amostra pelo exame da lista. Também pode ser possível descobrir a proba-
bilidade de seleção no momento da coleta dos dados.
No exemplo anterior, sobre formular amostras de pacientes pela
formulação de amostras de visitas ao médico, se o pesquisador pergunta
aos pacientes selecionados o número de visitas ao médico que eles fize-
ram em um ano, ou se o pesquisador pode ter acesso aos prontuários dos
pacientes selecionados, seria possível ajustar os dados no momento da
análise para levar em conta as diferentes chances de seleção. Se não é
possível saber a probabilidade de seleção de cada indivíduo selecionado,
porém, não é possível estimar precisamente a relação entre a estatística
da amostra e a população da qual ela foi retirada.
As “amostras por cota”, discutidas no final do Capítulo 4, são outro
exemplo comum do uso de procedimentos para os quais a probabilidade
de seleção não pode ser calculada.
Eficiência. Em alguns casos, as estruturas de amostra incluem uni-

dades que não são membros da população-alvo que o pesquisador deseja
amostrar. Supondo que pessoas elegíveis podem ser identificadas no pon-
to da coleta de dados, ser muito abrangente não é um problema. Por isso
uma forma perfeitamente apropriada de formular amostras de idosos vi-
vendo em família é extrair uma amostra de todos os domicílios, descobrir
se há pessoas idosas vivendo neles, e então excluir aqueles sem residentes
idosos. Amostras de discagem aleatória de dígitos selecionam números de
telefone (muitos dos quais não estão em uso) como uma maneira de for-
mular amostras de unidades familiares com telefone. A única questão so-
bre tais modelos é se eles são ou não realmente rentáveis.
Devido ao fato de a capacidade de generalizar a partir de uma
amostra ser limitada pela estrutura da amostra, quando informar os resul-
tados, o pesquisador deve dizer aos leitores a quem foi e a quem não foi
dada a chance de ser selecionado e, na medida em que isso é sabido, como

aqueles que foram omitidos foram distintivos.
SELECIONANDO UMA AMOSTRA DE UM ESTÁGIO
Uma vez que o pesquisador tenha tomado uma decisão sobre a es-
trutura da amostra ou a abordagem para a obtenção de uma amostra, a
próxima questão é especificamente como selecionar as unidades indivi-
duais a ser incluídas. Nas próximas seções, as várias formas tipicamente
usadas para extrair amostras são discutidas.
Amostragem aleatória simples

Amostragem aleatória simples é, de certo modo, o protótipo da
amostragem da população. As formas mais básicas de calcular estatísticas
sobre amostras supõe que uma amostra aleatória simples foi elaborada. A
amostragem aleatória simples é quase como selecionar uma amostra reti-
rando o nome dos participantes de um chapéu: os membros de uma popu-
lação são selecionados um de cada vez, independentes um do outro e sem
substituição; uma vez que uma unidade é selecionada, ela não tem mais
chance de ser selecionada.
Operacionalmente, extrair uma amostra aleatória simples requer uma
lista numerada da população. Por simplicidade, assume-se que cada pessoa
na população aparece uma e apenas uma vez. Se houvesse 8.500 pessoas em
uma lista, e o objetivo fosse selecionar uma amostra aleatória simples de 100,
o procedimento seria simples. As pessoas na lista seriam numeradas de 1 a
8.500. Então um computador, uma tabela de números aleatórios ou algum
outro gerador de números aleatórios seria usado para produzir 100 números
diferentes no mesmo intervalo. Os indivíduos correspondentes aos 100 nú-
meros escolhidos constituiriam uma amostra aleatória simples daquela popu-
lação de 8.500. Se a lista está em um arquivo de dados informatizado, rando-
mizando a ordem da lista, então escolhendo as 100 primeiras pessoas sobre
a lista reordenada, produziria um resultado equivalente.
Amostras sistemáticas
A menos que uma lista seja pequena, tenha todas as unidades pré-
numeradas e seja informatizada para que possa ser numerada facilmente,
extrair uma amostra aleatória simples como descrito antes pode ser traba-
lhoso. Em tais situações, há uma forma de usar uma variação chamada
amostragem sistemática que terá uma precisão equivalente a uma amos-
tra aleatória simples e pode ser mecanicamente mais fácil de criar. Além
disso, os benefícios da estratificação (discutida na próxima seção) podem
ser efetuados mais facilmente por meio de amostragem sistemática.
Na elaboração de uma amostra sistemática a partir de uma lista, o
pesquisador primeiro determina o número de entradas na lista e de elemen-
tos dela que serão selecionados. Dividir este último pelo primeiro produzirá
uma fração. Assim, se há 8.500 pessoas em uma lista e uma amostra de 100
é requerida, 100/8.500 da lista (ou seja, 1 em cada 85 pessoas) deve ser
incluída na amostra. A fim de selecionar uma amostra sistemática, um pon-
to de partida é designado pela escolha de um número aleatório que está
dentro do intervalo de amostragem, neste exemplo, qualquer número de 1
a 85. O início aleatório garante que este é um processo de seleção casual.
Começando com a pessoa na posição selecionada aleatoriamente, o pesqui-
sador passa a selecionar cada 85ª pessoa na lista.
Muitos livros de estatística previnem sobre amostras sistemáticas se
a lista é ordenada por algumas características, ou tem um padrão recor-
rente, o que irá afetar diferencialmente a amostra dependendo do início.
Como um exemplo extremo, se os membros de um clube de casais foram
listados com o parceiro masculino sempre listado primeiro, qualquer in-
tervalo constante de números produziria uma amostra sistemática consti-
tuída de apenas um gênero, embora o clube como um todo seja uniforme-
mente dividido por gênero. Isso é definitivamente importante para exami-
nar uma potencial estrutura de amostra a partir da perspectiva de se há
ou não alguma razão para pensar que a amostra resultante de um início
aleatório será sistematicamente diferente daquela resultante de outro iní-
cio de formas que vão afetar os resultados do levantamento. Na prática, a
maioria das listas ou das estruturas de amostra não representa nenhum
problema para a amostragem sistemática. Quando representam, por uma
reordenação das listas ou ajuste dos intervalos de seleção, quase sempre é
possível formular uma estratégia de amostragem sistemática que é, ao
menos, equivalente à amostra aleatória simples.
Amostras estratificadas
Quando uma amostra aleatória simples é extraída, cada nova sele-
ção é independente, não afetada por nenhuma das seleções que veio an-
tes. Como resultado desse processo, qualquer uma das características da

amostra pode, por acaso, diferir um pouco da população a partir da qual é
elaborada. Em geral, pouco se sabe sobre as características dos membros
individuais da população antes da coleta de dados. Não é incomum, contu-
do, que pelo menos algumas características da população sejam identificá-
veis no momento da amostragem. Quando esse é o caso, há a possibilidade
de estruturar o processo de amostragem para reduzir a variação normal de
amostragem, desse modo produzindo uma amostra que é mais provável de
se parecer com a população total do que uma amostra aleatória simples. O
processo pelo qual isso é feito é chamado de estratificação.
Por exemplo, suponha-se que havia uma lista de estudantes universi-
tários. A lista é organizada alfabeticamente. Alunos de classes diferentes
são misturados por toda a lista. Se a lista identifica a classe particular a que
o estudante pertence, seria possível reorganizar a lista para colocar calou-
ros primeiro, depois estudantes do segundo ano, em seguida juniores e fi-
nalmente seniores, com todas as classes agrupadas. Se a amostragem re-
quer a seleção de uma amostra de 1 em cada 10 dos membros da lista, a
reorganização garantiria que exatamente 1/10 dos calouros foram selecio-
nados, 1/10 dos estudantes do segundo ano e assim por diante. Por outro
lado, se uma amostra aleatória simples ou uma amostra sistemática foi se-
lecionada a partir da lista alfabética original, a proporção da amostra no
primeiro ano estaria sujeita à variação normal de amostragem e poderia ser
ligeiramente superior ou inferior do que era o caso para a população. A
estratificação com antecedência garante que a amostra terá exatamente as
mesmas proporções em cada classe como a população como um todo.
Considere a tarefa de estimar a idade média do corpo estudantil. A
classe a qual um estudante é membro quase certamente está correlaciona-
da com a idade. Apesar disso, ainda haverá alguma variabilidade nas esti-
mativas da amostra por conta do procedimento de amostragem, estrutu-
rar a representação de classes na estrutura da amostragem também irá
limitar a extensão a qual a idade média da amostra diferirá por acaso da
população como um todo.
Quase todas as amostras de populações de áreas geográficas são
estratificadas por alguma variável regional, de modo que serão distribuí-
das da mesma forma como a população como um todo. Amostras nacio-
nais são tipicamente estratificadas por região do país e também por loca-
lizações urbanas, suburbanas e rurais. A estratificação somente melhora a
precisão das estimativas das variáveis que são relacionadas às variáveis de
estratificação. Devido ao fato de um certo grau de estratificação ser rela-
tivamente simples de realizar, no entanto, e porque isso nunca fere a pre-

cisão das estimativas da amostra (contanto que a probabilidade de sele-
ção seja a mesma em todas as camadas, esta normalmente é uma caracte-
rística desejável de um projeto de amostra).
Diferentes probabilidades de seleção

Algumas vezes a estratificação é usada como um primeiro passo
para variar as taxas de seleção de subgrupos da população. Quando as
probabilidades de seleção são constantes ao longo de todas as camadas,
um grupo que constitui 10% da população constituirá cerca de 10% da
amostra selecionada. Se um pesquisador queria uma amostra de pelo me-
nos 100 de um subgrupo da população que constituía 10% da população,
uma abordagem de amostragem aleatória simples exigiria uma amostra
total de 1000. Além disso, se o pesquisador decidiu aumentar o tamanho
da amostra daquele subgrupo para 150, isso implicaria tomar uma amos-
tra adicional de 500 membros, trazendo o total para 1500, de modo que
10% da amostra seria igual a 150.
Obviamente, há ocasiões em que aumentar uma amostra desta for-
ma não é muito rentável. No último exemplo, se um pesquisador está sa-
tisfeito com o tamanho das amostras de outros grupos, o projeto acrescen-
ta 450 entrevistas desnecessárias para adicionar 50 entrevistas que são
desejadas. Em alguns casos, portanto, o adequado é selecionar algum sub-
grupo em uma taxa mais elevada do que o resto da população.
Como exemplo, suponha que um pesquisador desejava estudantes
do sexo masculino e feminino, com um mínimo de 200 respondentes ho-
mens, em uma determinada faculdade onde apenas 20% dos estudantes
são homens. Assim, uma amostra de 500 estudantes incluiria 100 estu-
dantes homens. Se estudantes do sexo masculino puderam ser identifica-
dos com antecedência, contudo, pode-se selecioná-los duas vezes mais
rápido do que estudantes do sexo feminino foram selecionadas. Desta
forma, em vez de adicionar 500 entrevistas para aumentar a amostra em
100 homens, um adicional de 100 entrevistas sobre a amostra de base de
500 produziria um total de cerca de 200 entrevistas com homens. Assim,
ao fazer comparações entre masculino e feminino, ter-se-ia a precisão for-
necida por amostras de 200 respondentes do sexo masculino e 400 do
sexo feminino. Para combinar essas amostras, o pesquisador teria que dar
aos respondentes do sexo masculino o peso de metade do dado aos do
sexo feminino para compensar o fato de que eles foram amostrados duas
vezes a mais do que resto da população. (Ver Capítulo 10 para mais deta-
lhes sobre ponderação.)
Mesmo se membros individuais de um subgrupo de interesse não
possam ser identificados com certeza antes da amostragem, às vezes a
abordagem básica esboçada anteriormente pode ser aplicada. Por exem-
plo, é muito incomum ter uma lista de unidades habitacionais que identi-
fica a raça dos ocupantes antes do contato. Não é incomum, contudo, para
famílias asiáticas estarem mais concentradas em algumas áreas de vizi-
nhança do que em outras. Nesse caso, o pesquisador pode ser capaz de
amostrar domicílios em áreas que são predominantemente asiáticas em
uma taxa superior à média para aumentar o número de respondentes
asiáticos. Novamente, quando é dada a um grupo uma chance de seleção
diferente daquela dada a outros membros da população, um peso com-
pensatório apropriado é necessário a fim de gerar estatísticas precisas so-
bre a população para a amostra combinada ou total.
Uma terceira abordagem é a de ajustar a chance de seleção baseada
em informações recolhidas depois de fazer contato com respondentes em
potencial. Voltando ao levantamento dos estudantes universitários, se o
sexo dos estudantes não pôde ser verificado com antecedência, os pesquisa-
dores poderiam selecionar uma amostra inicial de 1000 estudantes, ter en-
trevistadores que verifiquem o sexo de cada um, e então realizar uma entre-
vista completa com todos os estudantes do sexo masculino (200), mas com
apenas a metade dos estudantes do sexo feminino (400). O resultado seria
exatamente o mesmo que com a abordagem descrita anteriormente.
Finalmente, outra razão técnica para usar diferentes probabilidades
de seleção por camadas deveria ser mencionada. Se o que está sendo
mensurado é muito mais variável em um grupo do que em outro, isso
pode ajudar a precisão da estimativa global resultante para destacar o
grupo com o maior nível de variabilidade. Groves (1989) fornece uma boa
descrição da lógica e de como avaliar a eficiência de tais projetos
AMOSTRAGEM MULTIESTÁGIO
Quando não há lista adequada de indivíduos em uma população e

não há forma de chegar à população diretamente, uma amostragem de
multiestágio fornece uma abordagem útil.
Na ausência de uma fonte direta de amostragem, uma estratégia é
necessária para ligar os membros da população a algum tipo de agrupa-
mentos que possa ser amostrado. Esses agrupamentos podem ser amostra-
dos como um primeiro estágio. Listas são feitas, então, de membros indivi-
duais dos grupos selecionados, com possivelmente uma seleção posterior a
partir da lista criada no segundo (ou posterior) estágio de amostragem. Na
terminologia de amostragem, os agrupamentos no último estágio de um
projeto de amostra são normalmente referidos como agrupamentos. A pró-
xima seção ilustra a estratégia geral para a amostragem multiestágio por
descrever seu uso em três dos tipos mais comuns de situações nas quais
listas de todos os indivíduos na população-alvo não estão disponíveis.
Amostragens de estudantes em escolas

Se alguém quisesse extrair uma amostra de todos os estudantes
matriculados nas escolas públicas de uma determinada cidade, não seria
surpreendente descobrir que não havia uma única lista completa de tais
indivíduos. Há, contudo, uma estrutura de amostra que possibilita chegar
até e incluir todos os estudantes na população desejada: a saber, a lista de
todas as escolas públicas naquela cidade. Devido ao fato de cada indiví-
duo na população de estudo poder ser anexado a uma e a apenas uma
daquelas unidades, uma amostra de estudantes perfeitamente aceitável
pode ser selecionada usando uma estratégia de dois estágios: primeiro
selecionando escolas (isto é, os agrupamentos) e então selecionando os
estudantes dessas escolas.
Suponha os seguintes dados:
Há 20000 estudantes em uma cidade com 40 escolas
Amostra desejada = 2000 = 1/10 de estudantes
Quatro planejamentos ou abordagens diferentes para formular amos-
tras são apresentados a seguir. Cada um produziria uma amostra de proba-
bilidade de 2000 estudantes.
Todas as quatro abordagens listadas produzem amostras de 2.000;

todas dão a cada estudante da cidade uma chance igual (1 em 10) de se-
leção. A diferença é que, do topo para a base, os projetos são cada vez
menos caros; as listas precisam ser coletadas de poucas escolas, e poucas
escolas precisam ser visitadas. Ao mesmo tempo, a precisão de cada amos-
tra é susceptível de diminuir à medida que menos escolas são amostradas
e mais estudantes por escola são amostrados. O efeito deste e de outros
projetos de multiestágio sobre a precisão das estimativas de amostra é
discutido em mais detalhes em uma seção posterior deste capítulo.
Probabilidade de X Probabilidade de Seleção = Probabilidade

Seleção no Estágio 1 no Estágio 2 (estudantes Total de seleção
(escolas) nas escolas selecionadas
(a) Selecione todas as 1/1 X 1/10 = 1/10
escolas, liste todos os
estudantes e selecione
1/10 estudantes em
(b) cada escola
(c) Selecione 1/2 ½ X 1/5 = 1/10

das escolas, então
selecione 1/5 de todos
os estudantes em cada
escola
(d) Selecione 1/5 1/5 X 1/2 = 1/10

das escolas, então
selecione 1/2 de todos
escola
(e) Selecione 1/10 1/10 X 1/1 = 1/10

escolas, então colete
informações sobre todos
escola
Amostragem de área de probabilidade

A amostragem de área de probabilidade é uma das estratégias multies-
tágio mais geralmente úteis devido a sua larga aplicabilidade. Ela pode ser
usada para amostrar qualquer população que possa ser definida geografica-
mente, por exemplo, as pessoas que vivem em um bairro, em uma cidade, em
um estado ou em um país. A abordagem básica é dividir a área total alvo em
exaustivas subáreas mutuamente exclusivas com limites identificáveis. Essas
subáreas são os agrupamentos. Uma amostra de subáreas é extraída. Uma
lista, em seguida, é feita das unidades habitacionais nas subáreas seleciona-
das, e uma amostra das unidades listadas é elaborada. Como uma etapa final,
todas as pessoas nas unidades habitacionais selecionadas podem ser incluídas
na amostra ou podem ser listadas e amostradas também.
Essa abordagem funcionará para selvas, desertos, áreas rurais es-
cassamente povoadas ou para áreas centrais em grandes cidades. Os pas-
sos específicos para tal amostra podem ser muito complicados. Os princí-
pios básicos, contudo, podem ser ilustrados descrevendo como se pode
amostrar a população de uma cidade usando os quarteirões da cidade
como unidades primárias de subáreas a serem selecionadas no primeiro
estágio da amostragem.
Considerando os dados a seguir:

Uma cidade consiste de 400 quarteirões
20 mil unidades habitacionais estão localizadas nesses quarteirões
Amostra desejada = 2 mil unidades habitacionais = 1/10 de todas
as unidades habitacionais
Dada essa informação, uma amostra de domicílios pode ser selecio-
nada usando uma estratégia paralela à seleção de estudantes anterior-
mente mencionada. No primeiro estágio da amostragem, quarteirões (isto
é, os agrupamentos) são selecionados. Durante a segunda etapa, todas as
unidades habitacionais nos quarteirões selecionados são listadas e uma
amostra é selecionada. A seguir, temos duas abordagens para selecionar
unidades habitacionais:
Probabilidade X Probabilidade de = Probabilidade total
de seleção seleção no Estágio 2 de seleção
Estágio 1 (unidades habitacionais
(quarteirões) nos quarteirões
selecionados)
(a) Selecione 80 1/5 X 1/2 = 1/10
quarteirões (1/5), então
pegue 1/2 das unidades
naqueles quarteirões
(b) Selecione 40 1/10 X 1/1 = 1/10
quarteirões (1/10), então
pegue todas as unidades
naqueles quarteirões
Paralelo ao exemplo da escola, a primeira abordagem, envolvendo

mais quarteirões, é mais cara do que a segunda; ela também provavel-
mente produzirá estimativas de amostra mais precisas para uma amostra
de um dado tamanho.
Nenhum dos esquemas de amostra citados leva em consideração o
tamanho dos agrupamentos do Estágio 1 (isto é, o tamanho dos quartei-
rões ou das escolas). Escolas e quarteirões grandes são selecionados na
mesma proporção dos pequenos. Se uma fração fixa de cada grupo sele-
cionado é tomada no último estágio, haverá mais entrevistas tomadas das
grandes escolas ou grandes quarteirões selecionados do que dos peque-
nos; o tamanho das amostras (tamanhos dos agrupamentos) tomadas no
Estágio 2 será muito divergente.
Se há informação disponível sobre o tamanho dos grupos do Está-
gio 1, geralmente é bom usá-la. Os projetos de amostra tendem a fornecer
estimativas mais precisas se o número de unidades selecionadas no passo
final de seleção é aproximadamente igual em todos os agrupamentos.

Outras vantagens de tais planos são que os erros de amostragem são mais
fáceis de calcular e o tamanho total da amostra é mais previsível. Para
produzir agrupamentos de tamanho igual, as unidades do Estágio 1 de-
vem ser amostradas em proporção ao seu tamanho.
Os exemplos a seguir mostram como os quarteirões poderiam ser
amostrados em proporção ao seu tamanho como o primeiro estágio da
abordagem de uma área de probabilidade para amostrar unidades habita-
cionais (apartamentos ou casas unifamiliares). A mesma abordagem po-
deria ser aplicada ao exemplo anterior da escola, tratando as escolas de
forma análoga aos quarteirões no seguinte processo.
1. Decida quantas unidades habitacionais serão selecionadas no úl-
timo estágio de amostragem – o tamanho médio do agrupamen-
to. Vamos escolher 10, por exemplo.
2. Faça uma estimativa do número de unidades habitacionais em
cada unidade do Estágio 1 (quarteirão).
3. Disponha os quarteirões de modo que estejam geograficamente
adjacentes ou de outra maneira similar. Isso efetivamente estratifi-
ca a amostragem para melhorar a amostra, como discutido antes.
4. Crie uma conta cumulativa estimada de unidades habitacionais
(UH) em todos os quarteirões. Isso resultará em uma tabela como
a abaixo.
Unidades Unidades habitacionais visitadas
Número do Unidades Habitacionais
Habitacionais (Início Aleatório = 70;
Quarteirão Estimadas
Cumulativas Intervalo = 100 UH)
1 43 43 -
2 87 130 70
3 99 229 170
4 27 256 -
5 15 271 270
Determine o intervalo entre os agrupamentos. Se queremos selecio-

nar 1 em cada 10 unidades habitacionais e um agrupamento de cerca de
10 em cada quarteirão, precisamos de um intervalo de 100 unidades ha-
bitacionais entre os agrupamentos. Dito de outra forma, em vez de pegar
1 casa em um intervalo de cada 10 casas, pegamos 10 casas em um inter-
valo de cada 100 casas; a taxa é a mesma, mas o padrão é agrupado.
Depois de primeiro escolher um número aleatório de 1 a 100 (o
intervalo do exemplo) como ponto de partida, prosseguimos sistematica-
mente por meio da contagem cumulativa, designando as unidades primá-

rias (ou quarteirões) atingidas nesta primeira fase de seleção. No exem-
plo, o início aleatório escolhido (70) falhou o quarteirão 1 (por 43 vezes
em 100 isso teria sido atingido); a 70ª unidade habitacional estava no
quarteirão 2; a 170ª unidade habitacional estava no quarteirão 3; e a 270a
unidade habitacional estava localizada no quarteirão 5.
Uma lista então é feita das unidades habitacionais nos quarteirões
selecionados (2, 3 e 5), normalmente enviando-se uma pessoa para visitá-
-los. O próximo passo é selecionar unidades habitacionais dessas listas. Se
estávamos certos de que as estimativas dos tamanhos dos quarteirões
eram precisas, poderíamos simplesmente selecionar 10 unidades habita-
cionais de cada quarteirão selecionado, usando uma amostragem aleató-
ria simples ou sistemática; uma amostra sistemática normalmente seria a
melhor porque distribuiria as unidades escolhidas pelo quarteirão.
É comum, para estimativas do tamanho do estágio 1, unidades tais
como os quarteirões estarem de alguma forma em erro. Podemos corrigi-
-los calculando a taxa em que as unidades habitacionais devem ser sele-
cionadas do quarteirão como:
(No quarteirão 2)
Taxa de seleção de UH = tamanho médio do agrupamento = 10 = 1

no quarteirão UH estimadas no quarteirão 87 8,7
No nosso exemplo, pegaríamos 1 por 8,7 unidades habitacionais

no quarteirão 2, 1 por 9,9 unidades habitacionais no quarteirão 3, e 1 por
1,5 unidades habitacionais no quarteirão 5. Se um quarteirão é maior do
que o esperado (por exemplo, por conta de uma construção nova), mais
de 10 unidades habitacionais serão extraídas; se é menor do que o espe-
rado (por exemplo, por conta de uma demolição), menos de 10 unidades
habitacionais serão retiradas. Se é exatamente o que esperávamos (por
exemplo, 87 unidades habitacionais no quarteirão 2), pegamos 10 unida-
des habitacionais (87) 8,7 = 10. Desta maneira, o procedimento é auto-
corretivo para erros nas estimativas iniciais do tamanho do quarteirão,
enquanto mantém a mesma chance de seleção para as unidades habita-
cionais em todos os quarteirões. Não importa a estimativa ou o tamanho
real do quarteirão, a chance de cada unidade habitacional ser seleciona-
da é 1 em 10.
A abordagem da área de amostra probabilística pode ser usada para
amostrar qualquer população geograficamente definida. Embora os pas-
sos sejam mais complicados conforme a área fica maior, a abordagem é a

mesma. Os passos-chave para lembrar são os seguintes:
• A todas as áreas deve ser dada alguma chance de seleção. Com-
bine áreas onde nenhuma unidade é esperada com áreas adja-
centes para garantir uma chance de seleção; novas construções
podem ter ocorrido ou as estimativas podem estar erradas.
• A probabilidade de selecionar um quarteirão (ou outra área de
terra) vezes a probabilidade de selecionar uma unidade habita-
cional de um quarteirão selecionado deve ser constante em todos
os quarteirões.
• Finalmente, mesmo os compiladores de campo mais cuidadosos
vão deixar escapar algumas unidades habitacionais. Portanto, é
uma boa prática incluir verificações das unidades perdidas no
momento da coleta de dados.
Discagem aleatória de dígitos

A discagem de dígito aleatória (RDD – Random-digit dialing) forne-
ce uma forma alternativa para formular uma amostra de unidades habita-
cionais a fim de amostrar as pessoas naqueles domicílios. Suponha que as
20 mil unidades habitacionais no exemplo anterior são abrangidas por
seis centrais telefônicas. Pode-se tirar a amostra probabilística de 10% das
unidades habitacionais que têm telefones, como se segue:
1. Há um total de 60 mil números de telefone possíveis naquelas 6
centrais (10 mil por central). Selecione 6 mil daqueles números
(ou seja, 10%), extraindo, de cada central, mil números de qua-
tro dígitos randomicamente gerados.
2. Disque todos os 6 mil números. Nem todos os números serão
domésticos; na verdade, muitos dos números não vão estar fun-
cionando, estarão desconectados ou temporariamente fora de
serviço, ou serão empresas. Devido ao fato de 10% de todos os
números de telefone possíveis que poderiam servir à área terem
sido chamados, cerca de 10% de todas as residências com tele-
fones naquela área serão alcançadas chamando a amostra de
números.
Esta é a abordagem da discagem aleatória de dígitos para amostra-

gens. A desvantagem óbvia dessa abordagem é o grande número de liga-
ções improdutivas. Nacionalmente, menos de 25% dos números possíveis
são associados com residências; a taxa é de cerca 30% nas áreas urbanas
e de 10% nas áreas rurais. Waksberg (1978) desenvolveu um método para
aproveitar o fato de que os telefones são ordenados em grupos. Cada gru-
po de 100 números de telefone é definido por um código de área de três
dígitos, por um intervalo de três dígitos e por dois números adicionais
(código de área- 4702-82xx). Por meio da realização de uma triagem ini-
cial dos números por chamar um número aleatório em uma amostra de
grupos, e então chamando números aleatórios adicionais apenas dentro
do grupo de números onde um número residencial foi encontrado, a taxa
de unidades habitacionais atingidas pode ser elevada a mais de 50%. Nes-
te esquema, os grupos de 100 números de telefone são os agrupamentos.
Nos últimos anos, a maioria das organizações de pesquisa tem co-
meçado a usar uma lista assistida de abordagem à discagem aleatória de
dígitos. Com o avanço da tecnologia computacional, as companhias po-
dem compilar versões computadorizadas de listas telefônicas. Essas listas
são atualizadas a cada três meses. Uma vez que todas estão em um arqui-
vo de computador, uma pesquisa pode produzir todos os agrupamentos
(código de área- 4702-82xx) que tenham pelo menos um número de tele-
fone residencial publicado. Essas companhias podem então produzir a
estrutura da amostra de todos os números de telefone possíveis nos agru-
pamentos que têm pelo menos um número de telefone residencial publi-
cado. A amostragem pode agora ser conduzida usando essa estrutura de
amostra. Esta abordagem tem duas vantagens distintas. A primeira é que a
triagem inicial de números de telefone requerida pelo método de Waksberg
não é mais necessária. A constrição da estrutura da amostra já o realizou. A
segunda vantagem é que a amostra selecionada usando essa estrutura não
é mais agrupada. Usando-se todos os agrupamentos que possuem núme-
ros de telefone residencial como uma estrutura da amostra, uma amostra
simples ou sistemática aleatória de números de telefone pode ser extraí-
da. Essa nova abordagem à discagem aleatória de dígitos é mais rentável
e eficiente do que as anteriores. Uma limitação é que números de telefone
em agrupamentos que não têm números de telefone residenciais listados
não têm chance de seleção. Brick, Waksberg, Kulp e Starer (1995) estima-
ram que, em média, cerca de 4% das famílias com serviço de telefone nos
Estados Unidos são deixadas de fora. Lepkowski (1988) fornece um bom
resumo de várias formas de produzir amostras de números de telefone a
fim de amostrar famílias.
O acúmulo de listas de indivíduos e suas características fez possível
alguns avanços para levantamentos por telefone. Um deles, comparativa-
mente simples, é que diretórios de telefone invertidos podem ser usados para
vincular endereços a alguns números de telefone. Um dos inconvenientes da
discagem aleatória de dígitos é que as famílias não são notificadas de que um
entrevistador irá ligar. As listas possibilitam separar os números selecionados
em grupos (ou camadas) baseados em se há ou não um endereço residencial
conhecido associado ao número. Para aqueles em que há um endereço conhe-
cido, uma carta pode ser enviada com antecedência.
Mais elaboradamente, se há listas de pessoas que têm características
conhecidas que são alvo de um levantamento – uma faixa etária, aqueles que
vivem em uma determinada área geográfica, pessoas que doam a uma deter-
minada instituição de caridade – uma camada pode ser feita dos números de
telefone que são prováveis de se conectar com famílias que estão sendo o
alvo. Os números na outra camada ou para os quais a informação não está
disponível podem ser amostrados em taxas mais baixas, dando, desse modo,
a todas as famílias uma chance conhecida de seleção, mas aumentando a
eficiência da coleta de dados por concentrar mais esforços nas famílias prová-
veis de fornecer respondentes capacitados. Note que se as probabilidades de
seleção não são as mesmas para todos os respondentes, a ponderação deve
ser usada no estágio de análise, como descrito no Capítulo 10.
Há varias questões adicionais para notar sobre a abordagem da dis-
cagem aleatória de dígitos para produzir amostragens. Primeiro, o seu valor
depende do fato de que a maioria das famílias possui serviço de telefone.
Nacionalmente, apenas cerca de 5% das famílias não têm serviço domésti-
co, mas em algumas áreas, particularmente nas grandes cidades ou nas
áreas rurais, a taxa de omissão pode ser maior do que aquela. O uso cres-
cente de telefones celulares individuais também tem representado um pro-
blema crescente para as amostragens produzidas a partir da discagem
aleatória de dígitos. A mais atual amostragem por discagem aleatória de
dígitos foca apenas em serviços domésticos e evita a troca consagrada ao
uso de telefones celulares. É possível produzir amostras a partir de ambos
os tipos de serviço, mas a complexidade da amostragem, a coleta de dados
e a ponderação pós-levantamento são muito melhores se números de celu-
lar são incluídos nas estruturas da amostra (Brick, Diplo, Presser, Tucker e
Yuan, 2006; Lavraskas, Shuttles, Steeh e Fienberg, 2007).
Para dar um exemplo da complexidade: amostragens baseadas em dis-
cagem aleatória de dígitos usam códigos de área para atingir populações em
áreas geográficas definidas. Contudo, números de telefones celulares são
muito menos ligados ao lugar em que as pessoas realmente vivem. Um levan-
tamento baseado em códigos de área de telefones celulares alcançará algu-
mas pessoas que vivem fora da área geográfica alvo e, pior, omitirá aqueles
que vivem na área mas que têm celulares com códigos de área distantes.
Como qualquer abordagem particular de amostragem, a discagem
aleatória de dígitos não é o melhor modelo para todas as pesquisas. Prós
e contras adicionais serão discutidos no Capítulo 5. A introdução da dis-
cagem aleatória de dígitos como uma opção de amostragem, contudo, fez
uma grande contribuição para expandir as capacidades de pesquisa nos
últimos 30 anos. Com o impacto a longo prazo dos celulares e o problema
das taxas de resposta (discutido no Capítulo 5), o uso futuro da discagem
aleatória de dígitos continua a ser visado.
Seleção de respondentes
Tanto as amostras por área de probabilidade quanto a discagem
aleatória de dígitos designam uma amostra de unidades habitacionais. Há,
então, a questão posterior de quem no domicílio deve ser entrevistado.
A melhor decisão depende de que tipo de informação está sendo
reunida. Em alguns estudos, a informação que está sendo reunida é sobre
a família e sobre todas as pessoas na família. Se a informação é comumen-
te conhecida e fácil de relatar, talvez qualquer adulto que esteja em casa
possa responder às perguntas. Se a informação é mais especializada, o
pesquisador pode querer entrevistar o membro da família que é mais ex-
periente. Por exemplo, na National Health Interview Survey,* a pessoa que
“mais sabe sobre a saúde da família” será quem vai responder às questões
que envolvem todos os membros da família.
Há, porém, várias coisas que um indivíduo pode relatar apenas por
si próprio. Os pesquisadores quase universalmente acreditam que nenhum
indivíduo pode relatar sentimentos, opiniões ou conhecimentos por algu-
ma outra pessoa. Há também muitos comportamentos ou experiências
(por exemplo, o que as pessoas comeram ou beberam, o que compraram,
o que viram ou o que lhes foi dito) que normalmente apenas podem ser
reportados precisamente por autorrelatos.
Quando um estudo de variáveis para as quais apenas o autorrelato
é apropriado, o processo de produção da amostragem precisa ir além da
seleção de famílias para amostrar indivíduos específicos dentro daqueles
domicílios. Uma abordagem é entrevistar todas as pessoas elegíveis em
uma família. (Portanto, não há amostragem nesta fase.) Devido à homo-
geneidade dentro da família, porém, bem como às preocupações acerca
do fato de um respondente influenciar as respostas do seguinte, é mais
*
N. de R.T.: Levantamento Nacional de Saúde.
comum designar apenas um respondente por domicílio. Obviamente, pe-

gar a pessoa que atende ao telefone ou à porta seria uma maneira não
probabilística e potencialmente tendenciosa de selecionar indivíduos; a
discrição do entrevistador e do respondente e a disponibilidade (que está
relacionada ao status profissional, ao estilo de vida, à idade) poderia afe-
tar quem acabou sendo o entrevistado. O princípio-chave da amostragem
probabilística é que a seleção é realizada por meio de alguma mudança ou
processo aleatório que designa pessoas específicas. O procedimento para
gerar uma probabilidade de seleção de respondentes dentro das famílias
envolve três etapas:
1. Verificar quantas pessoas que vivem na casa são capazes de res-
ponder (por exemplo, quantas têm 18 anos ou mais).
2. Numerá-las da mesma forma em todas as casas (por exemplo,
por ordem decrescente de idade).
3. Ter um procedimento que objetivamente designa uma pessoa
para ser o respondente.
Kish (1949) criou um procedimento detalhado para designar respon-

dentes utilizando um conjunto de tabelas aleatórias que ainda é usado atual-
mente. Quando a entrevista é assistida por computador, é fácil fazer com que
ele selecione um dos membros elegíveis da família. As características essen-
ciais do processo de seleção são que nenhum critério está envolvido e que
todas as pessoas nos domicílios selecionados têm uma probabilidade de sele-
ção conhecida (e não zero). Groves e Lyberg (1988) revisaram várias estra-
tégias para simplificar os procedimentos de seleção de respondentes.
Uma das preocupações acerca dos procedimentos de seleção de res-
pondentes é que a interação inicial quando do primeiro contato com al-
guém é fundamental para assegurar a cooperação. Se o procedimento de
seleção é muito incômodo ou parece intrusivo, isso pode afetar negativa-
mente a taxa de respondentes. Portanto, têm havido vários esforços para
encontrar melhores formas de amostrar adultos nas famílias selecionadas.
Um método popular é do “último aniversário”. Pede-se à pessoa
contatada para que identifique o adulto que fez aniversário mais recente-
mente, e esta pessoa é o respondente designado. Em princípio, esta deve-
ria ser uma forma imparcial para selecionar respondentes. Na prática,
depende do fato de se o contato inicial colheu informações sobre o aniver-
sário de todos os membros da família.
Outra abordagem de seleção relativamente nova é selecionar a pessoa
com quem o entrevistador falou primeiro. Primeiro, o número de pessoas
elegíveis na residência é determinado. Se há dois ou mais, um algoritmo alea-

tório escolhe se o informante inicial na taxa adequada ou escolhe entre os
“outros” adultos elegíveis (se há mais de um) (Rizzo, Brick e Park, 2004).
Sem importar como o respondente é escolhido, quando apenas uma
pessoa é entrevistada em uma família, ele ou ela obviamente será o res-
pondente se a família for selecionada. Em contraste, um adulto que vive
em uma família de três adultos apenas será o respondente um terço do
tempo. Sempre que um grupo identificável é selecionado em uma taxa
diferente da dos outros, pesos são necessários para que as pessoas hipera-
mostradas não sejam hiper-representadas nas estatísticas da amostra. No
exemplo anterior neste capítulo, quando estudantes do sexo masculino
foram selecionados com o dobro da taxa de estudantes do sexo feminino,
suas respostas foram ponderadas pela metade e assim sua proporção pon-
derada da amostra seriam as mesmas da população. A mesma abordagem
geral se aplica quando um respondente é escolhido em famílias com nú-
mero variável de pessoas elegíveis.
A maneira mais simples de ajustar para o efeito de selecionar um
respondente por domicílio é pesar cada resposta pelo número de pessoas
elegíveis naquela família. Assim, se há três adultos, o peso é três; se há dois
adultos elegíveis, o peso é dois; e se há apenas um adulto, o peso é um. Se
um esquema de ponderação é correto, a probabilidade de seleção vezes o
peso é o mesmo para todos os respondentes. (Ver o Capítulo 10.)
FAZENDO ESTIMATIVAS A PARTIR DE

AMOSTRAS E DE ERROS DE AMOSTRAGEM
As estratégias de amostragem apresentadas anteriormente foram

escolhidas porque estão entre as mais comumente usadas e ilustram as
principais opções de esquemas de amostragem. Um esquemas de amostra
probabilística eventualmente designará um conjunto específico de domi-
cílios ou indivíduos sem a interferência de pesquisadores ou responden-
tes. As ferramentas básicas disponíveis para o pesquisador são a amostra
aleatória e a amostragem sistemática, que são modificadas pela estratifi-
cação, taxas desiguais de seleção e agrupamento. A escolha de uma estra-
tégia de amostragem repousa, em parte, sobre a viabilidade e sobre os
custos; isso também envolve a precisão das estimativas da amostra. A
principal razão para o uso de métodos de probabilidade de amostragem é
permitir o uso de uma variedade de ferramentas estatísticas para estimar
a precisão das estimativas de amostra. Nesta seção, o cálculo de tais esti-

mativas e como elas são afetadas pelas características do desenho da
amostra são discutidos.
Os pesquisadores normalmente não têm interesse nas característi-
cas de uma amostra em si. A razão para coletar dados sobre uma amostra
é alcançar conclusões acerca de uma população inteira. Questões estatís-
ticas e de projeto são consideradas, neste capítulo, no contexto de quanta
confiança se pode ter de que uma amostra descreve precisamente a popu-
lação como um todo.
Como descrito no Capítulo 2, uma forma de pensar sobre os erros
de amostragem é pensar na distribuição de médias que se pode obter se
várias amostras forem extraídas da mesma população com o mesmo pro-
cedimento. Embora algumas fontes de erro em levantamentos sejam po-
larizadas e produzam cálculos sistematicamente distorcidos, os erros de
amostragem são um resultado aleatório (e, portanto, não uma polariza-
ção sistemática) da amostragem. Quando procedimentos de probabilida-
de são usados para selecionar uma amostra, é possível calcular quanto as
estimativas de amostra podem variar devido à amostragem.
Se um número infinito de amostras é extraído, as estimativas da
amostra de estatísticas descritivas (por exemplo, as médias) formarão
uma distribuição normal em torno do verdadeiro valor da população.
Quando maior o tamanho da amostra e menor a variância do que está
sendo medido, mais rigorosamente as estimativas irão se agrupar em tor-
no do verdadeiro valor da população, e mais precisa uma estimativa ba-
seada em amostra normalmente será. Esta variação em torno do valor
verdadeiro, decorrente do fato de que as amostras podem diferir da popu-
lação como um todo, é chamada de “erro de amostragem”. Estimar os li-
mites de confiança que se pode ter em uma estimativa da amostra, dada
a chance normal de variabilidade de amostragem, é uma parte importan-
te da avaliação dos cálculos derivados de levantamentos.
O projeto da seleção de amostra (especificamente se isso envolve
estratificação, agrupamento ou probabilidades de seleção desiguais) afeta
as estimativas de erros de amostragem para uma amostra de um dado
tamanho. A abordagem usual para descrever erros de amostragem, contu-
do, é calcular o que eles seriam para uma amostra aleatória simples, e
então calcular os efeitos de variação de um plano de amostragem aleató-
ria simples. Portanto, o cálculo dos erros da amostragem para amostras
aleatórias simples é descrito primeiro.
Erros de amostragem para amostras aleatórias simples

Este não é um livro sobre amostragens estatísticas. Estimar a quan-
tidade de erros que se pode esperar do projeto de uma amostra em parti-
cular, contudo, é uma parte básica do processo de planejamento do levan-
tamento. Além disso, os pesquisadores rotineiramente abastecem os leito-
res com orientações acerca dos erros atribuíveis à amostragem, orienta-
ções que tanto os leitores informados quanto os usuários dos dados de
pesquisas devem saber e entender. Para este fim, uma noção de como o
erro de amostragem é calculado é uma parte necessária para entender
todo o processo de levantamento.
Embora a mesma lógica se aplique a todas as estatísticas calculadas a
partir de uma amostra, as estimativas de levantamentos mais comuns são
as médias e as proporções. A estatística mais frequentemente usada para
descrever erros de amostragem é chamada de erro padrão (da média). Isso
é o desvio padrão da distribuição de estimativas de amostra de médias que
seria formado se um número infinito de amostras de determinado tamanho
fosse extraído. Quando o valor de um erro padrão foi estimado, pode-se di-
zer que 67% das médias de amostras de um dado tamanho e formato cairão
dentro do intervalo de ±1 erro padrão da média verdadeira da população;
95% de tais amostras cairão dentro do intervalo de ±2 erros padrão. O úl-
timo valor (±2 erros padrão) muitas vezes é relatado como o “intervalo de
confiança” em torno de uma estimativa de amostra.
A estimativa do erro padrão de uma média é calculada a partir da
variação e do tamanho da amostra a partir da qual isso foi calculado:

EP = √ Var
n
EP = erro padrão de uma média
Var = a variação (soma dos desvios quadrático da média da amos-
tra sobre n)
n = tamanho da amostra
O tipo mais comum de média calculada a partir de um levantamen-

to de amostras é provavelmente a porcentagem de uma amostra que tem
uma determinada característica ou que fornece uma determinada respos-
ta. Isso pode ser útil para mostrar como uma porcentagem é a média de
uma distribuição de dois valores.
Uma média é uma média. Isso é calculado como a soma dos valores
divididos pelo número de casos: ∑x/n. Agora suponha que existam ape-
nas dois valores, 0 (não) e 1 (sim). Há 50 casos em uma amostra; 20 di-

zem “sim” quando perguntados se são casados, e o resto diz “não”. Se há
20 respostas “sim” e 30 respostas “não”, calcule a média como
∑ x (20 x 1 + 30 x 0) 20
= = = 0,40
n 50 50
Uma declaração de percentual, como 40% dos respondentes são ca-
sados, é apenas uma afirmação sobre a média de uma distribuição 1/0; a
média é 0,40. O cálculo de erros padrão de porcentagens é facilitado pelo
fato de que a variação de uma porcentagem pode ser calculada facilmente
como p x (1 – p), em que p = porcentagem que tem uma característica (por
exemplo, os 40% de casados no exemplo anterior) e ( 1 – p) é a porcenta-
gem a qual falta a característica (por exemplo, os 60% de não casados).
Nós já vimos que o erro padrão de uma média é como segue:
EP = √ Var
n
Porque p(1 – p) é a variação de uma porcentagem,

EP = √ p(1–p)
n
é o erro padrão de uma porcentagem. No exemplo anterior, com 40% da

amostra de 50 pessoas sendo casada, o erro padrão daquela estimativa
poderia ser como segue:

SE = √ p(1–p)
n
= √ 0,40 x 0,60
50
= √
0,24
50
= 00,7
Assim poderíamos estimar que a probabilidade é 0,67 (ou seja, ± 1

erro padrão da média da amostra) que o valor verdadeiro da população (a
porcentagem de toda a população que é casada) está entre 0,33 e 0,47
(0,40 ± 0,07). Estamos 95% confiantes de que o valor verdadeiro da po-
pulação está dentro de dois erros padrão de nossa média de amostra, ou
seja, entre 0,26 e 0,54 (0,40 ± 0,14).
A Tabela 3.1 é uma tabela generalizada de erros de amostragem
para amostras de vários tamanhos e para várias porcentagens, visto que
as amostras foram selecionadas como amostras aleatórias simples. Cada
número na tabela representa dois erros padrão de uma porcentagem.
Dado o conhecimento (ou uma estimativa) da porcentagem de uma amos-
tra que fornece uma determinada resposta, a tabela oferece 95% de inter-
valos de confiança para vários tamanhos de amostra. No exemplo anterior,

com 50 casos rendendo uma estimativa de amostra de 40% de casados, a
tabela relata um intervalo de confiança próximo de 0,14, como calculamos.
Se uma amostra de cerca de 100 casos produziu uma estimativa de que
20% eram casados, a tabela diz que nós podemos estar 95% certos de que
o número real é 20% ± 8 pontos percentuais (ou seja, de 12 a 28%).
Vários pontos sobre a tabela não são relevantes. Em primeiro lugar,
pode-se observar que amostras cada vez maiores sempre reduzem erros
de amostragem. Segundo, também podemos observar que adicionar um
dado número de casos a uma amostra reduz os erros de amostragem mui-
to mais quando a amostra é pequena do que quando é comparativamente
grande. Por exemplo, adicionar 50 casos a uma amostra de 50 produz
uma notável redução nos erros de amostragem. Adicionar 50 casos a uma
amostra de 500, contudo, produz um aumento praticamente imperceptí-
vel na precisão geral das estimativas de amostra.
Em terceiro lugar, pode-se observar que o tamanho absoluto do erro
de amostragem é maior em torno de porcentagens de 0,5 e diminui à me-
dida que uma amostra tem uma característica que se aproxima de 0 ou de
100%. Temos visto que erros padrão são diretamente relacionados com
variações. A variação p(1 – p) é menor quanto mais as porcentagens se
distanciam de 0,5. Quando p = 0,5, (0,5 x 0,5) = 0,25. Quando p = 0,2,
(0,2 x 0,8) = 0,16.
Em quarto lugar, a Tabela 3.1 e as equações nas quais ela é baseada
se aplicam a amostras colhidas com procedimentos de amostragem alea-
tória simples. A maioria das amostras de populações gerais não são amos-
tras aleatórias simples. A extensão em que o projeto particular de amostra
vai afetar os cálculos de erro de amostragem varia de projeto para projeto
e por diferentes variáveis no mesmo levantamento. Na maioria das vezes,
a Tabela 3.1 constituirá uma subestimação dos erros de amostragem para
uma amostra geral de população.
Finalmente, deve ser enfatizado que a variabilidade refletida na Ta-
bela 3.1 descreve o potencial de erros que vêm do fato de se produzir uma
amostra em vez de se coletar informações sobre cada indivíduo em uma
população. Os cálculos não incluem estimativas de erro de nenhum outro
aspecto do processo de pesquisa.
Tabela 3.1 Intervalos de confiança para variabilidade atribuível à amostragem*

Percentual de amostras com característica
Tamanho da
5/95 10/90 20/80 30/70 50/50
Amostra
35 7 10 14 15 17
50 6 8 11 13 14
75 5 7 9 11 12
100 4 6 8 9 10
200 3 4 6 6 7
300 3 3 5 5 6
500 2 3 4 4 4
1.000 1 2 3 3 3
1.500 1 2 2 2 2
NOTA: As chances são de 95 em 100 de que o valor real da população se encontre entre o intervalo definido
pelo número ± indicado na tabela, dada a porcentagem da amostra que relata a característica e o número de
casos de amostra nos quais a porcentagem é baseada.
* Esta tabela descreve as variabilidades atribuíveis à amostragem. Erros resultantes da ausência de resposta ou
erros de relato não são refletidos nesta tabela. Também, esta tabela assume uma amostra aleatória simples. As
estimativas podem estar sujeitas a mais variabilidades do que esta tabela indica por conta do projeto de amos-
tra ou da influencia dos entrevistadores sobre as respostas obtidas; a estratificação pode reduzir os erros de
amostragem abaixo daqueles indicados aqui.
Efeitos de outras características de projetos de amostras

A discussão anterior descreve o cálculo de erros de amostragem para
amostras aleatórias simples. As estimativas dos erros de amostragem serão
afetadas por diferentes procedimentos de amostragem. A amostragem sis-
temática deve produzir erros equivalentes aos das amostras aleatórias sim-
ples se não há estratificação. Amostras estratificadas podem produzir erros
que são menores do que aqueles associados a amostras aleatórias simples
do mesmo tamanho por variáveis que diferem (em média) por camadas, se
as taxas de seleção são constantes ao longo da camada.
Taxas desiguais de seleção (selecionar subgrupos na população em
diferentes taxas) são projetadas para melhorar a precisão de estimativas
para grupos sobreamostrados, assim
(a) elas geralmente irão produzir erros de amostragem para toda a
amostra que são maiores do que aqueles associados a amostras
aleatórias simples do mesmo tamanho, para variáveis que dife-
rem por camada, exceto
(b) quando a sobreamostragem é apontada na camada que tem
mais variações do que a média para algumas variáveis, os erros
de amostragem para aquelas variáveis serão menores do que

para uma amostra aleatória simples do mesmo tamanho.
Agrupamentos tendem a produzir erros de amostragem que são

maiores do que aqueles associados a amostras aleatórias simples do mes-
mo tamanho para variáveis que são mais homogêneas nos agrupamentos
do que na população como um todo. Também, quanto maior o tamanho
do agrupamento na última etapa, maiores normalmente serão os impac-
tos sobre os erros de amostragem.
Frequentemente não é fácil antecipar os efeitos das características
do projeto sobre a precisão das estimativas. Eles diferem de estudo para
estudo e por diferentes variáveis na mesma pesquisa. Para ilustrar, supo-
nha que cada casa nos vários quarteirões selecionados eram as mesmas
com respeito ao tipo de construção e se eram ou não ocupadas pelos pro-
prietários. Uma vez que um respondente em um quarteirão relate que é
proprietário de uma casa, as entrevistas adicionais naquele quarteirão ab-
solutamente não produziriam informação nova sobre a taxa de proprieda-
de de casas na população como um todo. Por essa razão, quer o pesquisa-
dor faça 1 ou 20 entrevistas por quarteirão, a confiabilidade daquela esti-
mativa seria exatamente a mesma, basicamente proporcional ao número
de quarteirões dos quais nenhuma entrevista foi tomada. No outro extre-
mo, a estatura dos adultos é provável de variar tanto dentro de um quar-
teirão quanto em toda a cidade. Se os respondentes em um quarteirão são
tão heterogêneos quanto à população como um todo, o agrupamento não
diminui a precisão das estimativas de altura a partir de uma amostra de
um dado tamanho. Assim, deve-se olhar para a natureza do agrupamento
ou da camada e que estimativas devem ser feitas a fim de avaliar o efeito
provável do agrupamento em erros de amostragem.
Os efeitos do projeto de amostra sobre os erros de amostragem nor-
malmente são pouco apreciados. Não é incomum ver relatos de intervalos
de confiança que assumem amostragem aleatória simples quando o proje-
to foi agrupado. Também não é simples questão de prever com antecedên-
cia o tamanho dos efeitos do projeto. Como notado, os efeitos do projeto
da amostra sobre os erros de amostragem são diferentes para cada variá-
vel; seu cálculo é particularmente complicado quando um projeto de
amostra tem vários desvios da amostragem aleatória simples, como agru-
pamento e estratificação. Devido ao fato de a habilidade para calcular
erros de amostragem ser uma das principais forças do método de levanta-
mento, é importante que uma estratificação seja envolvida em um levan-
tamento com um complexo projeto da amostra para garantir que os erros

de amostragem são calculados e relatados apropriadamente. O problema
de levar em consideração apropriadamente as características do projeto
quando da estimativa dos erros de amostragem vem sendo muito simpli-
ficado pelo fato de que vários pacotes de análise disponíveis farão tais
ajustes. (Ver o Capítulo 10.)
Finalmente, a adequação de qualquer característica do projeto de
amostra pode ser avaliada apenas no contexto dos objetivos do levanta-
mento total. Projetos agrupados são prováveis de economizar dinheiro tan-
to na amostragem (lista) quanto na coleta de dados. Além disso, é comum
encontrar muitas variáveis para as quais agrupamento não inflam muito os
erros de amostragem. Como a maioria das questões discutidas neste livro,
o ponto importante para um pesquisador é que ele seja consciente dos pos-
síveis custos e benefícios das opções e pesá-las no contexto de todas as op-
ções de projeto e os principais propósitos do levantamento.
DE QUE TAMANHO DEVE SER UMA AMOSTRA?
Das muitas questões envolvidas no projeto de amostras, umas das

mais comuns colocadas para um metodologista é quão grande uma amos-
tra de levantamento deve ser. Antes de fornecer uma abordagem para
responder a essa questão, talvez seja adequado discutir três formas co-
muns, mas inapropriadas, de respondê-la.
Um equivoco comum é que a adequação de uma amostra depende
profundamente da fração da população incluída naquela amostra – que
de alguma maneira 1%, 5%, ou alguma outra porcentagem de uma popu-
lação fará uma amostra verossímil. As estimativas de erros de amostra-
gem discutidas anteriormente não levam em consideração a fração de
uma população incluída em uma amostra. As estimativas de erros de
amostragem das equações precedentes e da Tabela 3.1 podem ser reduzi-
das multiplicando-as pelo valor (1 - f), onde f = a fração da população
incluída em uma amostra. Quando uma amostragem é de 10 % da popu-
lação, esse ajuste pode ter um efeito perceptível sobre as estimativas dos
erros de amostragem. A grande maioria das amostras de levantamento,
contudo, envolve frações muito pequenas da população. Em tais casos,
pequenos incrementos nas frações de uma população incluída em uma
amostra não terão efeito sobre a capacidade de um pesquisador para ge-
neralizar a partir de uma amostra para uma população.
O oposto desse princípio também deve ser notado. O tamanho de

uma população a partir da qual uma amostra de um tamanho particular é
retirada tem praticamente nenhum impacto sobre quão bem aquela amos-
tra é provável de descrever a população. Uma amostra de 150 pessoas des-
creverá uma população de 15 mil ou de 15 milhões com praticamente o
mesmo grau de precisão, presumindo que todos os outros aspectos de pro-
jeto de amostra e procedimentos de amostragem são os mesmos. Compara-
do ao tamanho total da amostra e a outras características do projeto, tais
como agrupamento, o impacto da fração da população amostrada sobre os
erros de amostragem normalmente é trivial. É incomum que isso seja uma
consideração importante ao decidir sobre o tamanho da amostra.
Uma segunda abordagem inapropriada para decidir sobre o tama-
nho da amostra é um pouco mais fácil de entender. Algumas pessoas fo-
ram expostas aos chamados padrões de estudos de levantamento e, a par-
tir disso, derivaram um típico ou adequado tamanho de amostra. Assim,
algumas pessoas vão dizer que levantamentos ideais de amostras nacio-
nais geralmente são de 1500, ou que amostras ideais da comunidade são
de 500. Naturalmente não é tolo olhar o que outros pesquisadores compe-
tentes têm considerado como um tamanho adequado de amostra de uma
população particular. A decisão do tamanho da amostra, contudo, como a
maioria das outras decisões de projeto, devem ser feitas caso a caso, com
os pesquisadores considerando a variedade de objetivos a serem alcança-
dos por um determinado estudo e levando em consideração vários outros
aspectos do projeto de pesquisa.
Uma terceira abordagem errada para decidir sobre o tamanho da
amostra é a mais importante de se falar, por poder ser encontrada em
vários livros sobre estatística. A abordagem é assim: Um pesquisador deve
decidir qual margem de erro ele pode tolerar ou qual precisão é requerida
das estimativas. Uma vez que se sabe a necessidade de precisão, usa-se
simplesmente uma tabela tal como a Tabela 3.1, ou variações adequadas
dela, para calcular o tamanho necessário da amostra para alcançar o nível
de precisão desejado.
Do ponto de vista teórico, não há nada errado com essa abordagem.
Na prática, contudo, isso fornece pouca ajuda para a maioria dos pesqui-
sadores que estão tentando projetar estudos reais. Primeiro, não é comum
basear a decisão sobre o tamanho da amostra na necessidade de precisão
de uma única estimativa. A maioria dos estudos de levantamento são pro-
jetados para fazer várias estimativas, e a precisão necessária para essas
estimativas provavelmente varia.
Além disso, não é comum para um pesquisador estar apto a especifi-

car o nível de precisão desejado mais do que de uma maneira geral. É ape-
nas uma exceção, mais do que uma situação comum, quando uma margem
específica aceitável de erros pode ser especificada com antecedência. Mes-
mo em último caso, a abordagem citada implica que o erro de amostragem
é a única ou a principal fonte de erros em uma estimativa de pesquisa.
Quando um nível de precisão necessário de uma amostra de pesquisa é es-
pecificado, isso geralmente ignora o fato de que haverá erros de outras
fontes que não a amostragem. Em tais casos, o cálculo de precisão baseado
no erro de amostragem é apenas uma simplificação irrealista. Além disso,
dados os recursos fixos, aumentar o tamanho da amostra pode até mesmo
diminuir a precisão por reduzir os recursos devotados às taxas de resposta,
à formulação das perguntas ou à qualidade da coleta de dados.
As estimativas de erros de amostragem são relacionadas ao tama-
nho da amostra, desempenham um papel na análise de quão grande uma
amostra deve ser. Este papel, contudo, é complicado.
O primeiro pré-requisito para determinar o tamanho da amostra é
um plano de análise. O componente-chave do plano de análise normalmen-
te não é uma estimativa de intervalos de confiança para a amostra total,
mas antes um esboço dos subgrupos dentro da população total para os
quais estimativas separadas são necessárias, junto com algumas estimativas
da fração da população que cairá dentro daqueles subgrupos. Tipicamente,
o processo de formulação se move rapidamente para identificar os grupos
menores dentro da população para a qual números são necessários. O pes-
quisador então estima o tamanho necessário da amostra a fim de que seja
minimamente adequada a esses subgrupos pequenos. A maioria das deci-
sões sobre o tamanho da amostra não focam nas estimativas para a popula-
ção total; antes, elas são concentradas nos tamanhos mínimos de amostra
que podem ser tolerados para os menores subgrupos de importância.
O processo então se volta para a Tabela 3.1, não para a parte mais
cara, mas para a menos dispendiosa da continuidade do tamanho da
amostra. São adequadas 50 observações? Se estudarmos a Tabela 3.1,
podemos ver que a precisão aumenta constantemente até os tamanhos de
amostra de 150 a 200. Depois desse ponto, há um ganho muito mais mo-
desto para aumentar o tamanho da amostra.
Como a maioria das decisões relacionadas ao projeto de pesquisa,
raramente há uma resposta definitiva sobre quão grande uma amostra deve
ser para qualquer dado estudo. Há muitas formas de aumentar a confiabili-
dade das estimativas de levantamento. Aumentar o tamanho da amostra é
uma delas. Mesmo se não se pode dizer que há uma única resposta correta,
contudo, pode ser dito que há três abordagens para decidir sobre o tama-
nho da amostra que são inadequadas. Especificar uma fração da população
a ser incluída na amostra nunca é o caminho certo para decidir sobre o ta-
manho desta. Os erros de amostragem dependem principalmente do tama-
nho da amostra, e não da proporção da população nela. Dizer que um ta-
manho de amostra em particular é a abordagem usual ou típica para estu-
dar a população também é quase sempre uma abordagem errada. Um plano
de análise que aborda os objetivos de um estudo é o primeiro passo crítico.
Finalmente, é muito raro que calcular um intervalo de confiança desejado
de uma variável para uma população inteira seja o cálculo determinante em
relação ao tamanho que a amostra deve ter.
O ERRO DE AMOSTRAGEM COMO UM COMPONENTE

DO ERRO TOTAL DE LEVANTAMENTO
O processo de amostragem pode afetar a qualidade das estimativas

de levantamento de três formas diferentes:
• Se a estrutura da amostra inclui algumas pessoas a quem nós
queremos descrever, as estimativas serão tendenciosas na medi-
da em que aqueles que foram omitidos diferem dos que foram
incluídos.
• Se o processo de amostragem não é probabilístico, a relação en-
tre a amostra e aqueles amostrados é problemática. Pode-se de-
fender a credibilidade de uma amostra por razões diferentes das
do processo de amostragem; contudo, não há base estatística para
dizer que uma amostra é representativa da população amostrada
a menos que o processo de amostragem dê a cada pessoa selecio-
nada uma probabilidade conhecida de seleção.
• O tamanho e o formato de uma amostra de probabilidade, junta-
mente com a distribuição de o que está sendo estimado, determi-
na o tamanho dos erros de amostragem, ou seja, as possíveis va-
riações que ocorrem por conta da coleta de dados sobre apenas
uma amostra de uma população.
Frequentemente os erros de amostragem são apresentados de for-

ma que os implicam como a única fonte de desconfiança em estimativas
de levantamento. Para levantamentos que utilizam grandes amostras, ou-

tras fontes de erros provavelmente são mais importantes. Um tema prin-
cipal deste livro é que erros de não amostragem justificam tanta atenção
quando os erros de amostragem. Também, não é incomum ver erros de
amostragem relatados que assumem procedimentos de amostragem alea-
tória simples quando o projeto de amostra envolve agrupamentos, ou até
mesmo quando não eram amostras probabilísticas. Dessa forma, ironica-
mente, estimativas de erros de amostragem podem conduzir os leitores ao
erro sobre a precisão ou exatidão das estimativas de amostra.
Amostrar e analisar dados de uma amostra pode ser bastante simples
se uma boa lista é usada como estrutura de amostragem, se um esquema
simples aleatório ou sistemático de amostragem é usado, e se todos os res-
pondentes são selecionados na mesma proporção. Com tal modelo, a Tabe-
la 3.1 e as equações nas quais ela é baseada vão fornecer boas estimativas
de erros de amostragem. Mesmo com tal modelo simples, contudo, os pes-
quisadores precisam considerar todas as fontes de erros, incluindo a estru-
tura da amostra, a ausência de resposta e os erros de resposta (todos discuti-
dos nos capítulos subsequentes) quando estiverem avaliando a precisão das
estimativas do levantamento. Além disso, quando há dúvidas sobre a me-
lhor forma para amostrar, ou quando há desvios da amostragem aleatória
simples, é praticamente essencial envolver um especialista em amostragem
tanto para projetar um plano apropriado quanto para analisar os resultados
corretamente a partir de um complexo projeto de amostra.
EXERCÍCIOS
1. A fim de apreender o significado de erro de amostragem, repeti-

das amostras sistemáticas do mesmo tamanho (com inícios alea-
tórios diferentes) podem ser extraídas da mesma lista (por exem-
plo, uma lista telefônica). A proporção daquelas amostras tendo
algumas características (por exemplo, uma listagem de empre-
sas) tomadas em conjunto formarão uma distribuição. Tal distri-
buição terá um desvio padrão que é de cerca da metade da entra-
da na Tabela 3.1 para amostras dos tamanhos extraídos. Também
é válido calcular várias das entradas na Tabela 3.1 (isto é, para
diferentes tamanhos de amostras e proporções) para ajudar a
entender como os números são derivados.
2. Qual percentagem de adultos nos Estados Unidos você estima-

ria:
a. Os que têm licença para dirigir?
b. Os que têm números de telefone listados?
c. Os que são registrados para votar?
d. Os que têm um endereço de e-mail pessoal (não em seu traba-
lho)?
3. Quais são algumas diferenças prováveis entre aqueles que esta-

riam naquelas estruturas de amostra e aqueles que não estariam?
4. Comparadas com as amostras aleatórias simples, as alternativas
a seguir tendem a aumentar, diminuir, ou não ter nenhum efeito
sobre os erros de amostragem?
a. Agrupar?
b. Estratificar?
c. Usar uma abordagem de amostragem sistemática?
Leituras Complementares
Kalton, G. (1983). Introduction to survey sampling. Beverly Hills, CA: Sage.

Kish, L. (1965). Survey sampling. New York: John Wiley.
Lohr, S. L. (1998). Sampling design and analysis. New York: Brooks/Cole.
Ausência de resposta
4 implementando um
projeto de amostra
A falha em coletar dados a partir de uma alta porcentagem daqueles selecionados

para estar em uma amostra é a principal fonte potencial de erros de levantamento.
As abordagens para contatar respondentes e recrutar cooperação por correio, tele-
fone, internet e entrevistas pessoais são discutidos. Os vieses associados a não res-
posta são descritos, como o são as desvantagens de estratégias tais como amostras
por cota para evitar o esforço requerido para obter altas taxas de resposta.
A ideia de uma amostra probabilística de pessoas é que todos os

indivíduos na população-alvo (ou pelo menos a estrutura da amostra)
têm uma chance conhecida de ter dados coletados sobre ele ou ela. Um
procedimento de amostragem vai designar um conjunto específico de in-
divíduos (ou unidades de algum tipo); a qualidade dos dados da amostra
depende de quão bem aqueles de quem os dados são realmente coleta-
dos refletem a população total com respeito às variáveis que a pesquisa é
designada a descrever. Os procedimentos usados para coletar dados são
tão importantes quanto o processo de seleção de amostra em determinar
quão bem os dados desta descrevem a população.
Certamente, a exatidão de qualquer estimativa particular de uma
amostra depende de quem fornece uma resposta para uma determinada
questão. Em todo levantamento, há alguns respondentes que não respon-
dem a todas as questões. Embora a ausência de resposta a questões indi-
viduais seja normalmente baixa, ocasionalmente ela pode ser alta e pode
ter um efeito real sobre as estimativas. O foco deste capítulo é, contudo,
sobre aquelas pessoas que não fornecem quaisquer dados. (Ver Capítulo
10 para mais discussões sobre este item.)
Há três características daqueles selecionados para estar em uma

amostra que realmente não fornecem dados:
• Aqueles a que o procedimento de coleta de dados não atinge,
não lhes dando, assim, a chance de responder às questões.
• Aqueles solicitados a fornecer dados e que se recusam a fazê-lo.
• Aqueles solicitados a fornecer dados e que são incapazes de rea-
lizar a tarefa requerida (por exemplo, pessoas que estão doentes
demais para ser entrevistadas, que não falam a língua do pesqui-
sador ou cujas habilidades de leitura e escrita impedem o seu
preenchimento de questionários autoadministrados.
Os procedimentos que um pesquisador decide usar podem ter uma

importante influencia sobre a porcentagem de uma amostra que realmen-
te fornece informação (isto é, a taxa de resposta) e sobre a medida em que
não respondentes introduzem viés nos dados da amostra. Para a maior
parte, o efeito provável da ausência de resposta é influenciar as amostras,
ou seja, fazê-las sistematicamente diferentes da população da qual foram
extraídas, produzindo assim estimativas potencialmente tendenciosas.
Neste capítulo, os efeitos da ausência de resposta sobre as estimativas do
levantamento e os procedimentos para reduzi-la são discutidos.
CALCULANDO TAXAS DE RESPOSTA
A taxa de resposta é um parâmetro básico para avaliar os esforços

da coleta de dados. É simplesmente o número de pessoas que completam
a pesquisa dividido pelo número de pessoas (ou unidades) amostradas.
O denominador inclui todas as pessoas na população de estudo que fo-
ram selecionadas mas não responderam por qualquer que seja a razão:
recusas, problemas com a língua, doença ou falta de disponibilidade.
Algumas vezes um formato de amostra envolverá uma triagem
para encontrar membros de uma população a ser estudada. Unidades de
triagem que não incluem as pessoas na população de estudo não entram
no cálculo da taxa de resposta. Consequentemente, imóveis vagos, nú-
meros de telefone que não estão funcionando ou que não servem a uni-
dades residenciais, ou famílias em que nenhuma pessoa elegível reside
(por exemplo, domicílios em que nenhum idoso vive quando se está ex-
traindo uma amostra de idosos) são omitidos no cálculo de taxas de res-
posta. Se há algumas unidades para as quais a informação necessária
para determinar a elegibilidade não é obtida, contudo, a taxa de respos-

ta é incerta. A melhor abordagem, nessa situação, é calcular as taxas de
resposta utilizando hipóteses conservativas e liberais sobre a taxa de ele-
gibilidade das unidades que não passaram pela triagem e relatar o inter-
valo, juntamente com a melhor estimativa.
Taxas de resposta são normalmente relatadas como a porcentagem
de uma amostra selecionada a partir da qual os dados foram coletados.
Um cálculo posterior pode às vezes ser feito da fração da população re-
presentada na amostra. Se a estrutura da amostra não omite nenhuma
pessoa da população de estudo, a taxa de resposta é a mesma da porcen-
tagem da população representada na amostra. Se apenas 95% da popu-
lação tem um telefone, contudo, a melhor estimativa da porcentagem da
população representada em uma amostra é 0,95 vezes a taxa de resposta
para um levantamento por telefone.
É importante saber os detalhes da forma como as taxas de resposta
são calculadas. Diferenças na forma do cálculo podem dificultar as com-
parações ou fazê-las inadequadas. Por exemplo, algumas organizações
relatam uma “taxa de conclusão”, a porcentagem de famílias contatadas
nas quais uma entrevista foi completada.
Tais números serão sempre superiores à taxa de resposta descrita
anteriormente, a qual inclui unidades selecionadas não contatadas no
denominador. Uma publicação disponível da American Association of
Public Opinion Research (AAPOR) fornece uma excelente discussão dos
cálculos da taxa de resposta e de como relatá-los (AAPOR, 2006).
VIÉS ASSOCIADO À AUSÊNCIA DE RESPOSTA
O efeito da ausência de resposta sobre as estimativas do levanta-

mento depende da porcentagem que não responde e da medida em que
aqueles que não respondem são tendenciosos – ou seja, sistematicamen-
te diferente de toda a população. Se a maioria daqueles selecionados forne-
ce dados, as estimativas da amostra serão muito boas mesmo se os não res-
pondentes forem distintivos. Por exemplo, quando a Bureau of the Census
dos Estados Unidos realiza a National Health Interview Survey, é bem-suce-
dida em completar entrevistas em mais de 90% das famílias seleciona-
das. É fácil de mostrar que mesmo se os 10% não respondentes são mui-
to distintivos, as amostras resultantes são ainda muito similares à popu-
lação como um todo.
A experiência do Bureau of the Cesus é extrema no sentido positi-

vo. No outro extremo, ocasionalmente ver-se-á relatórios de levantamen-
tos feitos por correio ou pela internet nos quais de 5 a 20% da amostra
selecionada respondeu. Nesses casos, a amostra final pode ter uma pe-
quena relação com o processo de amostragem original; esses responden-
tes são essencialmente autosselecionados. É muito improvável que tais
procedimentos forneçam algumas estatísticas credíveis sobre as caracte-
rísticas da população como um todo.
As taxas de resposta para a maioria dos projetos de pesquisa de levan-
tamento estão em algum lugar entre esses dois extremos. Elas geralmente são
superiores em áreas rurais do que o são em grandes cidades. Também é mais
fácil coletar informações de algum adulto responsável em uma família do que
obter uma entrevista com um respondente específico designado. Alguns as-
suntos (por exemplo, saúde) podem interessar mais pessoas do que outros tó-
picos (por exemplo, comportamento econômico ou opinião pública). Além
disso, organizações de pesquisa diferem consideravelmente na medida em
que dedicam tempo e dinheiro para melhorar as taxas de resposta.
Não há nenhum padrão acordado para uma taxa de resposta míni-
ma aceitável. O Office of Management and Budget do governo federal, o
qual analisa os levantamentos feitos sob contrato com o governo, geral-
mente solicita que os procedimentos sejam suscetíveis de produzir uma
taxa de resposta superior a 80% e exige uma análise da ausência de res-
posta se um levantamento não atende a esse padrão (OMB, 2006). Nos
Estados Unidos, as organizações de pesquisa acadêmica por vezes são ca-
pazes de atingir taxas de resposta para adultos designados na faixa de
70% para pesquisas em pessoa com amostras gerais de famílias. A Gene-
ral Social Survey, realizada pelo National Opinion Research Center, é um
exemplo. Taxas de resposta para levantamentos de amostras em cidades
ou o uso de amostras de discagem aleatória de dígitos provavelmente
são inferiores – frequentemente muito inferiores.
A natureza dos vieses associados à ausência de resposta difere um
pouco entre correio, telefone e procedimentos de entrevista pessoal. Uma
generalização que parece sustentar a maioria dos levantamentos por cor-
reio é que as pessoas que têm um interesse particular no assunto ou na
pesquisa em si são mais prováveis de retornar questionários por correio
do que aquelas que são menos interessadas (Groves et al. 2006). Isso sig-
nifica que levantamentos por correio com baixas taxas de resposta po-
dem ser significativamente tendenciosos na maneira com que são rela-
cionados diretamente aos propósitos da pesquisa (Filion, 1975; Heberlein e
Baumgartner, 1978; Jobber, 1984). Por exemplo, um estudo daqueles

que não retornam um questionário por correio sobre experiências de cui-
dados com a saúde, mas que foram posteriormente entrevistados por te-
lefone, indicou que os que não responderam por correio eram mais jo-
vens, mais saudáveis, usavam menos os serviços de saúde, e eram mais
propensos a ser homens do que os respondentes por correio (Fowler et
al., 2002). Gallangher, Fowler e Stringfellow (2005) relataram em outro
estudo em que os registros de saúde dos que não responderam estavam
disponíveis, permitindo-lhes concluir que os primeiros respondentes por
correio eram significativamente diferentes dos últimos de diversas for-
mas altamente relevantes para o levantamento.
Outro exemplo de viés significativo a partir da baixa resposta aos
questionários por correspondência é a pesquisa frequentemente citada,
da eleição presidencial de 1936, feita pela Literary Digest, que conseguiu
prever a vitória para Alf Landon em uma eleição que Franklin Roosevelt
ganhou por maioria de votos. Conta-se a história de que uma amostra foi
extraída de listas telefônicas, e os Republicanos (aqueles partidários de
Landon) eram mais prováveis de ter telefones em 1936. Além disso, no
entanto, o levantamento da Literary Digest foi feito por correspondência.
Sua falha também foi a ausência de resposta; apenas uma minoria da-
queles solicitados a reenviar os questionários o fizeram. Como é típico
em levantamentos por correio, aqueles que queriam que o oprimido ga-
nhasse, os apoiadores de Landon, eram particularmente prováveis de
querer expressar seus pontos de vista (Bryson, 1976; Converse, 1987).
A disponibilidade é a fonte mais importante de ausência de resposta
para levantamentos por telefone e pessoais do que para levantamentos por
correio. É obvio que se um esforço de coleta de dados for realizado entre
9h e 17h, de segunda a sexta-feira, as pessoas que estarão disponíveis para
ser entrevistadas serão distintivas. É claro, a maioria das organizações de
levantamento enfatizam o contato com as famílias à noite e nos finais de
semana. Todavia, aqueles mais prováveis de ser encontrados são os pais
que ficam em casa, pessoas desempregadas e aposentadas. Eles tenderão a
não ter uma ocupação voluntária e uma vida social. São mais prováveis de
ser pais de crianças pequenas. Famílias maiores são mais prováveis de ter
alguém em casa do que as compostas por apenas um ou dois membros.
A acessibilidade de um tipo diferente também produz vieses asso-
ciados à ausência de resposta. Os levantamentos nacionais que usam
procedimentos de entrevistas pessoais quase sempre têm taxas de res-
posta inferiores em grandes cidades do que em subúrbios e áreas rurais.
Há três razões principais para isso. Primeiro, a taxa de dificuldade de en-

contrar indivíduos solteiros é maior nas cidades. Segundo, uma fração
crescente de indivíduos nas grandes cidades vive em prédios de aparta-
mentos que têm significativas características de segurança que tornam
difícil aos entrevistadores ter acesso direto aos residentes. Terceiro, há
mais áreas nas cidades onde visitas à noite são desagradáveis para os en-
trevistadores; portanto, eles podem não dar às pessoas difíceis de encon-
trar uma boa chance de serem encontradas em casa.
O constante aumento da população das cidades e outras grandes
mudanças sociais (mais domicílios com uma única pessoa, menos famí-
lias com filhos, mais mulheres na força de trabalho) têm feito a obtenção
de altas taxas de resposta mais difícil durante os últimos 20 anos tanto
para os levantamentos em pessoa quanto para os feitos por telefone. As
taxas de resposta dos levantamentos por telefone também podem sofrer
pelo aumento do uso do identificador de chamadas e pela ascensão do
uso de telefones celulares – ambos podem ter diminuído a proporção em
que as pessoas atendem aos seus telefones fixos e podem ser expostos à
introdução dos entrevistadores. De Leeuw e de Heer (2002) relatam ten-
dências de declínio nas taxas de resposta internacionalmente, bem como
nos Estados Unidos. Os papéis correspondentes do não contato e das re-
cusas na ausência de resposta variam de país para país.
Há alguma evidencia de que procedimentos por telefone podem redu-
zir a taxa de resposta diferencial entre as grandes cidades e as áreas rurais
porque é possível dar uma cobertura mais completa para domicílios urba-
nos, fazer contato com as pessoas em prédios de alta segurança, e fazer um
grande número de esforços para encontrar pessoas solteiras em casa. Por
outro lado, pessoas menos instruídas parecem mais dispostas a serem entre-
vistadas em um procedimento de dígito aleatório por telefone, como são
aqueles com mais de 65 anos. Tais vieses são encontrados menos frequente-
mente em levantamentos por entrevistas pessoais. Groves e Kahn (1979),
Cannell, Groves, Magilavy, Mathiowetz Miller (1987), Groves e Lyberg (1988)
e Groves e Couper (1998) apresentam boas avaliações dos vieses da ausência
de resposta em levantamentos por telefone.
Finalmente, há um viés associado às pessoas que estão impossibili-
tadas de ser entrevistadas ou de preencher um formulário. Tais pessoas
normalmente compõem uma pequena fração de uma população geral.
Deixar de fora as pessoas que estão em um hospital, contudo, pode ser
uma omissão muito importante quando se está tentando estimar a utili-
zação dos cuidados com a saúde ou as despesas. Há também áreas vizi-
nhas ou grupos onde omitir pessoas que não falam inglês poderia ser um
fator significante. Se medidas especiais não são tomadas para coletar da-
dos de um grupo particular, as estimativas da amostra requerem uma po-
pulação mais restrita: a população que realmente teve uma chance de
responder às questões ou de fornecer dados, por conta dos procedimen-
tos de coleta de dados implementados.
Apesar da tendência de ser demograficamente diferente entre res-
pondentes e não respondentes para levantamentos administrados por
um entrevistador, particularmente para levantamentos por telefone base-
ados na discagem aleatória de dígitos, o efeito da ausência de resposta
sobre as estimativas do levantamento é menos claro. Keeter, Miller, Kohut,
Groves e Presses (2000) relatam uma cuidadosa comparação dos resulta-
dos de dois levantamentos por telefone: um rendeu uma taxa de respos-
ta de 36%, o outro uma taxa de 60%. Com relação às atitudes políticas e
sociais que eram os tópicos do levantamento, havia muito pouca diferen-
ça estatisticamente significante entre os dois resultados. Os pesquisa-
dores relataram uma replicação desse estudo com resultados similares
(Keeter, Kennedy, Dimock, Best e Craighill, 2006).
Contudo, esses estudos não devem levar os pesquisadores a acre-
ditar que a ausência de resposta não é uma importante fonte de erro.
Groves (2006) relata sobre uma análise de taxas de resposta e erro de
ausência de resposta. Ele estudou mais de 200 estimativas baseadas em
30 levantamentos que usaram vários modos de coleta de dados. Encon-
trou evidencias consideráveis de erros devidos à ausência de resposta.
Groves alcançou, contudo, duas outras conclusões importantes:
1. A taxa de resposta para uma pesquisa não é uma predição mui-
to boa do erro de ausência de resposta. A correlação que ele re-
lata entre as duas é de 0,33.
2. Uma das razões principais para a associação comparativamente
baixa é a variabilidade dentro dos levantamentos no montante
dos erros de ausência de resposta para variáveis diferentes.
Deste modo, para qualquer pesquisa, algumas estimativas podem

ser muito afetadas pela ausência de resposta, enquanto outras são muito
pouco afetadas.
A questão-chave é a extensão em que a ausência de resposta é rela-
cionada com as estimativas que o levantamento é destinado a fazer. Groves,
Presser e Dipko (2004) relatam resultados experimentais que mostram
que as pessoas com papeis relevantes para um tópico do levantamento
(como novos pais solicitados a fazer um levantamento sobre os cuidados

com as crianças) são mais prováveis de responder do que a média. Contu-
do, eles também descobriram que tais grupos de papeis identificáveis co-
mumente eram pequenos e, por isso, não poderiam ter um efeito mensu-
rável sobre as estimativas do levantamento. Isso parece razoável, e é con-
sistente com as evidencias existentes, de que o interesse do respondente
no assunto pode desempenhar um papel maior na resposta a levantamen-
tos por correio do que quando um entrevistador pede cooperação.
De modo geral, temos claras evidências de que a ausência de res-
posta pode afetar as estimativas do levantamento, mas normalmente nos
falta uma informação confiável para prever quando e quanto isso irá ou
não afetar as estimativas do levantamento. Além disso, o efeito da au-
sência de resposta sobre uma variável pode ser muito diferente do que
nas outras em um mesmo levantamento.
A Tabela 4.1 apresenta um exemplo para ajudar a pensar sobre os
efeitos potenciais da ausência de resposta sobre os resultados. Suponha
que uma amostra de 100 é extraída, e 90 respondem (taxa de resposta
de 90%). Dos 90, 45 dizem “sim” para alguma questão; os outros 45 di-
zem “não”. Há 10 pessoas (os não respondentes) das quais a visão nós
não sabemos. Se elas todas eram “sims”, o número verdadeiro para a po-
pulação seria 55% “sim”. Desta forma:
Taxa de resposta = 90%
50% dos respondentes dizem “sim”
A porcentagem real na amostra originalmente selecionada que di-
ria “sim” se eles respondessem poderia ser não mais do que 55% e não
menos que 45%. O intervalo possível para o exemplo é dado na coluna
do lado direito da Tabela 4.1.
Tabela 4.1 Exemplo de erro potencial devido à ausência de resposta

Respostas* Ausência de respostas Amostra total (intervalo possível de
(Respostas conhecidas)** (Respostas não conhecidas) respostas se todos responderam)
Sim 45 0 a 10 45 a 55
Não 45 0 a 10 45 a 55
Total 90 10 100
* Se a taxa de resposta foi de 90%.
** Se 50% dos respondentes responderam “sim”.
A Tabela 4.2 organiza essa lógica para um intervalo de taxas de

resposta. Pode ser visto que quando as taxas de resposta são baixas, o
potencial de erros devido à ausência de resposta é muito grande.
Tabela 4.1 Intervalo de porcentagens verdadeiras possíveis quando 50% da

amostra fornece uma resposta, por taxa de resposta
Quando a Taxa de Resposta é de:
90% 70% 50% 30% 10%

Se 50% dos que responderam deram uma resposta
particular, o valor verdadeiro se todos na amostra
responderam pode variar de: 45-55% 35-65% 25-75% 15-85% 5-95%
Fonte: Adaptado de uma tabela desenvolvida por Jack Elinson e Mitchell D. Elinson. Comunicação pessoal.
Pode ser instrutivo comparar os efeitos potenciais do viés da au-

sência de resposta, tais como os apresentados na Tabela 4.2, com os efei-
tos do erro de amostragem apresentados no capítulo anterior (ver a Ta-
bela 3.1). Normalmente não se sabe quão tendenciosa é a ausência de
resposta, mas é raro uma boa hipótese de que ela seja imparcial. Esfor-
ços para garantir que as taxas de resposta alcancem um nível razoável e
para evitar procedimentos que produzem sistematicamente diferenças
entre respondentes e não respondentes são formas importantes de cons-
truir a confiança na exatidão das estimativas do levantamento.

REDUZINDO A AUSÊNCIA DE RESPOSTA
Levantamentos por Entrevista Pessoal ou por Telefone
Assim como sempre se pode dizer que uma amostra maior será
mais confiável do que uma amostra pequena, sendo todas as outras coi-
sas iguais, também se pode dizer que um levantamento com uma taxa de
resposta maior provavelmente irá produzir uma amostra melhor e menos
tendenciosa do que um que tem mais ausência de resposta. Pelo menos,
dado que o erro da ausência de resposta normalmente não é medido, po-
de-se dizer que taxas de resposta maiores aumentam a credibilidade dos
resultados de um levantamento. Como em qualquer outra decisão do
projeto, um pesquisador deve escolher quanto esforço investir na redu-
ção da ausência de resposta.
Dois problemas diferentes devem ser abordados a fim de alcançar
uma alta taxa de resposta para levantamentos pessoais e por telefone:
obter acesso aos indivíduos selecionados e conseguir sua cooperação.
Para reduzir a ausência de resposta resultante da falta de disponi-
bilidade
• Faça diversas chamadas, concentrando-se nas noites e nos finais
de semana. O número necessário depende da configuração. Seis
ligações por família são provavelmente o mínimo em áreas urba-

nas. Para estudos por telefone, mais chamadas podem ser feitas
mais barato, e muitas organizações usam 10 como mínimo. Co-
mumente, muito mais do que 10 chamadas são feitas.
• Tenha entrevistadores com horários flexíveis que possam fazer en-
trevistas a qualquer hora que seja conveniente aos respondentes.
• Para conseguir cooperação
• Se possível, envie uma carta informativa com antecedência. Isso
tranquiliza alguns respondentes, bem como faz com que os en-
trevistadores sintam-se mais confiantes.
• Apresente eficazmente e precisamente os propósitos do projeto.
Tenha certeza de que os respondentes saibam que sua ajuda é
importante e como ela será útil.
• Tenha certeza de que os respondentes não serão ameaçados pela
tarefa ou pelos usos a que os dados serão submetidos.
• Tenha entrevistadores eficazes. Tenha certeza de que eles sabem
que a taxa de resposta é importante. Identifique os entrevistado-
res que estão tendo problemas com a taxa de resposta rapida-
mente ou recicle ou não continue a usar entrevistadores que não
são eficientes.
• Ensine os entrevistadores a ouvir os respondentes e a adequar a
interação ao indivíduo em vez de seguir uma abordagem ampla-
mente preparada para apresentar o levantamento.
Achar o equilíbrio entre persistência e capacidade de responder

não é fácil para respondentes relutantes. A participação em levantamen-
tos é voluntária, mas a relutância em participar é muitas vezes baseada
na ignorância. Groves e Couper (1998) apresentam análises úteis das ra-
zões para a relutância dos respondentes em ser entrevistados.
É apropriado solicitar aos respondentes que se informem sobre os
objetivos de um levantamento antes de recusarem. A maioria dos levanta-
mentos fornece um propósito útil de alguma posição estratégica. Quando
uma pessoa recusa, os dados resultantes serão menos exatos. Os entrevis-
tadores devem ser solicitados a fazer um bom esforço para conduzir os
respondentes ao ponto de que eles saibam o que estão sendo solicitados a
fazer e por quê. Também é razoavelmente rotineiro perguntar às pessoas
que inicialmente recusaram para reconsiderar. Uma porcentagem signifi-
cativa de recusas resulta do contato com respondentes na hora errada em
vez de uma relutância fundamental em ser entrevistado. Entre um quarto
e um terço das pessoas que inicialmente recusam concordarão em ser en-

trevistadas quando perguntadas novamente um tempo depois.
O processo de entrevista normalmente é uma experiência positiva
para os respondentes. Se este está sendo conduzido por um grupo res-
ponsável, as respostas serão mantidas estritamente confidenciais. Pesqui-
sadores rotineiramente respeitam a confidencialidade com o mesmo zelo
que os psiquiatras e os jornalistas protegem suas fontes. Muitos projetos
de pesquisa estão oferecendo alguns motivos razoáveis para os quais a
maioria das pessoas estaria disposta a contribuir. Se o entrevistador está
disposto a arranjar uma entrevista conveniente ao respondente, as pres-
sões de tempo podem não ser notáveis para a maioria dos respondentes.
Finalmente, a maioria dos respondentes relata que ser entrevistado é
agradável. As pessoas gostam de ter uma oportunidade para falar sobre
elas mesmas a um bom ouvinte.
A discagem aleatória de dígitos representa mudanças particular-
mente significantes para alcançar boas taxas de resposta. Quando abor-
dagens assistidas por lista são usadas para selecionar a amostra, cartas
podem ser enviadas para os domicílios para os quais os endereços são
conhecidos. Contudo, mesmo quando isso é feito, está sobre o entrevista-
dor a carga de envolver a pessoa que atende ao telefone. As primeiras
frases são críticas para o sucesso. Também, por conta de os contatos por
telefone serem feitos por muitos vendedores e para fins de captação de
recursos, algumas pessoas iniciam com uma impressão negativa a liga-
ções de estranhos. Nesse contexto, mesmo organizações conscientes atin-
gem taxas de resposta entre 30 e 50% – particularmente quando o as-
sunto da pesquisa não é imediatamente atraente. A dificuldade em atin-
gir altas taxas de resposta é um dos limites intrínsecos da discagem alea-
tória de dígitos como uma abordagem para amostragem.
Finalmente, deve ser notado que pagamentos adiantados em di-
nheiro para respondentes de entrevistas demonstraram um aumento nas
taxas de respostas tanto nas entrevistas pessoais quanto por telefone.
Historicamente os pagamentos têm sido usados principalmente para es-
tudos de entrevista que fazem solicitações incomuns aos respondentes,
tais como aqueles que envolvem múltiplas entrevistas. Contudo, pesqui-
sas recentes mostram que também há um impacto sobre as taxas de res-
posta quando apenas uma entrevista é feita (Groves e Couper, 1998; Singer,
2002; Singer, Van Hoewyk, Geber, Raghunnathan e McGanale, 1999;
Singer, Van Hoewyk e Maher, 2000). A utilidade mais importante dos pe-
quenos pagamentos é prender a atenção dos respondentes para que eles
leiam a carta previamente enviada ou ouçam as instruções do entrevista-

dor. Isso provavelmente também produz alguns sentimentos positivos e,
em alguns, o sentido de que um gesto positivo pela equipe de pesquisa
pode justificar algum gesto positivo recíproco – como fazer a entrevista.
Outra razão para considerar incentivos financeiros, além dos seus efeitos
sobre o total das taxas de resposta, é que eles podem reduzir o viés da
ausência de resposta resultante daqueles mais interessados em um tópi-
co serem sobrerepresentados em amostras – por induzir algumas pessoas
menos interessadas a responder o que caso contrário não responderiam.
Levantamentos por correio

Os problemas em reduzir a ausência de resposta para levantamen-
tos por correio são um pouco diferentes. Chegar ao respondente, o que é
uma parte crítica dos levantamentos pessoais e por telefone, não é nor-
malmente um problema se o pesquisador tem um endereço exato. A
maioria das pessoas vai para casa para pegar suas correspondências. An-
tes, a principal dificuldade é induzir os respondentes a realizar a tarefa
de responder sem a intervenção de um entrevistador.
Escrever uma carta não é uma forma muito efetiva de convencer
uma alta porcentagem das pessoas a fazer alguma coisa. O contato pes-
soal é significantemente mais efetivo do que isso. Há um grande corpo
de literatura sobre estratégias projetadas para tentar fazer um contado
por correio mais efetivo. Deve-se imprimir um questionário em papel co-
lorido ou branco? Quão bem faz um impressionante papel timbrado? E
sobre as autenticações? Qual é a importância de pagar as pessoas? Al-
guns pesquisadores enviam dinheiro junto com o questionário, enquanto
outros prometem o reembolso se o questionário for reenviado. A carta
do respondente deve ser assinada com tinta azul? Um selo autêntico é
melhor do que um envelope com porte pago?
Genericamente falando, quase nada faz com que um questionário por
correio pareça mais profissional, mais personalizado ou mais atrativo terá
algum efeito positivo sobre a taxa de respostas. Cuidar de tais detalhes pro-
vavelmente vale a pena no conjunto; Dillman (2007, 2008) revisa bem essas
questões. Provavelmente também é importante fazer com que o instrumento
seja fácil de completar. Mais detalhes sobre modelos são fornecidos no Capí-
tulo 6, mas há três pontos dignos de serem mencionados aqui.
1. O leiaute deve ser limpo para que seja fácil de ver como proce-
der.
2. As questões devem ser atrativamente espaçadas, ordenadas e fá-

ceis de ler.
3. A tarefa deve ser fácil de fazer. Não peça aos respondentes que
forneçam respostas escritas, exceto na opinião deles. As tarefas
devem ser verificar um quadro, circular um número ou algo
equivalentemente simples.
Novamente, Dillman (2007, 2008) fornece uma ampla orientação

sobre o leiaute dos instrumentos autoadiministrados.
Várias revisões de estudos publicados indicam que o pagamento
adiantado de vários dólares aos respondentes aumenta as taxas de res-
posta por correio (Fox, Crask e Kim, 1988; James e Bolstein, 1990). Qua-
se todos os estudos mostraram um benefício, até mesmo levantamentos
de médicos (Berry e Kanouse, 1987). Contudo, é apenas o pagamento
adiantado que tem demonstrado afetar as respostas. Pagamentos atrasa-
dos, ofertas para dar dinheiro para caridade e inscrições em modelos não
têm mostrado melhorar as taxas de resposta (Warriner, Goyder, Jersten,
Hohner e McSupurren, 1996). Finalmente, não há dúvida de que a dife-
rença mais importante entre bons levantamentos por correio e levanta-
mentos pobres é a extensão na qual o pesquisador faz contato repetido
com os não respondentes. Uma sequência sensata de eventos, tal como o
esboçado por Dillman (2007), pode incluir o que segue:
1. Cerca de 10 dias depois da correspondência inicial, enviar um
cartão para lembrar, enfatizando a importância do estudo e da
alta taxa de resposta.
2. Cerca de 10 dias depois que a carta foi enviada, envie para os
não respondentes remanescentes novamente uma carta enfati-
zando a importância de uma alta taxa de retorno e incluindo
outro questionário para aqueles que jogaram o primeiro fora.
3. Se a taxa de resposta ainda não é satisfatória, provavelmente o me-
lhor próximo passo é entrar em contato pelo telefone com os não
respondentes. Se números de telefone não estão disponíveis ou se
as despesas com chamadas telefônicas parecem muito grandes, car-
tas adicionais persuasivas, telegramas ou outros procedimentos que
se destacam e parecem importantes têm se mostrado úteis.
Com os acompanhamentos por telefone, é claro, as taxas de respos-

ta serão maiores do que sem eles. Se o pesquisador é persistente, e se este
é um estudo razoavelmente bem concebido e bem formulado, taxas de
resposta aceitáveis podem ser obtidas por correio. Há vários exemplos de

levantamentos por correio que alcançam taxas de resposta tão ou mais al-
tas do que outros métodos (por exemplo, Fowler, Roman e Di, 1998).
Se um pesquisador vai contatar novamente os não respondentes,
ele precisa saber quem não reenviou o questionário. O processo não pre-
cisa ser sinuoso ou complexo. Um simples número de identificação pode
ser escrito no questionário ou no envelope de retorno. É uma boa prática
dizer às pessoas na carta para que serve o número.
Ocasionalmente o pesquisador pode querer reafirmar aos respon-
dentes que eles não serão identificados. Há uma estratégia alternativa
simples que funciona muito bem e que ainda permite acompanhamento.
Um questionário sem identificador é enviado aos respondentes. Anexado
ao questionário está um cartão postal separado que contém um identifi-
cador do respondente, como segue:
Caro Pesquisador, estou enviando este cartão postal no mesmo instante em

que coloco meu questionário preenchido no correio. Uma vez que meu ques-
tionário é completamente anônimo, este cartão postal dirá a você que não
precisa me mandar um lembrete posterior para reenviar o questionário.
Este procedimento mantém o anonimato do respondente, ao mesmo

tempo que diz ao pesquisador quando alguém completou o questionário.
Alguns poderiam pensar que os respondentes simplesmente mandariam
de volta o cartão postal a fim de evitar lembretes posteriores, mas isso ra-
ramente acontece. O número de cartões postais e questionários reenvia-
dos quase sempre vem a ser aproximadamente o mesmo. Sieber (1992)
discute uma ampla gama de meios de coletar dados anonimamente.
Levantamentos pela internet

Embora os levantamentos pela internet sejam comparativamente
novos, assim não há o mesmo corpo de experiência que existe para o
correio e para os levantamentos por entrevista, a dinâmica e os desafios
parecem estreitamente paralelos com os levantamentos por correio. O
problema é induzir as pessoas a responder sem a intervenção de um en-
trevistador.
Há duas formas principais para as quais a internet é usada para le-
vantamentos: os respondentes são solicitados a responder questões em
um questionário por e-mail ou são solicitados a visitar um site onde um
formulário está esperando para ser preenchido. Por uma variedade de

razões, usar e-mail como uma abordagem para coleta de dados não é
uma ideia muito boa (ver o Capítulo 5), e o uso da internet para levanta-
mentos é essencialmente sobre obter respondentes para visitarem um
site e completarem um questionário.
A forma mais comum de solicitar às pessoas para que completem
um levantamento pela internet é mandar um convite por e-mail. Como
se pode esperar, isso pode produzir resultados muito diferentes. Dillman
(2007) relata um levantamento de corpo docente que obteve uma ta-
xa de resposta próxima de 60%, quase a mesma taxa que obtiveram
em uma versão paralela por correio do mesmo levantamento. Kaplovitz,
Hadlock e Levine (2004) relatam um experimento similar com estudan-
tes que obteve uma taxa de resposta pela internet que foi 50% maior que
o estudo de Dillman e no qual o postal por correio teve uma taxa de res-
posta significativamente mais alta do que a estratégia do e-mail.
Ambos os experimentos foram com populações que têm acesso
praticamente universal ao e-mail e o usam rotineiramente – e o pedido
de levantamento era identificável como vindo de uma instituição a qual
os respondentes eram membros. Quando os pedidos de levantamento
vêm de fontes menos conhecidas ou desconhecidas e vão para pessoas
que variam muito em como e quanto elas usam a internet, os resultados
são previsivelmente variáveis. Às vezes, quase ninguém responde.
Os mesmos tipos de passos que se descobriu serem úteis para le-
vantamentos por correio provavelmente ajudam a reunir esforços para
levantamentos pela internet: patrocinadores identificáveis, instrumentos
bem formulados, incentivos financeiros e contatos repetidos, inclusive
tentativas de pedido por correio ou telefone para aqueles que não res-
ponderam a um pedido inicial por e-mail. Dillman (2007) apresenta uma
discussão profunda das abordagens para melhorar as taxas de resposta.
Levantamentos multímodo
Um dos melhores caminhos para minimizar a ausência de resposta
em levantamento é usar mais de um modo de coleta de dados. As ques-
tões-chave, como observado, são acesso, motivação e custo. Misturar os
modos pode habilitar os pesquisadores a alcançar as pessoas que estão
inacessíveis por meio de um único modo. Isso também pode permitir-
-lhes coletar dados dos membros da amostra menos intrinsecamente mo-
tivados. Por exemplo, um protocolo atrativo é usar e-mail ou correio para
a primeira fase da coleta de dados, seguido por entrevistar por telefone

com os não respondentes. Combinar entrevistas por telefone e em pessoa
é outro modelo eficaz.
Uma questão crítica em levantamentos multímodo é a compatibi-
lidade dos dados através dos modos. As respostas para algumas per-
guntas são afetadas pelo modo da coleta de dados; outras não o são. A
fim de combinar dados coletados usando modos diferentes, é importan-
te que os dados sejam comparáveis. Tais questões são mais discutidas
no Capítulo 5.
DUAS OUTRAS ABORDAGENS PARA DIMINUIR

O ERRO DA AUSÊNCIA DE RESPOSTA
Respondente representante
Muitos levantamentos rotineiramente coletam dados de um repre-
sentante da família sobre os outros membros da família. Se um respon-
dente está impossibilitado ou relutante a ser entrevistado, pedir a outro
membro da família relatar para o respondente designado é uma opção.
Estudos da qualidade de tais dados representados normalmente, mas
não sempre, indicam que o relato do representante não é tão bom quan-
to o autorrelato para a maioria dos tópicos. Contudo, poucos pesquisa-
dores aceitariam relatórios feitos por representantes para estados subje-
tivos, tais como sentimentos, conhecimentos ou opiniões. Para informa-
ções factuais, contudo, se há um representante bem-informado disponí-
vel, usá-lo pode ser uma forma efetiva para reduzir o erro resultante da
ausência de resposta. Groves (1989) revisa a literatura inconclusa sobre
a qualidade dos dados fornecidos por representantes.
Fazendo um levantamento dos não respondentes

Suponha que um levantamento por correio foi feito e 60% dos
amostrados responderam. O pesquisador pensa que muitos não respon-
dentes responderiam a solicitação para dar uma entrevista pessoal ou
por telefone, mas necessita de fundos para tentar tais procedimentos
com todos os não respondentes. Uma opção é extrair uma amostra deles
a ser contatada com os métodos mais dispendiosos.
Dois usos diferentes podem ser feitos de tais esforços.
Primeiro, os dados desse segundo turno de coleta de dados podem
ser usados para estimar a direção e a quantidade de vieses na amostra
inicial. É claro, o segundo turno também terá ausência de resposta, por-

tanto pode produzir dados que não representam completamente todos
os não respondentes. Contudo, sujeitos a essa limitação, os dados podem
ser usados para melhorar um ajuste estatístico (discutido no Capítulo
10). Com essa perspectiva, o pesquisador pode perguntar apenas um
subconjunto de questões-chave, em vez de todas as questões, como uma
forma de melhorar as chances de que um respondente relutante possa
concordar em participar. Algumas organizações de pesquisa usam incen-
tivos financeiros nesses esforços também.
Segundo, se a nova rodada de coleta de dados replica questões da
amostra inicial, os resultados podem ser adicionados aos dados da amos-
tra inicial definida. Para fazer isso, os dados precisam ser ponderados
para se ajustarem ao fato de que apenas uma amostra de não responden-
tes recebeu o tratamento de acompanhamento.
Se metade dos não respondentes são acompanhados, então os res-
pondentes dessa fase da coleta de dados devem ser ponderados por um
fator de dois quando eles forem combinados com os dados iniciais. Além
disso, os resultados podem ser apropriadamente relatados como refletin-
do uma porcentagem ajustada da amostra da população (uma taxa de
resposta ajustada), calculada da seguinte maneira:
Respostas da Fase I + 2 X Respostas da Fase II

Taxa de Resposta Ajustada =
Amostra Original Elegível
AMOSTRAS NÃO PROBABILísticaS

(OU DE PROBABILIDADE MODIFICADA)
A discussão neste capítulo até agora assumiu um formato de amos-

tra probabilística por meio do qual os respondentes são designados por
algum procedimento objetivo. O problema dos pesquisadores é coletar
dados desses designados. Contudo, como temos discutido, frequentemen
te é difícil e caro obter respostas de uma alta porcentagem de uma amos-
tra probabilística, particularmente uma amostra geral da população que
em média não tem uma razão particular para investir em um levanta-
mento particular. É, portanto, compreensível que os investigadores te-
nham explorado abordagens alternativas para facilitar a responsabilida-
de da coleta de dados.
Substituindo respondentes
As discordâncias entre os pesquisadores sobre a importância da
amostragem probabilística é intrigante. O Governo Federal em geral não
custeará esforços de pesquisas projetadas para fazer estimativas das carac-
terísticas da população que não sejam baseadas nas técnicas da amostra-
gem probabilística. A maioria das organizações de pesquisa acadêmica e
muitas organizações de pesquisa sem fins lucrativos têm a mesma aborda-
gem para produzir a amostragem. Ao mesmo tempo, a maioria dos grupos
de pesquisa da opinião pública, de pesquisa de grupos políticos de votação
e das organizações de pesquisa de mercado apoiam-se pesadamente nos
métodos de amostragem não probabilística (ver Converse, 1987, para uma
discussão das raízes históricas dessa diferença).
O núcleo das estratégias de amostragem probabilística é que a in-
clusão de alguém em uma amostra é baseada em um procedimento pre-
determinado que define uma taxa de seleção para subgrupos definidos
da população. Além disso, nenhuma característica do respondente nem
critério do entrevistador influencia a probabilidade de uma pessoa estar
em uma amostra. Apesar das modificações não probabilísticas dos proce-
dimentos de amostragem variarem, todas compartilham a propriedade
de que, no último estágio, o critério do entrevistador e/ou as caracterís-
ticas do respondente que não fazem parte do modelo de amostra afetam
a probabilidade de ser incluído em uma amostra. Os dois procedimentos
mais comuns são descritos a seguir.
Para um estudo por entrevistas pessoais envolvendo amostragem
não probabilística, o pesquisador pode extrair quarteirões da mesma ma-
neira que um amostrador extrairia para uma área de amostra probabilís-
tica. A diferença seria que, uma vez que o quarteirão é selecionado, o
entrevistador seria instruído a visitar aquele quarteirão e completar al-
gum número fixo de entrevistas com as pessoas que residem no quartei-
rão. Não haveria nenhuma lista específica de unidades habitacionais no
quarteirão. Uma abordagem é dar ao entrevistador a liberdade de visitar
qualquer casa localizada naquele quarteirão; ele não faria visitas subse-
quentes para encontrar as pessoas que não estavam em casa no momen-
to da visita inicial.
Uma estratégia similar é usada para levantamentos por telefone.
Dentro de uma troca particular, ou conjunto de números dentro de uma
troca, um alvo é definido para completar um determinado número de
entrevistas. Caso não haja resposta ou nenhum respondente disponível
no momento em que o entrevistado telefona, outro número que esteja

dentro do mesmo grupo é chamado até que o número desejado de entre-
vistas seja obtido. O primeiro estágio de amostragem, se for conduzido
da maneira como indicado anteriormente, distribui a amostra sobre a área
geográfica mais ou menos da maneira como a população é distribuída. So-
bre a família e a seleção de respondentes, contudo, há três tipos muito
claros de vieses que podem ser introduzidos.
Na estratégia de entrevista pessoal, mas não na por telefone, os
entrevistadores podem fazer uma escolha acerca de quais casas visitar.
Acontece que eles vão mais às casas mais atraentes do que às menos
atraentes, e a apartamentos do primeiro andar mais do que aos do se-
gundo e terceiro andares. Os entrevistadores também preferem unidades
habitacionais sem cachorros. Outros fatores que influenciam as escolhas
feitas pelos entrevistadores individuais podem ser deixadas a cargo da
imaginação do leitor.
Algumas organizações de pesquisa tentam restringir o critério
dos entrevistadores fornecendo informações acerca de por onde come-
çar no quarteirão e solicitando a eles que não pulem unidades habita-
cionais. Sem uma lista prévia de unidades no quarteirão, contudo, é
praticamente impossível avaliar se aquelas instruções foram ou não se-
guidas. Além disso, se há uma listagem prévia das unidades na rua,
uma porção das economias reservadas para os custos com essa aborda-
gem é eliminada.
Além do potencial para substituir as famílias em que as entrevistas
são feitas, é de grande valor fazer uma entrevista com algum adulto da
família que esteja disponível e disposto a ser entrevistado. As exigências
da amostra probabilística especificam um respondente dentro de uma fa-
mília por algum método objetivo; em contraste, as estratégias de substi-
tuição permitem entrevistas com qualquer membro de uma família con-
tatada que esteja disposto a ser entrevistado.
Uma das mais obvias características do potencial de viés dos méto-
dos não probabilísticos é o efeito de disponibilidade. Se não se vai ligar
novamente para uma unidade habitacional na qual ninguém estava em
casa, ou ligar de volta para membros da família que não estavam em
casa no momento em que o entrevistado fez contato, as pessoas que pas-
sam mais tempo em casa têm uma chance maior de serem selecionadas
do que aquelas que rotineiramente não estão em casa.
Uma amostragem descontrolada dessa forma produz alguns vieses
óbvios de amostra. A abordagem mais comum para melhorar a qualidade
das amostras é introduzir cotas para vieses óbvios. Desse modo um entre-
vistador pode ser obrigado a entrevistar metade de homens e metade de
mulheres em um determinado quarteirão ou agrupamento de telefone.
Ocasionalmente alguma restrição adicional será estabelecida, tal como a
composição racial esperada ou o número de adultos jovens ou velhos. É
importante, contudo, não colocar muitas limitações nas cotas, ou os entre-
vistadores terão que gastar uma grande quantidade de tempo ligando ou
caminhando pelos quarteirões procurando por respondentes elegíveis.
O viés final inerente ao fato de permitir substituições tem a ver com a
conquista da cooperação. No caso em que o respondente diz estar ocupado
ou que não é uma boa hora para ser entrevistado, o entrevistador não tem
incentivo para mobilizar a cooperação. Se um projeto não é efetivamente
apresentado, uma fração significativa da população não ficará interessada
em ajudar. Deixar as pessoas se recusarem facilmente sem um esforço árduo
para apresentar o estudo a eles não vai apenas influenciar uma amostra con-
tra as pessoas ocupadas, isso também vai influenciá-la contra as pessoas que
têm menos conhecimento prévio ou menos interesse intrínseco em pesquisa
e/ou no assunto particular que está sendo estudado.
Sudman (1967, 1976) argumenta que há ausência de resposta em
todos os levantamentos, mesmo naqueles em que todo esforço é feito para
contatar os não respondentes. Uma vez que foi aprendido que um indiví-
duo não irá cooperar ou que não pode ser alcançado depois de vários tele-
fonemas, ele sugere que substituir um respondente da mesma casa ou do
mesmo quarteirão na verdade pode melhorar a qualidade das estimativas.
Ele argumenta que ter um vizinho na amostra pode ser melhor do que não
ter nem o respondente designado nem seu vizinho ou vizinha. Quando um
controle cuidadoso é exercido sobre o critério dos entrevistadores, contu-
do, como Sudman defende, a economia em ligações de retorno são com-
pensadas pelo aumento nos custos de supervisão.
Métodos de amostragem não probabilística produzem economia
de custos para levantamentos de entrevista pessoal (menos para levanta-
mentos por telefone). Uma outra vantagem importante desses métodos,
particularmente para levantamentos políticos, é que eles possibilitam
conduzir levantamentos durante a noite ou em poucos dias. Há muitas
pessoas para as quais muitas ligações de retorno ao longo de vários dias
são necessárias para pegá-las em casa. Levantamentos rápidos, obvia-
mente, têm que contar principalmente com a resposta das pessoas que
estão mais disponíveis. Quando uma cota de amostra é efetivamente im-
plementada, as amostras resultantes normalmente são bastante similares
aos dados de amostra probabilística, na medida em que eles podem ser

comparados. Mesmo assim, dois fatos não devem ser esquecidos. Primei-
ro, visto que a chave para economizar dinheiro é não fazer ligações de
retorno, apenas cerca de um terço da população tem chance de estar na
maioria das amostras não probabilísticas (isto é, a população que está
em casa em uma primeira ligação). Uma amostra que dá a apenas um
terço da população uma chance de ser selecionada, um terço da popula-
ção com características distintivas conhecidas, tem grande potencial de
ser atípica de forma que afetarão as estatísticas da amostra.
Robinson (1989) fornece um excelente exemplo de quão distorci-
da uma amostra presumivelmente bem feita pode ser. Ele comparou re-
sultados de dois levantamentos, um baseado em amostra probabilística e
outro em amostra não probabilística, ambos destinados a estimar o inte-
resse em arte e a presença em eventos relacionados à arte. O levanta-
mento da amostra não probabilística superestimou muito o nível de inte-
resse nas artes.
Além dos vieses potenciais, outra desvantagem das amostras de
cota é que os pressupostos da teoria da probabilidade e dos erros de
amostragem, os quais rotineiramente são apresentados como descreven-
do a confiança das amostras não probabilísticas, não se aplicam. Se há
substitutos, a amostra não é uma amostra probabilística, embora possa
ser espalhada pela população de uma forma razoavelmente realista.
Há alguns momentos em que amostras não probabilísticas são
úteis. Henry (1990) descreve os vários tipos de amostra não probabilísti-
ca e quando elas podem ser apropriadas. Se um pesquisador decide usar
uma amostra não probabilística, contudo, deve ser dito aos leitores como
a amostra foi extraída, o fato de que isso provavelmente é tendencioso
na direção da disponibilidade e da boa vontade (complacência) para ser
entrevistado, e que os pressupostos normais para calcular os erros de
amostra não se aplicam. Tal advertência para os leitores não é comum.
Em vários casos, as amostras não probabilísticas são seriamente mal apre-
sentadas, e isso constitui um sério problema para a credibilidade da pes-
quisa em ciências sociais.
A AUSÊNCIA DE RESPOSTA COMO UMA FONTE DE ERRO
A ausência de resposta é uma importante fonte de erros em levan-

tamentos. A Tabela 4.2 demonstra o grande potencial disso em afetar os
resultados. No entanto, embora possamos calcular a taxa de ausência de

resposta, normalmente não sabemos o resultado disso nos dados. O estu-
do de Keeter e colaboradores (2006) ilustra um levantamento com uma
taxa comparativamente baixa de resposta produzindo resultados que são
muito similares a uma com uma taxa muito mais alta, mas a análise de
Groves (2006) lembra-nos de não sermos complacentes.
O problema-chave é que nos faltam bons dados acerca de quando
a ausência de resposta é e não é provável de ser tendenciosa com res-
peito ao conteúdo do levantamento. Certamente um efeito positivo in-
voluntário das preocupações cada vez maiores acerca das taxas de res-
posta aumentará a pressão sobre os pesquisadores para que coletem da-
dos sobre os vieses da ausência de resposta quando puderem. Contudo,
isso é algo difícil de ser feito. Na ausência de tais dados, talvez o mais
forte argumento para os esforços para maximizar as taxas de resposta
seja a credibilidade. Quando as taxas de resposta são altas, há apenas
um pequeno potencial para erro devido à ausência de resposta a ser im-
portante. Quando as taxas de resposta são baixas, há um grande poten-
cial para erros importantes; as críticas aos resultados do levantamento
têm uma base sensata sobre a qual se apoiar para dizer que os dados
não são verossímeis.
EXERCÍCIO
Se uma amostra de unidades habitacionais é selecionada como

primeiro estágio da amostragem de adultos com 18 anos ou mais, a taxa
de resposta é o número total de entrevistas dividido pelo número de in-
divíduos na população de estudo designada pelo procedimento de
amostragem para estar na amostra. Você incluiria ou excluiria os seguin-
tes grupos do denominador quando estivesse calculando a taxa de res-
posta? (Por quê?)

Unidades habitacionais desocupadas.
Aqueles que estavam ausentes, em férias.
Aqueles que estavam temporariamente no hospital.
Aqueles que se recusaram a ser entrevistados.
Unidades habitacionais onde todos os moradores eram menores de 18 anos.
Aqueles que não sabiam falar a língua do entrevistador.
Aqueles cujas outras pessoas da família disseram ser doentes mentais ou
muito confusos para serem entrevistados.
Aqueles que não estavam nunca em casa quando o entrevistador ligava.

Aqueles que estavam ausentes, na faculdade.
Defina a população a qual as suas estatísticas (e sua taxa de res-

posta) se aplicam.
Dillman, D. A. (2007). Mail and Internet surveys: The tailored design method (2nd
ed.). New York: John Wiley.
Groves, R. M., & Couper, M. P. (1998). Nonresponse in household interview surveys.
New York: John Wiley.
Groves, R. M., Dillman, D. A., Eltinge, J. L., & Little, R. J. A. (Eds.). (2002). Survey
nonresponse. New York: John Wiley.
Método de coleta de dados 5
A escolha do modo para coleta de dados, por correspondência, por telefone,

pela internet, por entrevista pessoal ou em grupos, é relacionada diretamen-
te com a estrutura da amostra, com o tópico da pesquisa, com as caracterís-
ticas da amostra e com os recursos e equipe disponíveis; isso influencia as
taxas de resposta, os modelos de questões e os custos da pesquisa. Computa-
dores podem ser utilizados no processo de coleta de dados através dos méto-
dos citados. Neste capítulo serão apresentadas várias considerações e conse-
quências da escolha de cada método de coleta de dados.
Uma das decisões mais urgentes que o pesquisador precisa tomar re-
fere-se ao modo como será realizada a coleta de dados. Um entrevistador
deveria fazer as perguntas e gravar as respostas, ou as questões deveriam
ser autoadministradas, ou seja, respondidas e conduzidas pelo próprio en-
trevistado? Se a participação de um entrevistador for necessária, há ainda a
decisão por uma entrevista realizada pessoalmente ou por telefone. Há dife-
rentes modos de apresentar o questionário ao respondente, caso este precise
ler e responder às questões sem o auxílio de um pesquisador. Em alguns ca-
sos, questionários são entregues aos entrevistados, em grupos ou individual-
mente, e devolvidos imediatamente. Em pesquisas realizadas com famílias,
questionários podem ser deixados nas casas ou enviados por correspondên-
cia e devolvidos da mesma maneira. Para os que possuem acesso à internet,
as perguntas podem ser enviadas por e-mail ou pode ser solicitado aos en-
trevistados que acessem sites para responder às questões.
Computadores podem ser incorporados de várias formas ao pro-
cesso de coleta de dados. Obviamente, entrevistadores costumam fazer
uso de computadores portáteis ao realizarem entrevistas por telefone ou

pessoalmente. Indivíduos têm respondido às mais interessantes variações
de pesquisas que utilizam o computador como ferramenta. Pesquisas que
fazem da internet um instrumento não utilizam entrevistadores. Os da-
dos podem ser coletados em lugares frequentados pelos entrevistados,
como consultórios médicos, por exemplo, desde que os respondentes es-
tejam utilizando computadores. Finalmente, em levantamentos de dados
realizados pelo telefone, uma voz computadorizada pode fazer as per-
guntas, cujas respostas serão dadas pressionando teclas do telefone.
Embora a maioria das pesquisas utilize um único meio para a coleta
de dados, não raro são empregadas combinações de métodos. Por exemplo,
é possível que pesquisas baseadas em entrevistas pessoais tenham um deter-
minado número de questões a serem administradas pelos próprios sujeitos,
as quais podem ser respondidas diretamente através de um computador. A
coleta de dados realizada através de computadores pode também vir acom-
panhada de entrevistas por telefone. Para reduzir a taxa de ausência de res-
posta, indivíduos que porventura não retornarem questionários enviados
por correio podem ser contatados pelo entrevistador pessoalmente ou por
telefone. As pesquisas que fazem uso de e-mails são comumente comple-
mentadas por levantamento de dados por correspondência para aqueles que
não fornecem seu endereço de e-mail ou não respondem às mensagens ele-
trônicas. Os respondentes que não forem localizados pelo pesquisador po-
dem ser entrevistados por telefone ou solicitados a preencherem um ques-
tionário autoadministrado. Finalmente, algumas pesquisas feitas com famí-
lias utilizam entrevistas por telefone para sujeitos cujos números de contato
podem ser obtidos, contudo, fazem uso de entrevistas pessoais em famílias
cujos números de telefone não são encontrados.
A eficácia de cada modo de pesquisa dependerá de uma série de con-
dições. A meta deste capítulo é apresentar e discutir cada uma destas condi-
ções, necessárias à escolha do melhor método para a coleta de dados.
AS MAIORES DIFICULDADES NA ESCOLHA DE UMA ESTRATÉGIA

Amostragem
O modo escolhido pelo pesquisador para elaborar uma amostra é
relacionado ao melhor método para coletar dados. Certos tipos de abor-
dagens de amostragem podem facilitar ou dificultar o uso de uma ou ou-
tra estratégia. Se uma amostragem é oriunda de uma lista, a informação
contida nesta é importante. Obviamente, se na lista faltarem endereços

confiáveis de correspondência, e-mails ou números de telefone, tentar
coletar dados por este meio torna-se uma tarefa complicada. A discagem
aleatória de dígitos aprimorou expressivamente o potencial das estraté-
gias de coleta de dados através do telefone, ao dar a todas as famílias
com telefone a chance de serem selecionadas. Estar disposto a excluir as
que não possuem números de telefone é, talvez, o meio mais barato de
elaborar uma amostragem geral de famílias.
Logicamente, é possível utilizar a estratégia de discagem aleatória
de dígitos simplesmente para fazer um contato inicial com as famílias e
em seguida coletar dados usando outro método. A partir do momento
em que uma família for localizada, pode ser solicitado um endereço ou
um e-mail para manter contato e permitir o envio de um questionário ou
a visita de um entrevistador. Estes métodos são úteis quando um pesqui-
sador procura por uma população singular, uma vez que a coleta de da-
dos através do telefone é consideravelmente mais barata do que aquela
realizada através de entrevistas pessoais. Essas estratégias podem apre-
sentar problemas no que diz respeito à cooperação dos sujeitos.
Quando a base da amostragem é um conjunto de endereços, uma
lista ou uma amostragem por área, números de telefone, entrevistas pes-
soais ou procedimentos de correspondência podem ser viáveis. Obvia-
mente, se o endereço for confiável, um entrevistador pode ser enviado
para realizar a coleta de dados. Além disso, é possível obter números de
telefone de vários endereços através da utilização de serviços comerciais
ou da internet que ligam nomes e endereços a números publicados em
listas telefônicas.
Este método não irá fornecer números de telefone para todos os
endereços. Contudo, algum outro modo de coleta de dados será necessá-
rio como um complemento. É ordinariamente possível realizar entrevis-
tas por telefone com a maioria dos sujeitos considerando, desse modo, as
potenciais vantagens deste método. Se uma amostra é derivada de uma
boa lista de endereços, um levantamento de dados com base em corres-
pondências também se torna possível. No entanto, em uma área urbana
com vários condomínios é essencial que haja distinções por apartamento
(ou por nome de família), bem como por nomes de ruas. Sem uma de-
signação correta, o envio das correspondências pode não ser bem-sucedi-
do, e as cartas provavelmente não serão entregues ao destinatário corre-
to. O problema possui a mesma magnitude em áreas rurais onde os indi-
víduos retiram suas correspondências em caixas de correio. Se no refe-
rencial da amostra de uma área rural não estão incluídos os nomes e en-
dereços dos sujeitos, então a realização de um levantamento de dados
por correspondência está fora de questão.
Listas de amostragem que incluem endereços de e-mail obviamen-
te proporcionam novas oportunidades para métodos de coleta de dados.
Se por um lado ainda não é universal a utilização do correio eletrônico,
por outro há grupos (trabalhadores, estudantes, membros de organiza-
ções profissionais) para os quais é possível a aplicação de pesquisas en-
volvendo o uso deste. Nestes casos, o emprego da internet como um dos
principais métodos para coleta de dados torna-se uma boa alternativa.
Um último problema de amostragem a ser considerado é a desig-
nação de um respondente. Se a estrutura da amostra é uma listagem de
indivíduos, qualquer procedimento é viável, incluindo aquele baseado
em correspondência. Muitas pesquisas, no entanto, requerem a designa-
ção de um tipo específico de respondente para a realização da coleta de
dados. Se um questionário é endereçado a uma casa de família ou orga-
nização, o pesquisador terá algum controle sobre quem irá respondê-lo.
Portanto, o envolvimento de um entrevistador é um importante auxílio,
caso ocorram problemas na designação de respondentes.
Tipo de população
Como os sujeitos lidam com computadores, suas habilidades em
leitura e escrita e sua motivação para cooperar são fatores que devem
ser considerados no ato da escolha de um modo para a coleta de dados.
Procedimentos autoadministrados exigem mais das habilidades de leitu-
ra e escrita dos sujeitos do que procedimentos de entrevista, e a familia-
ridade dos mesmos com computadores é considerada se o pesquisador
fizer uso da internet como ferramenta de pesquisa. Respondentes que
não são proficientes em leitura e escrita (mas que possuem uma boa ex-
pressão oral), indivíduos que apresentam dificuldades de visão, pessoas
que não são familiarizadas com a utilização de computadores, ou aque-
las que, por alguma razão, estão fatigadas ou doentes, provavelmente
irão preferir responder a uma entrevista a preencher um questionário.
Outra dificuldade observada na aplicação de procedimentos au-
toadministrados é obter indivíduos que estejam dispostos a responder os
questionários adequadamente. Se não há o envolvimento de um entre-
vistador, a motivação partirá exclusivamente do respondente; indivíduos
que estão particularmente interessados no tópico da pesquisa tendem a
apresentar um maior empenho ao responder (Fowler et al., 2002; Heberlein

e Baumgartner, 1978; Jobber, 1984). Neste contexto, se um pesquisador
está coletando dados de uma população com um bom nível cultural e
que, em média, se mostra altamente interessada no tópico da pesquisa,
procedimentos que utilizam correspondência ou e-mail tornam-se mais
atraentes. Em contrapartida, se um pesquisador está lidando com uma
população cujas habilidades de leitura e escrita são insatisfatórias e/ou
nas quais a média de interesse e motivação mostra-se baixa, as estraté-
gias de coleta de dados baseadas em entrevistas são preferíveis.
A facilidade de contato é outro fator a ser considerado. Estratégias
baseadas em entrevistas dependem da capacidade do entrevistador de
contatar os respondentes e organizar a coleta de dados. Uma grande van-
tagem das estratégias autoadministradas é de que, se os endereços estão
corretos, as questões serão enviadas aos indivíduos sem maiores proble-
mas. Além disso, pessoas que acumulam diversas ocupações têm a possibi-
lidade de responder ao questionário no momento que julgarem convenien-
te. Por outro lado, se a pesquisa é relacionada ao ambiente profissional,
pessoas ocupadas em seus setores de trabalho poderão responder à entre-
vista por telefone ou combinar um horário com o entrevistador. Agendar
um horário para uma entrevista por telefone pode ser a melhor maneira
de contatar estes indivíduos para realizar a coleta de dados.
Formato de questões
Geralmente, se um pesquisador planeja realizar um questionário
autoadministrado, ele precisa limitá-lo a questões que requerem respos-
tas objetivas, ou seja, questões cujas respostas são apenas assinaladas em
uma folha entregue pelo pesquisador. Em parte, este método é utilizado
pela sua característica de simplificar respostas, o que pode aumentar a
taxa de devolução de questionários. Segundo, respostas amplas de ques-
tionários autoadministrados não costumam oferecer dados produtivos.
Sem a presença de um entrevistador para descobrir o significado de rela-
tos incompletos, baseado nos objetivos das questões, as respostas não
poderão ser comparadas entre os respondentes e, por consequência, se
tornarão praticamente indecifráveis. A provável função dessas respostas
(se apresentarem alguma utilidade) será de apoio aos dados inseridos na
pesquisa. Apesar da necessidade da presença de um entrevistador para
aplicar questões discursivas, há também alguns casos nos quais questões
objetivas produzem melhores resultados se autoadministradas. Um exem-
plo deste fato se dá quando um entrevistador deseja realizar uma série de

questões de forma similar. A leitura, feita por um pesquisador, de longas
listas contendo alternativas similares pode tornar uma entrevista constran-
gedora e tediosa. Em alguns casos, uma boa estratégia é inserir este tipo
de questão em questionários autoadministrados, os quais podem ser entre-
gues em forma impressa ou eletrônica. Este tipo de modificação pode sina-
lizar uma mudança favorável nos rumos da entrevista.
Procedimentos autoadministrados também são vantajosos quando
há numerosas ou complexas categorias de respostas. Em uma entrevista
pessoal, é comum entregar ao respondente um cartão para que ele possa
anotar todas as suas respostas, prevenindo, assim, possíveis esquecimen-
tos. No entanto, em pesquisas por telefone são necessários alguns ajus-
tes. Três métodos são utilizados. No primeiro, pesquisadores podem sim-
plesmente limitar as categorias de respostas para entrevistas. Tem-se dis-
cutido que o número de quatro categorias é o máximo adequado para
entrevistas por telefone; em muitos levantamentos de dados predomina
o número de duas a três categorias de resposta.
No segundo, uma longa lista pode ser apresentada em uma entrevis-
ta por telefone se o entrevistador ler as categorias de resposta lentamente,
repetindo-as e solicitando ao respondente que escolha a categoria que
ache adequada. Não foi esclarecido, contudo, se as respostas obtidas dessa
forma são idênticas àquelas oferecidas em uma lista visual de categorias.
Para alguns tipos de questões, as respostas são influenciadas pela ordem
na qual as perguntas são lidas (Bishop, Hippler, Schwartz, e Strack, 1988;
Schuman e Presser, 1981).
No terceiro, pesquisadores podem fragmentar uma questão com-
plexa em duas ou mais questões simplificadas. Por exemplo, é comum
solicitar aos indivíduos que insiram sua renda total em quatro ou cinco
categorias. Uma questão com nove categorias de respostas pode ser rea-
lizada em duas etapas, como nas frases a seguir: Você diria que a sua
renda familiar total é menor que $30.000, entre $30.000 e $60.000, ou
maior que $60.000? Então, dependendo da resposta, o entrevistador pros
segue fazendo outra pergunta de três alternativas, como: Bem, então
você diria que a sua renda familiar total é menor que $40.000, de
$40.000 a $50.000, ou maior que $50.000? Estas variações simplificam
as questões, contudo, o formato destas também pode influenciar as res-
postas (Groves, 1989).
Há formatos de questões, incluindo aquelas com descrições com-
plexas de situações ou eventos e aquelas que necessitam de recursos vi-
suais para serem compreendidas, que não podem ser adaptadas para en-
trevistas por telefone. Se, porventura, tais questões forem elementos cru-
ciais da pesquisa, então outra forma para a realização da entrevista se
faz necessária. Pesquisadores têm demonstrado, entretanto, que é possí-
vel adaptar a maioria das questões para entrevistas por telefone. Se um
instrumento for utilizado para pesquisas autoadministradas e para aque-
las realizadas através de entrevistas, é importante elaborar as questões
com antecedência. Isso geralmente requer poucas mudanças para trans-
formar um roteiro de entrevistas em uma pesquisa autoadministrada.
Métodos baseados em computador proporcionam um número de
vantagens que não podem ser obtidas em procedimentos que utilizam
papel e caneta. Por exemplo, regras para o preenchimento de questões
que possuem mais de uma resposta possível são praticamente impossí-
veis de serem compreendidas sem a assistência de um computador. Por
vezes é aconselhável desarranjar a ordem das questões ou as alternativas
de resposta – uma tarefa simples com o auxílio de um computador, po-
rém quase impossível sem a sua assistência.
Finalmente, quando respondentes estão trabalhando diretamente
com um computador, uma maior quantidade de material complexo pode
ser incluída na pesquisa. Deste modo, fotos, material de áudio e outras
combinações dessa espécie podem ser apresentadas aos respondentes
como parte do processo de levantamento de dados.
Conteúdo das questões

Muitos estudos têm comparado os resultados de diferentes estraté-
gias de coleta de dados (por exemplo, Cannel et al., 1987; Groves e Kahn,
1979; Hochstim, 1967; Mangione, Hingson, e Barret, 1982). Boas coletâ-
neas de resultados são apresentadas por Leeuw e van der Zouwen (1988)
e Dillman (2007). Para a maioria dos levantamentos de dados estudados,
o total de resultados obtidos através de entrevistas pessoais, entrevistas
por telefone e procedimentos autoadministrados tem sido similares.
Pesquisadores têm alimentado uma calorosa discussão a respeito
da melhor estratégia para lidar com tópicos delicados. Procedimentos
autoadministrados são considerados melhores, pois não é necessário que
o respondente revele para um entrevistador certos acontecimentos ou as-
pectos pouco louváveis de sua personalidade. Também é defendido o ca-
ráter impessoal das entrevistas por telefone, o qual deveria auxiliar o
respondente, encorajando-o a revelar eventos ou comportamentos nega-
tivos. Além disso, a discagem aleatória de dígitos proporciona a exe-

cução de um procedimento de levantamento de dados anônimo e virtual,
considerando o fato de que o entrevistador necessita saber o nome ou
endereço do respondente. Ainda há os que defendem a presença de um
entrevistador para apresentar questões delicadas, pois acreditam que é
essencial que se estabeleça uma relação de confiança, a qual se faz ne-
cessária para que os respondentes relatem informações pessoais.
Embora todos os argumentos anteriores sejam plausíveis, dados cla-
ramente indicam que informações pessoais são obtidas com maior fre-
quência, e certamente com maior precisão, através de métodos autoadmi-
nistrados. Tanto o método autoadministrado em questões impressas quan-
to o mesmo método monitorado por computador apresentam os mesmos
resultados, em comparação com os procedimentos administrados por um
entrevistador (Aquilino, 1994; Dillman e Tarnai, 1991; Tourangeau e Smith,
1998; Turner et al., 1998). Além disso, tais resultados se associam a tópicos
delicados (como uso de drogas ilegais e comportamento sexual) e temas
mais sutis ligados à construção e manutenção da autoimagem, como pro-
blemas relacionados à saúde ou a “dificuldades” surgidas após uma ci-
rurgia na próstata (Fowler, Roman e Di, 1998; McHorney, Kosinski, Ware,
1994). Se as possíveis respostas pessoais são o foco de uma pesquisa, tor-
na-se preciso encontrar um modo de obtê-las sem a presença de um entre-
vistador, de maneira que as respostas sejam genuínas.
Ao comparar entrevistas pessoais e por telefone, de acordo com este
tópico de discussão, os dados não se mostram claros (de Leeuw e van der
Zouwen, 1988). Todavia, é provavelmente mais comum que procedimen-
tos por telefone evidenciem diferenças na estrutura das respostas, eviden-
ciando as diferenças sociais dos respondentes, em comparação com entre-
vistas pessoais. Uma das diferenças mais marcantes foi descoberta por
Mangione e colaboradores (1982) em taxas de resposta nas quais os in-
divíduos admitiam terem tido problemas de abuso de álcool no passado.
Hochstim (1967), Henson, Roth e Cannell (1977), Aquilino (1994), e
Fowler e colaboradores (1998) observaram resultados consistentes.
Um aspecto completamente distinto do conteúdo das questões que
pode afetar o modo de coleta de dados é a dificuldade na transcrição de
respostas. Em alguns levantamentos de dados, pesquisadores almejam in-
dagar sobre eventos e comportamentos cujas respostas são de difícil trans-
crição, tanto por estenderem o limite de tempo quanto por apresentarem
muitos detalhes. Em determinados casos, uma transcrição precisa pode
apresentar benefícios no que diz respeito à consulta de registros ou à dis-
cussão de questões com membros do grupo familiar. O padrão de entrevis-

tas é um rápido processo de perguntas e respostas, o qual não oferece
oportunidades para aprimorar a coleta de dados; este fato pode ser perce-
bido especialmente em entrevistas por telefone. Procedimentos autoadmi-
nistrados proporcionam um maior tempo para elaborar as respostas, para
consultar registros e para consultar outros membros do grupo familiar.
Quando são solicitados maiores detalhes a respeito de eventos
simples, como informações sobre o que os indivíduos comem ou como
gastam seu dinheiro, ou quais programas assistem, o melhor método é
solicitar aos respondentes que organizem relatórios. Embora haja limites
de quantos indivíduos irão elaborar relatórios, e geralmente os respon-
dentes são pagos para fazê-lo, este é um bom método para conseguir
maiores detalhes. Há alternativas informatizadas para proporcionar
maior praticidade à elaboração de relatórios, como ter indivíduos ligan-
do periodicamente para um número gratuito ou fornecendo informações
pela internet, as quais podem oferecer dados da mesma qualidade.
De uma forma geral, quando as amostras são passíveis de compa-
ração, pesquisadores concluíram que muitas estimativas obtidas por pes-
quisas não são afetadas pelo método da coleta de dados. Salvo a relevân-
cia de alguns dos problemas mencionados anteriormente, é provável que
a decisão sobre como realizar a coleta de dados deva ser feita em razão
da ligação entre o tema do questionário e o método da coleta de dados.
Contudo, é necessário para o processo de levantamento de dados que se
estabeleça uma relação entre o formato ou o conteúdo das questões e o
modo da coleta de dados.
Taxas de resposta
A taxa de resposta tende a ser um fator decisivo na escolha de um
procedimento de coleta de dados. Obviamente, umas das maiores poten-
cialidades de levantamentos de dados autoadministrados, quando eles
são possíveis, é a elevada taxa de resposta. Generalizando, quando estu-
dantes em uma sala de aula ou trabalhadores em seus respectivos setores
são solicitados a responder questionários, a taxa de resposta se aproxima
dos 100%. A quantidade de respostas geralmente diminui em razão de
abstenções ou escalas de trabalho (trocas, folgas).
A taxa de resposta por levantamentos de dados por correspondên-
cia ou e-mail depende dos sujeitos e do propósito da pesquisa. Uma pes-
quisa financiada pela Medicare, realizada com pacientes que passaram
por cirurgia de próstata, alcançou um retorno de 82% em respostas en-

viadas por correspondência, seguido pela marca de 90% de retorno em
respostas obtidas por telefone (Fowler et al., 1998). Em contrapartida,
há casos de pesquisas feitas por correspondência que obtiveram retorno
de menos de 20%.
Não há dúvidas de que o problema da ausência de resposta esteja li-
gado principalmente aos levantamentos de dados por correspondência.
Como foi observado no capitulo anterior, se um pesquisador simplesmen-
te envia questionários para uma população geral, sem um acompanha-
mento adequado, a taxa de retorno tende a ser menor que 50% (Heberlein
e Baumgartner, 1978). Se o processo for acompanhado de maneira ade-
quada e se o projeto for bem elaborado e executado, as taxas de resposta
poderão ser obtidas tanto por pesquisas por correspondência quanto por
outros métodos (por exemplo, Dillman, 2007, Fowler et al., 1998).
A eficácia de estratégias que utilizam o telefone para produzir eleva-
das taxas de resposta depende, em parte, do esquema de amostragem. Uma
maneira de utilizar levantamentos de dados por telefone se dá através da
reprodução de alguns procedimentos executados em entrevistas pessoais. Se
um pesquisador possui uma lista de endereços e números de telefone, uma
carta pode ser enviada introduzindo o tópico do estudo e explicando seus
propósitos. Em seguida, o entrevistador pode realizar o primeiro contato por
telefone, pedindo a cooperação do respondente. Sob essas circunstâncias, as
taxas de resposta obtidas através de entrevistas pessoais ou por telefone não
diferem de maneira significativa. Isso ocorre especialmente quando é ofere-
cida aos não respondentes a opção de serem entrevistados pessoalmente
(Groves, 1989; Hochstim, 1967; Mangione et al., 1982).
Os procedimentos descritos anteriormente, contudo, representam
uma minoria nas pesquisas por telefone. São mais comuns os estudos que
associam o telefone com a amostragem por discagem aleatória de dígitos.
Uma particularidade da discagem aleatória de dígitos é que geralmente a
carta prévia não é enviada, ainda que algumas organizações utilizem listas
de endereços e enviem cartas quando um endereço é ligado a um número
selecionado. Por uma série de razões, as taxas de resposta oriundas do sis-
tema de discagem aleatória de dígitos têm sido menos utilizadas desde a
década passada. Este fenômeno, somado ao crescimento do uso de telefo-
nes celulares, tem influenciado de modo considerável as amostras basea-
das no sistema de discagem aleatória de dígitos.
Concluindo, tanto para amostras derivadas de listas quanto para re-
sultados de pesquisas telefônicas, há uma sutil diferença entre entrevistas
pessoais e por telefone no que diz respeito a tipos de resposta. Além disso,
quando pesquisadores optam por realizar novas entrevistas com respon-
dentes que já foram entrevistados para conseguir informações adicionais,
a taxa de resposta obtida pelo telefone não é diferente daquelas obtidas
por intermédio de entrevistas pessoais. Para populações maiores, aparen-
temente um dos custos da discagem aleatória de dígitos em levantamento
de dados por telefone é a reduzida taxa de resposta em famílias seleciona-
das, muito menor do que aquela obtida através de entrevistas pessoais.
Quando uma redução de 5 a 20% nas taxas de resposta é multiplicada
pela taxa na qual as pessoas sem telefone, ou linhas telefônicas, também
são excluídas de tais amostras, o diferencial nas taxas de resposta torna-se
considerável. Ao escolherem o método de discagem aleatória de dígitos, os
pesquisadores devem estar preparados ou para enfrentar dificuldades
como esta, ou para trabalhar muito, com o objetivo de evitá-la.
Custos
A grande vantagem dos procedimentos de levantamento de dados
por telefone e por correspondência é que eles geralmente possuem um
custo menor por retorno do que as entrevistas pessoais. Obviamente, o
método mais barato para levantamento de dados é aquele que utiliza a in-
ternet como ferramenta. Os custos dos levantamentos de dados dependem
de uma série de fatores. Alguns dos fatores mais expressivos são: a quanti-
dade de tempo exigida para a elaboração do questionário, o tempo neces-
sário para instalar e testar o programa de monitoramento por computador,
a extensão do questionário, o alcance geográfico da amostra, a disponibili-
dade e a importância da amostra, os procedimentos de retorno, as regras
para seleção de respondentes e a disponibilidade de equipe treinada.
Os custos de um levantamento de dados por correspondência po-
dem variar. O custo de postagem, as taxas de envio e a impressão de
questionários não são despesas baratas. Além disso, se forem realizadas
ligações como lembretes, o gasto torna-se maior.
Outro fator indispensável para comparação é associado às despe-
sas de telefone envolvidas. Os custos do uso de telefones irão afetar a
comparação existente entre levantamento de dados por telefone e por
entrevistas pessoais, no entanto entrevistas pessoais com famílias comu-
mente possuem um maior custo por entrevista do que aquelas realizadas
por telefone, fazendo uso de uma mesma amostra. Seguramente, os pa-
gamentos e os demais custos para um entrevistador visitar uma casa e
fazer contato com um respondente irão exceder aqueles obtidos através

de procedimentos por telefone.
A comparação de custos entre os métodos por correspondência e
por telefone também irá depender da população. Se for uma população
altamente motivada, que prontamente responde às pesquisas, os custos
do procedimento por correspondência serão menores do que por telefo-
ne. No entanto, na maioria dos casos, para conseguir taxas de resposta
similares, o uso de métodos por correspondência e por telefone podem
ter praticamente o mesmo resultado.
Embora a escolha entre levantamento de dados por correspondên-
cia ou por telefone possa ser feita independentemente de gastos, geral-
mente os mesmos influenciam na escolha do procedimento por entrevis-
tas pessoais. Ainda há muitos casos nos quais é necessário fazer uso das
potencialidades das entrevistas pessoais para atingir os objetivos estabe-
lecidos pela pesquisa.
Para concluir, é óbvio que, se o levantamento de dados pode ser feito
pela internet, os custos serão consideravelmente menores. Dependendo de
como se dará a coleta de dados, poderá haver um investimento inicial na
instalação de programas. Além disso, o principal custo na coleta de dados é
relacionado ao tempo gasto pela equipe para elaborar o método de levanta-
mento de dados e testá-lo. As principais dificuldades percebidas na compa-
ração com outros métodos são associadas, certamente, à confiabilidade das
amostras recolhidas por e-mail e a taxa de resposta que pode ser alcançada.
Serviços disponíveis
Os serviços e a equipe disponíveis devem ser considerados na esco-
lha de um modo de coleta de dados. A formação de uma equipe de entre-
vistadores é custosa e difícil. As taxas de rejeição à pesquisa são geralmen-
te elevadas para entrevistadores recém-treinados. Obter a cooperação dos
respondentes é uma árdua tarefa para entrevistadores inexperientes, o que
resulta em altas taxas de recusa no início do processo. Em suma, torna-se
complicado encontrar profissionais qualificados para treinar e supervisio-
nar entrevistadores. Desta forma, uma sugestão prática para pesquisadores
interessados em realizar levantamento de dados baseado em entrevistas
pessoais é trabalhar a habilidade em coletar dados de maneira organizada
e profissional. Se um indivíduo tem acesso à outra pesquisa em andamen-
to ou se um dos membros da equipe já possui experiência em treinamento
e supervisão de entrevistadores, o sucesso de estudos baseados em entre-
vistas será provável. Caso isso não ocorra, um levantamento de dados au-
toadministrado apresentará vantagens consideráveis.
Duração da coleta de dados

O tempo gasto na coleta de dados varia de acordo com o método
escolhido. Os levantamento de dados por correspondência geralmente
são realizados em um período de dois meses. Em condições normais, o
processo envolve enviar a correspondência, aguardar por um tempo, en-
viar mais algumas correspondências, aguardar mais algum tempo, e rea-
lizar alguns eventuais contatos por telefone ou pessoalmente. Obviamen-
te, a internet elimina o período de espera por respostas, contudo, os lem-
bretes dados pessoalmente ainda são largamente utilizados. Em contra-
partida, é possível realizar um levantamento de dados por telefone em
poucos dias. Pesquisas executadas rapidamente podem apresentar uma
elevada taxa de ausência de resposta, uma vez que pode tornar-se com-
plicado estabelecer contato com alguns indivíduos em um curto espaço
de tempo. Entretanto, um levantamento de dados por telefone tende a
ser realizado em um período de tempo consideravelmente menor do que
um feito por entrevistas pessoais com famílias ou por correspondência.
O prazo exigido para realizar um levantamento de dados baseado em
entrevistas pessoais com famílias vem de encontro a generalizações, pois de-
pende da quantidade de amostras e da disponibilidade da equipe. É correto
afirmar, todavia, que somente em circunstâncias extremas um levantamento
de dados baseado em entrevistas pessoais será realizado em um período de
tempo menor do que um levantamento de dados por telefone.
Coleta de dados assistida por computador

O método tradicional de levantamento de dados tem sua origem em
materiais escritos, os quais eram manuseados tanto pelos entrevistadores
quanto pelos respondentes. Entretanto, na década passada, o papel e o lápis
foram substituídos pelos computadores: agora questões são lidas na tela de
um computador por pesquisadores e entrevistados, e as respostas ficam re-
gistradas por senhas eletrônicas. A principal vantagem da coleta de dados
assistida por computador é a obtenção de respostas instantaneamente. Em
algumas pesquisas, há ainda outras vantagens para a coleta de dados:
• O computador pode compreender e executar modelos complexos
de questões que, manualmente, seriam de difícil elaboração.
• Informações provenientes de perguntas ou de entrevistas ante-

riores podem ser consideradas na elaboração ou na sequência
das questões feitas.
• Se um dado inconsistente é fornecido, o computador pode iden-
tificar e reparar o erro durante a coleta de dados.
Apesar destas vantagens, é necessário dispor de tempo para garantir

que a coleta de dados monitorada por computador seja livre de erro e, como
será discutido em detalhes no Capítulo 9, pesquisadores podem perder a
habilidade de checar ou exercitar um controle de qualidade sobre o proces-
so de inclusão de dados. Portanto, como a maioria das decisões a respeito
da elaboração de pesquisas, os benefícios do emprego da coleta de dados
assistida por computador podem variar conforme as especificidades de cada
projeto. Couper e colaboradores (1998) apresentam os estudos mais recen-
tes associados à coleta de dados assistida por computador.
O auxílio do computador é usado frequentemente em conjunto com
o levantamento de dados por telefone. De fato, para algumas pessoas, a
entrevista por telefone assistida por computador é um sinônimo para le-
vantamento de dados por telefone. Até o presente momento, não há regis-
tros de que a qualidade dos dados obtidos através de pesquisas por telefo-
ne seja afetada pela coleta de dados assistida por computador, exceto pela
redução de dados perdidos (Catlin e Ingram, 1988). A maioria das vanta-
gens ou desvantagens documentadas são técnicas: a facilidade de manu-
tenção da ordem e estrutura das questões, a velocidade da inclusão de da-
dos, a administração de amostras e a possibilidade de auxiliar os entrevis-
tadores no que diz respeito ao formato de questões ou definições, caso
precisem. As desvantagens incluem a necessidade da utilização de progra-
mas livres de erro, a dificuldade para os entrevistadores realizarem corre-
ções e o risco de haver pane no sistema computacional. Também, embora
respostas literais sejam encorajadas por entrevistadores nas questões em
forma de narração, a coleta de dados assistidada por computador poste-
riormente aumenta a exigência da utilização de questões objetivas.
A maioria das entrevistas assistidas por computador são realizadas a
partir de um serviço telefônico central. Com o uso de computadores portá-
teis, todavia, as entrevistas com famílias também requerem coleta de dados
assistida por computador. Além disso, em certos ambientes, como em con-
sultórios médicos, computadores têm sido utilizados para coletar dados de
indivíduos através do método autoadministrativo: os respondentes se sen-
tam diante de um computador, leem questões na tela, e as respondem sem a
presença de um entrevistador. Computadores com equipamentos como telas

sensíveis ao toque ou mouse são particularmente apropriados para este tipo
de coleta de dados. As vantagens de uma entrevista pessoal assistida por
computador são praticamente as mesmas das entrevistas por telefone assis-
tidas por computador: a facilidade na administração das questões e a rápida
compilação de dados. Ao término de um dia de entrevistas, o entrevistador
pode transmitir os dados para um escritório central através do telefone.
Apesar da assistência computacional a pesquisas automonitoradas
ainda estar em desenvolvimento, há algumas potencialidades interessan-
tes que tendem a ser realizadas. Por exemplo, os computadores tornam
possível a apresentação de informações e estímulos de outra maneira
que não por palavras (por exemplo, fotos).
Os computadores têm a capacidade de adequar o idioma das ques-
tões ao idioma falado pelo entrevistado, bem como de apresentar o áu-
dio das questões para indivíduos que tenham dificuldades na leitura. A
habilidade dos computadores de modificar a escolha ou a sequência de
questões, de modo que se encaixem na ordem lógica ditada pelas respos-
tas, é uma característica positiva na autoadministração, na qual instru-
ções complexas são de difícil assimilação pelos respondentes. Compu-
tadores conectados a linhas telefônicas podem perguntar e gravar as res-
postas através de números discados nas teclas do telefone, oferecendo
uma alternativa para que os respondentes, fazendo uso da internet, for-
neçam dados no momento que acharem conveniente. Finalmente, os res-
pondentes tendem a se sentir mais confortáveis ao responder perguntas
pessoais para computadores do que para entrevistadores.
COMPARAÇÃO RESUMIDA DE MÉTODOS
A discussão anterior não é exaustiva, mas apresenta a maioria das

considerações mais importantes. A escolha do modo de coleta de dados é
complexa e envolve muitos aspectos relacionados ao processo de pesqui-
sa de levantamento. A seguir, um resumo das potencialidades e defeitos
dos principais métodos para coleta de dados.
Potenciais vantagens de entrevistas pessoais:

• Algumas estruturas de amostra podem ser mais bem empregadas
por meio de entrevistas pessoais (por exemplo, amostras por área
de probabilidade).
• O procedimento baseado em entrevistas pessoais é provavelmen-

te o meio mais eficaz de obter cooperação.
• As vantagens de um procedimento administrado pelo entrevista-
dor, como responder a dúvidas dos respondentes, selecionar res-
postas adequadas, seguindo meticulosamente instruções ou se-
quências complexas, podem ser empregadas.
• Torna-se viável a combinação de diferentes métodos, incluindo
observações, recursos visuais e seções autoadministradas, os
quais podem vir apresentados tanto impressos quanto na tela de
um computador.
• É possível o estabelecimento de laços afetivos e confiança (in-
cluindo qualquer acordo escrito que se faça necessário para au-
torizar o registro de respostas pessoais).
• Provavelmente, instrumentos de pesquisa que requerem tempo
para serem executados são mais bem empregados em entrevistas
pessoais do que em qualquer outro método.
Potenciais desvantagens de entrevistas pessoais:

• Há a probabilidade de haver um maior custo neste método do
que em outros.
• Uma equipe treinada de entrevistadores, que estejam geografica-
mente próximos à amostra, se faz necessária.
• O período total de coleta de dados tende a ser maior do que em
procedimentos por telefone.
• Algumas amostras (aquelas em residências de classe alta ou em áre-
as com elevadas taxas de crime, elites, empregados, estudantes) po-
dem tornar-se mais acessíveis pela utilização de outros meios.
Potenciais vantagens de entrevistas por telefone:

• Os custos são geralmente menores do que em entrevistas pessoais.
• A discagem aleatória de dígitos pode ser usada em amostras de
população geral.
• Proporciona um melhor acesso a certos grupos, especialmente se
comparadas a entrevistas pessoais.
• O período da coleta de dados é geralmente menor do que o dos
outros métodos.
• As vantagens do procedimento monitorado por um entrevistador
(em oposição a pesquisas que utilizam correspondência ou a in-
ternet como ferramentas) podem ser aproveitadas.
• A administração do pesquisador em entrevistas por telefone é mais

simples do que em entrevistas pessoais: não é preciso uma equipe
tão grande, não é preciso estar próximo da amostra, e a supervisão
e o controle de qualidade são potencialmente melhores.
• Há a tendência de se obter uma melhor taxa de resposta oriunda
de uma amostra por listagem do que de uma amostra por corres-
pondência.
Potenciais desvantagens de estudos por telefone:

• Pode haver limitações de amostragem, especialmente como re-
sultado da omissão daqueles que não possuem linha telefônica;
ou da incapacidade de contatar aqueles que não possuem o nú-
mero correto na lista telefônica.
• A ausência de resposta associada à amostragem pela discagem
aleatória de dígitos é maior do que por entrevistas pessoais.
• Questionários ou limitações por área são associados ao telefo-
ne, incluindo limites alternativas de resposta, usos de recursos vi-
suais e observações do entrevistador.
• O telefone é possivelmente menos apropriado para questões de-
licadas ou pessoais.
Potenciais vantagens da coleta de dados autoadministrada (em con-

traste com a coleta de dados administrada por um entrevistador):
• É possível (em oposição a entrevistas por telefone) apresentar
questões que necessitam de auxílios visuais.
• Fazer questões que pedem respostas longas ou complexas tam-
bém se torna viável.
• Fazer uma série de questões similares pode ser mais bem aceito
pelos entrevistados.
• O fato de que o respondente não precisa compartilhar suas respos-
tas com um entrevistador torna a coleta de dados mais confiável.
Potenciais desvantagens da autoadministração:

• É imprescindível que o questionário seja cuidadosamente estru-
turado.
• Questões de ampla discussão geralmente não apresentam utili-
dade.
• É indispensável que os respondentes sejam habilidosos em leitu-
ra e escrita.
• O entrevistador não está presente para averiguar se todas as

questões estão sendo respondidas, ou se as respostas são ade-
quadas.
• Torna-se difícil estabelecer um controle sobre quem responde às
questões.
Pesquisas autoadministradas podem ser realizadas por correspon-

dência, através de administração em grupos ou em famílias. Cada méto-
do tem suas qualidades e potenciais defeitos.
Vantagens da administração em grupos:

• As taxas de cooperação são geralmente altas.
• Proporciona ao entrevistador a chance de explicar o estudo aos
respondentes, bem como responder a dúvidas sobre o questioná-
rio (contrastando com levantamento de dados por correspondên-
cia).
• Geralmente os custos são baixos.
A principal desvantagem é que apenas um reduzido número de

pesquisas pode fazer uso de amostras recolhidas de uma só vez em um
grupo.
Vantagens de procedimentos por correspondência:

• Os custos são relativamente baixos.
• Eles podem ser realizados com um mínimo de serviços e equipe.
• A correspondência proporciona o acesso a amostras diversas e
que, por qualquer outra razão, sejam difíceis de obter através de
entrevistas pessoais ou por telefone.
• É dado tempo aos respondentes para que eles forneçam respos-
tas cuidadosamente elaboradas, para procurar registros ou para
realizar outros tipos de consulta.
Desvantagens de procedimentos por correspondência:

• O contato por correspondência talvez não seja um meio eficaz de
se obter cooperação (dependendo do grupo a ser estudado e do
tópico da pesquisa).
• Há várias desvantagens em não haver a participação de um en-
trevistador na coleta de dados.
• Endereços confiáveis para correspondência são necessários.
Vantagens de entregar (e posteriormente

buscar) questionários em famílias:
• O entrevistador pode explicar o estudo, responder questões e de-
signar uma família respondente, em contraste com a correspon-
dência.
• As taxas de resposta tendem a ser como as de estudos que utili-
zam entrevistas pessoais.
• Há mais oportunidades para os entrevistados darem respostas
cuidadosamente elaboradas e consultarem registros de outros
membros da família do que em pesquisas baseadas em entrevis-
tas pessoais ou por telefone.
• Equipes de entrevistadores treinados não são necessárias.
Desvantagens da aplicação de questionários:

• Este procedimento tem o mesmo custo de entrevistas pessoais.
• Uma equipe de campo é necessária (embora talvez um indivíduo
com menos treinamento possa ser útil para entrevistas pessoais).
Potenciais vantagens em levantamentos de dados pela internet:

• O custo da coleta de dados é baixo.
• As respostas podem ser obtidas rapidamente.
• Todas as vantagens de um instrumento autoadministrado podem
ser aproveitadas.
• Todas as vantagens de um instrumento monitorado por compu-
tador podem ser aproveitadas.
• Como pesquisas por correspondência, este método concede tem-
po para respostas cuidadosamente elaboradas, verificação de re-
gistros ou outros tipos de consulta.
Potenciais desvantagens em levantamentos de dados pela internet:

• Amostras são limitadas aos usuários da internet.
• São necessários endereços confiáveis.
• Há o desafio de obter cooperação (dependendo dos grupos in-
cluídos na amostragem e do tópico).
• As várias desvantagens da não participação de um entrevistador
podem afetar a coleta de dados.
Finalmente, ao considerar suas opções, os pesquisadores devem

considerar combinações de modos. Como podemos notar, respostas a
muitas questões não são afetadas pelo modo de coleta de dados. Combi-
nações de pessoal, por telefone, por correspondências e procedimentos
que utilizam a internet como ferramenta podem oferecer menores preços
aliados a métodos que não tenham o custo da amostragem ou ausência
de resposta. Dillman (2007) e Leeuw, Dillman e Hox (2008) discutem al-
gumas dessas combinações.
CONCLUSÃO
É evidente que a escolha do modo de pesquisa é uma decisão com-

plexa e depende, sobretudo, da situação na qual a pesquisa está inserida.
Todas as estratégias apresentadas anteriormente são a melhor escolha
para alguns estudos. É apropriado, todavia, perceber que a tendência mu-
dou consideravelmente no que diz respeito às pesquisas em geral, em
amostras baseadas em famílias. Há 35 anos, um pesquisador teria admiti-
do que uma pesquisa com base em entrevistas pessoais seria o método es-
colhido pela maioria dos estudos. O ônus da prova recairia sobre a pessoa
que quisesse comprovar a eficácia de outro método de coleta de dados.
Em virtude das vantagens de custo, nas últimas décadas do século
XX, um pesquisador teria de enviar diretamente as questões por corres-
pondência ou realizá-las por telefone. Contudo, em razão da comum preo-
cupação a respeito da ausência de resposta a pesquisas por telefone, a ten-
dência mudou novamente. Enquanto as amostras oriundas de pesquisas
por telefone utilizando o sistema de discagem aleatória de dígitos ainda
são largamente empregadas, há uma crescente procura por métodos alter-
nativos de pesquisa envolvendo uma amostra geral da população.
O papel desempenhado pelas técnicas autoadministradas tem cres-
cido na última década por duas razões. Em primeiro lugar, temos, obvia-
mente, as inúmeras inovações nos métodos de coleta de dados propor-
cionadas pelo crescimento ilimitado da internet. Em segundo, um consi-
derável número de evidências tem demonstrado que os procedimentos
autoadministrados, especialmente aqueles monitorados por computador,
podem coletar dados mais pontuais do que entrevistadores. Tais conside-
rações, juntamente com a expansão de pesquisas sobre temas como uso
de drogas e comportamento sexual, têm aumentado o interesse em inte-
grar essas estratégias para aprimorar os métodos de coleta de dados.
Em suma, deve ficar claro que a estrutura geral da pesquisa nor-
teia a escolha pelo modo como será feita a coleta de dados. Uma peque-
na amostra de entrevistas pessoais pode produzir dados mais úteis do

que uma grande amostra de entrevistas por telefone. Ter plena consciên-
cia a respeito dos objetivos metodológicos e considerar se a confiabilida-
de dos dados e os custos poderão ser afetados pelo método escolhido se
faz necessário antes de uma decisão apropriada no que diz respeito ao
modo da coleta de dados.
EXERCÍCIO
Desconsiderando os custos monetários, relate um tópico de pes-

quisa para o qual a pesquisa por correspondência seria o método mais
adequado, e explique por que esta seria a melhor alternativa em detri-
mento das demais. Faça o mesmo com o método de pesquisa de disca-
gem aleatória de dígitos, de entrevistas pessoais com famílias, e uma
pesquisa que utilize a internet para a coleta de dados.
de Leeuw, E. D. (2008). Choosing the method of data collection. In E. D. de

Leeuw. J. J. Hox, e D. A. Dillman (Eds.), International handbook of survey meth-
odology (pp. 113-135). Mahwah, NJ: Lawrence Erlbaum.
Dillman, D. A. (2007). Mail and Internet surveys: The tailored design method (2nd
ed.). New York: John Wiley.
Groves, R. M., Fowler, F. J., Couper, M. P., Lepkowsky, J. M., Singer, E., e Tou-
6 Formulando questões para
que sejam boas medidas
Em levantamentos, respostas não são intrinsecamente de interesse, mas por

conta de sua relação com alguma coisa que se supõe que elas meçam. Ques-
tões boas são confiáveis (fornecem medidas consistentes em situações compa-
ráveis) e válidas (as respostas correspondem ao que elas pretendem medir).
Este capítulo discute abordagens teóricas e práticas para a formulação de
questões para que sejam medidas confiáveis e válidas.
Formular uma questão para um instrumento de pesquisa é formu-

lar uma medida, não uma investigação conversacional. Em geral, uma
resposta dada a uma questão de levantamento é muitas vezes de ne-
nhum interesse intrínseco. Ela é valiosa na medida em que pode mostrar
que possui uma relação previsível com os fatos ou com os estados subje-
tivos de interesse. Boas questões maximizam a relação entre as respostas
registradas e o que o pesquisador está tentando medir.
De certo modo, respostas de levantamento são simples respostas
evocadas em uma situação artificial criada pelo pesquisador. A questão
crítica neste capítulo é o que uma resposta a uma questão de levanta-
mento nos diz sobre alguma realidade na qual temos interesse. Vejamos
alguns tipos específicos de respostas e seus significados:
1. Um respondente nos diz que votou em Kerry e não em Bush
para presidente em 2004. A realidade na qual estamos interes-
sados é em que nível, se houve algum, ele foi influenciado na
cabine de votação. A resposta dada no levantamento pode dife-
rir de o que aconteceu na cabine de votação por um número de
razões. O respondente pode ter pressionado o botão errado e,
portanto, não saber em quem ele realmente votou. Ele pode ter
esquecido. O respondente também pode ter alterado sua respos-
ta intencionalmente por alguma razão.
2. Um respondente nos diz quantas vezes foi ao médico durante o
ano passado. Este é o mesmo número a que o pesquisador che-
garia se tivesse seguido o respondente cerca de 24 horas todos
os dias durante o ano passado? Problemas de recordação, de de-
finição do que constitui uma visita ao médico e de boa vontade
para responder com precisão podem afetar a correspondência
entre o número que o respondente fornece e a conta a que o
pesquisador teria chegado de forma independente.
3. Quando um entrevistado qualifica o seu sistema de escolas pú-
blicas como “bom” em vez de “regular” ou “ruim”, o pesquisador
interpretará tal resposta como refletindo avaliações e percep-
ções daquele sistema escolar. Se o entrevistado classificou ape-
nas uma escola (em vez de todo o sistema), se inclinou a respos-
ta para agradar o entrevistador, ou entendeu a questão de ma-
neira diferente dos outros, sua resposta pode não refletir os sen-
timentos que o pesquisador tentou medir.
Muitos levantamentos são analisados e interpretados como se o

pesquisador soubesse com certeza o que as respostas significam. Estudos
formulados para avaliar a correspondência entre as respostas dos entre-
vistados e os valores verdadeiros mostram que muitos deles respondem
a várias questões muito bem. Mesmo assim, assumir correspondência
perfeita entre as respostas que as pessoas dão e alguma outra realidade é
ingênuo. Quando as respostas são boas medidas, são normalmente o re-
sultado de um processo de formulação cuidadoso. Nas seções seguintes,
maneiras específicas pelas quais os pesquisadores podem melhorar a cor-
respondência entre as respostas dos entrevistados e o estado verdadeiro
das coisas são discutidas.
Um dos objetivos de uma boa medida é aumentar a confiabilidade
das questões. Quando dois respondentes estão em uma mesma situação,
eles devem responder às questões da mesma forma. À medida que há in-
consistência entre eles, um erro aleatório é introduzido, e a medição é
menos precisa. A primeira parte deste capítulo lida com como aumentar
a confiabilidade das questões.
Há também a questão de o que uma resposta dada significa em re-
lação ao que o pesquisador está tentando medir: Quão bem a resposta
corresponde? As últimas duas seções deste capítulo são dedicadas à vali-

dade, a correspondência entre as respostas e os valores verdadeiros e
formas de melhorar tal correspondência (Cronbach e Meehl, 1955).
AUMENTANDO A CONFIABILIDADE DAS RESPOSTAS
Um passo no sentido de assegurar a consistência da medição é que

para cada respondente em uma amostra é feito o mesmo conjunto de
perguntas. As respostas a essas perguntas são gravadas. O pesquisador
gostaria de estar apto a assumir que as diferenças nas respostas derivam
das diferenças entre os entrevistados no que eles têm para dizer e não
das diferenças no estímulo ao qual os respondentes foram expostos. A
formulação das questões é obviamente uma parte central do estímulo.
Uma coleta de dados de levantamento é uma interação entre um
pesquisador e um respondente. Em uma pesquisa autoadministrada, em
papel ou via computador, o pesquisador fala diretamente com o entrevis-
tado através de um questionário escrito ou por palavras em uma tela de
computador. Em outros levantamentos, um entrevistador lê as palavras
do pesquisador para o respondente. Em ambos os casos, o instrumento
de pesquisa é o protocolo para um dos lados da interação. A fim de for-
necer uma experiência de coleta de dados consistente para todos os res-
pondentes, uma boa questão tem as seguintes propriedades:
• O lado do pesquisador do processo de pergunta e resposta é to-
talmente planejado, de forma que as questões escritas preparam
totalmente o respondente para respondê-las.
• A questão significa a mesma coisa para todos os respondentes.
• Os tipos de respostas que constituem uma resposta apropriada
para a questão são comunicados de forma coerente a todos os
respondentes.
Evitando a Formulação Inadequada

O exemplo mais simples de formulação inadequada de uma ques-
tão é quando, de alguma forma, as palavras do pesquisador não consti-
tuem uma questão completa.
FORMULAÇÃO INCOMPLETA
Ruim Melhor
6.1 Idade? Qual era sua idade em seu último aniversário?
6.2 Razão pela qual foi ao médico Qual foi o problema médico ou a razão pela qual
da última vez? você foi ao medico mais recentemente?
Entrevistadores (ou respondentes) terão de adicionar palavras ou

substituí-las para que se possa respondê-las a partir das palavras na colu-
na da esquerda. Se o objetivo é que todos os respondentes respondam às
mesmas questões, então é melhor que o pesquisador escreva as questões
de forma completa.
Às vezes a formulação opcional é requerida para atender às dife-
rentes circunstâncias dos respondentes. Isso não significa, contudo, que
o pesquisador tenha que desistir de escrever as questões. Se a entrevista
é assistida por computador, frequentemente este pode adequar a formu-
lação das questões. Se um roteiro de entrevista em papel é usado, é uma
convenção comum colocar termos opcionais entre parênteses. Tais pala-
vras serão usadas pelo entrevistador quando forem adequadas à situação
e omitidas quando não forem necessárias.
EXEMPLOS DE TERMOS OPCIONAIS

6.3 Você foi (ou alguém que vive aqui com você) atacado ou agredido por um desconhecido
durante o último ano?
6.4 Você (ele/ela) informou o ataque à polícia?
6.5 Que idade tinha (CADA PESSOA) no (seu/dele/dela) último aniversário?
No exemplo 6.3, a frase entre parênteses seria omitida se o entre-

vistador já soubesse que o respondente vivia sozinho. Se mais de uma
pessoa vivia na casa, contudo, o entrevistador incluiria isso. A opção en-
tre parênteses oferecida em 6.4 pode parecer de menor importância. Os
parênteses, contudo, alertam o entrevistador para o fato de que uma es-
colha de termo deve ser feita; o pronome adequado é utilizado, e o prin-
cípio de que o entrevistador precisa ler apenas a questão exatamente
como escrita a fim de apresentar um estímulo satisfatório é mantido.
Uma variação que realiza a mesma coisa é ilustrada em 6.5. Um for-
mato como esse pode ser usado se a mesma pergunta fosse feita para cada
pessoa em uma família. Em vez de repetir infinitamente as mesmas pala-
vras, uma única questão é escrita instruindo o entrevistador para substituir
uma designação apropriada (seu marido, seu filho, sua filha mais velha).
Tanto em papel quanto pelo computador, o objetivo é fazer com

que o entrevistador faça perguntas que façam sentido e que se valham
dos conhecimentos previamente obtidos na entrevista para adequar as
questões às circunstancias individuais dos respondentes. Há outro tipo
de formulação opcional que é visto ocasionalmente em questionários e
que não é aceitável.
EXEMPLO DE FORMULAÇÃO OPCIONAL INACEITÁVEL

6.6 O que você mais gosta neste bairro? (Nós estamos interessados em qualquer coisa,
como casas, pessoas, parques ou o que quer que seja.)
Presumivelmente, o que está entre parênteses foi pensado para aju-

dar os respondentes que tenham dificuldade em responder à questão. A
partir de um ponto de vista da medição, contudo, isso viola o princípio da
entrevista-padrão. Se o entrevistador usa o conteúdo entre parênteses
quando um respondente não chega prontamente a uma resposta, aquele
subconjunto de respondentes terá respondido uma questão diferente. Tais
opções são introduzidas quando o pesquisador não acredita que a questão
inicial é uma boa questão. A abordagem apropriada é escrever, em primei-
ro lugar, uma boa questão. Aos entrevistadores não deve ser dada nenhu-
ma opção sobre quais questões ler ou como lê-las, exceto, como nos exem-
plos anteriores, para fazer as questões se adaptarem às circunstâncias par-
ticulares de um respondente de uma forma padronizada.
O que se segue é um exemplo diferente de uma formulação de
questão incompleta. Há três erros envolvidos no exemplo.
EXEMPLO DE UMA FORMULAÇÃO POBRE
6.7 Eu gostaria que você classificasse diferentes características do seu bairro como
muito bom, bom, razoável ou ruim. Por favor, pense cuidadosamente sobre cada
item quando eu os ler.
a. Escolas públicas
b. Parques
c. Transporte público
d. Outro
O primeiro problema com 6.7 é a ordem principal. As alternativas de

resposta são lidas antes de uma instrução para pensar cuidadosamente sobre
os itens específicos. O respondente provavelmente esquecerá a questão. O
entrevistador provavelmente terá que fazer alguma explicação ou reformula-
ção antes que o respondente esteja preparado para dar uma resposta. Em se-
gundo lugar, as palavras que o entrevistador precisa perguntar sobre os itens

da lista não são fornecidas. Uma questão muito melhor seria a seguinte:
6.7a Eu irei pedir a você para que classifique diferentes características do seu bairro.
Eu quero que você pense cuidadosamente sobre as suas respostas.
Como você classificaria (CARACTERÍSTICA)- você diria muito bom, bom, razoável ou
ruim?
O entrevistador inseriria sequencialmente cada item (escolas pú-

blicas, parques, etc.) até que as quatro questões tivessem sido feitas. Este
formado dá ao entrevistador a formulação necessária para perguntar o
primeiro e todos os outros itens subsequentes da lista como questões
completas. Isso também coloca os elementos da questão em uma ordem
apropriada, de forma que as alternativas de resposta são lidas para o res-
pondente da maneira que elas mais provavelmente serão lembradas.
O terceiro problema com o exemplo é a quarta alternativa, “ou-
tro”. O que o entrevistador dirá? Ele ou ela fará uma nova questão, como
“Há alguma outra coisa no seu bairro que você aprecie?” Como serão re-
digidas as questões de classificação? Não é raro ver “outro” em uma lista
de questões em um formulário similar ao do exemplo. Claramente, da
forma como apresentado em 6.7, o planejamento é inadequado.
Os exemplos apresentados ilustram questões que não poderiam ser
apresentadas consistentemente a todos os respondentes como um resul-
tado da formulação incompleta. Outro passo necessário para melhorar a
consistência é criar um conjunto de questões que fluam sem problemas e
facilmente. Se as questões têm uma formulação estranha ou confusa, se
há palavras difíceis de pronunciar ou se combinações de palavras soam
estranho juntas, os entrevistadores mudarão as palavras para fazer com
que soem melhor ou para torná-las mais fáceis de ler. Pode ser possível
treinar e supervisionar os entrevistadores para manter tais mudanças no
mínimo possível. Não obstante, isso só faz sentido para ajudar os entre-
vistadores por oferecer-lhes questões que são o mais fácil de ler possível.
Garantindo um significado coerente para todos os respondentes

Se a todos os entrevistados são feitas exatamente as mesmas per-
guntas, um passo foi dado para garantir que as diferenças nas respostas
podem ser atribuídas às diferenças dos respondentes. Mas há uma consi-
deração mais profunda: Todas as questões devem significar a mesma coi-
sa para todos os respondentes. Se dois respondentes entendem que uma
questão significa coisas diferentes, suas respostas podem ser diferentes

apenas por essa razão.
Um problema em potencial é usar palavras que não são universal-
mente entendidas. Em amostras gerais de populações, é importante lem-
brar que uma série de experiências educacionais e culturais serão repre-
sentadas. Até mesmo com respondentes muito bem educados, usar pala-
vras simples que são curtas e amplamente entendidas é um método se-
guro para a formulação de questionários.
Indubitavelmente, um erro muito mais comum do que usar pala-
vras não familiares é o uso de termos ou conceitos que podem ter múlti-
plos significados. A prevalência de interpretações errôneas de formula-
ções comuns vem sendo bem documentada por aqueles que estudaram o
problema (por exemplo, Belson, 1981; Fowler, 1992; Oksenberg, Cannell
e Kalton, 1991; Tanur. 1991; Tourangeau, Rips e Rasinski, 2000).
TERMOS DEFINIDOS POBREMENTE

6.8 Quantas vezes no ano passado você viu ou falou com um médico sobre sua saúde?
Problema. Há dois termos ou conceitos ambíguos nessa questão.

Primeiro, há base para incerteza sobre o que constitui um profissional da
saúde. Apenas as pessoas com formação em medicina e que a praticam
estão incluídas? Se sim, os psiquiatras estão incluídos, mas psicólogos,
quiropráticos, osteopatas e podólogos não estão. E os médicos assisten-
tes ou enfermeiros que trabalham diretamente para os médicos em con-
sultórios? Se uma pessoa vai a um consultório médico para ser vacinada
por um enfermeiro, isso conta?
Segundo, o que constitui ver ou falar com um médico? Consultas
por telefone contam? Visitas a um consultório médico quando o médico
não é visto contam?
Soluções. Normalmente a melhor abordagem é fornecer aos entre-

vistadores e respondentes as definições que eles precisam.
6.8a Nós vamos perguntar a você sobre médicos e sobre a obtenção de aconselhamen-
tos de um médico. Neste caso, estamos interessados em todos os profissionais que
tenham o grau ou que trabalham diretamente para um doutor em medicina em um
consultório, tais como enfermeiros ou médicos assistentes.
Quando a definição do que é esperado é extremamente complica-

da e tomaria um longo tempo para definir, como pode ser o caso nessa
questão, uma abordagem mais construtiva pode ser fazer perguntas su-
plementares sobre eventos desejados que são particularmente suscetíveis
de serem omitidos. Por exemplo, visitas a psiquiatras, visitas para tomar
vacinas e consultas por telefone normalmente são subnotificadas e po-
dem justificar questões especiais de acompanhamento. Perguntar ques-
tões específicas de acompanhamento para ter certeza de que eventos não
foram deixados de lado é uma forma fácil de reduzir tais erros.
6.9 Você tomou café da manhã ontem?
Problema. O problema é que a definição de café da manhã varia mui-

to. Algumas pessoas consideram café e uma rosquinha a qualquer momento
antes do meio-dia um café da manhã. Outras não consideram que tomaram
café da manhã a menos que isso inclua uma grande entrada, como bacon e
ovos, e que seja consumido antes das 8h. Se o objetivo é medir o consumo
de comida pela manhã, os resultados provavelmente terão erros considerá-
veis decorrente das diferentes definições de café da manhã.
Soluções. Há duas abordagens para a solução. Por outro lado, po-

de-se optar por definir café da manhã:
6.9a Para os nossos propósitos, vamos considerar café da manhã como uma refeição
consumida antes das 10h, que inclua alguma proteína, como ovos, carne ou leite,
alguns grãos, como torradas ou cereal, e alguma fruta ou vegetal, incluindo suco.
Usando essa definição, você tomou café da manhã ontem?
Embora esta seja normalmente uma abordagem muito boa, neste

caso é muito complicada. Em vez de tentar comunicar uma definição co-
mum aos respondentes, o pesquisador pode simplesmente perguntar às
pessoas o que elas comeram antes das 10h. Na fase de codificação, o que
foi consumido pode ser avaliado coerentemente para ver se isso se encai-
xa nos padrões de café da manhã, sem precisar que cada respondente
compartilhe a mesma definição.
6.10 Você é a favor ou contra a legislação para o controle de armas?
Problema. A legislação para o controle de armas pode significar ba-

nir a venda legal de certos tipos de armas, pedir às pessoas para que re-
gistrem suas armas, limitar o número ou o tipo de armas que as pessoas

podem possuir ou limitar quais pessoas podem possuí-las. As respostas
não podem ser interpretadas sem suposições sobre o que os responden-
tes pensam que a questão significa. Eles indubitavelmente interpretam
essa questão de forma diferente.
6.10a Uma proposta para o controle das armas é que a nenhuma pessoa que já tenha sido
condenada por um crime violento seja permitido comprar ou possuir uma pistola, um
rifle ou uma espingarda. Você se opõe ou apóia uma legislação como esta?
Pode-se argumentar que esta é apenas uma de uma variedade de

propostas para o controle das armas. Este é exatamente o ponto. Se que-
remos perguntar múltiplas questões sobre possíveis diferentes estratégias
para o controle das armas, devemos perguntar separadamente questões
específicas que podem ser geralmente entendidas por todos os respon-
dentes e interpretadas pelos pesquisadores. Não se resolve o problema
de uma questão complexa deixando-se para o respondente decidir qual
questão ele quer responder.
Há uma tensão potencial entre dar uma definição complicada para
todos os respondentes e tentar manter as questões claras e simples. Isso
é particularmente verdadeiro para levantamentos administrados pelo en-
trevistador, assim como as definições são particularmente difíceis de en-
tender quando são dadas oralmente.
Uma abordagem potencial é dizer aos entrevistadores para forne-
cer definições aos respondentes que pedirem esclarecimentos ou aparen-
tarem não compreender bem uma questão. Uma preocupação acerca de
tais abordagens é que os entrevistadores não darão definições coerentes
se tiverem que improvisar. Contudo, entrevistas assistidas por computa-
dor facilitam o fornecimento de definições precisamente formuladas. A
outra preocupação, mais importante, é que apenas alguns respondentes
entenderão a definição necessária. Aqueles que não solicitarem esclareci-
mentos ou que não aparentarem estar confusos vão ter uma lacuna de
informações que poderá afetar suas respostas.
Conrad e Schober (2000) experimentaram dando liberdade aos
entrevistadores para fornecerem definições e explicações quando elas pa-
recessem necessárias. Houve alguma evidência de que a precisão melho-
rou, mas o aumento veio a um preço de mais treinamento de entrevista-
dores e entrevistas mais longas. Enquanto há necessidade de mais pes-
quisa sobre como fazer questões sobre conceitos complexos, a aborda-
gem geral de evitar termos complexos ou ambíguos, e definir aqueles
que são usados na formulação das questões, é a melhor abordagem para

a maioria dos levantamentos.
EVITANDO QUESTÕES MÚLTIPLAS
Outra maneira de fazer questões não confiáveis é perguntar duas

coisas na mesma questão.
6.11 Você quer ser rico e famoso?
O problema é óbvio: rico e famoso não são a mesma coisa. Uma pes-
soa pode querer ser um, mas não querer ser o outro. Os respondentes, quan-
do se deparam com duas questões, terão de decidir a qual responder, e essa
decisão será feita de forma inconsistente por diferentes respondentes.
A maioria das questões múltiplas são um pouco mais sutis, contudo.
6.12 Nos últimos 30 dias, quando você sacou dinheiro em um caixa-eletrônico,

com que frequência sacou menos de 25 dólares - sempre, normalmente,
algumas vezes, nunca?
Essa questão requer três cálculos cognitivos: calcular o número de

visitas a um caixa-eletrônico, o número de vezes que menos de 25 dóla-
res foram sacados, e a relação entre os dois números. Enquanto tecnica-
mente há apenas uma questão, é necessário responder pelo menos duas
questões anteriores para que se produza a resposta. A pergunta seria
mais bem formulada se usássemos duas questões.
6.12a Nos últimos 30 dias, quantas vezes você sacou dinheiro em um caixa-eletrônico?
6.12b (SE ALGUMA) Em quantas dessas vezes você sacou menos de 25 dólares?
Observe outras duas virtudes das séries 6.12a e 6.12b. Primeiro,

isso identifica aqueles que não usaram um caixa-eletrônico, aos quais a
questão não se aplica. Segundo, por perguntar por números em ambas
as questões, isso evita que os respondentes façam um cálculo. Simplificar
a demanda sobre o respondente é quase sempre uma boa ideia.
6.13 A que tipo de lugar você vai para o seu atendimento médico de rotina?
Essa questão admite que todos os respondentes têm uma rotina de

cuidados médicos, o que não é uma suposição precisa. Isso deveria ser
perguntado em duas questões. Provavelmente a melhor abordagem é

perguntar aos respondentes se eles tiveram alguma rotina de cuidados
médicos em algum período – por exemplo, nos últimos 12 meses. Se sim,
prossiga com uma questão sobre o tipo de lugar.
A opção “não sei”

Quando os respondentes estão sendo questionados sobre suas pró-
prias vidas, sentimentos ou experiências, uma resposta “não sei” é normal-
mente uma afirmação de que eles estão relutantes em fazer a tarefa reque-
rida para dar uma resposta. Por outro lado, às vezes perguntamos a eles
questões relativas a coisas sobre as quais eles legitimamente não sabem.
Conforme o assunto das questões se afasta das suas vidas imediatas, é
mais plausível e razoável que alguns respondentes não tenham o conheci-
mento adequado sobre o qual basear uma resposta ou não tenham forma-
do uma opinião ou sentimento. Neste caso, temos outro exemplo de uma
questão que na verdade é duas em uma: você tem a informação necessária
para responder à pergunta e, se sim, qual é a resposta?
Há duas abordagens para lidar com tal possibilidade. Pode-se ape-
nas perguntar as questões de todos os respondentes, confiando no res-
pondente para oferecer-se a dar uma resposta “não sei”. Os respondentes
diferem em sua complacência para voluntariamente responderem que
“não sabem”, contudo (Schuman e Presser, 1981), e os entrevistadores
são inconsistentes na forma como lidar com tais respostas (Fowler e
Mangiore, 1990; Groves, 1989). A alternativa é dizer a todos os respon-
dentes uma triagem de questões padronizadas sobre se eles se sentem ou
não familiarizados o suficiente com um tópico para ter uma opinião ou
sentimento sobre ele.
Quando um pesquisador está lidando com um tópico com o qual a
familiaridade é alta, se uma questão de triagem para conhecimento é fei-
ta ou não, não importa. Quando um número notável de respondente não
é familiarizado com o tópico, ou nunca pensou sobre, não importa com o
que a questão está lidando, é provavelmente melhor fazer uma questão
de triagem sobre a familiaridade com o tópico.
Formulação especializada para subgrupos especiais

Os pesquisadores têm lutado com o fato de que o vocabulário em
diferentes subgrupos da população não é o mesmo. Pode-se argumentar
que medições padronizadas na verdade requereriam diferentes questões

para diferentes subgrupos (Schaeffer, 1992).
Criar formulários de questionários diferentes para subgrupos dife-
rentes, contudo, quase nunca é feito. Antes, os metodologistas tendem a
trabalhar duro na tentativa de encontrar a melhor forma para as ques-
tões que possuem um significado consistente entre a população como um
todo. Apesar de haver situações em que a formulação de uma questão
seja mais típica da linguagem de um segmento de uma comunidade do
que de outro (normalmente o segmento mais instruído), encontrar pala-
vras exatamente comparáveis para algum outro grupo da população e
então fornecer aos entrevistadores regras confiáveis para decidir quando
perguntar qual versão é tão difícil que é provável de se produzir mais in-
segurança do que eliminá-la.
O grande desafio é como coletar dados comparáveis de pessoas que
falam línguas diferentes. Os esforços mais cuidadosos para traduzir uma
versão original em uma nova língua contam com um tradutor diferente que
faz uma retrotradução da nova versão para a língua original, e então tenta
conciliar as diferenças entre o original e a versão antes traduzida.
Esse processo seria muito melhorado se os formuladores da ques-
tão original estivessem preocupados com a facilidade da tradução. Por
exemplo, números são traduzidos mais facilmente entre as línguas do
que adjetivos. Conceitos abstratos e palavras que são coloquiais são pro-
váveis de ser particularmente difíceis de traduzir precisamente. Mesmo
quando grande cuidado é tomado, é muito difícil ter certeza de que as
pessoas estão respondendo questões comparáveis entre as línguas. É du-
vidoso que escalas de classificação adjetivas sejam sempre comparáveis
em todas as línguas. Quanto mais concretas forem as questões, maiores
as chances de comparabilidade entre as línguas ou culturas. Marin e Ma-
rin (1991) apresentam uma boa análise dos desafios de coletar dados
comparáveis de pessoas falantes de inglês e de espanhol. Harkness, Van
de Vijver e Mohler (2003) fornecem um olhar abrangente sobre os desa-
fios de coletar dados comparáveis entre culturas.
Expectativas padrão para tipos de resposta

Como afirmado, é importante dar aos entrevistadores um bom ro-
teiro para que possam ler as questões exatamente como formuladas, e é
importante formular questões que signifiquem a mesma coisa para todos
os respondentes. O outro componente-chave de uma boa questão é que
os respondentes devem ter a mesma percepção de o que constitui uma

resposta adequada para a questão.
A forma mais simples de fornecer aos respondentes a mesma per-
cepção de o que constitui uma resposta adequada é dar-lhes uma lista de
respostas aceitáveis. Tais questões são chamadas de questões fechadas. O
respondente precisa escolher uma, ou, às vezes, mais de uma, de um
conjunto de alternativas fornecidas pelo pesquisador.
6.14 Qual foi a principal razão pela qual você foi ao médico – por um novo problema
de saúde, para o acompanhamento de um problema de saúde anterior, para
um checkup de rotina, ou por alguma outra razão?
Questões fechadas não são adequadas em todos os casos. O leque

de respostas possíveis pode ser mais extenso do que é razoável de se for-
necer. O pesquisador não pode sentir que todas as respostas razoáveis
podem ser antecipadas. Por essas razões, ele pode preferir não fornecer
uma lista de alternativas ao respondente. Neste caso, a questão deve in-
formar o tipo de resposta esperado sempre que possível.
6.15 Quando você teve sarampo?
Problema. A questão não especifica os termos nos quais o respon-

dente deve responder. Considere as seguintes respostas possíveis: “Cinco
anos atrás”; “Enquanto eu estava no exército”; “Quando eu estava grávi-
da do nosso primeiro filho”; “Quando eu tinha 32 anos”; “Em 1987”. To-
das essas respostas poderiam ser dadas pela mesma pessoa, e todas são
apropriadas à questão como colocada. Elas não são todas aceitáveis no
mesmo levantamento, contudo, porque estatísticas descritivas requerem
respostas comparáveis. Um entrevistador não pode usar as palavras no
exemplo 6.14 e consistentemente obter dados comparáveis, porque cada
respondente deve adivinhar que tipo de resposta é esperado.
Solução. Uma nova questão que explique ao respondente que tipo

de resposta é esperado deve ser criada.
6.15a Quantos anos você tinha quando teve sarampo?
Obviamente, a opção 6.15a é a forma que a questão deveria ter si

do formulada pelo pesquisador para todos os respondentes.
6.16 Por que você votou no candidato A?
Problemas. Quase todas as questões “Por que” levantam problemas.

Uma razão é que o sentido de causalidade ou a estrutura de referência
pode influenciar as respostas. No exemplo particular anterior, o respon-
dente pode escolher falar sobre os pontos fortes do candidato A, as fra-
quezas do candidato B, ou as razões pelas quais ele ou ela usou determi-
nado critério (Minha mãe foi Republicana ao longo da vida). Por isso os
respondentes que veem as coisas exatamente da mesma forma poder res-
ponder de forma diferente.
Solução. Especificar o foco da resposta.
6.16a Quais características do candidato A levaram você a votar (nele/nela)

em relação ao candidato B?
Esse tipo de questão explica aos respondentes que o pesquisador

quer que eles falem sobre o candidato A, a pessoa na qual eles votaram.
Se todos os respondentes respondem com a mesma estrutura de referên-
cia, então o pesquisador estará apto a comparar as respostas dos diferen-
tes respondentes de forma direta.
6.17 Quais são algumas das coisas deste bairro que você mais gosta?
Problemas. Ao responder uma questão como essa, algumas pessoas

vão apenas mencionar um ou dois pontos, enquanto outros mencionarão
vários. É possível que isso reflita diferenças importantes na percepção ou
nos sentimentos dos respondentes. Pesquisas têm mostrado muito clara-
mente, contudo, que a educação é altamente relacionada ao número de
respostas que as pessoas dão a tais questões. Os entrevistadores também
afetam o número de respostas.
Solução. Especificar o número de pontos a serem levantados:
6.17a Qual é a característica deste bairro que você elegeria como a que você mais gosta?
6.17b Diga-me três coisas relacionadas a viver neste bairro de que você mais gosta.
Embora isso possa não ser uma solução satisfatória para todas as
questões, para a maioria das questões como essa isso é uma forma eficaz
de reduzir a variação indesejada nas respostas entre os respondentes.
Um ponto básico é que aquelas respostas podem variar devido aos

respondentes terem um entendimento diferente dos tipos de resposta
que são apropriados. Uma melhor especificação das propriedades de
uma resposta desejada pode remover uma fonte desnecessária de incer-
tezas no processo de medição.
TIPOS DE MEDIDAS/TIPOS DE QUESTÕES
Os procedimentos relatados são elaborados para maximizar a con-

fiança, na medida em que as pessoas em situações comparáveis respon-
derão a questões de maneira similar. Pode-se medir com perfeita confian-
ça, contudo, e ainda não estar medindo o que se deseja medir. Na medi-
da em que a resposta fornece uma medida verdadeira e significa o que o
pesquisador quer ou espera que signifique é chamado de validade. Nesta
seção, aspectos da formulação de questões são discutidos, além dos pas-
sos para maximizar a confiabilidade das questões, que podem aumentar
a validade das medições de levantamento.
Para esta discussão, é necessário distinguir entre questões formu-
ladas designadas a medir fatos ou eventos objetivamente mensuráveis e
questões designadas a medir estados subjetivos, tais como atitudes, opi-
niões e sentimentos. Mesmo que haja questões que caem em uma área
obscura na fronteira entre essas duas categorias, a ideia de validade é de
alguma forma diferente para medidas objetivas e subjetivas.
Se é possível verificar a exatidão de uma resposta por alguma obser-
vação independente, então a medida de validade torna-se a similaridade
do relato de levantamento para o valor de alguma medida “verdadeira”.
Na teoria, pode-se obter uma conta independente, precisa, do número de
vezes que um indivíduo usou um caixa-eletrônico durante um ano. Embo-
ra na prática possa ser muito difícil obter tal medição independente (por
exemplo, ter acesso aos registros relevantes poderia ser impossível), o en-
tendimento da validade pode ser consistente para situações objetivas.
Em contraste, quando as pessoas são questionadas sobre estados
subjetivos, sentimentos, atitudes e opiniões, não há uma forma objetiva
de validar as respostas. Apenas o respondente têm acesso aos seus senti-
mentos ou opiniões. Portanto, a validade dos relatos de estados subjeti-
vos pode ser acessa apenas por usar correlações com outras respostas
que uma pessoa fornece ou com outros fatos sobre a vida dos responden-
tes que se pensa que podem ser relacionados com o que está sendo men-
surado. Para tais mensurações, não há medida verdadeiramente direta

independentemente possível; o significado das respostas deve ser inferi-
do a partir dos padrões de associação.
Níveis de mensuração
Há quatro formas diferentes por meio das quais as medições são

realizadas em ciências sociais. Isso produz quatro tipos diferentes de tare-
fas para os respondentes e quatro tipos diferentes de dados para análise:
Nominal – pessoas ou eventos são classificados em categorias de-
sordenadas (Você é do sexo masculino ou feminino?)
Ordinal – pessoas ou eventos são ordenados ou colocados em cate-
gorias organizadas ao longo de uma única dimensão (Como você classifi-
caria sua saúde – muito boa, boa, regular ou ruim?)
Intervalar – números que fornecem informações significativas sobre
a distância entre estímulos ordenados ou classes são inscritos (na verdade,
intervalos de dados são muito raros; temperatura em Fahrenheit é um dos
poucos exemplos comuns)
Razão – números são atribuídos como as razões entre valores e signi-
ficados, assim como os intervalos entre eles. Exemplos comuns são conta-
gens ou medições por um objetivo, escalas físicas tais como distância, peso
ou pressão (Quantos anos você tinha no seu último aniversário?)
Muito comumente em levantamentos, quando se está coletando

dados factuais, é solicitado aos respondentes que encaixem a si mesmos
ou suas experiências em uma categoria, criando dados nominais, ou lhes
é solicitado um número, muitas vezes uma relação de dados. “Você está
empregado?”; “Você é casado?”; e “Você tem artrite?” são exemplos de
questões que fornecem dados nominais. “Quantas vezes você foi ao mé-
dico?”; “Quanto você pesa?”; e “Quanto lhe é pago por hora?” são exem-
plos de questões que pedem aos respondentes para fornecer números
reais para uma relação de dados.
Quando se está coletando dados factuais, respostas ordinais devem
ser solicitadas aos respondentes. Por exemplo, deve ser solicitado a eles
que relatem seus rendimentos em categorias relativamente amplas ou que
descrevam seu comportamento em termos não numéricos (por exemplo,
habitualmente, às vezes, raramente ou nunca). Quando solicitamos a eles
que relatem eventos factuais em termos ordinais, isso é porque grande
precisão não é solicitada pelo pesquisador ou porque a tarefa de relatar
um número exato é considerada muito difícil. Há normalmente uma base

numérica real, contudo, subjacente a uma resposta ordinal para uma ques-
tão factual.
A situação é um pouco diferente com relação aos relatos de dados
subjetivos. Embora tenha havido esforços ao longo dos anos, primeiro no
trabalho de psicólogos psicofísicos (por exemplo, Thurstone e Chave,
1992), para que as pessoas atribuam números a estados subjetivos que
satisfaçam as hipóteses do intervalo e da razão de dados, para a maioria
dos respondentes é solicitado que forneçam dados nominais e ordinais
sobre estados subjetivos. A questão nominal é, “Em qual categoria seus
sentimentos, opiniões ou percepções se encaixam?”
Quando estamos formulando um instrumento de levantamento,
uma tarefa básica do pesquisador é decidir que tipo de medição é deseja-
do. Quando essa decisão for tomada, há algumas implicações claras para
a forma em que a questão será perguntada.
Tipos de questões
As questões de pesquisa podem ser grosseiramente classificadas
em dois grupos: aqueles para os quais uma lista de respostas aceitáveis é
fornecida aos respondentes (questões fechadas) e aqueles para as quais
as respostas aceitáveis não são exatamente fornecidas para os respon-
dentes (questões abertas).
Quando o objetivo é colocar as pessoas em categorias desordena-
das (dados nominais), o pesquisador pode escolher se perguntará uma
questão aberta ou fechada. Questões praticamente idênticas podem ser
formuladas de qualquer forma.

EXEMPLOS DE QUESTÕES ABERTAS E FECHADAS
6.18 Quais as suas condições de saúde? (aberta)

6.18a Em qual das seguintes condições você se encaixa atualmente?
(LER A LISTA) (fechada)
6.19 Qual você considera o problema mais importante que nosso país enfrenta hoje?
(aberta)
6.19a Aqui temos uma lista dos problemas com os quais muitas pessoas no país
estão preocupadas. Qual você considera o problema mais importante que
nosso país enfrenta hoje? (fechada)
Há vantagens para as questões abertas. Elas permitem que o pes-

quisador obtenha respostas imprevistas. Também podem descrever de
forma mais próxima as visões reais dos respondentes. Em terceiro lugar, e

este não é um ponto trivial, os respondentes gostam da oportunidade de
responder a algumas questões com suas próprias palavras. Responder ape-
nas escolhendo uma resposta fornecida e nunca ter a oportunidade de di-
zer o que se passa em suas cabeças pode ser uma experiência frustrante.
Finalmente, questões abertas são apropriadas quando uma lista de respos-
tas possíveis é maior do que o viável de se apresentar aos respondentes.
Além de tudo isso, contudo, questões fechadas são normalmente uma
forma mais satisfatória de produzir dados. Há quatro razões para isso:
1. O respondente pode realizar de forma mais segura a tarefa de res-
ponder à questão quando alternativas de resposta são fornecidas.
2. O pesquisador pode realizar de forma mais segura a tarefa de
interpretar o significado das respostas quando as alternativas
são fornecidas ao respondente (Schuman e Presser, 1981).
3. Quando uma questão completamente aberta é feita, muitas pes-
soas dão respostas relativamente raras que não são analitica-
mente úteis. Fornecer aos respondentes um número restrito de
opções de respostas aumenta a probabilidade de que um núme-
ro suficiente de pessoas dará alguma resposta particular que
seja analiticamente interessante.
4. Visto que a maioria das coletas de dados é atualmente assistida
por computador, é muito fácil para entrevistadores ou respon-
dentes registrar as respostas olhando as respostas fornecidas do
que as digitando.
Finalmente, se o pesquisador deseja dados ordinais, as categorias

devem ser fornecidas ao respondente. Não se pode ordenar respostas de
maneira confiável ao longo de um único continuum a menos que um
conjunto de respostas ordenadas admissíveis seja especificado na ques-
tão. Uma discussão mais aprofundada sobre a tarefa que é dada aos res-
pondentes quando são solicitados a realizar uma tarefa ordinal é apro-
priada, visto que este é provavelmente o tipo prevalente de mensuração
em pesquisas de levantamento.
A Figura 6.1 mostra um continuum. (Este caso diz respeito a ter os
respondentes fazendo uma avaliação de algum tipo, mas a abordagem
geral se aplica a todas as questões ordinais.) Há uma dimensão assumida
pelo pesquisador que vai dos sentimentos mais negativos possíveis aos
mais positivos possíveis. A maneira com que os pesquisadores colocam
os respondentes em categorias ordenadas é colocando-lhes designadores
ou rótulos em tal continuum. Os respondentes então são solicitados a

considerar os rótulos, seus próprios sentimentos ou opiniões e colocar-se
na categoria apropriada.
SENTIMENTO SOBRE ALGO

Extremamente Positivo Extremamente Negativo
ESCALA DE DUAS CATEGORIAS
Bom Não Bom
ESCALA DE TRÊS CATEGORIAS
Bom Regular Ruim
ESCALA DE QUATRO CATEGORIAS
Muito Bom Bom Regular Ruim
ESCALA DE CINCO CATEGORIAS
Excelente Muito Bom Bom Regular Ruim
ESCALA DE ONZE CATEGORIAS
10 9 8 7 6 5 4 3 2 1 0
Figura 6.1 Escalas subjetivas contínuas.
Há dois pontos importantes sobre os tipos de dados que resultam

de tais questões. Primeiro, os respondentes irão diferir nos seus entendi-
mentos de o que os rótulos ou categorias significam. A única suposição
necessária a fim de se fazer análises significativas, contudo, é que, em
média, as pessoas que classificam seus sentimentos como “bom” sentem-
se mais positivas do que aquelas que os classificam como “regular”. Na
medida em que as pessoas diferem um pouco em seus entendimentos de
um critério para “bom” e “regular”, há uma desconfiança na mensura-
ção, mas ela ainda pode ter significado (isto é, correlaciona-se com o es-
tado de sentimentos subjacente que o pesquisador quer medir).
Segundo, uma escala de medição ordinal como essa é relativa. A
distribuição de pessoas escolhendo um determinado rótulo ou categoria
depende da escala particular que é apresentada.
Considere novamente a escala de classificação na Figura 6.1 e as
duas abordagens para criar escalas ordinais. Em um caso, o pesquisador
usou uma escala de três pontos: bom, regular ou ruim. No segundo caso,
o pesquisador usou cinco opções descritivas: excelente, muito bom, bom,
regular e ruim. Quando se compara as duas escalas, pode-se ver que adi-
cionar “excelente” e “muito bom” em todas as probabilidades não apenas
fragmenta a categoria “bom” em três partes. Antes, isso muda todo o

sentido da escala. As pessoas respondem à posição ordinal das categorias
assim como o fazem aos descritores.
Um experimento recente considerável (Wilson, Alman, Whitaker e
Callegro, 2004). Foi solicitado aos respondentes que usassem duas escalas de
5 pontos para classificar sua saúde – uma idêntica à escala de 5 pontos da Fi-
gura 6.1 e a outra usando “muito boa, boa, moderada, ruim e muito ruim”. Os
respondentes foram, então, solicitados a usar uma escala de 1 a 10 para for-
necer um equivalente numérico para cada categoria verbal nas duas escalas.
Como se poderia esperar, o número dado para “muito boa” foi
maior quando esta era a primeira resposta (9,8 versus 7,8) e “boa” rece-
beu um escore numérico de 7,3 quando esta foi a segunda categoria,
mas apenas 5,4 quando foi a terceira.
Tais escalas são significativas se forem usadas como devem ser:
para ordenar as pessoas. Por si só, contudo, a declaração de que uma
porcentagem da população sente que algo está “bom ou melhor” não é
inadequada, pois implica que a população está sendo descrita em algum
sentido absoluto. Na verdade, a porcentagem mudaria se a pergunta fos-
se diferente. Apenas afirmações comparativas (ou afirmações sobre rela-
ções) são justificáveis quando se está usando medidas ordinais:
• comparando respostas à mesma questão ao longo dos grupos
(por exemplo, 20% a mais do grupo A do que do grupo B classi-
ficou o candidato como “bom ou melhor”); ou
• comparando respostas de amostras comparáveis ao longo do
tempo (por exemplo, 10% a mais classificou o candidato como
“bom” ou melhor em janeiro do que em novembro).
Os mesmos comentários gerais se aplicam aos dados obtidos pela

ordenação dos itens feita pelos respondentes (por exemplo, considere as
escolas, os serviços de polícia e a coleta de lixo. Qual é o serviço mais
importante para você?). O percentual que deu a algum item o topo do
ranking, ou o ranking médio de um item, é completamente dependente
da lista particular fornecida. Comparações entre distribuições quando as
alternativas foram trocadas não são significativas.
Itens concordo/não concordo: um caso especial

Itens concordo/não concordo são muito predominantes em pesqui-
sas de levantamento e, portanto, merecem uma atenção especial. A tarefa
dada aos respondentes em tais itens é diferente daquela de situar a si pró-

prio em uma categoria ordenada. A abordagem habitual é ler uma afirma-
ção aos respondentes e perguntar a eles se concordam ou não com ela. A
afirmação está localizada em algum lugar em um continuum tal como o
retratado na Figura 6.1. As localizações dos respondentes no continuum
são calculadas pela descoberta de se eles dizem que seus sentimentos são
muito próximos à afirmação (por concordarem) ou se são muito distantes
de onde aquela afirmação está localizada (por discordarem).
Quando se compara questões apresentadas no formato concordo/
não concordo com questões no formato direto de classificação, há nume-
rosas desvantagens para o primeiro. Compare o seguinte:
6.20 Minha saúde está ruim. Você concorda fortemente, concorda, discorda
ou discorda fortemente?
6.20a Como você classificaria sua saúde – excelente, muito boa, boa, regular ou ruim?
As desvantagens da primeira afirmação são as seguintes:

• A escala de classificação coloca os respondentes em cinco cate-
gorias; as questões concordo/não concordo são quase sempre
analisadas por colocar os respondentes em dois grupos (os que
concordam e os que não concordam). Portanto, mais informação
é obtida da classificação.
• Questões concordo/não concordo, para que sejam interpretáveis,
podem apenas ser perguntadas sobre extremos em um conti-
nuum. Se a afirmação fosse “Minha saúde é regular,” uma pessoa
poderia discordar tanto porque é “boa” ou porque é “ruim”. Essa
característica limita a habilidade de ordenar as pessoas no meio
de um continuum.
• Os respondentes normalmente acham confusa a forma de dizer
que sua saúde é boa por discordar que ela é ruim.
• Estudos mostram que alguns respondentes são particularmente
prováveis de concordar (ou consentir) quando as questões são co-
locadas dessa maneira; ou seja, há pessoas que concordariam tan-
to que sua saúde é “ruim” quanto que ela “não é ruim” se a ques-
tão 6.20 fosse declarada na negativa (Dillman e Tarnai, 1991;
Krosnick, Judd e Wittenbrink, 2007; Schuman e Presser, 1981).
Por conta dessas complexidades, rotineiramente se constata que

a tarefa de classificação direta tem mais validade do que a questão con-
cordo/não concordo comparável. Para tarefas unidimensionais de escala,
é difícil justificar o uso da questão 6.20 em vez da 6.20a. Um uso muito

comum do formato, contudo, é obter respostas para afirmações comple-
xas como as seguintes:
6.21 Com as condições econômicas conforme estão atualmente, não é razoável

ter mais de dois filhos.
Esta questão está perguntando pelo menos sobre três coisas de

uma vez: o estado econômico percebido, o olhar sobre o número máxi-
mo apropriado de filhos e o olhar sobre a relação entre a economia e o
tamanho da família.
Se não acontece de uma pessoa pensar que as condições econômi-
cas são ruins (o que a questão impõe como uma suposição) e/ou que as
condições econômicas de qualquer tipo têm alguma implicação para o
tamanho da família, mas se essa pessoa pensa que dois filhos é um bom
objetivo para uma família, não é fácil responder à questão. Além disso,
se uma pessoa concorda ou discorda, é difícil saber com o que o respon-
dente concorda ou discorda.
O formato concordo/não concordo parece ser uma maneira bas-
tante simples de construir questões. Na verdade, usar essa forma para
fornecer medidas confiáveis e úteis não é fácil e requer uma grande
quantidade de cuidado e atenção. Normalmente os pesquisadores terão
dados mais confiáveis, válidos e interpretáveis se evitarem as questões
concordo/não concordo.

AUMENTANDO A VALIDADE DOS RELATOS FACTUAIS
Quando um pesquisador pergunta uma questão factual de um res-

pondente, o objetivo é ter o relato deste com perfeita precisão; ou seja, dar
a mesma resposta que o pesquisador teria dado se tivesse acesso às infor-
mações necessárias para responder à questão. Há uma rica literatura me-
todológica sobre o relato do material factual. Os relatos têm sido compara-
dos com os registros em uma variedade de áreas, em particular o relato de
eventos econômicos e de saúde (ver Cannell, Marquis e Laurent, 1977,
para um bom resumo, bem como Edwards et al., 1994; Edwards, Winn e
Collins, 1996; Tourangeau, Rips e Rasinski, 2000).
Os respondentes respondem a várias questões com precisão. Por
exemplo, mais de 90% das noites passadas em um hospital dentro de 6
meses de uma entrevista são relatadas (Cannell, Marquis e Laurent, 1977).
O quão bem as pessoas relatam, contudo, depende tanto de o que eles es-
tão sendo questionados quanto de como estão lhes perguntando. Há qua-
tro razões básicas que explicam o porquê de os respondentes relatarem
eventos com uma precisão menos perfeita:
1. Eles não entendem a questão.
2. Eles não sabem a resposta.
3. Eles não conseguem lembrar, embora saibam a resposta.
4. Eles não querem relatar a resposta no contexto da entrevista.
Há vários passos que o pesquisador pode seguir para combater cada

um desses problemas em potencial. Tais passos são revisados a seguir.
Entendendo a questão
Se os respondentes não têm todos o mesmo entendimento de o
que a questão solicita, isso certamente resultará em erro. Como discutido
antes, quando os pesquisadores estão tentando contar eventos que têm
definições complexas, tais como assaltos ou serviços médicos, eles têm
duas opções: (a) Fornecer definições para todos os respondentes; ou (b)
ter os respondentes fornecendo as informações necessárias para classifi-
car suas experiências em categorias detalhadas, complexas, e então ter
os codificadores categorizando as respostas.
Fowler (1992) mostrou que as pessoas respondem a questões que
incluem termos ambíguos, produzindo dados completamente distorcidos.
Os pesquisadores não podem presumir que os respondentes irão pedir
esclarecimentos se eles não estão certos de o que uma questão significa.
Para maximizar a validade de dados de levantamento factual, um pri-
meiro passo essencial é escrever questões que serão consistentemente
entendidas por todos os respondentes.
Falta de conhecimento
A falta de conhecimento como uma fonte de erro pode ser de dois
tipos principais: (a) O respondente escolhido não sabe a resposta para a
questão, mas alguém na família selecionada sabe; ou (b) ninguém na fa-
mília selecionada sabe a resposta. A solução para a primeira situação
está em escolher o respondente correto, não na formulação da questão.
Na maioria das vezes, o problema é que o respondente da família é soli-
citado a relatar informações sobre outros membros da família ou dela
como um todo. As soluções incluem o seguinte:
• Identificar e entrevistar o membro mais bem informado da família.

• Usar procedimentos de coleta de dados que permitam ao respon-
dente consultar outros membros da família.
• Eliminar respondentes substitutos; apenas peça aos responden-
tes para fornecer informações sobre eles próprios.
Às vezes uma estratégia complexa de coleta de dados é necessária.

Por exemplo, a Nacional Crime Victimization Survey, conduzida pelo Bu-
reau of the Census obtém relatos de crimes domésticos de um único in-
formante da família, mas, além disso, pergunta a cada adulto da família
diretamente sobre crimes pessoais, tais como furtos. Se a entrevista bási-
ca será conduzida pessoalmente, os custos das entrevistas com outros
membros da família podem ser reduzidos se formulários autoadministra-
dos forem deixados para que sejam preenchidos pelos membros da famí-
lia que estejam ausentes, ou se entrevistas secundárias forem feitas por
telefone. Uma variação é pedir ao principal respondente para reportar o
mais completamente possível a informação desejada para todos os mem-
bros da família, então enviar a ele um resumo para verificação, permitin-
do a consulta a outros membros da família.
Quando perguntamos aos respondentes questões sobre eles mesmos
que não conseguem responder, há um problema de formulação da questão.
Teoricamente, podemos diferenciar entre a informação que o respondente
não consegue lembrar e a informação que ele nunca teve. Em ambos os ca-
sos, o problema para o pesquisador é formular questões que quase todos
possam responder. Entre as opiniões disponíveis estão as seguintes:
• Mude as questões para perguntar informações que sejam menos
detalhadas ou mais fáceis de lembrar.
• Ajude o respondente a estimar a resposta.
• Mude ou pule o objetivo.
Não é incomum que as questões solicitem respostas com mais de-

talhes do que os objetivos da pesquisa necessitam.
A questão solicita aos respondentes que digam os nomes de todos os me-

dicamentos que eles tomam (uma questão muito difícil) quando o objeti-
vo é descobrir quem está tomando medicação para pressão alta (uma
questão muito mais fácil).
A questão pergunta sobre rendimentos de forma livre (uma maneira im-
plicitamente muito detalhada) quando obter uma estimativa de renda em
categorias amplas satisfaria os objetivos da pesquisa.
A recordação segue alguns princípios óbvios: Pequenos eventos que

têm menos impacto serão mais provavelmente esquecidos do que aqueles
mais significantes; eventos recentes são mais bem reportados do que aqueles
que ocorreram em um passado mais distante (Cannell, Marquis e Laurent,
1977). Algumas vezes pode valer à pena mudar os objetivos da questão para
melhorar o relato perguntando por eventos que são mais fáceis de recordar.
Por exemplo, embora possa ser desejável que os respondentes relatem todos
os crimes que aconteceram no último ano, haverá menos erros no relato se
eles forem solicitados a relatar apenas os últimos seis meses.
Um conjunto de estratégias de formulação de questões comparati-
vamente novo foi o resultado do crescente envolvimento de psicólogos
cognitivistas nos métodos de pesquisa (Jabine, Straf, Tanur e Tourangeau,
1984; Sirken, Herrman, Schechter, Schwarz, Tanur e Tourangeau, 1999;
Willis, 2005). Várias estratégias estão sendo testadas para ajudar os res-
pondentes a recordar eventos (por exemplo, pela sugestão de possíveis
associações) ou eventos em um determinado lugar no tempo (por exem-
plo, pela recordação dos respondentes de alguma coisa que aconteceu
cerca de um ano antes). Calendários de eventos ajudam os respondentes
a situar os acontecimentos no tempo e a lembrá-los, inserindo-os em um
contexto (Belli, Lee, Stafford e Chou, 2004).
Para várias tarefas de pesquisa, estudos têm mostrado que os respon-
dentes na verdade não usam a recordação para responder a algumas ques-
tões; eles estimam a resposta (Burton e Blair, 1991). Por exemplo, se per-
guntamos aos respondentes o número de vezes que eles foram a uma mer-
cearia para comprar comida em algum período, eles normalmente fazem
uma estimativa baseada no seu padrão habitual em vez de tentar lembrar os
eventos individualmente. Essa observação leva os pesquisadores a formular
estratégias para ajudar os respondentes a fazerem estimativas melhores.
Finalmente, é importante reconhecer que há algumas coisas que os
pesquisadores gostariam que as pessoas relatassem e que elas não po-
dem. Por exemplo, as pessoas não sabem os custos de seus tratamentos
médicos que são pagos pelo plano de saúde. Caso se queria realmente
obter tais custos, é necessário acrescentar o que os respondentes podem
estar aptos a relatar (por exemplo, os gastos do próprio bolso) com da-
dos coletados dos prestadores ou seguradores.
Conveniência social
Há certos fatos ou eventos que os respondentes preferirão não
relatar de maneira precisa em uma entrevista. Condições de saúde que
têm algum grau de inconveniência social, tais como transtornos mentais

ou doenças venéreas, são significantemente menos relatadas do que outras
condições. Hospitalizações associadas a condições particularmente amea-
çadoras, quer pelos possíveis estigmas que podem ser associados a elas ou
por seu natural risco de vida, são relatadas em uma taxa menor do que a
média (Cannell, Marquis e Laurent, 1977). As estimativas agregadas do
consumo de álcool fortemente sugerem um relato inferior, embora os pro-
blemas de relato possam ser uma combinação das dificuldades de recorda-
ção e das preocupações dos respondentes sobre as normas sociais em rela-
ção ao consumo de álcool. Prisão e falência são outros eventos que se des-
cobriu serem consistentemente menos relatados, mas que parecem impro-
váveis de ser esquecidos (Locander, Sudman e Bradburn, 1976).
Provavelmente há limites no que as pessoas vão relatar em uma con-
figuração padrão de entrevista. Se um pesquisador realmente espera que al-
guém admita algo que é muito embaraçoso ou ilegal, esforços extraordiná-
rios são necessários para convencer os respondentes de que os riscos são mí-
nimos e de que as razões para correr tal risco são importantes. O que segue
são alguns dos passos que o pesquisador deve considerar quando questões
particularmente sensíveis estão sendo feitas (ver também Catania, Gibson,
Chitwood e Coates, 1990; Sudman e Bradburn, 1982).
1. Minimize o senso de julgamento; maximize a importância da pre-

cisão. Uma atenção especial à introdução e ao vocabulário que
podem implicar que o pesquisador poderia avaliar certas respos-
tas negativamente é importante.
Os pesquisadores devem estar sempre conscientes do fato de que

os respondentes estão tendo uma conversa com o pesquisador. As ques-
tões e o comportamento do entrevistador, se houver um, constituem toda
a informação que o respondente tem sobre o tipo de interpretação que o
pesquisador dará às respostas. Portanto, o pesquisador precisa ter muito
cuidado com relação às pistas que o respondente está recebendo sobre o
contexto no qual suas respostas serão interpretadas.
2. Use procedimentos autoadministrados de coleta de dados. Embora

os dados não sejam conclusivos, há algumas evidências de que
entrevistas por telefone são mais sujeitas a vieses de conveniên-
cia social do que entrevistas pessoais (Aquilino, 1994; de Leeuw
e van der Zouwen, 1988; Fowler et al., 1998; Henson et al., 1977;
Mangione et al., 1982). A evidência é muito mais clara de que

ter o respondente respondendo a questões em um formulário
autoadministrado, em papel ou diretamente no computador, em
vez de contar com um entrevistador fazendo as perguntas, pro-
duzirá menos viés de conveniência social para alguns itens (por
exemplo, Aquilino, 1994; Aquilino e Losciuto, 1990; Dillman e
Tarnai, 1991; Fowler et al., 1998; Hochstim, 1967). Para levan-
tamentos que lidam com tópicos sensíveis, um levantamento por
correio ou administrado em grupo deve ser considerado. Um le-
vantamento por entrevista pessoal também pode incluir algu-
mas questões autoadministradas: Simplesmente é dado ao res-
pondente um conjunto de questões para que responda em uma
apostila. Se o levantamento é assistido por computador, os res-
pondentes podem digitar suas respostas diretamente nele com o
mesmo efeito. Por exemplo, tal abordagem tem mostrado au-
mentar significativamente os relatos de uso recente de drogas
ilegais (Penne, Lessler, Beiler e Caspar, 1998; Tourangeau e Smith,
1998). Finalmente, Turner e colaboradores (1998) e Villarroel e
colaboradores (2006) têm mostrado que levantamentos por tele-
fone obtêm uma estimativa muito maior de atividades social-
mente sensíveis relacionadas a sexo e drogas quando as respos-
tas são digitadas diretamente em um computador usando a ca-
racterística do toque de tom no telefone do que quando um pes-
quisador faz as perguntas.
3. Garanta a confidencialidade e o anonimato. Quase todos os le-
vantamentos prometem aos respondentes que as respostas serão
tratadas confidencialmente e que ninguém além dos pesquisa-
dores será capaz de associar individualmente os respondentes a
suas respostas. Normalmente os respondentes são assegurados
de tais fatos pelos pesquisadores na introdução e nas cartas pre-
cedentes, se houver alguma; isso pode ser reforçado pelo com-
promisso assinado pelos pesquisadores. Formulários autoadmi-
nistrados sem identificação fornecem uma maneira de garantir
que as respostas são anônimas – não apenas confidenciais. Fi-
nalmente, para levantamentos sobre assuntos particularmente
sensíveis ou pessoais, há algumas estratégias elaboradas de le-
vantamento, tais como técnicas aleatórias de resposta, na qual o
respondente não pode ser ligado a suas respostas (Tais técnicas
são descritas por Fox e Tracy, 1986, e por Fowler, 1995.)
É importante enfatizar novamente que o limite da pesquisa de le-

vantamento é o que as pessoas estão dispostas a contar aos pesquisado-
res sob as condições da coleta de dados projetada pelo pesquisador. Há
algumas questões que provavelmente não podem ser pedidas de amos-
tras de probabilidade sem esforços extraordinários. Alguns dos procedi-
mentos discutidos nesta seção, contudo, tais como tentar criar um con-
texto neutro para as respostas e enfatizar a importância da precisão e da
neutralidade do processo de coleta de dados, são provavelmente proce-
dimentos que valem a pena para a mais inofensiva das questões. Qual-
quer questão, não importa o quão inocente ela possa parecer, pode ter
uma resposta embaraçosa para alguém da amostra. É melhor projetar to-
das as fases de um instrumento de pesquisa com a delicadeza de reduzir
os efeitos da conveciência social e do embaraço para qualquer resposta
que as pessoas possam dar.
AUMENTANDO A VALIDADE DAS RESPOSTAS

QUE DESCREVEM ESTADOS SUBJETIVOS
Como discutido anteriormente, a validade das questões subjetivas

tem um significado diferente daquele das questões objetivas. Não há um cri-
tério externo; pode-se estimar a validade de uma medida subjetiva apenas
pela extensão na qual as respostas são associadas de maneira esperada com
as respostas para outras questões, ou outras características do indivíduo ao
qual isso deve ser relacionado (ver Turner e Martin, 1984, para uma ampla
discussão de questões que afetam a validade de medidas subjetivas).
Há basicamente apenas três passos para o aumento da validade de
medidas subjetivas:
1. Faça com que as questões sejam o mais confiável possível. Reveja a
seção sobre confiabilidade das questões, lidando com a ambiguidade
dos termos, com apresentações padronizadas e com a imprecisão
nos formulários de resposta, e faça o possível para obter as ques-
tões que significarão a mesma coisa para todos os respondentes.
Na medida em que as medições subjetivas não são confiáveis, sua
validade será reduzida. Uma questão especial é a confiabilidade
das escalas ordinais, que são dominantes entre as medições de es-
tados subjetivos. As alternativas de resposta oferecidas devem ser
unidimensionais (isto é, tratar de apenas uma questão) uniformes
(apresentado em ordem, sem inversão).
ESCALAS PROBLEMÁTICAS
6.22 Como você classificaria seu trabalho – muito gratificante, gratificante
mas estressante, não muito gratificante ou nada gratificante?
6.23 Como você classificaria seu trabalho – muito gratificante, algo gratificante,
gratificante ou nada gratificante?
A questão 6.22 tem duas escalar de propriedade, gratificação e es-

tresse, que não devem ser relacionadas. Nem todas as alternativas são
esgotadas. A questão 6.22 deveria ser feita em duas questões se gratifica-
ção e estresse dos trabalhos serão ambos medidos. Em 6.23, alguns po-
dem ver “gratificante” como mais positivo do que “algo gratificante” e fi-
car confuso sobre como as categorias foram ordenadas. Ambos os pro-
blemas são comuns e devem ser evitados.
2. Quando colocando as pessoas em classes ordenadas ao longo
de um continuum, provavelmente é melhor ter mais categorias
do que poucas. Há um limite, contudo, para a precisão da dis-
criminação que os respondentes podem exercer em fornecer
classificações ordenadas. Quando o número de categorias exce-
de a habilidade dos respondentes em discriminar seus senti-
mentos, categorias numerosas simplesmente produzem um ruí-
do não confiável. Várias categorias também podem tornar mais
difíceis de administrar as questões, particularmente no telefo-
ne. Contudo, na medida em que aquela variação real entre os
respondentes está sendo mensurada, mais categorias aumenta-
rão sua validade.
3. Faça questões múltiplas, com diferentes formulários de ques-
tões, que meçam o mesmo estado subjetivo; combine as respos-
tas em uma escala. As respostas para todas as questões são po-
tencialmente influenciadas pelo estado subjetivo para serem
mensuradas e pelas características específicas do respondente
ou das questões. Alguns respondentes evitam categorias extre-
mas; alguns tendem a concordar mais do que discordar. Ques-
tões múltiplas ajudam até mesmo sustentas idiossincrasias de
respostas e aumentam a validade do processo de medição
(Cronbach, 1951; DeVellis, 2003).
O ponto mais importante de se lembrar sobre o significado das

medições subjetivas é a sua relatividade. As distribuições podem ser
comparadas apenas quando a situação de estímulo é a mesma. Peque-
nas mudanças na formulação, que mudam o número de alternativas ofe-

recidas, e até mesmo mudam a posição de uma questão em um questio-
nário, podem fazer uma diferença importante em como as pessoas res-
pondem (ver Schuman e Presser, 1981; Sudman e Bradburn, 1982; e
Turner e Martin1984, para vários exemplos dos fatores que afetam as
distribuições de respostas). A distribuição de respostas para uma ques-
tão subjetiva não pode ser interpretada diretamente; ela tem significado
apenas quando as diferenças entre as amostras expostas ao mesmo
questionário são comparadas ou quando os padrões de associação entre
as respostas são estudados.
ERRO E FORMULAÇÃO DE QUESTÕES
Uma propriedade definitiva dos levantamentos sociais é que as

respostas às questões são usadas como medidas. A extensão em que
aquelas respostas são boas medidas é obviamente uma dimensão crítica
da qualidade das estimativas do levantamento. As questões podem ser
medições pobres por não serem confiáveis (por produzirem resultados
erráticos) ou por serem tendenciosas, produzindo estimativas que consis-
tentemente erram em uma direção a partir do valor verdadeiro (como
quando as prisões de motoristas alcoolizados são subnotificadas).
Sabemos um pouco sobre como tornar as questões mais confiáveis.
Os princípios descritos neste capítulo são provavelmente sólidos. Embora
outros pontos possam ser adicionados à lista, criar questões não ambí-
guas que forneçam medidas consistentes ao longo dos respondentes é
sempre um passo construtivo para boas medições.
A questão da validade é mais complexa. De certo modo, cada variá-
vel a ser mensurada requer uma pesquisa para identificar o melhor con-
junto de questões para medi-la e para produzir estimativas de quão válida
a medida resultante é. Muitas das sugestões para melhorar os relatos nes-
te capítulo emergiram do um programa de 20 anos para avaliar e me-
lhorar as medições de variáveis relacionadas à saúde (Cannell, Marquis e
Laurent, 1977; Cannell, Oksenberg e Converse, 1977). Há várias áreas nas
quais muito mais trabalho sobre validação é necessário.
Reduzir os erros de medida por meio da melhor formulação de
questões é uma das formas menos caras de melhorar as estimativas
de levantamento. Para qualquer levantamento, é importante atentar
cuidadosamente para a formulação de questões e para o pré-teste (o
que é discutido no Capítulo 7), bem como para o uso da literatura de

pesquisa existente sobre como medir o que está sendo medido. Tam-
bém, continuar construindo uma literatura na qual a validade das me-
dições vem sendo avaliada e relatada é muito necessário. Robinson,
Chaver e Wrightsman (1997) e McDowell (2003) compilaram dados
sobre a validade de várias medições de multi-item comumente utiliza-
das que documentam como as medições têm sido validadas, bem como
quanto trabalho ainda precisa ser feito.
EXERCÍCIOS
1. Use os critérios discutidos neste capítulo para avaliar as seguin-

tes questões como confiável, interpretável e medições analitica-
mente úteis; escreva questões melhores se conseguir.
a. Para medir os rendimentos: Quanto você ganha?
b. Para medir a saúde: Quão saudável você está?
c. Para medir a satisfação com a vida: Como você classificaria
sua vida – muito boa, melhor do que a média, um pouco dos
dois, poderia ser melhor ou muito ruim?
d. Para medir opiniões sobre leis de aborto: Diga-me se você
concorda ou não com a declaração a seguir: O aborto é mo-
ralmente muito questionável; abortos deveriam ser ilegais,
exceto em emergências.
2. Escreva uma série de questões para medir a posição a favor ou

contra planos de saúde universais.
3. Escreva uma série de questões para medir o grau de envolvi-
mento político.
4. Escreva uma hipótese sobre uma possível relação entre duas
variáveis (por exemplo, boa saúde é relacionada com receber
assistência médica de qualidade; ou boa qualidade de habita-
ção está relacionada com altos rendimentos). Então, sob cada
parte da hipótese, escreva uma informação que você necessita-
ria a fim de atribuir um valor a uma pessoa para cada uma das
duas variáveis. Em seguida, elabore uma questão (ou um con-
junto delas) para cada parte, e as respostas devem fornecer as
informações de que você necessita. Indique se as suas questões
perguntam sobre informações factuais ou subjetivas e se os da-

dos resultantes serão nominais, ordinais, intervalos ou proprie-
dades de razões.
Fowler, F. J. (1995). Improving survey questions. Thousand Oaks, CA: Sage.

Krosnick, J. A., Judd, C. M., & Wittenbrink, B.. (2007). The measurement of at-
titudes. In D. Albarracin, B. T. Johnson. & M. P. Zanna (Eds.) The handbook of
attitudes (pp. 21-78). Mahwah, NJ: Lawrence Erlbaum.
Tourangeau, R., Rips, L., & Rasinski, K. (2000). The psychology of survey response.
Cambridge, UK: Cambridge University Press.
Avaliando questões e
instrumentos de levantamento 7
A elaboração de um bom instrumento de levantamento de dados envolve sele-

cionar as questões a fim de que elas venham ao encontro dos objetivos da pes-
quisa, testando-as para assegurar que sejam indagadas e respondidas como
planejado e, a seguir, estruturando-as de maneira que facilitem o trabalho de
respondentes e entrevistadores. Este capítulo descreve passos para a elabora-
ção de bons instrumentos de levantamento.
Todo levantamento de dados requer ou um roteiro de entrevista, o

qual constitui uma espécie de guia para entrevistadores em pesquisas, ou
um questionário que os respondentes irão ler e preencher sem auxílio.
Estes documentos, os quais serão apresentados em forma impressa ou
como programas para computador, serão utilizados como instrumentos
genéricos de levantamento de dados.
Compreender a correta estruturação de uma boa questão e a melhor
maneira de utilizar questões como parâmetros, consoante o que foi discuti-
do no Capítulo 6, é certamente o elemento principal para a elaboração de
um bom instrumento de levantamento. Há, contudo, uma série de instru-
ções muito práticas essenciais para a produção de um bom instrumento de
coleta de dados. Este capítulo apresenta um resumo desses passos. Converse
e Presser (1986), Bradburn e Sudman (1992), Fowler (1995), Groves e co-
laboradores (2004), Presser e colaboradores (2004), e Willis (2005) apre-
sentam longas e detalhadas discussões a respeito desses passos.
A elaboração de um instrumento de levantamento de dados possui
dois componentes: decidir o que averiguar, elaborar e testar questões que
serão boas ferramentas de avaliação. Geralmente o primeiro passo é defi-
nir os objetivos do levantamento, embora estas metas possam ser revisa-

das, baseadas em testes subsequentes de questões. Então o processo de es-
colha e teste de questões é iniciado. Os passos envolvidos no processo de
desenvolvimento de levantamento de dados podem incluir o seguinte:
• focar em discussões em grupos;
• esquematizar protótipo de um conjunto de questões;
• fazer uma revisão crítica para detectar falhas comuns;
• realizar entrevistas individuais cognitivas (evitando a reprodu-
ção de procedimentos de coleta de dados propostos);
• inserir questões em um instrumento de levantamento de dados;
• realizar um pré-teste utilizando uma aproximação de procedi-
mentos de coleta dados propostos.
DEFININDO OBJETIVOS
Um pré-requisito para elaborar um bom instrumento de levanta-

mento de dados é decidir o que será averiguado. Isso pode parecer simples
e evidente, contudo este passo é frequentemente esquecido, em detrimen-
to dos resultados. Um valioso primeiro passo é escrever um parágrafo so-
bre as funções que deverão ser executadas pelo levantamento de dados.
Na elaboração de um instrumento de levantamento de dados, pesquisado-
res são geralmente tentados a adicionar questões que não contribuem para
alcançar as metas do projeto. Uma maneira de evitar essas tentações é ter
um bom relatório dos propósitos, contra os quais a inclusão de uma área
específica de pesquisa pode ser avaliada. Segundo, um pesquisador precisa
elaborar uma lista do que dever ser averiguado para atingir as metas do
projeto. Estas não devem ser questões; devem ser variáveis a serem avalia-
das, listadas em categorias ou áreas que tenham sentido.
Um plano de análise deve ser desenvolvido para acompanhar uma
lista de variáveis a serem analisadas. Provavelmente, um bom começo já
deverá ter sido feito associado à elaboração da amostra. O pesquisador
já deverá ter definido quais subgrupos da população requerem estimati-
vas especiais. Neste ponto, entretanto, o pesquisador precisa refinar es-
tas ideias, com o intuito de criar uma listagem de (a) quais variáveis são
elaboradas para serem variáveis dependentes, para as quais medidas de
tendência central (por exemplo, meios ou distribuições) são estimadas;
(b) quais variáveis precisam ser independentes, com o objetivo de com-
preender distribuições e padrões de associação; e (c) quais variáveis po-
dem ser necessárias como variáveis de controle e intervenção para expli-

car padrões observados e analisar hipóteses conflitantes.
Estes três documentos, um relatório de propostas, uma lista dos ti-
pos de variáveis a serem analisadas e um esboço de um plano de análise
são componentes essenciais para a elaboração de um instrumento de le-
vantamento de dados.
PASSOS PRELIMINARES PARA A ELABORAÇÃO DE QUESTÕES

Grupos focais*
Antes de elaborar um esboço de uma lista estruturada de questões,
é quase sempre de grande importância conduzir discussões a respeito do
tópico do projeto com indivíduos que integram a população a ser estuda-
da. A proposta inicial destas discussões é comparar a realidade sobre a
qual os sujeitos estarão respondendo a questões com os conceitos abstra-
tos constituintes objetivos do estudo.
Exemplo. O objetivo é averiguar o número de visitas a médicos. Um
grupo de discussão poderia se focar no que é comumente considerado como
uma visita ao médico. Dois conceitos-chave são “visita” e “médico”. Os parti-
cipantes podem ser indagados sobre os vários contatos que eles tiveram re-
lacionados a médicos (por exemplo, atendimentos médicos por telefone,
consultas para a realização de raio-x ou testes em laboratório, aplicação de
vacinas) e se esses contatos poderiam ou não ser considerados visitas. Aos
participantes também poderia ser inquirido a respeito das várias pessoas
contatadas para cuidar de sua saúde (por exemplo, psicólogos, psiquiatras,
técnicos em enfermagem, oftalmologistas, optometristas, fisioterapeutas) e
perguntar se estes indivíduos podem ou não ser considerados médicos.
Esta discussão pode proporcionar informações críticas de, pelo me-
nos, três tipos:
1. Os tipos de contatos considerados visitas pelos indivíduos. Esta
informação ajudaria o pesquisador a refinar os objetivos e os
termos utilizados na questão para estabelecer o que pode ou
não ser incluído. Por exemplo, consultas por telefone podem ser
incluídas? Se um estudante de enfermagem é visto em um con-
sultório médico, deve ser levado em consideração?
2. O que os indivíduos sabem. Por exemplo, está claro que um psi-
quiatra é formado em medicina, mas um psicólogo não o é? Que
*
N. de R.T.: Em inglês: focus group.
suposições podem ser feitas sobre o conhecimento prévio e percep-

ções das pessoas, treinamento, ou credenciais de seguro-saúde?
3. A compreensão de algumas palavras-chave ou termos. A palavra
médico significa um indivíduo formado em medicina, ou é mais
genérica (como quando utilizamos o nome de uma marca co-
mercial para nos referirmos ao produto) referindo-se a quais-
quer profissionais que usem jalecos brancos e lidem com ques-
tões relacionadas à saúde? Termos como “provedor de cuidados
com a saúde” ou “profissional dos cuidados com a saúde” teriam
o mesmo significado para os respondentes?
Discussões de grupos focais são mais bem realizadas com seis a

oito participantes. O protocolo geral é discutir as percepções, experiên-
cias e talvez sentimentos dos indivíduos relacionados ao que será averi-
guado no levantamento de dados. O número de grupos que será necessá-
rio pode variar, mas praticamente qualquer instrumento de levantamen-
to de dados será bem-sucedido com ao menos dois grupos focais nos es-
tágios iniciais do processo de elaboração do instrumento de levantamen-
to de dados.
Esboçando questões
Munido de uma lista do que será avaliado, o pesquisador se es-
força em encontrar uma única questão ou relação de questões necessá-
rias para criar medidas das variáveis da lista. Muitas questões, como
aquelas que lidam com informações prévias ou problemas demográfi-
cos, são padrão para a maioria dos levantamentos de dados. Pode ser
útil revisar as questões utilizando o General Social Survey, com o apoio
do National Opinion Research Center, na University of Chicago. Muitas
pesquisas são também realizadas através da internet pelo Inter-univer-
sity Consortium of Political and Social Research (ICPSR), na University
of Michigan. McDowell (2003) é um excelente recurso para a realiza-
ção desses levantamentos de dados com temas relacionados aos cuida-
dos com a saúde. Cópias de instrumentos de levantamentos de dados
originais, advindos das mais importantes organizações de levantamen-
to, também são úteis como referências. Com base neles, o pesquisador
pode abstrair ideias sobre como questões específicas são estruturadas,
e sobre como gerar questões padronizadas e formatar instrumentos de
levantamentos de dados.
Tirar vantagem do trabalho que outros elaboraram é muito sensa-

to. Obviamente, é melhor revisar questões feitas por pesquisadores que
anteriormente fizeram trabalhos com o mesmo tópico. Além disso, se
questões já foram feitas em outras amostras, a coleta de dados para com-
paração pode contribuir para a confiabilidade da pesquisa. O simples
fato de que uma questão foi utilizada por alguém anteriormente, toda-
via, não é garantia de que a mesma é muito boa ou, certamente, que é
apropriada para a dada pesquisa. Muitas questões inadequadas são lar-
gamente utilizadas por pesquisadores que não realizam uma análise crí-
tica. Todas as questões devem ser testadas para que haja garantias de
que “funcionam” para os sujeitos, para o contexto e para os objetivos de
um determinado estudo.
Avaliação Pré-levantamento
Revisão crítica sistemática
A partir do momento em que o conjunto de questões é esboçado, é
aconselhável que o próximo passo seja submetê-lo a uma revisão crítica.
Lesser e Forsyth (1996) produziram uma lista de falhas a serem localiza-
das em um conjunto de questões. Fowler e Cosenza (2008) também pro-
puseram uma lista de padrões para questões que podem ser aplicados
inicialmente para teste. Enquanto a não utilização de listas pode tornar a
tarefa exaustiva, o uso de ambas as listas pode auxiliar na identificação
de uma série de características de questões que são indicadas como pro-
blemáticas. Uma extensão disso tem sido desenvolvida por Graesser e co-
laboradores (Graesser, Cai, Louwerse e Daniel, 2006), a qual é composta
por uma lista de 12 problemas em questões que podem ser identificados
através do uso de uma ferramenta eletrônica de avaliação. A utilização
de uma dessas listagens pode ser útil na identificação de questões que
podem precisar de revisão; bem como na indicação de dificuldades que
requerem atenção durante as próximas fases de teste.
Entrevistas cognitivas em laboratório

Uma vez que a lista de questões estiver pronta, revisada e classifi-
cada como confiável, o próximo passo é averiguar se os sujeitos poderão
entender e responder às questões. Discussões de grupos de foco podem
proporcionar algumas soluções para problemas de compreensão, mas
elas não fornecem opções para discutir a avaliação de vocabulário espe-

cífico ou o nível de dificuldade da tarefa de resposta. Nos estágios ini-
ciais da estruturação de questões, o pesquisador também pode realizar
testes, aplicando-as em grupos de amigos, parentes e colegas de traba-
lho. Versões recentes de instrumentos de levantamentos de dados con-
têm questões confusas, que não podem ser lidas como foram escritas, e
que são praticamente impossíveis de serem respondidas.
A partir do momento em que as questões estão em sua forma pri-
mitiva, mas antes de serem submetidas à pré-testes em campos formais,
uma espécie formal de teste, comumente denominada testes cognitivos, é
um importante passo (DeMaio e Rothgeb, 1996; Forsyth e Lesser, 1992;
Fowler, 1995; Lesser e Tourangueau, 1989; Presser et al., 2004; Willis,
2005; Willis, DeMaio e Harris-Kojetin, 1999). Embora entrevistas cogni-
tivas tenham uma variedade de formas, há certas características que são
comumente compartilhadas. Primeiramente, respondentes são voluntá-
rios que estão dispostos a estender o seu período de participação para
além do necessário na realização da coleta de dados, com o objetivo de
auxiliar os pesquisadores. Comumente o serviço dos respondentes é re-
compensado, e eles são levados ao laboratório, onde as entrevistas po-
dem ser observadas e gravadas.
Geralmente essas entrevistas não são realizadas por entrevistado-
res comuns. Em algumas ocasiões, os entrevistadores são psicólogos cog-
nitivos; em outras, as entrevistas são realizadas pelos próprios investiga-
dores ou indivíduos encarregados de supervisionar entrevistadores. Na
maioria dos casos, os entrevistadores possuem um vasto conhecimento
sobre os objetivos de cada questão, o que possibilita a percepção de pro-
blemas relacionados à compreensão dos respondentes ou à forma como
eles respondem às questões.
O padrão básico requer perguntar aos respondentes uma série de
questões, avaliando a maneira como os indivíduos as compreenderam e
como as responderam. Não raro os respondentes são solicitados a “pen-
sar em voz alta” enquanto preparam suas respostas. Em outros casos, os
indivíduos são convidados a responder uma série de perguntas sobre sua
compreensão e sobre dificuldades relacionadas às suas respostas. Duas
das tarefas mais comuns são:
1. Solicitar aos respondentes que expliquem, com suas próprias pa-
lavras, o que a questão está pedindo.
2. Solicitar aos respondentes que justifiquem sua escolha em favor
de uma resposta, em detrimento das outras.
A meta é coletar informações suficientes a respeito da compreen-

são e preparação das respostas dos entrevistados, com o intuito de ava-
liar se estes realizaram a tarefa de acordo com as expectativas do pesqui-
sador. Há quatro tipos específicos de questões que devem ser respondi-
das pelo teste cognitivo:
1. As questões são satisfatoriamente compreendidas?
2. Os respondentes possuem as informações necessárias para res-
ponder às questões?
3. As respostas refletem com precisão o que os respondentes dese-
jam comunicar?
4. As respostas fornecem considerações válidas a respeito do tópi-
co principal da questão?
Há um certo limite sobre o que pode ser obtido por intermédio de en-
trevistas em laboratórios. Poucas entrevistas desse tipo são realizadas (geral-
mente o número de entrevistas é inferior a 10), pois elas exigem trabalho e,
na maioria das organizações, podem ser conduzidas apenas por um reduzi-
do número de pessoas. Segundo, as entrevistas são conduzidas sob condi-
ções artificiais; tarefas pelas quais os respondentes estão realmente interes-
sados, e são hábeis para executar, podem não ser passíveis de execução por
uma amostra cruzada realizada em suas residências. Entretanto, estas entre-
vistas são muito utilizadas como um passo essencial na elaboração e avalia-
ção de um instrumento de levantamento de dados. Questões que não são
satisfatoriamente compreendidas ou respondidas em um laboratório certa-
mente não irão ter melhor resultado em uma situação real. Problemas de
compreensão e dificuldades com a tarefa de resposta não são consideradas
confiáveis em pretextos de campo como seriam em entrevistas em laborató-
rios, onde o processo para resposta pode ser examinado.
A entrevista cognitiva em laboratório tem sido comumente empre-
gada para testar protocolos de entrevista. Os mesmos problemas de com-
preensão e dificuldades da tarefa de resposta, contudo, se aplicam a mé-
todos autoadministrados. Embora o teste-padrão de métodos autoadmi-
nistrados, como descrito a seguir, geralmente envolva a ampliação de
questões similares àquelas empregadas em entrevistas cognitivas, a com-
preensão dos respondentes é mais aparente quando o processo de per-
guntas e respostas é realizado oralmente. Deste modo, para questões de
teste elaboradas para serem autoadministradas, uma entrevista cognitiva
pode ser um meio eficaz de identificar problemas que não seriam obser-
vados no pré-teste-padrão.
ELABORAÇÃO, FORMATO E LEIAUTE DOS

INSTRUMENTOS DE LEVANTAMENTO
Uma vez que uma lista de questões é preparada para o pré-teste fi-
nal, é necessário arranjar as questões de maneira que facilite o processo de
entrevista ou autoadministração. O primeiro passo é ordenar as questões.
Muitos pesquisadores optam por iniciar aplicando questões relativamente
fáceis e diretas, que podem apresentar ao respondente o tópico da pesqui-
sa. Questões que exigem um raciocínio mais apurado, ou aquelas que li-
dam com temas delicados, são comumente reservadas para as últimas ses-
sões. Um procedimento aconselhável é numerar as questões de cada ses-
são: A1, A2, B1, B2, e assim por diante. Dessa forma, quando questões são
adicionadas ou excluídas, não é necessário renumerar todas as questões.
Quer o levantamento de dados seja administrado por um entrevis-
tador, quer pelo próprio respondente, o objetivo principal dos esquemas
e formato do questionário deve ser facilitar a tarefa dos entrevistadores
e dos respondentes. Com o intuito de alcançar este objetivo, a seguir po-
derão ser observadas algumas regras, elaboradas para um instrumento
de levantamento de dados administrado por um entrevistador:
1. Adotar uma convenção que diferencie as palavras lidas pelos en-
trevistadores para os respondentes, e as palavras que são instru-
ções. Uma convenção comum é o emprego de letras em caixa
alta para instruções e em caixa baixa para questões que devem
ser lidas em voz alta.
2. Se uma entrevista é apresentada em forma impressa, e não é
monitorada por computador, é necessário fazer uso de instru-
ções que permitam ao respondente que ignore questões que fo-
ram elaboradas para um grupo específico de indivíduos. Uma
convenção comum é colocar INSTRUÇÕES EM LETRAS MAIÚS-
CULAS. As instruções devem ser ligadas a respostas específicas,
auxiliando o entrevistador. Obviamente, instrumentos monitora-
dos por computador pularão questões automaticamente, com
base nas respostas fornecidas.
3. Colocar vocabulário opcional em parênteses. Convenções como
(dele/dela) ou (esposo/esposa) podem ser empregadas com na-
turalidade por entrevistadores se eles forem alertados por ter-
mos em parênteses. Uma convenção similar utiliza todas as le-
tras maiúsculas (por exemplo, CÔNJUGE) quando o entrevista-
dor precisa substituir uma palavra que não é fornecida na pró-
pria questão. A assistência do computador geralmente oferece

vocabulário opcional para ser utilizado, em vez de um entrevis-
tador adaptar o vocabulário à situação.
4. Garantir que todas as palavras que deverão ser utilizadas pelo
entrevistador estão, de fato, escritas. Isso inclui não apenas a es-
truturação das questões, mas transições, introduções para ques-
tões, definições necessárias e explicações.
Para questionários autoadministrados, os mesmos princípios se apli-

cam; isto é, a meta principal é facilitar a utilização do questionário. O for-
mato de um questionário autoadministrado é o mais importante. Em con-
traste com entrevistas, os respondentes não são beneficiados com a prática,
eles usualmente não recebem a motivação necessária para realizar um bom
trabalho e não são selecionados de acordo com suas habilidades para lidar
com questionários. A seguir serão apresentados cinco princípios-guia:
1. Um questionário autoadministrado deve ser, em especial, auto-
explicativo. Não há a necessidade da leitura de instruções, uma
vez as mesmas não serão lidas adequadamente.
2. Questionários autoadministrados devem se restringir a respostas
objetivas. Checar uma tabela de respostas, clicar em uma alter-
nativa ou circular um número devem ser as únicas tarefas solici-
tadas. Quando os respondentes são convidados a responder com
suas próprias palavras, as respostas são geralmente incompletas,
vagas, de difícil compreensão e, por essa razão, dotadas de limi-
tado valor como medidas.
3. É importante que não haja uma grande variedade de formatos
de questões em questionários autoadministrados. Quanto maior
o número de questões similares, menor a probabilidade de fa-
lhas na compreensão por parte do respondente; e também a ta-
refa se tornará mais fácil para os respondentes.
4. Um questionário deve ser elaborado da maneira mais clara e or-
ganizada possível. Redução do tamanho de letra (ou outra es-
tratégia para colocar várias questões em uma única página) re-
duz consideravelmente a taxa de resposta em comparação com
o mesmo número de questões organizadas para atrair a atenção
do leitor, em mais de uma página.
5. Não é aconselhável fornecer informações redundantes aos res-
pondentes, através de imagens e perguntas escritas que transmi-
tem a mesma mensagem sobre como proceder. Se os indivíduos
podem se confundir sobre o que eles precisam fazer, eles irão.

Se esforce para tornar tudo simples e claro.
A maioria dos princípios listados anteriormente também podem ser

aplicados em instrumentos monitorados por computador. Além disso, au-
xiliar os respondentes e entrevistadores a lidar com dificuldades comuns
surgidas durante o processo, como encontrar a maneira adequada para
corrigir respostas anteriores ou o que fazer se respondentes desejam igno-
rar uma questão é uma parte importante no trabalho de elaboração. A
chave para evitar todas essas dificuldades é localizar os problemas com
antecedência, por meio de testes. Boas descrições de procedimentos de
teste são apresentadas por Dillman e Redline (2004), Tarnai e Moore
(2004), Hansen e Couper (2004) e Baker, Crawford e Swinehart (2004).
PRÉ-TESTES DE CAMPO
Uma vez que o instrumento de levantamento de dados esteja pró-

ximo de sua conclusão, um pré-teste de campo do instrumento e dos pro
cedimentos se faz necessário. O propósito de tais pré-testes é descobrir
como os protocolos de coleta de dados e os instrumentos do levantamen-
to de dados irão funcionar sob circunstâncias reais.
Pré-teste e roteiro de entrevista

O pré-teste tradicional realizado por organizações de pesquisa geral-
mente consistem em entrevistadores experientes realizarem de 20 a 50 en-
trevistas com respondentes retirados de uma população semelhante àquela
que será incluída na pesquisa. Os entrevistadores são solicitados a desempe-
nhar duas funções nestes pré-testes: Eles são entrevistadores conduzindo o
procedimento e são observadores do processo de coleta de dados que devem
alertar os pesquisadores sobre melhorias necessárias nos instrumentos de le-
vantamento de dados. É provavelmente mais típico deste processo de retorno
de informações que ele ocorra em reuniões de grupo, embora haja casos nos
quais os entrevistadores se dirigem aos pesquisadores individualmente.
Pré-testes como os descritos aqui são essenciais para o processo de
elaboração do levantamento de dados. Uma função particularmente impor-
tante é testar a utilidade do instrumento, tanto as questões quanto os esque-
mas, da perspectiva dos entrevistadores. Contudo, estes testes também pos-
suem uma série de limitações. O padrão utilizado pelos entrevistadores para

a identificação de problemas não é especificado, e é quase certo que os en-
trevistadores apresentam inconsistências no que consideram como proble-
ma. Também, uma discussão em grupo não é o meio mais aconselhável para
reunir informações sistemáticas sobre a experiência de pré-teste.
Os pesquisadores têm adicionado passos elaborados para tornar a
experiência de pré-teste o mais sistemática e eficaz possível. Uma inova-
ção simples é solicitar aos entrevistadores que preencham uma espécie
de relatório sobre cada questão, para compartilhá-lo em uma reunião de
grupo posterior. Um relatório desse tipo solicita aos entrevistadores que
avaliem cada questão no que diz respeito a (a) se ela é de fácil leitura,
(b) se os respondentes entenderam satisfatoriamente a questão e (c) se
os indivíduos responderam às questões adequadamente (Fowler, 1995).
Obviamente, os entrevistadores precisam adivinhar se as questões serão
ou não respondidas e compreendidas; contudo, esta é uma tarefa neces-
sária. A vantagem de um formulário é que entrevistadores são solicitados
a voltar sua atenção para esses aspectos sutis da elaboração de questões,
tão distintos dos aspectos práticos do instrumento de levantamento de
dados, com os quais eles estão mais familiarizados. Ainda, dispor de en-
trevistadores que já responderam a esse tipo de formulário facilita aos
investigadores o resumo de relatórios elaborados pelos entrevistadores,
bem como a identificação de problemas de uma forma eficaz.
A mais importante, e provavelmente de maior utilidade, inovação
no que diz respeito ao pré-teste de campo é o uso de gravações de áudio
e observação de comportamento para a avaliação de questões de levan-
tamento de dados. Com a permissão dos respondentes, a qual é quase
sempre obtida, torna-se fácil gravar pré-testes de entrevistas feitas tanto
pessoalmente quanto por telefone. Gravadores treinados podem então
escutar essas gravações e avaliar problemas no processo de pergunta e
resposta de uma maneira satisfatória.
Três comportamentos têm sido essenciais na identificação de pro-
blemas com questões de levantamento de dados (Fowler e Cannell, 1996;
Oksenberg et al., 1991): (a) se o entrevistador realiza ou não a leitura
das questões como foram escritas, (b) se é ou não solicitado pelo respon-
dente maiores explicações a respeito das questões e (c) se o respondente
inicialmente fornece uma resposta inadequada que requere a interven-
ção do entrevistador. Foi constatado que, ou as questões constantemente
produzem comportamentos desse tipo, ou elas não os produzem de for-
ma alguma em entrevistas; ou seja, há questões que são constantemente
mal interpretadas pelos entrevistadores, o que leva os respondentes a so-

licitarem maiores explicações ou a responderem de forma inadequada.
Esse tipo de sistema não identifica todas as questões que são constante-
mente mal interpretadas pelos respondentes. No entanto, quando um
desses comportamentos ocorre em 15% ou mais de pré-testes de entre-
vistas, tem sido demonstrado que ou a questão tende a produzir dados
distorcidos, ou se torna suscetível à influência do entrevistador (Fowler,
1991; Fowler e Mangione, 1990).
Um benefício adicional da observação de comportamento de pré-
testes de entrevistas é que os resultados são sistemáticos e podem ser re-
produzidos. Deste modo o processo de avaliação da questão é conduzido
de forma alheia a opiniões subjetivas de pesquisadores e entrevistadores,
e evidências concretas e passíveis de reprodução são produzidas sobre
questões inadequadas.
Arquivos de acompanhamento são a terceira fonte de informação
advinda de pré-teste de uma entrevista monitorada por computador.
Quando uma entrevista é monitorada por um computador, é possível re-
cuperar os caminhos seguidos pelo entrevistador durante a entrevista.
Tais arquivos podem identificar situações nas quais os entrevistadores
precisaram voltar para telas e questões anteriores. Ter de retornar a
questões anteriores diminui a produtividade de um entrevistador e geral-
mente evidencia que a questão não foi elaborada adequadamente. Ob-
servar como funções “de auxílio” são utilizadas pode fornecer indícios de
onde a ajuda é necessária e quão “úteis” as várias funções de auxílio são.
Novamente, uma informação adicional sobre arquivos de acompanha-
mento é que os resultados são sistemáticos e confiáveis (Couper, Hansen
e Sadowsky, 1997; Hansen e Couper, 2004).
Pré-teste de questionário autoadministrado

Instrumentos autoadministrados requerem mais pré-testes do que
instrumentos de levantamento de dados administrado por um entrevista-
dor, simplesmente porque entrevistadores podem solucionar algumas di-
ficuldades que os pesquisadores não solucionaram ao elaborar o instru-
mento de levantamento de dados. Infelizmente, o pré-teste de um instru-
mento autoadministrado é, de certa forma, de difícil realização, uma vez
que problemas de compreensão e dificuldades para responder questões
são menos evidentes. Embora a observação de como os indivíduos pre-
enchem formulários ou lidam com o computador seja uma maneira de
identificar questões ou instruções pouco claras, esta não se mostra tão

satisfatória como uma gravação de áudio ou a observação de comporta-
mento proporcionada pelas entrevistas.
Provavelmente o melhor meio de realizar pré-testes de questioná-
rios autoadministrados é pessoalmente, com um grupo de potenciais res-
pondentes. Se é um levantamento de dados baseado em computador, os
respondentes podem fornecer suas respostas por meio de computadores
portáteis. Primeiramente, eles devem preencher o questionário como se
já estivessem respondendo ao levantamento de dados. Então o pesquisa-
dor pode conduzir a discussão sobre o instrumento. Um dos tópicos é,
obviamente, se as instruções foram claras. Um segundo tópico é se as
questões foram claras. Um terceiro é se houve problemas em compreen-
der que tipo de respostas eram exigidas ou em fornecer respostas para as
questões como estas foram criadas (Dillman e Redline, 2004).
Em adição a grupos de teste, a utilização de um instrumento basea-
do em computador pode beneficiar-se de testes contínuos, nos quais al-
guns respondentes são observados lidando com o computador e com as
questões (Tamai e Moore, 2004). A observação direta ou a gravação em
vídeo podem ser utilizadas para identificar potenciais dificuldades. No-
vamente, arquivos de acompanhamento podem ser examinados para
identificar problemas operacionais ou lugares visitados pelos responden-
tes para corrigir respostas.
Eliminando os erros de um instrumento assistido por computador

A aplicação de instrumentos de teste em entrevistadores e responden-
tes pode fornecer informações sobre facilidades de uso, mas não demonstra
se o protocolo de coleta de dados está correto ou não. A principal área de
observação, a qual requer maior cuidado, é a área das instruções “puladas”.
Uma grande vantagem do auxílio do computador é ajudar os res-
pondentes e entrevistadores a conduzir a entrevista adequadamente:
quando ou como cada questão é feita é relacionado com as respostas da-
das a questões anteriores. Obviamente, a precisão de instruções “pula-
das” requer uma revisão apurada das versões finais dos instrumentos im-
pressos. Contudo, os desafios de checar a precisão de instrumentos mo-
nitorados por computador são muito maiores do que em instrumentos
impressos. O problema é que programas de teste não são capazes de per-
ceber quais questões são puladas e, consequentemente, podem ignorar o
fato de que algumas deveriam ter sido respondidas. Uma análise apura-
da de um programa e um detalhado processo de testes são passos impor-

tantes. Todavia, se um instrumento é extenso e apresenta eventualidades
complexas, estes passos podem ser inadequados.
Por esta razão, a partir do momento em que um levantamento de da-
dos é iniciado, deveria ser uma prática padrão tabular a distribuição das res-
postas. Apenas através da análise de tais métodos um pesquisador pode ter
certeza de que as instruções estão desempenhando seu papel corretamente.
DURAÇÃO DOS INSTRUMENTOS DE LEVANTAMENTO
Um resultado de um bom pré-teste é descobrir quanto tempo irá

levar para finalizar um instrumento de levantamento de dados. O crité-
rio para a duração de uma entrevista deve incluir os custos, o feito ou
taxa de resposta, as limitações nas habilidades dos respondentes e a mo-
tivação para responder questões. O nível de abrangência da duração de
um questionário autoadministrado, e o quanto ele pode afetar os custos
e as taxas de resposta varia de acordo com a população estudada o com
tópico; generalizações são difíceis de ser realizadas. É também difícil ge-
neralizar o tempo de duração das entrevistas.
Quando pesquisadores pensam em perguntar mais do que eles
sentem que deveriam, há duas escolhas a serem feitas. Logicamente, o
pesquisador pode simplesmente excluir questões. Um método alternativo
é disponibilizar subseções de questões para representar subamostras de
respondentes. Este tipo de método aumenta a complexidade do levanta-
mento de dados e reduz a precisão de estimativas dessas variáveis, por-
tanto, é aconselhável disponibilizar todas as questões de uma só vez.
Uma vantagem clara da coleta de dados assistida por computador é a fa-
cilidade com que estes métodos podem ser implementados.
CONCLUSÃO
Houve um tempo em que o processo de avaliação de questões era

considerado uma tarefa altamente subjetiva, eventualmente subordinada
às preferências de entrevistadores e pesquisadores. Sabemos agora que é
preciso ir além disso. As questões em levantamento de dados devem ter
o mesmo significado para todos os respondentes, responder às questões
deve ser uma tarefa que a maioria dos respondentes possa realizar, e as
palavras em um roteiro de entrevistas devem ser adequadas, de maneira

que os entrevistadores possam ser guiados na administração da entrevista.
Logicamente, não importando o quão clara uma questão possa ser,
alguns respondentes apresentarão dificuldades ao respondê-la, e alguns
entrevistadores não irão compreendê-la. Há julgamentos a serem feitos so-
bre o quão mal elaborada uma questão pode ser, de maneira que melho-
rias sejam possibilitadas. Uma parte crítica do processo de elaboração e
avaliação de instrumentos de levantamento de dados, contudo, é coletar
informações sobre compreensão, a tarefa de responder às questões, e como
entrevistadores e respondentes usam os protocolos de modo que análises
possam ser feitas a respeito de possíveis modificações nas questões e nos
instrumentos. A avaliação adequada de questões e instrumentos antes mes-
mo da elaboração de uma pesquisa é um elemento crucial para a prática de
um bom levantamento de dados. É um dos meios mais baratos de reduzir
erros em estimativas de levantamentos de dados. Embora seja trabalhoso
definir meios eficientes de avaliar questões, os procedimentos citados nas
páginas anteriores constituem um apanhado de técnicas úteis que, quando
usadas, terão um impacto positivo nos dados da pesquisa.
EXERCÍCIOS
Utilize as questões elaboradas no exercício do Capítulo 6 e trans-

forme-as em uma lista de questões que poderiam ser administradas por
um entrevistador em uma forma padrão.
1. Teste cognitivamente as questões e revise-as, se necessário.
2. Realize um pré-teste com as questões conseguintes. Revise se for
preciso.
3. Agora coloque as mesmas questões no formato autoadministra-
do. Em seguida, realize um pré-teste.
Presser, S., et al. (2004). Methods for testing and evaluating survey questionnaires.
Hoboken, NJ: John Wiley.
Willis, G. (2005). Cognitive interviewing. Thousand Oaks, CA: Sage.
Entrevista de levantamento 8
Os entrevistadores afetam as estimativas do levantamento de três formas: Eles

têm um importante papel na taxa de resposta que é atingida, são responsáveis
por treinar e motivar os respondentes e precisam tratar sua parte na interação da
entrevista e no processo de pergunta e resposta de forma padrão, não tendencio-
sa. Este capítulo discute a significância da seleção, do treinamento e da supervisão
dos entrevistadores, além dos procedimentos que são dados aos entrevistadores
para minimizar os erros relacionados ao entrevistador em um levantamento.
VISÃO GERAL SOBRE O TRABALHO DO ENTREVISTADOR
Embora muitos levantamentos sejam conduzidos usando-se méto-

dos autoadministrados, usar entrevistadores para fazer perguntas e re-
gistrar respostas é certamente uma parte comum dos procedimentos de
medição de levantamentos, tanto face a face quanto por telefone. Devido
ao papel central que eles ocupam na coleta de dados, os entrevistadores
têm muito potencial para influenciar a qualidade dos dados que coletam.
O gerenciamento de entrevistadores é uma tarefa difícil, particularmente
em estudos com entrevistas pessoais. O objetivo neste capítulo é fornecer
um entendimento sobre o que um entrevistador deve fazer, sobre os pro-
cedimentos adequados para gerenciar entrevistadores e a significância
do gerenciamento e do desempenho do entrevistador para a qualidade
das estimativas baseadas em levantamento.
Os entrevistadores possuem três papéis primordiais a cumprir na
coleta de dados de levantamento:
• localizar e mobilizar a cooperação dos respondentes seleciona-

dos
• treinar e motivar os respondentes para que façam um bom tra-
balho
• fazer perguntas, registrar as respostas e investigar respostas in-
completas para garantir que atinjam os objetivos da questão
Obtendo cooperação
Os entrevistadores precisam entrar em contato com os respondentes
para mobilizar a cooperação. A dificuldade dessa parte do trabalho difere
grandemente com a amostra. Os entrevistadores precisam estar disponí-
veis quando os respondentes querem ser entrevistados, eles precisam estar
disponíveis (e persistentes) o suficiente para fazer contato com responden-
tes difíceis de encontrar e para fazer entrevistas na casa das pessoas, preci-
sam estar aptos e dispostos a ir onde os respondentes estão.
Embora muitos indivíduos amostrados concordem prontamente em
ser entrevistados, conseguir a cooperação de respondentes desinformados
ou inicialmente relutantes é, sem dúvida, uma das mais difíceis e mais im-
portantes tarefas que os entrevistadores devem desempenhar. Mais entre-
vistadores provavelmente falham nessa área do que em qualquer outra.
Não há dúvidas de que alguns entrevistadores são muito melhores
do que outros em conquistar a cooperação. Também está claro que estilos
pessoais diferentes farão diferença. Alguns entrevistadores eficazes são
muito profissionais, enquanto outros são mais casuais e encantadores. A
experiência sugere que há duas características que os entrevistadores que
são bons em conquistar cooperação parecem compartilhar. Primeiro, eles
têm um tipo de confiança assertiva. Eles apresentam o estudo como se não
houvesse dúvida de que o respondente irá querer cooperar. O tom e o con-
teúdo de sua conversa não deixam dúvida de que a entrevista acontecerá.
Segundo, eles têm o dom de engajar de imediato as pessoas pessoalmente,
de forma que a interação é focada e feita muito individualmente para o
respondente. Isso pode ser muito orientado pela tarefa, mas é sensível às
necessidade, às preocupações e à situação do indivíduo. Ler um roteiro
predeterminado não é uma forma eficaz de conquistar a cooperação.
Embora essas habilidades do entrevistador sejam importantes para
todos os levantamentos, elas são particularmente desafiadoras para le-
vantamentos por telefone para os quais os respondentes não recebem
nenhum aviso prévio (como é o caso quando a discagem aleatória de dí-
gitos é utilizada) ou quando o assunto não prende de imediato o interes-

se do respondente.
Treinando e motivando respondentes

O desempenho dos respondentes, bem como a precisão do relato,
tem sido ligada às orientações para a entrevista. Tem sido mostrado que
os entrevistadores têm um papel importante na definição dos objetivos
dos respondentes (Cannell e Fowler, 1964; Cannell, Oksenberg e Conver-
se, 1977; Fowler e Mangione, 1990). Por exemplo, entrevistadores que
apressam a entrevista encorajam os respondentes a responder às ques-
tões rapidamente. Os entrevistadores que leem as questões lentamente
indicam aos respondentes, de forma não verbal, sua disposição para to-
mar o tempo e obter respostas precisas, pensadas; consequentemente,
eles obtêm respostas mais exatas. Estudos também mostram que a forma
com que os entrevistadores fornecem estímulo para os respondentes afe-
ta o seu senso de o que eles devem fazer e quão bem eles relatam (Can-
nell et al., 1987; Cannell, Oksenberg e Converse, 1977; Fowler e Man-
gione, 1990; Marquis, Cannell e Laurent, 1972).
Não há dúvida de que a maioria dos respondentes tem alguma
ideia de o que devem fazer e como devem desempenhar o seu papel. Os
entrevistadores, tanto implícita quando explicitamente, ensinam aos res-
pondentes como se comportar; esta é uma parte normalmente negligen-
ciada, mas fundamental, do trabalho do entrevistador.
Sendo um entrevistador padrão

Pesquisadores de levantamento gostariam de afirmar que as diferen-
ças nas respostas podem ser atribuídas às diferenças em o que os respon-
dentes têm a dizer (por exemplo, suas opiniões e experiências) e não às
diferenças nos estímulos aos quais eles foram expostos (por exemplo, a
formulação da questão, o contexto no qual ela foi perguntada e a forma
como isso foi feito). A maioria do treinamento dos entrevistadores visa en-
sinar os aprendizes a ser entrevistadores padrão que não afetam as respos-
tas que obtêm. Há cinco aspectos do comportamento do entrevistador que
os pesquisadores tentam padronizar: a forma como eles apresentam o es-
tudo e a tarefa; a forma como as questões são perguntadas, a forma como
questões inadequadas (por exemplo, respostas que não atingem os objeti-
vos da questão) são exploradas, a forma como as respostas são registradas
e a forma como os aspectos interpessoais da entrevista são tratados. Cada

um deles é discutido a seguir em maiores detalhes.
1. Apresentando o estudo: Os respondentes devem ter um entendi-
mento comum dos propósitos do estudo, pois esse senso de pro-
pósito pode ter um impacto sobre a maneira com que eles respon-
dem às questões. Suposições sobre coisas tais como confidenciali-
dade, sobre a natureza voluntária de um projeto e sobre quem irá
usar os resultados também potencialmente podem ter algum efei-
to sobre as respostas. Um bom corpo de entrevistadores dará a
todos os respondentes uma orientação similar para o projeto para
que o contexto da entrevista seja tão constante quanto possível.
2. Fazendo as perguntas: As questões de levantamento devem ser
feitas exatamente da forma como foram escritas, sem variação
ou mudanças de formulação. Até mesmo pequenas mudanças
na forma como as questões foram formuladas mostraram, em
alguns casos, ter efeitos significativos sobre a forma como as
questões são respondidas.
3. Sondagem: Se um respondente não responde completamente à
questão, o entrevistador precisa fazer algum tipo de questão de
acompanhamento para obter uma resposta melhor; isso é chamado
de sondagem (probing). Os entrevistadores devem sondar respostas
incompletas de forma indireta – formas que não aumentam a pro-
babilidade de uma resposta sobre a outra. Para questões de respos-
ta fixa, repetir a questão e todas as alternativas de resposta é a son-
dagem mais comumente necessária. Para questões abertas, repetir
a questão, ou perguntar “Mais alguma coisa?”; “Fale-me mais.”; ou
“O que você quer dizer com?” vão manejar a maioria das situações
se o instrumento de levantamento for bem projetado.
4. Registrando as respostas: O registro das respostas deve ser padro-
nizado para que nenhuma variação induzida pelo entrevistador
ocorra nesse estágio. Quando uma questão aberta é perguntada,
os entrevistadores devem registrar as respostas textualmente; ou
seja, exatamente com as palavras que o respondente utilizou, sem
parafrasear, resumir ou deixar algo de fora. Em questões com res-
postas fixas, quando é dado aos respondentes uma escolha de res-
postas, os entrevistadores devem apenas registrar a resposta quan
do o respondente de fato escolhe uma. Há um potencial para in-
consistência se os entrevistadores codificam as palavras do res-
pondente em categorias que o respondente não escolheu.
5. Relações interpessoais: Os aspectos interpessoais de uma entre-

vista devem ser gerenciados de forma padronizada. Inevitavel-
mente um entrevistador traz algumas características demográfi-
cas obvias para a entrevista, tais como gênero, idade e educa-
ção. Para enfatizar os aspectos profissionais da interação e focar
na tarefa, contudo, o lado pessoal da relação pode ser minimi-
zado. Os entrevistadores normalmente são instruídos a não con-
tar histórias sobre eles mesmos ou expressar visões ou opiniões
relacionadas ao assunto da entrevista. Os entrevistadores não
devem comunicas nenhum julgamento sobre as respostas que o
respondente fornece. Em resumo, comportamentos que comuni-
cam as características pessoais idiossincráticas do entrevistador
serão evitados, pois vão variar entre os entrevistadores. Com-
portar-se como um profissional, não como um amigo, ajuda a
padronizar a relação entre entrevistadores e respondentes. Não
há evidências de que ter um estilo interpessoal amigável per se
aumente a exatidão do relato; isso provavelmente tende a ter
um efeito negativo sobe ela (Fowler e Mangione, 1990).
Uma complexidade especial é introduzida quando entrevistador e
respondente vêm de uma diferente origem na sociedade. Neste caso, a co-
municação pode não ser tão livre e fácil como quando as origens são simi-
lares. Há algumas evidências de que entrevistadores que tomam providên-
cias para facilitar a comunicação em tais situações (por exemplo, por in-
troduzir um pouco de humor) podem estar aptos a produzir uma entrevis-
tas mais eficaz (Fowler e Mangione, 1990). Os esforços para deixar o res-
pondente à vontade, contudo, não devem diminuir o valor de uma intera-
ção basicamente profissional, focada no bom desempenho da tarefa.
Significância do trabalho do entrevistador

Deve estar claro, pelo que foi dito anteriormente, que entrevistar é
um trabalho difícil. Além disso, falhar no desempenho do trabalho pode
produzir três tipos diferentes de erros nos dados do levantamento:
• As amostras perdem credibilidade e são potencialmente tenden-
ciosas se os entrevistadores não fazem um bom trabalho para
conquistar a cooperação dos respondentes.
• A precisão das estimativas do levantamento será reduzida, have-
rá mais erros em torno das estimativas, visto que os entrevista-
dores são inconsistentes de maneira que influencia os dados.
• As respostas podem ser sistematicamente imprecisas e tenden-

ciosas na medida em que os entrevistadores falham em treinar e
motivar apropriadamente os respondentes ou falham em estabe-
lecer uma configuração interpessoal apropriada para relatar o
que é requerido.
Dados todos esses potenciais para produzir erros, os pesquisado-

res devem estar motivados a usar bons entrevistadores. Há muitos ca-
minhos para afetar a qualidade do trabalho de um entrevistador: recru-
tamento e seleção, treinamento, supervisão, formulação de boas ques-
tões e uso de procedimentos eficazes. As próximas cinco seções discuti-
rão o potencial de cada um desses pontos para influenciar o desempe-
nho do entrevistador.
RECRUTAMENTO E SELEÇÃO DE ENTREVISTADORES
Algumas das características dos entrevistadores são ditadas pelas

necessidades do trabalho de levantamento do entrevistador que não tem
nada a ver com a qualidade dos dados per se:
1. Os entrevistadores precisam ter habilidades de leitura e escrita
razoavelmente boas. Alguns, se não a maioria, dos entrevistado-
res trabalham atualmente com computadores, portanto habilida-
de de digitação e familiaridade geral com computadores são nor-
malmente necessárias também. A maioria das organizações de
pesquisa exige ensino médio completo, e algumas exigem ou pre-
ferem entrevistadores que tenham ao menos alguma experiência
na faculdade.
2. Entrevistar é originalmente um trabalho de meio turno. É difícil
trabalhar 40 horas por semana toda a semana em levantamen-
tos de populações gerais; as organizações de pesquisa quase
sempre têm algum ir e vir de trabalho para entrevistadores.
Como resultado, eles normalmente são pessoas que podem tole-
rar rendimentos intermitentes ou que estão entre empregos
mais permanentes. O pagamento de um entrevistador normal-
mente não é alto para uma pessoa com nível universitário. Nor-
malmente não há benefícios, como plano de saúde, para um
emprego de entrevistador. Não é comum para um entrevistador
de levantamentos estar apto a contar com as entrevistas como
uma única fonte de rendimentos e sustento por um longo perío-

do de tempo.
3. Entrevistadores pessoais familiares precisam ter alguma flexibi-
lidade de horários; os levantamentos exigem que eles estejam
disponíveis quando os respondentes estão disponíveis. Uma van-
tagem das entrevistas por telefone é que os entrevistadores po-
dem trabalhar em turnos mais previsíveis, embora a noite e os
finais de semana sejam o horário nobre para quase todos os tra-
balhos de levantamento em populações gerais.
4. Entrevistadores pessoais familiares precisam ser móveis, o que
normalmente exclui pessoas com alguma deficiência física e
aquelas sem o uso de um carro. Nenhuma dessas restrições é sa-
liente para entrevistadores por telefone.
Além desses requisitos profissionais práticos, há pouca base científica

para escolher um determinado pesquisador do que outros. Por exemplo, en-
trevistadores experientes são prováveis de melhor conseguir cooperação
simplesmente porque aqueles para os quais isso é um problema não conti-
nuarão a trabalhar como entrevistadores; contudo, não há efeitos positivos
documentados da experiência sobre a qualidade dos dados. Há apenas evi-
dências de que os entrevistadores se tornam menos cuidadosos e coletam
dados mais pobres ao longo do tempo (Bradburn, Sudman e Associates,
1979; Cannell, Marquis e Laurent, 1977; Chromy, Eyerman, Odom, McNee-
ley e Hughes, 2005; Fowler e Mangione, 1990; Groves et al., 2004).
Da mesma forma, ter entrevistadores que tenham conhecimento
especializado sobre o assunto em questão é raramente algo a mais. Na
verdade, devido ao fato de os entrevistadores bem informados poderem
supor que sabem o que o respondente está dizendo quando este não foi
claro, eles podem interpretar mais do que o indivíduo está dizendo do
que pessoas não treinadas na área. A menos que as observações do en-
trevistador ou taxas que exijam um extenso conhecimento especializado
sejam necessárias, um entrevistador treinado sem conhecimentos espe-
cializados é a melhor escolha.
A idade, a educação e o gênero do entrevistador raramente têm
sido associados com a qualidade dos dados, embora haja alguma evidên-
cia de que mulheres possam, em média, ser mais bem avaliadas em
amostras cruzadas (Fowler e Mangione, 1990; Groves, 1989). Em geral,
um pesquisador seria aconselhado a enviar o melhor entrevistador dispo-
nível para entrevistar um respondente, sem levar em conta as caracterís-
ticas demográficas. A exceção é se o assunto do levantamento é direta-

mente relacionado à raça ou à religião (ou qualquer outra característica
demográfica) e as opiniões dos respondentes sobre as pessoas do mesmo
ou de grupos diferentes. Por exemplo, se as pessoas serão entrevistadas
sobre suas próprias opiniões antissemitas, o judaísmo do entrevistador
fará diferença nas respostas (Robinson e Rhode, 1946). Da mesma for-
ma, negros e brancos expressam opiniões diferentes sobre raça de acor-
do com a cor da pele do entrevistador (Schuman e Converse, 1971).
É importante notar, contudo, que correspondências étnicas não ne-
cessariamente melhoram o relato. Dois estudos dessa questão descobriram
que respondentes negros relatam os rendimentos do bem-estar (Weiss,
1968) e a votação (Anderson, Silver e Abramson, 1988) mais precisamen-
te para entrevistadores brancos do que para entrevistadores negros.
Não há dúvida de que o pesquisador deve considerar a interação
entre o assunto de um levantamento e as características demográficas
dos entrevistadores e respondentes. Se a etnicidade (ou alguma outra
característica) é extremamente saliente para as respostas a serem dadas,
controlar a relação entre as características dos entrevistadores e dos res-
pondentes deve ser considerado, de forma que os efeitos do entrevista-
dor sobre os dados possam ser mensurados (Groves, 1989). Para a maio-
ria dos levantamentos, contudo, as dificuldades práticas e os custos de
controlar o trabalho do entrevistador e a ausência de efeitos previsíveis
irão argumentar contra a tentativa de controlar as características demo-
gráficas de respondentes e entrevistadores.
Finalmente, equipes voluntárias de entrevista são quase sempre
malsucedidas em conduzir levantamentos de amostra de probabilidade.
Há várias razões para o fracasso de voluntários. Visto que é difícil exigir o
comparecimento a sessões de treinamento demoradas, os voluntários são,
em geral, pobremente treinados. Como é difícil terminar com os entrevis-
tadores voluntários mal treinados, as taxas de resposta são normalmente
baixas. Além disso, o desgaste dos voluntários é normalmente alto.
A discussão aqui apresentada oferece algumas diretrizes para os
pesquisadores na seleção de entrevistadores. Em algumas circunstâncias
bastante especializadas, a origem étnica, a idade e o gênero dos entrevis-
tadores pode afetar as respostas; por exemplo, adolescentes podem res-
ponder de maneira diferente se o entrevistador for uma mulher mais ve-
lha (Erlich e Riesman, 1961). Para a maioria dos levantamentos, contu-
do, as exigências particulares do trabalho vão ditar amplamente o corpo
de entrevistadores. Há pouca base para afastar pessoas por conta de sua
origem ou de suas características pessoais. Antes, a chave para construir

um bom grupo de entrevistadores é o bom treinamento e uma supervi-
são cuidadosa. Além disso, devido à dificuldade de identificar bons en-
trevistadores de antemão, o desgaste dos entrevistadores menos capazes
é provavelmente uma parte crítica e necessária da construção de uma
boa equipe de entrevistadores.
TREINANDO ENTREVISTADORES
Há uma grande diversidade nos tipos de experiências de treinamen-

to às quais os entrevistadores de levantamento estão expostos. A quantida-
de de tempo exata que será dedicada ao treinamento, o tipo de sessão de
treinamento e o conteúdo do programa obviamente dependerão da confi-
guração organizacional particular e do que os entrevistadores irão fazer.
Há alguns desacordos, além disso, sobre a extensão na qual os esforços
devem ser dedicados para uma sessão inicial de treinamento, antes do iní-
cio do campo de experiência, contra o aprendizado contínuo e a recicla-
gem depois de os entrevistadores terem começado. Todavia, todas as orga-
nizações profissionais de levantamento preocupadas com a qualidade dos
dados têm ao menos algum tipo de (normalmente presencial) treinamento
de todos os novos entrevistadores. O que segue é um resumo geral de o
que um treinamento razoável dos entrevistadores pode implicar.
Conteúdo do treinamento
O conteúdo do treinamento inclui tanto informações gerais sobre
entrevistas que se aplicam a todos os levantamentos quanto informações
específicas ao estudo particular no qual os entrevistadores vão trabalhar.
Os tópicos gerais a serem abrangidos incluirão o seguinte:
• procedimentos para contatar os respondentes e apresentar o estudo;
• as convenções que são usadas na formulação de um instrumento
de levantamento com relação à formulação e ao salto de instru-
ções, de forma que os entrevistadores possam perguntar as ques-
tões de forma consistente e padronizada;
• procedimentos para sondar respostas inadequadas de forma não
diretiva;
• procedimentos para registro de respostas para questões abertas e
fechadas;
• regras e diretrizes para lidar com os aspectos interpessoais da

entrevista de forma não tendenciosa;
• como usar os programas de entrevista assistida por computador.
Além disso, muitas organizações de pesquisa acreditam que é uma

boa ideia dar aos entrevistadores uma noção da forma como as entrevis-
tas se encaixam no processo total de pesquisa. Por essa razão, elas fre-
quentemente tentam dar aos entrevistadores alguma familiaridade com
procedimentos de amostragem, de codificação e com os tipos de análise
de relatos que resultam de levantamentos. Tais informações podem ser
úteis para os entrevistadores ao responder às perguntas dos responden-
tes e podem desempenhar um papel positivo ao motivar o entrevistador
e ajudá-lo a entender o trabalho.
Com relação a algum projeto específico, os entrevistadores tam-
bém precisam saber o seguinte:
• Propósitos exclusivos do projeto, incluindo o patrocínio, os obje-
tivos gerais da pesquisa e os usos previstos da pesquisa. Essas in-
formações são básicas para fornecer aos respondentes respostas
apropriadas a questões e ajudar a conquistar a cooperação.
• A abordagem específica que foi usada na amostragem, novamen-
te para fornecer uma base para responder às questões dos res-
pondentes. Além disso, pode haver algum treino necessário so-
bre como implementar um projeto básico de amostra.
• Detalhes com relação aos propósitos das questões específicas –
não necessariamente suas funções na análise, mas ao menos o
tipo de informação que elas são projetadas para obter.
• Os passos específicos que serão tomados com relação à confiden-
cialidade e os tipos de garantias que são apropriadas de se forne-
cer aos respondentes.
Procedimentos para treinamento

Há seis formas básicas para ensinar os entrevistadores: materiais es-
critos, palestras e apresentações, tutoriais baseados em computador, exercí-
cios planejados, práticas de encenação (role-play) e observações de entrevis-
tas anteriores. Os materiais escritos são normalmente de dois tipos. Primei-
ro, é uma ideia muito boa ter um manual geral de entrevistas que forneça
uma descrição escrita completa dos procedimentos de entrevista. Além dis-
so, para cada estudo particular, deveria normalmente haver algumas instru-
ções específicas de projeto por escrito. É tentador quando entrevistadores

estão sendo treinados pessoalmente e um projeto está sendo feito em um
site local para economizar na preparação de materiais escritos. Entrevista-
dores recém-treinados, contudo, dizem que há uma quantidade esmagadora
de material e informação para assimilar durante o treinamento. Ter os pro-
cedimentos por escrito permite aos entrevistadores revisar o material em um
ritmo mais tranquilo; isso também aumenta a probabilidade de que as men-
sagens sejam apresentadas de forma clara e precisa.
Palestras e demonstrações obviamente têm um papel a desempe-
nhar em qualquer treinamento de entrevistadores, tanto se apenas um
ou se um grande grupo de deles está sendo treinado. Além da apresenta-
ção geral dos procedimentos e habilidades necessários, muitos treinado-
res acreditam que demonstrar uma entrevista padronizada é uma forma
rápida e eficiente de fornecer aos entrevistadores uma noção de como
administrar uma entrevista. Gravações em vídeo comumente são usadas
para complementar palestras. Fazer gravações em vídeo de práticas de
entrevista ou de outras atividades do entrevistador é uma boa ferramen-
ta para o treinamento dos entrevistadores.
O uso difundido das entrevistas assistidas por computador significa
que o treinamento dos entrevistadores deve incluir ensinar a eles como
usar os instrumentos baseados em computador. Os sistemas de levanta-
mento mais comumente usados têm tutoriais baseados em computador
que podem ser integrados no treinamento geral dos entrevistadores.
Visto que essas são habilidades novas, a prática estruturada supervi-
sionada é uma das partes mais importantes do treinamento do entrevista-
dor. Ter os entrevistadores revezando-se e fazendo o papel de respondente
e de entrevistador é uma atividade comum. A prática deve incluir a con-
quista da cooperação e o desenvolvimento do processo de perguntas e res-
postas. Também é válido monitorar algumas práticas de entrevista com
respondentes que não estão encenando e os quais os entrevistadores não
conhecem. Para entrevistas pessoais, os supervisores podem acompanhar e
observar os novos entrevistadores realizando a prática de entrevista ou re-
ver entrevistas gravadas. Pelo telefone, as entrevistas podem ser direta-
mente monitoradas ou gravadas para revisão posterior.
Dois estudos (Billiet e Loosveldt, 1988; Fowler e Mangione, 1990)
concluíram que treinamentos de entrevistadores de menos de um dia pro-
duzem entrevistadores insatisfatórios; eles não são capazes de desempenhar
o seu trabalho de forma estruturada e os dados resultantes são afetados ne-
gativamente. Programas de treinamento que duram de dois a cinco dias são
a norma em organizações profissionais de pesquisa. A duração do treina-

mento depende de inúmeros fatores, incluindo o número de entrevistadores
a ser treinado e a complexidade do projeto para o qual eles estão sendo trei-
nados. A chave essencial para a qualidade do treinamento, contudo, é pro-
vavelmente a quantidade de práticas supervisionadas de entrevista.
SUPERVISÃO
As chaves para uma boa supervisão são ter a informação necessária

para avaliar o desempenho do entrevistador e o investimento de tempo e re-
cursos necessários para avaliar a informação e fornecer um feedback oportu-
no. Há quatro aspectos principais do desempenho do entrevistador a super-
visionar: custos, taxa de respostas, qualidade dos questionários completados
e qualidade da entrevista. É consideravelmente mais fácil supervisionar en-
trevistadores que estão fazendo as entrevistas por telefone de uma instala-
ção centralizada do que aqueles que estão entrevistando em domicílio.
Custos
Supervisionar os custos para entrevistadores requer informações opor-
tunas sobre o tempo gasto, a produtividade (normalmente as entrevistas
completadas) e taxas de milhagem para entrevistadores que usam carros. Os
altos custos de entrevistas por telefone são provavelmente daqueles que tra-
balham nos horários menos produtivos, que têm altas taxas de recusa (uma
recusa toma quase tanto tempo quanto uma entrevista) ou que simplesmente
encontram maneiras (por exemplo, editando entrevistas, apontando lápis) de
fazer menos ligações por hora. Os pesquisadores domiciliares com custos al-
tos provavelmente moram longe dos seus endereços da amostra, fazem via-
gens muito curtas ou nos horários errados (noites e finais de semana são cla-
ramente os mais produtivos) ou têm baixas taxas de resposta.
Taxas de resposta
É importante monitorar as taxas de resposta (particularmente as
taxas de recusa) por entrevistador em uma base oportuna; contudo, isso
não é algo fácil de fazer. Há três problemas principais:
1. Para entrevistas pessoais, mas não para levantamentos por telefone a
partir de uma instalação central computadorizada, pode ser difícil
manter informações oportunas sobre os resultados do entrevistador.
2. Os entrevistadores podem subestimar suas recusas por atribuir

seus resultados malsucedidos a outras categorias.
3. As designações para entrevistas em pessoa podem não ser compa-
ráveis, de forma que as diferenças nas taxas de recusas por entre-
vistador podem não ser indicadores consistentes do desempenho
do entrevistador. Essa questão se aplica muito menos ao trabalho
de entrevista por telefone em uma instalação centralizada.
As taxas de resposta não podem ser calculadas até que o estudo

esteja acabado, mas esforços especiais para identificar recusas por entre-
vistador durante a coleta de dados podem alertar os supervisores para
problemas e são uma parte muito importante da supervisão da entrevis-
ta. É difícil ajudar um entrevistador que tem problemas com as taxas de
resposta. Em estudos por telefone, um supervisor pode ouvir as apresen-
tações e fornecer um feedback imediatamente após a entrevista (ou não
entrevista) sobre como o entrevistador pode ser mais eficaz. Para entre-
vistas domiciliares, a tarefa é mais difícil porque o supervisor não pode
observar a abordagem do entrevistador a menos que o acompanhe. Des-
ta maneira, o supervisor muitas vezes fica contente em ouvir o entrevis-
tador dando uma amostra de apresentação.
Os supervisores podem dar dicas úteis aos entrevistadores. É impor-
tante ter certeza de que os entrevistadores estão completamente informados
sobre um levantamento. Fazer com que eles pratiquem respostas claras e
concisas para questões comuns pode ser útil. Além de trabalhar nos detalhes
das apresentações, os supervisores podem necessitar direcionar as opiniões
gerais dos entrevistadores sobre a abordagem das pessoas ou sobre o proje-
to de pesquisa e seu valor. Há limites, porém, para quanto a reciclagem aju-
dará; há pessoas que nunca conseguem atingir boas taxas de resposta. Em-
bora isso seja estressante, uma das maneiras mais eficazes de manter altas
as taxas de resposta é retirar os entrevistadores ineficazes do estudo.
Revisão de instrumentos de pesquisa completados

Quando os entrevistadores estão utilizando instrumentos em papel
e caneta, uma amostra dos instrumentos de levantamento completados
deve ser revisada para avaliar a qualidade dos dados que os entrevistado-
res estão coletando. Quando revisando uma entrevista completa, pode-se
obviamente observar se o registro é legível, se as instruções passadas fo-
ram seguidas apropriadamente e se as respostas obtidas são completas o
suficiente para permitir a codificação. Além disso, observar uma entrevista

completada pode dar uma ideia muito boa da extensão na qual um entre-
vistador está registrando as respostas do respondente textualmente, em
relação aos registros resumidos ou parafraseados. Para entrevistas assisti-
das por computador, tais questões – exceto para o registro e para a sonda-
gem associada a respostas narrativas – não são relevantes.
O processo de pergunta e resposta

A qualidade da entrevista não pode ser supervisionada pela revisão
de instrumentos de levantamento completados; eles não falam absoluta-
mente nada ao supervisor sobre a forma com que o entrevistador conduziu
a entrevista e como aquelas respostas foram obtidas. A fim de ficar sabendo
disso, o supervisor precisa observar diretamente o processo de entrevista.
Um levantamento por telefone a partir de uma instalação central per-
mite supervisão direta de como o entrevistador coleta os dados. Um supervi-
sor pode e deve estar disponível para monitorar os entrevistadores a todo
momento. Alguns sistemas centralizados incluem a capacidade de gravar
toda ou uma amostra das entrevistas. Os supervisores devem ouvir sistema-
ticamente toda ou partes de uma amostra das entrevistas que cada entrevis-
tador tomou, avaliando (entre outras coisas) a apresentação apropriada do
estudo, o uso das questões exatamente como foram escritas, a sondagem
apropriada e indireta e o tratamento adequado dos aspectos interpessoais
da entrevista. Esse processo funciona melhor se um formulário de avaliação
abrangendo esses e outros aspectos do trabalho do entrevistador é preenchi-
do rotineiramente por um monitor (Cannell e Oksenberg, 1988).
Quando os entrevistadores estão fazendo os estudos na casa dos
respondentes ou em outros lugares distantes, é mais difícil de supervisio-
nar o processo de pergunta e resposta. Há apenas duas formas de fazer
isso: Um supervisor pode acompanhar um entrevistador como um obser-
vador, ou as entrevistas podem ser gravadas. Sem as gravações ou um
programa de observação, o pesquisador não tem como avaliar a qualida-
de da entrevista. Todos os aspectos mais importantes de um processo de
medição não são monitorados. Entrevistadores ruins não podem ser
identificados para reciclagem, e o pesquisador não pode apresentar a
qualidade das entrevistas além de dizer que foi dito aos entrevistadores
o que fazer. Realmente, do ponto de vista do entrevistador, deve ser difí-
cil acreditar que a entrevista padronizada é importante quando é o foco
do treinamento mas não é mais tratada posteriormente.
Fowler e Mangione (1990) apresentam evidências de que entrevistado-

res pessoais são menos prováveis de entrevistar da forma como foram treina-
dos se seu trabalho não é monitorado diretamente por gravações. Tanto Fow-
ler e Mangione quanto Billiet e Loosveldt (1988) descobriram que a qualidade
dos dados melhorou quando os entrevistadores foram monitorados direta-
mente dessa maneira. Está claro agora que a supervisão direta do processo de
entrevista deve ser parte de um levantamento bem administrado. O fato de
que computadores portáteis podem ser configurados para gravar entrevistas
em áudio torna viável a revisão do comportamento do entrevistador.
QUESTÕES DE LEVANTAMENTO
Embora o treinamento e a supervisão sejam importantes para produ-

zir boas entrevistas, talvez o passo mais importante que um pesquisador
pode dar para produzir boas entrevistas seja a formulação de um bom ins-
trumento de levantamento. Pesquisas têm mostrado que certas questões são
regularmente mal interpretadas, enquanto outras regularmente são inade-
quadamente respondidas, exigindo que os entrevistadores façam uma son-
dagem para obter respostas adequadas (Fowler, 1991; Fowler e Cannell,
1996; Fowler e Mangione, 1990; Oksenberg et al., 1991). Essas questões
podem ser identificadas com o tipo de pré-teste descrito no Capítulo 7.
Quando mais os entrevistadores precisam sondar, explicar ou es-
clarecer, mais prováveis eles são de influenciar as respostas. Quando me-
lhor for o instrumento de levantamento, mais provavelmente o entrevis-
tador conduzirá uma entrevista boa e padronizada. O papel da boa for-
mulação de questões na produção de boas entrevistas é discutido em de-
talhes em Fowler e Mangione (1990) e Fowler (1991).
PROCEDIMENTOS DE ENTREVISTA
Treinando e motivando os respondentes
Estudos têm demonstrado o valor de se ir além da boa formulação
de questões para ajudar a padronizar a entrevista (Cannell et al., 1987;
Cannell, Oksenberg e Converse, 1977; Miller e Cannell, 1977). Por
exemplo, o pesquisador pode ajudar o entrevistador a treinar o respon-
dente de forma consistente. Antes de começar a entrevista, o entrevista-
dor deve ler algo como o seguinte:
Antes de começarmos, deixe-me falar um pouco sobre o processo de en-

trevista, uma vez que a maioria das pessoas nunca esteve em um levanta-
mento como este antes. Dois tipos de questão serão perguntados a você
neste levantamento. Em alguns casos, pedirei a você para que responda
às questões com suas próprias palavras. Nesses casos, terei que escrever
cada palavra que você disser, sem resumir nada. Para outras questões,
será dado a você um conjunto de respostas, e será solicitado que você es-
colha aquelas que mais se aproxima da sua própria opinião. Mesmo que
nenhuma das respostas se encaixe exatamente na sua opinião, escolher a
que mais se aproxima dela nos permitirá comparas as suas respostas mais
facilmente com as das outras pessoas.
Curiosamente, os entrevistadores gostam muito dessa instrução. Isso

explica a tarefa dos respondentes a eles, e faz com que o processo de per-
guntas e respostas ocorra sem problemas. Na verdade, bons entrevistado-
res dão instruções como essas por conta própria. O valor de fornecer ins-
truções explícitas é que isso reduz as diferenças entre os entrevistadores
por fazer com que todos eles façam a mesma coisa. Além disso, tais instru-
ções têm um efeito salutar sobre o desempenho do entrevistador. Uma vez
que ele leu as instruções explicando as expectativas do trabalho, é mais fá-
cil fazer o trabalho da maneira como ele deve ser feito, e é um pouco mais
difícil fazê-lo de forma errada, porque o respondente agora também sabe
o que o entrevistador deve fazer (Fowler e Mangione, 1990).
As instruções padronizadas para os respondentes também poder
ser usadas para estabelecer metas e padrões de desempenho:
É muito importante que você responda o mais precisamente possí-
vel. Não tenha pressa. Consulte registros se quiser. Peça-me esclareci-
mentos se você tem alguma dúvida sobre o que é esperado.
Tais declarações garantem que os respondentes tenham um enten-
dimento comum de suas prioridades. Alguns entrevistadores não inten-
cionalmente prometem aos respondentes que irão facilitar para os res-
pondentes se os últimos apenas derem a entrevista; entrevistadores que
apressam comunicam que a velocidade é mais importante do que a pre-
cisão. Quando uma instrução tal como a anterior é lida, isso força a pre-
cisão e a qualidade dos dados a ser uma parte central do papel das ex-
pectativas tanto para o respondente quanto para o entrevistador. Mais
uma fonte de variabilidade entre entrevistador é reduzida, e a probabili-
dade de um bom desempenho para ambos é aumentada.
Concluindo, há partes importantes do trabalho do entrevistador
além do processo de pergunta e resposta. Em particular, o entrevistador é
responsável por comunicar ao respondente como a entrevista procederá: o

que o respondente deve fazer, o que o entrevistador irá fazer e quais são
os seus objetivos comuns. Esse aspecto do trabalho do entrevistador tem
principalmente sido deixado por conta dele e, não surpreendentemente,
os entrevistadores diferem em como eles fazem isso de forma que afeta os
dados. Por desenvolver programas de instruções padronizadas para res-
pondentes, os pesquisadores podem facilitar o trabalho dos entrevistado-
res, reduzir uma fonte importante de variância entre entrevistador e me-
lhorar a extensão em que os entrevistadores e respondentes se comportam
de forma que farão o processo de medição correr melhor.
Formulação padronizada
Foi dito anteriormente que perguntar as questões exatamente
como foram formuladas é um fundamento das medições padronizadas,
mas nem todos concordam (Tanur, 1991). Críticos das entrevistas padro-
nizadas observaram que algumas questões não são regularmente com-
preendidas por todos os respondentes. Quando este é o caso, eles argu-
mentam que produziria melhores dados se o entrevistador fosse livre
para esclarecer ou explicar o significado da questão (por exemplo, Con-
rad e Schober, 2000; Schober e Conrad, 1997). De forma similar, os críti-
cos notam que algumas tarefas de coleta de dados – por exemplo, quan-
do a mesma informação está sendo colhida sobre várias pessoas ou even-
tos diferentes – produzem interações muito artificiais ou embaraçosas
quando os entrevistadores tentam usar apenas as formulações escritas.
Nestes casos, argumenta-se que dar aos entrevistadores mais flexibilida-
de com as formulações resultaria em uma interação entrevistador-res-
pondente mais confortável (Schaeffer, 1992).
Muitas das críticas à entrevista padronizada são principalmente
para o resultado das questões pobremente formuladas (ver Houtkoop-
Steenstra, 200; Suchman e Jordan, 1990). Quando as questões não são
claras ou fornecem roteiros embaraçosos para os entrevistadores, a solu-
ção normalmente é escrever questões melhores, não deixar que os entre-
vistadores as reformulem (Beatty, 1995). Há uma base real de preocupa-
ção de que quando é dado aos entrevistadores a flexibilidade para refor-
mular ou explicar as questões, eles farão isso de forma que mude o signi-
ficado das questões e piore, em vez de melhorar, os dados resultantes
(Fowler e Mangione, 1990). Contudo, há determinadas questões – tais
como séries repetitivas ou quando poucos respondentes precisam de de-
finições detalhadas que seriam incômodas de fornecer a todos os respon-

dentes – que seriam mais bem tratadas por se dar aos entrevistadores
mais flexibilidade. Além do mais, quando os entrevistadores fazem mu-
danças na formulação das questões isso não tem consistentemente mos-
trado aumento nos erros relacionados ao entrevistador e nos erros de
resposta (Dykema, Lepkowski e Blixt, 1997; Fowler e Mangione, 1990).
Tem havido experimentos que dão aos entrevistadores mais poder
sobre como perguntar e sondar questões (Conrad e Schober, 2000; Scho-
ber e Conrad, 1997). Até agora os resultados têm sido mistos: a precisão
de alguns relatos pode ser melhorada, mas o treinamento de entrevista-
dores, consideravelmente aumentado, e às vezes entrevistas mais longas
estão envolvidos. Como e quando dar aos entrevistadores mais flexibili-
dade é um tópico que exige mais experimentação. Enquanto isso, para a
maioria dos levantamentos, formular questões que os entrevistadores
possam e façam exatamente como foram escritas continua sendo a prin-
cipal forma de conduzir um bom levantamento.
VALIDAÇÃO DE ENTREVISTAS
A possibilidade de que um entrevistador inventar uma entrevista é

uma grande preocupação. A possibilidade de isso acontecer varia com a
amostra, com a equipe de entrevistadores e com o campo de procedimen-
tos. Para a maior parte, a preocupação sobre a validação é restrita aos le-
vantamentos nos quais os entrevistadores estão conduzindo entrevistas na
casa dos respondentes ou estão fazendo entrevistas por telefone a partir
de suas próprias casas. Nesses casos, a coleta de dados não é observada
por supervisores. O número de horas dedicadas para a realização de uma
entrevista normalmente é suficiente para motivar um entrevistador a in-
ventar uma entrevista em vez de gastar tempo e o esforço para realizá-la.
No final das contas, provavelmente a melhor proteção contra en-
trevistas falsas seja ter um grupo de entrevistadores que tenham algum
comprometimento com a qualidade da pesquisa e da organização. Tais
problemas parecem ocorrer mais comumente com entrevistadores recém-
-contratados. Mesmo organizações com uma equipe profissional expe-
riente, contudo, rotineiramente verificam uma amostra de entrevistas
para ter certeza de que elas foram realmente realizadas.
Há duas abordagens para esse tipo de validação. Uma dela é enviar
por correio para todos os respondentes um breve questionário de acompa-
nhamento perguntando sobre as reações à entrevista. Provavelmente um

procedimento mais comum é orientar os entrevistadores a obter um nú-
mero de telefone de cada respondente; uma amostra desses números rece-
be a ligação de um supervisor. Simplesmente saber de antemão que uma
validação por correio ou por telefone será feita provavelmente já impede a
fraude do entrevistador. Além disso, estar apto a dizer que tal verificação
foi feita pode ser tranquilizador para os usuários dos dados.
O PAPEL DA ENTREVISTA NOS ERROS DE LEVANTAMENTO
Como observado no início deste capítulo, os entrevistadores afe-

tam as taxas de resposta, a precisão dos relatos e a consistência ou exati-
dão das medições. Cada uma delas tem um papel central na qualidade
das estimativas de um levantamento.
Um dos efeitos mais observáveis do bom gerenciamento de levan-
tamentos é a taxa de resposta. Embora essa questão seja discutida mais a
fundo no Capítulo 4, é válido repetir que a qualidade de uma equipe de
entrevistadores é fundamental para a taxa de resposta que será obtida
em qualquer levantamento particular.
É mais difícil medir o erro introduzido pelos entrevistadores no pro-
cesso de pergunta e resposta. Muitas vezes o erro de levantamento é inde-
tectável. Quando se pergunta questões sobre estados subjetivos, verifica-
ções objetivas para vieses ou imprecisões são em geral nada significativas,
como foi discutido no Capítulo 6. Houve estudos, contudo, nos quais os
pesquisadores tiveram medições objetivas de fatos que os respondentes fo-
ram solicitados a relatar, permitindo uma avaliação da exatidão do relato.
Em um dos tais estudos (Cannell, Marquis e Laurent, 1977), amostras de
famílias nas quais alguém havia sido hospitalizado no ano anterior foram
entrevistadas. A precisão dos relatos pode ser avaliada comparando-se os
relatórios de entrevista de saúde que ficam armazenados nos registros do
hospital. Uma medida da exatidão dos relatos era simplesmente a porcen-
tagem de hospitalizações conhecidas que foram relatadas.
Nesse estudo, foi descoberto que o número de entrevistas atribuí-
das a um entrevistador era altamente correlacionado (r = 0,72) com a
porcentagem de hospitalizações que não foram relatadas na entrevista.
Os entrevistadores que tinham grandes atribuições, com as pressões que
isso exercia sobre eles, coletaram dados muito menos precisos do que
aqueles com poucas atribuições.
Um estudo diferente utilizando o mesmo critério (a porcentagem de

hospitalizações relatadas; Cannell e Fowler, 1964) chegou a uma conclusão
similar. Nesse caso, metade dos respondentes de um entrevistador relatou
hospitalizações em uma entrevista, enquanto a outra metade completou o
formulário autoadministrado com relação às hospitalizações depois de o en-
trevistador ter completado o resto das entrevistas de saúde. Foi descoberto
que os entrevistadores cujos respondentes relataram com grande precisão
quando solicitados a relatar internações na entrevista também tiveram res-
pondentes que relataram muito bem no formulário autoadministrado depois
que o entrevistador havia saído (r = 0,65). Esse estudo sugeriu não apenas
que os entrevistadores tinham um papel importante a desempenhar em afe-
tar o erro do relato de seus respondentes, mas também que uma forma pela
qual os entrevistadores afetaram o desempenho dos respondentes foi o grau
em que eles motivaram os respondentes a um bom desempenho. Em ambos
os casos, o efeito do entrevistador sobre a precisão do relato estava claro.
Na ausência da validação de dados, não se pode avaliar a precisão. É
possível, contudo, avaliar a extensão na qual os entrevistadores influenciam
as respostas de seus respondentes. Se uma equipe de entrevista operou de
forma perfeitamente padronizada, seria impossível de se explicar a variação
nas respostas por saber quem foi o entrevistador. Na medida em que as res-
postas são previsíveis em parte por se saber quem fez a entrevista, pode-se
concluir que o entrevistador está influenciando de maneira imprópria as res-
postas. Groves (1989) discute a fundo as técnicas para calcular a extensão
na qual os entrevistadores estavam afetando as respostas a questões e resu-
me os resultados de diversos estudos nos quais os efeitos do entrevistador
foram calculados. Revela-se que para muitas questões que os entrevistado-
res perguntam, não se pode ver nenhum efeito do entrevistador sobre as
respostas. Entre um terço e metade das questões na maioria dos levanta-
mentos, contudo, os entrevistadores afetam significativamente as respostas.
O resultado de tais efeitos do entrevistador é aumentar o padrão de
erros em torno das estimativas do levantamento. O tamanho do multiplica-
dor depende do tamanho da correlação intraclasse (rho) e do tamanho mé-
dio das atribuições dos entrevistadores (ver Groves, 1989; Kish, 1962). Se a
correlação intraclasse é 0,01 (a qual Groves descobriu estar próxima da mé-
dia) e o número médio de entrevistas por entrevistador é próximo de 31, o
erro padrão das médias será aumentado em 14% sobre aqueles estimados a
partir apenas do projeto da amostra. Quando as atribuições do entrevistador
têm uma média próxima de 50, para itens com uma correlação de intraclas-
se de 0,02, a estimativa dos erros padrão será aumentada em 41%.
Fora essa discussão, há vários pontos a serem considerados sobre o pa-

pel do entrevistador na estrutura de erros totais de dados de levantamento:
1. Além do seu papel nas taxas de resposta, os entrevistadores po-
dem ser associados ao grau em que os respondentes fornecem
respostas imprecisas em levantamentos e com a inconsistência
das medidas. Evidências existentes claramente indicam que os
entrevistadores são uma fonte significante de erros para vários
tipos de medições.
2. O treinamento e a supervisão que os entrevistadores recebem pode
significantemente aumentar a consistência dos entrevistadores, au-
mentando a confiabilidade das estimativas e reduzindo os vieses.
Em particular, os entrevistadores que receberam um treinamento
mínimo (por exemplo, menos de um dia) e entrevistadores que re-
ceberam um mínimo ou nenhum feedback sobre a qualidade de
suas entrevistas são entrevistadores menos produtivos.
3. Procedimentos que estruturam o treinamento e a instrução de
respondentes, que minimizam o feedback inapropriado do entre-
vistador e, em geral, controlam mais o comportamento deste
podem reduzir os efeitos do entrevistador sobre os dados e au-
mentar a precisão total.
4. Uma melhor formulação de questões é a chave para uma entre-
vista melhor.
5. Uma opção de projeto que tem sido menos valorizada é o tamanho
da média de atribuições do entrevistador. Embora o treinamento e
o gerenciamento de custos possa ser menor se poucos entrevistado-
res são usados, os pesquisadores devem pagar o preço da confiabi-
lidade dos dados por permitir que os entrevistadores individuais
assumam um grande número de entrevistas. Reduzir a média de
atribuições dos entrevistadores normalmente é uma forma rentável
de melhorar a precisão das estimativas do levantamento.
6. Praticamente todos os relatos da confiabilidade das estimativas
de levantamento ignoram os efeitos dos entrevistadores sobre os
dados. Em parte, isso acontece porque os pesquisadores não po-
dem separar os efeitos do entrevistador dos efeitos da amostra-
gem quando aos entrevistadores são atribuídas amostras em
uma base não aleatória, tais como comodidade ou proximidade
geográfica. Os efeitos dos entrevistadores são uma fonte signifi-
cativa de erros, contudo, para muitos itens na maioria dos le-
vantamentos. Qualquer relato da precisão de uma estimativa de
levantamento que ignore os efeitos do entrevistador é provável

de ser uma subestimação dos erros de levantamento.
Para concluir, o papel do entrevistador em contribuir para erros em

levantamentos de dados não tem sido valorizado em geral. Embora a
maioria dos pesquisadores de levantamento saiba que algum treinamento
é necessário para os entrevistadores, os procedimentos para treinamento e
supervisão variam muito e frequentemente não são adequados. Não é co-
mum para os pesquisadores fazer qualquer esforço além de treinar e su-
pervisionar para minimizar os efeitos do entrevistador. Todavia, esses as-
pectos do projeto de levantamento constituem algumas das formas mais
rentáveis de aumentar a qualidade dos dados de levantamento. O impacto
do entrevistador sobre as estimativas do levantamento merece um lugar
de destaque que ainda não conquistou no projeto e no relato de estudos.
EXERCÍCIOS
1. Grave em áudio alguma encenação de entrevistas nas quais você

e/ou outros usam um programa de entrevista padronizado (as
questões desenvolvidas no Capítulo 6 ou um programa de outra
fonte). Então ouça as gravações e avalie sistematicamente o de-
sempenho do entrevistador observando em cada questão pelo
menos os seguintes erros: sondou uma resposta inadequada de
forma tendenciosa (diretiva); falhou ao sondar uma resposta
que não estava clara; ou qualquer outro viés possível ou com-
portamento interpessoal não padronizado. As avaliações são
particularmente instrutivas se feitas por um grupo, de forma
que os erros do entrevistador possam ser discutidos.
2. Realize um exercício similar desempenhando o papel de um en-
trevistador tentando conquistar a cooperação de um responden-
te em potencial para uma entrevista.
Fowler, F. J., & Mangione, T. W. (1990). Standardized survey interviewing: Mini-

mizing interviewer-related error. Newbury Park, CA: Sage.
Preparando os dados do
levantamento para análise 9
As respostas de levantamentos geralmente são transformadas em arquivos

de dados para a análise no computador. Este capítulo descreve opções e boas
formas de uso para formatação de dados, desenvolvimento de código, proce-
dimentos de codificação e gerenciamento, entrada de dados e procedimentos
de checagem.
Assim que o dado for coletado pelo levantamento, não importando

os métodos usados, eles quase que invariavelmente devem ser traduzi-
dos em uma forma apropriada para uma analise feita no computador.
Tratamos nesse capítulo sobre os processos que podem ser usados quan-
do os dados são extraídos de questionários completos e de entrevistas de
levantamento e colocados em uma forma que pode ser lida e processada
por um computador. O processo de codificação e redução de dados en-
volve cinco fases separadas:
• decidir o formato (a maneira como os dados serão organizados
no arquivo);
• decidir o código (as regras pelas quais as respostas dos entrevis-
tados serão determinadas como válidas para serem processadas
pela máquina);
• codificar (o processo de colocar as respostas em categorias padrão)
• entrada de dados (colocar os dados em uma forma legível para o
computador);
• limpeza de dados (fazer uma checagem final do arquivo de da-
dos para exatidão, integralidade e consistência prévia para o iní-
cio da análise).
Existem dois tipos de erros que podem ocorrer durante o processo

de resposta até o de entrada em um arquivo de dados. Primeiro, pode
haver transcrições ou erros de entrada toda vez que alguém grava uma
resposta ou um número. Segundo, pode haver decisões de codificação
erradas, aplicações errôneas das regras para a equivalência entre as res-
postas e a significação do código. As opções para o controle de qualidade
são ligadas à coleta particular de dados, à entrada de dados e aos proce-
dimentos de codificação escolhidos. Essas opções e procedimentos alter-
nativos de avaliação são discutidos a seguir.
FORMATANDO UM ARQUIVO DE DADOS
O termo gravar usado aqui se refere a todos os dados relacionados

a um único caso individual ou a uma entrevista. Uma gravação pode
consistir uma ou mais linhas de dados. Embora convenções e regras va-
riem com as instalações e os programas a ser usados, o que segue são al-
gumas questões comuns:
1. Um identificador serial para cada entrevistado usualmente en-
contra-se na mesma localização em que cada linha de dados é
feita para um questionamento particular ou uma entrevista, nor-
malmente no início de uma gravação. Isso também ajuda na
checagem pela integralidade do arquivo de dados para que te-
nham uma linha de número na mesma localização de cada linha
de dados se houverem múltiplas linhas. Essas marcações preser-
vam a ordem dos dados se eles forem misturados e são impor-
tantes para a checagem da integralidade dos arquivos.
2. A codificação, os dados de entrada e as programações de tarefas
são facilitados se os dados forem codificados na ordem em que
aparecem no instrumento de levantamento. Isso reduzirá os er-
ros nesses níveis e representará um meio relativamente livre de
custos de controle de qualidade.
3. Múltiplos códigos em um único campo ou coluna são aceitáveis em
alguns programas de computador, mas não em outros. Seria prova-
velmente melhor se houvesse uma única entrada positiva em cada
campo que contenha dados. Semelhantemente, alguns programas
de computador interpretam espaços em branco como zeros, en-
quanto outros não interpretam dessa forma. Se for intencional o
uso do zero, a melhor ideia seria codificar o zero em vez de deixar
o campo em branco; se a intenção for a de ter um código para cada

item sem resposta, quando nenhuma resposta que possa ser codifi-
cada for fornecida, algum valor específico deve ser usado.
CONSTRUINDO UM CÓDIGO
Um código é um conjunto de regras que traduzem as respostas ob-

tidas em números e vice-versa (alguns sistemas aceitam valores alfabéti-
cos, mas a maiorias dos códigos em levantamentos usa apenas códigos
numéricos). Quais números correspondem a quais respostas são irrele-
vantes para o computador. É crucial confiar no código usado e nas apro-
priadas interpretações de dados, porém, o código tem que ser claro.
Deve haver uma regra clara para qual número deve ser designado para
cada uma das respostas (ou para outros resultados). Complementando,
códigos podem ser designados para minimizar erros durante a codifica-
ção e a análise. O que segue são alguns princípios gerais:
1. Tenha certeza de não colocar codificações de dados para ques-
tões que não foram respondidas. Os códigos devem ser usados
para diferenciar entre as seguintes alternativas:
a) Em informações incorretas, onde a informação codificada não
foi obtida como resultado do entrevistador imperfeito ou
como consequência do desempenho do entrevistado.
b) Em informações inaplicáveis, onde a informação não pode ser
aplicada a um entrevistado particular devido a uma resposta
anterior (por exemplo, o campo de dados para duração de
hospitalização seria codificado como “não se aplica” para os
não hospitalizados).
c) Em respostas como “não sei”, que podem ser tratadas como
incorretas ou como uma categoria distinta de falta de dados.
d) Aos que se recusaram a responder, pode haver um código
próprio, como no caso de alguns pesquisadores que prefe-
rem separar o código para diferenciar os entrevistados que
se recusaram a responder a questão daqueles que não res-
ponderem devido há outras razões. Existem outros que sim-
plesmente tratam a recusa a uma resposta como um resulta-
do incorreto.
2. Seja consistente ao designar números; sempre use o mesmo có-
digo para as respostas “incorreto”, “inaplicável”, “não sei” e “ou-
tras” respostas. Quanto mais consistente for o código, menores

serão os erros dos codificadores e dos programadores.
3. Faça com que os códigos se ajustem aos números no mundo real
quando possível. Códigos numerais exatos (por exemplo, codifi-
car o atributo 45-anos como 45). Além disso, numere a lista de
entrevistados na ordem em que eles aparecem no instrumento se
não houver nenhuma forte razão para que seja feito o contrário.

Quando as alternativas de respostas são fornecidas aos responden-
tes ou o formulário de resposta é altamente estruturado, o trabalho do
construtor de código consiste simplesmente em designar números aos
grupos de respostas e considerar os dados perdidos. Constantemente as
alternativas de resposta são pré-numeradas no instrumento de levanta-
mento. Quando é pedido aos entrevistados que respondam questões em
suas próprias palavras, contudo, o alcance das respostas não será total-
mente previsível antes do tempo. Para questões de respostas abertas, o
desenvolvimento do código é um processo interativo pelo qual o pesqui-
sador identifica as categorias que emergem das respostas, bem como im-
põe ordem nas respostas que são obtidas.
A ideia é criar categorias em que grupos de respostas que são ana-
liticamente similares e diferenciar entre respostas que são diferentes. Se
a caracterização for muito fina, o resultado será de muitas categorias
com apenas algumas entradas, as quais são difíceis de analisar e uma
perda do esforço de codificação. Por outro lado, grandes categorias po-
dem mascarar importantes diferenças.
Um critério importante para se ter um bom código é o de que seja ne-
cessária uma designação não ambígua para cada resposta para um e apenas
número de código. Outro critério é o de colocar as respostas em uma cate-
goria analiticamente significativa. O quão bem se conhece o último padrão
pode ser acesso apenas no contexto de um plano para a análise.
Com o objetivo de construir esse código:
• Tenha uma ideia clara sobre quais características de resposta são
analiticamente significativas. Um bom primeiro passo é o de es-
crever brevemente os tipos de diferenças entre as respostas de
cada questão que forem importantes do ponto de vista do pes-
quisador.
• Tabule realmente algumas das respostas a partir de respostas an-
teriores. Então construa um rascunho do código para a classifica-
ção destas respostas.
• Tente o esquema de classificação em outros 10 ou 20 retornos;

revise quando necessário.
• Tenha um código separado para as “outras” respostas que não se
enquadram claramente nas categorias, e os codificadores fazen-
do anotações quando gravarem essas respostas. As notas podem
ser usadas para expandir e esclarecer o código ou para adicionar
categorias necessárias, bem como para fornecer uma gravação
de respostas incluída na categoria “outras”.
• O mesmo tipo de nota deve ser usada para permitir que os codi-
ficadores comuniquem problemas ou ambiguidades nas regras
de codificação ao pesquisador, que por sua vez deve refinar as
definições e as políticas.
ABORDAGENS PARA CODIFICAÇÃO E ENTRADA DE DADOS
Alguns levantamentos são feitos usando papel e lápis. As questões

são respondidas pelos respondentes por checagem de campos ou escritas
em respostas narrativas; os entrevistadores gravam as respostas que os
respondentes fornecem de forma paralela. A codificação e a entrada de
dados são os passos pelos quais essas respostas se tornam arquivos de
dados numéricos eletrônicos.
Gravação do entrevistador. Não há um modo prático de checar se os
entrevistadores gravaram cada uma das respostas de um modo apurado ou
não (por exemplo, conferido o campo correto ou clicando na resposta corre-
ta). É uma boa prática, entretanto, minimizar o grau em que cada entre
vistador tem de tomar uma decisão de codificação. Se as alternativas de res-
posta não foram informadas, as respostas abertas são melhores gravadas
textualmente para serem codificadas por codificadores treinados supervisio-
nados, ao invés de fazer os entrevistadores classificarem as respostas narra-
das em categorias durante a entrevista (ver Houtkoop-Steenstra, 2000).
Codificação. O controle de qualidade da codificação inclui os se-
guintes quesitos:
• Codificadores em cadeia, incluindo ter todos os codificadores de
inúmeros códigos do mesmo levantamento em retorno e então
comparar os resultados para ter a certeza de que todos estão co-
dificando da mesma maneira.
• Ter outro codificador checando independentemente uma amos-
tra do trabalhado que está sendo feito pelos outros codificado-
res. Isso serve a dois propósitos: o de identificar os codificadores

que estão tomando decisões errôneas de codificação, e a de iden-
tificar as regras de codificação que são ambíguas e que requerem
esclarecimentos.
• Um procedimento deve ser estabelecido para os codificadores es-
creverem notas sobre as respostas das quais eles não tem certeza
de como codificar. Essas notas devem ser rotineiramente revisa-
das por um supervisor. Tais notas são uma extensão do sistema
de checagem, ajudando os supervisores na identificação de códi-
gos ou codificadores que necessitam de atenção e de regras de
codificação que requeiram esclarecimentos.
Entrada de dados. Respostas coletadas por meio de formulários es-

critos são mais bem inscritas em um arquivo de dados usando um de vá-
rios programas de entrada de dados disponíveis. Além de coletar entra-
das de forma organizada para que os dados possam ser analisados, esses
programas podem fornecer um controle de qualidade tal qual:
• permitir a entrada apenas de códigos legais em qualquer campo
particular;
• checar as entradas para ter certeza de que todas são consistentes
com outra entrada de dados prévia;
• assegurar automaticamente que as questões que causam incerte-
zas sejam tratadas apropriadamente (isto é, quando uma série
de questões é perguntada somente para um subgrupo de respon-
dentes, instruções de contingência podem ser programadas para
que os campos para questões a serem puladas possam ser preen-
chidos automaticamente com os códigos apropriados).
Apesar das checagens não identificarem os erros nos dados de en-

trada que não violam as regras programadas, muitos dos erros na entra-
da de dados serão descobertos a tempo de serem corrigidos com facilida-
de. Além disso, na medida em que as checagens para entradas ilegais,
dados inconsistentes e conformidade com as regras de contingência são
feitas no momento da entrada dos dados, isso reduz a necessidade de
um processo de limpeza de dados muito demorado e propenso a erros
depois que a entrada de dados é completada.
Muitas organizações de pesquisa rotineiramente têm todas as suas
entradas de dados verificadas independentemente; isto é, outra pessoa
do grupo, sem possuir conhecimento do início da entrada de dados, en-

tra com o mesmo dado, e qualquer discrepância pode ser flagrada e os
erros corrigidos. Esse passo pode fazer o processo de entrada de dados
praticamente livre de erros. Se a codificação e a entrada de dados são
feita como primeiro passo, a verificação se torna um passo para o contro-
le de qualidade em ambas.
A maioria dos dados de levantamentos são coletados e armazenados
em um único processo, conhecido como entrevista por telefone assistida por
computador (computer-assisted telephone interviewing – CATI), entrevista
pessoal assistida por computador (computer-assisted personal interviewing –
CAPI), ou autoentrevista assistida por computador (computer-assisted self-
-interview – CASI), de forma que os entrevistadores ou os respondentes pos-
sam responder diretamente no computador em um formato previamente
codificado. Papel e caneta não são usados. Coletas de dados por sites da in-
ternet são essencialmente iguais na perspectiva de uma entrada de dados
como a autoentrevista assistida por computador.
Para entrevistas por telefone, cada entrevistador tem um terminal
na estação telefônica. As perguntas aparecem na tela, o entrevistador as
lê, os entrevistados respondem e o entrevistador insere o valor numérico
que corresponde à resposta no terminal. Essa entrada fará iniciar uma
nova questão na tela do computador. Laptops ou outros tipos de computa-
dores pessoais portáteis oferecem a mesma opção para entrevistas familia-
res. Para a autoentrevista assistida por computador ou quando levanta-
mentos são feitos via internet, a experiência é exatamente a mesma exceto
que os respondentes digitam suas próprias respostas em vez de terem um
entrevistador como intermediário. Em todas essas aplicações, o computa-
dor pode ser programado para aceitar apenas entradas válidas e para che-
car a consistência de qualquer inserção que tenha uma entrada de dados
prévia, para que assim aparentes inconsistências nas respostas possam ser
tratadas no mesmo momento em que é feita a coleta dos dados.
Outra tecnologia que não custa nada é a de que os entrevistados
por telefone podem entrar com suas respostas diretamente em um ar-
quivo de dados usando apenas característica de toque de tom de seus
telefones. (Por exemplo, “Por favor, pressione 1 se a sua resposta for sim
e 2 se sua resposta for não.”) Isso é chamado de autoentrevista áudio-
telefônica assistida por computador (telephone-audio computer-assisted
self-interviewing – T-A CASI). Questões podem ser feitas por uma voz
de computador pré-gravada, então nenhum entrevistador precisa estar
envolvido. O sistema de reconhecimento por voz pode ser usado no lu-
gar da entrada de dados por toque de tom. Obviamente que essas abor-
dagens se encaixam melhor quando as questões têm respostas fixas.
Outro meio de inserir os dados de levantamento que não usam
nem os entrevistadores nem o grupo envolvido com a entrada de dados
é o escaneamento óptico. Existem duas maneiras que o escaneamento é
usado para fazer a inserção dos dados.
As alternativas de resposta podem ser por códigos de barras, de
forma que a pessoa pode inserir os números passando o scanner sobre a
barra ao lado da resposta escolhida. A vantagem dessa abordagem é que
a pessoa sem habilidades de inserir dados pode fazê-lo, mas ainda é ne-
cessária uma pessoa para gerenciar a entrada de dados.
O escaneamento óptico de folhas e de formulários especiais, tais
como os usados para testes padronizados, tem sido viável há anos e não
requer um grupo para entrada de dados. Como resultado, os custos da
entrada de dados são bem baixos. O custo principal está na aquisição dos
equipamentos e, se formulários com propósitos especiais forem necessá-
rios, na construção e na impressão deles.
Historicamente, costumam ocorrer aspectos negativos no uso de
escaneamento óptico em levantamentos:
Os formulários não foram usados de um modo conveniente, e os pesqui-
sadores de levantamentos querem questionários que sejam o mais fácil
possível.
Criar formulários com propósito especial para levantamentos relativa-
mente pequenos é bastante oneroso.
Uma significativa falta de dados pode ser o resultado, particularmente
quando respondentes desmotivados ou não habilidosos descuidadamente
marcam suas respostas.
O último problema pode ser administrado por checagens visuais

dos itens faltantes para identificar as marcas que a máquina pode não
conseguir ler. Entretanto, a promessa por um maior uso de scanner ópti-
cos em levantamentos provavelmente reside na melhoria de tecnologia.
Scanner modernos são muito mais tolerantes a marcações imperfeitas do
que aqueles usados no passado. Eles também são utilizados com uma va-
riedade de formatos, tornando-os mais adaptáveis para o uso em instru-
mentos amigáveis ao usuário.
O uso de scanner só funciona bem com escolha fixa, com dados
pré-codificados, embora progresso esteja sendo feito para que respostas
escritas possam ser digitalizadas para codificação posterior. Enquanto o
melhor equipamento é ainda comparativamente caro, os scanners prova-
velmente terão um papel cada vez maior na entrada de dados no futuro.

Dillman e Miller (1998), Dillman (2007) e Blom e Lyberg (1998) forne-
cem bons resumos das atuais opções e limitações dos scanner.
Para resumir, existem inúmeros atrativos para todos os sistemas de
coleta de dados baseados em computador:
1. O computador pode seguir modelos de questões complexas que
são difíceis tanto para os entrevistadores quanto para os respon-
dentes em uma versão de levantamento feita em papel e caneta.
2. Informações retiradas de questões anteriores ou até mesmo en-
trevistas feitas anteriormente podem ser levadas em conta na
formulação ou na sequência em que as questões foram aplica-
das.
3. Se dados inconsistentes são fornecidos, eles são sinalizados e
podem ser corrigidos imediatamente.
4. Os dados podem ser adicionados a um arquivo de leitura de da-
dos para análise imediata.
O lado mais negativo desses sistemas, quando comparados aos for-

mulários de papel, pode vir a ser o tempo necessário para se programar
um protocolo assistido por computador. O programa precisa ser livre de
erros para que possa ser útil. Os entrevistadores não podem lidar com
erros de programação durante as entrevistas, como eles podem com er-
ros tipográficos em uma lista escrita, e, é claro, erros são ainda mais pro-
blemáticos quando os entrevistados inserem diretamente as suas respos-
tas. Por esta razão deve ser disponibilizado um tempo considerável para
testar e depurar antes que se comece a coleta de dados, ainda que sim-
ples instrumentos com poucas omissões irão apresentar menos proble-
mas na detecção de erros de programação.
Além disso, as entradas de dados não possuem um controle de qua-
lidade. Pode haver nenhuma checagem em qualquer inserção de dados ou
em qualquer decisão de codificação que os entrevistadores façam com um
sistema assistido por computador, exceto em ter certeza de que as entra-
das feitas são códigos válidos e que são internamente consistentes. Apesar
da proporção de erros no código ser relativamente baixa, a maior preo-
cupação é a qualidade das decisões tomadas durante a codificação (Dielman
e Couper, 1995). Devido às preocupações referentes à falta de controle nas
decisões de código, quando questões que tenham respostas abertas são fei-
tas, entrevistadores de entrevistas por telefone assistidas por computador
e de entrevistas pessoais assistidas por computador costumam gravar as
respostas textualmente no computador para codificação posterior. Nichols,

Baker e Martin (1997) e especificamente o livro editado por Couper e co-
laboradores (1998) fornecem bons resumos das características, usos e ex-
periências com sistemas assistidos por computador.
LIMPEZA DOS DADOS
Uma vez que os entrevistadores codificaram e inseriram os dados

em uma fita ou disco de arquivos, os dados precisam ser checados. A re-
visão mais importante é a de garantir que o arquivo de dados esteja com-
pleto e em ordem. Além disso, todo campo deve ser revisado para se ter
certeza de que apenas códigos válidos estejam presentes. Mesmo que re-
visões houvessem ocorrido no período de inserção dos dados, é uma boa
prática ter certeza de que tudo correu como o planejado colocando em
operação um grupo que use todas as distribuições. Claro que, se os testes
não foram feitos no momento da inserção dos dados, as revisões para
procurar uma consistência interna devem ser feitas também.
Quando forem encontrados erros, a fonte original deve ser consul-
tada e correções devem ser feitas. (Note que isso normalmente não é
possível em um sistema de entrevista por telefone assistida por computa-
dor, de entrevista pessoal assistida por computador ou de autoentrevista
assistida por computador, pois nenhuma cópia das respostas é preserva-
da.) Devido aos erros que acontecerão durante a correção dos processos,
as revisões devem ser novamente executadas. Em grandes arquivos, esse
processo de limpeza consome um bom tempo e tem uma grande propen-
são a erros. Na medida em que os erros podem ser descobertos na entra-
da de dados, a dependência de limpeza posterior é reduzida, o que é al-
tamente desejável.
CODIFICAÇÃO E REDUÇÃO DE DADOS COMO FONTES DE ERROS
Devido ao fato de que a codificação e a redução de dados podem

ocorrer em lugares altamente supervisionados e podem ser checadas mi-
nuciosamente, elas têm a possibilidade de ser uma parte quase livre de
erros dentro do processo de levantamento. Além disso, os custos para a
codificação e redução de dados normalmente devem ser uma fração pe-
quena do custo total do levantamento.
Quando lidamos com respostas fechadas, a estimativa de erros na en-

trada de dados deve ser menor do que 1%. O nível de erros nos dados finais
será menor, é claro, quando aqueles números são inseridos diretamente e
são 100% revisados, então o processo de transcrição em si é chegado.
A confiança da codificação das respostas de opinião aberta irá va-
riar com a qualidade das questões, com a qualidade do código e com o
treinamento e supervisão de seus codificadores. Se um pesquisador tiver
uma questão razoavelmente focada, e se as categorias do código forem
conceitualmente claras, pode-se esperar que a codificação exceda 90%
em confiabilidade; isto é, o codificador e o revisor de códigos irão discor-
dar nas classificações feitas em menos de 1 a cada 10 respostas. Codifi-
cadores que não são treinados e revisores de código apropriadamente
criam erros em taxas consideravelmente altas. Códigos que dependem
que se tenha conhecimento de definições completas, tais como catego-
rias ocupacionais, condições de saúde ou definições legais específicas de
crimes podem justificar atenção especial no treinamento dos codificado-
res e na revisão de códigos.
O processo de inserção de dados pode ser quase livre de erros se
isso for verificado. Apesar de alguns operadores individuais serem capa-
zes de inserir dados a um considerável nível de exatidão, com taxas de
erro inferiores a 1 em 1000 entradas, não se pode rotineiramente afirmar
que a entrada de dados irá ocorrer no mesmo nível de precisão.
A escolha da codificação e do processo de inserções dos dados será
frequentemente feita por outras razões além da minimização dos erros de
codificação e da entrada de dados. A velocidade da construção do arquivo
e a oportunidade de apanhar erros durante a entrevista estão entre os re-
cursos dos sistemas de entrevista por telefone assistida por computador e
de entrevista pessoal assistida por computador, assim como são alguns dos
pontos positivos do envolvimento de computadores em especificar a for-
mulação e a ordem das questões. Puramente da perspectiva de redução
dos erros, entretanto, o processo de dois passos, pelo qual os codificadores
inserem os dados e seus trabalhos diretamente (codificação e entrada de
dados) é 100% revisado, podendo ser ideal quando um levantamento en-
volve um número significante de decisões de codificação. Nenhum outro
sistema fornece uma revisão independente sobre todas as decisões de co-
dificação, bem como sobre todas as entradas de dados.
10 Analisando os dados
do levantamento
Assim que os dados forem coletados e o arquivo de dados houver sido criado,
o próximo passo será o de analisar esses dados para que sejam feitas esti-
mativas estatísticas e para que se possa chegar a algumas conclusões. Esse
capítulo foi feito para familiarizar os leitores com quatro questões analíticas
que a maioria dos usuários de dados de levantamento tem de resolver para
que a análise dos dados possa ser feita: ajustar a ausência de respostas ao
levantamento, ajustar os itens que não foram respondidos, fazer ponderações
para ajustar as diferentes probabilidades de seleção e calcular os efeitos do
planejamento da amostra em cálculos estatísticos.
AJUSTE PARA AMOSTRAS SEM RESPOSTAS E PARA

AMOSTRAS COM DEFICIÊNCIAS NA ESTRUTURA
Praticamente todo levantamento falha ao coletar dados de todas

ou sobre todas as amostras individuais. Também não é incomum para a
estrutura de amostra utilizada incluir imperfeitamente o total da popula-
ção que o pesquisador queria descrever. O que importa aqui, claramente,
é o grau em que aqueles que não responderam ou que nunca tiveram a
chance de ser selecionados são diferentes daqueles que respondem com
relação às variáveis que os levantamentos feitos tendem a estimar.
Se há informação disponível sobre os valores dos não responden-
tes, então correções nas estimativas do levantamento podem ser feitas
diretamente. Contudo, esse é raramente o caso, pois haverá uma peque-
na necessidade de conduzir um levantamento que tenha um propósito
especial se a informação já estava disponível através de outras fontes.
Uma situação mais comum é a de que algumas informações estão dis-

poníveis sobre os não respondentes, mas não sobre as variáveis-chave que
são estimadas. Quando uma amostra é extraída de uma lista, às vezes a in-
formação é disponível para todos os indivíduos que foram selecionados an-
tes do levantamento – frequentemente características demográficas como
idade, gênero e talvez raça. Para amostras retiradas de populações generali-
zadas, pode haver informações disponíveis sobre toda a população. A partir
desses dados, pode-se determinar se certos grupos são bem ou mal repre-
sentados na amostragem de pessoas das quais foram coletados os dados.
Se for concluído que certos subgrupos desta população não foram
propriamente representados no conjunto dos dados, uma questão óbvia
é se as estimativas podem ser ou não melhoradas pelo o ajustamento da
amostra de dados, fazendo-as parecer mais com a população total.
Exemplo: Suponha que a população é conhecida por incluir números

aproximadamente iguais de homens e mulheres, mas a amostra dos que
responderam às perguntas inclui um total de 60% de mulheres. As mulhe-
res responderam ao levantamento em um nível mais alto do que os ho-
mens; consequentemente, os homens são subrepresentados nessas respos-
tas. Pode-se multiplicar todas as respostas por 1,5, igualando as respostas
de homens e mulheres, como seria se eles houvessem respondido pela
mesma taxa e a amostra refletisse perfeitamente a população.
Considere agora um levantamento que abranja 400 entrevistados,
sendo 240 do sexo feminino e 160 do sexo masculino.
Suponhamos que cada resposta dos entrevistados masculinos pesa
1,5, enquanto as respostas das mulheres pesam 1,0. Essa abordagem da-
ria aos 160 homens (1,5 x 160 = 240) o mesmo peso das 240 mulheres.
Sendo assim, na análise, a representação das respostas dos homens e das
mulheres seria a mesma.
Por que alguém usaria esse método? Suponhamos que um dos pro-
pósitos desse levantamento seja o de estimar quantos drinques os entre-
vistados tomam quando ingerem bebidas alcoólicas. Suponhamos que as
mulheres entrevistadas reportem que ingerem uma media de 2 drinques
nos dias em que usufruem de álcool, enquanto os homens digam que em
média bebem 4 drinques.
Se os dados não forem pesados, a estimativa da média de drinques
tomados no total seria calculada dessa forma:
240 x 2 = 480, o número total de drinques ingeridos pelas mulheres
160 x 4 = 640, o número total de drinques ingeridos pelos homens
480 + 640 = 1.120, o número total de drinques ingeridos por ambos os sexos
1.120 drinques divididos por 400, o número de entrevistados = 2,8, o
número médio de drinques ingeridos por aqueles da amostra.
ENTRETANTO
Se pesássemos as respostas masculinas para que elas possam ser re-

presentadas na amostra de dados de um mesmo modo como quando es-
tão na população, teríamos
1,5 x 160 x 4 = 960, o número de drinques ingeridos pelos homens (que

são contabilizados como 240 dos respondentes para ajustar os 80 homens
que não responderam, mas que poderiam se tivessem a mesma média de
resposta que a das mulheres)
480 + 960 drinques = 1.440, o número de drinques ingeridos pelos ho-
mens e pelas mulheres (com as respostas masculinas pesando 1,5)
1.440 drinques divididos pelos 480 entrevistados (as mulheres mais o
peso de 1,5 de homens) = 3,0, a média estimada de drinques tomados
por toda a população
Ao pesar a análise para que seja feito um ajuste devido ao fato de

que as mulheres responderam o levantamento em uma taxa maior que a
dos homens, mudamos a estimativa de 2,8 para 3,0, e a maioria das pes-
soas provavelmente concluiria que uma estimativa maior é mais precisa.
Essa abordagem geral pode ser ampliada para ajustar diferentes
numerações entre as características da amostra de resposta e das carac-
terísticas da população que se queira generalizar nossas estatísticas. Con-
forme cresce o número de variáveis, os ajustes podem tornar-se compli-
cados, mas computadores podem lidar com essas complexidades.
Curiosamente, nenhum analista recomenda o uso de pesagens pa
ra o ajuste das diferenças encontradas entre características conhecidas
da amostra populacional e a amostra de resposta. A razão disso é uma
suposição importante que é quase sempre incontestável: a de que os que
respondem de um subgrupo específico são quase os mesmos que não res-
pondem sobre as variáveis que o levantamento está tentando estimar. No
exemplo anterior, a hipótese é a de que os homens que não responderam
teriam reportado um número semelhante de drinques tomados aos que
responderam a questão. E se os homens que não responderam a questão
fossem desproporcionalmente contrários a beber álcool? E se, na verda-
de, os homens que não responderam não só bebessem menos que os ho-
mens que responderam, mas, naturalmente, bebessem menos que as mu-

lheres que haviam respondido. Nesse caso, o ajuste feito àqueles que não
responderam teria piorado a estimativa, e não melhorado.
Muitas organizações de pesquisa rotineiramente ajustam suas
amostras de dados por ponderação, para fazer que as composições de-
mográficas (e algumas vezes outras) correspondam às características co-
nhecidas da população à qual se tenta descrever. Na medida em que não
há associação entre as características que estão sendo ajustadas e as va-
riáveis que estão sendo estimadas, essa ponderação não terá efeito sobre
o resultado das estimativas. Visto que há relações entre as variáveis que
estão sendo estimadas e as características que estão sendo ajustadas, ha-
verá potencialmente uma melhora nas estimativas, assumindo que os que
não responderam ao grupo que foi ajustado tenham respostas respectiva-
mente similares aos entrevistados dos quais foram estimadas as variáveis.
Entretanto, se os indivíduos que não responderam são muito diferentes,
então esses ajustes podem fazer com que as estimativas se tornem piores
do que se os dados de amostra não houvessem sido ponderados. A não
ser que se tenha o conhecimento sobre essas relações, não há uma res-
posta clara sobre se ponderar ou não para ajustar aos que não responde-
ram de fato reduz o erro nos levantamentos. Ponderar uma amostra para
fazê-la espelhar uma característica demográfica conhecida da população
como um todo, por si só não proporciona uma certeza real de que a pre-
cisão de outras estimativas, baseadas na amostra, tenha sido melhorada.
LIDANDO COM A AUSÊNCIA DE RESPOSTA AO ITEM
Além do fato de que alguns indivíduos selecionados para partici-

par da amostra não fornecem sequer um dado, todos os levantamentos
têm de lidar essencialmente com o fato de que os que respondem ao le-
vantamento não fornecem respostas codificáveis a todas as questões.
Existem duas opções: pode-se deixar aqueles respondentes que não for-
neceram informações fora da análise, ou pode-se tentar estimar as res-
postas que eles poderiam ter dado caso as houvessem fornecido.
Para a maioria dos levantamentos bem planejados, as taxas de
itens sem respostas (itens para os quais não há valor) são tipicamente
baixas. Quando o item não respondido for menor que, digamos, 5%, o
potencial para que essa falta de resposta distorça as estimativas é míni-
mo. Se um sentindo ou outra estatística é relatado baseado apenas na-
queles que responderam um item, assumisse essencialmente que o resul-

tado dos itens sem resposta são os mesmos daqueles respondidos. As
respostas verdadeiras dos que não responderam terão de ser muito di-
vergentes daqueles que responderam para afetar as distribuições quando
elas são menores que 5%.
Conforme aumenta o índice de itens não respondidos, também au-
menta o potencial para que isso afete as estimativas. Um jeito de deixar os
itens que não forem respondidos fora da análise, para não produzirem ne-
nhum efeito nos resultados, é reduzindo o número de observação sobre as
quais são baseadas as análises de correlação ou regressão. Por essa razão,
muitos pacotes analíticos irão substituir a média de respostas em toda a
amostra por uma não resposta, com a pretensão de incluir todos os respon-
dentes na análise. Uma abordagem muito mais complicada e sofisticada, al-
gumas vezes intitulada por “imputação”, é a construção de um modelo que
prediga as respostas mais prováveis para cada um dos respondentes que não
responderam a uma questão. Para que isso seja feito, o pesquisador usa os
dados daqueles que responderam uma questão para identificar outras ques-
tões do levantamento que são boas para fazer a predição da questão como
problema. A equação de predição que resulta é então usada para assinalar
um valor àqueles que não responderam as questões.
Essa abordagem apenas melhora os dados na medida em que o mo-
delo é um bom prognosticador de respostas; é obviamente mais complicado
do que deixar de fora os itens que não foram respondidos, e não faz muito
efeito nos resultados analíticos quando os itens sem resposta são poucos.
Por outro lado, quando os itens de respostas são altos, há um potencial con-
siderável para aumentar as estimativas por meio da imputação.
Não é incomum descobrir que diferentes modelos de imputação pro-
duzam diferentes resultados. Normalmente é melhor comparar os resulta-
dos de vários modelos diferentes. Se eles produzirem resultados semelhan-
tes, então se pode reassegurar que as estimativas imputadas provavelmente
são melhorias sobre afirmar que a não resposta ao item teria fornecido
respostas “médias”. Se os modelos produzirem resultados bem diferentes,
é importante entender as razões pelas quais as diferenças ocorreram antes
de decidir pelo o uso de uma abordagem particular para a imputação.
Como qualquer procedimento de ajuste, a imputação tem o poten-
cial de ser mal usada e de criar mais erros do que reduzi-los. Porém,
quando os modelos são bons e os itens não respondidos são altos, impu-
tações apropriadamente feitas para dados faltantes podem ser de grande
contribuição para a análise de dados.
AJUSTES PARA DIFERENTES PROBABILIDADES DE SELEÇÃO
Como descrito no Capítulo 3, muitos projetos de amostra pedem

por uma seleção de certos indivíduos com índices mais altos do que ou-
tros. Uma das razões mais comuns é a política geral de selecionar apenas
um respondente por família. Se as casas de família forem selecionadas e
uma pessoa é solicitada a responder, isso significa que adultos que vivem
em uma família que contém três adultos serão o respondente apenas
uma vez em três, enquanto adultos que vivem em casas de família que
tenham somente um adulto sempre serão selecionado para ser o respon-
dente. Desta maneira o último exemplo terá três vezes mais chance de
ser escolhido do que o primeiro.
Nesses casos, os amostradores propositalmente tentam amostrar
alguns subgrupos de uma população em um nível mais alto que o índice
para aumentar a habilidade de fazer estimativas confiáveis das caracte-
rísticas daquele subgrupo.
Quando há diferenças nas probabilidades de seleção, é sempre
apropriado pesar as respostas para que o peso vezes a probabilidade de se-
leção seja o mesmo para todos os respondentes.
Exemplo: Em uma amostra de famílias, é escolhido um adulto por
casa de família para ser o respondente. Para que seja feito um ajusta-
mento das diferenças na probabilidade de seleção, todas as respostas são
pesadas pelo número de adultos elegíveis em cada família. Deste modo:
Se houver um adulto, a probabilidade de seleção dentro da família será

de 1/1 e o peso = 1
Se houver dois adultos, a probabilidade seleção dentro da família será de
1/2 e o peso = 2
Se houver três adultos, a probabilidade seleção dentro da família será de
1/3 e o peso = 3
Se houver quatro adultos, a probabilidade seleção dentro da família será
de 1/4 e o peso = 4
É fácil de ver que a probabilidade de seleção vezes o peso é uma

constante = 1, não importa quantos adultos haja na casa.
Essa mesma abordagem pode ser aplicada em qualquer situação
em que específicos subgrupos identificáveis de uma população possuam
diferentes probabilidades de seleção. Ao fazer a pesagem para que a pro-
babilidade de seleção vezes o peso seja o mesmo a todos os responden-
tes, esses subgrupos serão representados na amostra de dados de modo
que possam espelhar sua representação na população da qual a amostra-

gem foi extraída.
CALCULANDO ERROS DE AMOSTRAGEM
Uma das razões mais fortes para o uso do método de amostragem

por probabilidade é que ele fornece os fundamentos para estimar os er-
ros de amostragem e para calcular outras estatísticas referentes à prová-
vel relação entre amostras de estimativas e as características da popula-
ção. Se uma amostra foi extraída como uma amostra aleatória simples,
sem nenhum agrupamento, sem estratificação e sem uma igualdade na
probabilidade de seleção para todos os membros da amostra, o cálculo
de erros padrão é completamente honesto e pode ser feito usando quase
qualquer pacote estatístico ou até mesmo usando as fórmulas e tabelas
do Capítulo 3. Em uma situação mais recorrente, quando algum desvio
da amostragem aleatória simples é aplicado e algum tipo de pesagem é
requerido como parte da análise, a análise estatística precisa levar em
conta essas características do planejamento. Se um programa é usado
sem um apropriado ajustamento para o projeto, as estimativas de erros
de amostragem e de cálculos dos testes estatísticos estarão erradas.
Especificamente, se os pesos forem usados para ajustar as diferen-
tes probabilidades de seleção para que seja feita a correção da subrepre-
sentações de algum grupo ou grupos nos dados, o número de observa-
ções sobre as quais os cálculos são baseados é provavelmente distorcido.
Testes estatísticos dependem criticamente da estimativa do número efeti-
vo de observações que estão sendo analisadas.
O agrupamento em uma amostra normalmente aumenta as esti-
mativas de erros de amostragem, pois os agrupamentos provavelmente
reduzem o número “efetivo” de observações. A estratificação de uma
amostra usualmente reduz as estimativas de erros padrão, pois a estrati-
ficação provavelmente diminui variações não controláveis na composição
da amostra. O grande desafio é que os efeitos da ponderação, do agrupa-
mento e da estratificação não são os mesmos para todas as variáveis. De-
pendendo de como os valores de uma variável são de fato distribuídos
com relação aos agrupamentos, às camada e aos pesos que estão sendo
usados, os efeitos dos ajustes apropriados irão diferir.
Felizmente, existem vários pacotes extraordinários de estatística
disponíveis com a possibilidade de fazer os ajustes apropriados que per-
mitam refletir as realidades do planejamento da amostra. Está além do

alcance deste livro explicar os detalhes de como esses cálculos são feitos.
Entretanto, a tarefa do livro é deixar claro aos leitores que os detalhes de
um planejamento de amostra e a ponderação necessária realmente afe-
tam os testes estatísticos, e que estratégias apropriadas devem ser incor-
poradas na análise a fim de calcular corretamente os erros padrão e as
significâncias estatísticas.
CONCLUSÃO
A maior parte deste livro visa a detalhar como devem ser coletados
os dados de levantamentos de uma forma que maximize o seu valor para
abordar as questões de análise. Está além do alcance deste livro cobrir as
técnicas analíticas e os problemas estatísticos relacionados. Os proble-
mas abordados neste capítulo são diretamente relacionados ao planeja-
mento e à execução de um levantamento. Como se faz inevitável a esco-
lha difícil sobre como os dados serão coletados, é importante que seja
pensando em como os dados irão ser analisados e planejar ajustes apro-
priados na análise para as decisões do projeto que são feitas e a pratica-
mente inevitável imperfeição nos dados que são coletados.
Groves, R. M., Fowler, F. J., Couper, M. F., Lepkowski, J. M., Singer, E., &
Tourangeau, R. (2004). Survey methodology (Chap. 10). New York: John Wiley.
11 Problemas éticos em
pesquisas de levantamento
Como toda pesquisa social, os levantamentos devem ser conduzidos de um

modo planejado para evitar riscos aos participantes, aos respondentes e aos
entrevistadores. Esse capítulo resume os procedimentos para o gerenciamento
ético de levantamentos.
Como toda pesquisa que envolve sujeitos humanos, os pesquisado-

res de levantamentos precisam estar atentos ao modo ético com que a pes-
quisa está sendo conduzida. Uma boa diretriz de procedimento é que os
pesquisadores devem ter certeza de que nenhum indivíduo sofra nenhum
tipo de consequência adversa como resultado do levantamento. Além dis-
so, na medida em que isso é factível, um bom pesquisador também deverá
estar atento em maximizar resultados positivos obtidos no processo de
pesquisa. A base para a maioria das diretrizes que protegem os seres hu-
manos participantes de pesquisas nos Estados Unidos é o Belmont Report
(National Commission for the Protection of Human Subjects, 1979).
Quase todas as universidades e a maioria das organizações nos Es-
tados Unidos que conduzem pesquisas financiadas pelo governo federal
têm um Institutional Review Board (IRB) que é responsável por inspecio-
nar pesquisas que envolvam seres humanos. Quando se propõe a pesqui-
sa, O principal investigator deve submeter o protocolo proposto para
uma revisão do IRB antes que comessem as coletas de dados.
As revisões de IRB são feitas para proteger os indivíduos seleciona-
dos, os pesquisadores e as instituições. Em geral, a maior preocupação
do conselho é a respeito das pesquisas que envolvam algum tipo de risco
aos participantes. “Atividades de pesquisa em que o único envolvimento
de seres humanos será... testes educacionais, procedimentos de levanta-

mento ou observação de comportamento público... [são] liberados” a
não ser que:
1. a informação seja registrada de tal forma que os sujeitos possam
ser identificados... e
2. qualquer revelação das respostas dos sujeitos... que possam ra-
zoavelmente pôr os sujeitos em risco quanto a suas responsabili-
dades criminais ou civis ou que cause algum dano a sua condi-
ção financeira, empregatícia ou à sua reputação. (Department
of Health and Human Services, 2005, p. 5)
Sob essas diretrizes, muitos, se não a maioria, dos levantamentos

são tecnicamente eximidos. Isso significa que não existe nenhum funda-
mento para que o IRB tenha de inspecionar os detalhes da pesquisa ou
que tenha que recomendar mudanças. Entretanto, pelo fato de envolve-
rem sujeitos, o material usado deve ser fornecido ao IRB para que al-
guém (normalmente o presidente) possa determinar que o protocolo está
de acordo com os padrões. Se o levantamento envolve algum nível de
risco potencial, ou se populações vulneráveis estão envolvidas, cabe ao
IRB a explícita responsabilidade de revisar todos os procedimentos para
se ter a certeza de que os seres humanos estão bem protegidos.
Nesse texto, não é possível tratar de todos os problemas que pos-
sam estar envolvidos em estudos de populações especiais. Pesquisa sobre
crianças, sobre pessoas mentalmente incapacitadas, mentalmente doen-
tes, prisioneiros e outras populações especiais podem necessitar de aten-
ção, para as quais os pesquisadores talvez consigam obter ajuda em ou-
tro lugar. Sieber (1992) nos oferece muito mais detalhes de como tratar
a coleta de dados de um modo ético, assim como faz um relatório de
2003 da The National Academy of Sciences (Citro, Ilgen e Marret, 2003).
Entretanto, a seguir encontram-se alguns princípios éticos sobre como
fazer levantamento de populações gerais com o qual todo pesquisador
deve estar familiarizado.
INFORMANDO OS RESPONDENTES
O processo de pesquisa de levantamento geralmente envolve a

conquista da cooperação voluntária. É uma premissa básica da pesquisa
ética de levantamentos que os respondentes devem ser informados sobre
o que eles estão se voluntariando para fazer. Os respondentes devem ter

conhecimento das seguintes informações antes de ser solicitados a res-
ponder às questões:
1. O nome da organização que está conduzindo a pesquisa. Se um
entrevistador é envolvido, o respondente também deve saber o
nome do entrevistador.
2. O patrocinador, ou seja, quem está dando suporte ou financian-
do a pesquisa.
3. Uma razoavelmente precisa, porém breve, descrição dos propó-
sitos da pesquisa. A pesquisa está tentando aumentar o conheci-
mento geral ou básico, ou se há algum planejamento ou proces-
so de ação que a pesquisa é projetada para assistir? Quais
questões ou tópicos a pesquisa foi planejada para abranger? De
quais questões a pesquisa deve tratar?
4. A indicação exata da extensão em que as respostas são protegidas
no que diz respeito à confidencialidade. Se há riscos ou limites na
confidencialidade que é oferecida, eles devem ser claras.
5. A garantia de que a cooperação é voluntária e que não haverá
nenhuma consequência negativa àqueles que decidirem não
participar.
6. A garantia de que os respondentes podem escolher pular qual-
quer questão que não queiram responder.
Essas informações podem ser enviadas com antecedência ou po-

dem ser diretamente entregues aos respondentes, se o planejamento per-
mitir. Independente de o que mais seja feito, os entrevistadores (se são
usados) devem ser solicitados a revisar os pontos mencionados anterior-
mente com os respondentes antes de começar uma entrevista.
Finalmente, talvez uma palavra seja apropriada sobre formulários
de consentimento assinados. Em geral, os respondentes de amostras de
levantamento não precisam assinar formulários antes de completar a en-
trevista. Obviamente, não é possível obter assinaturas para levantamen-
tos via o telefone. Mesmo em entrevistas pessoais para levantamentos,
contudo, muitos comitês sérios de revisão acham que formulários de
consentimento assinados não são necessários. Na maioria dos casos, os
riscos envolvidos na participação em levantamentos são relativamente
mínimos e também sob controle do respondente. Além disso, os respon-
dentes têm a oportunidade de re-exercitar a sua decisão de participar de
um levantamento cada vez que uma nova questão é feita.
Existem algumas exceções. Um formulário assinado fornece evidên-

cias de que os pesquisadores e suas instituições de fato expuseram os res-
pondentes a certos fatos-chave e que os respondentes concordaram com os
termos da pesquisa. Os pesquisadores e o Institutional Review Boards
(IRBs) são os mais prováveis a solicitar uma documentação escrita com-
provando que os respondentes foram completamente informados quando
1. Informação particularmente sensível é coletada que poderia, na
verdade, embaraçar ou prejudicar alguém caso se torne pública.
2. Que existem limites importantes para a confidencialidade dos
dados.
3. Pode haver falta de julgamento ou poder da população para de-
clinar da participação (por exemplo, crianças, prisioneiros, em-
pregados, estudantes).
4. Acesso a informações previamente coletadas para algum propósito
que não seja o de pesquisa, tais como registros médicos, está sendo
solicitado em complementação às respostas do levantamento.
Esses casos são uma exceção, e não a regra. A maioria das entre-
vistas de levantamento não requerem formulários de concessão assina-
dos – somente protocolos que assegurem que os respondentes foram in-
formados antes de concordar com suas participações. Novamente, Sieber
(1992) discute bem sobre os formulários de concessão.
PROTEGENDO OS RESPONDENTES
Se uma amostra é extraída de uma lista, tais como dos membros de

um plano de saúde ou de empregados de uma organização, um princípio ex-
tremamente básico de pesquisa ética é que as vidas dos membros de amos-
tras não devem ser desfavoravelmente afetadas de nenhuma maneira, mes-
mo se eles aceitem ou não participar. Para essa finalidade, o fato dos
indivíduos responderem ou não, não deve ser comunicado com ninguém fora
do time de pesquisa, e, quando isso potencialmente se tornar um problema,
as pessoas que participam da amostra devem ter a garantia de que não have-
rá resultados adversos (por exemplo, em seus benefícios de saúde, serviços,
situações trabalhistas ou de classificação) se eles optarem por não participar.
Além disso, a principal dificuldade com relação à proteção dos res-
pondentes é o modo como a informação que eles fornecem será tratada.
Manter a confidencialidade em geral é mais fácil quando as respostas são
inseridas diretamente no computador do que quando o questionário é feito

através de uma folha ou por uma entrevista. Alguns procedimentos-padrão
que cuidadosamente os pesquisadores de levantamento usam para minimi-
zar as chances de uma quebra na confidencialidade são os seguintes:
• Todas as pessoas que têm acesso aos dados ou a um papel na co-
leta de dados são comprometidas a escrever confidencialmente.
• As ligações entre as respostas e os identificadores são minimiza-
das. Nomes, e-mails ou endereços postais e números telefônicos
são os identificadores mais comuns. Frequentemente nomes não
são necessários com o propósito de executar um levantamento
adequado; quando eles podem ser evitados, muitas das organi-
zações de levantamento não usam nomes em nenhuma parte do
processo de pesquisa.
• Quando houver identificadores específicos tais como nomes, en-
dereços ou números de telefones, eles são colocados em um for-
mato em que possam ser lidos separadamente das respostas do
levantamento. Os identificadores (que não sejam números codi-
ficados de id) devem ser fisicamente removidos de todos os ins-
trumentos existentes no levantamento o mais cedo possível.
• Se nomes ou endereços foram usados na identificação da amos-
tra ou na coleta de dados, são deletados ou destruídos assim que
não forem mais necessários.
• Retornos de levantamentos completados não podem ser acessíveis
aos que não forem membros do projeto. Se eles estiverem em for-
mato de papel, é preferível mantê-los em arquivos fechados.
• Indivíduos que puderem identificar os respondentes por meio dos
perfis das respostas (por exemplo, supervisores no caso de levan-
tamentos de empregados ou professores no caso de levantamentos
de alunos) não são permitidos a ver as respostas do levantamento.
• Os arquivos de dados terão algum tipo de número de ID para
cada respondente. A ligação entre o número de ID e os endere-
ços das amostras ou os identificadores não são disponíveis aos
usuários gerais dos arquivos de dados.
• Durante a análise, os pesquisadores são muito cuidadosos na
apresentação dos dados para pequenos grupos de pessoas que
talvez possam ser identificáveis.
• Quando um projeto é completado, ou quando o uso de instru-
mentos de levantamento houver terminado, é de responsabilida-
de do pesquisador monitorar a destruição dos dados completos
dos instrumentos de levantamento da pesquisa, ou garantir que

eles permaneçam armazenados em um lugar seguro.
Obviamente, fazer um desvio desses procedimentos particulares pode

ser necessário para um dado projeto. A abordagem geral e as preocupações
refletidas nesse grupo de procedimentos, contudo, devem exemplificar
quaisquer responsabilidades nos projetos de pesquisa de levantamento.
Um limite provavelmente baixo, porém importante, quanto à promessa
de confidencialidade nos levantamentos de dados é que questionários e gra-
vações podem ser intimados por uma corte. Os pesquisadores podem se pro-
teger deste acordo de proteção à confidencialidade de vários modos. Se a pes-
quisa envolve especialmente um material sensível, tal como drogas ou estudos
na justiça criminal que talvez possam ser vinculados, os pesquisadores podem
fazer uma petição às agências federais ou estaduais em busca de um certifica-
do de confidencialidade que os proteja de futuras intimações. Alternativamen-
te, pesquisadores preocupados podem destruir esse vínculo antes que qual-
quer intimação seja emitida, entre os identificadores e os responsáveis, para
que assim seja impossível a associação dos respondentes às suas respostas. Se
manter o vínculo for essencial, como no caso de estudos longitudinais que re-
querem o contato repetitivo com os respondentes, os pesquisadores são co-
nhecidos por enviar os arquivos individuais conectivos e as respostas para ou-
tro país, fora da jurisdição das cortes dos Estados Unidos. Novamente Sieber
(1992) é uma boa fonte para a obtenção de mais detalhes sobre esse assunto.
BENEFÍCIOS AOS RESPONDENTES
Na maioria dos levantamentos, os principais benefícios das entre-

vistas são intrínsecos: apreciar o processo de entrevista ou sentir que
contribuiu de alguma forma, que foi um esforço que tenha valido a pena.
Benefícios mais diretos, como pagamentos, prêmios ou serviços às vezes
são fornecidos. Quando serviços são oferecidos, deve atribuir-se certa
atenção para que eles sejam equipados de uma forma que não compro-
meta a promessa de confidencialidade das respostas do levantamento.
Também, conforme o uso de incentivos em dinheiro para participar tor-
ne-se mais comum, as preocupações vêm crescendo de que a quantidade
de dinheiro oferecido não deva ser tão grande que isso se torne irracio-
nalmente difícil para alguns respondentes, particularmente aqueles com
problemas financeiros, dizerem “não”. Os benefícios não devem ser tão
grandes a ponto de enfraquecer o princípio de que a participação em

pesquisas é um ato voluntário. Além disso, o ponto-chave da responsabi-
lidade ética é ter certeza de não exagerar em benefícios e de entregar os
benefícios prometidos. Em particular, o pesquisador que atrai as coope-
rações pela descrição das utilidades da pesquisa assume um comprome-
timento de assegurar apropriadas análises e a disseminação dos dados.
RESPONSABILIDADES ÉTICAS DOS ENTREVISTADORES
Além das obrigações de qualquer empregador, o pesquisador tem a

responsabilidade para com os entrevistadores em duas áreas. Primeiro, é
dada ao entrevistador a responsabilidade de apresentar a pesquisa aos
respondentes. É obrigação do pesquisador ter certeza de que todas as in-
formações foram precisamente dadas aos entrevistadores. O pesquisador
não pode pôr o entrevistador em uma posição em que ele pareça ser en-
ganoso e que dê a impressão errada ou imprecisa.
Segundo, o pesquisador deve lidar com a segurança do entrevista-
dor. Devido ao fato de que a maioria das amostras de famílias incluirá
todas as áreas, os entrevistadores talvez tenham de visitar vizinhanças
em que não se sintam seguros. As seguintes diretrizes de procedimento
talvez possam ser úteis:
• Os entrevistadores podem ser convidados a visitar os endereços da
amostragem em um carro antes de decidir que não se sentem segu-
ros. Os bairros são heterogêneos e variam de quadra em quadra.
• Os entrevistadores devem ser explicitamente informados de que
não é uma exigência do trabalho ir a lugares no qual se sintam
inseguros. Algumas opções incluem evitar chamadas noturnas,
usar fins de semana para entrevistar pessoas empregadas e en-
trevistar juntamente com outro entrevistador ou um acompa-
nhante pago. Uma boa abordagem seria solicitar aos entrevista-
dores a trabalharem com o supervisor de campo para descobri-
rem como conduzir entrevistas de forma que se sintam seguros.
• Os entrevistadores devem ser informados sobre os procedimen-
tos sensatos para reduzir os riscos de serem vítimas.
Felizmente, a vitimização é algo raro; o maior problema é o medo.

Na nossa sociedade, entretanto, crimes acontecem. Tanto pesquisadores
quando entrevistadores precisam sentir que os entrevistadores foram in-
formados e que não foram pressionados a ir a nenhum lugar ou a fazer

nada que pudesse aumentar a real probabilidade de que eles possam ser
vítimas de um crime.
CONCLUSÃO
Os problemas éticos em pesquisas de levantamento não são dife-

rentes daqueles das ciências sociais em geral. Os reais riscos e os poten-
ciais custos de ser um respondente (ou um entrevistador) na maioria dos
levantamentos são mínimos. Alguns passos básicos são necessários na re-
dução de quaisquer riscos que ocorram tanto para os participantes quan-
to para a imagem dos pesquisadores das ciências sociais. Os passos espe-
cíficos delineados anteriormente não são de nenhum modo conclusivos.
A abordagem fundamental de lidar com pessoas de um modo honesto,
com uma atenção continuada aos detalhes que irão maximizar os benefí-
cios e evitar os custos, deve ser uma parte integral de qualquer esforço
nas pesquisas de levantamento.
Citro, C., Ilgen, D., & Marrett, C. (2003). Protecting participants and facilitating so-
cial and behavioral sciences research. Washington, DC: National Academy Press.
Groves, R. M., Fowler, F. J., Couper, M. P., Lepkowski, J. M., Singer, E., & Tou-
Sieber, J. (1992). Planning ethically responsible research: Developing an effective
protocol. Newbury Park, CA: Sage.
Fornecendo informações
12 sobre os métodos
de levantamento
Ao reportar estimativas de levantamento, os pesquisadores têm a obrigação

científica de fornecer uma descrição completa de detalhes dos procedimentos
usados que poderiam afetar tais estimativas. Em acréscimo, eles devem rea-
lizar e reportar os cálculos que foram relevantes à precisão e à veracidade de
seus números. Esse capítulo discute o material que deve ser incluído em uma
completa descrição metodológica de um levantamento.
Existem algumas decisões metodológicas que um pesquisador pode

tomar e que podem ser categoricamente rotuladas como erradas. Existem
algumas situações durante a pesquisa nas quais qualquer um dos compro-
missos discutidos nesse livro podem ser apropriados e rentáveis para coletar
informações. Embora as decisões feitas no planejamento da pesquisa não
possam ser criticadas fora de contexto, a falha em descrever completamente
os procedimentos pelos quais os dados foram coletados pode ser criticada. É
essencial para os leitores e para os usuários de um levantamento de dados
ter acesso a uma descrição completa do processo de coleta dos dados.
Existem duas funções gerais de uma boa descrição metodológica. A
primeira é fornecer um bom entendimento de o quão bem as estimativas de
amostra são prováveis de descrever a população da qual a amostra foi ex-
traída. Não é suficiente simplesmente declarar as conclusões do autor nesse
assunto; cálculos detalhados relevantes à precisão e ao viés devem ser apre-
sentados para que permitam aos leitores fazer suas próprias avaliações. A
segunda função é a de fornecer os detalhes procedurais necessários para a
replicação dos esforços feitos na coleta de dados e/ou detectar diferenças
procedurais entre levantamentos que poderiam afetar a comparabilidade.
Não é incomum encontrar apenas o tamanho da amostra reportado

sobre um levantamento; pesquisadores mais conscienciosos irão incluir
uma descrição de suas estratégias de amostragens e taxas das respostas.
Embora o nível apropriado de detalhes varie de acordo com a maneira que
os dados estão sendo usados, a seguir encontra-se um breve esboço da in-
formação que deve ser fornecida sobre qualquer levantamento.
• A estrutura da amostra (isto é, aquelas pessoas de onde a amos-
tra foi extraída), junto com uma estimativa da porcentagem da
população estudada que teve uma chance de seleção daquela es-
trutura e qualquer coisa que seja conhecida sobre o modo no
qual as pessoas excluídas diferem da população como um todo.
• O procedimento de amostragem, incluindo quaisquer desvios da
amostragem aleatória simples, tais como agrupamentos, estratifica-
ção ou taxas desiguais de seleção entre subgrupos da população.
• Os resultados de campo, a disposição de um planejamento inicial
de amostra: o número de respondentes, o número de não respon-
dentes e as maiores razões para a ausência de resposta. Se a taxa de
resposta não pode ser exatamente calculada porque a estrutura de
amostra inclui unidades ilegíveis (por exemplo: números telefônicos
não associados a unidades habitacionais ocupadas), o pesquisador
deve reportar o número de unidades para as quais a elegibilidade
não foi determinada e uma estimativa das taxas de resposta mais
prováveis. A American Association of Public Opinion Research pu-
blicou uma boa monografia sobre o relato das taxas de resposta
para aumentar a consistência do relato e a terminologia que os pes-
quisadores usam quando reportam seus resultados (AAPOR, 2006).
• A formulação exata das questões analisadas. Para um relato im-
portante, o instrumento de levantamento completo deve ser re-
produzido em um apêndice.
Além da descrição factual do processo de coleta dos dados, exis-

tem cinco outras coisas desejadas em um apêndice metodológico.
Primeiro, a maioria dos relatos são pretendidos para um público
que vai além dos metodologistas de pesquisas de levantamento. Portan-
to, uma breve descrição dos tipos possíveis de erro em levantamentos
normalmente é uma introdução apropriada para uma seção metodológi-
ca de um levantamento.
Segundo, estimativas numéricas do conjunto de erros de amostragem
associados a o planejamento particular da amostra devem ser incluídas. Se a
amostra planejada foi estratificada ou agrupada, ou se taxas diferentes de
seleção forem usadas, os efeitos daquelas características do planejamento

serão diferentes por diferentes medidas no levantamento. Tipicamente, os
pesquisadores calculam esses efeitos no planejamento pelo número de me-
didas no levantamento, incluindo aquelas que eles esperam que sejam os
mais e os menos afetados pelo planejamento do levantamento. Eles então
apresentam os efeitos de planejamento para esses itens ou reportam o al-
cance dos efeitos de planejamento, com algumas generalizações sobre os ti-
pos de itens que mais foram afetados pelo planejamento da amostra.
Terceiro, se entrevistadores forem usados, as informação sobre eles
que forem relevantes aos efeitos dos dados são desejáveis. Uma descrição
mínima seria número de entrevistadores que coletaram os dados, o quanto
eles receberam de treinamento e se a amostra do seu trabalho foi ou não
monitorada. Idade, gênero e etnia dos entrevistadores são úteis para saber
se essas características são relevantes para o conteúdo do levantamento.
Como discutido no Capítulo 8, os efeitos que os entrevistadores po-
dem causar não podem ser calculados de forma confiável se os responden-
tes forem designados aos seus entrevistadores com base na conveniência.
Existe um corpo crescente de dados do tamanho dos efeitos causados pe-
los entrevistadores, entretanto, resumido por Groves (1989), que pode ser
usado para relatar aos leitores sobre o provável alcance de efeitos dos en-
trevistadores nas estimativas. Além disso, levantamentos por telefone fei-
tos a partir de instalações centrais tornam possível gerenciar designações
de entrevistadores para que estimativas razoáveis dos efeitos causados pe-
los entrevistadores possam ser feitas. Seria desejável se mais estudos fos-
sem feitos para que assim, os efeitos causados pelos entrevistadores pu-
dessem ser estimados, e se o resultado das estimativas se tornasse uma
característica comum de relatórios metodológicos de levantamento.
Quarto, um pesquisador deve dizer aos seus leitores tudo o quanto
se sabe sobre os efeitos da ausência de respostas nas estimativas da
amostra. Essa exigência é particularmente importante quando as taxas
de respostas para um levantamento são comparativamente baixas. Se o
pesquisador tirou a amostra de uma fonte que forneça informações sobre
aqueles dos quais nenhuma resposta foi obtida, essa informação deve ser
apresentada. Entrevistadores devem ser encorajados a pegar, ao menos,
alguma informação sobre pessoas que se recusam, para que o pesquisa-
dor possa dizer alguma coisa sobre os modos em que os não responden-
tes podem diferir dos respondentes. Se há estatísticas de outras fontes
sobre a população da qual a amostra foi extraída, tais como um censo
relativamente recente, o pesquisador pode comparar a amostra com al-
guns números agregados independentes para estimar alguns efeitos da
ausência de resposta na amostra. Usualmente, não existem dados sobre

como a ausência de resposta é relacionada às medições-chave em um le-
vantamento. Contudo, qualquer tipo de dado que for apresentado sobre
os não respondentes ajudará os leitores a avaliar como os erros da au-
sência de respostas podem afetar os resultados.
Finalmente, um bom apêndice metodológico deve incluir algumas
informações sobre a confiabilidade e a validade das medidas mais impor-
tantes usadas em um levantamento. Existem três tipos de informações
relevantes que podem ser relatadas.
Primeiro, se as questões forem submetidas a testes laboratoriais cog-
nitivos ou a testes sistemáticos preliminares, esse fato e os resultados podem
ser relatados. Relatar o tipo de avaliação da questão que foi feita pode ser
útil para os usuários dos resultados. É importante que seja dito que as ques-
tões foram construídas para serem abrangentes e que a codificação do com-
portamento durante os pré-testes revelaram que as questões foram pergun-
tadas da maneira como foram formuladas e que poderiam normalmente ser
respondidas prontamente. Também, os testes pré-liminares às vezes indicam
um problema com a questão que, todavia, é mantido. Obviamente tal infor-
mação é de muita ajuda aos usuários dos dados resultantes.
Segundo, os pesquisadores podem apresentar análises que avaliem
a validade das respostas às questões. Na medida em que as respostas se
correlacionam de modo previsível com as respostas a outras questões, há
evidências de que elas medem o que o pesquisador esperava medir. Ware
(1987) apresenta um bom esboço dos tipos de análise que uma avaliação
meticulosa da confiabilidade e da validade devem ocasionar.
Terceiro, embora a precisão do relatório de dados factuais rara-
mente possa ser avaliada diretamente em um levantamento, citar os re-
sultados de um estudo de checagem de registros do relatório de itens si-
milares pode fornecer aos leitores uma base para estimar a quantidade e
a direção dos erros em uma estimativa baseada em levantamento.
Até então tem havido uma relativa escassez de dados sistemáticos
sobre quão bem as questões medem o que se pretende que meçam. É pro-
vavelmente honesto dizer que a maioria dos relatórios de levantamentos
assume uma face de validade, que as respostas significam aquilo que aque-
le que projetou da questão pensou que elas significariam. Seria desejável
se a coleta de dados e a análise dirigida na avaliação de questões e respos-
tas, e fazer relatórios das avaliações das questões, poderia se tornar uma
parte rotineira dos relatórios de metodologia de levantamento.
Haverá relatórios de dados de levantamentos para os quais toda a
informação delineada anteriormente será muito detalhada. Ocorre sem-
pre uma pressão de encurtar os artigos. Entretanto, toda a informação é

decididamente relevante para a avaliação da provável qualidade de um
levantamento baseado em estimativas. Em um relatório completo de
análise de um levantamento, um apêndice metodológico completo deve
ser incluído. Quando pequenos trabalhos são publicados, ao menos um
relatório metodológico que cubra os detalhes do processo de coleta de
dados deve ser disponibilizado.
Deve ser notado, em conclusão, que a lista almejada é tanto sobre
a importância de coletar e analisar as informações sobre as medidas
quanto é sobre relatar isso. É obviamente desejável que sejam tomadas
medidas para minimizar os erros, mas levantamentos livres de erros não
são possíveis. Documentar o quão bem as medições foram feitas e esti-
mar a quantidade e o tipo de erros nos resultados é uma parte crítica de
garantir o uso apropriado dos dados do levantamento. É também uma
parte importante a construção da base de conhecimento na qual será viá-
vel construir no futuro melhores medidas para levantamentos.
Portanto, quando resultados de levantamentos são relatados, há
uma obrigação de reportar as informações necessárias para avaliar a
qualidade dos dados, bem como para replicar os resultados. O último
objetivo pode ser atingido através da descrição cuidadosa dos procedi-
mentos usados; o objetivo anterior requer um esforço especial para a
medição dos erros bem como comunicar os resultados. Quando um rela-
tório é silencioso sobre algum tipo de erro, tais como se as questões são
compreensíveis ou se os entrevistadores afetaram os resultados, a supo-
sição implícita feita pela maioria dos leitores é a de que não há nenhum
problema. Pelo menos, pesquisadores podem estar certos de que os leito-
res sabem sobre as várias fontes de erros que podem afetar as estimati-
vas de levantamento (aspiração número 1). Entretanto, pensando mais
ao futuro, é esperado que os passos requeridos para o fornecimento de
estimativas específicas de erros se tornarão gradualmente rotineiros nos
resultados dos relatórios de levantamentos.
EXERCÍCIO
Usando os padrões apresentados nesse capítulo, avalie sistematica-

mente a adequação e a plenitude da seção metodológica de um livro pu-
blicado ou de um relatório que foi sido baseado em um levantamento.
Erros de levantamento
em perspectiva 13
O planejamento total do levantamento envolve considerar todos os aspectos

de um levantamento e escolher um nível de rigor apropriado aos propósitos
particulares do projeto. Os desvios mais comuns da boa prática e do bom plane-
jamento de levantamentos são discutidos nesse capítulo, juntamente com uma
avaliação dos respectivos potenciais de economia de custos e sua significância
para a precisão, a exatidão e a credibilidade das estimativas de levantamento.
O CONCEITO DE PLANEJAMENTO TOTAL DE UM LEVANTAMENTO
O planejamento total de um levantamento significa que quando se

planeja um levantamento ou se avalia a qualidade dos dados, olha-se
para o processo completo de coleta de dados, e não simplesmente para
um ou dois aspectos do levantamento. A qualidade da amostra (a estru-
tura, o tamanho, o formato e a taxa de resposta), a qualidade das ques-
tões como medidas, a qualidade da coleta de dados (especialmente o uso
de procedimentos eficazes de treinamento e supervisão de entrevistado-
res) e o método de coleta dos dados constituem um conjunto fortemente
inter-relação de questões e de decisões de planejamento, todos com o
potencial de afetar a qualidade dos dados resultantes. A completa apre-
ciação da abordagem do projeto total de levantamento aos erros de um
levantamento tem três implicações concretas:
1. Ao se planejar uma coleta de dados de levantamento, o pesqui-
sador, de forma autoconsciente, leva em conta as desvantagens
entre os custos e o rigor metodológico em todos os aspectos do
processo de planejamento do levantamento. Investimentos em

redução de erros em um aspecto do levantamento não são feitos
quando outros aspectos do levantamento não justificam tama-
nho nível de investimento.
2. Na avaliação da qualidade dos dados, os pesquisadores pergun-
tam sobre como todas as decisões que afetaram a qualidade dos
dados foram feitas e conduzidas.
3. Ao relatar os detalhes de um levantamento, um pesquisador de-
verá reportar detalhes relevantes de todos os aspectos dos esfor-
ços de coleta de dados que afetam o nível de erros dos dados.
ERRO EM PERSPECTIVA
É difícil generalizar, por entre todos os projetos considerados, a

significância das várias escolhas metodológicas discutidas neste livro. O
custo de tomar decisões rigorosas varia muito através das escolhas como
também variam para cada situação de pesquisa. Do mesmo modo, o po-
tencial para erro por tomar a decisão de menor custo também varia mui-
to. A ideia de um planejamento personalizado para um levantamento
significa que o pesquisador deveria diminuir a lista de opções de planeja-
mento com cautela, avaliando as alternativas, estimando o custo e o po-
tencial para erro, e tomando decisões sobre quais compromissos fazem
sentido e quais não. A seguir, encontram-se algumas possíveis generali-
zações que de algum modo podem ser úteis.
É muito raro ter uma estrutura de amostra perfeita que forneça a
todos os membros de uma população que o pesquisador quer estudar
uma chance de seleção. De quem fazer a amostra é uma decisão que
não pode ser avaliada fora do contexto. É incumbido aos pesquisadores
ser muito claro sobre o quão abrangente a sua estrutura de amostra era
e quem foi omitido, e não sugerir que a sua estimativa de amostra apli-
ca-se a pessoas que não tiveram chance de ser amostradas.
Provavelmente o compromisso mais comum de economia de custo
em pesquisa de levantamento acontece na área de amostragem. No pior
dos casos, algumas pessoas tentam generalizar desde os dados a serem
coletados até pessoas que não participaram da amostra, tais como leito-
res de revistas ou usuários de internet que voluntariamente preenchem
questionários. Usando amostras de não probabilidade, porém, ao fazer a
substituição das pessoas mais disponíveis ou dispostas por outras mais
difíceis de inscrever em amostras, é uma prática comum; é típica de mui-

tas consultas de opinião pública, política e em pesquisa de mercado. Na
verdade, para levantamentos feitos por telefone, permitir a substituição
da amostra não economiza uma grande quantidade de dinheiro, embora
permita que se façam amostras mais rapidamente. Para entrevistas feitas
pessoalmente em casas de família, entretanto, há uma considerável dife-
rença de custo entre a probabilidade e a não probabilidade das amostras.
O preço mais alto que alguém paga para tais custos é o de desistir da
credibilidade estatística com relação ao erro nos dados; não há nenhuma
base científica para descrever a relação da amostras com a população
amostrada. Se o objetivo do levanto é o de solicitar a opinião de amplo
espectro da população do que estaria facilmente acessível de outra for-
ma, tais procedimentos de amostragem não estatística podem servir bem
ao propósito. Apesar disso, se o interesse for de algo há mais do que or-
dens de estimativas de magnitude e quando a credibilidade científica se
torna um problema, as economias de custos derivadas da substituição
das amostras provavelmente não valerão à pena.
Um compromisso quase igualmente comum em levantamentos se-
ria o de aceitar baixas taxas de resposta. Quase todos os estudos de re-
torno antecipado de questionários por correio mostram que eles são
amostras tendenciosas, de forma que são diretamente relevantes ao as-
sunto do levantamento. As inclinações associadas com as baixas taxas de
resposta para levantamentos por telefone são um pouco menos drásticas.
O problema real é que nos falta boa informação sobre quando a ausência
de resposta é provável de afetar seriamente as estimativas. Erros devidos
à ausência de resposta são comuns e normalmente grandes, mas a quan-
tidade de erros não é altamente correlacionada com as taxas de resposta
(Groves, 2006). Isso faz com que se torne difícil dizer quando uma esti-
mativa das respostas é muito baixa e quando esforços adicionais signifi-
cantes são essenciais. A base é a credibilidade. Dados baseados em bai-
xas taxas de resposta são fáceis de criticar e os pesquisadores devem
decidir o quanto isso importa.
Devido ao fato de que a maioria das pessoas pensa no planejamen-
to de levantamentos pensa em amostragem, pouquíssimo tempo será
gasto aqui sobre esse tópico. Se alguém vai extrair uma amostra sofisti-
cada, a ajuda de um estatístico de amostragem qualificado é necessária.
Presumivelmente, tal estatístico irá considerar as vantagens entre vários
esquemas de amostragem para o cálculo de erros de amostragem. Um
ponto que deve ser notado aqui é que a maioria das amostras de popula-
ção abrange algum tipo de agrupamento. Na verdade, amostras agrupa-

das multiestágios são a melhor solução para uma grande quantidade de
problemas de amostragem. Entretanto, não é incomum ver relatos em
que os efeitos de agrupamento são ignorados nas estimativas de erros de
amostragem. Se os pesquisadores não tiverem uma amostra aleatória
simples eficaz, o que normalmente é o caso, não podem usar suposições
de amostragem aleatória simples na estimativa de erros-padrão.
A escolha do modo de coleta de dados é uma das mais fundamen-
tais escolhas que afetam os custos de um levantamento. Embora durante
anos os métodos de levantamentos pessoais tenham sido considerados o
único caminho efetivo para se conduzir levantamentos de populações ge-
rais, estratégias por telefone são agora de longe prevalentes do que entre-
vista de levantamentos pessoais na maioria das organizações de pesquisa.
Para muitos propósitos, o telefone forneceu uma forma eficaz de pro-
dução de dados de levantamento. Dependendo da situação, entrevistas feitas
pelo telefone podem estar em desvantagem em deixar de fora o segmento da
população sem telefones residenciais (o problema da estrutura da amostra),
na produção de maiores taxas de não resposta (apesar de não ser sempre
esse o caso) e em permitir aos pesquisadores que coletem menos dados (por-
que entrevistas por telefone geralmente são planejadas para durar menos do
que entrevistas feitas pessoalmente). Os procedimentos de levantamentos
feitos pelo telefone são as melhores respostas para muitos projetos. Como na
maioria dos procedimentos de economia de gastos, existem ocasiões em que
um preço não monetário na escolha do telefone é muito alto.
Protocolos de coletas de dados feitas por correio e pela internet
claramente são modos atrativos de coletar informações de algumas po-
pulações. Seus custos comparativamente baixos também fazem deles for-
tes candidatos para seu uso em combinações com métodos mais caros.
Os métodos menos caros podem ser usados para a coleta de dados da-
queles que usarão esses modos, enquanto outras abordagens podem ser
usadas na coleta de dados daqueles que são menos motivados a respon-
der ou que não podem responder facilmente para alguns modos (por
exemplo, porque lhes falta acesso à internet). Descobrir como combinar
os métodos de coletas de dados com a amostra, com o tópico e com as
necessidades do instrumento de uma forma rentável e que produza boas
taxas de respostas é um dos elementos mais essenciais de um bom proje-
to de levantamento. Alternativamente, confiar exclusivamente em um
modo que é inapropriado ou ineficiente para alguma parte da população
de estudo é um claro exemplo de um pobre planejamento de amostra.
A qualidade da equipe de entrevista é um dos aspectos menos

apreciados de uma pesquisa de levantamento. Vem sendo mostrado que
um bom treinamento e uma boa supervisão causam efeitos significativos
sobre como os entrevistadores conduzem entrevistas. Também, para um
bom número de questões comuns de levantamentos, entrevistadores po-
bremente treinados ou supervisionados podem aumentar a margem de
erro em volta das estimativas, bem como ter uma amostra pode fazer.
Isso significa que quando há importantes efeitos causados por entrevista-
dores nas respostas, uma amostra de 1.000 pode ter a efetiva precisão de
uma amostra com apenas 700. Apesar da significância da qualidade da
entrevista variar com o teor do levantamento e dos tipos de questões, a
maioria propósitos gerais do levantamento terá ao menos algumas ques-
tões que serão significantemente afetadas pelos entrevistadores. Nesse
contexto, fugir do treinamento aos entrevistadores e da supervisão pode
ser uma escolha improdutiva.
A qualidade da equipe de entrevista também afeta a taxa de respos-
ta. O uso de uma boa equipe de entrevistadores provou que atingir a coope-
ração dos respondentes é um dos modos mais fáceis de assegurar uma boa
taxa de resposta. Uma supervisão cuidadosa, um novo treinamento e a eli-
minação de entrevistadores que não são bons na conquista da cooperação
também são passos que irão valer a pena na redução da ausência de res-
postas a provavelmente não acrescerão muitos custos extras.
Os procedimentos padronizados que estruturam o modo como os
entrevistadores explicam a tarefa da entrevista aos respondentes podem
ser construídos nos levantamentos. Tais técnicas tem se mostrado ser um
modo praticamente livre de custos para aumentar o nível médio de de-
sempenho do respondente.
Finalmente, a avaliação profunda das questões de levantamento pode
ser uma das mais importantes e rentáveis formas de redução de erros de le-
vantamento. Por um apropriado uso dos grupos de foco e de entrevistas cog-
nitivas, os pesquisadores podem aprimorar o grau no qual as questões são
consistentemente entendidas e respondidas validamente. Estudos sistemáti-
cos de comportamento para pré-testes de campo podem identificar questões
que os entrevistadores não perguntam de uma forma consistente ou que
apresentem problemas para os respondentes. O aprimoramento das ques-
tões pode tanto melhorar a validade do relato do respondente quanto redu-
zir o efeito dos entrevistadores sobre as respostas.
CONCLUSÃO
Os objetivos de um bom planejamento e de uma boa prática são

produzir a maior exatidão, credibilidade e replicabilidade possível para
cada dólar. Quão preciso, crível e replicável deve ser um estudo particular
depende do problema a ser abordado e de como a informação será usada.
Ocasionalmente se poderá interpretar que a ciência social é inexa-
ta, e comparações desagradáveis são feitas entre os processos de medi-
ção das ciências sociais e das ciências físicas. Apesar de tais conclusões
serem comuns, elas são comumente desinformadas. Medições básicas
em ciências físicas e biomédicas, como o nível de chumbo em uma
amostra de sangue, as leituras de pressão sanguínea, a leitura de raios-x
e as medições de elasticidade dos metais, todas provam ter níveis não
triviais de insegurança. Medições em qualquer um desses campos po-
dem ser feitas tanto bem quanto mal pela metodologia usada e o cuida-
do que vai com o planejamento do processo de medição; Turner e Mar-
tin (1984) fornecem numerosos exemplos. O mesmo é verdadeiro para
a pesquisa de levantamento.
A minimização de erros em levantamentos geralmente vem com
um custo. Em alguns casos, o valor da melhor medição possivelmente
não vale o custo. Amostrar uma população pela amostragem de casas de
família omite pessoas que não podem ser associadas a famílias. Essa é
uma fração bem pequena do total da população na maioria das áreas,
contudo, e o custo de achar uma maneira de amostrar pessoas que não
podem ser associadas com famílias é extraordinário.
As taxas de ausência de resposta podem ser diminuídas a praticamen-
te zero. A Bureau of the Census rotineiramente alcança índices de respostas
de 90% para o National Health Interview Survey e para o Current Popula-
tion Survey, ainda que as taxas de respostas sejam menores nas grandes ci-
dades. Se se quer gastar tempo e dinheiro suficientes, pode-se provavelmen-
te atingir taxas de respostas próximas de 100%, mesmo nos segmentos mais
inospitaleiros de nossas cidades mais difíceis. Novamente o custo seria ex-
traordinário e o potencial de redução de erro seria modesto.
Felizmente os respondentes são capazes e dispostos a responder
várias das questões de grande interesse para os cientistas sociais e para
aqueles envolvidos na formulação de políticas. Para algumas outras ques-
tões, seria conveniente se os respondentes fossem capazes e dispostos a
responderem um processo padronizado de levantamento, mas eles não
são. Por exemplo, condenações por beber alcoolizado e falências são
marcadamente sub-relatadas usando técnicas-padrão de levantamento.

(Locander et al., 1976). Provavelmente há algum modo que um projeto
de pesquisa possa ser apresentado que induzirá a maioria das pessoas a
reportar tais fatos com exatidão, mas despenderia um maior esforço do
que os pesquisadores normalmente fazem para conquistar a cooperação
dos respondentes. Mais uma vez, existem decisões a serem tomadas so-
bre o quanto de exatidão e de detalhe são válidos no contexto de como
os dados serão usados. Os leitores são referidos para Groves (1989) por
um modo de análise muito mais extensivo quanto ao relacionamento en-
tre os custos e os erros do levantamento.
Vem sendo dito que o limite de uma pesquisa de levantamento é o
que as pessoas são capazes e estão dispostas a nos dizer dentro do con-
texto do levantamento. Esses limites, contudo, podem ser aumentados.
Certamente há alguns limites reais para o que pode ser medido com exa-
tidão usando procedimentos padronizados de levantamento. Ainda as-
sim, os limites provavelmente são muito mais seguidamente relacionados
a considerações orçamentais e em quanto esforço o pesquisador quer co-
locar no processo de medição do que no que é verdadeiramente factível.
O contexto no qual se avalia um planejamento é se os compromis-
sos feitos foram ou não os corretos, aqueles que são inteligentes e aque-
les que produzirão dados apropriados para o propósito em mãos. É tam-
bém válido ressaltar que erros de levantamento não resultam apenas de
decisões atenciosas de economia de custos. Também não tem havido
uma adequada apreciação da significância da ausência de respostas, do
planejamento das questões e do desempenho dos entrevistadores para a
qualidade das estimativas de levantamento. Uma completa falta de aten-
ção a esses importantes aspectos da coleta de dados rotineiramente pro-
duzem levantamentos de dados que carecem de credibilidade ou que não
atendem os padrões de última geração para a confiabilidade.
Compreender o conceito de planejamento completo articulado nes
se livro deve significar o seguinte:
• Nenhuma característica da coleta de dados será tão pobre ou tão
fraca que possa enfraquecer a habilidade do pesquisador de usar
os dados para alcançar os objetivos do levantamento.
• O planejamento de todas as fases da coleta de dados será relati-
vamente consistente, para que assim os investimentos não te-
nham sido feitos para produzir precisão em um aspecto do pro-
cesso de coleta de dados que não sejam justificados pelo nível de
precisão que outros aspectos do planejamento irão gerar.
• Usuários do levantamento de dados terão um respeito apropria-

do aos usos das estimativas baseadas em uma amostra de levan-
tamento, às prováveis fontes de erro nos levantamentos e aos li-
mites de precisão e confidência que eles podem ter nas estimati-
vas baseadas em levantamentos.
Finalmente, é esperado que os usuários da pesquisa tenham uma

completa compreensão das questões que eles devem perguntar sobre a co-
leta de dados em qualquer levantamento, que os pesquisadores tenham
um melhor entendimento da significância dos detalhes das decisões do
planejamento e que todos os leitores partam com um comprometimento
renovado para um melhor planejamento e execução de levantamentos.
Referências
American Association for Public Opinion Research. (2006). Standard definitions:

Final dispositions of case codes and outcome rates for surveys (4th ed.). Lenexa, KS:
AAPOR.
Anderson, B., Silver, B., & Abramson, P. (1988). The effects of race of the interviewer
on measures of electoral participation by blacks. Public Opinion Quarterly, 52(1),
53-83.
Aquilino, W. S. (1994). Interview mode effects in surveys of drug and alcohol use: A
field experiment. Public Opinion Quarterly, 58(2), 210-240.
Aquilino, W. S. (1998). Effects of interview mode on measuring depression in younger
adults. Journal of Official Statistics, 14(1), 15-30.
Aquilino, W. S., & Losciuto, L. A. (1990). Effects of mode of interview on self-reported
drug use. Public Opinion Quarterly, 54(3), 362-391.
Baker, R. P., Crawford, S., & Swinehart, J. (2004). Development and testing of Web
questionnaires. In S. Presser et al. (Eds.), Methods or testing and evaluating survey
questionnaires (pp. 361-384). New York: John Wiley.
Beatty, P. (1995). Understanding the standardized/non-standardized interviewing
controversy. Journal of Official Statistics, 11(2), 147-160.
Belli, R. P., Lee, E. H., Stafford, F. P., & Chou, C. (2004). Calendar and question-list
survey methods: Association between interviewer behaviors and data quality. Journal
of Official Statistics, 20(2), 185-218.
Belson, W. A. (1981). The design and understanding of survey questions. Aldershot, UK:
Gower. Berry, S., & Kanouse, D. (1987). Physician response to a mailed survey: An
experiment in timing of payment. Public Opinion Quarterly, 57(1), 102-114.
Billiet, J., & Loosveldt, G. (1988). Interviewer training and quality of responses. Public
Opinion Quarterly, 52(2), 190-211.
Bishop, G. R, Hippler, H. J., Schwartz, N., & Strack, F. (1988). A comparison of
response effects in self-administered and telephone surveys. In R. M. Groves, P. N.
Biemer, L. E. Lyberg, J. T. Massey, W. L. Nichols II, & J. Waksberg (Eds.), Telephone
survey methodology (pp. 321-340). New York: John Wiley.
Blom, E., & Lyberg, L. (1998). Scanning and optical character recognition in survey
organizations. In M. P. Couper et al. (Eds.), Computer assisted survey information
collection (pp. 449-520). New York: John Wiley.
218 Referências
Blumberg, S., Lake, J., & Cynamon, M. (2006). Telephone coverage and health survey
estimates: Evaluating concerns about wireless substitutes. American Journal of Public
Health, 96, 926-931.
Bradbum, N. M., & Sudman, S. (1992). The current status of questionnaire design.
In P. N. Beimer, R. M. Groves, L. E. Lyberg, N. Mathiowetz, & S. Sudman (Eds.),
Measurement errors in surveys (pp. 29^0). New York: John Wiley.
Bradbum, N. M., Sudman, S., & Associates (1979). Improving interview method and
questionnaire design. San Francisco: Jossey-Bass.
Brick, J. M., Dipko, S., Presser, S., Tucker, C., &Yuan,Y. (2006). Nonresponse bias in
a dual frame sample of cell and landline numbers. Public Opinion Quarterly, 70(5),
780-793.
Brick, J. M., Waksberg, J., Kulp, D., & Starer, A. (1995). Bias in list-assisted telephone
samples. Public Opinion Quarterly, 59, 218-235.
Bryson, M. (1976, November). The Literary Digest poll: Making of a statistical myth.
American Statistician, pp. 184-185.
Burton, S., & Blair, E. (1991). Task conditions, response formulation processes, and
response accuracy for behavioral frequency questions in surveys. Public Opinion
Quarterly, 55, 50-79.
Cannell, C., & Fowler, F. (1964). A note on interviewer effect in self-enumerative pro
cedures. American Sociological Review, 29, 276.
Cannell, C., Groves, R., Magilavy, L., Mathiowetz, N., & Miller, P. (1987). An experi
mental comparison of telephone and personal health interview surveys. Vital & Health
Statistics, Series 2, 106. Washington, DC: Government Printing Office.
Cannell, C., Marquis, K., & Laurent, A. (1977). A summary of studies. Vital & Health
Cannell, C., & Oksenberg, L. (1988). Observation of behaviour in telephone
interviewers. In R. M. Groves, P. N. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nichols
H, & J. Waksberg (Eds.), Telephone survey methodology (pp. 475^195). New York:
JohnWiley.
Cannell, C., Oksenberg, L., & Converse, J. (1977). Experiments in interviewing tech
niques: Field experiments in health reporting, 1971-1977. Hyattsville, MD: National
Center for Health Services Research.
Catania, J. A., Gibson, D., Chitwood, D., & Coates, T. (1990). Methodological prob
lems in AIDS behavioral research: Influences on measurement error and participation
bias in studies of sexual behavior. Psychological Bulletin, 108(3), 339-362.
Catlin, 0., & Ingram, S. (1988). The effects of CATI on costs and data quality: A com
parison of CATI and paper methods in centralized interviewing. In R. M. Groves, P. N.,
Biemer, L. E., Lyberg, J. T., Massey, W. L. Nichols II. & J. Waksberg (Eds.), Telephone
survey methodology (pp. 437—445). New York: John Wiley.
Chromy, J. R., Eyerman, J., Odom, D., McNeeley, M. E., & Hughes, A. (2005).
Association between interviewer experience and substance use prevalence rates in
NSDUH. In J. Kennett & J. Gfoerrer (Eds.), Evaluating and improving methods used in
the NSDUH (DHHS Publication number SMA 05-4044, methodology series M-5) (pp.
59-87). Rockville, MD: SAMSA.
Citro, C., Ilgen, D., & Marrett, C. (2003). Protecting participants and facilitating social
and behavioral sciences research. Washington, DC: National Academy Press.
Conrad, F. G., & Schober, M. F. (2000). Clarifying question meaning in a household
telephone survey. Public Opinion Quarterly, 64(1), 1-28.
Converse, J. (1987). Survey research in the United States. Berkeley: University of
California Press.
Referências 219
Converse, J., & Presser, S. (1986). Survey questions. Beverly Hills, CA: Sage.
Couper, M. P. (2007). Issues of representation in eHealth research (with a focus on
Web surveys). American Journal of Preventive Medicine, 32(5S), S83-S89.
Couper, M. P., et al. (Eds.). (1998). Computer assisted survey information collection.
Couper, M. P., Hansen, S. E., & Sadowsky, S. A. (1997). Evaluating interviewer use of
CAPI technology. In L. E. Lyberg, P. Beimer, M. Collins, & E. D. de Leeuw (Eds.), Survey
measurement and process quality (pp. 267-286). New York: John Wiley.
Cronbach, L. (1951). Coefficient alpha and the internal structure of tests. Psychiatrika,
16, 297-334.
Cronbach, L., & Meehl, P. (1955). Construct validity in psychological tests. Psychological
Bulletin, 52, 281-302.
de Leeuw, E. D. (2008). Choosing the method of data collection. In E. D. de Leeuw,
J. J. Hox, & D. A. Dillman (Eds.), International handbook of survey methodology (pp.
113-135). Mahwah, NJ: Lawrence Erlbaum.
de Leeuw, E. D., & de Heer, W. (2002). Trends in household survey nonresponse: A lon
gitudinal and international comparison. In R. M. Groves, D. A. Dillman, J. E. Eitinge, &
R. J. A. Little (Eds.), Survey nonresponse (pp. 41-54). New York: John Wiley.
de Leeuw, E. D., Dillman, D. A., & Hox, J. J. (2008). Mixed mode surveys: When and
why. In E. D. de Leeuw, J. J. Hox, & D. A. Dillman (Eds.), International handbook of
survey methodology (pp. 299-316). Mahwah, NJ: Lawrence Erlbaum.
de Leeuw, E. D., & van der Zouwen, J. (1988). Data quality in telephone and face to
face surveys: A comparative meta-analysis. In R. M. Groves, P. N. Biemer, L. E. Lyberg,
J. T. Massey, W. L. Nichols II, & J. Waksberg (Eds.), Telephone survey methodology (pp.
283-299). New York: John Wiley.
DeMaio, T. J., & Rothgeb, J. M. (1996). Cognitive interviewing techniques—in the lab
and in the field. In N. A. Schwarz & S. Sudman (Eds.), Answering questions (pp. 177-
196). San Francisco: Jossey-Bass.
Department of Health and Human Services. (2005). Protection of human subjects. Title
45, Code of Regulations, Part 46. Washington, DC: Government Printing Office.
DeVellis, R. F. (2003). Scale development: Theory and applications. Newbury Park, CA: Sage.
Dielman, L., & Couper, M. P. (1995). Data quality in CAPI survey: Keying errors. Journal
of Official Statistics, 11(2), 141-146.
Dillman, D. A. (2007). Mail and Internet surveys: The tailored design method (2nd ed.).
Dillman, D. (2008). The logic and psychology of constructing questionnaires. In
E. D. de Leeuw, J. J. Hox, & D. A. Dillman (Eds.), International handbook of survey
methodology (pp. 161-175). Mahwah, NJ: Lawrence Erlbaum.
Dillman, D. A., & Miller, K. J. (1998). Response rates, data and feasibility for optical
scannable mail surveys for small research centers. In M. P. Couper et al. (Eds.), Com
puter assisted survey information collection (pp. 475-498). New York: John Wiley.
Dillman, D. A., & Redline, C. D. (2004). Testing self-administered questionnaires:
Cognitive interview and field test comparision. In S. Presser et al. (Eds.), Methods for
testing and evaluating survey questionnaires (pp. 299-318). New York: John Wiley.
Dillman, D. A., & Tamai, J. (1991). Mode effects of cognitively designed recall ques
tions: A comparison of answers to telephone and mail surveys. In P. N. Biemer, R. M.
Corres, L. E. Lyberg, N. A. Mathiowetz, & S. Sudman (Eds.), Measurement errors in
surveys (pp. 367-393). New York: John Wiley.
Dykema, J., Lepkowski, J., & Blixt, S. (1997). The effect of interviewer and respon
dent behavior on data quality: Analysis of interaction coding in a validation study. In
220 Referências
L. Lyberg et al. (Eds.), Survey measurement and process quality (pp. 287-310). New
York: John Wiley.
Edwards, W. S., et al. (1994). Evaluation of National Health Interview Survey diag
nostic reporting. In Vital & Health Statistics, Series 2, No. 120. Hyattville, MD: National
Center for Health Statistics.
Edwards, W. S., Winn, D. M., & Collins, J. G. (1996). Evaluation of 2-week doctor visit
reporting in the National Health Interview Survey. In Vital & Health Statistics, Series 2,
No. 122. Hyattsville, MD: National Center for Health Statistics.
Erlich, J., & Riesman, D. (1961). Age and authority in the interview. Public Opinion
Quarterly, 24, 99-114.
Filion, F. (1975). Estimating bias due to nonresponse in mail surveys. Public Opinion
Quarterly, 39(4), 482-492.
Forsyth, B. H., & Lessler, J. T. (1992). Cognitive laboratory methods: A taxonomy.
In P. N. Biemer, R. M. Groves, L. E. Lyberg, N. A. Mathiowetz, & S. Sudman (Eds.),
Measurement errors in surveys (pp. 393-418). New York: John Wiley.
Fowler, F. J. (1991). Reducing interviewer related error through interviewer training,
supervision, and other means. In P. N. Biemer, R. M. Groves, L. E. Lyberg, N. A.
Mathiowetz, & S. Sudman (Eds.), Measurement errors in surveys (pp. 259-278). New
York: John Wiley.
Fowler, F. J. (1992). How unclear terms affect survey data. Public Opinion Quarterly,
56(2), 218-231.
Fowler, F. J. (1995). Improving survey questions. Thousand Oaks, CA: Sage.
Fowler, F. J. (2004). Getting beyond pretesting and cognitive interviews: The case for
more experimental pilot studies. In S. Presser et al. (Eds.), Questionnaire development,
evaluation, and testing methods (pp. 173-188). New York: John Wiley.
Fowler, F. J., & Cannell, C. F. (1996). Using behavioral coding to identify cognitive
problems with survey questions. In N. A. Schwarz & S. Sudman (Eds.), Answering
questions (pp. 15-36). San Francisco: Jossey-Bass.
Fowler, F. J., & Cosenza, C. (2008). Writing effective survey questions. In J. Hox, E. D.
de Leeuw, & D. Dillman (Eds.), The international handbook of survey methodology (pp.
Fowler, F. J., Gallagher, P. M., Stringfellow, V. L., Zaslavsky, A. M., Thompson, J. W., &
Cleary, P. D. (2002). Using telephone interviewers to reduce nonresponse bias to mail
surveys of health plan members. Medical Care, 40(3), 190-200.
Fowler, F. J., & Mangione, T. W. (1990). Standardized survey interviewing: Minimizing
interviewer related error. Newbury Park, CA: Sage.
Fowler, F. J., Roman, A. M., & Di, Z. X (1998). Mode effects in a survey of Medicare
prostate surgery patients. Public Opinion Quarterly, 62(1), 29^46.
Fox, J. A., & Tracy, P. E. (1986). Randomized response: A method for sensitive surveys.
Beverly Hills, CA: Sage.
Fox, R., Crask, M., & Kirn, J. (1988). Mail survey response rate: A meta-analysis of
selected techniques for increasing response. Public Opinion Quarterly, 52(4), 467-91.
Friedman, P. A. (1942). A second experiment in interviewer bias. Sociometry, 15, 378-381.
Gallagher, P. M., Fowler, F. J., & Stringfellow, V. (2005). The nature of nonresponse
in a Medicaid survey: Causes and consequences. Journal of Official Statistics, 21(1),
73-87.
Graesser, A. C., Cai, Z., Louwerse, M., & Daniel, P. (2006). Question understanding aid
(QUAID): A Web facility that helps survey methodologists improve the comprehension
of questions. Public Opinion Quarterly, 70(1), 1-20.
Groves, R. M. (1989). Survey errors and survey costs. New York: John Wiley.
Referências 221
Groves, R. M. (2006). Nonresponse rates and nonresponse bias in household surveys.

Public Opinion Quarterly, 70(5), 641-675.
Groves, R. M., & Couper, M. P. (1998). Nonresponse in household interview surveys.
Groves, R. M., et al. (2006). Experiments in producing nonresponse bias. Public
Groves, R. M., Dillman, D. A., Eitinge, J. L., & Little, R. J. A. (Eds.). (2002) Survey
nonresponse. New York: John Wiley.
Groves, R. M., Fowler, F. J., Couper, M. P., Lepkowski, J. M., Singer, E., & Tourangeau,
R. (2004). Survey methodology. New York: John Wiley.
Groves, R. M., & Kahn, R. L. (1979). Surveys by telephone. New York: Academic Press.
Groves, R. M., & Lyberg, L. (1988). An overview of nonresponse issues in telephone
surveys. In R. M. Groves, P. N. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nichols II, & J.
Waksberg (Eds.), Telephone survey methodology (pp. 191-212). New York: John Wiley.
Groves, R.M., Presser, S., & Dipko, S. (2004) The role of topic interest in survey par
ticipation decisions. Public Opinion Quarterly, 68(1), 2-31.
Hansen, S. E., & Couper, M. P. (2004). Usability testing to evaluate computer-assisted
instruments. In S. Presser et al. (Eds.), Methods for testing and evaluating survey
questionnaires (pp. 337-360). New York: John Wiley.
Harkness, J. A., Van de Vijver, F. J. R., & Mohler, P. P. (2003). Cross-cultural survey
methods. New York: John Wiley.
Heberlein, T., & Baumgartner, R. (1978). Factors affecting response rates to mailed
questionnaires: A quantitative analysis of the published literature. American Sociological
Review, 43, 447-462.
Henry, G. T. (1990). Practical sampling. Newbury Park, CA: Sage.
Henson, R., Roth, A., & Cannell, C. (1977). Personal versus telephone interviews: The
effect of telephone reinterviews on reporting of psychiatric symptomatology. In C.
Cannell, L. Oksenberg, & J. Converse (Eds.), Experiments in interviewing techniques:
Field experiments in health reporting, 1971-1977 (pp. 205-219). Hyattsville, MD:
National Center for Health Services Research.
Hochstim, J. (1967). A critical comparison of three strategies of collecting data from
households. Journal of the American Statistical Association, 62, 976-989. Houtkoop-
Steenstra, H. (2000). Interaction and the standardised survey interview: The living
questionnaire. Cambridge, UK: Cambridge University Press.
Hyman, H., Feldman, J., & Stember, C. (1954). Interviewing in social research. Chicago:
University of Chicago Press.
Jabine, T. B., Straf, M. L., Tanur, J. M., & Tourangeau, R. (Eds.). (1984). Cognitive
aspects of survey methodology: Building a bridge between disciplines. Washington, DC:
National Academy Press.
James, J., & Bolstein, R. (1990). The effect of monetary incentives and follow-up
mailings on the response rate and the response quality in mail surveys. Public Opinion
Quarterly, 54(3), 346-361.
Jobber, D. (1984). Response bias in mail surveys: Further evidence. Psychological
Reports, 54, 981-984.
Kalton, G. (1983). Introduction to survey sampling. Beverly Hills, CA: Sage.
Kaplowitz, M. D., Hadlock, T. D., & Levine, R. (2004). A comparison of Web and mail
survey response rates. Public Opinion Quarterly, 68(1), 94—101.
Keeter, S., Kennedy, C., Dimock, M., Best, J., & Craighill, P. (2006). Gauging the impact
of growing nonresponse on estimates from a national RDD telephone survey. Public
222 Referências
Keeter, S., Miller, C., Kohut, A., Groves, R. M., & Presser, S. (2000). Consequences
ofreducing nonresponse in a national telephone survey. Public Opinion Quarterly,
64(2), 125-148.
Kish, L. (1949). A procedure for objective respondent selection within the household.
Journal of the American Statistical Association, 44, 380-387.
Kish, L. (1962). Studies of interviewer variance for attitudinal variables. Journal of
the American Statistical Association, 57, 92-115. Kish, L. (1965). Survey sampling. New
York: John Wiley.
Krosnick, J. A., Judd, C. M., & Wittenbrink, B. (2007). The measurement of attitudes.
In D. Albarracin, B. T. Johnson, & M. P. Zanna (Eds.), The handbook of attitudes (pp.
Lavrakas, P. J., Stuttles, C. D., Steeh, C., & Fienberg, H. (2007). The state of surveying
cell phone numbers in the United States in 2007 and beyond. Public Opinion Quarterly,
71(5), 814-854.
Lepkowski, J. M. (1988). Telephone sampling methods in the United States. In R. M.
Groves, P. N. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nichols II, & J. Waksberg (Eds.),
Telephone survey methodology (pp. 73-98). New York: John Wiley.
Lessler, J. T, & Forsyth, B. H. (1996). A coding system for appraising questionnaires. N.
A. Schwartz & S. Sudman (Eds.), Answering questions (pp. 259-292). San Francisco:
Jossey-Bass.
Lessler, J. T., & Kalsbeek, W. D. (1992). Nonsampling error in surveys. New York: John
Wiley.
Lessler, J., & Tourangeau, R. (1989). Questionnaire design in the cognitive research laboratory.
Vital & Health Statistics, Series 6, 1. Washington, DC: Government Printing Office.
Likert, R. (1932). A technique for measurement of attitudes. Archives of Psychology, 140.
Locander, W., Sudman, S., & Bradbum, N. (1976). An investigation of interview me
thod, threat and response distortion. Journal of the American Statistical Association,
71, 269-275.
Lohr, S. L. (1998). Sampling design and analysis. New York: Brooks/Cole.
Mangione, T., Hingson, R., & Barret, J. (1982). Collecting sensitive data: A compari
son of three survey strategies. Sociological Methods and Research, 10(3), 337-346.
Marin, G., & Marin, B. V. (1991). Research with Hispanic populations. Newbury Park,
CA: Sage.
Marquis, K., Cannell, C., & Laurent, A. (1972). Reporting health events in household
interviews: Effects of reinforcement, question length, and reinterviews. Vital & Health
McDowell, I. (2003). Measuring health: A guide to rating scales and questionnaires (3rd
ed.). Oxford, UK: Oxford University Press.
McHomey, C. A., Kosinsky, M., & Ware, J. E. (1994). Comparisons of the cost and
quality of norms for the SF-36 Health Survey by mail versus phone interviews: Results
from a national survey. Medical Care, 32(6), 551-567.
Miller, P. V., & Cannell, C. F. (1977). Communicating measurement objectives in the
interview. In P. Hirsch, P. V. Miller, & F. G. Kline (Eds.), Strategies/or communication
research (pp. 127-152). Beverly Hills: Sage.
National Commission for the Protection of Human Subjects of Biomedical and Behavioral
Research. (1979). Belmont report: Ethical principles and guidelines for the protection of
human subjects of research. Washington, DC: Government Printing Office.
Nichols, W. L., Baker, R. P., & Martin, J. (1997). The effect of new data collection tech
nologies on survey data quality. In L. Lyberg et al. (Eds.), Survey measurement and
process quality (pp. 221-248). New York: John Wiley.
Referências 223
Office of Management and Budget. (2006). Standards and guidelines for statistical
surveys. Washington, DC: Author.
Oksenberg, L., Cannell, C., & Kalton, G. (1991). New strategies of pretesting survey
questions. Journal of Official Statistics, 7(3), 349-366.
Payne, S. (1951). The art of asking questions. Princeton, NJ: Princeton University
Press.
Penne, M. A., Lessler, J. T., Beiler, G., & Caspar, R. (1998). Effects of experimental and
audio computer-assisted self-interviewing (ACASI) on reported drug use in the HSDA.
In Proceedings, 1998 (section on survey research methods; pp. 744-749). Alexandria,
VA: American Statistical Association.
Presser, S., Rothgeb, J. M., Couper, M. P., Lessler, J. T., Martin, E., Martin, J., & Singer,
E. (Eds.). (2004). Methods of testing and evaluating survey questionnaires. Hoboken,
NJ: John Wiley.
Rizzo, L., Brick, J. M., & Park, I. (2004). A minimally intrusive method for sampling
persons in random-digit dial surveys. Public Opinion Quarterly, 68(2), 267-274.
Robinson, D., & Rhode, S. (1946). Two experiments with an anti-Semitism poll.
Journal of Abnormal Psychology, 41, 136-144.
Robinson, J. P. (1989). Poll review: Survey organization differences in estimating
public participation in the arts. Public Opinion Quarterly, 53(3), 397-414.
Robinson, J. P., Shaver, P. R., & Wrightsman, L. S. (Eds.). (1997). Measures of per
sonality and social psychological attitudes (Vol. 1). New York: Harcourt Brace.
Saris, W., & Andrews, F. (1991). Evaluation of measurement instrument using a struc
tural modeling approach. In P. Biemer, R. Groves, L. Lyberg, N. A. Mathiowetz, & S.
Sudman (Eds.), Measurment errors in surveys (pp. 575-597). New York: John Wiley.
Schaeffer, N. C. (1992). Interview: Conversation with a purpose or conversation? In
P. Biemer, R. Groves, L. Lyberg, N. A. Mathiowetz, & S. Sudman (Eds.), Measurment
errors in surveys (pp. 367-393). New York: John Wiley.
Schober, M. R, & Conrad, F. G. (1997). Conversational interviewing. Public Opinion
Quarterly. 61(4), 576-602.
Schuman, H., & Converse, J. (1971). The effects of black and white interviewers on
black responses in 1968, Public Opinion Quarterly, 35, 44-68.
Schuman, H., & Presser, S. (1981). Question and answers in attitude surveys. New York:
Academic Press.
Sieber, J. (1992). Planning ethically responsible research: Developing an effective pro
tocol. Newbury Park, CA: Sage.
Singer, E. (2002). The use of incentives to reduce nonresponse in household surveys.
In R. M. Groves, D. A. Dillman, J. E. Eitinge, & R. J. A. Little (Eds.), Survey non-
response (pp. 163-177). New York: John Wiley.
Singer, E., Van Hoewyk, J., Gebler, N., Raghunnathan, T, & McGanagle, K. (1999).
The effect of incentives on response rates in interviewer-mediated surveys. Journal of
Official Statistics, 15(2), 217-230.
Singer, E., Van Hoewyk, J., & Maher, M. P. (2000). Experiments with incentives in tele
phone surveys. Public Opinion Quarterly, 64(2), 171-188.
Sirken, M. G., Herrmann, D. J., Schechter, S., Schwarz, N., Tanur, J. M., & Tourangeau,
R. (1999). (Eds.). Cognition and survey research. New York: John Wiley.
Suchman, L., & Jordan, B. (1990). Interactional troubles in face-to-face survey inter
views. Journal of the American Statistical Association, 85, 232-241.
Sudman, S. (1967). Reducing the cost of surveys. Chicago: Aldine.
Sudman, S. (1976). Applied sampling. New York: Academic Press.
Sudman, S., & Bradbum, N. (1982). Asking questions. San Francisco: Jossey-Bass.
224 Referências
Tanur, J. M. (1991). Questions about questions. New York: Russell Sage.

Tamai, J., & Moore, D. L. (2004). Methods for testing and evaluating computer-
assisted questionnaires. In S. Presser et al. (Eds.), Methods/or testing and evaluating
survey questionnaires (pp. 319-338). New York: John Wiley.
Thurstone, L., & Chave, E. (1929). The measurement of attitude. Chicago: University
of Chicago Press.
Tourangeau, R., Rips, L., & Rasinski, K. (2000). The psychology of survey response.
Cambridge, UK: Cambridge University Press.
Tourangeau, R., & Smith, T. W. (1998). Collecting sensitive data with different modes
of data collection. In M. P. Couper et al. (Eds.), Computer assisted survey information
collection (pp. 431^53). New York: John Wiley.
Turner, C. F., et al. (1998). Automated self-interviewing and the survey measurement
of sensitive behaviors. In M. P. Couper et al. (Eds.), Computer assisted survey infor
mation collection (pp. 455—473). New York: John Wiley.
Turner, C. R, & Martin, E. (1984). Surveying subjective phenomena. New York: Russell
Sage.
Villarroel, M. A., et al. (2006). Same-gender sex in the United States: Impact of
T-ACASI on prevalence estimates. Public Opinion Quarterly, 70(2), 166-196.
Waksberg, J. (1978). Sampling methods for random-digit dialing. Journal of the
American Statistical Association, 73, 40-46.
Ware, J. (1987). Standards for validating health measures: Definition and content.
Journal of Chronic Diseases, 40, 473^1-80.
Warriner, K., Goyder, J., Jersten, H., Hohner, P., & McSpurren, K. (1996). Cash versus
lotteries versus charities in mail surveys. Public Opinion Quarterly, 60(4), 542-562.
Weiss, C. (1968). Validity of welfare mothers' interview responses. Public Opinion
Quarterly, 32, 622-633.
Willis, G. B. (2005). Cognitive interviewing. Thousand Oaks, CA: Sage.
Willis, G. B., DeMaio, T., & Hams-Kojetin, B. (1999). Is the bandwagon headed to
the methodicalogical promised land? Evaluating the validity of cognitive interviewing
techniques. In M. G. Sirken, D. J. Herrmann, S. Schechter, N. Schwarz, J. M. Tanur, &
R. Tourangeau (Eds.), Cognition and survey research (pp. 133-154). New York:
John Wiley.
Wilson, B. F., Alman, B. M., Whitaker, K., & Callegro, M. (2004). How good is good?
Comparing numerical ratings of response options for two versions of the self-assessed
health status questions. Journal of Official Statistics, 20(2), 379-391.
Índice onomástico
Abramson, P., 162 Cannell, C., 17, 69, 93, 94, 114, 129, 132,
Alman, B. M., 127 133, 137, 150, 157, 161, 169, 169, 173
Anderson, B., 162 Caspar, R., 134
Andrews, F., 29 Catania, J. A., 133
Aquilino, W. S., 94, 133 Catlin, O., 100
Chave, E., 17, 124
Baker, R. P., 149, 186 Chitwood, D., 133
Barret, J., 93 Chou, C., 132
Baumgartner, R., 68, 91, 96 Chromy, J. R., 161
Beatty, P., 171 Citro, C., 197
Beiler, G., 134 Coates, T., 133
Belli, R. F., 132 Collins, J. G., 129
Belson, W. A., 114 Conrad, F. G., 18, 116, 171, 172
Berry, S., 76 Converse, J., 16, 17, 18, 68, 81, 137,
Best, J., 70 140, 157, 162, 169
Billiet, J., 17, 165, 169 Cosenza, C., 144
Beshop, G. F., 92 Couper, M. P., 34, 69, 73, 74, 100, 149,
Blair, E., 132 151, 186
Blixt, S., 172 Craighill, P., 70
Blom, E., 185 Crask, M., 70
Blumberg, S., 33 Crawford, S., 149
Bolstein, R., 76 Cronbach, L., 29, 110, 136
Bradburn, N. M., 133, 137, 140, 161 Cynamon, M., 33
Brick, J. M., 50, 48
Bryson, M., 68 Daniel, F., 144
Burton, S., 132 de Heer, W., 69
de Leeuw, E. D., 69, 93, 106, 133
Cai, Z., 144 DeMaio, T. J., 145
Callegro, M., 127 DeVellis, R. F., 136
226 Índice onomástico
Di, Z. X., 77, 94 Hyman, H., 17

Dielman, L., 185 Ilgen, D., 197
Dillman, D. A., 75, 78, 94, 96, 106, 128, Ingram, S., 100
134, 149, 152, 185
Dimock, M., 70 Jabine, T. B., 132
Dipko, S., 48, 70 James, J., 76
Dykema, J., 172 Jersten, H., 76
Jobber, D., 68, 91
Edwards, W. S., 129 Jordan, B., 171
Erlich, J., 162 Judd, C. M., 128
Eyerman, J., 161
Kahn, R. L., 69, 93
Feldman, J., 17, Kalton, G., 31, 114
Fienberg, H., 48 Kanouse, D., 76
Filion, F., 67 Kaplowitz, M. D., 78
Forsyth, B. H., 144, 145 Keeter, S., 70, 70, 85
Fowler, F. J., 17, 68, 77, 91, 94, 94, 96, Kennedy, C., 70
114, 118, 130, 134, 140, 144, 145, Kim, J., 76
150, 157, 159, 161, 165, 169, 170, 172, Kish, L., 31, 50, 174
174 Kohut, A., 70
Fox, J. A., 134 Kosinky, M., 94
Fox, R., 76 Krosnick, J. A., 128
Friedman, P. A., 17 Kulp, D., 47
Gallagher, P. M., 68 Lake, J., 33

Gebler, N., 74 Laurent, A., 129, 133, 137, 157, 161, 173
Gibson, D., 133 Lavrakas, P. J., 48
Goyder, J., 76 Lee, E. H., 132
Graesser, A. C., 144 Lepkowski, J. M., 47, 172
Groves, R. M., 18, 31, 40, 50, 67, 69, 70, Lessler, J. T., 134, 144, 145
73, 74, 79, 85, 93, 96, 118, 140, 161, Levine, R., 78
174, 207, 211, 215 Likert, R., 17
Locander, W., 133, 215
Hadlock, T. D., 78 Lohr, S. L., 31
Hansen, S. E., 149, 151 Loosveldt, G., 17, 165, 169
Harkness, J. A., 119 Losciuto, L. A., 133
Harris-Kojetin, B., 145 Louwerse, M., 144
Heberlein, T., 67, 91, 96 Lyberg, L., 50, 69, 185
Henry, G. T., 31, 84
Henson, R., 94, 133 Magilavy, L., 69
Herrmann, D. J., 132 Maher, M. P., 74
Hingson, R., 93 Mangione, T. W., 17, 93, 94, 96, 118,
Hippler, H. J., 92 134, 151, 157, 159, 161, 165, 169, 170,
Hochstim, J., 93, 94, 96, 133 172
Hohner, P., 76 Marin, B. V., 119
Houtkoop-Steenstra, H., 171, 181 Marin, G., 119
Hox, J. J., 106 Marquis, K., 129, 132, 137, 157, 173, 161
Hughes, A., 161 Marrett, C., 197
Índice onomástico 227
Martin, E., 18, 135, 137, 214 Shaver, P. R., 138

Martin, J., 186 Shuttles, C. D., 48
Mathiowetz, N., 69 Sieber, J., 77, 197, 199, 201
McDowell, I., 138, 144 Silver, B., 162
McGanagle, K., 74 Singer, E., 74
McHorney, C. A., 94 Sirken, M. G., 132
McNeeley, M. E., 161 Smith, T. W., 94, 134
McSpurren, K., 76 Stafford, F. P., 132
Meehl, P., 29, 110 Starer, A., 47
Miller, C., 70 Steeh, C., 48
Miller, K. J., 185 Stember, C., 17
Miller, P. V., 70, 169 Strack, F., 92
Mohler, P. P., 119 Straf, M. L., 132
Moore, D. L., 149, 152 Stringfellow, V., 68
Suchman, L., 171
Nichols, W. L., 186 Sudman, S., 31, 83, 133, 137, 140, 161
Swinehart, J., 149
Odom, D., 161
Oksenberg, L., 17, 114, 137, 150, 157, 169 Tamai, J., 152
Tanur, J. M., 114, 132
Park, I., 50 Tarnai, J., 94, 128, 134, 149
Payne, S., 16 Thurstone, L., 17, 124
Penne, M. A., 134 Tourangeau, R., 94, 114, 129, 132, 145,
Presser, S., 17, 48, 70, 70, 92, 118, 125, 134
128, 137, 140, 145 Tracy, P. E., 134
Raghunnathan, T., 74 Tucker, C., 48
Rasinski, K., 114, 129 Turner, C. F., 18, 94, 134, 135, 137, 214
Redline, C. D., 149, 152
Rhode, S., 162 Vande de Vijver, F. J. R., 119
Riesman, D., 162 van der Zouwen, J., 93, 133
Rips, L., 114, 129 Van Hoewyk, J., 74
Rizzo, L., 50 Villarroel, M. A., 134
Robinson, D., 162 Waksberg, J., 16, 44, 47
Robinson, J. P., 84, 138 Ware, J. E., 94, 207
Roman, A. M., 77, 94 Warriner, K., 76
Roth, A., 94 Weiss, C., 162
Rothgeb, J. M., 145 Whitaker, K., 127
Willis, G. B., 132, 140, 145
Sadowsky, S. A., 151 Wilson, B. F., 127
Saris, w., 29 Winn, D. M., 129
Schaeffer, N. C., 119, 171 Wittenbrink, B., 128
Schechter, S., 132 Wrightsman, L. S., 138
Schober, N. F., 18, 116, 171, 172
Schuman, H., 92, 118, 125, 137, 162 Yuan, Y., 48
Schwarz, N., 92, 132
Índice remissivo
Administração em grupo, 87, 104 American Association os Public Opinion

Amostra da população atual, 214 Research (AAPOR), 66, 205
Amostras Análise de dados, preparando para
estratificadas, 37-39 abordagens para codificar e entrada de
fazendo estimativas a partir das, 22-24, dados, 181-186
29-30, 30-32, 51-58 codificação e redução de dados, erros e,
tamanho das, 58-61 186-187
Amostras não probabilísticas, 31-32 construindo um código, 179-181
características de viés das, 83-84 formatando um arquivo de dados, 177
substituindo respondentes, 81-84 limpeza de dados, 186-186
Amostras sistemáticas, 36-37 Anonimato, 77, 134
Amostragem, 30-32 Arquivos de acompanhamento, 151
agrupando, 41-49 Ausência de respostas
amostragem aleatória simples, 36, 53 ajustando à amostra, 188, 191
componentes do projeto de amostra, 30 amostras não probabilísticas e, 81-84
estratificação, 37-39 calculando taxas de resposta e, 65-66
implicações para o método de coleta de como fonte de erros, 84-85, 210-212
dados, 88-90 lidando com o item, 191-192
multiestágio, 41-51 reduzindo, 72-80
por área de probabilidade, 15-16, 42-46 viés associado à, 66-72
por cota, 81-84 Avaliação da questão
probabilidades desiguais de seleção, 39 arquivos de acompanhamento, 151
questões importantes na, 18-19 codificação do comportamento, 150-151
sistemática, 36-37 entrevistas cogniticas em laboratório,
tamanho da amostra, 58-61 144-146
um estágio, 36-40 grupos focais, 142-143
Amostragem probabilística, 14 pré-testes, 149-153
área, 42-46 reduzindo erros de levantamento e, 213
seleção e, 39-40, 50 revisão crítica sistemática, 144
230 Índice remissivo
Belmont Report, 196 Efeitos do projeto

Bureau of Labor Statistics, 13 entrevistadores e, 169-176
Bureau of the Census, 14, 66 amostragem e, 53-58, 61-62, 194, 212
Entrevistadores
Celulares, levantamentos por telefone e, resposdabilidades éticas dos, 201-203
32-34, 48-49, 88-89, 102-103 erros relacionados aos, 169, 173-176, 213
Censo recrutamento e seleção, 160-163
decenal (EUA), 12-15 supervisão de, 166-169
definido, 15 treinamento, 163-165
Veja também U.S. Bureau of the Census validação do trabalho, 172
Codificação Erro
como uma fonte de erros, 186-187 aleatório, 25, 29-30
do comportamento, 150-151, 213 amostragem. Veja Erro de amostragem
Códigos, construídos para análise de da associado às respostas, 27-28
dos, 179-181 associado a quem responde as questões,
Computadores, uso em coleta de dados, 25-27
(CATI, CASI e CAPI), 87-88, 92-93, 99- ausência de resposta como uma fonte
100, 182-184 de, 66-72, 84-85, 210-212
Confidencialidade codificação e redução de dados como
garantindo a, 134 fonte de, 186-187
minimizando a quebra da, 200-202 em perspectiva, 210-213
Consentimento informado, 197-199 falta de conhecimento como uma fonte
de, 130-132
Dados do levantamento, analisando formulação da questão e, 137-138
ajuste à ausência de respostas, 188-191 papel do entrevistador no, 173-176
ajuste às deficiências da estrutura da projeto total de levantamento e, 18-20,
amostra, 188-191 209
ajuste às probabilidade de seleção, 193 viés comparado ao aleatório, 29-30
calculando os erros de amostragem, 195 Erro de amostragem, 25-27
estruturas deficientes, 188-191 agrupamento e, 57
lidando com a ausência de resposta ao calculando, 63-58, 194-195
item, 191-192 erro total de levantamento e, 61-62
Dados de levantamentos, preparando pa estratificação e, 57
ra análise probabilidades desiguais de seleção e, 57
codificação e entrada de dados, 185-186 Escalas, 126-130, 136-137, 193
construindo um código, 179-181 Escalas subjetivas contínuas, 126
fontes de erros, 186-187 Escaneamento óptico, 184-186
formatando o arquivo de dados, 177- Entrevista padronizada, 157-159
179 Estrutura da amostra, 25, 30-36
limpeza de dados, 186 ajuste às deficiências na, 188-191
Dados nominais, 123 três características da, 32-35
Dados ordinais, 123, 127 Formatando um arquivo de dados, 178
Department of Agriculture, 14-16 Formulação da questão
Discagem aleatória de dígitos (RDD), 16, confiabilidade das respostas, 110-111
35, 46-49, 96-97 erro e, 137-138
Índice remissivo 231
passos preliminares na, 142-144 Levantamentos multímodo, reduzindo a

tipos de medidas e questões, 122-130 ausência de respostas no, 78, 87
validade das respostas que descrevem Levantamentos pela internet, 34
estados subjetivos, 135-137 custos dos, 97
validade de relatos factuais, 130-135 reduzindo a ausência de resposta nos,
77-78
Gastos do consumidos, padrões de, 12-13 vantagens e desvantagens dos, 105, 212
Grupos de foco, 142-143
Literary Digest presidential, 68
Hiperamostragem, 39-40, 58
Medições
ICPSR. Veja Inter-university Consostium níveis de, 123-124
of Political and Social Research
Institutional Review Board, (IRB), 196-199 Não respondentes, fazendo um levanta
Instrumento de levantamento mento dos, 79-80
avaliação pré-levantamento, 144-146 National Academy od Sciencies, 197
definindo objetivos, 142-144 National Commission for the Protection
duração do, 152-153 of Human Subjects, 196
passos para a formulação de questões, National Crime Victimization Survey, 12-
142-144 14, 131
pré-testes de campo, 149-153 National Health Interview Survey, 12-13,
processo de desenvolvimento, 140 49, 66, 214
projeto, formato e leiaute do, 147-149 National Opinion Research Center, 68,
Instrumentos assistidos por computador, 142-143
eliminando os erros dos, 152-153
Interferência na pesquisa de levantamen- Office of Management and Budget, 67-68
to, 22-24, 29-30
Inter-university Consortium of Political Pagando respondentes, 75-76
and Social Research (ICPSR), 143-144 Ponderação, 39-40, 188-191, 193
Interval de dados, 123 Probabilidades de seleção, 35, 39-41
ajustando às, 193
Levantamentos por correio, 75-77 Pré-teste de campo, 149-151
custos dos, 97 Pré-teste do questionário autoadministra
retorno antecipado, 210-212 do, 151
reduzindo a ausência de respostas nos, leiaute do, 148-149
75-77 Projeto total de levantamento, 17-18, 209,
vantagens e desvantagens dos, 104 215
Levantamento por telefone, 32-34
custos do, 97 Questões
eficiência do, 96-97 abertas e fechadas, 125-127
erros e, 212 aumentando a validade factuais, 129-135
reduzindo a ausência de resposta no, como medidas, 16, 27-28
72-75 concordo/não concordo, 127-130
vantagens e desvantagens do, 102-103 conteúdo das, métodos de coleta e, 95
Levantamento social geral, 68, 142-143 efeitos de conveniência social, 132-135
232 Índice remissivo
entendimento da, 130 amostragem e, 88-90

erros relacionados ao entrevistador e, 169 comparação resumida de, 101-107
esboçando, 142-143 conteúdo da questão e, 93-95
escalas problemáticas em, 136-137 custos e, 19, 97, 213-214
evitando múltiplas, 117-118 forma da questão e, 91-93
expectativas-padrão de resposta, 119-122 problemas na escolha da estratégia, 88-
falta de conhecimento e, 130-132 101
formulário de, métodos de coleta de da- questionários autoadministrados e, 134
dos e, 91-93 taxas de resposta e, 95-97
opção “não sei”, 118 tempo envolvido em, 99
propriedade de uma boa, 110-111 tipo de população e, 90-91
significado consistente das, 113-114
termos pobremente definidos e, 114-117 Tarefas do entrevistador
testagem de grupos focais, 142-143 conquistar cooperação, 155-157
tipos de, 124-130 entrevista padronizada, 157-159, 171
validade das subjetivas, 136-137, 195 IRB. Veja Institutional Review Board
Questões concordo/não concordo, 127-130 perguntar questões, 157-158, 169-172
Questões éticas em levantamentos de pes registrar respostas, 159
quisa, 196-197 relacionadas aos respondentes, 159, 169-
benefícios aos respondentes, 201 171
informando os respondentes, 197-199 sondando respostas incompletas, 157-
protegendo os respondentes, 199-202 158, 169-169
responsabilidades éticas dos entrevista- treinar e motivar respondentes, 157-158,
dores, 202-203 169-171, 173
Taxas de resposta
Razão de dados, 124 calculando, 65-66
Respondente representante, 79, 130 efeitos sobre os erros, 69-72, 84-85
Respondentes monitorando entrevistadores, 166-168
benefícios do levantamento para, 201 qualidade da equipe de pesquisa e, 213
informando os, 197-199
protegendo os, 199-202 Validação do trabalho dos entrevistadores,
representante, 79 172
substituindo, 81-84 Validade, 27-28
treinando e motivando, 169-171, 173 de medições subjetivas, 136-138
Respostas, aumentando a confiabilidade de respostas factuais, 27-30, 130-135
das, 110-122 Viés
Revisão cognitiva das questões em labo associado à ausência de resposta, 66-72,
ratório, 144-146, 213 84, 210-212
como erro em respostas a questões, 29-
Sondando, 157-158, 169-169 30, 132-135
Serviços disponíveis e, 98 como erro em amostragem, 25-27, 29-
assistido por computador, 87-88, 92, 99- 30, 32-35
101, 182-184 em amostras não probabilísticas, 84

Pesquisa de Levantamento Floyd J Fowler JR Compress

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Pesquisa de Levantamento Floyd J Fowler JR Compress

Enviado por

Direitos autorais:

Formatos disponíveis

4ª edição

F785p Fowler, Floyd J., Jr.

Editado também como livro impresso em 2011.

1. Pesquisa científica – Métodos de pesquisa. I. Título.

Catalogação na publicação: Ana Paula M. Magnus – CRB 10/2052

Capa: Paola Manica

Leitura final: Marcos Vinícius Martim da Silva

Editora sênior – Ciências Humanas: Mônica Ballejo Canto

Editora responsável por esta obra: Carla Rosa Araujo

Editoração eletrônica: Formato Artes Gráficas

Reservados todos os direitos de publicação, em língua portuguesa, à

É proibida a duplicação ou reprodução deste volume, no todo ou em parte,

SAC 0800 703-3444

O objetivo desta quarta edição de Pesquisa de levantamento, bem

NOVIDADES DA QUARTA EDIÇÃO

Finalmente, fazer justiça às pessoas que contribuíram para fazer deste

Este livro versa sobre padrões e procedimentos práticos para levantamentos

O assunto deste livro é a coleta de dados em pesquisas sociais. Isso in-

• Em geral, a informação é coletada apenas sobre uma fração da po-

RAZÕES PARA LEVANTAMENTOS

Na constituição dos Estados Unidos, está especificado que uma pes-

• Taxas de desemprego, conforme divulgadas rotineiramente pelo

• A saúde mental, as necessidades de transporte e padrões de uso,

Patrocinar a coleta de dados de uma pesquisa com um objetivo

Há sempre algumas informações disponíveis em um dado tópico do

COMPONENTES DOS LEVANTAMENTOS

Como as medidas de todas as ciências, as medições de pesquisas

de conveniência ou em amostragens que excluíam parcelas significativas

por construir uma ponte entre as elaboradas técnicas de escala desenvol-

Formas de coleta de dados

Planejamento total do levantamento

forma, o projeto de uma pesquisa envolve um conjunto de decisões para

No que diz respeito à formulação das questões, o pesquisador deve

amostra que visa reduzir o erro de amostragem ao mínimo provavelmen-

PROPÓSITOS E OBJETIVOS DESTE TEXTO

Este texto apresenta uma discussão das decisões importantes que

por terceiros em seus trabalhos devem ter um entendimento sofisticado

Levantamentos são formulados para produzir estatísticas sobre uma popula-

Dois dos principais objetivos da metodologia de pesquisa são mini-

respondem. Uma segunda premissa fundamental do processo de pesquisa de

Amostra dos membros

Respostas dadas pelos

Figura 2.1 Interferência na pesquisa de levantamento.

Alguns aspectos da metodologia de pesquisa são formulados para

ERRO ASSOCIADO A QUEM RESPONDE

Toda vez que uma amostra é retirada de uma população maior, há

consistentemente diferentes daquelas que têm a chance de ser

É importante entender a distinção entre os dois tipos de erros em

quando as amostras são retiradas apenas daqueles que vivem em grupos

ERRO ASSOCIADO ÀS RESPOSTAS

A fim de entender os erros associados às respostas para questões de

tes: o valor verdadeiro, o que um respondente perfeito com conhecimentos

Os erros podem ser causados por todos os tipos de coisas: o não

prováveis de estar em uma direção do que em outra. Como exemplos,

RECAPITULANDO A NATUREZA DOS ERROS EM LEVANTAMENTOS

Portanto, para ambas as inferências-chave que são cruciais para a

Quando se tenta avaliar a confiança que se pode ter nas estimati-

Quadro 2.1 Exemplos de erro por tipos de erro e tipo de inferência

O quão bem uma amostra representa uma população depende da estrutura

Há ocasiões em que o objetivo da coleta de informações não é gerar

muitos dos princípios gerais sejam aplicados a qualquer problema de

Esses detalhes do processo de amostragem, juntamente com a pro-

tragem. Este capítulo, contudo, pretende familiarizar os leitores com ques-