Você está na página 1de 487

PESQUISA DE MARKETING

Metodologia, planejamento,
execução e análise
PESQUISA DE MARKETING
Metodologia, planejamento,
execução e análise

a
7      edição

FAUZE NAJIB MATTAR


© 2014, Elsevier Editora Ltda.

Todos os direitos reservados e protegidos pela Lei n° 9.610, de 19/02/1998.


Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser reproduzida
ou transmitida sejam quais forem os meios empregados: eletrônicos, mecânicos, fotográficos,
gravação ou quaisquer outros.

Copidesque: Shirley Lima da Silva Braz


Editoração Eletrônica: Thomson Digital
Revisão tipográfica: Casa Editorial BBM
Revisão: Maria Madalena Macedo Vicente
Elsevier Editora Ltda.
Conhecimento sem Fronteiras
Rua Sete de Setembro, 111 – 16° andar
20050-006 – Centro – Rio de Janeiro – RJ – Brasil
Rua Quintana, 753 – 8° andar
04569-011 – Brooklin – São Paulo – SP

Serviço de Atendimento ao Cliente


0800-026 5340
atendimento1@elsevier.com
ISBN: 978-85-352-5964-3
ISBN (versão digital): 978-85-352-5871-4
Nota: Muito zelo e técnica foram empregados na edição desta obra. No entanto, podem ocorrer
erros de digitação, impressão ou dúvida conceitual. Em qualquer das hipóteses, solicitamos a
comunicação ao nosso Serviço de Atendimento ao Cliente, para que possamos esclarecer ou
encaminhar a questão.
Nem a editora nem o autor assumem qualquer responsabilidade por eventuais danos ou
perdas a pessoas ou bens, originados do uso desta publicação.

CIP-BRASIL. CATALOGAÇÃO NA PUBLICAÇÃO


SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ

M386p
7. ed.
Mattar, Fauze Najib, 1944-
Pesquisa de marketing : metodologia, planejamento, execução e análise/Fauze Najib Mattar,
Braulio Oliveira, Sérgio Luís Stirbolov Motta. - 7. ed. - Rio de Janeiro : Elsevier, 2014.
24 cm.
ISBN 978-85-352-5964-3
1. Marketing. 2. Pesquisa de mercado I. Oliveira, Braulio Alexandre Contento de. II. Motta,
Sérgio Luis Stirbolov III. Título

13-03448         CDD: 658.8
                CDU: 658.8
DEDICATÓRIA

A todos com quem convivi e tenho convivido ao longo da minha vida:


familiares, companheiros de trabalho, professores, alunos, orientadores,
orientados, amigos e colegas. A todos devo contribuições e lições de vida
que têm enriquecido minha existência.
Fauze

Ao Prof. Fauze, pela amizade e pelo estímulo à inspiração e ao trabalho.


Braulio

Para Luísa e Rodrigo.


Sérgio
AGRADECIMENTOS

Agradecimentos especiais se fazem necessários: primeiro, aos coautores dos capítulos 12


e 13, Profs. Drs. Braulio Oliveira e Sérgio Motta, e ao estatístico Dirceu de Aguiar, pela
revisão técnica dos capítulos 11, 12 e 13, cujas contribuições enriqueceram esta obra;
segundo, ao André Gerhard Wolff, gerente editorial da Elsevier que proporcionou todo o
apoio da editora para esta 7ª edição; terceiro, a Maria Madalena Macedo Vicente, por suas
valiosas contribuições ao livro, com pesquisa de materiais, revisões e correções do texto,
críticas e sugestões; e, finalmente, aos meus familiares, que compreenderam e suportaram
minhas ausências durante o desenvolvimento desta edição do livro.
Quero agradecer também a todos que me honraram adquirindo este livro ou ci-
tando-o em seus estudos, particularmente aos colegas, professores e acadêmicos, de
Marketing e de Pesquisa de Marketing, em todo o Brasil, dos quais tenho, continuamente,
recebido manifestações de apreço e carinho.
A todos, meus sinceros agradecimentos.
Fauze Najib Mattar

vii
NOTA DO AUTOR À 7ª EDIÇÃO

A primeira edição deste livro foi em 1993 e visava atender, na época, à carência de livros
sobre o assunto publicados no Brasil de autores nacionais e voltados para a realidade
brasileira. Os resultados alcançados, desde então, medidos pelas diversas tiragens e edições,
pelas infinidades de citações em artigos, dissertações, teses, livros e outros trabalhos
acadêmicos e profissionais das áreas de Administração, Marketing, Pesquisa de Marketing
e Comunicações (2.930 citações listadas em 12 de fevereiro de 2013 pelo Publish or
Perisch), e pela circulação atingida de mais de 45.000 exemplares (incluindo todas as
edições do Volume 1,Volume 2 e Edição Compacta), fizeram o Autor ficar extremamente
gratificado e considerado válido todo o esforço dedicado à sua elaboração.
O compromisso de manter uma obra viva faz com que constantes atualizações
sejam efetuadas. Notadamente em Pesquisas de Marketing, as mudanças propiciadas
pelo avanço tecnológico na informática (tanto nos equipamentos quanto nos sistemas)
e na teleinformática (infovias, telecomunicações, teleprocessamentos, internet, sites etc.)
causaram, e continuam causando, constante revolução, mudando, continuamente, os
procedimentos de se fazerem pesquisas. Esta 7ª edição, publicada pela Elsevier, reúne,
em um só, os anteriores Volume 1 (cuja última edição foi a 6ª) e Volume 2 (cuja última
edição foi a 3ª) e incorpora essas mudanças e atualizações.
A seguir é descrita a organização do livro nesta edição.
O Capítulo 1, Importância da Informação para Marketing, destaca a necessidade e a
importância de informação para marketing; relaciona as diversas formas de obtenção de
informações para marketing; descreve a função e os componentes do sistema de informações
de marketing, com a pesquisa de marketing como um de seus componentes, e mostra uma
visão geral do processo de pesquisa de marketing.
O Capítulo 2, Processo de Pesquisa, apresenta as formas de adquirir conhecimento;
diferencia pesquisas científicas e pesquisas aplicadas; apresenta e detalha as etapas e fases
componentes de um processo de pesquisa de marketing.
O Capítulo 3,Tipos de Pesquisa, discute as classificações e apresenta as diversas opções
de projetos de pesquisa.
O Capítulo 4, Projeto de Pesquisa Explicativa, detalha o projeto de pesquisa ex-
plicativa (ou causal).
O Capítulo 5,Tipos, Fontes e Formas de Coleta de Dados, apresenta e detalha os tipos,
fontes e formas de coleta de dados; apresenta os métodos de comunicação e observação
utilizados em pesquisas de marketing.
O Capítulo 6, Medidas e Instrumentos de Coleta de Dados, apresenta as principais fontes de
erros amostrais e não amostrais em pesquisas de marketing; mostra como ocorre o processo de
medição em pesquisas de marketing; descreve os tipos básicos de escalas utilizadas em pesquisas
de marketing; mostra como construir um instrumento de coleta de dados bem estruturado.
O Capítulo 7, Procedimentos de Amostragem Simples, apresenta e discute o conceito
de amostragem, os tipos de amostras e amostragens, as teorias estatísticas que dão suporte

ix
x Nota do autor à 7ª edição

aos procedimentos de amostragens probabilísticas e os procedimentos para a seleção de


amostras aleatórias simples.
O Capítulo 8, Outras Formas de Amostragens Probabilísticas e o Tamanho da Amos-
tra, apresenta e discute os procedimentos para a realização de: amostragem aleatória es-
tratificada; amostragem estratificada não proporcional; amostragem por conglomerados
(ou grupos); e a determinação do tamanho da amostra e do erro amostral nos diversos
tipos de amostragens probabilísticas.
O Capítulo 9, Coleta de Dados, apresenta e detalha todas as ações que envolvem o
planejamento e a coleta de dados e as formas de apurar a validade e a confiabilidade dos
dados coletados.
O Capítulo 10, Processamento dos Dados, apresenta e detalha as atividades de proces-
samento dos dados: crítica manual, checagem, codificação, digitação, tabulação e crítica
eletrônica.
O Capítulo 11, Métodos de Análise de Dados e Inferência Estatística, apresenta e
exemplifica os métodos descritivos de medidas de posição e dispersão, e os métodos
inferenciais para análise de dados.
O Capítulo 12, Métodos Não Paramétricos para Análise de Dados, apresenta as
técnicas mais utilizadas de análise de dados de amostras pequenas ou provenientes de
populações com parâmetros desconhecidos e as técnicas não paramétricas para medir a
associação e a interdependência entre as variáveis.
O Capítulo 13, Técnicas Paramétricas para Análise de Dados, apresenta as técnicas
mais utilizadas de análises de dados de grandes amostras ou provenientes de populações
cujos parâmetros são conhecidos.
O Capítulo 14, Comunicação dos Resultados, apresenta as formas de comunicação
dos resultados de pesquisas de marketing.
O Capítulo 15, Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisas
de Marketing, apresenta outros tópicos relevantes sobre o tema pesquisas de marketing:
histórico da pesquisa no Brasil e no mundo; ética em pesquisas; formato e conteúdo de
propostas de pesquisas; critérios para contratação externa de pesquisas e publicação de
artigos com resultados de pesquisas.
É importante salientar que os exemplos de processamentos de pesquisas pelo SPSS
têm por objetivo orientar o leitor quanto ao tipo de teste que deve ser usado, o conceito
do teste e a interpretação do resultado obtido, e não a apresentação dos procedimentos
para operar os processamentos pelo SPSS, que poderão ser obtidos em obras destinadas
a esse fim.
Agradeço antecipadamente as críticas e sugestões.

Fauze Najib Mattar


São Paulo, dezembro de 2013.
fauze@usp.br
fauze@fia.com.br
fauze@mattareassociados.com.br
www.fauze.com.br
www.mattareassociados.com.br
CAPÍTULO 1
Importância da Informação
para Marketing
A diferença entre dados e informações é que, enquanto os dados são coletáveis de fatos
brutos, informações representam a organização seletiva e a interpretação imaginativa
desses fatos.
Theodore Levitt

Objetivos
• Destacar a necessidade e a importância de informação para marketing.
• Aprofundar as diversas formas de obtenção de informações para marketing.
• Descrever a função e os componentes do sistema de informações de marketing.
• Apresentar a pesquisa de marketing como um dos subsistemas componentes do sistema de informação
de marketing.
• Mostrar uma visão geral do processo de pesquisa de marketing.

Sumário
PLANEJAMENTO DE MARKETING
PROPORCIONANDO INFORMAÇÕES PARA MARKETING
Sistema
Sistema de informações
Sistema de Informações de Marketing - SIM
PESQUISA DE MARKETING
Definição de pesquisa de marketing
Etapas de uma pesquisa de marketing

PLANEJAMENTO DE MARKETING
O exercício da administração de marketing compreende a tomada de decisões que
envolve as quatro funções da administração: planejamento, organização, direção e con-
trole. Dentre essas, o planejamento é a função mais importante, pois sem ela as demais
ficam sem sentido.
Planejar é decidir no presente o que fazer no futuro e compreende a determinação
do futuro almejado e das etapas para atingi-lo.
Segundo Drucker (1962):
Planejamento é o processo contínuo e sistemático de tomar decisões futuras no presente com o melhor
conhecimento possível do que deverá acontecer, organizando sistematicamente os esforços necessários
para levar adiante essas decisões e medir os resultados das decisões em relação ao esperado, por meio de um
organizado sistema de controle.

1
2 Pesquisa de Marketing

Segundo Westwood (1990:18):


O termo 'planejamento de marketing' é usado para descrever os métodos de aplicar os recursos de marketing
para atingir objetivos de marketing. Isto pode soar simples, mas é, de fato, um processo muito complexo que
envolve:
- Realizar pesquisas de marketing dentro e fora da empresa.
- Procurar por fortalezas e fraquezas da empresa.
- Efetuar suposições.
- Efetuar previsões.
- Fixar objetivos de marketing.
- Gerar estratégias de marketing.
- Definir programas.
- Efetuar orçamentos financeiros.
- Rever os resultados e revisar objetivos, estratégias e programas.

Ainda segundo Westwood (1990:19):


Um plano de marketing é um documento que formula um plano para o marketing de produtos ou serviços. Pode
ser usado para:
- Preparar um argumento para o lançamento de um novo produto.
- Reformular a abordagem de marketing para produtos existentes.
- Juntar planos de marketing departamentais, divisionais e empresarial para ser incluído no plano corporativo
ou de negócio.

O modelo de planejamento de marketing compreende as seguintes fases (Mattar, 2009:


92-93):
Fase 1 – Obtenção e reunião de informações.
Fase 2 – Análise da situação/Resultados das análises:
2.1 Diagnósticos:
2.1.1 Análise dos elementos ambientais: determinação de ocorrências ambientais significativas:
tendências, fatos (eventos) e demandas do mercado.
2.1.2 Identificação dos fatores-chave do sucesso - FCS.
2.1.3 Análise do setor empresarial e da concorrência: identificação das características do setor e
identificação das fortalezas (potencialidades) e fraquezas (vulnerabilidades) do(s) produto(s)
concorrentes e da empresa concorrente em relação aos FCS.
2.1.4 Análise interna: identificação das fortalezas (potencialidades) e fraquezas (vulnerabilidades)
do(s) produto(s) e da empresa em relação aos FCS.
2.1.5 Identificação das vantagens e das desvantagens competitivas do produto e da empresa.
2.1.6 Identificação das oportunidades (situações favoráveis) e das ameaças (situações desfavoráveis)
do produto e da empresa e dos produtos e das empresas concorrentes.
2.2 Prognósticos:
2.2.1 Construção de cenários com previsões do comportamento das variáveis ambientais não con-
troláveis.
2.2.2 Previsões da demanda.
Fase 3 – Decisões:
3.1 Fins:
3.1.1 Objetivos.
3.1.2 Metas.
3.2 Meios:
3.2.1 Estratégias – desenvolvimento e definição de estratégias alternativas:
Estratégias: competitivas, de mercado, de produto, de preço, de distribuição, de comunicação
e de vendas.
3.2.2 Decisões e proposições de ações relacionadas a:
Produto, preço, promoção ou comunicação e pontos de venda ou distribuição.
Importância da Informação para Marketing 3

3.2.3 Recursos – determinação dos tipos e quantidades de recursos necessários e de como deverão
ser gerados, adquiridos, gerenciados e alocados às atividades de marketing.
Fase 4 – Definição dos controles da execução:
Definição de o que, quem, quando, onde, como, com que padrão e com que frequência controlar a
execução do planejado.
Fase 5 – Elaboração/redação do plano de marketing:
Redigir, de forma ordenada e compreensível, os resultados de tudo que foi analisado
e planejado.
Uma forma esquemática e visual de apresentar as fases e sequências do processo de
planejamento de marketing está na Figura 1.1. Uma análise desse modelo mostra que, em
quase todos os itens, a necessidade de informações e sua disponibilidade estão presentes e
constituem-se em condições sine qua non para o efetivo planejamento e controle da atividade
de marketing. O exercício adequado do planejamento de marketing exige que seja iniciado
sobre bases sólidas e, para tal, é imperativo que se coloquem à disposição dos executivos de
marketing todas as informações necessárias. Por exemplo: dos desejos, necessidades e grau de
satisfação dos consumidores/clientes; das ações dos concorrentes; da evolução do mercado;
das capacitações e dos recursos disponíveis na empresa; da evolução das vendas, lucros e
participação no mercado por produtos e mercados; do comportamento das inúmeras variáveis
ambientais que afetam o marketing da empresa etc.
As contínuas e aceleradas mudanças nos ambientes social, tecnológico, cultural, demo-
gráfico, político, legal, concorrencial, governamental e psicológico que caracterizam o ma-
croambiente de marketing da empresa atual, associadas às contínuas mudanças internas nas
empresas por ganhos e perdas de capacitações; aquisições, fusões, incorporações e vendas;
mudanças organizacionais; alterações nas estratégias e nas políticas; disponibilidade ou não de
recursos de vários tipos; dificuldades momentâneas etc., fazem com que a tarefa da adminis-
tração se torne extremamente complexa e arriscada, notadamente a administração de marketing
que está voltada prioritariamente para esse complexo e mutante ambiente externo.
Uma das formas mais importantes de reduzir o risco da administração de marketing é dis-
por do máximo de conhecimento e compreensão do comportamento das inúmeras variáveis
externas e internas à empresa (o objetivo é a redução do risco e não sua eliminação, pois o
risco faz parte da atividade empresarial). Para se ter conhecimento e compreensão desses dois
importantes aspectos são necessários a disponibilidade de informação com qualidade e seu uso
correto (Mattar, 1982). Muitas vezes, a empresa dispõe de grande quantidade de informações,
mas irrelevantes e (ou) de baixa qualidade, comprometendo assim todo o processo de marke-
ting. Outras vezes, a empresa dispõe de grande quantidade de informações relevantes e de boa
qualidade, mas os executivos de marketing não percebem a importância de seu uso e tomam
decisões baseadas unicamente em suas intuições e experiências. Intuição e experiência são
extremamente importantes no processo de planejamento de marketing e, quando associadas a
uma dose adequada de informações relevantes, propiciarão resultados extremamente positivos.
Há também empresas que dispõem de grande quantidade de informações pertinentes e com
qualidade, mas que são utilizadas de forma errada no processo de decisão em marketing, quer
por desconhecimento dos usuários de como fazer a triagem da informação adequada, quer por
terem dificuldades em interpretá-las corretamente, gerando com isso um comprometimento
do processo de planejamento de marketing (Mattar, 1982).
Como foi visto, é total a dependência que as atividades de planejamento de marketing
têm em relação à informação. Em marketing, por ser a atividade da empresa que mais interage
4
Pesquisa de Marketing
Figura 1.1  Modelo geral de planejamento e plano de marketing.
Fonte: Adaptado de Mattar, Fauze Najib (Org.) et al. Gestão de produtos, serviços, marcas e ­mercados:
estratégias e ações para alcançar e manter-se “Top of Market”. São Paulo: Atlas, 2009:93.
Importância da Informação para Marketing 5

com o ambiente externo, a necessidade de informação é crítica. Uma noção da complexidade


do ambiente em que as decisões de marketing são tomadas pode ser percebida na Figura 1.2,
onde são mostrados os componentes do sistema de marketing da empresa e de seu ambiente.
A forma mais adequada de prover os usuários de informações de marketing na empresa é
pela estruturação de um sistema de informações de marketing.

PROPORCIONANDO INFORMAÇÕES PARA MARKETING


A literatura de marketing, no período anterior à primeira metade da década de 1960,
aborda a problemática da informação de marketing por meio da pesquisa de mercado. A pes-
quisa de mercado está voltada para o ambiente externo à empresa, mais especificamente para
o mercado. No entanto, como já visto, a necessidade de informação para o planejamento e
controle de marketing é muito mais ampla e implica a busca de informações em inúmeras
outras fontes, inclusive no próprio ambiente interno à empresa. A partir da segunda metade
da década de 1960, surgiram autores de marketing que passaram a tratar a problemática da
informação de marketing de forma mais ampla, integrada e sistêmica (Cox e Good, 1967),
(Brien e Stafford, 1968), (Adler, 1967), provavelmente sob a influência do desenvolvimento
e da difusão da teoria dos sistemas.
Cristalizou-se a ideia de que a informação de marketing, obtida e processada pelo sistema
de informações de marketing, proporciona os pré-requisitos necessários para a realização das
atividades de planejamento e controle de marketing.

Sistema
Um sistema é um conjunto de partes interdependentes que, conjuntamente, forma um todo unitário, efetuando uma
dada função. (O'Shaughnessy, 1976:133).

Um sistema compõe-se (Figura 1.3) de três elementos básicos: entradas, processador e saídas;


e um acessório: controle. Além disso, um sistema construído requer a definição de seu objetivo.
Entradas – Tudo que o processador do sistema recebe para processar, armazenar e produzir
saídas.
Processador – Componentes do sistema que transformam as entradas em saídas, podendo
efetuar várias operações, como: juntar, calcular, transformar, armazenar, selecionar, recuperar etc.
Saídas – Produtos finais resultantes do processamento das entradas.
Controle – Componente que verifica, periódica ou continuamente, se as saídas do sistema
estão de acordo com os padrões estabelecidos, efetuando as correções necessárias para que o
sistema atinja seus objetivos.
Objetivo – Razão principal da existência do sistema, ou seja, é a razão pela qual o sis-
tema foi concebido.
Sistema de informações
Um sistema de informações tem por objetivo fornecer aos interessados informações per-
tinentes a determinando assunto. Os elementos componentes de um sistema de informações
são (Figura 1.4): dados, processador, informação e controle.
Dados – São as entradas do sistema de informações. Podem ser coletados nas mais diversas
fontes possíveis e, da forma bruta como se apresentam e onde estão localizados, não têm utilidade
6
Pesquisa de Marketing
Figura 1.2  Elementos do sistema de marketing da empresa e de seu meio ambiente.
Importância da Informação para Marketing 7

Figura 1.3  Esquema básico de um sistema.

Figura 1.4  Elementos componentes de um sistema de informações.

per si. Para se tornarem relevantes e úteis, é preciso que sejam transformados em informação, isto é,
precisam ser coletados, triados, classificados, tabulados, armazenados etc.
Processador do sistema de informações – São os componentes do sistema que vão
proceder à tarefa de transformar os dados brutos em informações, desde a coleta até sua dis-
seminação pelos usuários.
Informação – É a saída do sistema de informação, o resultado do processamento dos
dados pelo processador do sistema.
Controle – É a forma de se verificar se as saídas do sistema estão de acordo com as previstas.
Sistema de Informações de Marketing - SIM
O objetivo fundamental de um sistema de informações de marketing é ajudar para que
melhores decisões sejam tomadas pelo pessoal de marketing. A forma de reduzir a incerteza
na tomada de decisões é dispor de informações a respeito do comportamento das variáveis
não controláveis e das variáveis de resultado. O SIM monitora os resultados da empresa e o
ambiente externo, busca e capta, avalia e seleciona, trata, condensa, indexa, analisa, interpreta,
classifica, armazena, recupera, transmite e dissemina dados e informações externos e internos
à empresa, pertinentes e relevantes para a tomada de decisões em marketing.
A definição mais completa e consagrada de sistema de informação de marketing é a de
Cox e Good (1967):
É um complexo estruturado e interagente de pessoas, máquinas e procedimentos destinados a gerar um fluxo
ordenado e contínuo de dados, coletados de fontes internas e externas à empresa, para uso como base para a tomada
de decisões em áreas específicas de responsabilidade de marketing.

Vantagens da utilização do SIM – As vantagens advindas da adoção desse sistema


compreendem:
• Proporcionar mais informações dentro das limitações de tempo exigidas pela empresa.
Concomitantemente, a empresa toda poderá conseguir melhor desempenho.
• Permitir às grandes empresas descentralizadas usarem informações que se achavam ­dispersas,
reunindo-as e integrando-as de forma mais adequada.
• Permitir maior exploração do conceito de marketing.
• Proporcionar a recuperação seletiva de informação – Os usuários recebem apenas o que
querem e o que necessitam.
• Proporcionar reconhecimento mais rápido das tendências em andamento.
8 Pesquisa de Marketing

• Permitir melhor uso das informações dos históricos das atividades da empresa, por exemplo:
vendas por produto, por região e por cliente.
• Permitir melhor controle do plano de marketing.
• Evitar que informações importantes sejam ignoradas, como, por exemplo, indicações de
que um produto deva ser retirado de mercado.
• Reduzir o número de decisões tomadas intuitivamente, pois leva a informação de forma
conveniente e precisa.
• Depurar o fluxo, às vezes esmagador, de informações de marketing, que chega aos
executivos transformando-o num volume razoável, adequado e enxuto.
Tendências para o uso crescente do SIM – A necessidade e o uso crescente de sistemas
de informação de marketing são, segundo Boyd e Massy (1980), justificados pelas seguintes
tendências que hoje afetam o marketing:
• Número crescente de empresas multinacionais que, aparentemente, estão expandindo suas
linhas de produtos.
• Dispêndios crescentes em pesquisa e desenvolvimento de novos produtos e crescente
quantidade de produtos novos lançados no mercado.
• Aumento da competição e ciclos de vida dos produtos cada vez mais curtos.
• Crescente utilização de planejamento estratégico para produtos e mercados pelos depar-
tamentos de marketing.
• Crescente uso (apesar de lento) de técnicas analíticas mais sofisticadas em marketing,
inclusive a utilização de modelos de simulação em computadores.
• Crescente redução do custo e do tamanho, elevação da capacidade de processamento dos
computadores e disponibilidade de programas poderosos e a custos acessíveis têm per-
mitido sua rápida difusão pelas empresas.
• Crescente tendência ao atendimento de nichos de mercado.
• Mudança de marketing local para nacional e internacional.
• Transição de necessidades do consumidor para desejos do consumidor.
• Transição de concorrência de preço para concorrência de não preço.
• Diminuição dos prazos para a tomada de decisões.
• A atividade de marketing está tornando-se muito mais complexa e mais ampla em seu
campo de ação.
Funções do SIM – Não há um sistema padronizado de informações de marketing que
sirva genericamente a qualquer empresa. Ao abordar esse fato, Amstutz, citado por Boyd e
Massy (1980), assim se expressa:
Não há sistemas generalizados de informação. Cada empresa tem necessidades singulares de informação, uma
perspectiva singular sobre o ambiente interno e externo, prioridades singulares e um estilo de administração que é
produto singular de determinadas personalidades que formam o grupo que a administra.

Uhl (1981) também é da mesma opinião quando cita Heaxy:


Não existe um único sistema de informações de marketing que sirva a todas as empresas. Cada administração tem
requisitos de informação únicos, devido à sua perspectiva, também única, com uma ordem única de prioridades e
estilos de dirigir.

Evidentemente, esse fato não invalida o desenvolvimento de modelos de sistemas de in-


formação de marketing, desde que, antes de serem aplicados, sejam adaptados às necessidades
e às realidades de cada empresa e de seus dirigentes.
Importância da Informação para Marketing 9

Em linhas gerais, um sistema de informação de marketing deve cumprir as funções de:


reunir, processar e disseminar dados e informações externas e internas à empresa que sejam
relevantes para o processo de decisão de marketing.
A reunião de informações envolve o esforço do SIM para localizar, captar e recuperar
dados e informações julgados relevantes pelos executivos de marketing das empresas em
suas decisões. Essa função compreende três atividades: busca, monitoração e recuperação. A
busca consiste na localização de fontes de dados importantes e na forma de captá-los para o
SIM. Essa atividade é, em grande parte, atendida pela pesquisa de marketing. A monitoração
consiste no acompanhamento constante da evolução das variáveis ambientais e de outros
assuntos específicos de interesse dos executivos de marketing. É a chamada inteligência de
marketing. Especialistas em inteligência monitoram regularmente essas variáveis por meio
de leituras de jornais, revistas em geral, revistas especializadas, registros governamentais,
relatórios especiais, contatos e entrevistas pessoais etc. A recuperação de informações consiste
em fazer com que as informações arquivadas requisitadas pelos usuários do sistema sejam
localizadas e colocadas à disposição de forma eficiente e rápida. A eficiência da atividade
de recuperação vai depender das técnicas e dos equipamentos utilizados.
O processamento da informação envolve o esforço de transformar os dados em informações,
de mantê-las adequadamente arquivadas e de promover sua disseminação para os usuários do
SIM. Essa função compreende cinco atividades: avaliação, condensação, indexação, disseminação e
armazenagem. A avaliação consiste em julgar a confiabilidade e relevância de determinado dado
ou informação e decidir se deve ou não ser incluído no SIM.A condensação consiste em resumir
e condensar as informações de tal forma que os usuários recebam um pequeno volume de
dados relevantes, e não pilhas de dados. A indexação consiste num conjunto de procedimentos
de codificações, classificações e arquivamentos que permitirão sua armazenagem, atualização,
recuperação e fácil acesso e identificação a qualquer momento. O desenvolvimento de um
bom sistema de indexação e classificação é fundamental para o bom funcionamento do SIM.
A disseminação é a importante atividade de levar ou ter à disposição a informação certa, no
momento certo, para a pessoa certa e no menor espaço de tempo possível. Inúmeros são os
meios possíveis de disseminação da informação, que podem variar de simples memorandos,
exposições orais, relatórios periódicos e telefonemas até sistemas mais modernos, como men-
sagens via fax e sofisticados sistemas computacionais interligando os usuários diretamente ao
SIM. A armazenagem consiste em estocar a montanha de dados e informações que a empresa
gera e coleta continuamente. Será preciso definir para cada tipo de informação como ela será
arquivada, em que nível de agregação e por quanto tempo deverá permanecer arquivada.
Na utilização da informação, deverá haver empenho especial em se adaptar o SIM às neces-
sidades e exigências dos usuários, que deverão ser assistidos continuamente no atendimento dessas
necessidades. Os usuários necessitam basicamente de três tipos de assistência: a própria informação,
ajuda nas análises e interpretações e simulação de decisões. Com relação à assistência à própria
informação, reuniões periódicas poderão definir frequências, formatos e conteúdos (até onde o
projeto do sistema permitir), de modo a produzi-la o mais ajustado possível às necessidades do
usuário. A ajuda nas análises e interpretações poderá ser atendida incluindo-se, no staff do SIM,
especialistas em diversas áreas do conhecimento, conforme a demanda por análises assim o exigir,
e poderá incluir: estatísticos, psicólogos, economistas, bem como pesquisadores com experiência
operacional em marketing e até mesmo pesquisadores generalistas. A necessidade de simulação
de decisões poderá ser atendida por meio da construção de complexos modelos estatísticos
10 Pesquisa de Marketing

representativos do funcionamento do mercado em que a empresa opera para serem usados em


simulação por computadores. Essas técnicas ainda estão nos estágios iniciais de desenvolvimento
(veja discussão mais detalhada a respeito em Mattar, 1986).
Informações para decisão em marketing – Inúmeras são as informações necessárias
para a tomada de decisão em marketing. Antes de entrar em detalhes sobre a composição do
SIM, é importante conhecer detalhadamente quais são esses diversos tipos de informação. Seu
conhecimento ajudará na construção do SIM. Estão classificadas em três tipos: informações
para análise da situação, informações sobre as variáveis de decisão de marketing e informações
sobre medidas de desempenho (Kinnear e Taylor, 1984).
I – Informações para análise da situação
A – Análise da demanda
1. Comportamento, necessidades, desejos e características do consumidor/cliente:
• Quem é.
• O que compra.
• Razões para comprar.
• Razões para não comprar.
• Quem inicia a compra, quem influencia, quem decide, quem compra e quem usa.
• Onde compra.
• Como compra.
• Quando compra.
• Quanto compra.
• Como usa.
• Problemas no uso.
• Quais necessidades e desejos estão sendo satisfeitos e quais não.
• Como todas essas variáveis tendem a evoluir.
2. Características do mercado:
• Tamanho e potencial.
• Evolução.
• Segmentação.
• Demanda por segmento.
• Diferenças regionais.
• Surgimento e crescimento de novos mercados.
• Previsão dos padrões futuros do mercado.
B – Concorrência
1. Quem são os concorrentes:
• Concorrência de empresa.
• Concorrência de produto (concorrência direta produto × produto).
• Concorrência de necessidade (produtos diferentes para atender à mesma neces-
sidade).
2. Características dos concorrentes:
• Porte.
• Participação no mercado: áreas, segmentos, evolução.
• Resultados.
• Programas de marketing.
• Investimentos programados.
Importância da Informação para Marketing 11

• Estilo de administração.
• Principais pontos fortes e fracos de marketing.
• Ambiente concorrencial futuro.
C – Macroambiente
1. Condições da economia e tendências.
2. Legislação e tendências.
3. Tecnologia e tendências.
4. Demografia e tendências.
5. Valores socioculturais e tendências.
6. Clima político-ideológico e tendências.
7. Clima governamental e tendências.
8. Clima psicológico e tendências.
9. Ecologia e consumerismo.
10. Oportunidades para os produtos da empresa em outros países.
D – Ambiente interno
1. Recursos e capacitações de marketing.
2. Recursos e capacitações de produção.
3. Recursos e capacitações de finanças.
4. Recursos e capacitações tecnológicas.
5. Clima organizacional.
6. Experiências de marketing anteriores bem- e malsucedidas.
7. Tendências do ambiente interno.
II – Informações sobre as variáveis de decisão de marketing
A – Produto
1. Que atributos e benefícios são importantes?
2. Como diferenciar o produto:
• Atributos (tamanho, cor, sabor, composição, desempenho, design, qualidade etc.).
• Embalagem.
• Marca.
• Socialmente.
• Psicologicamente.
3. Como os vários segmentos de mercado respondem às diferenciações no produto?
4. Qual a importância dos serviços de pós-venda:
• Assistência técnica.
• Instalação.
• Linha direta com o consumidor.
• Assessoria técnica etc.
5. Há necessidade de alterações nos produtos. Quais?
6. Razões para o baixo desempenho em vendas e participação de mercado de um deter-
minado produto. O que fazer para inverter a situação?
7. Como os nossos produtos são percebidos pelo mercado em relação aos nossos con-
correntes?
8. Qual das alternativas de um novo produto/marca/embalagem/design/etc. tem mais
probabilidade de ter sucesso?
9. Quais ações devem ser tomadas para enfrentar os produtos concorrentes?
12 Pesquisa de Marketing

B – Preço
1. Quais são as elasticidades-preço da demanda dos vários produtos?
2. Quais as consequências para as vendas e para os lucros de uma elevação/redução nos
preços de nossos produtos?
3. Como estabelecer uma política de descontos no preço em função de: porte e tipo de
cliente, volume de compra, sazonalidade, exclusividade, localização etc.?
4. Como estabelecer preços para uma linha de produtos?
5. Como estabelecer preços para produtos com demanda inter-relacionada?
6. Como reagir a uma redução de preços do concorrente?
7. Qual a importância relativa, para o consumidor, do preço comparado às demais variáveis
de decisão de marketing?
8. Como o consumidor reage à variável preço numa economia altamente inflacio-
nária?
C – Pontos de distribuição
1. Que intermediários podem trabalhar com nossos produtos?
2. Existem novas formas de distribuição para nossos produtos que sejam mais eficazes
do que as atuais?
3. Quais as atitudes e motivações dos elementos dos canais para trabalhar com nossos
produtos?
4. Que medidas são necessárias para motivá-los a trabalhar com nossos produtos?
5. O que fazer para ganhar exclusividade para nossos produtos?
6. Que margens são apropriadas e motivadoras?
7. Qual a intensidade qualitativa e quantitativa ideal de cobertura na distribuição, no
atacado e no varejo?
8. Quais prazos de entrega satisfazem os intermediários?
9. Em quais áreas de mercado a distribuição precisa ser intensificada?
10. Como será a distribuição física: localização de armazéns e depósitos regionais, definição
de níveis de estoques, definição dos meios de transporte?
11. Onde localizar, em que quantidades e qual o tamanho de filiais e escritórios de vendas?
12. Onde localizar e em que quantidades, vendedores e representantes de vendas?
13. Onde localizar, em que quantidades, qual o tamanho e como operar um eficaz sistema
de serviços de assistência técnica e de pós-venda?
III – Informações sobre medidas de desempenho
1. Quais nossas vendas atuais por linha de produto, por produto e por mercado e sua
evolução nos últimos 12 meses?
2. Quais são nossas atuais participações de mercado por linha de produto, por produto e
por mercado e sua evolução nos últimos 12 meses?
3. Quais são nossos lucros por linha de produtos, por produtos e por mercados?
4. Qual a imagem da empresa e de seus produtos junto aos consumidores, distribuidores
e público em geral?
5. Quais os níveis de recordação de nossas marcas?
6. Quais os níveis de resposta às nossas propagandas?
7. Quais os níveis de resposta às nossas promoções de venda:
• Aos consumidores/clientes?
• Aos intermediários?
Importância da Informação para Marketing 13

• Aos vendedores da empresa?


• Aos vendedores dos intermediários?
8. Qual é o nível de participação em nossa distribuição de atacadistas e varejistas (peque-
nos, médios e grandes)?
Modelo de SIM – Um sistema de informação de marketing é composto de quatro sis-
temas: de monitoração ambiental (também chamado de inteligência de marketing), de infor-
mações competitivas, de informações internas (também chamado de contabilidade gerencial)
e de pesquisa de marketing (Figura 1.5).

Figura 1.5  Sistema de Informações de Marketing – SIM e seus componentes.

O sistema de monitoração ambiental visa manter os executivos de marketing informados


e atualizados em relação às condições e modificações no ambiente e no macroambiente de
marketing da empresa. Esse sistema funciona de duas diferentes formas: coletando informa-
ções não sistematizadas e esporádicas e gerando ou adquirindo informações sistematizadas
e frequentes. Na primeira forma, o objetivo é coletar e difundir informações geralmente
não solicitadas e não previstas que chegam ou são coletadas esporadicamente, mas que são
relevantes para o processo de decisão de marketing e que dificilmente fluiriam por outros
meios aos usuários. Informações, por exemplo, dos seguintes tipos: mudanças na legis-
lação que afetam o marketing da empresa, previsões sobre o comportamento da economia,
mudanças sociais etc. As fontes habituais de dados para alimentar esse sistema são: livros,
jornais, revistas gerais e especializadas, contatos com estudiosos e especialistas, universidades,
institutos de pesquisa, relatórios e estudos especiais. Esses dados coletados e adequadamente
14 Pesquisa de Marketing

processados geralmente se transformam em excelentes informações para as decisões de


marketing. Pode-se também recorrer a empresas especializadas em obtenção de informações
comerciais e a empresas/institutos de pesquisas de marketing. Estas produzem com frequência
informações – geralmente a cada bimestre – sobre participação de mercado e distribuição,
gastos em propaganda, índices de audiência de rádio e TV, índices de circulação e leitura de
jornais e revistas, entre outras.
O sistema de informações competitivas visa captar toda e qualquer informação pública dos
concorrentes (informação pública é toda informação que, por razões de operação do negócio
ou por livre e espontânea vontade, é tornada pública). Exemplos de informações públicas:
registros em órgãos governamentais e associações empresariais, tabelas de preços, propaganda,
promoções de vendas, produtos, resultados operacionais e financeiros (quando empresas de
capital aberto), reportagens e análises realizadas e divulgadas por veículos de comunicação, press
releases e entrevistas de executivos dos concorrentes etc. Sem que a empresa recorra a meios
ilícitos e aéticos, é possível obter uma grande quantidade de informações relevantes, desde que
a empresa tenha montado um arcabouço adequado para captá-las, analisá-las e disseminá-las
junto aos executivos de marketing.
O sistema de informações internas visa manter os executivos de marketing informados a
respeito do desempenho de marketing da empresa para que possam exercer controle sobre
parte da atividade de marketing. As informações produzidas pelo sistema dizem respeito a
estatísticas de venda, resultados obtidos, produção e estocagem, e processamento de pedidos e
entregas. Além disso, o sistema deve gerar informações sobre os pontos fortes da empresa, como:
recursos disponíveis para investimento, capacidade produtiva, recursos humanos, know-how
tecnológico, bem como sobre seus pontos fracos: equipamentos de produção obsoletos,
vendedores inadequados para comercializar novos produtos, dificuldades em colocar novos
produtos no mercado.
No sistema de informações internas, é imperioso destacar a necessidade de que os relatórios
sejam de tal forma oportunos para agilizar ao máximo o processo de decisão nos diversos
níveis da estrutura organizacional de marketing. Entretanto, é preciso tomar cuidado para que
o sistema não gere informações inúteis e dispendiosas, que mais atrapalham do que ajudam.
Para evitar esse problema, é necessário que as informações a serem fornecidas pelo sistema
sejam definidas em conjunto com os usuários, a partir da combinação entre o que os usuários
acham que precisam, o que realmente precisam e o que pode ser obtido de forma econômica
e tecnicamente viável.
Um interessante rol de perguntas foi proposto por Kotler (1998:113), aqui modificado e
ampliado, para ser aplicado junto aos usuários do sistema, quando se pretende implantar um
novo SIM ou para subsidiar a reformulação de um existente. A resposta a essas questões ajuda
a evitar problemas futuros:
• Que decisões você toma regularmente?
• De quais informações você precisa para tomar essas decisões?
• Que informações você recebe e com que frequência?
• Qual o uso que faz dessas informações?
• Quais informações você recebe regularmente e não usa? Por quê?
• Que tipos de estudos especiais você costuma pedir?
• Que tipos de informações você gostaria de receber, mas não está recebendo?
• Que informações você deseja receber e com que frequência?
Importância da Informação para Marketing 15

• Qual apresentação da informação é mais conveniente (tabelas, gráficos, figuras, descrições)?


• Quais publicações você gostaria que lhe fossem enviadas?
• Quais relatórios comerciais você gostaria de receber?
• Sobre quais assuntos específicos você gostaria de ser constantemente informado?
• Que tipos de programas de análises de dados você gostaria que estivessem disponíveis no
SIM?
• Que melhorias você sugere para aperfeiçoar o atual SIM?
O SIM visa fornecer aos executivos de marketing informações para ajudar na solução
de problemas específicos e esporádicos que surjam durante o processo de administração de
marketing. As informações produzidas pelo sistema são predominantemente do tipo ad hoc, ou
seja, são produzidas especificamente e dirigidas para ajudar na solução de problemas definidos
e únicos, como: escolher a marca para um novo produto, descobrir as razões para a queda
de venda de um produto, redefinir o preço de um produto etc. As fontes utilizadas no SIM
variam muito em função dos objetivos da pesquisa e podem compreender o consumidor
final, os intermediários, os aplicadores do produto, os representantes de vendas, a força de
vendas da empresa e dos intermediários, os prestad­ores de serviço de assistência técnica,
formadores de opinião etc. O SIM se utiliza de metodologias e técnicas específicas para
obter dados e transformá-los em informação não viesada. Essas metodologias e técnicas serão
apresentadas e analisadas ao longo deste livro.

PESQUISA DE MARKETING
Definição de pesquisa de marketing
O sistema de pesquisa de marketing faz parte do SIM da empresa e visa coletar dados
p­ ertinentes e transformá-los em informações que venham a ajudar os executivos de marketing
na solução de problemas específicos e esporádicos que surgem durante o processo de adminis-
tração de marketing e que não estão no SIM.
A European Society for Opinion and Marketing Research - ESOMAR (<www.esomar.
org/index.php>) e a American Marketing Association (AMA, 1988) assim definem pesquisa
de marketing:
Pesquisa de marketing é a função que liga o consumidor, o cliente e o público ao marketing por meio da informação
– informação usada para identificar e definir as oportunidades e os problemas de marketing; gerar, refinar e avaliar
a ação de marketing; monitorar o desempenho de marketing; e aperfeiçoar o entendimento de marketing como
um processo. Pesquisa de marketing especifica a informação necessária destinada a esses fins; projeta o método
para coletar informações; gerencia e implementa o processo de coleta de dados; analisa os resultados e comunica
os achados e suas implicações.

As denominações de pesquisa de mercado e pesquisa de marketing são, frequente e er-


roneamente, usadas como sinônimos. Enquanto a primeira restringe seu foco ao mercado da
empresa ou de um produto seu, a segunda compreende a pesquisa de todo tipo de dado que diz
respeito à atividade de marketing da empresa, incluindo os elementos abrangidos pela pesquisa
de mercado, como: levantamentos de mercado, previsão da demanda e de vendas, pesquisas da
imagem da empresa e de seus produtos etc.
No Quadro 1.1 são apresentados diversos tipos de pesquisas utilizados em marketing. No
Quadro 1.2 são apresentadas estatísticas referentes à utilização de pesquisas de marketing em
empresas dos Estados Unidos (em 1989 e 1994).
16
Quadro 1.1  Tipos de pesquisas de marketing

Pesquisa de Marketing
Tipo Decisão Pesquisa Método(s) Objetivo(s) visado(s)
COMUNICAÇÃO Pesquisa da O que dizer Motivos de compra Focus group Novos apelos
motivação Apelos mais eficazes
Eficácia da Como dizer Sensibilização, Pré-testes (focus group, Comunicação mais eficaz
propaganda conscientização, cinema)
reconhecimento, Pós-testes (entrevistas
recordação pessoais, entrevistas por
telefone)
Imagem Administrar e Imagem percebida Entrevistas pessoais Diagnosticar a imagem
controlar a imagem Entrevistas por telefone Comparar a imagem
percebida com a desejada
Comparar a imagem
da empresa com a dos
concorrentes
Promoção de Realizar ou não a Eficácia da promoção Experimento em Verificar se a promoção
vendas promoção sobre vendas locação planejada atingirá os
Entrevistas pessoais objetivos
Força de vendas Adequar a força de Qualidade da força de Levantamentos Criar/reformular/
vendas vendas documentais adequar a força de vendas
Regiões e territórios de Entrevistas pessoais à realidade ambiental e
vendas Entrevistas com concorrencial
Potenciais de vendas especialistas
Cotas de vendas Dados
Resultado de vendas macroeconômicos
Dados demográficos
Ações dos concorrentes
Quadro 1.1  Tipos de pesquisas de marketing (cont.)

Tipo Decisão Pesquisa Método(s) Objetivo(s) visado(s)


DISTRIBUIÇÃO Localização: Definir estratégia de Potenciais regionais para Levantamentos Determinar localização de
industrial, canais de distribuição melhores localizações documentais lojas, depósitos e plantas
comercial e Definir estratégias de Entrevistas pessoais produtivas
residencial logística Entrevistas com Determinar elementos
especialistas dos canais com quem
Dados trabalhar
macroeconômicos Encontrar a melhor
Dados demográficos equação custo/benefício
Ação de concorrentes na determinação das
estratégias de canais
CENÁRIOS Estudos para a Decidir estratégias Identificação de Método Delphi Elaborar planos
construção de futuras tendências futuras Levantamentos estratégicos
cenários Decidir planos de comportamentos documentais
de crescimento e do consumidor, da Entrevistas pessoais
expansão concorrência e de diversas Entrevistas com
Elaborar planos variáveis ambientais de especialistas

Importância da Informação para Marketing


estratégicos de marketing, permitindo a Dados
produtos e mercados construção de possíveis macroeconômicos e
cenários futuros, nos tendências
quais decisões serão Dados demográficos e
tomadas, reduzindo-se os tendências
riscos envolvidos Dados legais e
tendências
Dados políticos e
tendências
Ações de concorrentes
e tendências

(Continua)

17
Quadro 1.1  Tipos de pesquisas de marketing (cont.)

18
Tipo Decisão Pesquisa Método(s) Objetivo(s) visado(s)
PREÇO Sensibilidade a Determinar preços Relacionar alterações de Experimentos em Determinar preço de

Pesquisa de Marketing
preços preços com volumes de locação forma a trazer o melhor
vendas Entrevistas pessoais retorno de marketing
Comparar preços com possível
valor percebido
Preços e margens Determinar estratégia Preços praticados pelos Pesquisa por observação Determinar o melhor
praticados de posicionamento concorrentes no atacado no varejo preço para atingir os
em preços e no varejo Entrevistas pessoais no objetivos de marketing
Margens de contribuição atacado
praticadas pelos Levantamento de
distribuidores tabelas de preços dos
concorrentes
MERCADO Potencial de Prever e orçar vendas Potencial de mercado Levantamentos Conhecer o efetivo
mercado, oferta e Potencial de vendas documentais tamanho do mercado, sua
demanda Previsão de vendas Entrevistas pessoais evolução e suas tendências
Evolução no mercado Entrevistas com
Distribuição geográfica especialistas
Participantes do mercado, Dados
suas dimensões e suas macroeconômicos
potencialidades e Dados demográficos
vulnerabilidades Ações de concorrentes
Participações de mercado
Segmentação Canalizar esforços de Identificar os segmentos Entrevistas pessoais Direcionar compostos
marketing que compõem o mercado seguidas de análise de marketing para os
e determinar seus fatorial ou análise segmentos potencialmente
tamanhos discriminante mais lucrativos
Comportamento Interagir melhor com Processo de compra Entrevistas pessoais Conhecer o modelo
de compra o consumidor Informações para compra Entrevistas por telefone comportamental de
Intenções de compra Questionários via compra dos consumidores
Por que compra correio, fax ou internet e a ele melhor se adequar
Onde compra
Quando compra
Como compra
Satisfação no uso e quais
reações apresenta pós-compra
Quadro 1.1  Tipos de pesquisas de marketing (cont.)

Tipo Decisão Pesquisa Método(s) Objetivo(s) visado(s)


PRODUTOS Conceito Lançar? Aceitação Focus group Verificar a aceitação do
E SEUS Continuar o Rejeição conceito de um novo
COMPONENTES desenvolvimento? Motivação produto
Descontinuar? Auxiliar no
direcionamento do
desenvolvimento de um
novo produto
Marca Avaliar Atitudes, aceitação, Focus group Adequar a marca ao
rejeição, consciência, Entrevistas pessoais produto
adequação, comparações Entrevistas por telefone Associações favoráveis/
Questionários via desfavoráveis da marca
correio, fax ou internet Comparar força da marca
com as concorrentes
Produto em si Avaliar Aceitação, rejeição, Focus group Adequar o produto ao

Importância da Informação para Marketing


Aprimorar/melhorar adequação, comparações Entrevistas pessoais público-alvo
Lançar/não lançar com a concorrência Testes de uso Avaliar o produto em
Teste de comparação relação aos concorrentes
pareada Decidir por lançamento,
aprimoramento ou
descontinuidade
Embalagem Avaliar Aceitação/rejeição Focus group Alterar embalagem
Aprimorar/ Adequação, associações Entrevistas pessoais Lançar nova embalagem
melhorar/adequar Sugestões para melhorar Entrevistas por telefone Avaliar embalagem atual
embalagem
Testes de uso

(Continua)

19
20
Pesquisa de Marketing
Quadro 1.1  Tipos de pesquisas de marketing (cont.)

Tipo Decisão Pesquisa Método(s) Objetivo(s) visado(s)


PRODUTOS Qualidade Acompanhar e Nível de qualidade Entrevistas pessoais Comparar a qualidade
E SEUS percebida controlar qualidade percebida Entrevistas por telefone desejada com a qualidade
COMPONENTES percebida Comparar nível de percebida
Adequar qualidade qualidade entre o Comparar a qualidade
produto da empresa e os percebida entre os
concorrentes produtos concorrentes
Posicionamento e Posicionar um Determinar os atributos Entrevistas pessoais Encontrar no mercado
reposicionamento novo produto ou principais de decisão do para mapeamento (ou segmento
reposicionar um consumidor perceptual por meio de de mercado) um
produto existente Avaliar os atributos análise fatorial, análise posicionamento adequado
principais do produto em discriminante ou MDS para o produto em relação
relação aos concorrentes – Multidimensional aos seus concorrentes nos
Verificar o Scaling atributos principais
posicionamento dos
produtos concorrentes e
do produto da empresa
Fonte: www.mattareassociados.com.br/
Importância da Informação para Marketing 21

Quadro 1.2  Tipos de atividades de pesquisa de marketing desenvolvidas pelas empresas americanas
Empresas que fazem
Tipo de pesquisa 1989 (%) 1994 (%)

A – Economia de negócios e pesquisa corporativa


1. Características e tendências da indústria/mercado 83 92
2. Estudos para aquisições/diversificações 53 50
3. Análises da participação no mercado 79 85
4. Estudos internos dos recursos humanos 54 72
B – Estabelecimento de preços
1. Análises de custos 60 57
2. Análises de lucros 59 55
3. Elasticidade de preços 45 56
4. Análises da demanda
• Potenciais de mercado 74 78
• Potenciais de vendas 69 75
• Previsões de vendas 67 71
5. Análises dos preços da concorrência 63 71
C – Produto
1. Desenvolvimento e teste de conceitos 68 78
2. Geração e teste de marcas 38 55
3. Testes de mercado 45 55
4. Testes de produtos existentes 47 63
5. Estudos de embalagens 31 48
6. Estudos de produtos concorrentes 58 54
D – Distribuição
1. Estudos para localização de fábricas/armazéns 23 25
2. Estudos sobre o desempenho dos canais 29 39
3. Estudos sobre a cobertura dos canais 26 31
4. Estudos internacionais e de exportação 19 32
E – Promoção
1. Pesquisas da motivação 37 56
2. Pesquisas dos meios de comunicação 57 70
3. Pesquisas de copy (rascunhos de anúncios impressos) 50 68
4. Pesquisas sobre a eficácia da propaganda 65 66
5. Estudos sobre a propaganda da concorrência 47 45
6. Estudos de imagem 60 65
7. Estudos sobre a remuneração da força de vendas 30 34
8. Estudos sobre cotas da força de vendas 26 28
9. Estudos sobre territórios da força de vendas 31 32
10. Estudos de prêmios, cuponagens e amostra grátis 36 47

(Continua)
22 Pesquisa de Marketing

Quadro 1.2  Tipos de atividades de pesquisa de marketing desenvolvidas pelas empresas


americanas (cont.)
Empresas que fazem
Tipo de pesquisa 1989 (%) 1994 (%)
F – Comportamento do consumidor
1. Preferências por marca 54 78
2. Atitudes em relação a marcas 53 76
3. Satisfação com produtos 68 87
4. Comportamentos de compra 61 80
5. Intenções de compra 60 79
6. Consciência de marca 59 80
7. Estudos de segmentação 60 84
Fontes: Kinnear, Thomas C.; Root, Ann R. Survey of marketing research 1988. Chicago: American Marketing As­
sociation, 1989:43; Kinnear, Thomas C.; Root, Ann R. Survey of marketing research 1993. Chicago: American Marketing
Association 1994:49.

Etapas de uma pesquisa de marketing


Um processo de pesquisa de marketing compreende quatro diferentes etapas: formulação
do problema, planejamento, execução e comunicação dos resultados.
Formulação do problema – Consiste na correta identificação ou formulação do pro-
blema de marketing que se pretenda resolver e que possa efetivamente receber contribuições
valiosas da pesquisa de marketing em sua solução.
Planejamento – Compreende a definição dos objetivos da pesquisa e de toda a sua
operacionalização: determinação das fontes de dados, escolha do(s) método(s) de pesquisa, da(s)
forma(s) de coleta dos dados, da construção e teste do(s) instrumento(s) de coleta dos dados, da
definição do plano de amostragem e do tamanho da amostra, da definição dos procedimentos de
campo, da elabora­ção do plano de processamento e análises, da definição dos recursos necessários
(humanos, financeiros, tecnológicos e materiais), da definição de uma estrutura organizacional
para a equipe de pesquisa com definição de responsabilidades e do estabelecimento de um crono-
grama com definição de prazos e datas para o cumprimento de cada etapa e de suas subdivisões.
Execução – A execução da pesquisa compreende três atividades: a preparação do campo,
a realização do campo e o processamento, análise, interpretação e conclusão.
Preparação do campo – Corresponde à construção, ao pré-teste e à reformulação do(s) instru-
mento(s) de coleta de dados; à edição e à impressão do(s) instrumento(s); à definição e ao sorteio
da amostra; à formação e ao treinamento da equipe; e, finalmente, à distribuição do trabalho.
Realização do campo – Corresponde ao efetivo trabalho de coleta dos dados junto às fontes de
dados. É a etapa geralmente mais cara e crítica da pesquisa, pois é aquela que mais está sujeita à
ocorrência de erros e atrasos e, por isso, exige supervisão muito intensa e controle rígido para
minimizá-los. Esse controle é feito por meio de conferência, crítica, codificação, checagem e
correções no(s) instrumento(s) de coleta de dados.
Processamento, análise, interpretação e conclusão – Corresponde à transformação dos dados brutos
coletados em informações de marketing relevantes para solucionar ou ajudar na solução do
problema que deu origem à pesquisa. Essa etapa inclui: verificação do preenchimento dos ins-
trumentos, codificação e digitação das respostas, processamento (geralmente eletrônico) dos
Importância da Informação para Marketing 23

dados, realização de cálculos, testes estatísticos, análises, interpretações e conclusões. Nessa etapa,
há intenso uso de estatística e de computadores.
Comunicação dos resultados – Compreende a apresentação escrita e verbal das principais
descobertas da pesquisa relacionadas ao problema que lhe deu origem, bem como das sugestões
e recomendações de ações pertinentes à sua solução.
Cada uma dessas etapas será exaustivamente estudada ao longo deste livro.

RESUMO
No processo de administração de marketing, a disponibilidade de informações, em quanti-
dade e com qualidade, a respeito do mercado, do ambiente, do macroambiente de marke-
ting e da própria empresa, é fundamental para a redução do risco na tomada de decisões.
A forma de prover os tomadores de decisões de marketing de informações é pelo Sistema
de Informações de Marketing - SIM, que monitora os ambientes externos e internos da
empresa, capta e busca dados, avalia e seleciona, trata, condensa, analisa e interpreta, classifica,
armazena, atualiza, recupera e dissemina informações pertinentes e relevantes à tomada de
decisões em marketing.
O SIM é composto de quatro sistemas: sistema de monitoração ambiental, sistema de informações
competitivas, sistema de informações internas e sistema de pesquisas de marketing.
O sistema de monitoração ambiental visa oferecer informações aos executivos de marketing
para mantê-los informados e atualizados em relação às condições e modificações no ambiente
e no macroambiente de marketing da empresa.
O sistema de informações competitivas visa captar informações públicas dos concorrentes
para manter os executivos atualizados.
O sistema de informações internas visa fornecer aos executivos de marketing informações
que lhes permitam manter-se informados a respeito do desempenho de marketing da empresa,
bem como exercer controle sobre parte da ativid­ade de marketing.
O sistema de pesquisas de marketing visa fornecer aos executivos de marketing informações
para ajudar na solução de problemas específicos e esporádicos que surjam durante o processo de
administração de marketing. As informações produzidas são predominantemente do tipo ad hoc.
Pesquisa de mercado e pesquisa de marketing não são sinônimos. O escopo da pesquisa
de marketing é muito mais amplo e inclui o da pesquisa de mercado.
Um processo de pesquisa de marketing compreende quatro diferentes etapas: formu-
lação do problema, planejamento, execução e comunicação dos resultados.

QUESTÕES DE REVISÃO
1. Quais são os componentes do processo de administração de marketing?
2. Quais são os componentes ambientais do sistema de marketing e de que forma mudanças
nesses componentes podem interferir no marketing das empresas?
3. Qual a diferença entre dado e informação de marketing?
4. Qual é a tarefa do Sistema de Informações de Marketing - SIM no processo de planeja-
mento de marketing?
5. Quais são as funções executadas pelo SIM?
6. Qual o papel do SIM no processo de administração de marketing?
7. Quais são e em que consistem as etapas de uma pesquisa de marketing?
24 Pesquisa de Marketing

REFERÊNCIAS
AMA – American Marketing Association. Dictionary of marketing terms. Chicago: BENNETT, Peter (Org.), 1988.
ADLER, L. System approach to marketing. Harvard Business Review, ano 3, n. 45, p. 105-118, May-June 1967.
BOYD, JR., Harper W.;WESTFALL, Ralph. Pesquisa mercadológica. Rio de Janeiro: Fundação Getulio Vargas, 1973.
BOYD, JR., Harper W.; MASSY, William F. Administração de marketing. São Paulo: Saraiva, 1980.
BRIEN, Richards H.; STAFFORD, James E. Marketing information system: a new dimension for marketing
research. Journal of Marketing, n. 32, p. 19-23, July 1968.
COX, Donald F.; GOOD, Robert E. How to build a marketing information system. Harvard Business Review, ano
3, n. 45, p. 145, May-June 1967.
DRUCKER, Peter F. Prática de administração de empresas. Rio de Janeiro: Fundo de Cultura, 1962.
HOUAISS, Antônio. Dicionário Houaiss da língua portuguesa. 1. ed. Rio de Janeiro: Objetiva, 2001.
KINNEAR, Thomas C.; ROOT, Ann R. Survey of marketing research 1993. Chicago: American Marketing As-
sociation, 1994, p. 49.
KINNEAR, Thomas C.; ROOT, Ann R. Survey of marketing research 1988. Chicago: American Marketing As-
sociation, 1989, p. 43.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
KOTLER, P. Administração de marketing: análise, planejamento e controle. 5. ed. São Paulo: Atlas, 1998.
LEVITT, Theodore. Marketing myopia. Harvard Business Review, p. 45-56, July-Aug 1960.
MATTAR, Fauze Najib (Org.); OLIVEIRA, Bráulio; QUEIROZ, Maurício Jucá de; MOTTA, Sérgio Luis
Stirbolov. Gestão de produtos, serviços, marcas e mercados: estratégias e ações para alcançar e manter-se “Top of
Market”. São Paulo: Atlas, 2009.
MATTAR, Fauze Najib; SANTOS, Dílson Gabriel. Gerência de produtos: como tornar seu produto um sucesso.
São Paulo: Atlas, 2004.
MATTAR, Fauze Najib. SIM – Sistemas de informação de marketing. Revista Mercado Global, ano 12, p. 24-45,
mar.-abr. 1986.
MATTAR, Fauze Najib. A informação de marketing e o sucesso no lançamento de novos produtos. Revista de
Administração, ano 4, n. 17, p. 23-44, out.-dez. 1982.
O'SHAUGHENESSY, John. Organização de empresas. São Paulo: Atlas, 1976.
UHL, Kenneth P. Sistemas de informação de marketing. In: BRITT, Stewart; BOYD, Harper (Org.). Marketing:
gerência e ação executiva. São Paulo: McGraw-Hill do Brasil, 1981.
WESTWOOD, John. The marketing plan: a practitioner's guide. Londres: Kogan, 1990.

Sites:
www.esomar.org.
www.fauze.com.br.
www.mattareassociados.com.br.
CAPÍTULO 2
Processo de Pesquisa
A experiência é uma vela que ilumina apenas quem a conduz.
Oscar Wilde

Objetivos
• Apresentar as formas de adquirir conhecimento.
• Diferenciar pesquisas científicas e pesquisas aplicadas.
• Apresentar e detalhar as etapas e fases componentes de um processo de pesquisa
de marketing.

Sumário
FORMAS DE ADQUIRIR CONHECIMENTO
Pesquisa científica
Pesquisa básica e pesquisa aplicada
COMPONENTES DE UMA PESQUISA DE MARKETING
Etapa 1: Formulação do problema de pesquisa
Etapa 2: Planejamento da pesquisa
Etapa 3: Execução da pesquisa
Etapa 4: Comunicação dos resultados

O ser humano, diante da complexidade dos fatos e dos fenômenos com que convive,
procura, continuamente, desenvolver esforços para entender o porquê das coisas e ganhar
conhecimento sobre o universo em que vive.
Há razões intelectuais e razões práticas para essa busca incessante de conhecimentos.
As razões intelectuais advêm do desejo inato no homem de conhe­cer, aprender e
compreender. Já as razões práticas advêm da necessidade de conh­ecer, aprender e com-
preender, a fim de fazer algo melhor ou de maneira mais eficaz do que está sendo feito,
ou para encontrar soluções para problemas específicos do cotidiano humano.

FORMAS DE ADQUIRIR CONHECIMENTO


No homem, a procura constante por conhecimento pode ser satisfeita por meio de
quatro diferentes formas: popular, religiosa, filosófica e científica, conforme mostra o
Quadro 2.1.Todas essas formas são válidas e funcionam simultaneamente, apesar de suas
fundamentações serem radicalmente diferentes.
O conhecimento popular é obtido por meio das experiências do indivíduo. É o modo
comum, corrente e espontâneo de obtenção de conhecimento no trato direto com os
seres humanos e com os objetos. Advém da vivência e da convivência com os fatos e
25
26 Pesquisa de Marketing

os fenômenos, principalmente os repetitivos, para os quais, por meio de experiência própria


ou de experiência transmitida, vão-se estabelecendo relações e explicações. É uma forma
importante de adquirir conhecimento, e nela se enquadra a transmissão de conhecimentos
do pai para o filho, do professor para o aluno, da autoaprendizagem. As chamadas decisões
intuitivas no mundo empresarial são tomadas com base no conhecimento adquirido dessa
forma e não devem ser desprezadas. No entanto, a análise do Quadro 2.1 mostra vários pontos
fracos dessa forma de adquirir conhecimento, o que leva a concluir que não deve ser utilizada
de forma exclusiva. Segundo Lakatos e Marconi (1983):
O conhecimento popular é valorativo por excelência, pois se fundamenta numa seleção operada com base em
estados de ânimo e emoções. É também reflexivo, mas, estando limitado pela familiaridade com o objeto, não
pode ser reduzido a uma formulação geral. A caracterização de assistemático baseia-se na ‘organização’ particular
das experiências próprias do sujeito cognoscente, e não em uma sistematização das ideias, na procura de uma
formulação geral que explique os fenômenos observados, aspecto que dificulta a transmissão de pessoa a pessoa
deste modo de conhecer. É verificável, visto que está limitado ao âmbito da vida diária, e diz respeito àquilo que se
pode perceber no dia a dia. Finalmente, é falível e inexato, pois se conforma com a aparência e com o que se ouviu
dizer a respeito do objeto.

Quadro 2.1  Comparação entre as formas de adquirir conhecimento


Formas de conhecimento
Popular Religiosa Filosófica Científica
Valorativo Valorativo Valorativo Factual
Reflexivo Inspiracional Racional Contingente
Assistemático Sistemático Sistemático Sistemático
Verificável Não verificável Não verificável Verificável
Falível Infalível Infalível Falível

O conhecimento religioso consiste em explicações sistemáticas sobre os fenômenos e os


fatos do mundo, e compreende proposições e dogmas sagrados, revelados por seres sobrena-
turais. O aprendizado que tem origem nessa forma de conhecimento é caracterizado pela
indiscutibilidade e pela dogmaticidade, e os que o aceitam consideram-no infalível, apesar da
impossibilidade de verificar sua veracidade. Trata-se de uma forma importante de adquirir
conhecimento, levando-se em consideração o número de seres humanos que a utilizam, mas
extremamente discutível, e até perigosa, tendo em vista suas características de indiscutibilidade
e dogmaticidade.
O conhecimento filosófico parte da experiência e, por meio de processos de racionalização,
indutivos ou dedutivos, procura estabelecer hipóteses coerentes para a explicação dos fatos e
dos fenômenos. No entanto, essas hipóteses não são passíveis de verificação, pois não podem
passar por experimentações, por isso, não podem ser aceitas nem rejeitadas. Foi uma importante
forma de adquirir conhecimento na história humana, e foi com o conhecimento filosófico
que se iniciou a maioria das ciências. Segundo Lakatos e Marconi (1983):
O conhecimento filosófico é valorativo, pois seu ponto de partida consiste em hipóteses que não poderão ser
submetidas à observação: as hipóteses filosóficas baseiam-se na experiência, portanto este conhecimento emerge
de experiência e não da experimentação; por este motivo, o conhecimento filosófico é não verificável, já que os
enunciados das hipóteses filosóficas, ao contrário do que ocorre no campo da ciência, não podem ser confirmados
nem refutados. É racional, em virtude de consistir num conjunto de enunciados logicamente correlacionados. Tem
a característica de sistemático, pois suas hipóteses e enunciados visam a uma representação coerente da realidade
Processo de Pesquisa 27

estudada, numa tentativa de apreendê-la em sua totalidade. Por último, é infalível e exato, já que, quer na busca
da realidade capaz de abranger todas as outras, quer na definição do instrumento capaz de apreender a realidade,
seus postulados, assim como suas hipóteses, não são submetidos ao decisivo teste da observação (experimentação).

O conhecimento científico, analogamente ao filosófico, também estabelece hipóteses ex-


plicativas sobre fenômenos e fatos observados, porém, diferentemente daquele, estas podem
ser verificadas por meio de experimentações, ter seus enunciados aceitos ou rejeitados e,
somente após isso, poderão ser consideradas pertencentes ao âmbito da ciência. Segundo
Lakatos e Marconi (1983):
O conhecimento científico é real (factual) porque lida com ocorrências ou fatos, isto é, com toda forma de existência
que se manifesta de algum modo. Constitui um conhecimento contingente, pois suas proposições ou hipóteses
têm sua veracidade ou falsidade conhecida por meio da experiência e não apenas pela razão, como ocorre no
conhecimento filosófico. É sistemático, já que se trata de um saber orientado logicamente, formando um sistema de
ideias (teoria) e não conhecimentos dispersos e desconexos. Possui a característica da verificabilidade, a tal ponto
que as afirmações (hipóteses) que não podem ser comprovadas não pertencem ao campo da ciência. Constitui-se
em conhecimento falível, em virtude de não ser definitivo, absoluto ou final, e, por este motivo, é aproximadamente
exato: novas proposições e o desenvolvimento técnico podem mudar o acervo da teoria existente.

O conhecimento científico é também racional, objetivo, analítico, claro e preciso, comunicável,


acumulativo, geral, explicativo, preditivo, aberto, útil, transcende os fatos e depende de inves-
tigação metódica (Lakatos e Marconi, 1983).

Pesquisa científica
A forma, por excelência, de se adquirir conhecimento científico é por meio da pesquisa
científica. Segundo Kerlinger (1973):
Pesquisa científica é uma investigação sistemática, controlada, empírica e crítica de proposições hipotéticas sobre
as relações presumidas entre fenômenos naturais.

A pesquisa científica é também caracterizada por ter procedimentos bastante rigorosos que,
se não forem seguidos, farão com que seus resultados não sejam aceitos pela comunidade
científica.
Os procedimentos da pesquisa científica compreendem:
• Isolamento de um fenômeno natural para estudo.
• Identificação das variáveis intervenientes no fenômeno.
• Elaboração de proposições hipotéticas sobre as relações presumidas entre as variáveis
(hipóteses).
• Investigação, com todos os meios e técnicas disponíveis, de forma sistemática, controlada,
empírica e crítica, das proposições hipotéticas estabelecidas, verificando quais são sus-
tentadas e quais não são.

Pesquisa básica e pesquisa aplicada


O tópico geral de uma pesquisa pode surgir de algum interesse prático, intelectual ou científico.
Segundo Yates apud Selltiz et al. (1974):
Por pesquisa básica (ou pura, ou fundamental), entendemos o tipo de estudo sistemático que tem a curiosidade
intelectual como primeira motivação e a compreensão como principal objetivo. Por pesquisa aplicada, entendemos
o tipo de estudo sistemático motivado pela necessidade de resolver problemas concretos.

Interessante discussão é feita por Castro (1978), quando compara pesquisa básica com pes-
quisa aplicada:
28 Pesquisa de Marketing

Sob o rótulo de pesquisa aplicada, estariam aquelas investigações que respondessem diretamente às indagações dos
que estão envolvidos na formulação de política, planejamento, ou coisa do mesmo teor. Já em pesquisa básica, estariam
aquelas que apenas indiretamente geram implicações de política ou esclarecem questões onde é preciso agir ou tomar
decisões. A pesquisa aplicada é o coroamento de um esforço de investigações em pesquisas básicas, não um substituto,
uma alternativa. O salvo-conduto da pesquisa aplicada reside na clareza de seus objetivos. Se a pergunta a que se tenta
responder é importante, então a pesquisa é importante. A pesquisa fundamental não pode obter esse ‘nihil obstat’ ins-
tantâneo. Sua relevância tem de ser decifrada. Às vezes, nem mesmo é claro a que questões importantes ela dará subsídio.

Fazendo uma analogia com as colocações de Yates apud Selltiz et al. (1974), existem as pesquisas
básicas de marketing e as pesquisas aplicadas de marketing. As pesquisas básicas de marketing são
predominantemente desenvolvidas em ambiente acadêmico por professores, pesquisadores, es-
tudiosos e alunos de cursos de pós-graduação.Visam ampliar, desenvolver ou aprofundar os
conhecim­entos de marketing como uma área de administração, têm a curiosidade intelectual
ou acadêmica como principal motivação e a compreensão como principal objetivo. Já as pes-
quisas aplicadas de marketing são predominantemente desenvolvidas em ambiente empresarial,
por empresas/institutos de pesquisas contratados ou nas próprias empresas, por profissionais de
pesquisa com as mais diferentes formações, com predominância de administradores de empresas,
economistas, sociólogos, estatísticos e psicólogos.Visam ganhar conhecimentos para ajudar na
solução de problemas práticos específicos do marketing de suas empresas. No Quadro 2.2 estão
exemplos de questões de pesquisas básicas de marketing e de pesquisas aplicadas de marketing.

Quadro 2.2  Exemplos de questões de pesquisa de marketing

A – Pesquisas básicas de marketing


Quais são as razões dos sucessos, relacionadas ao marketing, na indústria paulista de alimentos
processados?
Qual é o estágio em que se encontra o marketing bancário no Brasil?
Quais são o perfil e o padrão de atuação dos gerentes de produto na indústria de bens
de consumo de massa no Brasil?
Quais são as práticas de marketing no lançamento de novos produtos na indústria brasileira de
computadores?
Qual é o estágio em que se encontram empresas brasileiras de bens de consumo de massa na
prática do marketing social?
B – Pesquisas aplicadas de marketing
Por quais razões estamos perdendo participação de mercado no Grande Rio na linha
de refrigerantes dietéticos?
Por que o produto do nosso principal concorrente está tendo maior preferência dos
consumidores das classes A/B do que o nosso?
Por que as vendas da linha de sopas enlatadas estão caindo?
Qual deverá ser a tendência do consumidor de cigarros para os próximos dois anos?
O que deverá acontecer com as vendas de combustível e com o lucro em nossa rede
de postos de abastecimento se reduzirmos o preço em 2%?
Quais são os atuais índices de recordação de marca para nossa linha de aparelhos de som? O que
acontecerá com esse índice se elevarmos em 20% a verba de propaganda? Qual das três versões de um
novo produto (ou nova marca, nova propaganda, nova embalagem etc.) agrada mais ao consumidor?
Quais são as importâncias relativas atribuídas aos vários atributos de automóveis no processo de
decisão de compra do consumidor?
Processo de Pesquisa 29

A atenção deste livro será concentrada nas pesquisas aplicadas de marketing, principalmente
em termos de exemplificações, embora a maioria das metodologias, das abordagens, das técnicas
e dos conceitos apresentados e discutidos sejam aplicados indistintamente às pesquisas básicas
ou aplicadas de marketing.

COMPONENTES DE UMA PESQUISA DE MARKETING


No Capítulo 1 foram apresentadas as partes componentes de um processo de pesquisa de
marketing. A seguir, o estudo de cada uma delas será aprofundado.
O processo de pesquisa de marketing compreende quatro diferentes etapas, em cada etapa,
diversas fases e, em cada fase, diversos passos. Para conduzir adequadamente a pesquisa, é es-
sencial que todas as etapas sejam planejadas antes que o processo tenha início. Essas etapas e
seus componentes serão apresentados neste capítulo de forma a descrevê-los enfatizando sua
sequência e interdependência. O detalhamento mais profundo e a análise mais detalhada de
cada etapa serão apresentados ao longo deste livro nos capítulos correspondentes.
As etapas componentes de um processo de pesquisa de marketing são:
1. Formulação do problema de pesquisa.
2. Planejamento da pesquisa.
3. Execução da pesquisa.
4. Comunicação dos resultados.
As etapas da pesquisa e suas partes são apresentadas de forma sequencial por uma questão
meramente didática. Na realidade, o processo de pesquisa é circular, ou seja, o acúmulo de
conhecimentos advindos do próprio desenvolvimento da pesquisa, bem como a definição de
partes posteriores da pesquisa, pode implicar a reformulação de etapas anteriores e, às vezes,
até a do próprio problema de pesquisa. Na Figura 2.1, estão apresentadas as quatro etapas do
processo de pesquisa de marketing e suas partes componentes.

Etapa 1 – Formulação do problema de pesquisa


Esta parte da pesquisa é fundamental e dela dependerá todo o seu desenvolvimento para se chegar
a informações úteis ou para se despenderem esforços e recursos de forma inútil e desnecessária.
Problema de marketing/problema de pesquisa – Já foi visto que o tópico geral de
uma pesquisa pode surgir de algum interesse prático, intelectual ou científico.
O interesse prático em pesquisa de marketing tem início com alguma indagação vivida
pela administração de marketing da empresa e para a qual é necessário encontrar respostas ou
orientações para fundamentar a tomada de decisões. Essas indagações podem ter origem em
um fato-problema constatado, numa dúvida quanto ao melhor curso de ação a ser tomado
entre vários possíveis, em dúvi­das quanto ao comportamento presente e (ou) futuro de de-
terminadas variáveis de marketing, ou ainda num simples interesse em conhecer, de maneira
mais aprofundada, determinados aspectos do mercado ou da atividade mercadológica. Aos
tomadores de decisão de marketing, cabe reconhecer uma situação de decisão em que a pes-
quisa de marketing possa colaborar; aos pesquisadores de marketing, cabe ajudá-los na definição
e na formulação específicas do problema de pesquisa, conduzir a pesquisa e fornecer as in-
formações e as sugestões que os ajudarão a tomar melhores decisões. No Quadro 2.2, foram
apresentados vários exemplos de questões de pesquisas aplicadas de marketing; no Quadro 2.3,
são mostrados fatos-problemas que podem dar origem a pesquisas aplicadas de marketing e
de que forma a realização da pesquisa poderia ajudar na solução do problema.
30 Pesquisa de Marketing

Figura 2.1  Etapas de um processo de pesquisa de marketing.


O interesse intelectual ou científico tem início quando o pesquisador se volta para a ex-
ploração de algum objeto geral sobre um assunto a respeito do qual pouco se sabe como, por
exemplo, qual a efetividade da utilização de marketing em órgãos e instituições governamentais.
Processo de Pesquisa 31

Quadro 2.3  Fatos-problemas que podem dar origem a pesquisas de marketing


Fatos ou problemas Ajuda da pesquisa de marketing
Queda nas vendas/participação Razões do problema/Dimensão do problema/Possíveis
de mercado/lucros. soluções/Localização do problema.
Qual decisão tomar diante de Define a ação a tomar mostrando os resultados e riscos de
alternativas. cada alternativa.
Qual a reação do consumidor Prevê as possíveis reações dos consumidores e sugere quais
a mudanças nos 4 Ps. alterações serão convenientes.
Como o mercado está Levanta a evolução do mercado até o presente e prevê a
evoluindo. evolução futura.
Quem são os concorrentes e Levanta a estrutura de oferta, apontando os participantes, suas
como agem. participações no mercado, seu porte, suas vendas, estrutura de
distribuição, seus pontos fortes e fracos etc.

Pode também ter início quando o pesquisador se interessar por fenômenos que, apesar de já
terem sido estudados, carecem de especificações mais exatas das condições em que ocorrem,
ou como podem ser influenciados por outras variáveis, como, por exemplo, até que ponto as
decisões de compra dos consumidores de diferentes produtos são influenciadas pelas opiniões
de familiares, amigos, conhecidos, líderes de opinião etc., ou quando o pesquisador se interessar
por verificações específicas de um sistema teórico muito desenvolvido, como, por exemplo,
verificar se empresas que dispõem de modernos sistemas de informação de marketing têm
efetivamente mais sucesso do que aquelas que não dispõem dele. No Quadro 2.2, foram
apresentados vários exemplos de questões de pesquisa básica de marketing.
Há, portanto, uma grande variedade de fontes que podem sugerir tópicos para pesquisas.
Em certas situações, principalmente em se tratando de pesquisas aplicadas de marketing, o
pesquisador tem pouca ou nenhuma decisão sobre a escolha do tópico; já em pesquisas básicas
de marketing passa a ter uma amplitude de decisão muito grande e escolherá seu tópico de
pesquisa de acordo com seus valores e interesses. Excetuam-se os casos de pesquisas promo-
vidas ou subvencionadas por instituições de estímulo a pesquisas, que, geralmente limitam
os tópicos àqueles em que estão dispostas a conceder recursos. Não se deve esquecer que a
escolha de temas, nesse caso, também poderá ser decidida em função de busca de prestígio
e status, de recursos para pesquisa e até para elevar a remuneração pessoal.
Qualquer que seja o tema escolhido, não importa o tipo de pesquisa, fundamental ou
aplicada, determinados critérios deverão ser atendidos na escolha para que a pesquisa se jus-
tifique e o pesquisador não fique frustrado ao final do processo. Segundo Castro (1978), esses
critérios são: importância, originalidade e viabilidade do tópico escolhido.
Importância – Dizemos que um tema é importante quando está de alguma forma ligado a uma questão crucial que
polariza ou afeta um segmento substancial da sociedade. Um tema pode também ser importante se está ligado a
uma questão teórica que merece atenção continuada na literatura especializada. A seleção mais delicada e difícil
teria a ver com os temas novos, que a ninguém preocupa, seja teórica ou praticamente, mas que contêm o potencial
de virem a interessar ou afetar muita gente.
Originalidade – Um tema original é aquele cujos resultados têm o potencial de nos surpreender.
Viabilidade – Dados os prazos, os recursos financeiros, a competência do futuro autor, a disponibilidade potencial de
informações, o estado da teorização a esse respeito, dá para fazer a pesquisa? O prazo pode ser insuficiente, o mesmo
se dando com os recursos, pode ao pesquisador faltar o preparo específico naquele campo, pode não haver uma
sistematização prévia do conhecimento na área ou a teoria apresentar uma insolvência metodológica. Finalmente,
os dados necessários podem inexistir, ou mesmo sua coleta ser impossível.
32 Pesquisa de Marketing

O fato de um tema nunca ter sido pesquisado não lhe confere necessariamente origi-
nalidade, bem como o fato de o tema já ter sido pesquisado não lhe tira a originalidade.
Uma pesquisa cujo tema fosse verificar por que o consumo de alimentos pelos brasileiros está
muito abaixo do que recomenda a ONU-FAO não tem o potencial de surpreender. Embora
esse tema ainda não tenha sido pesquisado, segundo o conceito exposto, não será original, pois
as razões parecem óbvias (miséria, desemprego, salários ínfimos etc.). Já uma pesquisa cujo
tema tenha sido exaustivamente explorado em outras localidades pode ser um tema original
para ser investigado num país em que nada se sabe a esse respeito.
Dentre os três critérios, o conceito de viabilidade é seguramente o mais tangível e, por
isso, a definição de pesquisa viável/inviável é mais fácil de ser obtida com confiança.
Cada um desses critérios aponta numa direção, e não haverá grande dificuldade para jus-
tificar a realização de uma pesquisa que satisfaça a um ou dois deles, mas aos três simultanea-
mente. Se, em algum grau, os três não forem satisfeitos, o resultado da pesquisa poderá ser um
grande fracasso, e a frustração do pesquisador será inevitável.
Exploração inicial do tema – Ter o tema da pesquisa já definido não significa que o
pesquisador esteja em condições de iniciá-la. Segundo Selltiz et al. (1974:38):
O reconhecimento de um problema ou a escolha de um tópico para a pesquisa não coloca o pesquisador numa
posição de já poder considerar os dados a serem coletados, quais métodos deve empregar e como analisá-los. Antes
de iniciar tais etapas, precisa formular um problema específico que possa ser pesquisado por métodos científicos.
Infelizmente, não poucas vezes, ocorre que um pesquisador tenta saltar, imediatamente, da escolha de um tópico
para a coleta de observações. No melhor dos casos, isso significa que, depois da coleta dos dados, enfrentará a tarefa
de formular um problema; no pior dos casos, significa que não realizará qualquer pesquisa científica.

A pesquisa científica é uma atividade voltada para a solução de problemas. O primeiro passo
na formulação do problema é torná-lo concreto e explícito (Selltiz et al., 1974). Embora, como
já visto, a escolha de um tópico de pesquisa possa ser determinada por outras considerações
além das científicas, a formulação do tópico em um problema de pesquisa é a primeira etapa
na busca científica e, como tal, deve ser influenciada, fundamentalmente, pelas exigências do
processo científico. Não existe regra infalível para orientar o pesquisador na formulação de
questões significativas em cada área de pesquisa: a experiência, a vivência, o treinamento e a
capacidade individual de cada um são os elementos que contam.
Tendo definido o problema de pesquisa, o passo seguinte é identificar algum aspecto que
possa ser formulado numa questão específica de pesquisa a ser investigada com os recursos dis-
poníveis. Como é impossível considerar, nos limites de um único estudo, todas as possibilidades,
um tópico que se apresente como uma tarefa realizável precisa ser escolhido. O escolhido tem,
geralmente, uma amplitude tal que nem todos os aspectos do problema poderão ser estudados
simultaneamente. Em geral, será reduzido a um só aspecto, que possa ser tratado num único
estudo, ou dividido para que possa ser tratado em estudos separados (Selltiz et al., 1974).
Para exemplificar o exposto, suponha-se que uma empresa esteja interessada em pesquisar
o comportamento de compra dos seus consumidores. Note que o tema é muito amplo, e, da
forma ampla como foi colocado, é praticamente inexequível. É preciso restringir sua amplitude
e delimitá-lo a tópicos que sejam pesquisáveis. Uma forma de fazê-lo seria procurar respostas
para as seguintes perguntas:
Consumidor do quê? → Delimita-se o produto.
Consumidor onde? → Delimitam-se o mercado e a região.
Consumidor quando? → Delimita-se o período de tempo: antes, durante e pós-compra.
Comportamento de quem? → I niciador, influenciador, decisor, comprador e usuário.
Processo de Pesquisa 33

Uma pesquisa exequível sobre esse tema seria, por exemplo, determinar o comportamento
de compradores de automóveis novos, na Grande São Paulo, em 2011.
Nesta fase, o pesquisador deve inteirar-se o mais possível sobre o problema de pesquisa e,
para tanto, deve proceder a uma exploração inicial do assunto, recorrendo a todas as fontes de
dados disponíveis, tanto internas quanto externas à empresa, não só para bem conceituar o pro-
blema de pesquisa, como também para possivelmente economizar recursos, pois, muitas vezes,
outras pesquisas já investigaram os mesmos problemas, apresentando resultados aproveitáveis,
se não no todo, ao menos em parte. As possíveis fontes para se efetuar uma exploração inicial
do assunto são: conversa com especialistas dentro e fora da empresa, reuniões com grupos
de consumidores, relatórios de pesquisas anteriores, informações registradas nos arquivos da
empresa, consulta a livros, jornais, revistas, empresas/institutos de pesquisas de marketing,
anuários estatísticos, censos, estudos de casos etc.
Um esforço inicial para a definição adequada do problema de pesquisa e de sua delimitação
poderá evitar grandes dissabores, perda de tempo e de recursos financeiros após a pesquisa
ter sido iniciada.

Etapa 2: Planejamento da pesquisa


No Capítulo 1 foi visto em que consiste um processo de planejamento. Aquelas colocações
serão aqui empregadas para se conceituar o planejamento de uma pesquisa.
Uma vez definido claramente o problema de pesquisa, a etapa seguinte compreende o
planejamento de todas as atividades que serão efetuadas durante sua execução. Essa etapa
compreende:
Objetivos da pesquisa – Para pessoas que nunca se tenham envolvido com o processo
de pesquisa, parece infantil e desnecessário expor esta fase, uma vez que o problema já tenha
sido delineado. No entanto, a realidade mostra que essa é uma das etapas mais difíceis e, sem
um objetivo claramente definido, a pesquisa não deve ser iniciada, sob pena de, se o for, chegar
a resultados inúteis após grande esforço.
A definição do objetivo da pesquisa deve estar perfeitamente amarrada à solução do pro-
blema de pesquisa e a ele deve estar restrita. Além disso, devem ser levados em consideração
em seu estabelecimento:
• Tempo disponível.
• Recursos disponíveis (físicos, humanos, financeiros e tecnológicos).
• Acessibilidade aos detentores dos dados.
• Disponibilidade de meios de captação dos dados.
Dependendo do problema de pesquisa e dos recursos disponíveis, os objetivos podem ser
restritos ou ampliados. O pesquisador pode ater-se exclusivamente à coleta de informações
relacionadas ao problema de pesquisa e, nesse caso, o objetivo perseguido é denominado de
principal. Porém, às vezes, aproveitando os recursos que serão despendidos na pesquisa, outros
objetivos mais ou menos diretamente relacionados com o problema de pesquisa, afetos à mesma
população, poderão ser incluídos. Um exemplo dessas colocações é o que mostra o Quadro 2.4.
Para a definição do problema de pesquisa e de seus objetivos, o pesquisador precisa receber
do patrocinador uma grande quantidade de informações denominadas de “brief de pesquisa”.
Exemplos de informações que o “brief de pesquisa” deve conter:
• Descrições do produto/serviço.
• Descrições do problema de marketing.
34 Pesquisa de Marketing

Quadro 2.4  Exemplo de problema e objetivos de pesquisa

Problema de pesquisa:
Verificar qual é a melhor localização para uma nova unidade de uma cadeia de lojas
de conveniência na cidade de Campo Grande – MS.
Objetivo principal:
Reunir informações que possibilitem a melhor localização possível para uma loja
de conveniência na cidade de Campo Grande – MS.
Objetivos secundários:
Apontar todas as áreas disponíveis em Campo Grande que se prestem à instalação de uma loja
de conveniência; determinar o número de consumidores potenciais para cada área disponível;
verificar a predisposição dos consumidores de Campo Grande para uma loja de conveniência.

• Descrições do público-alvo.
• Descrições do mercado, dos concorrentes e dos produtos concorrentes.
• Descrições das áreas geográficas de mercado atingidas pelo produto e sua importância
relativa.
• Razões conhecidas ou supostas para compra/ o uso do produto/ do serviço.
• Resultados de pesquisas anteriores realizadas sobre o mesmo tema.
De posse dessas informações, será mais fácil determinar o objetivo da pesquisa de forma
que esteja ajustado ao problema de marketing e ao seu patrocinador.
Ao iniciar um processo de pesquisa, não se deve esquecer da regra mais importante de um
processo de planejamento: definir aonde se quer chegar antes de iniciar a caminhada.
Estabelecimento das questões e (ou) das hipóteses – As questões de pesquisa são
indagações amplas que, para serem respondidas, vão exigir a inserção de um conjunto de
perguntas específicas no questionário. Exemplos de ques­tões de pesquisa:
• Quais consumidores frequentarão a loja de conveniência?
Para responder a essa questão de pesquisa, deverão constar do questionário perguntas
específicas sobre: sexo, idade, escolaridade, classe social, estilo de vida, local de moradia
dos respondentes, entre outras.
• Quais são os hábitos de compra dos consumidores de Campo Grande-MS?
Também para responder a essa questão de pesquisa, deverão constar do questionário
inúmeras perguntas específicas sobre: O que compram? Quando compram? Onde
compram? Com que frequência compram? Quanto compram de cada vez? Como
pagam? etc.
Quando a pesquisa trata da verificação de relações de causa e efeito entre variáveis, surge
a necessidade do estabelecimento de hipóteses ou proposições de pesquisa. Uma hipótese de
pesquisa consiste numa afirmação sobre o possível relacionamento de causa e efeito entre
variáveis sob estudo. Essa hipótese será verificada por meio das informações obtidas pela
pesquisa e poderá ser rejeitada ou não. Se não for rejeitada, o pesquisador admitirá a relação
como verdadeira. No Capítulo 4, encontra-se uma discussão mais detalhada sobre hipóteses
e relações de causa e efeito em relação a pesquisas explicativas (ou causais).
Alguns exemplos de hipóteses de pesquisas:
Processo de Pesquisa 35

• Quanto mais jovem o consumidor do produto, mais suscetível aos apelos de propaganda.
• A marca do concorrente tem maior participação de mercado porque seus índices de “não
estoque” na rede de distribuição são menores do que os da empresa.
Dados, variáveis e indicadores da pesquisa – Nesta fase, já se deve ter noção clara
dos objetivos que se pretendem atingir, bem como das questões e hipóteses da pesquisa,
o que permitirá, com relativa facilidade, a definição dos dados que precisam ser coletados para
que se tenha êxito.
Ao campo de variação de cada tipo de dado a ser obtido, denomina-se variável. Assim, se
houver interesse na obtenção de dados sobre a idade dos entrevistados, o campo de variação
desse dado será chamado de variável idade. Se for necessário classificar os entrevistados segundo
seus rendimentos mensais, o campo de variação desse dado será chamado de variável renda
individual.
É extremamente fácil identificar e medir algumas variáveis, denominadas simples. Para tanto,
é suficiente que uma única pergunta, direta e objetiva, conste do questionário. Exemplos de
variáveis simples: idade, altura, peso, sexo, escolaridade.
Outras variáveis, denominadas complexas, não são passíveis de medição direta. Para que
possam ser medidas, é preciso identificar um conjunto de indicadores (variáveis simples) cuja
variabilidade conjunta fornecerá as medidas da variável complexa que se pretende medir.
Exemplo de variável complexa: nível socioeconômico dos entrevistados – essa variável só será
passível de medição por um complexo conjunto de indicadores, como: nível de escolaridade,
atividade profissional, posse de bens, renda, local e tamanho da moradia.
Fontes de dados – Precedendo a determinação de como obter os dados, vem a neces-
sidade de descobrir onde se encontram, quem os possui, como estão armazenados, se estão
disponíveis etc.
Fontes primárias – Chamam-se de fontes primárias ou diretas de dados as que são portadoras
de dados brutos, ou seja, dados que nunca foram coletados, tabulados e analisados. São fontes
primárias: consumidores, telespectadores, radiouvintes, intermediários, leitores etc. Denomi-
nam-se de dados primários ou diretos os obtidos nessas fontes.
Dados secundários – Chamam-se de fontes secundárias ou indiretas de dados as que pos-
suem dados que já foram coletados, tabulados e analisados, ou seja, foram informados – e
estão à disposição para consulta. São fontes de dados secundários: IBGE, Fundação SEADE,
FIPE, FGV, relatórios de pesquisas, jornais, revistas, livros etc.
Metodologia de pesquisa – Tendo as fontes de dados sido identificadas, a fase seguinte
é a determinação da metodologia de pesquisa a ser seguida. Essa fase compreende os seguintes
passos:
1. Tipo de pesquisa – Seleciona(m)-se o(s) tipo(s) de pesquisa(s) mais adequado(s) para a
obtenção dos dados nas fontes já identificadas. O pesquisador poderá optar por um método ou
por uma combinação dos seguintes métodos (ou tipos) de pesquisas: exploratória, conclusiva
descritiva (ou simplesmente descritiva) e conclusiva explicativa (ou simplesmente explicativa).
A apresentação, a descrição e a discussão desses métodos de pesquisa estão nos Capítulos 3 e 4.
2. Métodos e técnicas de coleta de dados – Em função do tipo de pesquisa escolhido e da fonte
de dado, o pesquisador deverá, a seguir, determinar quais métodos e técnicas de coleta de
dados irá utilizar. Poderá optar por um ou por uma combinação dos seguintes:
• Levantamentos bibliográficos.
• Levantamentos documentais.
36 Pesquisa de Marketing

• Estatísticas publicadas.
• Entrevistas com especialistas.
• Entrevistas focalizadas de grupo (pesquisa de motivação).
• Observação assistemática.
• Observação sistemática.
• Entrevistas pessoais.
• Entrevistas pelo telefone.
• Questionários distribuídos e recolhidos pelo correio, fax e internet.
• Questionários distribuídos e recolhidos pessoalmente.
• Levantamentos de campo.
• Estudos de campo.
• Estudos em laboratório.
• Estudos de casos.
A apresentação detalhada desses métodos e técnicas e a discussão de seus usos estão no
Capítulo 5.
3. População de pesquisa, tamanho da amostra e processo de amostragem – Este é um dos passos
mais importantes do processo de pesquisa, principalmente quando se tratar de pesquisas des-
critivas – levantamento, por exemplo –, em que a preocupação com a representatividade da
amostra é total. Essa importância fica evidenciada quando alguém se atém à essência de um
processo de pesquisa. Quando se deseja saber algo sobre uma população desconhecida, há
duas opções para conseguir informações, e uma delas consiste em obter os dados de cada
elemento dessa população, realizar o que é chamado de censo. Porém, a teoria, a prática e a
própria intuição indicam que esse caminho não é recomendável, por ser trabalhoso, caro e,
principalmente, desnecessário. A coleta e a análise de apenas alguns elementos dessa população,
desde que efetuadas segundo determinados critérios estatísticos e acompanhadas de inúmeros
cuidados operacionais, serão suficientes para proporcionar, de forma relevante, as informações
procuradas sobre essa população. A Figura 2.2 mostra um diagrama dessa essência do processo
de pesquisa. Em função do exposto, cabe ao pesquisador, nessa fase, definir metodologicamente
a pesquisa, determinar a população de pesquisa, o número de elementos dessa população
que farão parte da amostra e o processo pelo qual serão escolhidos os elementos que farão
parte da amo­stra. Esses assuntos serão abordados nos Capítulos 7 e 8.
4. Planejamento da coleta de dados − Visa definir uma série de medidas que venham a facilitar
a realização da coleta de dados e que minimizem a ocorrência de fatos que possam com-
prometer os resultados da pesquisa. O planejamento da coleta de dados vai depender do tipo

Figura 2.2  Diagrama da essência do processo de pesquisa.


Processo de Pesquisa 37

de pesquisa e dos métodos e técnicas a serem utilizados, e pode compreender as seguintes


definições:
• Perfil dos entrevistadores e dos supervisores de campo.
• Número de entrevistadores e de supervisores de campo, número de entrevistas diárias por
entrevistador, distribuição dos entrevistadores e supervisores de campo pelas áreas de pes-
quisa.
• Prazo para realização do campo.
• Sistema de remuneração dos entrevistadores.
• Material e forma de treinamento dos entrevistadores.
• Procedimentos de coleta de dados a serem seguidos por entrevistadores.
• Procedimentos de supervisão a serem seguidos por supervisores de campo.
• Procedimentos de verificação das entrevistas realizadas.
5. Planejamento do processamento e análise dos dados – Nesse passo da metodologia, o pes-
quisador deverá prever como os dados deverão ser processados e quais análises serão efetuadas
para se chegar a informação(ões) que traga(m) respostas ao problema de pesquisa. Essa previsão
pode incluir a definição de:
• Tabelas, quadros, gráficos e figuras.
• Quais variáveis terão tabulação simples.
• Quais variáveis deverão ser tabuladas em conjunto com outras (tabulação cruzada).
• Quais medidas estatísticas deverão ser calculadas para cada variável (média, moda, variância etc.).
• Quais variáveis e a que testes estatísticos deverão ser submetidas.
Convém notar que todo esse planejamento da análise deve ser feito à luz do problema e
dos objetivos da pesquisa, e visa evitar que inúmeros processamentos e análises desnecessários
sejam efetuados, economizando tempo, material e dinheiro.
O planejamento do processamento e da análise permite ainda prever quais recursos hu-
manos, equipamentos e sistemas serão necessários quando sua alocação for possível. Quando
não, servirá para condicionar as análises aos recursos disponíveis.
Uma última implicação importante é que o planejamento da análise pode exigir a rede-
finição do número de elementos da amostra anteriormente previsto.
6. Planejamento da organização, cronograma e orçamento – De posse de tudo que foi planejado,
o pesquisador agora estará em condições de definir a estrutura organizacional, o cronograma
e o orçamento da pesquisa.
Poderá, inicialmente, optar entre realizar a pesquisa pela própria empresa ou encomendá-la
em empresas/institutos de pesquisas. Inúmeros fatores precisam ser levados em consideração
nessa opção, dentre os quais:
• Disponibilidade de recursos internos para levar a pesquisa a bom termo.
• Capacidade técnica do departamento de pesquisa.
• Capacidade operacional do departamento de pesquisa.
• Custo de comprar × custo de fazer.
• Capacidade técnica do fornecedor de pesquisa.
• Prazo disponível.
Caso se decida por contratar uma empresa externa para efetuar a pesquisa (ou parte dela),
o responsável pelo departamento de pesquisa terá de decidir a quem contratar.
Caso a decisão seja fazer a pesquisa internamente, o pesquisador deverá definir a equipe
e sua organização, que compreenderá as seguintes etapas:
38 Pesquisa de Marketing

• Definição de cargos e funções, técnicas e operacionais, e o número de ocupantes.


• Definição de coordenações e supervisões.
• Atribuição de responsabilidades e de autoridades.
Também deverá ser elaborado um cronograma detalhado da pesquisa, dele constando
todas as etapas, fases e passos, suas durações e os respectivos momentos de início e término.
O cronograma deverá mostrar todo o inter-relacionamento entre as partes componentes e
a duração total do projeto, destacando seu caminho crítico (partes cujos atrasos ou anteci-
pações possam implicar mudanças no prazo final da pesquisa).
Concluindo essa etapa, deverá ser elaborado um orçamento da pesquisa. Deverão ser
considerados todos os custos diretos e indiretos, como os de: coordenação, supervisão, técnicos,
secretaria, materiais, composição e impressão dos instrumentos, coleta de dados, processamento,
análises e interpretações, além de outros custos indiretos. Muitas vezes, durante a elaboração
dessa etapa, o pesquisador poderá ter que redefinir etapas e fases anteriores para adequar o
orçamento da pesquisa à verba disponível para sua realização. Uma vez definido o orçamento,
é importante elaborar um fluxo de necessidades de caixa que cubra todo o período de sua
execução. Essa providência ajudará a definir, junto à empresa ou ao patrocinador da pesquisa,
o fluxo necessário de entradas de caixa durante sua execução.
7. Redação do projeto e (ou) da proposta de pesquisa – Quando o projeto for muito grande ou
metodologicamente muito complexo, torna-se imperativa a colocação num documento escrito
de todo o resultado do processo de planejamento, que se denomina projeto ou plano de pes-
quisa. O projeto de pesquisa tem a finalidade principal de permitir que toda a equipe traba­lhe
de forma coordenada, com conhecimento de todos os detalhes metodológicos e operacionais.
O projeto de pesquisa é um documento interno da equipe e não deve circular fora dela. Para
circular fora da equipe, junto a outras áreas da empresa, ou para obter aprovação da pesquisa
por um cliente, faz-se necessária a elaboração de uma proposta de pesquisa. A proposta de
pesquisa deve conter, de forma sucinta, todas as informações sobre seu planejamento que
sejam importantes para o conhecimento do público-leitor e das pessoas que aprovarão ou
não a pesquisa, sem, no entanto, deixar transparente a essência da metodologia a ser seguida.

Etapa 3: Execução da pesquisa


Nesta etapa, proceder-se-á à efetiva realização da pesquisa. Tudo que foi planejado na etapa
anterior passa agora a se concretizar. Os cuidados do pesquisador concentram-se na opera-
cionalização, de forma a zelar para que:
• Os recursos necessários estejam disponíveis nos prazos e quantidades previstos.
• As etapas, as fases e os passos sigam exatamente o cronograma estabelecido no projeto.
• Todos os cuidados metodológicos sejam atendidos durante a coleta de dados no campo,
na verificação, no processamento e na análise.
• A supervisão de campo efetivamente funcione e verifique, conforme previsto, a realização
e a confiabilidade das entrevistas.
• Os entrevistadores contratados possuam o perfil projetado e sejam efetivamente treinados
para a pesquisa.
• As entrevistas sejam efetuadas com os elementos da amostra conforme planejado e que as
eventuais substituições sigam as regras estabelecidas.
Essa etapa compreende três fases: a preparação do campo; a realização do campo e o proces-
samento (análise/interpretação/conclusão).
Processo de Pesquisa 39

Os passos de cada fase dependerão do tipo de pesquisa, dos métodos e técnicas escolhidos,
e compreendem:
Na preparação do campo:
• Construção, pré-teste e reformulação do instrumento de pesquisa e do manual de campo.
• Edição e impressão do instrumento e do manual de campo.
• Definição (e sorteio) da amostra.
• Formação da equipe de campo: recrutamento, seleção e treinamento.
• Distribuição do trabalho entre a equipe.
Na realização do campo:
• Coleta dos dados.
• Conferência, verificação, codificação e correção dos preenchimentos dos instrumentos de
coleta de dados.
• Checagem para verificar a veracidade e a confiabilidade dos dados, além de esclarecimento
de eventuais dúvidas.
No processamento (análise/interpretação/conclusão):
• Preparação da planilha eletrônica.
• Digitação – Passagem dos dados dos instrumentos para arquivos eletrônicos.
• Verificação e consistência eletrônica do banco de dados.
• Processamento – Trabalho de contagem, cruzamentos, realização de cálculos e testes es-
tatísticos feitos geralmente em computadores.
• Análise/interpretação/conclusão – Relacionar os dados e as informações obtidas no
processamento dos dados com o problema e os objetivos da pesquisa, de forma a permitir
abstrações, conclusões, sugestões e recomendações relevantes para solucionar ou ajudar
na solução do problema ou sugerir a realização de novas pesquisas cuja necessidade tenha
sido constatada pelo estudo presente.

Etapa 4: Comunicação dos resultados


Nesta última etapa da pesquisa, o pesquisador procederá à elaboração e à entrega do relatório
da pesquisa e da preparação e da apresentação oral dos resultados.
Geralmente devem ser preparados dois relatórios: um completo e outro sintético. O
relatório completo deverá conter a apresentação da pesquisa – problema, objetivos, questões
de pesquisa –, principais aspectos metodológicos e operacionais, resultados da pesquisa –
apresentados por meio de tabelas, quadros, figuras, gráficos e comentários – e suas principais
conclusões e recomendações. O relatório sintético, também chamado gerencial, deverá conter
apenas as principais tabelas e gráficos e as principais conclusões e recomendações.
Além desses dois relatórios, é recomendável que, alguns dias após a entrega – num tempo
suficiente para que os interessados nos resultados já tenham tido contato com suas informações
–, o pesquisador realize uma apresentação oral (apoiado em material visual), num encontro
em que estejam presentes todos os interessados nos resultados. Trata-se de uma excelente
oportunidade para esclarecimento de dúvidas, discussão dos resultados e das soluções sugeridas.
Convém, mais uma vez, enfatizar que a realização de uma pesquisa não é um processo
linear, em que as etapas se sucedem sequencialmente, como pode parecer pela apresentação
com objetivos didáticos que foi feita. Na verdade, o processo é cíclico e interagente. Etapas,
fases e passos posteriores poderão influir na reformulação de etapas, fases e passos anteriores.
À medida que se vai conhecendo e praticando o processo de pesquisa, cresce a evidência
40 Pesquisa de Marketing

dessa sua característica cíclica. É natural que, ao se formular o problema e se elaborar o


planejamento da pesquisa, faz-se isso em função dos conhecimentos acumulados até aquele
momento. No entanto, durante o planejamento e a execução da pesquisa, passa-se a ampliar os
conhecimentos sobre o assunto, o que poderá exigir seu replanejamento parcial ou até total.
Existe uma forma prática de se obter consistência entre os principais componentes de
um processo de pesquisa. Essa forma prática consiste na construção de um quadro em que se
procura relacionar: para cada objetivo, as questões e as hipóteses de pesquisa; para cada ques-
tão ou hipótese de pesquisa, as variáveis necessárias; para cada variável, seus indicadores e o
conjunto de perguntas ou itens do questionário a ela relacionados. Na Figura 2.3, apresenta-se
um exemplo dessa disposição. O pesquisador que proceder dessa forma dificilmente pesquisará
uma variável desnecessária, ou colocará no questionário perguntas ou itens que nada tenham
a ver com o trabalho.

Figura 2.3  Matriz de amarração para relacionar objetivos, questões, hipóteses, variáveis, indicadores e
itens do instrumento.

RESUMO
Existem diversas formas utilizadas pelo homem para adquirir conhecimento: popular, religiosa,
filosófica e científica. Cada uma delas apresenta características distintas, mas todas são válidas.
Processo de Pesquisa 41

A forma científica de aquisição de conhecimentos é a única que permite verificação


empírica e, por isso, é a única aceita pela comunidade científica.
A forma de se ganhar conhecimento científico por excelência é por meio da pesquisa científi-
ca.A pesquisa científica tem procedimentos muito claros e específicos que precisam ser obedecidos
para que os resultados tenham validade e sejam reconhecidos pela comunidade científica.
A pesquisa de marketing deve seguir os procedimentos da pesquisa científica, adaptados
às ciências humanas.
Existem pesquisas básicas e pesquisas aplicadas de marketing. As pesquisas básicas de
marketing visam ampliar e aprofundar conhecimentos de marketing, como área de adminis-
tração, e, as aplicadas, à obtenção de respostas para questões práticas de marketing no processo
de decisão da empresa.
A pesquisa de marketing é a investigação sistemática, controlada, empírica e crítica de
dados com o objetivo de descrever fatos ou de verificar a existência de relações presumidas
entre fatos referentes ao marketing de bens, serviços e ideias, e ao marketing como área de
conhecimento de administração.
A pesquisa de marketing compreende inúmeras etapas, fases e pas­sos, compondo um
processo cíclico e interagente, em que etapas, fases e passos posteriores podem influenciar na
reformulação de etapas, fases e passos anteriores.

QUESTÕES DE REVISÃO
1. Compare as quatro formas de aquisição de conhecimentos e faça uma lista das vantagens
e desvantagens de cada uma.
2. Faça uma distinção entre pesquisa básica de marketing e pesquisa aplicada de marketing.
3. Faça uma descrição de todo o processo de pesquisa de marketing, com suas várias etapas,
bem como de suas fases e de seus passos. Nessa descrição, procure evidenciar o caráter
cíclico da pesquisa de marketing.
4. O que o pesquisador deve levar em conta na definição do problema de pesquisa?
5. Por que a pesquisa precisa ser planejada antes que qualquer dado seja coletado no campo?
6. O que são variáveis de pesquisa? O que são indicadores de variáveis? Quando o pesquisador
precisa usar indicadores?
7. Qual é a essência do processo de pesquisa?
8. Quais fatores influenciam a decisão de fazer internamente pesquisas de marketing ou
contratar externamente?

Exercício
Relate uma situação real que caracterize um problema de marketing cuja solução possa receber
contribuições da pesquisa de marketing. Procure definir os objetivos que uma pesquisa deverá
ter para solucionar o problema de pesquisa relatado.

Trabalho – Parte 1
• Defina um problema de marketing associado ao problema de marketing definido.
• Defina um problema de pesquisa de marketing e o objetivo dessa pesquisa.
• Esse problema deverá ser transformado num projeto de pesquisa ao longo deste livro.
42 Pesquisa de Marketing

REFERÊNCIAS
CASTRO, Cláudio de Moura. A prática da pesquisa. São Paulo: McGraw-Hill, 1978.
KERLINGER, Fred N. Foundations of behavioral research. 2. ed. New York: Holt, Rinehart, 1973.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Metodologia científica. São Paulo: Atlas, 1983.
SELLTIZ, Claire; JAHODA, Marie; DEUTSCH, Morton; COOK, Stuart W. Métodos de pesquisas nas relações sociais.
São Paulo: Editora Pedagógica e Universitária - EPU. Editora da Universidade de São Paulo, 1974.
CAPÍTULO 3
Tipos de Pesquisa
Não palmilhe sempre o mesmo caminho, passando somente onde outros já passaram.
Abandone ocasionalmente o caminho trilhado e embrenhe-se na mata. Certamente
descobrirá coisas nunca vistas, insignificantes, mas não as ignore. Prossiga explorando
tudo sobre elas; cada descoberta levará a outra. Antes do esperado, haverá algo que
mereça reflexão.
Alexandre Graham Bell

Objetivos
• Apresentar a classificação dos tipos de pesquisa.

Sumário
CLASSIFICAÇÃO DOS TIPOS DE PESQUISA
PESQUISA EXPLORATÓRIA
Métodos da pesquisa exploratória
PESQUISA CONCLUSIVA DESCRITIVA
Levantamentos e estudos de campo
Pesquisa ocasional e pesquisa evolutiva

No Capítulo 2, foram apresentadas as etapas componentes de um processo de pesquisa. Foi


enfatizada a importância de se ter o problema claramente definido, bem como a neces-
sidade de se planejar todas as fases de sua execução. Naquele momento, foram mencionados
diferentes tipos de pesquisa sem maiores considerações a respeito da natureza de cada tipo.
Neste capítulo, serão apresentados os diferentes tipos de pesquisa, sua natureza e sua
aplicação na solução de vários problemas de marketing.
Diferentes tipos de pesquisa implicam diversos procedimentos para coleta e análise
dos dados, de forma a atender, economica e tecnicamente, aos objetivos da pesquisa.

CLASSIFICAÇÃO DOS TIPOS DE PESQUISA


Diferentes classificações dos tipos de pesquisa têm sido adotadas por autores da área. No
Quadro 3.1, são apresentadas as várias classificações e seus respectivos autores.
Essa aparente confusão observada nas diversas classificações ocorre porque o tipo
de pesquisa é um conceito complexo que não pode ser descrito de maneira única.
Muitas dessas classificações utilizam variáveis de classificação que não podem ser usadas
simultaneamente. Assim, diferentes classificações podem ser obtidas usando-se diferentes
variáveis. As pesquisas podem ser classificadas quanto:
• À natureza das variáveis pesquisadas − Pesquisas qualitativas e pesquisas quantitativas.
43
44 Pesquisa de Marketing

• À natureza do relacionamento entre as variáveis estudadas − Pesquisas descritivas e pes-


quisas explicativas.
• Ao objetivo e ao grau em que o problema de pesquisa está cristalizado − Pesquisa ex-
ploratória e pesquisa conclusiva.
• À forma utilizada para a coleta de dados primários − Pesquisa por comunicação e pesquisa
por observação.
• Ao escopo da pesquisa em termos de amplitude e profundidade − Estudos de casos, es-
tudos de campo e levantamentos amostrais.
• À dimensão da pesquisa no tempo − Pesquisas ocasionais e pesquisas evolutivas.
• À possibilidade de controle sobre as variáveis em estudo − Pesquisas experimentais de
laboratório, pesquisas experimentais de campo e pesquisas ex-post facto.
• Ao ambiente de pesquisa − Pesquisa de campo, pesquisa de laboratório e pesquisa por simulação.

Quadro 3.1  Classificações dos tipos de pesquisa


Classificações Autor(es)
Exploratória Selltiz et al. (1974)
Descritiva Churchill (1979)
Causal (ou de Relações Causais; ou Explicativa) Green e Tull (1966)
Exploratórias Cox e Good (1967)
Conclusivas: Malhotra (2001)
– Descritivas
– Causais
Exploratórias Kinnear e Taylor (1979)
Conclusivas:
– Descritivas
– Causais
Performance-monitoração
Exploratórias Boyd e Westfall (1973)
Conclusivas:
– Estudos estatísticos
– Estudos de casos
– Estudos experimentais
Método histórico Luck, Wales e Taylor (1974)
Abordagem inferencial
Abordagem experimental
Método qualitativo Kirk e Miller (1986)
Método quantitativo
Experimental Kerlinger (1973)
Ex-post facto
Levantamentos amostrais Festinger e Katz (1959)
Estudos de campo
Experimentos no campo
Experimentos em laboratório
Exploratório Drake e Miller (1969)
Descritivo
Experimental
Tipos de Pesquisa 45

Uma discussão breve de cada uma dessas abordagens de classificação poderá ajudar a compreender
suas naturezas e suas contribuições para o entendimento do processo de pesquisa.
Natureza das variáveis estudadas – Segundo Kirk e Miller (1986), tecnicamente, a
pesquisa qualitativa identifica a presença ou a ausência de algo, enquanto a quantitativa procura
medir o grau em que algo está presente. Há também diferenças metodológicas: na pesquisa
quantitativa, os dados são obtidos de um grande número de respondentes, usando-se escalas,
geralmente numéricas, e são submetidos a análises estatísticas formais; na pesquisa qualitativa,
os dados são colhidos por meio de perguntas abertas (quando em questionários), em entrevis-
tas em grupos, em entrevistas individuais em profundidade e em testes projetivos. É possível
que numa mesma pesquisa e num mesmo instrumento de coleta de dados haja perguntas
quantitativas e qualitativas.
Natureza do relacionamento entre as variáveis estudadas – A diferença básica entre
pesquisa descritiva e pesquisa causal está em seus objetivos. No primeiro caso, a pesquisa res-
ponderá a questões como: quem, o quê, quanto, quando e onde, enquanto, no segundo caso,
a questão básica a ser respondida é “por quê?”. Por exemplo, por meio de uma pesquisa des-
critiva, é possível traçar-se um perfil do consumidor, quais produtos consome, quanto e quando
consome, e onde compra. Já a pesquisa explicativa trará informações sobre os “porquês”, como:
por que o consumidor prefere a marca A à B? Por que a propaganda X comunica mais que
a Y? Qual será a reação do consumidor diante de alterações nas variáveis de marketing da
empresa (preço, produto, promoção e pontos de distribuição)? Portanto, a pesquisa descritiva
tem o objetivo de expor o fenômeno em estudo, enquanto a pesquisa causal procura verificar
relações entre variáveis que expliquem o fenômeno em estudo.
Objetivo e grau em que o problema de pesquisa está cristalizado – A diferença
básica entre a pesquisa exploratória e a conclusiva está no grau de estruturação da pesquisa
e em seu objetivo imediato. Uma pesquisa exploratória é pouco ou nada estruturada em
procedimentos e seus objetivos são pouco definidos. Seus propósitos imediatos são os de
se ganhar maior conhecimento sobre um tema, desenvolver hipóteses para serem testadas
e aprofundar questões a serem estudadas. Já a pesquisa conclusiva é bastante estruturada em
termos de procedimentos, a(s) questão(ões) e ou hipótese(s) de pesquisa está(ão) claramente
definida(s) e os objetivos são claros: obter respostas para as questões ou hipóteses da pesquisa.
A classificação de pesquisas em exploratórias ou conclusivas é muito menos precisa do que
outras classificações, pois todas as pesquisas têm aspectos exploratórios e são raras aquelas cujo
problema de pesquisa e (ou) objetivos estejam tão bem definidos que possam prescindir de
atividades de pesquisa exploratória. Normalmente, uma pesquisa apresenta uma parte inicial
exploratória que ajudará no delineamento da parte conclusiva.
Forma utilizada para a coleta de dados primários – A forma mais tradicional e
corriqueira de obtenção de dados em pesquisa é pela comunicação com o detentor dos dados
e sua principal característica é que se obtém o dado por meio de uma declaração do próprio
respondente. A primeira forma de pesquisa por comunicação se realiza por meio de entrevistas.
As perguntas são efetuadas e o entrevistado responde verbalmente às perguntas enquanto o en-
trevistador as anota. As entrevistas podem ser individuais ou em grupo, pessoais ou por telefone,
e estruturadas ou não estruturadas. A segunda forma ocorre por meio de questionários, que
têm como característica mais importante ser o próprio respondente quem lê a pergunta e a res-
ponde diretamente no instrumento de pesquisa, sem o auxílio de entrevistadores. As pesquisas
por questionários podem ser efetuadas pessoalmente ou via correio/fax/internet/encarte em
46 Pesquisa de Marketing

jornais e revistas etc. Já a pesquisa por observação consiste na obtenção dos dados sem que
haja comunicação com o pesquisado. Sua principal característica é a de que os dados não são
obtidos por declaração do pesquisado, mas pela observação de seus atos, comportamentos
e fatos. A observação pode ser sistemática ou assistemática, e a olho nu ou com aparelhos
(câmeras de TV e de fotografia, espelhos one-way etc.).
Escopo de pesquisa em termos de amplitude e profundidade – Os estudos de caso,
os levantamentos amostrais e os estudos de campo diferem entre si em função de sua represen-
tatividade quanto à população pesquisada e aos seus graus de profundidade. O estudo de caso é
profundo, mas não amplo; por meio dele, procura-se conhecer profundamente apenas um ou
poucos elementos da população sobre um grande número de aspectos e suas inter-relações. Os
levantamentos amostrais caracterizam-se pela obtenção de dados representativos da população
estudada, tanto em termos do número quanto do processo de seleção dos elementos da amostra
de pesquisa. Já os estudos de campo situam-se no meio-termo entre os estudos de caso, que são
profundos, mas não amplos, e os levantamentos amostrais, que são amplos e representativos da
população, mas pouco profundos. Os estudos de campo trabalham com amostras de dimensões
que permitem análises estatísticas, sem, contudo, haver preocupação com a representatividade,
mas que permitem profundidade maior que a dos levantamentos amostrais.
Dimensão da pesquisa no tempo – Algumas pesquisas são realizadas uma única vez e seus
resultados mostram um instantâneo do fenômeno estudado, outras são periodicamente repetidas
e seus resultados mostram a evolução cronológica das variáveis pesquisadas. As primeiras são
chamadas pesquisas ocasionais (ou ad hoc) e, as segundas, evolutivas.A pesquisa ocasional presta-se
a ajudar a resolver problemas específicos, enquanto as evolutivas servem ao acompanhamento
e controle da atividade de marketing e à detecção de problemas. Nas pesquisas evolutivas, o
pesquisador pode estudar os mesmos elementos da população por vários períodos de tempo
(pesquisa painel) ou usar diferentes elementos a cada medição, conforme determinar os objetivos
da pesquisa. A pesquisa painel é muito utilizada, em marketing, a fim de gerar informações para
controle sobre um grande número de categorias de produtos. Esses dados, coletados de painéis
nacionais (de supermercados, de consumidores, de telespectadores etc.), alimentam periodica-
mente grandes bancos de dados que fornecem informações sobre: participação no mercado,
volume de vendas da categoria de produto no mercado, distribuição qualitativa e quantitativa,
níveis de distribuição sem estoque, respostas a novos produtos, índices de audiência etc.
Possibilidade de controle sobre as variáveis em estudo – A concepção “ideal” de pesquisa,
advinda das áreas de ciências exatas, é o experimento de laboratório, no qual o pesquisador pode
controlar e manipular todas as variáveis em estudo e, assim, estabelecer o relacionamento entre
elas. O experimento de laboratório, segundo essa rígida concepção, não é comumente utilizado
em pesquisas de marketing e pesquisas sociais de forma geral, devido às grandes dificuld­ades de se
criar uma situação de laboratório que corresponda à complexa reali­dade de mercado, e que per-
mita, ao mesmo tempo, o controle de todas as variáveis intervenientes.A pesquisa experimental de
campo constitui-se no estudo de uma situação real, em que uma ou mais variáveis independentes
são manipuladas pelo pesquisador, sob condições tão controladas quanto a situação assim o per-
mitir, e medidos seus efeitos sobre as variáveis dependentes. A partir daí, procura-se verificar a
existência de relações de causa e efeito. A pesquisa ex-post facto procura descobrir a existência de
relacionamentos entre variáveis após o fenômeno em estudo já ter ocorrido. Existem inúmeros
projetos de pesquisas experimentais que visam isolar os efeitos das variáveis não controláveis
sobre o fenômeno estudado e que serão estudados no capítulo seguinte.
Tipos de Pesquisa 47

Ambiente de pesquisa – Essa forma de classificar pesquisas procura distinguir as que


são feitas em condições ambientais reais daquelas realizadas em condições artificiais ou
simuladas, denominadas, respectivamente, por pesquisas de campo, pesquisas de laboratório
e pesquisas por simulação. Como para algumas pesquisas o próprio ambiente real pode ser
considerado um laboratório, a principal distinção será em função de sua realização com
sujeitos reais em condições ambientais consideradas normais para o problema estudado,
com sujeitos normais em condições laboratoriais ou com sujeitos irreais por meio da
simulação com modelos em computadores construídos a partir de informações sobre o
mercado.
Pelas considerações feitas, qualquer classificação que não leve em conta todas essas variáveis
classificatórias sempre será incompleta e, por isso, sujeita a críticas. No entanto, para efeito
didático, faz-se necessário adotar uma classificação; neste livro, optou-se pela que considera,
num primeiro momento, objetivo e grau em que o problema de pesquisa está cristalizado e,
a seguir, a natureza do relacionamento entre as variáveis estudadas. A classificação resultante
está na Figura 3.1.

Figura 3.1  Classificação de pesquisas.

As pesquisas explicativas são também chamadas de verificativas ou causais.


Evrard, Pras e Roux (1993) apresentam, na Figura 3.2, uma classificação dos objetivos de uma
pesquisa de marketing segundo o problema de decisão que se pretende solucionar.

Figura 3.2  Classificação dos objetivos de uma pesquisa de marketing, segundo o problema a solucionar.

Pesquisa exploratória – Conforme o objetivo da pesquisa, a primeira necessidade pode


ser a de explorar um tema que é de desconhecimento do pesquisador; essa exploração per-
mitirá ao pesquisador ganhar conhecimento para gerar questões de pesquisa e o instrumento
de coleta que lhe permitirá realizar um estudo descritivo.
Pesquisa conclusiva descritiva - Um projeto de pesquisa conclusiva descritiva tem
por objetivo descrever o fenômeno que está sendo pesquisado. Os conhecimentos adquiridos
tanto no estudo exploratório quanto no descritivo conclusivo possibilitam ao pesquisador
além da descrição dos fenômenos observados, a elaboração de hipóteses sobre as razões dos
fatos observados e descritos.
Pesquisa conclusiva explicativa – No projeto de pesquisa conclusiva explicativa o
pesquisador realiza a verificação das hipóteses de pesquisa e poderá constatar quais devem ser
aceitas como explicativas desses fatos e quais devem ser rejeitadas.
48 Pesquisa de Marketing

Geralmente o pesquisador inicia com uma pesquisa exploratória, segue com uma pesquisa
conclusiva descritiva e, com base nos resultados, conclui com uma pesquisa conclusiva explicativa.
O pesquisador pode também iniciar com uma pesquisa exploratória, seguir com uma con-
clusiva descritiva e, com base em seus resultados, efetuar uma segunda pesquisa exploratória,
procurando levantar hipóteses explicativas para os resultados e concluir com uma pesquisa
conclusiva explicativa para verificar as hipóteses levantadas.
Todos os três tipos de projetos de pesquisa podem contribuir (o exploratório menos in-
tensamente) para a construção de modelos de simulação do funcionamento de mercados.

PESQUISA EXPLORATÓRIA
A pesquisa exploratória visa prover o pesquisador de maior conhecimento sobre o tema ou
problema de pesquisa em perspectiva. Por isso, é apropriada para os primeiros estágios da in-
vestigação quando a familiaridade, o conhecimento e a compreensão do fenômeno por parte
do pesquisador são, geralmente, insuficientes ou inexistentes.
Esse tipo de pesquisa é particularmente útil quando se tem uma noção muito vaga do pro-
blema de pesquisa. Será preciso conhecer de maneira mais profunda o assunto para se estabelecer
melhor o problema de pesquisa por meio da elaboração de questões e do desenvolvimento ou
criação de hipóteses explicativas para os fatos e os fenômenos a serem estudados. Nos primeiros
estágios da pesquisa, o pesquisador não tem conhecimento suficiente para formular questões e
(ou) hipóteses específicas (uma hipótese é uma afirmação que especifica como duas variáveis
devem estar relacionadas). Mesmo quando já existem conhecimentos do pesquisador sobre o
assunto, a pesquisa exploratória também se faz útil, pois normalmente para um mesmo fato
em marketing poderá haver inúmeras explicações alternativas, e sua utilização permitirá ao
pesquisador tomar conhecimento, se não de todas, pelo menos da maior parte delas. A seguir,
um exemplo para ilustrar esse fato.
Fato verificado: as vendas do produto A estão caindo. Possíveis explicações para o fato:
• Preço elevado.
• Força de vendas fraca: número de vendedores insuficiente, vendedores desmotivados,
vendedores mal treinados.
• Propaganda fraca: insuficiente, ineficaz, meios de comunicação inadequados.
• Promoção de vendas: ausente, fraca, inadequada.
• Ausência do produto nos pontos de venda.
• Problemas com o produto: produto em si, marca, embalagem, mau uso do produto, assis-
tência técnica ruim.
Para saber quais das várias opções se aplicam ao problema de pesquisa, somente a pesquisa
exploratória poderá ajudar o pesquisador.
A pesquisa exploratória também poderá ajudar a estabelecer as prioridades a serem pes-
quisadas. As prioridades poderão ser estabelecidas porque uma particular hipótese explicativa
surgida durante a pesquisa exploratória parecerá mais promissora do que outras. Além disso, a
pesquisa exploratória poderá gerar informações sobre as possibilidades práticas da condução
de pesquisas específicas.
Usa-se a pesquisa exploratória também para a clarificação de conceitos. Por exemplo, o gerente
de vendas está considerando a possibilidade de mudar a sua política de remuneração de vendedores
que deverá resultar numa elevação do grau de satisfação da equipe, e quer verificar, por meio de
Tipos de Pesquisa 49

uma pesquisa, se isso vai efetivamente acontecer e quanto proporcionará de melhoria. Uma pes-
quisa exploratória poderá ser usada para clarificar o conceito de “grau de satisfação da equipe” e
ajudar a desenvolver uma escala pela qual o grau de satisfação poderá ser convenientemente medido.
Em resumo, a pesquisa exploratória pode ser usada para os seguintes objetivos:
• Familiarizar e elevar o conhecimento e a compreensão de um problema de pesquisa em
perspectiva.
• Auxiliar a desenvolver a formulação mais precisa do problema de pesquisa.
• Acumular a priori informações disponíveis relacionadas a um problema de pesquisa con-
clusiva a ser efetuada ou em andamento.
• Ajudar no desenvolvimento ou na criação de hipóteses explicativas de fatos a serem
verificados numa pesquisa explicativa.
• Ajudar no desenvolvimento ou na criação de questões de pesquisa relevantes para o objetivo
pretendido.
• Auxiliar na determinação de variáveis relevantes a serem consideradas num problema de
pesquisa.
• Clarificar conceitos.
• Ajudar no delineamento do projeto final da pesquisa.
• Verificar se pesquisas semelhantes já foram realizadas, quais os métodos utilizados e quais
os resultados obtidos.
• Estabelecer prioridades para futuras pesquisas.

Métodos da pesquisa exploratória


A pesquisa exploratória utiliza métodos bastante amplos e versáteis. Os métodos empregados
compreendem: levantamentos em fontes secundárias, levantamentos de experiências, estudos
de casos selecionados e observação informal.
Levantamentos em fontes secundárias – Esses levantamentos compreendem: levan-
tamento bibliográfico, levantamento documental, levantamento de estatísticas e levantamento
de pesquisas realizadas.
Levantamento bibliográfico – Uma das formas mais rápidas e econômicas de amadurecer ou
aprofundar um problema de pesquisa é pelo conhecimento dos trabalhos já feitos por outros,
via levantamento bibliográfico. Esse levantamento deverá envolver procura em livros sobre
o assunto, revistas especializadas ou não, dissertações e teses apresentadas em universidades e
informações publicadas por jornais, órgãos governamentais, sindicatos, associações de classe,
concessionários de serviços públicos etc.
Levantamento documental – Às vezes, a própria empresa mantém em seus arquivos valiosas
informações sobre resultados de pesquisas anteriores, registros de gastos em propaganda e pro-
moção de vendas, número de vendedores por mês e por região, dados sobre produção, estoques
e vendas mensais, práticas de preço etc. Essas informações, além de terem custos praticamente
desprezíveis, poderão ser de grande importância, não só para a pesquisa em pauta, mas também
para o delineamento de novas pesquisas. O levantamento documental também pode ser efetuado
fora da empresa, quando se recorre à análise de documentos à disposição em arquivos públicos.
Levantamento de estatísticas – São inúmeras as instituições governamentais ou não que geram
estatísticas sobre os mais diferentes assuntos. É importante estar sempre atento e buscar es-
tatísticas que possam ajudar no delineamento do problema de pesquisa. Exemplos de fontes
de estatísticas: IBGE, FIPE, FGV, Fundação SEADE.
50 Pesquisa de Marketing

Levantamento de pesquisas realizadas –Vale a pena certo esforço para verificar se já foram efetuadas
pesquisas sobre o tema em estudo. Mesmo quando efetuadas em outros locais e em outras épocas,
e por isso de pouca utilidade imediata, sua localização e seu conhecimento permitirão ao pes-
quisador ter contato com as metodologias utilizadas, e isso o levará a decidir por sua adoção ou não
no projeto. Não é raro o pesquisador ficar surpreso com informações também aproveitáveis para
sua pesquisa.As fontes para esses levantamentos são: empresas/institutos de pesquisa, universidades,
faculdades, publicações especializadas etc.
O grande risco do pesquisador ao desprezar as fontes secundárias de dados é o de conduzir
a pesquisa errada. Muitos esforços e recursos poderão ser despendidos na realização de pes-
quisas erradas ou em pesquisas que já foram realizadas.
Convém lembrar que, em levantamentos secundários, como em pesquisas exploratórias
em geral, o importante é descobrir ideias e explicações possíveis para o fato ou fenômeno a
serem posteriormente investigadas, e não tomá-las como verdades.
Os levantamentos em fontes secundárias ficaram bastante facilitados com a utilização cada
vez mais intensa da internet. No Capítulo 5, encontra-se uma relação de sites importantes para
o levantamento em fontes secundárias.
Levantamentos de experiência – Grande parte das experiências e dos conhecimentos
adquiridos não está escrita. Muitas pessoas, em função da posição privilegiada que ocupam
cotidianamente, acumulam experiência e conhecimento sobre um dado tema ou problema em
estudo. Em pesquisas de marketing, todas as pessoas envolvidas nos esforços de marketing de
um produto são potencialmente detentoras de informações relevantes. Dentre elas, incluem-se:
presidentes de empresas, diretores de marketing, gerentes de marketing, gerentes de ven­das, gerentes
de produto, supervisores de vendas, vendedores, promotores de ven­das, intermediários e clientes/
consumidores.Também se devem incluir pessoas que, embora não estejam envolvidas diretamente
no marketing da empresa, detêm valiosas informações devido à sua atividade profissional ou ao
cargo que ocupam, como: consultores, pesquisadores, professores, advogados, cientistas, jornalistas,
presidentes e diretores de sindicatos e associações de classe etc. O objetivo do levantamento de
experiências é o de obter e sintetizar todas as experiências relevantes sobre o tema em estudo e,
dessa forma, tornar o pesquisador cada vez mais consciente da problemática em estudo.
As formas de levantamento de experiências compreendem: entrevistas individuais, ou em
grupo com especialistas, ou conhecedores do assunto. São conduzidas entrevistas individuais
quando o número de especialistas é pequeno e tem experiências variadas. Já as entrevistas
em grupo são utilizadas quando esse número for grande e com experiências assemelhadas.
Para obter rapidez e economia no processo de levantamento de experiências, é necessário
escolher cuidadosamente as pessoas a serem pesquisadas. Será perda de tempo entrevistar pes-
soas com pouca experiência significativa, pouco conhecimento ou que tenham dificuldade
em comunicar suas experiências. Uma forma de identificar as pessoas certas é indagar junto
a administradores que trabalham na área em estudo, estrategicamente situados, quem são os
indivíduos com mais experiência, informação, capacidade analítica e capacidade de comunicar
suas experiências e conhecimentos. Apesar de não haver preocupação com a representatividade,
é interessante entrevistar pessoas com diferentes experiências, para que se tenha uma visão ampla
e com diferentes pontos de vista sobre o problema em estudo.
Essas entrevistas, tanto individuais quanto em grupos, caracterizam-se pela informalidade e
pela pouca estruturação. É comum o pesquisador dispor apenas de um roteiro dos assuntos a
serem abordados. Outras vezes, os assuntos estão colocados na forma de perguntas abrangentes,
Tipos de Pesquisa 51

como “qual sua opinião sobre o mercado de computadores no Brasil?”, “qual sua opinião
sobre as possíveis razões para a queda nas vendas e na participação de mercado de nossa linha
de detergentes domésticos?”. Tendo em vista que o objetivo é ganhar conhecimento sobre o
tema, o próprio pesquisador é quem deve, de preferência, realizar as entrevistas, porém não
deve ir para as entrevistas com total desconhecimento sobre o assunto. Uma das maneiras
de ganhar conhecimento prévio é pela pesquisa documental e bibliográfica. O número de
entrevistas a realizar não é definido – e devem-se realizar tantas quantas forem necessárias. A
partir do momento em que se perceber que novas entrevistas não estão mais trazendo con-
tribuições significativas para ampliar a compreensão do tema, é chegado o momento de parar.
O levantamento de experiências, além de ajudar a aprofundar o conhecimento sobre o
problema em estudo, poderá trazer outras valiosas contribuições para a pesquisa, como: quais
os problemas mais emergentes? Quais as facilidades disponíveis para a condução da pesquisa?
Quais fatores podem ou não ser controlados? Quais as possíveis fontes de dados e sua aces-
sibilidade? Qual a disposição das pessoas em cooperar?
Cuidados especiais devem ser tomados ao se apresentarem os resultados de levantamentos
de experiências. Deve ficar claro que se trata de estudos exploratórios e não conclusivos,
que seus objetivos consistem em aprofundar o conhecimento do assunto e gerar hipóteses
explicativas sobre os fatos e os fenômenos em estudo e, finalmente, que as informações foram
obtidas junto a uma amostra casual ou intencional de pessoas com experiência nesse campo.
Estudos de casos selecionados – Uma terceira forma de aprofundar o conhecimento de
problemas não suficientemente definidos é por meio de estudos de casos selecionados.Trata-se
de um método muito produtivo para estimular a compreensão e sugerir hipóteses e questões
para a pesquisa. O método do estudo de casos pode envolver exame de registros existentes,
observação da ocorrência do fato, entrevistas estruturadas, entrevistas não estruturadas etc.
O objeto do estudo pode ser um indivíduo, um grupo de indivíduos, uma organização, um
grupo de organizações ou uma situação. Como o estudo de caso é um método de pesquisa
exploratória, convém novamente lembrar que o seu objetivo é o de gerar hipóteses e não
verificá-las, além de possibilitar a ampliação dos conhecimentos sobre o problema em estudo.
Em marketing, existem inúmeras situações em que os estudos de casos ajudam a com-
preender melhor o problema em estudo e a gerar hipóteses, por exemplo: por que certos
vendedores vendem muito mais do que outros? Por que certos intermediários são mais coo-
perativos com a empresa do que outros? Por que certos grupos de consumidores reagem mais
favoravelmente aos apelos promocionais do que outros?
Esse método apresenta três características.A primeira é que os dados podem ser obtidos em tal
nível de profundidade que permitem caracterizar e explicar em detalhes os aspectos singulares do
caso em estudo, bem como apontar semelhanças e diferenças quando comparado com outros casos
estudados. Dependendo dos objetivos e do objeto em estudo, esse método poderá demandar muito
tempo. A segunda característica é a atitude receptiva do pesquisador, que deve ser caracterizada
pela busca de informações e geração de hipóteses, e não por conclusões e verificações. A terceira
é a capacidade de integração do pesquisador de reunir, numa interpretação unificada, inúmeros
aspectos do objeto pesquisado.
Não existem regras para a escolha dos casos pesquisáveis. A experiência indica que, em
determinadas situações, alguns tipos são mais adequados que outros. Por exemplo:
• Casos que reflitam comportamentos ou desempenhos extremados − Estudar o melhor e o
pior vendedor da empresa; estudar um caso de sucesso e outro de insucesso de lançamento
52 Pesquisa de Marketing

de novos produtos na mesma empresa; estudar um caso de empresa bem-sucedida e outro


de uma malsucedida no mesmo ramo empresarial.
• Casos que reflitam mudanças e, particularmente, mudanças abruptas − Estudar uma agência
de um grande banco que vinha tendo um péssimo resultado e que, em pouco tempo, passa
a ter ótimo desempenho, sem que as causas sejam conhecidas.
• Casos em que, reconhecidamente, houve, ou não, exposição a determinadas condi-
ções − Estudar dois produtos de uma mesma empresa em que um ficou exposto a
condições comerciais especiais (por exemplo, descontos e promoções de vendas) e o outro
não.
Em estudos exploratórios é correto afirmar que casos que apresentam nítidos contrastes ou
que tenham aspectos salientes são mais úteis. Assim, em vez de se trabalhar com casos médios,
em que a percepção de pequenas diferenças tende a ser difícil, procura-se trabalhar com
casos extremos, no sentido de exagerar as diferenças que possam existir e daí tirar hipóteses
explicativas para o fato.
Observação informal – A observação informal em pesquisas exploratórias envolve a
natural capacidade de observar continuamente objetos, comportamentos e fatos que estão ao
redor. O processo de observação utilizado no dia a dia é chamado de observação informal não
dirigida. A percepção e a retenção do que é observado são muito pequenas e dependem dos
interesses individuais e da capacidade de percepção do observador. Para a utilização em pesquisas
exploratórias, a observação deve ser informal e dirigida, pois precisa estar centrada unicamente
em observar objetos, comportamentos e fatos de interesse para o problema em estudo, mesmo
que obtidos informalmente.

PESQUISA CONCLUSIVA DESCRITIVA


A pesquisa conclusiva é caracterizada por ter objetivos bem definidos, procedimentos formais,
ser bem estruturada e dirigida à solução de problemas ou à avaliação de alternativas de cursos
de ação.
A maioria das pesquisas de marketing realizada é de pesquisa conclusiva descritiva (ou
simplesmente pesquisa descritiva). Sob a denominação de pesquisa descritiva, agrupa-se uma
série de pesquisas cujos processos apresentam importantes características em comum. Dife-
rentemente do que ocorre nas pesquisas exploratórias, a elaboração das questões de pesquisa
pressupõe profundo conhecimento do problema a ser estudado. O pesquisador precisa saber
exatamente o que pretende com a pesquisa, ou seja, quem e (ou) o que deseja medir, quando
e onde o fará, como o fará e por que deverá fazê-lo.
A pesquisa descritiva compreende um grande número de métodos de coleta de dados que serão
discutidos no Capítulo 5. Esses métodos compreendem: entrevistas pessoais, entrevistas por telefone,
questionários pelo correio, fax/internet, questionários pessoais e observação.
A pesquisa descritiva é utilizada quando o propósito é:
• Descrever as características de grupos. Por exemplo, obter um perfil dos consumido-
res, por meio de sua distribuição em relação a sexo, faixa etária, nível educacional,
nível socioeconômico, preferências e localização.
• Estimar a proporção de elementos numa população específica que tenham determinadas
características ou comportamentos. Por exemplo, quantos consomem o produto A? Quan-
tos assistem ao programa X? Quantos costumam comprar o produto Z em supermercados
Tipos de Pesquisa 53

e quantos em lojas de departamento? Quantos usam o produto A da forma K e quantos


da forma Z?
• Descobrir ou verificar a existência de relação entre variáveis. Por exemplo, será que as pessoas
com maiores níveis de educação formal preferem nosso produto? Será que as novelas de TV
são mais assistidas pelas mulheres com mais de 40 anos do que pelas mais jovens? (Observe
que nenhuma dessas perguntas envolve uma relação de causa e efeito entre as variáveis, mas
simplesmente a existência de relações).
Entre pessoas pouco familiarizadas com pesquisas de marketing, é comum achar que, para
realizá-las, basta construir rapidamente um questionário e sair a campo coletando milhares
de dados. Ao findar esse trabalho imenso, ficam certamente decepcionadas com a inutilidade
da maior parte dos dados coletados dessa forma desordenada. A quantidade de opções de
dados possíveis de serem coletados numa pesquisa é infinita; por isso, é preciso saber antes,
para aquele fato em particular ou fenômeno em estudo, quais são os dados relevantes a serem
coletados. Isso enfatiza, como visto no capítulo anterior, a necessidade de um planejamento
rigoroso da pesquisa.
Considere a seguinte situação: uma cadeia de lojas de varejo está interessada em elevar
o movimento de compras em suas lojas, pois o diretor-superintendente o considera estar
mais de 30% abaixo do nível esperado. Para montar um plano de marketing e fazer as vendas
voltarem ao normal, o diretor-superintendente solicitou a seu pessoal de marketing que antes
aprendesse mais sobre os consumidores-alvo da rede.
Para projetar uma pesquisa que ajude na solução do problema apresentado, algumas ques-
tões precisam ser definidas antes de se efetuar a coleta de dados:
• Como caracterizar o público a pesquisar: por sexo, idade, nível de escolaridade, classe de
renda, ocupação, local de moradia, estilo de vida?
• Como caracterizar a preferência por uma rede de lojas: por frequência de compra, imagem,
itens comprados, fidelidade?
• Quais unidades devem ser consideradas na pesquisa: residências, famílias, indivíduos?
• Como os dados serão coletados: por entrevistas pessoais, entrevistas por telefone, correio,
fax e internet, preenchimento de questionários nas lojas?
• Em que momento as entrevistas devem ser efetuadas: nas lojas, na rua, em casa, no local
de trabalho?
• Como analisar os dados a serem coletados?
Essas questões não exaurem todas as eventuais dúvidas durante a elaboração de um pla-
nejamento de pesquisa. Algumas questões serão respondidas pelo uso da lógica; outras, a
partir de estudos exploratórios, enquanto outras ainda, mais complexas, poderão exigir até
a condução de uma pesquisa-piloto. Uma forma prática de determinar claramente quais
dados deverão ser coletados para a análise é dada pela construção de tabelas projetadas, como
o exemplo apresentado na Tabela 3.1.
A Tabela 3.1 ilustra de que forma podem ser analisadas as preferências pelas diversas cadeias
de lojas de diferentes segmentos de idades. Observe que a tabela lista os particulares segmentos de
idade cuja comparação interessa. É fundamental que essas especificações de variáveis e categorias
sejam definidas antes de a coleta de dados ter início. Os testes estatísticos que serão empregados
para verificar a relação entre idade e preferência por loja também precisam ser especificados.
Após os dados terem sido coletados e a análise iniciada, será tarde para lamentar: “Se nós tivés-
semos coletado mais sobre esta outra variável...” Ou “Se nós tivéssemos medido a variável A
54 Pesquisa de Marketing

Tabela 3.1  Exemplo de tabela planejada para análise


Preferência por loja
Idade Loja 1 Loja 2 Loja 3
Menos de 25 anos
De 25 a 40 anos
Mais de 40 anos
Total

com uma escala mais precisa...” Preferencialmente, o pesquisador deverá perceber esses detalhes
durante a etapa de planejamento. Projetar as tabelas para futura análise facilitará o planejamento
e a execução. Nenhum problema deve ser considerado convenientemente formulado, antes que
o pesquisador possa especificar como serão efetuadas as análises e como os possíveis resultados
contribuirão para sua solução.

Levantamentos e estudos de campo


Há dois tipos básicos de pesquisas descritivas: levantamentos de campo e estudos de campo
(Figura 3.3), embora a distinção entre um e outro não seja precisa. A diferença básica está na
grande amplitude e na pouca profundidade dos levantamentos de campo e na média profundidade
e na média amplitude dos estudos de campo. Dependendo dos objetivos do estudo, tanto uma
abordagem quanto outra são perfeitamente justificáveis e plenamente corretas. Note que, quando
a profundidade for grande e a amplitude, pequena, o projeto de pesquisa resultante é o estudo
de caso já apresentado na pesquisa exploratória. Na Figura 3.4, mostra-se a diferença entre os
projetos: estudos de casos, estudos de campo e levantamentos de campo segundo a profundidade
e a amplitude consideradas.
Com o levantamento de campo, procura-se dispor de dados representativos da população de
interesse, tanto em relação ao número de casos incluídos na amostra quanto em relação à forma de

Figura 3.3  Classificação de pesquisas descritivas.


Tipos de Pesquisa 55

Figura 3.4  Diferenciação entre estudos de casos, estudos de campo e levantamentos de campo, segundo a
profundidade e a amplitude da pesquisa.

sua inclusão; já o estudo de campo está menos preocupado com a geração de grandes amostras re-
presentativas de uma dada população, pois se ocupa do estudo medianamente profundo de algumas
situações típicas.A ênfase do levantamento de campo está na geração de sumários estatísticos, como
médias, modas, variâncias, decis, centis, percentis, percentagens e a relação desses sumários estatís-
ticos. Os estudos de campo devem ser utilizados quando se estiver mais interessado em conhecer
o inter-relacionamento entre as diversas variáveis que ocasionam um fenômeno e, principalmente,
quando for difícil entender esse fenômeno sem compreender esse inter-relacionamento.
Grande parte das preocupações nos levantamentos de campo é canalizada para a seleção dos
componentes da amostra. Usualmente, essa seleção é feita por meio de um plano de amostragem
probabilística, cujo objetivo é minimizar o erro associado às estatísticas obtidas a partir da
amostra selecionada (cham­ado erro amostral) e usadas para descrever a população em estudo.
Vantagens dos levantamentos de campo:
• Representatividade da população em estudo – À medida que a amostra é gerada a partir
de métodos probabilísticos, tem-se total controle sobre o erro amostral dos dados obtidos
em relação à população geradora da amostra.
• Geração de tabelas com os dados coletados – Como o número de elementos da amostra
geralmente é grande, o levantamento de campo permite a geração de tabelas, sumarizadas
por categorias, com os dados coletados, e a generalização desses sumários para toda a
população em estudo.
• Geração de tabelas com o cruzamento de dados – Também graças ao grande número de
elementos pesquisados, o levantamento de campo permite a geração de tabelas a partir da
tabulação cruzada. Essas tabelas consistem na apresentação simultânea da classificação dos
elementos da amostra em diversas categorias.
• Despertar, junto ao público em geral, maior confiança nos resultados da pesquisa quando
comparados a outros métodos.
Por outro lado, os levantamentos de campo apresentam diversas desvantagens:
• Não permitem aprofundar os tópicos da pesquisa. A extensão da informação procurada é
usualmente enfatizada em detrimento da profundidade. Além disso, sua característica de
gerar sumários estatísticos para descrever os fenômenos pode não ajudar em nada a com-
preensão da população estudada, dependendo do nível de agregação/desagregação com que
os dados foram coletados. Por isso, o levantamento de campo é mais adequado a pesquisas
extensivas; outros tipos de pesquisa são mais adequados à realização de pesquisas profundas.
• São mais dispendiosos, tanto em termos de custo quanto de tempo. Devido às preliminares
necessárias, vitais nesse método, exigem grande tem­po de preparação antes que qualquer
56 Pesquisa de Marketing

dado possa ser coletado. O processo total de pesquisa, desde a definição do problema até
a tabulação dos dados coletados, já deve estar realizado antes que uma simples hipótese
possa ser testada. Cada uma dessas etapas requer grande investimento de tempo e dinheiro.
• A realização de levantamentos de campo exige grandes conhecimentos técnicos. O pes-
quisador e sua equipe precisam possuir os conhecimentos exigidos a cada estágio do
processo ou ter acesso a quem os possua, na forma de consultoria técnica. É raro que
um mesmo indivíduo possua amplos e profundos conhecimentos técnicos em áreas tão
diferentes e sofisticadas quanto aquelas necessárias às pesquisas de marketing, a ponto de
saber desenvolver uma escala de atitudes e ainda projetar um complexo plano de amos-
tragem ou um sofisticado plano de análises para o processamento eletrônico dos dados.
Vantagens dos estudos de campo:
• Os fenômenos são investigados durante a sua ocorrência natural. Ao contrário dos estudos
em laboratório, não há manipulação das variáveis controláveis. Não há, portanto, ocorrência
de vieses advindos dessas causas.
• Constitui-se em grande fonte geradora de hipóteses. Os estudos de campo servem,
principalmente, aos propósitos da pesquisa exploratória, em que a ênfase está na geração
e não no teste de hipóteses.
• Quando a percepção do pesquisador é de que há grande homogeneidade nos elementos
da população, o estudo de campo será recomendado, pois se caracteriza como uma forma
mais rápida e econômica de se obterem os dados, sem perda da representatividade.
• Adquire-se profundo conhecimento das relações entre as variáveis de pesquisa nos casos
estudados.
Desvantagens dos estudos de campo:
• Os estudos de campo têm a característica de investigar o fato somente após sua ocorrência
(ex-post facto) e, por isso, não permitem controle sobre as variáveis em estudo (diferente-
mente das pesquisas em laboratório, em que o controle é total, e dos levantamentos, em que
o controle é parcial). Portanto, sempre há um grande número de variáveis que interferem
nos resultados e cujos efeitos são difíceis ou impossíveis de serem isolados.
• Não podem ser generalizados, a não ser quando já se tem conhecimento anterior sobre a
homogeneidade da população pesquisada. Embora esse método seja muito utilizado em
pesquisas de marketing, respondendo a questões específicas sobre o que, como, onde, quem
etc., o pesquisador precisa ser absolutamente honesto na apresentação dos resultados em
relação a essa desvantagem dos estudos de campo.
Por outro lado, tanto os levantamentos de campo quanto os estudos de campo podem ser
classificados em ocasionais ou evolutivos.

Pesquisa ocasional e pesquisa evolutiva


O projeto de pesquisa ocasional é o mais conhecido e o mais usado dos projetos de pesquisa
descritiva. Caracteriza-se pelo uso de uma amostra de elementos da população de interesse, em
que os elementos são medidos uma única vez no tempo, e visa atender a um objetivo específico.
O projeto ocasional proporciona uma visão das variáveis em estudo em determinado momento.
O projeto de pesquisa evolutiva baseia-se na coleta e análise periódica das mesmas variáveis, de
forma a permitir seu acompanhamento evolutivo no tempo. A população pesquisada deverá ser
sempre a mesma, mas a amostra pesquisada a cada medição poderá ou não ser idêntica. Se a amostra
pesquisada for sempre a mesma, a pesquisa evolutiva é chamada de pesquisa painel. O pesquisador
Tipos de Pesquisa 57

deve sempre preferir, quando possível, a pesquisa evolutiva painel, pois, ao pesquisar sempre os
mesmos elementos, elimina uma das possíveis fontes de viés. No entanto, mesmo não havendo
essa possibilidade, a pesquisa deverá ser realizada utilizando-se amostras diferentes a cada medição.
Pesquisa painel – As pesquisas evolutivas por painéis são muito utilizadas em marketing.
Muitas das informações necessárias para marketing precisam ser obtidas de forma periódica, a
fim de permitir uma avaliação contínua de sua evolução no tempo. Existem empresas de pes-
quisas especializadas em fornecer informações de marketing a partir de pesquisas por painéis.
O painel é chamado fixo quando os entrevistados são sempre os mesmos a cada rodada; é
chamado móvel quando, a cada rodada, são sorteados novos entrevistados.
O IBOPE tem um exemplo de painel fixo para a pesquisa contínua de audiência de TV.
No Capítulo 5, há uma descrição detalhada do sistema do IBOPE.
Painel omnibus – Uma variação da pesquisa painel tem sido utilizada por empresas/institutos
de pesquisa, principalmente para baratear o processo de coleta dos dados; é o chamado painel
omnibus, que consiste na amostra permanente de uma população que é frequentemente pesquisada.
As informações coletadas podem variar conforme as necessidades dos clientes contratantes da
empresa/instituto.Algumas vezes, é possível medir atitudes em relação a um novo produto; outras
vezes, os membros do painel podem ser solicitados a avaliar alternativas de propaganda. Inclusive,
numa mesma coleta, dados de diferentes produtos para diferentes clientes podem ser levantados.
Dependendo do grau de especificidade da pesquisa, às vezes faz-se necessário selecionar, do total da
amostra, uma subamostra que reúna os elementos com as características desejadas. Como os custos
de montagem de um painel e de coleta dos dados são elevados, à medida que um painel pode ser
utilizado para atender às necessidades de pesquisas de vários clientes, haverá diluição dos custos.
Vantagens da pesquisa painel:
• Análises longitudinais por longos períodos de tempo, permitindo a verificação de tendências.
• Redução do custo de construções contínuas de amostras; se for painel omnibus, o custo
será diluído mais ainda.
• Ao repetirem sempre as mesmas tarefas, os entrevistadores ficam habilmente treinados na
coleta de dados. Ganham-se rapidez e precisão.
• Há bastante interação entre entrevistado e entrevistador, o que cria um ambiente propício
à colaboração.
A vantagem mais importante da pesquisa painel é a analítica. Para verificar essa vantagem,
veja o exemplo a seguir.
As marcas consumidas de certa categoria de produto foram medidas junto a um painel de 1.000
famílias, em dois períodos consecutivos, e os resultados estão na Tabela 3.2.

Tabela 3.2  Marcas consumidas por bimestre


Bimestre
Marca consumida t1 % t2 %
A 200 20 250 25
B 300 30 270 27
C 350 35 330 33
D 150 15 150 15
Total 1.000 100 1.000 100
58 Pesquisa de Marketing

Se essas medidas tivessem sido efetuadas em amostras diferentes, todas as interpretações


e conclusões só poderiam derivar da tabela apresentada. Na Tabela 3.2, observa-se que o
consumo de A subiu de 200 para 250, e sua participação, de 20% para 25%. No entanto, não
é possível saber quantos consumidores de cada uma das outras marcas passaram a consumir A,
nem quanto A perdeu para outras marcas. No entanto, como se trata de uma pesquisa painel,
pois a amostra é a mesma, na Tabela 3.3 é possível ver a riqueza de informações que pode ser
obtida por meio de uma simples retabulação dos dados.
Tabela 3.3  Retabulação dos dados da Tabela 3.2
t2
t1 A B C D Total
A 175 25 0 0 200
B 0 225 50 25 300
C 0 0 280 70 150
D 75 20 0 55
Total 250 270 330 150 1000

A partir da Tabela 3.3, é possível analisar o que ocorreu com cada marca:


• O consumo de A de t1 a t2 passou de 200 para 250 famílias, sendo que, dessas, 175 já eram
consumidores de A, 75 trocaram o consumo de D por A, e 25 famílias que consumiam A
passaram a consumir B.
• O crescimento de participação de mercado da marca A ocorreu em detrimento da marca
D. No entanto, enquanto a marca A ganha consumidores da marca D, perde consumidores
para a marca B. Análises semelhantes poderão ser feitas para as demais marcas.
• Também é possível calcular os índices de fidelidade de cada marca. Basta dividir o número
de famílias que consumiam o produto de determinada marca em t1 pelo de t2 e multiplicar
por 100. Assim, o índice de fidelidade à marca A é: 175/200 × 100 = 87,5%. Analogamente,
os índices das outras marcas também podem ser calculados.
Por outro lado, a pesquisa painel apresenta uma única e grande desvantagem: a dificuldade de
manter o painel representativo da população. Há necessidade de um grande esforço do pesquisador
para compensar as perdas resultantes de recusas, mudanças, desistências, ausências temporárias
etc. Em alguns casos, esse conjunto de fatores pode representar até 50% de quebra da amostra
inicialmente delineada para o painel. Quando for possível prever essas ocorrências, o pesquisador
poderá planejar substituições e minimizar as implicações sobre os resultados. Note, no entanto,
que esse procedimento altera o caráter da pesquisa, que deixa de ser um painel verdadeiro.
A pesquisa conclusiva explicativa, devido à sua especificidade, será apresentada e discutida
no Capítulo 4.

RESUMO
Existem vários tipos de classificação de pesquisas que resultam da utilização de diferentes variáveis
de classificação. Este livro adota a classificação que leva em consideração o objetivo e o grau em
que o problema de pesquisa está cristalizado e a natureza do relacionamento entre as variáveis es-
tudadas.A classificação adotada é: pesquisas exploratórias, pesquisas conclusivas descritivas e pesquisas
conclusivas explicativas.
Tipos de Pesquisa 59

A pesquisa exploratória é utilizada para elevar o conhecimento do pesquisador sobre um tema


que ainda lhe é totalmente desconhecido. É muito útil para gerar questões e (ou) hipóteses de
pesquisa, e não deve ser utilizada para a tomada de decisões.
Os meios para a obtenção de dados utilizados pela pesquisa exploratória compreendem:
levantamentos em fontes secundárias (levantamentos: bibliográficos, documentais, de estatís-
ticas e de pesquisas realizadas), levantamentos de experiências, estudos de casos e observação
informal.
A pesquisa conclusiva descritiva visa prover o pesquisador de dados sobre as caracterís-
ticas de grupos, estimar proporções de determinadas características e verificar a existência de
relações entre variáveis.
As pesquisas conclusivas descritivas compreendem: os levantamentos de campo e os estudos
de campo; e cada um deles pode ser classificado em pesquisa ocasional (ou ad hoc) ou pesquisa
evolutiva. A pesquisa painel é um tipo de pesquisa evolutiva em que a amostra é permanente.
A pesquisa conclusiva explicativa objetiva a verificação das hipóteses de pesquisa e poderá
constatar quais podem ser aceitas como explicativas dos fatos observados e quais devem ser
rejeitadas.

QUESTÕES DE REVISÃO
1. Qual a diferença entre pesquisa exploratória e pesquisa descritiva?
2. Qual a diferença entre estudos de caso, estudos de campo e levantamentos de campo?
3. Quais os cuidados a serem tomados para a realização de um levantamento de campo?
4. Informações obtidas num estudo de caso podem ser utilizadas para a tomada de decisões
em marketing?
5. Por que é importante, antes de começar a coleta de dados numa pesquisa descritiva por
levantamento de campo, prever como eles serão analisados?
6. Faça um quadro mostrando as vantagens e as desvantagens dos estudos de campo. Dê dois
exemplos de pesquisas em que o estudo de campo é mais recomendável.
7. Qual a vantagem mais importante que a pesquisa painel oferece? E a desvantagem mais
importante?

Trabalho – Parte 2
Tendo em vista o problema de pesquisa e o objetivo da pesquisa definidos no Capítulo 2,
compare as vantagens e as desvantagens das possíveis utilizações no seu projeto de cada
tipo de pesquisa apresentado neste capítulo. Procure concluir o trabalho definindo
qual tipo você escolheria como o mais adequado para resolver o problema de pesquisa
apresentado.

REFERÊNCIAS
BARDIN, L. Análise de conteúdo. Lisboa: Edições70, 1977.
BONOMA, Thomas V. Case research in marketing: opportunities, problems, and process. Journal of
Marketing Research, v.22, pp. 199-208, 1985.
BOYD. JR, Harper W.; WESTFALL, Ralph. Pesquisa mercadológica. Rio de Janeiro: Fundação Getulio
Vargas, 1973.
60 Pesquisa de Marketing

CHURCHILL. JR., Gilbert A. Marketing research: methodological foundations. Insdale, Illinois: Driden
Press, 1979.
COX, Donald F.; GOOD, Robert E. How to build a marketing information system. Harvard Business
Review, ano 3, n. 45, May/June 1967.
DRAKE, Jerry E.; MILLER, Frank J. Marketing research: intelligence and management. Stranton Pa:
International Texbook, 1969.
EVRARD, Yves; PRAS, Bernard; ROUX, Elyette (em colaboração com: CHOFFRAY, Jean-Marie;
DUSSAIX, Anne-Marie). Market – études et recherche em marketing: foundements. Éditions Nathan,
1993.
FESTINGER, Leon; KATZ, Daniel. Research methods in the behavioral sciences. New York: Holt, Rinehart,
1959.
GREEN, Paul E.;TULL, Donald S. Research for marketing decision. Englewood Cliffs: Prentice Hall, 1966.
KERLINGER, Fred N. Foundations of behavioral research. 2. ed. New York: Holt, Rinehart, 1973.
KINNEAR,Thomas C.;TAYLOR, James R. Marketing research: an applied approach.Tóquio: McGraw-Hill
Kogakusha, 1979.
KIRK, J.; MILLER, M. Reliability and validity in qualitative research. Beverly Hills: Sage Publications, 1986.
LUCK, David J.; WALES, Hugh G.; TAYLOR, Donald A. Marketing research. 4. ed. Englewood Cliffs:
Prentice Hall, 1974.
MALHOTRA, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Booka-man,
2001.
SELLTIZ, Claire; JAHODA, Marie; DEUTSCH, Morton, COOK, Stuart W. Métodos de pesquisas nas
relações sociais. São Paulo: Editora Pedagógica e Universitária - EPU. Editora da Universidade de
São Paulo, 1974.
YIN, R. K. Case study: design and methods. 2. ed. Sage University Paper Series on Applied Social Research
Methods, CA. 5. Newbury Park: Sage Publications, 1989.
CAPÍTULO 4
Projeto de Pesquisa Explicativa
O espírito científico, fortemente armado com seu método,
não existe sem a religiosidade cósmica.
Albert Einstein

Objetivos
• Apresentar e detalhar o projeto de pesquisa explicativa.

Sumário
CONCEITO DE CAUSALIDADE
Critérios para inferir relações de causalidade
EXPERIMENTAÇÃO
Uso de projetos de pesquisas experimentais em marketing
Definições e conceitos
Validade interna e externa de experimentos
Experimentos de laboratório e de campo
Tipos de variáveis estranhas
Notação utilizada em experimentos
Projetos experimentais
Projetos quase experimentais
TESTE DE MARKETING
Usos do teste de marketing
Custos do teste de marketing
Critérios para selecionar locais para o teste de marketing
Duração do teste de marketing

No Capítulo 3, foram tratados os diversos tipos de projetos de pesquisas, excetuan-


do-se o projeto explicativo, que foi apenas mencionado e que será apresentado neste
capítulo em função de sua especificidade, complexidade e importância para a pesquisa
de marketing.
Foi visto que, com a pesquisa exploratória, procura-se ganhar conhecimento sobre
um tema de pesquisa totalmente desconhecido. Foi visto também que, com a pesquisa
descritiva, é possível obter mensurações e descrições do fato ou do problema de marketing
em estudo. No entanto, frequentemente os gerentes de marketing têm necessidade de,
não só tomar conhecimento do que e da intensidade do que está ocorrendo, mas também
das causas dessas ocorrências, pois só conhecendo, efetivamente, essas causas, será pos-
sível interagir no processo e tomar decisões corretas e melhores. É o projeto de pesquisa
explicativa que pode atender a essa necessidade de marketing.
61
62 Pesquisa de Marketing

CONCEITO DE CAUSALIDADE
Em diversas situações da prática de marketing, tais como: alterações no preço de um produto,
escolher o nome para um novo produto, escolher uma nova embalagem para um produto
existente, definir o melhor perfil para a equipe de vendas, prever os resultados de uma nova
campanha de propaganda ou de promoção de vendas, apontar as razões de um insucesso
de vendas etc., há necessidade de os gerentes de marketing descobrirem relações de causa e
efeito entre as variáveis de decisão de marketing (sobre as quais têm controle) e as variáveis de
resultado (sobre as quais não têm controle). No entanto, na prática, não é simples estabelecer
a atribuição da “causalidade”, ou seja, ter certeza de que “o responsável por isto foi aquilo”.
Essa dificuldade será ilustrada por meio de um exemplo. Uma empresa manteve estáveis,
durante muitos anos, as vendas e a participação de mercado de um de seus modelos de fogão,
responsável por 35% de suas vendas. Nos últimos três meses, as vendas subiram cerca de 10%
ao mês, sem que se soubessem as razões desse crescimento.
Para tentar descobrir as “causas” desse incremento nas vendas, o diretor presidente manteve
uma conversa com o diretor de vendas, que foi categórico ao declarar que “as vendas cresceram
como resultado do vigoroso programa de treinamento no produto que conduzimos, junto ao
nosso corpo de vendas e junto aos vendedores de nossos lojistas distribuidores”. Em seguida, o
diretor presidente manteve uma conversa com o diretor de marketing que, também categórico,
afirmou para ele que “as vendas cresceram por duas razões: a nova campanha de propaganda
que entrou no ar e a vigorosa campanha promocional que conduzimos, junto aos vendedores de
nossos distribuidores, pagando a eles um prêmio por unidade vendida no varejo”. Finalmente,
o diretor presidente conversou com o diretor financeiro, que lhe disse que “as vendas subiram,
única e exclusivamente, porque ele havia estabelecido um novo critério de rateio dos custos
fixos, de forma que uma carga menor foi atribuída a esse produto e, por isso, seu preço está, nos
últimos três meses, 2,5% abaixo do que normalmente foi”. Afinal de contas, com quem estaria
a razão? Será que somente um desses fatores foi responsável pelo incremento das vendas? Ou
será que todos foram igualmente responsáveis? Ou será que todos foram responsáveis, mas com
diferentes parcelas de responsabilidades? E se, na mesma ocasião, o diretor presidente dessa em-
presa descobrisse que seu maior concorrente desse produto elevara o preço em 10%, ou deixara
de fazer propaganda, também não seriam explicações possíveis para a elevação das vendas?
Selltiz et al. (1974) apresentam interessante discussão sobre a problemática do estabeleci-
mento de relações de causa e efeito. O senso comum que se faz de causalidade é de que um
único acontecimento, a “causa”, sempre provoca outro acontecimento, o “efeito”. É a chamada
causação determinística. De forma esquemática, a causalidade, segundo o senso comum, pode
ser assim representada:

Sendo: x, z, t, v e s = variáveis independentes e y = variável dependente.


Ao contrário, o pesquisador científico tende a acentuar que uma série de condições deter-
minantes reunidas torna provável a ocorrência de determinado fato. Enquanto o senso comum
Projeto de Pesquisa Explicativa 63

faz pensar que um único fato (causa) pode dar uma explicação completa para outro fato (efeito),
o cientista raramente espera encontrar um único fato responsável pela ocorrência de outro; in-
clusive, jamais chega a afirmar categoricamente a relação de causalidade. Ele conclui em termos
de probabilidade, com afirmações do tipo:“Se ocorrer isto, provavelmente deverá ocorrer aquilo.”
É a chamada causação probabilística. O cientista assim procede porque tem consciência da impos-
sibilidade de provar. Ele pode apenas inferir a existência de causalidade. Essa inferência será baseada
na observação do comportamento dessas variáveis, diante de condições contribuintes, contingentes
e alternativas. De forma esquemática, a causalidade, segundo a ciência, pode ser assim representada:
• Condição contribuinte – É aquela que aumenta a probabilidade de ocorrência de deter-
minado fenômeno, mas não a torna certa; isso ocorre porque é apenas um dentre vários
outros fatores que, em conjunto, determinam a ocorrência do fenômeno. No exemplo,
todas as razões alegadas pelos diretores são condições contribuintes.
• Condição contingente – Diz respeito à condição em que determinada variável é uma
causa contribuinte para a ocorrência de determinado fenômeno. No exemplo, as condições
contingentes para a ocorrência do incremento das vendas poderiam ser: disponibilidade de
capacidade ociosa de produção e de mão de obra, a não ocorrência de greves dos operários
no período, não ter faltado matéria-prima para a produção, não ter faltado capital de giro
para financiar as vendas etc.
• Condição alternativa – Diz respeito a outras possíveis condições favoráveis à ocorrência do
fenômeno observado e que não foram consideradas. No exemplo, poderiam ser: ocorrência
de greve no principal concorrente, redução nos impostos diretos cobrados pelo governo
(IPI e ICMS), redução nos juros ou elevação dos prazos de financiamento ao consumidor
final, aceleração da inflação, fazendo o consumidor antecipar suas compras etc. Uma
condição alternativa no exemplo seria a elevação dos preços do principal concorrente.
Note que todas as hipóteses em pesquisas de marketing se referem as condições con-
tribuintes ou alternativas.

Critérios para inferir relações de causalidade


Apesar de ser praticamente impossível o estabelecimento de relações de causalidade entre
variáveis de marketing, existem alguns critérios que, se devidamente aplicados, levam os pes-
quisadores de marketing a eliminar aquelas que não possuem inter-relacionamento, e a inferir
pela existência de inter-relacionamento entre outras. Esses critérios são: variação concomitante,
ordem de ocorrência das variáveis no tempo e na eliminação de outros fatores.
Variação concomitante – Diz respeito à ocorrência de variação conjunta entre uma
possível causa (x) e um efeito (y), segundo o estabelecido por uma hipótese considerada.
Considere-se o seguinte exemplo: uma empresa fabricante de motocicletas estabeleceu a
seguinte hipótese, entre outras, para sua baixa participação de mercado: “Nossa participação
de mercado (y) depende da qualidade de nossas concessionárias (x). Onde temos boas conces-
sionárias, nossa participação é boa; onde temos concessionárias fracas, nossa participação é
baixa.” Para verificar a veracidade dessa hipótese, foram levantados dados sobre a qualidade de
cada uma das 200 concessionárias selecionadas aleatoriamente, bem como sobre sua intensidade
de participação no mercado. O resultado está apresentado na Tabela 4.1.
As informações constantes da Tabela 4.1 evidenciam que há variação concomitante entre
as duas variáveis relacionadas, ou seja, à medida que piora a qualidade da concessionária,
também piora a participação de mercado da empresa, e vice-versa. Mas cuidado: é possível
64 Pesquisa de Marketing

Tabela 4.1  Exemplo de evidência de variação concomitante


Qualidade da Participação no mercado (y)
concessionária (x) Baixa Média Alta
Baixa 4 (2%) 12 (6%) 24 (12%)
Média 6 (3%) 18 (9%) 36 (18%)
Alta 10 (5%) 30 (15%) 60 (30%)

concluir apenas que há variação concomitante. Não é possível concluir que esse fato seja a
razão para a baixa participação de mercado da empresa, sem que se realizem estudos muito
mais profundos.Veja que a seguinte condição alternativa poderia estar relacionada com o fato
observado: “A qualidade das concessionárias que a empresa consegue atrair para sua rede de
distribuição é baixa porque seus produtos não exercem atratividade no mercado e, por isso,
não despertam o interesse das boas concessionárias.”
Analogamente, podem-se construir tabelas parecidas relacionando incremento dos gastos de
propaganda (x) com o crescimento nas vendas (y), número de horas de treinamento da equipe
de vendas (x) com o crescimento na participação de mercado (y) etc. Em nenhum desses casos
será possível concluir que, havendo variação concomitante, existirá relação de causa e efeito,
mas que, não havendo variação concomitante, dificilmente existirá essa relação. Portanto, esse
critério serve para indicar quais variáveis não têm relação de causa e efeito.
Ordem de ocorrência das variáveis no tempo – Diz-se que um evento só poderá
ser causador de outro se ocorrer antes ou simultaneamente ao efeito causado. Ou seja, no
exemplo deste capítulo, o diretor de vendas jamais poderia alegar que a razão do incremento
nas vendas teria sido o treinamento realizado, se este só tivesse ocorrido um mês após o início
do crescimento nas vendas.
Apesar de esse critério ser muito simples e óbvio, na prática, em algumas situações,
ocorrem dificuldades na identificação de qual variável antecedeu qual no tempo. Vejam-se
os seguintes exemplos: existem certos produtos, principalmente de moda, cujo aumento
nas vendas provoca mudança na atitude dos consumidores, e essa mudança de atitude causa
elevação das vendas. Nas empresas em que o orçamento de propaganda é fixado segundo
um percentual fixo sobre as vendas, considerando a análise da relação propaganda e vendas,
qual variável antecedeu qual no tempo? A intensidade da propaganda cresce porque as
vendas crescem, ou as vendas crescem porque há maior intensidade na propaganda? Nos
dois exemplos, há necessidade de um entendimento prévio do que aqui foi exposto, sem o
qual o pesquisador talvez não consiga estabelecer a relação correta da ordem de ocorrência
das variáveis no tempo.
Mesmo já tendo estabelecido que dois eventos variam concomitantemente no tempo, e
também verificado que o evento causador antecede a ocorrência do efeito, o pesquisador não
pode inferir que há relação de causa e efeito, pois ainda permanecerá a seguinte dúvida: “Será
que existem outros possíveis eventos que estejam causando o efeito observado?”
Eliminação de outros fatores – O terceiro critério a ser atendido para que se possa
induzir uma relação de causa e efeito é a busca e a eliminação de outros possíveis fatores causa-
dores do efeito estudado. O problema é que aqui, diferentemente dos dois casos anteriores, não
existe regra para aplicação desse critério. O pesquisador precisa usar de toda sua experiência
e sensibilidade para encontrar e tentar eliminar os outros possíveis fatores. Segundo Churchill
(1979), a eliminação de outros possíveis fatores é muito parecida com a abordagem usada por
Projeto de Pesquisa Explicativa 65

Sherlock Holmes para desvendar os crimes misteriosos, ou seja, se você conseguir eliminar
todas as possíveis causas menos uma, esta deverá ser inferida como a causadora do efeito. Na
prática de pesquisa de marketing, esse critério será aplicado mediante a medição de outras
possíveis variáveis, ou via controle das outras causas por meio do projeto do experimento,
como será visto adiante neste capítulo. Para exemplificar, será utilizado novamente o exemplo
inicial do capítulo. O diretor presidente poderia investigar gradativamente as afirmações co-
lhidas junto a cada diretor e verificar quais não se sustentavam à medida que as informações
colhidas o demonstrassem, como, por exemplo, a pesquisa a posteriori da campanha de propa-
ganda realizada mostrou que seu resultado foi um completo fracasso, e assim, sucessivamente,
iria eliminando diversas possíveis causas. Aquelas cuja eliminação não fosse possível e que
atendessem, simultaneamente, também aos outros dois critérios anteriores seriam inferidas
como as possíveis causadoras do inesperado sucesso nas vendas.
A postura correta em relação a esses três tipos de critérios para detectar a evidência de
causalidade é que eles proporcionam uma base razoável para que se acredite que uma variável
x é, ou não, causadora de y. Jamais se terá certeza se os resultados serão verdadeiros, mesmo
quando todo o relacionamento tiver sido conclusivamente demonstrado. Ganha-se maior
confiabilidade nos resultados, à medida que repetidas experimentações com as mesmas variáveis
independentes e dependentes indiquem sempre as mesmas conclusões.

EXPERIMENTAÇÃO
Uma das formas mais utilizadas em marketing para identificar relações de causa e efeito entre
variáveis é a experimentação. Um experimento consiste na manipulação controlada pelo
pesquisador de uma ou mais variáveis independentes e a medição dos efeitos causados na(s)
variável(eis) dependente(s). Um experimento é capaz de proporcionar maiores e convincentes
evidências de relações causais do que projetos exploratórios ou descritivos, pois, nesses projetos,
não é possível haver manipulação ou controle de variáveis independentes e dependentes. Um
experimento tem grande capacidade de proporcionar evidências de causalidade devido ao con-
trole que o pesquisador tem sobre as variáveis em estudo, bem como sobre os demais fatores. A
experimentação é a forma de pesquisa, por excelência, das ciências exatas (física, química, biologia
etc.) e nelas teve origem. Nos últimos 30 anos, suas práticas foram gradativamente assimiladas
pelas ciências sociais. Enquanto nas ciências exatas o controle exercido pelo pesquisador sobre
todos os aspectos do experimento é total, o mesmo não pode ser dito quanto a sua aplicação
nas ciências sociais.

Uso de projetos de pesquisas experimentais em marketing


A literatura de marketing e de pesquisa de marketing não indica que tenha havido grande
utilização de projetos experimentais em marketing, excetuando-se os testes de mercado.
Somente em testes de marketing, segundo Weingarten, citado por Churchill (1979), foram
gastos, nos Estados Unidos, mais de US$ 1 bilhão. Ou a literatura não está retratando a prática
de marketing e de pesquisas de marketing nas empresas (o que parece mais provável), ou
as empresas ainda não despertaram para o grande potencial dos projetos de pesquisas ex-
perimentais em marketing. O Quadro 4.1 apresenta uma listagem das inúmeras utilizações
possíveis de projetos experimentais em marketing, além dos testes de marketing (apresentados
ao final deste capítulo).
66 Pesquisa de Marketing

Quadro 4.1  Exemplos das possibilidades de utilização de projetos experimentais em marketing


• Qual o melhor canal para distribuir nosso produto?
• Qual a relação entre o espaço ocupado na prateleira dos supermercados e a participação no
mercado de nosso produto?
• O tipo de vizinhança do nosso produto na prateleira do supermercado tem implicação em
suas vendas?
• Qual o relacionamento entre a altura em que nosso produto é colocado na prateleira do
supermercado e suas vendas?
• Qual é o efeito sobre as vendas de uma pretendida redução no preço de um produto?
• O lançamento de um novo item em nossa linha de produtos ganhará vendas de um produto
concorrente ou de outro produto nosso (canibalismo)?
• Qual deverá ser o efeito de uma nova campanha de propaganda ou de promoção de vendas,
em nível nacional?
• Qual deverá ser o efeito de um novo plano de incentivo à equipe de vendas?
• Qual a relação entre o nível de estocagem de nosso produto nos lares e o volume
de consumo?
• Qual dentre n (n não maior que 5) opções de propaganda/promoções de vendas/novas
embalagens/novas marcas/novos sabores/novos aromas/novas cores/novos rótulos/novo
design etc. sensibiliza mais o consumidor e deve ser adotada?

Em todos os exemplos do Quadro 4.1, a empresa evitaria correr riscos desnecessários


realizando experimentos para verificar os resultados prováveis antes de tomar a decisão final.
Esses são apenas alguns exemplos, e essa lista poderia ser estendida indefinidamente.
Segundo Cox e Enis (1969):
A utilidade dos projetos experimentais de marketing abrange todas as áreas funcionais de decisão de promoção,
distribuição, preço e produto. Sempre que o gerente de marketing estiver interessado em medir os efeitos de cursos
de ação alternativos, a experimentação pode ser uma forma prática de reduzir o risco envolvido na escolha dessas
alternativas.

Esses mesmos autores (Cox e Enis, 1969) acreditam que esses projetos tendem a ser bas-
tante utilizados em pesquisas de marketing pelas seguintes razões:
• A experimentação funciona. Expressivos resultados de marketing são produzidos por seus
procedimentos.
• Os custos das inferências causais erradas de marketing estão crescendo.
• Os níveis educacionais (do pessoal de marketing e de pesquisa de marketing) estão cres-
cendo com um incremento associado no entendimento desses procedimentos.
• As capacidades dos procedimentos de análise por computadores têm eliminado o tédio
das análises manuais.

Definições e conceitos
Para facilitar o entendimento dos projetos experimentais que serão expostos a seguir, é
importante que alguns conceitos e definições básicos sejam apresentados.
Experimento – Segundo Kerlinger (1973), “um experimento é um tipo de pesquisa
científica na qual o pesquisador manipula e controla uma ou mais variáveis independentes e
observa a variação na variável ou nas variáveis dependentes concomitantemente à manipulação
das variáveis independentes”.
Projeto de Pesquisa Explicativa 67

Variáveis independentes (ou tratamentos) – São as variáveis manipuladas e con-


troladas, cujos efeitos sobre as variáveis dependentes se desejam medir. Exemplos de variáveis
independentes em marketing: preço, gastos em propaganda, tipos de promoção, meios de dis-
tribuição, componentes do produto (design, marca, sabor, cor, embalagem etc.).
Variáveis dependentes – São as variáveis cujos efeitos, provocados pelas variáveis
independentes, interessam ao pesquisador medir. Exemplos de variáveis dependentes em
marketing: vendas, participação no mercado, experimentação, atitudes, imagem, elevação do
nível de estocagem do produto nos lares etc.
Variáveis estranhas – São todas as outras variáveis, que não as variáveis independentes
consideradas, que possam afetar os resultados da variável dependente. Assim, seria uma
variável estranha a promoção de vendas que fosse realizada simultaneamente a um estudo
que procurasse verificar o resultado sobre as vendas de uma pretendida redução no preço
de um produto. Os efeitos dessa promoção de vendas iriam “mascarar” os resultados ex-
clusivos da redução de preços pretendida.
O pesquisador tem três possíveis formas de lidar com variáveis estranhas para isolar, con-
trolar ou eliminar seus efeitos sobre a variável dependente. A primeira consiste em controlar
fisicamente a variável. No exemplo citado, o experimento deveria ser conduzido em unidades
de supermercado em que não houvesse, simultaneamente, atividades de promoção de vendas;
ou deveria ser solicitado à área de promoção de vendas que reservasse algumas unidades de
supermercado sem promoção de vendas para que o experimento fosse realizado. A segunda
maneira é, se o controle físico não for possível, fazer com que o experimento seja conduzido
em unidades, com as variáveis estranhas, probabilisticamente selecionadas. No exemplo, o pes-
quisador deveria compor seu experimento com unidades randomicamente selecionadas e, em
todas, a variável estranha deveria estar presente. É evidente que essa alternativa não resolve o
problema de se eliminar o efeito da variável estranha. O controle físico será sempre melhor,
mas observe que se está tratando de casos em que isso não é possível, e há muitas situações de
marketing em que essa impossibilidade ocorre. A terceira maneira, a mais adequada, é controlar
os efeitos das variáveis estranhas, por meio de experimentos especificamente projetados com esse
intento. Na sequência deste capítulo, será analisada essa terceira forma de lidar com essas variáveis.
Unidades de teste (ou unidades experimentais) – As unidades de teste são as
entidades nas quais os tratamentos são aplicados e os efeitos, medidos. Em marketing, é
possível utilizar como unidades de testes: indivíduos, famílias, empresas, lojas, regiões geo-
gráficas etc. Exemplos: indivíduos serão as unidades de teste quando expostos a determinada
propaganda e, em seguida, medem-se as mudanças em suas atitudes quanto ao produto em
tela; supermercados serão as unidades de teste quando se realiza uma atividade promocional
em suas dependências e mede-se o efeito sobre as vendas do produto em cada loja.
Grupo experimental – São as unidades de teste expostas ao tratamento experimental.
Grupo de controle – São as unidades de teste não expostas ao tratamento experimental
que servem para medir os efeitos das outras variáveis a que tanto o grupo experimental quanto
o de controle estão sujeitos.
Projeto experimental – Um projeto experimental envolve: (1) definição de uma
hipótese relacionando duas ou mais variáveis; (2) determinação da variável (ou variáveis)
independente (ou tratamento); (3) determinação da(s) unidade(s) de teste; (4) determinação
da variável (ou variáveis) dependente; e (5) determinação dos procedimentos para tratar as
variáveis estranhas.
68 Pesquisa de Marketing

Validade interna e externa de experimentos


O conceito de validade diz respeito ao grau em que as conclusões obtidas num experimento
específico podem ser aceitas como válidas, tanto para a unidade de teste quanto para a
população do local em que foram selecionadas. Há dois conceitos de validade relevantes em
experimentos: validade interna e validade externa.
Validade interna – Refere-se às condições mínimas que precisam estar presentes no
projeto para que qualquer inferência a respeito da relação causal entre duas ou mais variáveis
possa ser feita. Este conceito está relacionado a tudo o que foi visto até agora a respeito da ne-
cessidade de controle das variáveis estranhas e às condições em que o experimento é realizado.
Validade externa – Diz respeito à extensão em que é possível generalizar os resultados
obtidos para toda a população de onde as unidades de teste foram selecionadas.
Naturalmente, todo pesquisador gostaria que os dois tipos de validade fossem atendidos
pelo mesmo projeto experimental. No entanto, isso é praticamente impossível. Desejando
ter um projeto com grande validade interna, será possível optar por um experimento de
laboratório, onde haverá total controle sobre todas as variáveis. Sua validade externa, porém,
será muito baixa, pela situação irreal que caracteriza esse tipo de projeto. É possível, em con-
trapartida, optar pela realização de um experimento de campo, e o projeto terá grande validade
externa, pois será conduzido numa situação real, porém sua validade interna será baixa, em
razão da dificuldade de se controlarem as variáveis estranhas.

Experimentos de laboratório e de campo


Há dois tipos de experimentos em pesquisa de marketing: os experimentos de laboratório e
os experimentos de campo.
Experimentos de laboratório – São os que estão mais próximos do conceito de ex-
perimento em ciências exatas, em que o pesquisador tem total controle sobre as variáveis
intervenientes no fenômeno observado. Segundo Festinger and Katz (1950):
Um experimento de laboratório pode ser definido como aquele em que o pesquisador consegue criar uma situação
com as condições exatas que desejaria ter e na qual ele controla algumas e manipula outras variáveis. Além disso,
ele pode observar e medir os efeitos dessa manipulação das variáveis independentes sobre as variáveis dependentes,
numa situação em que os outros fatores relevantes são mantidos constantes.

Os experimentos de laboratório têm a vantagem de permitir ao pesquisador grande


controle sobre todas as variáveis intervenientes no processo e, como grande desvantagem, o
fato de constituírem uma situação fictícia, em que as unidades de teste podem, justamente
por causa disso, ter uma reação totalmente atípica à de uma reação natural. Ao reunir pessoas
num estúdio para avaliar suas reações a uma nova campanha de propaganda, exatamente por
saberem que estão sendo observadas, por não estarem em seus respectivos lares, por estarem
em presença de estranhos etc., poderão ter uma reação totalmente diversa daquela que teriam
numa situação natural e induzir o pesquisador a conclusões errôneas.
Experimentos de campo – É um projeto de pesquisa experimental conduzido numa
situação real, em que uma ou mais variáveis independentes são manipuladas pelo pesquisador,
sob condições tão cuidadosamente controladas quanto a situação permitir, e medido seu efeito
sobre uma ou mais variáveis dependentes (conceito adaptado de Kerlinger, 1973).
Os experimentos de campo não permitem ao pesquisador exercer total controle sobre
todas as variáveis intervenientes no processo, porém têm a vantagem de serem conduzidos em
uma situação real que dificilmente poderia ser reproduzida em laboratório. Em contrapartida,
Projeto de Pesquisa Explicativa 69

seus custos e o tempo de realização são muito mais elevados. Experimentos de laboratório
têm grande validade interna, enquanto experimentos de campo têm grande validade externa;
entre uma e outra opção, o pesquisador deverá escolher a que melhor atenda aos objetivos de
seu projeto. O Quadro 4.2 apresenta um resumo dessa comparação.

Quadro 4.2  Comparação entre experimentos de laboratório e de campo


Fatores Laboratório Campo
Validade interna Grande Pequena
Validade externa Pequena Grande
Custo Baixo Elevado
Espaço de tempo Curto Longo

Tipos de variáveis estranhas


Por diversas vezes, neste capítulo, enfatizou-se a necessidade de se controlarem as variáveis
estranhas durante a realização de um experimento de marketing para que o resultado não
fosse confundido, ou seja, para que se tenha certeza da existência de grande validade interna.
Essas variáveis estranhas podem ser de diferentes tipos (Kinnear e Taylor, 1979), (Churchill,
1979): história (H), maturação (M), efeito teste principal (TP) ou interativo (TI), variação nos
instrumentos (I), regressão estatística (R), viés de seleção (V) e mortalidade das unidades de
teste (MT). Cada um desses casos será analisado a seguir.
História (H) – Refere-se a eventos específicos que ocorrem ao mesmo tempo, mas ex-
ternamente ao experimento, e que podem estar afetando a variável dependente. Exemplo: ao
mesmo tempo em que se pretende verificar a relação de causa e efeito entre a participação de
uma empresa de máquinas operatrizes numa grande exposição/feira de máquinas e equipa-
mentos e suas vendas ao longo dos doze meses seguintes, mudanças nos rumos da economia
do país levaram a uma grande expansão da atividade econômica. É possível que o incremento
observado nas vendas tenha sido afetado pela mudança ocorrida no ritmo dos negócios, e não
ser atribuído exclusivamente à participação naquele evento. Quanto maior for o espaço de
tempo entre as medições da variável dependente e maior a duração do experimento, maior será
a ocorrência de história, e maiores tenderão a ser os efeitos provocados na variável dependente.
Maturação (M) – Diz respeito às mudanças que ocorrem nas unidades de teste ao longo
do experimento. Nada é estático, tudo muda com a passagem do tempo, e, à medida que o
experimento vai transcorrendo, principalmente se for muito longo, poderá haver inúmeras
mudanças com as unidades de teste que talvez afetem os resultados da variável dependente.
Exemplo: pessoas que no início do experimento eram solteiras e depois casaram, ficaram mais
velhas, formaram-se, ou mudaram o status social; lojas que foram reformadas ou mudaram de
direção; distribuidores que cresceram e se diversificaram etc. Analogamente à história, quanto
maior for o espaço de tempo entre as medições da variável dependente e maior for a duração
do experimento, maior será a ocorrência de maturação e maiores tenderão a ser os efeitos
provocados na variável dependente.
Efeito teste principal (TP) ou interativo (TI) – Diz respeito às interferências sobre
a variável dependente resultantes de medições dela tomadas antes que tenha sido exposta ao
tratamento. Há dois tipos de efeito teste: o efeito teste principal (TP) e o efeito teste interativo
(TI). O efeito teste principal ocorre quando a primeira medição realizada na variável dependente
70 Pesquisa de Marketing

afeta a segunda. Por exemplo, quando, para medir os efeitos de uma propaganda sobre a mu-
dança de atitudes de consumidores em relação à determinada marca de produto, efetua-se uma
medição prévia dessa atitude para posterior comparação, essa própria medição poderá induzir
esses consumidores a mudanças na atitude em relação à marca pesquisada, comprometendo a
validade interna do experimento. Esse efeito é também chamado de efeito reativo. Existem
poucos temas em ciências sociais em que o próprio processo de medição não provoca mudança
no que está sendo medido. Assim, qualquer pessoa que seja questionada sobre suas atitudes
em relação a uma empresa, produto ou marca pode ser induzida a realizar mudanças em suas
atitudes em relação ao que lhe foi perguntado. O fato de uma pessoa ter de relatar inicialmente
o seu padrão de consumo, ao ser incluído num painel de consumidores, poderá mudar esse
padrão de consumo. O efeito teste interativo ocorre quando a primeira medição, feita antes de
se exporem as unidades de teste ao tratamento, pode afetar as respostas das unidades de teste em
relação à variável experimental, pelo fato de as unidades de teste passarem a ficar mais interes-
sadas e curiosas a respeito do que está sendo medido, o que pode interferir em sua maneira
normal de reagir ao tratamento. Assim, os consumidores tendem a reagir de forma diferenciada
daquela que normalmente teriam quando, ao se efetuar a primeira medição para detectar suas
atitudes, por exemplo, em relação à empresa LG (fabricante de produtos eletrônicos), ficam mais
interessados em conhecer a empresa, o que ela fabrica e mais perceptivos às suas propagandas.
Tudo isso, provavelmente, provocará uma mudança em suas atitudes perante a LG que não
corresponderá à situação de normalidade que se pretendia medir. Os efeitos teste de um e
outro tipo produzem diferentes impactos sobre a validade. Enquanto o efeito teste principal
reduz a validade interna do experimento, o efeito teste interativo reduz sua validade externa.
Variações nos instrumentos (I) – Refere-se a qualquer mudança que possa ter ocorrido
com o(s) instrumento(s) utilizado(s) na medição das variáveis. Isso pode ocorrer tanto em
função de mudanças efetivas no instrumento quanto em função de diferentes formas de sua
aplicação. Exemplo: durante um experimento em que se procurava medir o efeito de um novo
programa de incentivo à equipe de vendas, houve, entre a primeira medição nas vendas antes
de o programa ser introduzido e uma medição três meses depois, inflação de 45%, fazendo
com que a escala utilizada (reais) ficasse com seu valor real alterado e a medida obtida na
segunda medição fosse completamente irreal, por causa da variação no instrumento de medida.
Por outro lado, medições feitas por um mesmo entrevistador, com o mesmo instrumento de
coleta de dados, mas cujo comportamento durante a entrevista tenha sido substancialmente
diferente, também poderá introduzir variação nas respostas. Esse problema tende a ocorrer
com maior intensidade quando as medições forem realizadas por diferentes entrevistadores.
Regressão estatística (R) – Os efeitos decorrentes de regressão estatística surgem quando
as unidades de teste escolhidas para a realização do experimento ocupam posições extremadas
em relação à variável dependente. Ao serem expostos ao tratamento, seus resultados tendem a
se mover rapidamente para um valor médio da população de onde foram retiradas. Chama-se
efeito regressão estatística a essa variação rápida, acima do normal, na variável dependente,
que pode estar trazendo grande distorção nos resultados. A seleção de unidades de teste por
meio de amostragens probabilísticas pode eliminar a ocorrência desse efeito. Exemplo: essa
ocorrência estaria presente no experimento que, procurando medir os efeitos de um pro-
grama de treinamento da equipe de vendas, escolhesse para unidades de teste os dez piores
vendedores da empresa. Esses vendedores, ao serem expostos ao programa de treinamento,
deverão ter uma reação que será medida por meio do incremento em suas vendas, maior do
Projeto de Pesquisa Explicativa 71

que a que deve ocorrer com toda a equipe de vendas. A validade externa dos experimentos
que têm o efeito regressão estatística fica comprometida.
Viés de seleção (V) – Ocorre quando são selecionadas unidades de teste com grandes diferen-
ças em relação à variável dependente, antes que sejam expostas ao tratamento. No exemplo visto no
item anterior, ocorreria viés de seleção se fosse montado um experimento para medir o resultado
sobre as vendas resultantes do programa de treinamento com o grupo dos dez piores vendedores da
empresa expostos ao tratamento, e o grupo dos dez melhores não expostos ao tratamento, servindo
como grupo de controle (para medir o efeito de outras variáveis). Nesse caso, além do efeito regres-
são estatística nos dois grupos, o viés de seleção agravaria a validade interna do experimento, pois
se estaria comparando dois grupos heterogêneos e, portanto, não comparáveis. A forma de reduzir
ou eliminar a ocorrência desse efeito é a utilização de processos randômicos ao longo de todo o
experimento. Segundo Kerlinger (1973), o princípio geral para se evitar o viés de seleção é:
Randomize1 sempre que for possível: selecione as unidades de teste por processos randômicos; atribua os papéis entre
os grupos de forma randômica; atribua os tratamentos experimentais aos grupos de forma randômica.

Mortalidade das unidades de teste (MT) – Refere-se às interferências que ocorrem


nos resultados, devido às perdas nas unidades de teste, durante a realização de um experimento.
Suponha que, no exemplo do treinamento da equipe de vendas, entre uma medição e outra,
três vendedores tenham pedido demissão da empresa e outros dois tenham sido transferidos
para uma nova região de vendas. O experimento estará completamente comprometido.
Todos esses tipos de variáveis estranhas constituem explicações alternativas para as variações
que ocorrem na variável dependente e que podem distorcer totalmente o efeito que se está
procurando medir. A forma de evitar, eliminar ou controlar seus efeitos é por meio de um
adequado projeto experimental.
Notação utilizada em experimentos
Para facilitar o entendimento da apresentação que segue, acerca dos diversos projetos experi-
mentais, será adotada a simbologia proposta por Banks (1965), que tem sido universalmente
adotada em pesquisas de marketing e está apresentada no Quadro 4.3.

Quadro 4.3  Simbologia adotada em projetos experimentais


Símbolo Significado
Representa que uma unidade de teste, ou um grupo experimental, foi exposto a
X
um tratamento cujo efeito sobre a variável dependente deverá ser determinado.
Representa que uma medida da variável dependente na unidade de teste foi
O
tirada ou observada.
Significa que os indivíduos foram distribuídos pelos grupos de forma
R probabilística, e que cada grupo foi também probabilisticamente determinado
para receber diferentes tratamentos.
Observações:
• Todos os símbolos situados numa mesma linha referem-se ao mesmo grupo ou unidade de teste.
• Todos os símbolos situados numa mesma vertical referem-se ao mesmo período de tempo.
• O acompanhamento do experimento no tempo é feito pela leitura dos símbolos da esquerda
para a direita.

Randomizar quer dizer selecionar de forma aleatória (probabilística).


1
72 Pesquisa de Marketing

Projetos experimentais
Existem inúmeros tipos de projetos experimentais. Neste livro, serão apresentados apenas os
sete considerados de maior utilidade para pesquisas de marketing. Os projetos experimentais
são classificados segundo o momento da medição da variável dependente em projetos antes,
projetos depois e projetos antes e depois do tratamento e segundo o número de grupos ex-
perimentais e de controle utilizados no projeto.
Projeto apenas depois, sem grupo de controle – A representação esquemática deste
projeto é:

X O

Ou seja, uma única unidade de teste é exposta a um tratamento X e, em seguida, efetua-se


uma medição O. O grupo não foi constituído por processos aleatórios (note que o símbolo R
não aparece), tendo sido, provavelmente, autosselecionado, ou selecionado pelo pesquisador
por processos arbitrários.
Esse projeto tem pouca importância para marketing devido à sua “fraqueza” constitucional.
Nele, estão presentes as seguintes variáveis estranhas não controladas: história, maturação, seleção
e mortalidade. Tudo isso torna sua validade interna muito pequena. Mesmo assim, há algumas
situações em marketing em que é possível sua utilização, principalmente naquelas em que uma
medição antes da variável dependente possa ser dispensável. Por exemplo, reunir um grupo arbi-
trário de leitores de determinado jornal que viram a propaganda do produto da empresa na edição
dominical, a fim de medir sua reação em termos de atitude. Note que as conclusões a que se pode
chegar com um projeto experimental desse tipo são muito limitadas.
Todos os projetos a seguir apresentados poderão ter seus grupos formados e selecionados
para exposição ao tratamento por processos não aleatórios, por autoescolha dos respondentes
ou por escolha arbitrária do pesquisador. Deixou-se de apresentar essas versões principalmente
por essa “fraqueza” constitucional que as caracteriza. Sua utilização somente se justifica quando
os processos probabilísticos na formação dos grupos forem impossíveis. Não obstante esse
aspecto, todos os procedimentos são idênticos aos dos projetos que serão apresentados.
Projeto antes-depois sem grupo de controle – A representação esquemática desse
projeto é:

R O1 X O2
Esse projeto apresenta duas diferenças em relação ao primeiro: a unidade de teste foi
probabilisticamente constituída (R) e foi realizada uma medida antes (O1). Aplicando esse
projeto ao mesmo exemplo anterior, ter-se-ia agora uma unidade de teste constituída por
processos aleatórios e uma medição anterior (O1) das atitudes desses consumidores em relação
ao produto para poder ser comparada a medição posterior (O2) com a exposição ao tratamento
(propaganda no jornal dominical). A conclusão que, a princípio, se poderia chegar seria:

d = O2 − O1 sendo d = efeito observado

No entanto, o efeito observado num projeto experimental com essas características não po-
de ser considerado resultante única e exclusivamente da exposição ao tratamento, pois inúmeras
variáveis estranhas podem ter estado presentes, mascarando o resultado. Por exemplo, o grupo
Projeto de Pesquisa Explicativa 73

pode ter sido exposto, simultaneamente, à propaganda do mesmo produto na TV (história) e


ter mudado sua atitude por causa disso; a medição antes pode ter despertado a atenção desses
consumidores para o produto e para todas as propagandas do produto (efeito teste interativo);
a medição antes pode influenciar os respondentes a terem determinadas respostas na medição
depois que não correspondam à realidade (efeito teste principal); entrevistadores diferentes
para medir a atitude antes e depois podem ter interferido nas respostas (instrumento) etc.
Todos esses problemas indicam que esse projeto também tem uma “fraqueza” constitucional
que faz com que a sua validade interna seja muito pequena.
Projeto apenas depois com um grupo de controle – A representação esquemática desse
projeto é:

Grupo experimental R X O1
Grupo de controle R O2

Esse projeto é constituído de duas unidades de teste: uma é utilizada como grupo ex-
perimental, exposto ao tratamento e às variáveis estranhas, e outra, como grupo de c às
variáveis estranhas. Tanto a constituição das unidades de teste como a determinação de qual
será o grupo experimental e o grupo de controle são feitas mediante processos aleatórios (R),
o que elimina a ocorrência de viés de seleção (V). Após o período de exposição do grupo
experimental ao tratamento, efetuam-se medições no grupo experimental (O1) e no grupo
de controle (O2). Partindo do pressuposto de que os dois grupos são idênticos, o resultado da
exposição do grupo experimental ao tratamento poderá ser:
d = O1 − O2

Sendo:
O1 = ET + H + M + TP + I + R + MT e
O2 = H + M + TP + I + R + MT
Ter-se-á:
d = O1 − O2 = ET ,   sendo ET = efeitode tratamento.

Note que esse projeto experimental apresenta um grande número de pontos positivos
quando comparado com os que foram até aqui apresentados. Não havendo medições antes
em nenhum dos grupos, não haverá problemas com o efeito teste; tendo sido os dois grupos
aleatoriamente formados e um aleatoriamente escolhido para ser exposto ao tratamento, não
haverá problemas de viés de seleção e de regressão estatística; como o grupo de controle está
sujeito a todas as outras variáveis exógenas ao experimento, esse efeito pode ser extraído da
medição do grupo experimental, eliminando, assim, o efeito história; como os grupos são
teoricamente idênticos, pode-se também admitir, porém sem muita certeza, que a maturação
e a mortalidade devem ter ocorrido de forma semelhante nos dois grupos, e seu efeito foi
eliminado por meio do grupo de controle. Permaneceriam apenas dúvidas quanto ao efeito
instrumento. Havendo, no entanto, cuidados em sua aplicação, poderia ser perfeitamente
controlado. Por todos esses pontos positivos, conclui-se que é um bom projeto experimental.
Apenas um ponto negativo precisa ser registrado. Como não são efetuadas medidas antes no
grupo experimental nem no grupo de controle, mesmo tendo sido constituídos de forma
74 Pesquisa de Marketing

probabilística, sempre permanecerá a dúvida se eram efetivamente idênticos em relação à


variável dependente, antes de expostos ao tratamento. Não obstante esse ponto negativo, esse
projeto apresenta grande validade interna.
Um exemplo da aplicação desse projeto seria, ao se pretender testar uma nova forma de
treinamento de novos vendedores, formar, por processos probabilísticos, dois grupos de novos
vendedores e, por sorteio, determinar qual grupo será o experimental. Em seguida, deve-se
expor o grupo experimental a uma nova forma de treinamento, e o grupo de controle, à
forma tradicional. Após o período de exposição, acompanhar o desempenho de um e outro
grupo (poderá ser em vendas, ou número de visitas, ou número de novos clientes conquis-
tados, ou até um indicador que leve em consideração tudo isso). A diferença verificada no
desempenho entre o grupo de controle e o grupo experimental será atribuída à nova forma
de treinamento. Note que a principal “fraqueza” desse projeto é a de não se ter certeza de
que os grupos sejam realmente semelhantes. Poderá haver, entre seus componentes, diferenças
de experiências, de capacidades, de exposição a treinamentos anteriores em outras empresas,
de personalidades, de motivação etc. que poderão ser responsáveis por diferentes desempe-
nhos dos grupos. Uma forma de reduzir o efeito desse problema é procurar, na formação dos
grupos, conciliar métodos probabilísticos com a escolha do pesquisador a partir da ficha de
cada vendedor, de forma a fazer com que os grupos sejam os mais semelhantes possíveis no
maior número de variáveis consideradas importantes para o experimento. Uma forma de se
criarem grupos semelhantes é selecionar e distribuir os elementos para os grupos de forma
pareada, ou seja, procurar na população, ou na amostra já selecionada, pares de indivíduos com
características bem semelhantes, e distribuí-los pelos grupos. A seguir, sorteia-se qual grupo
será experimental.
Projeto antes-depois com um grupo de controle – A representação esquemática
desse projeto é:
Grupo experimental R O1 X O2
Grupo de controle R O3 O4

Observe que esse projeto é, em tudo, similar ao anterior, com a vantagem de que, neste, são
tomadas medidas antes, tanto no grupo experimental quanto no de controle, o que facilita a
comparação entre os grupos.Todas as vantagens apresentadas no projeto anterior permanecem,
apesar do efeito teste interativo que agora surge em função das medições antes realizadas nos
dois grupos. A premissa desse projeto é que todas as variáveis estranhas agem igualmente
sobre os dois grupos, e a única diferença entre eles é a exposição do grupo experimental ao
tratamento. O efeito do tratamento no grupo experimental na variável dependente será:
d = d1 − d 2
d1 = O2 − O1 = ET + H + M + TP + TI + I + R + MT
d 2 = O4 − O3 = H + M + TP + I + R + MT
Em que:
d1 = efeito aparente na variável dependente no grupo experimental
d2 = efeito na variável dependente no grupo de controle resultante das variáveis estranhas
ET = efeito do tratamento
H = efeito história
M = efeito maturação
Projeto de Pesquisa Explicativa 75

TP = efeito teste principal


TI = efeito teste interativo
R = efeito regressão estatística
I = efeito instrumento
MT = efeito mortalidade
d = d1 − d 2 = ET + H + M + TP + TI + I + R + MT
− ( H + M + TP + I + R + MT )
d = ET + TI
Ou seja, o efeito medido sobre a variável dependente nesse projeto experimental será o
resultante do tratamento a que foi exposto o grupo experimental, mais o efeito resultante do efeito
teste interativo, pelo qual as pessoas reagem de forma diferente pelo fato de saberem que estão
sendo testadas. Isso compromete a validade externa do projeto, já que não se consegue separar
esse efeito do efeito tratamento. Apesar dessa ressalva, este é um bom projeto experimental, com
excelente validade externa, e poderá ser usado em pesquisas de marketing sem nenhum problema
quando as medidas antes não forem obtidas diretamente com os indivíduos (por exemplo, as
vendas de cada vendedor podem ser obtidas nos registros da empresa e eles não precisam saber
que estão sendo observados e participando de um experimento).
Quando, nesse mesmo esquema de projeto, os grupos não forem constituídos de forma proba-
bilística, sua denominação passa a ser projeto antes-depois com grupo de controle não equivalente.
Os projetos experimentais que seguem visam, principalmente, evitar o problema que ocorre
com este. São projetos muito complexos, trabalhosos e de custo elevado.
Projeto antes-depois com grupos intercambiáveis – A representação esquemática
desse projeto é:
Grupo um R O1
Grupo dois R X O2
Pode-se observar que, nesse projeto, também se parte do pressuposto de que os dois grupos
são idênticos. Realiza-se uma medida antes, no grupo que não será exposto ao tratamento, para
servir como parâmetro de comparação, e efetua-se uma medida depois, no grupo que ficou
exposto ao tratamento. Esse projeto apresenta uma única vantagem e um grande número de
“fraquezas”. A grande vantagem é que se elimina o efeito da mensuração inicial (efeito teste).
Por outro lado, esse projeto não apresenta nenhuma possibilidade de controlar e (ou) eliminar
os efeitos dos outros acontecimentos (variáveis estranhas). Seu uso se justificaria em pesquisas
de marketing somente nos casos em que a medição inicial contaminasse irremediavelmente
o experimento e naqueles em que outros projetos teriam difícil aplicação. Um exemplo de
aplicação desse projeto é o caso de, ao avaliar os efeitos de uma campanha de propaganda
sobre a intenção de compra dos consumidores, efetuar-se a medição antes, num grupo de
consumidores. Realiza-se a campanha de propaganda e efetua-se uma medição após, em outro
grupo de consumidores, o mais semelhante possível ao primeiro grupo. A diferença observada
na intenção de compra será totalmente atribuída à campanha de propaganda. Qualquer outro
acontecimento que, paralelamente, ocorra e que também influencie a intenção de compra
não poderá ser excluído.
Projeto antes-depois com dois grupos de controle (também denominado
Projeto Solomon de três grupos) – A representação esquemática desse projeto é:
76 Pesquisa de Marketing

Grupo experimental R O1 X O2
Grupo de controle 1 R O3 O4
Grupo de controle 2 R X O5

Esse projeto é similar ao projeto antes-depois com um grupo de controle, com a diferença
de que, agora, com mais um grupo de controle em que não é feita nenhuma medição antes. O
grupo de controle 2, não se contaminando pelo efeito teste interativo, possibilita a eliminação
de seu efeito sobre o efeito total. Para o cálculo do efeito tratamento d, tem-se de proceder
da seguinte forma:
Seja EXT o efeito conjunto de todas as variáveis estranhas menos o efeito teste interativo
(TI). Assim:
EXT = H + M + TP + I + R + MT
Então, ter-se-á para analisar o efeito do tratamento (ET)

Do grupo experimental d1 = O2 – O1 = ET + EXT + TI


Do grupo de controle 1 d2 = O4 – O3 = EXT
Do grupo de controle 2 d3 = O5 – (O1 + O3)/2 = ET + EXT

Observe que, na ausência de medições no grupo de controle 2, utiliza-se para sua subs-
tituição a média das medições antes dos grupos experimental e de controle 1, pressupondo
que os dois grupos sejam homogêneos. Observando as expressões acima, pode-se concluir
que o cálculo de d será igual a:

d = d 3 − d 2 = O5 − (O1 + O 3 )/2 − (O 4 + O 3 ) − ET + EXT − EXT = ET

Esse projeto experimental permite ainda calcular TI, bastando, para isso, calcular d3 – d1.
Pode-se concluir que esse é um bom projeto experimental, pois todos os efeitos indesejáveis
de serem medidos na variável dependente estão sob controle.
Projeto antes-depois com dois grupos de controle e dois grupos experimentais
(também denominado Projeto Solomon de quatro grupos) – A representação es-
quemática desse projeto é:

Grupo experimental 1 R O1 X O2
Grupo de controle 1 R O3 O4
Grupo experimental 2 R X O5
Grupo de controle 2 R O6

Com esse projeto experimental, analogamente ao projeto anterior, pode-se controlar o efei-
to de todas as variáveis estranhas que afetam a validade interna e ainda controlar o efeito teste
interativo que os projetos anteriores não controlavam. Em relação ao projeto antes-depois com
um grupo de controle, foram acrescentados mais um grupo experimental e um de controle.
Os procedimentos, nesse segundo grupo experimental, são idênticos ao primeiro, com exceção
de que não se efetua uma medida antes, não ficando exposto ao efeito teste interativo. No
Projeto de Pesquisa Explicativa 77

segundo grupo de controle, efetua-se apenas a medida depois. Quais as vantagens que esses
dois grupos adicionais podem trazer?
Chame EXT o efeito conjunto de todas as variáveis estranhas menos o efeito teste in-
terativo (TI). Assim:
EXT = H + M + TP + I + R + MT

Então, ter-se-á para analisar o efeito do tratamento (ET):

Do grupo experimental 1 d1 = O2 – O1 = ET + EXT + TI


Do grupo de controle 1 d2 = O4 – O3 = EXT
Do grupo experimental 2 d3 = O5 – (O1 + O3)/2 = ET + EXT
Do grupo de controle 2 d4 = O6 – (O1 + O3)/2 = EXT

Observe que, na ausência de medições antes nos novos grupos, utiliza-se a média das
medições antes nos grupos anteriores. Pressupõe-se que os grupos sejam homogêneos.
Pela observação das expressões anteriores, pode-se verificar que, se desejar-se calcular
apenas o efeito d resultante do tratamento aplicado, basta subtrair d4 de d3:
d = d 3 − d4 = [O5 − (O1 + O 3 )/2] − [O6 − (O1 + O 3 )/2] = ET + EXT − EXT = ET

Esse projeto permite que se tenha uma medida direta do efeito resultante das variáveis
estranhas: d3 e d4. Permite também que se calcule o efeito teste interativo:
d1 − d 3 = (O 2 − O1 ) − [O5 − (O1 + O 3 )/2] = ET + EXT + TI − ( ET + EXT ) = TI
Pode-se concluir que esse é, juntamente com o anterior, um bom projeto experimental,
pois todos os efeitos indesejáveis de serem medidos na variável dependente estão sob controle,
inclusive o efeito teste interativo. No entanto, os dois projetos propostos por Solomon (1949),
apesar de suas correções, têm sido pouco usados na prática de pesquisa de marketing, pois,
paralelamente ao incremento na correção dos resultados, sua complexidade leva também ao
incremento dos custos e do tempo demandado para sua realização. No entanto, apesar dessa
sua pouca utilização, Selltiz et al. (1974), citando Canter, alertam para o seguinte:
Embora, geralmente, se reconheça que a solução de Solomon é correta, seu planejamento não tem sido muito
empregado. No entanto, alguns poucos estudos que o empregaram sugerem que os efeitos da interação são,
frequentemente, tão grandes que têm efeitos marcantes nos resultados experimentais. Por exemplo, Canter (1951)
usou este planejamento (...) num estudo sobre a eficiência de um curso de treinamento em relações humanas
para supervisores (...) Ao comparar os resultados, Canter verificou que cada um dos testes da pré-medida interagiu
de alguma forma com a variável experimental; alguns dos testes iniciais pareciam tornar os supervisores mais
receptivos aos aspectos significativos do curso de treinamento, outros pareciam torná-los menos receptivos.

Projetos quase experimentais


Todos os projetos experimentais vistos têm em comum o problema de possuírem baixa
validade externa resultante da preocupação do pesquisador quanto ao controle sobre todas as
variáveis estranhas. Essa preocupação acaba criando situações artificiais que não correspondem
às situações ambientais em que as inter-relações entre as variáveis ocorrem. Por exemplo,
reunir pessoas num auditório para realizar o teste de um novo comercial, tirando-as de seu
dia a dia e solicitando-lhes suas opiniões numa condição totalmente artificial, leva a uma baixa
78 Pesquisa de Marketing

validade externa de um projeto desse tipo. Para solucionar esse problema, foram desenvolvidos
os projetos chamados quase experimentais. Esses projetos são assim denominados por não se
constituírem em experimentos verdadeiros. Nesse tipo de projeto, o pesquisador tem grande
controle sobre os procedimentos de coleta de dados, mas falha completamente ao controlar a
exposição ao tratamento e na capacidade de projetar as unidades de teste de forma probabilís-
tica. Com essas “fraquezas” do projeto quase experimental, a possibilidade de obter resultados
confusos e incorretos é muito grande. O pesquisador precisa estar ciente de quais variáveis
específicas não estão sendo controladas. Existem inúmeros projetos de quase experimento.
Serão analisados, neste livro, apenas os três que mais interessam à pesquisa de marketing.
Projeto série de tempo – Esse projeto compreende a definição de uma unidade de
teste em que se efetuam, periodicamente, na variável dependente, várias medidas antes e
várias depois de expô-la a determinado tratamento experimental. A mudança observada
entre o padrão das medidas tomadas antes e depois é atribuída ao efeito-tratamento. Como o
tratamento é aplicado à unidade de teste numa situação ambiental natural, esse projeto possui
grande validade externa. Sua representação esquemática é:

O1 O2 O3 O4 O5 X O6 O7 O8 O9 O10

Nesse projeto, o pesquisador tem controle sobre o momento em que as medidas são
efetuadas e de quem são tiradas, mas não tem controle sobre a exposição dos elementos das
unidades de teste (não tem controle sobre quem efetivamente foi exposto, nem o quanto foi
exposto). O interesse maior do pesquisador, ao utilizar um projeto quase experimental série de
tempo, é estabelecer quais os efeitos verdadeiros proporcionados sobre a variável experimental
pela exposição da unidade de teste ao tratamento. Para chegar a essa conclusão, deverá eliminar
outras possíveis hipóteses explicativas para a ocorrência do efeito, e é nesse aspecto que o
projeto apresenta “fraquezas” semelhantes às apontadas no projeto experimental antes-depois
sem grupo de controle. O projeto quase experimental série de tempo é, estruturalmente, em
tudo semelhante ao projeto experimental antes-depois sem grupo de controle, com a única
diferença de que são tomadas, em vez de uma, várias medidas antes e várias depois. Porém, o
fato de acompanhar a evolução no tempo da variável dependente proporciona ao pesquisador
maior controle dos efeitos das variáveis estranhas. Esse tipo de projeto quase experimental é
muito utilizado em pesquisas de marketing, sendo as de painéis (de consumidores, de teles-
pectadores, de radiouvintes, de leitores, de lojas etc.), sua aplicação mais comum.
A título de exemplo, suponha-se que uma empresa queira decidir se deve ou não per-
manecer com sua atual agência de propaganda. Para ajudar nessa decisão, preparou-se um
projeto quase experimental para analisar os resultados da última campanha de propaganda
conduzida por essa agência para o composto de seus produtos. A análise da participação de
mercado de toda a empresa, apontada pelo painel de consumidores do departamento de pes-
quisas de marketing, apresentou possíveis resultados das dez observações tomadas a cada mês
antes e após a campanha ter início (Figura 4.1).
Admitindo que cada observação (O) seja uma medida da participação mensal de mercado
da empresa, as conclusões obtidas do efeito da campanha de propaganda podem ser:
1. Nas situações A, B e C, a campanha não teve nenhum efeito sobre a participação de
mercado da empresa. Nas três situações, as tendências observadas antes permaneceram
inalteradas depois.
Projeto de Pesquisa Explicativa 79

Figura 4.1  Exemplos de efeitos sobre a participação de mercado em projetos quase experimentais.

2. Nas situações D, E e F, a campanha teve apenas um efeito de curto prazo, com a partici-
pação de mercado voltando ao patamar anterior um ou dois meses após seu início.
3. Na situação G, a campanha teve efeito contrário ao desejado, levando a empresa a perder
participação de mercado.
4. Nas situações H, I e J, a campanha trouxe resultados positivos para a participação de mer-
cado da empresa. Na situação H, foi capaz de sustar uma contínua queda na participação
de mercado que vinha sendo observada; na situação I, foi capaz de elevar e manter nesse
patamar a participação de mercado da empresa e, na situação J, foi capaz de elevar a taxa
de crescimento na participação de mercado observada antes de seu início.
O pesquisador menos atento, tão logo constatasse resultados como os apresentados
nos itens (1), (2) e (3), poderia imediatamente recomendar à diretoria de marketing que
trocasse de agência de propaganda. A seguir, será analisado se esse pesquisador deveria ou
não fazer essa sugestão com total segurança de que não estaria cometendo uma injustiça.
As múltiplas observações proporcionam controle adicional, mas não total, sobre as variá-
veis estranhas. O efeito maturação pode ser desconsiderado, pois, como está presente em
todas as observações, a tendência observada não se altera. Pela mesma razão, não é preciso
preocupar-se com os efeitos teste principal, instrumento e regressão estatística. O problema
do viés de seleção pode ser perfeitamente evitado se a unidade de teste for constituída
por processos probabilísticos, e o efeito mortalidade da unidade de teste poderá ser con-
trolado se for acompanhado e excluído das medições anteriores e posteriores às possíveis
perdas. A principal “fraqueza” desse projeto é a impossibilidade de o pesquisador controlar
o efeito história; mesmo que mantenha um registro dos eventos que estão ocorrendo
simultaneamente (ações dos concorrentes, mudanças na economia, outras ações da própria
empresa etc.), o pesquisador não terá como medir e eliminar esse efeito do total observado.
Outra “fraqueza” desse projeto é a impossibilidade de se eliminar o efeito teste interativo,
que, com certeza, deve ocorrer em grande intensidade em unidades de teste que sejam
80 Pesquisa de Marketing

continuamente medidas (mudança de padrão de consumo, má vontade em atender ao pes-


quisador etc.). Dessa forma, poderá cometer uma grande injustiça o pesquisador que fizer
a recomendação citada. Apesar dessas críticas, esse projeto é muito utilizado na prática de
pesquisa de marketing e, quando usado com certos cuidados, contribui significativamente
para o processo de decisão de marketing.
Projeto série de tempo com grupo de controle – Analogamente à comparação
feita no item anterior, esse projeto é estruturalmente semelhante ao projeto antes-depois
com um grupo de controle, com a diferença de que agora são tomadas várias medidas
antes e várias depois nos grupos experimentais e de controle. A representação esquemática
desse projeto é:

O1 O2 O3 O4 O5 X O6 O7 O8 O9 O10
O11 O12 O13 O14 O15 O16 O17 O18 O19 O20

A vantagem desse projeto é que se for conseguido um grupo de controle equivalente ao grupo
experimental, obter-se-á uma certeza muito maior nos resultados do efeito tratamento do
que no projeto anterior, pois agora o pesquisador pode comparar o efeito tratamento tanto
em relação ao grupo experimental quanto em relação ao grupo de controle, conseguindo,
dessa forma, grande validade externa para os resultados. O único problema desse projeto é
a possibilidade de efeito interativo no grupo experimental, sobre o qual o pesquisador não
terá controle.
Um exemplo da utilização desse projeto é constituir duas unidades de teste formadas por
supermercados equivalentes visando medir os efeitos de uma campanha de promoção de
vendas realizada em que é exposta apenas a unidade de teste experimental.
Projeto série de tempo com grupo único equivalente – Às vezes, para a realização
do projeto anterior, não é fácil encontrar um grupo equivalente para servir de grupo de
controle. Quando isso ocorre, uma solução viável é a utilização do mesmo grupo, ora como
grupo experimental ora como grupo de controle, ou seja, num período o grupo é exposto ao
tratamento, no período seguinte não, e assim, sucessivamente, enquanto durar o experimento.
A representação esquemática desse projeto é:

O X Ox − O X Ox − O X Ox

Em que:
O representa medições referentes aos períodos sem exposição ao tratamento e Ox com
exposição.
X representa a presença de tratamento e – sua ausência.
Esse projeto tem muita utilidade para medir efeitos de tratamentos cuja ação é apenas
ocasional, como a maioria das atividades promocionais nos pontos de venda. Assim, se dese-
jar-se medir o efeito sobre as vendas de uma banca de degustação num supermercado, ou da
demonstradora de um novo aspirador de pó numa loja de departamentos, ou de propaganda
no ponto de venda, esse projeto se adapta perfeitamente.
Passos para a realização de um projeto experimental – Se o pesquisador tiver
decidido que, para seu problema específico de pesquisa, a realização de um experimento é a
melhor solução, tiver conhecimento dos procedimentos para a realização de um experimento,
Projeto de Pesquisa Explicativa 81

tiver um bom entendimento de como controlar as variáveis estranhas, fontes de invalidados,


e tiver conhecimento das limitações dos experimentos, estará em condições de iniciar um
projeto seguindo estes passos:
1. Identificar ou estabelecer o problema.
2. Formular a hipótese.
3. Escolher o projeto experimental adequado.
4. Efetuar uma previsão dos possíveis resultados que esse projeto poderá fornecer-lhe e
verificar se os resultados atenderão ao problema de pesquisa.
5. Verificar se os dados a serem obtidos poderão ser analisados pelos procedimentos estatís-
ticos disponíveis (esses procedimentos estão apresentados e discutidos nos Capítulos 11, 12
e 13 deste livro).
6. Realizar o experimento.
7. Aplicar os procedimentos de análises estatísticas aos dados para verificar se os efeitos são
reais ou apenas aparentes.
8. Tirar conclusões referentes às validades interna e externa.

TESTE DE MARKETING
O conceito de teste de marketing ou teste de mercado, segundo Achenbaum (1974) é:
Um experimento controlado, realizado numa limitada, mas cuidadosamente selecionada parte de um mercado,
cujo objetivo é o de prever as consequências sobre as vendas ou sobre os lucros, tanto em termos absolutos quanto
relativos, de uma ou mais ações de marketing propostas.

Kinnear and Taylor (1979)Kinnear e Taylor (1979) apresentam uma definição um pouco
diferente e mais abrangente que a de Achenbaum (1974):
É a implementação e a monitoração de um programa de marketing numa pequena parte do mercado geográfi-
co-alvo para o produto em questão.

A primeira definição está mais direcionada a mostrar o que o teste de marketing é em


termos metodológicos, enquanto a segunda está mais direcionada à natureza de sua atividade.
O teste de marketing é frequentemente utilizado para testar o lançamento de um
novo produto ou uma nova versão de um produto existente. Os gerentes de marketing
precisam utilizar seu julgamento pessoal e outras formas de pesquisa para reduzir o nú-
mero de alternativas e, se possível, ficar com apenas uma para testar. Imagine um gerente
que desejasse testar três opções de preço, três opções de embalagem, duas opções de
propaganda, duas opções de marca, dois diferentes pontos de distribuição e três diferentes
versões do produto em si. Veja quantas diferentes unidades esse gerente precisaria para
levar seu teste adiante:

N° de unidades de teste = 3 preços x 3 embalagens x 2 propagandas x


2 marcas x 2 formas de distribuição x
3 versões do produto = 216

É evidente que um teste com esse número de unidades (que, no teste de marketing, são
cidades) é inviável, tanto pela impossibilidade de conseguir essa quantidade de cidades quanto
pelo custo e o tempo que isso demandaria.
82 Pesquisa de Marketing

Usos do teste de marketing


Utilizam-se os testes de marketing para três finalidades: como treinamento gerencial, para
efetuar previsões de resultados e para ajustar as variáveis de marketing do produto (produto,
preço, promoção e pontos de distribuição).
Para controle gerencial, o teste de marketing permite que a empresa e seus executivos
ganhem experiência e conhecimento antes de empreenderem um projeto em grande escala.
Exemplos de experiência que pode ser adquirida por meio do teste de marketing: na movi-
mentação e na manipulação física do produto (armazenagem, transporte, expedição, duração
do produto na prateleira do supermercado etc.); na produção (desenvolvimento de fornece-
dores, treinamento dos operários em novos equipamentos e com novas matérias-primas etc.)
e na própria atividade de marketing (superar dificuldades em conseguir distribuição, fixar o
preço nos diversos níveis de distribuição, como produzir um comercial, efetuar promoções
de vendas etc.). Quando o teste de marketing é usado apenas com esse objetivo, não há muita
preocupação com a correção do projeto experimental usado, afinal o interesse é apenas treinar
o pessoal nesse novo produto ou novo mercado.
Para efetuar previsões de resultados, o projeto experimental precisa estar muito bem elabora-
do, para que não se cometam erros de avaliação. Quando se realiza um teste de marketing com
esse objetivo, procura-se extrapolar os resultados do teste de uma pequena região, em termos
de vendas, participação de mercado e lucros, para um lançamento nacional. Existem inúmeras
formas de se projetarem os resultados de vendas de um teste de marketing para todo o país.
A seguir, serão apresentadas as três mais simples e mais utilizadas em pesquisas de marketing.
Método da renda nacional – Neste método, as vendas do produto na região-teste são ex-
trapoladas para todo o país por meio da proporção que a renda da área-teste tem na renda nacional:

Previsão de vendas nacionais − (Renda nacional /


Renda da área-teste) × Vendas do produto na área-teste

Esse método terá um bom resultado se a área escolhida para teste for representativa do país.
Método do rateio de vendas – Neste método, as vendas do produto na região-teste são
comparadas com as vendas de um produto concorrente de outra marca com o qual se espera
que a relação ocorrida na região-teste seja mantida em nível nacional:
Previsão de vendas nacionais − (Vendas do produto na área-teste /
Vendas do produto concorrente na área-teste) ×
Vendas nacionais do produto concorrente

Método da participação de mercado – Neste método, as vendas do produto na


região-teste são relacionadas com o total das vendas da categoria de produtos. A participação
de mercado obtida na região-teste é aplicada às vendas nacionais da categoria para se obter
a previsão de vendas:
Previsão de vendas nacionais − (Vendas do produto na área-teste /
Vendas da categoria na área-teste) × Vendas nacionais da categoria

O maior uso do teste de marketing ocorre efetivamente para ajustar as variáveis de decisão
de marketing. Quando se está providenciando o lançamento de um novo produto, ou mesmo
Projeto de Pesquisa Explicativa 83

modificando um produto existente, é muito difícil avaliar qual será a reação do consumidor
às inúmeras e complexas variáveis de marketing que compõem um lançamento. O risco de se
fazer o lançamento em nível nacional e cometer-se um erro poderá significar não só a perda
de milhões de reais, como também o custo de oportunidade (dependendo do erro cometido,
o produto poderá estar irremediavelmente “queimado” no mercado). O lançamento numa
pequena região permitirá que os possíveis erros possam ser corrigidos a um custo razoável
e, mesmo que se cometam erros irremediáveis, o produto estará “queimado” apenas naquela
pequena região. As chances de que o lançamento, em nível nacional, de um produto ajustado
por meio de um teste de marketing seja bem-sucedido são infinitamente maiores do que as
de outro que não o tenha sido. As informações para a tomada de decisão que um teste de
marketing pode fornecer compreendem:
• Vendas em unidades e valores monetários.
• Participação de mercado.
• Participação relativa de mercado (participação em relação aos principais concorrentes).
• Lucratividade e retorno do investimento.
• Resultados das alternativas das estratégias de marketing.
• Receptividade dos consumidores ao produto.
• Receptividade dos intermediários ao produto.
• Possíveis reações dos concorrentes.
Infelizmente, como será visto a seguir, os custos de um teste de marketing são muito
elevados, o que certamente impede que muito mais empresas façam uso dele.

Custos do teste de marketing


Foi visto que os projetos experimentais de campo são, em geral, muito caros e que, destes, o
teste de marketing é o mais caro de todos. Estimativas de seu custo feitas em 1975 por Klomp-
maker, Hughes e Haley (1976) indicavam que um teste de marketing feito em duas cidades
simultaneamente tinha custos diretos de US$ 250.000. Testes mais complexos e longos podem
ultrapassar US$ 1 milhão.
Em função desses elevados custos, antes de decidir por sua realização ou não, uma empresa
precisa ponderar seus custos e benefícios. Nesse processo de avaliação, os seguintes aspectos
precisam ser ponderados:
• Comparar o custo e o risco do insucesso com a lucratividade e a probabilidade do sucesso. Produtos
com baixo custo e baixo risco de insucesso não precisam ser testados. Ninguém deve realizar um
teste de marketing para avaliar o lançamento de um novo sabor (ou formato) de sorvete.
• Considerar todos os investimentos necessários para fazer o lançamento nacional e o lança-
mento na região-teste. Produtos que exigem grande investimento em planta, equipamentos
etc. não devem ser testados. Ninguém deve realizar um teste de marketing para avaliar o
lançamento de um novo automóvel.
• Considerar a probabilidade e a velocidade com que os concorrentes possam copiar o
produto a ser testado, preparar-se para concorrer com o produto no momento de seu
lançamento em nível nacional e até se antecipar a seu lançamento. Se o produto é uma
inovação tecnológica muito bem protegida por patente, é possível fazer o teste. Porém,
se a ideia for fácil de copiar e não estiver legalmente protegida, é melhor não arriscar e o
teste não deve ser feito. Não esquecer que um teste de marketing é transparente, e não é
só o pessoal da empresa que está acompanhando os resultados.
84 Pesquisa de Marketing

• Considerar os efeitos de um fracasso em nível nacional para sua empresa. Considerar os


efeitos externos, em termos de queda na imagem e no prestígio, e os efeitos internos, em
termos de desgaste emocional e das dificuldades advindas para o lançamento futuro de
novos produtos. Se os efeitos de um possível fracasso forem muito drásticos, deve-se efetuar
o teste.
Após fazer essas ponderações, os responsáveis pelo marketing da empresa estarão em
condições de decidir se devem ou não realizar o teste de marketing.

Critérios para selecionar locais para o teste de marketing


A cidade ideal para a realização de testes de marketing não existe. Essa cidade deveria ser
representativa de todo o mercado brasileiro. Desconhece-se a existência de alguma cidade
brasileira que tenha esta característica. O que se deve fazer é procurar cidades que reúnam um
grande número de características que as aproximem do mercado-teste ideal. As características
que devem ser procuradas são:
• A situação concorrencial local deve ser semelhante à nacional.
• Deve representar uma situação típica do nível e do volume da propaganda entre os diversos
concorrentes.
• O alcance dos meios de comunicação local não deve atingir outros mercados importantes
que estejam fora do mercado-teste; nem o mercado-teste deve receber um grande impacto
dos meios de comunicação situados fora de sua área. Por exemplo, as redes de televisão
precisam ter condições de emitir propagandas apenas locais.
• O mercado local deve ter um padrão de uso de mídia similar ao nacional.
• Se os mercados regionais do país forem muito diferentes, em cada região deve ser feito um teste
de marketing, e a cidade-teste deve reunir as características da região.
• O mercado local não deve ser supertestado.
• Esse mercado não pode ser muito pequeno, pois os resultados obtidos precisam ser signi-
ficativos; nem deve ser tão grande que torne o teste de marketing muito dispendioso.
• O mercado deve ter tido um desenvolvimento histórico “normal” para a classe do produto
a ser testado.
• Esse mercado não deve ser constituído de públicos com perfis diferenciados (cidades-dor-
mitório, cidades de aposentados, cidades de estudantes, cidades turísticas etc.).
• Agências de pesquisas que realizam auditoria de lojas e outros tipos de pesquisas precisam
estar disponíveis nesses locais ou dispostas a ali realizar trabalhos.
• O perfil sociodemográfico econômico dos residentes deve aproximar-se do perfil do
público-alvo do produto a ser testado.
• Devem existir canais de distribuição representativos da distribuição nacional.
É evidente que nenhuma cidade brasileira atenderá a todas essas características simultanea-
mente; deve-se procurar aquela que reunir o maior número dessas características.
Duração do teste de marketing
A duração do teste varia em função de seus objetivos, do tipo de produto testado, dos riscos
envolvidos em sua duração e do custo para sua realização. Em média, não devem durar menos
de seis nem mais de doze meses.
Se o objetivo do teste for avaliar apenas uma versão do plano de marketing, poderá ter
uma duração mais curta; se o objetivo for avaliar várias versões, a duração será maior.
Projeto de Pesquisa Explicativa 85

Quanto maior for a frequência de compra do tipo de produto testado, menor será o
período de teste e vice-versa. Há necessidade de um período mínimo para que ocorra estabi-
lidade nos resultados. Somente após os resultados haverem se estabilizado é que as projeções
poderão ser feitas e o teste encerrado. Quanto maior a frequência de compra de um produto,
mais rapidamente os resultados atingem a estabilidade e menor deverá ser a duração do teste.
Quanto maior o risco envolvido em se ter o produto copiado ou imitado pelos concor-
rentes, menor deverá ser a duração do teste.
Os custos envolvidos na realização do teste, comparados ao ganho adicional de informação
em alongar sua duração, devem ajudar a determinar a duração que o teste deve ter.

RESUMO
A causalidade é um conceito complexo que tem um significado diferente para o “senso
comum” das pessoas e para os cientistas. Segundo o senso comum, um evento (causa) singular
é responsável por outro evento (efeito), chamado de causação determinística. O cientista
reconhece que um evento tem um número de condições determinantes (causas) cuja ação
conjunta pode levar a um provável efeito, chamado de causação probabilística.
A causalidade pode ser inferida quando, entre duas ou mais variáveis, houver: variação
concomitante, ordem de ocorrência correta das variáveis no tempo e quando os outros pos-
síveis fatores causais forem eliminados.
Um experimento é um tipo de pesquisa científica em que o pesquisador manipula e con-
trola uma ou mais variáveis independentes e observa a variação na variável ou nas variáveis
dependentes concomitantemente à manipulação das variáveis independentes.
Variáveis independentes (ou tratamentos) são aquelas que são manipuladas e cujos efeitos
sobre as variáveis dependentes se desejam medir. Exemplos de variáveis independentes em
marketing: preço, gastos em propaganda, tipos de promoção, meios de distribuição, compo-
nentes do produto (produto em si, design, marca, sabor, cor, embalagem etc.).
Variáveis dependentes são aquelas que variam concomitantemente a outras variáveis
(chamadas independentes) cuja variação conjunta interessa ao pesquisador medir. Exemplos
de variáveis dependentes em marketing: vendas, participação no mercado, experimentação,
atitudes, imagem, elevação do nível de estocagem do produto nos lares etc.
Variáveis estranhas são todas as outras, que não as variáveis independentes consideradas,
que possam afetar os resultados da variável dependente. Assim, seria uma variável estranha a
promoção de vendas que fosse realizada simultaneamente a um estudo que procurasse verificar
o resultado sobre as vendas de uma pretendida redução no preço de um produto.
As unidades de teste são as entidades nas quais os tratamentos são aplicados, e os efeitos,
medidos.
Grupo experimental é a unidade de teste exposta ao tratamento experimental.
Grupos de controle são as unidades de teste não expostas ao tratamento experimental e
que servem para medir os efeitos das outras variáveis a que tanto o grupo experimental quanto
o de controle estão sujeitos.
Um projeto experimental envolve: definição de uma hipótese relacionando duas ou mais
variáveis; determinação da variável (ou variáveis) independente (ou tratamento); determinação
da(s) unidade(s) de teste; determinação da variável (ou variáveis) dependente; e determinação dos
procedimentos para tratar as variáveis estranhas.
86 Pesquisa de Marketing

A validade interna de um experimento diz respeito às condições mínimas que precisam


estar presentes no projeto para que qualquer ingerência a respeito da relação causal entre duas
ou mais variáveis possa ser feita.
A validade externa de um experimento diz respeito à extensão segundo a qual se podem gene-
ralizar os resultados obtidos para toda a população de onde as unidades de teste foram selecionadas.
Um experimento de laboratório pode ser definido como aquele em que o pesquisador
consegue criar uma situação com as condições exatas que desejaria ter e na qual ele controla
algumas e manipula outras variáveis. Além disso, ele pode observar e medir os efeitos dessa
manipulação das variáveis independentes sobre as variáveis dependentes.
Um experimento de campo é um projeto de pesquisa experimental conduzido numa
situação real em que uma ou mais variáveis independentes são manipuladas pelo pesquisador,
sob condições tão cuidadosamente controladas quanto a situação o permitir, e medido seu
efeito sobre uma ou mais variáveis dependentes.
As variáveis estranhas podem ser das seguintes categorias: história (H), maturação (M), efeito
teste (TP ou TI), variações nos instrumentos (I), regressão estatística (R), viés de seleção (V)
e mortalidade das unidades de teste (MT).
Projetos experimentais: apenas depois sem grupo de controle, antes-depois sem grupo de
controle, apenas depois com um grupo de controle; antes-depois com um grupo de controle;
antes-depois com grupos intercambiáveis, antes-depois com dois grupos de controle (também
denominado Projeto Solomon de três grupos), antes-depois com dois grupos de controle e
dois grupos experimentais (também denominado Projeto Solomon de quatro grupos).
Tipos de projetos quase experimentais: série de tempo, série de tempo com grupo de
controle, série de tempo com grupo único equivalente.
Teste de marketing é um experimento controlado, realizado em uma limitada, mas cuida-
dosamente selecionada parte de um mercado, cujo objetivo é prever as consequências sobre
as vendas ou sobre os lucros, tanto em termos absolutos quanto relativos, de uma ou mais
ações de marketing propostas.
As alternativas a serem testadas num teste de marketing precisam ser reduzidas a um
pequeno número por outras formas de pesquisa e pelo bom senso e a experiência dos gerentes
de marketing.
Testes de marketing podem ser utilizados para três diferentes finalidades: como treinamento
gerencial, para efetuar previsões de vendas e para ajustar as variáveis de marketing do produto
em teste (produto, preço, promoção e pontos de distribuição).
Os projetos experimentais de campo são em geral muito caros e, destes, o teste de marketing
é o mais caro de todos (US$ 250.000 a US$ 1 milhão). Em função desses elevados custos,
antes de decidir por sua realização ou não, uma empresa precisa ponderar sobre seus custos
e benefícios.
Um teste de marketing dura, em média, não menos que seis e não mais que 12 meses.
A cidade ideal para a realização de testes de marketing não existe. O que deve ser feito
é procurar cidades que reúnam um grande número de características que as aproximem do
mercado-teste ideal.
Ao planejar um teste de marketing, o pesquisador deve tomar decisões que envolvam: quais
informações coletar, quais cidades escolher para o teste, qual a duração do teste e como irá
proceder com toda a infraestrutura necessária (transporte dos produtos, distribuição, produção
e veiculação de propaganda e promoção de vendas e medição dos resultados).
Projeto de Pesquisa Explicativa 87

QUESTÕES DE REVISÃO
1. Em que diferem os conceitos de científico e “senso comum” no que diz respeito à
causalidade?
2. Quais são as condições para que se possa inferir causalidade entre duas ou mais variáveis?
3. O que é um experimento?
4. No que um experimento difere de pesquisas exploratórias e de pesquisas conclusivas
descritivas?
5. Qual a diferença entre experimentos de laboratório e de campo?
6. Qual a diferença entre validade interna e validade externa em experimentos?
7. Quais são e de que forma agem as variáveis estranhas que podem afetar os resultados de
um experimento?
8. Qual a diferença entre o efeito teste principal e o efeito teste interativo?
9. Como proceder para estabelecer equalização entre os grupos experimentais e os grupos
de controle?
10. Quais são os tipos de projetos experimentais?
11. Qual é o melhor projeto experimental, levando-se em conta os custos e a validade dos
resultados?
12. No que um projeto quase experimental difere de um projeto experimental?
13. Descreva os projetos quase experimentais e faça uma comparação entre as vantagens e
desvantagens de cada um.
14. Quais são os passos para se realizar um experimento?
15. Faça um resumo dos problemas e limitações dos projetos experimentais aplicados a pes-
quisas de marketing.
16. O que é um teste de marketing?
17. Quais são os usos do teste de marketing?
18. Quais são os métodos utilizados para se projetarem os resultados de vendas de um teste
de marketing para todo o mercado nacional? Descreva-os.
19. Faça uma lista de todas as informações possíveis que um teste de marketing pode
proporcionar.
20. Quais aspectos devem ser ponderados para se decidir pela realização ou não de um teste
de marketing?
21. Faça uma lista de pelo menos cinco características que uma cidade deveria ter para poder
sediar um teste de marketing.

Trabalho – Parte 3
Verifique se, para seu projeto de pesquisa, é possível e desejável, a utilização de projetos ex-
perimentais. Em caso positivo, proponha um projeto experimental para sua pesquisa.

REFERÊNCIAS
ACHENBAUM, Alvin R. Market testing: using a marketplace as a laboratory. In: ROBERT, Ferber
(Org.) Handbook of marketing research. New York: McGraw-Hill, 1974.
BANKS; Seymour. Experimentation in marketing. New York: McGraw-Hill, 1965.
CAMPBELL, Donald T.; STANLEY, Julian C. Experimental and quasi experimental design for research.
Chicago: Rand McNally, 1966.
88 Pesquisa de Marketing

CHURCHILL, JR.; Gilbert, A. Marketing research: methodological foundations. Hinsdale, Illinois: Driden
Press, 1979.
COX, Keith K.; ENIS S Ben M. Experimentation for marketing decision. Scranton, PA: International Text
Book, 1969.
FESTINGER, Leon; KATZ, Daniel. Research methods in behavioral sciences. New York: Holt, Rinehart
and Winston, 1950.
KERLINGER, Fred N. Foundations of behavioral research. 2. ed. New York: Holt, Rinehart and Winston,
1973.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio:
McGraw-Hill Kogakusha, 1979.
KLOMPMAKER, Jay E.; HUGHES, G. David; HALEY, Russel I. Test marketing in new product
development. Harvard Business Review, CA. 54, pp. 128-138, May-June 1976.
SELLTIZ, Claire; JAHODA, Marie; DEUTSCH, Morton; COOK, Stuart W. Métodos de pesquisas nas
relações sociais. São Paulo: Editora Pedagógica e Universitária - EPU. Editora da Universidade de
São Paulo, 1974.
SOLOMON, R. L. Extension of control group design. Psychological Bulletin, 46, pp. 137-150, 1949.
CAPÍTULO 5
Tipos, Fontes e Formas de Coleta
de Dados
A pesquisa é a grande orelha da propaganda.
Alex Periscinoto

Objetivos
• Apresentar as fontes de dados em pesquisas de marketing.
• Apresentar os tipos de dados, primários e secundários, em pesquisas de marketing.
• Apresentar os métodos de comunicação e observação utilizados em pesquisas de marketing.

Sumário
FONTES DE DADOS EM PESQUISAS DE MARKETING
Pesquisado
Pessoas que tenham informações sobre o pesquisado
Situações similares
Dados disponíveis
TIPOS DE DADOS
Dados primários e dados secundários
Sequência na procura de dados em pesquisas de marketing
DADOS SECUNDÁRIOS
Vantagens e desvantagens dos dados secundários
Fontes de dados secundários
DADOS PRIMÁRIOS
Tipos de dados primários geralmente coletados
Meios básicos de coleta de dados primários
MÉTODO DA COMUNICAÇÃO
Método da comunicação quanto ao grau de estruturação e disfarce
Método da comunicação quanto à forma de aplicação
COMPARAÇÃO ENTRE OS MÉTODOS DA COMUNICAÇÃO QUANTO À FORMA DE APLICAÇÃO
Uso combinado das várias formas de aplicação do método da comunicação
MÉTODO DA OBSERVAÇÃO
Método da observação quanto ao grau de estruturação
Método da observação quanto ao grau de disfarce
Método da observação quanto aos instrumentos utilizados
Método da observação quanto ao ambiente
Método da observação quanto ao objeto observado
Método da observação quanto à participação do observador
89
90 Pesquisa de Marketing

Para a definição dos métodos a serem utilizados numa pesquisa de marketing, o pesquisador
precisa conhecer o leque de métodos disponíveis, os diferentes tipos de dados que podem ser
coletados, as fontes de dados e as formas de coletá-los.
Nos capítulos precedentes, foram estudados os métodos disponíveis para serem utilizados
em pesquisas de marketing. No presente capítulo, serão estudados os tipos, as fontes e as formas
de coleta de dados em pesquisas de marketing.

FONTES DE DADOS EM PESQUISAS DE MARKETING


Há quatro diferentes fontes básicas de dados em pesquisas de marketing: pesquisado, pessoas
que tenham informações sobre o pesquisado, situações similares e dados disponíveis.

Pesquisado
Os próprios pesquisados são a maior fonte de dados em pesquisas de marketing. O dado pode
ser obtido do pesquisado por meio de sua própria declaração, oralmente ou por escrito, ou
por meio de sua observação.

Pessoas que tenham informações sobre o pesquisado


Quando ocorre de o pesquisado ser inacessível, possuir pouco conhecimento da informação
desejada ou tiver dificuldade de se expressar, às vezes é mais fácil conseguir a informação
com outras pessoas que convivem com o pesquisado do que com ele próprio. É comum,
em pesquisas de marketing, obter informações sobre as crianças de uma casa com a mãe,
ou do marido com a esposa, do chefe com a secretária, do subordinado com o chefe, do
cliente com o vendedor etc.

Situações similares
Outra fonte de informações para a pesquisa de marketing é a busca de conhecimento em situações
análogas ou similares, naturais ou criadas pelo pesquisador.Aprende-se bastante em saber como ou-
tra empresa procedeu para o lançamento de um produto similar, como outras empresas do mesmo
ramo trabalham com a variável promoção de vendas, como foram as reações dos consumidores
quando determinado produto foi lançado em outro mercado etc. As formas básicas de conhecer
situações similares são por meio do estudo de casos, do experimento e da simulação.
O estudo de caso, já apresentado no Capítulo 3, envolve o estudo intensivo de algumas
situações reais e relevantes para determinado problema estabelecido e, como já visto, é utilizado,
principalmente, com objetivos exploratórios.
O experimento, já apresentado no Capítulo 4, é um tipo de pesquisa científica na qual o
pesquisador manipula e controla uma ou mais variáveis independentes e observa a variação
na variável ou nas variáveis dependentes concomitantemente à manipulação das variáveis
independentes.
A simulação consiste na criação de um modelo computacional de uma situação similar
àquela em que se deseja ganhar conhecimento. Uma vez construído e testado o modelo, o
pesquisador poderá, a qualquer momento, simular o resultado que obteria se determinado
conjunto de decisões sobre as variáveis de marketing fosse tomado. Se a resposta à simulação
for favorável, esse conjunto de decisões simuladas pode transformar-se em decisões reais.
Tipos, Fontes e Formas de Coleta de Dados 91

Modelos de simulação mais sofisticados podem até indicar, diante de determinadas situações
apresentadas, qual o melhor conjunto de decisões que o gerente de marketing deve tomar. Note
que há grande semelhança entre os processos de experimentação e de simulação, em termos
de obter os efeitos que a manipulação das variáveis independentes de marketing trazem para
as variáveis dependentes, com a diferença de que o experimento (de campo ou de laboratório)
é realizado com sujeitos reais, enquanto a simulação é realizada com modelos de sujeitos.
Modelos de simulação são muito usados em outras áreas do conhecimento (construção
de aviões, navios, hidrelétricas etc.), mas sua utilização em marketing é recente (Mattar, 1986).
A utilização de simulação em marketing necessita que o construtor do modelo conceitue
e documente os principais componentes do sistema e estabeleça as probabilidades para re-
presentar o comportamento desses componentes. Pode-se, por exemplo, criar um modelo
computacional referente ao comportamento do consumidor de determinado mercado, do
varejista, do atacadista ou mesmo um modelo referente ao funcionamento completo de
determinado mercado. O modelo estabelece como esses elementos (consumidores, varejistas,
atacadistas, telespectadores etc.) se comportam em função de variações nos preços, nos gastos
de propaganda, nos gastos de promoção de vendas, no nível de qualidade do produto, na
margem bruta aos intermediários etc. Probabilidades são associadas aos elementos em função
de suas respostas a essas variáveis. O objetivo é fazer com que as respostas desses elementos de
simulação sejam semelhantes às respostas dos sujeitos reais que eles representam. O compor-
tamento desses elementos resultará em saídas do modelo que podem ser projeções quanto a
participação de mercado, vendas, lucros, índice de audiência etc. O desenvolvimento de um
modelo de simulação exige a contribuição de um especialista, geralmente um estatístico, e a
cooperação dos gerentes de marketing e vendas da empresa interessada. O especialista procura
reduzir a complexidade da realidade desse mercado a proporções passíveis de modelagem, sem
que se percam as interações mais importantes. Para a construção do modelo, esse especialista
deverá adquirir um grande conhecimento das inúmeras variáveis desse mercado (número de
pessoas, valor médio da renda e sua distribuição, número de concorrentes e suas práticas de
marketing etc.) e dos padrões de ação e reação (ou de causa e efeito) existentes, tais como
elasticidade preço, elasticidade promocional, elasticidade a alterações no produto etc.
A construção de um bom modelo de simulação é um processo difícil e complicado. Um
bom modelo de simulação deve reunir as seguintes características: ser simples o suficiente
para uma fácil compreensão e manipulação dos usuários, ter uma representação razoável do
domínio das implicações existentes no sistema de marketing e ser complexo o suficiente para
representar exatamente o funcionamento do mercado que pretende simular (Chorafas, 1965).
Os modelos de simulação podem ser de três tipos: descritivos, preditivos e prescritivos.
O modelo descritivo é aquele que mostra como o sistema de marketing em estudo está
funcionando. O modelo preditivo é aquele que permite verificar como as variáveis in-
dependentes de marketing do mercado reagem às mudanças nas variáveis dependentes. O
modelo prescritivo é aquele que tem condições de indicar, diante de determinadas situações
de mudanças ambientais que lhe são apresentadas, qual o melhor rumo de ação a ser tomado,
em função das avaliações sobre os possíveis resultados de cada ação que o modelo for capaz
de realizar. Dos três modelos apresentados, o mais fácil de ser construído, embora de menor
utilidade para marketing, é o modelo descritivo, pois apresenta uma situação estática do
mercado e não permite interações; o modelo mais difícil de ser construído, e o mais útil
para marketing, é o modelo prescritivo, mas, justamente por sua dificuldade de construção,
92 Pesquisa de Marketing

ainda é pouco utilizado nessa área; o modelo preditivo apresenta dificuldade intermediária
em sua construção, também é bastante útil em marketing, e, por isso, é o modelo que mais
tem sido utilizado.
A utilização de modelos de simulação em pesquisas de marketing apresenta inúmeras
vantagens sobre outros métodos de pesquisas:
• São mais baratos e rápidos.
• São mais ágeis nas respostas aos problemas de marketing.
• Não expõem os segredos e as estratégias da empresa ao mercado.
• Permitem a avaliação de diversas alternativas e fornecem evidências de qual é a melhor.
• Podem ser continuamente atualizados.
• As diversas estratégias de marketing podem ser avaliadas sem que se corra o risco de sua
avaliação direta no mercado real.
• Podem ser usados como forma de treinamento dos gerentes da empresa, diretamente
envolvidos ou não com as atividades de marketing da empresa (gerentes de marketing, de
produto, de promoção, de distribuição, de pesquisa e desenvolvimento, de produção, de
compras, financeiros etc.), sobre como o mercado da empresa funciona e como as decisões
tomadas em suas respectivas áreas podem afetá-lo.
Os maiores problemas com a utilização de modelos de simulação em marketing dizem
respeito, principalmente, às dificuldades em se construir um modelo que tenha grande validade
em relação à realidade que pretende simular. Em mercados relativamente estáveis, em situações
em que a empresa possui muita informação acumulada sobre o mercado e seus gerentes têm
grande sensibilidade e experiência de como o mercado funciona, os modelos de simulação
funcionam como uma boa fonte de dados em marketing.

Dados disponíveis
Existe uma infinidade de dados úteis para marketing que já foram coletados, tabulados e,
às vezes, até analisados, que estão catalogados à disposição dos interessados e que vão exigir
deles apenas o esforço de dedicar algum tempo na internet, em bibliotecas, nas visitas a órgãos
governamentais, na leitura de jornais e revistas, na consulta de informações padronizadas de
empresas de pesquisas ou na consulta de informações internas da própria empresa.

TIPOS DE DADOS
Dados primários e dados secundários
Os dados em pesquisas de marketing são classificados em dois grandes grupos: dados primários
e dados secundários.
Dados primários são aqueles que não foram antes coletados, estando ainda na posse dos
pesquisados, e que são coletados com o propósito de atender às necessidades específicas da
pesquisa em andamento. As fontes básicas de dados primários são: pesquisado, pessoas que
tenham informações sobre o pesquisado e situações similares.
Dados secundários são aqueles que já foram coletados, tabulados, ordenados e, às vezes, até
analisados, sem o propósito de atender às necessidades da pesquisa em andamento, e que estão
catalogados à disposição dos interessados. As fontes básicas de dados secundários são: a própria
empresa, publicações, governos, instituições não governamentais e serviços padronizados de
informações de marketing.
Tipos, Fontes e Formas de Coleta de Dados 93

Sequência na procura de dados em pesquisas de marketing


É apresentada na Figura 5.1 a sequência dos passos que, normalmente, deve ser seguida na
definição dos dados e das fontes de dados no processo de pesquisa de marketing. É comum
as pessoas imaginarem que a única forma de obter dados em pesquisa de marketing é pelo
levantamento de campo (construção e aplicação de um instrumento de coleta de dados a uma
amostra da população de pesquisa). Na verdade, os levantamentos de campo e outras formas
de coleta de dados primários somente deverão ser usados se outras formas mais rápidas, baratas
e eficientes não conseguirem atender às necessidades de dados da pesquisa. Grande esforço
nos estágios iniciais da pesquisa deverá ser canalizado para tentar descobrir se, ao menos em
parte, os dados necessários já não foram coletados, estando, de alguma forma, disponíveis. Esse
esforço inicial poderá significar grande economia de tempo, dinheiro e esforço na realização
da pesquisa. Serão analisadas, ao longo deste capítulo, todas essas possíveis fontes de dados
secundários e primários.

Figura 5.1  Passos na definição dos dados e das fontes de dados no processo de pesquisa de marketing.

DADOS SECUNDÁRIOS
Duas ferramentas tecnológicas vieram facilitar a pesquisa de dados secundários: a internet e
as bases de dados em CD-ROMs. A internet permite que, dispondo-se de um computador
94 Pesquisa de Marketing

equipado com modem, uma linha telefônica e um provedor de internet, se tenha acesso a um
universo jamais imaginado de informações de todo o mundo. Os CD-ROMs de base de dados
e de publicações, disponíveis nas boas bibliotecas, facilitam, de forma extremamente rápida, a
pesquisa e a localização dos dados publicados em revistas.
A maioria das fontes de dados secundários que será apresentada adiante neste capítulo
possui sites e pode ser acessada pela internet.

Vantagens e desvantagens dos dados secundários


As vantagens da utilização de dados secundários são a economia de tempo, dinheiro e es-
forços. Se os dados necessários para a pesquisa estiverem disponíveis em fontes secundárias e
exigirem apenas o esforço de dedicar algum tempo na internet, em bibliotecas, nas visitas a
órgãos governamentais, a instituições não governamentais, na leitura de jornais e revistas ou
consultas de informações padronizadas de empresas de pesquisas, demandarão apenas alguns
dias para o levantamento e envolverão custos pequenos. Se esses mesmos dados tiverem de
ser obtidos por meio de uma pesquisa de dados primários, os custos, o tempo e os esforços
necessários seriam infinitamente maiores. Consequentemente, não se pode ignorar os dados
secundários; deve-se começar a pesquisa com eles e, somente quando todas as suas possibili-
dades tiverem sido esgotadas ou quando o retorno for muito pobre, passar para a pesquisa de
dados primários. É muito raro que a pesquisa de dados secundários seja suficiente para atender
às necessidades totais da pesquisa, mas, mesmo que isso ocorra, o esforço não será inútil, pois
os dados secundários obtidos poderão contribuir para:
• Estabelecer melhor o problema de pesquisa.
• Sugerir outros métodos já testados e aprovados de coleta dos dados.
• Sugerir outros tipos de dados a serem coletados para se obterem as informações desejadas.
• Servir como fonte comparativa e complementar aos dados primários a serem coletados.
Paralelamente a essas vantagens, existem diversas desvantagens na utilização de dados
secundários. A primeira desvantagem é que, à medida que são coletados com diferentes
objetivos, raramente serão encontrados dados secundários que se ajustem perfeitamente às
necessidades de determinada pesquisa. O grau de ajustamento desses dados depende de seis
fatores: unidade de medida, definição de classes, momento da publicação, abrangência (geo-
gráfica e populacional), confiabilidade e precisão.
Não é raro o pesquisador sentir-se frustrado ao encontrar dados secundários que serviriam
para sua pesquisa, caso não fossem expressos em unidades que não se ajustam à sua necessidade.
Ele pode estar interessado na renda familiar e encontrar dados expressos na renda individual;
pode estar interessado em dados de lojas categorizadas por faturamento e encontrá-los em
lojas categorizadas por área de vendas ou por número de caixas registradoras.
Outra desvantagem dos dados secundários ocorre quando os intervalos de classe da apre-
sentação dos resultados da variável de interesse não coincidem com aqueles que interessariam à
pesquisa. A pesquisa precisa dos consumidores categorizados nos seguintes intervalos de idade:
0 ┤2, 2 ┤5, 5 ┤12, 12 ┤21, 21 ┤35, 35 ┤50 e mais de 50 anos1, e os dados secundários
obtidos categorizam os resultados nos seguintes intervalos: 0 ┤3, 3 ┤10, 10 ┤20, 20 ┤45 e
mais de 45 anos. Apesar de os dados encontrados serem necessários para a pesquisa, sua simples
categorização em classes diferentes pode torná-los inúteis.

1
Significa que o primeiro número não pertence ao intervalo e o último pertence.
Tipos, Fontes e Formas de Coleta de Dados 95

Os dados secundários apresentam uma desvantagem relacionada com o tempo decorrido


entre a coleta dos dados e sua publicação. Dependendo da fonte, o momento da publicação
pode variar de poucos meses (um mês, no caso das pesquisas de auditoria de lojas) até vários
anos (cinco ou mais anos, no caso dos Censos Populacionais do IBGE). O valor dos dados pu-
blicados para marketing decresce à medida que o tempo entre a coleta do dado e sua publicação
cresce. Muitos dados publicados se tornam obsoletos, mantendo apenas o valor histórico, e
não servem para a tomada de decisões em marketing, as quais necessitam, principalmente, de
dados correntes.
É raro encontrar dados secundários cuja abrangência coincida com a da pesquisa tanto em
termos geográficos quanto populacionais.
Finalmente, uma última desvantagem dos dados secundários diz respeito à sua confiabili-
dade. Para poder utilizar dados secundários, o pesquisador precisa verificar sua confiabilidade,
tendo em vista os propósitos de sua pesquisa. Porém, uma grande limitação dos dados secun-
dários está na dificuldade de se avaliarem confiabilidade e precisão. Inúmeras são as fontes
de erros em pesquisas de marketing, e esses erros tanto podem ter origem no processo de
amostragem quanto durante a realização das diversas etapas e fases da pesquisa. Quando o
pesquisador realiza uma pesquisa de dados primários, tem grande controle sobre esses erros,
o que não ocorre quando se utilizam dados secundários. Para apurar a confiabilidade dos
dados secundários, existem os seguintes critérios: fonte, propósitos da publicação e evidências
de qualidade.
A fonte dos dados é muito importante para avaliar sua confiabilidade. Existem fontes
originais e fontes reprodutoras de dados secundários. Uma fonte original é aquela que efeti-
vamente produziu os dados secundários. Uma fonte reprodutora é aquela que apenas reproduz
os dados de uma fonte original. O pesquisador deve sempre preferir as fontes originais, pois
são mais completas e precisas que as fontes reprodutoras e, geralmente, apresentam informa-
ções importantes sobre o processo de coleta e de análise que permitem uma avaliação de sua
confiabilidade. Além disso, há o risco de os dados serem reproduzidos de forma errônea pelas
fontes no processo de coligi-los das fontes originais.
Avaliar os propósitos da publicação é a segunda forma de se avaliar a confiabilidade dos
dados. Publicações são utilizadas para os mais diversos propósitos: divulgar estudos e conhe-
cimentos, despertar o interesse de determinado grupo empresarial, promover vendas, formar
opiniões, ganhar simpatias, favorecer grupos políticos e empresariais, atacar ou defender
governos e homens públicos etc. Todo tipo de dado secundário encontrado em publicações
“suspeitas” quanto à sua neutralidade precisa ser devidamente verificado e confirmado, antes de
ser utilizado. A probabilidade de esses dados estarem adulterados ou distorcidos para defender
certas posições é muito grande.2
A última forma de se avaliarem a confiabilidade e a precisão consiste em verificar as
evidências de qualidade dos dados secundários. Um primeiro aspecto dessa evidência está
relacionado com a credibilidade da fonte. Existem empresas e entidades, governamentais
ou não, que, ao longo de sua existência, foram adquirindo credibilidade pela qualidade e
seriedade de seus trabalhos, enquanto outras caminharam em sentido inverso ou são ainda
muito recentes e não conseguiram notoriedade. O pesquisador deverá sempre preferir as

2
Sobre essa problemática, recomenda-se a leitura do livro de Cynthia Crossen. O fundo falso das pesquisas: a ciência
das verdades distorcidas. Rio de Janeiro: Revan, 1996.
96 Pesquisa de Marketing

fontes cujas qualidade e seriedade sejam inquestionáveis. Outra forma de efetuar essa avaliação
consiste em conhecer o perfil profissional de seus técnicos e responsáveis. Por outro lado, se a
fonte original dos dados não apresenta o essencial do planejamento da pesquisa que per-
mita a avaliação de sua confiabilidade e de sua precisão, o pesquisador deverá ficar cauteloso.
Espera-se que uma fonte que deseja que seu trabalho tenha credibilidade apresente os
resultados de uma pesquisa acompanhados de definições, formulários de coleta de dados,
método de amostragem, número de elementos da amostra, níveis de erro e de confiabilidade
(quando a amostra for probabilística), processos de análises a que os dados foram submetidos
etc. Omissões desse tipo podem significar que os dados foram obtidos numa pesquisa mal
conduzida e, por isso, devem ser evitados.

Fontes de dados secundários


Existem diversas fontes de dados secundários em pesquisas de marketing. Essas fontes, já
apresentadas na Figura 5.1, serão descritas a seguir.
Dados secundários internos – Os dados obtidos junto à empresa para a qual está sendo
realizada a pesquisa são chamados de dados internos. Se forem coletados, exclusivamente, para
atender às necessidades específicas dessa pesquisa, são chamados de dados primários internos.
Se já foram coletados e catalogados com outros objetivos e estão disponíveis para consulta,
são chamados de dados secundários internos.
Todas as empresas coletam, normalmente, uma infinidade de dados internos destinados a
atividades de controle ou para atender às exigências fiscais, como: vendas em R$ e em unidades
por região/tipo de consumidor/tipo de distribuição, gastos em propaganda e promoção de
vendas por linha de produtos, custos de distribuição, lucro por linha de produto, relatórios
de produção, relatórios de estoques etc. Dependendo dos objetivos da pesquisa, esses dados
internos podem ser de muita utilidade. Por exemplo, se o pesquisador desejar estabelecer uma
correlação entre as despesas com comunicação de marketing e as vendas de um produto es-
pecífico da empresa, a disponibilidade dessas informações será fundamental.
As vantagens dos dados secundários internos são sua disponibilidade e o baixo custo.
Infelizmente, o problema é que muitas empresas não coletam ou não armazenam dados
secundários internos em nível suficiente de detalhes para atender às necessidades de pesquisas
de marketing. Quanto mais detalhado for o registro dos dados, melhor será para as pesquisas.
No entanto, como os sistemas são montados para atender a outros objetivos, nem sempre es-
sas necessidades são plenamente atendidas. Para resolver esse problema, as empresas deveriam
reformular seus sistemas internos de informação, a fim de moldá-los para atender, também, às
necessidades de marketing e de pesquisas de marketing.
Publicações – Existe uma infinidade de publicações dos mais diversos tipos que podem
trazer valiosas contribuições para diferentes tipos de pesquisas de marketing.
No Quadro 5.1 são apresentados exemplos de fontes de dados secundários em jornais e
revistas.
Governos – Mesmo quando alguma informação coletada por instituições governamentais
não é publicada, vale a pena o esforço de se dirigir diretamente à instituição responsável para
ter acesso aos dados. No Quadro 5.2, são apresentadas as fontes de dados governamentais,
com seus respectivos sites.
No Quadro 5.3, é apresentado o conteúdo das informações que constam do site do IBGE
www.ibge.com.br.
Tipos, Fontes e Formas de Coleta de Dados 97

Quadro 5.1  Fontes de dados secundários: jornais e revistas


Jornais Sites
São Paulo
Diário do Comércio e Indústria www.dci.com.br
Diário de S. Paulo www.diariosp.com.br
Diário do Grande ABC www.dgabc.com.br
Folha de S. Paulo www.folhaonline.com.br
Gazeta Mercantil www.gazetamercantil.com.br
O Estado de S. Paulo www.estadao.com.br
Valor Econômico www.valor.com.br
Rio de Janeiro
Jornal do Brasil (só on-line) www.jb.com.br
O Globo www.globo.com (1)
O Dia www.odia.ig.com
Pernambuco
Diário de Pernambuco www.diariodepernambuco.com.br
Jornal do Comércio www.jconline.com.br
Rio Grande do Sul
Correio do Povo www.correiodopovo.com.br
Jornal do Comércio www.jcrs.uol.com.br
Zero Hora www.clirbs.com.br/jornais/zerohora
Distrito Federal
Correio Braziliense www.correiobraziliense.com.br
Jornal de Brasília www.jornaldebrasilia.com.br
Minas Gerais
O Estado de Minas www.estaminas.com.br
Folha da Manhã www.folhadamanha.com.br
Santa Catarina
Diário Catarinense www.diariocatarinense.com.br
Bahia
A Tarde www.atardeonline.com.br
Revistas Sites
Exame www.exame.com.br
Veja www.veja.com.br
Época www.epoca.com.br
Isto é www.istoe.com.br
Quatro Rodas www.quatrorodas.abril.com.br
Duas Rodas www.revistaduasrodas.com.br
Globo Rural www.revistagloborural.globo.com
Pequenas Empresas & Grandes Negócios www.pegn.globo.com
Marketing www.marketing.com.br
Propaganda www.revistapropaganda.com.br
Marketing Cultural www.marketingcultural.com.br
RAUSP – Revista de Administração www.fia.com.br
ERA – Revista de Adm.de Empresas da GV www.fgv.com.br
Gestão & Regionalidade www.uscs.edu.br/revistasacademicas
Conjuntura Econômica www.fipe.com.br
 elo site www.globo.com podem ser acessadas diversas mídias do Sistema Globo: TV Globo, Globonews, Globo on-line,
(1) P
Época, Diário de São Paulo, CBN, Globo Rural, Pequenas Empresas Grandes Negócios, Galileu, Auto Esporte, Marie Claire,
Criativa, Crescer, Casa e Jardim, e noticiosos da TV Globo.
98 Pesquisa de Marketing

Quadro 5.2  Fontes governamentais de dados secundários


Fonte/Instituição Site Tipo de dado secundário
Banco Central do Brasil www.bcb.gov.br Contas nacionais
Instituto Brasileiro de Geografia www.ibge.com.br Dados demográficos/
e Estatística (IBGE) econômicos/censo do
comércio/ Pesquisa
Nacional por Amostra de
Domicílios (PNAD)
Instituto de Pesquisas Econômicas e www.ipea.gov.br Pesquisas sociais
Sociais (IPEA)
Empresa Brasileira de Infraestrutura www.infraero.gov.br Estatísticas sobre
Aeroportuária (Infraero) movimento aeroportuário
Fundação Sistema Estadual de Análise www.seade.gov.br Dados demográficos e
de Dados (Seade) econômicos do Estado de
São Paulo
Instituto Nacional de Estudos www.inep.gov.br Estatísticas de educação
e Pesquisas Educacionais (Inep)
Instituto Nacional de Previdência www.inss.gov.br Estatísticas de previdência
Social (INSS)
Agência Nacional do Petróleo (ANP) www.anp.gov.br Estatísticas de combustíveis
de petróleo
Agência Nacional de www.anatel.gov.br Estatísticas de
Telecomunicações (Anatel) telecomunicações
Agência Nacional de Energia Elétrica www.aneel.gov.br Estatísticas de eletricidade
(Aneel)
Agência Nacional de Saúde (ANS) www.ans.gov.br Estatísticas de saúde,
pública e privada
Empresa Brasileira de Turismo www.embratur.gov.br Estatísticas de turismo
(Embratur)
Empresa Brasileira de Agropecuária www.embrapa.gov.br Tecnologia agropecuária
(Embrapa)
Centrais Elétricas Brasileiras S.A. www.eletrobras.com.br Dados sobre o sistema
(Eletrobras) elétrico
Ministério da Agricultura www.agricultura.gov.br Estatísticas agropecuárias
Ministério da Saúde www.saude.gov.br Estatísticas de saúde
Ministério da Fazenda www.fazenda.gov.br Estatísticas das contas
nacionais
Ministério das Minas e Energia www.mme.gov.br Estatísticas de energia
Ministério da Previdência Social www.previdencia.gov.br Estatísticas de previdência
Ministério das Relações Exteriores www.itamaraty.gov.br Estatísticas de comércio
exterior
Ministério dos Transportes www.transportes.gov.br Estatísticas de transportes
Ministério do Turismo www.turismo.gov.br Estatísticas de turismo
Tipos, Fontes e Formas de Coleta de Dados 99

Quadro 5.3  Conteúdo das informações no site do IBGE www.ibge.com.br


Indicadores
Trabalho e Rendimento
• Pesquisa Mensal de Emprego - PME
• Pesquisa Mensal de Emprego - PME (Antiga Metodologia)
Agropecuária
• Pesquisa Estoques
• Produção Agrícola
• Produção Pecuária
Indústria
• Índices Especiais de Produção Física
• Bens de Capital
• Categoria de Uso por Atividade
• Classificação Compatível com a PIMES
• Difusão
• Eletrodomésticos
• Embalagens
• Intensidade do Gasto com Energia Elétrica
• Intensidade Exportadora
• Pesquisa Industrial Mensal de Emprego e Salário - PIMES
• Pesquisa Industrial Mensal - Produção Física PIM-PF
• Agroindústria
• Brasil
• Regional
Comércio
• Pesquisa Mensal de Comércio - PMC
Índices, Preços e Custos
• Harmonização dos Índices de Preços ao Consumidor dos países do MERCOSUL e Chile
• IPA (Índice de Preços ao Produtor Amplo)
• IPP (Índice de Preços ao Produtor)
• Programa de Comparação Internacional
• SINAPI (Construção Civil)
• SNIPC (Preços ao Consumidor)
• IPCA - INPC
• IPCA - E
• IPCA - 15
Contas Nacionais Trimestrais
• Contas Nacionais Trimestrais
População
Indicadores Sociais
• Intermediação política
• Crianças e Adolescentes
• Educação e Trabalho
• Mortalidade Infantil
• Indicadores Sociais Mínimos
• Mercado de Trabalho

(Continua)
100 Pesquisa de Marketing

Quadro 5.3  Conteúdo das informações no site do IBGE www.ibge.com.br (cont.)


População
• Mobilidade Social
• População Jovem
• Síntese de Indicadores Sociais
• Indicadores Culturais
• Indicadores Sociodemográficos e de Saúde
Censos Demográficos
• Censo 2010
• Censo 2000
Contagem da População
População Indígena
Estatísticas do Registro Civil
PNAD
• Pesquisa Nacional por Amostra de Domicílios
• Suplementos
• Pesquisas especiais
Pesquisa de Orçamentos Familiares
• 2008-2009
• 2002-2003
Tábuas Completas de Mortalidade
Projeção da População
Estimativas de População
Atlas de Saneamento
Economia Informal Urbana
Assistência Médico-Sanitária
Saneamento Básico
Sindicatos: Indicadores Sociais
Pesquisa de Esporte
Reflexões sobre os Deslocamentos Populacionais no Brasil
Características Étnico-raciais da População
PeNSE
• Pesquisa Nacional de Saúde do Escolar
• Avaliação do estado nutricional dos escolares do 9° ano do ensino fundamental
Economia
Indústria
• Indústria da Construção - PAIC
• Pesquisa Industrial Anual
• PIA Empresa
• PIA Produto
Serviços
• Meios de Hospedagem
• Pesquisa Anual de Serviços - PAS
• Pesquisa Anual de Serviços - Produtos e Serviços
• Pesquisa de Serviços de Publicidade e Promoção
• Pesquisa de Serviços de Tecnologia da Informação 2009
• Pesquisa de Serviços de Hospedagem
Tipos, Fontes e Formas de Coleta de Dados 101

Quadro 5.3  Conteúdo das informações no site do IBGE www.ibge.com.br (cont.)


Economia
Assistência Social Privada sem Fins Lucrativos
Agropecuária
• Censo Agropecuário
• Café (Paraná)
• Flores e Plantas Ornamentais
• Indicadores Agropecuários
• Safras
• Produção Agrícola Municipal
• Cereais, Leguminosas e Oleaginosas
• PAM
• Extração Vegetal e Silvicultura - PEVS
• Pecuária Municipal - PPM
• Agrotóxicos (Paraná)
As Micro e Pequenas Empresas
Demografia das Empresas
Cadastros e Classificações Econômicas
• Classificação Nacional de Atividades Econômicas 2.0
• Classificação Nacional de Atividades Econômicas - Subclasses para Uso da Administração
Pública 2.0
• Lista de Produtos da Agropecuária e Pesca - PRODLIST : Agro/Pesca
• Lista de Produtos da Indústria - PRODLIST : Indústria
Comércio
• Pesquisa Anual de Comércio - PAC
Inovação e Empreendedorismo
• Pesquisa de Inovação Tecnológica -PINTEC
• Pesquisa de Inovação nas Empresas Estatais Federais
• Estatísticas de Empreendedorismo
Sistema de Contas Nacionais
• Conta Financeira e Conta de Patrimônio Financeiro
• Contas Nacionais
• Contas Regionais
• Conta-Satélite de Saúde
• Economia do Turismo
• Matriz de Insumo-produto
• Produto Interno Bruto dos Municípios
Estatísticas do Cadastro Central de Empresas
Finanças Públicas do Brasil
As Fundações Privadas e Associações sem Fins Lucrativos
O Setor de Tecnologia da Informação e Comunicação no Brasil
Pesquisa sobre o Uso das Tecnologias de Informação e Comunicação nas Empresas

(Continua)
102 Pesquisa de Marketing

Quadro 5.3  Conteúdo das informações no site do IBGE www.ibge.com.br (cont.)


Geociências
Área Territorial Oficial
Cartografia
• Mapeamento Topográfico
• Mapeamento das Unidades Territoriais
• Mapeamento Geográfico
• Publicações
Geodésia
• Posicionamento por Ponto Preciso (PPP)
• Sistema Geodésico Brasileiro (SGB)
• Rede Brasileira de Monitoramento Contínuo dos Sistemas GNSS (RBMC)
• Rede Maregráfica Permanente para Geodésia (RMPG)
• Sistema de Referência Geocêntrico para as Américas (SIRGAS)
• Projeto Mudança do Referencial Geodésico (PMRG)
• Documentação
• Especificações e Normas
• Homologação de Marcos
Geografia
• Divisão Regional
• Áreas Especiais
• Faixa de Fronteira
• Zona Costeira
• Atlas
• Regiões de Influência das Cidades
Recursos Naturais
• Publicações
• Fauna e Flora
• Uso da Terra
• Sistematização
• Recursos Hídricos
Canais
Banco de Dados
• BME
• Séries Estatísticas
• Cidades@
• Estados@
• Países@
• Mapas
• Pesquisa de Informações Básicas Estaduais - Estadic
• Pesquisa de Informações Básicas Municipais - Munic
• SIDRA
• Metadados
• Banco de Nomes Geográficos do Brasil
Canais temáticos
• Brasil em Síntese
• IBGE - 7 a 12
Tipos, Fontes e Formas de Coleta de Dados 103

Quadro 5.3  Conteúdo das informações no site do IBGE www.ibge.com.br (cont.)


Canais
• IBGE teen
• Vamos Contar
Produtos e Serviços
• Biblioteca
• Loja Virtual
• IBGE modo texto
• Questionários Eletrônicos
Conteúdo Histórico
• Brasil - 500 anos de povoamento
• Estatísticas do século XX
• Memória Institucional
Projetos e Entidades
• Censo 2010
• Comitê de Estatísticas Sociais
• Classificações Estatísticas/ CONCLA
• Projeto Comissão-Europeia Mercosul em Matéria Estatística II
• CONCAR
• INDE
• CONFEST/CONFEGE
• CP IDEA
• ENCE
• Estudo da Modalidade de Censo Demográfico Contínuo - EMCDC
• Reformulação das Pesquisas Domiciliares Amostrais do IBGE
• Projeto de Reformulação das Pesquisas Agropecuárias do IBGE
• BRICS
IBGE Interativo
• Redes sociais
• Multimídia
• Fóruns do IBGE
Artigos e Apresentações
• Artigos e Publicações
Eventos
• Workshop de ferramentas digitais

Instituições não governamentais – Analogamente, existem muitas instituições não


governamentais, como: universidades, faculdades e centros de pesquisas ou federações, associa-
ções e sindicatos patronais e de empregados, que estão, constantemente, captando dados e
produzindo valiosas informações que não são publicadas. Aqui, também, vale o esforço de se
dirigir diretamente à instituição responsável para tentar conseguir os dados. No Quadro 5.4, são
apresentadas as fontes de dados de instituições não governamentais com seus respectivos sites.
Serviços padronizados de informações de marketing – Existem muitos serviços
padronizados de informação de marketing disponíveis como mais uma fonte de dados secun-
dários. Os serviços padronizados de informações de marketing têm um custo de obtenção
mais elevado do que as outras fontes vistas até agora, porém são muito menos dispendiosos
do que se fossem obtidos por meio de uma pesquisa de dados primários, pois os custos para
104 Pesquisa de Marketing

Quadro 5.4  Exemplos de fontes de dados secundários em instituições não governamentais


Fonte Site Tipo de dado secundário
FIESP/CIESP www.fiesp.com.br Estatísticas gerais da indústria
Associação Nacional dos Fabricantes www.anfavea.com.br Estatísticas sobre a indústria
de Veículos Automotivos (Anfavea) automobilística
Sindicato Nacional das Indústrias de www.sindipecas.org.br Estatísticas sobre a indústria
Autopeças (Sindipeças) de autopeças
Departamento Intersindical www.dieese.org.br Índice de desemprego nas
de Estatística e Estudos regiões metropolitanas
Socioeconômicos (Dieese)
Associação Brasileira de www.abrasnet.com.br Informações sobre o setor
Supermercados (Abras) de supermercados no Brasil
Associação Paulista de www.apas.com.br Informações sobre o setor
Supermercados (Apas) supermercadista no Estado
de São Paulo
Associação Brasileira dos Fabricantes www.abraciclo.com.br Estatística sobre a indústria
de Motonetas, Motocicletas, de motonetas, motocicletas e
Bicicletas e Similares (Abraciclo) bicicletas no Brasil
Associação Brasileira dos Agentes de www.abav.com.br Informações sobre o setor
Viagens (Abav) de turismo no Brasil

sua obtenção são rateados entre todos os compradores desse serviço da empresa produtora.
Procura-se, nesse item, descrever alguns dos principais tipos e fontes de serviços padronizados
de informação de marketing disponíveis no Brasil. A descrição a seguir procura apenas ser
exemplificativa; não é extensiva nem pretende ser exaustiva, tendo em vista as dificuldades de
se obterem informações mais detalhadas das empresas prestadoras dos serviços, bem como das
constantes mudanças que ocorrem no leque de empresas e de produtos oferecidos.
Consulte o site www.abep.org para verificar as empresas associadas à Associação Brasileira
de Empresas de Pesquisa e seus respectivos serviços.
Os dados dos serviços padronizados de informações de marketing podem ser classificados
em: do consumidor, do varejo, do atacado, da indústria e dos meios de comunicação.
Dados do consumidor – Este serviço compreende a coleta periódica, de um painel de consumi-
dores, de dados a respeito de compras e das circunstâncias a respeito de como foram realizadas.
No Brasil, a Ipsos-Marplan www.ipsos-marplan.com.br oferece um painel de dados de
consumidores com as seguintes características:
Estudos Marplan (está na 43ª edição) – Estudo contínuo dos hábitos de mídia (revistas,
jornais, TV, rádio, internet, cinema e teatro) e de consumo de uma infinidade de produtos.
É realizado com amostras de consumidores em treze mercados: São Paulo, Rio de Janeiro,
Belo Horizonte, Recife, Porto Alegre, Salvador, Curitiba, Belém, Fortaleza, Brasília/DF,
Baixada Santista, Londrina e Campinas. São realizadas, anualmente, mais de 61.000 entrevis-
tas. Por meio de softwares exclusivos, os assinantes do serviço têm rápido acesso ao banco
de dados de mídia e de mais de 1.700 informações de consumo dos mercados pesquisados.
Dados do varejo – Este serviço compreende a coleta bimensal de dados sobre compras
e níveis de estoques (na área de vendas e no depósito) de amostras nacionais de lojas dos
principais mercados brasileiros de vários produtos.
O procedimento utilizado, chamado de auditoria de loja, é muito simples. No período de
levantamento, a empresa responsável pelo serviço envia seus funcionários às lojas da amostra onde
Tipos, Fontes e Formas de Coleta de Dados 105

são levantados, numa ficha apropriada, para cada item de produto que faz parte do rol de itens
levantados, as compras efetuadas entre uma visita e outra e os níveis de estoques no dia da visita. Esses
dados são levados ao escritório, onde são tabulados conforme o seguinte princípio de contabilidade:

Estoque inicial + compras − estoque final = vendas


As vendas de cada produto, em cada loja, são consolidadas para toda a amostra e extrapo-
ladas para todo o universo de lojas, o que permitirá à empresa prestadora de serviços enviar,
bimensalmente, a seus clientes assinantes do serviço as seguintes informações sobre os itens
pesquisados da empresa e de seus concorrentes, no total e por tipo de canal de distribuição:
• Volume de vendas aos consumidores finais em unidades e R$.
• Participação de mercado na venda aos consumidores finais.
• Venda média mensal por loja em unidades.
• Compras efetuadas pelos varejistas em unidades.
• Participação nas compras efetuadas pelos varejistas.
• Compra média mensal por loja em unidades.
• Estoques no varejo em unidades.
• Participações nos estoques do varejo.
• Estoque.
• Número de dias de suprimento.
• Índices de lojas negociantes do produto.
• Índices de lojas sem estoques.
• Estoque médio por loja em unidades.
• Preços de aquisição e de venda.
• Total das vendas de alimentos.
• Índices de distribuição numérica e qualificada.
Os relatórios bimensais são encaminhados em arquivos eletrônicos aos clientes 30 dias após
o período de coleta. Após uma ou duas semanas de seu encaminhamento, são apresentados
e discutidos oralmente numa reunião pré-agendada com os diversos gerentes das áreas de
marketing e vendas do cliente. A empresa que realiza essa pesquisa fornece também um software
que permite o reprocessamento dos dados conforme as necessidades dos clientes.
Esse serviço é oferecido no Brasil pela ACNielsen www.acnielsen.com.br. As informações
obtidas são disponibilizadas no site da empresa, que tem por política não fornecer nenhuma
informação adicional à do site. No Quadro 5.5, está uma descrição do Índice Nielsen de Varejo.
Dados sobre os meios de comunicação – Os serviços de informações de marketing sobre
os veículos de comunicação no Brasil apresentam uma gama de informações disponíveis
abundantes quando comparados aos outros serviços.
Os serviços e as empresas que os oferecem no Brasil são:
• Dados de audiência de TV – Apresentam os índices de audiência bruta e qualificada da
TV comercial (aberta). Esse serviço é oferecido no Brasil pelo IBOPE (www.ibope.com.
br), que utiliza o procedimento descrito no Quadro 5.6.
• Dados sobre a circulação paga de jornais e revistas – Este serviço, por meio de sistemas de
auditoria, levanta a efetividade da circulação paga em número de exemplares por edição
de um grande número de jornais e revistas brasileiros. A instituição que oferece este serviço
é o Instituto para a Verificação da Circulação - IVC www.ivc.org.br. O que o serviço do
IVC compreende está descrito no Quadro 5.7.
106 Pesquisa de Marketing

Quadro 5.5  Índice Nielsen de Varejo

Abrangência
“As informações do índice ACNielsen de Varejo são fornecidas por área e tipo de loja, para
o mercado total, segmento e marca, de acordo com o universo de lojas auditadas pela
ACNielsen no país. Por isso, o índice ACNielsen de Varejo é apresentado de várias formas, que
buscam atender às necessidades do mercado.
A ACNielsen audita oito índices, sendo que eles se diferenciam pela abrangência
de canais:
• Alimentar – Inclui supermercados, bares, mercearias, lojas de conveniência, mercearias/
quitandas, padarias/leiterias, armazéns, empórios.
• Farmacosméticos – Inclui farmácias, drogarias e perfumarias.
• Bar – Inclui adegas, bares e cafés, bares e lanches, bares e restaurantes, botecos, res-
taurantes e lanchonetes, botequins, snacks.
• Bebida alcoólica – Inclui lojas do índice ACNielsen Alimentar e Bar, hotéis, restaurantes e
casas noturnas.
• Papelarias – Inclui autosserviços de dez e mais check-outs, papelarias, livrarias, bazares,
lojas de armarinho e copiadoras.
• Refrigerantes e cerveja – Inclui lojas do índice ACNielsen Alimentar e Bar, hotéis, restaurantes
e casas noturnas, podendo ser reportado por franquias.
• Cigarro – Inclui lojas do índice ACNielsen Alimentar e Bar, hotéis, restaurantes e casas
noturnas.
• Sorvete – Inclui lojas do índice ACNielsen Alimentar e Bar.

Cobertura geográfica
Para reportar a informação das áreas cobertas, o país é dividido em sete grandes regiões que
se denominam ‘Áreas ACNielsen’. Essas regiões são selecionadas por: população, volume de
negócios e custo/benefício. A amostra abrange 86% da população brasileira, representando
92% do potencial de consumo. Essas áreas são:
• Área I – Ceará, Rio Grande do Norte, Paraíba, Pernambuco, Alagoas, Bahia e
Sergipe.
• Área II – Minas Gerais, Espírito Santo, interior do Rio de Janeiro (excluindo-se os municípios
contidos na Área III).
• Área III – Grande Rio de Janeiro: Rio de Janeiro, Niterói, Nova Iguaçu, Duque de Caxias,
Nilópolis, São Gonçalo e São João de Meriti.
• Área IV – Grande São Paulo: São Paulo, Santo André, São Bernardo do Campo, São Caetano
do Sul, Diadema, Mauá, Guarulhos, Osasco, Embu e Taboão da Serra.
• Área V – Interior de São Paulo (excluindo-se os municípios contidos na Área IV).
• Área VI – Paraná, Santa Catarina e Rio Grande do Sul.
• Área VII – Brasília, Mato Grosso do Sul e Goiás.
• Capitais Norte – Teresina, São Luís, Belém e Manaus (opcional).”
Fonte: www.acnielsen.com.br
Tipos, Fontes e Formas de Coleta de Dados 107

Quadro 5.6  Sistema de pesquisa de audiência de TV do IBOPE

A partir de dados demográficos e socioeconômicos, o IBOPE seleciona uma amostra de do-


micílios que representam a população a ser pesquisada: de ambos os sexos, mais de 4 anos
de idade, residir em áreas urbanas e fazer parte das classes A, B, C, D ou E (Critério de Clas-
sificação Econômica Brasil).
Os moradores desses domicílios são convidados a participar da pesquisa e, concordando,
passam a integrar o Painel de Televisão e têm aparelhos people meter instalados em até quatro
televisores da família.
O people meter registra o status do televisor, isto é, se está ligado ou desligado. No primeiro
caso, o aparelho identifica automaticamente o canal sintonizado. Cada morador da casa,
por sua vez, por meio de um controle remoto ou dos botões que estão no painel do próprio
aparelho (meter), registra sua presença em frente à TV.
Para a Grande São Paulo, os dados são transmitidos para a Central DataIBOPE, minuto a
minuto (realtime), através de radiofrequência e linha telefônica. Já no mercado do Grande
Rio de Janeiro, os dados são enviados à noite (overnight) através de modem.
Nos demais mercados/praças (Grande Belo Horizonte, Grande Brasília, Grande Curitiba,
Grande Porto Alegre, Grande Recife e Grande Salvador), a coleta também é diária, feita no
dia seguinte à medição.
Da Central DataIBOPE, informações são enviadas minuto a minuto para os clientes do
IBOPE e processadas para o envio posterior e geração de outros produtos e serviços.
No Brasil, há 3.019 domicílios com people meter:

Grande São Paulo 750


Grande Rio de Janeiro 450
Grande Porto Alegre 250
Grande Curitiba 250
Grande Belo Horizonte 250
Grande Salvador 250
Grande Recife 250
Grande Brasília 250
Outras cidades 319

A pesquisa de audiência de TV também é realizada em Fortaleza e Florianópolis, com


metodologia Painel (280 domicílios em cada cidade). Os colaboradores registram as in-
formações sobre a emissora e o horário que assistiu em cadernos diários. São formulários
estruturados para preenchimento de audiência de televisão de cada um dos integrantes
do domicílio. Os cadernos são recolhidos semanalmente e submetidos a uma leitura
ótica, para que as informações alimentem o banco de dados e possam ser processadas
posteriormente.
Para fazer o Painel Nacional de TV, também são realizadas duas coletas por semana, en-
tretanto, para o Estado de Minas Gerais como um todo (excluindo-se o mercado da Grande
Belo Horizonte), realiza-se apenas uma coleta por semana.
Fonte: IBOPE, em atendimento à solicitação do Autor.
108 Pesquisa de Marketing

Quadro 5.7  Sistema IVC de verificação de circulação paga de jornais e revistas

Toda publicação que desejar ingressar no Instituto deve aceitar publicidade competitiva a preços cons-
tantes de tabelas públicas, e poderá, a partir de sua primeira edição, pedir filiação, permanecendo nessa
condição por um período de três meses.
Em seguida, o IVC realizará supervisão na organização da empresa, para constatar se está em
condições de atender às exigências dos Estatutos e Normas do Instituto. Se tudo estiver em ordem, o
editor deverá preencher um formulário fornecido pelo instituto, intitulado Pedido de Filiação.
A seguir, a equipe de auditores do instituto iniciará os trabalhos de verificação dos dados de circulação,
correspondentes a um mês do calendário (o mais próximo possível), e emitirá um relatório de auditoria que,
após apresentado, aprovado e divulgado pelo IVC, tornará oficial o ingresso da publicação no quadro de filiados.
Antes disso, nenhum editor poderá fazer qualquer referência ao IVC ou à sua solicitação de filiação,
sob pena de indeferimento do pedido.
A partir da divulgação do relatório inicial de Auditoria (Auditoria Prévia), a publicação terá a res-
ponsabilidade de entregar periodicamente ao IVC, dentro dos prazos previstos, a sua Informação Jurada
contendo dados da circulação líquida, a qual, uma vez conferida, será distribuída a todos os associados,
em disquete ou impresso.
Semestralmente, o IVC programa e executa as comprovações da circulação líquida dos veículos
filiados, de modo a não deixar nenhum período sem auditoria.
Tais comprovações abrangem documentos, registros estatísticos e contábeis a respeito de:
• Apurações industriais – Matéria-prima (aquisição – estoque – consumo), papel em bobina ou resma, tintas.
• Produção – Pedido de tiragem, boletins de tiragem ou máquina, boletins de aplicação de tiragem.
• Vendas – Venda avulsa – cidade sede, venda avulsa – interior e exterior, assinaturas – cidade-sede,
assinaturas – interior e exterior, aparas – encalhes – sabugos – capas – papel sujo etc.
• Distribuição grátis, exemplares não distribuídos ou inutilizados.
• Distribuição e expedição – Venda avulsa e assinaturas, frota e outros meios de distribuição na
cidade-sede, conhecimento dos transportes aéreos, ferroviários, marítimos, ou rodoviários, para
interior e exterior, guia de franquia postal, guias de expedição ou de malas postais, cadernos de
repartes ou mapas de expedição.
• Apuração de vendas:
• Contagem física de exemplares nas gráficas no ato de conclusão da produção e mediante a
apresentação das respectivas notas fiscais, verificação no caso de praças diversas sobre venda
avulsa e assinaturas.
• As empresas filiadas que não possuírem oficinas próprias deverão exigir da gráfica impressora todos
os elementos comprobatórios necessários, bem como comprovar o faturamento da impressão.
• Os elementos acima são extensivos aos jornais e revistas de circulação paga.
• As publicações de circulação controlada estão enquadradas nas regras específicas.
• O IVC poderá solicitar dos editores todo e qualquer documento e registro contábil, desde que
necessário à comprovação das apurações.
• Fora as comprovações acima o IVC mantém um serviço de controle das publicações, bem como
de amostragem junto aos vendedores, distribuidores, assinantes etc., objetivando conferir maior
autenticidade às apurações.
A diferença máxima admitida pelo IVC entre os dados de circulação apresentados nas Informações
Juradas do editor e o resultado da auditoria é de 4%. Acima desse percentual, o editor será advertido,
e seu Relatório de Auditoria, divulgado entre todos os associados.
Além da emissão de circulares de interesse de todos os associados, mensalmente são divulgados
os dados de circulação pelo website do IVC.

Fonte: www.ivc.org.br
Tipos, Fontes e Formas de Coleta de Dados 109

DADOS PRIMÁRIOS
Conforme já visto neste capítulo, dados primários são aqueles que não foram antes coletados,
estando ainda na posse dos pesquisados, e que são coletados com o propósito de atender às
necessidades específicas da pesquisa em andamento.
Tipos de dados primários geralmente coletados
Os dados coletados podem ser: características demográficas, socioeconômicas e de estilo de
vida; atitudes e opiniões; conscientização e conhecimento; motivações; comportamento pas-
sado e presente; e intenções. A seguir, apresenta-se cada um desses tipos de dados primários.
Características demográficas, socioeconômicas e de estilo de vida – Um tipo de
dado de grande importância para marketing é aquele relativo às características demográficas,
socioeconômicas e de estilo de vida dos respondentes, tais como: sexo, idade, nível educacional,
estado civil, número de filhos, renda, ocupação, bens e produtos possuídos etc. Com esses dados
em mãos, o pesquisador pode elaborar tabulações cruzadas que lhe permitirão identificar o
relacionamento entre essas variáveis e as opiniões e os hábitos dos consumidores em relação
ao produto pesquisado. Poderá também fazer uma análise inversa e, por meio da tabulação
cruzada, identificar e caracterizar o perfil do consumidor típico de determinado produto. Essas
variáveis são tipicamente utilizadas no processo de segmentação de mercado.
Algumas dessas variáveis são facilmente obtidas durante uma pesquisa. São elas: sexo, nível
educacional, estado civil. Outras, contudo, como nível socioeconômico e estilo de vida, são de
obtenção imperfeita, pois se tratam de medidas relativas e não absolutas do indivíduo perante
a sociedade da qual faz parte.
Informações sobre o nível socioeconômico de pesquisados devem ser obtidas recorrendo-se
a sistemas já estabelecidos e praticados pelo mercado. No Brasil, o sistema usual é o Critério
de Classificação Econômica Brasil - CCEB, ou simplesmente Critério Brasil, da Associação
Brasileira de Empresas de Pesquisa - ABEP, que visa estimar o poder de compra das pessoas e
famílias urbanas. O Critério Brasil, com suas variáveis e indicadores componentes, bem como
a forma de aplicação, pode ser acessado no site www.abep.org.
Outra forma de descrever os respondentes é pelo seu estilo de vida, definido como um modo
diferenciado de viver de uma sociedade ou de seus segmentos. A descrição dos consumidores,
segundo seu estilo de vida, envolve o levantamento de informações sobre suas atividades, seus in-
teresses e suas opiniões, além das características demográficas e psicográficas. O Quadro 5.8 apresenta
uma lista das atividades, dos interesses e das opiniões geralmente levantados para se determinar o
estilo de vida, chamada de itens A-I-O.
O perfil psicográfico das pessoas está intimamente relacionado com o conceito de es-
tilo de vida e, consequentemente, com o que estão predispostas a adquirir em termos de
produtos e serviços, se suas condições econômicas assim o permitirem. Por isso, as pes-
quisas quantitativas psicográficas procuram levantar e relacionar, simultaneamente, variáveis
demográficas, socioeconômicas, atitudinais, comportamentais e psicológicas, e, a partir de
seu tratamento conjunto (geralmente por meio de análise fatorial), estabelecer segmentos
de mercado psicográficos.
Atitudes e opiniões – As atitudes são importantes em marketing, pois têm estreito relacio-
namento com o comportamento, precedendo-o. Raramente um consumidor irá adquirir um
produto sobre o qual, ou sobre seu fabricante, não tenha uma atitude favorável. Enquanto um
comportamento é manifestado, e por isso pode ser observado, a atitude não se manifesta, a não
110 Pesquisa de Marketing

Quadro 5.8  Itens de atividades, interesses e opiniões (itens A-I-O) para caracterizar estilo de vida
Atividades Interesses Opiniões
Trabalho Família Sobre si mesmo
Passatempos Lar Sobre itens sociais
Eventos sociais Emprego Políticas
Férias Comunitários Sobre negócios
Diversões Recreação Econômicas
Membro de clubes Moda Sobre educação
Comunitárias Alimentos Sobre produtos
Compras Meios de comunicação Sobre futuro
Esportes Aquisições Sobre cultura

ser pelo comportamento apresentado, ou por meio de declarações do próprio entrevistado que
permitam sua medição.
A atitude tem três componentes: um cognitivo, resultante da vivência e da experiência do
entrevistado com o rol de marcas e produtos existentes; um afetivo, resultante dos sentimentos
adquiridos em relação ao rol de marcas e produtos existentes, e que está muito relacionado
com a imagem que a empresa foi capaz de desenvolver para seus produtos ou sua marca; e um
comportamental, relacionado com a rápida reação de comportamento diante de determinados
estímulos de marcas e produtos.
Opiniões são manifestações de atitudes dos entrevistados em relação a determinado objeto.
No capítulo seguinte, são apresentadas formas de medir atitudes por meio de escalas
apropriadas.
Conscientização e conhecimento – Em pesquisa de marketing, conscientização e co-
nhecimento referem-se ao que os entrevistados sabem a respeito de determinado produto, ser-
viço, marca, propaganda etc. de uma empresa. Esses dois termos são utilizados como sinônimos.
Esse tipo de dado é muito utilizado pelas agências de propaganda no processo de avaliação
das campanhas de propagandas. O entrevistado é exposto a uma campanha de propaganda ou
a uma propaganda específica (pode ser em situação natural ou em laboratório), em conjunto
com várias outras, sendo, em seguida, entrevistado para avaliação do índice de recordação que
a propaganda produziu. Uma escala possível numa pesquisa desse tipo poderia ser a seguinte:

Sem ajuda :
recordam
não recordam
⇒ Com ajuda :
recordam
não recordam

Ou seja, os respondentes são inicialmente indagados de forma a verificar se eles se recordam


da propaganda sem que lhes seja dado nenhum auxílio. Em caso negativo, passa-se à etapa
seguinte, com a apresentação de algum material que estimule sua recordação. Em função das
possíveis respostas, ter-se-á uma escala de três pontos, com dois pontos extremos e um in-
termediário. A partir da tabulação de todas as respostas, chegar-se-á ao índice de recordação
da propaganda analisada.
Analogamente, outras variáveis de marketing podem ser assim pesquisadas, como, por
exemplo, nível de consciência em relação: ao produto; às suas características; onde está dis-
ponível para ser adquirido; ao seu preço; à empresa que o produz; onde é produzido; como
deve ser usado e com que finalidade; e às diferenças em relação aos produtos concorrentes.
Tipos, Fontes e Formas de Coleta de Dados 111

Motivações – O conceito de motivação é muito discutido tanto em psicologia quanto


em marketing. Para os objetivos de pesquisa de marketing, motivação refere-se a necessidades,
desejos, vontades, impulsos ou qualquer outro estado que impele, conduz, ativa, move, direciona
ou canaliza o comportamento de pessoas para que se alcancem determinados objetivos.
O interesse dos pesquisadores de marketing por esse tipo de dado é determinar por que
as pessoas se comportam de determinada forma. À medida que o comportamento é a ex-
teriorização de um conjunto complexo de variáveis do indivíduo, dentre as quais a motivação,
é importante em marketing conhecer a relação entre essas variáveis interiores, principalmente
a motivação, e o comportamento de escolha, compra e uso de produtos. As motivações tendem
a ser mais estáveis nos indivíduos do que seu comportamento, e conhecê-las permite prever
melhor o comportamento futuro do que a projeção de comportamentos passados e presentes.
Conhecendo as motivações que estão por detrás do comportamento das pessoas, se estará em
condições de melhor entendê-las, de saber como influenciar seu comportamento futuro ou,
ao menos, ter uma ideia consistente de como deverão ser.
Comportamento passado e comportamento presente – O comportamento refere-se
àquilo que as pessoas fizeram (comportamento passado) ou ao que estão fazendo (comporta-
mento presente). O objetivo de marketing, ao pesquisar o comportamento, é entender melhor
o consumidor e, assim, ter condições de antecipar ou prever seu comportamento futuro. Os
comportamentos que despertam maior interesse em marketing dizem respeito à compra
(presente e passado) e ao uso (presente e passado). O comportamento é uma atividade física
que envolve circunstâncias específicas, num específico momento de tempo, com um ou mais
participantes. A tarefa do pesquisador de marketing é descrever como essa atividade ocorre
no que diz respeito a seus vários componentes. O Quadro 5.9 apresenta uma listagem das
possíveis situações comportamentais que podem ser pesquisadas.
Analogamente, o pesquisador pode estar interessado em saber como se distribuem, entre os
vários “atores”, os diferentes papéis desempenhados no processo de compra. O Quadro 5.10
oferece um exemplo dos possíveis dados a serem levantados.
Intenções – Referem-se a previsões e antecipações de comportamentos futuros declarados
pelos próprios entrevistados. Se as pessoas sempre se comportassem de acordo com as intenções
manifestadas, esse seria o melhor tipo de dado a ser coletado para orientar as decisões de
marketing. Normalmente, há grande disparidade entre o que as pessoas tencionam fazer e o
que efetivamente fazem, principalmente quando no que diz respeito a intenções de compra.

Quadro 5.9  Possíveis situações comportamentais pré, durante e pós-compra


Comportamento
Passado Futuro
Informação Pré-compra Compra Pós-compra Pré-compra Compra Pós-compra
O quê?
Para quê?
Por quê?
Quanto?
Quando?
Como?
Onde?
Quem?
112 Pesquisa de Marketing

Quadro 5.10  Dados a serem coletados para se definirem os papéis desempenhados na família em
relação à compra de determinado produto
Papel desempenhado na compra
Elemento da família Iniciador Influenciador Decisor Comprador Usuário
Marido
Esposa
Filhos
Outros. Quais?

Há maior credibilidade quando as intenções se referem a grandes itens de compra, como casas,
terrenos, automóveis, refrigeradores, televisores etc. Mesmo aqui, o pesquisador precisa ser
cauteloso. Observe um exemplo de escala para coleta de intenções de compra:
• Intenção definitiva de comprar.
• Provável intenção de comprar.
• Indeciso – pode ser que compre ou não.
• Provável intenção de não comprar.
• Intenção definitiva de não comprar.
• Não sabe.
Meios básicos de coleta de dados primários
Existem dois meios básicos para se obterem dados primários: comunicação e observação. O
método da comunicação consiste no questionamento, verbal ou escrito, dos respondentes para
a obtenção do dado desejado, que será fornecido por declaração, verbal ou escrita, do próprio.
O método da observação consiste no registro de ações, comportamentose fatos relacionados
com o objetivo da pesquisa e não envolve questionamentos ou respostas, verbais ou escritas.
Tanto o método da comunicação quanto o da observação apresentam grande variedade
de formas e técnicas para sua condução, conforme é apresentado no Quadro 5.11.
A escolha do método de coleta de dados primários implica um número de decisões su-
plementares, como: CAs pessoas têm condições de autoadministrar o instrumento de coleta
ou há necessidade de um entrevistador? A entrevista será individual ou em grupo, pessoal
ou por telefone? O questionário será aplicado por correio/fax/internet ou distribuído pes-
soalmente? A observação será natural ou serão utilizados instrumentos mecânicos, como
máquinas fotográficas ou eletrônicos como câmeras de TV? Os dados devem ser obtidos de
forma disfarçada para não viesar os resultados, ou isso não será necessário? etc.
Tanto o método da comunicação quanto o da observação apresentam vantagens e des-
vantagens, e cabe ao pesquisador, conhecendo-as, fazer a escolha mais adequada para atender
às necessidades de sua pesquisa. Para auxiliá-lo nessa decisão, apresenta-se, no Quadro 5.12,
um resumo das vantagens e das desvantagens de cada um desses métodos.
Outras vantagens e desvantagens de cada método serão apresentadas quando forem des-
critas suas opções de aplicação.
MÉTODO DA COMUNICAÇÃO
Conforme já dito, o método da comunicação consiste no questionamento, verbal ou escrito,
dos respondentes, para a obtenção do dado desejado, que será fornecido por declaração, verbal
ou escrita, do próprio.
Tipos, Fontes e Formas de Coleta de Dados 113

Quadro 5.11  Meios básicos de coleta de dados primários

Comunicação
• Quanto ao grau de estruturação e disfarce
   Estruturado não disfarçado
   Não estruturado não disfarçado
   Não estruturado disfarçado
  Estruturado disfarçado
• Quanto à forma de aplicação
  Entrevista
   Pessoal
    Individual
    Em grupos
   Telefone
• Questionários autopreenchidos
   Pessoal (residência, lojas, locais de trabalho, locais públicos)
  Correio/fax/internet
  Jornais/revistas
  Tvs/rádios
   Acompanhando o produto
   Colocados à disposição
Observação
• Quanto ao grau de estruturação
  Estruturada
  Não estruturada
• Quanto ao grau de disfarce
  Disfarçada
  Não disfarçada
• Quanto aos instrumentos utilizados
  Humana
  Mecânica
  Eletrônica
• Quanto ao ambiente
  Natural
   Laboratório
• Quanto ao objeto observado
  Direta
  Indireta
• Quanto à participação do observador
  Participativa
  Não participativa

O método da comunicação pode ser classificado quanto ao grau de estruturação e disfarce


e quanto à forma de aplicação.

Método da comunicação quanto ao grau de estruturação e disfarce


Essa classificação é feita em função de duas variáveis tomadas simultaneamente: estruturação e
disfarce. A estruturação refere-se ao grau de padronização do instrumento de coleta dos dados.
Um instrumento de coleta altamente estruturado significa que tanto as questões a serem per-
guntadas quanto as respostas possíveis já estão completamente determinadas. Por outro lado, um
instrumento de coleta não estruturado significa que apenas os assuntos a serem abordados estão
114 Pesquisa de Marketing

Quadro 5.12  Vantagens e desvantagens dos métodos da comunicação e da observação


Método Vantagens Desvantagens
Comunicação • Mais versátil • Depende da boa vontade dos
• Mais rápido respondentes
• Menor custo • Depende de o respondente dispor
• Pode ser usado para obter a grande ou lembrar do dado solicitado
maioria de tipos de dados • Depende da sinceridade dos
respondentes
• O instrumento ou a forma de
coleta pode influenciar as respostas
• Menos preciso
Observação • Independe da boa vontade dos • Menos versátil
respondentes • Menos rápido
• Não há influência do processo nas • Maior custo
respostas • Dados coletados são de
• Certos dados só podem ser obtidos interpretação mais difícil
por este método • Não pode ser utilizado para obter
• Independe da sinceridade dos dados de situações íntimas
respondentes • Só pode ser usado para obter
• Independe de o respondente dispor dados exteriorizados por meio
ou se lembrar do dado necessário de comportamentos
• É mais preciso

listados, e tanto o entrevistador quanto o respondente estão livres para perguntar e responder
com suas próprias palavras. Um instrumento de coleta medianamente estruturado é aquele em
que, por exemplo, as questões a serem perguntadas são fixas, mas as respostas são obtidas pelas
próprias palavras do pesquisado. O disfarce diz respeito ao grau em que o instrumento de coleta
de dados permite ao respondente conhecer os propósitos da pesquisa e os temas sobre os quais
está sendo questionado. Um instrumento não disfarçado é aquele que permite total transparência
ao pesquisado. Um instrumento disfarçado é aquele que não permite nenhuma transparência.
Método estruturado não disfarçado – Constituem basicamente os instrumentos
utilizados em pesquisas conclusivas, principalmente em levantamentos amostrais e estudos de
campo. Nesse instrumento, comumente denominado questionário, as perguntas são apresen-
tadas exatamente com as mesmas palavras, sempre na mesma ordem e com as mesmas opções
de respostas a todos os respondentes. O objetivo dessa extrema padronização é ter certeza de
que todos responderam exatamente à mesma pergunta. Se for permitido que os entrevistadores
façam as perguntas de forma diferente, é bem possível que sejam obtidos dados diferentes.
Por exemplo, se um pesquisador pergunta: “Você costuma ir ao teatro mensalmente?” e ou-
tro pergunta: “Você costuma ir ao teatro?”, com certeza os dados obtidos não poderão ser
comparáveis, pois um pode responder a partir de seu costume de ir ao teatro ao menos uma
vez por mês, enquanto o outro pode responder segundo sua ida semestral ao teatro.
Os instrumentos estruturados não disfarçados requerem um longo tempo de desenvolvi-
mento e construção, e exigem do pesquisador o máximo cuidado para não deixar que per-
guntas fiquem sem algumas das possíveis alternativas de resposta, pois isto poderá confundir
o respondente. Deve-se, também, tomar cuidados para que as perguntas sejam elaboradas
de forma a não induzir as respostas e para que as opções estejam suficientemente claras e
Tipos, Fontes e Formas de Coleta de Dados 115

completas. Uma forma importante de depuração do instrumento é o pré-teste. Uma discussão


mais detalhada dos cuidados na construção de instrumentos e de como realizar pré-testes será
apresentada no próximo capítulo.
As maiores vantagens da utilização de instrumentos estruturados não disfarçados estão
na simplicidade de sua aplicação e na facilidade que proporciona para a tabulação, a análise
e a interpretação. Quando o instrumento é bem-construído e devidamente testado, os res-
pondentes não encontram dificuldade para responder, e poucas orientações serão o suficiente
para instruí-los sobre como devem proceder. Por outro lado, como as opções de respostas
são extremamente padronizadas, o instrumento todo pode ser pré-codificado, o que vem a
facilitar extremamente o processo de digitação e a fase de processamento dos dados, tanto em
rapidez e economia quanto em precisão. Sua aplicação pode ser efetuada pessoalmente, pelo
telefone, pelo correio/fax/internet, por jornais e revistas ou ainda acompanhando o produto.
As desvantagens dos instrumentos estruturados não disfarçados são as mesmas do método
da comunicação: dependem da boa vontade dos respondentes, de o respondente dispor ou
lembrar do dado solicitado, da sinceridade dos respondentes e de o instrumento de coleta ou
a forma de coleta poder influenciar ou não as respostas. Por último, acrescenta-se a limitação
da informação obtida, pois esse tipo de instrumento é muito bom para obter os fatos, mas
extremamente inadequado para se obterem as explicações e os porquês desses fatos.
A seguir, apresenta-se um exemplo de pergunta típica de um instrumento estruturado não
disfarçado. Numa pesquisa sobre turismo receptivo no Brasil, realizada pela Embratur e pela
Riotur, uma das perguntas do instrumento era:
Razões para viagem:
– Turismo
– Negócios
– Congresso ou convenção
– Outros. Especifique: _________________
Como pode ser observado, o propósito está claro, e a pergunta, completamente estruturada.
Método não estruturado não disfarçado – A abordagem não estruturada não dis-
farçada (também conhecida como pesquisa: focalizada, da motivação, não diretiva ou profunda),
caracteriza-se por ter os propósitos do estudo claros aos respondentes, mas não há uma es-
truturação predefinida das perguntas e das respostas. Há grande flexibilidade na forma de
se perguntar e no grau de questionamento. As respostas são abertas, e os respondentes têm
liberdade e são encorajados a expressar livremente suas percepções, crenças, valores, opiniões,
experiências, atitudes, estilo de vida, comportamentos e intenções.
Há duas técnicas para a utilização da abordagem não estruturada não disfarçada em pes-
quisas de marketing: a entrevista focalizada de grupo e a entrevista focalizada individual. Existem
outras técnicas mais adequadas às necessidades da psicologia do que as de marketing – e que,
por isso, não são apresentadas neste livro, porém a forma é a mesma, variando apenas o grau de
profundidade e os temas pesquisados. Nessas outras técnicas, o interesse maior está focalizado nas
motivações e nos sentimentos mais amplos e subjacentes no transcorrer das experiências de vida
de um indivíduo, e não voltado para uma experiência específica, que é o interesse de marketing.
Entrevista focalizada de grupo – A entrevista focalizada de grupo (também conhecida
por focus group, reuniões de grupos, pesquisa diagnóstica e pesquisa da motivação) é uma
técnica de entrevista muito pouco estruturada, conduzida por um moderador experiente,
simultaneamente, com um pequeno número de participantes, a fim de obter dados sobre
116 Pesquisa de Marketing

determinado assunto focalizado. Essa técnica teve origem na psicologia, como um método
de terapia de grupo.
A entrevista focalizada de grupo pode ser utilizada em marketing para um grande número
de finalidades, das quais se destacam:
• Avaliar e ajudar a desenvolver conceitos de novos produtos.
• Gerar hipóteses sobre opiniões, usos, costumes, imagens, aceitação de produtos, percepções,
crenças, valores, experiências, atitudes, estilos de vida, comportamentos passados e presentes,
bem como intenções que poderão ser testadas quantitativamente no futuro.
• Gerar ideias criativas para desenvolver novos produtos ou aprimorar produtos atuais.
• Gerar ideias criativas para o desenvolvimento de propaganda e promoções de vendas de
produtos.
• Ajudar a reduzir o número de opções de um novo produto a ser submetido a um teste de
mercado ou a uma pesquisa quantitativa.
• Gerar informação útil para estruturar instrumentos de coleta de dados.
• Prover informações gerais a respeito de uma categoria de produto.
• Ajudar a interpretar qualitativamente uma informação previamente obtida em pesquisa
quantitativa.
Os grupos devem ser formados por pessoas com características demográficas, socioeco-
nômicas e de estilo de vida extremamente homogêneas. Essa condição é importante para
que haja identificação e integração entre os participantes, durante a reunião, e para que não
existam posições extremamente conflitantes entre os membros do grupo. Geralmente, o pes-
quisador recorre a recrutadores disponíveis no mercado, especializadas em recrutar e selecionar
participantes. O recrutador recebe o perfil e o número de participantes necessários e procede
ao recrutamento e a uma seleção prévia. Desse perfil, deve constar também a experiência que
o participante deve ter. A seleção final dos participantes é sempre feita pelo pesquisador, por
meio das fichas dos recrutados, enviadas pelo recrutador.
Na seleção dos participantes do grupo deve ser evitado que, de um mesmo grupo, partici-
pem parentes, conhecidos, vizinhos ou amigos, evitando assim que relacionamentos existentes
previamente predominem durante a reunião. Devem-se também evitar: pessoas que participem
constantemente desse tipo de reunião, que trabalhem na área de marketing e em agências
de pesquisas de marketing e de propaganda (por questões de sigilo e pela possibilidade de
viés). O tamanho dos grupos deve ficar entre 8 e 12 pessoas. Experiências têm mostrado que
grupos acima de 12 inibem e reduzem as possibilidades de participação de todos, e grupos
com menos de 8 tendem a ser menos dinâmicos e cresce a possibilidade de que apenas alguns
participantes dominem a reunião.
A reunião deve ocorrer em ambiente agradável que estimule a descontração e encoraje
a participação das pessoas. O ideal é que a reunião seja realizada num ambiente de sala de
estar de uma residência. Como isso é muito difícil de se conseguir, devido à ausência de dis-
ponibilidades e à necessidade de infraestrutura, o que normalmente ocorre é que a reunião
é realizada em salas de agências de pesquisas de marketing ou de propaganda, especialmente
construídas para essa finalidade, que, além da infraestrutura disponível, permitem o acompa-
nhamento da reunião pelos clientes através de espelhos one-way, bem como sua gravação em
áudio e vídeo para observações e análises posteriores. Na sala onde a reunião ocorre só devem
estar presentes o moderador, um taquígrafo (este pode ser dispensável, dependendo da forma
como a reunião for registrada) e os entrevistados. Ninguém mais deverá estar presente, sob
Tipos, Fontes e Formas de Coleta de Dados 117

pena de a reunião ficar totalmente prejudicada. Durante a reunião, é aconselhável servir bebidas
(café, chá, refrigerantes, sucos e/ou bebidas levemente alcoólicas) e petiscos, para acentuar a
impressão de uma reunião social e obter-se o necessário clima de descontração. É costume,
ao final da reunião, fazer um agradecimento formal pela participação de cada entrevistado e
distribuir um presente como retribuição a essa participação. Não é incomum o pagamento
a entrevistados (valor previamente combinado), como forma de estimular a participação e
ressarcir o tempo dedicado e as despesas de locomoção.
O entrevistador, no caso chamado de moderador, desempenha papel fundamental na entre-
vista focalizada de grupo. Sua principal função consiste em focalizar a atenção dos participantes
para determinada experiência e, a partir daí, obter os dados desejados. O moderador precisa
saber, antecipadamente, quais são os tópicos – e sua sequência – e os aspectos de uma questão
que precisam ser abrangidos. A lista a ser abrangida deriva da formulação do problema de pes-
quisa, de suas respectivas hipóteses e do conhecimento prévio das experiências pelas quais os
entrevistados passaram. Esta listagem de tópicos é tudo que o moderador dispõe para conduzir
a reunião. A forma de elaborar as perguntas, a quem efetuá-las, qual o momento propício de
serem colocadas, o estímulo à participação dos mais inibidos, o controle da participação dos
mais extrovertidos e a manutenção de um alto grau de interação entre os elementos do grupo
etc. ficam ao livre-arbítrio do moderador.
Além de seu importante papel de liderar a reunião (diferentemente dos outros métodos
de pesquisa, em que a coleta dos dados e sua análise são feitas por diferentes pessoas), o
moderador também é o responsável pelas análises e pela elaboração do relatório de pes-
quisa. Por todas essas razões, o moderador de entrevista focalizada de grupo precisa ser uma
pessoa com grande conhecimento teórico e prático dessa atividade. Geralmente, as pessoas
que reúnem essas condições são psicólogos experientes que desenvolveram a característica
de moderadores por meio de profundos conhecimentos teóricos e de grande experiência
prática. Entre outras, o conjunto das características do moderador ideal compreende: comu-
nicabilidade, amabilidade, firmeza, permissibilidade, envolvimento, autocontrole, sensibilidade,
empatia e flexibilidade.
A duração da reunião varia de uma hora e meia a três horas. Reuniões com menos de
uma hora e meia são pouco produtivas, pois, geralmente, leva-se de 30 a 40 minutos para
aquecer o grupo antes de o assunto em pauta ser introduzido, e o tempo restante é muito
pouco para que todos os participantes possam expressar suas opiniões. O moderador deve
ter sensibilidade para perceber quando é chegada a hora de encerrar a discussão, deve per-
ceber quando novas informações não estão mais sendo acrescentadas, ou quando sinais
de exaustão começam a ser apresentados. A duração máxima não deve ultrapassar de três
horas, que é o limite considerado máximo para que a exaustão do grupo não comece a
prejudicar a reunião.
O número de grupos a serem conduzidos depende de: objetivos do estudo, regiões abran-
gidas pelo estudo, segmentos de mercado de interesse e disponibilidades de tempo e recursos
financeiros. Quando os recursos financeiros forem limitados, o pesquisador deverá concentrar
a formação de grupos com os segmentos que se mostrarem prioritários para a pesquisa.
As vantagens da entrevista focalizada de grupo estão relacionadas com a premis-
sa de marketing de que sempre que se desejar entender os consumidores, o melhor ca-
minho é ouvi-los. Há muto que aprender ouvindo os consumidores contarem suas ex-
periências, imagens etc. com suas próprias palavras, de forma espontânea e não forçada.
118 Pesquisa de Marketing

Quando comparada a outras técnicas de coleta de dados, as entrevistas focalizadas de grupo


apresentam as seguintes vantagens:
• Sinergismo – O resultado obtido com a participação simultânea de todos os entrevistados
é muito mais rico do que se todos fossem entrevistados individualmente.
• Interação – A interação entre os elementos também enriquece o resultado, pois as colo-
cações feitas por um dos participantes do grupo pode provocar a lembrança de outras nos
demais elementos.
• Estimulação – O grupo tende a atingir um grau de identificação após a fase de aquecimento
e cada elemento fica cada vez mais ansioso para expor suas ideias e impressões, à medida
que cresce a excitação geral para o tópico da pesquisa.
• Espontaneidade – À medida que as pessoas não são obrigadas a dar respostas às perguntas
específicas, suas colocações tendem a ser mais naturais e espontâneas.
• Flexibilidade – O método permite grande flexibilidade, de tal forma que o moderador
pode, a qualquer momento, dirigir a discussão para um novo tópico interessante que tenha
surgido e que não havia sido previsto.
• Profundidade – O método permite ao moderador explorar cada tema proposto com o
grau de profundidade que julgar necessário.
• Amplo leque de dados possíveis – Já se viu que o método permite obter um leque muito
amplo de dados que raramente outros métodos possibilitam, como: opiniões, usos, cos-
tumes, imagens, aceitação de produtos, percepções, crenças, valores, opiniões, experiências,
atitudes, estilo de vida, comportamentos passados e presentes, bem como intenções.
• Rapidez na coleta – Como não há necessidade de construção de instrumento de coleta e
não há utilização de técnicas sofisticadas de amostragens, coletam-se dados simultaneamente
de 8 a 12 pessoas, com uma rapidez muito grande na coleta, mas, em contrapartida, a análise
é muito demorada.
A maior desvantagem desse método é a impossibilidade de utilização dos dados obtidos de
forma conclusiva. Essa impossibilidade está relacionada com as seguintes “fraquezas” desse método:
• As amostras são constituídas por um número muito pequeno de entrevistados, o que
impede qualquer inferência e extrapolação.
• As amostras não são formadas por processos probabilísticos, o que também impede qualquer
inferência e extrapolação.
• A interpretação dos dados é altamente subjetiva e demorada, depende muito da experiência
e da percepção do moderador e, muitas vezes, exige a utilização de técnicas muito sofis-
ticadas e pouco exatas como a análise de valores.
• A grande interação ocorrida durante a reunião pode fazer com que opiniões que contrariam a
opinião média grupal deixem de ser manifestadas, por receio de uma eventual exposição social.
Em função dessas fraquezas, a entrevista focalizada de grupo é uma técnica muito reco-
mendável para pesquisas exploratórias, e não para pesquisas conclusivas.
Entrevista focalizada individual – A entrevista focalizada individual (também denominada
entrevista em profundidade) é uma técnica muito pouco estruturada, conduzida por um en-
trevistador experiente, com um único entrevistado de cada vez, a fim de obter dados sobre um
assunto focalizado. Como pode ser observada, a essência dessa técnica é semelhante à anterior,
com a diferença de que agora as entrevistas são individuais.
Essa forma de pesquisa tem sido pouco utilizada em marketing, pois, tendo praticamente
os mesmos objetivos da entrevista focalizada em grupos, apresenta muitas desvantagens em
Tipos, Fontes e Formas de Coleta de Dados 119

relação àquela, como custos mais elevados, maior prazo de aplicação, amostras menores e
grande dependência do entrevistador-analista. Além disso, é muito mais difícil e leva-se mais
tempo para conseguir que as pessoas se exponham quando estão sozinhas do que quando em
grupos, em que se sentem apoiadas.
As entrevistas focalizadas individuais apresentam as seguintes vantagens sobre as realizadas
em grupo: permitem maior aprofundamento do tema e associação direta dos dados com o
respondente.
Analogamente às entrevistas focalizadas grupais, as individuais se prestam apenas à utilização
em pesquisas exploratórias.
Método não estruturado disfarçado – As técnicas de coleta de dados não estruturadas
disfarçadas, também chamadas de técnicas projetivas, compreendem a criação de uma circuns-
tância que encoraje os respondentes a exporem livremente dados sobre crenças, sentimentos,
estrutura da personalidade, necessidades emocionais e seus conflitos interiores sem que tenham
conhecimento do que estão expondo.
Os métodos projetivos vêm da psicologia e foram inicialmente desenvolvidos para diagnos-
ticar e tratar pacientes com perturbações emocionais, e esse tem sido seu principal uso. Num
teste projetivo, as respostas não são consideradas por seu conteúdo aparente, mas em função da
conceituação psicológica preestabelecida para aquela situação de pesquisa. Essa conceituação
subjacente é que apresenta o quadro referencial para a interpretação das respostas obtidas.
A aplicação das técnicas projetivas exige profissionais com larga experiência e conheci-
mento teórico (psicólogos ou psicanalistas). Além disso, são técnicas de aplicação demorada e
de interpretações difíceis e extremamente subjetivas. É raro encontrar consumidores que se
predisponham a se submeter a elas. Por isso, as técnicas projetivas raramente são utilizadas em
marketing, e seu uso tem-se limitado a situações especiais em que não se conseguem obter
os dados necessários por meio de técnicas não disfarçadas.
A respeito da validade dessas técnicas, Selltiz et al. (1974:319, 351) assim se posicionam:
Muitas dessas técnicas foram submetidas a muita pesquisa; foram publicados métodos padronizados de
aplicação, avaliação e interpretação. Apesar disso, repetidamente, se põe em dúvida a sua validade, e as provas de
pesquisa estão longe de serem decisivas. (...)
(...) No caso das técnicas projetivas, existem outras razões para as dúvidas quanto à validade: a grande variedade
de aspectos a respeito dos quais é possível fazer inferências e o fato dessas técnicas dependerem muito da habilidade
do analista. Para a maioria das técnicas projetivas, não são minuciosamente especificadas as regras pelas quais os
dados devem ser transformados em escalas de mensuração; sob este aspecto, o mesmo ocorre com as dimensões
que tentamos medir. Por isso, cada pesquisador é obrigado, até certo ponto, a criar suas próprias regras. Além disso,
a flexibilidade dos testes significa que nem sempre abrangem os mesmos aspectos, no mesmo pormenor. Em outras
palavras, pelo menos em sua forma atual, os testes projetivos sacrificam a exatidão e a precisão no interesse da
amplitude e profundidade.

A título de curiosidade, as técnicas não estruturadas disfarçadas que têm, ou poderão vir a
ter, utilidade em pesquisas de marketing são: contar histórias (Teste de Apercepção Temática
– TAT),Teste de Rorschach, interpretação de papéis, completar histórias, completar desenhos
em quadrinhos, completar sentenças, associação de palavras, hierarquização de palavras, brincar
com bonecos, desenho de pessoas, colagem e Teste Tomkins-Horn de organização de figuras.
Contar histórias (Teste de Apercepção Temática - TAT) – O TAT consiste em uma série de figuras,
em forma de histórias em quadrinhos, que descrevem, de forma neutra, determinada situação
relacionada ao produto ou tópico de marketing em estudo. A situação é apresentada aos res-
pondentes para que descrevam o que está acontecendo e o que acontecerá depois do que foi
120 Pesquisa de Marketing

apresentado. Parte-se do pressuposto de que essa condição deixa os respondentes livres para
exprimir seus próprios sentimentos a respeito da situação em estudo. Dos testes projetivos, este
é o mais utilizado em pesquisas de marketing. Um exemplo da aplicação do TAT é submeter os
respondentes, por meio de histórias em quadrinho, à situação de compra (ou uso) de um forno
de micro-ondas e solicitar que descrevam a situação contando histórias e fazendo comentários a
respeito do que viram.As histórias contadas e/ou comentários feitos permitem aos pesquisadores
concluir, por exemplo, se a imagem de uma dona de casa que usa um forno de micro-ondas é a
de uma mulher moderna, prática, ocupada, ou preguiçosa, relaxada, que não gosta de cozinhar
etc. Uma forma mais moderna de aplicar o TAT é a apresentação da situação-teste em vídeo.
Teste de Rorschach – É composto de dez cartões, cada qual com um borrão de tinta diferente.
O teste consiste em perguntar aos respondentes o que significa cada um dos borrões. Todos
os borrões são padronizados e as descrições possíveis por parte do respondente têm concei-
tuação psicológica preestabelecida. Pela dificuldade de aplicação a problemas de marketing
e, principalmente, pela subjetividade de sua interpretação, o Teste de Rorschach raramente é
empregado em pesquisas de marketing.
Interpretação de papéis – A interpretação de papéis, ou técnica da terceira pessoa, consiste em
apresentar uma situação de pesquisa, de forma verbal ou visual, em que ao respondente é solicitado
a exprimir seus sentimentos e crenças para a condição em que o sujeito da situação fosse outra
pessoa, como um amigo, um parente, um vizinho ou um consumidor “típico” de determinado
produto. Pressupõe-se que, descrevendo aquela situação para terceiros, estará revelando seus pró-
prios sentimentos e crenças a esse respeito. Uma forma de aplicação dessa técnica é apresentar
uma lista de compras (ou de produtos que são usados) que um consumidor teórico realizou, e
solicitar que o respondente descreva esse consumidor, a partir da lista dos produtos adquiridos.
Completar histórias – Essa técnica consiste em fazer o respondente receber uma história em
que se narra o necessário para focalizar sua atenção em determinado tópico, mas não o suficiente
para indicar seu final, e, em seguida, ele é convidado a apresentar sua conclusão. Por exemplo:
Mário está em dúvida se deve ou não trocar seu automóvel por um novo, pois já está com
quatro anos de uso e tem-lhe dado alguns problemas. Mário tem economias suficientes
apenas para a troca, mas a perspectiva da economia do país não é boa e ele teme ser um
desempregado com um automóvel novo. Na saída do trabalho, encontra-se com o amigo
Barbosa e, juntos, vão bebericar num bar que costumam frequentar. Barbosa, que trabalha
na mesma empresa e tem função similar à de Mário, acabou de trocar seu automóvel por
um novo e diz a Mário que está muito satisfeito.
Eu penso que...
Completar desenhos em quadrinhos – Essa técnica consiste em apresentar aos respondentes
desenhos em quadrinhos que mostrem uma ou mais pessoas em determinada situação. O
respondente é solicitado a completar o quadrinho seguinte em função da(s) situação(ões)
observada(s) nos quadrinhos anteriores. Geralmente, a complementação é feita com palavras,
preenchendo-se o balão reservado para texto do quadrinho seguinte. Por exemplo: nos três
quadrinhos, aparece a mesma pessoa dizendo:
• No primeiro quadrinho: “Meu avô comprou para meu pai um carrinho de brinquedo.”
• No segundo quadrinho: “Meu pai comprou para mim uma bicicleta.”
• No terceiro quadrinho: “Em relação ao meu filho, pretendo...”
O pesquisado é convidado a completar o terceiro quadrinho. A ideia é que o respondente
projete a intenção de compra em relação a seu(s) filho(s), ao completar o terceiro quadrinho.
Tipos, Fontes e Formas de Coleta de Dados 121

Completar sentenças – Completar sentenças é uma técnica similar à de completar quadri-


nhos, e compreende solicitar aos respondentes que completem uma sentença, em que são
apresentadas as primeiras palavras de uma possível sentença. Exemplos:
Os compradores de automóveis BMW são...
A dona de casa que serve alimentos congelados à sua família é...
O consumidor de cigarros é...
Os clientes de lojas de conveniência são...
Associação de palavras – O teste de associação de palavras é semelhante ao de complemen-
tação de sentenças, e consiste em entregar ao respondente uma lista de palavras para que as
associe imediatamente com a primeira palavra que lhe ocorrer. As palavras são cuidadosa-
mente selecionadas e colocadas em sequência, de forma a permitir a revelação de crenças e
sentimentos. Os resultados do teste são analisados em relação à frequência das respostas, ao
seu conteúdo, à hesitação em respondê-las e ao número de respostas em branco. Essa técnica
é muito utilizada em pesquisas de marketing para descobrir que associações estão ligadas à
determinada marca que se pretenda adotar para um novo produto.
Hierarquização de palavras – Consiste em apresentar uma série de palavras que exprimam
sentimentos, crenças e valores, e solicitar que os respondentes as coloquem numa hierarquia, da
mais importante para a menos importante. Exemplos de palavras que exprimem sentimentos,
crenças e valores cuja hierarquização expressará muito a respeito das personalidades dos res-
pondentes: amor, bem-viver, conhecimentos/nível educacional, dinheiro, igualdade, liberdade,
paz, política, patriotismo, religião, riqueza, sexo, trabalho etc.
Brincar com bonecos – Na técnica de brincar com bonecos, o respondente recebe um
conjunto de bonecos que representam adultos e crianças de ambos os sexos, e é solicitado a
montá-los de forma a representar como agiriam em determinada circunstância. É uma técnica
mais adequada para fazer pesquisas comportamentais com crianças.
Desenho de pessoas – No teste de desenho de pessoas, parte-se do pressuposto de que o
desenho que uma pessoa faz de outro ser humano representa a imagem que a pessoa tem de
si mesma.
Colagem – A colagem consiste em entregar a um respondente ou a um grupo de res-
pondentes várias revistas velhas, cartolina e cola, e fornecer-lhes um tema para que seja re-
presentado pela colagem de recortes. Parte-se do pressuposto de que a forma e a criatividade
apresentadas dizem muito a respeito da personalidade individual ou grupal.
Teste Tomkins-Horn de organização de figuras – Consiste em 25 cartões com três desenhos
cada um, que podem ser dispostos de várias formas para apresentar uma sequência de aconte-
cimentos, e o pesquisado é solicitado a dispô-los na sequência que considerar mais adequada.
A tabulação e a pontuação são efetuadas por computadores, e os resultados são interpretados
para dar as seguintes dimensões da personalidade do respondente: grau de conformismo/
inconformismo, tipo de orientação social, grau de otimismo/pessimismo, nível de atuação e
nível de orientação para o trabalho (Selltiz et al., 1974).
Método estruturado disfarçado – Essa técnica retrata uma tentativa de se associarem
as vantagens das técnicas não estruturadas disfarçadas (técnicas projetivas), principalmente a
de que o pesquisado não conheça os objetivos da pesquisa, com a facilidade de aplicação,
tabulação, interpretação e análise das técnicas estruturadas não disfarçadas. Em função disso,
foram criadas algumas técnicas estruturadas disfarçadas, mas cuja utilização em pesquisas de
marketing é desconhecida.
122 Pesquisa de Marketing

De acordo com esse método, os respondentes são solicitados a memorizar e, em seguida,


descrever um tópico definido pelo pesquisador. As respostas são analisadas e se inferem con-
clusões sobre a natureza dos respondentes conforme as lembranças, as crenças e os sentimentos
manifestados em relação ao tópico. O método se baseia na premissa de que, quanto mais
informação for retida pelos respondentes em relação a determinado tópico, maior deverá ser
sua atitude em relação a ele, pois as pessoas tendem a:
• Selecionar sua exposição às informações sobre os tópicos de seu interesse.
• Diferenciar e canalizar a percepção da informação para os tópicos de seu interesse.
• Reter seletivamente as informações a respeito dos tópicos de seu interesse e que sejam
coerentes com suas atitudes.
Assim, solicitar às pessoas que recordem e deem informações a respeito de determinado
tópico é uma forma de medir, disfarçadamente, a direção e a força de suas atitudes em relação
ao próprio tópico e até em relação à sua atitude diante da vida e do mundo. Alguns autores
consideram que o assunto em si, escolhido para que as pessoas discorram a respeito, não é
relevante; o importante é provocar reações que permitam a medição da atitude de interesse.
Segundo Campbell (1950), esse teste compreende:
Encontre uma tarefa que todas as pessoas que a realizem considerem objetiva, e que todos procurem realizá-la bem.
Faça um teste suficientemente difícil, ou use uma área de conteúdo na qual as pessoas tenham pouca experiência ou
oportunidade para a verificação da realidade. Carregue o teste com o conteúdo relativo à atitude que você estuda.
Nas respostas, procure o erro sistemático, ou qualquer seletividade de realização. Se tais situações foram encontradas,
parece uma base adequada para a inferência de uma atitude.

Pela dificuldade de sua aplicação e pela subjetividade de sua interpretação, são muito
remotas as possibilidades de que técnicas estruturadas disfarçadas venham a ser intensamente
utilizadas em pesquisas de marketing.

Método da comunicação quanto à forma de aplicação


O método da comunicação quanto à forma de aplicação compreende entrevistas e ques-
tionários autopreenchidos.
Entrevista – O método da entrevista é caracterizado pela existência de uma pessoa (en-
trevistador) que fará a pergunta e anotará as respostas do pesquisado (entrevistado). A entrevista
pode ser realizada pessoalmente ou por telefone, e individualmente ou em grupos.
Entrevista pessoal – A entrevista pessoal consiste em o entrevistador e o(s) entrevistado(s)
estarem em contato pessoal para a obtenção dos dados. A tarefa do entrevistador é contatar
o(s) entrevistado(s), agendar a(s) entrevista(s), efetuar as perguntas e tomar nota das respostas.
A entrevista tanto pode ser individual quanto em grupo(s). Quando realizada em grupo(s),
várias pessoas são entrevistadas ao mesmo tempo, e a forma mais comum em pesquisas de
marketing é a entrevista focalizada de grupo, que já foi vista neste capítulo.
Entrevista por telefone – As entrevistas por telefone consistem na obtenção dos dados de
pesquisa por telefone, e não por meio de contato pessoal. De todos os métodos de coleta de
dados, a entrevista por telefone é a que atualmente predomina nos países em que a maioria da
população possui telefone (nestes países, cerca de 90% das pesquisas de marketing são realizadas
por telefone). Infelizmente, no Brasil, as entrevistas por telefone têm seu uso ainda restrito às
classes sociais cuja maioria já possui telefone, o que impede que as agências de pesquisas e as
empresas tirem maior proveito de suas vantagens de grande eficiência e baixo custo quando
comparadas às entrevistas pessoais.
Tipos, Fontes e Formas de Coleta de Dados 123

Questionários autopreenchidos – Os questionários autopreenchidos consistem em


um instrumento de coleta de dados lido e respondido diretamente pelos pesquisados, não
havendo a figura do entrevistador. Existem várias formas de enviar e receber os questionários:
• Pessoalmente – O questionário é entregue e recolhido pessoalmente nas residências, em
lojas, empresas, escolas etc., ou em qualquer lugar público.
• Via correios/fax/internet – O questionário é enviado e recebido pelo correio, por apare-
lhos de fax ou pela internet.
• Por meio de jornais/revistas – O questionário chega ao respondente impresso em jornais
ou revistas, e deve ser devolvido pelos correios ou depositados em urnas estrategicamente
localizadas.
• Via TV/rádio – O respondente é solicitado a entrar em contato com a emissora (via tele-
fone ou internet) e responder à pergunta colocada no ar. Essa resposta é automaticamente
registrada pelo sistema adotado.
• Acompanhando o produto – O questionário é enviado ao respondente acompanhando o
produto e deve ser devolvido pelos correios.
• Colocados à disposição – Os questionários ficam à disposição em locais que o público de
interesse da pesquisa frequenta. Após o preenchimento, os questionários são depositados
numa urna, de onde, periodicamente, são recolhidos.
Com exceção da forma de enviar e receber o questionário pessoalmente, todas as demais
formas de aplicação de questionários autopreenchidos apresentam problemas de controle
amostral, pois não há certeza de que quem respondeu é a pessoa que deveria fazê-lo. Outro
problema resultante é que, mesmo sendo a amostra original probabilística, a amostra efetiva
de respondentes não o será.

COMPARAÇÃO ENTRE OS MÉTODOS DA COMUNICAÇÃO


QUANTO À FORMA DE APLICAÇÃO
No Quadro 5.13, apresenta-se um resumo da comparação entre os métodos da comunicação
segundo a forma de aplicação. Como cada uma das formas de aplicação apresenta variações
que podem implicar mudanças em suas características, foram consideradas para efeito de
comparação apenas as formas básicas de cada método: entrevista pessoal, entrevista por telefone
e questionários autopreenchidos por correios/fax/internet. Para ajudar a seleção de qual
método utilizar, segue uma discussão mais detalhada sobre problemas, dificuldades e vantagens
de cada um em relação a cada característica.
Versatilidade – A entrevista pessoal é o mais versátil dos três métodos de comunicação
segundo a forma de aplicação. As entrevistas por telefone são menos versáteis do que as en-
trevistas pessoais, e o questionário por correios/fax/internet é o menos versátil dos três.
A melhor forma de comunicação é o contato pessoal. O contato pessoal, devido ao
relacionamento estreito entre as pessoas, possibilita que todas as dúvidas sejam imediata e
devidamente esclarecidas.
A entrevista pessoal possui alta versatilidade, à medida que esta se baseia no contato pes-
soal. Esse contato pessoal permite que, em caso de dúvida e nas questões mais complexas,
o entrevistador elabore a pergunta de outra forma, faça esclarecimentos e explanações não
previstas para elucidá-las e utilize material auxiliar, como amostras ou fotos do produto. Essa
grande versatilidade permite que instrumentos não estruturados possam ser aplicados pela
entrevista pessoal sem problemas.
124 Pesquisa de Marketing

Quadro 5.13  Comparação entre as características dos métodos da comunicação segundo a forma de
aplicação: entrevista pessoal, entrevista por telefone e questionários autopreenchidos pelo correio/fax/
internet
Entrevista por Questionário
Característica Entrevista pessoal
telefone autopreenchido
Versatilidade Alta Média Baixa
Custo Alto Médio Baixo
Tempo para aplicação Alto Baixo Médio
Controle amostral Alto Médio Baixo
Quantidade de dados Alta Média Média
Qualidade dos dados (Veja Quadro 5.14)
Garantia de anonimato Baixa Baixa Média
Habilidade exigida Alta Alta Baixa
para aplicação
Uniformidade da mensuração Baixa Média Alta
Índice de resposta Alto Alto Baixo
Nível educacional exigido dos Baixo Baixo Alto
respondentes
Possibilidade de verificação da Alta Baixa Baixa
sinceridade das respostas
Tamanho da amostra Pequeno Grande Grande

Na entrevista por telefone, a ausência de contato pessoal entre entrevistado e entrevis-


tador impede que haja grande versatilidade; dispondo o entrevistador apenas de sua fala
como meio de comunicação, é evidente que muitos esclarecimentos e orientações poderão
ser passados ao entrevistado, mas nunca com as mesmas possibilidades do contato pessoal. Por
isso, instrumentos pouco estruturados e questões muito complexas não devem ser aplicados
por telefone.
De forma geral, o questionário apresenta baixa ou nenhuma versatilidade, por ter a
característica de ser altamente estruturado. No entanto, dependendo de sua forma de
aplicação, poderá ser mais ou menos versátil. Nas formas em que, apesar do autopreen-
chimento, existir a figura de um entregador-recolhedor do questionário, sempre haverá a
possibilidade de orientações e esclarecimentos em seu preenchimento, fazendo com que
haja certa versatilidade.
Custo – Em função da quantidade de horas de trabalho, dos custos de deslocamento,
do nível da equipe de pesquisa, a entrevista pessoal é o método mais caro por entrevista
completada. As entrevistas por telefone são geralmente mais caras do que os questionários
por correios/fax/internet, porém, quando se tratar de entrevistas muito curtas, seu custo é
comparável àquele. A forma mais barata de se aplicar um questionário é deixá-lo à disposição
em lugares públicos e recolher as respostas por meio de uma urna.
Tempo para aplicação – A forma mais rápida para se obterem dados é via telefone, porém os
questionários aplicados pessoalmente a grupo(s) de pessoas e aqueles colocados à disposição
também são formas extremamente rápidas de obtenção de dados. A entrevista pessoal é a
forma mais lenta. Enquanto, por telefone, um entrevistador é capaz de realizar de dez a vinte
entrevistas por dia, pessoalmente, dependendo de sua complexidade, pode não conseguir
Tipos, Fontes e Formas de Coleta de Dados 125

realizar mais do que cinco (principalmente nos casos que envolvem deslocamentos). Em casos
especiais de pesquisa por telefone associada a um programa de TV, em que os telespectadores
são convidados a ligar para um número telefônico se forem favoráveis e ligar para outro se
forem desfavoráveis a certa colocação feita no programa (não há atendente para a ligação/a
ligação é registrada diretamente num sistema computacional), a quantidade de respostas
possível de ser obtida por hora dependerá exclusivamente da capacidade de atendimento
do sistema que foi montado para recepção dos telefonemas (número de linhas e sistema
computacional).
A redução do tempo de aplicação, no caso das entrevistas pessoais e por telefone, pode ser
obtida pela elevação do número de entrevistadores. Essa elevação do número de entrevistadores,
no caso das entrevistas pessoais, tornará o projeto administrativamente mais complexo devido
à maior necessidade de recrutamento, seleção, treinamento, coordenação, controle e supervisão.
Os problemas administrativos e o custo de administrar uma equipe maior podem não justificar
a redução de tempo pretendida. Por isso, as pesquisas com base em entrevistas pessoais são mais
demoradas do que as por telefone e as realizadas por questionários colocados à disposição.
A redução do tempo de aplicação de questionários, por correios/fax/internet, é mais difícil,
pois, uma vez postados, há pouco que o pesquisador possa fazer para acelerar sua devolução.
Em média, a devolução ocorre em maior volume duas a três semanas depois de postados, mas,
se o pesquisador desejar trabalhar com uma devolução maior e mais rápida, deverá, após uma
semana da remessa do questionário, iniciar um processo de postagens estimuladoras. Deverá
aguardar duas ou três semanas para receber as respostas do estímulo e, para as não respostas,
enviar nova postagem estimuladora, e assim sucessivamente. Esse processo poderá demorar
vários meses até se obter o retorno desejado. Com a distribuição e o recolhimento pessoal de
questionários, esse problema não ocorre e o tempo de aplicação é bastante rápido.
Controle amostral – Refere-se ao grau em que a amostra inicialmente projetada para a pes-
quisa foi efetivamente atingida durante o processo de coleta de dados.
A entrevista pessoal apresenta o mais alto nível de controle amostral. O pesquisador
pode controlar quais unidades amostrais são pesquisadas, quem será entrevistado, se haverá
participação de outras pessoas no processo de entrevista, substituir uma unidade amostral que
se recusou a responder por outra semelhante etc. Mesmo quando não dispõe de uma listagem
preliminar da população de pesquisa para sortear a amostra, existem métodos de amostragem
à sua disposição que lhe garantirão grande controle amostral (veja Capítulo 8).
As entrevistas por telefone dependem da constituição da amostra. Essas amostras são
geralmente constituídas a partir das listas telefônicas. As listas telefônicas são fontes pobres e
problemáticas para gerar amostras probabilísticas de toda a população pelas seguintes razões:
• A grande maioria das famílias brasileiras não possui telefone, sendo um aparelho típico das
famílias de classes alta, média-alta e média-média.
• As listas telefônicas envelhecem rapidamente, pois, após sua publicação, várias mudanças
são efetuadas, novos telefones são instalados e, por isso, passam a não refletir corretamente
a população de possuidores de telefone.
• Algumas pessoas, apesar de possuírem telefone, não figuram nas listas por solicitação às
empresas telefônicas.
• O grande número de possuidores de telefone celular para os quais não há listagens.
Em razão dos problemas apontados, as entrevistas por telefone oferecem um controle
amostral médio, excetuando-se os casos em que a listagem tenha sido preparada por outros
126 Pesquisa de Marketing

meios (por exemplo: listagem de médicos, dentistas, advogados etc. obtidas em suas associações
de classe).
O controle amostral dos questionários, excluindo a entrega e o recolhimento pessoal,
é extremamente baixo. Mesmo quando se dispõe de listagens e se tenha construído uma
amostra probabilística, como no caso de questionários por correios/fax/internet, o controle
amostral é baixo, pois o pesquisador não consegue ter nenhum controle sobre quem res-
pondeu ao questionário nem se quem respondeu constitui uma amostra representativa da
população em estudo. Na entrega e no recolhimento pessoal, uma pressão maior é exercida
sobre os respondentes pela própria presença do recolhedor para se obter o preenchimento
do instrumento.
Quantidade de dados – A quantidade de dados possível de se obter é maior na entrevista pes-
soal, pois, além da presença pessoal do entrevistador, dispõe-se de bastante tempo para explorar
inúmeros pontos de interesse. Uma entrevista pessoal pode durar de quinze minutos a uma
hora, sem grandes problemas de recusa. Em entrevistas por telefone, o tempo que o entrevis-
tador dispõe para a entrevista é muito limitado, geralmente não mais que dez minutos, o que
reduz a quantidade de dados obtidos. A quantidade de dados obtidos por meio de questionários
é semelhante à das entrevistas por telefone, e está limitada pela impessoalidade da aplicação
e pela padronização do instrumento. Quando a necessidade de dados a serem levantados é
grande, o método da entrevista pessoal é o mais recomendado.
Uma forma de conseguir elevar o tempo de entrevistas por telefone é selecionar en-
trevistadores com o perfil adequado para a realização desse trabalho. Algumas características
desejáveis importantes: voz extremamente agradável e carismática, maneiras afáveis ao telefone
e boa capacidade de envolvimento das pessoas pela forma de falar.
Qualidade dos dados – A qualidade dos dados refere-se ao grau em que estejam livres de
vieses em função do meio de comunicação utilizado em sua obtenção. As inúmeras fontes
de vieses se refletem de forma diferente na qualidade dos dados, conforme o método de
comunicação utilizado para a coleta dos dados. É apresentada no Quadro 5.14 uma síntese
das diversas fontes de vieses e o grau de sua ocorrência conforme o método utilizado.

Quadro 5.14  Grau de ocorrência de vieses conforme o método de comunicação utilizado


Nível de ocorrência de viés
Entrevista Entrevista por Questionário
Fonte de viés pessoal telefone autopreenchido
Garantia de anonimato Alto Médio Baixo
Questões de entendimento difícil Baixo Médio Alto
Uniformidade da mensuração Alto Médio Baixo
Conhecer todas as questões antes Baixo Baixo Alto
de responder
Fraude do entrevistador Alta Baixo Baixo
Dificuldade de supervisão e Alto Médio Baixo
controle
Controle sobre quem responde Baixo Alto Alto
Influência do entrevistador Alto Alto Baixo
Insinceridade nas respostas Baixo Alto Alto
Tipos, Fontes e Formas de Coleta de Dados 127

Garantia de anonimato – O questionário é o método com maior garantia de anonimato aos


respondentes. Basta solicitar aos respondentes que não se identifiquem ao responder para que
o anonimato esteja garantido. Se, por um lado, a possibilidade de anonimato ajuda na coleta
de dados sinceros de conteúdo difícil, por outro dificulta o controle amostral.
Tanto as entrevistas pessoais quanto as realizadas por telefone apresentam baixa garantia de
anonimato. Mesmo quando o entrevistador promete verbalmente que haverá total anonimato,
sempre persistirá a dúvida para o respondente se isso efetivamente ocorrerá, à medida que,
a qualquer momento, uma identificação poderá ser feita. Uma forma de elevar a garantia de
anonimato nas entrevistas pessoais é formalização por meio de um documento escrito que
deve ficar de posse do entrevistado.
Habilidade exigida para aplicação – Tanto as entrevistas pessoais quanto as realizadas por
telefone exigem grande habilidade em sua aplicação. O perfil de qualificação dos entrevis-
tadores precisa ser elevado e deve estar perfeitamente adaptado às características do público a
ser pesquisado. Em ambos os tipos de entrevista, é muito importante estabelecer um processo
de empatia entre entrevistador e entrevistado, como condição para que se obtenham bons
resultados. A melhor forma de conseguir estabelecer empatia é fazer com que o perfil socioe-
conômico e demográfico dos entrevistadores seja aproximadamente igual ao dos entrevistados.
Os questionários exigem pouca habilidade para sua aplicação.
Uniformidade das mensurações – As mensurações têm grande uniformidade nos questionários.
Frases padronizadas, ordem padronizada das perguntas, perguntas padronizadas, opções de res-
postas padronizadas, tudo isso assegura grande uniformidade de uma mensuração para outra.
Por outro lado, as entrevistas pessoais tendem a apresentar baixo índice de uniformidade. As
situações das entrevistas são diferentes, as personalidades dos entrevistadores são diferentes,
o comportamento dos entrevistadores durante a entrevista pode ser diferente, pode haver
maior ou menor empatia entre entrevistado e entrevistador; tudo isso contribui para a pouca
uniformidade entre uma mensuração e outra, feitas por meio de entrevistas pessoais. As en-
trevistas por telefone também tendem a ter, pelos mesmos motivos, baixa uniformidade, mas,
como estão sujeitas a maior controle e supervisão, essa uniformidade poderá ser aprimorada
por meio de intenso treinamento, controle, supervisão e padronização do instrumento.
Índice de respostas – O questionário, com exceção da entrega e do recolhimento pessoais,
oferece a menor pressão para a obtenção de respostas imediatas. Esse fato tem duas im-
plicações: a primeira é que as pessoas, tendo mais tempo para responder e respondendo sem
pressões, tendem a refletir mais sobre cada questão e a responder melhor; a segunda é que,
sem pressão, a grande maioria das pessoas acaba deixando de responder, o que faz com que
os questionários apresentem o menor índice de respostas de todos os métodos de aplicação.
A consequência mais grave desse baixo índice de respostas é o baixo controle amostral.
Em questionários aplicados por correios/fax/internet, os índices de resposta podem variar
de 3% a 50%. Várias experiências efetuadas para elevar seus índices de respostas mostraram
que as seguintes providências funcionam:
• Enviar antecipadamente uma carta/e-mail, ou telefonar, apresentando ao respondente os
objetivos do estudo e solicitando sua cooperação.
• Enviar o questionário acompanhado de uma segunda carta/e-mail apresentando os objetivos
do estudo, solicitando sua cooperação e assegurando formalmente o sigilo.
• Acompanhando o questionário, enviar um envelope selado para a resposta, quando a
remessa for pelo correio.
128 Pesquisa de Marketing

• Acompanhando o questionário, enviar um pagamento simbólico pela cooperação em


responder (as pessoas ficam inibidas por receber a quantia e se sentem na obrigação de
responder).
• Quando por correios/fax/internet, jornal ou revista, associar o recebimento de um brinde
aos respondentes ou a possibilidade de participar de um concurso cujos prêmios são objetos
valiosos.
• Aproximadamente após uma ou duas semanas, enviar uma mensagem (por carta, e-mail ou
telefonema) enfatizando a importância da colaboração do respondente.
• Após quatro semanas, enviar novamente um exemplar do questionário acompanhado de
uma nova mensagem solicitando cooperação.
Williams e Wechsler (1970), utilizando providências semelhantes, relatam que, numa pes-
quisa realizada com cirurgiões, conseguiram um índice espetacular de respostas de 77,8%.
O Autor conduziu uma pesquisa junto aos ex-alunos da FEA-USP e obteve retorno de 60%.
Além dessas providências, vários outros fatores influenciam o índice de respostas:
• Identificação do patrocinador e (ou) do realizador da pesquisa – Essa providência gera
maior confiança nos respondentes e, quanto mais conhecida e idônea for a empresa, maior
será a confiança do respondente.
• Formato e apresentação agradáveis do questionário – O formato e a apresentação (letras;
figuras; desenhos; uso de cores; tipo, qualidade e cor do papel etc.) agradáveis do ques-
tionário facilitam e estimulam a resposta.
• Extensão do questionário – Questionários extensos representam uma barreira para serem
respondidos. Quanto mais objetivos e curtos eles forem, maior será o índice de respostas.
• Natureza dos respondentes – Geralmente, as pessoas que mais respondem aos questionários
são as mais interessadas, as mais participantes e as mais instruídas da população.
• Interesse do respondente – Quanto maior for o interesse do respondente no assunto pes-
quisado, maior será o índice de resposta. A promessa de enviar uma síntese dos resultados
também eleva o índice de respostas.
Nas entrevistas pessoais, os maiores problemas são não encontrar o respondente em casa,
recusas e dificuldades de acesso à residência. O problema de não encontrar o respondente
em casa é em parte resolvido com revisitas, ou, em último caso, com uma substituição por
outro respondente semelhante. O problema da recusa é resolvido pela substituição por um
respondente semelhante. O problema da dificuldade de acesso ocorre, principalmente, em
grandes cidades, em prédios de apartamentos e em bairros residenciais murados e com portarias,
chamados condomínios horizontais fechados. Nesses tipos de condomínios, é praticamente
impossível aos entrevistadores conseguirem acesso às residências. Principalmente em função
dessa última razão, para a qual a única solução possível é a entrevista por telefone, as entrevistas
pessoais têm um índice de respostas considerado médio. Nos bairros em que esse problema
não ocorre, a pressão da presença física do entrevistador, associada às providências apresentadas,
faz com que o índice de respostas seja elevado.
As entrevistas por telefone são as que menos tendem a apresentar problemas de recusa
e, por isso, apresentam o melhor índice de respostas dos três métodos.
Nível de formação exigido dos respondentes – Segundo os dados do Censo 2010 disponibili-
zados no site do Instituto Brasileiro de Geografia e Estatística – IBGE www.ibge.com.br, os
índices de analfabetismo (para pessoas de dez ou mais anos de idade) são os que constam nas
Tabelas 5.1 e 5.2.
Tipos, Fontes e Formas de Coleta de Dados 129

Tabela 5.1  Índice de analfabetismo nas regiões brasileiras – pessoas com dez ou mais anos de idade
Região Analfabetos (%)
Urbana 8,6
Rural 23,7
Total Brasil 10,9
Fonte: Censo IBGE 2010. Disponível em: www.ibge.com.br. Acessado em: 30 maio 2012.

Tabela 5.2  Índice de analfabetismo nas principais regiões metropolitanas – pessoas com dez ou mais
anos de idade
Região metropolitana de Analfabetos (%)
Belém 3,6
Fortaleza 8,9
Recife 8,5
Salvador 4,8
Belo Horizonte 3,9
Rio de Janeiro 3,4
São Paulo 3,4
Curitiba 3,2
Porto Alegre 3,0
Fonte: Censo IBGE 2010. Disponível em: www.ibge.com.br. Acessado em: 30 maio 2012.

Esses dados levam a concluir que, mesmo para o autopreenchimento de questionários


simples, uma parte considerável da população não poderá fazê-lo.
Para questionários medianamente complexos, o percentual de pessoas que terão dificul-
dades pode crescer consideravelmente.
Para questionários extremamente complexos, com perguntas abertas, que exigem extensas
respostas por escrito, somente uma pequena percentagem da população reúne condições de
autopreenchê-los. Isso leva a concluir que os questionários, em qualquer uma de suas versões
de aplicação, são mais adequados a públicos com educação formal elevada e que, no Brasil, sua
aplicação fica restrita a uma pequena parte da população. Às vezes, ocorre que, mesmo pessoas
com alto nível educacional, têm dificuldades para escrever e, mesmo quando têm facilidade,
podem não ter paciência ou motivação para escrever tanto quanto seriam capazes de falar. Por
isso, os questionários se prestam à obtenção de dados junto a pessoas que tenham, no mínimo,
um nível educacional médio. As entrevistas tanto pessoais como por telefone prestam-se a
obter informações de pessoas de qualquer nível educacional.
Possibilidade de verificação da sinceridade das respostas – A entrevista pessoal apresenta uma
possibilidade de verificação bem elevada de sinceridade das respostas. O entrevistador pode
observar, durante o processo de entrevista, o comportamento do entrevistado (jocoso, envolvi-
do, relapso, ansioso etc.), suas reações faciais e corporais, e pode deduzir quanto à sinceridade
das respostas. Pode também verificar informações contraditórias e respostas incoerentes. As
entrevistas por telefone e os questionários não permitem avaliar a sinceridade das respostas.
Tamanho da amostra – As entrevistas por telefone e os questionários, pela agilidade em sua
aplicação e distribuição, permitem trabalhar com amostras grandes a custos baixos, porém,
na entrevista pessoal, devido à dificuldade de aplicação, principalmente quando envolve des-
locamento, o tamanho da amostra interferirá significativamente no custo da pesquisa.
130 Pesquisa de Marketing

Uso combinado das várias formas de aplicação do método


da comunicação
Cada forma de aplicação do método da comunicação apresenta vantagens e desvantagens, e
nenhum deles pode ser considerado o melhor em todos os aspectos analisados. Em função
disso, o pesquisador deve considerar a possibilidade de fazer usos combinados de métodos em
sua pesquisa. Por exemplo, numa mesma pesquisa, para a parte da amostra que possui telefone,
utilizar entrevistas por telefone; para a parte que não possui telefone nem reúne condições
de autopreencher o questionário, utilizar entrevistas pessoais, e, para a parte da amostra com
elevado nível educacional, utilizar questionários por correios/fax/internet.
Se, por um lado, a combinação de métodos pode elevar o erro não amostral resultante
da falta de uniformidade das medições, por outro é a melhor forma de elevar o número de
elementos da amostra e, com isso, reduzir o erro amostral para um mesmo custo total de
campo. É também a melhor forma de se reduzir o custo total de campo para um mesmo
tamanho de amostra.

MÉTODO DA OBSERVAÇÃO
Conforme já dito, o método da observação consiste no registro de comportamentos, fatos e ações
relacionados com o objetivo da pesquisa, sem que haja comunicação com os pesquisados e não
envolvam questionamentos e respostas, verbais ou escritas.
O método da observação pode ser classificado quanto: ao grau de estruturação, ao grau
de disfarce, aos instrumentos utilizados, ao ambiente, ao objeto observado e à participação
do observador.

Método da observação quanto ao grau de estruturação


A observação quanto ao grau de estruturação pode ser estruturada e não estruturada. A dife-
renciação estruturada/não estruturada é semelhante à que foi vista no método da comunicação
e, basicamente, refere-se ao grau de especificação do que será observado.
Observação estruturada – A observação estruturada é utilizada em pesquisas em que
o problema e os objetivos já estejam claramente definidos, a ponto de permitir uma es-
pecificação clara e a priori das situações e dos comportamentos que serão observados e de suas
categorizações para registrar o observado.
A observação estruturada é utilizada em pesquisas conclusivas, descritivas ou explicativas.
Um exemplo de sua aplicação é o de uma empresa fabricante de bebidas alcoólicas que
desejava medir a variedade e a intensidade das atividades promocionais, no ponto de venda
de supermercados, de seus concorrentes (Mattar e Santos, 1982). Para tanto montou-se um
projeto baseado no método da observação estruturada. Foi constituída uma amostra de 40
supermercados na Grande São Paulo e 30 no Grande Rio, que eram visitados a cada dois
meses por observadores devidamente treinados. Esses observadores não perguntavam nada a
ninguém; apenas observavam inúmeros itens definidos a priori, como: espaço frontal ocupado
pelos produtos nas prateleiras, vizinhança dos produtos (à esquerda e à direita), altura ocupada
na prateleira e tipo de atividade promocional encontrado (havia uma lista pré-codificada de
aproximadamente 30 atividades). Foi desenvolvido e testado um formulário para colher essas
observações de forma rápida e precisa (Figura 5.2). A tabulação desses dados, via computador,
oferecia, periodicamente, uma visão comparativa da variedade e da intensidade das atividades
Tipos, Fontes e Formas de Coleta de Dados 131

Figura 5.2  Exemplo de formulário para coleta de dados na observação estruturada.

promocionais dos produtos concorrentes em relação às atividades dedicadas aos produtos da


empresa.
Observação não estruturada – A observação não estruturada é utilizada em pesquisas
em que o problema e os objetivos ainda não estão claramente definidos, e por isso há neces-
sidade de grande flexibilidade para analisar os comportamentos e as situações em observação.
A observação não estruturada é utilizada em pesquisas exploratórias e tem por objetivo
familiarizar o pesquisador com o problema em estudo, a fim de lhe permitir desenvolver
hipóteses de relações causais, especificações claras dos comportamentos observados, ou
situações, e ajudar na definição das categorizações para registrar o que será observado numa
observação estruturada.
Enquanto as observações estruturadas são facilmente tabuladas e analisadas, e há pouca
subjetividade em sua interpretação, as observações não estruturadas são de interpretação difícil
e carregadas de subjetividade.

Método da observação quanto ao grau de disfarce


Nesse caso, a observação pode ser disfarçada e não disfarçada. A diferenciação disfarçada/não
disfarçada é semelhante à que foi vista no método da comunicação e, basicamente, refere-se ao
grau em que a forma utilizada para observar permite aos observados saber que o estão sendo.
Observação disfarçada – Utiliza-se a observação disfarçada quando se pressupõe que o
conhecimento por parte do pesquisado de que está sendo observado pode induzi-lo a ter um
comportamento anormal. Espera-se que, numa situação de observação, o comportamento de
compra dos consumidores diante de uma prateleira de supermercados possa ser influenciado
se perceberem que estão sendo observados. O momento de escolha dos produtos, quando
feito em presença de estranhos, é de exposição social e, se o consumidor sentir que o com-
132 Pesquisa de Marketing

portamento para escolha ou a própria escolha possam expô-lo socialmente, é bem provável
que altere seu comportamento natural.
Para realizar a observação disfarçada, o observador deverá ficar oculto, fazer parte da situação
observada (passando também por consumidor) ou se utilizar de instrumentos mecânicos e
eletrônicos ocultos para registrar as observações e, posteriormente, proceder às interpretações
e análises.
Observe que, em qualquer das situações de observação disfarçada, fica a dúvida da questão
ética relacionada com a observação de pessoas sem seu devido consentimento e conhecimento.
Em respeito à ética, as pessoas observadas deveriam, ao menos depois, tomar conhecimento, e a
elas ser dada a oportunidade de consentir ou não na utilização do que foi observado. Parte do
Capítulo 15 se dedica à análise dos aspectos éticos e legais relacionados a pesquisas de marketing
e pesquisas em geral.
Observação não disfarçada – Deve ser utilizada quando o fato observado não envolver
comportamentos, quando o comportamento observado não for influenciado pela presença
do observador ou quando aspectos éticos ou legais impeçam a utilização da observação
disfarçada.

Método da observação quanto aos instrumentos utilizados


A observação quanto aos instrumentos utilizados classifica-se em: humana e por instrumentos
(mecânicos, elétricos ou eletrônicos).
Observação humana – É a forma mais simples de observação e consiste no registro de
informações sobre o observado apenas por meio de papel e caneta.
O maior problema desse método reside no fato de que o registro do observado depende
da capacidade de interpretação do observador. Muitas das interpretações dadas para um fato
dependem do nível cognitivo, dos sentimentos, dos valores e das crenças do observador.Veja
o problema no seguinte exemplo: numa partida de futebol, para um mesmo fato observado,
a queda de dois jogadores adversários dentro da grande área de um dos times, numa acirrada
disputa de bola. Parte da assistência viu na jogada uma falta que precisa ser punida com um
pênalti (coincidentemente, essa parte da assistência torce pelo time atacante), enquanto outra
parte considerou a jogada normal e que, portanto, não deve haver nenhuma punição ao time
defensor (coincidentemente, essa parte da assistência torce pelo time defensor). O fato foi
o mesmo, mas as interpretações, carregadas de emoção, foram não só diferentes, mas com-
pletamente opostas.
Para evitar que os fatos observados sejam interpretados por um único observador, usa-se
o registro, a fim de permitir que sua interpretação seja posteriormente feita por uma junta
de observadores.
Observação por instrumentos – Como visto no item anterior, em algumas situações
de marketing é mais adequado substituir a observação humana por outra forma de observação,
mecânica, elétrica ou eletrônica, que eleve a precisão dos dados, não iniba o observado e reduza
os custos necessários para determinada medição.
Os equipamentos disponíveis para o registro de observações compreendem: câmeras
fotográficas, câmeras de TV, audímetros (ou tevêmetros), gravadores de som, leitores óticos
nos caixas das lojas, psicogalvanômetros, câmeras de movimento dos olhos (oftalmógrafo),
pupilômetro e contadores de tráfego. Os mais utilizados em pesquisas de marketing têm sido
os cinco primeiros; a descrição dos demais é feita a título de curiosidade.
Tipos, Fontes e Formas de Coleta de Dados 133

Câmeras fotográficas – O registro visual dos fatos observados é feito de forma estática por
câmeras fotográficas e operadores ocultos.
Câmeras de TV – O registro visual e sonoro dos fatos é feito de forma dinâmica por uma
câmera de TV oculta, e a operação da câmera pode ser automática ou feita a distância por um
operador oculto. É um dos melhores instrumentos para a observação disfarçada.
Audímetros (ou tevêmetros) – Os audímetros, já mencionados no Capítulo 3, são utili-
zados para medir a audiência de TV. Consiste num aparelho que, acoplado ao televisor,
registra a cada 30 segundos se o televisor está ligado e em qual emissora. As versões
antigas desse aparelho faziam o registro em fitas perfuradas que, periodicamente, eram
recolhidas para tabulação e análise. A versão mais moderna permite a interligação, via
linha telefônica direta, do aparelho com uma central de processamento de dados; a coleta
e o envio dos dados para a central de processamento são feitos a cada 30 segundos e,
imediatamente, os dados sobre a audiência estão disponíveis (medição da audiência em
tempo real).
Gravadores de som – Foram muito utilizados para o registro de informações em sessões de
entrevista focalizada de grupos de consumidores, e serviam, junto com os dados taquigráficos,
para auxiliar o moderador a interpretar, analisar e elaborar o relatório da pesquisa. A gravação
apenas do som traz problemas para a interpretação, pois, no momento da análise, não há
condição de identificar quem falou o quê. Com a redução do tamanho das câmeras de TV e
com seu barateamento, é mais eficaz gravar as reuniões em vídeo do que apenas em áudio e,
por isso, os gravadores de som passaram a ser menos utilizados.
Leitores óticos nos caixas das lojas – Trata-se de um instrumento novo que está começando a
surgir no Brasil, com um potencial enorme para ser utilizado em pesquisas por observação. O
leitor ótico é um aparelho que substitui a digitação nos caixas das lojas. Ele lê diretamente o
código do produto impresso (chamado código de barras) em sua embalagem. O consumidor
recebe uma listagem dos itens adquiridos com o respectivo preço pago. O leitor ótico está
ligado diretamente a um computador central da cadeia de lojas, onde estão armazenados os
preços dos produtos e as quantidades estocadas, e permite o registro imediato das operações
enquanto estão sendo realizadas. O registro das operações é periodicamente consolidado e tem
-se à disposição o movimento de cada loja, por linha de produto, por produto e até mesmo por
item de produto. Além de ser um instrumento fantástico para a administração imediata das lojas,
oferece as seguintes possibilidades para pesquisas de marketing a um custo infinitamente baixo:
• Comparação imediata entre uma promoção que está sendo feita na loja com os resultados
sobre as vendas.
• Comparação imediata entre as participações de mercado de cada produto concorrente
que participa da mesma loja ou da mesma cadeia de lojas.
• Determinação de quais estratégias de preço, embalagem, propaganda e promoção de vendas
funcionam e quais não.
• Dispondo-se de um perfil dos habituais consumidores de uma loja, podem-se efetuar
cruzamentos entre esses perfis e os produtos consumidos, podendo-se inferir padrões de
consumo por classes socioeconômicas ou segmento de mercado.
Psicogalvanômetro – Também conhecido como detector de mentiras, é um aparelho que
mede a mudança na transpiração, por meio da qual se infere a reação emocional das pessoas
sujeitas a determinado estímulo. A emoção causada por determinada propaganda que esteja
sendo testada pode ser verificada por esse aparelho.
134 Pesquisa de Marketing

Câmera de movimento dos olhos (oftalmógrafos) – É utilizada para se determinar como uma
pessoa lê determinada propaganda impressa, uma página de revista ou jornal, embalagens etc.
As medidas são tomadas da sequência em que os movimentos de leitura são efetuados e do
tempo despendido em cada ponto do objeto lido. Parte-se do pressuposto de que se começa
a leitura pelos pontos que visualmente despertaram mais a atenção e se dedica mais tempo
à leitura dos pontos que despertaram o maior interesse do objeto lido. O oftalmógrafo é o
aparelho utilizado para a leitura do movimento dos olhos.
Pupilômetro – Mede a mudança no diâmetro da pupila dos olhos. Sabe-se que as pessoas
não têm controle sobre o diâmetro da abertura de suas pupilas. O instrumento pressupõe que,
à medida que as pessoas se interessam e têm reação favorável por determinado objeto, suas
pupilas aumentam de diâmetro. A dimensão do diâmetro dará uma dimensão da favorabilidade
da reação ao estímulo provocado.
Contadores de tráfego – Compreendem aparelhos manuais, mecânicos (catracas) ou ele-
trônicos que objetivam contar o número de pessoas que passam por determinado ponto ou
frequentam determinado local.

Método da observação quanto ao ambiente


A observação quanto ao ambiente classifica-se em natural e de laboratório.
Observação natural – Compreende observar o comportamento ou o fato no ambiente
natural em que ocorre. Essa condição sugere que o comportamento observado deverá ocorrer
da forma mais natural possível e, dessa forma, evitar a ocorrência de vieses.
Observação de laboratório – Compreende criar uma situação de marketing artificial
e observar o comportamento exibido pelos consumidores colocados nessa situação artificial.
Esse tipo de observação só deve ser usado quando for impossível a observação natural, ou
quando seus custos a tornarem proibitiva.

Método da observação quanto ao objeto observado


Esse método classifica-se em observação direta ou indireta.
Observação direta – Compreende observar o comportamento ou fato no momento
de sua ocorrência. Por exemplo, o consumidor está realizando uma compra e o processo de
observação está ocorrendo simultaneamente. A observação direta só é possível em comporta-
mentos ou fatos que ocorram em ambiente público e, por isso, sejam transparentes.
Observação indireta – Refere-se à observação de registros deixados por comporta-
mentos ou fatos passados. Naquelas situações em que é impossível observar diretamente um
comportamento, podem-se observar os possíveis efeitos por ele deixados e, a partir disso,
inferir conclusões sobre o próprio comportamento. Um exemplo da utilização desse método
é a pesquisa de lixo familiar para inferir padrões de compra e de uso de uma infinidade de
produtos no lar, algo parecido com “deixe-me observar seu lixo e eu lhe direi que tipo de
consumidor você é”.

Método da observação quanto à participação do observador


Aqui, a observação pode ser participativa ou não participativa.
Observação participativa – Existem certos temas de pesquisa e certas situações de
observações nas quais se o observador não estiver integrado ao grupo observado e/ou não
Tipos, Fontes e Formas de Coleta de Dados 135

fizer parte integrante da situação a ser observada, a pesquisa estará comprometida, pois os
comportamentos que se deseja observar não são realizados em lugares públicos acessíveis para
realizar observação não participativa (por exemplo: o consumo de drogas; como os operários
se comportam em relação ao trabalho). Para esses casos, a solução é o observador integrar a
situação ou o grupo observados.
Observação não participativa – É aquela em que o observador não faz parte do que
está sendo observado. É a forma mais usual de aplicar o método de observação.

RESUMO
Há quatro diferentes fontes básicas de dados em pesquisas de marketing: pesquisados, pessoas
que tenham informações sobre o pesquisado, situações similares e dados disponíveis.
A simulação consiste na criação de um modelo computacional de uma situação similar
àquela em que se deseja ganhar conhecimento.
Dados primários são aqueles que não foram antes coletados, estando ainda em posse dos
pesquisados, e que são coletados com o propósito de atender às necessidades específicas da
pesquisa em andamento.
Dados secundários são aqueles que já foram coletados, tabulados, ordenados e, às vezes, até
analisados, com propósitos outros ao de atender às necessidades da pesquisa em andamento e
que estão catalogados à disposição dos interessados.
A sequência na definição dos dados e das fontes de dados no processo de pesquisa de
marketing é a seguinte: definir os objetivos da pesquisa; especificar as necessidades de dados;
procurar dados secundários internos e externos; determinar as necessidades de dados primários;
e determinar as fontes de dados primários.
As fontes de dados secundários em pesquisas de marketing são: dados secundários internos,
publicações (gerais, governamentais e institucionais), governos (federal, estaduais e municipais),
instituições não governamentais (universidades, faculdades e centros de pesquisas, associações,
federações e sindicatos) e serviços padronizados de informações de marketing (do consumidor,
do varejo, do atacado, da indústria e dos meios de comunicação).
Os dados coletados são: características demográficas, socioeconômicas e de estilo de vida;
atitudes e opiniões; conscientização e conhecimento; motivações; comportamento passado e
presente; e intenções.
O método da comunicação consiste no questionamento, verbal ou escrito, dos respondentes
para a obtenção do dado desejado, que será fornecido por declaração, verbal ou escrita, do
próprio.
O método da observação consiste no registro de comportamentos, fatos e ações relaciona-
dos com o objetivo da pesquisa, e não envolve questionamentos e respostas, verbais ou escritas.
O método da entrevista é caracterizado pela existência de uma pessoa (entrevistador)
que fará a pergunta e anotará as respostas do pesquisado (entrevistado). A entrevista pode ser
realizada pessoalmente ou por telefone, e individualmente ou em grupo(s).
Os questionários autopreenchidos consistem no instrumento de coleta de dados ser lido
e respondido diretamente pelos pesquisados, não havendo a figura do entrevistador.
A observação estruturada é utilizada em pesquisas em que o problema e os objetivos já
estejam claramente definidos, a ponto de permitir uma especificação clara a priori dos compor-
tamentos ou situações que serão observados e de suas categorizações para registrar o observado.
136 Pesquisa de Marketing

A observação não estruturada é utilizada em pesquisas em que o problema e os objetivos


não estão ainda claramente definidos e, por isso, há necessidade de grande flexibilidade para
analisar os comportamentos e as situações em observação.
Utiliza-se a observação disfarçada quando se pressupõe que o conhecimento por parte do
pesquisado de que está sendo observado pode induzi-lo a ter um comportamento anormal.
A observação não disfarçada deve ser utilizada quando o fato observado não envolver
comportamentos, quando o comportamento observado não for influenciado pela presença do
observador ou quando aspectos éticos ou legais impeçam a utilização da observação disfarçada.
O método da observação quanto aos instrumentos utilizados classifica-se em: humana e
por instrumentos (mecânicos, elétricos ou eletrônicos).
A observação natural compreende observar o comportamento ou fato no ambiente natural
em que ele ocorre.
A observação de laboratório compreende criar uma situação de marketing artificial e
observar o comportamento exibido pelos consumidores colocados nessa situação artificial.
A observação direta compreende observar o comportamento ou fato no momento de
sua ocorrência.
A observação indireta refere-se à observação de registros deixados por comportamentos
ou fatos passados.
Na observação participativa, o observador participa do grupo ou da situação observados.
Na observação não participativa, o observador não participa da situação ou do grupo
observados.

QUESTÕES DE REVISÃO
1. Quais são as fontes básicas de dados em pesquisas de marketing?
2. No que consiste o processo de simulação como fonte de dados em marketing?
3. Qual a sequência a ser observada na busca de dados nas diversas fontes em pesquisas de
marketing?
4. Quais as vantagens e desvantagens dos dados secundários?
5. O que são dados secundários internos?
6. Quais são os tipos de dados primários possíveis de serem coletados em pesquisas de
marketing?
7. Apresente uma comparação entre as vantagens e as desvantagens dos métodos da comu-
nicação e da observação.
8. Dê um exemplo de uma questão típica de um instrumento estruturado não disfarçado.
9. Qual a utilização para marketing das entrevistas focalizadas de grupo?
10. Descreva como funciona a realização de uma entrevista focalizada de grupo. Quais são
suas principais vantagens e desvantagens?
11. Dê exemplos de três técnicas projetivas (não estruturadas disfarçadas) que possam ser
utilizadas em pesquisas de marketing.
12. Por que as técnicas estruturadas não disfarçadas são mais utilizadas em pesquisas de
marketing?
13. Faça uma comparação entre entrevista pessoal, entrevista por telefone e questionários
autopreenchidos por correios/fax/internet em relação a: tempo de aplicação, controle
amostral e índices de respostas.
Tipos, Fontes e Formas de Coleta de Dados 137

14. Faça um elenco das medidas necessárias para elevar o índice de resposta de uma pes-
quisa feita por meio de questionários autopreenchidos pelo correio.
15. Qual dos três métodos de aplicação (entrevista pessoal, entrevista por telefone e ques-
tionários autopreenchidos) apresenta maior fonte de viés devido a: questões de enten-
dimento difícil, influência do entrevistador e uniformidade das mensurações?
16. Apresente as diversas técnicas do método da observação quanto ao grau de disfarce.
17. Descreva três dos aparelhos utilizados para o registro de observações.

Trabalho – Parte 4
1. Faça uma lista de todas as possíveis fontes de dados secundários para seu tema de pesquisa.
2. Faça uma lista de todos os dados necessários para sua pesquisa. Para cada dado, coloque ao
lado a justificativa da necessidade de obtê-lo para solucionar o problema de pesquisa.
3. Faça um relatório avaliando as vantagens e as desvantagens da utilização em seu projeto
de pesquisa dos métodos da comunicação e da observação. Decida e justifique, em função
da avaliação efetuada, qual método pretende usar em sua pesquisa.

REFERÊNCIAS
ALMEIDA, Pergentino; WICHAUSER, Hilda. Proposta de reformulação do critério ABA/ABIPEME. Documento
de circulação restrita, jun. 1991.
CAMPBELL, D. T. The indirect assesment of social attitudes. Psychological Bulletin, n. 47, pp. 15-38, Jan. 1950.
CHURCHILL, JR., Gilbert A. Marketing research-methodological foundations. Insdale, Illinois: Driden, 1979.
CHORAFAS, Dimitris N. System and simulation. New York: Academy, 1965.
CROSSEN, Cynthia. O fundo falso das pesquisas: a ciência das verdades torcidas. Rio de Janeiro: Revan, 1996.
MATTAR, Fauze N. Estudo sobre estratificação social para utilização em marketing e pesquisas de marketing. Proposta de
novo modelo para estratificação socioeconômica.Tese (Livre-Docência) – Faculdade de Economia, Adminis-
tração e Contabilidade. São Paulo: Universidade de São Paulo, CA. 1 e 2, 1996.
MATTAR, Fauze N. SIM – Sistemas de Informação de Marketing. Revista Mercado Global, ano 12, pp. 24-45,
mar.-abr. 1986.
MATTAR, Fauze N.; SANTOS, Rubens da C. Análise contínua para a promoção de vendas. Revista Display, São
Paulo, ano 1, n. 5, pp. 28-30, maio/jun. 1982.
SELLTIZ, Claire; JAHODA, Marie, DEUTSCH, Morton, COOK, Stuart W. Métodos de pesquisas nas relações sociais.
São Paulo: Editora Pedagógica e Universitária - EPU. Editora da Universidade de São Paulo, 1974.
WILLIAMS, A. F.; WESCHLER, H. The mail survey: methods to minimize bias owing to incomplete response.
Sociological and Social Research, ano 54, pp. 533-535, July 1970.

Sites:
www.abep.org
www.acnielsen.com.br
www.ibge.com.br
www.ibope.com.br
www.ipsos-marplan.com.br
www.ivc.org.br
CAPÍTULO 6
Medidas e Instrumentos de Coleta
de Dados
Nem tudo o que pode ser contado conta, e nem tudo o que conta pode ser contado.
Albert Einstein

Objetivos
• Apresentar as principais fontes de erros amostrais e não amostrais em pesquisas de marketing.
• Mostrar o processo de medição em pesquisas de marketing.
• Descrever os tipos básicos de escalas utilizadas em pesquisas de marketing.
• Mostrar como construir um instrumento de coleta de dados bem estruturado.

Sumário ESCALAS DE AUTORRELATO PARA MEDIR ATITUDES


ERROS E VIESES EM PESQUISAS DE MARKETING Escalas nominais
Erros amostrais Escalas de avaliação
Erros não amostrais Escalas de ordenação
ERROS NA PREPARAÇÃO E NA COLETA Escalas comparativas
DE DADOS Escalas de diferencial semântico (Osgood)
Erros na amostragem Escalas Stapel
Erros de não resposta Escalas indiretas
Erros durante a coleta dos dados INSTRUMENTOS DE COLETA DE DADOS
MEDIDAS EM PESQUISAS DE MARKETING Importância do instrumento para a precisão dos
Processo de medição dados a coletar
TIPOS BÁSICOS DE ESCALAS Projeto do instrumento
Escala nominal Determinação dos dados a coletar
Escala ordinal Determinação do instrumento segundo
o método de administração
Escala intervalar
Redação da primeira versão do instrumento
Escala razão
Revisões e pré-testes
ATITUDES EM MARKETING
Redação final
Técnicas para medir atitudes

ERROS E VIESES EM PESQUISAS DE MARKETING


É inevitável erros em pesquisas, e um dos principais papéis do pesquisador é minimizar sua
ocorrência.
O erro total a que uma pesquisa está sujeita pode ser de dois tipos: erros amostrais
e erros não amostrais:

Erro total = Erros amostrais + Erros não amostrais


139
140 Pesquisa de Marketing

Este capítulo e o próximo são dedicados a como controlar, evitar e/ou reduzir os erros
que podem ocorrer durante a condução de pesquisas de marketing.

Erros amostrais
Os erros amostrais ocorrem única e exclusivamente em função do número de elementos
da amostra e do processo de seleção desses elementos; pela Teoria das Grandes Amos-
tras, os erros ocorrem ora num sentido, ora noutro. Se a amostra não for viesada, esses
erros tendem a se neutralizar e, quanto maior o tamanho da amostra, menores serão.
No Capítulo 7, quando for abordada a amostragem probabilística simples, será exposta
a essência dos erros amostrais.

Erros não amostrais


Os erros não amostrais são todos os erros cometidos durante o processo de pesquisa de
marketing que não sejam oriundos do tamanho e do processo de seleção da amostra.
No Capítulo 7, será visto que o erro amostral estará sob o controle do pesquisador quando a
amostragem for probabilística. Em relação aos erros não amostrais, o pesquisador não consegue
exercer nenhum controle. Esses erros não são mensuráveis e, ao contrário dos erros amostrais,
tendem a crescer à medida que cresce o tamanho da amostra. Eles introduzem vieses nos
resultados da pesquisa sobre os quais o pesquisador não tem nenhum conhecimento a respeito
de suas direções e dimensões.
Inúmeras são as fontes de erros não amostrais em pesquisas de marketing e ao pesquisador
cabe apenas tomar o máximo cuidado, durante as várias etapas e fases do processo, para mi-
nimizar sua ocorrência. A seguir, são apresentadas as principais fontes de erros não amostrais.
Definição errada do problema de pesquisa – Pela definição incorreta do problema de
pesquisa, todo o esforço é canalizado para a coleta de dados, que não contribuirá para sua solução.
Definição errada da população de pesquisa – Pela definição incorreta da população
de pesquisa, os dados serão colhidos em uma amostra que não pertence à população-alvo, e
os resultados obtidos serão totalmente viesados.
Definição parcial da população de pesquisa – A obtenção dos dados é efetuada
numa amostra colhida, apenas, em parte da população total da pesquisa.
Não resposta – Apesar de uma amostra ter sido planejada para ser probabilística,
durante o processo de coleta de dados, muitos elementos selecionados recusam-se a res-
ponder, não são encontrados, ou, após responderem, não autorizam a inclusão de suas
respostas etc. Em função dessas ocorrências, e dependendo de como foram projetadas
suas substituições, poderão surgir inúmeros erros não amostrais que tornarão a amostra
resultante não probabilística.
Instrumentos de coleta de dados – Instrumentos de coleta de dados mal cons-
truídos são grandes fontes de erros não amostrais. As perguntas podem estar redigidas
de tal forma que se obtenham respostas viesadas; as opções de respostas podem não estar
completas; pode não haver orientação adequada de como proceder para responder às
perguntas; a localização da pergunta pode estar errada; a resposta a uma pergunta pode
interferir nas respostas de outras etc.
Escalas – Muitas pesquisas dependem do desenvolvimento de escalas para realizar a
medição de determinadas variáveis. O desenvolvimento inadequado dessas escalas tende a
introduzir grandes vieses em seus resultados.
Medidas e Instrumentos de Coleta de Dados 141

Entrevistadores – Entrevistadores com nível inadequado para a pesquisa, não treinados,


sem orientação e supervisão no campo ou desonestos, que utilizam procedimentos para in-
fluenciar as respostas dos entrevistados, anotam as respostas em local errado do instrumento,
trocam o elemento sorteado ou respondem pelo entrevistado, geram inúmeros e grandes
vieses nos resultados.
Entrevistados – Inúmeros são os motivos que levam um entrevistado a não responder
ou responder de forma incorreta, insincera ou incompleta às perguntas numa pesquisa: não
dar a devida importância ao tema; estar, no momento, muito ocupado; estar preocupado com
outros assuntos; o assunto abordado é considerado confidencial ou o expõe socialmente; não
ter memorizado o que lhe é perguntado; não ter simpatia pelo patrocinador ou realizador da
pesquisa; ou ter se antipatizado com o entrevistador.
Inferências causais impróprias – Em projetos de pesquisas de relações causais, determi-
nado resultado pode ser erroneamente relacionado à determinada causa quando, na verdade,
inúmeras outras podem tê-lo influenciado.
Processamento – À medida que os questionários chegam do campo, os dados neles
contidos precisam ser preparados para a análise. Isso envolve codificá-los, digitar ou digitalizar
as respostas em arquivos eletrônicos e efetuar tabulações simples, cruzamentos, cálculos es-
tatísticos e representações gráficas. Em todas essas atividades, poderão ocorrer erros que irão
viesar os resultados.
Análises – Os erros que podem ser cometidos aqui são inúmeros, desde a utilização de
dados incorretos até a utilização de técnicas de análises estatísticas inadequadas para as variáveis
em estudo e para os objetivos da pesquisa.
Interpretação – Às vezes, o pesquisador tende a interpretar, consciente ou inconscien-
temente, os resultados da pesquisa segundo seus interesses (defesa de uma hipótese; defesa de
uma opinião; defesa de uma opção de decisão etc.).
Toda essa exposição sobre a ocorrência de erros não amostrais foi feita devido a seu es-
treito relacionamento com os erros cometidos durante a coleta dos dados. A coleta de dados
é uma das maiores fontes, se não a maior, de erros não amostrais.

ERROS NA PREPARAÇÃO E NA COLETA DE DADOS


Foi mostrado, na seção anterior, que inúmeros fatores contribuem para a ocorrência dos
erros não amostrais, e que, entre eles, os que mais contribuem são os erros cometidos durante
as operações de preparação e de coleta dos dados. As principais fontes de erros, durante a
preparação e a coleta de dados, são: erros na amostragem, erros de não resposta e erros durante
a coleta de dados.

Erros na amostragem
Os erros oriundos do processo de amostragem podem ocorrer por diversas razões: utilização
de processo de amostragem não probabilístico, utilização de listagens da população em estudo
incorretas ou incompletas e localização errada da unidade a ser pesquisada.
Processos de amostragens não probabilísticos – As amostragens não probabilís-
ticas trazem consigo, potencialmente, erros que estão fora do controle do pesquisador. Se o
pesquisador desejar ter total controle sobre a ocorrência de erros amostrais, deverá, neces-
sariamente, utilizar-se de amostragem probabilística na pesquisa.
142 Pesquisa de Marketing

Listagens incorretas – Mesmo tendo utilizado amostragem probabilística, poderão


ocorrer erros oriundos de listagens incorretas ou incompletas da população da pesquisa, caso
a listagem da população utilizada pelo pesquisador contenha erros do tipo: não inclusão de
algumas unidades ou até de seções inteiras (mapas de cidades desatualizados que não incluem
bairros inteiros; listas telefônicas que só incluem a população possuidora de telefone; listas
postais que não incluem parte da população de pesquisa), ou a multiplicação de ocorrência da
mesma unidade (listas telefônicas que apresentam a mesma unidade várias vezes, pois naquele
endereço existem vários telefones).
Localização errada da unidade a ser pesquisada – Às vezes, por falhas na descrição
ao entrevistador de campo quanto à correta localização das unidades a serem pesquisadas ou
por desobediência em seguir a regra de seleção estabelecida (notadamente, em pesquisas que
se utilizam de amostragem por conglomerados), acaba-se coletando dados de outras unidades
que não faziam parte da amostra, introduzindo-se, dessa forma, erros não controláveis.

Erros de não resposta


Os erros de não resposta surgem em função da impossibilidade de se obterem respostas
de elementos da amostra e constituem-se numa das maiores fontes de erros não amostrais
em pesquisas de marketing. As razões para a ocorrência de não respostas compreendem:
recusas, mudanças de endereço e ausência/ausência momentânea da pessoa com quem
a entrevista deve ser conduzida.
Existem alguns procedimentos que podem diminuir a ocorrência desses problemas:
1. Recusas:
• Documento apresentando os objetivos da pesquisa e a garantia de que os dados cole-
tados serão sigilosos (entrevista pessoal e questionários, e exposição oral, nos casos de
entrevistas telefônicas).
• Utilizar entrevistadores adequadamente selecionados e treinados (entrevistas pessoais
e telefônicas).
• Agendar previamente a entrevista, dependendo do tipo de entrevista/entrevistado e de
sua duração (entrevistas pessoais e telefônicas).
• Efetuar as visitações ou realizar os telefonemas em momentos mais adequados (do dia,
da semana, do mês e até do ano) para a maioria dos entrevistados, e, às vezes, se for o
caso, para determinado entrevistado.
• Estimular as respostas em recusas de questionários pelo correios/fax/internet, por meio
de um programa de estímulo a respostas.
2. Mudanças de endereços:
• Trabalhar com listagens atualizadas que se tenham mostrado corretas.
3. Ausências/ausências momentâneas:
• Agendar a entrevista com antecedência.
• Aguardar pelo entrevistado, se a previsão da ausência não for longa.
• Voltar em outra ocasião.
Para os casos de impossibilidade de realização da entrevista, oriundos de recusa efetiva, mudança
de endereço e ausência irrecuperável, deve-se providenciar, a priori, o sorteio de elementos da
população para atuarem como substitutos.
Caso essas providências não sejam tomadas, os erros de não resposta surgirão e poderão
manifestar-se de diferentes formas. A dificuldade dos erros de não resposta é que nunca se
Medidas e Instrumentos de Coleta de Dados 143

saberá se aqueles que não responderam o fariam de forma similar aos que responderam, e
é errôneo pressupor que a distribuição de opiniões entre respondentes e não respondentes
é a mesma sobre o assunto em estudo. Nos casos de entrevistas pessoais e telefônicas,
o problema não é tão grave, à medida que o controle exercido sobre o campo permite
que as não respostas sejam substituídas. A situação é mais grave no caso dos questionários
enviados por correios/fax/internet, em que o pesquisador não consegue exercer controle
adequado sobre as respostas, e o método não permite que substituições, correspondentes
às não respostas, sejam efetuadas. Por isso, são raras as pesquisas por correios/fax/internet
que não estejam seriamente comprometidas por erros de não resposta, sendo esta sua
principal fraqueza.

Erros durante a coleta dos dados


A última fonte de erro no campo ocorre no momento da coleta de dados. Grande parte das
formas de se evitar, ou minimizar, a ocorrência desse tipo de erro está relacionada com a
qualidade dos recursos humanos utilizados na pesquisa, já analisados neste capítulo. A seguir,
apresenta-se um resumo da relação de itens que devem ser trabalhados para reduzir a ocorrência
de erros na coleta de dados:
• Utilizar recursos humanos adequados às necessidades da pesquisa.
• Treinar adequadamente os entrevistadores.
• Em pesquisas mais complexas, elaborar manuais de instrução.
• Registrar, ao longo do instrumento de coleta de dados, orientações aos entrevistadores para
procedimentos corretos; quando se tratar de instrumento autopreenchível, as instruções
precisam ser detalhadamente esclarecidas, antes e ao longo do instrumento.
• Exercer constante controle de qualidade sobre a produção do campo.
• Verificar, por processos de amostragem, a veracidade das entrevistas realizadas.

MEDIDAS EM PESQUISAS DE MARKETING


A atividade de realizar medições é fundamental para a pesquisa de marketing. Em sua essência,
a atividade de pesquisa de marketing conclusiva (descritiva ou explicativa) consiste em realizar
medições. Exemplos de medições comuns feitas pela pesquisa de marketing:
• Medir a quantidade de consumidores que preferem um produto a outro(s).
• Descrever, por meio de medidas, quem são os consumidores de determinado produto em
relação a inúmeras características demográficas, socioeconômicas e psicológicas.
• Medir qual o potencial de mercado para determinado produto.
• Medir atitudes, comportamentos, percepções, preferências, intenções de compra etc.
Para realizar essas medições, o pesquisador precisa desenvolver instrumentos adequados para
que as medidas efetuadas correspondam efetivamente ao que se deseja medir (validade) e para
que o erro não amostral seja o menor possível (confiabilidade) diante dos recursos disponíveis.

Processo de medição
O processo de medição consiste em associar números a um objeto, os quais, segundo uma regra
estabelecida, passam a representar a quantidade de suas características ou atributos. Segundo esse
conceito, não se mede o objeto em si, mas suas características ou atributos. Por exemplo, não
se mede uma pessoa, mas sua renda, idade, sexo, nível de escolaridade, estado civil, número de
144 Pesquisa de Marketing

filhos, atitudes, comportamentos etc. Também segundo essa definição, está implícito que não
é possível utilizar todas as características do sistema numérico na análise dos dados obtidos,
mas restringi-las à regra que foi estabelecida.
Cada um dos quatro tipos básicos de escalas apresentadas no item seguinte está diretamente
relacionado com uma das quatro características do sistema numérico de 0 a 9; conhecer estas
características ajudará a compreender cada uma daquelas escalas. A primeira característica é a de
que cada número na série é único, representa uma quantidade diferente e há dez números. A
segunda é que existe uma convenção estabelecendo o ordenamento dos números, e é por essa
convenção que se sabe que 4 > 2 e que 9 > 7 etc. A terceira é que há um intervalo homogêneo
entre cada número na sequência, de tal forma que permite afirmar que o intervalo entre 3 e
5 é igual aos intervalos entre 7 e 9 e entre 1 e 3 etc.; pela mesma razão pode-se afirmar que
4 é quatro vezes maior que 1, 8 é duas vezes maior que 4 etc. A quarta e última característica
é a possibilidade de definir iguais proporções, como 8/4 = 6/3 = 4/2 etc.
A utilização de matemática ou estatística na manipulação de números envolve o uso de
uma ou mais dessas características do sistema numérico. Há uma grande tentação, ou um des-
conhecimento, que faz com que, na análise dos dados coletados, utilizem-se mais características
do sistema numérico do que a realidade dos dados coletados permite, invalidando as conclusões
que a partir daí se chegar. Para que esse problema não ocorra, é importante definir a priori
quais dessas quatro características estão presentes no fenômeno de marketing em estudo e que
vão condicionar o uso das escalas e as análises estatísticas que poderão ser feitas.

TIPOS BÁSICOS DE ESCALAS


Há quatro tipos básicos de escalas de medidas: nominal, ordinal, intervalar e razão. Cada uma
dessas escalas corresponde a uma das propriedades apresentadas na seção anterior para o sistema
numérico de 0 a 9. No Quadro 6.1, apresenta-se um resumo das características de cada uma,
sua utilização em pesquisas de marketing e quais estatísticas são possíveis de serem utilizadas.

Escala nominal
Uma escala nominal é aquela em que os números servem apenas para nomear, identificar e
(ou) categorizar dados sobre pessoas, objetos ou fatos. O número da Carteira de Identidade
(Registro Geral) é um exemplo de escala nominal, assim como os números das camisas dos
jogadores de um time de futebol, o número das placas dos veículos etc. Esses números não têm
nenhum outro significado a não ser o de identificar a pessoa ou o objeto associado ao número.
As escalas nominais são intensivamente utilizadas em pesquisas de marketing para nomear,
identificar e classificar variáveis como: marcas, cores, modelos, sexo, tipo de loja, regiões, usa/
não usa, gosta/não gosta, ocupação etc.Veja os seguintes exemplos:
Sexo:
__1. Masculino __2. Feminino
Cor preferida:
__1. Azul __2. Branco __3.Vermelho
__4. Amarelo __5.Verde __6. Preto
__7. Marrom __8. Outra. Qual?
Nos dois exemplos, observa-se que não há nenhum outro significado dos números atribuídos
a não ser o de associá-los aos “valores” das variáveis sexo e cor. Não se pode afirmar que, pelo
Medidas e Instrumentos de Coleta de Dados 145

fato de ao sexo feminino ter sido atribuído o número 2, este seja melhor que o masculino, ao qual
foi atribuído o número 1; analogamente, o marrom (7) não é melhor que as outras cores, nem o
azul (1) é pior que as outras. É possível, inclusive, trocar todos os números atribuídos a cada “valor”
das variáveis, pois nada mudará, desde que seja mantida a regra estabelecida até o final da pesquisa.

Quadro 6.1  Características das escalas básicas de medição


Escala Características Uso em pesquisas de marketing Estatísticas possíveis
Nominal Identidade Marcas, sexo, raças, cores, tipos de lojas, Moda
Definição regiões, usa/não usa, gosta/não gosta, e toda Porcentagens
única de variável que se possa associar números para Teste binomial
números identificação Teste Qui-quadrado
McNemar, Cochran
Q
Ordinal Ordem dos Atitudes, preferências, opiniões, classes Medianas
números sociais, ocupações Quartis
Decis
Percentis
Teste
Mann-Whitney
Teste U
Kruskal Wallis
Correlação de postos
Intervalar Comparação Atitudes, opiniões, conscientização, Média
de intervalos preferências, números-índices Intervalo
Amplitude total
Amplitude média
Desvio-médio
Variância
Desvio-padrão
Teste z
Teste t
Análise de variância
Correlação de
produto - momento
Razão Comparação Idade Todos os do item
de medidas Preço anterior e mais:
absolutas Número de consumidores Média geométrica
Comparação Volume de vendas Média harmônica
de proporções Renda Coeficiente de
Patrimônio variação

Com escalas nominais, a única operação possível é a contagem, e, por isso, a moda é a
única medida de tendência central que pode ser calculada. Não faz nenhum sentido calcular a
média em escalas nominais. Nos dois exemplos vistos, qual seria o significado da média entre
sexo masculino e feminino, ou da cor média obtida? Cuidado, pois, na tabulação eletrônica
dos dados, o computador trabalha apenas com números, e não saberá identificar qual o tipo
de escala a que o número se refere e calculará tudo o que lhe for pedido. É o pesquisador
146 Pesquisa de Marketing

que deve saber quais tipos de cálculos se aplicam ou não à variável em estudo. Alguns sistemas
de análise permitem definir a priori o tipo de escala que está sendo utilizada, restringindo os
cálculos estatísticos àqueles que o tipo de variável permitir.
Escala ordinal
Uma escala ordinal é aquela em que os números servem para, além de nomear, identificar
e (ou) categorizar, ordenar, segundo um processo de comparação, as pessoas, os objetos ou
fatos, em relação a determinada característica. Essa escala permite concluir que o produto de
marca A é melhor que o produto de marca B, segundo a preferência dos consumidores, mas
não permite saber quanto A é melhor que B. Um exemplo de escala ordinal é o seguinte: das
três versões do produto lava-roupa/amaciante/facilitador de passar líquido: A, B e C, responda
qual é sua preferência, em 1o, 2o e 3o lugares, em relação a:

Perfume Cor preferida


1° lugar: ________ 1° lugar: ________
2° lugar: ________ 2° lugar: ________
3° lugar: ________ 3° lugar: ________

Amacia melhor Lava melhor


1° lugar: ________ 1° lugar: ________
2° lugar: ________ 2° lugar: ________
3° lugar: ________ 3° lugar: ________

O resultado da tabulação do primeiro item dessa pergunta resultou na Tabela 6.1.


Tabela 6.1  Preferência ordenada entre as versões A, B e C de um lava-roupas/amaciante/facilitador de passar
líquido em relação ao perfume
Versão do produto Ordem de preferência para o perfume
Primeiro Segundo Terceiro Total
A 25 25% 40 40% 35 35% 100 100%
B 50 50% 35 35% 15 15% 100 100%
C 25 25% 25 25% 50 50% 100 100%
Total 100 100% 100 100% 100 100%

Neste exemplo, pode ser observada uma preferência nítida pelo produto B em relação
à característica perfume, porém não há condição de saber em que grau o perfume B é mais
agradável que A ou C.
As escalas ordinais são muito utilizadas em pesquisas de marketing sempre que se deseja
obter ordenamento das preferências, opiniões, atitudes e percepções dos consumidores.
Em escalas ordinais, as únicas medidas de tendência central que podem ser calculadas são
a moda e a mediana.
Escala intervalar
Uma escala intervalar é aquela em que os intervalos entre os números revelam a posição e
quanto as pessoas, os objetos ou fatos estão distantes entre si em relação a determinada carac-
terística. Essa característica da escala intervalar permite comparar diferenças entre as medições,
mas não permite concluir quanto à magnitude absoluta das medições. Um exemplo clássico
Medidas e Instrumentos de Coleta de Dados 147

de escala intervalar é aquela usada para medir temperaturas.Tome-se, como exemplo, a escala
Celsius (Centígrado). Se a temperatura durante o dia atingiu o máximo de 30 graus e durante
a noite atingiu um mínimo de 15 graus, ao comparar as duas temperaturas, a única conclusão
que se pode tirar é que: a temperatura durante o dia foi mais elevada do que a noite em 15
graus centígrados. Por se tratar de uma escala intervalar, é um erro concluir que durante
o dia a temperatura foi o dobro da temperatura da noite. Para mostrar a evidência desse
erro, basta utilizar a escala Fahrenheit para indicar as mesmas temperaturas. Usando a fórmula
de transformação F = (9C + 160)/5, obtêm-se as medidas de 59 graus F e 86 graus F, res-
pectivamente, e a mesma diferença de 15 graus centígrados agora é representada por 27 graus
F, e a relação que existia na escala Celsius não permanece na escala Fahrenheit. Esse fato ocorre
com as escalas intervalares porque os “zeros” dessas escalas são estabelecidos arbitrariamente
e não correspondem ao zero absoluto da característica que se deseja medir. Somente tem-
peraturas medidas na escala Kelvin, cujo zero é aceito como absoluto (e corresponde a –273
graus Celsius), permitem a comparação de suas magnitudes absolutas.
Em pesquisas de marketing, as escalas intervalares são muito utilizadas para medir atitudes,
opiniões, conscientização e preferências em que a preocupação é estabelecer medidas relativas
e não absolutas. Uma utilização muito frequente das escalas intervalares é na construção de
números-índices, principalmente na Economia.
Nas escalas intervalares, a média, a moda e a mediana são medidas legítimas de tendência central.

Escala razão
A escala razão apresenta as mesmas propriedades da escala intervalar, com a vantagem de possuir
o zero absoluto. Em função disso, as medidas tomadas nessas escalas permitem concluir quanto
à sua magnitude absoluta, além de informar a posição e quanto as pessoas, os objetos ou fatos
estão distantes entre si em relação a determinada característica. Exemplos dessas escalas são a es-
cala Kelvin para medir temperaturas, a escala em gramas e quilogramas para medir pesos, a escala
métrica para medir distâncias etc. Nas escalas razão, é perfeitamente possível e correto comparar
as medições absolutas efetuadas das características e inferir conclusões sobre quanto uma medida
é maior ou menor que as outras. Dessa forma, o fato de uma pessoa A pesar 50kg e outra B pesar
100kg permite concluir que B pesa o dobro de A, pois os pesos foram medidos numa escala razão.
Em pesquisas de marketing, as escalas razão podem ser utilizadas sempre que seja possível
estabelecer a relação entre o zero absoluto da variável a ser medida e o zero da escala, e sempre
que as razões estabelecidas para a escala correspondam às razões do fenômeno de marketing a
ser medido. Um grande número de variáveis importantes de marketing podem ser medidas por
escalas razão, como: idade, preços, número de consumidores, número de lojas, quantidade de
produtos consumidos, número de vezes que o produto é comprado ao mês, valor das vendas,
renda dos consumidores, lucros. Em todos esses casos, existe um zero natural ou absoluto.
Nas escalas razão, a média, a média geométrica, a moda e a mediana são medidas legítimas
de tendência central.

ATITUDES EM MARKETING
Conhecer as atitudes dos clientes/consumidores em relação à empresa, aos seus produtos
e aos produtos concorrentes é de enorme importância para marketing. Todos os principais
modelos de comportamento do consumidor, dentre eles os de Nicosia (1966), Engel,
148 Pesquisa de Marketing

Kollat e Blackwell (1968) e Howard e Sheth (1969), atribuem importância fundamental


para as atitudes em função de seu papel influenciador do comportamento. As atitudes
condicionam não só o comportamento para compra, como também o comportamento
de pós-compra.
A atitude é um dos componentes influenciadores do comportamento. Para uma decisão
particular de compra, pode ocorrer que outros fatores tenham maior influência na decisão
do que a atitude. Um caso típico é o do consumidor que, mesmo tendo uma atitude negativa
em relação a determinada marca de produto, não resiste a uma oferta promocional e acaba
comprando-o. Não há evidências comprovadas da existência de um relacionamento direto
entre atitudes e comportamentos e, por isso, é preciso ser cauteloso na tomada de decisões
quanto a assumir que esse relacionamento existe. Mesmo com essa ressalva, o conhecimento
das atitudes dos consumidores ajuda os gerentes de marketing a:
• Prever comportamentos para compra.
• Prever comportamentos de pós-compra.
• Prever aceitações/rejeições de produtos e marcas.
• Tomar medidas para mudar atitudes desfavoráveis à empresa e aos seus produtos.
• Avaliar conceitos de novos produtos.
• Avaliar propagandas e promoções de vendas.
A atitude é um conceito extremamente complexo, e essa complexidade fica evidenciada
pelas inúmeras definições existentes. Apesar de ser muito utilizado em psicologia e em pes-
quisas de marketing, o conceito de atitude ainda é inconsistente entre os estudiosos. Existem
inúmeras definições, às vezes radicalmente diferentes, o que permite propor a seguinte:
Atitude é uma predisposição subliminar da pessoa, resultante de experiências anteriores,
da cognição e da afetividade, na determinação de sua reação comportamental em relação a
um produto, organização, pessoa, fato ou situação.
Porém, o que realmente importa é a conceituação de atitude, e não sua definição. Os seis
seguintes pontos ajudam a conceituar adequadamente o que vem a ser atitude:
1. Atitude representa uma predisposição para uma reação comportamental em relação a um
produto, organização, pessoa, fato ou situação e não é o comportamento propriamente
dito. A atitude tem a característica de fazer com que o consumidor fique de prontidão
para ter uma reação determinada em relação a certos estímulos.
2. Atitude é persistente no tempo. Ela pode ser mudada, mas qualquer tentativa de mudança
de uma atitude fortemente arraigada exige grande pressão por muito tempo.
3. Atitude produz comportamentos consistentes.
4. Atitude pode ser expressa de forma direcional. A avaliação da atitude em relação a um
objeto, organização, pessoa, fato ou situação pode ser obtida por meio da coleta da manifes-
tação de sentimentos a favor, contra ou neutros.
5. A atitude possui três principais componentes: componente cognitivo (crenças da pessoa
em relação a produtos, organizações, pessoas, fatos ou situações); componente afetivo
(sentimento das pessoas em relação a produtos, organizações, pessoas, fatos ou situações) e
componente comportamental (predisposição para uma reação comportamental em relação
a um produto, organização, pessoa, fato ou situação).
6. A formação de uma atitude é resultante de: crenças, reflexos condicionados, fixações,
julgamentos, estereótipos, experiências, exposições a comunicações persuasivas, trocas de
informações e experiências com outros indivíduos etc.
Medidas e Instrumentos de Coleta de Dados 149

Técnicas para medir atitudes


A medição de atitudes é muito complexa. Existem dois fatos relacionados com atitudes que
dificultam sua medição: as atitudes existem somente na mente das pessoas, não sendo direta-
mente observáveis, e a própria complexidade do conceito. Na seção anterior, foi visto que a
atitude é composta de três principais componentes. Qual desses componentes será medido: o
afetivo, o cognitivo, o comportamental ou todos os três? Decidido qual componente medir,
tem-se de decidir qual escala utilizar.
As escalas de atitude utilizadas em marketing procuram medir as crenças dos respondentes
em relação aos atributos do produto (componente cognitivo), seus sentimentos em relação às
qualidades esperadas desses atributos (componente afetivo), e uma combinação de crenças e
sentimentos é assumida para medir a intenção de compra (componente comportamental). Os
procedimentos para medir as atitudes dependem da obtenção de dados junto às pessoas cujas
atitudes são alvo dessa medição. Esses procedimentos compreendem dois grupos de técnicas:
as baseadas na observação e as baseadas na comunicação com as pessoas.
Técnicas da observação:
Comportamento aberto – As pessoas são colocadas numa situação artificial e seu padrão de
comportamento é observado. A partir do comportamento observado, são indeferidas con-
clusões a respeito de suas atitudes (crenças e sentimentos).
Reação psicológica – A técnica de medir a reação psicológica das pessoas foi explicada no
capítulo anterior. A medição de atitudes envolve a medição e a análise das reações das pessoas
por meio de instrumentos (psicogalvanômetros e pupilômetros), quando elas são colocadas
em determinadas situações.
Técnicas da comunicação:
Técnicas indiretas – As formas indiretas de medir atitudes compreendem a utilização das
técnicas não estruturadas disfarçadas do método da comunicação, vistas no capítulo anterior,
como: contar histórias, interpretação de papéis, completar histórias, completar sentenças, as-
sociação de palavras etc.
Desempenho da tarefa objetivo – Essa técnica consiste em solicitar às pessoas que relatem
informações reais a respeito do produto objeto da pesquisa. As respostas são analisadas, e in-
ferências a respeito da atitude dessas pessoas em relação ao produto são tomadas. Essa técnica
parte dos pressupostos de que nos relatos dessas pessoas estarão contidas suas atitudes em
relação ao objeto pesquisado e de que, em geral, as pessoas costumam lembrar mais as situações
ou os fatos em que as atitudes (principalmente crenças e sentimentos) são mais consistentes.
Autorrelato – É a técnica mais utilizada em pesquisa de marketing para a medição de atitudes.
Essa técnica consiste em solicitar às pessoas que respondam a um questionário contendo
questões a respeito de suas atitudes. Existem inúmeras escalas para a medição de atitudes
desenvolvidas para serem utilizadas neste método. A seção seguinte deste capítulo apresenta
uma série delas.

ESCALAS DE AUTORRELATO PARA MEDIR ATITUDES


As escalas de autorrelato são as mais utilizadas para medir atitudes em pesquisas de marketing,
em função de sua facilidade de aplicação e análise e de seu baixo custo. As escalas que serão
apresentadas têm em comum o fato de os dados serem obtidos de autorrelato, mas são muito
diferentes entre si em termos de sua construção, dos dados pesquisados e da forma de aplicação.
150 Pesquisa de Marketing

Escalas nominais
As escalas nominais para medir atitudes compreendem números que são associados às respostas
com o único objetivo de identificar as categorias de respostas para facilitar a digitação, o proces-
samento e a análise dos dados. Nessas escalas, as respostas das pessoas são classificadas em duas
ou mais categorias. É a mais simples das escalas. Exemplo de escala nominal para medir atitude:
Sua casa está equipada com lava-louça?
__1. Sim __2. Não __3. Não sei
Lava-louça é um objeto útil na cozinha?
__1. Sim __2. Não __3. Não sei

Escalas de avaliação
As escalas de avaliação são utilizadas para medir variáveis que envolvam escalas ordinais, in-
tervalares e razão. Uma escala de avaliação típica procura efetuar a medição do componente
afetivo da atitude. Solicita-se às pessoas que assinalem as posições numa escala contínua, ou
numa escala de categorias ordenadas, que correspondam às suas atitudes em relação ao que lhe
foi perguntado. As escalas de avaliação são as mais utilizadas para medir atitudes em pesquisas de
marketing. Existem três formas de construir uma escala de avaliação: gráfica, verbal e itemizada.
Escala de avaliação gráfica – Uma escala de avaliação gráfica compreende a apresen-
tação das opções de respostas às pessoas, desde o extremo mais favorável até o extremo mais
desfavorável, de forma visual contínua ou por figuras que representem categorias ordenadas.
A maneira de apresentar visualmente a escala depende da imaginação do pesquisador. Por
exemplo, para responder a uma questão do seguinte tipo:
Com relação aos serviços prestados em nosso hotel, qual é a sua opinião sobre:
• Recepção?
• Serviço de copa?
• Serviço de arrumadeira?
• Serviço de lavanderia?
• Serviço telefônico?
• Asseio e limpeza?
• Conforto?
• Localização?
• Café da manhã?
• Restaurante?
• Bar?
As opções de escalas gráficas que poderiam ser utilizadas estão na Figura 6.1.

Figura 6.1  Exemplos de escalas gráficas.


Medidas e Instrumentos de Coleta de Dados 151

A escala 1 apresenta um conjunto de três (ou cinco) expressões faciais que correspondem a
diversos graus de gostar/não gostar, e os respondentes devem ser solicitados a assinalar a expressão
facial que mais corresponda aos seus sentimentos e impressões em relação a cada item perguntado.
A escala 2 apresenta um conjunto de três setas, uma seta para cima representando aprovação,
uma seta horizontal representando indiferença e uma seta para baixo representando desaprovação.
Os respondentes são solicitados a assinalar, para cada item perguntado, a seta que corresponde aos
seus sentimentos e impressões em relação a cada item.
A escala 3 apresenta uma reta contínua que vai desde o ponto de extrema desaprovação,
representado por um sinal negativo, passa por um ponto de indiferença, representado pelo zero,
e vai até o ponto de máxima aprovação, representado pelo sinal positivo. Os respondentes são
solicitados a assinalar um ponto nessa reta que corresponda a seus sentimentos e impressões em
relação a cada item. Após os dados terem sido coletados, o pesquisador dividirá esse contínuo
em categorias, às quais associará números para permitir a tabulação. A escala 3 apresenta uma
vantagem sobre as outras duas, que é permitir aos respondentes posicionarem-se numa escala
contínua, em vez de obrigá-los a se posicionar em pontos predeterminados. Porém, apresenta
a desvantagem de, ao permitir que cada respondente faça sua própria divisão da escala, tornar
difícil justificar a comparação de respostas entre os respondentes.
Escala de avaliação verbal – Uma escala de avaliação verbal compreende a apresentação
das opções de respostas às pessoas, desde o extremo mais favorável até o extremo mais des-
favorável, pela identificação e ordenação das categorias por meio de expressões verbais.
Um exemplo de escala verbal de avaliação para as mesmas questões do item anterior
poderia ser a seguinte:
__Muito favorável
__Um pouco favorável
__Indiferente
__Um pouco desfavorável
__Muito desfavorável
Um segundo exemplo, muito utilizado para avaliações de filmes, programas de televisão,
propagandas, produtos e serviços, é a seguinte escala:

___ Péssimo; ___ Ruim; ___Regular; ___ Bom; ___ Ótimo; ___ Não sei
Na construção de escalas verbais, é importante ter cuidado em relação aos seguintes itens:
número de categorias, número par ou ímpar de categorias, escalas forçadas versus escalas não
forçadas, escala balanceada versus escala não balanceada e numeração versus não numeração
das categorias. A seguir, discute-se cada uma dessas questões.
Não há um número predeterminado de categorias, mas geralmente é utilizado um mínimo
de três e um máximo de sete. Os estudiosos argumentam que mais de sete categorias con-
fundem os respondentes sem incrementar a precisão da medição e menos de três inviabiliza
qualquer medição. Como, em termos de custo e de aplicação, tanto faz utilizar uma escala
com três ou cinco categorias, os pesquisadores têm preferido usar escalas de cinco, mesmo
porque sempre será possível durante o processamento, se for necessário, reduzir uma escala
de cinco pontos para três, enquanto o inverso é impossível. Além disso, uma escala de cinco
categorias permite analisar melhor as nuanças pró ou contra do que uma de três. As escalas
de sete categorias são utilizadas apenas para medir situações em que se deseja captar pequenas
152 Pesquisa de Marketing

nuanças na medição de atitudes. Quanto maior o número de categorias, maior deverá ser o
número de respondentes para que haja densidade estatística nas respostas.
A escala deve ter um número ímpar ou par de categorias? Os respondentes devem ser forçados
a se classificar nas categorias ou não? Escalas com número ímpar de categorias possuem um ponto
neutro, enquanto aquelas com núm­ero par não o possuem. Algumas escalas apresentam a opção
“não sei” ou “não tenho opinião a respeito”, enquanto outras não.Alguns estudiosos argumentam
que, em escalas com ponto neutro e em escalas com a opção “não sei”, há uma tendência a muitos
respondentes se posicionarem nesses pontos (por comodidade, por não desejarem se expor ou por
terem dúvidas), enquanto nas escalas sem ponto neutro e sem a opção “não sei” são obrigados
a tomar posições expressando certo grau de sentimento pró ou contra. No entanto, há outros
estudiosos que defendem posição exatamente oposta, no sentido de que os respondentes nunca
devem ser forçados, sob pena de se obterem respostas viesadas. As escalas sempre devem oferecer
a opção neutra e conter a opção “não sei” ou “não tenho opinião formada a respeito”.
Uma escala pode ser balanceada ou não, ou seja, pode ter o mesmo número de categorias
pró e contra, ou não. A decisão de utilizar escalas balanceadas ou não depende de como se
distribuem as respostas à variável que está sendo medida. Se a distribuição tende mais para o
lado favorável, mais categorias para medir a favorabilidade deveriam existir, e vice-versa. O
argumento para a utilização de escalas não balanceadas é que, se a distribuição das respostas
tende mais para um lado do que para outro, ganha-se informação ao determinar com mais
precisão o grau de favorabilidade ou desfavorabilidade. A maior dificuldade em seu uso é a
necessidade de se saber a priori para que lado tendem as respostas. Na ausência dessa informação,
é preciso, efetivamente, usar escalas balanceadas.
Escalas de avaliação itemizada – Nesse tipo de escala, o respondente é solicitado a escolher
uma categoria dentre várias categorias de expressões verbais de opiniões sob determinado
tópico que forma uma escala, desde a opinião mais desfavorável até a mais favorável. Exemplo:

Com relação ao produto lava-roupas/amaciante líquido testado, qual das frases


está mais de acordo com sua opinião:
___Eu não acreditava no produto desde o começo e por isso não o usei.
___Eu não acreditava no produto desde o começo e seu uso confirmou as minhas suspeitas.
___Eu acreditei no produto no início, mas seu uso me decepcionou.
___Eu não acreditava no produto, mas seu uso me surpreendeu.
___Eu acreditei no produto desde o início e fiquei muito satisfeita com seu uso.
___Ainda não formei opinião a respeito.
É mais difícil trabalhar esse tipo de escala verbal devido à subjetividade das expressões utilizadas. Não
é raro, nesse tipo de escala, os respondentes não encontrarem opções de expressões de atitudes que
coincidam com as suas. Uma forma de reduzir esse problema é fazer com que um grande número
de pessoas participe da criação da escala e, antes de ser utilizada, seja pré-testada inúmeras vezes, a
fim de verificar sua consistência.
Escalas de ordenação
As escalas de ordenação consistem em solicitar aos respondentes que ordenem ou classifiquem
os objetos de acordo com suas atitudes em relação a eles.
As escalas de ordenação são muito utilizadas em marketing, pois apresentam inúmeras
vantagens. São de concepção simples, fáceis de aplicar, e o processo de obter a informação é
muito similar ao próprio processo de decisão de compra.
Medidas e Instrumentos de Coleta de Dados 153

Essas escalas apresentam algumas importantes restrições. Produzem apenas dados ordinais que
permitem saber a ordem de preferências, mas não a distância entre essas preferências. Além disso,
como a técnica força o respondente a ordenar determinado conjunto de objetos, pode ocorrer
de, mesmo não gostando nem preferindo nenhum deles, o respondente os ordene segundo um
critério do que desgosta menos para o que desgosta mais, em vez de utilizar o critério do que
gosta mais para o que gosta menos. O Quadro 6.2 apresenta um exemplo de escala de ordenação.

Quadro 6.2  Exemplo de escala de ordenação


Ordene as quatro principais marcas de automóveis fabricados no Brasil, segundo a sua opinião,
em relação a cada um dos atributos
Utilize a seguinte legenda: Ford = FD, General Motors = GM,Volkswagen = VW e Fiat = FT
Atributo 1° lugar 2° lugar 3° lugar 4° lugar
Qualidade _______ _______ _______ _______
Economia de combustível _______ _______ _______ _______
Economia de manutenção _______ _______ _______ _______
Durabilidade _______ _______ _______ _______
Acabamento _______ _______ _______ _______
Desempenho _______ _______ _______ _______
Segurança _______ _______ _______ _______
Confiança na marca _______ _______ _______ _______
Valor de revenda _______ _______ _______ _______
Modelos modernos _______ _______ _______ _______
Qualidade da assistência técnica _______ _______ _______ _______

Ao final da tabulação dos dados, ter-se-á uma tabela apresentando as frequências com que,
para cada atributo pesquisado, cada marca apareceu em 1o, 2o, 3o e 4o lugares. Alguns pesquisado-
res costumam atribuir arbitrariamente uma pontuação inversa, conforme a posição. Por exemplo,
para a posição 1a atribuem 4 pontos, para a 2a, 3, para a 3a, 2, e para a 4a, 1. Tabulam todos os
dados com essas pontuações para chegar a um total geral de avaliação, no caso por marca. Essa
pontuação não tem significado algum e pode induzir o pesquisador a erros de interpretação
no total geral de avaliação, erros como afirmar que uma marca é x% melhor que outra etc. A
escala obtida é ordinal, e as análises devem ser feitas segundo suas propriedades e limitações.
Técnica de ordenação “Q” – A técnica de ordenação “Q” é outra forma de aplicação das
escalas de ordenação. Essa técnica consiste em registrar num conjunto de cartões os objetos
ou afirmações que se deseja que os respondentes ordenem, segundo sua preferência. Geral-
mente, recorre-se a essa técnica quando o número de objetos a ser ordenado é grande (de 9
a 15), e sua ordenação por outros métodos causaria fadiga e (ou) confusão aos respondentes.
O método consiste em fazer com que a ordenação seja feita passo a passo, justamente para
facilitar o julgamento do respondente. Num primeiro passo, solicita-se ao respondente dividir
os cartões em dois grupos de igual tamanho, um grupo com os cartões com os objetos que
ele considera os melhores (ou com cujas afirmações ele concorde ou concorde mais) e o
outro com os que considera os piores (ou de cujas afirmações discorde ou discorde menos).
A seguir, lhe é solicitado subdividir cada um desses dois grupos em outros dois, seguindo-se o
mesmo critério, e assim, sucessivamente, até chegar a uma ordenação final dos “n” objetos ou
afirmações. Quando o número de objetos do grupo a ser dividido for ímpar, o respondente
154 Pesquisa de Marketing

será solicitado a formar os grupos com diferença de uma unidade no tamanho. No Quadro 6.3,
é apresentado o esquema da técnica de ordenação “Q”.

Quadro 6.3  Esquema de utilização da técnica de ordenamento “Q”


1. Objetos a serem ordenados
2. Primeiro ordenamento: 2 grupos
3. Segundo ordenamento: 4 grupos
4. Terceiro ordenamento: 8 grupos
5. Ordenamento final
1 (A B C D E F G H I J K L)
2 (A D G I J L) (B C E F H K)
3 (D J L) (A G I) (B F H) (C E K)
4 (D L) (J) (G I) (A) (H B) (F) (E K) (C)
5 L D J G I A B H F K E C

A técnica de ordenação “Q” é pouco utilizada em marketing, pela dificuldade de sua


aplicação na prática. Toma-se muito tempo dos respondentes para que façam os vários orde-
namentos. Além disso, leva-se muito tempo para o registro da sequência final de ordenação.
Escalas comparativas
As escalas comparativas de avaliação resultam de um julgamento relativo que os respondentes
são solicitados a fazer antes de fornecerem suas opiniões. Seu procedimento compreende
solicitar aos respondentes que expressem suas atitudes mediante comparação com um padrão
de referência estabelecido. O padrão de referência pode ser a marca utilizada, a marca líder
do mercado, a marca do concorrente, a versão corrente do produto e até mesmo um produto
hipoteticamente ideal. As escalas comparativas são utilizadas sempre que conhecer a atitude
comparativa a um padrão de referência for fundamental para a tomada de decisão em marketing.
No Quadro 6.4, é apresentado um exemplo de escala comparativa.

Quadro 6.4  Exemplo de escala comparativa


Com relação às marcas de café A e B, qual a sua opinião sobre a marca B, comparativamente à
marca A, em relação aos seguintes atributos:
Atributo Pior que A Igual a A Melhor que A Não sei
Pureza _______ _______ _______ _______
Sabor _______ _______ _______ _______
Aroma _______ _______ _______ _______
Qualidade _______ _______ _______ _______
Textura _______ _______ _______ _______
Torrefação _______ _______ _______ _______
Embalagem _______ _______ _______ _______
Marca _______ _______ _______ _______

É muito fácil construir e aplicar as escalas comparativas e, por isso, são muito utilizadas
em pesquisas de marketing.
Escalas de comparação pareada – Foi visto, na seção anterior, apenas o caso de
comparação de uma marca com outra, mas, conforme a necessidade da pesquisa, talvez seja
Medidas e Instrumentos de Coleta de Dados 155

preciso comparar várias marcas entre si. Nas escalas de comparação pareada, os respondentes
são solicitados a comparar dois objetos (produtos, marcas, propagandas etc.) de cada vez, de
um conjunto de vários objetos, em relação às suas opiniões sobre os objetos ou sobre vários
de seus atributos. O procedimento compreende que os respondentes comparem todos os
possíveis pares de objetos do conjunto apresentado. Assim, para um grupo de quatro marcas,
os respondentes terão de comparar C4,2 = 6 pares; para um grupo de cinco marcas, terão de
comparar C5,2 = 10 pares, para 10 marcas, terão C10,2 = 45 pares a comparar.
As escalas de comparação pareadas são utilizadas sempre que conhecer as atitudes comparativas
dos consumidores em relação aos vários produtos ou marcas existentes no mercado for fundamental
para a tomada de decisão em marketing. Essas escalas são muito utilizadas em pesquisas de mar-
keting, tendo em vista a sua simplicidade de aplicação e a sua facilidade de análise e interpretação.
No entanto, a rápida expansão do número de pares a comparar, à medida que cresce o número
do conjunto a ser comparado, dificulta enormemente o trabalho de campo e gera fadiga nos res-
pondentes. Esse fato limita a utilização dessa escala à comparação de, no máximo, cinco objetos,
sendo que o ideal é três. Quando o número de marcas ou produtos a comparar for muito grande,
uma escala de ordenação simples será mais adequada. Exemplo de escala de comparação pareada:
Aponte a marca preferida entre cada par das marcas A, B, C e D da categoria
de produto X:
1. ___A comparada com ___B
2. ___A comparada com ___C
3. ___A comparada com ___D
4. ___B comparada com ___C
5. ___C comparada com ___D
6. ___D comparada com ___B
Na Tabela 6.2, apresenta-se um exemplo típico de resultado da tabulação de dados obtidos
de escalas de comparação pareada.
A transformação dos resultados da Tabela 6.2 em dados ordinais é feita atribuindo-se o
valor 1 para as células que tenham porcentagem maior que 50%, e 0 para aquelas com menor
ou igual a 50%. O relacionamento ordinal entre essas marcas será representado pela soma das
pontuações nas linhas. A matriz da transformação desses dados, numa escala ordinal, está na
Tabela 6.3. Assim, em relação às marcas pesquisadas, as atitudes dos consumidores apresentaram
Tabela 6.2  Exemplo típico de resultado da tabulação de dados obtidos de escalas de comparação pareada
A (%) B (%) C (%) D (%)
A - 85 98 86
B 15 - 68 36
C 2 32 - 10
D 14 64 90 -

Tabela 6.3  Matriz de transformação dos dados em uma escala ordinal


Marcas preferidas na comparação
A B C D Totais
A - 1 1 1 3
B 0 - 1 0 1
C 0 0 - 0 0
D 0 1 1 - 2
156 Pesquisa de Marketing

a seguinte sequência de preferência: marca A (3 pontos), marca D (2 pontos), marca B (1 ponto)


e marca C (0 ponto). Por se tratar de uma escala ordinal, nenhuma conclusão a respeito das
proporções das diferenças entre as marcas poderá ser inferida.
Note que os resultados da Tabela 6.2 referem-se à porcentagem de respondentes que
preferiram a marca da linha (que serviu de padrão de comparação), quando comparada com
as marcas na coluna.
Escalas de diferencial semântico (Osgood)
As escalas de diferencial semântico foram propostas por Osgood, Suci e Tannenbaum (1957)
e consistem em que o respondente avalie determinado objeto num conjunto de escalas
bipolares de sete pontos. Osgood e seus companheiros propuseram, na ocasião, 50 diferentes
adjetivos bipolares para serem utilizados numa escala de diferencial semântico, sendo alguns
deles relativos à dimensão avaliativa: bom/mau, justo/injusto, limpo/sujo, valioso/sem valor;
relativos à dimensão potência: grande/pequeno, forte/fraco, pesado/leve; e relativos à dimensão
atividade: ativo/passivo, rápido/lento, vivo/morto. No entanto, raramente os pesquisadores de
marketing se atêm aos adjetivos sugeridos por Osgood, havendo, portanto, grande liberdade
de serem utilizadas quaisquer qualificações bipolares possíveis de serem atribuídas ao produto
ou objeto pesquisado. As escalas de diferencial semântico são exaustivamente utilizadas em
pesquisas de marketing e apresentam as vantagens de serem facilmente constituídas, aplicadas,
analisadas e seus resultados rapidamente comunicados.
É possível atribuir ou não valores numéricos para os sete pontos da escala. Se não forem
atribuídos valores numéricos, a escala só poderá ser analisada como ordinal; se forem atribuídos
números aos pontos da escala (e os mesmos exibidos aos respondentes), assume-se que os
julgamentos dos respondentes foram efetuados segundo uma escala de intervalo e, por isso, os
dados poderão ser analisados segundo as propriedades desse tipo de escala. Apesar de comum
na prática da pesquisa de marketing, a atribuição de valores numéricos para a escala tem
gerado muita controvérsia entre os estudiosos de escalas. Um exemplo de escala de diferencial
semântico está no Quadro 6.5.

Quadro 6.5  Exemplo de escala de diferencial semântico


Com relação à marca de café A, qual a sua opinião sobre os seguintes atributos:
Puro _______ ______________ _______ _______ _______ _______ Impuro
Forte _______ ______________ _______ _______ _______ _______ Fraco
Saboroso _______ ______________ _______ _______ _______ _______ Sem sabor
Sabor _______ ______________ _______ _______ _______ _______ Sabor comum
diferente
Aromático _______ ______________ _______ _______ _______ _______ Sem aroma
Alta _______ ______________ _______ _______ _______ _______ Baixa
qualidade qualidade
Barato _______ ______________ _______ _______ _______ _______ Caro
Bem torrado_______ ______________ _______ _______ _______ _______ Mal torrado
Embalagem _______ ______________ _______ _______ _______ _______ Embalagem
bonita feia
Produto _______ ______________ _______ _______ _______ _______ Produto antigo
moderno
Medidas e Instrumentos de Coleta de Dados 157

A aplicação da mesma escala para os produtos concorrentes permite a construção de


gráficos de análises comparativos entre as várias marcas, como o apresentado na Figura 6.2.

Figura 6.2  Padrão de gráfico de análise comparativa construído a partir de escala de diferencial semântico.

Segundo as colocações de Osgood, a construção de uma verdadeira escala de diferencial


semântico exige a participação de grande número de juízes para julgar a pertinência ou não de
cada adjetivo a ser utilizado na escala. Além disso, antes de aplicada, deveria ser exaustivamente
testada para verificar sua consistência. Na prática de pesquisas de marketing, em função dos
altos custos e do tempo consumido, raramente esses quesitos são realizados, ficando a cons-
trução da escala a critério exclusivo do pesquisador.
Escalas Stapel
As escalas Stapel são uma modificação das escalas de diferencial semântico. Suas diferenças
em relação a elas são: os pontos da escala são representados por números, e a escala possui
dez pontos. Os resultados da utilização dessa escala são semelhantes aos obtidos pela escala de
diferencial semântico. A análise dos dados obtidos segue os mesmos padrões dos obtidos numa
escala de diferencial semântico. É apresentado no Quadro 6.6 um exemplo de escala Stapel.

Quadro 6.6  Exemplo de escala Stapel


Avalie o café da marca A segundo a sua opinião:
Atributos Avaliação
Pureza −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Sabor −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Aroma −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Qualidade −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Textura −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Torrefação −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Embalagem −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
Marca −5 −4 −3 −2 −1 +1 +2 +3 +4 +5
158 Pesquisa de Marketing

Analogamente às escalas de diferencial semântico, a aplicação da mesma escala Stapel para


os produtos concorrentes permite a construção de gráficos de análises comparativos entre as
várias marcas, como o apresentado na Figura 6.3.

Figura 6.3  Padrão de gráfico de análise comparativa construído a partir de escala Stapel.

Escalas indiretas
Todas as escalas de automedição de atitudes que foram apresentadas até agora solicitam aos
respondentes que se posicionem numa escala diretamente relacionada com o que se pretende
medir. Veja que, no exemplo anterior, ao respondente são oferecidas escalas diretamente
relacionadas com os atributos que se pretende medir, como pureza, sabor, aroma etc. Apesar de
esta ser uma forma muito eficiente para se medirem as atitudes, alguns estudiosos argumentam
que, quando se tratar de questões controversas ou que envolvam a exposição de valores e
atitudes em relação a assuntos considerados íntimos, os pesquisados podem não ser sinceros ao
responder a escalas diretas. Para atender à necessidade de medição de atitudes nessas circuns-
tâncias, esses estudiosos desenvolveram as escalas indiretas.
As escalas indiretas combinam um conjunto de respostas dos entrevistados em relação ao
objeto em questão, a fim de determinar sua posição na escala de atitude desenvolvida.
A construção de uma escala indireta para medir atitudes é muito complexa, e isso tem
limitado seu uso correto em pesquisas de marketing. À semelhança das escalas de diferencial
semântico, pretensas escalas indiretas têm sido exaustivamente utilizadas em marketing, mas
raras são aquelas que foram desenvolvidas segundo os preceitos metodológicos de seus autores.
As escalas indiretas mais importantes por seu potencial de utilização em pesquisas de
marketing são: as escalas de intervalos aparentemente iguais de Thurstone e as escalas somatórias
de Likert.
Escala de intervalos aparentemente iguais de Thurstone – Essa escala, proposta por
Thurstone e Chave (1929), constitui-se num conjunto de declarações (cada declaração possui
um valor predefinido na escala) que são apresentadas aos respondentes para que concordem
ou discordem de cada uma delas. A colocação do respondente na escala resultará da média
aritmética dos valores correspondentes na escala obtidos por suas respostas concordantes. É
muito simples efetuar tanto a aplicação da escala quanto a análise dos dados. O maior problema
dessa escala está na dificuldade e na complexidade de sua construção, o que tem dificultado
o seu correto uso em pesquisas de marketing.
Medidas e Instrumentos de Coleta de Dados 159

A construção de uma escala de Thurstone compreende as seguintes etapas:


1. O pesquisador e sua equipe devem gerar um grande número (100 a 200) de afirmações ou
declarações relacionadas a atitudes no que diz respeito ao objeto em estudo. Estas afirmações
são geradas a partir das experiências do pesquisador e de sua equipe, de conversas com es-
pecialistas, de pesquisas exploratórias, de discussões de grupo focalizadas, da literatura etc.
2. Essas afirmações devem ser ordenadas e editadas de forma a eliminar ambiguidades, du-
plicidades, irrelevâncias, inadequações e afirmações que dizem respeito a fatos, e não a
opiniões. As afirmações resultantes devem ser anotadas em cartões.
3. Submeter as afirmações a um grande número de juízes (100 a 200), formado de preferência
por pessoas do público-alvo da pesquisa, para que avaliem cada afirmação em relação ao seu
conteúdo intrínseco de favorabilidade em relação ao objeto pesquisado, segundo o critério
próprio de cada juiz. Para operacionalizar essa classificação, são entregues, a cada juiz, todos
os cartões contendo as afirmações e solicita-se a cada um que os distribua por 11 diferentes
pilhas, desde a pilha para declarações que julgar menos favoráveis até a pilha para declarações
que julgar mais favoráveis, conforme o esquema apresentado no Quadro 6.7.

Quadro 6.7  Grau de favorabilidade da afirmação ou declaração


Grau de favorabilidade da afirmação ou declaração
Pequena Média Grande
Pilhas A B C D E F G H I J K

4. A partir da tabulação das respostas de todos os juízes para cada afirmação, o pesquisador
estará em condições de julgar se a afirmação deve ou não permanecer e, permanecendo,
qual será seu valor na escala.
A título de exemplo, será considerado apenas o resultado da tabulação de uma suposta
afirmação, a de número 32, de 100 afirmações submetidas a 200 juízes. Os resultados em
termos de frequência absoluta (Fab), frequência relativa (Frel) e frequência relativa acumulada
(Frel ac) estão na Tabela 6.4.
Tabela 6.4  Resultado da tabulação da afirmação número 32 submetida ao julgamento de 200 juízes
Grau de favorabilidade da afirmação ou declaração
Pequena Média Grande
Pilhas: A B C D E F G H I J K
Escala: 1 2 3 4 5 6 7 8 9 10 11
Fab 0 0 0 0 10 10 14 32 84 34 16
Frel 0,00 0,00 0,00 0,00 0,05 0,05 0.07 0,16 0,42 0,17 0,08
Frel ac 0,00 0,00 0,00 0,00 0,05 0,10 0,17 0,33 0,75 0,92 1,00
O valor dessa declaração na escala será o correspondente à sua mediana, cujo cálculo é
dado pela seguinte fórmula:
Qn = v + (Q − Frel ac ) / Frel
Em que:
Qn = O valor do quartil que se deseja calcular
160 Pesquisa de Marketing

Sendo:
Q1 = 1o quartil, Q2 = 2o quartil = Mediana e Q3 = 3o quartil
v = é o valor médio do intervalo em que o quartil está situado
Q = é a frequência relativa acumulada do quartil a ser calculado
Assim:
Q = 0,25 para o 1o quartil, Q = 0,50 para a mediana e Q = 0,75 para o 3o quartil
Frel ac = é a frequência relativa acumulada até a classe anterior do quartil considerado
Frel = é a frequência relativa da classe onde o quartil está situado
Portanto, para o cálculo da mediana dos dados, tem-se:
Q 2 = 8, 5 + ( 0, 50 − 0, 33) / 0, 42 = 8, 90
Em conclusão, o valor da afirmação de número 32 na escala que está sendo construída é 8,90.
Esse procedimento deverá ser efetuado para todas as afirmações (no caso, 100) submetidas
aos juízes. Quando ocorrer de mais de uma afirmação ter valor aproximadamente igual na
escala, deve-se estabelecer um critério para ficar apenas com uma delas. O critério sugerido
é que seja calculada a distância (L) entre os 3os e os 1os quartis de cada uma: a afirmação que
apresentar menor L deverá permanecer na escala, enquanto as demais deverão ser abandonadas.
Para o exemplo apresentado, o cálculo de L é o seguinte:
L = Q3 – Q1
Q3 = 8,5 + (0,75 – 0,33)/0,42 = 9,5
Q1 = 7,5 + (0,25 – 0,17)/0,16 = 8,0
L = 1,5
5. Para aplicar a escala, as afirmações são posicionadas de forma aleatória no instrumento de
coleta de dados e apresentadas aos respondentes para que apenas assinalem se concordam
ou se discordam de cada uma das afirmações (note que não lhes é permitido atribuir graus
de concordância ou discordância). A medida da atitude de cada respondente na escala
é dada pelo cálculo da média aritmética dos valores correspondentes na escala, obtidos
apenas pelas suas respostas concordantes. Assim, num instrumento de coleta com 25
afirmações aplicadas a um respondente cujas respostas resultem em 15 discordantes e 10
concordantes, apenas as concordantes serão utilizadas para o cálculo da média aritmética
que posicionará a atitude daquele respondente na escala final. Supondo que o valor na
escala para cada uma das 10 afirmações concordantes fosse, por exemplo, 5,2; 8,3; 4,7;
7,3; 9,2; 8,0; 6,5; 7,0; 8,8 e 5,0, sua média aritmética é 7,0, e este será o ponto da escala
que corresponderá às suas atitudes.
Duas importantes críticas são feitas às escalas de Thurstone. A primeira é que, como são
consideradas para o cálculo da média apenas as respostas concordantes, pode ocorrer de
um respondente ter, tomando o exemplo anterior, respondido a apenas uma afirmação
concordante das 25 apresentadas e cujo valor na escala seja 7,0. Como só houve concor-
dância com essa afirmação, o método diz que, na escala final, a pontuação de sua atitude
será 7,0, ou seja, a mesma pontuação daquele outro que concordou com 10 afirmações.
Será correto afirmar que um e outro possuem a mesma atitude em relação ao objeto pes-
quisado? O bom senso faz acreditar que não. A segunda crítica diz respeito ao fato de ao
respondente não ser permitido indicar a intensidade de sua concordância ou discordância,
o que torna impossível captar, com essa escala, nuanças de concordância/discordância,
importantes para uma classificação da atitude de forma mais precisa. É apresentado no
Medidas e Instrumentos de Coleta de Dados 161

Quadro 6.8 um exemplo hipotético de uma escala de Thurstone para medir as atitudes de


consumidores em relação à marca de café A.

Quadro 6.8  Exemplo hipotético de uma escala de Thurstone


Assinale nas colunas da direita se você concorda ou discorda de cada uma das afirmações a
seguir em relação ao café A.
Afirmações Concordo Discordo
  1. É um café puro ______ ______
  2. É um café muito forte ______ ______
  3. É muito saboroso ______ ______
  4. Seu sabor é diferente e marcante ______ ______
  5. Seu aroma é delicioso ______ ______
  6. É feito com grãos de café de alta qualidade ______ ______
  7. É um café caro ______ ______
  8. É torrado no ponto certo ______ ______
  9. Sua embalagem protege o sabor ______ ______
10. Sua embalagem é bonita ______ ______
11. É um produto moderno ______ ______
12. É um produto que rende ______ ______

Vale lembrar que, numa escala verdadeira, para cada uma das 12 afirmações anteriores,
deverá haver um valor correspondente na escala para as respostas concordantes.
Escalas somatórias ou escalas Likert – As escalas somatórias para medir atitudes,
propostas por Rensis Likert (1932), à semelhança das escalas de intervalos aparentemente iguais
de Thurstone, compreendem uma série de afirmações relacionadas com o objeto pesquisado.
Diferentemente da escala de Thurstone, os respondentes são solicitados não só a concordarem
ou discordarem das afirmações, mas também a informar seu grau de concordância/discor-
dância. A cada célula de resposta, atribui-se um número que reflete a direção da atitude do
respondente em relação a cada afirmação. A pontuação total da atitude de cada respondente
é dada pela somatória das pontuações obtidas para cada afirmação. A escala de Likert evita as
críticas feitas à escala de Thurstone, ao medir a intensidade das concordâncias e discordâncias.
A construção da escala de Likert é, em parte, semelhante à de Thurstone, porém um pouco
mais simples. Os passos para a construção de uma escala Likert compreendem:
1. O pesquisador e sua equipe devem gerar um grande número (100 a 200) de afirmações
ou declarações relacionadas a atitudes com respeito ao objeto em estudo. Essas afirmações
são geradas a partir das experiências do pesquisador e de sua equipe, de conversas com
entendidos, de pesquisas exploratórias, de discussões de grupo focalizadas, da literatura etc.
2. Essas afirmações devem ser ordenadas e editadas de forma a eliminar ambiguidades, du-
plicidades, irrelevâncias, biadequacidades e afirmações que dizem respeito a fatos, e não
a opiniões. As afirmações devem ser classificadas em favoráveis e desfavoráveis. Para cada
afirmação, deverão ser atribuídos graus de favorabilidade e desfavorabilidade. Geralmente, o
conjunto de termos utilizados para atribuir esses graus de favorabilidade/desfavorabilidade
é um dos que se encontram no Quadro 6.9.
3. Submeter as afirmações a um grande grupo-piloto (100 a 200 pessoas), formado por
elementos do público-alvo da pesquisa. Aos componentes desse grupo, será solicitado que
162 Pesquisa de Marketing

respondam às afirmações, marcando o espaço correspondente ao seu grau de concordância/


discordância.

Quadro 6.9  Opções de conjuntos de termos para atribuir graus de favorabilidade/desfavorabilidade


Aprovo inteiramente Concordo totalmente
Aprovo Concordo em parte
Indeciso (ou Nem aprovo nem desaprovo) Indeciso (ou Nem concordo nem discordo)
Desaprovo Discordo em parte
Desaprovo inteiramente Discordo totalmente
Concordo inteiramente (ou totalmente) Concordo muito
Concordo Concordo pouco
Indeciso (ou Nem concordo nem discordo) Indeciso (ou Nem concordo nem discordo)
Discordo Discordo pouco
Discordo inteiramente (ou totalmente) Discordo muito

Aos vários graus de concordância/discordância, são atribuídos números para indicar a


direção da atitude do respondente. Geralmente, os números utilizados são 1 a 5, ou -2, -1,
0, 1 e 2. O conjunto de números utilizados não faz diferença em função das conclusões
a que se pretende chegar. O importante é que se atribuam corretamente os números às
respostas de afirmações positivas e negativas.
As associações com as respostas a afirmações positivas e negativas com os números adotados
devem ser feitas conforme mostra o Quadro 6.10.
4. O resultado da tabulação de todas as respostas, nesse grupo-piloto, para cada afirmação, é
utilizado para se proceder à redução das afirmações a apenas 20 ou 30 que sejam as mais
discriminadoras da atitude que se pretenda medir. O critério utilizado para proceder a esta
seleção parte do princípio de que indivíduos que têm uma atitude favorável para o objeto
em questão tendem a concordar com a maioria das afirmações positivas, a discordar da
maioria das afirmações negativas e vice-versa. Em função disso, todas as afirmações positivas
ou negativas que tiverem distribuição indefinida serão consideradas não discriminadoras
da atitude e deverão ser abandonadas.

Quadro 6.10  Esquema para atribuir números numa escala Likert


Tipo de afirmação Grau de concordância/ Valor da pontuação
discordância (-2 a 2) (1 a 5)
Favorável Concordo totalmente 2 5
ou positiva Concordo em parte 1 4
Indeciso 0 3
Discordo em parte -1 2
Discordo totalmente -2 1
Desfavorável Concordo totalmente -2 1
ou negativa Concordo em parte -1 2
Indeciso 0 3
Discordo em parte 1 4
Discordo totalmente 2 5
Medidas e Instrumentos de Coleta de Dados 163

Uma forma de proceder a essa seleção, apesar de discutível em termos metodológicos, pois
se calculam médias de variáveis que não o permitem, consiste em separar as respostas dos
pesquisados em grupos arbitrariamente definidos e comparar as do grupo mais concordante
de uma afirmação com a do grupo mais discordante. Supondo que o grupo-piloto fosse
composto por 200 pessoas, o conjunto de respostas obtidas para uma afirmação específica
poderia ser dividido, por exemplo, em quatro partes de 25% cada uma, e tomar-se-iam,
para comparar os 25% do grupo com respostas mais concordantes, os 25% com respostas
menos concordantes. Sempre que a diferença entre as médias de concordância e de dis-
cordância entre esses dois grupos for positiva, a afirmação será discriminadora e deverá
permanecer. Sempre que essa diferença for pequena, aproximando-se de zero, a afirmação
não será discriminadora e deverá ser abandonada. Veja um exemplo desse procedimento
no Quadro 6.11.

Quadro 6.11  Diferenças entre as médias dos grupos mais concordantes e menos concordantes para
determinada afirmação

Graus de concordância/ Escala Grupo favorável Grupo desfavorável


discordância x f f.x f f.x
Concordo inteiramente 2 26 52 2 4
Concordo em parte 1 16 16 8 8
Indeciso 0 4 0 16 0
Discordo em parte -1 4 -4 18 -18
Discordo totalmente -2 0 0 6 -12
Totais 50 64 50 -18
Média em cada grupo 1,28 -0,36
Diferença entre as médias -1,64 [1,28 - (-0,36)]

Nesse exemplo hipotético, a diferença de 1,64 entre as médias dos dois grupos significa
que a afirmação é discriminadora da atitude e deverá permanecer.
5. A aplicação da escala segue o mesmo procedimento da realizada no grupo-piloto.Todas as
afirmações selecionadas são distribuídas probabilisticamente pelo instrumento e solicita-se
aos respondentes que assinalem seus graus de concordância/discordância em relação a cada
uma.
6. A escala final para a colocação dos respondentes é constituída a partir do número de afir-
mações que constam do instrumento de coleta de dados e da escala de números que foram
atribuídos a cada categoria de intensidade de resposta. Supondo que o instrumento utilizado
tenha 20 afirmações e que a escala de números atribuídos tenha sido −2, −1, 0, 1 e 2, o
valor máximo da escala será 20 × 2 = 40, e o valor mínimo será 20 × (−2) = (−40). Se o
resultado obtido para determinado respondente for 25, pode-se concluir que a sua atitude
em relação ao objeto pesquisado é favorável em 25/40 (ou em 62,5%). O Quadro 6.12,
apresenta um exemplo de escala Likert.
Segundo Selltiz et al. (1974), as escalas do tipo Likert apresentam uma série de vantagens
em relação às do tipo Thurstone:
• Permitem o emprego de afirmações que não estão explicitamente ligadas à atitude estudada
e é possível incluir nelas qualquer item que se verifique, empiricamente, ser coerente com
o resultado total.
164 Pesquisa de Marketing

Quadro 6.12  Exemplo de escala Likert


Em relação à marca de café A, assinale seu grau de concordância ou discordância para
cada uma das afirmações a seguir:
Legenda:
CT = Concordo totalmente
C = Concordo
I = Indiferente
D = Discordo
DT = Discordo totalmente
  1. É um café puro CT C I D DT
  2. É um café forte CT C I D DT
  3. É muito saboroso CT C I D DT
  4. Seu sabor é diferente e CT C I D DT
marcante
  5. Seu aroma é delicioso CT C I D DT
  6. É feito com grãos de café de CT C I D DT
alta qualidade
  7. É um café caro CT C I D DT
  8. É torrado no ponto certo CT C I D DT
  9. Sua embalagem protege o sabor CT C I D DT
10. Sua embalagem é bonita CT C I D DT
11. É um produto moderno CT C I D DT
12. É um produto que rende CT C I D DT

• São de construção mais simples.


• Tendem a ser mais precisas, à medida que possuem um número de respostas alternativas
maior do que a de Thurstone.
• A amplitude de respostas permitidas apresenta informações mais precisas da opinião do
respondente em relação a cada afirmação.
Por outro lado, segundo esses mesmos autores citados, apresentam as seguintes desvantagens:
• A escala Likert é essencialmente uma escala ordinal e, por isso, não permite dizer quanto um
respondente é mais favorável que outro, nem medir quanto de mudança ocorre na atitude, após
a exposição dos respondentes a determinados eventos.
• Aplica-se à escala Likert, de forma mais intensa, a mesma crítica da escala Thurstone, de que
diferentes padrões de respostas podem conduzir a resultados na escala idênticos, o que leva a
duvidar se a mesma medição corresponde a atitudes idênticas.
As escalas apresentadas neste texto são as mais utilizadas em pesquisas de marketing,
segundo a literatura consultada e a vivência prática em pesquisas de marketing. Outros
modelos de escalas foram, e continuam sendo, desenvolvidos pelos estudiosos de pesquisas
de marketing, psicologia e sociologia, e terão grande utilidade futura em pesquisas de mar-
keting. São escalas mais complexas que ainda estão sendo testadas e cuja apresentação foge
aos objetivos deste livro-texto. Destas, as que oferecem grande potencial de utilização futura
em pesquisas de marketing são as escalas multidimensionais e as escalas de medição conjunta.
O leitor que tiver curiosidade em conhecê-las poderá recorrer à bibliografia apresentada ao
final deste capítulo.
Medidas e Instrumentos de Coleta de Dados 165

INSTRUMENTOS DE COLETA DE DADOS


O instrumento de coleta de dados é o documento no qual as perguntas e questões são
apresentadas aos respondentes e em que se registram os dados e as respostas obtidos. Todo o
trabalho de planejamento e execução das etapas iniciais do processo de pesquisa se consolida
no instrumento de coleta de dados. Chama-se genericamente de instrumento de coleta de
dados a todos os possíveis formulários utilizados para relacionar dados a serem coletados e
(ou) registrar os dados coletados, utilizando-se de qualquer das possíveis formas de adminis-
tração (questionário, formulário para anotações de observações, rol de tópicos a serem seguidos
durante uma entrevista de grupo focalizada etc.).

Importância do instrumento para a precisão dos dados a coletar


Conforme já mencionado no início deste capítulo, instrumentos de coleta de dados mal
elaborados, com questões dúbias, escalas incorretas, que apresentam dúvidas quanto à forma
de preenchimento, constituem uma das principais fontes de erros não amostrais. Portanto,
todo cuidado em sua construção e sua administração é fundamental para reduzir ao mínimo
a ocorrência de erros delas advindos.

Projeto do instrumento
O instrumento de coleta de dados mais utilizado em pesquisas de marketing é o questionário
(instrumento estruturado não disfarçado). Um questionário, geralmente, é formado de cinco
partes: (1) dados de identificação; (2) solicitação para cooperação; (3) instruções para a sua
utilização; (4) perguntas, questões e formas de registrar as respostas; e (5) dados para classificar
os elementos pesquisados.
Os dados de identificação ocupam normalmente a primeira parte do instrumento e com-
preendem: número do instrumento; nome do entrevistador; data, hora e local da entrevista; nome,
endereço e telefone do entrevistado ou número do seu código (quando for prometido sigilo).
A solicitação para cooperação, geralmente, é colocada no início do instrumento, antece-
dendo qualquer pergunta ou questão. As informações constantes da solicitação compreendem:
a empresa realizadora e (ou) a empresa patrocinadora da pesquisa, o nome do entrevistador,
os objetivos da pesquisa, promessa de anonimato, o tempo médio que tomará do respondente
e palavras solicitando a cooperação e antecipando agradecimentos, caso a cooperação seja
concedida.
As instruções para sua utilização compreendem todas as informações necessárias para o
correto preenchimento do instrumento. No tipo autopreenchível, essas instruções figuram ao
longo de todo o instrumento. Em instrumentos aplicados por entrevistadores, além das ins-
truções ao longo do instrumento, em pesquisas muito complexas, utiliza-se um documento à
parte, denominado Manual de Entrevistas, em que todas as informações e orientações, não só
do instrumento de coleta de dados, mas de toda a pesquisa, são passadas para os entrevistadores.
As perguntas, as questões e as formas de registrar as respostas constituem a essência do
instrumento e ocupam sua maior parte. O conteúdo das perguntas, a forma de redigi-las, a
sequência de sua apresentação no instrumento, o tipo de escala a utilizar, a forma de obtenção
das respostas etc. serão discutidos mais adiante, neste capítulo.
Os dados para classificar o elemento pesquisado são, geralmente, apresentados ao final do
instrumento, excetuando-se os casos em que essa classificação serve como filtro para definir
166 Pesquisa de Marketing

se cada candidato a respondente pertence ou não ao público-alvo da pesquisa e, portanto,


se deverá ou não ser entrevistado. A classificação pode envolver inúmeras variáveis, como:
gênero, idade, profissão, origem racial, comprador/não comprador, nível socioeconômico etc.
Quando a classificação for socioeconômica, geralmente recorre-se a critérios aceitos pela
comunidade interessada nos resultados da pesquisa ou de acordo com as determinações do
cliente. Um método aceito e muito utilizado no Brasil é o Critério Brasil www.abep.org já
mencionado no Capítulo 5.
O projeto e a construção de um instrumento de coleta de dados estão mais para arte do que
para ciência. Em sua construção, são importantes a sensibilidade, a experiência, o conhecimento
das opções de formas de perguntar e de utilizar escalas, além de uma grande dose de humildade
do pesquisador para submeter o instrumento à sugestão de outros e a submetê-lo a pré-teste,
tantas vezes quantas forem necessárias a fim de ter o instrumento refinado para a aplicação.
Para ajudar em sua construção, é possível identificar uma série de passos a serem seguidos; no
entanto, da mesma forma que ocorre em um processo de pesquisa, o projeto e a construção
de um instrumento de coleta de dados são circulares, e a execução de passos posteriores pode
implicar a reformulação e até a reconstrução de etapas anteriores.
O projeto e a construção de um instrumento de coleta de dados compreendem os se-
guintes passos (considerando-se, para a apresentação dos passos, um instrumento estruturado
não disfarçado, que é o mais completo de todos): (1) determinação dos dados a coletar; (2)
determinação do instrumento segundo o método de administração; (3) redação da primeira
versão do instrumento; (4) revisões e pré-testes; e (5) redação final. Essa sequência está no
Quadro 6.13.

Quadro 6.13  Sequência de passos para o projeto e construção de um instrumento de coleta de dados
1. Determinação dos dados a coletar.
2. Determinação do instrumento segundo o método de administração.
3. Redação da primeira versão do instrumento:
• Conteúdo das questões.
• Redação das questões.
• Forma de obtenção da resposta.
• Sequência das questões.
• Especificações de uso.
4. Revisões e pré-testes.
5. Redação final.

Determinação dos dados a coletar


A determinação dos dados a coletar é relativamente simples, desde que o pesquisador tenha sido
criterioso e preciso nos estágios anteriores do processo de pesquisa. O planejamento e a construção
de um instrumento de coleta de dados exigem um conhecimento profundo e preciso do que se
deseja da pesquisa, o que só é conseguido por meio de um grande envolvimento com o problema
que se pretenda resolver. Ao final do Capítulo 2, foi apresentado um esquema para amarrar todas
as etapas e fases de um processo de pesquisa até a construção do instrumento (Figura 2.3).
Seguindo o esquema proposto naquela figura, dificilmente o pesquisador deixará de
fazer constar itens no instrumento de coleta de dados que sejam necessários para atender
Medidas e Instrumentos de Coleta de Dados 167

aos objetivos da pesquisa, e que estejam estreitamente relacionados com as questões e (ou)
hipóteses da pesquisa, e vice-versa.
Outra forma que ajuda o pesquisador a definir quais variáveis devem fazer parte do ins-
trumento é a construção de quadros de análise projetados, conforme já visto no Capítulo 2.
Segundo Selltiz et al. (1974), os dados procurados numa pesquisa devem enquadrar-se num
dos títulos da classificação apresentada no Quadro 6.14. O pesquisador, tendo em mente esse
quadro e os objetivos de sua pesquisa, deverá decidir sobre que tipos de dados deverá obter.

Quadro 6.14  Classificação do tipo de informação procurada em pesquisas de marketing


1. Relatos de fatos passados e presentes:
• Sobre a pessoa que responde:
   Dados pessoais. Exemplo: idade, estado civil, nível educacional, ocupação etc.
   Dados de comportamento: Exemplo: hábitos de consumo de produtos, hábitos de compra
e uso, hábitos de leituras etc.
• A respeito de outras pessoas conhecidas de quem responde:
   Dados pessoais e de comportamento: como no item anterior.
• Sobre acontecimentos e condições que a pessoa conhece:
   Relato de fatos, estilos de vida, papéis desempenhados no processo de compra etc.
2. Relato de opiniões, sentimentos, crenças, valores etc.
• Razões e motivos para comportamentos e atitudes específicos:
   Fatores objetivos: influência de outras pessoas, de condições e acontecimentos, de
propaganda e promoções de vendas, de atributos do produto etc.
   Fatores subjetivos: necessidades específicas, disposições e desejos subjacentes, avaliações,
significações etc.

Determinação do instrumento segundo o método de administração


Conforme foi visto no Capítulo 5, existe um grande número de formas de coletar os dados
segundo o método de administrar o instrumento. A decisão de que tipo de forma utilizar vai
depender de inúmeros fatores, como: tipo de pesquisa (exploratória ou conclusiva), tipo de
pessoa que será abrangido pela pesquisa (nível educacional, nível social), assunto da pesquisa,
disponibilidade de meios para administrar a pesquisa (se o correio/fax/internet funcionam
bem, se o público-alvo da pesquisa possui telefone, se é possível ter acesso pessoal ao público
pesquisado etc.) e tipo de análise e interpretação que se pretenda realizar com os dados. Nova-
mente, a experiência, o conhecimento e a sensibilidade do pesquisador são fundamentais para
a determinação correta de que instrumento será mais adequado para cada pesquisa específica.

Redação da primeira versão do instrumento


A redação de um instrumento de coleta de dados é um processo cíclico e interativo, e a
melhor maneira de começá-la é por meio da redação de uma primeira versão, em que,
tentativamente, procura-se redigir as perguntas e as formas de coletar as respostas, deixando o
refinamento para ser feito ao longo de todo o processo. A primeira versão deve ser elaborada
pelo pesquisador, que, em seguida, a submete aos demais participantes da equipe para ser
criticada, modificada, revisada, ampliada ou reduzida, até se chegar a uma versão em que
todos os membros da equipe estejam de acordo. Essa versão é a que deverá ser pré-testada.
168 Pesquisa de Marketing

Tanto para a redação da primeira versão do instrumento como para as revisões subse-
quentes, é importante conhecer o conteúdo das perguntas, as diferentes maneiras de redigir
uma pergunta, os diferentes formatos para se elaborarem as perguntas e obter as respostas e a
sequência mais adequada para a inserção das perguntas no instrumento. A seguir, apresenta-se
uma lista dos aspectos a serem considerados durante as elaborações e (ou) revisões dos ins-
trumentos de coleta de dados.
As próximas cinco seções foram baseadas no texto de Kornhauser e Sheatsley apud Selltiz
et al. (1974).
Decisões quanto ao conteúdo das perguntas:
1. Essa pergunta é necessária?
Qual a sua utilidade para os objetivos da pesquisa?
O assunto exige uma pergunta separada ou pode ser integrado a outras perguntas?
O assunto já não está adequadamente incluído em outras perguntas?
2. Há necessidade de fazer várias perguntas sobre esse assunto?
O assunto não é muito complexo para ser abordado em uma só pergunta?
Será que sua subdivisão não pode gerar maior número de perguntas mais simples, de
forma a facilitar o entendimento e a obtenção das respostas?
A pergunta abrange adequadamente o tópico? Será que todos os aspectos importantes
para a pesquisa sobre esse tópico serão obtidos da forma como a pergunta foi elaborada?
Em perguntas sobre opiniões, basta saber se a opinião é a favor ou contra, ou será
importante medir os graus de favorabilidade/desfavorabilidade?
3. As pessoas têm a informação necessária para responder a essa pergunta?
É um assunto que as pessoas podem descrever adequadamente?
A pergunta exige respostas que as pessoas não têm condições de responder, ou de res-
ponder de forma precisa?
O tópico em questão faz parte das experiências e (ou) do conhecimento da maioria
do público-alvo da pesquisa?
Quando se trata de pergunta sobre o comportamento passado, será que as pessoas têm
ainda viva na memória recordação suficiente para relatá-las com a precisão necessária
para a pesquisa?
Há outro grupo de pessoas no qual possam ser obtidos os mesmos dados de forma mais
adequada e precisa do que junto ao público-alvo inicial da pesquisa?
Será necessário ter diferentes versões da pergunta adaptadas aos diferentes públicos-alvo
da pesquisa?
4. A pergunta deve ser mais direta, objetiva e ligada à experiência da pessoa, ou indireta,
ampla e mais geral?
Está apresentada de forma excessivamente genérica?
Pode a informação ser mais facilmente obtida se for mais direta, objetiva e relacionada
com o comportamento da pessoa?
5. O conteúdo da pergunta tende a captar dados sobre situações momentâneas e específicas,
em vez de captar o que é típico no respondente?
6. O conteúdo da pergunta não estará viesado ou carregado em determinada direção, de
forma a causar vieses na obtenção das respostas?
A pergunta pode ser considerada neutra? Da forma como está elaborada será conside-
rada neutra por pessoas com opiniões opostas sobre o assunto?
Medidas e Instrumentos de Coleta de Dados 169

A pergunta contém opiniões ou prejulgamentos relacionados ao assunto abordado?


7. As pessoas estarão predispostas a fornecer o dado solicitado?
O tema abordado é muito íntimo, perturbador ou expõe socialmente as pessoas de
forma a provocar resistências, evasões, mentiras e insinceridades?
Quais as objeções que uma pessoa poderia ter para responder ao conteúdo desta per-
gunta?
Será que a pergunta não lhe dará a impressão de estar sendo exposta e examinada?
É possível obter o dado desejado de forma não ofensiva ou será melhor omiti-lo?
Imaginando a situação ambiental típica em que o instrumento será aplicado, será que
o conteúdo da pergunta não receberá objeções e resistências para se obter uma res-
posta sincera?
O conteúdo da pergunta tende a provocar desejos e reações emocionais que levarão
a uma resposta não verdadeira?
Decisões quanto à redação das questões:
1. A pergunta pode ser mal compreendida? Contém termos difíceis ou com significado dúbio
ou obscuro?
As palavras utilizadas são de domínio do público-alvo?
Estão sendo utilizados termos técnicos de uso exclusivo de atividades profissionais
específicas?
A redação da pergunta é simples e curta? Existe palavreado desnecessário? Existe algum
outro sentido que a pergunta pode ter para quem responde?
2. A pergunta exprime, de forma balanceada, todas as alternativas?
Será que não se está apresentando apenas um dos lados do tópico em estudo?
3. A pergunta, ou seu preâmbulo, deixa claro e uniforme o quadro de referência em que a
resposta deve ser dada?
A pergunta apresenta a base para a resposta?
A pergunta consegue deixar explícito que a resposta a ser dada refere-se ao que a pessoa
pensa ser a verdade, e não ao que ela deseja que seja a verdade?
4. A redação da pergunta está viesada? Está emocionalmente carregada ou deformada para
direcionar as respostas em determinado sentido?
Emprega termos do tipo “A opinião geral das pessoas é que...” para, em seguida, per-
guntar a opinião do respondente?
Emprega a opinião de pessoas famosas para, em seguida, perguntar a opinião do res-
pondente?
Emprega termos superlativos que sugestionam a resposta em determinado sentido?
5. A redação da pergunta tende a despertar objeções, de qualquer tipo, do respondente?
Uma redação solicitando diretamente a renda do respondente tende a ter mais objeções
do que outra que apenas solicite vários indicadores para, a partir deles, deduzir a classe
de renda do respondente (Critério Brasil, por exemplo).
6. Uma redação mais pessoal ou menos pessoal apresentaria melhores resultados?
7. Uma redação mais direta ou menos direta apresentaria melhores resultados?
Decisões quanto à forma de resposta à pergunta:
Conforme o tipo de dado solicitado e se o interesse maior está na quantificação ou na
qualificação do dado solicitado, o pesquisador deverá optar por uma das seguintes formas, ou
por uma combinação delas, de obtenção e registro de respostas às perguntas:
170 Pesquisa de Marketing

Perguntas com respostas:


• Abertas.
• Fechadas:
– Dicotômicas.
– Escolha múltipla.
– Escala.
Perguntas com respostas abertas – Nas perguntas com respostas abertas, os pesquisados
respondem às questões com suas próprias palavras (escrevendo ou falando).
Vantagens das perguntas com respostas abertas:
• Servem como uma excelente primeira questão para um tópico que será seguido de ques-
tões com respostas fechadas. A pergunta com resposta aberta estabelece um relacionamento
estreito e consegue a cooperação dos respondentes para as perguntas com respostas fechadas
que serão apresentadas.
• Influenciam menos os respondentes que as perguntas com respostas fechadas. Os res-
pondentes não são influenciados por um conjunto predeterminado de respostas e podem
expressar livremente suas impressões sobre a questão.
• Proporcionam aos pesquisadores comentários, explicações e esclarecimentos importantes
para a interpretação e a análise de perguntas com respostas fechadas.
• Não exigem muito tempo de preparação.
Desvantagens das perguntas com respostas abertas:
• Tempo e custo elevados e grande dificuldade de codificação. Em pesquisas com amostras
muito grandes, o tempo exigido para a leitura de cada resposta e sua codificação torna
praticamente inviável a utilização de perguntas com respostas abertas. Além de exigir pes-
soal altamente especializado para realizar a codificação, esta é extremamente demorada e
muito pouco precisa, pois depende da interpretação subjetiva de cada codificador. Mesmo
quando as possíveis respostas a uma pergunta aberta são pré-codificadas, o trabalho de
codificação apresenta inúmeras dificuldades.
• Quando aplicadas em forma de entrevistas, possuem um grande potencial de viés dos entrevis-
tadores. Raramente um entrevistador consegue registrar tudo que é respondido ou usar os
mesmos termos empregados pelos respondentes.As respostas são registradas de forma resumida
e segundo a “interpretação” do entrevistador.A forma de evitar essa fonte de viés é a gravação
das entrevistas (porém, a presença de um gravador poderá inibir muitos dos respondentes).
• Quando aplicadas em questionários autopreenchíveis, as perguntas com respostas abertas
trazem problemas no seu preenchimento para a grande maioria das pessoas que têm
dificuldades de redação. Além disso, as pessoas tendem a escrever de forma mais reduzida
do que se estivessem falando. Finalmente, há a dificuldade natural de se entenderem uma
infinidade de diferentes e, às vezes, ilegíveis caligrafias manuscritas.
Pelas vantagens, desvantagens e características das perguntas com respostas abertas, seu uso é
recomendado para as pesquisas exploratórias ou em pesquisas conclusivas para complementar,
explicar ou esclarecer dados obtidos em perguntas com respostas fechadas.
Perguntas com respostas fechadas – Nas perguntas com respostas fechadas, solicita-se
aos respondentes que escolham a(s) resposta(s) (verbalmente ou assinalando graficamente)
dentre um rol predeterminado de opções. As perguntas com respostas fechadas podem ser:
Dicotômicas – São chamadas de dicotômicas as perguntas com respostas fechadas que
apresentam apenas duas opções de resposta, como: sim/não, concordo/discordo, faço/não
Medidas e Instrumentos de Coleta de Dados 171

faço, sou/não sou, aprovo/desaprovo etc. Geralmente, além das duas alternativas bipolares,
oferece-se aos respondentes a alternativa “não sei” ou “não tenho opinião”.
Vantagens das perguntas com respostas dicotômicas:
• Sua aplicação, seu processamento e sua análise são fáceis e rápidos.
• Os respondentes consideram essas perguntas fáceis e rápidas de responder.
• Apresentam pouca possibilidade de erros.
Desvantagens das perguntas com respostas dicotômicas:
• Podem apresentar erro de medição, se o tema foi tratado de forma dicotômica, quando
na realidade apresentava diversas nuanças entre, por exemplo, a concordância total e a dis-
cordância total, conforme visto neste capítulo, quando foi abordada a construção de escalas
de atitudes.
• Questões com respostas dicotômicas são muito suscetíveis de erros sistemáticos, dependen-
do de como a pergunta é elaborada. Um exemplo deste problema seria a pergunta: “Você
compraria um automóvel Astra que fosse vendido pelo mesmo preço de um Celta?”
__Sim __Não __Não sei.
Escolha múltipla – Nas perguntas com respostas de escolha múltipla, solicita-se aos res-
pondentes que assinalem (verbal ou graficamente) uma única opção, um número limitado de
opções ou qualquer número de opções de respostas.
Na utilização de perguntas com respostas múltiplas, o pesquisador deve se preocupar com
dois aspectos: o número de alternativas oferecidas e os vieses de posição.
As alternativas oferecidas devem atender a dois princípios básicos: ser coletivamente
exaustivas e mutuamente exclusivas. As alternativas são coletivamente exaustivas quando
incluem todas as possíveis respostas alternativas. Para que esse princípio possa ser atendido,
é sempre conveniente incluir a alternativa: “Outros. Quais? ____”. As alternativas são mu-
tuamente exclusivas quando os respondentes conseguem identificar uma só alternativa que
claramente represente sua resposta. Por outro lado, em instrumentos aplicados por entrevis-
tadores, quando o número de alternativas for pequeno, as alternativas podem constar do
próprio instrumento e serem apresentadas aos respondentes verbalmente; porém, quando o
número de alternativas for grande (por exemplo, maior que quatro), ou quando o número
for pequeno, mas a redação for complexa e de difícil memorização, é melhor registrá-las
em cartões e, ao fazer a pergunta, apresentar ao entrevistado o cartão com todas as opções
de respostas.
O problema com os vieses de posição ocorre em função da tendência, quando se trata de
palavras, à escolha das opções de resposta que aparecem primeiro no leque de opções, em de-
trimento daquelas que aparecem mais para o final; quando se trata de números, essa tendência
de escolha de resposta passa a ser a do número que ocupa a posição central. Para controlar a
ocorrência desses vieses, é recomendável, durante a coleta de dados, alternar (rodiziar), a cada
respondente, de forma cíclica, a sequência de apresentação das opções de resposta. Em pes-
quisas com respostas autopreenchíveis e naquelas em que o entrevistador expõe verbalmente
as respostas, a alternância das opções de respostas deve vir impressa no próprio instrumento.
Nos casos em que se entrega ao entrevistado uma ficha contendo as opções de respostas, devem
ser elaboradas fichas com todas as sequências de ordenações possíveis e, a cada entrevista, o
entrevistador usa, sequencialmente, uma diferente. Essa prática cria um complicador a mais
no processo de aplicar e processar a pesquisa, mas é fundamental para exercer controle sobre
essa fonte de viés.
172 Pesquisa de Marketing

Vantagens das perguntas com respostas múltiplas (praticamente as mesmas das perguntas
com respostas dicotômicas):
• É fácil aplicá-las, processá-las e analisá-las.
• Os respondentes consideram essas perguntas fáceis e rápidas de responder.
• Apresentam pouca possibilidade de erros.
Desvantagens das perguntas com respostas múltiplas:
• Exigem muito tempo de preparação para que todas as opções de respostas sejam apresen-
tadas; consequentemente, o custo de preparação é elevado.
• Se alguma das possíveis opções de resposta não tiver sido previamente incluída no rol de
opções, fortes vieses podem ser introduzidos, mesmo quando for oferecida a opção “Outros.
Quais? ____”.
• Tendem a introduzir vieses nos dados pelo fato de as alternativas de respostas serem
oferecidas aos respondentes.
Escalas – Nas perguntas fechadas com respostas formando escalas, os respondentes são
solicitados a responder qual ponto da escala corresponde com mais exatidão à sua opinião
a respeito do que está sendo perguntado. As escalas já foram discutidas, exaustivamente, na
parte inicial deste capítulo.
Tendo conhecimento dessas várias alternativas de opções de respostas, o pesquisador estará
em condições de responder às seguintes perguntas para verificar se as questões e as opções de
respostas estão adequadas à sua pesquisa:
1. Qual a melhor forma de perguntar e obter a resposta para esse dado: pergunta com res-
posta aberta ou fechada, e, se a escolha for fechada, deve ser dicotômica, escolha única,
escolha múltipla (quantas opções de escolha) ou escala?
2. Quando se trata de perguntas com respostas múltiplas: será que estão sendo oferecidas todas
as alternativas significativas possíveis? Não estará havendo superposições? A ordem em que as
opções estão sendo oferecidas é adequada? A redação das opções é imparcial e equilibrada?
3. A forma de resposta é fácil, definida e adequada para o objetivo? A quantidade e a com-
plexidade de opções exigem cartões? As pré-tabulações das respostas devem figurar nas
opções de resposta ou isso pode ser uma fonte de viés?
Decisões quanto à sequência das perguntas no instrumento:
1. O questionário começa com uma pergunta simples e interessante, de forma a despertar a
atenção dos respondentes?
2. As perguntas estão colocadas de forma a atender à seguinte sequência: as questões mais fáceis e
de caráter geral aparecem antes, enquanto as mais difíceis e de caráter mais específico, depois?
3. As perguntas anteriores tendem a influenciar, pelo conteúdo, as respostas às perguntas
posteriores?
4. A colocação das perguntas segue uma ordem lógica e racional? A colocação das perguntas
nessa sequência pode causar alguma confusão, hesitação, frustração ou indecisão aos res-
pondentes? Há instruções suficientes, corretas e simples para explicar quando as respostas
de perguntas anteriores condicionam perguntas posteriores? Quais perguntas posteriores
são pertinentes e quais não?
5. Para auxiliar o pesquisador na colocação das perguntas numa sequência lógica e racional,
é interessante elaborar um roteiro do fluxo de perguntas e respostas, conforme o exemplo
apresentado na Figura 6.4.
6. A pergunta é apresentada de maneira natural? Está em ordem psicologicamente correta?
Medidas e Instrumentos de Coleta de Dados 173

Figura 6.4  Exemplo de fluxo de perguntas e respostas de um instrumento de coleta de dados.

Especificações do uso:
Complementando a redação do instrumento, o pesquisador deve explicitar as condições
adequadas para seu uso e aplicação, tanto no caso de instrumentos autopreenchíveis quanto
naqueles que utilizam entrevistadores. Instruções sobre como os entrevistadores devem
proceder no campo, como preencher os instrumentos, como abordar os respondentes etc.
deverão ser minuciosamente explicitadas.
É apresentada, a seguir, uma listagem exemplificativa de itens que devem constar na
elaboração de manuais de entrevistas, nas especificações do uso de instrumentos de coleta de
dados e no treinamento de entrevistadores:
1. Os entrevistadores devem ser orientados a nunca discutir com os entrevistados.
2. Os entrevistadores devem aceitar, naturalmente, todas as opiniões, e nunca demonstrar sur-
presa ou desaprovação, nem apresentar suas opiniões pessoais, tampouco sugerir possíveis
respostas a uma pergunta.
3. Os entrevistadores devem manter o controle da entrevista, desestimulando conversas des-
necessárias.
4. Quando se trata de instrumentos de coleta estruturados, os entrevistadores e (ou) os
respondentes precisam ser lembrados da importância de obedecer à sequência exata de
apresentação das perguntas. Aos entrevistadores, deve ser ainda lembrado que as perguntas
174 Pesquisa de Marketing

devem ser efetuadas sempre com as mesmas palavras com que foram escritas e que qualquer
explicação improvisada da pergunta é proibida.
5. Os entrevistadores devem ser orientados a efetuar todas as perguntas e a não tentar deduzir
as respostas de algumas em função das respostas de outras.
6. Os entrevistadores devem ser orientados a obter respostas específicas e completas a per-
guntas abertas.
7. Os entrevistadores devem ser orientados em relação ao processo de amostragem:
• Como proceder para a seleção de habitações.
• Como proceder caso haja recusas e ausências.
Revisões e pré-testes
Após ter sido construída a primeira versão do instrumento, procede-se a inúmeras revisões junto à
própria equipe de pesquisa, seguindo os preceitos apresentados na seção anterior. Uma vez concluídas
as revisões e, tendo a equipe toda concordado com a versão presente do instrumento, este pode ser
considerado pronto para ser pré-testado.
O pré-teste do instrumento consiste em saber como ele se comporta numa situação real
de coleta de dados. Os objetivos de um pré-teste de um instrumento de coleta de dados
consistem em verificar:
• Se os termos utilizados nas perguntas são de compreensão dos respondentes.
• Se as perguntas estão sendo entendidas como deveriam ser.
• Se as opções de respostas nas perguntas fechadas estão completas.
• Se a sequência das perguntas está correta.
• Se não há objeções na obtenção das respostas.
• Se a forma de apresentar a pergunta não está causando viés.
• O tempo para aplicar o instrumento.
O pré-teste é tão importante para o aprimoramento de um instrumento de coleta de
dados que nenhuma pesquisa deveria iniciar sem que o instrumento utilizado tivesse sido
convenientemente testado.
Os pré-testes podem ser realizados em diferentes estágios de amadurecimento de um ins-
trumento. Nos primeiros estágios, quando o instrumento ainda está em desenvolvimento, o
pré-teste poderá ser realizado pelo próprio pesquisador por meio de entrevista pessoal. Quando
o instrumento já estiver no estágio final, o pré-teste deverá ser feito usando exatamente a
mesma forma de aplicação que será usada na pesquisa. Nesse caso, poderá ser feito por entrevis-
tadores bem treinados. Em qualquer um dos casos, o teste deverá ser feito junto a respondentes
pertencentes à população-alvo da pesquisa.
Redação final
O resultado dos pré-testes servirá para efetuar a revisão final do instrumento. Se as alterações
sugeridas pelos pré-testes forem muito grandes, é importante que o instrumento seja nova-
mente testado, até não ser mais preciso efetuar grandes alterações. O número de pré-testes
a serem efetuados depende da complexidade do instrumento e de quanto ele já tenha sido
previamente elaborado. Para instrumentos que tenham sido suficientemente desenvolvidos
previamente, geralmente dois ou três pré-testes são suficientes.
Os pré-testes devem ser efetuados com versões digitadas do instrumento para possibilitar
revisões rápidas. Uma vez aprovado o instrumento nos pré-testes o pesquisador precisa tomar
decisões quanto às características físicas de apresentação, como: tipo de letra, qualidade do papel,
Medidas e Instrumentos de Coleta de Dados 175

cor da tinta, qualidade da impressão, espaço entre perguntas, espaço entre opções de respostas
etc. Principalmente em instrumentos autopreenchíveis, esses itens, que, a princípio, parecem
pouco relevantes, são, às vezes, fundamentais para ganhar a cooperação dos respondentes. Quanto
melhor apresentação tiver o questionário, quanto mais agradáveis forem suas cores e o formato
das letras, quanto mais bem-ordenadas estiverem as questões, maior será o índice de respostas.

RESUMO
Os erros em pesquisa de marketing podem ser amostrais (com origem no processo amostral
utilizado) ou não amostrais (com origem em diversos procedimentos errados ou equivocados
da pesquisa).
As fontes de erros não amostrais em pesquisa de marketing compreendem: definição
errada do problema de pesquisa, definição errada da população de pesquisa, definição parcial
da população da pesquisa, não resposta, instrumentos de coleta de dados, escalas, entrevis-
tadores, entrevistados, inferências causais impróprias, processamento, análises e interpretações.
As principais fontes de erros, durante a fase de coleta de dados, são: erros na amostragem,
erros de não resposta e erros durante a coleta de dados.
Os erros oriundos do processo de amostragem podem ocorrer por diversas razões: utilização
de processo de amostragem não probabilístico, utilização de listagens da população em estudo
incorretas ou incompletas e localização errada da unidade a ser pesquisada.
As razões para a ocorrência de não respostas compreendem: recusas, mudanças de endereço
e ausência/ausência momentânea da pessoa com a qual a entrevista deve ser conduzida.
A atividade de realizar medições é fundamental para a pesquisa de marketing. O processo
de medição consiste em associar números a um objeto. Esses números, segundo uma regra
estabelecida, passam a representar as quantidades de suas características ou atributos.
Escala nominal é aquela em que os números servem apenas para nomear, identificar e (ou)
categorizar dados sobre pessoas, objetos ou fatos.
Escala ordinal é aquela em que os números servem para, além de nomear, identificar e
(ou) categorizar, ordenar, segundo um processo de comparação, as pessoas, objetos ou fatos,
em relação a determinada característica.
Escala intervalar é aquela em que os intervalos entre os números revelam a posição e quanto
as pessoas, os objetos ou fatos estão distantes entre si em relação a determinada característica.
A escala razão possui as mesmas propriedades das escalas de intervalo, com a vantagem de
ter o zero absoluto.
Atitude é uma predisposição subliminar da pessoa, resultante de experiências anteriores, na
determinação de sua reação comportamental em relação a um produto, organização, pessoa,
fato ou situação.
As escalas de atitude utilizadas em marketing procuram medir as crenças dos respondentes
em relação aos atributos do produto (componente cognitivo) e seus sentimentos em relação
às qualidades esperadas desses atributos (componente afetivo). Por fim, uma combinação
de crenças e sentimentos é assumida para se medir a intenção de compra (componente
comportamental).
As escalas nominais para medir atitudes compreendem números que são associados às res-
postas com o único objetivo de identificar as categorias de respostas para facilitar a digitação,
o processamento e a análise dos dados.
176 Pesquisa de Marketing

As escalas de avaliação são utilizadas para medir variáveis que envolvem escalas ordinais,
intervalares e razão. Uma escala de avaliação típica procura efetuar a medição do componente
afetivo da atitude. Solicita-se às pessoas que assinalem as posições numa escala contínua ou
numa escala de categorias ordenadas, que correspondam às suas atitudes em relação ao per-
guntado.
As escalas de ordenação compreendem solicitar aos respondentes que ordenem ou clas-
sifiquem os objetos segundo suas atitudes em relação a eles.
As escalas comparativas de avaliação resultam de um julgamento relativo que os respon-
dentes são solicitados a fazer antes de fornecer sua opinião. Seu procedimento compreende
solicitar aos respondentes que expressem suas atitudes mediante comparação com um padrão
de referência estabelecido.
Nas escalas de comparação pareada, solicita-se aos respondentes que comparem dois objetos
(produtos, marcas, propagandas etc.) de cada vez, de um conjunto de vários objetos, em relação
às suas opiniões sobre os objetos ou sobre vários de seus atributos.
As escalas de diferencial semântico consistem em que o respondente avalie determinado
objeto num conjunto de escalas bipolares de sete pontos.
As escalas indiretas compreendem a combinação de um conjunto de respostas dos entrevis-
tados em relação ao objeto em questão, a fim de determinar sua posição atitudinal.
Escala de intervalos aparentemente iguais (Thurstone) constitui-se num conjunto de
declarações (cada declaração tem um valor predefinido na escala) que são apresentadas aos
respondentes para que concordem ou discordem de cada uma.
As escalas somatórias para medir atitudes (Likert), à semelhança das escalas de intervalos
aparentemente iguais (Thurstone), compreendem uma série de afirmações relacionadas com
o objeto pesquisado que são apresentadas aos respondentes.
O instrumento de coleta de dados é o documento por meio do qual as perguntas e ques-
tões são apresentadas ou formuladas aos respondentes, onde se registram as respostas e os
dados obtidos.
Instrumentos de coleta de dados mal elaborados, com questões dúbias, escalas incorretas,
que apresentam dúvidas quanto ao seu preenchimento, constituem uma das principais fontes
de erros não amostrais.
O instrumento de coleta de dados mais utilizado em pesquisas de marketing é o questionário.
Um questionário, em geral, é formado de cinco partes: dados de identificação; solicitação para coo-
peração; instruções para a sua utilização; perguntas, questões e formas de registrar as respostas; e dados
para classificar os elementos pesquisados.
O projeto e a construção de um instrumento de coleta de dados compreendem os seguintes
passos (considerando para a apresentação dos passos um questionário estruturado não dis-
farçado, que é o mais completo de todos): determinação dos dados a coletar; determinação do
instrumento segundo o método de administração; redação da primeira versão do instrumento;
revisões e pré-testes; e redação final.
Durante o processo de redação e revisões do instrumento, devem ser observadas decisões
quanto a: conteúdo das questões, redação das questões, forma de obtenção de resposta,
sequência das questões e especificações do uso.
O pré-teste do instrumento consiste em saber como ele se comporta numa situação
real de coleta de dados. Os objetivos do pré-teste de um instrumento de coleta de dados
são: verificar se os termos utilizados nas perguntas são de compreensão dos respondentes;
Medidas e Instrumentos de Coleta de Dados 177

verificar se as perguntas estão sendo entendidas como deveriam ser; verificar se as opções
de respostas nas perguntas fechadas estão completas; verificar se a sequência das perguntas
está correta; verificar se não há objeções à obtenção das respostas; verificar se a forma de
apresentar a pergunta não está causando viés e qual o tempo para aplicar o instrumento.

QUESTÕES DE REVISÃO
1. O que são erros amostrais? E erros não amostrais? Explique e dê exemplos de cada um
deles.
2. Quais são as principais fontes de erros não amostrais?
3. No que consiste realizar medições em pesquisas de marketing?
4. Quais são as quatro escalas básicas de medições em pesquisas de marketing? Faça uma
distinção de cada uma e dê exemplos de fenômenos de marketing possíveis de serem
medidos por meio de cada uma. Dê exemplos de cada uma dessas escalas que estejam
sendo aplicadas em pesquisas de marketing.
5. O que é atitude? Como se forma a atitude? Quais são os componentes da atitude?
6. Por que medir atitudes é um processo muito difícil? O que as escalas de atitude procuram
medir?
7. Explique como funcionam as seguintes escalas e técnicas utilizadas para efetuar medições
em marketing, dando exemplos:
8. Escala nominal.
9. Escala de avaliação gráfica.
10. Escala de avaliação verbal.
11. Escala de avaliação itemizada.
12. Escala de ordenação.
13. Técnica de ordenação “Q”.
14. Escala comparativa.
15. Escala de comparação pareada.
16. Escala de diferencial semântico.
17. Escala Stapel.
18. Escala indireta.
19. Quais os passos para se construir uma escala Thurstone de intervalos aparentemente
iguais para medir atitudes? Como são colocadas na escala as respostas dos pesquisados?
20. Quais são os passos para se construir uma escala somatória de Likert que meça atitudes?
Como são colocadas na escala as respostas dos pesquisados?
21. Faça uma comparação entre as escalas de Thurstone e de Likert e aponte as vantagens e
desvantagens de uma e outra para serem utilizadas em pesquisas de marketing.
22. O que é um instrumento de coleta de dados e qual a sua importância no processo de
pesquisa de marketing?
23. Quais são as partes componentes de um instrumento de coleta de dados? Descreva cada
uma delas.
24. Quais os passos e sua sequência para o planejamento e a construção de um instrumento
de coleta de dados? Por que esse processo é cíclico?
25. O que o pesquisador precisa saber para determinar quais dados deverão ser coletados
por um instrumento de coleta?
178 Pesquisa de Marketing

26. Qual a forma prática de “amarrar” o problema da pesquisa, o seu objetivo, as questões
e hipóteses, as variáveis e dados a serem coletados, os indicadores das variáveis e as per-
guntas e itens do instrumento de coleta de dados de uma pesquisa de marketing?
27. Qual a classificação dos dados possíveis de serem investigados numa pesquisa de marketing?
28. Quais aspectos devem ser considerados na redação de um instrumento de coleta de dados
relacionados à redação das questões, à forma de obtenção de respostas e à sequência das
questões?
29. Quais as vantagens e desvantagens de perguntas com respostas: abertas, fechadas dicotô-
micas e fechadas com escolha múltipla?
30. O que é o pré-teste? Em que condições os pré-testes devem ser realizados?

Trabalho – Parte 5
Projete, construa, revise pessoalmente e, em seguida, com um grupo de colegas o instrumento
para a coleta de dados de seu projeto de pesquisa. Em seguida, faça um pré-teste e revise-o
quantas vezes forem necessárias até o pré-teste indicar que o instrumento está adequado para
ser aplicado.

REFERÊNCIAS
ENGEL, J. F.; KOLLAT, D.T.; BLACKWELL, R. D. Consumer behavior. 3. ed. Hinsdalle, Ill: Dryden, 1968.
HOWARD, J. R.; SHETH, J. N. The theory of buyer behavior. New York: John Wiley, 1969.
KORNHAUSER, Arthur; SHEATSLEY, Paul B. Construção de questionário e modelo de entrevista.
In: SELLTIZ, Claire; JAHODA, Marie; DEUSTSCH, Norton; COOK, Stuart W. Métodos de pesquisas
nas relações sociais. São Paulo: Editora Pedagógica e Universitária – EPU. Editora da Universidade
de São Paulo, 1974.
LIKERT, Rensis. A technique for measurement of attitudes. Archives of Psychology, n° 140, 1932.
NICOSIA, F. M. Consumer decision process: marketing and advertising implications. Englewood Cliffs,
N.J: Prentice Hall, 1966.
OSGOOD, Charle E.; SUCI, George J.; TANNENBAUM, Percy H. The measuring of meaning. Cham-
paign, Ill: University of Illinois Press, 1957.
SELLTIZ, Claire; JAHODA, Marie; DEUTSCH, Morton; COOK, Stuart W. Métodos de pesquisas nas
relações sociais. São Paulo: Editora Pedagógica e Universitária - EPU. Editora da Universidade de
São Paulo, 1974.
THURSTONE, Louis L. Attitudes can be measured. American Journal of Sociology, n° 33, p. 530, Jan 1928.
______; CHAVE, E. J. Measurement of attitude. Chicago: University of Chicago Press, 1929.
TORGENSEN, Warren S. Theory and methods of scalling. New York: Wiley, 1958.
CAPÍTULO 7
Procedimentos
de Amostragem Simples
Somos sábios, não resolvemos problemas, nós os evitamos.
Ditado popular

Objetivos
• Apresenta e discute o conceito de amostragem.
• Apresenta os tipos de amostras e amostragens.
• Apresenta e discute as teorias estatísticas que dão suporte aos procedimentos de amostragens probabilísticas.
• Apresenta os procedimentos para a seleção de amostras aleatórias simples.

Sumário
NATUREZA DA AMOSTRAGEM
Vantagens de amostrar
Conceitos relacionados à amostragem
Exemplos de definição de população de pesquisa
Qualidades de uma boa amostra
Passos para a seleção de amostras
TIPOS DE AMOSTRAS/AMOSTRAGENS
Amostras e amostragens não probabilísticas
Razões para a utilização de amostras/amostragens não probabilísticas
Amostras por conveniência (ou acidentais)
Amostras intencionais (ou por julgamento)
Amostras por cotas (ou proporcionais)
Amostras por tráfego
Amostras autogeradas
Amostras desproporcionais
Amostras e amostragens probabilísticas
Amostras e amostragens aleatórias simples
Teorias estatísticas de amostragem
Teoria do Limite Central
Intervalos de confiança
Tamanho da amostra e a precisão dos dados
Procedimentos para a seleção de amostras aleatórias simples

Estando o problema de pesquisa determinado, o objetivo definido, desenvolvido ade-


quadamente o projeto de pesquisa e o instrumento de coleta de dados, as preocupações
do pesquisador voltam-se agora para a determinação dos elementos dos quais os dados
179
180 Pesquisa de Marketing

serão coletados. Esses procedimentos recebem o nome de amostragem. Neste capítulo serão
apresentados os conceitos e as teorias estatísticas básicas necessárias para a compreensão prática
da amostragem em pesquisa de marketing. Foge aos objetivos deste livro a realização de
profundas discussões teóricas sobre o tema. Ao leitor interessado em se aprofundar no tema,
é oferecida, ao final do capítulo, extensa bibliografia a esse respeito.

NATUREZA DA AMOSTRAGEM
O processo intuitivo de amostragem faz parte do dia a dia. Qualquer pessoa já teve a experiên-
cia de utilizar amostras nesse sentido amplo. Por exemplo, experimentar uma pequena porção
de uma bebida alcoólica desconhecida e, em seguida, identificá-la como sendo vodca; conversar
com um grupo de quatro colegiais a respeito de sua escola e, a partir de suas colocações,
formar uma opinião sobre aquela instituição. A amostragem também ocorre quando, numa
loja, diante de uma prateleira com centenas de determinado produto, retira-se um primeiro
produto e constata-se que ele está com defeito, tentam-se um segundo e um terceiro e
­constata-se também que eles estão defeituosos. Esse fato leva o consumidor a desistir da compra,
pois, a partir dessas constatações, desconfia de que todo o estoque também está com defeito.
Evidentemente, esses exemplos variam em sua representatividade, mas todos são amostras.
A utilização de amostras é grande em atividades comerciais, governamentais, industriais e
científicas, como demonstram os exemplos a seguir:
• O IBGE seleciona amostras da população brasileira para conduzir periodicamente a Pes-
quisa Nacional por Amostragem Domiciliar – PNAD, a fim de obter dados que permitam
a atualização dos censos decenais.
• Empresas industriais selecionam amostras de produtos para efetuar o controle de qualidade
de suas compras e de sua produção.
• Centros de pesquisas econômicas, como a FIPE e a FGV, selecionam amostras de residências
para medir as taxas mensais de inflação e para a realização de estudos econômicos.
• Agências de pesquisas de marketing e de opinião pública selecionam amostras da popula-
ção para: realizar pesquisas eleitorais; medir a eficiência de propaganda, a preferência por
produtos, os índices de audiência de TV, os índices de circulação e leitura de jornais e
revistas; obter opiniões da população sobre temas polêmicos etc.
• Laboratórios farmacêuticos utilizam-se de amostras da população para testar a eficácia de
novas drogas desenvolvidas ou em desenvolvimento.
• Cientistas utilizam-se de amostras para verificar a existência de correlação entre a ocor-
rência de certas doenças e os usos e costumes em determinadas populações.
Como pode ser observado, há intensa utilização de amostras em inúmeras atividades do
ser humano.

Vantagens de amostrar
A amostragem se baseia em duas premissas. A primeira é a de que há similaridade su-
ficiente entre os elementos de uma população, de tal forma que uns poucos elementos
representarão adequadamente as características de toda a população. A segunda é a de que
a discrepância entre os valores das variáveis da população (parâmetros) e os valores dessas
variáveis obtidos na amostra (estatísticas) é minimizada, pois, enquanto algumas medições
subestimam o valor do parâmetro, outras os superestimam, e, desde que a amostra tenha
Procedimentos de Amostragem Simples 181

sido adequadamente obtida, as variações nesses valores tendem a contrabalançar e a anular


umas às outras, resultando em medidas na amostra que, geralmente, serão próximas às
medidas da população.
A amostragem é usada com frequência em pesquisas de marketing, em função das grandes
vantagens que oferece quando comparada a censos:
• A amostra economiza mão de obra e dinheiro à medida que podem ser entrevistadas,
por exemplo, apenas 1.000 pessoas, em vez de uma população de 1 milhão. Fica fácil
prever quanto se economiza no custo de: entrevistas, impressão do instrumento de coleta,
supervisão de campo, processamento dos dados etc.
• A amostra economiza tempo e possibilita rapidez na obtenção dos resultados. Explorando
o mesmo exemplo anterior, haveria apenas 1.000 horas de entrevistas na amostra (supondo
uma hora por entrevista), contra 1 milhão de horas no censo; além disso, haveria significativa
redução no número de horas de impressão dos instrumentos, no recrutamento, na seleção e
treinamento de entrevistadores, na revisão e preparação dos instrumentos para digitação
e no processamento dos dados. Toda essa economia de tempo possibilita grande rapidez
no fornecimento dos resultados, sendo este um fator fundamental no processo de decisão
de marketing.
• A amostra pode colher dados mais precisos. Por incrível que pareça, isso é verdade. Esse
fato resulta de inúmeras fontes de vieses, os chamados erros não amostrais, que ocorrem
num processo de pesquisa de marketing. Num censo, é necessário contar com muitos
entrevistadores, supervisores de campo e pessoas para converter os dados coletados em
entradas para computação. À medida que o staff da pesquisa cresce, a qualidade das pessoas
recrutadas cai e as necessidades de controle e supervisão aumentam e tornam-se mais
difíceis de serem exercidos, o que acaba, quase inevitavelmente, elevando a ocorrência de
vieses não amostrais. Ao contrário, quanto menor a magnitude das operações de campo,
mais fácil será exercer o controle de todo o processo de coleta e tratamento dos dados
e encontrar pessoal mais bem qualificado para conduzir, adequadamente, cada estágio
da pesquisa; assim, a ocorrência de vieses não amostrais poderá ser minimizada. Ocorre
também de a realização de um censo demandar um tempo tão longo que o fenômeno
de marketing em foco poderá mudar. Como exemplo, questões sobre o nível de cons-
cientização a respeito de um novo produto têm significado apenas em determinado
espaço de tempo. O nível de conscientização medido durante um longo período de
tempo por meio de um censo inevitavelmente trará, nessa medição, uma ocorrência
muito grande de vieses. Analogamente ao censo, uma amostra também inclui erros não
amostrais, porém em menor grau. Diferentemente de um censo, a amostra apresenta erros
amostrais, mas que, estatistica e convenientemente tratados, podem ser minimizados.
• A amostra é a única opção quando o estudo resulta em destruição ou contaminação dos
elementos pesquisados: o teste de uso do produto resulta no consumo do produto; é evidente
que a realização de um censo para se verificar a aceitação de um novo sabor de iogurte
não parece ser um bom início para se conduzir um negócio que se pretenda lucrativo.
Da mesma forma, entrevistar pessoas poderá sensibilizá-las para o tópico da entrevista e
viesar sua resposta. Quando isso ocorre, diz-se, em pesquisa de marketing, que essas pessoas
ficaram “contaminadas” a respeito desse tópico. Caso seja necessário prosseguir na pesquisa,
indagando sobre outros aspectos do mesmo tópico, será necessário procurar elementos “não
contaminados”, o que, em um censo, fica inviabilizado.
182 Pesquisa de Marketing

Conceitos relacionados à amostragem


População de pesquisa é o agregado de todos os casos que se enquadram num conjunto de
especificações previamente estabelecidas (Kinnear e Taylor, 1979).
Amostra é qualquer parte de uma população de pesquisa.
Amostragem é o processo de colher amostras de uma população de pesquisa.
A ideia básica da utilização de amostragem em um processo de pesquisa de marketing é de
que a coleta de dados relativos a alguns elementos da população e sua análise podem proporcionar
informações relevantes sobre toda a população.A amostragem está intimamente relacionada com
a essência do processo de pesquisa descritiva por levantamentos: pesquisar apenas uma parte da
população para inferir conhecimento para o todo, em vez de pesquisá-la por inteiro (censo).
Quando se pretende conhecer alguns aspectos de uma população, há dois caminhos a
seguir: ou se pesquisam todos os seus elementos e, nesse caso, o estudo é chamado de censo, ou
apenas uma amostra deles, a partir da qual se estimam os dados a respeito de toda a população.
Nesse caso, o estudo é chamado de pesquisa.
Realizam-se censos das populações, em vez de apenas pesquisá-las, quando:
• A população for pequena.
• Os dados a respeito da população forem facilmente obteníveis, ou já estejam semidis-
poníveis num cadastro ou banco de dados computadorizados.
• Os requisitos do problema em estudo impõem a obtenção de dados específicos de cada
elemento da população.
• Houver imposição legal.
Um exemplo do primeiro caso é o de uma empresa fabricante de um produto que tem 82
clientes em todo o Brasil; sempre que desejar levantar dados e opiniões dos clientes sobre seu
produto, produtos concorrentes, previsão de vendas e de produção etc., será mais conveniente
realizar um censo junto aos 82 clientes, pois os dados serão mais precisos, rapidamente obtidos (via
vendedores ou representantes de venda) e facilmente processados. Não haveria nenhum ganho
para a empresa em amostrar.
Um exemplo do segundo caso é o de um banco que deseja traçar o perfil socioeconômico
de seus clientes e correlacioná-lo com a intensidade com que transacionam com o banco.
Esse é um caso típico em que todos os dados dos clientes já estão semidisponíveis num
cadastro computadorizado. Dados cadastrais são obtidos por ocasião da abertura da conta e
são periodicamente atualizados, enquanto os dados sobre as transações realizadas são diária
ou até instantaneamente atualizados. Para obter as informações desejadas, bastará solicitar ao
computador que efetue as contagens e os cruzamentos necessários. Nesse caso, o processamento
de toda a população será mais útil, menos dispendioso e mais preciso do que selecionar e
processar apenas os dados de uma amostra.
Um exemplo do terceiro caso é procurar saber, sobre a população de determinada região,
quem é e quem não é portador de determinada doença. Apenas um censo dessa população
será capaz de dar resposta a esse problema de pesquisa.
Um exemplo do quarto caso é a necessidade, por imposição legal, de se realizar, a cada 10
anos, o recenseamento da população brasileira pelo IBGE. Outro exemplo é a necessidade,
também por imposição legal, de realizar eleições periódicas para a escolha de presidente da
República, governadores, prefeitos, senadores etc., em que toda a população de eleitores é
convocada a participar (embora, na prática, os que efetivamente comparecem para votar cons-
tituem uma amostra -muito grande- da população de eleitores).
Procedimentos de Amostragem Simples 183

Porém, excluindo-se os casos apresentados, na maioria absoluta das vezes, é desnecessária


a realização de censos; a simples pesquisa de uma amostra da população atenderá plenamente
às necessidades da pesquisa.
Há três conceitos básicos relacionados à amostragem, e o primeiro é o de população de
pesquisa, já apresentado no início de capítulo; os outros dois são:
• Elemento de pesquisa – É a unidade sobre a qual se procura obter os dados (Kinnear e
Taylor, 1979).
• Unidade amostral – É a unidade básica que contém os elementos da população a ser amos-
trada.
Os elementos mais comumente utilizados em amostras de pesquisa de marketing são as
pessoas. No entanto, dependendo dos objetivos da pesquisa, poderão ser: famílias, produtos,
lojas, indústrias, instituições etc.
Uma designação apropriada de população de pesquisa deve conter:
• Definição das especificações dos elementos de pesquisa.
• Definição da unidade amostral.
• Abrangência geográfica da pesquisa.
• Período de tempo em que foi designada a população da pesquisa.

Exemplos de definição de população de pesquisa


Exemplo 1 − População de homens consumidores de cigarros, residentes na Grande Porto
Alegre, no mês de dezembro de 2011.

Elemento de pesquisa: Homens


Consumidores de cigarros
Unidade amostral: Homens
Consumidores de cigarros
Abrangência: Grande Porto Alegre
Período de tempo: Dezembro de 2011

Exemplo 2 − População de gerentes de produtos mulheres da indústria de produtos


alimentares do Cbstado de São Paulo em junho de 2011.

Elemento de pesquisa: Mulheres


Gerentes de produtos
Unidade amostral: Empresas do setor de produtos alimentares; em
seguida, gerentes de produtos, depois mulheres.
Abrangência: Estado de São Paulo
Período de tempo: Junho de 2011

Nota-se que, quanto maior o número de especificações, mais detalhada e restrita será a
população definida.
Com base nos mesmos exemplos anteriores, veja como a população fica mais restrita à
medida que aumentam as especificações.
184 Pesquisa de Marketing

Exemplo 19 − População de homens casados, com 40 anos ou mais, consumidores de


cigarros com filtro, em Porto Alegre, no mês de dezembro de 2011.

Elemento de pesquisa: Homens


Casados
40 anos ou mais
Consumidores de cigarros com filhos
Unidade amostral: A mesma
Abrangência: Grande Porto Alegre
Período de tempo: Dezembro de 2011

Exemplo 29 − População de gerentes de produtos, mulheres, formadas em administração


de empresas há menos de três anos, do setor de sorvetes da indústria de produtos alimentares
com mais de 1.000 empregados da Grande São Paulo, em junho de 2011.

Elemento de pesquisa: Mulheres


Gerentes de produtos
Formadas há menos de três anos em administração de empresas
Unidade amostral: Empresas fabricantes de sorvetes com mais de 1.000
funcionários; em seguida, gerentes de produtos mulheres
formadas há menos de três anos em administração de empresas.
Abrangência: Grande São Paulo
Período de tempo: Junho de 2011

No caso mais simples, as unidades amostrais e os elementos são os mesmos. Em procedimen-


tos de amostragem mais complexos (que serão estudados no próximo capítulo), diferentes níveis
de unidades amostrais poderão ser utilizados até se chegar ao elemento de pesquisa. As unidades
amostrais e os elementos vão diferir em todos os estágios, exceto no último. No entanto, nem
sempre é fácil definir com clareza a população para o estudo. Suponha-se que o objetivo de
um estudo seja determinar o perfil sociodemográfico-econômico de consumidores de uísque.
Como definir para a pesquisa a população de consumidores de uísque? Aqueles que já o tenham
bebido alguma vez? Aqueles que o bebem ao menos uma vez ao mês, na semana, diariamente?

Qualidades de uma boa amostra


A essência de uma boa amostra consiste em estabelecer meios para inferir, o mais precisamente
possível, as características da população por meio das medidas das características da amostra.
As qualidades que uma amostra deve ter para atender a essas características são:
• Precisão – Refere-se à exatidão dos resultados de medições obtidos na amostra (estatísticas)
em relação aos resultados que seriam obtidos se fosse medida toda a população (parâmetros),
utilizando-se os mesmos métodos, instrumentos, procedimentos etc. empregados na amostra.
Precisão é a medida do erro amostral; quanto menor o erro amostral, mais precisa será a amostra.
• Eficiência – Refere-se à medida de comparação entre diversos projetos amostrais. Um
projeto é mais eficiente do que outro se, sob condições específicas, trouxer resultados mais
Procedimentos de Amostragem Simples 185

confiáveis do que o outro, ou se, para um dado custo, produzir resultados de maior precisão,
ou se, resultados com a mesma precisão forem obtidos a um menor custo.
• Correção – Refere-se ao grau de ausência de vieses não amostrais na amostra. Uma amostra
é dita correta (ou não viesada) se as medidas superestimadas e as subestimadas forem com-
pensadas entre seus membros. Não existem erros sistemáticos numa amostra correta. Erros
sistemáticos podem ser definidos como variações nas medidas resultantes de influências,
conhecidas ou não, que fazem com que os resultados pendam mais numa direção do que
em outra. Um exemplo de amostra não correta é o de uma pesquisa eleitoral conduzida
exclusivamente via telefone. Seus resultados serão totalmente viesados, pois a população de
possuidores de telefones, de onde a amostra foi retirada, é constituída, predominantemente,
de pessoas de classe alta e média, que não correspondem à população de eleitores.
Na Figura 7.1, está a visualização das características de precisão e correção de amostras.

Passos para a seleção de amostras


No processo de seleção de amostras, os seguintes passos deverão ser percorridos:
1. Definir a população de pesquisa.
2. Elaborar ou dispor de uma lista de todas as unidades amostrais da população.
3. Decidir o tamanho da amostra.
4. Selecionar um procedimento específico pelo qual a amostra será determinada ou selecionada.
5. Selecionar fisicamente a amostra tomando por base os procedimentos dos passos anteriores.

TIPOS DE AMOSTRAS/AMOSTRAGENS
Há grande variedade de tipos de amostras e de planos de amostragens possíveis de se utilizar
em pesquisas de marketing, mas uma diferenciação fundamental precisa ser estabelecida entre
amostragens probabilísticas e não probabilísticas.
Amostragem probabilística – Aquela em que cada elemento da população tem uma chance
conhecida e diferente de zero de ser selecionado para compor a amostra. As amostragens
probabilísticas geram amostras denominadas probabilísticas.
Amostragem não probabilística – Aquela em que a seleção dos elementos da população
para compor a amostra depende, ao menos em parte, do julgamento do pesquisador ou
do entrevistador no campo. Não há nenhuma chance conhecida de que um elemento
qualquer da população venha a fazer parte da amostra. As amostragens não probabilísticas
geram amostras denominadas não probabilísticas.
Os termos probabilístico, aleatório ou randômico são sinônimos em pesquisa de marketing.
O que está implícito na construção desse tipo de amostra é o fato de que a amostra a ser pes-
quisada foi constituída com base na sorte, não havendo nenhuma interferência do pesquisador
ou do entrevistador na escolha dos elementos que a comporão.
Somente amostras probabilísticas fornecem estimativas com precisão da população, ou seja,
as principais implicações desse fato para pesquisas de marketing são:
1. Amostras probabilísticas permitem o controle de erro amostral.
2. Amostras não probabilísticas não permitem o controle do erro amostral.1

1
 s implicações 1 e 2 não significam que amostras probabilísticas sejam melhores, iguais ou piores que as não
A
probabilísticas e vice-versa.
186 Pesquisa de Marketing

Figura 7.1  Correção e precisão de amostras.


Procedimentos de Amostragem Simples 187

Figura 7.2  Tipos de amostras e amostragens.

Os diferentes tipos de amostragens probabilísticas e não probabilísticas são apresentados


na Figura 7.2.
Para a escolha do processo de amostragem, o pesquisador deve levar em conta o tipo
de pesquisa, a acessibilidade aos elementos da população, a disponibilidade ou não de
ter os elementos da população em um rol, a representatividade desejada ou necessária, a
oportunidade apresentada pela ocorrência de fatos ou eventos, a disponibilidade de tempo,
os recursos financeiros e humanos etc. Trata-se de uma decisão que cabe exclusivamente ao
pesquisador. Seu bom senso e suas experiências anteriores podem ter um peso significativo
na escolha. A única objeção é que seja sincero e honesto e nunca utilize ou divulgue os
resultados de uma pesquisa com uma amostra não probabilística como se fosse probabilística.
Tem sido corriqueiro o fato de alguns veículos de comunicação, em associação com
empresas/institutos de pesquisas, divulgarem resultados de pesquisas que foram realizadas
com amostras não probabilísticas, indicando nível de confiabilidade e erro máximo admitido,
dados que só podem ser utilizados corretamente quando a pesquisa for realizada com amostras
exclusivamente probabilísticas.

Amostras e amostragens não probabilísticas


Qualquer discussão técnica sobre as vantagens e desvantagens de amostras probabilísticas e não
probabilísticas claramente evidenciará as vantagens da primeira (isso ficará demonstrado quando
for tratada, neste capítulo, a amostragem probabilística). Apesar da evidente desvantagem das
amostragens não probabilísticas, há diversas razões práticas que tornam conveniente seu uso
em pesquisas de marketing.

Razões para a utilização de amostras/amostragens não probabilísticas


A primeira razão para o uso de amostras e amostragens não probabilísticas é a não existência
de uma alternativa viável. A população toda não está disponível para ser sorteada. Por exemplo,
numa pesquisa que envolve uma amostra de 120 empresas, descobre-se que, dessas, apenas
188 Pesquisa de Marketing

55 estão dispostas a conceder entrevistas; as demais se recusam a fazê-lo, alegando razões de


sigilo. Qual será a opção menos ruim: não fazer a pesquisa ou fazê-la com aquelas empresas
que se dispõem a colaborar? Outro exemplo é a coleta de dados por correio/fax/internet.
Em geral, quando o correio/fax/internet são utilizados para a coleta de dados, as amostras
obtidas não são probabilísticas, mesmo quando os questionários enviados tenham sido para
uma amostra probabilística, pois ninguém pode garantir que o conjunto dos que se prestaram
a responder aos questionários constitua uma amostra probabilística. A decisão de responder
ou não aos questionários cabe exclusivamente aos respondentes, que decidirão, em última
análise, se farão ou não parte da amostra. Apesar disso, não se deixa de fazer pesquisas por
correios/fax/internet.
A segunda razão para o uso de amostras não probabilísticas é que a amostragem probabilís-
tica é tecnicamente superior na teoria, mas, na prática, ocorrem problemas em sua aplicação
que enfraquecem essa superioridade. Por exemplo, os entrevistadores podem não seguir
corretamente as instruções ao selecionar os respondentes, ou podem omitir algumas das per-
guntas ao entrevistar algumas pessoas; alguns dos elementos selecionados podem recusar-se a
ser entrevistados, ou podem não ser encontrados. E o resultado do processo de amostragem
poderá ser não probabilístico, apesar de todo o esforço para que o fosse, o que torna a opção
amostragem não probabilística também aceitável.
A terceira razão é que a obtenção de uma amostra de dados que reflita precisamente
a população talvez não seja o principal propósito da pesquisa. Se não houver intenção de
generalizar os dados obtidos na amostra para a população, então não deverá haver preo-
cupações quanto ao fato de a amostra ser mais ou menos representativa da população. É o
caso, por exemplo, da realização de uma pesquisa exploratória, em que o objetivo principal
é ganhar conhecimento sobre o assunto, e não o fato de as informações obtidas serem ou
não representativas da população. Outro exemplo é aquele em que alguns médicos es-
pecialistas são chamados para dar seus pareceres num caso difícil. Essa amostra intencional
da população de médicos não é consultada para que se tenha uma opinião média de toda a
classe, mas por sua maior competência e experiência. Outro exemplo de pesquisa em que
não há preocupação em se obterem estimativas da população, e sim ideias, é a pesquisa de
motivação. O objetivo típico da pesquisa de motivação é descobrir, por meio de entrevistas em
profundidade ou reuniões com grupos de consumidores, algo a respeito de motivos, atitudes,
hábitos, associações, imagens etc. que são provocados por determinados produtos, marcas,
cores, design, embalagens, aromas, sabores etc., cujo conhecimento é de extrema utilidade
para as áreas de marketing das empresas e agências de propaganda. Os resultados desses es-
tudos atendem a vários propósitos, como: gerar hipóteses sobre possíveis oportunidades de
mercado, desenvolver pesquisas específicas, detectar eventuais problemas com os produtos
a serem verificados em pesquisas conclusivas e ajudar as agências de propaganda na criação
das campanhas publicitárias. Geralmente, os pesquisadores de motivação ficam muito satis-
feitos com amostras acidentais ou intencionais (as quais serão explicadas na sequência),
escolhidas para acentuar as diferenças entre seus componentes. Um fabricante de bebidas
alcoólicas manteve durante anos um programa denominado “Consumer: wants and needs”, que,
conduzido por duas psicólogas, realizava continuamente, em todas as regiões metropolitanas
do Brasil, pesquisas de motivação por meio de reuniões com grupos de 8 a 12 consumidores
das mais diversas bebidas alcoólicas, das mais diversas classes sociais e faixas etárias, e tinha
por objetivo principal antecipar as tendências de consumo de bebidas alcoólicas no Brasil.
Procedimentos de Amostragem Simples 189

Inúmeras ideias surgidas nessas reuniões, depois de desenvolvidas e testadas, resultaram em


produtos bem-sucedidos. O importante é que o pesquisador não se engane, nem engane
os demais interessados na pesquisa, quanto à limitação das informações obtidas dessa forma.
A quarta razão diz respeito ao tempo e aos recursos financeiros, materiais e humanos
necessários à realização de uma pesquisa com amostragem probabilística. Pode ser que esses
recursos não estejam disponíveis e sejam de tal monta que, ao pesquisador, restem apenas
duas opções: fazer a pesquisa com os recursos disponíveis, conformando-se com uma amostra
não probabilística, ou simplesmente não fazê-la. É o caso, por exemplo, da oportunidade
que se apresenta para a realização de pesquisas não probabilísticas da ocorrência de uma
exposição que reúna um grande número de visitantes-compradores de determinado produto.
Pesquisas que aproveitam essas oportunidades, geralmente, têm custo irrisório. A opção,
ao não aproveitar essa oportunidade, seria fazer a mesma pesquisa por meio de amos-
tragem probabilística, o que, provavelmente, envolveria a realização de entrevistas com os
elementos da amostra em suas residências ou locais de trabalho, a um custo e a uma duração
infinitamente maiores.
A quinta e última razão é porque os dados sobre a população (número, listagens etc.)
não são ou não estão disponíveis, o que impede a construção de amostras probabilísticas. Por
exemplo, para realizar uma amostra probabilística de consumidores de determinada marca de
cerveja, seria necessário dispor-se de uma relação de todos esses consumidores (população)
para que a amostra pudesse ser sorteada. No entanto, nunca se deixou de realizar uma pesquisa
por essa razão. A solução é realizar a pesquisa com uma amostra não probabilística.
Por essas razões, se os pesquisadores estiverem convencidos de que tais processos de amos-
tragens são razoavelmente satisfatórios, é certo que continuarão sendo realizadas pesquisas
de acordo com os princípios da amostragem não probabilística, ou seja, os pesquisadores
continuarão a empregar métodos não probabilísticos, justificando seu uso por inúmeras razões
práticas, embora jamais deixando de admitir a superioridade técnica, a princípio, da amos-
tragem probabilística.
Existem três tipos básicos de amostras não probabilísticas e três variações.

Amostras por conveniência (ou acidentais)


São selecionadas, como o próprio nome diz, por alguma conveniência do pesquisador. É o
tipo de projeto de amostragem menos confiável, embora barato e simples. É utilizado, com
frequência, para testar ou obter ideias sobre determinado assunto de interesse. Enganosamente,
essa forma de amostragem pode dar a impressão de ser tão boa que pareça desnecessário utilizar
outras formas mais sofisticadas e precisas. Amostras por conveniência prestam-se muito bem
aos objetivos da pesquisa exploratória e não são recomendadas para pesquisas conclusivas.
Alguns exemplos de amostras por conveniência:
• Solicitar às pessoas que, voluntariamente, testem um produto e, em seguida, respondam a
uma entrevista.
• Parar pessoas num supermercado e colher suas opiniões.
• Durante um programa de TV ao vivo, colocar à disposição dos telespectadores linhas
telefônicas acopladas a computadores para registrar, automaticamente, opiniões favoráveis
ou contrárias a alguma colocação formulada.
Em qualquer desses exemplos, o elemento pesquisado foi autosselecionado, ou selecionado
por estar disponível no local e no momento em que a pesquisa estava sendo realizada.
190 Pesquisa de Marketing

Amostras intencionais (ou por julgamento)


A suposição básica da amostra intencional é que, com bom julgamento e adequada estratégia,
podem ser escolhidos os casos a serem incluídos e, assim, chegar a amostras que atendam às
necessidades da pesquisa. Uma estratégia muito utilizada na amostragem intencional é escolher
casos julgados como típicos da população na qual o pesquisador está interessado, supondo-se
que os erros de julgamento na seleção tenderão a se contrabalançar. Pela lógica da estatística,
essa suposição não é exata. Mais uma vez, tem-se o problema de conhecer o grau e a direção
do erro amostral; por isso, afirmações conclusivas sobre a população em estudo não poderão ser
feitas a partir dessa amostra. No entanto, se os critérios de julgamento na escolha da amostra
forem corretos, uma amostra intencional deverá trazer melhores resultados para a pesquisa
do que uma amostra por conveniência. Um exemplo em que a amostra intencional traz bons
resultados quando se deseja verificar as razões de compra/não compra de determinada marca
de produto é escolher dois grupos de elementos a serem pesquisados: os usuários e os não
usuários do produto.

Amostras por cotas (ou proporcionais)


As amostras por cotas constituem um tipo especial de amostras intencionais. O pesquisador
procura obter uma amostra que seja similar, sob alguns aspectos, à população. Há necessidade
de se conhecer, a priori, a distribuição na população de algumas características controláveis
e relevantes para o delineamento da amostra. É simples realizar a montagem dessa amostra
quando, além de dispor de informações sobre a população, o pesquisador trabalhar apenas
com poucas características sob controle e com poucas categorias em cada uma, como no
exemplo a seguir:
1ª característica, sexo: homens e mulheres (duas categorias).
2ª característica, idade: até 30 anos e mais de 30 anos (duas categorias).
Neste exemplo, há apenas quatro células de interesse:
• Homens até 30 anos.
• Homens com mais de 30 anos.
• Mulheres até 30 anos.
• Mulheres com mais de 30 anos.
O que precisa ser conhecido para estabelecer as cotas de cada célula na amostra é a pro-
porção da população em cada uma dessas células, informação que pode ser facilmente obtida
nos Censos Demográficos do IBGE.
À medida que o número de características e de categorias sob controle for sendo elevado,
é possível chegar a uma situação tal que o método não poderá ser empregado, ou pela não
disponibilidade do conhecimento dessas proporções na população, ou pelo exagerado número
de células a que se chega, o que demandará um número elevado de elementos no total da
amostra. O exemplo a seguir ilustra esses problemas:
1ª característica, sexo: homens e mulheres (duas categorias).
2ª característica, idade: até 18 anos, de 19 a 30 anos, de 31 a 50 anos e mais de 50 anos
(quatro categorias).
3ª característica, classe social: classes A, B, C, D e E (cinco categorias).
4ª característica, nível de escolaridade: Analfabeto/Ensino Fundamental ciclo I (1ª a 5ª
série – antigo Primário) incompleto; Ensino Fundamental ciclo I completo e ciclo II (6ª a
9ª série – antigo Ginásio) incompleto; Ensino Fundamental completo – Ensino Médio
Procedimentos de Amostragem Simples 191

incompleto; Ensino Médio completo – Superior incompleto; Superior completo (cinco


categorias).
O número de células resultantes será: 2 × 4 × 5 × 5 = 200. Para que uma amostra com
esse número de células seja levada adiante, é preciso ter informação acerca da proporção na
população de cada uma dessas células, o que é, praticamente, impossível. No entanto, admitin-
do-se que essas informações estejam disponíveis, outro problema operacional a ser resolvido
será o tamanho que essa amostra deverá ter e como trabalhar para colher elementos em número
significativo para todas as células, o que parece constituir-se numa tarefa, se não impossível,
extremamente complexa de ser resolvida.
Existem vários problemas na aplicação de amostras por cotas:
• A proporção de elementos designados para cada célula precisa ser exata e estar atualizada.
Frequentemente, essa informação é difícil e impossível de ser obtida ou, principalmente,
atualizada. As informações disponíveis para consulta são, em geral, publicadas muito tempo
após as coletas de dados terem sido realizadas e poderão já estar desatualizadas.
• Características controláveis “adequadas” precisam ser escolhidas; caso contrário, a pesquisa
poderá levar a resultados enganosos. Por exemplo, uma pesquisa que vise levantar os hábitos
de limpeza doméstica das donas de casa, que não leve em conta a idade como característica
controlável, à medida que a idade esteja relacionada com as atitudes das donas de casa em
relação a produtos, marcas e hábitos de limpeza doméstica, com certeza chegará a resultados
extremamente viesados.
• Surgem inúmeras dificuldades operacionais decorrentes da inclusão de muitas caracterís-
ticas e categorias controláveis. Há dificuldades tanto na obtenção das proporções de cada
célula na população, como no tamanho que deverá ter a amostra, quanto em encontrar
elementos na população com as especificações necessárias para fazer parte da amostra.
Durante as atividades de campo, os entrevistadores veem-se obrigados a abordar grande
número de pessoas para encontrar aquelas que se enquadram, em número e características,
nas determinadas pelo estudo.
• Um viés desconhecido é introduzido no estudo pela liberdade que os entrevistadores
têm de escolher os entrevistados. Na procura de elementos que se enquadrem na des-
crição prescrita, os entrevistadores podem acabar evitando pessoas com má aparência, ou
que pareçam muito sofisticadas, ou que residam em bairros muito pobres ou muito ricos;
alguns preferem só abordar mulheres, outros, só homens etc. A amostra terá a mesma
proporção da população, porém, devido aos vieses introduzidos por esses procedimentos,
que estão fora do controle do pesquisador, os dados coletados na amostra poderão diferir
substancialmente da população.
• Certos estratos são tão pequenos que tornam impossível qualquer análise por estrato. Um
exemplo ilustra bem este problema: num projeto de amostragem por cotas, chegou-se a
100 células e pretendia-se trabalhar com uma amostra de 2.000 elementos, o que resultava
numa média de 20 elementos por célula. Admita-se que uma célula específica represente
apenas 0,0025% da população. Se essa proporção for mantida na amostra, a célula resultante
terá apenas cinco elementos e será impossível efetuar qualquer análise estatística.
Apesar desses problemas, as amostras por cotas são muito utilizadas em pesquisa de mar-
keting, em razão de sua simplicidade e baixo custo.
Os métodos, a seguir, constituem variações dos três tipos de amostras não probabilísticas
vistas.
192 Pesquisa de Marketing

Amostras por tráfego


Com frequência, pesquisas envolvem observar ou entrevistar pessoas que trafegam por
determinado local, como pessoas dentro de uma loja de departamentos, visitantes numa
exposição, espectadores de um evento esportivo ou artístico etc. Os entrevistadores vão es-
colhendo dentre os passantes (ou presentes) aqueles a quem entrevistar, conforme as cotas
foram determinadas. Nestes casos, para a obtenção de amostras mais precisas, faz-se neces-
sário que o trabalho de campo seja realizado em diferentes horas do dia, em diferentes dias
da semana e, em certos casos, até em diferentes dias do mês, à medida que haja variações
no tempo do público que trafega pelo local da pesquisa. Para que esse procedimento seja
possível, um conhecimento prévio das características e volumes de tráfego no tempo faz-se
necessário.

Amostras autogeradas
Em alguns casos de amostras por cotas, o desconhecimento da população pelo pesquisador é
tão grande que nem o tamanho da população nem a localização de seus elementos podem
ser determinados a priori. À medida que se conseguem localizar alguns desses elementos (às
vezes apenas um), solicita-se-lhe(s) que indique(m) conhecidos que também façam parte da
população e, assim, sucessivamente, vai-se construindo a amostra. Exemplo: na condução de
uma pesquisa junto à população de um clube social muito fechado, no qual não foi possível
obter a listagem de associados, a localização de um primeiro associado poderá proporcionar
a indicação de seus amigos associados (inclusive facilitando o acesso a eles) e, assim, suces-
sivamente, a amostra vai sendo constituída.

Amostras desproporcionais
Podem ser aplicadas a qualquer tipo de amostragem em que a proporção dos estratos na p­ opulação
seja conhecida. Na amostragem por cotas, consideram-se apenas amostras que sejam proporcio-
nais a algumas características conhecidas da população. No entanto, nem sempre é possível, ou
recomendável, a obtenção de elementos na amostra com a mesma proporcionalidade, por um
ou mais dos seguintes motivos:
• Se a amostra de algum estrato, proporcional à população, resultar num número de elementos
tão pequeno que inviabilize qualquer análise por estrato.
• Quando um estrato da população for mais heterogêneo (ou homogêneo) que outro e for
do conhecimento do pesquisador, uma amostra desproporcionalmente maior (ou menor)
dessa parte pode levar a resultados mais precisos.
• Quando o custo de contatar parte da população for muito elevado, uma amostra des-
proporcionalmente menor dessa parte reduzirá o custo total da pesquisa.
Quando a escolha da amostra, por qualquer dos motivos apresentados, for despropor-
cional à população, durante o processo de análise conjunta das subamostras, deverão ser
atribuídos pesos aos dados de cada uma para se chegar a resultados ponderados represen-
tativos da população em estudo. Exemplo: para verificar o comportamento na compra dos
consumidores de automóveis novos, um pesquisador trabalhou com os dados constantes
da Tabela 7.1.
Dessa forma, foram entrevistadas subamostras de 75 compradores de cada marca, cons-
tituindo uma amostra desproporcional à população. Na análise por subamostras, poderá ser
verificado, detalhadamente, o comportamento marca por marca.
Procedimentos de Amostragem Simples 193

Tabela 7.1  Resultado de pesquisa com amostras desproporcionais à população


Marcas Participação de mercado (%) Amostra Participação na amostra (%)
Volkswagen 36 75 25
General Motors 28 75 25
Ford 22 75 25
Fiat 14 75 25
Total 100 300 100

Para a realização da análise conjunta, os resultados de cada subamostra deverão ser antes
ponderados conforme a seguinte fórmula:
An
Pn =
an
Em que:
Pn = peso a ser atribuído aos resultados da subamostra n.
An = proporção de elementos da subamostra n na população.
an = proporção de elementos da subamostra n na amostra.
Dessa forma, os pesos a serem atribuídos a cada marca na análise conjunta de todas as
marcas, no exemplo visto, seriam:
P (Volkswagen) = 1,44
P (General Motors) = 1,12
P (Ford) = 0,88
P (FIAT) = 0,56
Outra alternativa seria realizar as 300 entrevistas, independentemente da determinação de
cotas por marca, e realizar as ponderações depois, segundo o mesmo procedimento apresentado.
Amostras e amostragens probabilísticas
A amostragem probabilística é caracterizada pelo conhecimento da probabilidade de
que cada elemento da população possa ser selecionado para fazer parte da amostra. Essa
probabilidade pode ou não ser igual para todos os elementos da população, mas precisa ser
diferente de zero. Quando as probabilidades conhecidas forem todas iguais, ter-se-á um
caso particular de amostragem: a probabilística simples.
Antes de entrar em maiores detalhes sobre procedimentos e tipos de amostragens pro-
babilísticas, é importante conhecer em que consistem os processos de amostragem e de que
forma contribuem para a pesquisa de marketing.
A característica de se conhecerem as probabilidades de que cada elemento da população
possa vir a fazer parte da amostra garante que a amostra será constituída de elementos
selecionados objetivamente por processos aleatórios (sorteios, por exemplo), e não pela
vontade do pesquisador, dos entrevistadores de campo ou mesmo do entrevistado. Esse
fato, em termos estatísticos, significa que a amostragem probabilística permite calcular em
que medida os valores de variáveis obtidos nas amostras diferem dos valores da população.
Essa diferença é chamada de erro amostral e advém exclusivamente do fato de serem
tomadas medidas numa amostra, e não em toda a população. No entanto, esse fato, por
si só, não significa que amostras probabilísticas sejam mais representativas do que as não
probabilísticas. Conforme exemplos já vistos, devido aos inúmeros problemas operacionais,
uma amostra não probabilística pode até ser mais representativa do que uma probabilística.
194 Pesquisa de Marketing

O único significado de uma amostra dita probabilística é que o pesquisador tem controle
sobre o erro amostral da pesquisa. No entanto, o erro amostral é apenas uma das inúmeras
fontes de erro em pesquisas de marketing.

Amostras e amostragens aleatórias simples


Caracterizam-se pelo fato de cada elemento da população ter uma probabilidade conhecida,
diferente de zero, idêntica à dos outros elementos, de ser selecionado para fazer parte da
amostra.
Essa característica permite que qualquer subconjunto de n elementos de uma população
constitua-se numa amostra possível dessa população.
Notação e fórmulas utilizadas em teoria de amostragem – Para facilitar a compreensão das
teorias que serão apresentadas sobre amostragens probabilísticas, será útil conhecer as notações
adotadas, constantes do Quadro 7.1, e as fórmulas utilizadas, constantes do Quadro 7.2.

Quadro 7.1  Notações adotadas em teoria de amostragem


Notações
População Amostra Distribuição amostral
Número de elementos N n k
Observação Xi xi xi
Média m x µx
Variância σ2 S2 σ 2x
Desvio-padrão σ S σx
Proporção de ocorrência P p —
Proporção de não ocorrência Q q —

Quadro 7.2  Fórmulas utilizadas em teoria de amostragem


Fórmulas
População Amostra Distribuição amostral
∑ Xi ∑ xi ∑ xi
Média µ= x= µx =
N n k
Variância teórica ∑( X i − µ )2 ∑( xi − x )2 ∑( xi − µ x )2
σ2 = S2 = σ 2x =
N n k

Variância ∑ X i2 ( ∑ X i )2 ∑ xi2 ( ∑ xi )2 ∑ xi2 ( ∑ xi )2


σ2 = − S2 = − σ 2x = −
computacional N N2 n n2 k k2

Teorias estatísticas de amostragem


Toda a conceituação que dá suporte à utilização de amostragem probabilística em pesquisa
de marketing está resumida na seguinte sequência de passos:
1. Define-se uma população qualquer de tamanho N.
2. Tiram-se as medidas dos parâmetros da população.
Procedimentos de Amostragem Simples 195

Média da população = m
Variância da população = σ2
3. Define-se um tamanho n qualquer para a amostra.
n < N
4. Constroem-se todas as k amostras possível sem reposição* de tamanho n.
k = CN,n
5. Calcula-se a média de cada uma das k amostras obtidas.
xi = média de cada amostra
xi = x1, x 2 ,…, xk
6. Calcula-se a média de todas as médias das k amostras obtidas (média amostral).
µ x =  média das médias das k amostras (média amostral)
∑ xi
µx =
k
7. Calcula-se a variância da média das k amostras obtidas (chamada de variância amostral).
σ 2x  = variância das k amostras (variâncias amostrais)
∑( xi − µ x )2
σ 2x =
k
*(foi usada a fórmula elementar de cálculo da variância)
Cumpridos esses sete passos, será possível verificar as seguintes importantes relações:
• A média das médias das amostras obtidas (média amostral) é igual à média da população
que as originou (independentemente de N ou n), ou:
µx = µ
• A variância das médias de todas as amostras de tamanho n (variância amostral) é igual à
variância da população que as originou, dividida pelo tamanho das amostras para popu-
lações infinitas, e multiplicada pela expressão (N − n)/(N − 1) para populações finitas:

σ2 σ
σ 2x = e σx = (populações infinitas)
n n
σ 2(N − n) σ
ou σ 2x = ou σ x = (populações finitas)
n ( N − 1) ( N − n )/ n ( N − 1)
Observação: a expressão (N − n)/(N − 1) é conhecida como fator de correção para populações
finitas. Quando a população for infinita (N → ∞), essa expressão tende para 1, sendo desneces-
sário seu uso.
Toda essa sequência de passos e as conclusões podem ser observadas num exemplo.
1. Seja a seguinte população de tamanho N = 10, da qual foram colhidos dados sobre a renda
de seus elementos, conforme a Tabela 7.2.
2. Medidas de seus parâmetros:
Média = m = 1.600
Variância = σ2 = 46.000
3. Tamanho das amostras
n = 2 (poderia ser 3, 4 ou 5; não importa)
196 Pesquisa de Marketing

Tabela 7.2  Distribuição da população original


População original
Elemento Renda (R$)
A 1.300
B 1.300
C 1.400
D 1.500
E 1.600
F 1.600
G 1.700
H 1.800
I 1.900
J 1.900

4. Construir todas as k amostras possíveis sem reposição:


k = C10,2 = 10!/(10 – 2)! 2! = 45
5. Calcular a média de cada uma das 45 amostras obtidas (veja Tabela 7.3)
6. Calcular a média amostral (média de todas as 45 amostras obtidas):
∑ xi 72.000
µx = = = 1.600
k 45
7. Calcular a variância amostral (variância das médias das 45 amostras):
1 1
µ 2x = ∑( xi − µ x )2 = ∑( xi − 1.600)2 = 20.444,44
k 45
Verificando as relações entre as medidas da população e as obtidas no conjunto de amos-
tras dela derivadas de tamanho n = 2, tem-se:
para as médias µ x = µ = 1.600
σ 2 (N − n)
para as variâncias σ x2 = ×
n ( N − 1)
46.000 (10 − 2)
σ 2x = ×
2 (10 − 1)
σ x = 20.444,44
2

c.q.v
Se o exercício for repetido para amostras de tamanho n = 3, 4, 5 etc., as relações apresen-
tadas permanecem.
Note que, utilizando-se amostras aleatórias simples no processo de pesquisa, apenas uma
das 45 possíveis amostras de tamanho n = 2 do exemplo visto seria sorteada para que suas es-
tatísticas servissem como estimadores dos parâmetros da população. Essas estatísticas poderão
ser mais ou menos precisas, dependendo da amostra sorteada. Apesar de nunca se saber exata-
mente quanto o valor desse estimador estará próximo ou distante do parâmetro da população,
princípios e técnicas estatísticas permitem saber qual o máximo de distanciamento que poderá
ocorrer entre o estimador e seu parâmetro. A título de curiosidade, note que, caso houvesse na
Procedimentos de Amostragem Simples 197

Tabela 7.3  Distribuição da população derivada (ou amostral)


Número da amostra Amostra xi Renda média na amostra xi
1 AB 1.300
2 AC 1.350
3 AD 1.400
4 AE 1.450
5 AF 1.450
6 AG 1.500
7 AH 1.550
8 AI 1.600
9 AJ 1.600
10 BC 1.350
11 BD 1.400
12 BE 1.450
13 BF 1.450
14 BG 1.500
15 BH 1.550
16 BI 1.600
17 BJ 1.600
18 CD 1.450
19 CE 1.500
20 CF 1.500
21 CG 1.550
22 CH 1.600
23 CI 1.650
24 CJ 1.650
25 DE 1.550
26 DF 1.550
27 DG 1.600
28 DH 1.650
29 DI 1.700
30 DJ 1.700
31 EF 1.600
32 EG 1.650
33 EH 1.700
34 EI 1.750
35 EJ 1.750
36 FG 1.650
37 FH 1.700
38 FI 1.750
39 FJ 1.750
40 GH 1.750
41 GI 1.800
42 GJ 1.800
43 HI 1.850
44 HJ 1.850
45 IJ 1.900
198 Pesquisa de Marketing

população pesquisada 50 elementos, e não 10, e n = 2, o número de amostras possíveis seria
1.225 e, para n = 5, esse número seria de 2.118.760. Em pesquisa de marketing, apenas uma
dessas possíveis amostras seria sorteada para representar a população da qual foi originada.
Ainda a título de curiosidade, procure calcular quantas possíveis amostras de 1.000 eleitores
existem numa população de 55 milhões, das quais apenas uma deverá ser selecionada para se
realizar uma pesquisa eleitoral (não se assuste com o tamanho!).
Enfim, o importante é observar que, em qualquer população, há muitas possíveis amos-
tras. O que deve ser registrado é que a inferência estatística clássica se baseia no que acontece
quando forem selecionadas, repetidas vezes, diferentes amostras de mesmo tamanho de uma
mesma população.
Suponha que sejam sorteadas, sequencialmente, três amostras de tamanho n = 2 de uma
população conhecida e que sejam calculadas suas médias.Verifica-se que os três valores obtidos
são, geralmente, próximos, mas diferentes. Aparentemente, pode-se imaginar que há três dife-
rentes estimadores dos parâmetros da população. Entretanto, a teoria estatística recomenda que
não se deve parar apenas em três amostras; deve-se continuar colhendo mais e mais amostras e,
repetindo-se esse processo, começa-se a notar que determinados valores da média das amostras
se repetem com mais frequência. Especificamente, observa-se que os valores das médias das
amostras (a média amostral), próximos aos valores da média da população, tendem a se repetir
com mais frequência do que aqueles mais afastados. Plotando-se os valores obtidos num sistema
de dois eixos, será possível observar que formam uma curva familiar em formato de sino. Essa
distribuição das médias da amostra é chamada de distribuição amostral das médias ou, simples-
mente, distribuição amostral.
Voltando ao exemplo sobre pesquisa de renda (Tabela 7.2), a frequência das médias da
população derivada de tamanho n = 2 está na Tabela 7.4.
E os gráficos da população original e da população derivada (média amostral) serão, res-
pectivamente, as Figuras 7.3 e 7.4.

Tabela 7.4  Distribuição de frequência da média


na população derivada para n = 2
Médias das amostras Frequência absoluta
1.300 1
1.350 2
1.400 2
1.450 5
1.500 4
1.550 5
1.600 7
1.650 5
1.700 4
1.750 5
1.800 2
1.850 2
1.900 1
Total 45
Procedimentos de Amostragem Simples 199

Figura 7.3  Gráfico da população original.

Figura 7.4  Gráfico da população derivada (média amostral).

Note, neste último gráfico, que:


• As frequências dos valores mais próximos à média tendem a ser maiores do que os mais
distantes.
• A forma do gráfico da população derivada aproxima-se do formato de sino em torno da
média da população.
Portanto, a distribuição amostral da média de uma população é importante para a pesquisa
de marketing por duas razões:
1. As médias das amostras estão distribuídas em torno da média da população, de uma forma
conhecida (curva em forma de sino ou curva de Gauss).
2. Permite determinar quão próximas as estatísticas de determinada amostra estão distribuídas
em torno do parâmetro da população.
200 Pesquisa de Marketing

Teoria do Limite Central


Para que seja possível utilizar essas características da distribuição das médias amostrais de uma
população em pesquisa de marketing, é preciso formalizar a natureza da distribuição amostral da
média. Para isso, recorre-se à Teoria do Limite Central da Estatística, que estabelece o seguinte:
1. Se a distribuição da população para uma dada variável for normal, a distribuição das médias
de todas as possíveis amostras de igual tamanho dessa população (distribuição amostral)
também será normal, qualquer que seja o tamanho da amostra.
2. Se a distribuição da população não for normal, a distribuição das médias de todas as suas
possíveis amostras se aproximará de uma distribuição normal, à medida que se ampliar
o tamanho dessas amostras. Qual tamanho é suficiente? Se a distribuição da variável na
população não for normal, mas simétrica, amostras de pequeno tamanho produzirão uma
distribuição em que as médias amostrais estarão normalmente distribuídas. Se a distribuição
da variável na população for altamente assimétrica, então amostras de grande tamanho serão
necessárias. Conclusão: não é preciso assumir que a variável esteja normalmente distribuída
na população para efetuar inferências estatísticas usando as propriedades da curva normal;
basta ajustar o tamanho da amostra à distribuição da população e, caso essa distribuição
seja desconhecida, trabalhar com amostras grandes, com n acima de 30, conforme pode ser
observado na Figura 7.5.

Figura 7.5  Distribuição das médias amostrais para amostras de vários tamanhos de populações com
diferentes distribuições.
Procedimentos de Amostragem Simples 201

3. A Figura 7.5 mostra as consequências da Teoria do Limite Central. Quatro diferentes


distribuições de populações são apresentadas para uma variável x. Somente no caso do
Exemplo 4, a distribuição da população é normal. No entanto, nota-se que, para n = 5,
praticamente todas as distribuições amostrais das médias de todas as populações dos demais
exemplos são aproximadamente normais e verdadeiramente normais para n = 30. Portanto,
quando for calculada a média para qualquer amostra de n maior ou igual a 30, pode-se
estar certo de que essa média teve origem em uma distribuição normal.
4. A média das médias das amostras derivadas (ou a média amostral) de uma população qualquer
é igual à média da população. Quando o valor esperado de um estimador da população for
idêntico ao da população, diz-se que essa amostra é estatisticamente não viesada.

µx = µ

5. O desvio-padrão da distribuição amostral da média é igual ao desvio-padrão da população,


dividido pela raiz quadrada do tamanho da amostra, para populações infinitas.

σ
σx =
n
Já foi visto que, para populações finitas, essa expressão deverá ser corrigida para:
σ
σx =
( N − n )/ n ( N − 1)

Esse valor é também denominado de erro padrão da média.


6. Finalmente, existe um último aspecto sobre a curva normal e a Teoria do Limite
Central, extremamente útil para pesquisas de marketing, que precisa ser entendido
­para que se possa colocar toda essa teoria para trabalhar. Esse aspecto está relacionado
com a área contida sob a curva normal, delimitada pelos pontos correspondentes
a ± σ, ± 2σ e ± 3σ. A Figura 7.6 mostra uma curva normal com um montante de área
contida entre esses diferentes desvios-padrão da média. Especificamente, nota-se que,
aproximadamente:
• 68% dos casos estão contidos entre ± σ da média.
• 95% dos casos estão contidos entre ± 2σ da média.
• 99,7% dos casos estão contidos entre ± 3σ da média.
Agora se tem o necessário conhecimento sobre teoria estatística para poder determinar
qual a precisão dos dados obtidos na amostra de uma população.
Suponha-se que, no exemplo anterior sobre renda, a amostra selecionada tenha sido a de
número 38, cujos elementos são F com a renda de 1.600 e I com a renda de 1.900. Sendo a
média dessa amostra x = 1.750, sua variância será:
1
S2 = × (1.600 – 1.750)2 + (1.900 – 1.750)2
2
S 2 = 22.500 e seu desvio-padrão:
S = 22.500 = 150
202 Pesquisa de Marketing

Figura 7.6  Área contida sob a curva normal.

Para chegar ao estimador do desvio-padrão amostral, aplica-se a seguinte fórmula:


S
Sx = Z
n
150
Sx = Z = Z 106
1,41

Intervalos de confiança
A partir da expressão S x = Z 106 podem ser construídos os intervalos de confiança,
­respectivamente para os níveis de confiabilidade de 68% ( Z ≅ 1 ), 95% (Z ≅ 2 ) e 99,7%
( Z ≅ 3 ):
1. Intervalo de confiança para o nível de confiabilidade de 68% (Z ≅ 1):
x ± S x → x ± 106 → 1.750 ± 106
e o erro relativo máximo possível será:
106
e =± × 100% = ± 6,05%
1.750
2. Intervalo de confiança para o nível de confiabilidade de 95% (Z ≅ 2 ):
x ± S x → x ± 2 × 106 → 1.750 ± 212
e o erro relativo máximo possível será:
212
e = ± × 100% = ± 12,11%
1.750
3. Intervalo de confiança para o nível de confiabilidade de 99,7% (Z ≅ 3):
x ± S x → x ± 3 × 106 → 1.750 ± 318
Procedimentos de Amostragem Simples 203

e o erro relativo máximo possível será:


318
e = ± × 100% = ± 18,15%
1.750
Esses intervalos são chamados de intervalos de confiança notáveis da média. O primeiro
intervalo é chamado de intervalo de confiança de 68%, o segundo, de 95% e o terceiro, de
99,7%. Pode-se, a princípio, trabalhar com qualquer outro intervalo de confiança, bastando, para
isso, utilizar-se da fórmula de transformação da curva normal na curva normal padronizada e
procurando-se na tabela o valor da porcentagem correspondente delimitada pela curva e os
pontos de intervalo. A fórmula utilizada é a seguinte:
x − µx
Z= ou Zσ x = x − µ x
σx
Em que:
Z = valor da ordenada na curva normal padronizada
X = variável normal de média µ x = 0 e µ x = 1
2

Essa fórmula permite transformar os dados de qualquer distribuição normal numa dis-
tribuição normal padronizada cujas áreas delimitadas pela curva e pelas ordenadas O a Z
são tabeladas. Para uma interessante apresentação dessa teoria, veja Fonseca e Martins (1975,
cap. 4). Note que essa fórmula permite a utilização de qualquer valor para Z. No entanto, em
pesquisas de marketing, raramente são utilizados outros intervalos que não sejam os chamados
notáveis (Z = 1, 2 ou 3), meramente por questões de comodidade, pois, assim procedendo,
não há necessidade de se recorrer a fórmulas e tabelas de transformações.
Note que primeiro determina-se o nível de confiança para, em seguida, calcular-se o
intervalo.
O que esses intervalos de confiança significam exatamente para a pesquisa de marketing,
tomando-se como exemplo o intervalo de confiança de 68%? Já foi visto que a média da
distribuição amostral é igual à média da população e que, em pesquisas de marketing,
de todas as possíveis amostras de determinado tamanho n, sorteia-se apenas uma, sendo sua
média utilizada como estimador da média amostral (desconhecida) e, consequentemente,
da população. No entanto, a média amostral pode ou não estar contida no intervalo de
confiança calculado no nível, no caso, de 68%. O nível de 68% de intervalo de confiança
não significa que há 68 chances em 100 de a média amostral estar contida nesse intervalo,
mas, sim, que, se forem selecionadas 100 diferentes amostras aleatórias dessa população e
calculados 100 diferentes intervalos de confiança de 68% para a média, é possível esperar
que a média amostral esteja contida nesses intervalos de confiança em 68 das amostras entre
as 100 sorteadas.
Veja na Figura 7.7 a visualização do significado de um intervalo de confiança.
Convém enfatizar, mais uma vez, que esses procedimentos só são possíveis para amostras
probabilísticas. O pesquisador que apresentar números sobre níveis de confiança, intervalos
de confiança e precisão para amostras não probabilísticas estará incorrendo em grave e
imperdoável erro conceitual.
A seguir, apresenta-se, na Figura 7.8, um exemplo numérico ilustrando o contido na
Figura 7.7, a fim de facilitar a compreensão e a fixação desses conceitos.
Explicações, no caso da distribuição amostral, à Figura 7.8:
204 Pesquisa de Marketing

1. Significa que há 95% de probabilidade de sortear uma amostra com resultados no intervalo
de confiança 34,66 a 37,34 (ou 36 ± 1,34), podendo resultar em um erro máximo de 3,7%
e 1,34
(ou = ); significa também que há 5% de probabilidade de a amostra sorteada ter
µ 36
resultados fora desse intervalo de confiança.

Figura 7.7  Significado de um intervalo de confiança para um nível de confiabilidade de 95% e σ ­desconhecido.
Fonte: Adaptado de Bussab, Wilton O.; Morettin, Pedro A. Estatística básica. 4. ed. São Paulo: Atual,
1987:224.

2. No caso da amostra 1 sorteada, os dados medidos resultam na construção do intervalo de


confiança 32,176 a 33,824 (ou 33 ± 0,824).
O significado é que, se essa amostra tiver sido a sorteada, o resultado obtido para a
média (33) é diferente da média verdadeira da população em −3 (33 − 36) ou 8,3%
(3/36 × 100%), ou seja, maior que o erro máximo admitido de 3,7%.
Sendo assim, se utilizar-se o resultado da média obtida nessa amostra sorteada como es-
timador da média da população poder-se-á cometer um erro acima do erro amostral
máximo admitido, porém não se tem certeza de que está sendo cometido; saber-se-á
apenas que a probabilidade de se ter sorteado uma amostra cujos dados inferidos para a
população possam ter um erro máximo acima do admitido será de 5%, pois o nível de
confiabilidade é de 95%.
3. Analogamente, no caso da amostra 2, os dados obtidos na própria amostra resultaram na
construção do intervalo de confiança 36 a 38 (ou 37 ± 1).
O significado é que, se essa amostra tiver sido a sorteada, o resultado obtido para a média (37)
é diferente da média verdadeira da população em +1 (37 − 36) ou 2,7% (1/36 × 100%),
ou seja, menor que o erro máximo admitido de 3,7%.
Procedimentos de Amostragem Simples
Figura 7.8  Exemplo da utilização do conceito intervalo de confiança em pesquisa de marketing.

205
206 Pesquisa de Marketing

Se utilizar-se o resultado da média obtida nessa amostra como estimador da média da


população, estar-se-á cometendo um erro abaixo do erro amostral admitido, porém não se
tem certeza de que está sendo cometido. A probabilidade de se ter sorteado uma amostra
cujos dados inferidos para a população possam ter um erro amostral abaixo do admitido
será de 95%, pois o nível de confiabilidade é de 95%.
4. Na amostra 3, o raciocínio é análogo ao desenvolvido para a amostra 1.
Raciocínios análogos podem ser desenvolvidos para os níveis de confiabilidade:
99,7% → 3σ (onde Z ≅ 3)
68,0% → 1σ (onde Z ≅ 2)
ou para qualquer valor Z.
Procedimentos para o cálculo de intervalos de confiança para a média – A
seguir, apresenta-se um resumo dos procedimentos para o cálculo de intervalos de confiança
para a média:
1. Sorteia-se uma amostra probabilística simples de tamanho n da população em estudo.
2. Calcula-se a média x da amostra sorteada.
3. Calculam-se a variância S2 e o desvio-padrão S da amostra sorteada.
4. Define-se um nível de confiança: 68%, 95% ou 99,7%.
5. Com esses dados, calcula-se o intervalo de confiança para o nível de confiança definido:

para 68% → x ± S/ n
para 95% → x ± 2S / n
para 99,7% → x ± 3S / n
6. Define-se como precisão da amostra, ou erro máximo admitido:

Termos absolutos Termos percentuais


para 68% → e = ± S / n e = ±[(S / n ) / x ] × 100%
para 95% → e = ± 2S / n e = ±[(2S / n ) / x ] × 100%
para 99,7% → e = ± 3S / n e = ±[(3S / n ) / x ] × 100%
No capítulo seguinte, serão apresentados outros tipos de amostragens probabilísticas.

Tamanho da amostra e precisão dos dados


No exemplo ilustrativo das rendas, pode-se verificar que, para uma amostra de mesmo tama-
nho (no caso n = 2), à medida que se eleva o nível de confiança, consequentemente cresce
a precisão; em resumo:
Precisão
Termos absolutos Termos percentuais
1σ → 68% ± $ 106 ou ± 6,05%
2σ → 95% ± $ 212 ou ± 12,11%
3σ → 99,7% ± $ 318 ou ± 18,17%
O que acontecerá com a precisão se for elevado o número de elementos da amostra sorteada?
Procedimentos de Amostragem Simples 207

O cálculo do desvio-padrão de uma distribuição amostral é dado pela fórmula já vista


(para o propósito, é suficiente a fórmula para populações infinitas):
ZS
σx =
n
Em que:
σ x = desvio-padrão amostral
S = desvio-padrão da amostra sorteada e estimador do desvio-padrão da população, que
é desconhecido.
Observa-se que o valor de σ x varia inversamente à raiz quadrada do número de elementos da
amostra. Isso significa que, quanto maior for n, maior será n e menor será σ x , ou seja, menor será
o intervalo de confiança em torno de x e maior será a precisão dos dados, independentemente
do nível de confiança considerado.
Esse fato poderá ser constatado num simples exemplo. Numa pesquisa deseja-se saber
dados sobre a renda de uma população de 1 milhão de habitantes. Para tanto, foram
sorteadas, ­respectivamente, amostras de tamanhos n = 2, 5, 30, 100, 1.000 e 2.000. Para
efeito de comparação, admita-se que, nessas cinco amostras tanto as médias quanto os
desvios-padrão obtidos tenham sido idênticos (o que não é verdadeiro) x  = 1.750 e
S = 150. Pode-se observar o que acontece com o desvio-padrão amostral ( σ x ) para cada
tamanho de amostra:

n = 2 σx = 150/ 2≈ 106,38


n = 5 σx = 150/ 5≈ 66,96
n = 30 σx = 150/ 30 ≈ 27,37
n = 100 σx = 150/ 100 ≈ 15,00
n = 1.000 σx = 150/ 1.000 ≈ 4,73
n = 2.000 σ x = 150/ 2.000 ≈ 3,35
n = 20.000 σ x = 150/ 20.000 ≈ 1,06
Essas constatações levam à conclusão de que, contrariando a intuição da maioria das pessoas,
não há proporcionalidade entre a elevação do número de elementos da amostra e a respectiva
melhoria na precisão dos dados.
A determinação do número de elementos que uma amostra deve conter será apresentada
no capítulo seguinte.

Procedimentos para a seleção de amostras aleatórias simples


Existem dois procedimentos para a obtenção de amostras aleatórias simples de uma população
cujos elementos estejam todos identificados e que a cada um tenha sido atribuído um número:
a realização de sorteios ou a utilização de tabelas de números aleatórios (veja exemplo na Tabela
1 do Apêndice – Tabelas estatísticas selecionadas, no final deste livro).
Uma das formas para a realização de sorteios é colocar todos os números dos elementos
da população numa urna e ir retirando sem repor os números dos elementos que irão compor
a amostra.
208 Pesquisa de Marketing

Outra forma é a utilização de uma roleta. Chega-se ao número de cada elemento da


amostra por meio de tantos sorteios quantos forem os algarismos do número de elementos da
população. Os sorteios de cada algarismo devem ser realizados entre o conjunto de números
de 0 a 9, que faça sentido, tendo em vista o número de elementos da população. Assim, por
exemplo, se N = 2.759 e n = 100, o primeiro sorteio (correspondente ao milhar) deverá ser
feito no conjunto 0,1 e 2, e assim sucessivamente. Nesse caso, o número de sorteios a realizar
seria 4 × 100 = 400, constituindo-se um trabalho enorme.
Todo esse trabalho de realização de sorteios poderá ser evitado se forem utilizadas tabelas de
números aleatórios.As tabelas de números aleatórios são resultantes de sorteios teóricos realizados
por computadores e, por isso, pode-se confiar que são números totalmente probabilísticos.
Para a utilização de tabelas de números aleatórios, basta, em qualquer página, assinalar um
ponto para começar e definir uma regra de procedimento. Assim, deve-se trabalhar com tantos
algarismos quantos forem os algarismos do número de elementos da população. Em seguida,
a partir do ponto definido para o início, deve-se escolher em qual sentido caminhar (de cima
para baixo, de baixo para cima, da direita para a esquerda ou da esquerda para a direita), o que
não deverá mudar até o fim da seleção. Todos os números que surgirem com essa quantidade
de dígitos e ultrapassarem o número de elementos da população devem ser desprezados.Veja,
num exemplo simples, como trabalhar com essas tabelas.
Em uma população de 300 elementos, todos numerados de 1 a 300, deseja-se retirar
uma amostra aleatória simples de tamanho n = 10. Define-se trabalhar com três dígitos, no
sentido de cima para baixo e da esquerda para a direita. O Quadro 7.3 mostra os números
aleatórios encontrados segundo esse critério.

Quadro 7.3  Números aleatórios encontrados no exemplo


1a coluna: 2a coluna:
221* 333
507 836
137* 772
367 055*
918 159*
580 404
453 436
432 348
369 449
464 894
461 201*
702 698
329 310
128* 977
402 053*
519 593
593 022*
546 355
168* 094*
689 256
458 467
961 666
Procedimentos de Amostragem Simples 209

A amostra de 10 elementos resultante será a composta pelos elementos de números: 221,


137, 128, 168, 055, 159, 201, 053, 022 e 094.
A necessidade de ter todos os elementos da população identificados e numerados pode
tornar-se uma grande restrição para a realização de amostragens aleatórias simples. Quando
isso ocorrer, deve-se recorrer a outros métodos de amostragens probabilísticas, que serão es-
tudados no capítulo seguinte.
Os computadores também vieram facilitar a vida do pesquisador de marketing nas ativida-
des de sorteios de amostras. Diversos softwares têm procedimentos automáticos para a realização
de sorteios (o próprio Excel tem).
Exemplo utilizando a planilha Excel - Em uma população de N = 1.000, à qual já foram
atribuídos números de 1 a 1.000, deseja-se sortear uma amostra de n = 50 utilizando-se a
planilha Excel.
Procedimento na planilha Excel:
fx = ALEATÓRIO( )*(b − a) + 1
sendo:
b = o maior número que pode ser sorteado, no caso 1.000.
a = o menor número que pode ser sorteado, no caso 1.
Colocando-se o cursor na célula A1 e ao se teclar enter, será obtido o número do elemento
da população que constituirá o primeiro elemento da amostra.
Em seguida, colocando-se o cursor na célula A1 e arrastando-a até a célula A50, visualiza-se
o sorteio dos 50 elementos da população que constituirão a amostra a ser pesquisada.
Veja no Quadro 7.4 o resultado obtido seguindo-se o procedimento do exemplo.

Quadro 7.4  Resultado de sorteio automático de 50 elementos de uma população de 1.000


utilizando-se a planilha Excel
Elemento da amostra Elementos da população sorteada
1 553
2 7
3 430
4 930
5 310
6 124
7 990
8 239
9 534
10 812
11 329
12 443
13 488
14 228
15 366
16 78
17 257
18 146
19 182
20 859
21 625
22 753
210 Pesquisa de Marketing

Quadro 7.4  Resultado de sorteio automático de 50 elementos de uma população de 1.000


utilizando-se a planilha Excel (cont.)
Elemento da amostra Elementos da população sorteada
23 256
24 24
25 9
26 595
27 938
28 310
29 799
30 172
31 890
32 951
33 394
34 362
35 867
36 989
37 145
38 825
39 412
40 413
41 448
42 51
43 19
44 302
45 454
46 867
47 995
48 708
49 185
50 734

RESUMO
População de pesquisa é o agregado de todos os casos que se enquadram num conjunto de
especificações previamente estabelecidas.
Amostra é qualquer parte de uma população.
Amostragem é o processo de colher amostras de uma população.
A ideia básica de amostragem consiste em que a coleta de dados em alguns elementos da
população e sua análise poderão proporcionar informações relevantes de toda a população.
Elemento de pesquisa é a unidade sobre a qual se procura obter os dados.
Unidade amostral é a unidade básica que contém os elementos da população a ser amostrada.
Uma designação apropriada de população de pesquisa deve conter: definição das especi-
ficações dos elementos de pesquisa, definição da unidade amostral, abrangência geográfica da
pesquisa e período de tempo no qual foi designada a população da pesquisa.
As qualidades de uma boa amostra são: precisão, eficiência e correção.
Os passos para a seleção de amostras compreendem: definir a população de pesquisa, elaborar
e dispor de uma lista de todas as unidades amostrais da população, decidir o tamanho da amostra,
Procedimentos de Amostragem Simples 211

selecionar um procedimento específico pelo qual a amostra será determinada ou selecionada e


compor fisicamente a amostra tendo por base os procedimentos dos passos anteriores.
Amostragem probabilística é aquela em que cada elemento da população tem uma chance
conhecida e diferente de zero de ser selecionada para compor a amostra. As amostragens
probabilísticas geram amostras denominadas probabilísticas.
Amostragem não probabilística é aquela em que a seleção dos elementos da população
depende, ao menos em parte, do julgamento do pesquisador ou do entrevistador no campo.
Não há nenhuma chance conhecida de que um elemento qualquer da população venha a
fazer parte da amostra. As amostragens não probabilísticas geram amostras denominadas não
probabilísticas.
Os tipos básicos de amostras e amostragens não probabilísticas compreendem: conveniência
(ou acidental), intencional (ou julgamento) e cotas (ou proporcional), bem como suas variações:
tráfego, autogerada e desproporcional.
Os tipos de amostras e amostragens probabilísticas compreendem: aleatória simples,
aleatória estratificada e por conglomerado.
As razões para o uso de amostragens não probabilísticas em pesquisas de marketing podem
ser: a não existência de uma alternativa viável; a amostragem probabilística é tecnicamente
superior na teoria, mas, na prática, ocorrem problemas em sua aplicação que enfraquecem essa
superioridade; a obtenção de uma amostra de dados que reflita precisamente a população não
é o propósito principal da pesquisa; a escassez de tempo e de recursos financeiros, materiais
e humanos necessários para a realização de uma pesquisa com amostragem probabilística;
os dados sobre a população (número, listagens etc.) não são ou não estão disponíveis, o que
impede a construção de amostras probabilísticas.
A amostra e a amostragem aleatória simples caracterizam-se pelo fato de cada elemento
da população ter probabilidade conhecida, diferente de zero, e idêntica à dos outros, de ser
selecionado para fazer parte da amostra.
Existem dois procedimentos para a obtenção de amostras aleatórias simples de uma
população cujos elementos estejam todos identificados e que, a cada um, tenha sido atribuído
um número: a realização de sorteios ou a utilização de tabelas de números aleatórios.

QUESTÕES DE REVISÃO
1. O que é censo? O que é pesquisa por amostragem?
2. Por que a pesquisa por amostragem é muito usada em pesquisas de marketing?
3. Conceitue: elemento, amostra, população, população derivada e unidade amostral.
4. O que distingue uma amostra probabilística de uma não probabilística?
5. Qual a natureza do erro gerado por uma amostragem não probabilística?
6. O que é amostragem por conveniência? E intencional? E por cotas?
7. Por que se deve, sempre que possível, realizar as pesquisas de marketing com amostragens
probabilísticas?
8. Por que, apesar das críticas, os métodos de amostragens não probabilísticas são muito
utilizados em pesquisas de marketing e até mesmo em pesquisas acadêmicas?
9. Qual a diferença entre parâmetros e estatísticas?
10. Considerando uma população infinita, qual a relação entre a média da população e a média
da população derivada (média amostral)? Entre a variância da população e a variância da
população derivada (variância amostral)?
212 Pesquisa de Marketing

11. O que é a Teoria do Limite Central e de que forma pode ser utilizada para controlar o
erro amostral?
12. O que é um intervalo de confiança?
13. O que afeta o tamanho de um intervalo de confiança?
14. Qual o procedimento para a construção de um intervalo de confiança quando a variância
da população é conhecida? E quando a variância da população é desconhecida?
15. Quais as propriedades desejadas num bom estimador?
16. Quais os procedimentos para a seleção de uma amostra aleatória simples?
17. Por que, em algumas pesquisas realizadas com amostras não probabilísticas, vê-se menção
a intervalo de confiança? Qual o significado desses intervalos nessas pesquisas?

Exercícios
1. Para conhecer os hábitos de leitura dos 2.000 estudantes de uma escola, decidiu-se pesquisar
uma amostra probabilística simples de 20. Descreva todo o processo que você utilizaria
para a seleção dessa amostra.
2. Em uma pesquisa realizada junto a uma amostra probabilística simples de 400 consumidoras
de sabão em pó, qual o intervalo de confiança para determinar os hábitos de consumo ao
nível de confiabilidade de 95%, sabendo-se que a média de consumo mensal de sabão em
pó na amostra pesquisada foi de quatro caixas de 750g, com desvio-padrão de 100g?
3. Para estimar a proporção de famílias que possuem forno de micro-ondas na Grande Porto
Alegre, realizou-se uma pesquisa numa amostra de 2.000 e constatou-se que 4% possuíam
esse aparelho. Calcular com 99,7% de nível de confiabilidade o intervalo de confiança para
esse resultado a uma precisão de 5%.
4. Uma sondagem inicial, numa amostra de 50 consumidores de uma nova marca de iogurte,
mostrou que 40% estavam satisfeitos ou muito satisfeitos com o produto. Qual o tamanho
que a amostra total dessa pesquisa precisa ter para obter uma precisão de 5% em seus
resultados, com um nível de confiabilidade de 95%?

REFERÊNCIAS
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 4. ed. São Paulo: Atual, 1987.
COCHRAN, W. G. Sampling techniques. 2. ed. New York: John Wiley, 1963.
DEMING, W. E. Some theory of sampling. New York: John Wiley, 1950.
DEMING, W. E. Sample design in business research. New York: John Wiley, 1960.
FONSECA, Jairo Simon; MARTINS, Gilberto de Andrade. Curso de estatística. São Paulo: LPM, 1975, Cap. 4.
HANSEN, M. H.; HURWITZ W. N.; MADOW W. G. Sample survey: methods and theory. New York: John
Wiley, 1953, 2 v.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
KISH, Leslie. Survey sampling. New York: John Wiley, 1965.
STEPHAN, F. J.; McCARTHY, P. J. Sampling opinions: an analysis of survey procedure. New York: John Wiley, 1958.
SUKHATME, P.V. Sampling theory of surveys with applications. Iowa: Iowa State University Press, 1954.
YATES, F. Sampling methods for census surveys. 3. ed. New York: Hafner, 1960.
CAPÍTULO 8
Outras Formas de Amostragens
Probabilísticas e o Tamanho da Amostra
Um homem comum é exigente com os outros; um homem superior é exigente consigo
mesmo.
Platão

Objetivos
• Apresentar os procedimentos para a realização de amostragem aleatória estratificada.
• Apresentar os procedimentos para a realização de amostragens estratificadas não proporcionais.
• Apresentar os procedimentos para a realização de amostragem por conglomerados ou grupos.
• Apresentar os procedimentos para a determinação do tamanho da amostra e do erro amostral nos
diversos tipos de amostragens probabilísticas.

Sumário
AMOSTRA E AMOSTRAGEM ALEATÓRIA ESTRATIFICADA
Procedimentos para a realização de amostras e amostragens aleatórias estratificadas
AMOSTRAS E AMOSTRAGENS ESTRATIFICADAS NÃO PROPORCIONAIS
AMOSTRAS E AMOSTRAGENS POR CONGLOMERADOS (OU GRUPOS)
Amostra e amostragem sistemática
Amostra e amostragem por área
DETERMINAÇÃO DO TAMANHO DA AMOSTRA E DO ERRO AMOSTRAL
Tamanho da amostra na amostragem aleatória simples
Outros fatores determinantes do tamanho da amostra
TAMANHO DA AMOSTRA EM OUTROS TIPOS DE AMOSTRAGENS PROBABILÍSTICAS

Há diversas situações em pesquisa de marketing em que a realização de amostragem


probabilística simples não é recomendada porque: outros métodos permitirão chegar
aos mesmos resultados de forma mais rápida e econômica; é impossível de ser realizada,
como quando a amostragem é feita numa população infinita; não se possuem dados da
população que permitam a realização de sorteios.

AMOSTRA E AMOSTRAGEM ALEATÓRIA ESTRATIFICADA


Para introduzir a necessidade de amostragem aleatória estratificada, será apresentado um
exemplo. Suponha-se que o problema seja conduzir uma pesquisa contínua de auditoria
de loja e que, para tanto, seja preciso montar um painel de supermercados em certa região.
Sabe-se que a maioria dos supermercados é de tamanho médio ou pequeno e que existem
apenas poucos de grande porte. Sabe-se também que os grandes supermercados exercem
213
214 Pesquisa de Marketing

grande atratividade sobre os consumidores e, por isso, são responsáveis por uma quantidade
muito grande das vendas totais. Se resolver-se obter uma amostra desses supermercados por
meio da amostragem aleatória simples, corre-se um grande risco de que nenhum ou poucos
grandes supermercados sejam sorteados para compor a amostra que, consequentemente, deverá
ser pouco representativa da população.
A intuição indica que a população desses supermercados deveria ser dividida em três
grupos: pequenos, médios e grandes, e que certo número de supermercados de cada grupo
deveria ser sorteado para compor o painel desejado mais representativo da população de
supermercados do que se fosse efetuado o sorteio a partir de toda a população. Como será
visto a seguir, a teoria estatística confirma a intuição.
Pelo exemplo apresentado, a população de supermercados poderia ser subdividida em
subgrupos. Esses subgrupos são chamados de estratos.
O processo de subdividir uma população em estratos, selecionar amostras aleatórias simples
de cada estrato e, em seguida, combiná-las em uma amostra única para estimar os parâmetros
da população é denominado de amostragem aleatória estratificada.
Existem inúmeras razões para a utilização desse tipo de amostragem. A primeira e básica
razão é que, dadas certas condições, elevam-se a precisão, a eficiência e a correção, qualidades
procuradas numa boa amostra. Amostragens aleatórias estratificadas resultam em decréscimo do
erro-padrão do estimador da população; consequentemente, o intervalo de confiança calculado
poderá ser menor. A segunda razão é que informações e análises referentes a cada estrato podem
ser úteis e necessárias e, por isso, desejadas. A terceira razão é que a coleta de informações fica
mais fácil administrativa e operacionalmente. A quarta e última razão é econômica: o custo da
amostragem estratificada é menor do que o da amostragem aleatória simples, o que permite
que se chegue aos mesmos resultados trabalhando-se com uma amostra total bem menor.

Procedimentos para a realização de amostras e amostragens aleatórias


estratificadas
Os procedimentos para a realização de amostragens aleatórias estratificadas compreendem os
seguintes passos:
1. Divide-se a população objeto do estudo em estratos que sejam mutuamente exclusivos
e coletivamente exaustivos. Consideram-se estratos mutuamente exclusivos quando a in-
clusão de um elemento num estrato impossibilita sua inclusão em outro. Por exemplo, a
população de determinado município pode ser dividida em dois estratos em relação a sexo:
masculino e feminino; ou em cinco, considerando as classes socioeconômicas: A, B, C, D
e E. Considera-se o conjunto de estratos exaustivos quando todos os possíveis valores das
variáveis foram utilizados para defini-los. Nos exemplos, os estratos masculino e feminino
definem o domínio completo da variável sexo.
2. Define-se o número de elementos a selecionar em cada estrato.
3. Seleciona-se uma amostra aleatória simples e independente em cada estrato.
4. Calculam-se a média e o desvio-padrão de cada amostra.
5. Compõem-se as médias e os desvios-padrão de cada amostra para o cálculo da média e
do desvio-padrão que serão usados como estimadores dos parâmetros da população.
A redução do erro padrão de um estimador da população, por meio da amostragem
aleatória estratificada, ocorrerá, sempre e somente, quando, ao menos num dos estratos, houver
maior homogeneidade em relação à variável em estudo do que nos outros.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 215

Continuando com o exemplo prático de se construir um painel de supermercados para ilus-


trar os procedimentos da amostragem aleatória estratificada, suponha-se que os dados obtidos
sobre essa população de supermercados sejam os apresentados na Tabela 8.1, admitindo-se a
caracterização do porte dos supermercados pelas suas áreas de vendas (em m2).

Tabela 8.1  Área de vendas dos supermercados da região de Pasárgada


Elemento da população Área de vendas (m2) Elemento da população Área de vendas (m2)
1 500 21 4.000
2 500 22 4.500
3 500 23 4.500
4 500 24 5.000
5 1.000 25 5.000
6 1.000 26 7.000
7 1.000 27 9.000
8 1.500 28 10.500
9 1.500 29 10.500
10 1.500 30 11.000
11 1.500 31 12.000
12 2.000 32 12.000
13 2.000 33 12.500
14 2.500 34 14.000
15 2.500 35 18.000
16 2.500 36 25.000
17 3.000 37 35.000
18 3.000 38 45.000
19 3.500 39 60.000
20 3.500 40 70.000

Os parâmetros dessa população são, respectivamente:


m = 410.000/40 = 10.250 m2
σ2 = 249.975.000
σ = 15.810,60 m2
para o cálculo de σ2 foi usada a fórmula computacional:
∑ x 2 (∑ x )2
σ =
2
− 2
n n
Ao assumir a variável área de vendas (em m2) para a determinação do porte de cada
supermercado, tendo em vista os objetivos da pesquisa, está-se pressupondo que:
• Existem supermercados com áreas de vendas de diversos tamanhos.
• Existe uma relação entre a área de vendas de cada supermercado e o montante de suas
vendas.
• Os supermercados de maior área de vendas têm um montante de vendas por m2 maior
do que os outros.
Para facilitar a discussão que segue, será estabelecida a seguinte simbologia:
N = tamanho da população
N1 = tamanho da população no estrato 1
N2= tamanho da população no estrato 2
216 Pesquisa de Marketing

N3 = tamanho da população no estrato 3


n = tamanho da amostra sem estratificação
n1 = tamanho da amostra no estrato l
n2 = tamanho da amostra no estrato 2
n3 = tamanho da amostra no estrato 3
x  = média da amostra sem estratificação
x1  = média da amostra no estrato 1
x 2  = média da amostra no estrato 2
x 3  = média da amostra no estrato 3
S2 = variância da amostra sem estratificação
S12  = variância da amostra do estrato 1
S22  = variância da amostra do estrato 2
S32  = variância da amostra do estrato 3
Inicialmente, efetua-se uma amostragem aleatória simples de n = 8 (a determinação do
tamanho da amostra será discutida mais adiante neste capítulo), a partir de toda a população,
e calculam-se suas estatísticas. Em seguida, constrói-se uma amostra estratificada a partir da
população e calculam-se suas estatísticas. Finalizando, comparam-se os resultados obtidos em
cada caminho em termos do erro padrão.
Recorrendo ao exemplo de tabela de números aleatórios (veja a Tabela 1 do Apêndice –
Tabelas estatísticas selecionadas, no final deste livro), foi sorteada a seguinte amostra de oito
elementos da população de 40 supermercados (Tabela 8.2):
Tabela 8.2  Amostra sorteada da população de supermercados
Elemento da amostra Elemento da população Área de vendas (m2)
1 16 2.500
2 21 4.000
3 17 3.000
4 13 2.000
5 24 5.000
6 31 12.000
7 34 14.000
8 37 35.000

Cujas estatísticas são:


x = 9.687,50 m2
S2 = 109.308.484
S = 10.455,07 m2
Aplicando-se os procedimentos para a realização de amostragem estratificada a esse exem-
plo, tem-se:
• Dividir a população em estratos – Divide-se essa população de supermercados em três
estratos em função de suas áreas de vendas:
Estrato 1: Supermercados com área de vendas até 5.000 m2 (elementos da população
de números 1 a 25).
Estrato 2: Supermercados com área de vendas acima de 5.000 até 20.000 m2 (elementos
da população de números 26 a 35).
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 217

Estrato 3: Supermercados com área de vendas acima de 20.000 m2 (elementos da


população de números 36 a 40).
• Define-se o número de elementos a selecionar em cada estrato – Considera-se, no exem-
plo, para efeito de comparação dos resultados, que o número total de casos com e sem
estratificação seja o mesmo, n = 8. Além disso, faz-se com que o número de elementos de
cada amostra dos estratos seja proporcional à sua ocorrência na população (será visto mais
adiante, neste capítulo, que existem outras formas de determinar o número de elementos
de cada estrato). Assim:

n1 = (N 1 /N ) × n = 5
n2 = (N 2 /N ) × n = 2
n3 = (N 3 /N ) × n = 1

• Selecionam-se amostras aleatórias simples em cada estrato – Recorrendo, mais uma vez,
ao exemplo de tabela de números aleatórios (veja a Tabela 1 do Apêndice – Tabelas estatís-
ticas selecionadas, no final deste livro), sorteiam-se os elementos para compor as amostras
de cada estrato. No exemplo, também para facilitar a comparação, considera-se que os
elementos sorteados tenham sido os mesmos da amostra sem estratificação.
Estrato 1 (até 5.000 m2): 16 – 2.500; 21 – 4.000; 17 – 3.000; 13 – 2.000; 24 – 5.000
Estrato 2 (acima de 5.000 a 20.000 m2): 31 – 12.000; 34 – 14.000
Estrato 3 (acima de 20.000 m2): 34 – 35.000
• Calculam-se a média e os desvios-padrão de cada amostra:

Amostra 1:
x1  = 16.500/5 = 3.300
S12  = 1.160.000
S1 = 1.077
Amostra 2:
x2  = 26.000/2 = 13.000
2
S 2  = 1.000.000
S2 = 1.000
Amostra 3:
x3  = 35.000
S 32  = 0
S3 = 0

• Compõem-se as médias e os desvios-padrão de cada amostra para o cálculo da média e


do desvio-padrão que serão usados como estimadores da população.
Para o cálculo da média – A média da amostra estratificada é igual à média aritmética
ponderada das médias de cada estrato. A ponderação é feita segundo a participação de
cada estrato na população:
x = (N 1 /N ) × x1 + (N 2 /N ) × x 2 + (N 3 /N ) × x 3
x  = 5/8 × 3.300 + 2/8 × 13.000 + 1/8 × 35.000
x  = 9.687,50 (idêntica à da amostra não estratificada, como era esperado)
218 Pesquisa de Marketing

Para o cálculo da variância e do desvio-padrão – A variância da amostra estratificada é igual


à somatória das variâncias de cada estrato, multiplicadas pelo quadrado da participação
de cada estrato na população, dividido pelo número de elementos do respectivo estrato.
S 2 = ∑ (N i /N )2 × Si2 /ni
No exemplo:
S2 = (5/8)2 × 1.160.000 + (2/8)2 × 1.000.000 + (1/8)2 × 0
S2 = 515.625
S = 718
Sumarizando esses resultados na Tabela 8.3, pode-se observar que as variâncias e os
desvio-padrão em cada estrato são muito menores do que para o total da amostra sem es-
tratificação, e que a variância e o desvio-padrão resultantes da amostra com estratificação
são infinitamente menores do que sem estratificação.
Tabela 8.3  Médias, variâncias e desvios-padrão da população, da amostra sem estratificação, de cada estrato
e da amostra com estratificação
Média Variância Desvio-padrão
População 10.250 10.250 15.810,60
Amostra sem estratificação 9.687,50 109.308.484 10.455,07
Estrato 1 3.300 1.160.000 1.077,14
Estrato 2 13.000 1.000.000 1.000
Estrato 35.000 0 0
Amostra com estratificação 9.687,50 515.625 718,07

Analogamente, os intervalos de confiança, associados aos diversos níveis de confiança, poderão


ser facilmente calculados e será possível observar que também serão muito menores, quando
comparados aos originários de amostras não estratificadas, o que leva a concluir pelas grandes
vantagens da utilização de amostragens estratificadas.
AMOSTRAS E AMOSTRAGENS ESTRATIFICADAS NÃO PROPORCIONAIS
As amostras estratificadas podem também não ser proporcionais à ocorrência dos estratos na
população. São utilizadas quando já se possui algum conhecimento prévio da população que
permita decidir se determinados estratos devem ter pesos maiores ou menores em função da
maior ou da menor variabilidade das variáveis intraestrato e da maior ou menor representati-
vidade extraestrato, em relação à população. Esse procedimento permitirá que o erro padrão
da amostra seja reduzido ainda mais.
Voltando ao exemplo dos supermercados. Observa-se que as amplitudes de variações das
áreas de venda em cada estrato são, respectivamente:
A1 = 5.000 − 500 = 4.500 m2
A2 = 18.000 − 7.000 = 11.000 m2
A3 = 70.000 − 25.000 = 45.000 m2
Pode-se notar também que, em relação à somatória das áreas de vendas por estrato (Tabela 8.4),
há nítida diferença em termos quantitativos entre os três estratos de supermercados. Essas informações
sobre a população deveriam ser consideradas no momento de se determinarem os tamanhos de
cada estrato e na composição de uma amostra estratificada.
As empresas de pesquisas especializadas em auditoria de loja utilizam a amostragem aleatória
não proporcional para construir seus painéis de lojas e, normalmente, elevam a participação das
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 219

lojas grandes em função de sua representatividade na população e de sua maior variabilidade


nas vendas.
Tabela 8.4  Somatória das áreas de vendas dos supermercados por estrato
Estrato Número ∑ de área de vendas (m2) %
Supermercados pequenos 25 58.500 14,3
Supermercados médios 10 116.500 28,4
Supermercados grandes 5 235.000 57,3

A forma prática de se determinar o peso da participação não proporcional de um estrato


na composição da amostra obedece às seguintes regras:
• Quanto maior a importância de um estrato na população, maior deverá ser sua participação.
• Quanto maior o estrato, menor deverá ser sua participação.
• Quanto maior a variabilidade dentro do estrato, maior deverá ser sua participação.
As formulações para os cálculos de média, variância e desvio-padrão da amostra estratificada
são as mesmas utilizadas para amostras proporcionais.

AMOSTRAS E AMOSTRAGENS POR CONGLOMERADOS (OU GRUPOS)


Todos os métodos de amostragem estudados até aqui pressupunham que a seleção para a com-
posição da amostra tinha por base os elementos da população. Como visto, esses procedimentos
exigem determinado conhecimento prévio da população. No entanto, na maioria das vezes,
isso não é possível em pesquisas de marketing. Mesmo quando houver esse conhecimento,
outros métodos poderão ser utilizados com maior economia de tempo e dinheiro.
Na amostra aleatória por conglomerado, grupos de elementos da população são simul-
taneamente sorteados. Para colher esse tipo de amostra, a população em estudo precisa ser
subdividida em grupos mutuamente exclusivos e coletivamente exaustivos. Em seguida,
procede-se à seleção da amostra a partir desses grupos. Quando, dos grupos selecionados,
todos os elementos passam a fazer parte da amostra, a amostragem é chamada de “um estágio”.
Quando, após o sorteio dos grupos, procede-se a um segundo sorteio para determinar quais
elementos desses grupos sorteados farão parte da amostra, a amostragem é chamada de “dois
estágios”. Seguindo esse raciocínio, será possível ter amostragens de “n estágios”, quando
sorteios sucessivos são realizados, até se chegar ao sorteio dos elementos do último grupo.
Tanto na amostragem aleatória simples quanto na amostragem por conglomerados, a fração
da população amostrada poderá ser a mesma. No entanto, diferentemente da amostragem
aleatória simples, em que todas as combinações possíveis de n elementos da população podem
ser sorteadas, na amostragem aleatória por conglomerados isso não ocorre; ao contrário, a
maioria das combinações é impossível.
Também se deve observar que, enquanto na amostragem estratificada proporcional a
precisão da amostra cresce à medida que são formados estratos que sejam homogêneos in-
ternamente e heterogêneos externamente, na amostragem por conglomerados a precisão cresce
quanto mais a heterogeneidade dos grupos se aproximar da população. Portanto, em amos-
tragens estratificadas, precisa-se de grupos homogêneos e na por conglomerados, de grupos
heterogêneos, embora, na prática, na amostragem por conglomerados, há muita dificuldade
em se conseguirem grupos heterogêneos. Como exemplo, veja a população de 24 elementos
220 Pesquisa de Marketing

da Tabela 8.5, já subdividida em grupos e da qual se pretende retirar uma amostra de oito


elementos por meio de amostragem por conglomerados.
Tabela 8.5  População estratificada
Grupo Número de elementos da população
1 1, 2, 3 e 4
2 5, 6, 7 e 8
3 9, 10, 11 e 12
4 13, 14, 15 e 16
5 17, 18, 19 e 20
6 21, 22, 23 e 24

Conforme o número de estágios utilizados na amostragem, as amostras resultantes são:


• Na amostragem de um estágio, o sorteio aleatório de dois dos seis grupos; admitindo que
os grupos sorteados tenham sido 1 e 6, a amostra resultante será composta dos seguintes
elementos: 1, 2, 3, 4, 21, 22, 23 e 24.
• Na amostragem de dois estágios: no 1o estágio, o sorteio aleatório de quatro dos seis grupos;
admitindo que os grupos sorteados tenham sido: 1, 2, 4 e 6; no 2o estágio, em cada grupo
sorteado, procede-se a um segundo sorteio de dois elementos para fazer parte da amostra.
Admitindo que tenham sido sorteados do grupo 1, os elementos 2 e 3; do grupo 2, os
elementos 7 e 8; do grupo 4, os elementos 13 e 16; e do grupo 6, os elementos 21 e 23;
a amostra resultante será: 2, 3, 7, 8, 13, 16, 21 e 23.
O tamanho do erro amostral gerado a partir de amostras por conglomerados tende
a ser sempre maior ou, no máximo, igual ao gerado por amostras aleatórias simples de
mesmo tamanho da mesma população. Na prática, com raras exceções, as amostras por
conglomerado são menos homogêneas do que a população, e, por isso, menos eficientes
que as aleatórias simples. Apesar disso, por razões de custo, as amostras por conglomerado
são muito usadas em pesquisas de marketing. Para um mesmo custo, é possível trabalhar
com uma amostra por conglomerado muito maior do que uma aleatória simples. Quando
se combinam eficiência estatística e eficiência econômica do método de amostragem,
tem-se eficiência total; é a amostragem por conglomerados aquela que apresenta a maior
eficiência total, pois é o método com o menor erro padrão por unidade monetária de
custo.
São apresentados, a seguir, os principais tipos de amostras e amostragens por conglomerados.

Amostra e amostragem sistemática


Para realizar a amostragem sistemática, seleciona-se, aleatoriamente, para ser o primeiro ele-
mento de uma amostra de tamanho n, de uma população de tamanho N, um dentre os N/n
primeiros elementos listados em um rol. Para a obtenção dos demais elementos, acresce-se,
sucessivamente, ao número de ordem do elemento anterior N/n para se determinar o número
de ordem do elemento seguinte, até se esgotar toda a população.
Como exemplo, será constituída uma amostra sistemática de tamanho n = 4, da população
de 40 supermercados listada na Tabela 8.1. Seguindo o procedimento apresentado, tem-se:
• Sorteia-se um número entre 1 e N/n = 40/4 = 10, admitindo-se que o número sorteado
tenha sido 4.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 221

• Adiciona-se, sucessivamente, ao número de ordem do elemento anterior, N/n = 40/4 = 10,


para determinar o número do elemento seguinte:
No de ordem do 1o elemento: 4
No de ordem do 2o elemento: 4 + 10 = 14
No de ordem do 3o elemento: 14 + 10 = 24
No de ordem do 4o elemento: 24 + 10 = 34
A amostra será constituída conforme apresentado na Tabela 8.6.
Tabela 8.6  Amostra sistemática
Número de ordem do elemento Área de vendas (m2)
4 500
14 2.500
24 5.000
34 14.000

Uma observação atenta constata que a amostragem sistemática é um tipo de amostragem


por conglomerado de um estágio. No exemplo dos supermercados, existem apenas dez grupos
de diferentes elementos da população, dos quais foi sorteado apenas um para ser a amostra da
população. Na Tabela 8.7, são apresentados esses dez grupos, em que se pode observar que o
conglomerado sorteado foi o de número 4.
Tabela 8.7  Conjunto de todos os possíveis conglomerados da população de supermercados
Conglomerado Número de ordem dos elementos
1 1, 11, 21, 31
2 2, 12, 22, 32
3 3, 13, 23, 33
4 4, 14, 24, 34
5 5, 15, 25, 35
6 6, 16, 26, 36
7 7, 17, 27, 37
8 8, 18, 28, 38
9 9, 19, 29, 39
10 10, 20, 30, 40

Nota-se que, pela amostragem aleatória simples, tem-se C40, 4 = 40!/(40 − 4)! × 4! = 91.390
amostras de quatro elementos possíveis de serem sorteadas, e que, pela amostragem sistemática,
passa-se a ter apenas dez. Felizmente, a média da distribuição amostral (média amostral) de
todas as amostras possíveis de serem sorteadas, numa amostragem sistemática, é igual à média
da população, o que significa que a média obtida de qualquer amostra sistemática é um es-
timador não viesado da média da população, o que permite calcular os intervalos de confiança,
de forma semelhante aos efetuados para a amostragem aleatória simples.
Completando o exemplo:
x  = 5.500
S2 = 26.625.000
S = 5.159,94
O único cuidado que se deve ter com amostras sistemáticas é quando se trabalha com
populações sujeitas a variações cíclicas que coincidam com os múltiplos do intervalo amostral.
222 Pesquisa de Marketing

Dessa forma, deve-se evitar, por exemplo, colher dados sobre vendas em supermercados, sempre
nos mesmos dias da semana e do mês, ou sempre nos mesmos meses do ano.
Uma grande restrição ao uso da amostragem sistemática é a necessidade de se dispor dos
elementos da população em uma listagem, classificados segundo alguma variável importante
para o estudo. Em alguns casos, a ausência dessa listagem poderá ser contornada. Um exemplo
é o caso de, numa pesquisa, os entrevistadores serem orientados para entrevistar todas as 15as
pessoas que passarem pelo local da pesquisa; analogamente, é o caso de, em outra pesquisa, os
entrevistadores receberem a orientação de realizar a entrevista sempre na quinta casa do lado
par de ruas predeterminadas.

Amostra e amostragem por área


Para todos os planos de amostragens probabilísticas que foram estudados até o momento, uma
completa e correta lista dos elementos da população é necessária, além de que, no caso das
amostragens aleatórias estratificadas e sistemáticas, outras informações são ainda necessárias
para um procedimento correto. No entanto, para a maioria das situações ou aplicações em
pesquisa de marketing, essas listagens não existem, não estão disponíveis ou o custo de sua
obtenção é inviável. Alguns exemplos em que essa dificuldade é evidente:
• População de donas de casa consumidoras de mistura para bolos.
• População de consumidores de cerveja Kaiser.
• População de usuários de computadores pessoais no Brasil.
Existem algumas fontes de listagens de grandes populações não específicas que são aces-
síveis e que, dependendo dos objetivos da pesquisa, poderão ser utilizadas, como:
• Listagens dos consumidores de energia elétrica residencial, comercial e industrial (dis-
poníveis nas distribuidoras de energia elétrica).
• Listagens dos usuários de telefones fixos (disponíveis nas listas de assinantes e amarelas).
• Listagens de empresas comerciais, industriais e de prestação de serviços (disponíveis nas
Secretarias da Fazenda dos Estados, nas Prefeituras Municipais e na Secretaria da Receita
Federal).
Mesmo que não se consiga obter a listagem desejada, a pesquisa poderá ser conduzida, desde
que se passe a utilizar a amostragem por área. A amostragem por área é uma solução engenhosa
que dispensa a necessidade de listagens dos elementos da população, mas, em contrapartida,
exige a utilização de mapas detalhados de regiões, estados, municípios, cidades e bairros.
Quando se trata de pesquisa sobre um tema em que todos os elementos da população
têm conhecimento e opinião a dar, a amostragem por área se mostra perfeitamente adequada
e operacional.
No entanto, quando a população de pesquisa é infinitamente menor que a população
demográfica, ou seja, o número de elementos que têm conhecimento e opinião a dar é muito
pequeno, a amostragem por área gera um enorme problema operacional, exigindo que, no último
estágio, todos os domicílios da unidade amostral sorteada sejam arrolados, ou seja, que haja o
registro formal dos domicílios em que existam elementos pertencentes à população de pesquisa.
Após o completo arrolamento, procede-se ao sorteio dos entrevistados entre os domicílios
arrolados que têm elementos da população de pesquisa. Todo esse procedimento deve fazer
parte do relatório de campo da pesquisa. É um custo muito grande que precisa ser previamente
incluído no orçamento da pesquisa.
A amostragem por área pode ser: em um estágio, em dois estágios e em multiestágios.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 223

Amostragem por área em um estágio – Compreende os seguintes passos:


1. Listar e numerar todos os quarteirões de uma cidade (população de quarteirões = Nq).
2. Sortear uma amostra aleatória simples ou sistemática de tamanho nq da população de Nq
quarteirões.
3. Coletar dados de todas as residências dos nq quarteirões sorteados.
Observe que esse é um procedimento de amostragem probabilística. Todos os elementos
da população (residências) têm a mesma probabilidade nq/Nq de serem selecionados, pois todas
as residências dos quarteirões sorteados são pesquisadas.
Amostragem por área em dois estágios – Compreende os seguintes passos:
1. Listar e (ou) numerar todos os Nq quarteirões de uma cidade.
2. Sortear uma amostra aleatória simples ou sistemática de tamanho nq da população de Nq
quarteirões.
3. Listar e (ou) numerar todas as residências de cada um dos nq quarteirões sorteados.
4. Sortear uma amostra aleatória simples ou sistemática de nr residências de cada um dos nq
quarteirões sorteados.
Note que a única diferença entre os dois tipos de amostragem por área é que em “dois
estágios” procede-se a um segundo sorteio para determinar os elementos da amostra.
Amostragem por área em multiestágios – É utilizada quando a área geográfica
abrangida pela pesquisa é muito extensa. Quando aplicada a todo um país, essa amostragem
pode ter os seguintes passos:
1. Subdividir o país em áreas primárias. Considerar áreas primárias: regiões metropolitanas,
comarcas ou grupos de comarcas (quando se tratar de comarcas muito pequenas).
2. Estratificar essa população de áreas primárias para estar seguro de que a amostra a ser
construída tenha, na mesma proporção, os diferentes tipos de áreas primárias e (ou)
diferentes regiões do país.
3. Listar e (ou) numerar todas as divisões obtidas.
4. Sortear uma amostra aleatória estratificada dessa população de áreas primárias.
5. Em cada área primária selecionada, elaborar uma lista das cidades grandes, médias e dos
municípios restantes e criar estratos.
6. Sortear uma amostra aleatória estratificada da população de cidades grandes, cidades
pequenas e municípios restantes em cada área primária sorteada. Cada elemento sorteado
dessa forma é denominado de locação amostral.
7. A partir desse ponto, o processo passa a ser semelhante à amostragem por área em dois
estágios.
8. Listar e (ou) numerar todos os Nq quarteirões de cada locação amostral.
9. Sortear uma amostra aleatória simples ou sistemática de tamanho nq da população de Nq
quarteirões de cada locação amostral.
10. Listar e (ou) numerar todas as residências de cada um dos nq quarteirões sorteados de todas
as locações amostrais.
11. Sortear uma amostra aleatória simples ou sistemática de nr residências de cada um dos nq
quarteirões de cada locação amostral (veja na Figura 8.1 ilustração desse tipo de amostragem).
Observações:
1. Os passos 10 e 11 podem ser substituídos por orientações aos entrevistadores de campo
sobre como devem proceder na “escolha” de residências (por exemplo: começando pela
esquina norte do quarteirão sorteado e percorrendo-o no sentido anti-horário; a cada
224 Pesquisa de Marketing

quatro casas percorridas, a quarta deverá fazer parte da amostra, e assim, sucessivamente,
até esgotar o quarteirão e continuar no próximo sorteado).

Figura 8.1  Ilustração da amostragem por área de multiestágios.

2. Entre os passos 6 e 8, poderá ser incluído mais um: a listagem e (ou) numeração de todos
os bairros e o sorteio de bairros.
3. Um prédio de apartamentos residenciais com 120 unidades deverá ser considerado como
120 residências e, de forma semelhante à definição da escolha de residências num quarteirão,
deverá ser definido um critério para a escolha dos apartamentos em que a entrevista será
realizada.
4. Uma das grandes dificuldades desse tipo de amostragem está em conseguir acesso a certos
tipos de moradias, como em prédios de apartamentos, residências situadas em condomínios
horizontais fechados e residências de famílias de classes alta e média-alta. A utilização de
entrevistas por telefone pode solucionar esse problema.
Características da amostragem por área em multiestágios – Esse tipo de amostragem é, estatis-
ticamente, muito menos eficiente do que a amostragem aleatória simples. Enquanto a amos-
tragem aleatória simples está sujeita a apenas um erro amostral, originário de um sorteio, a
amostragem por área em multiestágios estará exposta a tantos erros amostrais quantos forem os
sorteios ao longo dos diversos passos de sua realização. As fórmulas de cálculo do desvio-padrão
para esse tipo de amostra são extremamente complexas e fogem ao escopo deste livro. No
entanto, o leitor interessado poderá ter acesso a elas, consultando a bibliografia recomendada
ao final deste capítulo.
Alguns fatos relacionados à amostragem por área em multiestágios são importantes e
merecem registro:
1. O erro amostral decresce à medida que:
• Crescer o tamanho da amostra.
• Crescer a homogeneidade dos elementos amostrados a cada estágio.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 225

2. Para um dado tamanho total da amostra, o erro amostral decresce à medida que:
• Crescer o número de elementos dos estágios intermediários (onde normalmente há
maior heterogeneidade).
• Decrescer o número de elementos do estágio final (onde normalmente há maior
homogeneidade).
Para a realização do procedimento proposto no item 2, há, em contrapartida, muito mais
trabalho e um custo mais elevado, pois:
• Mais áreas precisariam ser selecionadas.
• Maior número de listas e (numerações) de elementos nos estágios intermediários precisaria
ser preparado.
• Mais áreas geográficas seriam abrangidas pela pesquisa (com a consequente elevação dos
custos de deslocamentos).
• Haveria maior complexidade administrativa na execução da pesquisa.
A decisão final de como proceder sempre deverá ser tomada levando-se em conta os objetivos do
estudo, a precisão desejada, o tempo e os recursos disponíveis. O pesquisador procurará elaborar um
plano amostral, de forma a obter a melhor eficiência total possível. Não há fórmula predeterminada
para essa decisão, e a formação, a experiência e a sensibilidade do pesquisador têm um grande peso.
Amostragem por áreas de probabilidade iguais – Foi visto que uma das condições
da amostragem probabilística é que a probabilidade de cada elemento da população fazer parte
da amostra deve ser conhecida e diferente de zero. Será examinado, na amostragem por área,
se essas condições serão atendidas em dois casos diferentes: chances iguais de seleção das áreas
e amostras proporcionais ao tamanho das áreas.
1. Chances iguais de seleção das áreas/igual proporção de seleção dos elementos nos con-
glomerados – Nesse método, cada conglomerado terá a mesma chance de fazer parte da
amostra, independentemente de seu tamanho. Em seguida, de cada conglomerado sorteado,
sorteiam-se elementos, mantendo-se sempre a mesma proporção para a composição da
amostra final, conforme mostra o exemplo a seguir.
Seja uma população de 10.000 elementos agrupados em 100 conglomerados de diferentes
tamanhos. Sorteiam-se cinco desses conglomerados para ser as locações amostrais. A
chance de cada conglomerado ser sorteado é de 5/100. Em seguida, de cada um desses
conglomerados, sorteiam-se elementos para a amostra, na proporção, por exemplo, de 2/5,
ou seja, sorteiam-se 40% dos elementos de cada conglomerado sorteado. Dessa forma,
verifica-se que esse tipo de amostragem é probabilístico, pois a probabilidade total de cada
elemento ser selecionado é 5/100 × 2/5 − 0,02, e o mínimo total de elementos a serem
selecionados é 0,02 × 10.000 = 200.
Pode-se também intercambiar o número de conglomerados com a proporção de elementos
a sortear, mantendo o mesmo número total de elementos da amostra e a mesma proba-
bilidade de cada elemento. Para o exemplo em pauta, é possível ter as seguintes opções:
• 10 conglomerados e 1/5 dos elementos (10/100 × 1/5 = 0,02).
• 20 conglomerados e 1/10 dos elementos (20/100 × 1/10 = 0,02).
E, assim, sucessivamente.
Esse procedimento de elevar o número de conglomerados e reduzir o número de elementos
por conglomerado tende a elevar a precisão da amostra para o mesmo número total de
elementos, pois há menores variabilidades nas variáveis intraconglomerados do que nas
variáveis interconglomerados.
226 Pesquisa de Marketing

Analogamente, se esse procedimento for aplicado sucessivamente para a amostragem por área em
multiestágios, a amostra resultante também será probabilística.A probabilidade de cada elemento
fazer parte da amostra resultará da multiplicação das probabilidades de sorteio em cada estágio:
Probabilidade de cada elemento = P1 × P2 × … × Pi
A garantia de que cada elemento da população terá a mesma chance de ser sorteado é que,
em cada estágio, a mesma proporção de elementos é selecionada de cada conglomerado.
2. Amostras proporcionais ao tamanho da área – Outro procedimento na amostragem por
áreas, para se obterem amostras probabilísticas, é fazer com que o número de conglomerados
sorteados seja proporcional à sua incidência na população. Como, normalmente, há maior
variabilidade nas variáveis interconglomerados do que nas variáveis intraconglomerados,
se elevar-se o número de conglomerados a serem sorteados à proporcionalidade de sua
incidência na população, certamente será elevada a precisão da amostra, mesmo tendo de
reduzir o número de elementos a serem sorteados em cada conglomerado.
Os procedimentos para a realização dessa forma de amostragem, para o caso de dois es-
tágios, compreendem:
a. Identificar todos os conglomerados e o número de elementos que os compõem.
b. Estabelecer a proporção de conglomerados a serem sorteados em função do número
de elementos de cada conglomerado em relação ao total da população.
c. Sortear os conglomerados.
d. De cada conglomerado sorteado, sortear uma quantidade fixa e constante de elementos
para constituir a amostra.
Esses procedimentos serão aplicados ao seguinte exemplo: na Tabela 8.8, é apresentada a
distribuição do número de residências por quarteirão de uma pequena cidade. A partir desses
dados, será construída uma amostra por área proporcional ao tamanho.
Tabela 8.8  Distribuição do número de residências, por quarteirão, de uma pequena cidade
Número acumulado Intervalo de números
Quarteirão Número de residências % de residências randômicos associados
A 80 0,10 80 001 a 080
B 120 0,15 200 081 a 200
C 40 0,05 240 201 a 240
D 160 0,20 400 241 a 400
E 160 0,20 560 401 a 560
F 40 0,05 600 561 a 600
G 120 0,15 720 601 a 720
H 80 0,10 800 721 a 800

Para o sorteio dos quarteirões, define-se o número de elementos e, em seguida, uti-


lizando-se de uma tábua de números aleatórios, procede-se à seleção. Note agora que a
probabilidade de seleção do quarteirão é proporcional a seu tamanho, e não à amostra. Note
também que, na última coluna da Tabela 8.8, foi criado, a partir do número acumulado
de residências, um intervalo dos números randômicos associados a cada quarteirão, o que
garante a probabilidade de seleção proporcional ao tamanho do quarteirão. Supondo que
o número definido para a seleção de quarteirões tenha sido nq = 5, e os números encon-
trados na tábua de números aleatórios tenham sido: 117, 402, 764, 583 e 397 os quarteirões
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 227

que comporão a amostra serão: B, E, H, F e D. Supondo ainda que, de cada quarteirão se


tenha decidido sortear cinco casas, as probabilidades, a priori, de seleção de cada elemento
da população, situado em cada quarteirão sorteado, são as seguintes:
No quarteirão B: 0,15 × 5/120 = 0,00625.
No quarteirão E: 0,20 × 5/160 = 0,00625.
No quarteirão H: 0,10 × 5/80 = 0,00625.
No quarteirão F: 0,05 × 5/40 = 0,00625.
No quarteirão D: 0,20 × 5/160 = 0,00625.
Total da amostra = 25 elementos.
Isso leva a concluir que esse tipo de amostragem é probabilístico, conforme se desejava mostrar.
Amostragem por áreas de probabilidades desiguais – Em todos os casos de amos-
tragem por área vistos, a probabilidade de cada elemento da população fazer parte da amos-
tra sempre foi conhecida e idêntica para todos. No entanto, a condição para ter amostras
probabilísticas exige que as probabilidades sejam conhecidas e diferentes de zero, mas não
necessariamente idênticas. Na prática de pesquisa de marketing, nem sempre é possível,
conveniente ou desejável que se tenham amostras originadas de elementos da população com
probabilidades idênticas, como nos seguintes casos:
• Trabalhar com amostras estratificadas desproporcionais para elevar a precisão.
• O conhecimento prévio de algumas informações sobre a população sugere que determi-
nados conglomerados possam ter seu tamanho diminuído.
• Desconhecem-se os tamanhos dos conglomerados, o que impede a amostragem propor-
cional ao tamanho.
Pretendendo-se, na pesquisa, efetuar análises, apenas nos conglomerados ou intercon-
glomerados, não haverá nenhum problema em se trabalhar com amostragens por área de
probabilidade desigual. No entanto, desejando-se realizar análises dos resultados conjuntos,
será preciso efetuar antes uma ponderação dos resultados de cada conglomerado, de forma
a restabelecer a proporção existente na população. Essa ponderação poderá, facilmente, ser
executada na fase de processamento da pesquisa, porém só será possível se o pesquisador tiver
conhecimento dessa proporcionalidade na população.
A regra a ser utilizada para a ponderação é a seguinte: cada elemento deverá ser ponderado
na proporção inversa da probabilidade de ser selecionado para a amostra. Esse procedimento
será ilustrado por meio de um exemplo muito simples.
Supondo-se que, em determinada população, a proporção do número de elementos de
cada conglomerado seja: 2/3 para o conglomerado A e 1/3 para o conglomerado B, e que
amostras de tamanho 5, colhidas de cada conglomerado, mostraram o seguinte resultado:
• Média de consumo do produto Z no conglomerado A
X A = 20 Xunidades por mês
• Média de consumo do produto Z no conglomerado B
X B = 30 unidades por mês
Incorrerá em grave erro o pesquisador que, desejando saber o consumo médio mensal
desse produto em toda a população, simplesmente somar as médias de cada conglomerado e
dividi-las por dois. O cálculo correto é:
X AB = ( X A × 1 / 3 + X B × 2 / 3) / 2
X AB = (20 × 1 / 3 + 30 × 2 / 3) / 2 = 26,66
228 Pesquisa de Marketing

No Quadro 8.1, é apresentado um sumário gerencial, em termos de vantagens e des-


vantagens, dos vários métodos de amostragens em relação a erro amostral, eficiência estatística,
necessidade de listagem da população, custo e frequência do uso em pesquisas de marketing.

Quadro 8.1  Sumário gerencial de amostragens


Amostragem probabilística Amostragem não probabilística
Estrati- Sistemá- Julga-
Variável Censo Simples ficada tica Área Conveniência mento Cota
Geração de Não Sim Sim Sim Sim Não Não Não
erro amostral
Eficiência - Alta Alta Baixa Baixa (Não é possível comparar)
estatística
Necessidade Sim Sim Sim Sim Não Não Não Não
de listagem da
população
Custo Elevado Alto Alto Moderado Mo- Muito baixo Baixo Mode-
a alto derado rado
Frequência Baixo Baixo Mode- Moderado Alto Alto Mode- Eleva-
de uso em rado rado do
pesquisas de
marketing
Fonte: Adaptado de Kinnear, Thomas C.; Taylor, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.

DETERMINAÇÃO DO TAMANHO DA AMOSTRA E DO ERRO AMOSTRAL


A determinação do tamanho da amostra pela teoria estatística para o caso de amostragens
aleatórias simples é tecnicamente muito fácil, como será visto neste capítulo. No entanto, na
prática da pesquisa de marketing, inúmeros outros fatores, técnicos e não técnicos, precisam
ser considerados, além da teoria estatística, o que acaba tornando essa determinação bastante
complexa.
Relembrando o que já foi apresentado no Capítulo 6, os erros que podem ocorrer em
pesquisas de marketing são classificados em dois tipos: erros não amostrais e erros amostrais.
O erro total de uma pesquisa é a soma dos erros não amostrais e do erro amostral.
Os erros amostrais ocorrem, unica e exclusivamente, em função do número de ele-
mentos da amostra e do processo de seleção desses elementos. Pela Teoria das Grandes
Amostras, os erros ocorrem ora num sentido, ora noutro. Se a amostra não for viesada,
esses erros tendem a se neutralizar e, quanto maior o tamanho da amostra, menores serão.
No Capítulo 7, quando se abordou a amostragem probabilística simples, já foi exposta
a essência dos erros amostrais.
Os erros não amostrais são os cometidos durante o processo de pesquisa de marketing
que não sejam oriundos do tamanho e do processo de seleção da amostra. No capítulo
anterior, foi visto que o erro amostral está sob o controle do pesquisador, quando a
amostragem for probabilística. Em relação aos erros não amostrais, o pesquisador não
consegue exercer nenhum controle. Inúmeras são as fontes de erros não amostrais em
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 229

pesquisas de marketing e, ao pesquisador, cabe apenas tomar o máximo cuidado, durante


as várias etapas e fases do processo, a fim de minimizar sua ocorrência.
De forma geral, o relacionamento entre tamanho da amostra e erros amostrais e não
amostrais é o seguinte:
Quanto maior a amostra, menor o erro amostral, maior o erro não amostral e vice-versa.
Caberá ao pesquisador uma dose de técnica, uma de cuidados e outra de bom senso
para determinar o tamanho da amostra e o processo de amostragem.

Tamanho da amostra na amostragem aleatória simples


1. Dados em medidas (valores):
No Capítulo 7, foram apresentadas as teorias estatísticas de amostragem e, dentre outras
considerações, mostrou-se que:
σ
σx = (populações infinitas)
n
e
σ
σx =
(1) × ( N − n ) / ( N − 1)(populações finitas)
n
Mostrou-se também que o intervalo de confiança da média é determinado pela expressão:
(2) x ± Zσ x
Lembrando que σ x é o desvio-padrão da distribuição amostral das médias e que sua relação
com o desvio-padrão da população é dada pela expressão (1), tem-se que a expressão (2) será:
σ
x ±Z
(3) (populações infinitas)
n
e
σ
x ±Z
(4) × ( N − n ) / ( N − 1)(populações finitas)
n
Define-se como precisão da amostra ou erro máximo absoluto admitido às expressões:
σ
e =Z
(5) (populações infinitas)
n
e
σ
e =Z
(6) × ( N − n ) / ( N − 1)(populações finitas)
n
das quais podem ser isolados os valores de n:
Z 2σ 2
de(5) n = 2 (populações infinitas)
(7)
e
e
NZ 2e 2
de(6) n = 2 (populações finitas)
(8) e (N − 1) + Z 2σ 2
Estas são as expressões a serem utilizadas em pesquisas para a determinação do tamanho
da amostra quando o desvio-padrão da população for conhecido. Caso contrário, o desvio-padrão
230 Pesquisa de Marketing

da população deverá ser substituído por seu estimador (S), que é o desvio-padrão obtido em uma
amostra-piloto, e as expressões (7) e (8) passam a ser:
Z 2S 2
de(7) n = 2 (populações infinitas)
(9)
e
NZ 2e 2
de(8) n = 2
(10) (populações finitas)
e ( N − 1) + Z 2S 2
Em que:
n = número de elementos da amostra a ser pesquisada
Z = valor da variável z para o nível de confiabilidade adotado
S2 = variância na amostra-piloto sorteada, estimadora da variância da população
e = precisão da amostra ou erro máximo admitido (em valor absoluto)
N = número de elementos da população (para populações finitas)
Para os casos particulares dos níveis de confiabilidade (em valores precisos) de 68,26%
(Z = 1), 95,44% (Z = 2) e 99,74% (Z = 3)1, as expressões (9) e (10) passarão a ser, res-
pectivamente:

Populações infinitas Populações finitas


2
S Ne 2
n= 2 (11) n= 2 (12)
e e ( N − 1) + S 2
S2 N 4 e2
n=4 2 (13) n= 2 (14)
e e ( N − 1) + 4S 2
S2 N 9 e2
n=9 (15) n= (16)
e2 e 2 ( N − 1) + 9S 2

Observando-se essas expressões, é possível deduzir que:


1. Quanto maior for o desvio-padrão dos elementos da população (s) ou da amostra
(S), maior deverá ser o número de elementos da amostra para um mesmo nível de
confiabilidade e uma mesma precisão (ou erro), e vice-versa.
2. Quanto maior for a precisão desejada (e, portanto, menor erro admitido), maior deverá ser
o número de elementos da amostra para um mesmo nível de confiabilidade, e vice-versa.
3. Quanto maior o nível de confiabilidade desejado, para uma mesma precisão, maior deverá
ser o número de elementos da amostra, e vice-versa.
4. O cálculo do número de elementos da amostra independe do tamanho da população,
quando esta for considerada infinita.
Para ilustrar o cálculo do número de elementos da amostra, será utilizado o exercício do
capítulo anterior, sobre a área de vendas de supermercados. Naquele exercício, tinham-se os
seguintes dados da população:
m = 10.250 σ2 = 249.975.000 N = 40
e, para a amostra aleatória de n = 8, tinha-se:
x  = 9.687,50 S2 = 109.308.484 n = 8
1
É comum utilizar os valores aproximados de 68%, 95% e 99,7%, respectivamente para Z = 1, Z = 2 e Z = 3.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 231

Utilizando a fórmula (10) para populações finitas, e admitindo-se o erro e = 2.000, o


tamanho da amostra para cada um dos três níveis de confiabilidade será:
para o n.c. de 68% (valor aproximado):
n = 12 × 109.308.484 × 40/(109.308.484 + 2.0002 × 39)
n = 17
para o n.c. de 95% (valor aproximado):
n = 22 × 109.308.484 × 40/(22 × 109.308.484 + 2.0002 × 39)
n = 25
para o n.c. de 99,7% (valor aproximado):
n = 32 × 109.308.484 × 40/(32 × 109.308.484 + 2.0002 × 39)
n = 35
O leitor atento deve estar com a seguinte dúvida: como utilizar um parâmetro da população
(σ) ou um estimador desse parâmetro (S) obtido numa amostra de uma população que se
desconhece e que, por isso mesmo, se pretende estudar? E terá toda a razão! Dispondo-se
das medidas dos parâmetros da população, não há necessidade de pesquisá-las. Usualmente, o
que se faz na prática é a utilização, se houver, de informações dessa população originárias de
pesquisas anteriores, ou, então, realiza-se uma sondagem numa amostra-piloto e utilizam-se
as estatísticas nela obtidas para definir o tamanho da amostra de toda a pesquisa. Uma forma
mais precisa é a de se realizarem, sucessivamente, sondagens em várias amostras-pilotos cujas
estatísticas vão, gradativamente, ajudando o pesquisador a definir o tamanho ideal da amos-
tra. Os dados colhidos nessas amostras-piloto não são perdidos, pois elas passam a integrar a
amostra geral da pesquisa.
2. Dados em proporções (porcentagens)
No caso de a distribuição da população ser dicotômica (ou possível de ser trabalhada
como tal), em que os dados são apresentados em proporções ou percentagens, a variância da
população será dada por:

PQ
σ =
N

em que P é a proporção de ocorrência da variável em estudo na população, e Q (= 1 −


P), a proporção de não ocorrência. Dessa forma, as expressões para os intervalos de confiança
para variáveis dicotômicas serão:

genericamente p ± Z 2 PQ / n (17)
para o n.c. de 68,26%: p ± 12 PQ / n (18)
para o n.c. de 95,44%: p ± 2 2 PQ / n (19)
para o n.c. de 99,74%: p ± 32 PQ / n (20)

sendo P o percentual encontrado na amostra


232 Pesquisa de Marketing

A partir das expressões 17 a 20 são extraídas as expressões para o cálculo do número de


elementos da amostra; assim tem-se:
Para populações infinitas:
Z 2PQ
para o n.c. genérico: n= (21)
e2
PQ
para o n.c. de 68,26%: n= 2 (22)
e
PQ
para o n.c. de 95,44%: n=4 2 (23)
e
PQ
para o n.c. de 99,74%: n=9 2 (24)
e
Para populações finitas:
para o n.c. genérico: NZ 2PQ (25)
n=
e 2 ( N − 1) + Z 2PQ
NPQ
para o n.c. de 68,26%: n= 2 (26)
e ( N − 1) + PQ
4 NPQ
para o n.c. de 95,44%: n= 2 (27)
e ( N − 1) + 4PQ
9NPQ
para o n.c. de 99,74%: n= 2 (28)
e ( N − 1) + 9PQ
Em que:
P = proporção de ocorrência da variável em estudo na população
Q = proporção de não ocorrência da variável em estudo na população; sendo P + Q = 1
Analogamente ao caso da distribuição contínua, são válidas as mesmas considerações
no que diz respeito à utilização de parâmetros da população e de estatísticas das amos-
tras para a definição do número de elementos da amostra, com uma vantagem adicional,
neste caso: é a possibilidade de se utilizarem as expressões 21 a 24, sem que se tenha
conhecimento algum anterior das proporções da variável na população. Conhecendo-se
P, pode-se chegar facilmente a Q, pois P + Q = 1, substitui-se na fórmula e calcula-se n.
Mesmo não se tendo nenhuma ideia dessas proporções na população, pode-se calcular
n fazendo P = Q = 0,5, substitui-se na fórmula e calcula-se n. O único inconveniente
desse desconhecimento é que a amostra resultante será maior.
No Quadro 8.2, é apresentado um resumo de todas essas considerações, condições e
fórmulas para a determinação de amostras probabilísticas.
Veja a aplicação dessas fórmulas no seguinte exemplo: um fabricante de cigarros, preocupado
com a queda nas vendas de seus produtos, consumidos pelas classes de renda média e alta,
resultante das mudanças socioculturais que estão ocorrendo nestes segmentos de consumidores
para valorização do corpo e da saúde, encomendou uma pesquisa para comparar qual o impacto
dessas mudanças entre os atuais fumantes e não fumantes. Dados de pesquisas anteriores mos-
traram que a porcentagem de fumantes é de 30% da população. Qual o tamanho da amostra que
essa pesquisa deve ter para um erro máximo de 5% com um nível de confiabilidade de 95%?
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 233

Quadro 8.2  Resumo das condições e fórmulas para determinação do tamanho de amostras
probabilísticas
Estimativas de medidas (ou valores) Estimativas de proporções (ou porcentagens)
Quando conhecido σ da população Quando conhecidos P e Q da população
Populações infinitas Populações finitas Populações infinitas Populações finitas
Geral Z σ
2 2
NZ σ 2 2
Z PQ 2
NZ 2 PQ
1 n= 5 n= 9 n= 13 n =
e2 e ( N − 1) + Z 2σ 2
2
e2 e 2 ( N − 1) + Z 2 PQ
Z = 1 σ2 Nσ 2 PQ NPQ
nc = 68% n= n= n= 2 n= 2
2 e2 6 e ( N − 1) + σ 2
2 10 e 14 e ( N − 1) + PQ

Z = 2 4σ 2 N 4σ 2 4PQ N 4PQ


nc = 95% 3 n= 7 n= 11 n = 15 n =
e2 e ( N − 1) + 4σ 2
2
e2 e 2 ( N − 1) + 4PQ
Z = 3 9σ 2 N 9σ 2 9PQ N 9PQ
nc  =   99,7% 4 n = 8 n= 12 n = 16 n =
e2 e 2 ( N − 1) + 9σ 2 e2 e ( N − 1) + 9PQ
2

Quando desconhecido σ da população, substituir Conhecidos P e Q da população


σ por S, sendo S estimador de σ obtido em Sendo: P = % característica
amostra piloto Q = % não característica
e P + Q = 1 (ou 100%)
Erro sempre medido em valor absoluto Erro sempre medido em porcentagem

População infinita
Tem-se P = 0,30 → Q = 1 − P = 0,70
Erro = 5% = 0,05
Para n.c. de 95% → n = 4 PQ/e2
n = 4 × 0,30 × 0,70/(0,05)2
n = 336 elementos
Caso não houvesse a informação sobre a população, o cálculo seria o seguinte:
P = Q = 0,50
n = 4 × 0,50 × 0,50/(0,05)2
n = 400 elementos
A resposta é: para que se tenha, nessa pesquisa, um erro máximo de 5%, com um nível
de confiabilidade de 95% e um intervalo de confiança de P ± 5% (25% a 35%), seria preciso
construir uma amostra de 336 elementos.
Em resumo, trabalha-se, simultaneamente, com três grandezas, de tal forma que, definidas
duas, consequentemente obtém-se a terceira, conforme descrito a seguir.
1. Definido o nível de confiabilidade e tendo a amostra do tamanho n, pode-se calcular o
intervalo de confiança e o erro.
2. Definido o nível de confiabilidade e o intervalo de confiança (ou o erro), pode-se deter-
minar o tamanho da amostra (n).
3. Tendo a amostra do tamanho n e definido o intervalo de confiança (ou o erro), pode-se
determinar o nível de confiabilidade.
234 Pesquisa de Marketing

Essas relações induzem a que, em vez de, a cada pesquisa, se efetuarem cálculos, construam-se
tabelas relacionando esses três componentes, ao menos para erros de 1% até 10% e para níveis
de confiabilidade de 68%, 95% e 99,7%, para os casos de populações infinitas com distribuições
dicotômicas. A Tabela 8.9 foi construída a título de exemplo, aplicando-se as formulações
vistas, admitindo-se P = Q = 0,50.
A análise da Tabela 8.9 evidencia algumas conclusões importantes no relacionamento
entre erro, nível de confiabilidade e tamanho da amostra probabilística.
Tabela 8.9  Relacionamento entre erro, nível de confiabilidade e número de elementos da amostra
de populações infinitas dicotômicas
P = Q = 0,50
Erro amostral n = PQ/e (68%)
2
n = 4PQ/e2 (95%) n = 9PQ/e2 (99%)
0,01 2.500 10.000 22.500
0,02 625 2.500 5.625
0,03 278 1.112 2.502
0,04 156 624 1.404
0,05 100 400 900
0,06 70 280 630
0,07 51 204 459
0,08 39 156 351
0,09 31 124 279
0,10 25 100 225
Obs.: Outras tabelas, semelhantes a essa, poderão ser construídas, variando-se P e Q (desde P = 0,001), e variando-se
e ampliando-se os erros máximos.

Dados:
1. População infinita.
2. Dados em proporções ou porcentagens.
3. P = Q = 0,50 (ou 50%).
Pode-se concluir a partir da fórmula básica
Z 2PQ
n=
e2
que:
1. Dados Z e e, determina-se n; ou seja, determina-se n de forma essencialmente técnica.
2. Dados Z e n, determina-se e; ou seja, a verba disponível para a pesquisa determina n;
tecnicamente, define-se Z, e os resultados da pesquisa poderão ter um erro amostral
máximo de e.
3. Dados e e n, determina-se Z; ou seja, a verba disponível determina n; define-se o erro
amostral máximo a ser admitido; consequentemente, os resultados da pesquisa terão
um nível de confiabilidade de Z.
Devido a essas conclusões/considerações, é possível observar que, para um mesmo tama-
nho da amostra, os resultados podem ter diferentes níveis de confiabilidade e diferentes erros
amostrais, apontados pelas diferentes linhas pontilhadas na Tabela 8.9.
Análise semelhante poderá ser efetuada para a fórmula geral para dados em medidas (ou valores):
Z 2σ 2
n= 2
e
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 235

Outros fatores determinantes do tamanho da amostra


Como já visto neste tópico, outros fatores precisam ser considerados na determinação do tamanho
de uma amostra. Não se deve aceitar passivamente, sem maiores considerações, o tamanho da
amostra gerado por uma fórmula estatística. Inúmeros outros fatores precisam ser levados em conta.
Fatores psicológicos – Geralmente, quando os resultados de uma pesquisa não agradam
a alguém (algo comum, por exemplo, em pesquisas eleitorais), a primeira questão que costuma
ser levantada para denegrir seus resultados é quanto à “representatividade” da amostra. Uma
pesquisa feita com 500 eleitores de uma população de 3 milhões pode perfeitamente atender
à “representatividade estatística”, mas não atender à “representatividade psicológica” dos in-
teressados e do público em geral. Será mais fácil aceitar, e mais difícil questionar, os resultados
dessa mesma pesquisa junto a uma amostra de 3.000 eleitores (provavelmente, um tamanho
de amostra estatisticamente desnecessário) do que uma realizada junto a 500 (admitido como
tamanho de amostra estatisticamente ideal). De forma análoga, para uma empresa que deseja
usar os resultados de uma pesquisa para promover o seu produto, uma amostra deliberadamente
maior poderá ser necessária. O pesquisador sabe que amostras maiores não significam, neces-
sariamente, resultados melhores, pois, como já visto, os erros não amostrais crescem com o
tamanho da amostra e não são controláveis. No entanto, como poucos entendem de pesquisas
de marketing e de estatística, o pesquisador acaba sujeitando-se a definir o tamanho da amos-
tra segundo esses “fatores psicológicos” que darão “credibilidade” aos resultados da pesquisa.
Objetivos da pesquisa – O uso que se pretende dar à informação a ser obtida em
determinada pesquisa interfere na determinação do tamanho da amostra. Uma decisão de
marketing em que não há necessidade de informações muito precisas, mas apenas das direções
de determinadas variáveis, poderá ser plenamente satisfeita com uma amostra muito pequena.
Por outro lado, se a decisão a ser tomada exige uma precisão muito grande, que envolva deci-
sões sobre a aplicação de vários milhões de dólares, por exemplo, no lançamento de um novo
produto, a aceitabilidade desse produto deverá ser verificada com um intervalo de confiança
bastante pequeno, exigindo, consequentemente, uma amostra grande.
Objetivos múltiplos – Uma pesquisa raramente é conduzida para se estimar um único
parâmetro da população em estudo, sendo comum aproveitá-la para estimar um grande número
de outros parâmetros. No entanto, quando se procura definir estatisticamente o número de
elementos da amostra, leva-se em consideração apenas a distribuição de uma única variável dessa
população. Se for levada em conta a distribuição das suas outras variáveis, ver-se-á que a amostra
deverá ter diferentes tamanhos para a obtenção de uma mesma precisão desejada para todas as
variáveis, o que, evidentemente, é inviável. Exemplo: o diretor de marketing de uma empresa
fabricante de aparelhos de DVD deseja saber, junto à população de possuidores desses aparelhos,
estimativas da média dos preços pagos, da média dos filmes alugados mensalmente e do número
médio de horas mensais de utilização do aparelho.Veja na Tabela 8.10 os dados disponíveis e o
resultado da aplicação da fórmula n = Z2S2/e2 para determinar o tamanho da amostra necessário.
Tabela 8.10  Dados de variáveis diferentes de uma mesma população
Variável Preço Filmes alugados/mês Horas de utilização
Nível de confiabilidade 95% 95% 95%
Precisão desejada R$ 10.000 1 unidade 2,5 h
Estimativa de desvio-padrão R$ 50.000 3 unidades 5,0 h
Tamanho da amostra n1 = 100 n2 = 36 n3 = 16
236 Pesquisa de Marketing

As três condições requeridas, associadas às três distribuições de diferentes variáveis de uma


mesma população, produzem tamanhos de amostras diferentes e conflitantes, embora com
um mesmo nível de confiabilidade. Como resolver esse conflito? A primeira solução seria a
de se optar pelo maior dos três tamanhos (n1 = 100), o que asseguraria que cada variável seria
estimada, ao menos com a precisão desejada. Mas isso pode significar custos muito elevados
e desnecessários, pois, num caso, se estaria pesquisando 525% e, no outro, 177% a mais de
pessoas do que o necessário para a precisão desejada. A segunda solução implica que o pes-
quisador precisa definir qual variável é mais crítica para a pesquisa e utilizar o tamanho da
amostra segundo as condições por ela requeridas. Como, no caso, o preço não é a variável
mais crítica (pois pode ser obtido em outras fontes) nem o número de DVDs alugados por
mês (que também pode ser obtido em outras fontes), o tamanho da amostra a ser utilizado
será o número de horas de utilização dos aparelhos que é 16.
Restrições de tempo – Em geral, o pessoal de marketing precisa dos resultados da pesquisa
“para ontem”. Quanto maior a amostra, mais tempo levará a pesquisa. Para que a pesquisa seja
feita no período de tempo disponível, pode-se decidir por uma amostra menor do que a ideal.
Restrições de custo – A restrição dos recursos financeiros disponíveis para a realização
de uma pesquisa condiciona o tamanho da amostra. Não é incomum, na prática da pesquisa de
marketing, que o tamanho da amostra seja decidido, exclusivamente, em função dos recursos
financeiros disponíveis, e o nível de confiabilidade e o intervalo de confiança sejam calculados
a posteriori. Por outro lado, não é porque existe grande quantidade de recursos financeiros
disponíveis para a pesquisa que se deve decidir por uma amostra exageradamente grande. A
disponibilidade financeira nunca deverá ser a razão para aumentar o tamanho da amostra mais
do que exigem os objetivos da pesquisa, mas o inverso, sim.
Plano de análise dos dados – Uma das bases práticas mais importantes para ajudar na
definição do tamanho da amostra está na previsão das análises a serem realizadas. O tipo mais
simples de preparação dos dados para a análise é a tabulação simples das respostas de cada
variável. Dependendo da quantidade de opções de respostas oferecidas a uma dada questão,
uma amostra poderá ser considerada muito pequena para permitir qualquer análise, embora
seu tamanho tenha sido definido de forma estatisticamente correta. Suponha-se que, numa
pesquisa conduzida junto a uma amostra de tamanho 16, exista uma pergunta que ofereça 14
diferentes opções de marcas de produtos da mesma categoria para os entrevistados apontarem
suas preferências. A não ser que haja preferência maciça por uma ou duas marcas, será muito
difícil proceder a alguma análise estatística e chegar a alguma conclusão.
Quando se procura examinar a relação entre a variação concomitante entre duas variáveis,
efetua-se uma tabulação cruzada. Nesse caso, o problema da definição do tamanho da amostra
fica ainda mais complexo. Suponha-se que, numa pesquisa, se esteja procurando relacionar o
consumo de marcas de diversos refrigerantes com a faixa etária dos consumidores. Admitindo
que existam dez diferentes marcas sendo pesquisadas, e que foram estabelecidas sete classes de
idade, o resultado da tabulação cruzada será uma tabela com 70 células. Se a amostra tiver 140
elementos, haverá uma média de dois elementos por célula, o que impedirá qualquer análise.
Uma pesquisa feita apenas para uma tabulação simples de dados (também chamada de
análise univariada) poderá ser plenamente satisfeita com uma amostra de 100 elementos,
enquanto outra pesquisa semelhante, mas que vise cruzar os dados de diferentes variáveis
por meio da tabulação cruzada (também chamada de análise bivariada), poderá requerer uma
amostra de mais de 500 elementos.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 237

Pode-se também desejar estabelecer o relacionamento entre três ou mais variáveis ao


mesmo tempo (chamada de análise multivariada). Diferentes técnicas de análise multivariada
vão exigir diferentes tamanhos de amostras.Veja, em detalhes, os diversos tipos de análises de
pesquisa de marketing nos Capítulos 11, 12 e 13 deste livro.
Em resumo, o pesquisador precisa saber com antecedência como pretende analisar os
dados a serem obtidos, pois isso tem implicações na determinação do tamanho da amostra.
Observe que, no Capítulo 2, salientou-se a necessidade de ser previamente elaborado um
plano de análise, justamente por esse motivo.

TAMANHO DA AMOSTRA EM OUTROS TIPOS DE AMOSTRAGENS


PROBABILÍSTICAS
Tudo que foi estudado até aqui serviu para se definir o tamanho de amostras probabilísticas
simples. Na determinação do tamanho da amostra nos outros casos de amostragens proba-
bilísticas, apesar de serem utilizadas formulações mais complexas, são mantidos os mesmos
princípios utilizados para a amostragem aleatória simples: necessidade do uso de parâmetros
da população ou de seus estimadores, definição da precisão e do nível de confiabilidade.
Quando foram estudados esses outros tipos de amostras probabilísticas (estratificada e por
conglomerados), assumiu-se que o número total de elementos da amostra já estava definido,
e a preocupação concentrou-se em como distribuí-las entre os estratos ou conglomerados.
O problema agora é como determinar o tamanho total da amostra.
Os seguintes métodos são utilizados para a distribuição de n:
(1) Tamanhos iguais de elementos em cada estrato:
n
ne =
L
sendo:
n = número total de elementos da amostra
ne = número de elementos da amostra por estrato
L = número de estratos
(2) Tamanhos proporcionais aos estratos na população:
Ne
ne = ×n
N
sendo:
n = número total de elementos da amostra
N = número de elementos da população
Ne = número de elementos da população no estrato
(3) Tamanhos ótimos – Para um orçamento fixo de pesquisa, varia-se o custo de amos-
tragem total entre os estratos:
ne = (N eSe / √ C e )/ ∑ (N eSe / √ C e ) × n
sendo:
n = número total de elementos da amostra
Ne = número de elementos da população no estrato
Se = desvio-padrão no estrato
Ce = custo unitário de entrevista no estrato
238 Pesquisa de Marketing

(4) Alocação de Neyman – Igual custo de amostragem por estrato:


n e = N e S e / (S N e S e ) × n
sendo:
n = número total de elementos da amostra
Ne = número de elementos da população no estrato
Se = desvio-padrão no estrato
Os métodos (1) e (2) já foram vistos no capítulo anterior e os métodos (3) e (4) foram
apenas mencionados.
Para o cálculo do número total de elementos da amostra, analogamente ao que foi visto
para as amostras probabilísticas simples, parte-se das quatro relações apresentadas, e isola-se
n, obtendo-se:
(1) Tamanhos iguais em cada estrato:
n = L S N e2 Se2 /(N 2 D 2 + S N eSe2 )
sendo que D = e / Z , ou seja, é igual ao quadrado da precisão absoluta desejada dividido
2 2 2

pelo quadrado do valor da variável normal padronizada ao nível de confiabilidade desejado.


Para a utilização dessa fórmula, é necessário conhecer o tamanho da população e de seus
estratos.
(2) Tamanhos proporcionais a cada estrato:
n = N SN eSe2 / ( N 2 D 2 + SN eSe2 )
Para a utilização dessa fórmula, é necessário conhecer o tamanho da população e de seus estratos.
(3) Tamanhos ótimos:
n = (SN e Se C e )(SN eSe / C e ) / ( N 2 D 2 + SN eSe2 )
Para a utilização dessa fórmula, é necessário conhecer o tamanho da população, a variância
em cada estrato e o custo de entrevista em cada estrato.
(4) Alocação de Neyman:
n = (SN eSe )2 / ( N 2 D 2 + SN eSe2 )
Para a utilização dessa fórmula, é necessário conhecer o tamanho da população e a variância
em cada estrato.
Não há grandes dificuldades na aplicação dessas fórmulas, desde que se tenham todos os
dados necessários.Veja as aplicações no seguinte exemplo: o diretor de marketing de uma rede
de 500 lojas de eletrodomésticos (300 pequenas, 150 médias e 50 grandes) está interessado
em saber o número médio diário de consumidores que frequentam as lojas de sua rede, por
dia, além de outras informações sobre seus hábitos de compra. Está na dúvida sobre qual o
tamanho e a composição da amostra de lojas que deverá pesquisar. As informações que tem
disponível são as apresentadas na Tabela 8.11.

Tabela 8.11  Informações disponíveis sobre a rede de lojas de eletrodomésticos


Estrato Número de lojas Desvio-padrão (número Custo de entrevista (R$)
de consumidores)
Pequenas 300 10 1
Médias 150 15 2
Grandes 50 25 3
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 239

A Tabela 8.12 facilita os cálculos:


Tabela 8.12  Cálculos por estrato
Estrato N eS e
Se2 N eSe2 N e2 Se2 Ce N eS e C e N eS e / C e
1 100 3.000 30.000 9.000.000 1 3.000 3.000
2 225 2.250 33.750 5.062.500 1,414 3.181 1.591
3 625 1.250 31.250 1.562.500 1,732 2.165 721
Totais - 6.500 95.000 15.625.000 - 8.346 5.312

Admitindo-se Z = 3 (nível de confiabilidade de 99,7%) e e = ± 3 (erro absoluto igual


a ± 3 consumidores); tem-se que D = Z/e = 3/3 = 1.
1a solução: tamanhos iguais nos estratos:

n = L S N e2Se2 / ( N 2 D 2 + S N eSe2 )

n = 3 × 15.625.000/(5002 + 95.000)
n = 135
ne = n/L = 135/3
ne = 45
2a solução: tamanhos proporcionais a cada estrato na população:

n = N S N eSe2 / ( N 2 D 2 + S N eSe2 )

n = 500 × 95.000/(5002 + 95.000)
= 138
n1 = N1/N × 138 = 83
n2 = N2/N × 138 = 41
n3 = N3/N × 138 = 14
3a solução: alocação ótima:

n = (SN eSe C e )(S N e Se / C e ) / ( N 2 D 2 + SN eSe2 )

n = 8.346 × 5.312/(5002 + 95.000)
n = 128

ne = ( N e Se / C e ) / S ( N e Se / C e ) × n

n1 = 3.000/5.312 × 128 = 72
n2 = 1.591/5.312 × 128 = 38
n3 = 721/5.312 × 128 = 18
4a solução: alocação de Neyman:

n = (S N e Se )2 / ( N 2 D 2 + SN eSe2 )
n = 6.5002/(5002 + 95.000)
240 Pesquisa de Marketing

n = 122
ne = N eSe / (SN eSe ) × n
n1 = 3.000/6.500 × 122 = 56
n2 = 2.250/6.500 × 122 = 42
n3 = 1.250/6.500 × 122 = 24

RESUMO
O processo de subdividir uma população em estratos, selecionar amostras aleatórias simples
de cada estrato e combiná-las em uma amostra única para estimar os parâmetros da população
é chamado de amostragem aleatória estratificada.
Os passos para se compor uma amostra aleatória estratificada compreendem: dividir a
população objeto do estudo em estratos que sejam mutuamente exclusivos e coletivamente
exaustivos; definir o número de elementos a serem selecionados em cada estrato; selecionar
uma amostra aleatória simples e independente em cada estrato; calcular a média e o desvio-
padrão de cada amostra; e compor as médias e os desvio-padrão de cada amostra para o cálculo
da média e do desvio-padrão que serão usados como estimadores dos parâmetros da população.
As amostras estratificadas podem também não ser proporcionais à ocorrência dos estratos na
população. São utilizadas quando já existe algum conhecimento prévio da população que per-
mita decidir se determinados estratos devem ter pesos maiores ou menores em função da maior
ou da menor variabilidade das variáveis intraestrato e da maior ou menor representatividade
extraestrato, em relação à população.
A forma prática de determinar o peso da participação não proporcional de um estrato
na composição da amostra segue as regras: quanto maior a importância de um estrato na
população, maior deverá ser sua participação; quanto maior o estrato, menor deverá ser
sua participação; e, quanto maior a variabilidade dentro do estrato, maior deverá ser sua
participação.
Na amostra aleatória por conglomerado, grupos de elementos da população são simulta-
neamente sorteados. Para proceder a esse tipo de amostragem, a população em estudo precisa
ser subdividida em grupos mutuamente exclusivos e coletivamente exaustivos. A seguir,
procede-se à seleção da amostra a partir desses grupos.
Para realizar a amostragem sistemática, seleciona-se, aleatoriamente, para ser o primeiro
elemento de uma amostra de tamanho n, de uma população de tamanho N, um dentre os N /
n primeiros elementos listados em um rol. Para a obtenção dos demais elementos, vai-se, suces-
sivamente, acrescentando ao número de ordem do elemento anterior, N / n, para determinar
o número de ordem do elemento seguinte, até se esgotar toda a população.
A amostragem por área é uma solução engenhosa que dispensa a necessidade de lis-
tagens dos elementos da população, mas, em contrapartida, exige a utilização de mapas
muito detalhados de regiões, estados, municípios, cidades e bairros; a amostragem por
área pode ser: em um estágio, em dois estágios e em multiestágios. Quando, dos grupos
selecionados, todos os elementos passam a fazer parte da amostra, a amostragem é chamada
de “um estágio”. Quando, após o sorteio dos grupos, procede-se a um segundo sorteio
para determinar quais elementos desses grupos farão parte da amostra, a amostragem
é chamada de “dois estágios”. Seguindo esse raciocínio, é possível ter amostragens de
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 241

“n estágios”, quando sorteios sucessivos serão realizados, até se chegar ao sorteio dos
elementos do último grupo.
Existem dois métodos de selecionar as áreas em amostragens por conglomerados: chances
iguais de seleção das áreas e amostras proporcionais aos tamanhos das áreas.
Os erros amostrais são originários, única e exclusivamente, do processo de escolha e do
tamanho da amostra e estão sob o controle do pesquisador. Os erros amostrais diminuem com
a elevação do tamanho da amostra, enquanto os não amostrais crescem.
Os princípios estatísticos básicos necessários para a determinação do tamanho de amos-
tras aleatórias simples são: teoria das grandes amostras, nível de confiabilidade, intervalo de
confiança e grau de precisão.
A determinação do número de elementos de amostras aleatórias simples pelo método
estatístico é relativamente simples, porém outros inúmeros fatores precisam ser levados em
consideração: psicológicos, objetivos da pesquisa, objetivos múltiplos, restrições de tempo,
restrições de custo e plano de análise dos dados.
A definição do número de elementos de outros tipos de amostras probabilísticas exige
formulações complexas, mas os mesmos princípios das amostras probabilísticas simples são
utilizados: necessidade do uso de parâmetros da população ou de seus estimadores e definição
da precisão e do nível de confiabilidade da amostra.

QUESTÕES DE REVISÃO
1. Qual a vantagem de se trabalhar com amostras estratificadas?
2. Qual é o procedimento para selecionar amostras estratificadas?
3. O que é amostragem estratificada proporcional? E a não proporcional? Quando se aplica
uma ou outra?
4. Em que circunstâncias a amostragem estratificada reduz o erro amostral?
5. O que é uma amostra sistemática? Qual o procedimento para construir amostras sistemáticas?
6. O que é amostragem por conglomerado? Em que circunstâncias são utilizadas? Qual é
o procedimento para selecionar amostras por conglomerados?
7. O que é eficiência estatística? E eficiência econômica? E eficiência total?
8. O que é amostragem por área? Em que circunstâncias deve ser utilizada?
9. O que é amostragem por área em multiestágios? Qual é o procedimento para sua
realização?
10. O que é precisão, precisão absoluta e precisão relativa?
11. O que é: nível de confiabilidade, intervalo de confiança e grau de precisão? Explique cada
um deles.
12. Quais informações são necessárias para se calcular o tamanho de uma amostra quando: a
variável for contínua com população conhecida? A variável for contínua com população
desconhecida? A variável for dicotômica com população conhecida? A variável for dico-
tômica com população desconhecida?
13. Que outros fatores, além dos estatísticos, precisam ser levados em consideração na deter-
minação do tamanho da amostra?
14. Como definir o tamanho da amostra de uma população quando a pesquisa a ser conduzida tem
objetivos múltiplos, e inúmeras variáveis com distribuições diferentes deverão ser pesquisadas?
242 Pesquisa de Marketing

15. De que forma o plano de análises pode ajudar na definição do tamanho da amostra?

Exercícios
Exercício 8.1
As 1.000 lojas de material de construção existentes numa região estão estratificadas de acordo
com o número de empregados em pequenas, médias e grandes. Tendo disponíveis os dados
da seguinte:
Vendas médias Variância nas vendas
Estrato População (em milhões de R$) (em milhões de R$)
Pequenas 600 5 2
Médias 300 15 8
Grandes 100 30 16

• Estimar as vendas médias e a variância amostral, por meio da amostragem estratificada


proporcional para uma amostra de tamanho n = 80.
• Determinar o intervalo de confiança ao nível de confiabilidade de 95%.

Exercício 8.2
Deseja-se estimar o tamanho médio das 280 residências de um bairro que estão estratificadas
em quatro estratos, segundo a metragem quadrada de construção. Numa amostra estratificada,
foram obtidos os seguintes dados da tabela a seguir.
Amostra
Estrato (m ) 2
População Número de
elementos Elementos (m2)
0 – 100 100 6 40, 50, 90, 70, 20, 60
101 – 200 80 5 140, 150, 140, 130, 180
201 – 300 60 5 240, 280 260, 250, 220
Mais de 301 40 4 350, 330, 310, 380

• Calcule a média e a variância em cada estrato.


• Calcule a média e a variância da amostra.

Exercício 8.3
Em um município onde existem 1.000 fazendas, deseja-se estimar o número médio de cabeças
de gado por propriedade, por meio de uma pesquisa. A ausência de informações sobre a popu-
lação levou o pesquisador a realizar uma sondagem inicial numa amostra probabilística de 30
fazendas e foram obtidos os seguintes resultados para o número de cabeças de gado por fazenda:
34, 11, 23, 14, 15,   25, 38, 36, 11, 07,
24, 11, 07, 10, 09,   33, 16, 31, 25, 26,
09, 16, 12, 09, 12,   25, 04, 19, 28, 25.
• Calcule a média dessa amostra.
• Calcule a variância da amostra.
• Usando os dados dessa amostra, calcule o tamanho da amostra necessária para uma
precisão de quatro cabeças de gado, com um nível de confiabilidade de 99,7% para a
realização do estudo.
Outras Formas de Amostragens Probabilísticas e o Tamanho da Amostra 243

Exercício 8.4
Os dados disponíveis sobre os 5.000 clientes de uma empresa distribuidora de produtos
cirúrgicos e hospitalares que se deseja pesquisar são os da tabela a seguir:

Média mensal de Custo de


Estrato População compras (R$) Desvio-padrão (R$) entrevista (R$)
1 800 800 120 90
2 1.600 1.600 80 40
3 2.600 2.600 40 10

Determine o tamanho total da amostra a ser pesquisada e o de cada estrato, admitindo-se


uma precisão de ± R$ 30, com o nível de confiabilidade de 99,7% (Z = 3), para os seguintes
casos:
• Amostras de igual tamanho por estrato.
• Alocação proporcional.
• Alocação ótima.
• Alocação de Neyman.

Trabalho – Parte 6
Determine, em seu projeto de pesquisa, o número de elementos da amostra e o processo de
amostragem que pretende utilizar. Justifique a razão da escolha do método.

REFERÊNCIAS
COCHRAN, W. G. Sampling techniques. 2. ed. New York: John Wiley, 1963.
DEMING, W. E. Sample design in business research. New York: John Wiley, 1960.
______, Some theory of sampling. New York: John Wiley, 1950.
HANSEN, M. H.; HURWITZ, W. N.; MADOW, W. C.. Sample survey: methods and theory. New York: John Wiley,
1953.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
KISH, Leslie. Survey sampling. New York: John Wiley, 1965.
STEPHAN, F. J.; MCCARTHY, P. J. Sampling opinions: an analysis of survey procedure. New York: John Wiley, 1958.
SUKHATME, P.V. Sampling theory of surveys with applications. Iowa: Iowa State University Press, 1954.
YATES, F. Sampling methods for census surveys. 3. ed. New York: Hafner Publishing, 1960.
244 Pesquisa de Marketing

Anexo

NOTAÇÕES E FÓRMULAS ESTATÍSTICAS UTILIZADAS NESTE LIVRO


Notações
População Amostra Distribuição amostral
Número de elementos N n k
Observação Xi xi xi
Média m x µx
Variância σ2 S2 σ x2
Desvio-padrão σ S σx
Proporção de ocorrência P p —
Proporão de não ocorrência Q q —

Fórmulas
População Amostra Distribuição amostral
Média ∑ Xi ∑ xi ∑ xi
µ= x= µx =
N n k
Variância ∑( X i − µ )2 ∑( xi − x )2 ∑( xi − µ x )2
teórica σ2 = S2 = σ x2 =
N n k
computacional ∑ X i2 (∑ X i )2 ∑ xi2 (∑ xi )2 ∑ xi2 (∑ xi )2
σ2 = − S2 = − σ x2 = −
N N2 n n2 k k2

Fórmula para transformação dos dados x − µx x −µ


de uma distribuição normal para uma Z= ou Z=
σx σ n
distribuição padronizada

Fórmulas para calcular o número


de elementos da amostra População infinita População finita
Medidas (valores) Z σ
2 2
NZ 2σ 2
n= n=
e2 e 2 ( N − 1) + Z 2σ 2
Proporção (porcentagem) Z 2 PQ NZ 2 PQ
n= n=
e2 e 2 ( N − 1) + Z 2 PQ
CAPÍTULO 9
Coleta de Dados
Sinto muito, estou muito ocupada agora, volte outra hora.
Dona de casa

Objetivos
• Apresentar e detalhar todas as ações que envolvem o planejamento e a coleta de dados.
• Apresentar e discutir as formas de apurar a validade e a confiabilidade dos dados coletados.

Sumário
PLANEJAMENTO DAS OPERAÇÕES DE COLETA DE DADOS
Cronograma das atividades
Orçamento de despesas e de saídas de caixa
Recursos humanos
Controle
FORMAS ELETRÔNICAS PARA A COLETA DE DADOS
VALIDADE E CONFIABILIDADE
Definições de validade e confiabilidade
Métodos para estimar a validade
Métodos para estimar a confiabilidade

Neste capítulo são apresentadas e discutidas as operações necessárias para efetuar a coleta
de dados.
A coleta de dados é a fase em que são efetuados os contatos com os respondentes,
aplicados os instrumentos, registrados os dados e efetuada uma primeira crítica do
preenchimento dos instrumentos enviados para a central de processamento dos dados.
As operações de coleta de dados precisam ser detalhadamente planejadas e controladas
para que os dados coletados tenham alta qualidade e para que as previsões de tempo e
de custo de coleta sejam atingidas.

PLANEJAMENTO DAS OPERAÇÕES DE COLETA DE DADOS


Apesar de haver variação no planejamento das operações de coleta de dados segundo o
método utilizado, qualquer que seja o método empregado, os quatro aspectos a seguir
devem fazer parte de seu planejamento: cronograma das atividades, orçamento de des-
pesas e de saídas de caixa, recursos humanos e controle.

Cronograma das atividades


Todos os projetos devem ter um cronograma de coleta que especifique o início e o
término das operações e descreva todas as atividades que as compõem, nesse intervalo
245
246 Pesquisa de Marketing

de tempo, com seus respectivos inícios e términos. É fundamental que se estimem períodos
de tempo realistas para cada atividade e que se determine a sequência das atividades que
compõem seu caminho crítico, para que o cronograma da pesquisa como um todo não seja
comprometido por atrasos.
As atividades que precisam ser programadas compreendem: preparação e realização do
pré-teste, preparação do material para a coleta de dados; recrutamento, seleção e contratação
de entrevistadores; preparação de material para treinamento; treinamento dos supervisores e
entrevistadores; aplicação dos instrumentos; crítica no campo; crítica e checagem do trabalho
dos entrevistadores no escritório.Veja no Quadro 9.1, um modelo de cronograma das atividades
de coleta de dados (Hauck, 1974:2-148).

Quadro 9.1  Cronograma das atividades de coleta de dados


Atividade Início/Término N° de dias disponíveis
Instrumento e material para pré-teste
Amostra para pré-teste
Realização do pré-teste
Avaliação dos resultados do pré-teste
Reformulação do instrumento
Impressão do instrumento
Recrutamento, seleção e contratação
de entrevistadores
Material para treinamento
Treinamento dos supervisores e dos entrevistadores
Aplicação dos instrumentos
Crítica no campo
Crítica no escritório
Checagem
Elaboração do relatório final de coleta dos dados

Orçamento de despesas e de saídas de caixa


O orçamento de caixa compreende a elaboração de uma previsão de todos os custos envolvidos
e do momento de seu desembolso para a coleta de dados.
O orçamento de despesas para uma pesquisa que utilize entrevistas pessoais compreende
a previsão com: salários de supervisores e de pessoal administrativo; materiais e suprimentos;
diárias e ajudas de custo; transporte, hospedagem e alimentação; pagamento de entrevistas;
telefone e outras comunicações; reprodução de instrumentos de coleta de dados e cálculo dos
impostos (veja modelo sugerido no Capítulo 15).
O orçamento de saídas de caixa compreende prever o pagamento de todas essas despesas
no momento correto e de acordo com o orçamento das entradas de caixa da pesquisa.

Recursos humanos
O êxito da operação de coleta de dados está diretamente relacionado com a qualidade do pes-
soal contratado para sua realização. É necessário contar com um pessoal altamente especializado
e treinado em relação aos objetivos da pesquisa, para que os dados sejam corretamente obtidos
dentro dos prazos e dos custos preestabelecidos. Alguns aspectos do perfil de qualificação do
Coleta de Dados 247

pessoal variam de acordo com o tipo de método de coleta que será utilizado. De todos os
métodos de coleta de dados, a entrevista pessoal é o que exige maior cuidado em relação aos
recursos humanos. Por isso, serão apresentados em detalhes os cuidados necessários na con-
tratação de pessoas para entrevistas pessoais e complementados com observações em relação
aos demais métodos.
A utilização de entrevistas pessoais apresenta problemas específicos em relação a recru-
tamento, seleção, treinamento e supervisão de entrevistadores. A escolha de entrevistadores
inadequados pode introduzir uma infinidade de fontes de vieses que podem comprometer
completamente os resultados da pesquisa. O processo de entrevista pessoal está fundamentado
no processo de inter-relação pessoal. Para se conseguir empatia e clima favorável ao sucesso
da entrevista, é preciso que fatores relacionados às características demográficas, psicológicas
e comportamentais de entrevistadores e entrevistados sejam os mais semelhantes possíveis.
Dessa forma, conhecendo-se o perfil do público a ser pesquisado, é necessário recrutar e
selecionar entrevistadores com o máximo de aproximação possível desse perfil. Além dessas,
outras qualificações importantes, relacionadas com o perfil comportamental do entrevistador,
e que dizem respeito diretamente ao trabalho em si, também devem ser procuradas.Veja no
Quadro 9.2 uma relação dessas características.

Quadro 9.2  Características a serem procuradas nos entrevistadores


Características demográficas:
Idade, sexo, estado civil, raça, religião, ocupação, nível educacional, formação profissional,
estrato socioeconômico, estilo de vida etc.
Características psicológicas:
Motivação, atitudes, percepção, expectativas, valores etc.
Características comportamentais:
Disciplina, honestidade, comunicação, apresentação pessoal, precisão etc.

Pesquisas têm mostrado que a utilização de pesquisadores com um perfil inadequado de


características à pesquisa e ao público pesquisado traz resultados viesados.Veja alguns exemplos:
• Respostas obtidas quando entrevistadores e respondentes são do mesmo sexo diferem
daquelas quando são de sexos opostos (Hyman et al., 1954:79-81).
• Entrevistadores jovens tendem a obter respostas orientadas para seu grupo de idade (Ehrlich
e Riesman, 1961:41).
• Entrevistadores da classe média encontraram atitudes mais conservadoras entre grupos de
baixa renda do que entrevistadores de baixa renda (Lemske e Leggett, 1960:467).
• Entrevistadores de baixa renda tendem, tipicamente, a obter respostas mais radicais sobre
opiniões políticas e sociais do que entrevistadores da classe média (Katz, 1942:248-268).
• A quantidade de vieses cresce à medida que aumenta a distância social entre entrevistadores
e entrevistados (Williams Jr., 1964:338-352).
• Entrevistadores negros obtêm, significativamente, mais informações sobre ressentimento a
respeito de discriminação racial do que entrevistadores brancos (Hyman et al., 1954:159;
Athey et al., 1960:244).
• Em estudos sobre atitudes políticas, observaram-se diferenças significativas nas respostas
direcionadas às próprias atitudes políticas dos entrevistadores (Blankenship, 1940:134-136;
Cahalan, Tamulonis e Verner, 1947:63-77).
248 Pesquisa de Marketing

• Entrevistadores que já tinham uma atitude favorável a casas pré-fabricadas obtiveram res-
postas mais favoráveis a casas pré-fabricadas do que aqueles cuja atitude era, inicialmente,
desfavorável (Ferber e Wales, 1952:107-127).
Dispor de uma equipe de entrevistadores qualificados (tanto permanentes quanto free
lancers) é uma tarefa difícil. Primeiro, o pesquisador precisa especificar as qualificações neces-
sárias para a função. Em seguida, deve proceder ao recrutamento, à seleção e a uma eventual
contratação, de preferência nas próprias regiões requeridas pelo plano de amostragem, de
forma a reduzir os custos com diárias, hospedagem, transporte e alimentação.
Empresas de pesquisas contínuas, em função do volume e da continuidade de trabalho,
contam com equipes de entrevistadores permanentes contratados como funcionários ou, então,
optam por contratar empresas de pesquisas especializadas na realização de trabalho de campo.
Essas equipes permanentes permitem a essas empresas a redução dos custos de treinamento e
também melhor depuração da equipe ao longo do tempo. Empresas de pesquisas sob medida
(ou ad hoc) não têm condições de manter equipes permanentes de entrevistadores; elas mantêm
um cadastro de entrevistadores free lancers cuja experiência já é conhecida e que são contratados
conforme as necessidades de realização de coleta de dados.
Concluído o processo de contratação, os entrevistadores precisam ser treinados de forma
que se estabeleça, entre eles, um alto grau de similaridade no proc­esso de coleta de dados,
instruindo-os sobre os objetivos da pesquisa, o uso dos instrumentos de coleta, o plano amos-
tral, a abordagem aos respondentes, como conseguir empatia, apresentar-se adequadamente,
como efetuar as perguntas, como registrar as respostas e sobre o tipo de público com que
terão contato. Dependendo da complexidade da pesquisa e de sua dispersão geográfica, pode
surgir a necessidade de que essas instruções sejam escritas e distribuídas aos entrevistadores
em forma de manual de instruções, que, no entanto, não substitui a sessão de treinamento.
As sessões de treinamento devem ser conduzidas pelos próprios supervisores responsáveis
por cada equipe de entrevistadores somente quando todo o material para a coleta de dados
estiver pronto, e a equipe de entrevistadores, definida. Um processo de treinamento típico
compreende:
• Preparação do material (questionário, manual, listagem de endereços ou de entrevistados etc.).
• Preparação do local.
• Distribuição do material entre os participantes.
• Apresentação do material, de preferência, em projeção.
• Discussão do material e elucidação de dúvidas.
• Simulação da aplicação dos questionários entre pares de entrevistadores (somente para
questionários complexos).
• Acompanhamento pelos supervisores de campo durante as primeiras aplicações.
A seguir, são apresentados os principais tipos de erros cometidos por entrevistadores durante
as entrevistas (tanto pessoais quanto por telefone). No processo de treinamento, deve-se dar
ênfase específica a esses itens e, durante a coleta de dados, deve-se exercer intensa supervisão,
como forma de reduzir a incidência de eventuais erros.
Ausência de empatia entre entrevistador e entrevistado – Já foi visto que parte
desse problema poderá ser solucionada com um adequado processo de seleção. Porém,
existem outros aspectos que precisam ser transmitidos aos entrevistadores por meio do trei-
namento. Por exemplo, a apresentação pessoal (corte de cabelo, barbeado ou barba aparada,
maquilagem discreta, vestimenta discreta etc.) é importante no processo de despertar empatia,
Coleta de Dados 249

pois as pessoas, geralmente, relacionam esse fator com atitudes, orientações e valores pes-
soais. O entrevistador precisa ser treinado para se apresentar e ter uma conduta, no mínimo,
prazerosa para o entrevistado e saber, rapidamente, adaptar-se a diferentes entrevistados.
Forma de perguntar – O entrevistador precisa ser treinado sobre os seguintes pontos
relacionados com a forma de perguntar:
• Apresentar os objetivos da pesquisa e prometer sigilo – Toda entrevista deve ser iniciada
com a apresentação de seus objetivos ao respondente, acompanhada de uma promessa
formal (de preferência, por escrito) de que todos os dados obtidos serão tratados com
sigilo, serão reunidos aos dados de outros entrevistados e processados em conjunto, e que
os dados individuais isolados não serão utilizados nem terão utilidade para a pesquisa.
• Ficar profundamente familiarizado com o instrumento de coleta de dados – Antes de
iniciar as entrevistas verdadeiras e após a sessão de treinamento, será útil, para ganhar
familiaridade com o instrumento, efetuar entrevistas fictícias de treinamento com familiares
ou conhecidos.
• Efetuar as perguntas exatamente como estão escritas no instrumento – Até mesmo mu-
danças discretas podem trazer grande distorção para os resultados entre uma entrevista e
outra de um mesmo entrevistador e entre as de diferentes entrevistadores.
• Efetuar as perguntas exatamente na sequência em que aparecem no instrumento – No
planejamento e construção do instrumento, a sequência das perguntas é estabelecida de
forma a haver um ordenamento lógico em sua apresentação e a minimizar a ocorrência de
vieses de uma pergunta sobre as outras (efeito halo). Qualquer mudança, nessa sequência,
durante a entrevista, pode tornar todo esse esforço inútil.
• Efetuar todas as perguntas constantes do instrumento – Todas as perguntas constantes de
um instrumento bem construído têm relação com o objetivo da pesquisa. Os entrevis-
tadores devem ser orientados a efetuar todas as perguntas e a nunca inferir ou adivinhar
as respostas, para não comprometer os resultados da pesquisa.
• Usar técnicas apropriadas para obter respostas – Diferentes respondentes têm diferentes ca-
pacidades de entendimento e comunicação. Para aqueles com dificuldades de entendimento
ou comunicação, os entrevistadores precisam ser treinados a utilizar técnicas apropriadas
a fim de estimular o entendimento e a obtenção de respostas. Veja algumas sugestões de
técnicas neutras para alcançar esses objetivos:
• Repetir a pergunta – Não tendo obtido a resposta, repita a pergunta exatamente como
aparece no instrumento.
• Aguardar silenciosamente a resposta – O silêncio do entrevistador ou uma pausa na
continuação da entrevista é uma forma eficaz de demonstrar ao entrevistado que se
espera uma resposta mais completa.
• Repetir a resposta do respondente – Os respondentes, com frequência, sentem-se es-
timulados a acrescentar comentários quando ouvem suas próprias respostas.
• Tranquilizar o respondente – Ao perceber que o respondente está inseguro, o entrevis-
tador deverá efetuar comentários que o tranquilizem antes de continuar a entrevista,
tais como: “Estamos apenas procurando saber o que as pessoas pensam a esse respeito”
ou “Não existem respostas certas ou erradas; apenas ideias a respeito desse assunto”.
• Estimular por meio de perguntas neutras – Existem várias perguntas que podem ser
efetuadas para estimular a participação e a obtenção de respostas, que, sendo neutras,
não comprometem os resultados da pesquisa. Veja alguns exemplos: “Algo mais?”;
250 Pesquisa de Marketing

“Alguma outra razão?”; “Outras?”; “O que você pensa a esse respeito?”; “Você poderia
me dizer mais sobre o que pensa a esse respeito?”; “Você poderia me dizer o que tem
em mente?”; “O que você sente a respeito disso?”; “Não estou certo de ter entendido
o que você quis dizer com... você se importa de falar um pouco mais a esse respeito?”.
• Anotar qualquer mudança que venha a ocorrer – Se houver qualquer mudança na forma
de perguntar, na sequência das questões, nas palavras utilizadas ou no relacionamento
inadequado com o respondente, deve-se relatar imediatamente isso no instrumento, para
servir de base à posterior verificação da existência de erros potenciais e à decisão pela
aceitação ou exclusão de determinados dados ou de todo o instrumento.
Formas de registrar a resposta – Os entrevistadores precisam ser treinados a registrar
rápida e corretamente as respostas, principalmente quando se trata de perguntas abertas. Uma
das maiores dificuldades da entrevista é manter o processo interessante para o entrevistado e, ao
mesmo tempo, anotar as respostas. Essa dualidade é responsável por grande parte dos erros. As
soluções possíveis, corretamente técnicas, são: a entrevista ser efetuada por dois entrevistadores,
um conduzindo-a e outro tomando notas, ou fazendo a gravação. Ambas apresentam problemas
que podem desestimular seu uso. A utilização de dois entrevistadores, praticamente, duplica
o custo da entrevista e sua gravação, além de tender a inibir o entrevistado; também eleva os
custos, pois o entrevistador deverá dedicar boa parte do tempo, após a entrevista, à transcrição
das respostas para o instrumento de coleta. No treinamento, como forma de minimizar esse
problema, os entrevistadores devem ser orientados, durante a entrevista, a:
• Realizá-la num lugar que facilite o registro das respostas.
• Utilizar caneta na cor definida pela coordenação.
• Escrever o mais legível possível.
• Anotar as respostas durante a entrevista; nunca deixar para depois.
• Utilizar, de preferência, as próprias palavras dos respondentes.
• Não sumarizar nem parafrasear as respostas.
• Aprender a tomar notas.Vejam-se algumas regras a esse respeito:
• Registrar apenas as palavras mais importantes, as chamadas palavras com conteúdo; não
registrar artigos, preposições e afins, chamadas palavras estruturais.
• Não anotar dados e informações repetidos, comuns na linguagem oral.
• Utilizar abreviações, desde que não gerem confusões; utilizar simbologia ao máximo,
como a exemplificada a seguir:
=igual; o mesmo que.
≠ não igual; diferente de.
>maior que; mais do que.
< menor que; menos do que.
≥ maior ou igual.
≤ menor ou igual.
→ implica; resulta em.
← foi causada por; resultou de.
↑ positivo; pontos positivos.
↓ negativo; pontos negativos.
± mais ou menos; aproximadamente.
$ valor monetário; dinheiro.
% porcentagem.
Coleta de Dados 251

• Caso a explanação do respondente seja muito rápida, solicitar sua cooperação no sentido
de os ritmos se ajustarem.
• Utilizar parênteses para indicar as opiniões e observações do entrevistador.
Desonestidade – A desonestidade na coleta de dados é caracterizada pelo preenchimento,
total ou parcial, dos instrumentos com dados falseados ou com a realização de entrevistas com
pessoas não indicadas na amostra. Em pesquisas de marketing, não é fácil detectar desonestidade
apenas pela crítica dos instrumentos. É preciso montar e, efetivamente, utilizar um sistema de
verificação por amostragem, também denominado de checagem, cujo objetivo é confirmar se
os respondentes foram entrevistados. No processo de treinamento, os entrevistadores devem
ser devidamente informados de sua existência e das consequências para aqueles que forem
flagrados em prática desonesta.
Remuneração de entrevistadores – Outro importante ponto sobre recursos humanos
que deve ser definido pelo pesquisador é quanto à forma de pagamento das entrevistas
(pessoais ou por telefone). As opções são: pagar exclusivamente um salário fixo (por hora,
semanal ou mensal), pagar exclusivamente por entrevista realizada, ou uma composição des-
sas duas formas. O ideal seria pagar exclusivamente um salário fixo, uma vez que qualquer
pagamento como incentivo pode comprometer a qualidade dos dados coletados, quer pelo
fato de as entrevistas serem efetuadas com pressa, quer pela tentação de se utilizarem recursos
desonestos. No entanto, essa forma de remuneração tende a estimular a acomodação e
não é incomum que traga desestímulo aos entrevistadores mais produtivos, à medida que
remunera a todos de forma igual, independentemente de sua produção. Outro problema
associado a essa forma de remuneração é que o custo de realização de cada entrevista passa
a ser variável. Os argumentos em prol do pagamento exclusivamente por entrevistas com-
preendem: os entrevistadores podem ganhar mais se planejarem melhor suas atividades; há
maior justiça quando se paga pela produção: quem produz mais ganha mais, e vice-versa;
e o custo de realização de cada entrevista passa a ser fixo, facilitando o controle dos custos
totais de coleta de dados. Para se decidir entre uma forma e outra, o pesquisador poderá
utilizar as seguintes sugestões práticas:
Deve preferir pagar salário fixo quando:
• O nível dos entrevistadores for acima da média.
• O tema da pesquisa for complexo.
• A entrevista tiver longa duração.
• Os prazos para término do campo não forem rígidos.
• O orçamento para pagamento das entrevistas não for rígido.
• O tempo de locomoção entre uma entrevista e outra for longo.
• A prospecção de entrevistados for difícil.
• A empresa apresentar um volume de trabalho por um longo período de tempo (várias e
constantes pesquisas) que justifique a contratação de entrevistadores permanentes.
Deve preferir pagar por entrevista realizada quando:
• O nível dos entrevistadores for médio ou baixo.
• O tema da pesquisa for simples.
• As entrevistas forem de duração rápida.
• Os prazos para o término do campo forem rígidos.
• O orçamento para pagamento das entrevistas for rígido.
• O tempo de locomoção entre uma entrevista e outra for desprezível.
252 Pesquisa de Marketing

• No esquema de amostragem proposto, for possível desprezar e, portanto, não pagar pelas
entrevistas que estiverem abaixo da qualidade predefinida.
• A prospecção dos entrevistados for fácil.
• A empresa não apresentar um volume de trabalho que justifique entrevistadores per-
manentes.
Concluído o treinamento, os entrevistadores dão início ao processo de visitação e coleta
de dados. Ao longo de todo esse processo, os entrevistadores precisam ser continuamente
supervisionados para verificar se tudo está correndo segundo o planejado: se os respondentes são
os elementos, efetivamente, determinados pela amostra; se os instrumentos estão sendo preen-
chidos com clareza, correção e honestidade; se os prazos e custos estão sendo obedecidos etc.
A maior parte das considerações sobre as entrevistas pessoais também se aplica às entrevis-
tas telefônicas. Em geral, como as entrevistas telefônicas são realizadas a partir de um mesmo
local, toda a tarefa de controle e supervisão fica mais fácil. No que diz respeito às qualificações
necessárias para o processo de seleção, dá-se grande ênfase ao timbre de voz, à capacidade de
comunicação verbal, à capacidade de estabelecer empatia apenas pela voz e às práticas gentis
de utilização do telefone, sem prejuízo de outras julgadas necessárias, segundo o público a
ser entrevistado.
Os questionários autopreenchíveis, em qualquer de suas formas de aplicação, exigem
pouca habilidade dos aplicadores e estão, praticamente, sob o controle direto do pesquisador.
No entanto, agora é preciso empenhar-se em facilitar a compreensão e o preenchimento do
instrumento pelo próprio respondente, por meio de orientações no próprio corpo do ques-
tionário.
Quando se tratar de pesquisas por observação, a natureza do plano de observações no
campo, resultante da complexidade da pesquisa, implicará o perfil de qualificações dos recursos
humanos a serem contratados. Se houver necessidade de pessoas para a realização do campo,
grande parte das considerações apresentadas para as entrevistas pessoais é, aqui, também válida.
Quando equipamentos especiais forem necessários para registrar as observações, deve-se
considerar a contratação de operadores especializados (recrutamento, seleção, contratação por
prestação de serviços, custos etc.).

Controle
É fundamental controlar e acompanhar todas as atividades planejadas, bem como a medição
constante das metas atingidas em comparação com as programadas, para garantir o cum-
primento de prazos e orçamentos.Veja, no Quadro 9.3, um exemplo de planilha para controle
dos resultados esperados da coleta de dados.
Outras planilhas de controle semelhantes poderão ser construídas pelo pesquisador para
outros itens que ele julgar importantes controlar.

FORMAS ELETRÔNICAS PARA A COLETA DE DADOS


A evolução tecnológica nos campos da informática e das telecomunicações proporcionou
formas eletrônicas para a coleta e a transmissão de dados em pesquisa de marketing.
A área de pesquisa de marketing sempre deparou com um problema de difícil solução: a
defasagem de tempo entre a coleta dos dados e a disponibilização para os usuários de marketing
das informações geradas a partir desses dados. A forma tradicional de coletar dados envolve:
Coleta de Dados 253

imprimir um instrumento; coletar os dados, registrando-os nesse instrumento; transportar


fisicamente os instrumentos preenchidos até a central de processamento; transferir os dados dos
instrumentos para um arquivo eletrônico por meio de digitação e, só então, iniciar o proces-
samento eletrônico. Todo esse procedimento consome muito tempo, recursos financeiros e
possibilita a ocorrência de muitos erros não amostrais. As novas formas de coletar dados têm
possibilitado significativa redução dos prazos entre a coleta dos dados, o processamento e a
disponibilização da informação, bem como a redução de custos e a melhoria da qualidade,
devido a:
• Não necessidade de imprimir o instrumento de coleta de dados.
• Não necessidade de digitar dados.
• Não necessidade de transportar fisicamente os dados coletados.

Quadro 9.3  Controle dos resultados esperados de coleta de dados que reúnem as condições
necessárias para atender a pesquisa
1. Total de respondentes elegíveis ______
  1.1 Entrevistados ______
  1.2 Recusas ______
   1.3 Não contatos (assumidos como elegíveis) ______
   1.4 Outros (especificar) ______ ______
2. Total de respondentes não elegíveis ______
  2.1 Mudanças ______
  2.2 Outros ______
3. Total da amostra ______
Porcentagens de respostas
   (item 1.1 / item 1) × 100 ______%
Porcentagens de recusas
   [item 1.2 /(item 1.1 + item 1.2)] × 100 ______%
Porcentagens de contatos
   (item 1 – item 1.3) / item 1 × 100 ______%
Porcentagens de entrevistas elegíveis
   (item 1 / item 3) × 100 ______%

A utilização dessas tecnologias tem permitido a realização de pesquisas de marketing


em uma rapidez jamais imaginada, com grande economia de recursos e maior precisão. São
apresentados, a seguir, alguns elementos dessa evolução tecnológica, já utilizados ou disponíveis
em pesquisas de marketing e em outros tipos de pesquisa.
People meter – O people meter possibilitou uma verdadeira evolução no sistema de medir a
audiência de TV por meio do Tevetron (sucessor do Tevêmetro). O Tevetron é um aparelho que,
acoplado ao televisor, serve para registrar eletrônica e continuamente, a cada 30 segundos, a
audiência de TV. No Tevetron, a audiência qualificada (ou individualizada) é obtida por meio do
registro pelos pesquisados, em um caderno, dos momentos em que iniciaram e terminaram de
assistir a TV. Periodicamente, esses dados são fisicamente recolhidos e levados para a central de
processamento e, só após um longo período de tempo (de 15 a 30 dias), as informações sobre a
audiência qualificada estarão disponíveis aos usuários. O people meter compreende um segundo
aparelho que funciona acoplado ao Tevetron. Esse aparelho contém vários botões coloridos e,
a cada membro da família pertencente à amostra, é atribuído um dos botões, para que registre
254 Pesquisa de Marketing

sua audiência, apertando-o quando iniciar e voltando a apertá-lo quando terminar de assistir a
programas de TV. Com o people meter, a transmissão da audiência, tanto bruta quanto qualificada,
para a central de processamento, passa a ser realizada de 30 em 30 segundos através de linha
telefônica direta ou rádio; a informação é imediatamente processada e enviada, também a cada
30 segundos, aos computadores dos usuários da pesquisa. Com o people meter, é possível trans-
mitir continuamente, on-line, os resultados da audiência bruta e qualificada para os usuários da
pesquisa. No entanto, deve-se notar que tanto o sistema de registro da audiência qualificada
do Tevetron quanto do people meter podem apresentar falhas, pois dependem da lembrança dos
pesquisados em efetuar os registros ou apertar e desapertar os botões.
Smart sense – O smart sense é a versão mais moderna para o registro da audiência de TV
(bruta e qualificada). Esse aparelho, desenvolvido na França, registra eletronicamente a presença
dos membros da família que estão assistindo a programas de TV, independentemente de sua
vontade, lembrança ou ação. No mais, o sistema funciona de forma análoga ao people meter.
Leitor ótico – Os pontos de venda - PDVs informatizados, equipados com leitores óticos,
constituem outro desenvolvimento tecnológico que tende a revolucionar a coleta de dados em
algumas pesquisas de marketing. As tradicionais pesquisas de store-audit tendem a desaparecer,
pois bastará o computador da agência de pesquisa estar interligado aos computadores das redes
de lojas para a empresa ter as informações sobre participação de mercado, volume de vendas,
distribuição quantitativa e qualitativa, ausência de estoques na loja, preços praticados etc.,
on-line, e não uma vez a cada bimestre, como tradicionalmente se tem feito.
Notebooks/palmtops/coletadores eletrônicos de dados – A constante miniaturização
dos componentes eletrônicos informáticos (microinformática) tem possibilitado a redução
contínua do tamanho dos computadores, dando origem a versões supercompactas denomi-
nadas notebooks, palmtops e coletadores eletrônicos de dados. A utilização no campo desses
computadores supercompactos tem auxiliado na solução de problemas de administração de
vendas (os vendedores podem ter contato contínuo com a central para consultar estoque,
andam­e nto de pedidos, confirmação de pedidos, reserva de estoques etc.). As companhias
de distribuição de energia elétrica, água encanada e gás encanado têm feito uso intenso dos
chamados coletadores de dados para registro eletrônico do consumo mensal dos usuários desses
serviços públicos, com grande economia de tempo, recursos humanos, precisão e rapidez entre
a leitura, o faturamento e a cobrança da conta. Já existem casos em que o coletor de dados está
acoplado a uma pequena impressora que permite a emissão, na hora do registro do consumo,
da conta e a respectiva entrega ao consumidor.
Esses aparelhos podem ser adaptados e estão sendo utilizados para a coleta de dados no
campo. O entrevistador vai a campo com o questionário eletrônico no aparelho. À medida
que realiza a entrevista, registra (digita) as respostas no questionário eletrônico, na tela do
aparelho. A remessa dos dados coletados para a central de processamento poderá ser efetuada
com a frequência desejada (de hora em hora, uma vez por dia ou até on-line).
Smart card – O smart card consiste na evolução dos cartões eletrônicos de crédito. Enquanto
estes se caracterizam por possuir apenas uma tarja magnetizada com alguns dados de identifi-
cação de seu possuidor, o smart card tem uma grande capacidade de armazenamento eletrônico
de dados. Nele, é possível gravar uma infinidade de dados de interesse de marketing sobre o
possuidor, além dos dados de identificação (renda, estado civil, ocupação, número e idade dos
filhos, nível de escolaridade do possuidor e do cônjuge, hábitos que possam caracterizar o
estilo de vida etc.). Além disso, o smart card pode captar e registrar todas as compras efetuadas
Coleta de Dados 255

com o cartão. Determinados check outs possuem um equipamento capaz de captar dos smart
cards todas as informações de compras efetuadas e nele registradas. Dessa forma, tem-se aces-
so a todas as informações necessárias para relacionar as compras efetuadas com o perfil dos
consumidores, não havendo necessidade de se coletarem dados na forma tradicional. Os smart
cards estão sendo testados para várias finalidades em algumas pequenas cidades dos Estados
Unidos e já estão comercialmente disponíveis em alguns casos.
Fax – O fax foi considerado um substituto vantajoso dos correios para a realização de
pesquisas por meio de questionários autopreenchidos, em função da rapidez do envio do
instrumento e do recebimento da resposta. Atualmente, a utilização do fax para a realização
de pesquisas tem sido muito restrita, à medida que foi substituído pelas pesquisas na internet,
que apresentam infinitas vantagens.
Internet – A internet veio revolucionar a forma de se fazer pesquisa em diversas direções.
As pesquisas de dados secundários (também denominadas desk research) eram realizadas de
forma demorada e exaustiva, com inúmeras visitas a órgãos públicos, arquivos de jornais e
revistas, sindicatos, associações de classe, concessionárias de serviço público, universidades,
centros de pesquisas etc. Com a internet, a pesquisa de dados secundários passou a ser feita
exclusivamente pela navegação em inúmeros sites dessas entidades e pela utilização do auxílio
proporcionado pelos sites de busca. Outra facilidade é a aplicação de questionários autopreen-
chidos em substituição ao correio e ao fax. A utilização de software de pesquisas pela internet
possibilita: remessa automática dos questionários eletrônicos para uma relação de e-mails,
respostas digitadas diretamente pelo respondente, controle automático do retorno, proces-
samento contínuo aos retornos recebidos e envio contínuo dos resultados ao cliente. O grande
limitador da utilização da internet para a coleta de dados é a ainda pequena base de usuários,
o que restringe sua utilização a populações de pesquisa que já têm acesso.
Infovias – As infovias são as grandes vias de transporte de informações que estão sendo
construídas em todo o mundo. Caracterizam-se por transportar, simultaneamente, grandes
quantidades de dados e informações de forma rápida, precisa e barata. A tecnologia utilizada é
a fibra ótica. Além de facilitar a troca contínua de dados e informações entre diversos centros,
essa tecnologia permite o surgimento da TV interativa.
TV interativa – A principal característica da TV interativa é a de que usuário e emissora
poderão trocar informações. Surge, portanto, um novo meio de obtenção de dados para a
realização de uma infinidade de tipos de pesquisas, tão logo esteja disponível.
Observa-se, portanto, que as inovações tecnológicas estão continuamente contribuindo
para o aprimoramento dos processos de pesquisa em termos de qualidade, rapidez, precisão
e economia.

VALIDADE E CONFIABILIDADE
Foi visto no Capítulo 6 que inúmeras são as fontes de erros não amostrais em pesquisas de
marketing e, ao pesquisador, cabe apenas tomar o máximo cuidado, durante as várias etapas
e fases do processo, a fim de minimizar sua ocorrência. Foi visto também que determinada
medição efetuada em pesquisa de marketing (Me) é composta de três elementos: a medida
verdadeira (Mv), o erro amostral (Ea) e o erro não amostral ou sistemático (Es). Seu relacio-
namento é representado pela seguinte fórmula:
Me = Mv + Ea + Es
256 Pesquisa de Marketing

O pesquisador responsável pela condução de uma pesquisa precisa ter noção de quanto
os dados coletados são válidos e confiáveis. A seguir, são apresentados os significados desses
dois importantes conceitos em pesquisas de marketing e as formas de estimá-los.

Definições de validade e confiabilidade


Os termos conceitos e construções são utilizados neste livro como sinônimos. Um conceito,
ou uma construção, é definido como uma abstração mental formada pela percepção de um
fenômeno. Exemplos de construções em marketing: vendas, participação de mercado, atitudes,
demanda, imagem de marca, lealdade à marca etc. As construções servem para simplificar e
sintetizar um fenômeno complexo de marketing. Algumas construções são facilmente per-
ceptíveis e passíveis de medição, enquanto outras são de percepção, compreensão e medição
difíceis.
Uma definição constitutiva utiliza-se de outras construções para definir um conceito. Essa
abordagem é similar às utilizadas pelos dicionários, em que outras palavras são usadas para
definir os termos. Exemplo de definição constitutiva em marketing: para definir “lealdade à
marca”, são utilizados os conceitos “preferência pela marca”, “comportamento de compra em
relação à marca” e “atitudes em relação à marca”.
Uma definição operacional especifica como uma construção será medida. Para medir
a “preferência pela marca”, a especificação dada pela definição operacional poderá ser, por
exemplo, medir o número de compras repetidas durante um período de tempo, ou medir a
participação de mercado.
As definições constitutivas das construções direcionam o desenvolvimento de suas defi-
nições operacionais.
Quanto mais complexa a definição constitutiva de uma construção, mais difícil é desen-
volver definições operacionais que correspondam ao fenômeno e mais difícil será o processo
de medição.
A validade de uma medição refere-se a quanto o processo de medição está isento, simul-
taneamente, de erros amostrais e erros não amostrais.
A confiabilidade de uma medição, por sua vez, refere-se a quanto o processo está isento
apenas dos erros amostrais.
Ao realizar as medições, o pesquisador deve saber se corresponderam, efetivamente, ao que
desejava medir (validade) e se o tamanho do erro amostral ficou contido nas condições estabelecidas
para que as medidas sejam aceitas (confiabilidade). A validade é um conceito muito mais amplo e
difícil de ser trabalhado do que o de confiabilidade.
Para ilustrar melhor esses dois conceitos, será apresentado um exemplo hipotético: o caso
de uma pesquisa de marketing que vise determinar a participação de mercado de uma marca
de sabonetes. Admitindo que a participação real seja 10%, analisam-se os resultados hipotéticos
à luz das quatro seguintes hipóteses para os erros amostrais e não amostrais dessa pesquisa:
Hipótese 1: o erro amostral é baixo e não há erro não amostral.
Hipótese 2: o erro amostral é baixo e o erro não amostral é elevado.
Hipótese 3: o erro amostral é elevado e não há erro não amostral.
Hipótese 4: os erros amostrais e não amostrais são elevados.
A Figura 9.1 ilustra estas quatro situações extremas. Nela, pode-se observar a influência
dos erros amostrais e não amostrais na distribuição da média amostral dos resultados para cada
uma das quatro hipóteses extremas assumidas.
Coleta de Dados 257

Figura 9.1  Ilustração dos conceitos de validade e confiabilidade.

Na hipótese 1, o valor esperado da participação de mercado na distribuição da média amostral


é idêntico ao da participação verdadeira. O baixo erro amostral é refletido no traçado estreito e
elevado da curva. Nessa situação, repetidas amostras produzem, consistentemente, médias próxi-
mas da verdadeira participação de mercado, resultando em dados tanto válidos quanto confiáveis.
Na hipótese 2, a curva tem o mesmo formato da hipótese 1, em função do baixo erro
amostral, porém, devido à influência dos erros sistemáticos não amostrais, está deslocada para
a direita. Repetidas amostras produzirão médias consistentemente próximas a 12,5%, dois e
meio pontos percentuais acima da participação verdadeira de mercado. Nessa situação, diz-se
que os dados não são válidos, porém são confiáveis.
Na hipótese 3, o formato da curva é mais largo e mais achatado do que o das hipóteses
1 e 2, devido ao elevado erro amostral, mas está uniformemente distribuído em torno da
participação de mercado verdadeira de 10%, devido à não ocorrência de erros não amostrais.
Repetidas amostras produzirão médias completamente diferentes da participação verdadeira
de mercado. Nessa situação, afirma-se que os dados não são nem válidos nem confiáveis.
Na hipótese 4, a curva tem formato idêntico ao da hipótese 3, devido ao elevado erro
amostral, mas está distribuída em torno de uma média amostral situada cinco pontos per-
centuais à esquerda da média de participação de mercado da população, devido ao elevado
erro não amostral.Também nesse caso, repetidas amostras vão produzir médias completamente
diferentes da verdadeira participação de mercado. E, nessa situação, também se diz que os dados
não são nem válidos nem confiáveis.
258 Pesquisa de Marketing

Concluindo, para uma medida ser válida, precisa ser confiável. Porém, se uma medida não
for confiável, não poderá ser válida; e, sendo confiável, poderá ou não ser válida. A confiabi-
lidade é uma condição necessária, mas não suficiente, para a validade. Por essas razões, diz-se
que o conceito de validade é mais importante para os resultados de uma pesquisa de marketing
que o conceito de confiabilidade, justamente por ser mais amplo e incluir aquele.

Métodos para estimar a validade


Nesta seção será apresentada apenas uma rápida visão dos métodos de estimar a validade. Como
já foi mostrado, trata-se de um conceito complexo, e sua discussão profunda foge aos objetivos
de um livro-texto de pesquisa de marketing. Para o leitor interessado em se aprofundar neste
tópico, há, no final do capítulo, uma relação bibliográfica recomendada.
Uma forma fácil de medir a validade seria comparar o resultado da medição efetuada
com o valor real da variável na população. No entanto, como raramente se conhece o valor
real da variável na população, essa forma de medir a validade não serve. O que se pode fazer
é estimar a validade dessas medidas usando um, ou mais de um, dos seguintes métodos de
estimar validade: validade construída, validade satisfeita, validade concordante e validade
preditiva.
Validade construída – O método da validade construída envolve o entendimento teóri-
co-racional básico da obtenção das medidas. A abordagem compreende relacionar a construção
de interesse a outras construções, de tal forma que o referencial teórico seja desenvolvido de
acordo com o fenômeno de marketing que está sendo medido. A validade construída cresce
à medida que a correlação entre a construção de interesse e a construção relacionada cresce,
conforme a forma prevista.
Para ilustrar essa forma de medir a validade, veja o seguinte exemplo: um gerente de
marketing acredita que há relacionamento entre a imagem de seus produtos junto aos consu-
midores e o volume de recursos despendidos em propaganda e promoção de vendas. A validade
construída poderá ser verificada pela medição dessas três construções e pela existência de
relacionamento entre elas. Se esse relacionamento não for verificado, deverá ser questionada
a validade construída das medidas e/ou questionada a validade da hipótese estabelecida para
o relacionamento. Porém, se a hipótese de relacionamento já foi previamente confirmada por
outras pesquisas, conclui-se que as medidas não estão medindo o que se pensava que estavam
medindo e, portanto, não são válidas.
Validade satisfeita – O método da validade satisfeita envolve o julgamento subjetivo
feito por um ou mais especialistas quanto à adequação do processo de medição.
Um exemplo de validade satisfeita é a utilização de juízes para a construção de escalas para
a medição de atitudes. Conforme visto no Capítulo 6, esses juízes julgam a pertinência ou
não de cada afirmação para a medição específica que se pretende efetuar.
Validade concordante – O método da validade concordante envolve a realização de duas
diferentes medições, realizadas com técnicas diferentes, do mesmo fenômeno de marketing,
na mesma ocasião. Uma das medições deverá ser efetuada com uma técnica conhecida cuja
validade já foi comprovada. Correlacionam-se as duas medições: se houver alta correlação, diz-
-se que a nova técnica também tem validade; caso contrário, a nova técnica será considerada
não válida.
Para ilustrar, pode-se supor que, para uma técnica já conhecida e válida de medir atitudes,
contendo 20 afirmações, tenha surgido uma opção mais simples e fácil de aplicar. As duas
Coleta de Dados 259

técnicas são aplicadas, simultaneamente, para medir o mesmo fenômeno. Se houver alta cor-
relação em seus resultados, a nova técnica poderá ser adotada, pois terá a validade concordante
da anterior.
Validade preditiva – O método da validade preditiva compreende a medição de uma
variável em determinado momento para que, com base nos resultados dessas medições, possa-se
prever os resultados da variável de interesse que está sendo prevista num momento futuro. Após
a ocorrência da realidade, verifica-se a correlação entre os dois fenômenos. Se for elevada, diz-se
que a medição inicial tem validade preditiva.
Por exemplo, com base na correlação existente entre a evolução socioeconômica da
população e as vendas da empresa verificada nos últimos 36 meses, prevê-se o crescimento
das vendas da empresa para os próximos 12 meses. Se, após esse prazo, concluir-se que, efeti-
vamente, as vendas cresceram segundo a correlação prevista, diz-se que a medida da evolução
socioeconômica da população efetuada tem validade preditiva com as vendas.

Métodos para estimar a confiabilidade


Os dois métodos mais importantes para estimar a confiabilidade dos dados de uma pesquisa
de marketing são: confiabilidade de teste-reteste e confiabilidade de formas alternativas.
Confiabilidade de teste-reteste – O método teste-reteste para estimar a confiabilidade
compreende repetir várias vezes a medição utilizando-se o mesmo instrumento sob as condi-
ções mais idênticas possíveis dos mesmos respondentes em diferentes momentos de tempo. Os
resultados dessas várias medições são comparados para determinar seu grau de similaridade.
Esta abordagem pressupõe que, quanto maior for a discrepância dos dados, maior será o erro
amostral presente no processo de medição e menor será a confiabilidade dos dados.
Observe que os pressupostos para a medição da confiabilidade teste-reteste trazem inúme-
ros problemas para sua utilização. O primeiro deles diz respeito à dificuldade de medir inúmeras
vezes as mesmas pessoas. Somente as pesquisas contínuas que trabalham com amostras-painéis
reúnem condições para atender a esse preceito. O segundo problema é que cada medição
efetuada dos mesmos respondentes pode influenciar e alterar as medições seguintes. E terceiro,
mudanças podem ocorrer entre uma medição e outra nas respostas dos pesquisados, advindas
de outros fatores. Todos esses problemas poderão trazer vieses na estimativa da confiabilidade
medida por esse método.
Confiabilidade de formas alternativas – O método da forma alternativa para estimar
a confiabilidade compreende efetuar duas medições dos mesmos respondentes usando-se
instrumentos diferentes, mas considerados equivalentes. Os resultados das duas medições
são comparados para determinar o grau de discrepância, de forma semelhante ao método
teste-reteste.
As dificuldades de aplicação desse método compreendem conseguir que dois instrumentos
diferentes possam ser considerados efetivamente equivalentes: custos elevados e o tempo
elevado para se construir um segundo instrumento.

RESUMO
A coleta de dados é a fase em que são efetuados os contatos com os respondentes, aplicados os
instrumentos, registrados os dados, efetuada uma primeira crítica do preenchimento dos ins-
trumentos e enviados os instrumentos preenchidos para a central de processamento dos dados.
260 Pesquisa de Marketing

Todos os projetos devem ter um cronograma de coleta especificando quando as operações


terão início e término, e a descrição de todas as atividades, nesse intervalo de tempo, com seus
respectivos inícios e términos.
O orçamento de despesas e de saídas de caixa envolve a elaboração da previsão de todos os
custos envolvidos para a coleta dos dados e do momento de seu desembolso.
O êxito da operação de coleta de dados está diretamente relacionado com a qualidade do
pessoal contratado para sua realização.
O processo de entrevista pessoal está fundamentado no processo de inter-relação pessoal
entre duas pessoas, e é preciso que fatores relacionados com as características demográficas,
psicológicas e comportamentais de entrevistadores e entrevistados sejam parecidas para se
conseguir um clima favorável ao sucesso da entrevista.
Os principais tipos de erros cometidos por entrevistadores durante as entrevistas (tanto
pessoais quanto por telefone) ocorrem devido a: ausência de empatia entre entrevistador e
entrevistado, forma de perguntar, forma de registrar a resposta e desonestidade. Durante o
processo de treinamento, deve-se dar ênfase específica a esses itens, como forma de reduzir
sua incidência.
As opções existentes para remuneração de entrevistadores são: pagar exclusivamente um
salário fixo (por hora, semanal ou mensal), pagar exclusivamente por entrevista realizada ou
uma composição entre essas duas formas.
Durante todo o processo de coleta de dados, os entrevistadores precisam ser continuamente
supervisionados para verificar se tudo está ocorrendo, segundo o planejado: se os respondentes
são os elementos efetivamente determinados pela amostra; se os instrumentos estão sendo
preenchidos com clareza, correção e honestidade; e se os prazos estão sendo obedecidos.
É fundamental controlar e acompanhar todas as atividades planejadas e a medição constante
das metas atingidas em comparação com as programadas, a fim de garantir o cumprimento
de prazos e orçamentos.
Inúmeras são as fontes de erros não amostrais em pesquisas de marketing e, ao pesquisador,
cabe tomar o máximo de cuidado e atenções durante as várias etapas e fases da pesquisa para
minimizar sua ocorrência.
A evolução tecnológica nos campos da informática e das telecomunicações proporcionou várias
formas eletrônicas para a coleta e a transmissão de dados em pesquisa de marketing que compreendem:
people metter, smart sense, leitor ótico, notebooks/palmtops/coletadores eletrônicos de dados, smart card,
fax, internet, infovias e TV interativa.
A validade de uma medição refere-se a quanto o processo de medição está isento, simul-
taneamente, de erros amostrais e erros não amostrais.
A confiabilidade de uma medição refere-se a quanto o processo está isento apenas dos
erros amostrais.
Uma medida, para ser válida, precisa ser confiável. Porém, se uma medida não for confiável,
não poderá ser válida; e, em sendo confiável, poderá ou não ser válida. A confiabilidade é uma
condição necessária, mas não suficiente, para a validade.

QUESTÕES DE REVISÃO
1. Quais são as áreas importantes de serem planejadas na fase de coleta de dados?
2. Quais os principais pontos geradores de vieses no momento de realização das entrevistas?
Coleta de Dados 261

3. O que deve ser efetuado para minimizar a ocorrência de vieses na coleta de dados oriunda
dos entrevistadores?
4. O que deve ser efetuado para minimizar a ocorrência de vieses por parte dos entrevistados?
5. O que fazer para evitar a desonestidade dos entrevistadores?
6. Faça uma comparação entre as justificativas para pagamento de entrevistadores mediante
salário fixo e pagamento por entrevista.
7. O que é validade? Quais as formas de medir a validade?
8. O que é confiabilidade? Quais as formas de medir a confiabilidade?

Trabalho – Parte 7
Realize a coleta de dados de seu projeto de pesquisa.

REFERÊNCIAS
ATHEY, K. R.; COLEMAN, Joan E.; REITMAN, Audrey P.; TANG, Jenny. Two experiments showing the effect
of the interviewer's racial background on responses to questionnaires concerning racial issues. Journal of Applied
Psychology, 1960, 44, pp. 244-246.
BLANKENSHIP, Albert B. The effect of the interviewer upon the response in a public opinion poll. Journal of
Consulting Psychology, 4, 1940, pp. 134-136.
CAHALAN, D., TAMULONIS,V.,VERNER, H. W. Interviewer bias involved in certain types of attitude ques-
tions. International Journal of Opinion and Attitude Research, 1, Mar. 1947, pp. 63-77.
EHRLICH, June Sachar; RIESMAN, David. Age and authority in the interview. Public Opinion Quarterly, ano
25, Spring 1961, p. 41.
FERBER, Robert, WALES, Hugh. Detection and correction of interviewer bias. Public Opinion Quarterly, 16,
Spring 1952, pp. 107-127.
HAUCK, Mathew. Planning field operation. In FERBER, Robert (Ed.). Handbook of marketing research. New York:
McGraw-Hill, 1974, pp. 2-147 a 2-154.
HYMAN, Herbert H.; COOB,William J.; FELDMAN, Jacob J.; HART, Clyde W.; STEMBER, Charles
Herbert. Interviewing in social research. Chicago: University of Chicago Press, 1954.
KATZ, Daniel. Do interviewers bias poll results. Public Opinion Quarterly, 6, Summer 1942, pp. 248-268.
LEMSKE, Gerhard E., LEGGETT, John C. Caste, class, and deference in the research interview. The
American Journal of Sociology, 66, Mar 1960, p. 467.
MAYER, Charles S. Quality control. In FERBER, Robert (ed.). Handbook of marketing research. New
York: McGraw-Hill, 1975, pp. 2-160 a 2-177.
WILLIAMS, Jr., J. Allen. Interviewer-respondent interaction: a study of bias in the information interview.
Sociometry, ano 27, 1964, pp. 338-352.
CAPÍTULO 10
Processamento dos Dados
Os cientistas não lidam com a verdade; eles lidam com descrições da realidade, limitadas e
aproximadas.
Fritjof Capra

Objetivos
• Apresentar e detalhar todas as fases para a preparação e realização do processamento dos dados
na pesquisa.

Sumário
CRÍTICA
CHECAGEM
CODIFICAÇÃO
DIGITAÇÃO
TABULAÇÃO
CRÍTICA ELETRÔNICA
Crítica eletrônica de valores estranhos
Crítica eletrônica da consistência
Crítica eletrônica de valores extremados
COMPLETANDO O BANCO DE DADOS
PADRÕES TÍPICOS DE RESULTADOS DE TABULAÇÕES

O processamento dos dados compreende os passos necessários para transformar os


dados brutos coletados em informações (dados processados) que permitirão a realização
das análises e interpretações. O propósito da análise é a obtenção de significados nos
dados coletados, porém é impossível efetuar análises sobre os dados brutos, é preciso
que esses dados sejam antes processados, ou seja: somados; calculados os desvios-padrão
e as médias; construídas as distribuição de frequências; realizados os cruzamentos entre
as variáveis; efetuados os testes de hipóteses etc.
O processamento dos dados compreende as seguintes fases: crítica, checagem, codi-
ficação, digitação e tabulação.
Para permitir o controle de todas as fases do processamento quando o registro das
respostas é em questionários de papel, sugere-se a utilização de diferentes cores de caneta
para cada fase:
• Preenchimento dos questionários no campo: caneta azul.
• Crítica: caneta vermelha.
• Checagem: caneta verde.
• Codificação: caneta preta
263
264 Pesquisa de Marketing

CRÍTICA
A função básica da crítica é a de impor padrão de qualidade aos dados brutos, de forma
que sua precisão seja máxima, e as ambiguidades, mínimas. A crítica envolve a inspeção e, se
for o caso, a correção de cada instrumento de coleta preenchido, e deve ser efetuada em 100%
dos questionários aplicados.
A crítica é, geralmente, feita em dois estágios: no campo e no escritório. No campo, efe-
tua-se uma crítica preliminar para detectar os erros, omissões e ilegibilidades mais evidentes.
A crítica no campo deve ser imediatamente realizada após a entrega do instrumento pelo
entrevistador, de forma a possibilitar a correção de problemas mais evidentes, antes que a
equipe de entrevistadores seja desfeita, e, em geral, é feita pelo próprio supervisor de campo.
A crítica no escritório envolve um trabalho bem mais detalhista e intenso do que aquele
realizado no campo e exige a presença de pessoas com conhecimento profundo dos objetivos
e procedimentos da pesquisa. Para que a crítica no escritório seja eficaz, é fundamental que
se realize com consistência. Em estudos com amostras pequenas, uma mesma pessoa poderá
encarregar-se da crítica de todos os instrumentos e de todas as suas partes, e a consistência
estará garantida. Em estudos maiores, em que várias pessoas estarão encarregadas da crítica,
será necessário, para manter um padrão consistente, que sejam treinadas, e/ou que exista um
padrão por escrito a ser seguido (manual de crítica), e/ou que uma supervisão intensa seja
exercida ou ainda que cada crítico seja responsável por criticar determinadas perguntas de
todos os instrumentos.
Tanto a crítica no campo quanto no escritório devem analisar e avaliar se cada instrumento
preenchido está completo, legível e compreensível, uniforme, consistente e preciso.
Completo – Compreende verificar se todas as questões foram respondidas. As questões
não respondidas podem ser tratadas de uma das seguintes maneiras: contatar o respondente
(via entrevistador ou pelo próprio crítico) para obter a resposta; determinar que o dado,
no específico instrumento, seja considerado não resposta; e, quando a quantidade de não
respostas num item específico ocorrer em muitos instrumentos, determinar sua exclusão
da pesquisa.
Legível e compreensível – Para que o dado seja posteriormente codificado, é preciso
que tenha sido claramente registrado no instrumento e que as palavras utilizadas sejam com-
preensíveis. Caso o registro seja ilegível ou incompreensível, poderá ser corrigido por meio de
contato com o entrevistador responsável ou, se não for mais possível, o crítico deverá tentar
inferir o registro por meio das respostas de outras partes do instrumento. Se, com nenhuma
dessas opções for possível resolver o problema, o dado deverá ser abandonado.
Uniforme – É importante que as respostas sejam obtidas em unidades uniformes, con-
forme solicitado. Se o crítico perceber que isso não ocorreu (por exemplo, a frequência de
ida ao cinema deveria ser registrada em número de idas mensais e foi registrado o número de
idas semanais), deverá contatar o entrevistador ou o respondente para obter a resposta correta,
ou o dado deverá ser eliminado, a fim de evitar grande confusão durante o processamento.
Consistente – A consistência diz respeito à existência de coerência entre as respostas das
diferentes questões do instrumento. Não será consistente o instrumento que, por exemplo,
apresentar um padrão de compra incompatível com a renda ou apresentar hábitos socioculturais
incompatíveis com o nível educacional do respondente. O crítico deve solicitar esclarecimentos
ao entrevistador e, se estes não forem satisfatórios, eliminar as questões sem consistência, ou
até mesmo eliminar esse instrumento do estudo.
Processamento dos Dados 265

Preciso – O crítico deverá estar atento para descobrir eventual imprecisão nos dados. Essa
imprecisão pode estar relacionada a vieses introduzidos pelos entrevistadores ao conduzir de
forma errônea a entrevista, a vieses originários da falta de colaboração dos respondentes e aos
vieses decorrentes da desonestidade dos entrevistadores. Somente críticos muito experientes
são capazes de perceber diferentes nuanças no padrão de resposta dos instrumentos de um
entrevistador que o leve a desconfiar de que não houve a precisão necessária ou de que o
instrumento não foi preenchido de forma honesta. Quando imprecisões forem detectadas, o
instrumento deverá ser sumariamente eliminado do estudo.
A crítica no escritório difere da crítica no campo, no sentido de que está mais preocu-
pada com o que fazer com os casos que surgem do que com as correções a serem realizadas
pelos entrevistadores ou o retorno do questionário ao campo.
Outra forma de crítica, chamada crítica de consistência, deve ser feita quando os dados já
estiverem digitados e armazenados no banco de dados e antes do início do processamento.
Essa crítica é feita por processamento eletrônico e será vista, adiante, quando se discorrer sobre
tabulação eletrônica.

CHECAGEM
A checagem visa fundamentalmente avaliar a qualidade e a veracidade do trabalho de campo
e compreende entrar em contato com uma amostra (sorteada ou não) de entrevistados de cada
entrevistador, podendo variar de 10% a 30% do total da amostra pesquisada (dependendo das
exigências do cliente e do que foi acordado no contrato da pesquisa).
A checagem pode ser simples ou técnica. A checagem é simples quando visa apenas
confirmar os dados obtidos na entrevista; é técnica quando se faz necessário corrigir, com-
pletar ou entender alguma resposta.
Os objetivos da checagem compreendem:
• Confirmar se a entrevista foi efetivamente realizada.
• Verificar se a entrevista foi realizada respeitando-se os filtros estabelecidos.
• Confirmar se a entrevista foi realizada com a pessoa certa.
• Verificar se há consistência nas respostas obtidas no questionário, fazendo-as novamente
e comparando-as.
• Corrigir eventuais erros e dúvidas nas respostas.
• Obter respostas a perguntas que não foram respondidas.
A checagem pode ser feita por telefone ou pessoalmente. Sempre que possível, deve ser
feita por telefone, por ser a forma mais rápida e econômica.

CODIFICAÇÃO
A codificação é o procedimento técnico pelo qual os dados são categorizados. Por meio
da codificação, os dados brutos são transformados em símbolos (necessariamente numéricos
quando o processamento eletrônico for utilizado) que possam ser contados e tabulados. Os
procedimentos para codificação serão diferentes se as respostas a serem codificadas forem de
uma questão fechada ou aberta.
Codificação de questões fechadas – Para questões fechadas, a codificação pode ser estabe-
lecida antes que o trabalho de campo seja iniciado, e pode ou não estar impressa no instrumento
266 Pesquisa de Marketing

de coleta dos dados. Sua impressão no instrumento facilita o trabalho, pois evita que, antes de
o instrumento passar para a digitação, passe por uma fase de registro do código.Veja, a seguir,
exemplos de questões fechadas precodificadas, com a codificação já registrada no instrumento:
Sexo? 4
Masculino 1
Feminino 2
Qual o seu estado civil? 5
Solteiro 1
Casado 2
Desquitado/divorciado/separado 3
Viúvo 4
Qual a sua idade? 6
0 a 3 anos 1
4a7 2
8 a 11 3
12 a 18 4
19 a 25 5
26 a 45 6
46 a 55 7
Acima de 55 8
Nesses exemplos, o número que aparece acima da coluna de códigos de respostas indica
qual coluna do layout eletrônico foi reservada para se digitar a resposta a essa pergunta. Assim,
a coluna 4 está reservada para serem registrados os dígitos 1 ou 2, conforme a resposta tenha
sido sexo masculino ou feminino, respectivamente, a coluna 5, para o estado civil etc. Note
que, no caso de dados numéricos, como idade, renda, é possível coletá-los diretamente ou
por intervalos. A vantagem da coleta direta é que o intervalo poderá ser estabelecido durante
o processamento, conforme a necessidade determinar.
Contribuem para o estabelecimento a priori da codificação das opções de respostas o co-
nhecimento que o pesquisador e sua equipe tiverem do assunto de pesquisa e a realização de
pré-testes no instrumento.
Codificação de questões abertas – A codificação de questões abertas é muito mais
complexa; o problema, agora, consiste em codificar as respostas verbais dadas pelos respondentes
durante a entrevista.
Existem dois diferentes procedimentos de codificação, ambos trabalhosos e demorados. O
primeiro é a preparação a priori de um esquema bem desenvolvido de codificação. Para poder
realizá-lo, o pesquisador e sua equipe precisam ter acesso ao resultado de estudos anteriores,
um grande conhecimento do assunto em estudo ou levar em conta algum referencial teórico
existente. O segundo procedimento consiste em esperar pelo término do campo e, a partir das
verificações das respostas, ir construindo o esquema de codificação. Não é incomum, depois
de boa parte dos instrumentos terem sido codificados, surgir a necessidade de alterações no
esquema de codificação e, consequentemente, ter de recodificar novamente os já codificados.
Processamento dos Dados 267

Um problema adicional na codificação de questões abertas surge em função da subje-


tividade dos julgamentos dos codificadores. Esse problema torna-se mais crítico quando o
número de entrevistas realizadas exige a participação de mais de um codificador. A sugestão
para minimizar este problema é a atribuição de partes do instrumento para serem codificadas
pelo mesmo codificador, ao invés de todos codificarem todo o instrumento. Num caso e
noutro, faz-se necessária a elaboração de um documento denominado “livro de codificação”,
em que todas as variáveis e as codificações estabelecidas ficarão registradas para consulta pelos
codificadores e, posteriormente, pelos encarregados do processamento e das análises. Todos
esses procedimentos são demorados e exigem um trabalho muito desgastante da equipe de
pesquisa. Por todas essas dificuldades e consequentes implicações para o resultado da pesquisa
(em qualidade, tempo e custo), vale esforçar-se bastante para tornar todas as questões do ins-
trumento fechadas e reservar as abertas apenas para colher informações adicionais que possam
contribuir para a interpretação dos resultados ou àquelas impossíveis de serem transformadas
em fechadas.
Regras e convenções para codificação – Para o estabelecimento da codificação,
existem algumas regras que visam facilitar e evitar confusão nas fases seguintes de digitação e
processamento. As regras e convenções são as seguintes:
1. As opções de respostas precisam ser mutuamente exclusivas e coletivamente exaustivas –
Mutuamente exclusivas significa que uma única e exclusiva opção de resposta pode ser
assinalada, e o entrevistador, ou o próprio respondente, não podem ter nenhuma dúvida
quanto à resposta a assinalar. Coletivamente exaustivas significa que as opções de respostas
oferecidas devem cobrir todas as opções possíveis, não permitindo que nenhuma resposta
fique sem opção de registro. Para alguns tipos de variáveis, é extremamente fácil obter as
opções que sejam coletivamente exaustivas, para outras não; quando isso ocorrer, a solução
é incluir a opção “outras” ou “nenhuma das anteriores”, seguida da pergunta “Qual?” e
do espaço para registro da resposta. Assim procedendo, se o item “outras” apresentar in-
cidência muito grande na tabulação, sempre será possível tabulá-lo manualmente e não
perder nenhum dado que possa ser precioso para a análise.
2. Preferir sempre coletar dados em categorias mais desagregadas do que, a princípio, se prevê
necessitar – Note que, no processo de tabulação, sempre será possível agregar categorias,
mas será impossível desagregá-las. Com variáveis contínuas, é preferível coletar o valor no
ponto e deixar os cortes dos intervalos para serem feitos durante o processamento. Esse
procedimento traz maior liberdade ao pesquisador (em termos do número de categorias
e dos pontos de corte) e possibilita maior precisão nos cálculos de médias.
3. Na definição do corte de variáveis contínuas (se a preferência for trabalhar com intervalos
predefinidos), deve-se observar os seguintes pontos:
• Em quantas categorias a variável deve ser subdividida, tendo em vista o plano de análise
inicialmente estabelecido?
• O que facilita mais a análise, tendo em vista os objetivos da pesquisa: estabelecer
categorias de intervalos iguais (0-9, 10-19, 20-29 etc.) ou categorias com igual número
de casos (10% 0-2, 10% 3-10, 10% 11-19 etc.)?
• Os extremos das categorias devem ser abertos (abaixo de 9; 65 e mais) ou devem ser
formados intervalos fechados até esgotar todas as possibilidades?
4. Obedecer às seguintes convenções para o processamento eletrônico que facilitarão a
codificação, a digitação, o processamento e a análise dos dados:
268 Pesquisa de Marketing

• Use somente códigos numéricos; não utilize nenhum caractere especial nem deixe
nenhuma resposta em branco.
• Utilize uma coluna do layout da planilha eletrônica para cada variável.
• Utilize códigos diferentes para não resposta (missing) e para pulo (deixou de responder
porque, em função das respostas anteriores, não cabia responder).
• Nunca utilize o zero como opção de resposta, pois isso pode gerar muita confusão no
processamento. Estabeleça e utilize um código padronizado para diferentes tipos de
não respostas. Por exemplo:
Tipo de resposta Código
  Não sabe/não tem opinião 90 ou −1
  Não respondeu/recusa 91 ou −2
  Não se aplica 92 ou −3
  Dado excluído pela crítica 93 ou −4
Observação: dos dois conjuntos de possibilidades exemplificadas, a utilização de códigos
com números negativos é mais segura.
5. Todo o conjunto de respostas de um mesmo instrumento precisa estar devidamente
identificado na planilha eletrônica de dados – Muitos erros podem ocorrer no proces-
so de transcrição dos dados (digitação) para a planilha eletrônica; a identificação do
instrumento que gerou determinado conjunto de dados sempre permitirá eventuais
consultas a ele para dirimir eventuais dúvidas, ao longo do processamento e da análise.
Mais adiante, neste capítulo, quando for abordado o uso de computadores no proces-
samento de dados, será esclarecido como essa identificação poderá ser feita.
6. Em perguntas fechadas com resposta múltiplas (em que várias opções de respostas
podem ser escolhidas simultaneamente), deve ser utilizada, para codificação, cada opção
de resposta como uma pergunta simples cujas respostas possíveis sejam “sim”, código
1 ou “não”, código 2, e reservada cada coluna da planilha eletrônica para o registro de
cada opção de resposta.Veja a ilustração, no seguinte exemplo.
Dos itens apresentados a seguir, assinale aqueles que você leva em con-
sideração na escolha do café que consome.
10
Pureza Sim 1
Não 2
11
Sabor Sim 1
Não 2
12
Aroma Sim 1
Não 2
13
Qualidade Sim 1
Não 2
Processamento dos Dados 269

14
Textura Sim 1
Não 2
15
Torrefação Sim 1
Não 2
16
Embalagem Sim 1
Não 2
17
Marca Sim 1
Não 2
Neste exemplo, os números 10 a 17 representam os números das colunas da planilha
eletrônica reservados para registrar as respostas dos itens que forem assinalados no
instrumento de coleta de dados. No processamento eletrônico, pode-se solicitar
que as respostas sejam tabuladas em conjunto.

DIGITAÇÃO
A digitação, utilizada apenas para a tabulação eletrônica, consiste em transcrever os dados
codificados dos instrumentos de coleta de dados para o arquivo eletrônico de dados (banco
de dados).

TABULAÇÃO
A tabulação consiste na contagem do número de casos ocorridos em cada categoria. A
tabulação pode ser simples, quando envolve apenas a contagem do número de casos ocorridos
em cada uma das variáveis do estudo; ou cruzada, quando as ocorrências em duas ou mais
variáveis do estudo tiverem sido contadas simultaneamente. A tabulação pode ser inteira-
mente manual, inteiramente eletrônica ou parcialmente manual e parcialmente eletrônica.
A decisão de qual utilizar depende: da disponibilidade de equipamento de processamento
eletrônico, do volume de dados a processar – representado pelo número de instrumentos,
número de variáveis em cada instrumento e do número de opções de resposta para cada
variável – e da complexidade das análises estatísticas que serão necessárias. Quanto maior
for o volume de dados a processar e mais complexas as análises a serem efetuadas, maior
será a eficácia de se utilizar processamento eletrônico, e vice-versa, em relação ao proces-
samento manual.
Tabulação manual – Para a tabulação manual, basta dispor de uma folha de papel e
um lápis. Registram-se, na folha de papel, as várias opções de respostas e, percorrendo-se os
instrumentos de coleta por várias vezes quantas forem as opções de respostas, realizam-se os
registros das ocorrências e, finalmente, sua contagem. Na Tabela 10.1, está um exemplo de
tabulação manual simples de uma questão de pesquisa com quatro opções de respostas de um
instrumento que foi aplicado a 40 respondentes.
270 Pesquisa de Marketing

Tabela 10.1  Exemplo de tabulação manual simples de uma questão de pesquisa


Opções de respostas Contagem Contagem final
1 ///// ///// ///// 15
2 ///// ///// // 12
3 ///// // 7
4 ///// / 6
Total 40

A tabulação cruzada também pode ser feita manualmente, mediante a construção de uma tabela
com todos os valores das duas variáveis a serem cruzadas, de maneira que sejam criadas células
resultantes da combinação dos cruzamentos possíveis. Analogamente ao exemplo anterior, per-
correm-se todos os instrumentos de coleta e vão-se registrando, nessa tabela, os casos de ocorrência
simultânea dos valores nas duas variáveis em cruzamento. Na Tabela 10.2, mostra-se como efetuar
a tabulação cruzada manual dos resultados das seguintes questões de uma pesquisa em que foram
entrevistados 50 respondentes: marca do café consumido, com cinco opções de respostas: 1, 2, 3,
4 e 5; e estrato socioeconômico da família, com quatro opções de respostas: 1, 2, 3 e 4.
Tabela 10.2  Exemplo de tabulação cruzada manual de duas questões de uma pesquisa
Marca do café consumido
Estrato socioeconômico da família 1 2 3 4 5 Totais
1 //// // / ///// /// 15
2 // ///// /// // – 12
3 /// / /// – // 9
4 / //// ///// /// / 14
Totais 10 12 12 10 6 50

Note que os subtotais verticais e horizontais (ou subtotais marginais) de cada variável
correspondem à tabulação simples de cada uma delas. Isso indica que, quando se tem de efetuar
tabulações cruzadas, não é preciso efetuar as simples, que acabam sendo feitas em consequência.
Tabulação eletrônica – A popularização do computador, possibilitada pelas drásticas e con-
tínuas reduções de porte e preço, a elevação de sua capacidade de processamento a níveis nunca
antes imaginados, a disponibilidade no mercado de softwares poderosos para o processamento
estatístico dos dados e a simplificação e facilitação das formas de comunicação homem-máquina
fizeram com que, praticamente, toda pesquisa passasse a ser tabulada em computadores.
Para a realização do processamento eletrônico, o pesquisador precisará de um programa
para análise dos dados. Há muitos programas disponíveis na internet que captam e armazenam
dados e possibilitam processamentos básicos. Dependendo do programa disponibilizado,
inúmeras facilidades para todas as fases do processamento podem estar disponíveis, tais como:
• Módulo para construção de questionário.
• Biblioteca de questionários.
• Módulo para envio de questionários pela internet.
• Módulo para responder questionários pela internet.
• Módulo para armazenamento de respostas.
• Módulo para processamentos simples.
Processamento dos Dados 271

CRÍTICA ELETRÔNICA
Assim que os dados estiverem digitados e armazenados no banco de dados, e antes de
iniciar a tabulação/processamento, fazem-se necessárias a realização da crítica eletrônica e a
depuração dos dados de possíveis erros e inconsistências que não tenham sido percebidos nas
críticas no campo e no escritório. Existem três tipos de crítica eletrônica a serem efetuados
nos dados armazenados: crítica eletrônica de valores estranhos às variáveis; crítica eletrônica
da consistência dos dados de cada instrumento; e crítica eletrônica de valores extremados.
Crítica eletrônica de valores estranhos
Nesta crítica, devem-se fornecer comandos ao computador, de forma que aponte valores
de cada variável que não tenham sido previamente estabelecidos no livro de codificação e no
programa para entrada e saída dos dados. Assim, por exemplo, para a variável estado civil, para a
qual existem apenas cinco códigos legítimos (o quinto corresponde à não resposta), um coman-
do deve ser dado ao computador para apontar qualquer outro dígito que seja diferente desses
cinco legítimos. Esse procedimento deve ser feito com todas as variáveis da pesquisa. A correção
dos valores estranhos será fácil se os conjuntos de dados referentes a cada instrumento tiverem
sido, prévia e devidamente, identificados no banco de dados. Bastará localizar o instrumento
correspondente e a dúvida poderá ser solucionada. Para tanto, todos os instrumentos deverão
estar numerados, e esse mesmo número deverá constar do campo eletrônico correspondente.
Crítica eletrônica da consistência
A consistência de um conjunto de dados de um mesmo instrumento diz respeito à coerência
interna que deve haver entre eles. A crítica da consistência dos dados de cada instrumento
pode ser efetuada pelo computador de forma mais eficaz que as anteriores realizadas à mão. O
pesquisador deve estabelecer um programa de consistência com as variáveis-chaves de sua pes-
quisa. Deve identificar variáveis em que as ocorrências de uma, necessariamente, implicam as
ocorrências da outra (chamada de consistência de sentido único), como, por exemplo, alguém
que tenha respondido em uma pergunta não apreciar os programas atuais da TV e, em outra,
afirmar nunca ter possuído aparelho de TV; ou no caso de alguém ter respondido apreciar muito
determinado produto e, em outra questão, afirmar nunca tê-lo experimentado. Poderá também
identificar variáveis em que a ocorrência de uma implica a ocorrência da outra, e vice-versa
(chamada de consistência de sentido duplo). Um bom sistema de análise de dados deve permitir
a elaboração desses tipos de programas de consistência. Uma vez apontada pelo computador
a ocorrência de inconsistências, o pesquisador deverá decidir se é possível corrigi-las, ou se os
dados daquele instrumento deverão ser abandonados.
Crítica eletrônica de valores extremados
Um valor extremado de uma variável diz respeito a valores registrados que fogem com-
pletamente ao campo de variação tido como normal para aquela variável. Assim, por exemplo,
numa pergunta sobre o número de automóveis possuídos pela família, o pesquisador pode
estabelecer como padrão máximo o número de cinco automóveis, e o computador apontará
todos os casos que excederem a este número para a confirmação ou exclusão mediante
consulta ao instrumento e julgamento do pesquisador. Imagine que o computador tenha
apontado o caso de um possuidor de 85 automóveis. Qualquer que seja a razão para o registro
desse número (erro de digitação, o respondente era um colecionador de automóveis etc.), a
272 Pesquisa de Marketing

p­ ermanência de um dado dessa grandeza deturparia o resultado final (ou por se ter deixado
passar um erro, ou por se ter considerado um caso que era totalmente atípico).
COMPLETANDO O BANCO DE DADOS
Tendo os dados sido depurados e antes de iniciar a tabulação/processamento, o pesquisador
deverá completar o banco de dados com o acréscimo e/ou geração de outras variáveis e
efetuando a ponderação dos dados, se necessário.
Acréscimo e/ou geração de outras variáveis – Existem vários casos em que será
preciso acrescer ou gerar novas variáveis no banco de dados:
• Acrescer dados não coletados durante o campo, mas que serão utilizados para cruzamentos,
tais como: resultados de rodadas anteriores da mesma pesquisa ou de pesquisas semelhantes;
dados do censo; dados sobre vendas; dados sobre participação no mercado; dados sobre
investimentos em comunicação etc.
• Dividir uma variável contínua em categorias (por exemplo, idade em intervalos de idade),
ou combinar as categorias de uma variável de forma a trabalhar com menos categorias.
• Criar novas variáveis por meio da combinação de outras. Por exemplo, criar a variável
renda média familiar por meio da divisão da variável renda familiar pela variável número
de componentes da família.
• Criar um índice que represente o resultado de um conjunto de variáveis. Por exemplo, criar uma
variável índice de preferência para o produto como resultado da somatória das variáveis: grau de
conhecimento do produto, grau de utilização do produto e grau de satisfação para com o produto.
Ponderação dos dados – Este é o último passo a ser dado, antes que se possa iniciar
a tabulação/processamento. A ponderação dos dados se faz necessária, ou por exigência do
processo de amostragem (por exemplo, amostragem não proporcional) ou por ter ocorrido
alguma diferença entre a amostra efetiva, que foi pesquisada, e a amostra planejada, que precisa
ser agora compensada por meio de ponderação.
Um exemplo de ponderação em amostra não proporcional foi realizado na Pesquisa Nacional
Perfil, Formação,Atuação e Oportunidades de Trabalho do Administrador, realizada pelo Conselho
Federal de Administração - CFA (www2.cfa.org.br), em parceria com a Fundação Instituto de
Administração - FIA (www.fia.com.br/) em 2011. Nessa pesquisa, foi introduzida a ponderação das
respostas de cada estado (UF) para compor os processamentos para o Brasil. Como as amostras obti-
das por estado (UF) foram desproporcionais ao tamanho de suas respectivas populações de Adminis-
tradores, no processamento para obtenção dos resultados para o Brasil, os resultados de cada estado
foram ponderados por pesos segundo sua representatividade na composição do PIB do Brasil (PIB de
2008). O PIB foi utilizado para substituir a não disponibilidade de dados sobre as populações de cada
um dos segmentos pesquisados. Os pesos (ou ponderações) para compor os resultados para o total
Brasil foram calculados segundo a fórmula a seguir, com base nas proposições de Mattar (2009:279):
PnB = AnB / anB
Em que:
PnB = Peso (ou ponderação) a ser atribuído aos resultados da amostra de um estado para
compor os resultados do Brasil.
AnB = Proporção (ou %) do PIB do estado em relação ao PIB do Brasil de 2008.
anB = Proporção (ou %) de respondentes do estado no total de respondentes da pesquisa no Brasil.
Na Tabela 10.3, estão os cálculos dos índices de ponderação para o Total Brasil, resultantes
da aplicação da fórmula mencionada.
Tabela 10.3  Cálculo dos índices de ponderações de cada estado para serem aplicados ao n real para o cálculo do n ponderado para o processamento do Total Brasil
PIB de 2008 em R$ mil Administradores Coordenadores Empresários Total
Pondera- n ponde- n Ponde- n ponde- n Ponde- n ponde- n total
Estado Valor Prop. n real Prop. ção rado real Prop. ração erado real Prop. ração rado ponderado
 Acre 6.730.000 0,0022 115 0,0064 0,3471 40 8 0,0050 0,4445 4 7 0,0046 0,4861 3 47
 Alagoas 19.447.000 0,0064 192 0,0107 0,6007 115 9 0,0056 1,1417 10 7 0,0046 1,4047 10 135
 Amapá 6.765.000 0,0022 106 0,0059 0,3785 40 5 0,0031 0,7149 4 5 0,0033 0,6841 3 47
 Amazonas 46.823.000 0,0154 468 0,0260 0,5934 278 31 0,0194 0,7981 25 27 0,0176 0,8769 24 326
  Bahia 121.508.000 0,0401 1305 0,0726 0,5522 721 87 0,0543 0,7380 64 93 0,0607 0,6606 61 846
  Ceará 60.099.000 0,0198 258 0,0143 1,3816 356 38 0,0237 0,8357 32 22 0,0144 1,3813 30 419
  Distrito Federal 117.572.000 0,0388 1115 0,0620 0,6254 697 53 0,0331 1,1722 62 61 0,0398 0,9746 59 819
  Espírito Santo 69.870.000 0,0230 993 0,0552 0,4173 414 62 0,0387 0,5955 37 99 0,0646 0,3569 35 487
 Goiás 75.275.000 0,0248 557 0,0310 0,8015 446 52 0,0325 0,7649 40 37 0,0241 1,0287 38 524
 Maranhão 38.487.000 0,0127 229 0,0127 0,9968 228 26 0,0162 0,7822 20 19 0,0124 1,0242 19 268
  Mato Grosso 53.023.000 0,0175 276 0,0153 1,1394 314 64 0,0400 0,4378 28 33 0,0215 0,8124 27 369
  Mto. Grosso Sul 33.145.000 0,0109 286 0,0159 0,6874 197 32 0,0200 0,5473 18 19 0,0124 0,8821 17 231
  Minas Gerais 282.522.000 0,0932 1556 0,0865 1,0769 1676 162 0,1011 0,9215 149 105 0,0685 1,3605 143 1968
 Pará 58.519.000 0,0193 535 0,0298 0,6487 347 24 0,0150 1,2884 31 44 0,0287 0,6725 30 408
 Paraíba 25.697.000 0,0085 186 0,0103 0,8194 152 21 0,0131 0,6466 14 20 0,0130 0,6497 13 179
 Paraná 179.270.000 0,0591 876 0,0487 1,2138 1063 123 0,0768 0,7701 95 84 0,0548 1,0791 91 1249
 Pernambuco 70.441.000 0,0232 321 0,0179 1,3015 418 33 0,0206 1,1279 37 20 0,0130 1,7809 36 491
 Piauí 16.761.000 0,0055 115 0,0064 0,8644 99 21 0,0131 0,4217 9 7 0,0046 1,2107 8 117
  Rio de Janeiro 343.182.000 0,1132 2062 0,1147 0,9871 2035 109 0,0680 1,6636 181 130 0,0848 1,3348 174 2390
  R. G. Norte 25.481.000 0,0084 433 0,0241 0,3490 151 41 0,0256 0,3284 13 22 0,0144 0,5856 13 177
  R. G. Sul 199.499.000 0,0658 1571 0,0874 0,7532 1183 158 0,0986 0,6672 105 133 0,0868 0,7584 101 1390
 Rondônia 17.888.000 0,0059 136 0,0076 0,7801 106 23 0,0144 0,4110 9 13 0,0085 0,6958 9 125
 Roraima 4.889.000 0,0016 31 0,0017 0,9354 29 2 0,0012 1,2917 3 1 0,0007 2,4720 2 34
  Santa Catarina 123.283.000 0,0407 856 0,0476 0,8542 731 89 0,0556 0,7319 65 74 0,0483 0,8424 62 859
  São Paulo 1.003.016.000 0,3308 3183 0,1770 1,8690 5949 303 0,1891 1,7491 530 437 0,2851 1,1605 507 6986
 Sergipe 19.552.000 0,0064 173 0,0096 0,6703 116 18 0,0112 0,5740 10 9 0,0059 1,0985 10 136
 Tocantins 13.091.000 0,0043 48 0,0027 1,6176 78 8 0,0050 0,8646 7 5 0,0033 1,3239 7 91
Totais 3.031.835.000 1,0000 17982 1,0000 17982 1602 1,0000 1602 1533 1,0000 1533 21117
Fonte: Pesquisa Nacional Perfil, Formação, Atuação e Oportunidades de Trabalho do Administrador. Conselho Federal de Administração – CFA, 5. ed. 2011. Disponível em: www2.cfa.org.br.
Acessado em: 8 ago. 2012.
274 Pesquisa de Marketing

PADRÕES TÍPICOS DE RESULTADOS DE TABULAÇÕES


Os resultados das tabulações, manuais ou eletrônicas, têm padrões típicos de apresentação,
como será ilustrado a seguir.
Na Tabela 10.4, é apresentado o formato teórico dos resultados da tabulação simples.
Suponha-se uma variável com quatro categorias de respostas: A, B. C e D, com n res-
pondentes.

Tabela 10.4  Formato teórico dos resultados da tabulação simples


Categoria Fab Fac Frel Frel ac
A nA nA nA/n × 100 nA/n × 100
B nB nA + nB nB/n × 100 (nA + nB)/n × 100
C nC nA + nB + nC nC/n × 100 (nA + nB + nC)/n × 100
D nD nA + nB+ nC+ nD = n nD/n × 100 n/n × 100 = 100%
Totais n 100%

Em que:
Fab = Frequência absoluta (resultado da contagem da categoria).
Fac = Frequência acumulada (resultado da contagem acumulada de todas as categorias
anteriores até a categoria).
Frel = Frequência relativa (frequência da categoria em termos percentuais).
Frel ac = Frequência relativa acumulada (frequência em termos percentuais de todas as
categorias anteriores até a categoria).
n = número de respondentes da questão.
ni = número de respostas da categoria i (nA, nB, nC ou nD).
Um exemplo numérico é apresentado na Tabela 10.5. Suponha-se que a pergunta tenha
sido qual o número de filhos nas famílias pesquisadas; o número de famílias pesquisadas foi
de 150 e as opções de respostas foram 0, 1, 2, 3, 4, 5 ou mais e 9 (não respostas).

Tabela 10.5  Exemplo numérico de resultado da tabulação simples


N° de famílias Porcentagens Porcentagens
N° de filhos por família N° de famílias acumulado de famílias acumuladas de famílias
0 12 12 8 8
1 33 45 22 30
2 63 108 42 72
3 24 132 16 88
4 9 141 6 94
5 ou + 6 147 4 98
9 (não respostas) 3 150 2 100
Totais 150 100

Na Tabela 10.6 é apresentado o formato teórico dos resultados da tabulação cruzada.


Suponha-se o cruzamento de duas variáveis, sendo cada uma com as seguintes categorias de
Processamento dos Dados 275

respostas: variável 1 com as opções A, B e C e a variável 2 com as opções X e Y, tendo sido


pesquisada uma amostra de n respondentes.

Tabela 10.6  Formato teórico dos resultados da tabulação cruzada


Variável 2
Variável 1 X % Y % Total %
A nAX  (nAX/n) × 100 nAY  (nAY/n) × 100 nA  nA/n × 100
B nBX  (nBX/n) × 100 nBY  (nBY/n) × 100 nB  nB/n × 100
C nCX  (nCX/n) × 100 nCY  (nCY/n) × 100 nC  nC/n × 100
Total nX  nX/n× 100 nY  nY/n× 100 n 100%

A leitura da Tabela 10.6 deve ser feita conforme as orientações constantes no Quadro 10.1.

Quadro 10.1  Leitura dos resultados da tabulação cruzada


Variáveis e opções Leitura
nA, nB e nC Número total de respostas à variável A, B e C, respectivamente.
nX e nY Número total de respostas à variável X e Y, respectivamente.
nAX e nAY Número de respostas, simultâneas, às variáveis A e X, e A e Y,
respectivamente, sendo nAX + nAY = nA.
nBX e nBY Número de respostas, simultâneas, às variáveis B e X e B e Y,
respectivamente, sendo nBX + nBY = nB.
nCX e nCY Número de respostas, simultâneas, às variáveis C e X e C e Y,
respectivamente, sendo nCX + nCY = nC.
nAX, nBX e nCX Número de respostas, simultâneas, às variáveis A e X, B e X, e a C e X
respectivamente, sendo nAX + nBX + nCX = nX.
nAY, nBY e nCY Número de respostas, simultâneas, às variáveis A e Y, B e Y, e a C e Y,
respectivamente, sendo nAY + nBY + nCY = nY.
n Número total de respondentes, sendo que n = nA + nB + nC,
n = nX + nY, e n = nAX + nBX + nCX + nAY + nBY + nCY.
nAX/n × 100 Porcentagem de respostas simultâneas a A e X do total de respostas n.
nBX/n × 100 Porcentagem de respostas simultâneas a B e X do total de respostas n.
nCX/n × 100 Porcentagem de respostas simultâneas a C e X do total de respostas n.
nAY/n × 100 Porcentagem de respostas simultâneas a A e Y do total de respostas n.
nBY/n × 100 Porcentagem de respostas simultâneas a B e Y do total de respostas n.
nCY/n × 100 Porcentagem de respostas simultâneas a C e Y do total de respostas n.
nA/n × 100, Porcentagens sobre o total n de respostas dos totais das linhas A, B e C
nB/n × 100 e e sobre cada uma de suas células em relação ao total de cada coluna.
nC/n × 100
nX/n × 100 e Porcentagens sobre o total n de respostas dos totais das colunas X e Y
nY/n × 100 e sobre cada uma das células em relação ao total de cada linha.
276 Pesquisa de Marketing

Um exemplo numérico facilitará a compreensão do exposto. Suponha-se o resultado do


cruzamento das variáveis sexo e frequência de leitura de jornais, numa pesquisa em que foram
entrevistados 200 respondentes. A frequência de leitura de jornais foi medida com a seguinte
escala: diariamente, semanalmente, esporadicamente e nunca. Na Tabela 10.7 pode ser visto
um resultado hipotético da tabulação cruzada.
Tabela 10.7  Exemplo de resultado da tabulação cruzada
Sexo
Frequência de leitura Masculino Feminino Totais
Diariamente 20 55,5% 16 44,5% 36 100%
16,7% 10,0% 20,0% 8,0% 18% -
Semanalmente 36 58,0% 26 42,0% 62 100%
30,0% 18,0% 32,5% 13,0% 31% -
Esporadicamente 34 63,0% 20 37,0% 54 100%
28,3% 17,0% 25,0% 10,0% 27% -
Nunca 18 64,3% 10 35,7% 28 100%
15,0% 9,0% 12,5% 5,0% 14% -
Não resposta 12 60,0% 8 40,0% 20 100%
10,0% 6,0% 10,0% 4,0% 10% -
Totais 120 - 80 - 200 100%
100% 60,0% 100% 40,0% 100% -

Alguns exemplos de leituras que podem ser feitas na Tabela 10.7. Suponha como poderá
ser feita a leitura da célula formada pelo cruzamento da linha semanalmente com sexo
feminino:
• Dos 200 entrevistados, 26 são mulheres que leem jornais semanalmente.
• 13% do total da amostra (200) é representado por mulheres que leem jornais semanalmente.
• Das mulheres pesquisadas, 32,5% (80) leem jornais semanalmente.
• Dos 62 leitores semanais de jornais pesquisados, 42% são mulheres.
Além da leitura na célula, é possível efetuar leituras entre células nos sentidos horizontal
e vertical, e em relação ao total de respostas.

RESUMO
O processamento dos dados compreende os passos necessários para transformar os dados
brutos coletados dos instrumentos em dados trabalhados que permitirão a realização de
análises e interpretações, e apresenta as seguintes fases: crítica, checagem, codificação, digitação
e tabulação.
A função básica da crítica é a de impor padrão de qualidade aos dados brutos, de forma que
sua precisão seja máxima, e as ambiguidades, mínimas. A crítica é, geralmente, feita em dois es-
tágios: no campo e no escritório.Tanto a crítica no campo quanto no escritório devem analisar
se os instrumentos estão completos, legíveis e compreensíveis, uniformes, consistentes e precisos.
A checagem visa fundamentalmente avaliar a qualidade e a veracidade do trabalho de
campo e compreende entrar em contato com uma amostra (sorteada ou não) de entrevis-
tados de cada entrevistador, podendo variar de 10% a 30% do total da amostra pesquisada
(dependendo das exigências do cliente e do que tiver sido acordado no contrato da pesquisa).
Processamento dos Dados 277

A codificação é o procedimento técnico pelo qual os dados são categorizados. Para ques-
tões fechadas, a codificação pode ser estabelecida antes que o trabalho de campo seja iniciado
e pode ou não estar impressa no instrumento de coleta dos dados. A codificação de questões
abertas é muito mais complexa. Existem dois diferentes procedimentos: preparação antes
do campo de um bem desenvolvido esquema de codificação ou construção do esquema de
codificação, após o campo, a partir dos próprios dados coletados.
A digitação consiste em transcrever os dados codificados dos instrumentos de coleta de
dados para o arquivo eletrônico de dados.
A tabulação consiste na contagem do número de casos ocorridos em cada categoria. A
tabulação pode ser simples, quando envolve a simples contagem do número de casos ocorridos
em cada uma das variáveis do estudo; ou cruzada, quando as ocorrências em duas ou mais
variáveis do estudo são contadas simultaneamente. A tabulação pode ser inteiramente manual,
inteiramente eletrônica ou, parcialmente, manual e eletrônica.

QUESTÕES DE REVISÃO
1. Descreva o que é crítica, checagem, codificação, digitação e tabulação em pesquisas de
marketing.
2. O que deve ser analisado durante a crítica?
3. O que difere a crítica no campo e no escritório?
4. Quais os objetivos da checagem?
5. No que difere a codificação de questões fechadas das questões abertas?
6. Quais são as regras e convenções para a realização de codificação?
7. Qual a diferença entre tabulação simples e cruzada?
8. O que é necessário para a realização da tabulação eletrônica dos dados de uma pesquisa?
9. No que consiste a crítica eletrônica da consistência? O que se procura detectar?
10. Quais são os tipos de crítica eletrônica da consistência? Dê exemplos.
11. Que tipo de dados não coletados durante o campo pode ser necessário acrescer ao banco
de dados da pesquisa, antes do processamento?
12. Quais as possíveis razões para realizar ponderações no banco de dados antes de iniciar o
processamento?

Trabalho – Parte 8
1. Realize a crítica dos instrumentos coletados em sua pesquisa.
2. Realize a checagem dos instrumentos coletados em sua pesquisa.
3. Caso seu instrumento, ou algumas questões, não tenham sido do tipo pré-codificado,
monte um plano de codificação e, em seguida, codifique-as.
4. Efetue a digitação dos dados, caso vá utilizar o processamento eletrônico.

REFERÊNCIAS
CHURCHILL, JR., Gilbert A. Marketing research: methodological foundations. Insdale, Illinois: Driden Press, 1979.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tokio: McGraw-Hill
Kogakusha, 1979.
SIDEL, Philip S. Coding. In: FERBER, Robert (Org.). Handbook of marketing research. New York: McGraw-Hill,
1975. pp. 2-178 a 2-199.
278 Pesquisa de Marketing

STOWELL, III, Channing. Planning for data processing and data storage. In: FERBER, Robert (Org.). Handbook
of marketing research. New York: McGraw-Hill, 1975. pp. 2-52 a 2-89.

Sites
CONSELHO FEDERAL DE ADMINISTRAÇÃO – CFA. Pesquisa Nacional Perfil, Formação, Atuação e
Oportunidades de Trabalho do Administrador, 5. ed. 2012. Disponível em: www2.cfa.org.br. Acessado em: 8
ago. 2012.
FUNDAÇÃO INSTITUTO DE ADMINISTRAÇÃO – FIA. Disponível em: www.fia.com.br/.
CAPÍTULO 11
Métodos de Análise de Dados
e Inferência Estatística1
Parece-me que, na escala das medidas universais, há um ponto em que a imaginação e
o conhecimento se cruzam, um ponto em que se atinge a diminuição das coisas grandes
e o aumento das coisas pequenas: é o ponto da arte.
Vladimir Nabokov

Objetivos
• Apresentar e exemplificar os métodos descritivos de medidas de posição e dispersão para análise de dados.
• Apresentar e exemplificar os métodos inferenciais para análise de dados.

Sumário
MÉTODOS DESCRITIVOS
Medidas de posição
Medidas de posição para variável nominal
Medidas de posição para variável ordinal
Medidas de posição para variável intervalar ou razão
Medidas de dispersão
Medidas de dispersão para variável nominal
Medidas de dispersão para variável ordinal
Medidas de dispersão para variável intervalar ou razão
Exemplos de cálculos de medidas de posição e dispersão
MÉTODOS INFERENCIAIS
Fatores para seleção da técnica inferencial
TESTES DE HIPÓTESES

Tendo os dados coletados sido criticados, codificados e devidamente arquivados,


deve-se agora dirigir a atenção à realização das análises. O objetivo principal das
análises é permitir ao pesquisador tirar conclusões a partir dos dados coletados. Alguns
pesquisadores consideram a análise a mais importante etapa da pesquisa, no entanto,
ela é tão importante quanto qualquer outra das etapas, pois de nada adiantará uma
análise sofisticada e precisa sobre dados coletados de forma inadequada, viesada, se

1
 ão confundir o uso adequado dos métodos com o uso de métodos sofisticados. Para alguns estudos,
N
é suficiente realizar tabulações simples e cruzadas; outros envolvem análises adicionais com medidas da
dispersão e medidas da associação, acompanhadas de testes estatísticos; para outros ainda, será necessária a
utilização de métodos multivariados.
279
280 Pesquisa de Marketing

eles forem oriundos de um problema mal definido, de um projeto de pesquisa ruim, de


uma amostragem inadequada ou de um trabalho de campo mal conduzido. Analogamente,
de nada adianta coletar dados de forma extremamente correta e não viesada e serem
errônea ou pobremente analisados. A qualidade de uma pesquisa está diretamente relacio-
nada ao equilíbrio da qualidade entre suas diversas etapas, por isso todas são igualmente
importantes.
É importante que o pesquisador saiba exatamente quais técnicas pode aplicar cor-
retamente sobre os dados a analisar, como utilizar o computador para a elaboração das
análises, entender os resultados e como a eles se chegou. O grande desafio dessa etapa
é saber escolher corretamente as técnicas de análise entre as inúmeras existentes. Por
essa razão, o objetivo principal dos capítulos referentes às análises é o de proporcionar
uma visão geral da adequação ao problema de pesquisa da aplicação das técnicas mais
importantes de análise, sem entrar, no entanto, no mérito de seu desenvolvimento teórico.
Para atingir esse objetivo, cada técnica apresentada conterá: sua utilização em pesquisas de
marketing, condições para sua aplicação, breve explanação teórico-conceitual, procedi-
mentos sumarizados para sua aplicação e exemplos de sua utilização manual e eletrônica
em pesquisas de marketing.
Há dois objetivos básicos procurados na análise de dados: descrição dos dados e inferências
para a população a partir dos resultados da amostra. Os métodos de análises correspondentes
denominam-se descritivos e inferenciais.
Os métodos descritivos têm por objetivo proporcionar informações sumarizadas dos dados
contidos no total de elementos estudados, sejam eles em uma amostra ou em uma população.
Como o próprio nome indica, visa descrever as características do conjunto de elementos
pesquisado. As técnicas utilizadas em pesquisas de marketing para a descrição dos dados com-
preendem: medidas de posição, medidas de dispersão e medidas de associação. As medidas de
associação serão apresentadas no Capítulo 12.
Os métodos inferenciais têm por objetivo possibilitar generalizações sobre as caracterís-
ticas de uma população a partir dos resultados obtidos em uma amostra dessa população.
Compreendem um grande conjunto de técnicas de análises que servem para julgar a validade
de hipóteses estatísticas sobre uma população ou para estimar seus parâmetros, a partir da
análise dos dados de uma amostra dessa população. Os métodos inferenciais se baseiam na
teoria das probabilidades, de forma que a incerteza da inferência possa ser medida, isto é, o
risco de efetuar inferências incorretas possa ser estabelecido. As técnicas inferenciais com-
preendem a estimação de parâmetros e os testes de hipóteses. A estimação de parâmetros já
foi apresentada nos capítulos sobre amostragem, Capítulos 7 e 8.

MÉTODOS DESCRITIVOS
Dos métodos descritivos de análise de dados, as medidas de posição servem para caracterizar
o que é “típico” no conjunto de elementos, as medidas de dispersão, para medir como os in-
divíduos estão distribuídos no conjunto de elementos, e as medidas de associação, para medir
o nível de relacionamento existente entre duas ou mais variáveis do conjunto de elementos.
A utilização das medidas de posição e de dispersão depende apenas do tipo de escala de
medição da variável sob análise. No Quadro 11.1, apresenta-se um resumo das medidas de
posição e de dispersão e sua utilização em função do tipo de escala de medição da variável.
Métodos de Análise de Dados e Inferência Estatística 281

Quadro 11.1  Medidas de posição e de dispersão para variáveis em escalas nominais, ordinais e intervalares
mais utilizadas em pesquisas de marketing
Escala da variável Medidas de posição Medidas de dispersão
Nominal Moda Distribuição de frequência (absoluta e relativa)
Ordinal Mediana Ordenamento
Quartis, decis e
percentis
Intervalar ou razão Média aritmética Distribuição de frequência acumulada
(absoluta e relativa)
Amplitude
Desvio-médio
Desvio-padrão
Coeficiente de variação
Obs.: As medidas apresentadas são cumulativas, em cada coluna, no sentido de cima para baixo, isto é, todas as medidas aplicáveis
às variáveis com escalas nominais são também aplicáveis àquelas com escalas ordinais, e todas as aplicáveis às variáveis com
escalas ordinais o são também àquelas com escalas intervalares.

A seguir, são apresentados os conceitos de cada medida de posição e de dispersão e, ao


final do capítulo, um exemplo completo, com todas as medidas.

Medidas de posição
Como já visto, as medidas de posição servem para caracterizar o que é “típico” no grupo. As
medidas de posição compreendem: moda, mediana e média aritmética (chamadas de medidas
de tendência central) e quartis, decis e percentis (chamadas de separatrizes).

Medidas de posição para variável nominal


Moda – É o valor ou categoria da variável que ocorre com a maior frequência. É uma
medida típica de tendência central para variáveis nominais, mas que também pode ser aplicada
a variáveis ordinais ou intervalares, desde que tenham sido previamente agrupadas em classes;
neste caso, a classe que obtiver a maior frequência é denominada classe modal. O leitor não
deve estranhar encontrar, na prática, distribuições que apresentem mais de uma moda ou
classe modal.Veja na Tabela 11.1 um exemplo de determinação da moda em uma tabela de
distribuição de frequências.

Tabela 11.1  Exemplo de determinação da moda em uma tabela de distribuição de frequências


Empresa de transporte aéreo preferida Frequência absoluta
A 20
B 40
C 10
D 30
E 50
F 10
G 60 (moda)
Total 220
282 Pesquisa de Marketing

Medidas de posição para variável ordinal


Mediana – É o valor da variável que divide o grupo em dois subgrupos de igual tamanho
ou, em outras palavras, é o valor da variável correspondente ao elemento central da distribuição.
É uma medida típica de tendência central para variáveis ordinais, que pode também ser aplicada
a variáveis intervalares. Para variáveis ordinais, o valor da mediana é facilmente determinado; para
tanto, basta ordenar numericamente os dados e procurar o valor da variável correspondente ao
elemento que divide o grupo em dois subgrupos quando a amostra tiver número ímpar de ele-
mentos, ou a média dos valores dos dois elementos centrais, quando a amostra possuir um número
par de elementos. Por exemplo, para determinar a mediana da amostra 3, 2, 1, 5, 8, 4, 8, 9, 6 e 2,
primeiro ordenam-se os dados em ordem crescente: 1, 2, 2, 3, 4, 5, 6, 8, 8 e 9. Como se trata de
uma amostra com número par de elementos, a mediana será a média entre 4 e 5; portanto, 4,5. A
fórmula para o cálculo da mediana para variáveis intervalares será apresentada adiante neste capítulo.
Quartis – Os quartis são os valores da variável correspondentes aos três elementos que
dividem o conjunto de dados ordenados em quatro subgrupos de tamanhos iguais. São chama-
dos, respectivamente, de: 1° quartil, o valor do elemento que divide o grupo numericamente
ordenado em duas partes, a primeira com 25%, e a segunda, com 75% dos elementos do
grupo; 2° quartil (também chamado de mediana), o valor do elemento que divide o grupo
numericamente ordenado em duas partes com 50% dos elementos cada uma; e 3° quartil, o
valor do elemento que divide o grupo numericamente ordenado em duas partes, a primeira
com 75%, e a segunda, com 25% dos elementos do grupo. A determinação dos quartis para
variáveis ordinais segue a mesma sistemática apresentada para o cálculo da mediana no item
anterior, porém agora é preciso procurar, nos dados ordenados, os valores dos elementos corres-
pondentes a 25%, 50% e 75% da distribuição ordenada.
O cálculo dos quartis para variáveis intervalares é aproximado e só poderá ser feito se a variável
estiver apresentada numa tabela de distribuição de frequências relativas acumuladas das classes em
que tenha sido previamente subdividida. Para o cálculo dos quartis, utiliza-se a seguinte fórmula:

Qn = v + (Q − Frac )/Frel
Em que:
Qn = valor do quartil que se deseja calcular, sendo:
Q1 = 1° quartil.
Q2 = 2° quartil = mediana.
Q3 = 3° quartil.
V  = valor médio do intervalo de classe em que o quartil está situado.
Q = frequência relativa acumulada do quartil a ser calculado, sendo: Q = 0,25 para o 1°
quartil, Q = 0,50 para a mediana e Q = 0,75 para o 3° quartil.
Frac = frequência relativa acumulada até a classe anterior à do quartil considerado.
Frel = frequência relativa da classe em que o quartil está situado.
Decis e percentis – Correspondem, respectivamente, aos valores dos elementos que
dividem o grupo em 10 e 100 partes iguais. Não são apresentadas as formas de cálculo devido
à sua pouca utilização em pesquisas de marketing.

Medidas de posição para variável intervalar ou razão


Média aritmética (ou simplesmente média) – Corresponde ao valor médio de um
conjunto de dados. É uma medida de tendência central de aplicação exclusiva a variáveis
Métodos de Análise de Dados e Inferência Estatística 283

intervalares. Dependendo da forma de apresentação dos dados, existem duas fórmulas para o
cálculo da média.
Fórmula para o cálculo da média para dados que não estejam na forma de distribuição
de frequências:
População Amostra
N n

∑ Xi ∑x i
µ= i =1
x= i =1
N n

Fórmula para o cálculo da média para dados que estejam na forma de distribuição de
frequências:
População Amostra
N n

∑fX i i ∑ fx i i
µ= i =1
x= i =1
N n

No caso de a distribuição da variável ser apresentada em intervalos de classes, o valor a ser


considerado para o cálculo da média deve ser o valor médio do intervalo de classe.

Medidas de dispersão
As medidas de tendência central informam a respeito do ponto de concentração da maior
parte das respostas, porém não informam nada a respeito do grau de concentração dessas
respostas, nem da maneira como as observações estão dispersas por toda a distribuição. O co-
nhecimento da dispersão dos dados de uma variável é importante, não só por essa razão, mas
também porque permite avaliar a confiabilidade de uma medida de tendência central numa
amostra como parâmetro da população. Assim, se duas distribuições apresentam a mesma média,
não há condição de dizer se são iguais ou diferentes se não se souber a medida de dispersão
dos dados em torno da média de cada distribuição.

Medidas de dispersão para variável nominal


Distribuição de frequência absoluta e relativa – A distribuição de frequência ab-
soluta resulta da contagem das ocorrências de respostas por opção possível da variável, e a
frequência relativa é resultante da divisão da frequência absol­u ta de cada opção pelo
total de elementos da amostra. Constituem as únicas medidas de dispersão que podem ser
aplicadas às variáveis nominais. Não são apresentados exemplos sobre tabelas de distribuição
de frequências neste capítulo, tendo em vista os já apresentados no Capítulo 10, quando foi
abordado o processamento dos dados.Veja exemplos de aplicação, adiante, neste capítulo.

Medidas de dispersão para variável ordinal


Ordenamento – É a disposição de todos os elementos do grupo de forma crescente ou
decrescente, segundo as avaliações efetuadas para a variável ordinal pesquisada. Exemplo: uma
rede de supermercados deseja avaliar quanto três de suas lojas estão agradando a seus clientes,
284 Pesquisa de Marketing

para, em função dos resultados, decidir em qual(ais) loja(s) devem ser tomadas providências
administrativas e mercadológicas. Para tanto, realizou uma pesquisa junto a nove consumidores
de cada uma das lojas, quanto a seu grau de satisfação, avaliado por meio da atribuição de pontos
para um grande número de tópicos de um mesmo instrumento de pesquisa. Os resultados
dessa avaliação estão na Tabela 11.2.
Tabela 11.2  Dados brutos resultantes da avaliação do grau de satisfação
em três lojas de uma rede de supermercados
Loja A Loja B Loja C
78 113 72
120 90 93
106 99 80
77 100 69
87 123 97
86 92 76
111 121 62
128 104 67
110 132 116
Totais  903 974 732

Uma forma comumente encontrada em pesquisas de marketing é efetuar a soma das


pontuações na vertical, comparar os resultados e, a partir desses resultados, decidir qual(ais)
loja(s) merece(m) mudanças. Neste caso ter-se-ia a seguinte pontuação: Loja A com 903
pontos, Loja B com 974 e Loja C com 732, indicando que a Loja C foi a pior avaliada. No
entanto, como se trata de uma variável ordinal, essa prática está conceitualmente errada. A
prática correta consiste em proceder a um ordenamento conjunto das pontuações obtidas
da menor para a maior, somar na vertical as várias posições ocupadas nesse ordenamento
conjunto para então comparar os resultados e tomar as decisões. Na Tabela 11.2 observa-se
que a maior pontuação foi de 132 (loja B), à qual se atribui a ordem 1; a segunda maior
pontuação foi de 128, à qual se atribui a ordem 2 (loja A); e assim, sucessivamente, com
todas as pontuações obtêm-se os resultados do ordenamento conjunto dos dados constantes
da Tabela 11.3.

Tabela 11.3  Resultados do ordenamento conjunto da avaliação do grau


de satisfação em três lojas de uma rede de supermercados
Loja A Loja B Loja C
21 7 24
5 17 15
10 13 20
22 12 25
18 3 14
19 16 23
8 4 27
2 11 26
9 1 6
Totais 114 84 180
Métodos de Análise de Dados e Inferência Estatística 285

Por esses resultados, verifica-se que a loja B teve o melhor desempenho, seguida da loja
A, sendo que a loja C é a que merece mais atenção da empresa em relação à necessidade de
melhorias.

Medidas de dispersão para variável intervalar ou razão


Distribuição de frequências absoluta acumulada e relativa acumulada – A distribuição
de frequência absoluta acumulada é resultante da contagem acumulativa da ocorrência de respostas
até determinado valor da variável, enquanto a relativa acumulada resulta da divisão da frequência
absoluta acumulada pelo total de elementos da amostra. Constituem medidas de dispersão exclusivas
a serem aplicadas a variáveis intervalares ou razão.
Amplitude – A amplitude de uma distribuição ordenada é uma medida de dispersão típica
de variáveis intervalares. A amplitude é a diferença entre o maior e o menor valor observado
da variável. Dessa forma, ela fornece a dimensão do campo de variação da variável. A fórmula
para o cálculo da amplitude é:
A = xmaior − xmenor

Desvio-médio – É a média aritmética das diferenças em módulo (ou seja, despreza-se o


sinal) entre cada observação e a média das observações. O desvio-médio serve para comparar
duas distribuições com igual média e saber qual das duas está mais ou menos dispersa. A
fórmula para o desvio-médio é:
População Amostra
N n

∑X i −µ ∑x i −x
DM = i =1
DM = i =1

N n

Variância e desvio-padrão – A soma dos quadrados das diferenças entre cada observação
e a média, dividida pelo número de observações é definida como variância. O desvio-padrão é
a raiz quadrada da variância. As fórmulas para o cálculo do desvio-padrão para populações
e amostras estão no Quadro 11.2.
O significado do desvio-padrão em termos de dispersão dos dados é que, sendo o valor da
variância para determinado número de observações, proporcional à soma dos quadrados das
diferenças entre as observações e a média, quanto mais essas observações estiverem dispersas,
mais distantes da média estará cada um dos valores de cada observação; dessa forma, maior será

Quadro 11.2  Fórmulas para o cálculo do desvio-padrão para populações e amostras


População Amostra
Dados brutos
Σ( X − µ )2 Σ( x − x )2
σ = S=
N n
Dados em distribuição 2 2
Σf ( X i )2  Σf i X i  Σf ( xi )2  Σf i xi 
de frequência σ = − S= −
N  N  n  n 
286 Pesquisa de Marketing

o valor da variância e, consequentemente, do desvio-padrão. O desvio-padrão é uma medida


efetiva de dispersão dos dados de uma distribuição em termos absolutos; ele é, em síntese, a
média dos desvios de cada observação em relação à média da amostra ou da população.
Coeficiente de variação – O desvio-padrão é uma medida absoluta da dispersão e é
apresentado nas mesmas unidades de medida originais em que os dados foram coletados. Às
vezes, em pesquisas de marketing, é necessário comparar a dispersão de diversas distribuições
que não possuam as mesmas médias ou que não estejam nas mesmas escalas ou unidades de
medida e que, por isso, não podem ser feitas com os desvios-padrão. O coeficiente de variação
permite efetuar essas comparações. O coeficiente de variação é uma medida abstrata da dis-
persão e é obtido por meio da divisão do desvio-padrão pela média.

População Amostra
CV p = σ /µ CVa = S /x

Exemplo de aplicação do coeficiente de variação. Um gerente de vendas está interessado


em saber quanto há de homogeneidade no desempenho de seus vendedores entre regiões. Para
tanto, recebeu os dados anuais sobre as vendas médias, por vendedor, das quatro regiões sob sua
responsabilidade, constantes da Tabela 11.4.
Tabela 11.4  Dados anuais de vendas, por vendedores, das regiões A, B, C e D
Região Vendas médias Desvio-padrão Coeficiente
por vendedor (R$) (R$) de variação
A 8.000 2.400 0,30
B 12.000 3.000 0,25
C 15.000 6.000 0,40
D 20.000 7.000 0,35

Apenas observando os dados da Tabela 11.4, é difícil tirar alguma conclusão, já que os desvios-
padrão não podem ser comparados. Dividindo-se cada desvio-padrão por sua respectiva
média, obtêm-se os respectivos coeficientes de variação CVa = 0,30, CVb = 0,25, CVc = 0,40
e CVd = 0,35. Esses coeficientes permitirão ao gerente concluir que, na região B, está a equipe
de vendas com desempenho mais homogêneo, com as vendas de cada vendedor com pouca
dispersão em torno da média, enquanto, na região C, está a equipe com desempenho menos
homogêneo.

Exemplos de cálculos de medidas de posição e dispersão


Uma pesquisa sobre renda familiar realizada com uma amostra de 1.000 pessoas resultou
na Tabela 11.5 de distribuição de frequências, à qual foram acrescidos cálculos para facilitar
a exposição que segue.
Em que:
x = ponto médio do intervalo de renda.
f = frequência absoluta.
frel = frequência relativa.
fac = frequência acumulada.
frac = frequência relativa acumulada.
Métodos de Análise de Dados e Inferência Estatística 287

Tabela 11.5  Tabela de distribuição de frequências dos resultados de pesquisa sobre renda familiar
x
(Ponto f
Renda (R$) médio) (unidades) frel Fac frac f.x f . (x2)
0 |– 10.000 5.000 250 0,25 250 0,25 1.250.000 6.250.000.000
10.000 |– 20.000 15.000 300 0,30 550 0,55 4.500.000 67.500.000.000
20.000 |– 30.000 25.000 200 0,20 750 0,75 5.000.000 125.000.000.000
30.000 |– 40.000 35.000 120 0,12 870 0,87 4.200.000 147.000.000.000
40.000 |– 50.000 45.000 60 0,06 930 0,93 2.700.000 121.500.000.000
50.000 |– 60.000 55.000 40 0,04 970 0,97 2.200.000 121.000.000.000
60.000 |– 70.000 65.000 20 0,02 990 0,99 1.300.000 84.500.000.000
70.000 ou + 75.000 10 0,01 1.000 1,00 750.000 56.250.000.000
O 1.000 1,00 21.900.000 729.000.000.000

Aplicando os conceitos e as formulações apresentados nesta seção, tem-se:


1. Moda – É a classe de maior frequência: 10.000 |– 20.000.
2. Média
n

∑fx i i
x= i =1
n
x = 21.900.000/1.000= R$ 21.900,00
3. Quartis e mediana – A fórmula geral de cálculo é
Qn = v + (Q – f rac )/f rel
Substituindo os valores na fórmula ter-se-á:
1° Quartil
Q1 = R$ 5.001,00
2° Quartil = Mediana
Q2 = R$ 15.000,83
3° Quartil
Q3 = R$ 25.001,00
4. Amplitude
A = 75.000 – 5.000 = R$ 70.000,00
5. Desvio-médio
n

∑x i −x
DM = i =1
n
DM = R$ 12.590,00
6. Desvio-padrão
2
Σf ( x )2  Σf x 
S= − 
n  n 
S = R$ 15.792,00
288 Pesquisa de Marketing

MÉTODOS INFERENCIAIS
A inferência é tópico fundamental em pesquisas de marketing. A inferência diz respeito
a como é possível assumir conclusões para toda uma população a partir das medições e da
análise de apenas uma parte dela (amostra), de forma que o risco de se chegar a conclusões
incorretas possa ser medido. A inferência diz respeito a dois tipos de problemas: estimar os
parâmetros de uma população e realizar testes de hipóteses.
É por meio dos métodos de inferência estatística que se pode assumir, por exemplo, com
determinada probabilidade conhecida de erro, a média calculada numa amostra como es-
timativa da média da população.
É também por meio dos métodos de inferência estatística que se podem realizar os testes
de hipóteses a respeito, por exemplo, da diferença entre duas distribuições. A estimação de
parâmetros já foi devidamente explorada nos Capítulos 7 e 8 deste livro, referentes a processos
de amostragem e determinação do número de elementos da amostra.

Fatores para seleção da técnica inferencial


Muitas pesquisas de marketing têm apresentado conclusões baseadas em resultados obtidos
com a utilização incorreta de métodos e técnicas de análises, comprometendo, dessa forma,
a qualidade, a precisão e a confiabilidade. Esse tópico visa apresentar todas as questões que
devem ser consideradas para a correta escolha da técnica de análise.
Uma classificação útil dos fatores a considerar compreende: o tipo(s) de escala(s) da(s)
variável(eis) pesquisada(s); o nível de conhecimento ou não dos parâmetros da população
pesquisada; o problema da pesquisa; o número de variáveis a serem analisadas em conjun-
to; o número de amostras e seu grau de relacionamento; e a relação de dependência entre
as variáveis. A consideração conjunta de todos esses fatores determinará o método e a
técnica apropriada de análise. O detalhamento de cada um desses fatores será apresentado
a seguir.
Tipo de escala – O primeiro fator importante para a determinação da técnica cor-
reta de análise é o tipo de escala utilizada para medir a(s) variável(eis) pesquisada(s). No
Capítulo 6 foram apresentadas as diversas escalas e suas características. É importante, para a
compreensão desta exposição, a revisão pelo leitor dos conceitos lá apresentados. As técnicas
possíveis de serem utilizadas na análise variam conforme a escala seja nominal, ordinal ou
intervalar.
Nível de conhecimento dos parâmetros da população – Parâmetros de uma popula-
ção são os dados reais de uma variável dessa população em estudo como média, desvio-padrão
etc. As técnicas de análises inferenciais são classificadas em dois grupos, segundo a exigência
ou não de conhecimento dos parâmetros da população: não paramétricas e paramétricas.
No primeiro grupo, estão as técnicas que não requerem o conhecimento dos parâmetros da
população para serem utilizadas e, no segundo, estão as que exigem o conhecimento desses
parâmetros. Devido à diferença em relação às técnicas não paramétricas e paramétricas, o
Capítulo 12 tratará das técnicas não paramétricas, e o Capítulo 13, das paramétricas.
À medida que, em pesquisas de marketing, raramente se tem conhecimento dos parâmetros
da população e, portanto, se as condições para a aplicação de um teste paramétrico existem,
sua aplicação nessa condição leva ao fato de que a correção e a significância de seus resultados
fiquem na dependência da correção da suposição assumida.
Métodos de Análise de Dados e Inferência Estatística 289

Por exemplo, para a aplicação do teste paramétrico t, as exigências a serem atendidas para
sua correta aplicação compreendem:
• As observações precisam ser independentes.
• As amostras precisam ter sido retiradas de populações com distribuições normais.
• As populações precisam ter as mesmas variâncias (ou a relação entre as variâncias co-
nhecida).
• As variáveis em estudo precisam ter sido medidas ao menos numa escala intervalar que
possibilite as quatro operações aritméticas.
No entanto, esse conjunto de exigências raramente é atendido em pesquisas de marketing.
Na maioria das vezes, não se sabe o tipo de distribuição da população nem sua variância.
Além disso, muitas das variáveis são medidas em escalas nominais ou ordinais. Para analisar os
dados de amostras de populações sobre as quais não se tem conhecimento dos parâmetros ou
de que outra condição específica de uma técnica inferencial paramétrica não foi atendida, as
técnicas corretas são as não paramétricas.
Uma alternativa utilizada é a estimação de parâmetros a partir da própria amostra ou de
parte dela, que, embora não solucione por completo a questão, à medida que são realizadas
novas rodadas das mesmas pesquisas, o refinamento pode trazer resultados próximos aos
parâmetros.
Como raramente o pesquisador possui todas as especificações necessárias para aplicar cor-
retamente as técnicas paramétricas, as técnicas não paramétricas assumem grande importância
para aplicação nas análises de pesquisas de marketing.
Problema de pesquisa – Uma questão fundamental que se deve levar em consideração
para a escolha do método e da técnica de análise é o problema de pesquisa, ou seja, o que se
quer descobrir, pois cada uma das técnicas apresentadas nos próximos capítulos possui requisitos
e atende a propósitos específicos.
Número de variáveis a serem analisadas simultaneamente – Outro fator deter-
minante para a escolha do método de análise é o número de variáveis a serem analisadas em
conjunto. Assim, se o número de variáveis for, respectivamente, uma, duas ou mais de duas,
o pesquisador encontrará métodos específicos aplicáveis a cada situação, denominados, res-
pectivamente, de univariados, bivariados e multivariados.
Número de amostras a analisar e grau de relacionamento entre elas – Também são
determinantes, na escolha do método e da técnica, o número de amostras que será considerado
na análise e o grau de relacionamento existente entre elas. Segundo esse fator, é possível ter
as seguintes possibilidades: amostra simples, duas amostras relacionadas, duas amostras não
relacionadas, amostras múltiplas relacionadas e amostras múltiplas não relacionadas.
Especificamente com relação aos métodos inferenciais, o tamanho das amostras também
é fator importante na determinação da técnica de análise. Em geral, as técnicas paramétricas
requerem grandes amostras e amostras pequenas podem ser analisadas com técnicas não
paramétricas (por isso são também chamadas de “estatística de pequenas amostras”).
Amostras relacionadas e não relacionadas – O conceito de relacionamento entre amostras diz res-
peito ao fato de a escolha de um elemento para integrar a amostra interferir ou não na probabi-
lidade de escolha de outro ou se o resultado da avaliação de qualquer elemento da amostra possa
ter interferido na avaliação de outro.A seguir, vejam-se alguns exemplos para ilustrar esse conceito.
Em duas amostras selecionadas ao acaso de uma mesma população, uma delas foi exposta
a determinado tratamento, por exemplo, a uma propaganda da empresa. Em seguida, são feitas
290 Pesquisa de Marketing

medições da variável imagem do produto nas duas amostras. Esse é um exemplo típico de
amostras independentes, pois nem a seleção nem as medições efetuadas interferiram entre si.
Se apenas uma amostra tivesse sido selecionada e uma medição tivesse sido feita antes
de expô-la à propaganda e outra tivesse ocorrido após, os dois conjuntos de medições não
constituiriam amostras independentes, pois as avaliações feitas a priori teriam interferido
nas realizadas a posteriori, devido ao fato de terem sido obtidas junto aos mesmos pes-
quisados.
Relação de dependência entre as variáveis – Nos casos em que houver mais de uma
variável a ser simultaneamente analisada, um fator também determinante para a escolha da
técnica adequada de análise é a relação de dependência existente entre as variáveis. Sob este
aspecto, as variáveis podem ter, entre si, uma relação de dependência ou de interdependência.
Numa relação de dependência, uma (ou mais de uma) das variáveis é escolhida, segundo as
condições estabelecidas pelo problema de pesquisa, para ser examinada no sentido de verificar
sua dependência em relação a outras variáveis. Numa relação de interdependência, o interes-
se está em verificar o relacionamento existente entre as próprias variáveis do conjunto, não
sendo nenhuma escolhida, em especial, como a variável dependente. Conforme a relação de
dependência for estabelecida, a escolha deverá recair entre métodos para análise da dependência
ou métodos para análise da interdependência.
A colocação simultânea de todos esses fatores, num quadro resumo, ao invés de ajudar,
acabaria por atrapalhar o leitor; por isso, optou-se por apresentar as classificações, gradativa-
mente, à medida que sua apresentação se fizer necessária.

TESTES DE HIPÓTESES
Em ciências do comportamento, muitas pesquisas são conduzidas com o objetivo de veri-
ficar hipóteses construídas a partir das teorias conhecidas ou de suposições sobre a realidade.
Em pesquisas de marketing, uma hipótese pode surgir por meio da especulação sobre: um
fenômeno de marketing, o resultado esperado de determinada ação, o relacionamento entre
variáveis etc. Uma vez selecionadas as hipóteses importantes a serem testadas, o próximo
passo é a coleta de dados empíricos no campo, que, analisados, permitirão rejeitá-las ou
mantê-las. Para se atingir o objetivo de rejeição ou manutenção de determinada hipótese,
é necessário ter procedimentos bem definidos e objetivos para a realização do teste que
compreendem:
1. Estabelecer a hipótese nula (H0) e a hipótese alternativa (H1), tendo em vista a hipótese
da pesquisa.
2. Selecionar o teste estatístico adequado à situação.
3. Estabelecer um nível de significância (ou de confiança).
4. Determinar ou assumir a distribuição amostral da prova estatística sob a hipótese nula (H0).
5. Definir a região de rejeição da hipótese nula (H0, com base em 2, 3 e 4).
6. Calcular o valor da prova estatística a partir dos dados da(s) amostra(s).
7. Decidir quanto à rejeição ou não da hipótese nula (H0) e, consequentemente, adotar ou
não a hipótese alternativa (H1).
Estabelecer a hipótese nula – A hipótese nula H0 é usualmente formulada como
negação da hipótese alternativa H1 e com o objetivo expresso de ser rejeitada, sendo que
Métodos de Análise de Dados e Inferência Estatística 291

a hipótese alternativa H1 sempre deve corresponder à hipótese do projeto de pes-


quisa. Exemplos:
• Se H1 = “há diferenças na aceitação do produto entre as classes socioeconômicas A/B e
C/D”, então H0 = “não há diferenças na aceitação do produto entre as classes socioeco-
nômicas A/B e C/D”.
• Se H1 = “a realização da promoção de vendas elevou as vendas do produto”, então H0 = “a
realização da promoção de vendas não elevou as vendas do produto”.
• Se H1 = “as donas de casa mais jovens apresentam maior reação ao produto que as donas
de casa mais idosas”, então H0: “não há diferenças entre a reação ao produto entre as donas
de casa mais jovens e as mais idosas” etc.
Selecionar o teste estatístico – A seleção do teste estatístico a ser aplicado num teste de
hipóteses depende de vários fatores.A primeira escolha a ser feita, dependendo da escala dos dados
e da disponibilidade ou não de dados da população, é entre testes paramétricos ou não paramé-
tricos. Como já visto, para dados nominais ou ordinais e sem o conhecimento dos parâmetros
da população, devem-se escolher os métodos não paramétricos e, para dados intervalares e com
o conhecimento dos parâmetros da população, os métodos paramétricos. São apresentados, no
Quadro 11.3, tipos de testes de hipóteses apropriados segundo os métodos estatísticos, as escalas
de mensuração utilizadas para os dados e o número de amostras e seu relacionamento.

Quadro 11.3  Métodos da inferência – testes estatísticos apropriados segundo os métodos estatísticos,
as escalas de mensuração e o número de amostras e seu relacionamento
Testes de inferência
Escala de Duas amostras Várias amostras
mensuração Não Relacio-
Métodos da variável Uma amostra Relacionadas relacionadas nadas Não relacionadas
Não Nominal Binomial χ2 McNemar χ2 duas Cochran χ2 várias amostras
paramé- uma amostra amostras Q independentes
tricos Ordinal Kolmogorov- Wilcoxon Mediana Análise Mediana –
Smirnov Mann- da várias amostras
Whitney U variância Independentes
Kolmogorov- por Análise da variância
Smirnov postos de numa direção de
Friedman Kruskal -Wallis
Paramé- Intervalar z tr Diferença Anova – Análise da
tricos ou razão t de médias variância
z Manova – Análise
t multivariada da
Regressão variância

Há dois tipos de erros que podem ser cometidos num teste de hipótese. O primeiro,
chamado de erro tipo I, é o de rejeitar H0 quando verdadeira. O segundo, chamado de erro
tipo II, é o de aceitar H0 quando falsa. Chamando de a a probabilidade de ocorrer o erro
tipo I e, de b, a de ocorrer o tipo II, têm-se as opções expostas no Quadro 11.4 dos tipos de
erros que podem ser cometidos em testes de hipóteses.
292 Pesquisa de Marketing

Quadro 11.4  Tipos de erros que podem ser cometidos em testes de hipóteses
Hipótese verdadeira
Decisão Hipótese nula (H0) Hipótese alternativa (H1)
Não rejeitar H0 Decisão correta Erro tipo II
1–a b
Rejeitar H0 Erro tipo I Decisão correta
a 1−b

O poder do teste é definido como sua probabilidade de rejeitar H0 quando falsa, ou seja,
(1 − b). Dessa forma, quanto maior for a probabilidade do teste de rejeição de H0 quando
falsa, maior será seu poder.
A segunda escolha a ser feita ocorre quando houver mais de um tipo de teste que possa
ser aplicado à situação. Dentre várias alternativas de escolha de testes, deverá ser escolhido
aquele que tiver maior poder.
Uma terceira escolha deverá ser feita tendo em vista o tipo de escala em que os dados
foram medidos. Normalmente escalas nominais ou ordinais levam a testes não paramétricos,
enquanto escalas intervalares ou razão, a testes paramétricos.
Finalmente, uma quarta escolha deverá ocorrer quando se tratar de apenas uma amostra,
duas amostras relacionadas e não relacionadas ou várias amostras relacionadas e não relacionadas.
Estabelecer um nível de significância (ou de confiança) – O erro tipo I, de rejeitar
H0 quando for verdadeira, ocorrerá quando a amostra selecionada, dentre todas as possíveis da
população de pesquisa, apresentar dados que contrariem os dados verdadeiros da população.
Como nunca se sabe se a amostra selecionada possui dados semelhantes ou contrários aos da
população, trabalha-se com as probabilidades dessa ocorrência. Para isso, deve-se especificar
qual é o conjunto de todas as possíveis amostras que possam ocorrer quando H0 for verda-
deira. Desse conjunto, deve-se especificar um subconjunto de amo­s tras possíveis que
sejam tão extremas (exageradas) que a probabilidade de a amostra selecionada estar entre elas,
se H0 for verdadeira, é muito pequena. Se a amo­stra selecionada para a pesquisa pertencer
a esse subconjunto, rejeita-se H0. Ou seja, o procedimento será rejeitar H0, em favor de H1,
se o teste estatístico produzir um valor cuja probabilidade associada de ocorrência sob H0
é menor ou igual a uma pequena probabilidade, estabelecida pelo pesquisador, chamada de
nível de significância (ou de confiança) e simbolizada por a. Note que, conforme visto no
item anterior, a é também a probabilidade de ocorrência do erro tipo I (rejeitar H0 quando
verdadeira). Tanto a quanto b devem ser estabelecidos antes de a pesquisa ser iniciada.
Determinar ou assumir a distribuição amostral – A distribuição amostral é a dis-
tribuição derivada (ou teórica) de uma população. A distribuição deri­vada é aquela formada
por todas as possíveis amostras probabilísticas de mesmo tamanho de uma população. Para a
realização do teste de hipótese, o pesquisador precisa conhecer, ou assumir como conhecido,
o tipo de distribuição amostral da população em estudo. A distribuição amostral mostra todas
as probabilidades, sob H0, associadas aos vários possíveis valores numéricos das estatísticas
da população. Para tanto, é preciso saber se essa distribuição é normal, binomial, retangular,
Métodos de Análise de Dados e Inferência Estatística 293

qui-quadrada etc., à medida que, sabendo-se qual é o tipo de distribuição, pode-se procurar
em tabelas estatísticas padronizadas as respectivas probabilidades associadas. Como já visto no
Capítulo 7, quando são utilizadas amostras com tamanho igual ou maior a 30, a distribuição
derivada (ou amostral) aproxima-se de uma normal, a qual acaba sendo assumida.
Definir a região de rejeição da hipótese nula (H0) – A região de rejeição é uma região
da distribuição amostral. A distribuição amostral inclui todos os possíveis valores que um teste
estatístico pode assumir sob H0.A região de rejeição consiste em um subconjunto desses possíveis
valores e é definida de tal forma que a probabilidade sob H0 de a ocorrência do teste estatístico
ter um valor que esteja nesse subconjunto é a. Em outras palavras, a região de rejeição consiste
num conjunto de valores possíveis tão extremados que, quando H0 for verdadeira, a probabilidade
de a amostra selecionada estar nesse conjunto é muito pequena (isto é, a probabilidade é a).
Diz-se que a probabilidade associada a qualquer valor nessa região é igual ou menor que a.
A localização no gráfico da região de rejeição depende de como H1 foi formulada:
• Se H1 indicar a direção prevista da diferença (“a aceitação do produto é maior, ou menor,
entre as classes A/B do que entre as C/D”), tem-se um teste do tipo unicaudal, e as regiões
de rejeição de H0 serão demarcadas no extremo direito ou no esquerdo, respectivamente,
do gráfico da distribuição, conforme mostra a Figura 11.1a.
• Se H1 não indicar a direção da diferença (“não existem diferenças na aceitação do produto
entre as classes A/B e C/D”), então se tem um teste do tipo bicaudal, e as regiões de
rejeição serão demarcadas nos extremos do gráfico da distribuição amostral, à direita e à
esquerda, conforme mostra a Figura 11.1b. Em outras palavras, se H1 for do tipo “... uma
população é maior (ou menor) que a outra em relação a certa variável”, o teste de hipótese
será do tipo unicaudal (à direita ou à esquerda), mas, se H1 for do tipo “...uma população
é diferente da outra em relação a certa variável”, o teste será do tipo bicaudal. Definido um
valor a para o nível de confiabilidade, no teste unicaudal, a região de rejeição compreende

Figura 11.1a  Região de rejeição de um teste unicaudal para distribuição normal padronizada ao nível
de significância de .

Neste caso, há duas regiões de rejeição:


Z c < − Zα ou Z c > + Zα
294 Pesquisa de Marketing

Figura 11.1b  Região de rejeição de um teste bicaudal para distribuição normal padronizada ao nível
de significância de .

Neste caso, a região de rejeição será:


Z c < − Z (α /2) e Z c > + Z (α /2)

o total de a (à direita ou à esquerda) e, no teste bicaudal, haverá duas regiões de rejeição,


sendo a/2 à direita e a/2 à esquerda.
A determinação no gráfico da região de rejeição de H0 é feita pela procura, em tabelas pa-
dronizadas da distribuição amostral da prova, correspondente para a hipótese H0 e o nível de
significância a ou a/2 (se unicaudal ou bicaudal), do valor da ordenada. Os valores maiores ou
iguais ao valor da ordenada, que limita no gráfico a probabilidade a (ou a/2) correspondem
à região de rejeição de H0.
Como exemplos, na Tabela 11.6 são apresentados, para dois diferentes valores de a(0,05 e 0,10)
os valores críticos de z que determinam as regiões de rejeição de H0 em testes unicaudais e bicaudais:

Valores críticos de z
a Teste unicaudal Teste bicaudal
0,05 (5%) −1,65 ou 1,65 −1,96 e 1,96
0,10 (10%) −1,28 ou 1,28 −1,65 e 1,65
Obs.: Veja os níveis de significância de a e os valores associados de z em testes unicaudal e bicaudal na Tabela 3b do Apêndice
– Tabelas estatísticas selecionadas, no final do livro.

Calcular o valor da prova estatística – A partir dos dados da amostra pesquisada e das
formulações aplicáveis à distribuição amostral determinada ou assumida, calcular o valor da
prova estatística. Esse valor é também denominado de valor calculado e, dependendo do teste,
apresenta-se em forma de probabilidade (p-value) ou em forma de ordenada.
Decidir quanto à rejeição ou não da hipótese nula (H0) – Antes do avanço e da
popularização da informática e dos programas de análises estatísticas, recorria-se à comparação
do valor calculado com um valor tabelado (valor expresso em uma tabela) para se decidir pela
rejeição ou não de H0. Com testes efetuados de forma eletrônica, o procedimento adotado
para decidir pela aceitação ou rejeição de H0 é o de comparar o p-value com o nível de signi-
ficância a definido quando do planejamento para a realização do teste. O p-value é um valor
que expressa exatamente o nível de significância que corresponde ao valor calculado para H0.
Métodos de Análise de Dados e Inferência Estatística 295

Dessa forma:
1. Para valores expressos em números relativos ou percentagens:
• Se a probabilidade calculada (p-value) for menor ou igual ao nível de significância a,
rejeita-se H0 em prol de H1.
• Se a probabilidade calculada (p-value) for maior que o nível de significância a, aceita-se H0.
2. Para valores apresentados em ordenadas:
• Se o valor calculado para o teste for maior ou igual ao valor tabelado, H0 é rejeitada
em prol de H1, ao nível de confiança a.
• Se o valor calculado for menor que o valor tabelado, H0 é aceita, significando que a
hipótese da pesquisa H1 não ocorre, ao nível de confiança a.
RESUMO
As medidas de posição servem para caracterizar o que é “típico” no grupo e compreendem: as
medidas de tendência central (moda, mediana e média) e as separatrizes (quartis, decis e percentis).
Moda é o valor ou categoria da variável que ocorre com a maior frequência.
Mediana é o valor da variável que divide o grupo em dois subgrupos de igual tamanho;
é o valor da variável correspondente ao elemento central da distribuição.
Os quartis são os valores da variável correspondentes aos três elementos que dividem o
grupo em quatro subgrupos de tamanhos iguais.
Média é o valor médio de um conjunto de dados.
As medidas de tendência central informam a respeito do ponto de concentração da maioria
das respostas.
A distribuição de frequência absoluta é resultante da contagem das ocorrências de res-
postas por opção possível da variável; a relativa resulta da divisão da frequência absoluta de
cada opção pelo total de elementos da amostra.
Ordenamento é a disposição de todos os elementos do grupo de forma crescente ou decres-
cente, segundo as avaliações efetuadas para a variável ordinal pesquisada.
A distribuição de frequência absoluta acumulada é resultante da contagem acumulativa da
ocorrência de respostas até determinado valor da variável; a relativa acumulada é resultante da
divisão da frequência absoluta acumulada pelo total de elementos da amostra.
A amplitude de uma distribuição ordenada é a diferença entre o maior e o menor valor
da variável observados.
O desvio-médio é a média aritmética das diferenças (em módulo, ou seja, despreza-se o
sinal) entre cada observação e a média das observações.
O desvio padrão é a raiz quadrada da variância, que, por sua vez, é a soma dos quadrados
das diferenças entre as observações e a média, dividida pelo número de observações.
O coeficiente de variação é obtido por meio da divisão do desvio-padrão pela média.
A inferência diz respeito a dois tipos de problemas: estimar os parâmetros de uma população
e realizar testes de hipóteses.
A classificação dos fatores para seleção da técnica inferencial compreende: o tipo(s) de escala(s)
da(s) variável(eis) pesquisada(s); o nível de conhecimento ou não dos parâmetros da população
pesquisada; o problema da pesquisa; o número de variáveis a serem analisadas em conjunto; o
número de amostras e seu grau de relacionamento; e a relação de dependência entre as variáveis.
A realização do teste de hipóteses exige procedimentos bem definidos e objetivos que
compreendem: estabelecer a hipótese nula (H0) e a hipótese alternativa (H1); selecionar o teste
296 Pesquisa de Marketing

estatístico adequado à situação; estabelecer um nível de significância (ou de confiança); deter-


minar ou assumir a distribuição amostral da prova estatística sob a hipótese nula (H0); definir a
região de rejeição da hipótese nula (H0); calcular o valor da prova estatística a partir dos dados
da(s) amostra(s), decidir quanto à rejeição ou não da hipótese nula (H0) e, consequentemente,
adotar ou não a hipótese alternativa (H1).

QUESTÕES DE REVISÃO
1. O que são medidas de posição e medidas de dispersão?
2. Por que as medidas de posição devem ser acompanhadas de medidas da dispersão?
3. O que é moda e o que mede?
4. O que é mediana e o que mede?
5. O que é quartil e o que mede?
6. O que é média e o que mede?
7. O que é desvio-médio?
8. O que mede o desvio-padrão e para que serve?
9. Em que situação o coeficiente de variação ajuda a medir a dispersão?
10. O que são métodos inferenciais?
11. Quais são os fatores para seleção da técnica inferencial?
12. No que consiste um teste de hipóteses?
13. Quais são os passos que compreendem um teste de hipóteses?
14. Como se define a hipótese nula H0? E a hipótese alternativa H1?
15. Como é definida a região de rejeição num teste unicaudal? E num teste bicaudal?

Trabalho – Parte 9
Efetue as tabulações simples e cruzadas (manual ou eletronicamente) dos dados coletados
em sua pesquisa, seguindo o plano de análises constante de seu projeto. Construa as tabelas de
frequências e calcule as medidas de posição e de dispersão que os tipos de escalas das variáveis
utilizadas permitirem.

REFERÊNCIAS
ANDREWS, Frank M. et al. A guide for selecting statistical techniques for analysing social science. Ann Arbor: Institute
for Social Research, The University of Michigan, 1974.
CHURCHILL, Jr., Gilbert A. Marketing research: methodological foundations. Insdale, Ill: Driden Press, 1979.
FERBER, Robert (Org.). Handbook of marketing research. New York: McGraw-Hill, 1975.
FERBER, Robert. Statistical techniques in market research. New York: McGraw-Hill, 1949.
HAMBURG, Morris. Statistical analysis for decision making. New York: Harcourt Brace Jovanovich, 1977.
KINNEAR,Thomas C.;TAYLOR, James R. Marketing research: an applied approach.Tokio: McGraw-Hill Kogakusha,
1979.
MORRIS, John. Nonparametric Statistics. In: FERBER, Robert (Ed.). Handbook of marketing research. New York:
McGraw-Hill, 1974, pp. 2-295 a 3-306.
PESTANA, M. H.; GAGEIRO, J. M. Análise de dados para ciências sociais. Lisboa: Sílabo, 2003.
SIEGEL, Sidney. Estatística não paramétrica (para as ciências do comportamento). São Paulo: McGraw-Hill, 1981.
______. Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill, 1956.
CAPÍTULO 12
Métodos Não Paramétricos
para Análise de Dados
Fauze Najib Mattar, Braulio Oliveira e Sérgio Luís Stirbolov Motta

A meditação humana não tem limites. Seus perigos e riscos fazem-na analisar
e esquadrinhar seu próprio deslumbramento. Poder-se-ia quase dizer que, por admirável
reação, ela fascina a própria natureza e o misterioso mundo que nos cerca retribui
a contemplação de que é objeto, fazendo dos próprios contempladores objeto
de sua contemplação.
Victor Hugo

Objetivos
• Apresentar as técnicas mais utilizadas para se analisarem dados de amostras pequenas ou provenientes
de populações com parâmetros desconhecidos.
• Apresentar técnicas não paramétricas para medir a associação e a interdependência entre variáveis

Sumário
MÉTODOS NÃO PARAMÉTRICOS DE INFERÊNCIA ESTATÍSTICA
Testes para uma amostra – variável nominal
Teste binomial
Teste qui-quadrado de uma amostra
Teste para uma amostra – variável ordinal
Teste Kolmogorov-Smirnov
Teste para duas amostras não relacionadas – variável nominal
Teste qui-quadrado para duas ou mais amostras não relacionadas
Testes para duas amostras não relacionadas – variável ordinal
Teste da mediana
Teste Mann-Whitney U
Teste Kolmogorov-Smirnov para duas amostras não relacionadas
Teste para duas amostras relacionadas – variável nominal
Teste McNemar
Teste para duas amostras relacionadas – escala ordinal
Teste Wilcoxon T
Testes para várias amostras não relacionadas – variável ordinal
Teste da mediana
Análise da variância por classificação numa só direção de Kruskal-Wallis
Testes para várias amostras relacionadas – variável nominal
Teste Cochran Q
297
298 Pesquisa de Marketing

Teste para várias amostras relacionadas – variável ordinal


Análise da variância por postos de Friedman
MÉTODOS NÃO PARAMÉTRICOS PARA MEDIR A ASSOCIAÇÃO E A INTERDEPENDÊNCIA ENTRE VARIÁVEIS
Coeficiente de contingência C
Coeficiente de correlação de postos de Spearman Rs
Coeficiente de correlação de postos de Kendall – T (TAU)
Coeficiente de concordância W de Kendall

Muitos dados usualmente levantados em pesquisas de marketing não podem ser analisados com
métodos paramétricos por não reunirem as condições exigidas para sua aplicação. Os métodos
paramétricos foram desenvolvidos para aplicação em ciências exatas, em que, normalmente, se tem
conhecimento dos parâmetros da população, o que não ocorre, em geral, em ciências humanas
e, em particular, em marketing. Outra importante condição exigida para a aplicação de métodos
paramétricos, a de que as variáveis tenham sido medidas, ao menos, em escalas intervalares, também
restringe sua aplicação em grande parte das pesquisas de marketing, onde são usadas intensamente
variáveis medidas em escalas nominais e ordinais. Por último, muitos métodos paramétricos são
poderosos apenas quando aplicados a grandes amostras, o que não ocorre com os métodos não
paramétricos. Devido à importância atribuída aos métodos não paramétricos, em função de sua
aplicabilidade a inúmeras situações de pesquisas de marketing, optou-se por, diferentemente da
totalidade dos livros sobre o assunto, apresentá-los num capítulo específico.
O número de métodos não paramétricos disponíveis é muito grande e, neste livro, res-
tringe-se à apresentação sumarizada dos mais importantes e adequados para utilização em
pesquisas de marketing.
Existem métodos não paramétricos que se prestam a aplicações específicas com variáveis
medidas em escalas ao menos ordinais e outros que podem ser aplicados, indistintamente, a
variáveis medidas em escalas intervalares, ordinais ou nominais. Portanto, a distinção entre os
tipos de escalas é fundamental para a escolha do método. As técnicas estatísticas não paramé-
tricas podem ser aplicadas a pequenas amostras e, como o nome sugere, não é necessário o
conhecimento dos parâmetros da população, tais como a média e o desvio-padrão, para sua
utilização.
Após a apresentação da teoria relacionada a cada teste, são apresentados, como ilustração,
um exemplo com cálculo manual e outro exemplo com cálculo eletrônico efetuado no
software SPSS1.

MÉTODOS NÃO PARAMÉTRICOS DE INFERÊNCIA ESTATÍSTICA


Testes para uma amostra – variável nominal
Teste binomial
A distribuição binomial é a distribuição amostral de todas as proporções observadas de ocor-
rência de sucesso em todas as amostras possíveis de tamanho n de uma população com apenas
duas opções de respostas para a variável: sucesso (ou 1); e insucesso (ou 0). O teste binomial é

1
S tatistical Package for the Social Sciences - SPSS é um software aplicativo científico que serve de apoio à tomada
de decisão e inclui: aplicação analítica, Data Mining, Text Mining e estatísticas que transformam os dados em in-
formações. Uma das utilizações mais importantes desse software é no processamento de pesquisas.
Métodos Não Paramétricos para Análise de Dados 299

utilizado em pesquisas de marketing para verificar se há diferenças entre a proporção observada


na amostra e a esperada na população, quando os resultados possíveis para a variável têm apenas
duas ocorrências ou são passíveis de classificação em duas ocorrências. Por exemplo, verificar
se há diferenças na proporção de preferência para determinado produto entre os resultados da
amostra e da população em termos de: gostar/não gostar; usar/não usar, indicar/não indicar;
aprovar/não aprovar etc.
Condições para utilização – Variáveis cujos resultados possíveis têm apenas duas
ocorrências ou são passíveis de classificação em duas ocorrências; dados em proporção de
ocorrência.
Teoria/Conceito – A prova binomial é do tipo aderência, isto é, procura-se verificar
quanto a proporção de ocorrência de um fenômeno observado numa amostra (sucesso) se ajusta
à proporção esperada (teórica ou conhecida) de sua ocorrência na população. Como se tratam
de ocorrências com apenas duas possibilidades, sendo conhecida a proporção P de ocorrência
de casos de sucessos, a proporção de ocorrência de casos de insucessos será Q = 1 − P.
O teste de hipótese binomial consiste em verificar se a proporção observada (p) de sucessos,
em uma amostra de tamanho n de uma população é maior, menor ou igual à proporção (P)
de sucessos na população, em determinado nível de significância.
Procedimento geral para o teste:
1. Determinar H0, sendo sempre a negativa da hipótese da pesquisa H1.
H1 pode ser elaborada das seguintes formas:
• Se H1 = (p ≠ P) (teste bicaudal), então H0 = (p = P).
• Se H 1 = (p > P) ou (p < P) (teste unicaudal à direita ou à esquerda), então
H0 = (p = P).
2. Estabelecer um nível de significância a.
3. Cálculo da prova e região(ões) de rejeição de H0:
• Primeiro caso: probabilidade da ocorrência dos valores observados de x:
• Cálculo da prova. Sendo n ≤ 25, a distribuição binomial aproxima-se da normal, e
o Z calculado (Zc) é obtido pela fórmula (Daniel, 1984:204):

( p − P)
Zc =
PQ / n

Em que:
Zc = Z calculado.
p = proporção de ocorrência de sucessos na amostra.
P = proporção de ocorrência de sucessos na população.
Q =  (1 − P) = proporção de ocorrência de insucessos na população.
n = tamanho da amostra.
• Região(ões) de rejeição de H0:
Zc < Zt ou Zt > Zc nos testes unicaudais à direita ou esquerda.
Zc < Zt e Zt > Zc no teste bicaudal.
• Decisão. Comparar Zc com Zt ao nível de confiabilidade de a, H0 deve ser rejeitada se:
Zc < Zt ou Zt > Zc nos testes unicaudais à direita ou esquerda.
Zc < Zt e Zt > Zc no teste bicaudal.
300 Pesquisa de Marketing

• Segundo caso: probabilidade de ocorrência dos valores observados de x e mais extremados x:


• Cálculo da prova. Neste caso, diferentemente do anterior, as opções de respostas para
a variável são mais de duas, porém foram transformadas em duas. O campo de varia-
bilidade será agora dividido em probabilidade de ocorrência até X e mais de X até n.
Para esses casos, a P( X ≤ x ) é dada pela seguinte fórmula (Daniel, 1984:408):
n
n 
P( X ≤ x ) = ∑  x  p q x n −x

X= 0
Em que:
P( X ≤ x )  = probabilidade da ocorrência dos valores observados de x ou de valores
mais extremados x.
p e q = frequências relativas de ocorrência de sucesso e de insucesso, respectivamente,
em um evento binomial (por exemplo, no lançamento de uma moeda tem-se
p = 0,5 e q = 0,5; já no lançamento de um dado, a probabilidade de ocorrência do
número 1 é p = 0,166 e de não ocorrência é q = 0,833.
x = 0, 1, 2,... n.
n = número de elementos da amostra (número de vezes que ocorre o evento
binomial).
• Região de rejeição de H0. A região de rejeição de H0 consiste de todos os valores de
P( X ≤ x ) que forem menores ou iguais a a.
• Decisão. Comparar P( X ≤ x ) com o nível de significância a; se P( X ≤ x ) ≤ α , H0 é rejeitada.
Exemplo com cálculo manual para o caso da probabilidade da ocorrência dos
valores observados de X – Uma empresa de pesquisa de audiência de TV divulgou o nível
de 20% de audiência nacional para um programa A de domingo da emissora X. A emissora
Y, com o programa B, concorrente do programa A no mesmo horário de domingo, resolveu
verificar se esse resultado também seria válido para uma grande região metropolitana do país,
por meio de uma pesquisa própria junto a 200 lares sorteados da população de forma probabilís-
tica. Obteve como resultado a audiência de 10%. Qual deve ser a conclusão da empresa Y, para
um nível de confiabilidade de 0,05?
1. H0 = não há diferença entre a proporção observada na amostra p = 0,10 e na população
P = 0,20, ou H0 = (p = P).
H1 = há diferença entre a proporção observada na amostra p = 0,10 e na população
P = 0,20 (teste bicaudal).
2. a = 0,05.
3. Cálculo da prova:
p = 0,10
P = 0,20
Q = 0,80
n = 200
( p − P)
Zc =
PQ / n
(0,10 − 0,20)
Zc =
0,20 × 0,80 / 200
Zc = −3,53
Métodos Não Paramétricos para Análise de Dados 301

4. Região de rejeição. O valor de Zt = −1,65 na prova unicaudal à esquerda para a = 0,05.


A região de rejeição será composta por todos os valores de Zc < Zt = −1,65.
5. Decisão. Como Zc = −3,53 < Zt = −1,65, H0 = (p = P) é rejeitada em prol de H1 = (p < P),
ou seja, ao nível de confiabilidade de 0,05, a audiência de 0,10 na região metropolitana
pesquisada é inferior à nacional de 0,20.
Exemplo com cálculo manual: probabilidade da ocorrência dos valores observados
de x e de valores mais extremados de x – Numa pesquisa em nível nacional, constatou-se que
determinado programa popular de TV tinha um índice de audiência de 20% ou 0,20 (portanto, dis-
tribuição da população conhecida).A empresa agora está interessada em identificar comunidades em
que esse índice seja significativamente maior ou menor do que o índice nacional. Uma das amostras
pesquisadas consistiu de 20 respondentes de uma área tipicamente de classe socioeconômica A/B.
Nesta amostra, duas pessoas (10% ou 0,10) afirmaram assistir ao programa. A empresa deseja saber
se esse resultado pode ser significativamente diferente do índice nacional.
Procedimentos para o teste:
1. H0 = não há diferença entre a proporção observada na amostra (0,10) e na população
(0,20). H1 = há diferença entre a proporção observada na amostra e na população (teste
bicaudal).
2. a = 0,05.
3. Cálculo da prova. Sob a hipótese H0, e sendo p = 0,20 e q = 0,80, a probabilidade da ocor-
rência dos valores observados de x = 2 ou de valores mais extremados de x = 2 ( P( X ≤ 2) )
pode ser obtida na Tabela 2 do Apêndice – Tabelas estatísticas selecionadas, no final do
livro, para x = 2, n = 20 e p = 0,20 que é: P( X ≤ 2)  = 0,206.
P( X ≤ 2) pode também ser calculado utilizando-se a fórmula já apresentada no desenvolvi-
mento teórico desta distribuição:
n
n 
P( X ≤ x ) = ∑  x  p q x n −x

X= 0

P( X ≤ 2) = P( X =0) + P( X =1) + P( X =2)


20 20!
P( X =0) =   (2 / 10)0 (8 / 10)20 = (0,2)0 (0,8)20 = 1 × 1 × 0,011529
 0 (20 − 0)! 0!
20 20!
P( X =1) =   (2 / 10)1(8 / 10)19 = (0,2)1(0,8)19 = 20 × 0,2 × 0,0144113
 1 (20 − 1)! 1!
20 20!
P( X = 2) =   (2 / 10)2 (8 / 10)18 = (0,2)2 (0,8)18 = 190 × 0,04 × 0,018014
 2 (20 − 2)! 2!
P( X ≤ 2) = P( X =0) + P( X =1) + P( X =2) = 0,011 + 0,057 + 0,138
P( X ≤ 2) = 0,206
4. A região de rejeição H0 corresponde a todos os valores de P( X ≤ 2) ≥ α  = 0,05.
5. Decisão. Comparando a probabilidade P( X ≤2) com a, e sendo P( X ≤2) = 0,206 > a = 0,05,
rejeita-se H0 em prol de H1 = há diferença entre a proporção observada na amostra e
na população, ao nível de significância de 0,05. Portanto, aceita-se a hipótese de que a
diferença observada no índice de audiência na amostra é significativamente diferente do
índice nacional.
302 Pesquisa de Marketing

Exemplo com cálculo no SPSS – Para não correr o risco de aprovar uma peça de
comunicação que fosse preconceituosa, um gerente de marketing resolveu testar se mulheres e
homens envolvem-se igualmente em pequenos acidentes de automóveis, pois não dispunha de
dados de pesquisas anteriores que apontassem dados a respeito. Para isso, verificou-se que, em uma
amostra de 18 motoristas que já se envolveram em acidentes, dez eram mulheres e oito homens.
Procedimentos para o teste:
1. H0 = não há diferença significativa entre a proporção observada de mulheres na amostra
e na população teórica.
Sendo p = 0,56 (mulheres) e q = 0,44 (homens) e P = Q = 0,50 (mulheres e homens).
H1 = há diferença significativa para mais entre as mulheres entre a proporção observada
na amostra e na população, ou p > Q (teste unicaudal).
2. a = 0,05.
3. Resultados do processamento.
Binomial Test
Category N Observed Prop. Test Prop. Exact Sig.
(2-tailed)
Gênero Group 1 feminino 10 ,56 ,50 ,815
Group 2 masculino 8 ,44
Total 18 1,00

4. Decisão. Sendo p = 0,41 (= 0,815 / 2 – teste unicaudal) > a = 0,05, aceita-se H0 = não há


diferença significativa entre a proporção observada de mulheres na amostra e na população
teórica, ou seja, não há diferença significativa no envolvimento de homens e mulheres em
pequenos acidentes de automóveis.
Teste qui-quadrado de uma amostra
É utilizado em pesquisas de marketing para verificar se a distribuição de frequência absoluta obser-
vada de uma variável em uma amostra é significativamente diferente da distribuição de frequência
absoluta esperada (teórica ou conhecida).A principal diferença em relação ao teste binomial é o fato
de poder testar diversas categorias de uma variável, e não apenas duas. Por exemplo, sabendo-se qual
é a distribuição da preferência dos consumidores em relação aos quatro tamanhos de embalagens
de determinado produto (portanto, a distribuição da população é conhecida), verificar se a dis-
tribuição da preferência observada numa amostra nos tamanhos de embalagem para um novo
sabor do produto a ser lançado, difere significativamente da distribuição conhecida.
Condições para utilização – Exclusivamente para variáveis nominais ou ordinais (se a
escala utilizada for intervalar, pode ser reduzida para categorias); observações independentes;
não se pode utilizar se mais de 20% das frequências absolutas forem inferiores a cinco ou
se qualquer frequência for inferior a um (nesses casos, a solução é agrupar células até que se
tenham as condições atendidas).
Teoria/Conceito – É uma prova do tipo aderência, em que se verifica quanto a dis-
tribuição observada (Oi) se ajusta à distribuição esperada (Ei). Pela comparação entre as Ois e
as Eis, se aceita ou se rejeita H0, a determinado nível de significância a.
Procedimento geral para o teste:
1. Determinar H0 como a negativa da existência de diferenças entre as distribuições de
frequências observada e esperada.
Métodos Não Paramétricos para Análise de Dados 303

2. Estabelecer um nível de significância a.


3. Cálculo da prova. Distribuir as frequências observadas Ois pelas k categorias e, sob a hipótese
H0, determinar a distribuição de frequência esperada Eis pelas k categorias.
χ 2
Calcular o valor de qui-quadrado ( c ) a partir dos Oi, segundo a fórmula:
k
(Oi − Ei )2
χ2 = ∑
i =1 Ei
Em que:
Oi = número de observações classificadas na categoria i.
Ei = número de casos na categoria i, sob H0 (distribuição teórica).
k
(Oi − Ei )2
∑ E  = somatória dos cálculos efetuados para todas as células.
i =1 i

4. Determinar a região de rejeição de H0.


Determinar o valor dos graus de liberdade (gl),
Grausde liberdade = gl = k − 1,sendo k = númerode categorias
e procurar, a seguir, no caso de cálculo manual, o valor do qui-quadrado tabelado ( χ t )
2

correspondente para a e gl (Tabela 5 do Apêndice – Tabelas estatísticas selecionadas, no


final do livro). A região de rejeição de H corresponde χ
a todos os valores de c
2
≥ χ 2
t .
20
5. Decisão. Comparar χ c com χ t ; se χ c ≥ χ t , H0 deve ser rejeitada em prol de H1.
2 2 2

Exemplo com cálculo manual – Um gerente de produto quer saber se a posição que
um produto ocupa na prateleira dos supermercados tem influência sobre a quantidade vendida,
por meio de um experimento. Um supermercado possui, geralmente, prateleiras com sete
divisões verticais, sendo a posição 1 correspondente à mais próxima do piso. Para a realização
do experimento, o gerente conseguiu que, durante um dia, todas as posições verticais da
prateleira fossem ocupadas por um produto seu. Ao final do dia, as tabulações das vendas por
posição foram as constantes da Tabela 12.1.
Tabela 12.1  Vendas por posição na prateleira de supermercado.
Posição na prateleira
1 2 3 4 5 6 7 Total
Vendas (unidades) Oi 10 11 15 25 29 19 17 126
Vendas (unidades) Ei 18 18 18 18 18 18 18 126

Com base nesses dados, o gerente quer saber se as diferenças verificadas são significativas
a ponto de poder montar, com sucesso, um plano para induzir os supermercadistas a colocar
seu produto em determinadas posições.
Procedimentos para o teste:
1. Determinação de H0: não há diferenças significativas entre as posições 4 e 5 e as demais
na prateleira. H1 = as diferenças observadas para as posições 4 e 5 são significativamente
diferentes para melhor em relação às demais posições (teste unicaudal).
2. Nível de significância a = 0,025.
3. Cálculo da prova. Distribuição de frequências esperadas sob H0. Se não houver diferenças
entre as posições, a distribuição de frequências será de 18 unidades por posição, conforme
linha Ei da Tabela 12.1.
304 Pesquisa de Marketing

χ c2  = {(10 − 18)2 + (11 − 18)2 + (15 − 18)2 + (25 − 18)2 + (29 −18)2 + 


(19 − 18)2 + (17 − 18) 2
}/18 = 16,3
4. Região de rejeição. χ t  = 14,449 para a = 0,025 e gl = 6 (= 7 − 1) (Tabela 5 do Apêndice
2

– Tabelas estatísticas selecionadas,2no final do livro). A região de rejeição de H0 corres-


pondente a todos os valores de 2 c χ ≥ χ 2
t  = 14,449.
5. Decisão. Sendo χ c  = 16,3 >  χ t  = 14,449, H0 é rejeitada em prol de H1 = as diferenças
2

observadas para as posições 4 e 5 são significativamente diferentes para melhor em relação às


demais posições. Esse resultado sugere que um trabalho promocional junto aos supermercadis-
tas deve ser efetuado para estimular a colocação do produto da empresa nas posições 4 e 5.
Exemplo com cálculo no SPSS – Para a adequação do preço de um produto, um
gerente de marketing pesquisou 45 pessoas com o perfil do público-alvo do produto e obteve
as respostas constantes da linha Oi da Tabela 12.2. Com base nesses resultados, o gerente quer
saber se o preço desse produto pode ser considerado adequado.
Procedimentos para o teste:
Tabela 12.2  Percepções do preço de um produto.
Percepção do preço
Baixo Adequado Alto Total
Oi 13 12 20 45
Ei 15 15 15 45

1. H0: não há diferenças significativas entre as considerações dos pesquisados e, portanto, o


preço pode ser considerado adequado.
H1: há diferenças significativas entre as considerações dos pesquisados e, portanto, o preço
não pode ser considerado adequado (teste bicaudal).
2. Nível de significância a = 0,05.
3. Distribuição de frequências esperadas sob H0. Se não houver diferenças entre as posições, a
distribuição de frequências será de 15 pessoas por posição, conforme a linha Ei da Tabela 12.2.
4. Resultados do teste.
Test Statistics
VAR00001
Chi-Square 2,533a
df 2
Asymp. Sig. ,282
a
0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 15,0.

5. Decisão. Como p = 2 × 0,282 = 0,564 (bicaudal) > a = 0,05, não se pode rejeitar


H0: não há diferenças significativas entre as considerações dos pesquisados e, portanto, o
preço pode ser considerado adequado.

Teste para uma amostra – variável ordinal


Teste Kolmogorov-Smirnov
Esse teste tem a mesma utilização do teste qui-quadrado de uma amostra, com a vantagem
de tirar proveito da natureza ordinal da informação. É um teste mais poderoso e não exige
frequências mínimas por célula como o qui-quadrado.
Métodos Não Paramétricos para Análise de Dados 305

Condições para utilização – Dados ordinais; disponibilidade das frequências relativas


e (ou) relativas acumuladas dos dados.
Teoria/Conceito – Analogamente ao qui-quadrado, é um teste do tipo aderência que com-
preende verificar se há diferença significativa entre as distribuições relativas acumuladas observadas
e as teóricas ou conhecidas. O ponto de desvio máximo entre essas duas distribuições corres-
ponde ao valor que deve ser comparado com o nível de significância previamente estabelecido.
Procedimento geral para o teste:
1. Determinar H0 como sendo a negativa da existência de diferenças entre as frequências
relativas acumuladas observadas e as teóricas.
2. Estabelecer um nível de significância a.
3. Cálculo da prova. Determinar as frequências relativas e relativas acumuladas das ocorrências
observadas e a frequência relativa teórica e a relativa acumulada teórica sob H0 para cada
uma das k categorias. Calcular as diferenças entre as frequências relativas acumuladas
observadas e as teóricas para cada categoria. A maior diferença (dmax) é o valor calculado
da prova. Observe que, quanto maior for o dmax, menos parecidas serão as distribuições.
4. Região de rejeição. Procurar a diferença tabelada para a e n na Tabela 8 do Apêndice –
Tabelas estatísticas selecionadas, no final do livro. A região de rejeição de H0 compreende
todos os valores maiores ou iguais à diferença tabelada dtabelado para a e n.
5. Decisão. Se dmax ≥ dtabelado, H0 é rejeitada.
Exemplo com cálculo manual – Um fabricante de cervejas testou cinco diferentes
amostras dessa bebida em relação ao atributo leveza: muito leve, leve, média, forte e muito forte.
O teste foi realizado com uma amostra representativa de 100 consumidores e os resultados
verificados estão na Tabela 12.3.
Tabela 12.3  Resultados dos testes com cinco tipos de cervejas
Frequências
Tipo de cer- Absoluta Relativa Relativa observada Relativa Relativa teórica Diferença
veja acumulada (1) teórica acumulada (2) (1) – (2)
Muito leve 40 0,40 0,40 0,20 0,20 0,20
Leve 30 0,30 0,70 0,20 0,40 0,30
Média 15 0,15 0,85 0,20 0,60 0,25
Forte 10 0,10 0,95 0,20 0,80 0,15
Muito forte 5 0,05 1,00 0,20 1,00 0,00
Totais 100 1,00 1,00

Com base nesses resultados, o fabricante deseja saber se as diferenças observadas entre os
tipos de cervejas são significativas.
Procedimentos para o teste:
1. H0 = não há diferenças significativas na preferência entre os diversos tipos de cervejas.
H1 = há diferença significativa na preferência entre os tipos de cervejas (teste bicaudal).
2. a = 0,05.
3. Cálculo da prova. Determinar as frequências relativas e relativas acumuladas das ocorrências
observadas e a frequência relativa teórica e a relativa acumulada teórica sob H0 para cada
uma das k categorias, conforme Tabela 12.3. Calcular as diferenças entre as frequências
acumuladas observadas e as teóricas para as cinco categorias. A maior diferença observada
foi 0,30, portanto, dmax = 0,30 (conforme última coluna Tabela 12.3).
306 Pesquisa de Marketing

4. Região de rejeição. Para n = 100 e a = 0,05, o valor de dtabelado = 0,136 (Tabela 8 do


Apêndice – Tabelas estatísticas selecionadas, no final do livro). A região de rejeição com-
preende todas as dmax ≥ dtabelado = 0,136.
5. Decisão. Como dmax = 0,30 > dtabelado = 0,136, H0 é rejeitada em prol de H1 = há diferença
significativa na preferência entre os tipos de cervejas ao nível de significância de 0,05.
Um uso bastante comum do teste Kolmogorov-Smirnov é para verificar se a distribuição
de uma amostra pode ser considerada proveniente de uma população com distribuição normal.
Trata-se de uma exigência para que muitas das técnicas de análise paramétricas que serão
apresentadas no próximo capítulo possam ser utilizadas.
Exemplo com cálculo no SPSS – Um gerente de marketing deseja saber se é per-
tinente o uso da análise Multivariada da Variância (Manova) aos dados da Tabela 12.4, relativa
à propensão de compra de um produto ecologicamente correto. Ele deseja saber se esses
dados podem ser considerados provenientes de uma população com distribuição normal,
uma das exigências para o uso da Manova.
Tabela 12.4  Propensão à compra de produtos ecologicamente corretos
Resposta Frequência absoluta Percentagem Percentagem acumulada
0 2 5,0 5,0
1 2 5,0 10,0
2 3 7,5 17,5
3 21 52,5 70,0
4 12 30,0 100,0
Total 40 100,0

Procedimentos para o teste:


1. H0 = os dados da amostra podem ser considerados advindos de uma distribuição normal,
ou seja, não há diferença significativa entre a distribuição pesquisada e a normal.
H1 = os dados da amostra não podem ser considerados advindos de uma distribuição
normal (teste bicaudal).
2. a = 0,05.
3. Resultados do processamento.
One-Sample Kolmogorov-Smirnov Test
VAR00001
N 40
Normal Parameters a,b
Mean 2,9750
Std. Deviation 1,02501
Most Extreme Differences Absolute ,335
Positive ,190
Negative −,335
Kolmogorov-Smirnov Z 2,117
Asymp. Sig. (2-tailed) ,000
 est distribution is Normal;
T
a

Calculated from data.


b

4. Decisão. Sendo p = 0,000 < a = 0,05, rejeita-se H0 = os dados da amostra podem ser


considerados advindos de uma distribuição normal. Assim, não é adequado o uso da
Manova para a análise dos referidos dados.
Métodos Não Paramétricos para Análise de Dados 307

Teste para duas amostras não relacionadas – variável nominal


Teste qui-quadrado para duas ou mais amostras não relacionadas2
Sua utilização em pesquisa de marketing é para verificar se as distribuições absolutas de duas ou
mais amostras não relacionadas diferem significativamente em relação a determinada variável.
Por exemplo: verificar se as classes socioeconômicas diferem significativamente no consumo
de determinado produto; se a escolha do tamanho do automóvel difere significativamente em
função do tamanho da família etc.
Condições para utilização – Dados nominais; distribuição dos dados em frequências
absolutas; amostras não relacionadas ou independentes; não utilizar se mais de 20% das
frequências absolutas forem inferiores a cinco ou se qualquer frequência for inferior a um
(nestes casos, a solução é agrupar células até ter as condições atendidas).
Teoria/Conceito – A prova qui-quadrado para duas ou mais amostras não relacionadas
é, semelhantemente à prova qui-quadrado de uma amostra, uma prova do tipo aderência, isto
é, procura-se verificar quanto a distribuição observada (Oi) se ajusta à distribuição esperada
(Ei). Pela comparação entre as Ois e as Eis, aceita-se ou se rejeita H0, a determinado nível de
significância a.
Procedimento geral para o teste:
1. Determinar H0 como sendo a negativa da existência de diferenças entre a distribuição de
frequência absoluta observada e a esperada.
2. Estabelecer um nível de significância a.
3. Calcular a prova. Distribuir as frequências absolutas observadas das r variáveis pelas j
categorias. Sob a hipótese H0, determinar a distribuição de frequência absoluta esperada
das r variáveis pelas k categorias.Verificar se não estão ocorrendo as restrições ao uso do
qui-quadrado quanto ao número mínimo de frequências por célula.
Calcular o valor de qui-quadrado χ 2
c utilizando a seguinte fórmula:
r k
(Oij − Eij )2
χ = ∑∑
2
c
i =1 j =1 Eij

Em que:
Oij = número de observações classificadas, simultaneamente, na linha i e na coluna j.
Eij = número de casos esperados, simultaneamente na linha i e na coluna j, sob H0
(distribuição teórica); o cálculo de cada Eij é obtido pela multiplicação do total de obser-
vações da linha pelo total de observações da coluna, dividido pelo total de observações.
r k

∑∑ = somatória dos cálculos efetuados para todas as r linhas e k colunas.


i =1 j =1

4. Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (gl),

Grausde liberdade = gl = (r − 1)(k − 1)


Sendo: r = número de linhas e k = número de colunas.

2
O caso de mais de duas amostras foi reunido ao de duas amostras, pois a metodologia é a mesma.
308 Pesquisa de Marketing

Procurar o valor do qui-quadrado tabelado χ t para a e gl na Tabela 5 2do Apêndice


2

χ
Tabelas estatísticas selecionadas, no final do livro. Todos os valores de c ≥ χ 2
t , para a
e gl correspondem a ordenadas da região de rejeição de H0.
5. Decisão. Se χ c ≥ χ t rejeita-se H0 em prol de H1. Se χ c < χ t aceita-se H0.
2 2 2 2

Exemplo com cálculo manual para duas amostras – O gerente de concessionárias


de uma montadora de automóveis, ao analisar o desempenho de suas 417 concessionárias em
relação, simultaneamente, a inúmeros itens, classificou-as em baixo, médio e alto desempe-
nho. A empresa mantém um intenso programa de treinamento dirigido aos proprietários e
funcionários das concessionárias. Esse mesmo gerente, ao analisar os quadros de atendimento
aos programas de treinamento, notou que um grande número de concessionárias não tem
atendido regularmente aos programas. Interessado em saber se há relação entre o atendimento
aos programas de treinamento e o desempenho das concessionárias, solicitou que as duas
informações fossem cruzadas, o que resultou na Tabela 12.5.
Tabela 12.5  Desempenho de concessionárias que atenderam ou não ao treinamento
Atendimento ao treinamento
Não Sim
Desempenho
da concessionária Oij Oij Totais
Baixo 14 7 21
Médio 21 34 55
Alto 110 231 341
Totais 145 272 417

Procedimentos para o teste:


1. H0 = não existe diferença significativa entre o desempenho das concessionárias que
atenderam aos programas de treinamento e as que não atenderam.
H1 = há diferenças significativas para melhor, no desempenho, entre as concessionárias que
atenderam aos programas de treinamento e as outras (teste unicaudal).
2. Nível de significância a = 0,02.
3. Cálculo da prova. A distribuição das frequências absolutas observadas (O ij) das r
variáveis pelas k categorias está na Tabela 12.5. Sob a hipótese H0, a determinação da
distribuição das frequências absolutas esperadas (Eij) das r variáveis pelas k categorias
acompanha o seguinte raciocínio: supondo que o nível de desempenho seja designado
pela variável A e o atendimento ao treinamento pela variável B, ter-se-ão as seguintes
possibilidades:
A1 = Baixo desempenho.
A2 = Médio desempenho.
A3 = Alto desempenho.
B1 = Não atendimento ao treinamento.
B2 = Atendimento ao treinamento.
Como as variáveis A e B são independentes, então a probabilidade de ocorrer o evento
A1 B1 (concessionárias com baixo desempenho e que não atenderam ao treinamento) é
dada pelo produto das probabilidades independentes para A1 e B1:
P (A1 B1) = P (A1) P (B1).
P (A1) = 21/417 e P (B1) = 145/417.
Métodos Não Paramétricos para Análise de Dados 309

P (A1B1) = 21/417 × 145/417 = 7,3, que corresponde à frequência absoluta esperada


da respectiva célula. E assim, sucessivamente, calculam-se todas as demais. O seguinte
procedimento facilita esses cálculos:
Eij = A multiplicaçãodo total de observações da linha pelo total
de observaçõesda coluna dividido pelo total de observações

Assim, para a mesma célula já calculada, ter-se-ia:


Ejj= 21 × 145/417 = 7,3
Efetuando-se os cálculos para todas as células, obtêm-se os dados constantes na Tabe-
la 12.6, com as frequências absolutas observadas (Oij) e as esperadas (Eij).
Tabela 12.6  Frequências absolutas observadas (Oij) e as esperadas (Eij) do desempenho de
concessionárias que atenderam ou não ao treinamento
Atendimento ao treinamento
Não Sim
Desempenho
da concessionária Oij Eij Oij Eij Totais
Baixo 14 7,3 7 13,7 21
Médio 21 19,1 34 35,9 55
Alto 110 118,6 231 222,4 341
Totais 145 145,0 272 272,0 417

o valor do χ c a partir das Oijs e das Eijs, segundo a fórmula apresentada:


2
Calcular
χ c2  = (14 − 7,3)2/7,3 + (21 − 19,1)2/19,1 + (110 − 118,6)2/118,6 + (7 − 13,7)2/13,7 +
+ (34 − 35,9)2/35,9 + (231 − 222,4)2/222,4
χ c2  = 10,67
4. Determinação da região de rejeição de H0: o valor do χ t  = 7,378, correspondente
2

a a = 0,025 e gl = 2 = [(3 − 1) (2 − 1)] (Tabela 5 do Apêndice2 – Tabelas estatísticas


selecionadas, no final do livro). Dessa forma, todos os valores do χ c maiores ou iguais ao
χ t2  = 7,378 estarão na região de rejeição de H .
5. Decisão. Como o χ c  = 10,67 >  χ t  = 7,378, para a = 0,025 e gl = 2, H0 é rejeitada em
2 2 0

prol de H1 = há diferenças significativas para melhor, no desempenho, entre as conces-


sionárias que atenderam aos programas de treinamento.
Exemplo com cálculo no SPSS para duas amostras – Para saber se é necessário
efetuar revisões na próxima campanha de comunicação com reforços adicionais nas regiões de
atuação da empresa, um gerente de marketing solicitou uma pesquisa comparando a imagem
percebida da empresa nas diversas regiões. Os dados levantados na pesquisa realizada com 489
consumidores das cinco regiões de atuação da empresa estão na Tabela 12.7.
Procedimentos para o teste:
1. H0 = não existe diferença significativa entre as regiões em relação à intensidade da imagem
percebida.
H1 = há diferenças significativas entre as regiões em relação à intensidade da imagem per-
cebida (teste bicaudal).
2. Nível de significância a = 0,05.
3. A distribuição das frequências absolutas observadas (Oij) e esperadas (Eij) das r variáveis
pelas k categorias correspondentes está na Tabela 12.7.
310 Pesquisa de Marketing

Tabela 12.7  Distribuição, por região, da intensidade da imagem percebida


Intensidade Região
da imagem Norte Sul Centro Leste Oeste
percebida Total
Alta Frequência absoluta 43 38 45 32 40 198
observada (Oij)
Frequência absoluta 40,5 44,9 39,3 36,4 36,8 198,0
esperada (Eij)
% por região (Oij) 21,7% 19,2% 22,7% 16,2% 20,2% 100,0%
% por faturamento 43,0% 34,2% 46,4% 35,6% 44,0% 40,5%
Média Frequência absoluta 32 43 40 28 36 179
observada (Oij)
Frequência absoluta 36,6 40,6 35,5 32,9 33,3 179,0
esperada (Eij)
% por região (Oij) 17,9% 24,0% 22,3% 15,6% 20,1% 100,0%
% por faturamento 32,0% 38,7% 41,2% 31,1% 39,6% 36,6%
Baixa Frequência absoluta 25 30 12 30 15 112
observada (Oij)
Frequência absoluta 22,9 25,4 22,2 20,6 20,8 112,0
esperada (Eij)
% por região (Oij) 22,3% 26,8% 10,7% 26,8% 13,4% 100,0%
% por faturamento 25,0% 27,0% 12,4% 33,3% 16,5% 22,9%
Totais Frequência absoluta 100 111 97 90 91 489
observada (Oij)
Frequência absoluta 100,0 111,0 97,0 90,0 91,0 489,0
esperada (Eij)
% por região (Oij) 20,4% 22,7% 19,8% 18,4% 18,6% 100,0%
% por faturamento 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

4. Resultados do processamento:
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 16,745 a
8 ,033
Likelihood Ratio 17,364 8 ,027
N of Valid Cases 489
a
0 cells (,0%) have expected count less than 5. The minimum expected count is 20,61.

5. Conclusão. Sendo p = 0,033 < a = 0,05 (teste bicaudal), não é possível rejeitar H0 = não


existe diferença significativa entre as regiões em relação à intensidade da imagem percebida.

Testes para duas amostras não relacionadas – variável ordinal


Teste da mediana
O teste da mediana é utilizado em pesquisas de marketing para verificar se duas amostras
aleatórias não relacionadas (independentes), medidas em escalas ordinais, são significativamente
diferentes em relação às suas medianas.
Condições para utilização – Dados ordinais; duas amostras não relacionadas (indepen-
dentes); a escala de medição precisa ser a mesma para as duas amostras; e os dados precisam
ser dicotomizados numa tabela do tipo 2 × 2.
Métodos Não Paramétricos para Análise de Dados 311

Teoria/Conceito – O teste da mediana é um teste do tipo verificação de hipótese


nula, sendo que H0 é a negação da existência de diferenças entre as duas medianas obtidas de
amostras diferentes e independentes a determinado nível de significância. São utilizados os
conceitos do qui-quadrado para duas amostras independentes.
Procedimento geral para o teste:
1. Definir H0 como não havendo diferenças entre as medianas das duas amostras.
2. Definir um nível de confiabilidade a.
3. Cálculo da prova. Calcular a grande mediana, ou seja, a mediana do conjunto das duas
amostras. Comparar cada observação do conjunto das duas amostras com a grande mediana,
classificando-as em maiores ou menores. Montar uma tabela de contingência do tipo 2 × 2,
conforme apresentado a seguir, com os resultados das comparações efetuadas:
Amostra 1 Amostra 2 Total
Acima da mediana a b a + b
Abaixo da mediana c d c + d
Total a + c b + d a + b + c + d = n

Com os dados dessa tabela, calcular o qui-quadrado χ c usando a seguinte fórmula:


2

n (| ad − bc | − n / 2)2
χ = 2
c
(a + b )(c + d )(a + c )(b + d )
4. Região de rejeição. Procurar o valor do qui-quadrado tabelado χ t (Tabela 5
2

do Apêndice – Tabelas estatísticas selecionadas, no final do livro), para a e para gl = (r − 1)


(k − 1), pois 2a tabela é do tipo 2 × 2. A região de rejeição de H0 corresponde a todos os
valores de χ c ≥ χ t .
2

5. Decisão. Comparar o χ c com o χ t . Se χ c ≥ χ t rejeita-se H0 em prol de H1. Se


2 2 2 2

χ c2 < χ t2 aceita-se H0.


Ou, se p ≥ a, não se pode rejeitar H0 e se p < a, rejeita-se H0 em prol de H1, no caso dos
dados em porcentagens.
Exemplo com cálculo manual – Uma empresa pesquisou o grau de satisfação dos
consumidores em relação a um de seus produtos. Foram pesquisadas duas amostras de 18
consumidores, uma da classe socioeconômica A/B e outra da C/D. Determinado número de
afirmações foi avaliado segundo uma escala de Likert. As somas das avaliações obtidas junto
a cada respondente estão na Tabela 12.8.
Tabela 12.8  Grau de satisfação de consumidores das classes
socioeconômicas A/B e C/D com um produto.
Classe socioeconômica
A/B C/D
22 52 69 48
42 32 76 83
17 44 30 50
71 49 54 62
58 73 38 46
41 20 28 80
56 24 77 65
55 39 63 25
36 29 51 70
312 Pesquisa de Marketing

A empresa deseja saber, com base nos dados da Tabela 12.8, se há diferenças significativas
no grau de satisfação dos consumidores das classes A/B e C/D de seu produto.
Procedimentos para o teste:
1. H0 = não há diferenças significativas no grau de satisfação em relação ao produto entre os
consumidores das classes A/B e C/D.
H1 = há diferenças significativas no grau de satisfação em relação ao produto entre os
consumidores das classes A/B e C/D (teste bicaudal).
2. a = 0,025.
3. Cálculo da prova. Cálculo da grande mediana: a Tabela 12.9 é resultante da classificação
conjunta, do maior para o menor, dos resultados das duas amostras; o sinal + aponta os
valores acima da mediana e o sinal – os abaixo. Note que a grande mediana está entre o
18° e o 19° elementos e corresponde ao valor (49 + 50)/2 = 49,5.
A partir da Tabela 12.9, montar uma tabela (12.10) de contingência do tipo 2 × 2 com
os resultados 2das comparações efetuadas com a mediana.
Calcular χ c , aplicando a fórmula apresentada na teoria da prova aos dados da
Tabela 12.10.

Tabela 12.10  Tabela de contingência do tipo 2 × 2 com dados da Tabela 12.9


Classe A/B Classe C/D Total
Acima da mediana (+) a = 6 b = 12 a + b = 18
Abaixo da mediana (−) c = 12 d = 6 c + d = 18
Totais a + c = 18 b + d = 18 a + b + c + d = 36

χ c2  = 36 (|6 × 6 – 12 × 12| – 36/2)2/18 × 18 × 18 × 18 = 16.200/5.832 =  χ c2  = 2,77


4. Região de rejeição. O χ t  = 5,024, para a = 0,025 e gl = 1 (teste bicaudal) (Tabela 5 do
2

Apêndice – Tabelas estatísticas selecionadas, no final2 do livro). Portanto, a região de rejeição


de H0 corresponde a 2todos os valores2 de χ c ≥ χ t  = 5,024.
2

5. Decisão. Como o χ c  = 2,77 <  χ t  = 5,024 não se rejeita H0 = não há diferenças sig-


nificativas no grau de satisfação em relação ao produto entre os consumidores das classes
A/B e C/D, ao nível de significância de 0,025.
Exemplo com cálculo no SPSS – Interessado em monitorar as imagens de seus dois
restaurantes, um empresário pesquisou 25 consumidores de cada um deles para descobrir se
elas são iguais ou não. A escala utilizada foi adaptada da Likert3 com quatro pontos e os dados
obtidos estão na Tabela 12.11.
Procedimentos para o teste:
1. H0 = não há diferença nas imagens dos dois restaurantes.
H1 = há diferença nas imagens dos dois restaurantes, sendo a do restaurante B melhor que
a de A (teste unicaudal).
2. Nível de significância a = 0,05.
3. Resultados do processamento:

3
 escala Likert original possui cinco categorias. Neste exemplo, optou-se por quatro categorias devido ao fato
A
de a categoria “neutra” não ser apropriada aos objetivos da pesquisa.
Métodos Não Paramétricos para Análise de Dados 313

Tabela 12.9  Resultado da classificação conjunta dos resultados das duas amostras de consumidores
Classificação Comparação com a mediana (49,5)
conjunta Classe A/B Classe C/D Classe A/B Classe C/D
1 17 –
2 20 –
3 22 –
4 24 –
5 25 –
6 28 –
7 29 –
8 30 –
9 32 –
10 36 –
11 38 –
12 39 –
13 41 –
14 42 –
15 44 –
16 46 –
17 48 –
18 49 –
19 50 +
20 51 +
21 52 +
22 54 +
23 55 +
24 56 +
25 58 +
26 62 +
27 63 +
28 65 +
29 69 +
30 70 +
31 71 +
32 73 +
33 76 +
34 77 +
35 80 +
36 83 +
Totais 760 1.015 6+ 12+
12– 6–

Test Statistics
Rest1
N 25
Median 2,00
Chi-Square 1,438
Df 3
Asymp. Sig. ,697
314 Pesquisa de Marketing

Tabela 12.11  Avaliação das imagens dos restaurantes


Entrevistado Restaurante 1 Restaurante 2
1 2 4
2 3 3
3 3 4
4 2 4
5 2 3
6 2 4
7 1 3
8 2 1
9 4 4
10 3 3
11 1 4
12 4 2
13 2 3
14 3 2
15 4 3
16 2 3
17 2 3
18 2 1
19 3 1
20 2 2
21 1 4
22 3 3
23 2 3
24 2 3
25 2 3
Totais 59 76

4. Decisão. Como p = 0,697 > a = 0,05, não se pode rejeitar H0 = não há diferença


nas imagens dos dois restaurantes.
Teste Mann-Whitney U
Este teste é utilizado em pesquisas de marketing para verificar se as posições de duas populações
são iguais quando os dados estão em escala ordinal como alternativa ao teste paramétrico t.
É também utilizado com dados em escala intervalar, para verificar se duas amostras aleatórias
não relacionadas (independentes) são significativamente diferentes em relação a determinada
variável, quando não se tem conhecimento se as condições exigidas para aplicar o teste t estão
atendidas. É um dos testes não paramétricos mais poderosos e também pode ser utilizado
como substituto mais eficaz ao teste das medianas.
Condições para utilização – Só serve para a comparação de duas amostras indepen-
dentes; escala no mínimo ordinal; escalas de medição idênticas nos dois grupos; os dados
precisam estar ordenados.
Teoria/Conceito – O teste Mann-Whitney U é do tipo verificação de hipótese nula. A
hipótese nula é de que não há diferença significativa entre as distribuições das duas amostras.
A essência do método, a determinação do valor de U, compreende verificar quantas posições
das observações ordenadas num dos grupos precedem as do outro grupo também ordenadas.
Como a distribuição de U é conhecida sob a hipótese H0, pode-se determinar a probabilidade
associada com a ocorrência sob H0 de qualquer U tão extremo como um valor observado de U.
Métodos Não Paramétricos para Análise de Dados 315

Procedimento geral para o teste:


1. Determinar H0 como não havendo diferença entre as duas amostras (ou seja, as amostras
têm a mesma distribuição).
2. Determinar um nível de confiabilidade a.
3. Cálculo da prova. Determinar os valores de n1 e n2, sendo n1 = o número de casos das ob-
servações ordenadas do grupo 1 que precedem as do grupo 2; n2 = o número de casos das
observações ordenadas do grupo 2 que precedem as do grupo l e n = n1 + n2. Classificar, em
conjunto, as pontuações obtidas pelos dois grupos, sendo 1 para a menor pontuação e, suces-
sivamente, até n para a maior pontuação. Assumir para as observações coincidentes a média
das classificações coincidentes.
Determinar o valor de U, por meio da contagem direta, ou aplicando uma das seguintes
fórmulas:
U 1 = n1n2 + n1(n1 + 1) / 2 − R1 ou U 2 = n1n2 + n2 (n2 + 1) / 2 − R 2

Em que:
n1 e n2 = números de casos em cada grupo.
R1 e R2 = soma das classificações conjuntas obtidas para cada grupo.
Calculando-se U1 ou U2, determina-se, respectivamente, U2 ou U1, pois U1 + U2 = n1 n2.
O valor de Uc será o menor valor entre U1 e U2. Quanto maior a diferença entre as duas
distribuições, menor será o valor de Uc e, inversamente, quanto mais parecidas forem, maior
será o valor de Uc.
4. Determinar a região de rejeição de H0 para o nível a. A região de rejeição de H0 na dis-
tribuição U é dada por todos os valores de U calculados Uc que forem menores ou iguais ao
valor tabelado Ut para U, ao nível de confiabilidade a (Tabelas 11 e 12 do Apêndice – Tabelas
estatísticas selecionadas, no final do livro).
5. Decisão. Comparar Uc com Ut. Se Uc ≤ Ut, rejeitar H0; se Uc > Ut, aceitar H0.
Exemplo com cálculo manual – Seja o mesmo exemplo com cálculo manual utilizado
para ilustrar o teste da mediana (Tabela 12.9).
Procedimentos para o teste:
1. H0 = não há diferenças significativas no grau de satisfação em relação ao produto entre os
consumidores das classes A/B e C/D.
H1 = há diferenças significativas no grau de satisfação em relação ao produto entre os
consumidores das classes A/B e C/D (teste bicaudal).
2. a = 0,05.
3. Cálculo da prova. Classificar conjuntamente as pontuações obtidas pelos dois grupos.Veja
as colunas Classe A/B e Classe C/D da Tabela 12.9 do exemplo anterior.
Cálculo do valor de Uc, conforme a fórmula:
n1(n1 + 1)
U 1 = n1n2 + − R1
2
n1 = 18, n2 = 18
R1 = 1 + 2 + 3 + 4 + 7 + 9 + 10 + 12 + 13 + 14 + 15 + 18 + 21 + 23 + 24 + 25 + 
31 + 32 = 264
U1 = 18 × 18 + 18 (18 + 1)/2 − 264 = 231
316 Pesquisa de Marketing

U2 = n1 n2 − 231 = 324 − 231 = 93


O valor de Uc será o menor entre U1 e U2, portanto, Uc = 93.
4. A região de rejeição de H0 compreende todos os valores de Uc que forem menores ou
iguais a Ut = 99, ao nível de confiabilidade a = 0,05 (teste bicaudal) e n1 = n2 = 18 (Tabela
12 do Apêndice – Tabelas estatísticas selecionadas, no final do livro).
5. Decisão. Comparando Uc com Ut. Como o valor de Uc = 93 < Ut = 99, H0 é rejeitada
em prol de H1 = há diferenças significativas no grau de satisfação em relação ao produto
entre os consumidores das classes A/B e C/D.
Exemplo com cálculo no SPSS – Para verificar se as expectativas em relação ao consumo
de um produto são significativamente diferentes entre homens e mulheres, uma empresa pes-
quisou 40 consumidores, sendo 17 homens e 23 mulheres.A escala utilizada para medir a expec-
tativa foi a de Likert de cinco pontos e o gênero foi rotulado por 1 = homens e 2 = mulheres.
Procedimentos para o teste:
1. H0 = não há diferenças significativas no nível de expectativa em relação ao produto entre
os consumidores homens e mulheres.
H 1 = há diferenças significativas entre os consumidores homens e mulheres (teste
bicaudal).
2. a = 0,05.
3. Processamento do teste.
Ranks
Gênero N Mean Rank Sum of Ranks
Expectativa 1,00 17 21,26 361,50
2,00 23 19,93 458,50
Total 40
Test Statisticsb
VAR00001
Mann-Whitney U 182,500
Wilcoxon W 458,500
Z −,374
Asymp. Sig. (2-tailed) ,709
Exact Sig. [2*(1-tailed Sig.)] ,725a
a
 ot corrected for ties;
N
b
Grouping Variable:VAR00002.

4. Decisão. O processamento dos dados apresentou um p-value = 0,709 > a = 0,05 (teste bicaudal),


não se pode rejeitar H0 = não há diferenças significativas no nível de expectativa em relação
ao produto entre os consumidores homens e mulheres, ao nível de significância de 0,05.
Teste Kolmogorov-Smirnov para duas amostras não relacionadas
A utilização do teste Kolmogorov-Smirnov para duas amostras não relacionadas é análoga aos
testes da mediana e de Mann-Whitney U para verificar se há diferença entre as distribuições
de duas amostras não relacionadas.
Condições para utilização – Dados ao menos ordinais; os dados precisam ser dispos-
tos na forma de distribuição de frequência relativa acumulada para cada variável; as classes
precisam estar todas em intervalos iguais para as duas variáveis; quanto maior for o número
de intervalos de classes, maior será o poder do teste.
Métodos Não Paramétricos para Análise de Dados 317

Teoria/Conceito – É semelhante ao mesmo teste para uma amostra. É também um teste


do tipo aderência, e a diferença é que agora são comparadas diretamente duas distribuições
observadas, enquanto, no de uma amostra, comparava-se a distribuição observada com a
teórica. É, portanto, um teste de hipótese, cuja H0 é que não há diferenças significativas entre
as duas distribuições observadas.
Procedimento geral para o teste:
1. Definir H0.
2. Estabelecer um nível de significância a.
3. Cálculo da prova. Tabular os dados observados em intervalos iguais e os mais numerosos
possíveis para cada uma das amostras, individualmente. Calcular as frequências acumula-
das relativas de todos os intervalos para as duas amostras. Para cada intervalo, subtrair as
frequências acumuladas relativas de uma amostra em relação à outra.
Para n ≤ 40, Kc será o numerador da maior diferença observada.
Para n > 40, a distribuição se aproxima de um qui-quadrado, e o valor Kc será dado
pelo χ c segundo a fórmula:
2

n1n2
χ c2 = 4 D 2
n1 + n2
Em que:
D = diferença máxima observada entre as duas distribuições relativas acumuladas.
n1 e n2 = número de elementos de cada amostra.
4. Estabelecer a região de rejeição.
Para n ≤ 40, Kt é conhecida e tabelada para a = 0,05 e 0,01, em testes uni e bicaudal
(Tabela 9 do Apêndice – Tabelas estatísticas selecionadas, no final deste livro).
Para n > 40, os valores de Kt a serem utilizados são os mesmos da tabela do qui-quadrado ou
os constantes da Tabela 10 do Apêndice – Tabelas estatísticas selecionadas, no final do livro.
Utilizando-se a tabela do qui-quadrado tem-se:
χ t2 com gl = 2.
A região de rejeição de H0 para a e gl = 2:
Para n ≤ 40: todos os valores de Kc ≥ Kt; e
Para n > 40: todos os valores de χ c2 ≥ χ t2
5. Decisão. Se para n ≤ 40 o Kc ≥ Kt e para n > 40 o χ c ≥ χ t , rejeita-se H0.
2 2

Exemplo com cálculo manual para amostras pequenas – Seja o mesmo exem-
plo utilizado para ilustrar o teste da mediana para verificar se há diferença significativa no
grau de satisfação dos consumidores das classes A/B e C/D, com os dados apresentados na
Tabela 12.8.
Procedimentos para o teste:
1. H0 = não há diferenças significativas no grau de satisfação em relação ao produto entre os
consumidores das classes A/B e C/D.
H1 = há diferenças significativas entre os consumidores das classes A/B e C/D (teste
bicaudal).
2. a = 0,05.
3. Cálculo da prova. A tabulação dos dados observados em intervalos iguais e o cálculo das
frequências acumuladas relativas de todos os intervalos para as duas amostras resultaram
nos dados constantes da Tabela 12.12.
318 Pesquisa de Marketing

Tabela 12.12  Retabulação em intervalos dos dados da Tabela 12.8.


Frequências relativas acumuladas
Intervalo Classe A/B (1) Classe C/D (2) Diferenças (1) - (2)
15 a 20 2/18 0/18 2/18
21 a 25 4/18 1/18 3/18
26 a 30 5/18 3/18 2/18
31 a 35 6/18 3/18 3/18
36 a 40 8/18 4/18 4/18
41 a 45 11/18 4/18 7/18
46 a 50 12/18 7/18 5/18
51 a 55 14/18 9/18 5/18
56 a 60 16/18 9/18 7/18
61 a 65 16/18 12/18 4/18
66 a 70 16/18 14/18 2/18
71 a 75 18/18 14/18 4/18
76 a 80 18/18 17/18 1/18
80 a 85 18/18 18/18 0/18

Como a diferença máxima observada na Tabela 12.12 entre as frequências relativas acu-


muladas entre as classes A/B e C/D foi de 7/18, o valor a ser adotado para Kc = 7.
4. Região de rejeição. Para n = 18 e a = 0,05 (teste bicaudal), Kt = 9 (Tabela 9 do Apêndice
- Tabelas estatísticas selecionadas, no final deste livro).
5. Decisão. Como Kc = 7 < Kt = 9, rejeita-se H0 em prol de H1 = há diferenças significativas
entre os consumidores das classes A/B e C/D, ao nível de 0,05 de significância (teste
bicaudal).
Note que se chegou a um resultado diferente do teste da mediana para os mesmos dados
mostrando que há diferenças no poder de teste entre essas duas provas.
Exemplo com cálculo no SPSS – Seja o mesmo exemplo utilizado para ilustrar o teste
da mediana para verificar se há diferença significativa em relação à avaliação das imagens dos
dois restaurantes (Tabela 12.11).
Procedimentos para o teste:
1. H0 = não existe diferença significativa nas imagens dos dois restaurantes.
H1 = há diferenças significativas nas imagens dos dois restaurantes (teste bicaudal).
2. Nível de significância a = 0,10.
3. Resultados do processamento:
Test Statisticsa
Rest1
Most Extreme Differences Absolute ,286
Positive ,286
Negative −,143
Kolmogorov-Smirnov Z ,414
Asymp. Sig. (2-tailed) ,995
Grouping Variable: Rest2.
a

4. Conclusão. Como p = 0,995 > a = 0,10 (teste bicaudal), não se pode rejeitar H0 = não


existe diferença significativa nas imagens dos dois restaurantes.
Métodos Não Paramétricos para Análise de Dados 319

Teste para duas amostras relacionadas – variável nominal


Teste McNemar
O teste McNemar é utilizado em pesquisas de marketing para analisar resultados residuais
comparativos de situações pré e pós-testes. Exemplos de aplicações: verificar se as campanhas
promocionais ou as alterações no produto ou na embalagem trouxeram resultados positivos.
Condições para utilização – Dados nominais; os resultados das medidas, antes e depois,
precisam estar apresentados em tabelas tipo 2 × 2 (variáveis bipolares); as observações devem
ser dependentes e as duas amostras relacionadas (caso de painéis); analogamente ao teste qui-
quadrado, as frequências esperadas das células precisam ser maiores do que cinco (caso isso
não ocorra, agrupar células ou usar o teste binomial, em vez do McNemar).
Teoria/Conceito – É uma variação da técnica qui-quadrado aplicada exclusivamente
a tabelas de contingência do tipo 2 × 2 com variáveis bipolares. Analogamente ao qui-qua-
drado, é uma prova do tipo aderência, comparando-se a migração da frequência das células
de interesse antes e depois do teste experimental.
Procedimento geral para o teste:
1. Definir H0 como não havendo diferenças significativas entre os resultados antes e depois
do teste (pode ser uni ou bicaudal).
2. Estabelecer um nível de confiança a.
3. Cálculo da prova. Posicionar as frequências observadas antes e depois do teste experimental
numa tabela do tipo 2 × 2 como a seguinte:
Medidas após
x y Totais
Medidas antes x A B A + B
y C D C + D
Totais A+ C B+ D A + B + C + D = n

Em que:
x e y = variáveis em estudo.
A, B, C e D = frequências absolutas das respectivas células do cruzamento de x e y, antes
e depois do teste.
Determinar as frequências esperadas nas células de interesse. Supondo que as células de
interesse sejam C e B, a frequência esperada será (C + B)/2. Verificar se o valor não é
inferior a cinco. Se for, o teste não pode ser aplicado.
Calcular o χ c para as duas células de interesse A e D, usando a fórmula:
2

(| A − D | −1)2
χ = 2
c
(A + D)

4. Definir a região de rejeição. Procurar o χ t para a e gl = 1 (Tabela 52 do Apêndice – Tabelas


2

estatísticas selecionadas, no final do livro). Todos os valores de χ c maiores ou iguais ao


valor tabelado estarão na região de rejeição de H0.
5. Decisão. Comparar χ c com χ t . Se χ c ≥ χ t , H0 é rejeitada em prol de H1.
2 2 2 2

Exemplo com cálculo manual – Uma empresa realizou, durante um mês, o teste de
uma campanha promocional de degustação no ponto de venda do seu produto Star, numa
320 Pesquisa de Marketing

loja de supermercado. Um painel de 100 consumidores desse supermercado foi selecionado


para analisar os efeitos do teste. A medição das compras mensais do produto testado e dos
demais concorrentes foi feita duas vezes: no mês antes de o teste ter início e um mês após o
seu término. Os resultados estão na Tabela 12.13.
Tabela 12.13  Medidas de compras mensais antes e após a promoção de degustação no ponto de venda
Após a promoção
Star Outros Totais
Antes Star A = 10 B = 10 A + B = 20
da promoção Outros C = 20 D = 60 C + D = 80
Totais A + C = 30 B + D = 70 A + B + C + D = 100

Com base nesses resultados, a empresa deseja saber se a promoção foi um sucesso e se deve
generalizá-la para um grande número de lojas.
Procedimentos para o teste:
1. H0 = não houve diferença significativa entre os resultados antes e depois do teste.
H1 = houve diferença significativa entre os resultados antes e depois do teste para o produto
Star (teste unicaudal).
2. Nível de confiança a = 0,05.
3. Posicionar as frequências observadas antes e depois do teste experimental numa tabela do
tipo 2 × 2 (no caso, a própria pesquisa gerou a Tabela 12.13). Determinar as frequências
esperadas nas células de interesse. Neste caso, as células de interesse são as formadas pelos
cruzamentos de outras marcas e a Star, antes e depois do teste, com as frequências res-
pectivas de 20 e 10. E = (20 + 10)/2 = 15.
O cálculo do χ c , usando a fórmula apresentada, é:
2

(|10 − 60| −1)2


χ c2 = = 34,3
(70)

4. Região de rejeição. O χ t  = 3,841 para a = 0,05 e gl = 1 (teste unicaudal) (Tabela 5 do


2

Apêndice – Tabelas estatísticas selecionadas, no final do livro). A região de rejeição com-


de χ c maiores ou iguais a χ t  = 3,841.
2 2
preende todos os valores
5. Decisão. Como o χ c  = 34,3 >  χ t  = 3,841, rejeita-se H0 em prol de H1 = houve diferença
2 2

significativa para o produto Star ao nível de confiabilidade de a = 0,05 e a campanha


promocional deverá ser realizada.
Exemplo com cálculo no SPSS – Uma empresa está interessada em apoiar um can-
didato político que tenha boas chances de vitória em uma eleição. Para tanto, encomendou
uma pesquisa para saber a influência do conhecimento do programa de governo dos dois
candidatos mais fortes, sobre a intenção de voto dos eleitores. A pesquisa definiu uma amostra
aleatória de 70 eleitores que foram pesquisados antes e depois da exposição aos programas de
governos de cada candidato, obtendo-se os resultados apresentados na Tabela 12.14.
Procedimentos para o teste:
1. H0 = não há diferenças significativas entre os resultados antes e depois da exposição.
H1 = há mudanças significativas nas intenções de voto após a exposição, sendo maior a do
candidato 2 (teste unicaudal).
Métodos Não Paramétricos para Análise de Dados 321

Tabela 12.14  Resultados da intenção de voto antes e após a exposição do programa de governo
de dois candidatos
Após a exposição
Candidato 1 Candidato 2 Totais
Antes da exposição Candidato 1 12 19 31
Candidato 2 23 16 39
Totais 35 35 70

2. Nível de confiança a = 0,05.


3. Processamento do teste.
Antes e depois
Antes Depois
1,00 2,00
1,00 12 19
2,00 23 16
Test Statisticsb
Antes e depois
N 70
Chi-Square a
,214
Asymp.Sig. ,643
Continuity Corrected;
McNemar Test.

4. Decisão. Como p = 0,643 > a = 0,05 (teste unicaudal), não se pode rejeitar H0 = não há


diferenças significativas entre os resultados antes e depois da exposição. Assim, a empresa
pode apoiar qualquer um dos dois candidatos, já que não houve diferença significativa ao
nível de confiança de 0,05 entre os resultados antes e depois da exposição aos programas
de governo de cada um.

Teste para duas amostras relacionadas – escala ordinal


Teste Wilcoxon T
O teste Wilcoxon T deve ser utilizado em pesquisas de marketing como opção ao teste
Mann-Whitney quando as amostras estiverem relacionadas. É aplicado para situações de pré
e pós-teste, para verificar se houve mudança significativa entre as medições pareadas antes e
depois. Aplica-se a dados que estejam medidos, ao menos, em escalas ordinais e quando não se
tem conhecimento se as condições exigidas para aplicar testes paramétricos estejam presentes.
Condições para utilização – Dados ao menos ordinais; amostras relacionadas; medições
em momentos diferentes com a mesma escala; medições pareadas.
Teoria/Conceito – É um teste do tipo hipótese nula, em que H0 é a negação da existência de
diferenças entre as medições antes e depois, na mesma amostra de determinada variável. Consiste,
basicamente, em ordenar e atribuir posições, do menor valor para o maior, conjuntamente para as
duas amostras, de todas as diferenças algébricas entre as observações pareadas. Em seguida, somam-se,
para cada conjunto de observações, os valores das posições obtidas. A menor das duas somas será
322 Pesquisa de Marketing

o valor calculado (Tc) de T. Os pares em que a diferença for zero devem ser excluídos. Quando a
diferença entre dois ou mais pares for a mesma, a classificação para cada par também será a mesma e
corresponderá à média das posições que as duas ou mais diferenças ocupariam; a próxima diferença
terá a mesma posição correspondente caso as anteriores não hajam coincidido. Se dois pares tiverem
a diferença de 1, cada par será classificado como 1,5, e a próxima diferença será classificada como 3.
Procedimento geral para o teste:
1. Estabelecer H0 como não havendo diferença significativa entre os dois conjuntos de
observações.
2. Estabelecer um nível de significância a para a realização do teste.
3. Cálculo da prova.
Para n > 25, a distribuição amostral de T em H0 é a mesma de z na distribuição normal
padronizada, sendo T normalmente distribuído com média igual a n (n + 1)/4 e des-
vio-padrão igual a [n (n + 1) (2n + 1)]/24.
Para n > 25 os valores tabelados de z (Zt) e a estão na Tabela 3 do Apêndice – Tabelas
estatísticas selecionadas, no final deste livro.
Para n ≤ 25, os valores tabelados de T (Tt) e a estão na Tabela 7 do Apêndice – Tabelas
estatísticas selecionadas, no final deste livro.
Para cada par de observações, calcular a diferença algébrica e eliminar as diferenças iguais a
zero. Ordenar as diferenças obtidas nos dois conjuntos simultaneamente, desprezando-se o
sinal algébrico. Somar, separadamente, as classificações correspondentes às diferenças negativas
e positivas. O menor valor entre as duas somas será o valor de Tc (T calculado) ao nível de a.
4. Determinar a região de rejeição. A região de rejeição de H0 correspondente a todos os
valores de Tc ≥ Tt (para n ≤ 25) ou Zt (para n > 25).
5. Decisão. Comparar Tc com Tt (para n ≤ 25) ou Zt (para n > 25); se Tc ≥ Tt ou Zt, H0 é rejeitada.
Exemplo com cálculo manual – Uma empresa realizou uma pesquisa junto a 18
consumidores de seu produto para avaliar uma possível mudança na embalagem. Uma série
de afirmações foi apresentada a esses consumidores, antes e depois de terem recebido amostras
do produto com a nova embalagem, para serem avaliadas segundo uma escala de Likert. Os
resultados das duas avaliações estão na Tabela 12.15, nas colunas (1) e (2).
Com base nesses dados, a empresa deseja saber se deve introduzir a nova embalagem do
produto no mercado.
Procedimentos para o teste:
1. H0 = não há diferença significativa na avaliação dos consumidores antes e depois da nova
embalagem.
H1 = há diferença significativa favorável na avaliação dos consumidores antes e depois da
nova embalagem (teste unicaudal).
2. Nível de significância a = 0,025.
3. Cálculo da prova. Para cada par de observações, foi calculada a diferença algébrica (coluna
d da Tabela 12.15). Foram ordenadas as diferenças obtidas nos dois conjuntos simulta-
neamente, desprezando o sinal algébrico (coluna geral da Tabela 12.15). Somaram-se,
separadamente, as classificações negativas e positivas, e o menor valor encontrado entre as
duas somas foi 40,5, portanto Tc = 40,5.
4. Região de rejeição. Como n ≤ 25 o valor Tt = 40 para a = 0,025 e n = 18 (teste unicaudal),
a região de rejeição corresponde a todos os valores de Tc ≥ 40 (Tabela 7 do Apêndice –
Tabelas estatísticas selecionadas, no final deste livro).
Métodos Não Paramétricos para Análise de Dados 323

Tabela 12.15  Avaliação do produto antes e depois da nova embalagem


Avaliação Diferença (d) Classificação
Par Antes (1) Depois (2) (2) – (1) Geral d+ d−
1 22 33 11 18 18
2 42 48 6 13 13
3 17 25 8 16 16
4 71 66 −5 10,5 10,5
5 60 58 −2 2,5 2,5
6 41 47 6 13 13
7 56 59 3 5 5
8 36 40 4 8 8
9 55 58 3 5 5
10 32 39 7 15 15
11 44 48 4 8 8
12 49 50 1 1 1
13 73 64 −9 17 17
14 20 25 5 10,5 10,5
15 24 30 6 13 13
16 52 50 −2 2,5 2,5
17 29 32 3 5 5
18 39 35 −4 8 8
Totais 130,5 40,5

5. Decisão. Comparando Tc com Tt, verifica-se que Tc = 40,5 > Tt = 40, rejeita-se H0 em prol


de H1 = há diferença significativa favorável na avaliação dos consumidores antes e depois
da nova embalagem, ao nível de significância de 0,025, indicando que a nova embalagem
deve ser adotada.
Exemplo com cálculo no SPSS – Uma empresa pesquisou 23 pessoas pertencentes ao
público-alvo de um produto seu, com o objetivo de verificar qual de duas peças de propaganda
(filmes para TV) seria mais impactante na indução à compra. Os pesquisados responderam a
diversas afirmações em uma escala Likert de seis pontos, após terem sido expostos a cada um dos
filmes, cujos resultados estão na Tabela 12.16.
Tabela 12.16  Resultados da avaliação de dois filmes de propaganda para TV
Pesquisado Filme 1 Filme 2 Pesquisado Filme 1 Filme 2
1 2 1 13 2 2
2 1 1 14 1 1
3 2 2 15 2 2
4 3 2 16 6 6
5 5 4 17 3 3
6 3 6 18 3 2
7 4 2 19 3 1
8 4 3 20 2 3
9 5 5 21 3 1
10 3 2 22 4 3
11 3 4 23 6 3
12 3 3 - - -
324 Pesquisa de Marketing

Procedimentos para o teste:


1. H0 = não há diferença significativa na avaliação dos dois filmes.
H1 = há diferença significativa para melhor para o segundo filme (teste unicaudal).
2. Nível de significância a = 0,05.
3. Processamento do teste.

Descriptive Statistics
N Mean Std. Deviation Minimum Maximum
Filme 1 23 3,17 1,37 1 6
Filme 2 23 2,70 1,49 1 6
Ranks
N Mean Rank Sum of Ranks
Filme 2 - Negative Ranks 11a 7,41 81,50
Filme 1 Positive Ranks 3b 7,83 23,50
Ties 9c
Total 23
Filme 2  < Filme 1;
a
b
Filme 2  > Filme 1;
c
Filme 2 = Filme 1.

Test Statisticsb
Filme 2 - Filme 1
Z −1,879a
Asymp. Sig. (2-tailed) ,060
 ased on negative ranks;
B
a

Wilcoxon Signed Ranks Test.


b

4. Decisão. Sendo p = 0,06/2 = 0,03 < a = 0,05 (teste unicaudal), rejeita-se H0 = não há


diferença significativa na avaliação dos dois filmes, ao nível de significância de 0,05, portanto
é recomendada a adoção do segundo filme.

Testes para várias amostras não relacionadas – variável ordinal


Teste da mediana
A utilização do teste da mediana para várias amostras não relacionadas é a mesma do teste da
mediana para duas amostras.
Condições para utilização – Dados ordinais; várias amostras não relacionadas; as es-
calas de medição precisam ser as mesmas para as várias amostras; dados dispostos em tabela
do tipo k × 2.
Teoria/Conceito – O teste da mediana é do tipo verificação de hipótese nula, sendo
que H0 é a negação da existência de diferenças entre as várias medianas obtidas de amostras
diferentes e independentes, em determinado nível de significância. São utilizados os conceitos
do qui-quadrado aplicados a duas ou mais amostras independentes. A realização do teste com-
preende a comparação da distribuição resultante da comparação e da classificação de cada
observação com a grande mediana, com sua distribuição teórica.
Métodos Não Paramétricos para Análise de Dados 325

Procedimento geral para o teste:


1. Definir H0 como não havendo diferenças entre as medianas das várias amostras.
2. Definir um nível de confiabilidade a para a realização do teste.
3. Cálculo da prova. Calcular a grande mediana, ou seja, a mediana do conjunto das várias
amostras. Comparar cada observação do conjunto das várias amostras com a grande
mediana, classificando-as em maiores ou menores. Montar uma tabela de contingência
do tipo (k × 2), com os resultados dessas comparações.
Calcular o χ c aplicando a seguinte fórmula aos dados obtidos na tabela de contingência
2

(k x 2)
r k
(Oij − Eij )2
χ = ∑∑
2
c
i =1 j =1 Eij
Em que:
Oij = número de observações acima e abaixo da grande mediana, na coluna j-ésima.
Eij = número de observações esperadas acima e abaixo da grande mediana, na coluna
j-ésima, sob H0, calculadas segundo o método apresentado no teste qui-quadrado para
duas ou mais amostras.
r k

∑∑ = somatório dos cálculos efetuados para todas as células, segundoa fórmula


i =1 j =1 anterior.

4. Definir a região de rejeição. Procurar o valor de χ t para a e gl = (r − 1) (k − 1) = k − 1,


2

pois a tabela é do tipo k × 2 (Tabela 5 do Apêndice – Tabelas estatísticas selecionadas,


no2 final do livro). A região de rejeição de H0 será a correspondente a todos os valores de
χ c ≥ χ t2 para a e gl= k − 1.
5. Decisão. Comparar o χ c com χ t , se χ c ≥ χ t , para a e gl= k − 1, rejeitar H0.
2 2 2 2

Deixou-se de apresentar um exemplo com cálculo manual e com cálculo no SPSS do


teste da mediana para várias amostras não relacionadas devido à semelhança de sua resolução
aos já apresentados anteriormente no teste da mediana para duas amostras.

Análise da variância por classificação numa só direção de Kruskal-Wallis


A utilização em pesquisas de marketing da análise da variância de Kruskal-Wallis
é a mesma do teste Mann-Whitney U para situações em que amostras de mais de duas variáveis
independentes estejam sendo comparadas. É a contrapartida não paramétrica da análise da
variância num só sentido, cuja utilização exige que as distribuições das populações sejam
normais e com variâncias homogêneas.
Condições para utilização – Serve para a comparação de três ou mais variáveis in-
dependentes; medições ao menos em escalas ordinais; escalas de medição idênticas nos diversos
grupos; os dados precisam ser ordenados.
Teoria/Conceito – A conceituação do teste também é idêntica ao teste de Mann-Whit-
ney. O procedimento para o teste compreende a combinação dos escores das n amostras
num único rol ordenado do maior para o menor escore, numerados, respectivamente,
de 1 a n. A seguir, todas as classificações obtidas para os escores de cada amostra são
somadas. Quanto mais semelhantes forem essas somas, mais semelhantes serão as amostras
326 Pesquisa de Marketing

e, consequentemente, as populações de onde foram extraídas. Analogamente, quanto mais


diferentes forem, mais diferentes serão as amostras e a população de onde foram extraídas.
O teste Kruskal-Wallis determina se as somas dos escores são tão diferentes que as amos-
tras e as populações de onde foram extraídas não são idênticas, em determinado nível de
confiabilidade.
Procedimento geral para o teste:
1. Definir H0 como não havendo diferenças entre os escores das n amostras consideradas.
2. Definir um nível de confiabilidade a para a realização do teste.
3. Cálculo da prova. Para amostras com tamanho n > 5, sob H0, o H calculado Hc, é dado
pela seguinte fórmula, cuja distribuição é a mesma de χ t com gl = k − 1:
2

12  k R j 
2

Hc = ∑  − 3(n + 1)
n(n + 1)  j =1 n j 

Em que:
Hc = H calculado.
k = número de amostras.
nj = número de casos na j-ésima coluna.
n = número de casos na combinação de todas as amostras.
Rj = soma das classificações na j-ésima amostra.
k
R 2j
∑n  = soma de todos os quadrados de Rj divididos por nj.
j =1 j

4. Região de rejeição. Corresponde a todos os valores de Hc que forem maiores ou iguais ao


χ t2 para a e gl = k − 1 (Tabela 5 do Apêndice – Tabelas estatísticas selecionadas, no final
deste livro).
5. Decisão. Comparar Hc com χ t , se H c ≥ χ t , para a e gl = k − 1, rejeitar H0 em prol de H1.
2 2

Exemplo com cálculo manual – Para verificar a necessidade de reformulação em três


de suas lojas, uma cadeia de supermercados encomendou uma pesquisa para avaliar o grau de
satisfação dos consumidores de cada uma das lojas. A escala utilizada pela empresa/ instituto
de pesquisa foi a do tipo Likert, composta por uma série de afirmações às quais os consumi-
dores apontaram o seu grau de concordância. De cada uma das três lojas, foram selecionados,
aleatoriamente, nove consumidores. Os resultados tabulados das avaliações efetuadas estão na
Tabela 12.17.
Procedimentos para o teste:
1. H0 = não há diferenças significativas na satisfação dos consumidores em relação às três
lojas consideradas.
H1: há diferenças significativas na satisfação dos consumidores das três lojas, sendo a loja
C melhor avaliada, seguida da loja A (teste unicaudal).
2. a = 0,05.
3. Cálculo da prova.

12  k R j 
2

Hc = ∑  − 3(n + 1)
n(n + 1)  j =1 n j 
Métodos Não Paramétricos para Análise de Dados 327

Tabela 12.17  Avaliação de lojas por consumidores.


Avaliações Ordenação conjunta
A B C A B C
78 113 72 21 7 24
120 90 93 5 17 15
106 99 80 10 13 20
77 100 69 22 12 25
87 123 97 18 3 14
86 92 76 19 16 23
111 121 62 8 4 27
128 104 67 2 11 26
110 132 116 9 1 6
Totais 114 84 180

Tem-se:
12  114 2 84 2 180 2 
Hc =  + +  − 3(27 + 1)
27(27 + 1)  9 9 9 
12  12.946 + 7.056 + 32.400 
Hc =   − 84
756  9 
Hc = 8,51
4. Região de rejeição. O χ t , = 5,991 para a = 0,05 e gl = 2 (teste unicaudal) (Tabela 5 do
2

Apêndice – Tabelas estatísticas selecionadas, no final deste livro). A região de rejeição de


de H c ≥ χ t , = 5,991.
2
H0 é compreendida por todos os valores
5. Decisão. Comparando Hc com χ t . Como Hc = 8,51 ≥ χ t , = 5,991, para a = 0,05,
2 2

rejeita-se H0 em prol de H1: há diferenças significativas na satisfação dos consumidores das


três lojas, sendo a loja C melhor avaliada, seguida da loja A.
Exemplo com cálculo no SPSS – Para verificar a adequação do canal de distribuição ao
padrão de local de compra do público-alvo objetivando otimizar a distribuição, um fabricante
de produtos alimentícios pesquisou 48 consumidores nos quatro canais de varejo em que atua.
Com base em um questionário, os consumidores foram classificados de acordo com o grau
de julgamento da adequação do local de compra a seu padrão, sendo 1 = muito adequado,
2 = adequado e 3 = inadequado, cujos resultados estão na Tabela 12.18.
Tabela 12.18  Nível de adequação do local de compra
Nível de adequação Respondentes
1 19
2 14
3 15
Total 48
Procedimentos para o teste:
1. H0 = não há diferenças significativas na adequação do local de compra, de acordo com o
consumidor.
H1: há diferenças significativas na adequação do local de compra, de acordo com o con-
sumidor, sendo a resposta 1 – muito adequado, maior que as demais (teste unicaudal).
328 Pesquisa de Marketing

2. a = 0,05
3. Processamento do teste.
Adequação N Mean Rank
Canal 1 19 20,87
2 14 28,07
3 15 25,77
Total 48

Test Statisticsa,b
Canal
Chi-Square 2,339
df 2
Asymp. Sig. ,311
 ruskal Wallis Test;
K
a

Grouping Variable: Adequação


b

4. Decisão: como p = 0,311 > a = 0,05 (teste unicaudal), não se pode rejeitar H0 = não há


diferenças significativas na adequação do local de compra, de acordo com o consumidor.

Testes para várias amostras relacionadas – variável nominal


Teste Cochran Q
O teste Cochran Q é uma extensão do teste McNemar para os casos em que houver mais de
duas amostras relacionadas. É utilizado em pesquisas de marketing para analisar os resultados
de situações pré e pós-testes para mais de duas amostras relacionadas. Permite, por exemplo,
avaliar se as mudanças que vêm ocorrendo com as opiniões de uma amostra de consumidores
de um produto, ao longo de vários períodos de observações, são significativas ou não.
Condições para utilização – Dados nominais ou dicotômicos, em escala ordinal ou
intervalar; os resultados das medidas antes e depois precisam estar apresentados em tabelas
tipo k × n; as várias observações de um mesmo elemento precisam ser casadas; as observações
devem ser dependentes, e as várias amostras, relacionadas (caso de painéis).
Teoria/Conceito – É uma prova do tipo teste de hipótese que permite verificar se mais
de dois conjuntos pareados (casados) de frequências ou proporções diferem significativamente
entre si.
Procedimento geral para o teste:
1. Estabelecer H0 como a negação da existência de diferenças entre os conjuntos de obser-
vações.
2. Estabelecer um nível de confiabilidade a.
3. Cálculo da prova. Transformar os dados observados em variáveis dicotômicas, ou seja,
comparando os dados observados após o teste com o(s) observado(s) antes do teste, clas-
sificando-os em sucesso (1) ou insucesso (0) segundo um padrão. Construir uma tabela
de frequências k × n para esses resultados, somando o conjunto dos resultados da trans-
formação para cada elemento (Li), elevando cada Li ao quadrado e somando na vertical os
2
Lis e os L i s.
Aplicar a seguinte fórmula aos dados da tabela construída para o cálculo da prova Q (Qc),
cuja distribuição é aproximadamente igual a de χ com gl = k − 1:
2
Métodos Não Paramétricos para Análise de Dados 329

 k k  
2

(k − 1)K ∑G j − ∑G j  
2

 j =1  j =1  

Qc = n n
k∑ L i − ∑ L2i
i =1 i =1
Em que:
Qc = Q calculado.
Gj = número de sucessos na j-ésima coluna.
Li = número de sucessos na i-ésima linha.
k = número de colunas.
n = número de casos.
4. Região de rejeição. A região de rejeição é determinada pelo χ t ao nível a e gl = k − 1
2

(Tabela 5 do Apêndice – Tabelas estatísticas selecionadas, no final deste livro). Todos os


valores Qc ≥ χ t estarão na região de rejeição de H0.
2

5. Decisão. Comparando Qc com χ t , se Qc ≥ χ t , rejeita-se H0.


2 2

Exemplo com cálculo manual – Uma empresa de bebidas alcoólicas está interessada
em saber se uma campanha promocional a ser dirigida aos seus distribuidores teria sucesso.
Para tanto, testou-a junto a uma amostra aleatória de 18 distribuidores. As compras efetuadas
por cada distribuidor, nas três semanas seguintes à exposição à campanha promocional, foram
comparadas com a média das compras das três semanas anteriores ao seu início. O resultado
foi considerado sucesso (1) quando as compras de cada distribuidor, a cada semana posterior
à exposição, superaram, ao menos, 10% da média de compras das três semanas anteriores
à exposição desse mesmo distribuidor; caso contrário, foi considerado insucesso (0), cujos
resultados estão na Tabela 12.19.
Procedimentos para o teste:
1. H0 = não há diferença nos resultados observados antes e após a exposição à campanha
promocional.
H1 = há diferença para melhor entre os resultados observados antes e após a exposição à
campanha promocional (teste unicaudal).
2. a = 0,05.
3. Cálculo da prova. A classificação dos resultados em sucesso (1) ou insucesso (0) está nas
três primeiras colunas da Tabela 12.19. O valor de:
n n

∑L i = 30 e de ∑ L2i = 68
i =1 i =1

Aplicando a fórmula de cálculo de Qc aos dados da Tabela 12.19, ter-se-á:

(3 − 1)3(112 + 10 2 + 9 2 ) − (11 + 10 + 9)2  12


Qc = =
3 × 30 − 68 22
Qc = 0,545
4. Região de rejeição. Para a = 0,05 e gl = 2 o χ t  = 5,991 (teste unicaudal) (Tabela 5 do
2

Apêndice – Tabelas estatísticas selecionadas, no final deste livro). A região de rejeição com-
χ 2
preende todos os valores de Qc ≥ t  = 5,991.
330 Pesquisa de Marketing

Tabela 12.19  Compras dos distribuidores classificadas em sucesso (1) e insucesso (0)
Distribuidor 1ª semana 2ª semana 3ª semana Li L2i
1 0 0 0 0 0
2 1 1 1 3 9
3 1 1 1 3 9
4 1 1 0 2 4
5 1 1 0 2 4
6 1 1 0 2 4
7 0 0 0 0 0
8 0 1 0 1 1
9 1 1 1 3 9
10 1 0 1 2 4
11 0 1 1 2 4
12 0 0 1 1 1
13 1 0 1 2 4
14 1 1 0 2 4
15 0 0 1 1 1
16 1 0 0 1 1
17 1 1 1 3 9
18 0 0 0 0 0
Totais de sucesso G1 = 11 G2 = 10 G3 = 9 ∑L i  = 30 ∑L2i  = 68
Totais de insucesso 7 8 9 24

5. Decisão. Como Qc = 0,545 <  χ t  = 5,991, não se rejeita H1 = há diferença para melhor
2

entre os resultados observados antes e após a exposição à campanha promocional, ao nível


de significância de 0,05.
Exemplo com cálculo no SPSS – A direção de um hospital deseja saber qual das
formas de comunicação da programação de plantões de seus profissionais apresenta melhor
adesão. Foram testadas quatro diferentes formas de comunicação: pela intranet, pela internet,
por relatório físico e oralmente. Cada forma de comunicação foi adotada durante um mês,
sequencialmente, e, após quatro meses, foi realizada uma pesquisa sobre a aprovação/desa-
provação de cada forma de comunicação, sendo (1) para aprovada e (0) para desaprovada.
Foram envolvidos no teste 12 profissionais do hospital e os resultados estão na Tabela 12.20.
Procedimentos para o teste:
1. H0 = não há diferença nos resultados observados após a exposição às quatro formas de
comunicação.
H1 = há diferença significativa para a forma oral entre os resultados observados antes e
após a exposição às formas de comunicação (teste unicaudal).
2. a = 0,05.
3. Processamento do teste.
Test Statistics
N 398
Cochran's Q 39,184a
df 3
Asymp. Sig. ,000
Métodos Não Paramétricos para Análise de Dados 331

Tabela 12.20  Aprovação/desaprovação dos profissionais em relação às formas de comunicação pesquisadas


2° mês 3° mês (Relatório
Profissional 1° mês (Intranet) (Internet) físico) 4° mês (Oral)
1 1 1 0 1
2 1 0 0 1
3 0 1 0 1
4 0 0 1 1
5 0 1 1 1
6 0 0 1 1
7 1 0 0 0
8 1 0 1 0
9 1 1 0 0
10 1 1 1 1
11 0 1 0 1
12 0 0 1 0
Totais de aprovado 6 6 6 8
Totais de reprovado 6 6 6 4

4. Decisão. Sendo p = 0,000 < a = 0,05, rejeita-se H0 em favor de H1 = há diferença


significativa para a forma oral entre os resultados observados antes e após a exposição às
formas de comunicação.

Teste para várias amostras relacionadas – variável ordinal


Análise da variância por postos de Friedman
A utilização dessa análise é uma extensão do teste Wilcoxon para situações que envolvam mais
de dois conjuntos de amostras relacionadas. Trata-se de um ótimo método para comparar e
verificar a similaridade de dados ordenados de amostras diferentes de uma mesma população
ou de uma mesma amostra em momentos diferentes. É aplicada a dados ao menos ordinais
e quando não se tem conhecimento se as condições exigidas para aplicar testes paramétricos
estejam presentes.
Condições para utilização – Dados ao menos ordinais; amostras relacionadas; me-
dições em momentos diferentes de uma mesma amostra ou várias medições de amostras
diferentes de uma mesma população; medições efetuadas com a mesma escala; medições
pareadas.
Teoria/Conceito – Para a aplicação da análise da variância por postos de Friedman, os
dados precisam ser dispostos em uma tabela do tipo n × k, de dupla entrada, com n linhas
(cada linha representando um conjunto de medições) e k colunas (cada coluna representando
uma condição diferente da medição). A seguir, devem ser ordenados de 1 a k, separadamente,
os escores de cada linha. O teste indicará se as diversas medições (das mesmas amostras em
diferentes momentos) são, significativamente, diferentes.
Procedimento geral para o teste:
1. Estabelecer H0 como a negação de que existe diferença entre os conjuntos de observações.
2. Estabelecer um nível de confiabilidade a.
3. Cálculo da prova. Colocar os resultados das observações numa tabela de k colunas (número
de avaliações) e n linhas (número de elementos avaliados). Ordenar os resultados de cada
332 Pesquisa de Marketing

linha, atribuindo posições de 1 a k. Efetuar a soma das classificações de cada uma das k
colunas. Calcular o valor de χ j utilizando a seguinte fórmula:
2

k 
12 ∑ ( R 2j )
 i 
χ 2j = − 3n(k + 1)
nk(k + 1)
Em que:
n = número de elementos avaliados.
k = número de medições realizadas nos n elementos.
Rj = soma das classificações das j-ésimas colunas.
k

∑  = somatória do quadrado das Rj de j = 1 até k classificações.


j =1

4. Determinar a região de rejeição de H0. A distribuição amostral dessa prova é idêntica à de


χ 2 com gl = k − 1 para n > 9 (Tabela 5 do Apêndice – Tabelas estatísticas selecionadas,
no final deste livro). Todos χ 2
≥ χ 2
os valores de2 j 2 c estarão na região de rejeição de H0.
5. Decisão. Comparar χ j com χ c . Se χ j ≥ χ c , rejeita-se H0 em prol de H1.
2 2

Exemplo com cálculo manual – Uma empresa costuma avaliar, anualmente, junto aos
seus revendedores, sua política comercial. Uma mesma ficha, contendo várias afirmações com
escalas de cinco pontos para o registro do grau de concordância, tem sido sistematicamente
utilizada nos últimos cinco anos para efetuar as avaliações. Um diretor comercial, recém-ad-
mitido na empresa, decidiu comparar os resultados das avaliações dos últimos quatro anos para
verificar se houve mudança significativa no grau de satisfação dos revendedores. Para tanto,
sorteou uma amostra aleatória de 18 revendedores, cujas avaliações da política comercial da
empresa, nos últimos quatro anos, estão na Tabela 12.21.
Procedimentos para o teste:
1. H0 = não houve alteração significativa no grau de satisfação dos revendedores da empresa
em relação à política comercial nos últimos quatro anos.
H1 = houve alteração significativa para melhor no grau de satisfação dos revendedores em
relação à política comercial (teste unicaudal).
2. a = 0,05.
3. Cálculo da prova. Ordenando os escores de cada linha e atribuindo posições de 1 a 4,
têm-se os resultados apresentados nas quatro últimas colunas da Tabela 12.21. Somando-se
cada coluna, respectivamente, os resultados foram: 58; 52,5; 39,5 e 30. Aplicando a fórmula
de cálculo da prova a esses dados, tem-se:
12 (58)2 + (52,5)2 + (39,5)2 + (30)2 
χ = 2
j − 3 × 18 × (4 + 1)
18 × 4 × (4 + 1)
χ 2j = 16,01

4. O χ c  = 7,815, para a = 0,05 e gl = 4 − 1 = 3 (teste unicaudal) (Tabela 5 do Apêndice


2

– Tabelas estatísticas selecionadas, no final deste livro).


5. Região de rejeição. A região de rejeição de H0 compreende todos os valores de χ j ≥ χ c
2 2

= 7,815.
Métodos Não Paramétricos para Análise de Dados 333

Tabela 12.21  Grau de satisfação dos revendedores para com a política comercial da empresa
Avaliação anual Classificação
Revendedor 2008 2009 2010 2011 2008 2009 2010 2011
1 42 44 48 46 4 3 1 2
2 13 15 27 36 4 3 2 1
3 75 73 64 60 1 2 3 4
4 20 20 25 31 3,5 3,5 2 1
5 22 24 30 33 4 3 2 1
6 51 52 50 53 3 2 4 1
7 28 29 32 38 4 3 2 1
8 41 39 35 40 1 3 4 2
9 54 56 59 67 4 3 2 1
10 20 22 33 27 4 3 1 2
11 44 42 48 40 2 3 1 4
12 54 55 58 60 4 3 2 1
13 68 71 66 62 2 1 3 4
14 56 58 60 64 4 3 2 1
15 40 41 47 53 4 3 2 1
16 50 49 50 55 2,5 4 2,5 1
17 34 36 40 42 4 3 2 1
18 20 17 25 26 3 4 2 1
Totais 58 52,5 39,5 30

6. Decisão. Como χ j  = 16,01 >  χ c  = 7,815, H0 é rejeitada em prol de H1 = houve


2 2

alteração significativa para melhor no grau de satisfação dos revendedores em relação à


política comercial, ao nível de a = 0,05.
Exemplo com cálculo no SPSS – Uma empresa está interessada em saber junto a seu
público-alvo se há diferença na percepção de qualidade entre suas três principais marcas. Para
tanto, efetuou uma pesquisa junto a 15 consumidores e utilizou uma escala com variação de
1 a 4, sendo 1 = baixa qualidade, 2 = média qualidade, 3 = boa qualidade e 4 = qualidade
superior. Os resultados das somas das avaliações de cada consumidor para cada marca aos itens
avaliados estão na Tabela 12.22.
Procedimentos para o teste:
1. H0 = não há diferença nas avaliações da qualidade das três marcas.
H1 = há diferença nas avaliações da qualidade das três marcas, sendo a marca 3 a melhor
avaliada (teste unicaudal).
2. a = 0,05.
3. Processamento do teste.
Test Statisticsa
N 489
Chi-Square 312,734
df 2
Asymp. Sig. ,000

4. Decisão. Como p = 0,000 < a = 0,05 (teste unicaudal), rejeita-se H0 em prol de H1 = há


diferença nas avaliações da qualidade das três marcas, sendo a marca 3 a melhor avaliada.
334 Pesquisa de Marketing

Tabela 12.22  Avaliação da qualidade de três marcas da empresa


Consumidor Marca 1 Marca 2 Marca 3
1 41 39 35
2 54 56 59
3 20 22 33
4 44 42 48
5 54 55 58
6 68 71 66
7 56 58 60
8 40 41 47
9 42 44 48
10 13 15 27
11 75 73 64
12 20 20 25
13 22 24 30
14 51 52 50
15 28 29 32
Totais 628 641 682

MÉTODOS NÃO PARAMÉTRICOS PARA MEDIR A ASSOCIAÇÃO


E A INTERDEPENDÊNCIA ENTRE VARIÁVEIS
São utilizados para verificar se dois ou mais conjuntos de dados estão relacionados (se são in-
dependentes ou dependentes) e qual o nível de dependência, quando existente. Em marketing,
existem inúmeras situações em que essas verificações se fazem necessárias, como: conhecer a
preferência por um produto em relação à classe social dos consumidores ajuda os processos
de segmentação de mercado e planejamento de marketing; saber quanto a intensidade dos
gastos promocionais está relacionada aos resultados de vendas ou de participação no mercado
ajuda o planejamento futuro desses gastos para atingir aos objetivos.
Além das técnicas para verificar a interdependência e a dependência entre variáveis, também
serão apresentados testes do tipo verificação de H0, em que H0 é a negação da existência da
associação apontada entre os conjuntos de dados a determinado nível de confiabilidade. Nesse
caso, estar-se-á trabalhando também com inferência estatística, valendo os mesmos preceitos
para os testes de hipóteses a serem realizados já vistos.
A escolha do método não paramétrico para verificar a interdependência e a dependência
entre variáveis depende de: ser uma ou mais de uma variável independente, das escalas de suas
medições serem nominais ou ordinais, da existência ou não de variável dependente e da escala
de sua medição ser ordinal ou intervalar. O Quadro 12.1 mostra os métodos paramétricos e não
paramétricos de verificação da interdependência e da dependência entre variáveis e as condições
para sua utilização.

Coeficiente de contingência C
É utilizado para medir o grau de associação entre dois conjuntos de atributos medidos em escalas
nominais. Por exemplo: medir o grau de associação entre a classe socioeconômica da família
e a marca do automóvel possuído; a faixa etária e o tipo de programa de TV preferido etc.
Condições para utilização – Dois conjuntos de dados; só deve ser utilizado quando
houver dados nominais, ao menos em um dos dois conjuntos de dados.
Quadro 12.1  Técnicas paramétricas e não paramétricas para verificar a interdependência e a dependência entre variáveis
Método Escala de Número de Nominal Ordinal Intervalar ou razão
mensuração variáveis Número de variáveis dependentes Número de variáveis dependentes Número de variáveis dependentes
da variável independentes
Nenhuma Uma Nenhuma Uma Nenhuma Uma
Não Nominal Uma Coeficiente de
para- contingência
métrico
Mais de uma Índice de
Associação
Preditiva
Ordinal Uma Coeficiente
de Correlação
de Postos de
Spearman
Coeficiente
de Correlação

Métodos Não Paramétricos para Análise de Dados


de Postos de
Kendall
Mais de uma Coeficiente de
Concordância
de Kendall
Para- Intervalar Uma Análise
métrico ou razão da Regressão
Mais de uma Análise Fatorial Análise da Análise Análise
Análise de Regressão Fatorial da Regressão
Conglomerados Múltipla Escalonamento Múltipla
Multidimen-
sional - EMD
Nominal Análise de
ou ordinal Correspondência
- ANACOR

335
336 Pesquisa de Marketing

Teoria/Conceito – Por meio da comparação entre as frequências observadas e as es-


peradas em cada célula da tabela construída com os dados observados e esperados (análoga a
do qui-quadrado para n amostras), é possível determinar o grau de associação entre os dois
conjuntos de dados. Quanto maior for a discrepância entre os dados observados e os es-
perados, maior será o grau de associação entre os dois conjuntos e, consequentemente, o valor
do coeficiente de contingência C. Em seguida à determinação de C, efetua-se um teste de
hipótese para verificar sua veracidade, em determinado nível de significância.
Procedimento geral para o cálculo de C:
1. Construir uma tabela de contingência do tipo k × r (k = número de categorias de uma
variável e r, o da outra). Determinar a frequência esperada sob H0 para cada célula de forma
idêntica ao procedimento do qui-quadrado (inclusive as restrições).
2. Calcular o valor do qui-quadrado ( χ c ) conforme os métodos vistos anteriormente, pela
2

seguinte fórmula:
r k
(Oij − Eij )2
χ c2 = ∑ ∑
i =1 j =1 Eij

3. Em seguida, calcular o do coeficiente de contingência C pela fórmula:


χ c2
C=
n + χ c2
Procedimentos para o teste de verificação de C:
1. Determinar H0 como a não existência de relacionamento (ou de associação) entre os dois
conjuntos de dados observados.
2. Determinar o nível de significância a para a realização do teste. 2
3. Determinar a região de rejeição de H0 procurando o valor do χ t correspondente a a e
gl = (k − 1) (r − 1) na Tabela 5 do Apêndice – Tabelas estatísticas selecionadas, no final
deste livro).
4. Decisão. Comparar χ c (conforme o item 2 do procedimento geral para o cálculo de C)
2

com χ t . Se χ c ≥ χ t , rejeita-se H0 em prol de H1.


2 2 2

Exemplo com cálculo manual – Para aprimorar suas atividades de marketing, uma
montadora de automóveis está interessada em saber o quanto a escolha da marca do automóvel
está relacionada com a classe socioeconômica da família. Para a realização do estudo, foi cons-
tituída uma amostra aleatória de 900 compradores de automóveis novos dos três principais
fabricantes do mercado nos últimos 12 meses. A tabulação cruzada da classe socioeconômica
da família (A, B ou C) com a marca do fabricante do veículo adquirido (X, Y ou Z) resultou
nos dados das colunas Ois da Tabela 12.23.
Procedimentos para o cálculo de C:
1. A tabela de cruzamento apresentada é do tipo 3 × 3. A partir desta tabela, determinam-se as
frequências esperadas Ei sob H0. Na Tabela 12.23, junto com as Oi (frequências observadas),
estão as Ei (frequências esperadas).
2. Calcular o valor do qui-quadrado e, em seguida, o do coeficiente de contingência
C aplicando a fórmula apresentada no item 2 do procedimento geral para o cálculo
de C:
Métodos Não Paramétricos para Análise de Dados 337

Tabela 12.23  Marca da fábrica do veículo adquirido por classe socioeconômica da família
Classe socioeconômica
A B C
Marca da fábrica Oi Ei Oi Ei Oi Ei Totais
X 75 28 111 98 24 84 210
Y 30 50 186 175 159 150 375
Z 15 42 123 147 177 126 315
Totais 120 120 420 420 360 360 900

χ c2 = 174,60
174,60
C=
900 + 174,60
C = 0,403
Procedimentos para o teste de verificação de C = 0,403:
1. H0 = não existe correlação de 0,403 entre a classe socioeconômica da família e a marca
de fábrica do automóvel adquirido.
H1 = existe correlação de 0,403 entre a classe socioeconômica da família e a marca de
fábrica do automóvel adquirido (teste unicaudal).
2. a = 0,05.
3. Região de rejeição. O χ t  = 9,49, para a = 0,05 e gl = (3 − 1) (3 − 1) (Tabela 5 do
2

Apêndice – Tabelas estatísticas selecionadas, no final deste livro). A região de rejeição


é compreendida por todos os valores de χ c ≥ χ t  = 9,49, sendo χ c o mesmo para a
2 2 2

obtenção de C.
4. Decisão. Como o χ c  = 174,60 >  χ t  = 9,49, H0 é rejeitada em prol de H1 = existe
2 2

correlação de 0,403 entre a classe socioeconômica da família e a marca de fábrica do


automóvel adquirido, ao nível de confiabilidade de 0,05.
Exemplo com cálculo no SPSS – Interessado em saber se há associação entre o gênero
(homem = 1 e mulher = 2) e o tipo de bebida preferida por seus consumidores (água = 0,
suco = 1, refrigerante = 2, cerveja = 3 e vinho = 4), um restaurante fez uma pesquisa com
25 consumidores, obtendo os resultados mostrados na Tabela 12.24.
Procedimentos para o teste:
1. H0 = não há correlação entre gênero e tipo de bebida preferida.
H1 = há correlação entre gênero e tipo de bebida preferida.
2. a = 0,05.
3. Processamento do teste.
Symmetric Measures
Value Approx. Sig.
Nominal by Contingency ,367 ,420
Nominal Coefficient
N of Valid Cases 25

4. Decisão. De acordo com o teste, como p = 0,420 > a = 0,05, não se pode rejeitar H0 = não
há correlação entre gênero e tipo de bebida preferida, ao nível de a = 0,05.
338 Pesquisa de Marketing

Tabela 12.24  Preferência, por gênero, no consumo de bebidas


Consumidor Gênero Bebida preferida
1 2 2
2 1 2
3 2 3
4 1 2
5 1 2
6 1 3
7 2 4
8 1 3
9 2 0
10 1 3
11 1 3
12 1 0
13 1 4
14 2 2
15 2 4
16 2 2
17 2 1
18 2 3
19 2 2
20 2 2
21 2 4
22 2 2
23 1 2
24 1 0
25 2 4

Coeficiente de correlação de postos de Spearman Rs


O coeficiente de correlação de postos de Spearman é o mais conhecido e utilizado coefi-
ciente de associação de dois conjuntos de dados ordenados. Em pesquisas de marketing, sua
utilização ocorre quando, em um mesmo grupo de pessoas, são obtidas medições ordinais
de duas diferentes variáveis cujo relacionamento se deseja conhecer, tais como classe social
e preferência pelo produto. Pode também ser utilizado para comparar a associação existente
entre dois quaisquer conjuntos de dados ordenados.
Condições para utilização – Dois conjuntos de variáveis da mesma amostra ou de
amostras diferentes; que tenham sido medidas ao menos em escalas ordinais.
Teoria/Conceito – O coeficiente mede a disparidade de classificação entre dois conjuntos
de dados ordenados. Os dois conjuntos de dados a comparar são ordenados, independentemente,
do maior para o menor valor das medições, atribuindo-se, sequencialmente, aos maiores valores
a posição 1 e, aos menores, a posição n. Comparando-se essas duas ordenações, pode-se deduzir
que, quanto mais homogêneas e coincidentes forem essas ordenações, menores serão as diferenças
algébricas observadas entre uma e outra, e vice-versa. Se o relacionamento entre os dois con-
juntos de classificação ordenada for perfeito, todas as diferenças nos pares de classificação serão
iguais a zero. Analogamente, caso o relacionamento seja exatamente o inverso, todas as diferenças
serão máximas (por exemplo, um mesmo respondente que tenha avaliado a primeira variável
num valor que resultou numa classificação 1 e, a segunda, numa classificação n). A princípio,
Métodos Não Paramétricos para Análise de Dados 339

a somatória das diferenças poderia dar uma noção da magnitude da similaridade ou da dis-
crepância entre as classificações, porém, como as diferenças são algébricas, as negativas tendem
a cancelar as positivas, e o valor resultante ficaria deturpado. Para contornar esse problema,
utiliza-se, para medir a magnitude das discrepâncias observadas, a raiz quadrada da soma dos
quadrados das diferenças observadas. O cálculo do coeficiente de correlação é obtido pela
subtração da divisão desse valor pelo seu máximo valor possível (quando a discrepância for
máxima). Esse coeficiente varia de 0 (não há correlação) a 1 (correlação máxima) (Tabela
13 do Apêndice – Tabelas estatísticas selecionadas, no final deste livro).
Procedimento geral para o cálculo de Rs:
1. Ordenar as observações de cada uma das variáveis separadamente e atribuir posições para
as classificações de 1 a n (quando houver observações idênticas, utilizar a mesma forma de
atribuição de posições já apresentada quando foi estudado o teste Wilcoxon T).
2. Calcular a diferença d e seu quadrado d2 para as observações pareadas de cada elemento
da amostra.
3. Somar todos os quadrados das diferenças.
4. Com os dados assim obtidos, calcular o valor do coeficiente de correlação de postos (Rs)
utilizando a seguinte fórmula:
n
6∑ di2
Rs = 1 − i =1
n3 − n
Em que:
Rs = coeficiente de correlação de postos de Spearman.
n = número de observações.
di = diferença algébrica entre as classificações.
Procedimentos para o teste de verificação de Rs:
1. Definir H0 como não havendo correlação entre os dois conjuntos de dados.
2. Definir um nível de significância a.
3. Cálculo da prova. A significância de se obter um Rs sob H0 pode ser testada, utilizando-se a
seguinte fórmula para o cálculo de tc cuja distribuição é idêntica à distribuição t de Student
para gl = n – 2 (para n ≥ 10):

n−2
tc = R s
1 − R s2
Região de rejeição. Procurar na tabela da distribuição t de Student o valor correspondente
a tt para a e gl = n − 2 (Veja a Tabela 4 do Apêndice – Tabelas estatísticas selecionadas,
no final deste livro).
4. A região de rejeição estará compreendida por todos os valores de tc ≥ tt.
5. Decisão. A decisão será tomada comparando-se tc com tt, para a e gl = n − 2. Se tc ≥ tt, H0
é rejeitada em prol de H1.
Exemplo com cálculo manual – Uma empresa, desejando saber quanto o nível de
satisfação com um seu produto está relacionado ao nível socioeconômico do consumidor,
realizou uma pesquisa junto a uma amostra aleatória de 15 consumidores. O nível de satis-
fação foi medido segundo o grau de concordância para uma série de afirmações e o nível
340 Pesquisa de Marketing

socioeconômico por uma escala desenvolvida pela empresa. Os resultados dessas duas medições
estão na Tabela 12.25.
Procedimentos para o cálculo de Rs:
1. Ordenar as observações de cada uma das variáveis separadamente e atribuir posições para
as classificações de 1 a 15, obtendo-se as colunas ordem2(1) e ordem (2) na Tabela 12.25.
2. Calcular as diferenças di e os quadrados das diferenças di para as observações pareadas de
cada elemento da amostra e somar todos os quadrados das diferenças ( ∑di ), obtendo-se
2

os dados necessários para o cálculo do índice de correlação (Tabela 12.25).


Tabela 12.25  Nível de satisfação versus nível socioeconômico
Pesquisado Nível de satisfação Nível socioeconômico di di2
Pontuação Ordem (1) Pontuação Ordem (2) (1) – (2)
1 82 2 42 4 −2 4
2 98 8 46 6 2 4
3 87 5 39 2 3 9
4 40 1 37 1 – –
5 116 13 65 10 3 9
6 113 12 88 14 −2 4
7 111 11 86 12 −1 1
8 83 3 56 8 −5 25
9 85 4 62 9 −5 25
10 126 15 92 15 – –
11 106 10 54 7 3 9
12 117 14 81 11 3 9
13 103 9 87 13 −4 16
14 89 6 40 3 3 9
15 95 7 45 5 2 4

∑di2 128

3. Aplicar a fórmula apresentada no item 3 do procedimento para o cálculo de Rs a estes dados:


6 × 128 768
Rs = 1 − = 1− = 0,77
15 − 15
3
3.360
Procedimentos para o teste de verificação de Rs = 0,77
1. H0 = não há a correlação de 0,77 entre classe social e o nível de satisfação dos consumidores.
H1 = há a correlação de 0,77 entre classe social e o nível de satisfação dos consumidores
(teste unicaudal).
2. a = 0,02.
3. Cálculo da prova. Como n > 10, H0 pode ser testada utilizando-se, para o cálculo de tc, a
fórmula vista no item 3 da descrição do teste:
15 − 2 13
tc = 0,77 = 0,77 = 0,77 × 5,65
1 − 0,77 2
0,407
tc = 4,35
4. Região de rejeição. O valor de tt = 2,65, para a = 0,02 (teste unicaudal) e gl 15 − 2 = 13.
A região de rejeição de H0 compreende todos os valores de tc ≥ tt = 2,65 (Tabela 4 do
Apêndice – Tabelas estatísticas selecionadas, no final deste livro). Decisão. Comparando-se
Métodos Não Paramétricos para Análise de Dados 341

tc com tt, verifica-se que tc = 4,35 > tt = 2,65, o que implica na rejeição de H0 em prol de


H1 = há a correlação de 0,77 entre classe social e o nível de satisfação dos consumidores,
ao nível de significância de 0,02.
Exemplo com cálculo no SPSS – Uma empresa deseja avaliar como reagem os consumi-
dores a um produto seu em lançamento, em comparação à versão concorrente no mercado. Para
tanto, foram oferecidos a uma amostra de 20 consumidores os dois produtos, para que fossem
degustados em um blind test (teste cego, em que os consumidores apenas degustam o produto
sem saber sua marca e sem ver suas embalagens), e, em seguida, eles os avaliassem. As avaliações
de cada produto por cada um dos consumidores, em uma escala de 0 a 4, estão na Tabela 12.26.
Tabela 12.26  Avaliação dos produtos da empresa e do concorrente
Avaliações
Consumidor Versão da empresa Versão concorrente
1 2 3
2 4 4
3 2 3
4 2 4
5 2 4
6 4 3
7 2 3
8 3 3
9 3 4
10 4 4
11 2 4
12 3 3
13 4 4
14 2 3
15 4 4
16 0 3
17 2 4
18 4 4
19 3 4
20 3 3
Total 55 71
Procedimentos para o teste:
1. H0 = não há correlação entre os dois produtos.
H1 = há correlação entre os dois produtos (teste bicaudal).
2. a = 0,05.
3. Processamento do teste.
Correlations
Versão1 Versão2
Spearman’s rho Versão1 Correlation Coefficient 1,000 ,332
Sig. (2-tailed) . ,153
N 20 20
Versão2 Correlation Coefficient ,332 1,000
Sig. (2-tailed) ,153 .
N 20 20
342 Pesquisa de Marketing

4. Decisão. Sendo p = 0,153 > a = 0,05, não é possível rejeitar H0 = não há correlação entre


os dois produtos.

Coeficiente de correlação de postos de Kendall – T (TAU)


O coeficiente de correlação de Kendall T tem a mesma utilização para pesquisas de marke-
ting que o coeficiente de correlação de postos de Spearman, com a vantagem de poder ser
generalizado para um coeficiente de correlação parcial.
Condições para utilização – As mesmas do coeficiente de correlação de postos de
Spearman.
Teoria/Conceito – Tendo os valores de uma das variáveis sido naturalmente ordenados
de 1 a n, do menor para o maior, a essência do método compreende a comparação pareada das
classificações obtidas nas duas variáveis. O resultado de cada comparação deve ser classificado da
seguinte forma: se a classificação do par estiver “correta”, ou seja, na ordem natural, atribui-se
+1; se “incorreta” −1. Se o conjunto de classificações da segunda variável for exatamente
igual ao da primeira, todos os pares de comparações serão positivos, e sua soma será máxima
e positiva. Analogamente, se estiver completamente invertido, todas as comparações serão
negativas, e sua soma será máxima e negativa. Se esses valores forem divididos pelo total de
comparações possíveis (que é igual ao máximo escore possível), obter-se-á, respectivamente,
o valor máximo (+1) ou mínimo (−1) para o coeficiente de correlação de Kendall. Para
qualquer outro nível intermediário de classificação, o valor do coeficiente de correlação de
Kendall será obtido pela divisão da soma algébrica dos números atribuídos +1 e −1, dividido
pelo máximo escore possível.
Procedimento geral para o cálculo de T:
1. Ordenar as observações de cada uma das variáveis, separadamente, e atribuir posições para as
classificações de 1 a n de cada variável Quando houver observações idênticas, utilizar a mesma
forma de atribuição de posições já apresentada quando se estudou o teste Wilcoxon T.
2. Escolher uma das variáveis para ter a classificação na ordem natural, comparar todos
os possíveis pares da outra variável e atribuir a cada comparação +1 ou −1, conforme
resultar em classificação correta (ordem natural) ou incorreta.
3. Calcular a soma S de todos os valores +1 e −1 e aplicar a seguinte fórmula para o cálculo
do coeficiente de correlação de postos de Kendall:

S S
T= ou T =
C n,2 (n / 2)(n − 1)

Em que:
T = correlação de postos de Kendall cujo significado é:
escore efetivo
T=
escore máximo possível
S = resultado algébrico da soma dos +1s e −1s
Cn,2 = máximo de escore possível e compreende a combinação dos n elementos, dois
a dois.
Exemplo com cálculo manual – Seja o mesmo exemplo utilizado para ilustrar o cálculo
e teste do coeficiente de correlação de postos de Spearman (Tabela 12.25).
Métodos Não Paramétricos para Análise de Dados 343

Procedimentos para o cálculo de T:


1. As observações de cada uma das variáveis devem ser ordenadas separadamente e atribuídas
posições para as classificações de 1 a 15 (Tabela 12.27). A variável ordem do nível de satis-
fação foi escolhida para ter a classificação na ordem natural. O resultado da reclassificação,
segundo essa escolha, está nas colunas 2 e 3 da Tabela 12.27.
Tabela 12.27  Ordem no nível de satisfação com o produto e a pontuação de classe socioeconômica
Ordem no Ordem na Ordem natural –
nível de pontuação Ordem Ordem não ordem não
Pesquisado satisfação de classe natural natural natural
4 1 1 14 0 14
1 2 4 11 2 9
8 3 8 7 5 2
9 4 9 6 5 1
3 5 2 10 0 10
14 6 3 9 0 9
15 7 5 8 0 8
2 8 6 7 0 7
13 9 13 2 4 −2
11 10 7 5 0 5
7 11 12 2 2 0
6 12 14 1 2 −1
5 13 10 2 0 2
12 14 11 1 0 1
10 15 15 0 0 0
S 65

2. Comparar todos os possíveis pares da variável ordem na pontuação de classe, atribuindo


+1 ou −1, conforme a comparação resultar em classificação correta ou incorreta. Para a
posição 1, na ordem de pontuação de classe, a comparação com as outras 14 posições resulta
em 14 ordens corretas (coluna 4) e nenhuma incorreta (coluna 5), que dá o resultado
da coluna 6 (14 – 0); e assim, sucessivamente, obtêm-se os resultados das comparações
de todas as posições com as que as seguem e, efetuando a soma S de todos os resultados,
obter-se-á 65.
3. Aplicar a fórmula já apresentada no item 4 da teoria para o cálculo de T:

65 65
T= = = 0,62
(15 / 2)(15 − 1) 05
Analogamente aos procedimentos realizados com os outros índices de correlação, T deve
ser testado a determinado nível de significância para poder ser aceito.

Coeficiente de concordância W de Kendall


Nas seções precedentes, os coeficientes apresentados diziam respeito à correlação existente
entre apenas dois conjuntos ordenados de n objetos ou indivíduos. O coeficiente de concor-
dância de W de Kendall determina qual é o grau de associação entre mais de dois conjuntos
ordenados. Esse tipo de medida da associação é particularmente interessante para pesquisas de
344 Pesquisa de Marketing

marketing nos casos em que existem, por exemplo, vários consumidores avaliando, por meio
de classificações, simultaneamente, vários produtos (várias embalagens, várias propagandas etc.).
Condições para utilização – Conjunto de n objetos avaliados por k avaliadores; avalia-
ções em escalas ordinais originadas de comparação dos n objetos.
Teoria/Conceito – Uma das formas de solução do problema consiste em calcular todos
os índices de correlações de Spearman (Rs) de todos os possíveis pares de classificações e, em
seguida, calcular a média para determinar o coeficiente de correlação de todo o conjunto.
É um caminho muito trabalhoso e, por isso, não recomendável. A outra forma, mais fácil, é
imaginar o que ocorre quando não há nenhuma concordância entre todos os conjuntos e
quando há total concordância. O coeficiente de concordância será um índice de divergência
entre a concordância verdadeira verificada nos dados e o máximo de concordância possível.
Procedimento geral para o cálculo de W:
1. Sendo k = número de avaliadores e n = número de objetos avaliados, construir uma tabela
n × k com as classificações observadas.
2. Calcular Rn, que é a soma das classificações de cada objeto.
3. Calcular o Rn médio.
4. Calcular as diferenças algébricas d entre cada Rn e o Rn médio e elevar ao quadrado d2.
5. Obter S somando todos os d2.
6. O índice de concordância W de Kendall é obtido aplicando-se a seguinte fórmula:
S
W=
1 2 3
k (n − n )
12
Em que:
W = índice de concordância W de Kendall.
S =  ∑d (somatória do quadrado das diferenças observadas).
2

k = número de avaliadores.
n = número de objetos avaliados.
Exemplo com cálculo manual – Uma empresa realizou uma pesquisa para avaliar a
ordem de preferência dos consumidores para oito marcas concorrentes de uma mesma cate-
goria de produto. Foram obtidas as opiniões de uma amostra aleatória de 20 consumidores.
Com base nos resultados apresentados na Tabela 12.28, a empresa deseja saber qual foi o grau
de concordância na avaliação desses 20 consumidores.
Efetuando-se os procedimentos indicados para o cálculo de W, obtêm-se os dados que
constam das linhas Rn, Rn médio, d, d2 e S =  ∑d na tabela anterior. Aplicando-se a fórmula
2

para o cálculo de W, apresentada no item 6 da teoria a respeito, tem-se:


9.456
W= = 0,562
20 (8 3 − 8)
2

12
Portanto, a concordância na avaliação dos 20 consumidores na ordenação das oito marcas
pelo coeficiente de concordância W de Kendall foi de 0,562.
Analogamente aos procedimentos realizados com os outros índices, W = 0,562 deve ser
testado em determinado nível de significância para poder ser aceito.
Métodos Não Paramétricos para Análise de Dados 345

Tabela 12.28  Resultados da avaliação de oito produtos por 20 consumidores


Produtos (n)
Consumidor (k) A B C D E F G H
1 3 1 2 4 5 7 6 8
2 4 3 1 2 5 8 7 6
3 3 5 8 7 4 6 1 2
4 5 3 2 1 6 4 8 7
5 1 2 5 4 8 3 7 6
6 3 1 4 5 2 6 7 8
7 2 1 3 4 6 7 8 5
8 3 2 1 4 6 5 7 8
9 1 3 5 4 2 7 8 6
10 2 3 4 1 5 6 8 7
11 2 4 3 1 6 8 7 5
12 3 2 1 5 4 6 8 7
13 5 4 3 1 2 8 6 7
14 3 1 2 4 5 8 6 7
15 5 3 2 1 6 4 8 7
16 2 1 3 4 6 7 8 5
17 1 3 5 4 2 7 8 6
18 3 2 1 5 4 6 8 7
19 2 1 3 4 6 7 8 5
20 5 3 2 1 6 4 8 7
Totais (Rn) 58 48 60 66 96 124 142 126
∑ Rn = 720
Rn médio (=720/8) 90 90 90 90 90 90 90 90
d −32 −42 −30 −24 6 34 52 36
d2 1.024 1.764 900 576 36 1.156 2.704 1.296
S =  ∑d = 1.024 + 1.764 + 900 + 576 + 36 + 1.156 + 2.704 + 1.296 = 9.456
2

Exemplo com cálculo no SPSS – Uma empresa deseja verificar se um produto que
irá lançar no mercado é significativamente semelhante a outros três produtos concorrentes já
existentes. As avaliações de cada produto realizadas por cada um dos consumidores, em uma
escala de 0 a 4, estão na Tabela 12.29.
Procedimento para o teste:
1. H0 = os produtos não são percebidos como semelhantes.
H1 = os produtos são percebidos como semelhantes.
2. a = 0,01.
3. Processamento do teste.
Test Statistics
N 20
Kendall's W a
,020
Chi-Square 1,189
df 3
Asymp. Sig. ,756
a
Kendall's Coefficient of Concordance.
346 Pesquisa de Marketing

Tabela 12.29  Avaliações das versões dos produtos realizadas por cada um dos
consumidores
Produto
Consumidor Empresa Concorrente 1 Concorrente 2 Concorrente 3
1 2 2 2 2
2 4 4 3 4
3 2 2 2 2
4 2 2 2 2
5 2 2 2 2
6 4 4 3 4
7 2 2 2 2
8 3 3 3 3
9 3 1 1 1
10 4 4 3 4
11 2 3 4 3
12 3 3 3 3
13 4 4 4 4
14 2 2 2 3
15 4 4 4 4
16 0 0 0 0
17 2 2 3 3
18 4 4 4 4
19 3 3 3 3
20 3 3 3 2
Totais 55 54 53 55

4. Decisão. Uma vez que p = 0,756 > a = 0,01, não é possível rejeitar H0 = os produtos
não são percebidos como semelhantes, ao nível de significância de 0,01.

QUESTÕES DE REVISÃO
1. Qual a importância dos métodos não paramétricos para pesquisas de marketing?
2. Quais as condições para utilização de um teste de hipótese binomial?
3. Qual a utilização, em pesquisa de marketing, do teste qui-quadrado de uma amostra? E
o de duas ou mais amostras?
4. Como se calcula o valor da prova no teste qui-quadrado de duas ou mais amostras?
5. Quais as vantagens do teste Kolmogorov-Smirnov para uma amostra em relação ao teste
qui-quadrado?
6. Qual a utilização do teste da mediana? Quais as condições para sua utilização?
7. Qual o teste mais adequado para analisar resultados residuais comparativos de situações
pré e pós-testes para duas amostras relacionadas?
8. O que são métodos da associação?
9. Qual a utilização, em pesquisa de marketing, do teste de contingência C? Quais as
condições para sua utilização?
10. Qual a utilização, em pesquisa de marketing, do coeficiente de correlação de postos de
Spearman (Rs)? Quais as condições para sua utilização?
Métodos Não Paramétricos para Análise de Dados 347

11. Quais são os procedimentos para o cálculo do coeficiente de correlação de postos de


Kendall (T)?
12. Em que situações o coeficiente de concordância de Kendall (W) deve ser aplicado?

Trabalho – Parte 10
Aplique às variáveis nominais e ordinais de sua pesquisa, bem como às variáveis intervalares,
testes de hipóteses não paramétricos adequados às condições do projeto de pesquisa quando
não reunir condições de aplicar os métodos paramétricos. Calcule também o relacionamento
entre variáveis que não reúnam condições para a utilização de medidas paramétricas.

REFERÊNCIAS
COOPER, D. R.; SCHINDLER, P. S. Métodos de pesquisa em administração. 7. ed. Porto Alegre: Bookman, 2003.
DANIEL, W. W. Essentials of business statistics. Boston: Houghton Mifflin Co., 1984.
HAIR JR., J. F.; ANDERSON, R. E.; TATHAN, R. L.; BLACK, W. C. Análise multivariada de dados. Porto Alegre:
Bookman, 2005.
MALHOTRA, N. K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman, 2001.
NEWBOLD, P. Statistics for business & economics. Upper Saddle River: Prentice-Hall, 1994.
PESTANA, M. H.; GAGEIRO, J. N. Análise de dados para ciências sociais. Lisboa: Silabo, 2003.
SIEGEL, S.; CASTELLAN, JR., J. J. Estatística não paramétrica para ciências do comportamento. Porto Alegre: Bookman,
2006.
STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 2001.
CAPÍTULO 13
Técnicas Paramétricas para Análise
de Dados
Fauze Najib Mattar, Braulio Oliveira e Sérgio Luís Stirbolov Motta

Viver, e não ter a vergonha de ser feliz,


cantar, e cantar, e cantar a beleza de ser um eterno aprendiz,
eu sei, que a vida devia ser bem melhor, e será!
Mas isso não impede que eu repita: é bonita, é bonita e é bonita.
Gonzaguinha

Objetivos
• Apresentar as técnicas mais utilizadas em pesquisas de marketing para se analisarem dados
de grandes amostras ou provenientes de populações cujos parâmetros são conhecidos.

Sumário
TESTES PARA MEDIDAS DE POSIÇÃO
Testes da média para uma amostra – variável intervalar
Teste z
Teste t
Testes para duas amostras não relacionadas – variável intervalar
Teste z da diferença entre duas médias
Teste t da diferença entre duas médias
Testes para duas amostras relacionadas – variável intervalar
Teste tr
TÉCNICAS MULTIVARIADAS DE INTERDEPENDÊNCIA
Análise fatorial exploratória
Conceitos e termos utilizados na análise fatorial
Testes e precondições das variáveis e dos dados para a análise fatorial
Passos da análise fatorial
Análise de conglomerados
Análise de correspondência
Escalonamento multidimensional – MDS (Multidimensional Scaling)
TÉCNICAS PARA MEDIR A DEPENDÊNCIA
Métodos de correlação e regressão
Análise da variância - Anova
Análise multivariada da variância - Manova
Análise discriminante e classificatória

349
350 Pesquisa de Marketing

O presente capítulo é dedicado às técnicas paramétricas para análise de dados em pesquisas


de marketing quando as variáveis estudadas são intervalares ou razão, e quando os parâmetros
da população são conhecidos ou as amostras são grandes.

TESTES PARA MEDIDAS DE POSIÇÃO


São apropriados dois diferentes testes para se testarem medidas de posição quando se utilizam
escalas intervalares: o teste z e o t. A escolha entre um e outro dependerá do conhecimento do
desvio-padrão da população e do tamanho da amostra. São utilizados em testes de hipóteses
a respeito da média da população, das diferenças entre médias, das proporções na população,
das diferenças entre proporções e do coeficiente de regressão. Outro teste também utilizado
é o da análise da variância.

Testes da média para uma amostra – variável intervalar


Muitas vezes, interessa ao pesquisador de marketing conceber afirmações sobre uma única
variável e compará-las com dados já conhecidos. Para essa situação, os testes z e t da média
para uma amostra são os mais indicados, sendo o teste t o mais utilizado em razão de possuir
requisitos mais flexíveis.

Teste z
O teste z é utilizado em pesquisas de marketing para comparar a média de uma amostra com
a média conhecida ou hipotética da população e decidir se a média da amostra pode ser aceita
como a média da população, em determinado nível de significância.
Condições para utilização – Exclusivamente para variáveis intervalares; qualquer tama-
nho da amostra se o desvio-padrão da população for conhecido; somente para amostras de
tamanho igual ou superior a 30 elementos se o desvio-padrão da população não for conhecido.
Teoria/Conceito – O teste consiste em verificar se a média obtida em uma amostra
( x ) pode ser aceita como a média da população (m) da qual ela foi colhida, em determinado
nível de significância.
Procedimento geral para o teste:
1. Determinar H0 como a negação de H1, sendo H1 a hipótese da pesquisa.
2. Estabelecer um nível de significância a.
3. Calcular os valores de Z segundo as fórmulas:
Caso 1: Dados em unidades:
a. A variância da população é conhecida:

x−µ
Z=
σ
Em que:
Z = valor correspondente a x na distribuição normal padronizada.
x = média da amostra.
m = média da população.
σ = desvio-padrão da média na população.
Técnicas Paramétricas para Análise de Dados 351

b. A variância da população é desconhecida:


x −µ x −µ
Z= ou Z =
Sx S/ n
Em que:
Z = valor correspondente a x na distribuição normal padronizada.
x = média da amostra.
m = média da população.
Sx = estimativa do desvio-padrão da média na população, sendo Sx = S / n , onde n
é o tamanho da amostra e S o desvio-padrão da amostra.
Caso 2: Dados em proporções:
a. A variância da população é conhecida:
p−P
Z=
σ
Em que:
Z = valor correspondente a p na distribuição normal padronizada.
p = proporção de ocorrência na amostra.
P = proporção de ocorrência na população (verdadeira, se a população for conhecida,
e teórica ou hipotética, se desconhecida).
Q = proporção de não ocorrência na população (= 1 − P).
σ = desvio-padrão da proporção na população.
n = número de elementos da amostra.
b. A variância da população é desconhecida e n ≥ 30:
p−P
Z=
PQ / n
Em que:
Z = valor correspondente a p na distribuição normal padronizada.
p = proporção de ocorrência na amostra.
P = proporção de ocorrência na população (verdadeira ou teórica).
Q = proporção de não ocorrência na população (= 1 − P).
n = número de elementos da amostra.
4. Determinar a região de rejeição de z ao nível de significância a estabelecido. Procurar na
tabela da distribuição padronizada de z o valor tabelado Zt para o nível de significância a
estabelecido (Tabela 3 do Apêndice – Tabelas estatísticas selecionadas, no final deste livro).
5. A região de rejeição de H0 será formada por todos os valores de Zc ≥ Zt. Decisão. Comparar
os valores de Zc e Zt. Se Zc ≥ Zt, H0 é rejeitada em prol de H1.
Exemplo com cálculo manual – O comprador de uma rede de 500 farmácias está in-
teressado em verificar a viabilidade de adotar a comercialização de uma nova marca de sabonete
de um fornecedor tradicional. Sua experiência anterior, em função da categoria do produto e
da margem de comercialização oferecida, indica que, para que essa comercialização seja viável e
lucrativa, é necessário vender, no mínimo, uma média de 100 unidades/loja/dia. O fornecedor
concordou em fornecer uma quantidade do produto para a realização de um teste de vendas
352 Pesquisa de Marketing

em uma amostra probabilística de 32 lojas da rede. Os resultados obtidos de vendas por loja
encontram-se na Tabela 13.1. Com base nesses dados, o comprador deve decidir se adota ou
não a comercialização dessa nova marca de sabonete.
Tabela 13.1  Resultados obtidos de vendas da nova marca de sabonete,
por loja pesquisada
Vendas
Loja x x2
1 116 13.456
2 105 11.025
3 120 14.400
4 93 8.649
5 132 17.424
6 114 12.996
7 97 9.409
8 108 11.664
9 86 7.396
10 123 17.424
11 105 11.025
12 102 10.404
13 123 15.129
14 88 7.744
15 114 12.996
16 94 8.836
17 110 12.100
18 70 4.900
19 95 9.025
20 90 8.100
21 120 14.400
22 115 13.225
23 125 15.625
24 98 9.604
25 103 10.609
26 112 12.544
27 92 8.464
28 101 10.201
29 109 11.881
30 132 17.424
31 119 14.161
32 101 10.201
Totais 3.412 372.441

Procedimentos para o teste:


1. H0 = a média de vendas por loja não é maior que 100.
H1 = a média de vendas por loja é maior que 100 (teste unicaudal).
2. Estabelecer um nível de significância. Seja a = 0,05.
3. Calcular z pela fórmula:
x−µ
Z=
S/ n
Técnicas Paramétricas para Análise de Dados 353

m
x = ∑ xi / n = 3.412 / 32 = 106,625
i =1

2
∑ x2  ∑ x 
S= −  = 372.441 / 32 − (3.412 / 32)
2

n  n 

S = 11.638,78 − 11.368,89

S = 269,89 = 16,428 Sx = 16,428 / 32

Z c = (106,625 − 100) / 16,428 / 32 ) = 6,625 / 2,904

Z c = 2,281
4. Região de rejeição. Sendo Zt = 1,65 para a = 0,05 (teste unicaudal), a região de rejeição
de H0 corresponde a todos os valores de Zc ≥ Zt = 1,65 (Tabela 3 do Apêndice – Tabelas
estatísticas selecionadas, no final deste livro).
5. Decisão. Como Zc = 2,281 > Zt = 1,65, H0 é rejeitada em prol de H1 = a média de vendas
por loja é maior que 100, ao nível de confiabilidade de 0,05. Portanto, a nova marca de
sabonete deverá ser introduzida para ser comercializada pela rede de farmácias.
Exemplo com cálculo no SPSS – Veja o exemplo seguinte, com o teste t, já que não
há uma função específica para se calcular o teste z e, para amostras maiores ou iguais a 30, os
resultados dos testes z e t são semelhantes.

Teste t
A utilização em pesquisas de marketing do teste t é análoga à do teste z, porém é o reco-
mendado quando o número de elementos da amostra for inferior a 30.
Condições para utilização – Exclusivamente para variáveis intervalares; quando a
variância da população for desconhecida e n for de qualquer tamanho (inclusive para os
casos em que n < 30, em que o teste z não pode ser utilizado).
Procedimento geral para o teste:
O procedimento para o teste t é idêntico ao do teste z. A procura para o t tabelado deverá
ser feita na tabela para (n − 1) graus de liberdade e, para o cálculo, utiliza-se a fórmula:

(x − µ )
Tc =
Sx
Em que:
Tc = t calculado
∑( xi − x )2
Sx = S / n e S =
n −1
Exemplo com cálculo manual – Considere-se o mesmo exemplo anterior, admitindo
que o teste do produto tenha sido feito apenas nas dez primeiras lojas (Tabela 13.1).
Procedimentos para o teste:
1. H0 = a média de vendas por loja é menor ou igual a 100.
H1 = a média de vendas por loja é maior que 100 (teste unicaudal).
354 Pesquisa de Marketing

2. a = 0,05.
3. Calcular os valores de Tc.
n
x = ∑ xi / n = 109,4
i =1

∑(x i − x )2
S 14
S= i =1
= 14 Sx = = = 4,55
n −1 n 10
x − µ 109,4 − 100
Tc = = = 2,07
Sx 4,55
Tc = 2,07
4. Determinar a região de rejeição de t. Na tabela da distribuição padronizada, o Tt = 1,833,
para a = 0,05 e gl = (10 − 1) = 9 (teste unicaudal). A região de rejeição de H0 compreende
todos os valores de Tc ≥ 1,833 (Tabela 4 do Apêndice – Tabelas estatísticas selecionadas,
no final deste livro).
5. Decisão. Como Tc = 2,07 > Tt =1,833, H0 é rejeitada em prol de H1 = a média de vendas
por loja é maior que 100. Portanto, a nova marca de sabonete deverá ser aceita para ser
comercializada pela rede, pois a média de vendas, por loja, é maior que 100, ao nível de
confiabilidade de 0,05.
Exemplo com cálculo no SPSS – Com base nos dados do mesmo exemplo anterior,
com as dez primeiras lojas da Tabela 13.1 (n = 10).
Procedimentos para o teste:
1. H0 = a média de vendas por loja é menor ou igual a 100.
H1 = a média de vendas por loja é maior que 100 (teste unicaudal).
2. Estabelecer um nível de significância. Seja a = 0,05.
3. Resultado do teste no SPSS:
One-Sample Test
Test Value = 0
95% Confidence Interval
t df Sig. (2-tailed) Mean Difference of the Difference
Lower Upper
Vendas 24,036 9 ,000 109,40000 99,1039 119,6961

4. Decisão. Como p = 0,000 < a = 0,05 (teste unicaudal), H0 é rejeitada em prol de H1 = a


média de vendas por loja é maior que 100. Portanto, a nova marca de sabonete deverá ser
aceita para ser comercializada pela rede, pois a média de vendas por loja é maior que 100.

Testes para duas amostras não relacionadas – variável intervalar


Diferentemente das situações expressas anteriormente, quando interessa ao pesquisador de mar-
keting conceber afirmações sobre uma única variável e compará-las com dados já conhecidos
Técnicas Paramétricas para Análise de Dados 355

em outras situações, aqui se faz necessário comparar os resultados com os parâmetros de duas
populações diferentes e não relacionadas (ou independentes). O fato de serem independentes
significa que o que for medido em uma amostra não exerce nenhum efeito sobre o que for
medido na outra. Para essa situação, os testes de média para uma amostra, como os testes z e
t, a seguir apresentados, são os mais indicados.
Os procedimentos para os testes z e t em duas amostras não relacionadas são os mesmos
utilizados para os casos de uma amostra.

Teste z da diferença entre duas médias


O teste z da diferença entre duas médias é utilizado em pesquisas de marketing para verificar se
a diferença observada entre duas médias obtidas de amostras não relacionadas (independentes)
é suficientemente grande para ser considerada significativa.
Condições para utilização – Exclusivamente para variáveis intervalares; medições devem
ser efetuadas na mesma unidade ou escala; qualquer tamanho de amostras se o desvio-padrão da
população for conhecido. É adequado para amostras de tamanho superior a 30 elementos se o
desvio-padrão da população não for conhecido; se o tamanho da amostra for menor ou igual a
30, o teste recomendado é o t.
Teoria/Conceito – O princípio que norteia este teste é o de que, se as médias amostrais
de duas populações forem normalmente distribuídas, a distribuição de sua soma ou diferença
também será normalmente distribuída, desde que as populações que lhes deram origem sejam
normalmente distribuídas ou as amostras sejam superiores a 30 elementos. Neste caso, o cálculo
do teste será efetuado pela seguinte fórmula:
( x1 − x 2 ) − ( µ 1 − µ 2 )
Z=
σ x1 − x2
Em que:
x1 e x 2 = médias das amostras 1 e 2, respectivamente.
m1 e m2 = médias das populações 1 e 2 (desconhecidas), que, sob H0, são idênticas.
σ x1 − x2  = desvio-padrão da diferença das médias que é igual a:

σ x1 − x2 = σ 2x1 + σ 2x2

Sendo:
σ 12 σ2
σ 2x1 = σ 2x2 = 2
n1 e n2

Tem-se:

σ 12 σ 22
σ x1 − x2 = +
n1 n2

Exemplo com cálculo manual – Um fabricante de cigarros realizou uma pesquisa


entre 100 fumantes das classes socioeconômicas A/B e C/D e constatou que os fumantes da
classe A/B fumam, em média, 20 cigarros/dia, enquanto os da classe C/D, em média, fumam
356 Pesquisa de Marketing

25 cigarros/dia. Sabe-se, de estudos anteriores, que o desvio-padrão da população de fumantes


na classe A/B é de 10 cigarros e, na classe C/D, é de 14. Esse fabricante deseja saber se a
diferença verificada no consumo de cigarros entre as duas amostras deverá ser aceita como
verdadeira na população ou atribuída apenas a variações eventuais.
Procedimentos para o teste:
1. H0 = não há diferença entre fumantes das classes A/B e C/D, ou seja, µ1 = µ 2 .
H1 = há diferença entre fumantes das classes A/B e C/D, ou seja, µ1 ≠ µ 2 (teste bicaudal).
2. a = 0,05.
3. Calcular os valores de Zc utilizando as fórmulas apresentadas na teoria/conceito sobre o
teste:

100 196
σ x1 − x2 = + = 2,96 = 1,72
100 100
−5 − 0
Z c = [(20 − 25) − (µ1 − µ 2 )] / 1.720 = = −2,90
  1,72
(µ1 − µ 2 ) = 0, pois sob H0 ,µ1 = µ 2

4. Determinar a região de rejeição. Na tabela da distribuição padronizada Zt = + ou − 1,96


para a = 0,05 (teste bicaudal). As regiões de rejeição de H0 correspondem aos valores
de Zc ≤ Zt = −1,96, ou Zc ≥ Zt = 1,96 (Tabela 3 do Apêndice – Tabelas estatísticas
selecionadas, no final deste livro).
5. Decisão. Como o valor de Zc = −2,90 < Zt = −1,96, rejeita-se H0 em prol de H1 = há
diferença entre fumantes das classes A/B e C/D, ou seja, m1 ≠ m2, ao nível de significância
de 0,05.
Exemplo com cálculo no SPSS – Veja o exemplo seguinte com o teste t, já que não
há uma função específica para se calcular o teste z, e, para amostras maiores ou iguais a 30, os
resultados dos testes z e t são semelhantes.

Teste t da diferença entre duas médias


A utilização em pesquisas de marketing do teste t da diferença de duas médias é análoga à
do teste z.
Condições para utilização – Exclusivamente para variáveis intervalares; quando a
variância da população for desconhecida e n tiver qualquer tamanho (inclusive para os
casos em que n < 30, em que o teste z não pode ser utilizado).
Procedimento geral para o teste:
O procedimento para o teste t é idêntico ao do teste z e, neste caso, utiliza-se para o cálculo
da prova a seguinte fórmula:
( x1 − x 2 ) − ( µ 1 − µ 2 )
T =
Sx1 − x2

Em que:
x1 e x 2 = médias das amostras 1 e 2, e µ1 e µ 2 as médias das populações 1 e 2 (des-
conhecidas) que, sob H 0 → µ1 = µ 2 .
Técnicas Paramétricas para Análise de Dados 357

Sx1 - x2  = estimativa do desvio-padrão da diferença das médias e é igual a:

Sx1 - x2 = Sx21 + Sx22

Sendo:
n1
∑( xi 1 − x1 )2
Sx21 = i =1
para estimar σ 12
n1
e
n2
∑( xi 2 − x 2 )2
Sx22 = i =1
para estimar σ 22
n2
Tem-se que:
S1
Sx1 =
n1
e
S2
Sx2 =
n2
Portanto:
S12 S22
Sx1 − x2 = +
n1 n2

Exemplo com cálculo manual – Suponha-se que o teste para decisão sobre a adoção
de uma nova marca de sabonete numa rede de supermercados tenha sido realizado em duas
diferentes regiões, apresentando os seguintes resultados:
• Região 1: amostra de 10 lojas, com média de vendas de 109,4 unidades/loja/dia e
­desvio-padrão de 4,55 unidades.
• Região 2: amostra de 10 lojas, com média de vendas de 99,1 unidades/loja/dia e
­desvio-padrão de 20,5 unidades.
Com base nesses dados, deseja-se saber se há diferenças significativas no consumo do
produto em teste entre essas duas regiões.
Procedimentos para o teste:
1. H0 = não há diferença entre as médias de consumo nas duas regiões.
H1 = há diferença significativa entre as médias de consumo nas duas regiões, sendo o
consumo na Região 1 maior que na Região 2 (teste unicaudal).
2. a = 0,05.
3. Calcular os valores de t.

(4,55)2 (20,5)2 20,70 + 420,25


Sx1 − x2 = + = = 6,64
10 10 10
358 Pesquisa de Marketing

Tc = {(109,4 − 99,1) − (µ1 − µ 2 )} / 6,64 = 1,55


 
(µ1 − µ 2 ) = 0 pois sob H 0 , µ1 = µ 2

Tc = 1,55

4. Determinar a região de rejeição de t. Sendo Tt = 2,101, para a = 0,05 e gl = n1 + n2


− 2 = 18 (teste unicaudal), a região de rejeição de H0 corresponde a todos os valores
de Tc ≤ Tt = −2,101 ou a Tc ≥ Tt = 2,101 (Tabela 4 do Apêndice – Tabelas estatísticas
selecionadas, no final deste livro).
5. Decisão. Comparar Tc com Tt. Como Tc = 1,55 < Tt = 2,101, não é possível rejeitar
H0 = não há diferença entre as médias de consumo nas duas regiões, ao nível de signifi-
cância de 0,05.
Exemplo com cálculo no SPSS – Um gerente de marketing quer saber se as médias
de idade dos consumidores de dois diferentes produtos sob sua responsabilidade são iguais ou
diferentes para direcionar suas decisões de comunicação de forma conjunta ou separada. Os
dados de pesquisa obtidos com 19 consumidores, dos quais 10 consomem o produto 1, e 9,
o produto 2, estão apresentados na Tabela 13.2.
Tabela 13.2  Resultado da pesquisa
Consumidor Produto Idade
1 1 65
2 1 43
3 1 49
4 1 45
5 1 54
6 1 34
7 1 30
8 1 55
9 1 32
10 1 29
11 2 18
12 2 67
13 2 76
14 2 47
15 2 46
16 2 39
17 2 54
18 2 67
19 2 66

Procedimentos para o teste:


1. H0 = não há diferença entre as médias de idade dos consumidores dos dois produtos.
H1 = há diferença significativa entre as médias de idade dos consumidores dos dois produtos
(teste bicaudal).
2. a = 0,05.
3. Resultado do teste no SPSS:
Técnicas Paramétricas para Análise de Dados 359

Independent Samples Test


Levene's Test
for Equality of
Variances t-test for Equality of Means
95% Confidence Interval of Difference
Sig. Std. Error
(2-tai­- Mean Differ-
F Sig. t df led) Difference ence Lower Upper
Idade Equal 1,147 ,299 −1,390 17 ,182 −9,73333 7,00232 −24,50693 5,04026
variances
assumed
Equal −1,362 13,910 ,195 −9,73333 7,14718 −25,07181 5,60515
variances
not assu-
med

4. Decisão. Como p = 0,182 (variâncias iguais) ou 0,195 (variâncias diferentes) > a = 0,05


(teste bicaudal), aceita-se H0 = não há diferença entre as médias de idade dos consumidores
dos dois produtos.
É apresentado no Quadro 13.1 um resumo dos testes z e t sobre inferências da média para
uma amostra e para duas amostras não relacionadas.

Testes para duas amostras relacionadas – variável intervalar


Há situações que interessam ao pesquisador de marketing analisar ou comparar os resultados
dos questionamentos a duas amostras relacionadas (ou pareadas), ou seja, compostas pelos
mesmos indivíduos. Para esses casos, utiliza-se o teste tr.
Teste tr
O teste tr é o indicado para o caso de duas amostras relacionadas. Nestes casos, as formulações
anteriormente apresentadas não devem ser utilizadas. Será ilustrada a utilização do teste tr por meio
de um mesmo exemplo com cálculo manual e eletrônico.
Exemplo com cálculo manual – Um fabricante de vinhos pretende lançar uma nova
marca. Desenvolveu duas versões para embalagem, e a adoção de uma ou de outra deve ser
decidida por meio de pesquisa. Para realizar a pesquisa, solicitou que o novo vinho fosse
engarrafado nas duas versões de embalagem. Essas duas versões foram colocadas à venda numa
amostra aleatória de cinco lojas de uma rede de supermercados. Os resultados das vendas do
vinho nas duas embalagens, em cada uma das lojas, durante a semana que durou o teste, estão
na Tabela 13.3.
Com base nesses dados, qual embalagem deve ser adotada para o novo vinho?
Os passos para a realização do teste são os mesmos dos demais testes de hipóteses, como
apresentado a seguir.
Procedimentos para o teste:
1. H0 = não há diferença entre as médias de venda das duas embalagens.
H1 = há diferença entre as médias de venda das duas embalagens, sendo a média de vendas da
Embalagem 1 (58,8) maior que as da Embalagem 2 (55,2) (teste unicaudal).
360 Pesquisa de Marketing

Quadro 13.1  Resumo dos testes z e t sobre inferências da média para uma amostra e para duas
amostras não relacionadas
A variância da população é conhecida A variância da população é desconhecida
Uma n qualquer n < 30
amostra Dados em unidades
x−µ
x−µ T = , em que Sx = S / n
Z= ~ N (0,1) Sx
σ
∑( xi − x )
2
Dados em proporções
S=
n −1
p−P
Z= Utilizar a tabela t para gl = n − 1
σ
n ≥ 30
e
x − µ ou x−µ
p−P Z= Z=
Z= Sx S/ n
PQ / n
Duas n qualquer n < 30
amostras
não ( x − x 2 ) − ( µ1 − µ2 ) ( x1 − x 2 ) − ( µ1 − µ2 )
Z= 1 ~ N (0,1) T =
relacio- σ x1 − x2 Sx1 − x2
nadas e n ≥ 30

σ 12 σ 22 ( x1 − x 2 ) − ( µ1 − µ2 )
σ x1 − x2 = + Z=
n1 n2 Sx1 − x2 ,
Em que

S12 S22
Sx1 - x2 = Sx21 + Sx22 = +
n1 n2
Utilizar a tabela t para
gl = n1 + n2 − 2

Tabela 13.3  Resultado das vendas de vinho em duas embalagens diferentes


Vendas em unidades
Loja Embalagem 1 Embalagem 2 Diferença (d)
1 72 67 5
2 60 58 2
3 65 60 5
4 43 41 2
5 54 50 4
Totais 294 276
Técnicas Paramétricas para Análise de Dados 361

2. a = 0,05.
3. Calcular os valores de t. O cálculo de Tc é dado pela fórmula:

( xd − D )
Tc =
{[Sd / (n − 1)] }
Em que:
xd  = média das diferenças observadas entre as duas amostras em cada loja.
D = diferença esperada para H0, ou seja, D = 0.
n = número de diferenças, que no caso é 5.
Sd = desvio-padrão das diferenças observadas em relação à diferença média, que é calculado
pela seguinte fórmula:

∑ (d i − d )2
Sd = i =1
n −1
Aplicando essas formulações aos dados da Tabela 13.2, ter-se-á o seguinte resultado:
(5 + 2 + 5 + 2 + 4)
xd = = 3,6
5 .
(5 − 4,8)2 + (2 − 4,8)2 + (5 − 4,8)2 + (2 − 4,8)2 + (4 − 4,8)2 
Sd = = 4,1 = 2,024
(5 − 1)
(3,6 − 0) .
Tc = = 7,11
(2,024 / 4) .
4. Determinar a região de rejeição de t.Tt = 2,776 para a = 0,05 e gl = n − 1 = 5 − 1 = 4
(teste unicaudal). A região de rejeição de H0 corresponde a todos os valores de Tc ≤ Tt = −
2,776 ou a Tc ≥ Tt = 2,776 (Tabela 4 do Apêndice – Tabelas estatísticas selecionadas, no
final deste livro).
5. Decisão. Como Tc = 7,11 > Tt = 2,776, H0 é rejeitada em prol de H1 = há diferença entre
as médias de venda das duas embalagens, sendo a média de vendas da Embalagem 1 (58,8)
maior que as da Embalagem 2 (55,2), ao nível de significância de 0,05.
Exemplo com cálculo no SPSS – Nesse mesmo exemplo, o cálculo eletrônico apresenta
os seguintes resultados:

Paired Samples Test


Paired Differences
95% Confidence
Interval of the
Std. Std. Error Difference
Mean Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair Embalagem 1 3,60000 1,51658 ,67823 1,71692 5,48308 5,308 4 ,006
1 Embalagem 2
362 Pesquisa de Marketing

Decisão. Como a significância p = 0,006/2 = 0,003 (teste unicaudal) < a = 0,05, H0 é


rejeitada em prol de H1 = há diferença entre as médias de venda das duas embalagens ao nível
de significância de 0,05, sendo a embalagem 1 superior a 2.

TÉCNICAS MULTIVARIADAS DE INTERDEPENDÊNCIA


As técnicas paramétricas multivariadas de análise de dados são utilizadas em pesquisa de mar-
keting para verificar a interdependência entre as variáveis pesquisadas e compreendem: análise
fatorial exploratória, análise de conglomerados, análise de correspondência e escalonamento
multidimensional – MDS (Multidimensional Scaling).
As técnicas de interdependência consideram, simultaneamente, todas as variáveis na análise.

Análise fatorial exploratória


Análise fatorial exploratória é a denominação atribuída às técnicas estatísticas paramétricas mul-
tivariadas utilizadas para estudar o inter-relacionamento de um conjunto de variáveis observadas
visando obter redução e sumarização, denominada neste livro apenas de análise fatorial.
Historicamente, a análise fatorial tem sido empregada em pesquisas de marketing para identifi-
cação da estrutura, redução do volume de dados, construção de escalas e transformação dos dados.
Identificação da estrutura – A análise fatorial pode ser usada para descobrir a estrutura
básica que está por trás de um conjunto de medições. Por exemplo, pela análise fatorial, é
possível reduzir um conjunto de 40 diferentes atributos de um produto, medidos por 800
respondentes e que gerou 32.000 medições, para uma a cinco variáveis sínteses (fatores) que
permitirão maior compreensão e interpretação substantiva dessas medições.
Redução do volume de dados – A análise fatorial pode ser utilizada para reduzir
a massa de dados da pesquisa a uma quantidade gerenciável. A redução de um grande
número de variáveis para apenas alguns atributos permite a utilização desses fatores em
análises futuras, no lugar das variáveis originais, reduzindo, de forma considerável, o
volume de dados a ser processado e analisado.
Construção de escalas – A análise fatorial pode auxiliar o pesquisador na construção de
escalas. O problema da construção de escalas que agreguem muitas variáveis está na atribuição
dos pesos para a combinação das diversas variáveis na formação da escala. A análise fatorial
contribui para o processo reagrupando as variáveis em fatores independentes e atribuindo o
peso a ser usado em cada variável para ser combinado na escala.
Transformação dos dados – Várias técnicas estatísticas de análise da dependência, como
a regressão múltipla, só podem ser utilizadas com variáveis-prognóstico, desde que não es-
tejam correlacionadas. A análise fatorial pode ser empregada na identificação de fatores não
correlacionados para que essas técnicas possam ser utilizadas.
A partir de uma mesma matriz de dados pesquisados (indivíduos/variáveis), duas dife-
rentes abordagens de análise fatorial podem ser efetuadas: tipo R e tipo Q. A abordagem
tipo R consiste em procurar fatores no espaço das variáveis, ou seja, fatores que resultam
da combinação linear das variáveis pesquisadas. Assim, se as variáveis forem características
de uma categoria de produto, o resultado será diferentes agrupamentos de produtos, em
função das respostas às variáveis. A abordagem do tipo Q consiste em procurar fatores
no espaço dos indivíduos que responderam à pesquisa, ou seja, fatores que resultam da
combinação linear de indivíduos em função das respostas às variáveis. Assim, se as variáveis
Técnicas Paramétricas para Análise de Dados 363

forem características de indivíduos, o resultado agora será diferentes subcategorias de


indivíduos (segmentos) pesquisados, configurando a importância da análise fatorial no
processo de segmentação de mercado em marketing.
A análise fatorial tem sido empregada em pesquisas de marketing principalmente para a
redução de um grande número de variáveis estudadas em conjunto com um pequeno número
de fatores a elas relacionados. Alguns exemplos de seu emprego em pesquisas de marketing
da análise fatorial:
• Desenvolvimento de escalas de personalidades.
• Segmentação de mercado.
• Agrupamento de pessoas com base em suas similaridades de comportamento.
• Identificação dos atributos-chave do produto que determinam a preferência no consumo.
• Identificação de variáveis-chave que determinam a formação e a manutenção da imagem
da empresa.
• Identificação de similaridades entre produtos diferentes.
• Identificação dos pontos-chave da propaganda que mais sensibilizam a audiência.
• Desenvolvimento de um perfil de consumidores que reflita atividades, atitudes, opiniões,
interesses, percepções, preferências etc., de forma a predizer melhor o comportamento de
compra e de consumo.

Conceitos e termos utilizados na análise fatorial


Os seguintes conceitos e termos são utilizados na análise fatorial:
• Matriz de correlação – É a matriz que exibe todas as correlações simples entre todos
os pares possíveis de variáveis da pesquisa incluídas na análise. Em geral, utiliza-se apenas
o triângulo inferior da matriz.
• Matriz de correlação anti-imagem – É a matriz de correlações parciais entre variáveis,
após a análise fatorial, que representa o grau em que os fatores “explicam” um ao outro
nos resultados.
• Matriz de componentes principais – Matriz que mostra o total de variância explicada
pelos fatores gerados.
• Cargas dos fatores – São as correlações simples entre as variáveis e os fatores.
• Matriz de fatores – Contém as cargas dos fatores de todas as variáveis.
• Eigenvalue (Autovalor) – Representa a variância total explicada por cada fator.
• Comunalidade – É a proporção das variações totais das variáveis que estão envolvidas
com os fatores identificados.
• Gráfico das cargas dos fatores – É o gráfico das variáveis originais construído utili-
zando-se, como coordenadas, as cargas dos fatores.
• Porcentagem de variância – É a porcentagem da variância total atribuída a cada fator.
• Resíduos – São as diferenças entre as correlações observadas na matriz de correlações
inicial e as correlações estimadas pela matriz de fatores.
• Scree plot – Gráfico dos eigenvalues versus o número de fatores por ordem de extração.

Testes e precondições das variáveis e dos dados para a análise fatorial


Uma questão importante consiste em saber a priori se as variáveis e os dados são fatoriáveis,
ou seja, se formam um conjunto suficientemente coerente para pesquisar dimensões comuns
que façam sentido e que não sejam apenas resultados de processamentos estatísticos.
364 Pesquisa de Marketing

As variáveis devem ter origem em proposições teóricas sobre o tema, em análises empíricas
anteriores ou em fortes evidências percebidas pelo pesquisador ou contratante da pesquisa.
Essas análises podem ser informais, com o exame da matriz de correlações ou o exame das
comunalidades entre variáveis; ou formais, com um dos seguintes métodos:
• Teste da esfericidade de Bartlet – Testa a hipótese de que as variáveis não estejam corre-
lacionadas na população.
• Medida da adequacidade da amostra (Measure of Sampling Adequacity – MSA ou Kai-
ser-Meyer-Olkin – KMO) – Valores elevados dessa medida (entre 0,5 e 1) indicam que a
análise fatorial é adequada.

Passos da análise fatorial


Há quatro passos na condução da análise fatorial:
1. Cálculo das correlações entre as variáveis.
2. Extração inicial de fatores.
3. Rotação da matriz.
4. Análise/interpretação dos fatores.
Cálculo das correlações entre as variáveis – Para o cálculo da matriz de correlações,
podem ser utilizadas duas abordagens: análise fatorial R e análise fatorial Q. Na análise fatorial
R as correlações são calculadas entre variáveis e, na análise fatorial Q, entre casos. Nos pro-
cedimentos da análise fatorial R, procura-se agrupar as diferentes variáveis em alguns fatores
específicos. Casos podem ser pessoas, produtos, lojas ou quaisquer outros elementos medidos de
tal forma que, tratados pela análise fatorial, possam ser reunidos em agrupamentos específicos.
Esse procedimento poderá ser adotado para encontrar pessoas, produtos ou lojas que per-
tençam a diferentes grupos ou segmentos ou para reagrupar pessoas em grupos específicos.
Extração inicial dos fatores – Há diversos métodos de extração de fatores da matriz
de correlações. De forma geral, esses métodos são numericamente complexos para serem
aqui abordados por não fazerem parte dos objetivos deste livro. O método dos componentes
principais, muito utilizado na prática, servirá aqui para exemplificar os procedimentos da
análise fatorial.
O objetivo da extração de fatores é encontrar um conjunto de fatores que formem uma
combinação linear das variáveis na matriz de correlação. Dessa forma, se as variáveis X1, X2,
X3 são altamente correlacionadas entre si, serão combinadas para formar um fator e assim,
sucessivamente, com as demais variáveis da matriz de correlação. Uma combinação linear
entre variáveis pode ser expressa da seguinte forma:
F = b1X 1 + b2 X 2 + ... + bm X m
Em que F é uma combinação linear das variáveis X1, X2,..., Xm e é denominado de
componente principal.
O método dos componentes principais para análise fatorial envolve a procura de um
conjunto dos valores de b, na equação, que forme uma combinação linear que explique mais
variância na matriz de correlação que qualquer outro conjunto de valores para b. É chamado
de primeiro fator principal. A seguir, a variância explicada é extraída da matriz de correlações
original, obtendo-se, assim, a matriz residual. Dessa matriz de correlação residual, adotando-se
o mesmo procedimento, obtém-se o segundo fator principal e assim, sucessivamente, todos
os fatores principais, até que uma variância muito pequena permaneça sem ser explicada. A
Técnicas Paramétricas para Análise de Dados 365

natureza deste procedimento permite extrair fatores que não são correlacionados ou que
tenham correlação muito pequena uns com os outros. Nesse caso, os fatores são chamados
de ortogonais.
Rotação da matriz – A matriz inicial dos fatores (não girada) raramente resulta em fatores
facilmente interpretados, pois é uma matriz complexa em que os fatores estão correlacionados
com muitas variáveis. Para possibilitar as análises e interpretações dos fatores, faz-se necessária
a rotação da matriz inicial. A ideia básica do giro de fatores é identificar alguns fatores com
variáveis que tenham alta correlação e outros com variáveis que tenham baixa correlação. Para
essa rotação, podem ser utilizadas duas formas:
• Rotação ortogonal – Em que os eixos são mantidos em ângulo reto. O método Varimax
é a forma de rotação ortogonal mais utilizada, pois minimiza o número de variáveis com
altas cargas sobre um fator, facilitando a interpretação dos fatores.
• Rotação oblíqua – Em que os eixos não são mantidos em ângulo reto.
Análise/interpretação dos fatores – Em termos numéricos, os fatores são facilmente
identificáveis. Para atribuir identificação qualitativa aos fatores, estes podem ser identificados
pelas variáveis que têm sobre eles as maiores significâncias. Cabe ao analista utilizar de cria-
tividade para atribuir qualitativamente nomes aos fatores.
Exemplo ilustrativo da utilização da análise fatorial – Na Tabela 13.4 estão apre-
sentadas todas as correlações possíveis entre nove variáveis (análise fatorial R – correlações
entre variáveis) a partir dos dados coletados numa pesquisa (fictícia) para verificar quais são os
atributos do produto determinantes no processo de compra de automóveis novos, avaliados
numa escala de cinco pontos. A utilização da análise fatorial visará à redução desse conjunto
de nove atributos a um conjunto menor de fatores explicativos.
A Tabela 13.5 apresenta os fatores principais extraídos da matriz de correlação e a matriz
girada ortogonal (rotação varimax).1

Tabela 13.4  Matriz de correlações das variáveis relacionadas à compra de automóveis


Correlação entre variáveis
Variáveis 1 2 3 4 5 6 7 8 9
1. Desempenho 1
2. Modelo moderno ,76 1
3. Conforto ,48 ,47 1
4. Confiança na marca ,20 ,19 ,22 1
5. Durabilidade/qualidade ,08 ,07 ,13 ,42 1
6. Segurança ,25 ,25 ,22 ,53 ,36 1
7. Espaço (passageiros e bagagens) ,05 ,10 ,09 ,00 ,01 ,08 1
8. Economia (combustível e manutenção) ,28 ,30 ,31 ,20 ,09 ,31 ,45 1
9. Preço de aquisição ,18 ,21 ,26 ,33 ,18 ,33 ,34 ,48 1

1
 s cálculos para a realização dessa rotação são muito complexos e fogem ao escopo deste livro. A realização
O
da rotação de matrizes demanda uma quantidade tão grande de cálculos que a utilização da análise fatorial em
pesquisas de marketing só passou a ser viável com o advento dos computadores e dos programas de análises, que
possibilitaram a realização dos cálculos de forma rápida, precisa e econômica.
366 Pesquisa de Marketing

Tabela 13.5  Fatores principais extraídos da matriz de correlação e a matriz girada ortogonal (rotação varimax)
Matriz principal de fatores Matriz girada
Fatores
A B C
Variáveis A B C h2 Emocional Racional Econômico
1. Desempenho ,68 −,52 ,31 ,83 ,90 ,08 −,05
2. Modelo moderno ,69 −,51 ,26 ,80 ,89 ,07 −,01
3. Conforto ,63 −,32 ,16 ,53 ,69 +,15 −,17
4. Confiança na marca ,58 ,53 ,27 ,69 ,14 ,81 −,08
5. Durabilidade/qualidade ,38 ,59 ,29 ,57 −,02 ,76 ,03
6. Segurança ,63 ,44 ,16 ,62 ,20 ,73 −,20
7. Espaço (passageiros e ,33 −,04 –,77 ,70 −,02 –,13 −,83
bagagens)
8. Economia (combustível ,65 −,04 −,52 ,69 ,28 ,13 −,77
e manutenção)
9. Preço de aquisição ,62 ,22 −,42 ,61 ,13 ,36 −,68
Soma dos quadrados 3,12 1,51 1,40 6,03 2,23 1,97 1,83
% variância total 34,66 16,78 15,56 67,00 24,78 21,88 20,34
% variância comum 51,74 25,04 23,22 100,00 36,98 32,66 30,36

Analisando a Tabela 13.5, pode-se observar que existem três fatores que relacionam os
nove atributos. Os elementos da matriz principal, listados sob os fatores, são chamados de
carga dos fatores não girados. A carga dos fatores mede quais variáveis estão envolvidas e em
que grau e direção. A forma de entender o significado da carga é relembrar que ela é um
coeficiente de correlação simples entre uma variável e um fator. Quando se eleva a carga ao
quadrado estar-se-á calculando o coeficiente de determinação entre uma variável e um fator.
O coeficiente de determinação é a proporção de uma variação que uma variável tem em
comum com um fator não girado.
A coluna h2 mede as comunalidades. Matematicamente, h2 é igual à soma dos quadrados
de cada carga de cada variável em todos os fatores. Como exemplo, o cálculo de h2 para a
variável 1 (Desempenho) é:

h 2 = (,68)2 + ( −,52)2 + (,31)2 = 0,83


Tendo h2, calcula-se em que grau a variável não está relacionada com as outras, subtraindo-se de
1. Assim, 0,17 (= 1 − 0,83) é o grau que a variável 1 não está relacionada com as outras variáveis
(também chamado de medida da exclusividade).
Para obter a porcentagem da variância total dos dados, explicada pelos três fatores, também
chamada de variância comum, basta calcular H da seguinte forma:

soma de todos h 2
H= × 100 = 67%
númerode variáveis
Técnicas Paramétricas para Análise de Dados 367

Para calcular a quantidade de variação explicada em cada fator, basta somar os quadrados
das cargas atribuídas a cada fator, dividir pelo número de variáveis e multiplicar por 100. Por
exemplo, para o fator A, este valor é:
3,12
× 100 = 34,66%
9
Para efetuar o cálculo da quantidade de variação comum de cada fator, basta dividir a
variação explicada pela variância total dos dados explicada pelos três fatores (H), multiplicada
por 100, que, para o fator A, é:

34,66%
× 100 = 51,74%
67,00%
Note, na Tabela 13.4, que a comunalidade de cada variável permanece a mesma antes e
depois da rotação da matriz. Isso mostra que o giro dos fatores, quando feito simultaneamente,
aponta exatamente os mesmos valores para cada variável dos fatores não girados e que apenas
os pesos de cada variável em cada fator estão agora redistribuídos.
Já a quantidade de variação explicada em cada fator mudou da matriz principal para a ma-
triz girada. Na matriz principal, o fator A domina o quadro. Na matriz girada, as cargas foram
mudadas de tal forma que as quantidades de variações explicadas são agora aproximadamente
idênticas. Na matriz girada, fica fácil perceber agora, pelas grandes cargas atribuídas, quais são
as variáveis que compreendem cada fator.
As denominações a serem atribuídas aos fatores são de responsabilidade do pesquisador
que deve ser criativo e encontrar denominações que representem o conjunto de variáveis as-
sociadas ao fator. Assim, o fator A, denominado (pelo pesquisador) fator emocional, é composto
pelas variáveis: desempenho, modelo moderno e conforto; o fator B, denominado (pelo pes-
quisador) fator racional, é composto pelas variáveis: confiança na marca, durabilidade/qualidade
e segurança; e o fator C, denominado (pelo pesquisador) fator econômico, é composto pelas
variáveis: espaço, economia e preço.
Também é preciso observar, na apresentação feita da análise fatorial, que a atenção foi
concentrada em como dar entrada nos dados e em como interpretar as saídas, e muito pouco
em como o processamento é feito. Optou-se por esse caminho pelas seguintes razões: a com-
plexidade das formulações e teorizações existentes na análise fatorial é tão extensa que não
cabe apresentá-las num livro de pesquisa de marketing, uma vez que o interessado poderá
encontrá-las em outras obras especializadas; como a utilização da análise fatorial na prática
da pesquisa de marketing é feita essencialmente com o uso de computadores e programas de
análises especiais, não há necessidade de o pesquisador de marketing conhecer profundamente
suas formulações e teorizações, mas sim saber utilizá-los corretamente e, principalmente, saber
como interpretar os resultados obtidos. Nesse sentido, apresenta-se, a seguir, um exemplo de
análise fatorial processado no SPSS.
Obs.: Devido à complexidade dos cálculos matemáticos das análises multivariadas, os exemplos
ilustrativos serão apresentados apenas com cálculos eletrônicos realizados com o SPSS.
Exemplo da análise fatorial com cálculo no SPSS – Foi efetuada uma pesquisa para
identificar segmentos de mercado a partir da atitude dos consumidores em relação a atributos
ecológicos de produtos. Foram utilizadas 17 variáveis (assertivas) para medir, por meio do
368 Pesquisa de Marketing

nível de concordância com cinco categorias, a atitude dos consumidores entrevistados em


relação a cada uma delas. A análise fatorial foi utilizada para reduzir as 17 variáveis a fatores.
Todas as premissas para a utilização da análise fatorial a esses dados apontaram para a
correção de sua utilização:
• A matriz de correlação entre as variáveis apontou correlações expressivas de alguns pares
de variáveis, o que mostra que compartilham fatores em comum, possibilitando a rejeição
de H0 = correlação entre as variáveis é igual a zero e a aceitação de H1 = a correlação
entre as variáveis é diferente de zero.
• A matriz de correlação anti-imagem mostrou que os valores da diagonal principal apro-
ximaram-se de 1, e os valores das correlações parciais foram de pequena magnitude.
• O teste de Kaiser-Meyer-Olkin - KMO apresentou resultado acima de 0,5 (0,929).
• O teste de esfericidade de Bartlett apresentou Sig. igual a 0,000, o que permitiu rejeitar
H0 = a matriz de correlação é igual à matriz identidade e aceitar H1 = a matriz de corre-
lação é diferente da matriz identidade.
As 17 assertivas de atributos ecológicos de produtos estudadas nesta pesquisa foram as
seguintes, com suas respectivas denominações utilizadas no processamento:
1. Que sejam fabricados com matérias-primas renováveis ou recicláveis.
2. Que sejam fabricados com a quantidade mínima de ingredientes.
3. Que sejam fabricados com ingredientes naturais que não agridem a natureza quando extraídos.
4. Que sejam fabricados por empresas que economizam energia e água no processo de
produção.
5. Que sejam fabricados por empresas que despejam o mínimo de resíduos no processo de
fabricação.
6. Que sejam transportados por veículos que não poluam o meio ambiente.
7. Que suas embalagens sejam de materiais renováveis e recicláveis.
8. Que sejam biodegradáveis.
9. Que suas embalagens sejam mais leves.
10. Que suas embalagens possam conter maior quantidade de produtos.
11. Que os rótulos das embalagens sejam ricos em informações.
12. Que durem mais.
13. Que não ofereçam riscos à saúde, quando utilizados.
14. Que possam ser substituídos por refil.
15. Que sejam certificados por entidades que atestam que não agridem o meio ambiente.
16. Que não contenham gás CFC.
17. Que as embalagens, após o uso do produto, possam ser recicladas.
A análise das comunalidades mostrada na Tabela 13.6 apresentou algumas variáveis com
extrações abaixo de 0,5 [16 (0,499), 13 (0,497), 10 (0,482), 9 (0,387), 11 (0,392) e 14 (0,351],
o que exigiu algumas medidas para elevá-las.
Diferentes abordagens podem ser utilizadas para decidir o número de fatores a serem
incluídos na análise fatorial (Gorsuch, 1983:164-171), e a escolha da abordagem pode afetar
os resultados e sua credibilidade. As abordagens mais comuns são:
• Selecionar os fatores com eigenvalues de 1,000 ou maiores.
• Examinar a plotagem dos eigenvalues contra o número de fatores.
• Analisar o incremento de fatores e parar quando todas as variâncias não triviais tiverem
sido explicadas.
Técnicas Paramétricas para Análise de Dados 369

Tabela 13.6  Comunalidades


Variables Extraction
1 ,557
2 ,511
3 ,646
4 ,680
5 ,695
6 ,593
7 ,711
8 ,662
9 ,387
10 ,482
11 ,392
12 ,523
13 ,497
14 ,351
15 ,625
16 ,499
17 ,625

• Usar um número de fatores previsto na teoria relacionada ao assunto que deu embasamento
à pesquisa.
Com o intuito de elevar as comunalidades e permitir melhores resultados na utilização
da técnica da análise fatorial, foram aglutinados os fatores 2 e 3, que apresentaram eigenvalues
próximos a 1, em um único fator (Tabela 13.7).
Tabela 13.7  Total da variância explicada
Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Component Total % of Variance Cumulative % Total % of Variance Cumulative %
1 6,460 38,001 38,001 6,081 35,773 35,773
2 1,822 10,719 48,721 1,938 11,398 47,171
3 1,153 6,781 55,502 1,416 8,331 55,502

No entanto, o problema das baixas comunalidades permaneceu (foram observadas comu-


nalidades mais baixas ainda), como mostra a Tabela 13.8.
Tabela 13.8  Comunalidades após aglutinação dos fatores 2 e 3
Variables Initial Extraction
1 1,000 ,551
2 1,000 ,139
3 1,000 ,641
4 1,000 ,680
5 1,000 ,691
6 1,000 ,553
7 1,000 ,701
8 1,000 ,658
9 1,000 ,333
10 1,000 ,472
370 Pesquisa de Marketing

Tabela 13.8  Comunalidades após aglutinação dos fatores 2 e 3 (cont.)


Variables Initial Extraction
11 1,000 ,345
12 1,000 ,499
13 1,000 ,252
14 1,000 ,582
15 1,000 ,449
16 1,000 ,587
17 1,000 ,151
Procedeu-se à eliminação de todas as variáveis com comunalidades menores que 0,5: 9,
11, 12, 7 e 16.
Das 17 variáveis originais, restaram apenas 11 com comunalidades superiores a 0,5, como
mostra a Tabela 13.9, o que possibilitou a aplicação da análise fatorial a elas.
Tabela 13.9  Comunalidades após as rodadas de exclusão de variáveis
Variables Initial Extraction
1 1,000 ,549
3 1,000 ,661
4 1,000 ,700
5 1,000 ,711
6 1,000 ,562
7 1,000 ,709
8 1,000 ,660
10 1,000 ,667
12 1,000 ,669
15 1,000 ,558
17 1,000 ,586

Nesta solução, observa-se, na matriz de correlação na Tabela 13.10, expressiva correlação


de alguns pares de variáveis, o que mostra que compartilham fatores em comum, justificando
a utilização da técnica de análise fatorial. Esses resultados permitem a rejeição de H0 = não
há correlação entre as variáveis ou a correlação entre as variáveis é igual a zero e a aceitação
de H1 = a correlação entre as variáveis é diferente de zero.

Tabela 13.10  Matriz de correlação entre variáveis


1 3 4 5 6 7 8 10 12 15 17
Corre­lação 1 1,000 ,605 ,558 ,565 ,442 ,574 ,545 −,022 −,038 ,462 ,507
3 ,605 1,000 ,669 ,687 ,530 ,624 ,598 ,029 −,009 ,540 ,527
4 ,558 ,669 1,000 ,704 ,628 ,659 ,633 −,035 ,043 ,532 ,555
5 ,565 ,687 ,704 1,000 ,633 ,658 ,627 0,44 ,045 ,566 ,552
6 ,442 ,530 ,628 ,633 1,000 ,573 ,600 ,061 ,028 ,461 ,487
7 ,574 ,624 ,659 ,658 ,573 1,000 ,668 ,038 ,064 ,586 ,642
8 ,545 ,598 ,633 ,627 ,600 ,668 1,000 ,014 ,004 ,562 ,554
10 −,022 ,029 −,035 ,044 ,061 ,038 ,014 1,000 ,346 ,020 ,057
12 −,038 −,009 ,043 ,045 ,028 ,064 ,004 ,346 1,000 ,052 ,049
15 ,462 ,540 ,532 ,566 ,461 ,586 ,562 ,020 ,052 1,000 ,648
17 ,507 ,527 ,555 ,552 ,487 ,642 ,554 ,057 ,049 ,648 1,000
Técnicas Paramétricas para Análise de Dados 371

A Tabela 13.11 mostra que o teste Kaiser-Meyer-Olkin - KMO teve como resultado o


valor de 0,930, o que assegura a utilização da técnica de análise fatorial, uma vez que excede
o valor mínimo de 0,5; mostra ainda o resultado do teste de esfericidade de Bartlett, que
também corrobora a utilização da técnica, já que apresenta significância igual a 0,000, o que
permite rejeitar H0 = a matriz de correlação não é diferente da matriz identidade e aceitar
H1 = a matriz de correlação é diferente da matriz identidade.
Tabela 13.11  Teste KMO e teste de esfericidade de Bartlett
Kaiser-Meyer-Olkin Measure of Sampling Adequacy , 930
Bartlett's Test of Sphericity Approx. Chi-Square 3420,252
df 55
Sig. 0

A análise da matriz de correlação anti-imagem, apresentada na Tabela 13.12, contribui para


a decisão de utilizar a técnica, pois tanto os valores da diagonal principal aproximam-se de
1 quanto os valores das correlações parciais são de pequena magnitude. Os valores referidos
encontram-se na parte inferior da tabela.
Na Tabela 13.13, observa-se a formação de dois fatores que explicam 63,942% da variância,
o que se configura como razoável, uma vez que, “em ciências sociais... não é raro considerar
uma solução que explique 60% da variância total (e, em alguns casos, até menos) como satis-
fatória” (Hair Jr. et al., 2005:102). O critério de decisão do número de fatores a extrair foi
Tabela 13.12  Matriz de covariância anti-imagem e matriz de correlação anti-imagem
1 3 4 5 6 7 8 10 12 15 17
1 ,532 −,105 −,032 −,039 ,017 −,054 −,050 ,023 ,043 ,001 −,054
3 −,105 ,400 −,082 −,092 002 −,033 −,031 −,034 ,040 −,041 −,002
Anti-image covariance

4 −,032 −,082 ,361 −,080 −,091 −,049 −,042 ,075 −,044 −,004 −,026
5 −,039 −,092 −,080 ,352 −,092 −,042 −,026 −,019 −,012 −,047 −,003
6 ,017 ,002 −,091 −,092 ,491 −,030 −,091 −,049 ,021 ,003 −,023
7 −,054 −,033 −,049 −,042 −,030 ,368 −,087 −,004 −,034 −,034 −,097
8 −,050 −,031 −,042 −,026 −,091 −,087 ,421 ,000 ,025 −,060 −,017
10 ,023 −,034 ,075 −,019 −,049 −,004 ,000 ,857 −,299 ,022 −,035
12 ,043 ,040 −,044 −,012 ,021 −,034 ,025 −,299 ,861 −,026 ,001
15 ,001 −,041 −,004 −,047 ,003 −,034 −,060 ,022 −,026 ,486 −,172
17 −,054 −,002 −,026 −,003 −,023 −,097 −,017 −,035 ,001 −,172 ,454
1 ,954 a −,228 −,073 −,089 ,032 −,122 −,106 ,034 ,064 ,001 −,110
3 −,228 ,939 a −, 215 −,245 ,005 −,087 −,076 −,058 ,069 −,094 −,005
Anti-image correlation

4 −,073 −,215 ,937 a −,224 −,217 −,135 −,108 ,136 −,078 −,009 −,065
5 −,089 −,245 −,224 ,940 a −,222 −,177 −,069 −,035 −,022 −,114 −,007
6 0,32 ,005 −,217 −,222 ,941 a −,071 −,200 −,076 ,032 ,007 −,049
7 −,122 −,087 −,135 −,117 −,071 ,947 a −,222 −,006 −,060 −,079 −,237
8 −,106 −,076 −,108 −,069 −,200 −,222 ,952 a ,000 ,041 −,134 −,039
10 ,034 −,058 ,136 −,035 −,076 −,006 ,000 ,462 a −,348 ,034 −,056
12 ,064 ,069 −,078 −,022 ,032 −,060 ,041 −,348 ,484a −,040 ,001
15 ,001 −,094 −,009 −,114 ,007 −,079 −,134 ,034 −,040 ,929a −,367
17 −,110 −,005 −,065 −,007 −,049 −,237 −,039 −,056 ,001 −,367 ,922 a
Measures of Sampling Adequacy (MSA).
a
372 Pesquisa de Marketing

o eigenvalue, que considera, automaticamente, apenas os fatores com eigenvalues superiores a


1. Pode-se observar que o Fator 1 é o que mais explica a variância das variáveis (51,592%),
restando ao Fator 2 apenas 12,387% de explicação da variância.

Tabela 13.13  Fatores e a porcentagem de explicação da variância


Extraction sums of squared Rotation sums
Initial eigenvalues loadings of squared loadings
% of Cumul­- % of Cumul­- % of Cumul­-
Component Total variance ative % Total variance ative % Total variance ative %
1 5,675 51,592 51,592 5,675 51,592 51,592 5,671 51,554 51,554
2 1,358 12,349 63,942 1,358 12,349 63,942 1,363 12,387 63,942
3 ,683 6,210 70,152
4 ,659 5,991 76,143
5 ,578 5,250 81,393
6 ,433 3,932 85,325
7 ,387 3,517 88,842
8 ,364 3,313 92,156
9 ,299 2,716 94,872
10 ,288 2,620 97,492
11 ,276 2,508 100,000
Extraction Method: Principal Component Analysis.

A Figura 13.1 mostra o gráfico da formação de fatores onde pode ser visualizada a formação
de dois fatores com eigenvalue maior ou igual a 1.

Figura 13.1  Visualização da formação de fatores.

Na matriz dos componentes mostrada na Tabela 13.14, observa-se que o Fator 1 é compos-


to pelas variáveis 1, 3, 4, 5, 6, 7 e 8, e o Fator 2, pelas variáveis 10 e 12.
Técnicas Paramétricas para Análise de Dados 373

Tabela 13.14  Matriz de componentes


Variables Component
1 2
1 ,731 −,118
3 ,812 −,047
4 ,835 −,046
5 ,843 ,014
6 ,749 ,032
7 ,842 ,031
8 ,812 −,035
10 ,038 ,816
12 ,044 ,817
15 ,747 ,029
17 ,764 ,053

Rotacionando-se os fatores com o método Varimax, os resultados obtidos antes da rotação


são ratificados, conforme mostra a Tabela 13.15.
Tabela 13.15  Matriz de componentes rotacionados
Variables Component
1 2
1 ,735 −,095
3 ,813 −,022
4 ,836 −,020
5 ,843 ,040
6 ,748 ,055
7 ,840 ,057
8 ,813 −,009
10 ,013 ,817
12 ,019 ,818
15 ,745 ,052
17 ,762 ,077

Concluindo, o processamento da análise fatorial resultou em dois fatores:


• O Fator 1 (ao qual foi atribuído, pelo pesquisador, o nome de Ciclo de Vida), composto
pelas variáveis:
• 1. Que sejam fabricados com matérias-primas renováveis ou recicláveis.
• 3. Que sejam fabricados com ingredientes naturais que não agridem a natureza quando
são extraídos.
• 4. Que sejam fabricados por empresas que economizam energia e água no processo
de produção.
• 5. Que sejam fabricados por empresas que despejam o mínimo de resíduos no processo
de fabricação.
• 6. Que sejam transportados por veículos que não poluam o meio ambiente.
• 7. Que suas embalagens sejam de materiais renováveis e recicláveis.
• 8. Que sejam biodegradáveis.
374 Pesquisa de Marketing

• O Fator 2 (ao qual foi atribuído, pelo pesquisador, o nome de Economicidade), composto
pelas seguintes variáveis:
• 10. Que suas embalagens possam conter maior quantidade de produtos.
• 12. Que durem mais.

Análise de conglomerados
Enquanto a análise fatorial é apropriada à redução de variáveis em fatores, a análise de con-
glomerados permite ao pesquisador classificar objetos ou indivíduos observados em relação a
inúmeras variáveis, em subgrupos ou conglomerados definidos ou não a priori, mas que surgem
em função da análise realizada. Uma das principais aplicações da análise de conglomerados
em marketing é a subdivisão do mercado em segmentos, utilizando medidas multivariadas dos
consumidores, como demográficas, sociais, econômicas e psicográficas. Cada agrupamento (con-
glomerado) terá por característica grande similaridade interna e grande dissimilaridade externa.
Para exemplificar os procedimentos, suponham-se os dados da Tabela 13.16, obtidos em escalas
de renda e ocupação de nove consumidores que se deseja agrupar em segmentos socioeconômicos.
Tabela 13.16  Dados de renda e ocupação de consumidores que se deseja agrupar em
segmentos socioeconômicos
Consumidor Pontuação obtida na variável
Renda (X1) Ocupação (X2)
A 25,00 25,00
B −20,00 −22,50
C 30,00 20,00
D 25,00 17,50
E 2,50 10,00
F −15,00 −17,50
G 2,50 −5,00
H 0,50 0,50
I −25,00 −20,00

Uma primeira maneira de obter os agrupamentos é plotar os resultados num gráfico


bidimensional e, visualmente, determinar os segmentos. Na Figura 13.2, construída a partir
dos dados da Tabela 13.16, podem ser identificados visualmente três conglomerados (ou, no
caso, segmentos): segmento 1, formado pelos consumidores A, C e D; segmento 2, formado
pelos consumidores E, G e H; e o segmento 3, formado pelos consumidores B, F e I. A deter-
minação visual de conglomerados só é possível quando o número de variáveis de segmentação
não ultrapassar três. Quando o número de variáveis for maior que três, apenas por métodos
analíticos e objetivos será possível identificar os conglomerados.
Distância euclidiana de duas medidas – Uma medida da similaridade entre indivíduos que
leve em consideração, simultaneamente, diversas variáveis se faz necessária. Essa medida é chamada
de distância euclidiana da medida da similaridade, que pode ser estabelecida em termos absolutos
ou quadráticos. No caso particular de duas variáveis do exemplo, para os consumidores D e H, é:

d D ,H = ( X 1H − X 1D )2 + ( X 2 H − X 2 D )2
d D ,H = (5 − 25)2 + (5 − 17,5)2
d D ,H = 23,6
Técnicas Paramétricas para Análise de Dados 375

Figura 13.2  Identificação visual de conglomerados.

O mesmo raciocínio pode ser generalizado para o cálculo da distância euclidiana para n
variáveis.
Para a realização da análise de conglomerados, são utilizadas as distâncias euclidianas
médias. No exemplo considerado, a distância média entre os pontos D e H é d D ,H mé-
dia = 23,6/2 = 11,8.
O procedimento seguinte é a construção de uma matriz das distâncias médias entre todos
os pares de consumidores estudados, conforme mostra a Tabela 13.17, construída a partir do
exemplo. Note que a distância é uma medida inversa da similaridade, pois, quanto maior a
distância entre dois sujeitos, mais diferentes eles serão em relação às variáveis consideradas.
Note também o elevado volume de cálculos necessários para a construção de uma matriz
desse tipo, que, no exemplo simplificado, com apenas nove indivíduos e duas variáveis,
resultou em C9,2 = 9!/(9 − 2)! 2! = 36 distâncias a serem calculadas. Os conglomerados não

Tabela 13.17  Matriz das distâncias médias entre pares de consumidores


A B C D E F G H I
0,0
B 32,7 0,0
C 3,5 32,8 0,0
D 3,7 30,1 2,8 0,0
E 13,5 19,7 14,6 11,9 0,0
F 29,2 3,5 29,3 26,6 16,3 0,0
G 18,7 14,2 18,6 15,9 7,5 10,8 0,0
H 14,1 18,6 14,6 11,8 2,8 15,1 5,1 0,0
I 33,6 2,8 34,0 31,2 20,3 5,1 15,7 19,5 0,0
376 Pesquisa de Marketing

são facilmente identificados nessa matriz, exigindo algum procedimento adicional que facilite
essa identificação.
Partindo dessa matriz, existem três diferentes métodos para se proceder à análise de con-
glomerados: método das ligações, método nodal e método fatorial, cujos objetivos idênticos
são: classificar objetos ou indivíduos de tal forma que tenham, tanto quanto possível, grande
similaridade no grupo e grande dissimilaridade entre os grupos. O conjunto desses métodos
emprega um número tão grande, diverso e complexo de algoritmos que sua apresentação
detalhada exigiria um extenso livro específico.
Durante várias décadas, a análise de conglomerados não foi empregada em pesquisas
de marketing justamente devido à complexidade e volume de cálculos que tornavam
inviável sua operacionalidade. Com o desenvolvimento da informática, essa barreira foi
superada, e a análise de conglomerados passou a ser utilizada. Dos três métodos existentes,
será apresentado apenas o primeiro, com o objetivo específico de exemplificar o que é a
análise de conglomerados.
Método das ligações – O método das ligações subdivide-se em: método das ligações
simples, método das ligações completas e método das ligações médias. Só será detalhado, pelas
razões já expostas, o primeiro.
Método das ligações simples – Os procedimentos desse método compreendem, inicialmente,
partindo-se dos dados da matriz de distâncias médias, colocar em ordem crescente de dis-
tâncias, por exemplo, menores do que dez, os pares de indivíduos cujos resultados estão na
Tabela 13.18.

Tabela 13.18  Ordenamento crescente das distâncias entre pares de


consumidores pesquisados
Distância Pares de consumidores
2,8 CD, BI e EH
3,5 AC e BF
3,7 AD
5,1 Fl e GH
7,5 EG

A análise da Tabela 13.18 permite facilmente identificar os conglomerados. Por exemplo,


pode-se observar que C está próximo de D, D está próximo de A e A está próximo de C,
constituindo-se num conglomerado e, assim, sucessivamente, identificam-se os demais con-
glomerados: B, F e I; e E, G e H. Esses conglomerados podem ser visualizados conforme o
diagrama na Figura 13.3.

Figura 13.3  Visualização dos conglomerados.


Técnicas Paramétricas para Análise de Dados 377

Nos procedimentos para a realização de análises de conglomerados, recomendam-se os


seguintes passos:
1. Selecionar e codificar as variáveis (ou atributos).
2. Produzir estimativas das semelhanças (matriz de distâncias).
3. Proceder à conglomeração por meio de um dos três métodos apresentados.
4. Testar o sistema e nomear os conglomerados obtidos.
Exemplo com cálculo no SPSS – Seja o mesmo exemplo com os dados que cons-
tam da Tabela 13.17, sobre os quais foram processados no SPSS os métodos quadrado da
distância euclidiana e aglomeração between groups,2 obtendo-se os resultados apresentados
no Quadro 13.2.

Quadro 13.2  Identificação de conglomerados pelo SPSS


Cluster Combined Stage Cluster First Appears
Stage Cluster 1 Cluster 2 Coefficientes Cluster 1 Cluster 2 Next Stage
1 2 9 ,079 0 0 5
2 3 4 ,079 0 0 4
3 7 8 ,100 0 0 6
4 1 3 ,152 0 2 7
5 2 6 ,197 1 0 8
6 5 7 ,479 0 3 7
7 1 5 2,722 4 6 8
8 1 2 6,533 7 5 0

Segundo a “regra de parada” (que determina o número de conglomerados gerados no


estágio em que se observa uma mudança radical do coeficiente), observa-se, no Quadro 13.2,
a formação de três conglomerados da rodada 6 para a 7, em que houve mudança radical do
coeficiente de 0,479 para 2,722. Dessa forma, segundo esse método, foram identificados três
segmentos de mercado.

Análise de correspondência
Trata-se de uma técnica multivariada, relativamente nova, que possibilita a mensuração da
proximidade de variáveis e suas categorias medidas em escalas não intervalares, ou que possam
ser transformadas em dados categóricos. Tem grande aplicação em pesquisas de marketing,
uma vez que muitas pesquisas objetivam observar o relacionamento de determinados perfis
de consumidores em relação a seus comportamentos e interesses. É uma técnica exploratória,
que busca descobrir possíveis relações entre variáveis, sem, no entanto, gerar testes de hipótese.
Condições para utilização – Duas ou mais variáveis, com duas ou mais categorias cada;
dados medidos em escalas nominal ou ordinal.
Exemplo com cálculo no SPSS – Para definir o público-alvo e o nível de qualidade
de um energético, uma empresa deseja conhecer qual o relacionamento, se existente, entre a
classe social (4 classes), a preferência por marca (4 marcas), o gênero (1- masculino; 2- feminino)
e a expectativa de desempenho do produto (escala de 1 a 10). Dessa forma, foram coletados
2
 método de aglomeração between groups é aquele que considera a distância média de todos os indivíduos de
O
um grupo em um agrupamento em relação aos demais em outro agrupamento.
378 Pesquisa de Marketing

dados de 25 consumidores, em escala nominal para gênero e ordinais para marca, classe social
e desempenho, conforme apresentados na Tabela 13.19.
Tabela 13.19  Dados obtidos de classe social, preferência por marca, gênero e expectativa
de desempenho do produto
Classe Preferência Expectativa do
Consumidor socioeconômica por marca Gênero desempenho do produto
1 2 4 2 8
2 3 3 1 9
3 3 4 2 7
4 2 4 1 6
5 2 3 1 9
6 2 4 2 7
7 1 3 2 7
8 2 1 1 5
9 4 4 2 10
10 3 3 1 8
11 1 4 1 6
12 4 2 1 8
13 2 3 2 8
14 3 2 1 10
15 4 3 2 10
16 2 3 2 7
17 2 3 2 10
18 2 1 2 10
19 3 1 2 8
20 2 2 2 8
21 1 4 2 7
22 3 3 2 9
23 2 3 1 9
24 2 3 1 7
25 2 3 2 9

A análise dos resultados do processamento da Anacor (Análise de correspondência) foi feita


com base na porcentagem da variância explicada pelas dimensões geradas, em que, quanto mais
próximo o total for de 100%, melhor; e também observando-se visualmente as proximidades
das variáveis trabalhadas no mapa gerado pelo software.
Após padronizar os dados, uma vez que foram medidos em escalas diferentes (tipos e
tamanhos) e processados no SPSS com a técnica Optimal Scaling (usada quando há mais de
duas variáveis para análise), foram gerados os resultados a seguir apresentados.
O Quadro 13.3, produzido pelo SPSS com os dados da Tabela 13.19, mostra que a
Dimensão 1 explica 51,006% da variância, enquanto a Dimensão 2 explica 43,543%, e que

Quadro 13.3  Dimensões e porcentuais que explicam a variância


Model Summary
Variance Accounted For
Dimension Cronbach's Alpha Total (Eigenvalue) Inertia % of Variance
1 ,680 2,040 ,510 51,006
2 ,568 1,742 ,435 43,543
Total 3,782 ,945
Mean ,628a 1,891 ,473 47,274
a
Mean Cronbach's Alpha is based on the mean Eigenvalue.
Técnicas Paramétricas para Análise de Dados 379

a solução com essas duas dimensões explica 94,549% da variância dos dados, porcentual
elevado e considerado adequado à utilização da técnica.
Ressalte-se que é possível explicar até 100% da variância com a agregação de mais dimensões
ao se processarem os dados; no entanto, costuma-se optar pelo cálculo com duas dimensões, por
causa das dificuldades na realização de uma análise visual com muitas variáveis. A Figura 13.4
mostra a posição das diversas variáveis, a partir do processamento dos dados no SPSS.

Figura 13.4  Posição das variáveis com o processamento dos dados no SPSS.

A análise visual da Figura 13.4, juntamente com os dados da Tabela 13.19, permite ver


quão próximos ou distantes determinadas variáveis e suas categorias estão entre si. É possível
perceber três conjuntos: o primeiro é composto por pessoas das classes D e E, que preferem a
marca 4 e têm expectativa de desempenho 6 e 7 (o gênero mais próximo é o feminino, mas a
visualização indica haver pouca correlação com essa variável); o segundo conjunto é composto
por indivíduos da classe A, que preferem a marca 2 e esperam desempenho 10 do produto (o
gênero mais próximo também é o feminino, mas a visualização indica haver pouca correlação
com essa variável); e o terceiro conjunto é formado por homens, das classes B e C, que preferem
as marcas 1 e 3, com os desempenhos próximos de 5, 8 e 9.

Escalonamento multidimensional – MDS (Multidimensional Scaling)


O escalonamento multidimensional - MDS (Multidimensional Scaling) é uma técnica que per-
mite observar a interdependência entre diversas variáveis utilizando medidas de similaridades
ou de preferências entre objetos. Para utilizá-la, os dados precisam ser medidos em escalas
métricas (no entanto, escalas ordinais,3 como a de Likert, vêm sendo utilizadas, em função dos
resultados semelhantes que propiciam). Trata-se de uma técnica bastante útil para marketing,

3
 o entanto, o tratamento com MDS de variáveis medidas em escalas ordinais exige que tenham distribuição
N
normal ou, ao menos, simétrica (Pestana e Gageiro, 2003).
380 Pesquisa de Marketing

por gerar mapas de alocação das variáveis, utilizadas para decidir sobre o posicionamento de
ofertas.
Condições para utilização – Duas ou mais variáveis; dados medidos em escalas métricas.
Exemplo com cálculo no SPSS – A fim de reposicionar sua linha de produtos, um gerente
de marketing solicitou um estudo de mapeamento perceptual das dez principais marcas
concorrentes no mercado, com o objetivo de verificar como os clientes percebem sua marca
(C) comparativamente às demais em relação a determinadas variáveis. O gerente pretende que
sua marca seja percebida como concorrente da marca J, líder de mercado. Os dados coletados
na pesquisa com 40 consumidores, em escala Likert de cinco pontos, estão na Tabela 13.20.
Duas medidas são importantes na análise do escalonamento multidimensional: o
Stress e o RSQ. O Stress é uma medida de ajuste entre os inputs e os outputs e, quanto
menor, melhor; assim, um Stress maior que 0,20 indica que a qualidade do ajuste é
pobre. O RSQ é o coeficiente de correlação ao quadrado entre os dados e as distâncias
euclidianas e, quanto maior, melhor.
O processamento dos dados da pesquisa no SPSS apresentou como resultado para essas
duas medidas: Stress = 0,10749 e RSQ = 0,94391.
No exemplo apresentado, tanto o Stress quanto o RSQ podem ser considerados adequados.
Caso se queira melhorar a qualidade do ajuste, podem ser inseridas dimensões adicionais ao mapa.
No entanto, deve-se considerar o aumento da dificuldade para a análise que essa elevação pode
causar. Conforme se observa na Figura 13.5, há proximidade entre as marcas C e D, F e A H e B
e J, I e G, e um isolamento da marca E.

Figura 13.5  Mapa perceptual gerado pelo SPSS.

TÉCNICAS PARA MEDIR A DEPENDÊNCIA


A seguir, apresentam-se as técnicas paramétricas de análise de dados mais utilizadas em pes-
quisa de marketing: correlação e regressão (simples e múltipla), Anova (Análise da variância),
Técnicas Paramétricas para Análise de Dados 381

Tabela 13.20  Avaliação de dez marcas por consumidores na escala Likert de cinco pontos
Avaliação das marcas
Respondentes
A B C D E F G H I J
1 2 2 2 2 2 4 2 3 2 2
2 2 3 1 2 5 3 4 4 4 3
3 3 3 1 5 5 4 2 3 2 2
4 2 3 2 2 2 4 2 4 2 2
5 2 2 2 2 2 3 2 4 2 2
6 3 3 4 2 2 4 4 3 4 3
7 4 3 2 2 2 3 2 3 2 2
8 3 5 2 2 5 1 3 3 3 3
9 5 5 2 2 5 4 3 4 1 1
10 3 2 3 3 2 3 4 4 4 3
11 3 4 3 4 2 4 2 4 3 4
12 5 2 3 3 2 2 3 3 3 3
13 4 3 4 4 2 3 4 4 4 4
14 2 4 3 2 5 2 2 3 2 2
15 4 3 3 3 3 3 4 4 4 4
16 2 3 5 5 5 3 5 3 5 5
17 1 3 1 1 2 3 2 4 2 3
18 3 4 4 3 2 5 4 4 4 4
19 2 3 3 1 5 1 3 4 3 3
20 2 3 2 1 5 2 3 3 3 3
21 4 3 4 3 3 4 4 4 4 3
22 2 2 1 3 4 3 4 4 2 4
23 2 3 3 2 2 3 3 4 3 3
24 5 3 1 0 1 3 1 3 2 2
25 4 3 3 2 2 3 3 4 3 4
26 4 1 4 4 2 4 4 4 4 1
27 2 3 2 3 2 4 3 4 3 2
28 4 3 3 2 2 3 3 4 2 3
29 2 3 3 3 1 4 3 4 2 3
30 4 3 3 2 5 3 4 4 4 4
31 3 3 3 2 2 3 3 4 2 3
32 3 2 4 4 2 3 4 4 4 4
33 2 4 4 3 5 3 4 4 4 2
34 3 2 2 3 2 3 3 3 3 2
35 3 3 2 2 2 3 4 4 3 3
36 2 4 3 2 2 4 3 3 2 2
37 4 3 2 2 5 4 2 4 3 3
38 3 2 4 2 2 5 4 4 4 3
39 3 4 4 2 2 3 4 4 4 3
40 4 4 1 2 3 3 3 4 5 1
Totais 120 121 108 99 116 129 126 148 122 113
382 Pesquisa de Marketing

Manova (Análise multivariada da variância) e análise discriminante e classificatória. Analoga-


mente às outras apresentações de métodos estatísticos de análise neste livro, será mostrado o es-
sencial do método para que o pesquisador de marketing possa ter noção de sua aplicabilidade
e dos procedimentos básicos para aplicação, sem aprofundamento em considerações teóricas.

Métodos de correlação e regressão


A correlação e a regressão são técnicas de análise estatística que têm grande utilidade na
identificação e na quantificação do relacionamento entre uma variável-critério e uma ou mais
variáveis-prognóstico. Com frequência, na prática da pesquisa de marketing, faz-se necessário
verificar a existência de relacionamento entre duas ou mais variáveis. Procura-se expressar este
relacionamento, com base em dados observados, sob a forma matemática de uma equação que
interligue as variáveis e permita que, conhecendo-se o(s) valor(es) de uma(s), haja condições
de prever o valor de outra.
Os conceitos de correlação e regressão, apesar de diferentes, estão intimamente relacionados.
A correlação diz respeito ao grau de associação ou correspondência existente entre uma
variável-critério e uma ou mais variáveis-prognóstico. Note que se evita denominar as variáveis,
cujo relacionamento está sendo estudado, de dependente e independente, pois é muito difícil
estabelecer uma relação de dependência/independência.
A regressão refere-se à natureza da associação estatística, isto é, à correspondência de uma
variável-critério em relação a uma ou mais variáveis-prognóstico.
Equações de ajustamento – O primeiro passo para a determinação de uma equação de
ajustamento é o levantamento de dados a respeito das variáveis em estudo. O segundo passo
consiste em plotar num diagrama de dispersão os pontos correspondentes aos valores obtidos
para as variáveis em estudo (X1, Y1), (X2, Y2) etc., como exemplifica a Figura 13.6.

Figura 13.6  Diagramas de dispersão.

Existem dois métodos para se definir uma curva de ajustamento a um conjunto de dados
observados. O primeiro é o método de ajustamento de curva à mão livre. Traça-se uma curva à
mão livre que se ajuste aos pontos definidos pelos dados. A partir dessa curva, conhecendo-se o
tipo de equação da curva, será possível obter suas constantes, mediante a escolha de tantos pontos
da curva quantas forem as constantes da equação e, assim, definir a equação de ajustamento. Esse
método tem como desvantagem a imprecisão, levando diferentes analistas a obter diferentes curvas
e equações de ajuste.
O segundo método, mais recomendado pela precisão, é o dos mínimos quadrados, que
permite definir a melhor curva de ajustamento possível. Para explicar o método dos mínimos
quadrados, considere a curva desenhada na Figura 13.7, em que os dados que lhe deram
origem estão representados pelos pontos (X1, Y1); (X2, Y2); (Xn, Yn). Para um dado valor de X,
por exemplo, X1, haverá uma diferença entre Y1 e o valor correspondente determinado pela
curva de ajuste C. Essa diferença está representada na Figura 13.7, por d1, chamada de desvio.
Técnicas Paramétricas para Análise de Dados 383

De modo semelhante, em correspondência aos outros valores de X, obtêm-se os desvios em


Y: d1, d2..., dn. Uma medida da qualidade do ajustamento da curva C aos dados é proporcionada
n
por ∑ (di ) 2
. Se essa somatória for pequena, o ajustamento é elevado; se for grande, o ajus-
i =1
tamento é baixo.

Figura 13.7  Curva de mínimos quadrados.

O melhor ajustamento possível será proporcionado pela curva que minimizar a somatória
dos desvios, a chamada curva de mínimos quadrados.
Regressão – Em pesquisas de marketing, é frequente a necessidade de, com base em dados
amostrais, prever o valor de uma variável (critério), correspondente ao conhecido valor de
uma ou mais de uma variável (prognóstico). Isso pode ser conseguido mediante a construção
de uma equação ou de uma curva de mínimos quadrados. A equação, ou curva, resultante é
denominada de regressão de Y para X, visto que Y é avaliado a partir de X. Quando a relação
for apenas entre duas variáveis, a regressão é denominada simples; quando for entre uma
variável e mais de uma variável é denominada múltipla. A regressão é, portanto, uma técnica
de dependência, ou seja, um conjunto de variáveis-critério (independentes) é usado para
prever ou explicar uma ou mais variáveis prognóstico (dependentes).
Regressão linear simples – Para o caso particular de uma reta, a curva de regressão que se
ajusta aos dados tem a seguinte equação:4
Y = a1 + a2 X
Em que:
Y = variável-critério que representa o valor esperado de Y dado determinado valor de X.
X = variável-prognóstico.
a1 = valor de Y para X = 0.
a2 = valor médio de Y por unidade de X.
As constantes a1 e a2 são determinadas mediante a resolução do sistema de equações:
ΣY = a1n + a2 ΣX
ΣXY = a1 ΣX + a2 ΣX 2
As constantes a1 e a2 podem ser determinadas pelas fórmulas:
( ∑ Y )( ∑ X 2 ) − ( ∑ X )( ∑ YX )
a1 =
n( ∑ X 2 ) − ( ∑ X )2
4
Esta é uma equação da reta, mas o mesmo raciocínio é válido para equações de parábolas, de 3° e n graus.
384 Pesquisa de Marketing

e
n( ∑ XY ) − ( ∑ X )( ∑ Y )
a2 =
n( ∑ X 2 ) − ( ∑ X )2
Exemplo de cálculo manual de regressão e correlação simples – Uma empresa
produtora de bens de consumo de massa levantou um histórico de dez anos das vendas em mi-
lhares de unidades de um produto seu, dos investimentos em milhões de R$ em comunicação
(propaganda, promoção de vendas etc.) e do número de vendedores para esse mesmo produto.
Os resultados desse levantamento estão na Tabela 13.21 e na Figura 13.8.
Tabela 13.21  Relação entre investimentos em comunicação, número de vendedores e vendas
Ano X Comunicação (milhões de R$) Z Número de vendedores Y Vendas (milhares de unidades)
2002 9,5 10 95
2003 6,5 8 60
2004 7,0 9 60
2005 8,0 12 80
2006 7,5 15 80
2007 8,5 11 80
2008 7,5 13 85
2009 5,5 7 60
2010 8,0 15 85
2011 6,0 10 65

Figura 13.8  Relação entre investimentos em comunicação e vendas.


Para facilitar a determinação da equação de regressão e de outras medidas apresentadas adiante,
são apresentados, na Tabela 13.22, os cálculos necessários, efetuados a partir dos dados originais
do problema e, no Quadro 13.4, algumas estatísticas calculadas a partir dos dados da Tabela 13.22.
Tabela 13.22  Cálculos efetuados para determinar a equação de regressão
Ano X Z Y X2 XY Z2 ZY Y2 XZ
2002 9,5 10,0 95,0 90,3 902,5 100,0 950,0 9.025,0 95,0
2003 6,5 8,0 60,0 42,3 390,0 64,0 480,0 3.600,0 52,0
2004 7,0 9,0 60,0 49,0 420,0 81,0 540,0 3.600,0 63,0
2005 8,0 12,0 80,0 64,0 640,0 144,0 960,0 6.400,0 96,0
2006 7,5 15,0 80,0 56,3 600,0 225,0 1.200,0 6.400,0 112,5
2007 8,5 11,0 80,0 72,3 680,0 121,0 880,0 6.400,0 93,5
2008 7,5 13,0 85,0 56,3 637,5 169,0 1.105,0 7.225,0 97,5
2009 5,5 7,0 60,0 30,3 330,0 49,0 420,0 3.600,0 38,5
2010 8,0 15,0 85,0 64,0 680,0 225,0 1.275,0 7.225,0 120,0
2011 6,0 10,0 65,0 36,0 390,0 100,0 650,0 4.225,0 60,0
Total 74,0 110,0 750,0 560,5 5.670,0 1.278,0 8.460,0 57.700,0 828,0
Médias 7,4 11,0 75,0

Ano (X − X) (Z − Z) (Y − Y) [(X − X) (Y − Y)] [(Z - Z) (Y - Y)] [(X − X) (Z − Z)] (X − X)2 (Z − Z)2 (Y − Y)2 [(X − X) (Z − Z)(Y − Y)]
2002 2,1 −1,0 20,0 42,0 −20,0 −2,1 4,4 1,0 400,0 −42,0
2003 −0,9 −3,0 −15,0 13,5 45,0 2,7 0,8 9,0 225,0 −40,5

Técnicas Paramétricas para Análise de Dados


2004 −0,4 −2,0 −15,0 6,0 30,0 0,8 0,2 4,0 225,0 −12,0
2005 0,6 1,0 5,0 3,0 5,0 0,6 0,4 1,0 25,0 3,0
2006 0,1 4,0 5,0 0,5 20,0 0,4 0,0 16,0 25,0 2,0
2007 1,1 - 5,0 5,5 - - 1,2 - 25,0 -
2008 0,1 2,0 10,0 1,0 20,0 0,2 0,0 4,0 100,0 2,0
2009 −1,9 −4,0 −15,0 28,5 60,0 7,6 3,6 16,0 225,0 −114,0
2010 0,6 4,0 10,0 6,0 40,0 2,4 0,4 16,0 100,0 24,0
2011 −1,4 −1,0 −10,0 14,0 10,0 1,4 2,0 1,0 100,0 −14,0
Total - - - 120,0 210,0 14,0 12,9 68,0 1,450 −191,5
Médias

385
386
Pesquisa de Marketing
Quadro 13.4  Estatísticas calculadas a partir dos dados da Tabela 13.21
Estatística X Y Z
Média 10 10 10

∑X i
74
∑Y i
750
∑Z i
110
X= i =1
= = 7,4 Y = i =1
= = 75 Z= i =1
= = 11
n 10 n 10 n 10

Variância 10 10 10

∑ ( X i − X )2 12,9
∑ (Yi − Y )2 1.450
∑ (Z i − Z )2
68
S =
2
x
i =1
= = 1,29 S =
2
y
i =1
= = 145 S =
2
z
i =1
= = 6,8
n 10 n 10 n 10

Desvio-padrão Sx = 1,29 = 1,136 Sy = 145 = 12,04 Sz = 6,8 = 2,61

Covariância 10 10 10

∑(X i − X )(Z i − Z ) ∑ (Y i − Y )( X i − X ) ∑ (Z i − Z )(Yi − Y )


Sxz = i =1
Syx = i =1
Szy = i =1

n n n
8,6 120 228
Sxz = = 0,86 Syx = = 12 Szy = = 22,8
10 10 10
Técnicas Paramétricas para Análise de Dados 387

Aplicando as equações para determinar a1 e a2 aos dados de X e Y da Tabela 13.21, tem-se:

( ∑ Y )( ∑ X 2 ) − ( ∑ X )( ∑ YX ) 750 × 560,5 − 74 × 5.670 795


a1 = = =
n( ∑ X 2 ) − ( ∑ X )2 10 × 560,5 − 74 2 129
a1 = 6,162
n( ∑ XY ) − ( ∑ X )( ∑ Y ) 10 × 5.670 − 74 × 750 1.200
a2 = = =
n( ∑ X 2 ) − ( ∑ X )2 10 × 560,5 − 74 2 129
a2 = 9,302
E a equação de regressão resultante para o exemplo será:
Y = 6,162 + 9,302 X
Assim, se X = 5 Y = 6,162 + 9,302 × 5 = 52,672
e se X = 9, Y = 6,162 + 9,302 × 9 = 89,880
O coeficiente a1 é o valor onde a reta corta o eixo de Y e corresponde ao valor de Y para
X = 0. O coeficiente a2 é denominado coeficiente de regressão bruto, e seu significado para
o exemplo é o de que, em média, as vendas crescem 9.302 unidades para cada R$ 1.000 de
investimentos em comunicação, o que possibilita predizer qual será o incremento no volume
de vendas para dado incremento no investimento em comunicações.
Exemplo com cálculo no SPSS – Utilizando-se o mesmo exemplo anterior, têm-se
as seguintes saídas do SPSS e suas respectivas análises.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,877(a) ,770 ,741 6,45872
a
Predictors: (Constant), Comunicação.

Percebe-se, por meio do índice de correlação de Pearson, simbolizado por R (0,877), e


pelo R2 − R Square (,770), que ambas as variáveis são altamente correlacionadas, não obs-
tante o fato de que, para amostras pequenas – como é o caso do exemplo –, a tendência é
de aumento de R2. Isso significa que, quando uma variável cresce, a outra também cresce, e
vice-versa. Conforme o exemplo, quando o investimento em comunicação cresce, as vendas
em unidades também crescem.
O resultado seguinte exprime a análise da variância (Anova). Esse resultado aponta para
o fato de que a significância (Sig. 0,001) é menor que a significância estipulada (5%), o
que permite rejeitar a hipótese nula (H0) de não significância conjunta dos parâmetros da
equação.
Anovab
Model Sum of Squares df Mean Square F Sig.
1 Regression 1116,279 1 1116,279 26,760 ,001a
Residual 333,721 8 41,715
Total 1450,000 9
a
 Predictors: (Constant), Comunicação;
b
 Dependent variable:Vendasun.
388 Pesquisa de Marketing

No próximo resultado, verifica-se que a significância da variável explicativa “Comunicação”


(Sig. 0,001) também é menor que a significância estipulada (5%), o que permite afirmar que
essa variável é capaz de prever a variável dependente, “Vendas em unidades”.
Coefficientsa
Unstandardized Standardized 95% Confidence Interval
Coefficients Coefficients for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 6,163 13,463 ,458 ,659 −24,883 37,208
Comunicação 9,302 1,798 ,877 5,173 ,001 5,156 13,449
  Dependent Variable:Vendasun
a

A partir dos valores de B, é possível estabelecer a seguinte equação preditora:

Vendasem unidades = 6,163 + 9,302 × Comunicação


Regressão linear múltipla – Compreende a regressão linear de uma variável-critério em
relação a duas ou mais variáveis-prognóstico, e sua conceituação será explicitada em mais
detalhes no item coeficiente de correlação múltipla.
Coeficiente de correlação – A variação total ocorrida com uma variável Y (crité-
rio) será resultante, em parte, da variação ocorrida nas variáveis X, Z etc. (prognóstico),
e o restante da variação de Y resultará de outros fatores desconhecidos. A variação total
de Y pode ser expressa da seguinte forma:

∑(Y − Y )2 = ∑(Y − Yest )2 + ∑(Yest − Y )2


Em que:
Yest  = valor de Y estimado.
∑(Y – Yest )  = variação não explicada.
∑(Yest – Y )2  = variação explicada.
Define-se como coeficiente de determinação e nota-se por r2 o quociente da variação
explicada pela variação total.
Variaçãoexplicada ∑(Yest − Y )2
r2 = =
variaçãototal ∑(Y − Y )2
Esse coeficiente dá uma medida da quantidade da variação explicada na variável-critério
pelas variáveis-prognóstico consideradas. Se a variação explicada for nula, esse quociente será
igual a zero; se a variação total for toda explicada, esse quociente será igual a um.
Essa expressão também pode ser escrita, desprezando-se o sinal, da seguinte forma:
Sy2,x
r2 = 1−
Sy2
O coeficiente de correlação é a medida do grau de associação entre a variável Y (critério) e as
variáveis X, Z etc.; é definido como a raiz quadrada do coeficiente de determinação e nota-se por r.
Técnicas Paramétricas para Análise de Dados 389

Variaçãoexplicada ∑(Yest − Y )2
r= =
variaçãototal ∑(Y − Y )2
O coeficiente de correlação varia entre −1 e +1. Sendo que −1 significa que há total
correlação negativa, +1 total correlação positiva e 0 a inexistência de correlação. O coeficiente
de correlação também pode ser expresso por:

Sy2,x
r = 1−
Sy2
Em que:
Sy2,x  = variância de y em relação a x
Sy2  = variância de y
Na Figura 13.9, são apresentados exemplos de diagramas de dispersão de dados com os
respectivos coeficientes de correlação linear, associados.

Figura 13.9  Exemplos de diagramas de dispersão com os coeficientes de correlação associados.

Coeficiente de correlação simples – O coeficiente de correlação simples é a medida do grau de as-


sociação linear entre duas variáveis. Sendo a fórmula matemática que representa essa associação igual
a Y = a1 + a2 X , a formulação geral para r ficará reduzida a:

Σ( X − X )(Y − Y ) cov( X ,Y )
r= =
Σ( X − X )2 Σ(Y − Y )2 var( X ) var(Y )
Essa fórmula para o cálculo do coeficiente de correlação simples só poderá ser utilizada
quando os seguintes pressupostos forem atendidos: X e Y precisam ser variáveis aleatórias e as
observações originárias de amostras com distribuições normalmente distribuídas, tanto para
X quanto para Y.
Essa fórmula, aplicada aos dados do exemplo da Tabela 13.21, com os cálculos efetuados
na Tabela 13.22, resulta em:

120 120
rx ,y = = = 0,88
12,9 × 145,0 137
rx ,y = 0,88
390 Pesquisa de Marketing

O coeficiente de correlação rx.y = 0,88 significa que, para um campo de variação de −1


a +1, existe uma correlação linear positiva de 0,88 ou 88% entre a variável investimento em
comunicação e a variável volume de vendas (o que não significa e nem permite inferir a exis-
tência de uma relação de causa e efeito). Caso esse valor fosse próximo a zero, a conclusão seria
de que não existiria correlação linear, mas não se poderia afirmar a não existência de correlação,
que poderia ser não linear.
O coeficiente de determinação para os dados do exemplo corresponde a r2 = 0,882 = 0,77, cujo
significado é que 77% da variação que ocorrer no volume de vendas deve ser atribuída ou explicada
pela variação nos investimentos em comunicação.
Coeficiente de correlação múltipla – O grau de relação entre mais de duas variáveis é deno-
minado correlação múltipla. Os princípios fundamentais da correlação múltipla são análogos
aos da correlação simples.
Note que as variáveis a serem estudadas são: X1, X2..., Xn. Aos valores que essas variáveis
podem assumir, atribuem-se, respectivamente, X11, X12..., X1n para X1 e X21, X22..., X2n para a
variável X2 e assim sucessivamente.
Uma equação de regressão é uma expressão matemática utilizada para mostrar o relacionamento
entre uma variável X1, denominada critério, e diversas outras variáveis (X2..., Xn), denominadas
prognósticos. Essa relação pode ser notada em: X1 = F (X2..., Xn). No caso particular de apenas
três variáveis que serão utilizadas como exemplo, a equação de regressão linear de X1 em relação
a X2 e X3 tem a forma:
X 1 = b1.23 + b12.3 X 2 + b13.2 X 3
que representa, num sistema tridimensional de coordenadas retangulares, um plano de re-
gressão, que é uma generalização da reta de regressão vista para duas variáveis. Nesta equação,
b1.23, b12.3 e b13.2 são constantes; e b12.3 e b13.2 são denominados, respectivamente, coeficiente
de correlação parcial de X1 para X2 quando X3 for constante e X1 para X3 quando X2 for
constante.
Nesta equação, se X3 for mantida constante, o gráfico de X1 em função de X2 será uma linha reta,
com coeficiente angular b12.3. Analogamente, se X2 for mantida constante, o gráfico de X1 em função
de X3 será também uma linha reta com coeficiente angular b13.2. Os índices colocados antes do ponto
indicam as variáveis que estão sendo relacionadas; os índices colocados após o ponto indicam as variáveis
conservadas constantes.
Analogamente ao raciocínio para a regressão simples, o plano de regressão dos mínimos
quadrados de X1 para X2 e X3 é representado pela equação acima, cujas constantes são obtidas
pela solução do seguinte conjunto de equações:
∑ X 1 = b1.23 + b12.3 ∑ X 2 + b13.2 X 3
∑ X 1X 2 = b1.23 ∑ X 2 + b12.3 ∑ X 2 + b13.2 X 2 X 3
∑ X 1X 3 = b1.23 X 3 + b12.3 X 3 + b13.2 ∑ X 32
Se for feito x1 = X 1 − X 1 , x 2 = X 2 − X 2 , x 3 = X 3 − X 3 , a equação da regressão linear de
X1 para X2 e X3 pode ser escrita da forma simplificada:
x1 = b12.3 x 2 + b13.2 x 3
em que b12.3 e b13.2 são obtidos mediante a solução simultânea das equações:
Técnicas Paramétricas para Análise de Dados 391

∑ x1x 2 = b12.3 ∑ x 22 + b13.2 ∑ x 2 x 3

∑ x1x 3 = b12.3 ∑ x 2 x 3 + b13.2 ∑ x 32


O coeficiente de correlação múltipla para o caso de três variáveis é uma extensão da fórmula
geral e é calculado pela fórmula:

1 − S1,23
2

r1.23 =
S12

em que Si é o desvio-padrão da variável X1 e S1.23 é dado pelas expressões:

∑( X 1 − X 1est )2
S1.23 =
n
ou
1 − r122 − r132 − r232 + 2r12 r13 r23
S1.23 = S1
1 − r232
r1.23 também pode ser calculado em função de r , r e r , conforme a seguinte equação:
12 13 23

r122 − r132 − 2r12 r13 r23


r1.23 =
1 − r232
Se a equação de regressão for linear, a correlação calculada dessa forma recebe o nome de
coeficiente de correlação linear múltipla.
Seguindo o mesmo raciocínio, é possível generalizar a regressão e a correlação para mais
de três variáveis.
Aplicando essas formulações aos dados do problema ter-se-á:
• Cálculo dos índices de correlações

covar(YX )
1 − ryx = =
var(Y ) var( X )
e ryx2 = (0,877)2 = 0,7691

covar(YZ )
2 − ryz = =
var(Y ) var(Z )
e ryz2 = (0,725)2 = 0,5262

covar(ZX )
3 − rzx = =
var(Z ) var( X )
e rzx2 = (0,29)2 = 0,084
392 Pesquisa de Marketing

• Cálculo das constantes para definir a equação de regressão


σ y  rxy − ryz rxz  12,04  0,877 − 0,725 × 0,29 
b12.3 =  =   = 7,715
σ x  1 − (rxz )2  1,136  1 − (0,29)2 
σ y  ryz − ryx rxz  12,04  0,725 − 0,877 × 0,29 
b13.2 =  =   = 2,370
σ z  1 − (rxz )2  2,61  1 − (0,29)2 
b1.23 = Y − b12,3 X − b12,3 Z = [75 − 7,715 × 7,4 − 2,3701 × 1] = −8,16
A equação de regressão resultante é:
X1 = −8,16 + 7,715 X2 + 2,370 X3
Utilizando o mesmo exemplo do cálculo da regressão simples, os seguintes resultados são
obtidos no SPSS:

Model Summaryb
Model R R Square Adjusted Std. Error of the Estimate Durbin-Watson
R Square
1 ,924a ,853 ,811 5,51914 1,473
a 
 redictors: (Constant), Num. vendedores, Comunicação;
P
b 
Dependent variable: vendas un.
Nesses resultados, verifica-se que o conjunto de variáveis independentes (número de ven-
dedores e investimento em comunicação) explica 85,3% da variância da variável dependente
(vendas em unidades), nível de explicação considerado satisfatório. Verifica-se também, por
meio do teste de Durbin-Watson, ausência de multicolinearidade, que será explicitada no
item seguinte.
A análise da variância indica boa qualidade do modelo, uma vez que o Sig. (0,001) ficou
aquém do nível de significância proposto de 0,05, conforme mostra a seguinte saída do SPSS.

Anovab
Sum of Mean
Model Squares df Square F Sig.
1 Regression 1236,773 2 618,387 20,301 ,001a
Residual 213,227 7 30,461
Total 1450,000 9
a 
 redictors: (Constant), Numvendedores, Comunicação;
P
b 
Dependent Variable:Vendasun.
Na saída do SPSS de análise dos coeficientes mostrada a seguir, verifica-se que a variável
“número de vendedores” apresentou Sig. maior que 0,05, o que significa que não contribui
para o desempenho da variável dependente e, por isso, deve ser excluída do modelo. Ao ex-
cluí-la do modelo, uma vez que se está trabalhando apenas com duas variáveis independentes,
recai-se novamente em uma regressão simples, já exemplificada anteriormente. Se nenhuma
variável explicativa tivesse sido excluída do modelo, uma equação que contivesse todas elas
seria gerada, de maneira que os valores da variável dependente poderiam ser previstos a partir
dos das variáveis independentes. O alto valor de Tolerance indica, mais uma vez, ausência de
multicolinearidade entre as variáveis independentes.
Técnicas Paramétricas para Análise de Dados 393

Coefficientsa
Unstandardized Standardized 95% Confidence Collinearity
Model coefficients coefficients interval for B Statistics
t Sig.
Std. Lower Upper
B Error Beta Bound Bound Tolerance VIF
1 (Constant) 1,678 11,723 ,143 ,890 −26,043 29,399
Comunicação 7,663 1,744 ,723 4,394 ,003 3,540 11,786 ,777 1,288
Numvendedores 1,511 ,760 ,327 1,989 ,087 −,285 3,307 ,777 1,288
a 
Variável dependente: vendasun

Multicolinearidade5 – O modelo da regressão múltipla requer, para ser utilizado, o pres-


suposto de não haver intercorrelação entre as variáveis-prognóstico (independentes). Quando
o projeto de pesquisa for experimental, esse pressuposto poderá ser facilmente satisfeito. Em
projetos de levantamento, esse pressuposto é frequentemente ignorado, pois muitas variáveis
variam simultaneamente, como: renda, nível educacional, estilo de vida, nível de consumo
etc. A previsão do comportamento de compra resultante da regressão múltipla desse conjunto
de variáveis-prognóstico estaria violando o pressuposto de não existência de intercorrelação
entre elas. A esse fenômeno da existência de interdependência entre variáveis, denomina-se
multicolinearidade.
Índice de correlação parcial – Frequentemente, em pesquisas de marketing, faz-se necessário medir
a correlação entre uma variável-critério e uma variável-prognóstico, quando todas as demais forem
conservadas constantes. Representando por r12.3 o coeficiente de correlação parcial entre X1 e X2
e mantendo-se X3 constante, é dado por:
r12 − r13 r23
r12.3 =
(1 − r132 )(1 − r232 )
Analogamente, representando por r12.34 o coeficiente de correlação parcial entre X1 e X2
e mantendo-se constante X3 e X4, é dado por:
r12.4 − r13.4 r23.4 r12.3 − r14.3 r24.3
r12.34 = =
(1 − r 2
13.4 )(1 − r2
23.4 ) (1 − r14.3
2
)(1 − r24.3
2
)
Isso permite concluir que qualquer coeficiente de correlação parcial pode ser calculado a
partir dos coeficientes de correlação de ordem zero: r12, r23 etc.

Análise da variância - Anova


O teste da análise da variância é utilizado para se compararem as médias e apresenta vantagens
ao ser aplicado quando mais de duas médias estiverem sendo comparadas. Apesar disso, no
exemplo ilustrativo que será apresentado, apenas duas médias serão comparadas.
As condições para sua utilização compreendem: haver uma variável dependente métrica (medida
em escala intervalar); uma ou mais variáveis independentes, não métricas.
Para ilustrar a análise da variância, será utilizado o mesmo exemplo da comparação entre
duas embalagens de vinho apresentado para ilustrar o teste tr (Tabela 13.3).

5
A multicolinearidade refere-se à existência de correlação entre três ou mais variáveis independentes.
394 Pesquisa de Marketing

Convencione-se a seguinte simbologia:


Xij = i-ésima observação no j-ésimo tratamento ou grupo. No exemplo há dois tratamentos:
Embalagem 1 e Embalagem 2. Para cada tratamento há cinco lojas. Assim, a primeira
observação do primeiro tratamento será X11 = 72 e a última observação do segundo
tratamento será X25 = 50.
nj = número de observações no j-ésimo tratamento: n1 = 5 e n2 = 5.
n = número total de observações em todos os tratamentos combinados n = n  + n  = 10.
x j  = média das observações do tratamento j-ésimo; x1  = 58,8 e x 2  = 55,2.1 2
x  = média de todas as observações (grande média) = 57,0.
k = número de tratamentos = 2.
Teoria/Conceito – A ideia básica da análise da variância é que a variância da população
derivada pode ser estimada a partir da amostra por diversos meios, e a comparação dessas es-
timativas pode fornecer muitas informações sobre a população. Observa-se que, no teste de
hipótese a respeito de duas médias, anteriormente utilizado, a hipótese nula é de que não há
diferença entre as médias das duas populações derivadas. Se a hipótese nula for verdadeira,
excetuando-se os erros amostrais, as estimativas da variância entre os grupos e no grupo serão
iguais, e sua soma será igual à variância do total de observações. Dessa forma, tem-se:
1. Variação total (St), calculada pela comparação de cada um dos dez dados com a grande
média, pela seguinte fórmula:
k nj

Si = ∑ ∑ ( X ij − x )2
j =1 i =1

que, aplicando-se ao exemplo é:


St = (72 – 57)2 + … + (50 – 57)2 = 918
2. Variação entre os grupos (Se), calculada pela comparação da média de cada conjunto de
observações de cada tratamento com a grande média, pela seguinte fórmula:
k
Se = ∑ n j ( xi − x )2
j =1

que, aplicando-se ao exemplo é:


Se = 5 (58,8 – 57)2 + 5(55,2 – 57)2 = 32,4
3. Variação intragrupos (Si), calculada pela comparação de cada observação com a média de
seu grupo de tratamento, pela seguinte fórmula:
k nj

Si = ∑ ∑ ( X ij − x j )2
j =1 i =1

que, aplicando-se ao exemplo é:


Si = (72 – 58,8)2 + …(54 – 58,8)2 + (67 – 55,2)2 + … + (50 – 55,2)2 = 885,6
Os significados de cada uma dessas variações são:
Variação total (St) - Mede a variação geral de todas as observações e, quanto maior a variação
entre as observações, maior será St.
Variação entre (Se) - Mede a variação total entre as médias e, quanto mais diferentes forem
as k médias dos diferentes tratamentos, maior será Se.
Técnicas Paramétricas para Análise de Dados 395

Variação intra (Si) - Mede a variação das observações de cada tratamento e, quanto mais
diferentes forem estas observações, maior será Si.
É possível demonstrar, teoricamente, que St = Se + Si , e esse fato pode ser confirmado no
exemplo (918 = 32,4 + 885,6). As divisões das variações entre (Se) e da variação intra (Si) por
seus respectivos graus de liberdade produzem estimativas não viesadas da variância da população.
Procedimentos para o teste:
O teste de hipótese nula de não haver diferença entre as médias dos dois tratamentos leva
em consideração o pressuposto de que, ocorrendo H0, as estimativas das variâncias calculadas
entre e intragrupos são estimativas da mesma variância, e as eventuais diferenças devem ser
atribuídas à aleatoriedade. Se a variância entre grupos (SSe) for significativamente maior que
a variância intragrupos (SSi), a hipótese H0 de igualdade da população será rejeitada.
O número de graus de liberdade para o cálculo da variância correspondente a cada variação
é: para St: gl = n − 1; Se: gl = k − 1; e Si: gl = n − k. Dessa forma, as estimativas das respectivas
variâncias serão, para o exemplo:
SSt = St / (n − 1) = 918 / (10 − 1) = 102,0
SSe = Se / (k − 1) = 32,4 / (2 − 1) = 32,4
SSi = Si / (n − k ) = 885,6 / (10 − 2) = 110,7
Para o teste de H0, define-se a função F = SSi/SSe, que segue a distribuição F tabelada. F
será igual a 1 se não houver diferença nas médias dos dois grupos e será maior do que 1 se
houver diferença. O F assim calculado será comparado com o F tabelado em determinado
nível de significância e em graus de liberdade correspondentes aos do numerador de F.
Portanto, para o exemplo, gl = 2 − 1 = 1. Todas essas informações e cálculos podem ser
visualizados na Tabela 13.23.
Tabela 13.23  Cálculos para a análise de variância (Anova)
Fonte de Soma dos Graus de Estimativa da F calculado
variação quadrados (A) liberdade (B) variância (A)/(B)
Entre grupos 32,4 k − 1 = 1 32,4 110,7/32,4 = 3,42
Intragrupo 885,6 n − 2 = 8 110,7
Total 918,0 n − 1 = 9 102,0

Admite-se o nível de significância para o teste de 0,05. A distribuição F está tabelada para
alguns valores de a, e para os graus de liberdade do numerador (v1) e do denominador (v2)
utilizados para calcular F. O valor de F tabelado para o exemplo deve ser procurado na tabela
de a = 0,025 (0,05 / 2, pois é um teste bicaudal), v1 = n − 2 = 8 e v2 = k − 1 = 1, que é 5,32.
Como o valor de F calculado (3,42) é menor do que o F tabelado (5,32), H0 não pode
ser rejeitada, e admite-se não haver diferenças significativas, ao nível de 0,05, entre as
médias, e a adoção de qualquer uma das embalagens é indiferente.

Análise multivariada da variância - Manova


Em marketing, há situações em que é preciso conhecer a influência de diversos fatores (va-
riáveis independentes) sobre outros (variáveis dependentes). Para essas situações, a técnica de
análise apropriada é a Manova. Portanto, a Manova é uma técnica multivariada que permite
396 Pesquisa de Marketing

a análise conjunta de diversas variáveis dependentes e independentes. O teste é realizado sob


a Hipótese nula (H0) de que as médias são iguais, ou seja, de que não há relação significativa
de dependência ao nível de significância definido.
Condições para utilização – Independência das observações; multicolinearidade moderada
das variáveis dependentes (usar o teste de esfericidade de Bartlett); igualdade de matrizes de variância
e covariância (teste Box – é apresentado quando se efetiva a Manova); normalidade das distribuições
conjunta das variáveis (usar o teste Kolmogorov-Smirnov, que permite verificar a normalidade
de cada variável, individualmente – não há teste que permita verificar diretamente a normalidade
multivariada); duas ou mais variáveis dependentes, todas em escala intervalar; duas ou mais variáveis
independentes, todas em escala não métrica; cada variável deve ter mais observações do que o
número de variáveis dependentes (recomenda-se um mínimo de 20 observações por grupo).
Exemplo de cálculo no SPSS – Uma empresa, a fim de tomar decisões em relação
a um novo produto, buscou conhecer a influência do gênero e da classe social sobre o
preço e o desempenho esperados para essa classe de produto. Para poder utilizar a Manova,
as variáveis foram pesquisadas com as seguintes escalas:
• Preço estimado: intervalar, absoluto.
• Desempenho esperado: escala intervalar, de 1 a 10.
• Classe social: escala ordinal, de 1 a 4.
• Gênero: escala nominal dicotômica – masculino ou feminino.
Os dados coletados na pesquisa estão na Tabela 13.24.

Tabela 13.24  Dados coletados para determinar influência do gênero e da classe


social sobre o preço e o desempenho esperados para o produto
Desempenho
Respondente Gênero Classe social Preço esperado
1 2 2 19 8
2 1 3 22 9
3 2 3 23 7
4 1 2 18 6
5 1 2 21 9
6 2 2 25 7
7 2 1 18 7
8 1 2 18 5
9 2 4 27 10
10 1 3 21 8
11 1 1 20 6
12 1 4 25 8
13 2 2 20 8
14 1 3 27 10
15 2 4 26 10
16 2 2 18 7
17 2 2 19 10
18 2 2 21 10
19 2 3 22 8
20 2 2 19 8
21 2 1 19 7
Técnicas Paramétricas para Análise de Dados 397

Tabela 13.24  Dados coletados para determinar influência do gênero e da classe


social sobre o preço e o desempenho esperados para o produto (cont.)
Desempenho
Respondente Gênero Classe social Preço esperado
22 2 3 24 9
23 1 2 21 9
24 1 2 18 7
25 2 2 19 9

Procedimentos para o teste:


1. Definir as variáveis dependentes e independentes.
No exemplo, as variáveis dependentes são preço e desempenho, enquanto as indepen-
dentes são gênero e classe social do pesquisado.
2. H0 = matrizes são iguais, o que indica ser apropriado o uso da Manova.
H1 = matrizes são diferentes, o que indica não ser apropriado o uso da Manova.
3. a = 0,05.
4. Resultado do teste.
Box's Test f Equality of Covariance Matricesa
Box’s M 15,181
F 1,111
df1 9
df2 413,295
Sig. ,353

5. Decisão. Como a significância p (Sig.) = 0,353 > a = 0,05, H0 não pode ser rejeitada,


concluindo que as matrizes são iguais, o que indica ser apropriado o uso da Manova.
6. Os resultados da análise da Manova processada no SPSS mostrados na Tabela 13.25 com-
param o nível de significância calculado p (Sig., que aparece na última coluna da tabela)
com o nível de significância a definido (no exemplo, a = 0,05) para cada cruzamento de
variáveis de interesse.

Tabela 13.25  Saída do SPSS para o teste da Manova


Tests of Between-Subjects Effects
Dependent Type III Sum Mean
Source Variable of Squares df Square F Sig.
Corrected Preço 141,533 a
7 20,219 5,020 ,003
Model Desempenho 21,165b 7 3,024 1,927 ,128
Intercept Preço 7719,069 1 7719,069 1916,614 ,000
Desempenho 1012,555 1 1012,555 645,302 ,000
Gênero Preço ,055 1 ,055 ,014 ,909
Desempenho 2,525 1 2,525 1,609 ,222
Classe Preço 120,022 3 40,007 9,934 ,001
Desempenho 10,684 3 3,561 2,270 ,117
Gênero Preço 4,485 3 1,495 ,371 ,775
Classe Desempenho 6,216 3 2,072 1,320 ,300
398 Pesquisa de Marketing

Tabela 13.25  Saída do SPSS para o teste da Manova (cont.)


Tests of Between-Subjects Effects
Dependent Type III Sum Mean
Source Variable of Squares df Square F Sig.
Error Preço 68,467 17 4,027
Desempenho 26,675 17 1,569
Total Preço 11446,000 25
Desempenho 1680,000 25
Corrected Preço 210,000 24
Total Desempenho 47,840 24
a 
 Squared =,674 (Adjusted R Squared =,540).
R
b 
R Squared =,442 (Adjusted R Squared =,213).

Assim, quando p > a = 0,05, H0 não pode ser rejeitada, o que significa que não há in-
fluência. A Tabela 13.25 mostra que o gênero não influencia de maneira significativa nem a
expectativa do preço nem o desempenho, uma vez que p > 0,05, em ambos os casos, mas
que a classe social sim, em relação à expectativa de preço, pois apresenta p < 0,05. Além disso,
observa-se que, conjuntamente, classe social e gênero não influenciam significativamente
a expectativa de preço, nem o desempenho esperado, uma vez que, em ambos os casos,
apresentam p > 0,05.

Análise discriminante e classificatória


Diversos problemas em marketing envolvem a investigação de grupos diferentes e a caracteriza-
ção das diferenças. Dois ou mais grupos podem ser comparados com o objetivo de se determinar
se diferem entre si e a natureza dessa diferença. O objetivo da análise discriminante é, com
base num conjunto de variáveis independentes, classificar indivíduos ou objetos em duas ou
mais categorias ou classes mutuamente exclusivas. Ela se assemelha à regressão múltipla, com a
diferença de que a variável dependente é não métrica. Exemplos de problemas de marketing
que podem ser resolvidos por meio da análise discriminante são: determinar as características
que diferenciam consumidores de um produto em leais e não leais à marca; consumidores e
não consumidores da marca da empresa; consumidores que se abastecem num canal e noutro de
distribuição; os primeiros adotantes de um novo produto dos demais; classificar os vendedores
ou revendedores da empresa em ótimos, bons e medíocres etc.
Os aspectos essenciais para o entendimento da análise discriminante podem ser facilmente
entendidos. Constrói-se um “sistema de escores”, utilizado para atribuir um escore para cada in-
divíduo ou objeto a ser classificado. Cada escore compreende uma média ponderada dos valores
numéricos das variáveis independentes de cada indivíduo (por exemplo: idade, renda e educação).
Com base nesses escores, os indivíduos são classificados na categoria com as quais mais se parecem.
A essência teórica da análise discriminante consiste em encontrar uma combinação linear das
variáveis independentes que tornem os escores médios, entre as categorias das variáveis-critério na
combinação linear, diferentemente maximizados, na expectativa de encontrar variáveis que melhor
discriminem dois ou mais grupos. Essa combinação linear recebe o nome de função discriminante
(z), cuja equação geral é:
Z = v1X 1 + v 2 X 2 + ... + vm X m
Técnicas Paramétricas para Análise de Dados 399

Em que:
Xm = m-ésima variável independente.
e
v1, v2, ..., vm = pesos de cada variável na função z.
O objetivo é encontrar os valores para os vi que forneçam a procurada função z. O critério
adotado para decidir quando a média entre as categorias deve ser diferentemente maximizada é o
teste da análise da variância F para as diferenças entre médias.Assim, os vs são derivados de tal forma
que a relação entre a variância entre grupos e a variância dentro do grupo seja maximizada, ou seja,
F = SSentre/SSinter deve ser máxima, tornando os grupos tão diferentes entre si quanto possível.
Além disso, as saídas da análise discriminante incluem os valores dos vs que permitem os
cálculos dos escores Fi de cada indivíduo. Esses escores são comparados com o valor crítico de
F tabelado (Tabela 6a, 6b e 6c do Apêndice – Tabelas estatísticas selecionadas, no final deste
livro), utilizado para a realização do teste da análise da variância, o que permite a classificação
dos indivíduos nos grupos. O resultado dessa classificação é apresentado numa matriz chamada
de junção. A matriz junção compara a classificação atual com a classificação prevista, conforme
o modelo mostrado no Quadro 13.5, para dois grupos.

Quadro 13.5  Matriz de junção da classificação atual com a classificação prevista


Classificação atual Classificação prevista Totais
Grupo I Grupo II
Grupo I n11 n12 n1
Grupo II n21 n22 n2
Totais n.1 n.2 n

A apresentação detalhada dos algoritmos utilizados na análise discriminatória para cálculo


manual foge aos objetivos deste livro.
Exemplo com cálculo no SPSS – Será utilizada uma pesquisa cujo objetivo foi identi-
ficar segmentos de mercado a partir de atitudes em relação a atributos ecológicos de produtos.
Foram identificados seis segmentos, e a análise discriminante foi utilizada para verificar se as
seguintes 16 variáveis de consciência ecológica discriminavam os segmentos:
1. Que sejam fabricados com a quantidade mínima de ingredientes.
2. Que sejam fabricados com ingredientes naturais que não agridem a natureza quando são
extraídos.
3. Que sejam fabricados por empresas que economizam energia e água no processo de produção.
4. Que sejam fabricados por empresas que despejam o mínimo de resíduos no processo de
fabricação.
5. Que sejam transportados por veículos que não poluam o meio ambiente.
6. Que suas embalagens sejam de materiais renováveis e recicláveis.
7. Que sejam biodegradáveis.
8. Que suas embalagens sejam mais leves.
9. Que suas embalagens possam conter maior quantidade de produtos.
10. Que os rótulos das embalagens sejam ricos em informações.
400 Pesquisa de Marketing

11. Que durem mais.


12. Que não ofereçam riscos à saúde, quando utilizados.
13. Que possam ser substituídos por refil.
14. Que sejam certificados por entidades que atestam que não agridem o meio ambiente.
15. Que não contenham gás CFC.
16. Que as embalagens, após o uso do produto, possam ser recicladas.
Os resultados estão apresentados na Tabela 13.26.

Tabela 13.26  Identificação dos segmentos de mercado a partir de atitudes em relação a atributos
ecológicos de produtos
Tests of Equality of Group Means
Wilk's Lambda F df1 df2 Sig.
1 ,991 ,982 5 556 ,428
2 ,997 ,370 5 556 ,869
3 ,981 2,174 5 556 ,056
4 ,988 1,376 5 556 ,231
5 ,994 ,689 5 556 ,632
6 ,979 2,379 5 556 ,038
7 ,977 2,657 5 556 ,022
8 ,978 2,559 5 556 ,027
9 ,985 1,748 5 556 ,122
10 ,982 2,091 5 556 ,065
11 ,990 1,077 5 556 ,372
12 ,991 1,051 5 556 ,387
13 ,995 ,594 5 556 ,704
14 ,903 11,892 5 556 ,000
15 ,992 ,916 5 556 ,470
16 ,984 1,817 5 556 ,108

No entanto, como pode ser observado no Quadro 13.6, não há altas correlações entre as
variáveis da pesquisa, o que indica a correção na escolha dessa técnica.
A estatística Box's M correspondente aponta como hipótese nula (H0) que as variâncias
entre os grupos são iguais e, como hipótese alternativa (H1), que as variâncias entre os grupos
são diferentes. O Sig. igual a,000 permite rejeitar H0, o que nega correção à utilização da
análise discriminante nesse caso.

Test resultsa
Box's M 855,505
F Approx. 1,458
df1 544
df2 260810,0
Sig. ,000
Tests null hypothesis of equal population covariance matrices
a
Some covariance matrices are singular and the usual procedure will not work. The non-singular groups will be tested against
their own pooled within-groups covariance matrix. The log of its determinant is −3,949
Quadro 13.6  Matriz de correlação entre as variáveis
Pooled Within-Groups Matrices
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 1,000 ,118 ,009 ,052 ,175 −,036 −,045 −,096 −,093 −,008 ,245 ,280 −,005 −,030 ,136 −,046
2 ,118 1,000 ,250 ,278 −,048 ,196 ,059 ,103 ,020 ,103 −,012 −,062 ,047 ,067 ,024 ,117
3 ,009 ,250 1,000 ,314 −,046 ,262 ,071 ,090 ,162 ,135 −,044 −,099 −,046 ,104 −,030 ,141
4 ,052 ,278 ,314 1,000 −,060 ,258 ,087 ,071 ,086 ,037 −,005 −,048 ,021 ,132 ,005 ,150
5 ,175 −,048 −,046 −,060 1,000 −,039 −,022 −,090 −,089 −,072 ,200 ,163 ,071 −,084 ,170 −,030
6 −,036 ,196 ,262 ,258 −,039 1,000 ,234 ,196 ,175 ,141 −,013 ,024 ,013 ,117 ,043 ,097
7 −,045 ,059 ,071 ,087 −,022 ,234 1,000 ,426 ,176 ,276 −,115 −,081 −,050 ,072 −,109 ,173
Correlation

8 −,096 ,103 ,090 ,071 −,090 ,196 ,426 1,000 ,326 ,359 −,162 −,129 −,054 ,086 −,021 ,195

Técnicas Paramétricas para Análise de Dados


9 −,093 ,020 ,162 ,086 −,089 ,175 ,176 ,326 1,000 ,358 −,094 −,110 −,089 ,068 −,142 ,293
10 −,008 ,103 ,135 ,037 −,072 ,141 ,276 ,359 ,358 1,000 −,054 −,097 −,108 ,087 −,148 ,196
11 ,245 −,012 −,044 −,005 ,200 −,013 −,115 −,162 −,094 −,054 1,000 ,388 ,076 −,059 ,094 −,071
12 ,280 −,062 −,099 −,048 ,163 ,024 −,081 −,129 −,110 −,097 ,388 1,000 ,086 −,010 ,119 −,105
13 −,005 ,047 −,046 ,021 ,071 ,013 −,050 −,054 −,089 −,108 ,076 ,086 1,000 −,006 ,270 −,146
14 −,030 ,067 ,104 ,132 −,084 ,117 ,072 ,086 ,068 ,087 −,059 −,010 −,006 1,000 −,196 ,183
15 ,136 ,024 −,030 ,005 ,170 ,043 −,109 −,021 −,142 −,148 ,094 ,119 ,270 −,196 1,000 −,144
16 −,046 ,117 ,141 ,150 −,030 ,097 ,173 ,195 ,293 ,196 −,071 −,105 −,146 ,183 −,144 1,000

401
402 Pesquisa de Marketing

Os resultados da Tabela 13.27 indicam que cinco funções discriminantes foram geradas,


pois seis segmentos de consumidores estão sob análise. Percebe-se que a primeira função res-
ponde praticamente pela metade (49,6%) da variância explicada, contribuindo mais do que
as outras para explicar as diferenças entre os grupos.
Tabela 13.27  Funções discriminantes geradas
Eigenvalues
Function Eigenvalue % of variance Cumulative % Canonical Correlation
1 ,145 a
49,6 49,6 ,356
2 ,066 a 22,5 72,1 ,248
3 ,041 a 14,2 86,2 ,199
4 ,024 a 8,1 94,3 ,152
5 ,017 a 5,7 100,0 ,128
a 
First 5 canonical discriminant functions were used in the analysis.

No teste das funções, mostrado na Tabela 13.28, verifica-se que apenas a primeira função
discriminante é altamente significativa (Sig. igual a,000), o que comprova seu maior poder
discriminante.

Tabela 13.28  Resultado do teste de significância das funções geradas


Wilks’ Lambda
Test of Function(s) Wilks’ Lambda Chi-square df Sig.
1. throught 5 ,756 153,573 80 ,000
2. throught 5 ,866 79,190 60 ,049
3. throught 5 ,923 44,173 42 ,380
4. throught 5 ,961 21,893 26 ,695
5. ,984 9,078 12 ,696

Na matriz de estruturas, mostrada na Tabela 13.29, estão marcadas com asteriscos as


variáveis que mais contribuem para a discriminação dos segmentos em cada função.

Tabela 13.29  Matriz de estrutura


Structure Matrix
Function
1 2 3 4 5
14 ,852* −,157 −,041 −,098 −,036
3 ,097 ,424* ,339 ,262 −,029
6 ,235 ,369* −,251 ,121 −,301
1 −,136 ,304* −,031 −,045 ,015
8 ,066 ,319 −,485* ,317 ,466
15 −,095 ,077 ,339* ,270 ,071
13 −,162 −,044 ,168* −,096 ,028
7 ,308 ,143 −,102 ,566* ,219
4 −,059 ,135 ,129 ,532* −,446
12 −,063 ,177 ,295 −,365* −,059
Técnicas Paramétricas para Análise de Dados 403

Tabela 13.29  Matriz de estrutura (cont.)


Structure Matrix
Function
1 2 3 4 5
2 ,081 −,036 −,133 ,236* −,121
5 −,031 ,205 −,197 ,215* −,190
10 −,036 −,358 −,296 ,370 ,448*
9 ,211 ,280 −,200 ,142 ,348*
16 ,278 ,084 ,187 ,281 ,285*
11 −,135 ,224 ,165 −,234 ,283*
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions.
Variables ordered by absolute size of correlation within function.
* Largest absolute correlation between each variable and any discriminant function.

Concluindo, como a função mais representativa é a de número 1, resulta que a variável


14, do exemplo, discrimina, sozinha, todos os segmentos de mercado.

QUESTÕES DE REVISÃO
1. Qual a importância dos métodos paramétricos para análises em pesquisas de marketing?
2. Quais as condições para a utilização do teste z da média para uma amostra? E para o
teste t?
3. Dê exemplos de aplicação em pesquisas de marketing do teste z da média para uma
amostra. Fazer o mesmo em relação ao teste t.
4. Quais as condições para utilização do teste z da média para duas amostras não relacio-
nadas? E para o teste t?
5. Dê exemplos de aplicação em pesquisas de marketing do teste z da média para duas
amostras não relacionadas. Fazer o mesmo para o teste t.
6. Dê exemplos de aplicação em pesquisas de marketing do teste da análise da variância
para comparação de médias.
7. Em que consistem os conceitos de correlação e regressão? Dê exemplos de cada um.
8. O que é uma curva de ajustamento?
9. Qual a diferença entre regressão linear simples e regressão linear múltipla?
10. Qual a diferença entre correlação linear simples e correlação linear múltipla?
11. O que mede o coeficiente de correlação?
12. O que mede o coeficiente de determinação?
13. O que é multicolinearidade?
14. Em que consiste a análise de discriminante?
15. Dê exemplos de aplicação da análise de discriminante em pesquisas de marketing.
16. No que consiste a análise fatorial?
17. Quais as condições para ser aplicada a análise fatorial a um conjunto de dados?
18. Em que consiste um fator na análise fatorial?
19. Dê exemplos da aplicação da análise fatorial em pesquisas de marketing.
20. No que consiste a análise de conglomerados?
21. Dê exemplos da aplicação da análise de conglomerados em pesquisas de marketing.
404 Pesquisa de Marketing

Trabalho – Parte 11
Aplique testes de hipóteses paramétricos às variáveis intervalares (ou razão) de sua pesquisa,
adequados às condições do projeto. Efetue a medição dos relacionamentos de variáveis, segundo
o projeto de pesquisa.

REFERÊNCIAS
CHURCHILL, JR., Gilbert A. Marketing research: methodological foundations. Insdale, Ill: Driden, 1979.
CLAYCAMP, Henry J. Correlation and regression methods. In: FERBER, Robert (Org.). Handbook of marketing
research. New York: McGraw-Hill, 1974. pp. 394-408.
COOPER, D. R.; SCHINDLER, P. S. Métodos de pesquisa em administração. 7. ed. Porto Alegre: Bookman, 2003.
DANIEL, W. W. Essentials of business statistics. Boston: Houghton Mifflin Co. , 1984.
EVRARD, Yves; PRAS, Bernard; ROUX, Elyette. Market: études et recherché en marketing – Fondements,
méthods. Paris: Éditions Nathan, 1993.
GORSUCH, R. L. Factor Analysis. 2nd ed. New Jersey: Erlbaum Associates, Publishers, 1983.
HAIR, JR., F. J.; ANDERSON, R. E.; TATHAN, R. L.; BLACK, W. C. Análise multivariada de dados. Porto Alegre:
Bookman, 2005.
HARMAN, Harry H. Modern factor analysis. 2. ed. Chicago: The University of Chicago, 1967.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
MALHOTRA, N. K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman, 2001.
MORRISON, D. G. Discriminant analysis. In FERBER, Robert (Ed.). Handbook of marketing research. New York:
McGraw-Hill, 1974, pp. 442-457.
NEWBOLD, P. Statistics for business & economics. Upper Saddle River: Prentice-Hall, 1994.
PESTANA, M. H.; GAGEIRO, J. N. Análise de dados para ciências sociais. Lisboa: Sílabo, 2003.
SIEGEL, S.; CASTELLAN, J. R. J. Estatística não paramétrica para ciências do comportamento. Porto Alegre: Bookman,
2006.
STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 2001.
WELLS,William D.; SHETH, Jagdish N. Factor analysis. In FERBER, Robert (Ed.). Handbook of marketing research.
New York: McGraw-Hill, 1974, pp. 458-471.
ZALTMAN, G.; BURGER, P. C. Marketing research. Insdale, Ill: Driden, 1975.
CAPÍTULO 14
Comunicação dos Resultados
As hipóteses mais brilhantes, o estudo mais cuidadosamente planejado e executado,
os resultados mais notáveis têm pouco valor se não forem comunicados aos outros.
Seltiz, Jahoda, Deutsch e Cook

Objetivos
• Apresentar as formas de comunicação dos resultados de pesquisas de marketing.

Sumário
RELATÓRIO DE PESQUISA
Diretrizes para a elaboração do relatório escrito
Formato do relatório escrito da pesquisa
APRESENTAÇÃO GRÁFICA DOS RESULTADOS
Quadros
Tabelas
Figuras
Gráficos
APRESENTAÇÃO ORAL DOS RESULTADOS
ENTREGA ELETRÔNICA DOS RESULTADOS

A etapa final do processo de pesquisa é a comunicação dos resultados, que consiste


na apresentação dos achados e conclusões da pesquisa para uma audiência específica,
objetivando determinado propósito. Essa etapa compreende a preparação e a entrega
do relatório de pesquisa e a preparação e a apresentação de relato oral dos resultados.
Nenhuma pesquisa, por melhor que tenha sido planejada e executada, por mais
impactantes que tenham sido seus resultados, terá sucesso se o pesquisador falhar no
momento de sua comunicação. A comunicação bem planejada e executada é convin-
cente e valoriza os resultados da pesquisa e a equipe que a realizou.
Existem dois meios de comunicar os resultados de uma pesquisa: escritos e orais. Os
escritos podem ser impressos e entregues fisicamente, ou eletrônicos, entregues por meio
de CD-ROM ou enviados por e-mail.

RELATÓRIO DE PESQUISA
O relatório escrito é a forma mais completa e a mais utilizada para a comunicação dos
resultados de uma pesquisa. Existem certas diretrizes e determinado formato para sua
elaboração que, se obedecidos, elevam a probabilidade de se redigir um relatório de alta
qualidade e comunicabilidade.
405
406 Pesquisa de Marketing

Diretrizes para a elaboração do relatório escrito


Um relatório de pesquisa bem elaborado deve ser completo, preciso, objetivo, claro e conciso.
Completo – Um relatório é completo quando reúne todas as informações necessárias aos
leitores a que se dirige. No caso de relatórios de pesquisas de marketing, o redator/pesquisador
deve ter em mente que eles são utilizados para a tomada de importantes decisões mercadológicas,
e que seus usuários – diretores e gerentes de marketing, gerentes de produtos e novos produtos,
gerentes de promoção, gerentes de distribuição e gerentes de vendas – estão interessados em
clareza, objetividade, concisão e precisão. Sua preocupação primeira é saber como os resultados
apresentados poderão ajudá-los a tomar decisões melhores em suas respectivas áreas de ação
mercadológica. Um relatório cheio de pontos duvidosos, com linguagem difícil e obscura,
mostrando, junto com fatos importantes, uma infinidade de fatos óbvios, com resultados pouco
precisos e sem apresentar dados conclusivos a respeito do assunto em estudo, estará condenado ao
desprezo por esses usuários. Se, durante a redação do relatório, o redator/pesquisador tiver sempre
em mente os objetivos da pesquisa, a audiência a que se destina e souber separar dos resultados
o que é importante, com certeza estará no caminho certo de produzir um relatório completo.
Preciso – A precisão dos resultados de uma pesquisa depende, fundamentalmente, de
todo cuidado em seu planejamento e execução, porém toda precisão conseguida durante este
processo poderá ser colocada em risco, se o relatório não for bem elaborado. Imprecisões
podem ser cometidas por falta de cuidados no manuseio das informações; incapacidade de
construir frases que correspondam à realidade dos fatos; e até por erros gramaticais (pontuação
errônea, tempo verbal inadequado, discordâncias entre sujeito, verbo e objetos, palavras escritas
de forma incorreta, utilização inadequada de conjunções e preposições etc.).
Objetivo – Os resultados da pesquisa precisam ser apresentados com o máximo de objeti-
vidade, de forma a ganhar rapidamente o interesse de uma audiência extremamente ocupada. A
objetividade da redação de um relatório pode ser conseguida por meio dos seguintes pontos:
• Selecionar e salientar sempre os pontos relevantes dos resultados.
• Utilizar frases curtas e sempre na ordem direta.
• Utilizar parágrafos curtos (no máximo em torno de dez linhas).
• Usar palavras que sejam de conhecimento da audiência.
• Evitar termos populares e gírias.
Claro – A clareza de um relatório é conseguida por meio de uma sequência de apresen-
tação clara e lógica e de uma redação concisa. A ausência de clareza dificulta a localização
e até o entendimento das informações contidas no relatório e fazem com que o interesse
e a credibilidade da audiência caiam. O conhecimento do perfil da audiência, da sequência
lógica da otimização, da utilização de termos corretos e de uma redação simples e clara
ajudará a preparar relatórios mais claros. É difícil para o redator/pesquisador, que já está muito
familiarizado com a pesquisa, ter sensibilidade suficiente para perceber o nível de clareza em
seu relatório. Os seguintes procedimentos podem ajudar a redigir/verificar/ampliar a clareza
de um relatório:
• A objetividade ajuda na clareza. Portanto, a redação deve seguir as sugestões dadas no item
objetivo para se conseguir clareza.
• Verificar se a forma utilizada para apresentação do resultado de cada questão (quadros,
tabelas, gráficos de diversos tipos, figuras etc.) é a mais conveniente. Procurar sempre res-
ponder a esta pergunta: “Será que não existe outra forma mais clara de apresentar este
resultado e evidenciar as conclusões?”
Comunicação dos Resultados 407

• Depois de elaborada a primeira versão do relatório, fazer uma primeira revisão, colocan-
do-se no lugar de sua audiência.
• Outras revisões devem ser feitas por outros membros da equipe de pesquisa.
• Uma forma definitiva de testar a clareza do relatório, depois da última revisão feita pela
equipe, é solicitar sua leitura comentada por alguém que nada tenha a ver com a pes-
quisa, mas que tenha um perfil parecido com o da audiência.
Conciso – O relatório precisa ser conciso, embora completo. Parece impossível
atender a estas duas características simultaneamente, mas não o é. O que se quer dizer
com concisão é que o redator/pesquisador precisa ser seletivo sobre o que incluirá no
relatório, tendo em vista os objetivos de sua pesquisa. Não há necessidade de constar no
relatório tudo que foi encontrado na pesquisa; o que não for importante para atender
aos seus objetivos deve ser omitido. Também devem ser omitidas longas apresentações e
discussões de metodologias já suficientemente conhecidas. Um quadro, uma tabela, uma
figura ou um gráfico bem construídos podem evitar muitas páginas de apresentação des-
critiva e cansativa dos resultados.

Formato do relatório escrito da pesquisa


Não existe um único padrão de formato que atenda a todas as situações de pesquisa. A
seguir, apresenta-se um formato que atende à maioria dos projetos de pesquisas, mas o
redator/pesquisador deverá, para seu projeto, verificar se faz sentido apresentar todos os
itens e se não devem ser incluídos outros. Em seguida à apresentação do formato, faz-se
uma descrição do conteúdo de cada item.
1. Página de rosto
2. Sumário
3. Resumo gerencial
a. Colocação do problema e dos objetivos
b. Principais resultados
c. Conclusões e recomendações
4. Corpo do relatório
a. Apresentação (ou Introdução)
b. Objetivos
c. Metodologia
d. Resultados
5. Conclusões, recomendações e limitações
6. Anexos
a. Instrumento de coleta de dados
b. Plano de amostragem
c. Procedimentos e cálculos utilizados nas análises dos dados
d. Quadros, gráficos, figuras e tabelas não incluídos no corpo do relatório
7. Bibliografia e (ou) referências bibliográficas
Página de rosto – A página de rosto deve conter o título da pesquisa (que melhor
represente a essência do estudo), a data, o nome da organização patrocinadora e o nome da
organização realizadora da pesquisa.
Sumário – O sumário apresenta a listagem dos tópicos contidos na mesma sequência de
sua aparição no relatório, indicando a página em que o tópico se encontra. Os tópicos contidos
408 Pesquisa de Marketing

no sumário podem compreender: itens e subitens, quadros, gráficos, figuras e tabelas. O objetivo
principal do sumário é facilitar ao leitor a localização de qualquer tópico do relatório.
Resumo gerencial – O resumo gerencial é uma das partes mais importantes do relatório,
pois grande parte da audiência lerá, por razões de indisponibilidade de tempo, apenas essa
parte do relatório. Outra parte da audiência costuma ler primeiro o relatório gerencial; se
considerar a pesquisa e os resultados relevantes para seu problema, lerá o corpo; caso contrário,
o relatório será abandonado. O resumo gerencial deve ter uma ou, no máximo, duas páginas.
Não deve ser uma miniatura do corpo do relatório. O resumo gerencial deve ser elaborado
visando atender às necessidades dos tomadores de decisão e, por isso, deve ser orientado para
a ação. Deve prover os tomadores de decisão com os resultados e as recomendações-chave
para dar suporte e orientação às suas decisões.
Um bom resumo gerencial deve ater-se à apresentação sumária do problema e dos objetivos,
dos principais resultados encontrados e das conclusões e recomendações. O propósito da
introdução, no resumo gerencial, é o de prover o leitor com o mínimo de informações sobre
as origens da pesquisa, possibilitando-lhe apreciar e entender os resultados, conclusões e reco-
mendações. Esses resultados precisam estar em total acordo com os do corpo do relatório, mas
somente os achados fundamentais são aqui apresentados. Uma abordagem muito utilizada para
apresentar os achados é por meio de várias colocações objetivas, relatando o que foi encontrado
em relação a cada objetivo do estudo. Analogamente, as conclusões e recomendações também
podem seguir essa mesma forma de apresentação. O resumo gerencial deve ser destacável do
corpo do relatório para ser utilizado à parte.
Corpo do relatório – É a parte do relatório que deve conter os detalhes da pesquisa. O
conteúdo do corpo do relatório compreende: a apresentação (ou introdução), os objetivos, a
metodologia e os resultados.
Apresentação (ou introdução) – O propósito da apresentação é o de fornecer ao leitor as
informações necessárias para que ele possa entender o relatório da pesquisa. O detalhamento
maior ou menor da apresentação vai depender da familiaridade da audiência com o pro-
blema em estudo. Quanto menos familiarizada e diversa for a audiência, maior deverá ser o
detalhamento da apresentação. Tipicamente, uma apresentação deve ter em maior ou menor
grau de detalhamento:
• Exposição clara do problema de pesquisa – Quais as razões da pesquisa, quais problemas
podem ser resolvidos com a pesquisa.
• Apresentação do objetivo geral, incluindo a apresentação das questões e (ou) hipóteses da
pesquisa – O que se pretende com a realização da pesquisa.
• Apresentação de informações sobre o produto e o mercado estudados – Tais como parti-
cipação de mercado, concorrentes etc., que permitam melhor compreensão do problema.
Objetivos – Os objetivos são apresentados de forma a não deixar nenhuma dúvida quanto
ao que se pretende alcançar com os resultados da pesquisa. Uma pesquisa pode ter mais de
um objetivo, mas apenas um principal e outros complementares ou secundários. É interes-
sante, neste item, para facilitar a compreensão do leitor, separar esses objetivos em principal
e complementares ou secundários. Também deverá ser informado aqui se, por alguma razão,
houve necessidade de mudar ou incluir algum objetivo depois de a pesquisa ter sido iniciada.
A correta colocação dos objetivos é muito importante para não gerar falsas expectativas e
porque muitos leitores costumam ler, inicialmente, esta parte do relatório e, em seguida, ler
as conclusões e verificar se nelas os objetivos foram alcançados.
Comunicação dos Resultados 409

Metodologia – No item metodologia, deve-se descrever todo o projeto e a execução


metodológica da pesquisa, tais como o método de amostragem, a determinação do número
de elementos da amostra, o método de coleta de dados e os procedimentos para análise. Os
objetivos de se apresentar a metodologia no corpo do relatório compreendem: sumarizar os
aspectos metodológicos do projeto de pesquisa de forma a torná-los compreensivos para os
leitores não técnicos e despertar confiança na qualidade dos procedimentos adotados e, conse-
quentemente, nos resultados da pesquisa. Deve-se dar uma visão geral do projeto de pesquisa
para que o leitor possa ter uma ideia da metodologia utilizada, sem entrar em detalhes por
demais específicos. Se o redator/pesquisador julgar necessário que detalhes mais específicos
acompanhem o relatório, deverá fazê-lo nos anexos, para não tornar o corpo do relatório
muito detalhista e de leitura difícil. A seguir, apresenta-se uma lista das informações sobre a
metodologia que deve constar do corpo do relatório:
• Informar se o projeto da pesquisa foi exploratório ou conclusivo; se conclusivo, se foi
descritivo ou explicativo.
• Informar se o método de coleta de dados utilizado foi o da comunicação (entrevista pes-
soal, entrevista pelo telefone, entrevista focada de grupo, questionário pelo correios/fax/
internet etc.) ou o da observação (a olho nu, com instrumentos etc.).
• Informar como a amostra foi delineada:
• Como a população de pesquisa foi definida; como a listagem da população foi obtida
ou gerada.
• Como as unidades amostrais foram definidas.
• Como a amostra foi definida: a amostra foi probabilística (de qual tipo) ou foi não
probabilística (de qual tipo). Se a amostra não foi probabilística, qual a razão?
• Houve dificuldade para contatar elementos da amostra selecionados? Como estas dificulda-
des foram superadas? Foram introduzidos vieses na pesquisa por causa dessas dificuldades?
• Sobre as análises, deve-se informar apenas quais programas de análises foram empregados, à
medida que não há muita utilidade em informar, antecipada e desvinculadamente, detalhes
da análise que serão comunicados e mais bem aproveitados pelos leitores no momento
oportuno de apresentação dos resultados.
Resultados – O item de resultados compõe a maior parte do relatório e compreende a
apresentação numa estrutura lógica e sequencial de resultados e descobertas da pesquisa, pela
utilização de textos, quadros, tabelas, gráficos ou figuras. A seguir, apresentam-se algumas
sugestões para a apresentação dos resultados:
• Antes de iniciar a redação dos resultados, montar sua itemização numa sequência tão lógica
quanto possível (iniciar com os achados mais gerais e canalizar, gradativamente, para os
mais específicos).
• Ser bastante seletivo – Informações irrelevantes, embora interessantes, para os objetivos da
pesquisa não devem ser apresentadas.
• Os quadros, tabelas, gráficos e figuras também devem ser apresentados segundo um
ordenamento lógico.
• Reserve, para o corpo do relatório, os quadros, tabelas, gráficos e figuras mais gerais e com
informações mais consolidadas, deixando os mais específicos e com informações mais
detalhadas para os anexos.
Conclusões, recomendações e limitações – Apesar de, geralmente, os termos con-
clusões e recomendações virem sempre juntos no relatório de pesquisa, são substancialmente
410 Pesquisa de Marketing

diferentes. A conclusão é uma inferência baseada num resultado, enquanto a recomendação


é uma sugestão de procedimento futuro de ação, baseado nas conclusões. Tanto um quanto o
outro devem fluir de forma lógica, a partir dos resultados encontrados. As conclusões devem
estabelecer uma ponte entre os resultados encontrados e o problema e os objetivos da pesquisa,
e, com base nessa ponte, recomendações e sugestões para a ação poderão ser formuladas. Além
das conclusões e recomendações, é nesta parte do relatório que devem ser feitas observações
quanto à amplitude e às limitações da pesquisa e de seus resultados.
Conclusões – O redator/pesquisador está em melhores condições do que o leitor de es-
tabelecer as conclusões da pesquisa, tendo em vista sua familiaridade com o problema, com
a metodologia empregada, com todo o desenrolar da pesquisa e sua participação nas análises
efetuadas. O redator/pesquisador que se omitir de apresentar suas conclusões, deixando-as a
cargo do próprio leitor, poderá ser tido como omisso e negligente. As conclusões podem ser
apresentadas em forma de orações e, sempre que possível, devem ser relacionados os locais
do relatório em que elas estão evidenciadas. Deverá haver uma conclusão para cada objetivo
ou problema de pesquisa e, sempre que a pesquisa não fornecer evidências suficientes para
emitir conclusões sobre determinado objetivo ou problema, este fato deverá ser explicitamente
informado.
Recomendações – As recomendações podem ser no sentido de sugerir que se realizem pes-
quisas mais específicas sobre pontos importantes apontados pelos resultados, mas ainda obscuros,
ou sobre cursos de ação que devam ser tomados. No primeiro caso, as recomendações devem
ser sempre apresentadas, mas, com relação ao segundo, vai depender do conhecimento que o
redator/pesquisador tiver da audiência. Existem executivos de marketing que esperam receber
no relatório de pesquisa recomendações para a ação, e há aqueles que consideram os resultados
da pesquisa apenas um dos inputs a serem levados em conta no processo de decisão e que, por
isso, recomendações para decisão não devem ser efetuadas. Uma forma de o redator/pesquisador
apresentar suas sugestões sem, no entanto, comprometer-se é fazê-las segundo a seguinte res-
salva: “Apresentamos, a seguir, as recomendações para decisões, baseadas única e exclusivamente
nos resultados apresentados por esta pesquisa, sem que outros fatores tenham sido levados em
consideração”, lembrando, dessa forma, que a responsabilidade pela decisão final é do próprio
tomador de decisões.
Limitações – Não existe uma pesquisa “perfeita”. Toda pesquisa tem limitações de ordem
temporal, espacial, metodológica, operacional e outras que precisam ser comunicadas aos
leitores. Apesar de ser intenção dos pesquisadores conduzir “trabalhos perfeitos”, essa meta é
praticamente inatingível. O objetivo ao apresentar as limitações do estudo, no relatório, é o de
demonstrar que o próprio pesquisador tem conhecimento das limitações de seu trabalho e, as-
sim, evitar que os leitores descubram-nas sozinhos e, a partir dessa descoberta, possam tornar-se
extremamente críticos e desacreditarem de todo o trabalho. A admissão franca e aberta das
limitações, ao contrário do que muitos pesquisadores temem, pode elevar a credibilidade da
pesquisa. Mas tenha cuidado: o objetivo deste item não é depreciar o projeto da pesquisa e
desvalorizar seus resultados, e sim tornar o leitor capaz de julgar corretamente a validade e as
limitações dos resultados. A seguir, são apresentados alguns tipos de limitações em pesquisas
que, caso tenham ocorrido, devem ser mencionados no relatório:
• Limitações referentes à amostragem:
• Amostragem não probabilística.
• Amostragem geograficamente restrita.
Comunicação dos Resultados 411

• Amostra restrita em termos temporais.


• Problemas com não respostas.
• Ocorrência de erros não amostrais. Quais foram e como podem ter afetado os resultados.
• Dentre quais limites de tempo e de espaço os resultados podem ser generalizados.
Anexos – Neste item devem ser apresentados os tópicos considerados muito complexos,
muito detalhados e não absolutamente necessários para figurar no corpo do relatório. Os
anexos devem ser preparados para atender às necessidades dos leitores detalhistas, tecnicamente
orientados, e conter:
• Cópia completa do(s) instrumento(s) de coleta de dados utilizados, bem como de todo
material de orientação para sua utilização.
• Cópia do plano de amostragem, incluindo listagens da população ou mapas, fórmulas de
determinação do número de elementos da amostra, forma de seleção e composição da amostra.
• Procedimentos e cálculos detalhados utilizados nas análises realizadas e estimativas dos
erros amostrais.
• Quadros, tabelas, figuras e gráficos não incluídos no corpo do relatório por conter in-
formações muito detalhadas ou por não conter informações relevantes para os objetivos,
mas que possam interessar ao leitor.
É importante que, no corpo do relatório, façam-se referências à existência dos anexos e
seus conteúdos, a fim de orientar o leitor interessado em sua consulta.
Bibliografia e/ou referências bibliográficas – É o último item do relatório. Sempre
que o pesquisador utilizar determinadas obras (livros ou artigos), de forma específica ou gené-
rica, em seu trabalho, tendo ou não a elas se referido no corpo do relatório, este é o momento
de apresentá-las. A diferença entre bibliografia e referências bibliográficas é exatamente o fato
de a obra ter sido ou não citada, no corpo do relatório. Se a obra foi utilizada, de forma geral,
sem citação específica, denomina-se bibliografia; se foi especificamente citada, denomina-se
referência bibliográfica.
Existem normas padronizadas para as citações e apresentações bibliográficas que precisam
ser seguidas. Recomenda-se a consulta à NBR 6023 da ABNT referente a Informação e
documentação – Referências – Elaboração (ABNT, 2002).

APRESENTAÇÃO GRÁFICA DOS RESULTADOS


Há um ditado popular que diz que “uma boa ilustração vale por uma infinidade de palavras”.
Na apresentação dos resultados de uma pesquisa, é preciso ter sempre em mente esse ditado.
Existem diversas formas gráficas de apresentação dos resultados e a escolha entre uma e outra
deverá ser determinada pela melhor forma de comunicabilidade de um resultado, tendo em
vista a audiência em questão.
O conhecimento da audiência é fundamental para se determinar a forma mais adequada
de apresentação gráfica dos resultados. Existem indivíduos que têm grande facilidade para
leitura de números e tabelas; outros têm facilidade para leitura de gráficos e figuras; enquanto
outros ainda têm facilidade para compreender textos e sentem aversão por quadros, tabelas,
figuras e gráficos.
É importante assinalar que todos os quadros, tabelas, figuras e gráficos precisam ser devi-
damente numerados e identificados, de forma a permitir a fácil identificação e a compreensão
do que está sendo comunicado.
412 Pesquisa de Marketing

As opções existentes para a apresentação de resultados de forma gráfica compreendem


quadros, tabelas, figuras e gráficos.

Quadros
Os quadros são caracterizados por ter suas laterais fechadas (formando efetivamente um quadro)
e são utilizados, geralmente, para apresentar dados qualitativos.Veja, a seguir, um exemplo no
Quadro 14.1.

Quadro 14.1  Principais problemas com o produto “X” segundo os resultados da pesquisa
1. O produto não é suficientemente conhecido pelo público-alvo (apenas 32% afirmaram
conhecer o produto).
2. Há um grande número de clientes que deixou de adquirir o produto por não encontrá-lo no
ponto de venda (cerca de 60% dos usuários do produto reclamaram que, pelo menos uma vez,
nos últimos seis meses, deixaram de adquirir o produto por não encontrá-lo no ponto de venda).
3. De forma geral, os consumidores consideram que a embalagem do produto está defasada e
precisa ser modernizada (cerca de 72% dos usuários fizeram essa afirmação).

Tabelas
As tabelas já são conhecidas por terem sido utilizadas diversas vezes ao longo deste livro. Elas
se caracterizam por possuir apenas linhas horizontais e nenhuma linha vertical, por não ter
suas laterais fechadas e por apresentar, em geral, dados numéricos.Veja, a seguir, exemplos de
tabelas resultantes da tabulação simples (Tabela 14.1) e da tabulação cruzada (Tabela 14.2).

Tabela 14.1  Exemplo numérico de resultado da tabulação simples


Número de filhos Número Número de famílias Porcentagens Porcentagens acumuladas
por família de famílias acumulado de famílias de famílias
0 12 12 8 8
1 33 45 22 30
2 63 108 42 72
3 24 132 16 88
4 9 141 6 94
5 ou + 6 147 4 98
9 (não respostas) 3 150 2 100
Totais 150 100

Tabela 14.2  Formato teórico dos resultados da tabulação cruzada


Variável 2
Variável 1 X     % Y     % Total   %
A nAX (nAX/n) × 100 nAY (nAY /n) × 100 nA nA/n × 100
B nBX (nBX/n) × 100 nBY (nBY /n) × 100 nB nB/n × 100
C nCX (nCX/n) × 100 nCY (nCY /n) × 100 nC nC/n × 100
Total nX nX / n × 100 nY nY / n × 100 n 100%
Comunicação dos Resultados 413

Figuras
As figuras constituem os gráficos, desenhos, esquemas, fluxogramas, cronogramas e organo-
gramas utilizados para mostrar conclusões de forma visual, cujas descrições verbais exigiriam
muito tempo.Veja, a seguir, um exemplo na Figura 14.1.

Figura 14.1  Esquema de distribuição do produto “X”.

Gráficos
Os gráficos constituem um tipo específico de figura em que os resultados referentes a uma
variável ou ao cruzamento de duas (e, às vezes, até três) variáveis, são apresentados de forma visual.
Os gráficos podem ser construídos à mão ou por computador. Para utilizar o computador,
o redator/pesquisador precisará de um software específico.
Há basicamente quatro tipos de gráficos: gráficos de pizza, gráficos de linhas, gráficos de
estratos e gráficos de barras.
Gráficos de pizza – Como o próprio nome identifica, este gráfico é constituído pela
figura de um círculo repartido, por meio de seus raios, em n partes proporcionais à ocorrência
da variável nos resultados da pesquisa. Como cada parte apresentada faz parte de um todo, os
gráficos de pizza são particularmente interessantes para facilitar a visualização dos tamanhos
relativos, entre cada uma das partes do todo.
Os gráficos de pizza são utilizados para apresentar os resultados de uma única variável, de forma
estática, em determinado período de tempo. Sugere-se, para não dificultar a visualização, que sejam
utilizadas variáveis com, no máximo, oito categorias. A repartição do círculo deve ser iniciada a
partir de seu ponto mais alto (ponto correspondente às 12 horas de um relógio) e deve obedecer
a uma sequência da maior parte para a menor, no sentido horário. Para melhor visualização, além
de colocar o nome da variável e a percentagem correspondente, pode-se também hachurar cada
parte do gráfico de forma diferente. A Figura 14.2 apresenta um exemplo de gráfico de pizza.
Gráficos de linhas – Se desejar-se representar, por meio de gráfico de pizza, a evolução
de diversas variáveis, ao longo de vários períodos de tempo, deve-se utilizar um gráfico para
cada variável e para cada período que se pretenda representar. No entanto, essa forma de
apresentação, além de exigir a construção de uma infinidade de gráficos, dificulta a visualização,
as evoluções e as comparações de variáveis. Quando a apresentação dos resultados de forma
gráfica envolve a comparação de resultados de diversas variáveis e sua evolução ao longo do
414 Pesquisa de Marketing

Figura 14.2  Número de filhos por família.

tempo ou a comparação dos resultados simultâneos de duas diferentes variáveis, a forma mais
recomendada é o gráfico de linhas.
O gráfico de linhas tem duas dimensões; para o registro de cada dimensão, é utilizado o
sistema cartesiano de dois eixos perpendiculares, um na horizontal e outro na vertical, e os
pontos de cruzamento entre os valores correspondentes das duas variáveis consideradas são
interligados, formando uma linha. Se os resultados a serem representados forem de uma (ou
mais) variável(eis), ao longo do tempo (séries de tempo), o eixo X (horizontal) é utilizado
para a variável tempo, enquanto o eixo Y (vertical), para a(s) variação(ões) da(s) variável(eis)
estudada(s).Veja nas Figuras 14.3 e 14.4 dois exemplos de gráficos de linha, um para séries de
tempo e outro para o cruzamento de duas diferentes variáveis no mesmo período de tempo.

Figura 14.3  Evolução e distribuição da produção das diversas montadoras de automóveis no Brasil de 1985
a 1990.
Comunicação dos Resultados 415

Figura 14.4  Relação entre os estratos socioeconômicos e a porcentagem de alimentos supergelados


consumida por mês – março de 1992.

Gráficos de estratos – Os gráficos de estratos constituem uma espécie de fusão entre os


gráficos de pizza e os gráficos de linhas, pois permitem apresentar as participações relativas de
um todo de forma evolutiva, ao longo de vários períodos de tempo. Os gráficos de estratos cons-
tituem um conjunto de gráficos de linhas de desagregação de um total.Veja na Figura 14.5 um
exemplo de gráfico de estratos desagregando o total da produção da indústria automobilística
brasileira, entre seus fabricantes, de 1985 a 1990.

Figura 14.5  Distribuição da produção da indústria automobilística entre seus fabricantes de 1985 a 1990.
416 Pesquisa de Marketing

Gráficos de barras – Os gráficos de barras apresentam os resultados por meio dos


desenhos de diversas barras. A cada barra desenhada, associa-se uma variável e, ao seu com-
primento, vincula-se a outra variável que se deseja relacionar. Prestam-se a muitas formas de
apresentação de resultados. Podem ser utilizados para apresentar tanto os resultados de uma
só variável, em determinado período de tempo, como os resultados de diversas variáveis, em
diversos períodos, de uma forma evolutiva, permitindo uma grande facilidade de comparações.
Os gráficos de barras possuem grande versatilidade de apresentações.Veja nas Figuras 14.6, 14.7
e 14.8 exemplos de diferentes formas de apresentação e utilização de gráficos de barras.

Figura 14.6  Renda familiar anual nos estratos socioeconômicos em 1990.

Figura 14.7  Evolução da renda familiar anual nas classes A, B e C de 1988 a 1991 no Brasil (dados hipotéticos).
Comunicação dos Resultados 417

Figura 14.8  Evolução da produção de veículos automotores por tipo no Brasil de 1957 a 1990.
Fonte: Anfavea – Anuário Estatístico 1957-1990.

APRESENTAÇÃO ORAL DOS RESULTADOS


A apresentação oral dos resultados é geralmente utilizada para dar suporte ao relatório da
pesquisa. A forma de apresentação pode ser de uma simples reunião de esclarecimentos com
o principal usuário do contratante da pesquisa até apresentações formais para um grande
grupo de interessados.
A apresentação oral tem o propósito principal de permitir que os usuários da pesquisa
façam perguntas e solicitem esclarecimentos sobre pontos em que tenham dúvidas. Tendo
em vista esse objetivo, a apresentação oral só deve ser efetuada após os usuários terem tido
contato com os resultados contidos no relatório e deve ser marcada para cinco a dez dias
após sua entrega.
Dar sugestões de como proceder nas apresentações orais é muito difícil, tendo em vista que
a forma e os comportamentos de apresentações dependem da personalidade do apresentador e
do perfil da audiência a que se destina. Apesar dessa dificuldade, algumas sugestões gerais para se
conseguir uma boa apresentação podem ser elencadas:
• Planejar detalhadamente a apresentação.
• Definir o que será apresentado – Lembrar-se de que a audiência já recebeu o relatório da
pesquisa, portanto a apresentação não deve ser uma repetição de tudo que consta do relatório,
mas de tudo que for importante e relevante para os objetivos e para o problema de pesquisa.
Procure informar-se do tempo disponível para a apresentação e tenha-o em mente ao montar
seu plano de apresentação.
• Com o material selecionado, montar um roteiro lógico para a apresentação – Recapitular o
problema e os objetivos da pesquisa; fazer uma rápida apresentação da metodologia; elencar
os principais resultados, as conclusões e as recomendações. O material não selecionado
deverá ser levado junto, para o caso de precisar ser consultado a fim de responder a alguma
dúvida específica.
• Preparar o material para a apresentação – Isso inclui a construção de transparência, slides,
vídeos, flip-charts etc. O material a ser preparado vai depender dos recursos audiovisuais
418 Pesquisa de Marketing

a serem usados na apresentação. Quaisquer que sejam esses recursos, recomenda-se a


utilização intensa de quadros, tabelas, figuras e gráficos.
• Cuidar para que o local da apresentação seja adequado (haja acomodação confortável para
todos, que o local seja silencioso, que não esteja sujeito a interrupções frequentes etc.) e
que todos os recursos necessários à apresentação estejam disponíveis (retroprojetor, TV e
videocassete, projetor de slides, flip-chart, quadro-negro etc.).
• Se o apresentador ainda não tiver prática em apresentações, é recomendável treinar antes de
se expor a uma apresentação real (se o treino puder ser gravado em vídeo/CD, o próprio
apresentador poderá observar como melhorar sua apresentação; se não for possível, algum
colega deverá assistir ao treino e fazer sugestões para o aprimoramento).
• No dia da apresentação, chegar ao local cerca de meia hora mais cedo, a fim de verificar se
está tudo em ordem, principalmente os equipamentos; procurar saber, caso os equipamentos
falharem, a quem deverá recorrer para efetuar reparos ou substituições.
• Não iniciar a apresentação sem que elementos-chave do patrocinador, esperados para a
apresentação, estejam presentes, a não ser que seja autorizado seu início por alguém da casa.
• Começar mostrando qual é seu plano de apresentação – Dizer para a audiência o que será
apresentado, inclusive informar que as dúvidas, perguntas e solicitações de esclarecimentos
podem ser feitas a qualquer momento, interrompendo a apresentação, ou se só serão per-
mitidas ao final da exposição; seguir exatamente o plano de apresentação planejado.
• Ficar sempre de frente para a audiência; assumir um posicionamento adequado, evitando
maneirismos com as mãos e com outras partes do corpo.
• Evitar, ao máximo, a leitura dos resultados apresentados de forma visual (quadros,
tabelas, figuras e gráficos); a audiência tem condições de ler o que está sendo mostrado.
O importante é salientar e comentar os pontos relevantes.
• Quando a apresentação se dirigir a um número muito grande de profissionais de
diferentes áreas da instituição contratante, é comum que discordâncias em relação aos
resultados apresentados surjam, em função das diferentes experiências práticas ou do
conhecimento de outras fontes de informações. Quando isso ocorrer, a atitude recomen-
dada ao apresentador é a de, respeitando as opiniões divergentes, defender a correção de
seus resultados, apontando para a correção da metodologia utilizada.

ENTREGA ELETRÔNICA DOS RESULTADOS


Uma forma mais eficaz e econômica de entrega de resultados consiste em enviar ao cliente
o relatório e também o banco de dados por via eletrônica (em CD-ROM ou anexado a um
e-mail, via internet). O envio do banco de dados permite que o próprio cliente possa realizar
outros cruzamentos e análises além daqueles solicitados na pesquisa e constantes do relatório
produzido.

RESUMO
Existem dois meios de se comunicarem os resultados de uma pesquisa: escritos e orais.
O relatório escrito é a forma mais completa e a mais utilizada para a comunicação dos
resultados de uma pesquisa. Os procedimentos para a elaboração do relatório escrito da pesquisa
devem torná-lo completo, preciso, objetivo, claro e conciso.
Comunicação dos Resultados 419

As principais partes de um relatório de pesquisa são: página de rosto; sumário; resumo


gerencial; corpo do relatório; conclusões, recomendações e limitações; anexos e bibliografia
e/ou referências bibliográficas.
As opções existentes para a apresentação de resultados de forma gráfica compreendem:
quadros, tabelas, figuras e gráficos.
Os quadros se caracterizam por ter suas laterais fechadas (formando efetivamente um
quadro) e são utilizados, geralmente, para apresentar dados qualitativos.
As tabelas se caracterizam por ter apenas linhas horizontais e nenhuma linha vertical, por
não ter suas laterais fechadas e por apresentar, geralmente, dados numéricos.
As figuras constituem os gráficos, desenhos, esquemas, fluxogramas, cronogramas e organo-
gramas utilizados para mostrar conclusões de forma visual, cujas descrições verbais exigiriam
muito tempo.
Os gráficos constituem um tipo específico de figura em que os resultados referentes a uma
variável, ou ao cruzamento de duas (e, às vezes até três) variáveis, são apresentados de forma
visual. Há, basicamente, quatro tipos de gráficos: de pizza, de linhas, de estratos e de barras.
O gráfico de pizza é constituído pela figura de um círculo repartido, por meio de seus
raios em n partes proporcionais à ocorrência da variável nos resultados da pesquisa.
O gráfico de linhas tem duas dimensões; para o registro de cada dimensão, é utilizado o
sistema cartesiano de dois eixos perpendiculares, um na horizontal e outro na vertical, e os
pontos de cruzamento entre os valores correspondentes das duas variáveis consideradas são
interligados, formando uma linha.
Os gráficos de estratos constituem uma espécie de fusão entre os gráficos de pizza e os
gráficos de linhas, pois permitem apresentar as participações relativas de um todo de forma
evolutiva.
Os gráficos de barras apresentam os resultados por meio do desenho de diversas barras.
A cada barra desenhada, associa-se uma variável e, ao seu comprimento, vincula-se a outra
variável que se deseja relacionar.
A apresentação oral dos resultados é geralmente utilizada para dar suporte ao relatório
da pesquisa e tem o propósito principal de esclarecer dúvidas dos usuários sobre a pesquisa
e seus resultados.
As sugestões para se conseguir uma boa apresentação oral compreendem: planejar deta-
lhadamente a apresentação; definir o que será apresentado; montar um roteiro lógico para a
apresentação; preparar o material para a apresentação; cuidar para que o local da apresentação
seja adequado; treinar antes de se expor a uma apresentação real; chegar ao local com cerca de
meia hora de antecedência, para verificar se está tudo em ordem; não iniciar a apresentação
sem a presença de elementos-chave do patrocinador; começar mostrando qual é seu plano
de apresentação; ficar sempre de frente para a audiência; evitar, ao máximo, a leitura dos
resultados apresentados de forma visual; nunca entrar em discussão com a audiência sobre os
resultados da pesquisa.

QUESTÕES DE REVISÃO
1. Qual é a importância do relatório de uma pesquisa?
2. Qual o significado de se obter um relatório de pesquisa com cada uma das seguintes
características: completo, preciso, objetivo, claro e conciso?
420 Pesquisa de Marketing

3. Você acha que completo e conciso são características compatíveis num relatório de pes-
quisa? Explique.
4. Qual o objetivo de se elaborar um resumo gerencial da pesquisa?
5. Qual deve ser o conteúdo essencial de cada uma das seguintes partes de um relatório
de pesquisa: página de rosto; sumário; resumo gerencial; corpo do relatório; conclusões,
recomendações e limitações; anexos e bibliografia e/ou referências bibliográficas?
6. O que é um gráfico de pizza? Qual a sua utilização principal? Dê um exemplo.
7. O que é um gráfico de linhas? Qual a sua utilização principal? Dê um exemplo.
8. O que é um gráfico de estratos? Qual a sua utilização principal? Dê um exemplo.
9. O que é um gráfico de barras? Qual a sua utilização principal? Dê um exemplo.
10. Qual a principal função da apresentação oral dos resultados de uma pesquisa?
11. Quais as sugestões para se conseguir uma boa apresentação oral?

Trabalho – Parte 12
1. Elabore uma primeira versão do relatório relatando os resultados de sua pesquisa. Sub-
meta-o à análise crítica de dois colegas que não tenham conhecimento de seu trabalho.
Reformule seu relatório em função das sugestões recebidas. Submeta-o a uma primeira
avaliação do professor. Reformule-o em função das sugestões recebidas e entregue a versão
final para nova avaliação do professor.
2. Prepare uma apresentação oral dos resultados de sua pesquisa.Tempo de duração: mínimo
de cinco e máximo de dez minutos.Treine a apresentação em casa, gravando-a em vídeo/
CD, ou faça-a na presença de dois colegas. Aprimore a apresentação em função do que
você vir no vídeo/CD ou ouvir de sugestões dos colegas.

REFERÊNCIAS
BRITT, Steuart H.The communication of your research findings. In: FERBER, Robert (Ed.) Handbook of marketing
research. New York: McGraw-Hill, 1974, pp. 1-85, t. 1-95.
CASEY, R. S. Oral communication of technical information. New York: Reinhold Book, 1958.
CHURCHILL, JR., Gilbert A. Marketing research: methodological foundations. Hinsdale, Illinois: Driden, 1979.
GALLAGHER, William J. Report writing for management. Reading, Massachusetts: Addison-Wesley, 1969.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
CAPÍTULO 15
Histórico, Ética, Modelo de Propostas
e Outros Tópicos em Pesquisa
de Marketing
A revolução da informação representa uma nítida transferência de poder de quem detém
o capital para quem detém o conhecimento.
Peter Drucker

Objetivos
Apresentar outros tópicos relevantes de pesquisas de marketing que não foi possível incluir em capítulos
anteriores.

Sumário
HISTÓRICO DA PESQUISA DE MARKETING
PESQUISA DE MARKETING NO BRASIL E NO MUNDO
ÉTICA EM PESQUISAS DE MARKETING
FORMATO E CONTEÚDO DE PROPOSTAS DE PESQUISAS DE MARKETING
Itemização de propostas de pesquisa de marketing
Orçamento de pesquisa
CRITÉRIOS PARA CONTRATAÇÃO EXTERNA DE PESQUISAS DE MARKETING
Uso de pesquisas externas
Escolha do fornecedor
PUBLICAÇÃO DE ARTIGOS COM RESULTADOS DE PESQUISAS

HISTÓRICO DA PESQUISA DE MARKETING1


Uma rápida visão histórica da evolução da pesquisa de marketing ajudará na compreensão
do estágio atual em que se encontra e de sua inter–relação com a evolução do conceito
de marketing.
A pesquisa de marketing evoluiu e ganhou importância à medida que o conceito de
marketing também evoluiu com a adoção, pelas empresas, de uma orientação filosófica
para o consumidor.

1
 arte do histórico da pesquisa de marketing foi coletada no acervo da Associação dos Institutos de Pesquisa
P
de Mercado – ABIPEME.

421
422 Pesquisa de Marketing

A primeira pesquisa, segundo Eaton e Harrison (1930), ocorreu em Londres, em 1840,


e está descrita no Journal of the Statistical Society of London. Consistiu em dois pesquisadores
visitarem dois bairros operários de Londres e procederem a várias entrevistas, em diversas
residências.Tinha por objetivo levantar dados sobre as condições de vida e moradia de traba-
lhadores.
No período de 1900 a 1930, nos Estados Unidos, o interesse da administração das em-
presas estava voltado principalmente para as atividades de produção: como produzir mais e
mais barato. Foi a época da produção em massa de produtos extremamente padronizados. Na
década de 1930, o interesse da administração voltou–se para a distribuição: havia necessidade
de aprimorar os canais de distribuição para poder escoar os produtos produzidos em massa.
Somente a partir de 1940 é que a administração das empresas começou a dar atenção para as
necessidades e os desejos do consumidor (King, 1965) e, paralelamente, cresceu o interesse
pela pesquisa de marketing.
O período que vai de 1910 a 1920 é reconhecido como o início formal da pesquisa de
marketing, embora uma ou outra pessoa ou instituição dela tenham feito uso antes de 1910.
Foi em 1911 que surgiu, nos Estados Unidos, a primeira empresa de pesquisa “comercial” de
que se tem notícia: The Business Bourse. Nesse mesmo ano, a Curtiss Publishing Company
criou sua divisão de pesquisa comercial, que a tornou a maior empresa da década de 1920.
O grande sucesso da Curtiss levou inúmeras outras a estabelecerem suas próprias divisões de
pesquisas de marketing, tais como a United States Rubber Company, em 1915, e a Swift and
Company, em 1917.
Em 1919, foi publicado o primeiro livro que reunia todos os conhecimentos sobre pes-
quisa de marketing até então: Commercial research: an outline of working principles, do Professor
C. S. Duncan, da Universidade de Chicago. Em 1921, foi publicado o livro Market analisys, de
Percival White, um best–seller reeditado inúmeras vezes (Lockley, 1974).
Em 1937, foi publicado um livro de pesquisa que obteve grande sucesso e popularidade
nas universidades: Market research and analisys, de Lyndon O. Brown, que refletiu o interesse
crescente da pesquisa de marketing nos meios acadêmicos dos Estados Unidos. Após 1940,
com a mudança da orientação das empresas para o atendimento das necessidades e desejos
dos consumidores, um grande número de escolas de administração passou a oferecer cursos
de marketing e de pesquisa de marketing; em consequência, inúmeros outros livros-texto de
pesquisa de marketing foram publicados.
Após o término da Segunda Guerra Mundial, a atenção da administração das empresas
voltou–se cada vez mais para o consumidor e, com a crescente adoção do conceito filosófico
de marketing, intensificaram-se espantosamente as atividades de pesquisa na área. Em 1948,
já havia mais de 200 empresas de pesquisas de marketing nos Estados Unidos. Os gastos com
pesquisas de marketing, naquela ocasião, foram estimados em cerca de US$ 50 milhões. Para
se ter ideia da rápida evolução dessa atividade, em 1968 esses gastos já alcançavam US$ 600
milhões (Kinnear, 1979) e atingiram US$ 3,862 bilhões em 1997, somente nos Estados Unidos.
A mudança da prática das empresas para o conceito de marketing resultou na mudança
da ênfase de pesquisa de mercado, como era chamada até então, para pesquisa de marketing. A
pesquisa de marketing envolve a pesquisa de todas as fontes de dados e de informações de
interesse de marketing, incluindo o foco da pesquisa de mercado, que são as pesquisas voltadas
exclusivamente ao levantamento de dados e informações do mercado. A pesquisa de marketing
exige um envolvimento muito grande entre pesquisadores e executivos de marketing, no
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 423

sentido de trabalharem de forma a obter as informações necessárias e corretas para ajudá–los


no processo de decisão de marketing. Um livro que registrou essa mudança de ênfase foi o
Marketing research, de Harper Boyd e Ralph Westfall, em 1956, sendo o primeiro livro–texto
sobre o assunto no Brasil, publicado pela Editora da Fundação Getulio Vargas, em 1964, com
o título de Pesquisa mercadológica. Alcançou grande sucesso e é tido como um dos mais com-
pletos, mas já desatualizado. Outra obra com grande aceitação aqui foi Pesquisa de mercado:
teoria e prática, de Guglielmo Tagliacarne, publicada pela Editora Atlas em 1974, mas ainda
com enfoque de pesquisa de mercado. A primeira publicação sobre pesquisa de marketing
de autor brasileiro foi Pesquisa de marketing: metodologia, planejamento, execução e análise, do Dr.
Fauze Najib Mattar, professor da Faculdade de Economia, Administração e Contabilidade da
Universidade de São Paulo, pela Editora Atlas, em 1992, em dois volumes.
As publicações na área, a partir de 1960, passaram a denotar preocupação com o desen-
volvimento metodológico de pesquisa de marketing. Esse desenvolvimento, principalmente
na área da pesquisa quantitativa de marketing, só se tornou possível em função da evolução
das técnicas estatísticas e do barateamento, da miniaturalização e consequente popularização
do uso do processamento eletrônico de dados.
Em 1960, retratando essas preocupações metodológicas, surgiram nos Estados Unidos duas
importantes publicações periódicas dedicadas à área: o Journal of Advertising Research e o Journal
of Marketing Research, ambos publicados pela American Marketing Association. Em 1966, foi
publicado um livro–texto dedicado especificamente à pesquisa quantitativa de marketing:
Research for marketing decisions, dos Professores Paul Green e Donald Tull. Em 1974, surgiu
mais uma publicação periódica: o Journal of Consumer Research, dedicado a pesquisas sobre o
consumidor.

PESQUISA DE MARKETING NO BRASIL E NO MUNDO


Os negócios de pesquisa de marketing passaram a se desenvolver, no Brasil, por solicitação de
filiais das empresas de origem nos Estados Unidos aqui instaladas.
O primeiro registro de pesquisa realizada no Brasil data de 1934 e refere-se ao estudo
sobre hábitos e preferências de consumidores de café, realizado pela agência de publicidade
N. W. Ayer (de origem nos Estados Unidos) para o Departamento Nacional do Café. A N. W.
Ayer havia montado no Brasil, em 1931, uma filial para atender à Ford. Foi um período em
que diversas empresas estrangeiras instalaram operações aqui, induzindo suas agências de pu-
blicidade a fazerem o mesmo para atendê-las. Foi dessa época a vinda da J. Walter Thompson
(1929) para atender à General Motors e da McCann-Erikson (1935), para atender à Unilever.
Data também dessa época a grande expansão do rádio. As agências de publicidade estran-
geiras cuidavam das produções radiofônicas, incluindo as novelas, e também procuravam aferir,
com técnicas de pesquisas de opinião, o alcance e a penetração dos programas radiofônicos, bem
como das mensagens de propaganda que neles eram veiculadas para seus clientes. Pequenos
núcleos foram sendo formados nessas agências para a realização de pesquisas que utilizavam
experiências e metodologias das matrizes no exterior.
Ainda nessa mesma época, surgiram as primeiras iniciativas acadêmicas destinadas à formação
de profissionais capacitados à condução de pesquisas. Em 1933, foi fundada a Escola Livre de
Sociologia e Política - ELSP e, em 1935, a Faculdade de Filosofia, Ciências e Letras da Uni-
versidade de São Paulo - FFCL onde eram ensinadas metodologias e técnicas para a realização
424 Pesquisa de Marketing

de pesquisas sociais, como entrevistas em profundidade, surveys, técnicas de amostragem, cons-


trução de questionários etc. Embora nenhum dos dois cursos visasse explicitamente à formação
de pesquisadores de marketing, as técnicas ensinadas eram perfeitamente adaptadas à pesquisa
de marketing. Curiosamente, enquanto o curso da ELSP, estruturado segundo o modelo dos
Estados Unidos e com muitos professores de lá oriundos, valorizava a pesquisa empírica, o
curso da FFCL, estruturado segundo o modelo francês e com muitos professores franceses,
valorizava a teoria, a metodologia e a elitização. Na prática, ocorreu que os formados pela ELSP
adaptaram-se melhor e mais rapidamente às necessidades “empíricas” das empresas de pesquisas.
O primeiro profissional de pesquisa de marketing no Brasil foi Octávio da Costa Eduardo.
Formado pela ELSP em 1938, foi apresentado por seu professor Donald Pierson ao professor
Lloyd Free, da Princeton University, editor da Public Opinion Quarterly e amigo pessoal de
Nelson Rockefeller. Naquela ocasião, financiado por Rockefeller, Lloyd Free organizava em
diversos países pesquisas para apurar a imagem dos Estados Unidos e coletar opiniões acerca
de seu possível envolvimento na Segunda Guerra Mundial. Octávio foi convidado por Lloyd
Free a aplicar os questionários dessa pesquisa no Brasil. Dessa experiência, surgiu o convite
para estudar Psicologia e Antropologia Social nos Estados Unidos com Angus Campbell, da
Northwestern University, e colaborador de Paul Lazarsfeld. Após voltar ao Brasil, em 1945,
Octávio tornou-se professor da ELSP e, junto com seus alunos, viabilizou diversos projetos
trazidos por Elmo Wilson, da International Resarch Associates, dos Estados Unidos.
A primeira empresa de pesquisas no Brasil foi fundada em 1942, por Auricélio Penteado,
que era promotor da Justiça Militar e também radialista. Fundou o Instituto Brasileiro de
Opinião Pública e Estatística - IBOPE movido apenas pela curiosidade de conhecer o perfil do
público de seus programas no rádio. Inicialmente limitado a São Paulo e realizando pesquisas
de audiência de rádio, o IBOPE cresceu rapidamente. Em 1946, abriu uma sucursal na cidade
do Rio de Janeiro e, em 1950, realizou pesquisa eleitoral sobre a disputa para presidente da
República.Transferiu sua sede para a cidade do Rio de Janeiro e especializou-se em pesquisas
eleitorais e pesquisas de audiência de rádio.
Em 1951, como resultado da realização de trabalhos para a Esso e para a Embaixada dos
Estados Unidos no Brasil, sob a supervisão da International Resarch Associates, Octávio da
Costa Eduardo constituiu o Instituto de Opinião Pública e Mercado - IPOM.
Em 1952, na filial de São Paulo da agência de propaganda McCann-Erickson, Alfredo
da Silva Carmo e Júlio César Vercesi iniciaram o desenvolvimento de estudos motivacionais.
Em 1956, o núcleo de pesquisa de São Paulo e o da matriz no Rio de Janeiro se juntaram
para formar uma empresa de pesquisa autônoma da agência, que, mais tarde, deu origem à
Marplan (hoje IPSOS), que funcionava de forma associada ao departamento de Planejamento
de Mercado da agência.
Até o início da década de 1960, as pesquisas de marketing, excetuando-se as pesquisas de
opinião e políticas, eram restritas às grandes corporações internacionais e realizadas por um
número restrito de empresas de pesquisas. Aquelas criadas por brasileiros enfrentavam, nessa
ocasião, grande dificuldade de mercado, o que não ocorria com seus concorrentes direta-
mente ligados às grandes agências publicitárias internacionais, que detinham a exclusividade
para realizar pesquisas para seus clientes. O mercado de pesquisas para empresas brasileiras
praticamente inexistia.
Em 1955, após desligar-se do IPOM, Octávio da Costa Eduardo fundou, em São Paulo, o
Instituto de Estudos Sociais e Econômicos - INESE. Nesse instituto, ele concebeu o “Barômetro
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 425

de Consumo INESE”, uma pesquisa store audit, quadrimensal, junto a uma amostra de 8.400
estabelecimentos distribuídos em oito capitais, que tinha como clientes, entre outros: Johnson
& Johnson, Laboratórios Vick, Laboratórios Anakol, Fontoura White e Sidney Ross.
Em 1958, Máxime Castelneau, ao assumir a direção do IPOM, introduziu também uma pes-
quisa store audit que acabou inviabilizando a do INESE. O store audit do IPOM permaneceu no
mercado até a chegada ao Brasil da multinacional de pesquisas ACNielsen, em 1972. Dessa data
em diante, o domínio da ACNielsen nesse segmento do mercado de pesquisas no Brasil foi total.
Em 1960, a agência de publicidade McCann-Erickson, atendendo às necessidades de seus
clientes, introduziu um estudo regular voltado para a aferição de mídia. Esse estudo, com a
inclusão de muitas outras variáveis, passou a ser executado pela agência de pesquisa associada
à McCann, a Marplan, sendo conhecido como Estudos Marplan (atualmente conduzidos pela
IPSOS, uma multinacional francesa).
Data também dessa época o primeiro estudo qualitativo realizado no Brasil. Alfredo Carmo
realizou um estudo qualitativo (a técnica utilizada não foi informada) sobre o consumo de
chocolates por adultos – cujo índice era muito baixo quando comparado com o consumo
infantil – e constatou “que o chocolate é altamente desejado pelos adultos. Mas, em função
de sua imagem de produto de consumo infantil, o adulto vê-se bloqueado”. Em razão dessa
constatação, concluiu sugerindo ao cliente que “o encaminhamento que se deveria dar à
comunicação era de molde a fazer o adulto vencer o estereótipo de produto infantil, apre-
sentando-o como produto adulto”.
Em 1962, o INESE realizou para a Ford a primeira clínica de carros no país. O método
consistia em mostrar um protótipo em meio a outros modelos do mercado a uma pequena
amostra de potenciais clientes de determinado segmento do mercado e solicitar-lhes as im-
pressões e avaliações qualitativas para inúmeros itens. Octávio da Costa Eduardo relatou que
fez esses estudos para o lançamento do Galaxie pela Ford e da revista Realidade para a Editora
Abril e que haviam apontado aprovação e grande aceitação para os produtos.
Em 1964, é inventado por Hélio Silveira da Mota, publicitário da J. W. Thompson, um
aparelho para registrar automaticamente a audiência de TV, denominado tevêmetro. Até então, a
audiência de TV era obtida por declaração do entrevistado ao entrevistador em visita domiciliar
à amostra de domicílios. O invento entrou em operação experimental em São Paulo e Rio de
Janeiro e, após diversos aperfeiçoamentos, passou a ser utilizado em outras capitais brasileiras,
principalmente na década de 1970.
Também em 1964, foi realizada por Pergentino Mendes de Almeida a primeira pesquisa
focus group no Brasil, na ocasião denominada de discussão em grupo.
Em 1967, a Gessy Lever iniciou a operação da Mavibel para realizar pesquisas exclusiva-
mente para o grupo. Para inúmeros profissionais de pesquisa, a Mavibel foi uma verdadeira
escola de pesquisa de marketing. Muitos, após deixarem a Mavibel, abriram suas próprias
empresas de pesquisas.
Também em 1967, Carlos Eduardo Matheus filiou sua empresa à Gallup International
e, com sua tecnologia, criou, em 1969, a primeira pesquisa para medir a memorização de
propaganda de TV (Recall 24h), com amostras nas cidades de São Paulo e Rio de Janeiro. Criou
também a primeira pesquisa coletiva contínua (omnibus), com uma gama variada de assuntos,
contando com amostras nas cidades de São Paulo e Rio de Janeiro.
O segmento de pesquisas eleitorais caminhou bem enquanto havia eleições livres. Durante
os anos em que o país esteve sob a intervenção dos militares, esse segmento regrediu. Ressurgiu
426 Pesquisa de Marketing

com grande vitalidade com a redemocratização do país, após 1982. Em contrapartida às pesquisas
eleitorais, as pesquisas de audiência cresceram junto com o grande crescimento da penetração
da TV como veículo e com a formação das grandes redes de TV, com destaque para a Rede
Globo, e ocorreu justamente no período em que o país esteve sob a intervenção dos militares.
Foi justamente nesse período do país sob a intervenção dos militares, mais especificamente
entre 1968 e 1972, que ocorreu o grande crescimento do setor de pesquisas no Brasil, acompa-
nhando o forte crescimento da economia. O modelo econômico adotado favoreceu o ingresso
de inúmeras empresas estrangeiras na indústria de transformação. As atividades de marketing
praticadas por essas empresas propagaram-se como estilo de gestão comercial das empresas
mais dinâmicas e mais bem-sucedidas.
Paralelamente, observou-se um grande crescimento no ensino de economia e adminis-
tração, formando e disponibilizando para as empresas pessoal preparado e capacitado a exercer
funções gerenciais e executivas. Esse estilo de gestão empresarial voltado para marketing
irradiou-se rapidamente, inicialmente para fornecedores e distribuidores dessas empresas
estrangeiras, sob sua influência direta, e depois para concorrentes estrangeiros e até para em-
presas genuinamente nacionais (concorrentes ou não). Devido a esses dois fatores, empresas
voltadas para marketing e profissionais capacitados e estimulados a utilizar o ferramental de
marketing, o mercado de pesquisas cresceu rapidamente. Segundo estimativa de Octávio da
Costa Eduardo, o número de clientes das empresas de pesquisas cresceu de 20/30, em 1950,
para 50/70, em 1960, e atingiu 120/150, em 1970.
Esse crescimento da economia trouxe grande avanço nos veículos de comunicação (TV, rádio
e revistas) e na publicidade comercial, inclusive com o surgimento e o crescimento de diversas
agências de publicidade nacionais, que passaram a concorrer, com sucesso, com as estrangeiras.
O grande crescimento da participação da mídia televisiva no bolo das verbas de propaganda
e sua grande concentração em uma única rede de TV (Rede Globo) elevaram muito o custo de
veiculação dessa mídia em relação às tradicionais, o que fez com que agências de publicidade
e anunciantes investissem mais no controle das programações, dos índices de audiência e dos
resultados das campanhas, visando a uma melhor eficácia na aplicação das verbas publicitárias de
seus clientes. Em consequência, conforme relatório da história da J.W.Thompson, “na década
de 1960, a pesquisa de mercado, como instrumento de orientação publicitária, de criação e
aferição dos objetivos da comunicação, se impôs verdadeiramente”.
Sinal da importância que o setor atingiu foi o ingresso no mercado de duas grandes multi-
nacionais de pesquisa: ACNielsen, em 1972, e da Burke, em 1973. O ingresso dessas empresas
reduziu a participação de mercado de empresas brasileiras. Foi o início da desnacionalização do
setor e de inúmeros outros setores que ocorreram com grande intensidade após o Plano Real.
Após o Plano Real, com a estabilização dos preços, com a crescente competição e com
a globalização da economia brasileira, elevou-se ainda mais a importância das atividades de
marketing para o sucesso dos negócios e, em consequência, da pesquisa de marketing.
Como pode ser observado, na Tabela 15.1, os gastos estimados em pesquisa de marketing
no mundo cresceram 88%, de 2002 a 2010, atingindo US$ 31,2 bilhões.
De 2002 a 2010, em função da crise nos países desenvolvidos, houve mudanças importantes
no mercado. A América do Norte, que, em 2002, tinha 41% do mercado mundial de pes-
quisas, passou a deter 34% em 2010. Nesse mesmo período, observou-se grande crescimento
nos mercados das Américas Central e do Sul (177%) passando de 4% do mercado para 6%,
Oriente Médio e África (175%) passando de 1% para 2%, e Ásia/Pacífico (136%) passando
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 427

de 13% para 16%. Também se observa que, de 2009 para 2010, a Europa cresceu abaixo do
mercado (apenas 1% contra 2,8% do mercado) e a América Central e a América do Sul cres-
ceram muito acima do mercado (13,9%).
Tabela 15.1  Gastos em pesquisas de marketing por regiões do mundo em 2002 e 2010 (em milhões de US$)
2002 (em 2010 (em Crescimento Crescimento
milhões de Participação milhões de Participação 2002 a 2010 2009 a 2010
Região US$) 2002 (%) US$) 2010 (%) (%) (%)
Europa 6.820 41 13.142 42 93 1,0
América do Norte 6.756 41 10.614 34 57 3,1
Ásia/Pacífico 2.156 13 5.082 16 136 3,5
América Central 661 4 1.828 6 177 13,9
e do Sul
Oriente Médio 208 1 573 2 175 4,3
e África
Total mundial 16.601 100 31.239 100 88 2,8
Fonte: (1) ESOMAR, ISO/TC 225 “Market, opinion and social research” Draft Business Plan (IMF International Financial
Statistics 2004); (2) ESOMAR Industry Report. Global Market Research, 2011:6.1.

Na Tabela 15.2, apresenta-se a evolução do faturamento em pesquisas de marketing nos


seis principais países e no mundo, de 2002 a 2010 (em milhões de US$). Nessa tabela, pode-se
observar que os Estados Unidos, que representavam, em 2002, 36% do faturamento em pes-
quisas de marketing no mundo, caíram para a 32%, em 2010, com crescimento no período de
64%, abaixo do crescimento do mercado de 88%. A Grã-Bretanha também perdeu participação
no mercado (de 11% para 10%). Parte dessa participação foi obtida pela China (4%), que não
figurava em 2002, e pelos demais países, que cresceram de 30% para 31%.

Tabela 15.2  Evolução do faturamento em pesquisas de marketing nos seis principais países e no mundo
de 2002 a 2010 (em milhões de US$)
2002 2010 Crescimento
(em milhões Participação (em milhões Participação 2002 a 2010
País de US$) (%) de US$) (%) (%)
Estados Unidos 6.037 36 9.915 32 64
Grã-Bretanha 1.755 11 3.185 10 81
Alemanha 1.490 9 2.889 9 94
França 1.290 8 2.533 8 96
Japão 1.037 6 1.916 6 85
China n/d - 1.114 4 -
Demais países 4.992 30 9.687 31 94
Total mundial 16.601 100 31.239 100 88
Fonte: (1) ESOMAR Association, ISO/TC 225 “Market, opinion and social research”. Draft Business Plan; (2) Disponível em:
http://mundodapesquisa.wordpress.com/2012/01/06/top-20-mercados-de-pesquisa-online-em-2011/.Acessado em: 7 abr. 2012.

Na Tabela 15.3 está o faturamento em pesquisas de marketing pela internet no mundo e


nos dez maiores países (em milhões de US$). As pesquisas de marketing realizadas pela internet
vêm crescendo a taxas de 20% ao ano e já atingiram 22% do faturamento total mundial de
pesquisas de marketing em 2010, ou seja, US$ 6,9 bilhões.
428 Pesquisa de Marketing

Tabela 15.3  Faturamento em pesquisas de marketing pela internet no mundo e nos dez maiores países
(em milhões de US$), em 2010
Crescimento das
Pesquisa pela Total de Participação pesquisas pela
Classificação pelo internet pesquisas das pesquisas internet de 2010
faturamento na (em milhões (em milhões pela internet em relação a 2009
internet País de US$) de US$) (%) (%)
1 Estados Unidos 1.983 9.915 20 5
2 Alemanha 1.011 2.889 35 20
3 Japão 766 1.916 40 20
4 Grã-Bretanha 733 3.185 23 13
5 França 405 2.533 16 16
6 Canadá 294 699 42 19
7 Austrália 191 657 29 18
8 Espanha 96 736 13 108
9 Itália 93 771 12 75
10 China 56 1.114 5 n/d
Dez maiores 5.628 24.415 23
Demais países 1.245 6.824 18
Total mundial 6.873 31.239 22
Obs.: O Brasil não figura nesta lista por não informar à ESOMAR o faturamento em pesquisas pela internet.
Fonte: Disponível em: http://mundodapesquisa.wordpress.com/2012/01/06/top-20-mercados-de-pesquisa- online-em-2011/.
Acessado em: 7 abr. 2012.

Observa-se que a participação do faturamento das pesquisas pela internet no total do fatura-
mento de pesquisas de cada país não é homogênea, variando de 5% (China) a 42% (Canadá). Uma
das explicações para essa discrepância – mas não a única – está nas diferentes penetrações da internet;
há outras explicações, como a existência de fornecedores especializados em pesquisas on-line e
aspectos culturais dos povos na predisposição a responder questionários via internet, entre outras.
No Brasil, em 2003, o número de empresas de pesquisas associadas à Associação Brasileira
das Empresas de Pesquisa - ABEP (a ABEP resultou da fusão da ABIPEME com a ANEP em
2004) era de 162, com faturamento total de R$ 686,5 milhões. Estimando-se que as empresas
associadas à ABEP representam 90% do faturamento do setor, o faturamento do setor em 2003
pode ser estimado em R$ 763,0 milhões. Seguindo esses mesmos critérios, a estimativa do
faturamento de todo o setor, em 2011, pode ser estimado em R$ 1.776,5 milhões, com cres-
cimento de 133% em relação ao de 2003.
Apesar desse grande crescimento, tendo em vista o tamanho da economia brasileira, pode-se
concluir que esse faturamento ainda é pequeno. A pesquisa de marketing, embora seja um
negócio crescente no Brasil, está longe de adquirir a importância que atingiu, por exemplo, nos
Estados Unidos, onde, em 2010, alcançou o faturamento de US$ 9,9 bilhões, ou na Europa,
onde, também em 2010, atingiu US$ 13,1 bilhões.
No entanto, à medida que cresce a adoção do conceito de marketing pelas empresas bra-
sileiras e a economia do país continua crescendo a taxas superiores à dos países desenvolvidos,
também crescerá o negócio de pesquisa de marketing no Brasil.
Com dados dos faturamentos em pesquisas declarados pelas 174 empresas associadas à ABEP,
em 2011 foi construída a Tabela 15.4, mostrando o panorama atual do setor no Brasil.
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 429

Tabela 15.4  Faturamento do setor de pesquisas de marketing no Brasil – 2011 (em milhões de R$)
Faturamento Participação Faturamento
Número de conjunto (em Número de Faturamento médio anual (em
Porte (1) empresas milhões de R$) empresas (%) (%) milhões de R$)
Grandes 11 1.104,54 6,3 80,8 100,41
Médias 30 151,53 17,3 11,1 5,05
Pequenas 133 110,47 76,4 8,1 0,83
Total de associados 174 1.366,54 100 100,0 7,85
à Abep
Não associados n/d 409,96
à Abep (2)
Total Brasil (2) n/d 1.776,50
Fonte: Dados internos da Associação Brasileira de Empresas de Pesquisas – Abep, abr. 2012.
Observações:
(1) Porte das empresas segundo a Abep:
Grandes: faturamento acima de R$ 11,30 milhões/ano
Médias: faturamento de R$ 2, 89 a R$ 11,30 milhões/ano
Pequenas: faturamento até R$ 2, 89 milhões/ano
(2) Estimativas

Uma breve análise dessa tabela indica que a grande concentração no setor, já detectada em
2003, cresceu ainda mais em 2011, com apenas 11 empresas (6,3%) respondendo por 81% do
faturamento (em 2003, foram 15 empresas – 9,3% – respondendo por 80% do faturamento),
enquanto 163 empresas (93,7%) responderam por 19% do faturamento (em 2003, foram 147
empresas (90,7%) que responderam por 20% do faturamento do setor).
O resultado dessa situação é um grande número de empresas disputando um mercado pequeno
e ainda mais restrito pela ação das multinacionais. Consequentemente, a maioria das empresas
apresenta faturamento e resultados pequenos e até prejuízos.
As empresas do setor podem ser enquadradas em um dos seguintes tipos (caracterizados
pela importância da atividade em seu faturamento total):
• Empresas de pesquisas contínuas – Realizam, de forma sistemática e contínua (ou periódica),
pesquisas em todo o território nacional. São pesquisas padronizadas e de interesse de um
grande número de clientes. Aqui predominam as empresas de grande porte (nacionais e
multinacionais); são dirigidas para atender à eficiência operacional, e não para a aplicação
de metodologias científicas.
• Empresas de pesquisas sob medida (ou ad hoc) – Realizam pesquisas de forma assistemática
e não contínua, adequando-se às necessidades pontuais e momentâneas dos clientes. Aqui
predominam as empresas nacionais de médio porte e algumas de pequeno porte. Estão
preparadas para adequar as metodologias às necessidades da pesquisa do cliente.
• Empresas prestadoras de serviços – Realizam diversos serviços de pesquisas para as empresas
das outras duas categorias, tais como: aplicação de questionários, digitação, codificação,
processamento de dados, análises, edições etc. Aqui predominam as empresas nacionais de
pequeno porte. Adaptam-se às exigências e solicitações de seus clientes.
As grandes empresas de pesquisas operam em um ou mais dos seguintes direcionamentos:
• Formatam e disponibilizam enormes bancos de dados sobre transações comerciais, painéis
comportamentais de consumo, audiências de veículos de comunicação (rádio, TV, jornais
e revistas, internet) e medição de qualidade percebida em serviços.
430 Pesquisa de Marketing

• Formatam e disponibilizam modelos (com base em banco de dados e conhecimento do


mercado) de comportamento e previsão de mercados, de comportamento de consumidores,
de formação de preços, de eficiência da comunicação etc.
As médias empresas proveem com eficácia (rapidez, custos baixos, metodologia adequada
e precisão) as necessidades de pesquisas sob medidas dos clientes.

ÉTICA EM PESQUISAS DE MARKETING


À medida que a pesquisa de marketing foi ganhando importância como negócio, inúmeros
aspectos éticos começaram a ser levantados por parte de todos os envolvidos no processo
de pesquisa: clientes, agências, entrevistados e estudiosos. Tópicos éticos como os seguintes
começaram a ser constantemente discutidos e questionados:
• O respondente tem o direito de saber quem são os patrocinadores e os realizadores da
pesquisa?
• O respondente tem o direito de saber do que se trata a pesquisa e por que está sendo
realizada?
• O respondente tem o direito de não permitir que certas informações, já fornecidas, sejam
utilizadas na pesquisa?
• O respondente tem direito ao anonimato e a que as informações fornecidas tenham uso
restrito e específico?
• O excessivo número de vezes de entrevistas com um mesmo respondente é correto?
• O que deve conter uma proposta de pesquisa para ser corretamente avaliada e comparada
com outras pelo contratante?
• O que um relatório final de pesquisa deve conter para atender às necessidades do con-
tratante?
• Um contratante pode utilizar a metodologia contida na proposta de uma agência de pes-
quisa para ser aplicada por outra?
• Todo tipo de informação obtido pelo realizador da pesquisa deve ser repassado para o
patrocinador?
• Uma mesma empresa de pesquisa pode realizar pesquisas para clientes concorrentes?
• O que é ético e, portanto, pode ser utilizado nas técnicas de obtenção de dados:
• Uso de instrumentos ocultos para observação sem o conhecimento do observado
(espelhos one way, câmeras de foto/cinema/TV, gravadores etc.)?
• Argumentos inverídicos para conseguir entrevistas pessoais ou telefônicas?
• Promessas falsas de anonimato etc.?
Além dos aspectos éticos que dizem respeito diretamente aos envolvidos num processo de
pesquisa, existe também a questão ética das empresas que se utilizam do argumento de que se
trata de pesquisa para conseguir acesso a pessoas, residências e até empresas, mas cujo objetivo
é a realização de vendas ou prospecção de clientes potenciais para suas equipes de vendas.
Crawford (1970) realizou interessante pesquisa junto a pesquisadores e usuários de pes-
quisas de marketing sobre suas atitudes de aprovação ou desaprovação em relação a uma série
de práticas de pesquisas de ética discutível. Akaah e Riordan (1989), utilizando exatamente
a mesma metodologia de Crawford, reaplicaram essa pesquisa quase 20 anos depois. Os
resultados desses dois estudos estão apresentados, de forma que possam ser comparados, no
Quadro 15.1.
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 431

Quadro 15.1  Resultados (parciais) de pesquisas sobre atitudes de pesquisadores e usuários


de pesquisa de marketing sobre práticas discutivelmente éticas (1970 a 1989)
% de Desaprovação
Pessoal de pesquisa Pessoal de marketing
Item 1970 1989 1970 1989
Uso de tinta ultravioleta nos instrumentos 70 57 77 69
para identificação dos entrevistados
Uso de aparelhos ocultos 67 57 71 81
Uso de espelho one way 78 94 82 97
Ligações telefônicas falsas 10 – 16 -
Uso de nome fictício para a empresa 13 30 16 30
realizadora da pesquisa
Troca de informações sobre preços com o 89 89 82 87
pessoal de pesquisa dos concorrentes
Estímulo à propaganda para o uso exagerado 58 39 66 55
do produto (sem que haja perigo à saúde)
Distorção dos resultados da pesquisa pelo 87 88 86 89
pessoal de pesquisa
Conflito de interesse (fazer uso dos 57 56 38 44
resultados da pesquisa para atender a
interesses particulares)
Fonte: Crawford, Merle C. Attitudes of marketing executives toward ethics in marketing research. Journal of Marketing,
n° 34, p. 46–52, Apr. 1970; Akaah, I. P.; Riordan, F. A. Judgements of professionals about ethical issues in marketing research:
a reaplication and extension. Journal of Marketing Research, p. 112–120, Feb. 1989.

Pela observação desses resultados, é possível concluir que, à exceção dos itens 3, 6 e 8, as
percentagens de desaprovação para práticas discutivelmente éticas, em pesquisas de marketing,
não são elevadas, o que revela que essas práticas podem estar sendo aceitas por um número
considerável de profissionais da área.
A forma que as instituições que congregam as empresas de pesquisas de marketing
encontraram para resolver essas questões éticas, antes que legislações específicas o fizessem,
foi a elaboração e a sugestão de adoção, por seus associados, de códigos de conduta ética.
O primeiro código de ética para pesquisas de marketing foi elaborado, em 1948, pela Eu-
ropean Society for Opinion and Marketing Research - ESOMAR. Em 1972, esse código
foi revisto e atualizado. Somente em 1962, surgiu o primeiro código de ética para pes-
quisas de marketing nos Estados Unidos, elaborado pela American Marketing Association
- AMA, que passou por revisão e atualização em 1972. Tanto o código de ética da AMA
quanto o da ESOMAR (apesar de este ser mais completo) foram dirigidos, essencialmente,
à normatização das relações entre contratantes e contratados, não apresentando nenhuma
restrição no que diz respeito aos aspectos éticos envolvendo os respondentes. Essa omissão
dos dois códigos estimulou Tybout e Zaltman (1974) a escrever um artigo extremamente
crítico sobre o fato. Seus autores defendiam o ponto de vista de que “um entendimento dos
aspectos éticos envolvidos nas práticas de pesquisas de marketing é essencial para produzir
pesquisas com qualidade”. A persistência da AMA em não adotar, em seu código, os as-
pectos envolvendo os respondentes fez com que, a partir da publicação do artigo de Tybout
432 Pesquisa de Marketing

e Zaltman, restrições de ordem legal começassem a ser sugeridas e impostas nos Estados
Unidos, como as seguintes:
• O Comitê do Conselho de Ética de Pesquisas de Mercado do Congresso dos Estados
Unidos desenvolveu e teve aprovada, pelo Conselho de Pesquisas de Mercado, uma proposta
de Código de Ética de Pesquisas de Mercado para posterior apreciação pelo Congresso.
• A Federal Trade Comission - FTC agiu com sucesso contra empresas de enciclopédias
que utilizavam pesquisas de marketing para a realização de vendas.
• A FTC agiu com sucesso contra empresas que utilizavam pesquisas de marketing para
fazer prospecção de clientes para empresas de mala direta.
• A FTC agiu com sucesso contra empresas de pesquisas que garantiam que seus resultados
estavam totalmente isentos de erros não amostrais.
• A Lei de Privacidade de 1974 deu aos respondentes em projetos de pesquisas do governo
dos Estados Unidos todos os direitos sugeridos pelo trabalho de Tybout e Zaltman.
Em 1971, a International Chamber of Commerce - ICC, como representante da comu-
nidade internacional de marketing, unificou e racionalizou os principais pontos contidos nos
diversos códigos de éticas existentes e publicou o resultado, após consulta aos organismos de
marketing e de pesquisas de marketing diretamente envolvidos, como o Código Internacional
de Práticas de Pesquisas de Mercado.
A ICC e a ESOMAR reuniram esforços para a revisão e a atualização do código pu-
blicado em 1971 pela ICC, e publicaram em conjunto, em novembro de 1977, o Código
Internacional de Práticas de Pesquisas de Mercado e Sociais. Em sequência, complementando
a preocupação dessas entidades em estabelecer princípios éticos, bem como a harmonização
nas práticas de pesquisa, publicou, em 1979, o documento denominado Diretrizes ICC/
ESOMAR. Esse documento tem sido constantemente atualizado e pode ser acessado no site
www.esomar.com.
Não existe nenhum instrumento legal, no Brasil, estabelecendo práticas éticas em pes-
quisas de marketing. Em termos de ética em pesquisas de marketing, no Brasil há o Código
de Ética da Associação Brasileira das Empresas de Pesquisas - ABEP que pode ser acessado no
site www.abep.org. Nesse site, também podem ser encontrados outros códigos, guias e demais
materiais de interesse para os profissionais em pesquisa de marketing, como:
• Critério de Classificação Econômica Brasil - CCEB.
• Como selecionar uma empresa de pesquisa.
• Padrões de Qualidade ABEP.
• Guia ABEP para Divulgação de Pesquisas Eleitorais.
• Código de Ética ICC/ESOMAR.
• Código de Ética ABEP.
• Estatutos da ABEP.
• Busca de empresas associadas à ABEP.

FORMATO E CONTEÚDO DE PROPOSTAS DE PESQUISAS


DE MARKETING
A proposta de pesquisa de marketing não deve ser confundida com o projeto de pesquisa. O
projeto de pesquisa é um documento extremamente detalhista para uso interno da empresa
e da equipe de pesquisa, resultante de um grande esforço de planejamento. Uma proposta
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 433

de pesquisa é um documento que, baseado no projeto de pesquisa, deve conter informações


suficientes para que a entidade contratante/patrocinadora possa avaliá–lo, técnica e economi-
camente, e decidir pela contratação/patrocínio ou não. O desenvolvimento de um projeto de
pesquisas exige grande conhecimento de inúmeros aspectos metodológicos que não devem ser
fornecidos na proposta, sob pena de o proponente perder a primazia sobre sua metodologia.
Por outro lado, apresentar propostas sem entrar nos aspectos metodológicos, com certeza, não
inspirará confiança no contratante e, dificilmente, esta será aprovada. A sugestão é a apresentação
da metodologia de forma geral, sem entrar em pormenores técnicos.

Itemização de propostas de pesquisa de marketing


Os seguintes itens devem fazer parte de uma proposta de pesquisa de marketing:
Introdução
Objetivos
Geral
Específicos
Metodologia
Tipo de pesquisa
Método(s) de coleta de dados
População de pesquisa (ou público-alvo)
Amostra, amostragem, nível de confiabilidade, erro amostral etc.
Métodos de análises
Resultados esperados
Cronograma
Custo/forma de pagamento/validade da proposta
Responsabilidade da contratante
Responsabilidade da contratada
Responsável pela pesquisa
O conteúdo de cada uma dessas partes é sugerido pela ICC/ESOMAR, que, complemen-
tando a preocupação em estabelecer princípios éticos, bem como a harmonização nas práticas
de pesquisa, publicaram, em 1979, o documento denominado Diretrizes ICC/ESOMAR,
reproduzido no Web Anexo 15.1, e o Checklist a ser considerado, reproduzido no Web Anexo
15.2, ambos disponíveis no site www.elsevier.com.br/pesquisademarketing.

Orçamento de pesquisa
Muitas empresas pequenas e algumas médias têm problemas em orçar pesquisas. Essa dificuldade
fica evidente quando se observam resultados de licitações públicas de pesquisas. Em um processo
de licitação, normalmente toda a metodologia da pesquisa é predefinida pela instituição interes-
sada, facilitando, dessa forma, a comparação das propostas comerciais dos licitantes. Não tem sido
incomum encontrarem-se diferenças de até 600% nos preços entre a proposta de preço mais baixo
e a de preço mais elevado, denotando haver problemas na orçamentação de pesquisas pelas empresas.
No Quadro 15.2, apresenta-se uma sugestão de planilha para a elaboração de orçamentos de
pesquisas para empresas que adotam o sistema de Lucro Presumido, como a maioria das pequenas
empresas de pesquisa e parte das médias. Essa planilha pode ser colocada e programada em
planilha eletrônica, o que facilita e eleva a precisão dos cálculos, permitindo, também, efetuar
diversas simulações.
434 Pesquisa de Marketing

Quadro 15.2  Modelo de planilha de orçamento de pesquisa


Projeto
Atividade Quantidade R$ Unitário R$ Orçado R$ Real
Coordenação geral
Coordenação administrativa
Supervisão de campo
Entrevistas em profundidade (quando houver)
Relatório das entrevistas em profundidade
Aplicação de pré-testes
Campo/coleta de dados/aplicação de questionários
Ajuda de custos a entrevistadores
Impressão dos questionários (quando houver)
Agendamento de entrevistas (quando houver)
Custo de telefonemas para agendamento
Checagem (20% dos questionários)
Custo de telefonemas para checagem
Crítica dos questionários
Codificação de perguntas abertas (quando houver)
Digitação dos questionários (quando houver)
Crítica e consistência do banco de dados
Processamento e pré-elaboração de relatório
quantitativo
Análises e conclusões/elaboração de relatório final
Desk research (quando houver)
Cartuchos, papel, encadernação, motoboys, CD-ROMS etc.
Treinamento de pesquisadores
Viagens (transporte, hospedagem e alimentação)
INSS sobre autônomos
Subtotal 1 ST1
Margem de segurança sobre o subtotal 1 S
Subtotal 2 ST2
Overhead OH
Impostos (% sobre o total final) I
Total final TF

Sendo:
ST1 = Soma de todos os custos previstos.
S = % de margem de segurança aplicado ao ST1.
ST2 = ST1 + S × ST1.
OH = % do TF destinada ao lucro e a cobrir outros custos.
I = % do TF destinada ao pagamento dos impostos.
Tendo ST2, OH e I, calcula-se o valor de TF utilizando-se a fórmula:

TF = ST 2 / [1 − (OH + 1)]
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 435

Sendo OH e I em valores decimais (OH = Over head = % sobre o total final – pode também ser ao
custo total – destinado a cobrir outros custos e para atingir o lucro desejado com o projeto de pesquisa).
Exemplo:
ST1 = R$ 20.000,00
S = 5% (ou 0,05 em centesimais)
ST2 = R$ 20.000,00 + 0,05 × R$ 20.000,00 = R$ 21.000
OH = 30% (ou 0,30 em centesimais)
I = 13% (ou 0,13 em centesimais)
Aplicando a fórmula, ter-se-á:
TF = R$ 21.000 / [1 − (0,30 + 0,13)] = R$ 21.000 / 0,57 = R$ 36.842
Confirmando:
OH = 0,30 × R$ 36.842 = R$ 11.053
I = 0,13 × R$ 36.842 = R$ 4.789

CRITÉRIOS PARA CONTRATAÇÃO EXTERNA DE PESQUISAS


DE MARKETING
A maioria das empresas não possui departamento próprio de pesquisas de marketing e, por
isso, precisa contratar a realização de pesquisas com fornecedores externos.

Uso de pesquisas externas


Mesmo em empresas com departamento próprio de pesquisas, é comum a contratação externa:
• Em momentos de sobrecarga.
• Para atender à urgência na execução.
• Quando não se dispuser de pessoal e metodologia adequados.
• Quando for vantajoso utilizar empresas especializadas em certo tipo de pesquisa.
• Quando for vantajoso utilizar empresas com organização nacional (escritórios, equipe de pes-
quisadores e supervisores etc.), não compensando, em termos de custo e prazos, a realização interna.
• Quando a pesquisa a ser realizada abordar um assunto politicamente delicado, sendo
conveniente a contratação de uma instituição neutra e de reputação incontestável.
• Quando os resultados forem divulgados em campanhas de propaganda, a contratação de ins-
tituição externa, neutra e de reputação incontestável, atribuirá credibilidade às conclusões e
atenderá a normas do Conselho Nacional de Autorregulamentação da Publicidade - CONAR.

Escolha do fornecedor
Quando surge a necessidade de se contratarem pesquisas externas, surge também a dúvida sobre
quais critérios utilizar para selecionar a empresa a ser contratada. Para atender a essa necessidade,
apresenta-se, a seguir, uma série de sugestões para seleção e contratação de instituições de pesquisas:
• Manter um cadastro atualizado de fornecedores externos de pesquisa por especialidades.
• Visitar as instituições que parecem ser as melhores, contatando os principais dirigentes;
coletar exemplos de pesquisas realizadas e nomes de clientes; avaliar as instalações, os
equipamentos, o sistema de trabalho e as equipes técnicas.
• Verificar e avaliar o prestígio das instituições e de seus dirigentes junto ao mercado e a
seus principais clientes; efetuar visitas pessoais às empresas que foram e são clientes e reunir
impressões e informações para posterior avaliação.
436 Pesquisa de Marketing

• Apresentar o problema de pesquisa apenas para as instituições que foram aprovadas nos
itens anteriores e solicitar proposta de pesquisa, especificando quais os itens mínimos que
dela devem fazer parte e até quando podem ser apresentadas.
• A seleção da proposta vencedora deve ser tomada com base na compreensão do problema
de pesquisa, na adequação da metodologia adotada para a sua solução, nos prazos es-
tabelecidos e no preço. A utilização única e exclusiva do critério preço nem sempre leva
à melhor escolha, tendo em vista a relação custo/benefício.
• Elaborar um contrato em que todos os pormenores do desenvolvimento, controle, prazos,
responsabilidades, aceitação do resultado final e pagamentos estejam claramente especifica-
dos. É importante que os nomes dos respectivos responsáveis pela pesquisa, do contratante
e do contratado, constem do contrato.
Todos esses cuidados devem ser tomados quando se contrata pela primeira vez uma ins-
tituição. À medida que se adquire confiança com o conhecimento advindo por constantes
contratações, muitos desses cuidados tornam–se desnecessários.

PUBLICAÇÃO DE ARTIGOS COM RESULTADOS DE PESQUISAS


A publicação de artigos sobre resultados de pesquisas em revistas exige capacidade de síntese muito
grande do pesquisador, pois, geralmente, o espaço destinado à publicação é muito restrito, e os
artigos que não se enquadram nessas restrições simplesmente não são publicados. A restrição de
espaço em jornais é maior do que em revistas e, por isso e pela ampla audiência que atingem, os
aspectos metodológicos da pesquisa precisam ser reduzidos a um mínimo (às vezes, menciona-se
apenas o número de elementos da amostra, se foi probabilística ou não e qual a região abrangida).
Os itens que compreendem um artigo de resultado de pesquisa para publicação em revistas são:
• Sumário – Parte em que são sintetizados o objeto da pesquisa e os resultados atingidos
(máximo de dez linhas).
• Apresentação/introdução – Aqui, deve-se apresentar o problema de pesquisa, o porquê do
estudo, comentar sua importância e expor seus objetivos (em torno de 30 linhas).
• Estado da arte ou embasamento teórico – Apresenta–se uma rápida, mas completa revisão
da literatura a respeito do tema em estudo. Devem-se mencionar os principais estudos
anteriormente publicados, seus principais achados e conclusões, e também efetuar uma
breve discussão entre os diversos estudos. Faz-se necessário indicar pontos fortes e fra-
quezas e mostrar de que forma seu estudo se integra aos demais e como pode contribuir
para a ampliação do conhecimento. Caso ainda não tenham sido realizados estudos, deve
ser apresentado todo o embasamento teórico da pesquisa (não há uma delimitação para
este item, que dependerá da complexidade do estudo, da quantidade de estudos anteriores
que merecem citação e do espaço concedido pela revista).
• Apresentação das hipóteses e (ou) das questões de pesquisa – As hipóteses e/ou as questões de
pesquisa precisam estar de acordo com o que foi apresentado no item anterior, e sua apresen-
tação deve ser objetiva e não ocupar mais do que uma frase para cada hipótese ou questão.
• Resultados – São apresentados todos os principais resultados e achados da pesquisa por meio
de quadros, tabelas, figuras, gráficos e comentários objetivos (esta é a parte mais importante
do artigo e deve ocupar cerca de 70% do espaço).
• Conclusões – Neste item, apresentam–se as principais conclusões do estudo suportadas
pelos resultados. A apresentação das conclusões deve obedecer à mesma sequência da
Histórico, Ética, Modelo de Propostas e Outros Tópicos em Pesquisa de Marketing 437

apresentação das hipóteses e das questões de pesquisas. Além disso, deve–se fazer uma rápida
discussão dos resultados atingidos, em comparação com os dos demais estudos realizados,
e apontar os pontos em que foram concordantes e aqueles que foram discordantes.
• Implicações, recomendações e limitações – É o último item do artigo e onde são apresen-
tadas as implicações dos resultados para a área de conhecimento estudada, as recomendações
para decisões e as sugestões para a realização de outros estudos. Finalizando o artigo, devem
ser mencionadas as limitações do estudo em termos metodológicos e em que circunstâncias
seus resultados devem ser aceitos.
• Referências bibliográficas – Encerrando o artigo, são apresentadas todas as referências
bibliográficas utilizadas, seguindo o padrão recomendado pela Associação Brasileira de
Normas Técnicas - ABNT (2002).

RESUMO
A pesquisa de marketing surgiu e se desenvolveu a partir de 1910, nos Estados Unidos, onde as
verbas destinadas pelas empresas, em 1997, foram de US$ 3,862 bilhões.
A pesquisa de marketing evoluiu e ganhou importância à medida que o conceito de
marketing também evoluiu, principalmente com a adoção, pelas empresas, de uma orientação
filosófica ao consumidor.
Os negócios de pesquisa de marketing passaram a se desenvolver, no Brasil, por solicitação
de filiais das empresas de origem norte–americana aqui instaladas. No entanto, até hoje, seu
desenvolvimento tem sido muito restrito, não havendo nenhum termo de comparação com
o grande crescimento ocorrido, nos Estados Unidos, nas décadas de 1950 e 1960.
À medida que a pesquisa de marketing foi ganhando importância como negócio, inúmeros
aspectos éticos começaram a ser levantados por parte de todos os envolvidos no processo de
pesquisa: clientes, agências, entrevistados e estudiosos.
Pesquisas têm mostrado que as percentagens de desaprovação para práticas discutivelmente
éticas, em pesquisas de marketing, não são elevadas, o que revela que essas práticas estão sendo
aceitas por um número considerável de profissionais da área.
A forma que as instituições que congregam as empresas de pesquisas de marketing encon-
traram para resolver as questões éticas foi a elaboração e a imposição a seus associados de
códigos de conduta ética.
Os itens que devem fazer parte de uma proposta de pesquisa de marketing compreendem: in-
trodução; objetivos; metodologia; resultados esperados; cronograma; custo/condições de pagamento/
validade da proposta; responsabilidades da contratante e da contratada; e equipe responsável.
A maioria das empresas não possui um departamento próprio de pesquisas de marketing e,
por isso, precisa contratar a realização de pesquisas em instituições externas. Mesmo entre as que
possuem departamento de pesquisa de marketing, é comum a aquisição de pesquisas externas.
Com a necessidade de contratar pesquisas externas, surge a dúvida sobre quais critérios
utilizar para selecionar a empresa a ser contratada. Entre os critérios para contratação, os mais
importantes são qualidade, prazo e preço.
Os itens que compreendem um artigo de resultado de pesquisa para publicação em revistas
são: sumário; apresentação/introdução; estado da arte/embasamento teórico; hipótese/ques-
tões de pesquisa; resultados; conclusões, implicações, recomendações e limitações; e referências
bibliográficas.
438 Pesquisa de Marketing

QUESTÕES DE REVISÃO
1. Qual a explicação para o rápido desenvolvimento da pesquisa de marketing nos Estados
Unidos, nas décadas de 1950 e 1960, e para o fato de isso não ter ocorrido no Brasil com
a mesma intensidade?
2. Quais são os principais problemas de ética em pesquisas de marketing?
3. Qual a finalidade dos códigos de ética das associações que congregam pesquisadores e
empresas de pesquisa?
4. Quais itens devem conter uma proposta de pesquisa de marketing? Aponte as diferenças
entre uma proposta e um projeto de pesquisa.
5. Em que ocasiões/situações uma empresa com departamento de pesquisas de marketing
deve contratar pesquisas externas?
6. Quais critérios e cuidados uma empresa deve ter para contratar pesquisas externas?
7. Quais itens um artigo relatando resultados de pesquisas de marketing deve conter?

REFERÊNCIAS
ABIPEME – ASSOCIAÇÃO BRASILEIRA DOS INSTITUTOS DE PESQUISA DE MERCADO. Pesquisa
ao acervo.
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS – ABNT – Referências bibliográficas. Rio de
Janeiro, 2002.
AKAAH, I. P.; RIORDAN, F. A. Judgements of professionals about ethical issues in marketing research: a reap-
plication and extension. Journal of Marketing Research, pp. 112-120, Feb. 1989.
CHURCHILL, JR.; GILBERT, A. Marketing research methodological foundations. Hinsdale, Illinois: Driden Press,
1979.
CRAWFORD, Merle C. Attitudes of marketing executives toward ethics in marketing research. Journal of Marketing,
nº 34, pp. 46-52, Apr. 1970.
DURANT, José Carlos. Implantação da pesquisa de opinião e Mercado no Brasil (1930/1972). In: Anais…
ESOMAR – ABIPEME – Latin American Conference “Exchanging Experiences” São Paulo (Brazil), 5th –
8th, May, 1991.
ESOMAR, ISO/TC 225. Market, opinion and social research. Draft Business Plan (IMF International Financial
Statistics), 2004.
ESOMAR Industry Report. Global Market Research, 2011:6.1.
HOLBERT, Neil B.; SPEECE, Mark W. Practical marketing research: an integrated global perspective. New York:
Prentice Hall, 1997.
KINNEAR, Thomas C.; TAYLOR, James R. Marketing research: an applied approach. Tóquio: McGraw-Hill
Kogakusha, 1979.
LOCKLEY, Lawrence C. History and development of marketing research. In: FERBER, Robert (Org.). Handbook
of marketing research. New York: McGraw-Hill, 1974. pp. 1-3 a 1-15.
MALHORTA, Naresh K. Some observation on the state of art in marketing research, Journal of the Academy of
Marketing Sciences, n° 16, ano 1, pp. 4-24, Spring, 1988.
TYBOUT, Alice M.; ZALTMAN, Gerald. Ethics in marketing research: their practical relevance. Journal of Marketing
Research, v. 11, nº 4, pp. 357-368, nov., 1974.

Sites
ASSOCIAÇÃO BRASILEIRA DE EMPRESAS DE PESQUISA – ABEP – Documentos internos e www.
abep.org, abr. 2012.
MUNDO DA PESQUISA. Disponível em: http://mundodapesquisa.wordpress.com/2012/01/06/top-20-mer-
cados-de-pesquisa-online-em-2011/. Acessado em: 7 abr. 2012.

Material adicional disponível no site www.elsevier.com.br/pesquisademarketing


Web Anexo 15.1 – Código Internacional ICC/ESOMAR (Janeiro/2008)
Web Anexo 15.2 – Checklist
APÊNDICE

Tabelas estatísticas selecionadas


Tabela 1  Exemplo de tabela de números aleatórios
69 23 46 14 06 20 11 74 52 04 15 95 66 00 00 18 74 39 24 23 97 11 89 63 28
19 56 54 14 30 01 75 87 53 79 40 41 92 15 85 66 67 43 68 06 84 96 28 52 07
45 15 51 49 38 19 47 60 72 46 43 66 79 45 43 59 04 79 00 33 20 82 66 95 41
94 86 43 19 94 36 16 81 08 51 34 88 88 15 53 01 54 03 54 56 05 01 45 11 76
98 08 62 48 26 45 24 02 84 04 44 99 90 88 96 39 09 47 34 07 35 44 13 18 80
33 18 51 62 32 41 94 15 09 49 89 43 54 85 81 88 69 54 19 94 37 54 87 30 43
80 95 10 04 06 96 38 27 07 74 20 15 12 33 87 25 01 62 52 98 94 62 46 11 71
79 75 24 91 40 71 96 12 82 96 69 86 10 25 91 74 85 22 05 39 00 38 75 95 79
18 63 33 25 37 98 14 50 65 71 31 01 02 46 74 05 45 56 14 27 77 93 89 19 36
74 02 94 39 02 77 55 73 22 70 97 79 01 71 19 52 52 75 80 21 80 81 45 17 48
54 17 84 56 11 80 99 33 71 43 05 33 51 29 69 56 12 71 92 55 36 04 09 03 24
11 66 44 98 83 52 07 98 48 27 59 38 17 15 39 09 97 33 34 40 88 46 12 33 56
48 32 47 79 28 31 24 96 47 10 02 29 53 68 70 32 30 75 75 46 15 02 00 99 94
69 07 49 41 38 87 63 79 19 76 35 58 40 44 01 10 51 82 16 15 01 84 87 69 38
10 09 73 25 33 76 52 01 35 86 34 67 35 48 76 80 95 90 91 17 39 29 27 49 45
37 54 20 48 05 64 89 47 42 96 24 80 52 40 37 20 63 61 04 02 00 82 29 16 65
08 42 26 89 53 19 64 50 93 03 23 20 90 25 60 15 95 33 47 64 35 08 03 36 06
99 01 90 25 29 09 37 67 07 15 38 31 13 11 65 88 67 67 43 97 04 43 62 76 59
12 80 79 99 70 80 15 73 61 47 64 03 23 66 53 98 95 11 68 77 12 17 17 68 33
66 06 57 47 17 34 07 27 68 50 36 69 73 61 70 65 81 33 98 85 11 19 92 91 70
31 06 01 08 05 45 57 18 24 06 35 30 34 26 14 86 79 90 74 39 23 40 30 97 32
85 26 97 76 02 02 05 16 56 92 68 66 57 48 18 73 05 38 52 47 18 62 38 85 79
63 57 33 21 35 05 32 54 70 48 90 55 35 75 48 28 45 82 87 09 83 49 12 56 24
73 79 64 57 53 03 52 96 47 78 35 80 83 42 82 60 93 52 03 44 35 27 38 84 35
98 52 01 77 67 14 90 56 86 07 22 10 94 05 58 60 97 09 34 33 50 50 07 39 98
11 80 50 54 31 39 80 82 77 32 50 72 56 82 48 29 40 52 42 01 52 77 56 78 51
83 45 29 96 34 06 28 89 80 83 13 74 67 00 78 18 47 54 06 10 68 71 17 78 17
88 68 54 02 00 86 50 75 84 01 36 76 66 79 51 90 36 47 64 93 29 60 91 10 62
99 59 46 73 48 87 51 76 49 69 91 82 60 89 28 93 78 56 13 68 23 47 83 41 13
65 48 11 76 74 17 46 85 09 50 58 04 77 69 74 73 03 95 71 86 40 21 81 65 44
80 12 43 56 35 17 72 70 80 15 45 31 82 23 74 21 11 57 82 53 14 38 55 37 63
74 35 09 98 17 77 40 27 72 14 43 23 60 02 10 45 52 16 42 37 96 28 60 26 55
69 91 62 68 03 66 25 22 91 48 36 93 68 72 03 76 62 11 39 90 94 40 05 64 18
09 89 32 05 05 14 22 56 85 14 46 42 75 67 88 96 29 77 88 22 54 38 21 45 98
91 49 91 45 23 68 47 92 76 86 46 16 28 35 54 94 75 05 99 23 37 08 92 00 48
80 33 69 45 98 26 94 03 68 58 70 29 73 41 35 53 14 03 33 40 42 05 08 23 41
44 10 48 19 49 85 15 74 79 54 32 97 92 65 75 57 60 04 08 81 22 22 20 64 13
12 55 07 37 42 11 10 00 50 40 12 86 07 46 97 96 64 48 94 39 28 70 72 58 15
63 60 64 93 29 16 50 53 44 84 40 21 95 25 63 43 65 17 70 82 07 20 73 17 90
(Continua)
439
440 Pesquisa de Marketing

Tabela 1  Exemplo de tabela de números aleatórios (cont.)

61 19 69 04 46 26 45 74 77 74 51 92 43 37 29 65 39 45 95 93 42 58 26 05 27
15 47 44 52 66 95 27 07 99 53 59 36 78 38 48 82 39 61 01 18 33 21 15 94 66
94 55 72 85 73 67 89 75 43 87 54 62 24 44 31 91 19 04 25 92 92 92 74 59 73
42 48 11 62 13 97 34 40 87 21 16 86 84 87 67 03 07 11 20 59 25 70 14 66 70
23 52 37 83 17 73 20 88 98 37 68 93 59 14 16 26 25 22 96 63 05 52 28 25 62
04 49 35 24 94 75 24 63 38 24 45 86 25 10 25 61 96 27 93 35 65 33 71 24 72
00 54 99 76 54 64 05 18 81 59 96 11 96 38 96 54 69 28 23 91 23 28 72 95 29
35 96 31 53 07 26 89 80 93 54 33 35 13 54 62 77 97 45 00 24 90 10 33 93 33
59 80 80 83 91 45 42 72 68 42 83 60 94 97 00 13 02 12 48 92 78 56 52 01 06
46 05 88 52 36 01 39 09 22 86 77 28 14 40 77 93 91 08 36 47 70 61 74 29 41
32 17 90 05 97 87 37 92 52 41 05 56 70 70 07 86 74 31 71 57 85 39 41 18 38
Tabelas estatísticas selecionadas 441

Tabela 2  Distribuição da probabilidade binomial cumulativa


n
P( X ≤ x) = ∑  n  p x qn − x
x 
X= 0

( )
2
5 (0, 40)2 (0, 60)(5− 2) = 0, 6826
P( X ≤ 2) = ∑ 2
X= 0
n = 5
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,9510 0,9039 0,8587 0,8154 0,7738 0,7339 0,6957 0,6591 0,6240 0,5905
1 0,9990 0,9962 0,9915 0,9852 0,9774 0,9681 0,9575 0,9456 0,9326 0,9185
2 1,0000 0,9999 0,9997 0,9994 0,9988 0,9980 0,9969 0,9955 0,9937 0,9914
3 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995
4 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,5584 0,5277 0,4984 0,4704 0,4437 0,4182 0,3939 0,3707 0,3487 0,3277
1 0,9035 0,8875 0,8708 0,8533 0,8352 0,8165 0,7973 0,7776 0,7576 0,7373
2 0,9888 0,9857 0,9821 0,9780 0,9734 0,9682 0,9625 0,9563 0,9495 0,9421
3 0,9993 0,9991 0,9987 0,9983 0,9978 0,9971 0,9964 0,9955 0,9945 0,9933
4 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,3077 0,2887 0,2707 0,2536 0,2373 0,2219 0,2073 0,1935 0,1804 0,1681
1 0,7167 0,6959 0,6749 0,6539 0,6328 0,6117 0,5907 0,5697 0,5489 0,5282
2 0,9341 0,9256 0,9164 0,9067 0,8965 0,8857 0,8743 0,8624 0,8499 0,8369
3 0,9919 0,9903 0,9886 0,9866 0,9844 0,9819 0,9792 0,9762 0,9728 0,9692
4 0,9996 0,9995 0,9994 0,9992 0,9990 0,9988 0,9986 0,9983 0,9979 0,9976
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,1564 0,1454 0,1350 0,1525 0,1160 0,1074 0,0992 0,0916 0,0845 0,0778
1 0,5077 0,4875 0,4675 0,4478 0,4282 0,4094 0,3907 0,3724 0,3545 0,3370
2 0,8234 0,8095 0,7950 0,7801 0,7648 0,7491 0,7330 0,7165 0,6997 0,6826
3 0,9653 0,9610 0,9564 0,9514 0,9460 0,9402 0,9340 0,9274 0,9204 0,9130
4 0,9971 0,9966 0,9961 0,9955 0,9947 0,9940 0,9931 0,9921 0,9910 0,9898
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
(Continua)
442 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)


p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0715 0,0656 0,0602 0,0551 0,0503 0,0459 0,0418 0,0380 0,0345 0,0312
1 0,3199 0,3033 0,2871 0,2714 0,2562 0,2415 0,2272 0,2135 0,2002 0,1875
2 0,6651 0,6475 0,6295 0,6114 0,5931 0,5747 0,5561 0,5375 0,5187 0,5000
3 0,9051 0,8967 0,8879 0,8786 0,8688 0,8585 0,8478 0,8365 0,8247 0,8125
4 0,9884 0,9869 0,9853 0,9835 0,9815 0,9794 0,9794 0,9745 0,9718 0,9688
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 6
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,9415 0,8858 0,8330 0,7828 0,7351 0,6899 0,6470 0,6064 0,5679 0,5314
1 0,9985 0,9943 0,9875 0,9784 0,9672 0,9541 0,9392 0,9227 0,9048 0,8857
2 1,0000 0,998 0,9995 0,9988 0,9978 0,9962 0,9942 0,9915 0,9882 0,9841
3 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997 0,9995 0,9992 0,9987
4 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,4970 0,4644 0,4336 0,4046 0,3771 0,3513 0,3269 0,3040 0,2824 0,2621
1 0,8655 0,8444 0,8224 0,7997 0,7765 0,7528 0,7287 0,7044 0,6799 0,6554
2 0,9794 0,9739 0,9676 0,9605 0,9527 0,9440 0,9345 0,9241 0,9130 0,9011
3 0,9982 0,9975 0,9966 0,9955 0,9941 0,9925 0,9906 0,9884 0,9859 0,9830
4 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9990 0,9987 0,9984
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,2431 0,2252 0,2084 0,1927 0,1780 0,1642 0,1513 0,1393 0,1281 0,1176
1 0,6308 0,6063 0,5820 0,5578 0,5339 0,5104 0,4872 0,4644 0,4420 0,4202
2 0,8885 0,8750 0,8609 0,8461 0,8306 0,8144 0,7977 0,7804 0,7626 0,7443
3 0,9798 0,9761 0,9720 0,9674 0,9624 0,9569 0,9508 0,9443 0,9372 0,9295
4 0,9980 0,9975 0,9969 0,9962 0,9954 0,9944 0,9933 0,9921 0,9907 0,9891
5 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9995 0,9994 0,9993
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,1079 0,0989 0,0905 0,0827 0,0754 0,0687 0,0625 0,0568 0,0515 0,0667
1 0,3988 0,3780 0,3578 0,3381 0,3191 0,3006 0,2828 0,2657 0,2492 0,2333
2 0,7256 0,7064 0,6870 0,6672 0,6471 0,6268 0,6063 0,5857 0,5650 0,5443
3 0,9213 0,9125 0,9031 0,8931 0,8826 0,8714 0,8596 0,8473 0,8343 0,8208
4 0,9873 0,9852 0,9830 0,9805 0,9777 0,9746 0,9712 0,9675 0,9635 0,9590
5 0,9991 0,9989 0,9987 0,9985 0,9982 0,9978 0,9974 0,9970 0,9965 0,9959
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0422 0,0381 0,0343 0,0308 0,0277 0,0248 0,0222 0,0198 0,0176 0,0156
1 0,2181 0,2035 0,1895 0,1762 0,1636 0,1515 0,1401 0,1293 0,1190 0,1094
2 0,5236 0,5029 0,4823 0,4618 0,4415 0,4214 0,4015 0,3820 0,3627 0,3437
3 0,8067 0,7920 0,7768 0,7610 0,7447 0,7280 0,7107 0,6930 0,6748 0,6562
Tabelas estatísticas selecionadas 443

4 0,9542 0,9490 0,9434 0,9373 0,9308 0,9238 0,9163 0,9083 0,8997 0,8906
5 0,9952 0,9945 0,9937 0,9927 0,9917 0,9905 0,9892 0,9878 0,9862 0,9844
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 7
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,9321 0,8681 0,8080 0,7514 0,6983 0,6485 0,6017 0,5578 0,5168 0,4783
1 0,9980 0,9921 0,9829 0,9706 0,9556 0,9382 0,9187 0,8974 0,8745 0,8503
2 1,0000 0,9997 0,9991 0,9980 0,9962 0,9937 0,9903 0,9860 0,9807 0,9743
3 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996 0,9993 0,9988 0,9982 0,9973
4 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,4423 0,4087 0,3773 0,3479 0,3206 0,2951 0,2714 0,2493 0,2288 0,2097
1 0,8250 0,7988 0,7719 0,7444 0,7166 0,6885 0,6604 0,6323 0,6044 0,5767
2 0,9669 0,9584 0,9487 0,9380 0,9262 0,9134 0,8995 0,8846 0,8687 0,8520
3 0,9961 0,9946 0,9928 0,9906 0,9879 0,9847 0,9811 0,9769 0,9721 0,9667
4 0,9997 0,9996 0,9994 0,9991 0,9988 0,9983 0,9978 0,9971 0,9963 0,9953
5 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,1920 0,1757 0,1605 0,1465 0,1335 0,1215 0,1105 0,1003 0,0910 0,0824
1 0,5494 0,5225 0,4960 0,4702 0,4449 0,4204 0,3965 0,3734 0,3510 0,3294
2 0,8343 0,8159 0,7967 0,7769 0,7564 0,7354 0,7139 0,6919 0,6696 0,6471
3 0,9606 0,9539 0,9464 0,9383 0,9294 0,9198 0,9095 0,8984 0,8866 0,8740
4 0,9942 0,9928 0,9912 0,9893 0,9871 0,9847 0,9819 0,9787 0,9752 0,9712
5 0,9995 0,9994 0,9992 0,9989 0,9987 0,9983 0,9979 0,9974 0,9969 0,9962
6 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0745 0,0672 0,0606 0,0546 0,0490 0,0440 0,0394 0,0352 0,0314 0,0280
1 0,3086 0,2887 0,2696 0,2513 0,2338 0,2172 0,2013 0,1863 0,1721 0,1586
2 0,6243 0,6013 0,5783 0,5553 0,5323 0,5094 0,4866 0,4641 0,4419 0,4199
3 0,8606 0,8466 0,8318 0,8163 0,8002 0,7833 0,7659 0,7479 0,7293 0,7102
4 0,9668 0,9620 0,9566 0,9508 0,9444 0,9375 0,9299 0,9218 0,9131 0,9037
5 0,9954 0,9945 0,9935 0,9923 0,9910 0,9895 0,9877 0,9858 0,9836 0,9812
6 0,9997 0,9997 0,9996 0,9995 0,9994 0,9992 0,9991 0,9989 0,9986 0,9984
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0249 0,0221 0,0195 0,0173 0,0152 0,0134 0,0117 0,0103 0,0090 0,0078
1 0,1549 0,1340 0,1228 0,1123 0,1024 0,0932 0,0847 0,0767 0,0693 0,0625
2 0,3983 0,3771 0,3564 0,3362 0,3164 0,2973 0,2787 0,2607 0,2433 0,2266
3 0,6906 0,6706 0,6502 0,6294 0,6083 0,5869 0,5654 0,5437 0,5219 0,5000
4 0,8937 0,8831 0,8718 0,8598 0,8471 0,8337 0,8197 0,8049 0,7895 0,7734
5 0,9784 0,9754 0,9721 0,9684 0,9643 0,9598 0,9549 0,9496 0,9438 0,9375
6 0,9981 0,9977 0,9973 0,9968 0,9963 0,9956 0,9949 0,9941 0,9932 0,9922
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
(Continua)
444 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

n = 8
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,9227 0,8508 0,7837 0,7214 0,6634 0,6096 0,5596 0,5132 0,4703 0,4305
1 0,9973 0,9897 0,9777 0,9619 0,9428 0,9208 0,8965 0,8702 0,8423 0,8131
2 0,9999 0,9996 0,9987 0,9969 0,9942 0,9904 0,9853 0,9789 0,9711 0,9619
3 1,0000 1,0000 0,9999 0,9998 0,9996 0,9993 0,9987 0,9978 0,9966 0,9950
4 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9997 0,9996
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,3937 0,3596 0,3282 0,2992 0,2725 0,2479 0,2252 0,2044 0,1853 0,1678
1 0,7829 0,7520 0,7206 0,6889 0,6572 0,6256 0,5943 0,5634 0,5330 0,5033
2 0,9513 0,9392 0,9257 0,9109 0,8948 0,8774 0,8588 0,8392 0,8185 0,7969
3 0,9929 0,9903 0,9871 0,9832 0,9786 0,9733 0,9672 0,9603 0,9524 0,9437
4 0,9993 0,9990 0,9985 0,9979 0,9971 0,9962 0,9950 0,9935 0,9917 0,9896
5 1,0000 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995 0,9993 0,9991 0,9988
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,1517 0,1370 0,1236 0,1113 0,1001 0,0899 0,0806 0,0722 0,0646 0,0576
1 0,4743 0,4462 0,4189 0,3925 0,3671 0,3427 0,3193 0,2969 0,2756 0,2553
2 0,7745 0,7514 0,7276 0,7033 0,6785 0,6535 0,6282 0,6027 0,5772 0,5518
3 0,9341 0,9235 0,9120 0,8996 0,8862 0,8719 0,8567 0,8406 0,8237 0,8059
4 0,9871 0,9842 0,9809 0,9770 0,9727 0,9678 0,9623 0,9562 0,9495 0,9420
5 0,9984 0,9979 0,9973 0,9966 0,9958 0,9948 0,9936 0,9922 0,9906 0,9887
6 0,9999 0,9998 0,9998 0,9997 0,9996 0,9995 0,9994 0,9992 0,9990 0,9987
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0514 0,0457 0,0406 0,0360 0,0319 0,0281 0,0248 0,0218 0,0192 0,0168
1 0,2360 0,2178 0,2006 0,1844 0,1691 0,1548 0,1414 0,1289 0,1172 0,1064
2 0,5264 0,5013 0,4764 0,4519 0,4278 0,4042 0,3811 0,3585 0,3366 0,3154
3 0,7874 0,7681 0,7481 0,7276 0,7064 0,6847 0,6626 0,6401 0,6172 0,5941
4 0,9339 0,9250 0,9154 0,9051 0,8939 0,8820 0,8693 0,8557 0,8414 0,8263
5 0,9866 0,9841 0,9813 0,9782 0,9747 0,9707 0,9664 0,9615 0,9561 0,9502
6 0,9984 0,9980 0,9976 0,9970 0,9964 0,9957 0,9949 0,9939 0,9928 0,9915
7 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9996 0,9995 0,9993
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0147 0,0128 0,0111 0,0097 0,0084 0,0072 0,0062 0,0053 0,0046 0,0039
1 0,0963 0,0870 0,0784 0,0705 0,0632 0,0565 0,0504 0,0448 0,0398 0,0352
2 0,2948 0,2750 0,2560 0,2376 0,2201 0,2034 0,1875 0,1724 0,1581 0,1445
3 0,5708 0,5473 0,5238 0,5004 0,4770 0,4537 0,4306 0,4078 0,3854 0,3633
4 0,8105 0,7938 0,7765 0,7584 0,7396 0,7202 0,7001 0,6795 0,6584 0,6367
5 0,9437 0,9366 0,9289 0,9206 0,9115 0,9018 0,8914 0,8802 0,8682 0,8555
6 0,9900 0,9883 0,9864 0,9843 0,9819 0,9792 0,9761 0,9728 0,9690 0,9648
Tabelas estatísticas selecionadas 445

7 0,9992 0,9990 0,9988 0,9986 0,9983 0,9980 0,9976 0,9972 0,9967 0,9961
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 9
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,9135 0,8337 0,7602 0,6925 0,6302 0,5730 0,5204 0,4722 0,4279 0,3874
1 0,9966 0,9869 0,9718 0,9522 0,9288 0,9022 0,8729 0,8417 0,8088 0,7748
2 0,9999 0,9994 0,9980 0,9955 0,9916 0,9862 0,9791 0,9702 0,9595 0,9470
3 1,0000 1,0000 0,9999 0,9997 0,9994 0,9987 0,9977 0,9963 0,9943 0,9917
4 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997 0,9995 0,9991
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,3504 0,3165 0,2855 0,2573 0,2316 0,2082 0,1869 0,1676 0,1501 0,1342
1 0,7401 0,7049 0,6696 0,6343 0,5995 0,5652 0,5315 0,4988 0,4670 0,4362
2 0,9327 0,9167 0,8991 0,8798 0,8591 0,8371 0,8139 0,7895 0,7643 0,7382
3 0,9883 0,9842 0,9791 0,9731 0,9661 0,9580 0,9488 0,9385 0,9270 0,9144
4 0,9986 0,9979 0,9970 0,9959 0,9944 0,9925 0,9902 0,9875 0,9842 0,9804
5 0,9999 0,9998 0,9997 0,9996 0,9994 0,9991 0,9987 0,9983 0,9977 0,9969
6 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9998 0,9997
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,1199 0,1069 0,0952 0,0846 0,0751 0,0665 0,0589 0,0520 0,0458 0,0404
1 0,4066 0,3782 0,3509 0,3250 0,3003 0,2770 0,2548 0,2340 0,2144 0,1960
2 0,7115 0,6842 0,6566 0,6287 0,6007 0,5727 0,5448 0,5171 0,4898 0,4628
3 0,9006 0,8856 0,8696 0,8525 0,8343 0,8151 0,7950 0,7740 0,7522 0,7297
4 0,9760 0,9709 0,9650 0,9584 0,9511 0,9429 0,9338 0,9238 0,9130 0,9012
5 0,9960 0,9949 0,9935 0,9919 0,9900 0,9878 0,9851 0,9821 0,9787 0,9747
6 0,9996 0,9994 0,9992 0,9990 0,9987 0,9983 0,9978 0,9972 0,9965 0,9957
7 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9997 0,9997 0,9996
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0355 0,0311 0,0272 0,0238 0,0207 0,0180 0,0156 0,0135 0,0117 0,0101
1 0,1788 0,1628 0,1478 0,1339 0,1211 0,1092 0,0983 0,0882 0,0790 0,0705
2 0,4364 0,4106 0,3854 0,3610 0,3373 0,3144 0,2924 0,2713 0,2511 0,2318
3 0,7065 0,6827 0,6585 0,6338 0,6089 0,5837 0,5584 0,5331 0,5078 0,4826
4 0,8885 0,8748 0,8602 0,8447 0,8283 0,8110 0,7928 0,7738 0,7540 0,7334
5 0,9702 0,9652 0,9596 0,9533 0,9464 0,9388 0,9304 0,9213 0,9114 0,9006
6 0,9947 0,9936 0,9922 0,9906 0,9888 0,9867 0,9843 0,9816 0,9785 0,9750
7 0,9994 0,9993 0,9991 0,9989 0,9986 0,9983 0,9979 0,9974 0,9969 0,9962
8 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0087 0,0074 0,0064 0,0054 0,0046 0,0039 0,0033 0,0028 0,0023 0,0020
1 0,0628 0,0558 0,0495 0,0437 0,0385 0,0338 0,0296 0,0259 0,0225 0,0195
2 0,2134 0,1961 0,1796 0,1641 0,1495 0,1358 0,1231 0,1111 0,1001 0,0898
(Continua)
446 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

3 0,4576 0,4330 0,4087 0,3848 0,3614 0,3386 0,3164 0,2948 0,2740 0,2539
4 0,7122 0,6903 0,6678 0,6449 0,6214 0,5976 0,5735 0,5491 0,5246 0,5000
5 0,8891 0,8767 0,8634 0,8492 0,8342 0,8183 0,8015 0,7839 0,7654 0,7461
6 0,9710 0,9666 0,9617 0,9563 0,9502 0,9436 0,9363 0,9283 0,9196 0,9102
7 0,9954 0,9945 0,9935 0,9923 0,9909 0,9893 0,9875 0,9855 0,9831 0,9805
8 0,9997 0,9996 0,9995 0,9994 0,9992 0,9991 0,9989 0,9986 0,9984 0,9980
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 10
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,9044 0,8171 0,7374 0,6648 0,5987 0,5386 0,4840 0,4344 0,3894 0,3487
1 0,9957 0,9838 0,9655 0,9418 0,9139 0,8824 0,8483 0,8121 0,7746 0,7361
2 0,9999 0,9991 0,9972 0,9938 0,9885 0,9812 0,9717 0,9599 0,9460 0,9298
3 1,0000 1,0000 0,9999 0,9996 0,9990 0,9980 0,9964 0,9942 0,9912 0,9872
4 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997 0,9994 0,9990 0,9984
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,3118 0,2785 0,2484 0,2213 0,1969 0,1749 0,1552 0,1374 0,1216 0,1074
1 0,6972 0,6583 0,6196 0,5816 0,5443 0,5080 0,4730 0,4392 0,4068 0,3758
2 0,9116 0,8913 0,8692 0,8455 0,8202 0,7936 0,7659 0,7372 0,7078 0,6778
3 0,9822 0,9761 0,9687 0,9600 0,9500 0,9386 0,9259 0,9117 0,8961 0,8791
4 0,9975 0,9963 0,9947 0,9927 0,9901 0,9870 0,9832 0,9787 0,9734 0,9672
5 0,9997 0,9996 0,9994 0,9990 0,9986 0,9980 0,9973 0,9963 0,9951 0,9936
6 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9991
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0947 0,0834 0,0733 0,0643 0,0563 0,0492 0,0430 0,0374 0,0326 0,0282
1 0,3464 0,3185 0,2921 0,2673 0,2440 0,2222 0,2019 0,1830 0,1655 0,1493
2 0,6474 0,6169 0,5883 0,5558 0,5256 0,4958 0,4665 0,4378 0,4099 0,3828
3 0,8609 0,8413 0,8206 0,7988 0,7759 0,7521 0,7274 0,7021 0,6761 0,6496
4 0,9601 0,9521 0,9431 0,9330 0,9219 0,9096 0,8963 0,8819 0,8663 0,8497
5 0,9918 0,9896 0,9870 0,9839 0,9803 0,9761 0,9713 0,9658 0,9596 0,9527
6 0,9988 0,9984 0,9979 0,9973 0,9965 0,9955 0,9944 0,9930 0,9913 0,9894
7 0,9999 0,9998 0,9998 0,9997 0,9996 0,9994 0,9993 0,9990 0,9988 0,9984
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0245 0,0211 0,0182 0,0157 0,0135 0,0115 0,0098 0,0084 0,0071 0,0060
1 0,1344 0,1206 0,1080 0,0965 0,0860 0,0764 0,0677 0,0598 0,0527 0,0464
2 0,3566 0,3313 0,3070 0,2838 0,2616 0,2405 0,2206 0,2017 0,1840 0,1673
3 0,6228 0,5956 0,5684 0,5411 0,5138 0,4868 0,4600 0,4336 0,4077 0,3823
4 0,8321 0,8133 0,7936 0,7730 0,7515 0,7292 0,7061 0,6823 0,6580 0,6331
5 0,9449 0,9363 0,9268 0,9164 0,9051 0,8928 0,8795 0,8652 0,8500 0,8338
6 0,9871 0,9845 0,9815 0,9780 0,9740 0,9695 0,9644 0,9587 0,9523 0,9452
Tabelas estatísticas selecionadas 447

7 0,9980 0,9975 0,9968 0,9961 0,9952 0,9941 0,9929 0,9914 0,9897 0,9877
8 0,9998 0,9997 0,9997 0,9996 0,9995 0,9993 0,9991 0,9989 0,9986 0,9983
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 11
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8953 0,8007 0,7153 0,6382 0,5688 0,5063 0,4501 0,3996 0,3544 0,3138
1 0,9948 0,9805 0,9587 0,9308 0,8981 0,8618 0,8228 0,7819 0,7399 0,6974
2 0,9998 0,9988 0,9963 0,9917 0,9848 0,9752 0,9630 0,9481 0,9305 0,9104
3 1,0000 1,0000 0,9998 0,9993 0,9984 0,9970 0,9947 0,9915 0,9871 0,9815
4 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9995 0,9990 0,9983 0,9972
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,2775 0,2451 0,2161 0,1903 0,1673 0,1469 0,1288 0,1127 0,0985 0,0859
1 0,6548 0,6127 0,5714 0,5311 0,4922 0,4547 0,4189 0,3849 0,3526 0,3221
2 0,8880 0,8634 0,8368 0,8085 0,7788 0,7479 0,7161 0,6836 0,6506 0,6174
3 0,9744 0,9659 0,9558 0,9440 0,9306 0,9154 0,8987 0,8803 0,8603 0,8389
4 0,9958 0,9939 0,9913 0,9881 0,9841 0,9793 0,9734 0,9666 0,9587 0,9496
5 0,9995 0,9992 0,9988 0,9982 0,9973 0,9963 0,9949 0,9932 0,9910 0,9883
6 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995 0,9993 0,9990 0,9986 0,9980
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9998
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0748 0,0650 0,0564 0,0489 0,0422 0,0364 0,0314 0,0270 0,0231 0,0198
1 0,2935 0,2667 0,2418 0,2186 0,1971 0,1773 0,1590 0,1423 0,1270 0,1130
2 0,5842 0,5512 0,5186 0,4866 0,4552 0,4247 0,3951 0,3665 0,3390 0,3127
3 0,8160 0,7919 0,7667 0,7404 0,7133 0,6854 0,6570 0,6281 0,5989 0,5696
4 0,9393 0,9277 0,9149 0,9008 0,8854 0,8687 0,8507 0,8315 0,812 0,7897
5 0,9852 0,9814 0,9769 0,9717 0,9657 0,9588 0,9510 0,9423 0,9326 0,9218
6 0,9973 0,9965 0,9954 0,9941 0,9924 0,9905 0,9881 0,9854 0,9821 0,9784
7 0,9997 0,9995 0,9993 0,9991 0,9988 0,9984 0,9979 0,9973 0,9966 0,9957
8 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9994
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0169 0,0144 0,0122 0,0104 0,0088 0,0074 0,0062 0,0052 0,0044 0,0036
1 0,1003 0,0888 0,0784 0,0690 0,0606 0,0530 0,0463 0,0403 0,0350 0,0302
2 0,2877 0,2639 0,2413 0,2201 0,2001 0,1814 0,1640 0,1478 0,1328 0,1189
3 0,5402 0,5110 0,4821 0,4536 0,4256 0,3981 0,3714 0,3544 0,3204 0,2963
4 0,7672 0,7437 0,7193 0,6941 0,6683 0,6419 0,6150 0,5878 0,5603 0,5328
5 0,9099 0,8969 0,8829 0,8676 0,8513 0,8339 0,8153 0,7957 0,7751 0,7535
6 0,9740 0,9691 0,9634 0,9570 0,9499 0,9419 0,9330 0,9232 0,9124 0,9006
7 0,9946 0,9933 0,9918 0,9899 0,9878 0,9852 0,9823 0,9790 0,9751 0,9707
8 0,9992 0,9990 0,9987 0,9984 0,9980 0,9974 0,9968 0,9961 0,9952 0,9941
9 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9995 0,9994 0,9993
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
(Continua)
448 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)


p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0030 0,0025 0,0021 0,0017 0,0014 0,0011 0,0009 0,0008 0,0006 0,0005
1 0,0261 0,0224 0,0192 0,0164 0,0139 0,0118 0,0100 0,0084 0,0070 0,0059
2 0,1062 0,0945 0,0838 0,0740 0,0652 0,0572 0,0501 0,0436 0,0378 0,0327
3 0,2731 0,2510 0,2300 0,2100 0,1911 0,1734 0,1567 0,1412 0,1267 0,1133
4 0,5052 0,4777 0,4505 0,4236 0,3971 0,3712 0,3459 0,3213 0,2974 0,2744
5 0,7310 0,7076 0,6834 0,6586 0,6331 0,6071 0,5807 0,5540 0,5271 0,5000
6 0,8879 0,8740 0,8592 0,8432 0,8262 0,8081 0,7890 0,7688 0,7477 0,7256
7 0,9657 0,9601 0,9539 0,9468 0,9390 0,9304 0,9209 0,9105 0,8991 0,8867
8 0,9928 0,9913 0,9896 0,9875 0,9852 0,9825 0,9794 0,9759 0,9718 0,9673
9 0,9991 0,9988 0,9986 0,9982 0,9978 0,9973 0,9967 0,9960 0,9951 0,9941
10 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9998 0,9997 0,9996 0,9995
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 12
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8864 0,7847 0,6938 0,6127 0,5404 0,4759 0,4186 0,3677 0,3225 0,2824
1 0,9938 0,9769 0,9514 0,9191 0,8816 0,8405 0,7967 0,7513 0,7052 0,6590
2 0,9998 0,9985 0,9952 0,9893 0,9804 0,9684 0,9532 0,9348 0,9134 0,8891
3 1,0000 0,9999 0,9997 0,9990 0,9978 0,9957 0,9925 0,9880 0,9820 0,9744
4 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996 0,9991 0,9984 0,9973 0,9957
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997 0,9995
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,2470 0,2157 0,1880 0,1637 0,1422 0,1234 0,1069 0,0924 0,0798 0,0687
1 0,6133 0,5686 0,5252 0,4834 0,4435 0,4055 0,3696 0,3359 0,3043 0,2749
2 0,8623 0,8333 0,8023 0,7697 0,7358 0,7010 0,6656 0,6298 0,5940 0,5583
3 0,9649 0,9536 0,9403 0,9250 0,9078 0,8886 0,8676 0,8448 0,8205 0,7946
4 0,9935 0,9905 0,9867 0,9819 0,9761 0,9690 0,9607 0,9511 0,9400 0,9274
5 0,9991 0,9986 0,9978 0,9967 0,9954 0,9935 0,9912 0,9884 0,9849 0,9806
6 0,9999 0,9998 0,9997 0,9996 0,9993 0,9990 0,9985 0,9979 0,9971 0,9961
7 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0591 0,0507 0,0434 0,0371 0,0317 0,0270 0,0229 0,0194 0,0164 0,0138
1 0,2476 0,2224 0,1991 0,1778 0,1584 0,1406 0,1245 0,1100 0,0968 0,0850
2 0,5232 0,4886 0,4550 0,4222 0,3907 0,3603 0,3313 0,3037 0,2775 0,2528
3 0,7674 0,7390 0,7096 0,6795 0,6488 0,6176 0,5863 0,5548 0,5235 0,4925
4 0,9134 0,8979 0,8808 0,8623 0,8424 0,8210 0,7984 0,7746 0,7496 0,7237
5 0,9755 0,9696 0,9626 0,9547 0,9456 0,9354 0,9240 0,9113 0,8974 0,8822
6 09948 0,9932 0,9911 0,9887 0,9857 0,9822 0,9781 0,9733 0,9678 0,9614
7 0,9992 0,9989 0,9984 0,9979 0,9972 0,9964 0,9953 0,9940 0,9924 0,9905
8 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9990 0,9987 0,9983
9 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Tabelas estatísticas selecionadas 449

p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0116 0,0098 0,0082 0,0068 0,0057 0,0047 0,0039 0,0032 0,0027 0,0022
1 0,0744 0,0650 0,0565 0,0491 0,0424 0,0366 0,0315 0,0270 0,0230 0,0196
2 0,2296 0,2078 0,1876 0,1687 0,1513 0,1352 0,1205 0,1069 0,0946 0,0834
3 0,4619 0,4319 0,4027 0,3742 0,3467 0,3201 0,2947 0,2704 0,2472 0,2253
4 0,6998 0,6692 0,6410 0,6124 0,5833 0,5541 0,5249 0,4957 0,4668 0,4382
5 0,8657 0,8479 0,8289 0,8087 0,7873 0,7648 0,7412 0,7167 0,6913 0,6652
6 0,9542 0,9460 0,9368 0,9266 0,9154 0,9030 0,8894 0,8747 0,8589 0,8418
7 0,9882 0,9856 0,9824 0,9787 0,9745 0,9696 0,9641 0,9578 0,9507 0,9427
8 0,9978 0,9972 0,9964 0,9955 0,9944 0,9930 0,9915 0,9896 0,9873 0,9847
9 0,9997 0,9996 0,9995 0,9993 0,9992 0,9989 0,9986 0,9982 0,9978 0,9972
10 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0018 0,0014 0,0012 0,0010 0,0008 0,0006 0,0005 0,0004 0,0003 0,0002
1 0,0166 0,0140 0,0118 0,0099 0,0083 0,0069 0,0057 0,0047 0,0039 0,0032
2 0,0733 0,0642 0,0560 0,0487 0,0421 0,0363 0,0312 0,0267 0,0227 0,0193
3 0,2047 0,1853 0,1671 0,1502 0,1345 0,1199 0,1066 0,0943 0,0832 0,0730
4 0,4101 0,3825 0,3557 0,3296 0,3044 0,2802 0,2570 0,2348 0,2138 0,1938
5 0,6384 0,9111 0,5833 0,5552 0,5269 0,4986 0,4703 0,4423 0,4145 0,3872
6 0,8235 0,8041 0,7836 0,7620 0,7393 0,7157 0,6911 0,6657 0,6396 0,6128
7 0,9338 0,9240 0,9131 0,9012 0,8883 0,8742 0,8589 0,8425 0,8249 0,8062
8 0,9817 0,9782 0,9742 0,9696 0,9644 0,9585 0,9519 0,9445 0,9362 0,9270
9 0,9965 0,9957 0,9947 0,9935 0,9921 0,9905 0,9886 0,9863 0,9837 0,9807
10 0,9996 0,9995 0,9993 0,9991 0,9989 0,9986 0,9983 0,9979 0,9974 0,9968
11 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 13
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8775 0,7690 0,6730 0,5882 0,5133 0,4474 0,3893 0,3383 0,2935 0,2542
1 0,9928 0,9730 0,9436 0,9068 0,8646 0,8186 0,7702 0,7206 0,6707 0,6213
2 0,9997 0,9980 0,9938 0,9865 0,9755 0,9608 0,9422 0,9201 0,8946 0,8661
3 1,0000 0,9999 0,9995 0,9986 0,9969 0,9940 0,9897 0,9837 0,9758 0,9658
4 1,0000 1,0000 1,0000 0,9999 0,9997 0,9993 0,9987 0,9976 0,9959 0,9935
5 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9997 0,9995 0,9991
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,2198 0,1898 0,1636 0,1408 0,1209 0,1037 0,0887 0,0758 0,0646 0,0550
1 0,5730 0,5262 0,4814 0,4386 0,3983 0,3604 0,3249 0,2920 0,2616 0,2336
2 0,8349 0,8015 0,7663 0,7296 0,6920 0,6537 0,6152 0,5769 0,5389 0,5017
3 0,9536 0,9391 0,9224 0,9033 0,8820 0,8586 0,8333 0,8061 0,7774 0,7473
4 0,9903 0,9861 0,9807 0,9740 0,9658 0,9562 0,9449 0,9319 0,9173 0,9009
5 0,9985 0,9976 0,9964 0,9947 0,9925 0,9896 0,9861 0,9817 0,9763 0,9700
6 0,9998 0,9997 0,9995 0,9992 0,9987 0,9981 0,9973 0,9962 0,9948 0,9930
(Continua)
450 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

7 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9991 0,9988
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0467 0,0396 0,0334 0,0282 0,0238 0,0200 0,0167 0,0140 0,0117 0,0097
1 0,2080 0,1846 0,1633 0,1441 0,1267 0,1111 0,0971 0,0846 0,0735 0,0637
2 0,4653 0,4301 0,3961 0,3636 0,3326 0,3032 0,2755 0,2495 0,2251 0,2025
3 0,7161 0,6839 0,6511 0,6178 0,5843 0,5507 0,5174 0,4845 0,4522 0,4206
4 0,8827 0,8629 0,8415 0,8184 0,7940 0,7681 0,7411 0,7130 0,6840 0,6543
5 0,9625 0,9538 0,9438 0,9325 0,9198 0,9056 0,8901 0,8730 0,8545 0,8346
6 0,9907 0,9880 0,9846 0,9805 0,9757 0,9701 0,9635 0,9560 0,9473 0,9376
7 0,9983 0,9976 0,9968 0,9957 0,9944 0,9927 0,9907 0,9882 0,9853 0,9818
8 0,9998 0,9996 0,9995 0,9993 0,9990 0,9987 0,9982 0,9976 0,9969 0,9960
9 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0080 0,0066 0,0055 0,0045 0,0037 0,0030 0,0025 0,0020 0,0016 0,0013
1 0,0550 0,0473 0,0406 0,0347 0,0296 0,0251 0,0213 0,0179 0,0151 0,0126
2 0,1815 0,1621 0,1443 0,1280 0,1132 0,0997 0,0875 0,0765 0,0667 0,0579
3 0,3899 0,3602 0,3317 0,3043 0,2783 0,2536 0,2302 0,2083 0,1877 0,1686
4 0,6240 0,5933 0,5624 0,5314 0,5005 0,4699 0,4397 0,4101 0,3812 0,3530
5 0,8133 0,7907 0,7669 0,7419 0,7159 0,6889 0,6612 0,6327 0,6038 0,5744
6 0,9267 0,9146 0,9012 0,8865 0,8705 0,8532 0,8346 0,8147 0,7935 0,7712
7 0,9777 0,9729 0,9674 0,9610 0,9538 0,9456 0,9365 0,9262 0,9149 0,9023
8 0,9948 0,9935 0,9918 0,9898 0,9874 0,9846 0,9813 0,9775 0,9730 0,9679
9 0,9991 0,9988 0,9985 0,9980 0,9975 0,9968 0,9960 0,9949 0,9937 0,9922
10 0,9999 0,9999 0,9998 0,9997 0,9997 0,9995 0,9994 0,9992 0,9990 0,9987
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0010 0,0008 0,0007 0,0005 0,0004 0,0003 0,0003 0,0002 0,0002 0,0001
1 0,0105 0,0088 0,0072 0,0060 0,0049 0,0040 0,0033 0,0026 0,001 0,0017
2 0,0501 0,0431 0,0370 0,0316 0,0269 0,0228 0,0192 0,0162 0,0135 0,0112
3 0,1508 0,1344 0,1193 0,1055 0,0929 0,0815 0,0712 0,0619 0,0536 0,0461
4 0,3258 0,2997 0,2746 0,2507 0,2279 0,2065 0,1863 0,1674 0,1498 0,1334
5 0,5448 0,5151 0,4854 0,4559 0,4268 0,3981 0,3701 0,3427 0,3162 0,2905
6 0,7476 0,7230 0,6975 0,6710 0,6437 0,6158 0,5873 0,5585 0,5293 0,5000
7 0,8886 0,8736 0,8574 0,8400 0,8212 0,8012 0,7800 0,7576 0,7341 0,7095
8 0,9621 0,9554 0,9480 0,9395 0,9302 0,9197 0,9082 0,8955 0,8817 0,8666
9 0,9904 0,9883 0,9859 0,9830 0,9797 0,9758 0,9713 0,9662 0,9604 0,9539
10 0,9983 0,9979 0,9973 0,9967 0,9959 0,9949 0,9937 0,9923 0,9907 0,9888
11 0,9998 0,9998 0,9997 0,9996 0,9995 0,9993 0,9991 0,9989 0,9986 0,9983
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 14
Tabelas estatísticas selecionadas 451

p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8687 0,7536 0,6528 0,5647 0,4877 0,4205 0,3620 0,3112 0,2670 0,2288
1 0,9916 0,9690 0,9355 0,8941 0,8470 0,7963 0,7436 0,6900 0,6368 0,5846
2 0,9997 0,9975 0,9923 0,9833 0,9699 0,9522 0,9302 0,9042 0,8745 0,8416
3 1,0000 0,9999 0,9994 0,9981 0,9958 0,9920 0,9864 0,9786 0,9685 0,9559
4 1,0000 1,0000 1,0000 0,9998 0,9996 0,9990 0,9980 0,9965 0,9941 0,9908
5 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996 0,9992 0,9985
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,1956 0,1670 0,1423 0,1211 0,1028 0,0871 0,0736 0,0621 0,0523 0,0440
1 0,5342 0,4859 0,4401 0,3969 0,3567 0,3193 0,2848 0,2531 0,2242 0,1979
2 0,8061 0,7685 0,7292 0,6889 0,6479 0,6068 0,5659 0,5256 0,4862 0,4481
3 0,9406 0,9226 0,9021 0,8790 0,8535 0,8258 0,7962 0,7649 0,7321 0,6982
4 0,9863 0,9804 0,9731 0,9641 0,9533 0,9406 0,9259 0,9093 0,8907 0,8702
5 0,9976 0,9962 0,9943 0,9918 0,9885 0,9843 0,9791 0,9729 0,9651 0,9561
6 0,9997 0,9994 0,9991 0,9985 0,9978 0,9968 0,9954 0,9936 0,9913 0,9884
7 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995 0,9992 0,9988 0,9983 0,9976
8 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0369 0,0309 0,0258 0,0214 0,0178 0,0148 0,0122 0,0101 0,0083 0,0068
1 0,1741 0,1527 0,1335 0,1163 0,1010 0,0874 0,0754 0,0648 0,0556 0,0475
2 0,4113 0,3761 0,3426 0,3109 0,2811 0,2533 0,2273 0,2033 0,1812 0,1608
3 0,6634 0,6281 0,5924 0,5568 0,5213 0,4864 0,4521 0,4187 0,3863 0,3552
4 0,8477 0,8235 0,7977 0,7703 0,7415 0,7116 0,6807 0,6490 0,6168 0,5842
5 0,9457 0,9338 0,9203 0,9051 0,8883 0,8699 0,8498 0,8282 0,8051 0,7805
6 0,9848 0,9804 0,9752 0,9690 0,9617 0,9533 0,9437 0,9327 0,9204 0,9067
7 0,9967 0,9955 0,9940 0,9921 0,9897 0,9868 0,9833 0,9792 0,9743 0,9685
8 0,9994 0,9992 0,9989 0,9984 0,9978 0,9971 0,9962 0,9950 0,9935 0,9917
9 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995 0,9993 0,9991 0,9988 0,9983
10 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0055 0,0045 0,0037 0,0030 0,0024 0,0019 0,0016 0,0012 0,0010 0,0008
1 0,0404 0,0343 0,0290 0,0244 0,0205 0,0172 0,0143 0,0119 0,0098 0,0081
2 0,1423 0,1254 0,1101 0,0963 0,0839 0,0729 0,0630 0,0543 0,0466 0,0398
3 0,3253 0,2968 0,2699 0,2444 0,2205 0,1982 0,1774 0,1582 0,1405 0,1243
4 0,5514 0,5187 0,4862 0,4542 0,4227 0,3920 0,3622 0,3334 0,3057 0,2793
5 0,7546 0,7276 0,6994 0,6703 0,6405 0,6101 0,5792 0,5481 0,5169 0,4859
6 0,8916 0,8750 0,8569 0,8357 0,8164 0,7941 0,7704 0,7455 0,7195 0,6925
7 0,9619 0,9542 0,9455 0,9357 0,9247 0,9124 0,8988 0,8838 0,8675 0,8499
8 0,9895 0,9869 0,9837 0,9800 0,9757 0,9706 0,9647 0,9580 0,9503 0,9417
9 0,9978 0,9971 0,9963 0,9952 0,9940 0,9924 0,9905 0,9883 0,9856 0,9825
10 0,9997 0,9995 0,9994 0,9992 0,9989 0,9986 0,9981 0,9976 0,9969 0,9961
11 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9997 0,9997 0,9995 0,9994
(Continua)
452 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0006 0,0005 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001
1 0,0066 0,0054 0,0044 0,0036 0,0029 0,0023 0,0019 0,0015 0,0001 0,0009
2 0,0339 0,0287 0,0242 0,0203 0,0170 0,0142 0,0117 0,0097 0,0079 0,0065
3 0,1095 0,0961 0,0839 0,0730 0,0632 0,0545 0,0468 0,0399 0,0339 0,0287
4 0,2541 0,2303 0,2078 0,1868 0,1672 0,1490 0,1322 0,1167 0,1026 0,0898
5 0,4550 0,4246 0,3948 0,3656 0,3373 0,3100 0,2837 0,2585 0,2346 0,2120
6 0,6645 0,6357 0,6063 0,5764 0,5461 0,5157 0,4852 0,4549 0,4249 0,3953
7 0,8308 0,8104 0,7887 0,7656 0,7414 0,7160 0,6895 0,6620 0,6337 0,6047
8 0,9320 0,9211 0,9090 0,8957 0,8811 0,8652 0,8480 0,8293 0,8094 0,7880
9 0,9788 0,9745 0,9696 0,9639 0,9574 0,9500 0,9417 0,9323 0,9218 0,9102
10 0,9951 0,9939 0,9924 0,9907 0,9886 0,9861 0,9832 0,9798 0,9759 0,9713
11 0,9992 0,9990 0,9987 0,9983 0,9978 0,9973 0,9966 0,9958 0,9947 0,9935
12 0,9999 0,9999 0,9999 0,9998 0,9997 0,9997 0,9996 0,9994 0,9993 0,9991
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 15
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8601 0,7386 0,6333 0,5421 0,4633 0,3953 0,3367 0,2863 0,2430 0,2059
1 0,9904 0,9647 0,9270 0,8809 0,8290 0,7738 0,7168 0,6597 0,6035 0,5490
2 0,9996 0,9970 0,9906 0,9797 0,9638 0,9429 0,9171 0,8870 0,8531 0,8159
3 1,0000 0,9998 0,9992 0,9998 0,9945 0,9896 0,9825 0,9727 0,9601 0,9444
4 1,0000 1,0000 0,9999 0,9998 0,9994 0,9986 0,9972 0,9950 0,9918 0,9873
5 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9997 0,9993 0,9987 0,9978
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,1741 0,1470 0,1238 0,1041 0,0874 0,0731 0,0611 0,0510 0,0424 0,0352
1 0,4969 0,4476 0,4013 0,3583 0,3186 0,2821 0,2489 0,2187 0,1915 0,1671
2 0,7762 0,7346 0,6916 0,6480 0,6042 0,5608 0,5181 0,4766 0,4365 0,3980
3 0,9258 0,9041 0,8796 0,8524 0,8227 0,7908 0,7571 0,7218 0,6854 0,6482
4 0,9813 0,9735 0,9639 0,9522 0,9383 0,9222 0,9039 0,8833 0,8606 0,8358
5 0,9963 0,9943 0,9916 0,9879 0,9832 0,9773 0,9700 0,9613 0,9510 0,9389
6 0,9994 0,9990 0,9985 0,9976 0,9964 0,9948 0,9926 0,9898 0,9863 0,9819
7 0,9999 0,9999 0,9998 0,9996 0,9994 0,9990 0,9986 0,9979 0,9970 0,9958
8 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995 0,9992
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0291 0,0241 0,0198 0,0163 0,0134 0,0109 0,0089 0,0072 0,0059 0,0047
1 0,1453 0,1259 0,1087 0,0935 0,0802 0,0685 0,0583 0,0495 0,0419 0,0353
2 0,3615 0,3269 0,2945 0,2642 0,2361 0,2101 0,1863 0,1645 0,1447 0,1268
3 0,6105 0,5726 0,5350 0,4978 0,4613 0,4258 0,3914 0,3584 0,3268 0,2969
Tabelas estatísticas selecionadas 453

4 0,8090 0,7805 0,7505 0,7190 0,6865 0,6531 0,6190 0,5846 0,5500 0,5155
5 0,9252 0,9095 0,8921 0,8728 0,8516 0,8287 0,8042 0,7780 0,7505 0,7216
6 0,9766 0,9702 0,9626 0,9537 0,9434 0,9316 0,9183 0,9035 0,8870 0,8689
7 0,9942 0,9922 0,9896 0,9865 0,9827 0,9781 0,9726 0,9662 0,9587 0,9500
8 0,9989 0,9984 0,9977 0,9969 0,9958 0,9944 0,9927 0,9906 0,9879 0,9848
9 0,9998 0,9997 0,9996 0,9994 0,9992 0,9989 0,9985 0,9979 0,9972 0,9963
10 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995 0,9993
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0038 0,0031 0,0025 0,0020 0,0016 0,0012 0,0010 0,0008 0,0006 0,0005
1 0,0296 0,0248 0,0206 0,0171 0,0142 0,0117 0,0096 0,0078 0,0064 0,0052
2 0,1107 0,0962 0,0833 0,0719 0,0617 0,0528 0,0450 0,0382 0,0322 0,0271
3 0,2686 0,2420 0,2171 0,1940 0,1727 0,1531 0,1351 0,1187 0,1039 0,0905
4 0,4813 0,4477 0,4148 0,3829 0,3519 0,3222 0,2938 0,2668 0,2413 0,2173
5 0,6916 0,6607 0,6291 0,5968 0,5643 0,5316 0,4989 0,4665 0,4346 0,4032
6 0,8491 0,8278 0,8049 0,7806 0,7548 0,7278 0,6997 0,6705 0,6405 0,6098
7 0,9401 0,9289 0,9163 0,9023 0,8868 0,8696 0,8513 0,8313 0,8098 0,7869
8 0,9810 0,9764 0,9711 0,9649 0,9578 0,9496 0,9403 0,9298 0,9180 0,9050
9 0,9952 0,9938 0,9921 0,9901 0,9876 0,9846 0,9810 0,9768 0,9719 0,9662
10 0,9991 0,9988 0,9984 0,9978 0,9972 0,9963 0,9953 0,9941 0,9925 0,9907
11 0,9999 0,9998 0,9997 0,9996 0,9995 0,9994 0,9991 0,9989 0,9985 0,9981
12 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0000 0,0000
1 0,0042 0,0034 0,0027 0,0021 0,0017 0,0013 0,0010 0,0008 0,0006 0,0005
2 0,0227 0,0189 0,0157 0,0130 0,0107 0,0087 0,0071 0,0057 0,0046 0,0037
3 0,0785 0,0678 0,0583 0,0498 0,0424 0,0359 0,0303 0,0254 0,0212 0,0176
4 0,1948 0,1739 0,1546 0,1367 0,1204 0,1055 0,0920 0,0799 0,0690 0,0592
5 0,3726 0,3430 0,3144 0,2869 0,2608 0,2359 0,2125 0,1905 0,1699 0,1509
6 0,5786 0,5470 0,5153 0,4836 0,4522 0,4211 0,3905 0,3606 0,3316 0,3036
7 0,7626 0,7370 0,7102 0,6824 0,6635 0,6238 0,5935 0,5626 0,5314 0,5000
8 0,8905 0,8746 0,8573 0,8385 0,8182 0,7966 0,7735 0,7490 0,7233 0,6964
9 0,9596 0,9521 0,9435 0,9339 0,9231 0,9110 0,8976 0,8829 0,8667 0,8491
10 0,9884 0,9857 0,9826 0,9789 0,9745 0,9695 0,9637 0,9570 0,9494 0,9408
11 0,9975 0,9968 0,9960 0,9949 0,9937 0,9921 0,9903 0,9881 0,9855 0,9824
12 0,9996 0,9995 0,9993 0,9991 0,9989 0,9986 0,9982 0,9977 0,9971 0,9963
13 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9995
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 16
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8515 0,7238 0,6143 0,5204 0,4401 0,3716 0,3131 0,2634 0,2211 0,1853
1 0,9891 0,9601 0,9182 0,8673 0,8108 0,7511 0,6902 0,6299 0,5711 0,5147
2 0,9995 0,9963 0,9887 0,9758 0,9571 0,9327 0,9031 0,8688 0,8306 0,7892
3 1,0000 0,9998 0,9989 0,9968 0,9930 0,9868 0,9779 0,9658 0,9504 0,9316
(Continua)
454 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

4 1,0000 1,0000 0,9999 0,9997 0,9991 0,9981 0,9962 0,9932 0,9889 0,9830
5 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9995 0,9990 0,9981 0,9967
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9997 0,9995
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,1550 0,1293 0,1077 0,0895 0,0743 0,0614 0,0507 0,0418 0,0343 0,0281
1 0,4614 0,4115 0,3653 0,3227 0,2839 0,2487 0,2170 0,1885 0,1632 0,1407
2 0,7455 0,7001 0,6539 0,6074 0,5614 0,5162 0,4723 0,4302 0,3899 0,3518
3 0,9093 0,8838 0,8552 0,8237 0,7899 0,7540 0,7164 0,6777 0,6381 0,5981
4 0,9752 0,9652 0,9529 0,9382 0,9209 0,9012 0,8789 0,8542 0,8273 0,7982
5 0,9947 0,9918 0,9880 0,9829 0,9765 0,9685 0,9588 0,9473 0,9338 0,9183
6 0,9991 0,9985 0,9976 0,9962 0,9944 0,9920 0,9888 0,9847 0,9796 0,9733
7 0,9999 0,9998 0,9996 0,9993 0,9989 0,9984 0,9976 0,9964 0,9949 0,9930
8 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996 0,9993 0,9990 0,9985
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0230 0,0188 0,0153 0,0124 0,0100 0,0081 0,0065 0,0052 0,0042 0,0033
1 0,1209 0,1035 0,0883 0,0750 0,0635 0,0535 0,0450 0,0377 0,0314 0,0261
2 0,3161 0,2827 0,2517 0,2232 0,1971 0,1733 0,1518 0,1323 0,1149 0,0994
3 0,5582 0,5186 0,4797 0,4417 0,4050 0,3697 0,3360 0,3041 0,2740 0,2459
4 0,7673 0,7348 0,7009 0,6659 0,6302 0,5940 0,5575 0,5212 0,4853 0,4499
5 0,9008 0,8812 0,8595 0,8359 0,8103 0,7831 0,7542 0,7239 0,6923 0,6598
6 0,9658 0,9568 0,9464 0,9342 0,9204 0,9049 0,8875 0,8683 0,8474 0,8247
7 0,9905 0,9873 0,9834 0,9786 0,9729 0,9660 0,9580 0,9486 0,9379 0,9256
8 0,9979 0,9970 0,9959 0,9944 0,9925 0,9902 0,9873 0,9837 0,9794 0,9743
9 0,9996 0,9994 0,9992 0,9988 0,9984 0,9977 0,9969 0,9959 0,9945 0,9929
10 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9992 0,9989 0,9984
11 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0026 0,0021 0,0016 0,0013 0,0010 0,0008 0,0006 0,0005 0,0004 0,0003
1 0,0216 0,0178 0,0146 0,0120 0,0098 0,0098 0,0064 0,0052 0,0041 0,0033
2 0,0856 0,0734 0,0626 0,0533 0,0451 0,0380 0,0319 0,0266 0,0222 0,0183
3 0,2196 0,1953 0,1730 0,1525 0,1339 0,1170 0,1018 0,0881 0,0759 0,0651
4 0,4154 0,3819 0,3496 0,3187 0,2892 0,2613 0,2351 0,2105 0,1877 0,1666
5 0,6264 0,5926 0,5584 0,5241 0,4900 0,4562 0,4230 0,3906 0,3592 0,3288
6 0,8003 0,7743 0,7469 0,7181 0,6881 0,6572 0,6254 0,5930 0,5602 0,5272
7 0,9119 0,8965 0,8795 0,8609 0,8406 0,8187 0,7952 0,7702 0,7438 0,7161
8 0,9683 0,9612 0,9530 0,9436 0,9329 0,9209 0,9074 0,8924 0,8758 0,8577
9 0,9908 0,9883 0,9852 0,9815 0,9771 0,9720 0,9659 0,9589 0,9509 0,9417
10 0,9979 0,9972 0,9963 0,9952 0,9938 0,9921 0,9900 0,9875 0,9845 0,9809
11 0,9996 0,9995 0,9993 0,9990 0,9987 0,9983 0,9977 0,9970 0,9962 0,9951
12 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9991
Tabelas estatísticas selecionadas 455

13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0000 0,0000 0,0000 0,0000
1 0,0026 0,0021 0,0016 0,0013 0,0010 0,0008 0,0006 0,0005 0,0003 0,0003
2 0,0151 0,0124 0,0101 0,0082 0,0066 0,0053 0,0042 0,0034 0,0027 0,0021
3 0,0556 0,0473 0,0400 0,0336 0,0281 0,0234 0,0194 0,0160 0,0131 0,0106
4 0,1471 0,1293 0,1131 0,0985 0,0853 0,0735 0,0630 0,0537 0,0456 0,0384
5 0,2997 0,2720 0,2457 0,2208 0,1976 0,1759 0,1559 0,1374 0,1205 0,1051
6 0,4942 0,4613 0,4289 0,3971 0,3660 0,3359 0,3068 0,2790 0,2524 0,2272
7 0,6872 0,6572 0,6264 0,5949 0,5629 0,5306 0,4981 0,4657 0,4335 0,4018
8 0,8381 0,8168 0,7940 0,7698 0,7441 0,7171 0,6889 0,6596 0,6293 0,5982
9 0,9313 0,9195 0,9064 0,8919 0,8759 0,8584 0,8393 0,8186 0,7964 0,7728
10 0,9766 0,9716 0,9658 0,9591 0,9514 0,9426 0,9326 0,9214 0,9089 0,8949
11 0,9938 0,9922 0,9902 0,9879 0,9851 0,9817 0,9778 0,9732 0,9678 0,9616
12 0,9988 0,9984 0,9979 0,9973 0,9965 0,9956 0,9945 0,9931 0,9914 0,9894
13 0,9998 0,9998 0,9997 0,9996 0,9994 0,9993 0,9990 0,9987 0,9984 0,9979
14 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9997
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 17
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8429 0,7093 0,5958 0,4996 0,4181 0,3493 0,2912 0,2423 0,2012 0,1668
1 0,9877 0,9554 0,9091 0,8535 0,7922 0,7283 0,6638 0,6005 0,5396 0,4818
2 0,9994 0,9956 0,9866 0,9714 0,9497 0,9218 0,8882 0,8497 0,8073 0,7618
3 1,0000 0,9997 0,9986 0,9960 0,9912 0,9836 0,9727 0,9581 0,9397 0,9174
4 1,0000 1,0000 0,9999 0,9996 0,9988 0,9974 0,9949 0,9911 0,9855 0,9779
5 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9993 0,9985 0,9973 0,9953
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996 0,9992
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,1379 0,1138 0,0937 0,0770 0,0631 0,0516 0,0421 0,0343 0,0278 0,0225
1 0,4277 0,9777 0,3318 0,2901 0,2525 0,2187 0,1887 0,1621 0,1387 0,1182
2 0,7142 0,6655 0,6164 0,5676 0,5198 0,4734 0,4289 0,3867 0,3468 0,3096
3 0,8913 0,8617 0,8290 0,7935 0,7556 0,7159 0,6749 0,6331 0,5909 0,5489
4 0,9679 0,9554 0,9402 0,9222 0,9013 0,8776 0,8513 0,8225 0,7913 0,7582
5 0,9925 0,9886 0,9834 0,9766 0,9681 0,9577 0,9452 0,9305 0,9136 0,8943
6 0,9986 0,9977 0,9963 0,9944 0,9917 0,9882 0,9837 0,9780 0,9709 0,9623
7 0,9998 0,9996 0,9993 0,9989 0,9983 0,9973 0,9961 0,9943 0,9920 0,9891
8 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995 0,9992 0,9988 0,9982 0,9974
9 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0182 0,0146 0,0118 0,0094 0,0075 0,0060 0,0047 0,0038 0,0030 0,0023
1 0,1004 0,0849 0,0715 0,0600 0,0501 0,0417 0,0346 0,0286 0,0235 0,0193
(Continua)
456 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

2 0,2751 0,2433 0,2141 0,1877 0,1637 0,1422 0,1229 0,1058 0,0907 0,0774
3 0,5073 0,4667 0,4272 0,3893 0,3530 0,3186 0,2863 0,2560 0,2279 0,2019
4 0,7234 0,6872 0,6500 0,6121 0,5739 0,5357 0,4977 0,4604 0,4240 0,3887
5 0,8727 0,8490 0,8230 0,7951 0,7653 0,7339 0,7011 0,6671 0,6323 0,5968
6 0,9521 0,9402 0,9264 0,9106 0,8929 0,8732 0,8515 0,8279 0,8024 0,7752
7 0,9853 0,9806 0,9749 0,9680 0,9598 0,9501 0,9389 0,9261 0,9116 0,8954
8 0,9963 0,9949 0,9930 0,9906 0,9876 0,9839 0,9794 0,9739 0,9674 0,9597
9 0,9993 0,9989 0,9984 0,9978 0,9969 0,9958 0,9943 0,9925 0,9902 0,9873
10 0,9999 0,9998 0,9997 0,9996 0,9994 0,9991 0,9987 0,9982 0,9976 0,9968
11 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995 0,9993
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0018 0,0014 0,0011 0,0009 0,0007 0,0005 0,0004 0,0003 0,0002 0,0002
1 0,0157 0,0128 0,0104 0,0083 0,0067 0,0054 0,0043 0,0034 0,0027 0,0021
2 0,0657 0,0556 0,0468 0,0392 0,0327 0,0272 0,0225 0,0185 0,0151 0,0123
3 0,1781 0,1563 0,1366 0,1188 0,1028 0,0885 0,0759 0,0648 0,0550 0,0464
4 0,3547 0,3222 0,2913 0,2622 0,2348 0,2094 0,1858 0,1640 0,1441 0,1260
5 0,5610 0,5251 0,4895 0,4542 0,4197 0,3861 0,3535 0,3222 0,2923 0,2639
6 0,7464 0,7162 0,6847 0,6521 0,6188 0,5848 0,5505 0,5161 0,4818 0,4478
7 0,8773 0,8574 0,8358 0,8123 0,7872 0,7605 0,7324 0,7029 0,6722 0,6405
8 0,9508 0,9405 0,9288 0,9155 0,9006 0,8841 0,8659 0,8459 0,8243 0,8011
9 0,9838 0,9796 0,9746 0,9686 0,9617 0,9536 0,9443 0,9336 0,9216 0,9081
10 0,9957 0,9943 0,9926 0,9905 0,9880 0,9849 0,9811 0,9766 0,9714 0,9652
11 0,9991 0,9987 0,9983 0,9977 0,9970 0,9960 0,9949 0,9934 0,9916 0,9894
12 0,9998 0,9998 0,9997 0,9996 0,9994 0,9992 0,9989 0,9985 0,9981 0,9975
13 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0001 0,0001 0,0001 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0016 0,0013 0,0010 0,0008 0,0006 0,0004 0,0003 0,0002 0,0002 0,0001
2 0,0100 0,0080 0,0065 0,0052 0,0041 0,0032 0,0025 0,0020 0,0015 0,0012
3 0,0390 0,0326 0,0271 0,0224 0,0184 0,0151 0,0123 0,0099 0,0080 0,0064
4 0,1096 0,0949 0,0817 0,0699 0,0596 0,0505 0,0425 0,0356 0,0296 0,0245
5 0,2372 0,2121 0,1887 0,1670 0,1471 0,1288 0,1122 0,0972 0,0838 0,0717
6 0,4144 0,3818 0,3501 0,3195 0,2902 0,2623 0,2359 0,2110 0,1878 0,1662
7 0,6080 0,5750 0,5415 0,5079 0,4743 0,4410 0,4082 0,3761 0,3448 0,3145
8 0,7762 0,7498 0,7220 0,6928 0,6626 0,6313 0,5992 0,5665 0,5333 0,5000
9 0,8930 0,8764 0,8581 0,8382 0,8166 0,7934 0,7686 0,7423 0,7145 0,6855
10 0,9580 0,9497 0,9403 0,9295 0,9174 0,9038 0,8888 0,8721 0,8538 0,8338
11 0,9867 0,9835 0,9797 0,9752 0,9699 0,9637 0,9566 0,9483 0,9389 0,9283
12 0,9967 0,9958 0,9946 0,9931 0,9914 0,9892 0,9866 0,9835 0,9798 0,9755
13 0,9994 0,9992 0,9989 0,9986 0,9981 0,9976 0,9969 0,9960 0,9950 0,9936
14 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9995 0,9993 0,9991 0,9988
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Tabelas estatísticas selecionadas 457

n = 18
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8345 0,6951 0,5780 0,4796 0,3972 0,3283 0,2708 0,2229 0,1831 0,1501
1 0,9862 0,9505 0,8997 0,8393 0,7735 0,7055 0,6378 0,5719 0,5091 0,4503
2 0,9993 0,9948 0,9843 0,9667 0,9419 0,9102 0,8725 0,8298 0,7832 0,7338
3 1,0000 0,9996 0,9982 0,9950 0,9891 0,9799 0,9667 0,9494 0,9277 0,9018
4 1,0000 1,0000 0,9998 0,9994 0,9985 0,9966 0,9933 0,9884 0,9814 0,9718
5 1,0000 1,0000 1,0000 0,9999 0,9998 0,9995 0,9990 0,9979 0,9962 0,9936
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9994 0,9988
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,1227 0,1002 0,0815 0,0662 0,0536 0,0434 0,0349 0,0281 0,0225 0,0180
1 0,3958 0,3460 0,3008 0,2602 0,2241 0,1920 0,1638 0,1391 0,1176 0,0991
2 0,6827 0,6310 0,5794 0,5287 0,4797 0,4327 0,3881 0,3462 0,3073 0,2713
3 0,8718 0,8382 0,8014 0,7618 0,7202 0,6771 0,6331 0,5888 0,5446 0,5010
4 0,9595 0,9442 0,9257 0,9041 0,8794 0,8518 0,8213 0,7884 0,7533 0,7164
5 0,9898 0,9846 0,9778 0,9690 0,9581 0,9449 0,9292 0,9111 0,8903 0,8671
6 0,9979 0,9966 0,9946 0,9919 0,9882 0,9833 0,9771 0,9694 0,9600 0,9487
7 0,9997 0,9994 0,9989 0,9983 0,9973 0,9959 0,9940 0,9914 0,9880 0,9837
8 1,0000 0,9999 0,9998 0,9997 0,9995 0,9992 0,9987 0,9980 0,9971 0,9957
9 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9996 0,9994 0,9991
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0144 0,0114 0,0091 0,0072 0,0056 0,0044 0,0035 0,0027 0,0021 0,0016
1 0,0831 0,0694 0,0577 0,0478 0,0395 0,0324 0,0265 0,0216 0,0176 0,0142
2 0,2384 0,2084 0,1813 0,1570 0,1353 0,1161 0,0991 0,0842 0,0712 0,0600
3 0,4586 0,4175 0,3782 0,3409 0,3057 0,2728 0,2422 0,2140 0,1881 0,1646
4 0,6780 0,6387 0,5988 0,5586 0,5187 0,4792 0,4406 0,4032 0,3671 0,3327
5 0,8414 0,8134 0,7832 0,7512 0,7174 0,6824 0,6462 0,6093 0,5719 0,5344
6 0,9355 0,9201 0,9026 0,8829 0,8610 0,8370 0,8109 0,7829 0,7531 0,7217
7 0,9783 0,9717 0,9637 0,9542 0,9431 0,9301 0,9153 0,8986 0,8800 0,8593
8 0,9940 0,9917 0,9888 0,9852 0,9807 0,9751 0,9684 0,9605 0,9512 0,9404
9 0,9986 0,9980 0,9972 0,9961 0,9946 0,9927 0,9903 0,9873 0,9836 0,9790
10 0,9997 0,9996 0,9994 0,9991 0,9988 0,9982 0,9975 0,9966 0,9954 0,9939
11 1,0000 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995 0,9993 0,9990 0,9986
12 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0013 0,0010 0,0007 0,0006 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001
1 0,0114 0,0092 0,0073 0,0058 0,0046 0,0036 0,0028 0,0022 0,0017 0,0013
2 0,0502 0,0419 0,0348 0,0287 0,0236 0,0193 0,0157 0,0127 0,0103 0,0082
3 0,1432 0,1241 0,1069 0,0917 0,0783 0,0665 0,0561 0,0472 0,0394 0,0328
4 0,2999 0,2691 0,2402 0,2134 0,1886 0,1659 0,1451 0,1263 0,1093 0,0942
5 0,4971 0,4602 0,4241 0,3889 0,3550 0,3224 0,2914 0,2621 0,2345 0,2088
6 0,6889 0,6550 0,6202 0,5849 0,5491 0,5133 0,4776 0,4424 0,4079 0,3743
(Continua)
458 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

7 0,8367 0,8122 0,7859 0,7579 0,7283 0,6973 0,6651 0,6319 0,5979 0,5834
8 0,9280 0,9139 0,8981 0,8804 0,8609 0,8396 0,8165 0,7916 0,7650 0,7386
9 0,9736 0,9671 0,9595 0,9506 0,9403 0,9286 0,9153 0,9003 0,8837 0,8653
10 0,9920 0,9896 0,9867 0,9831 0,9788 0,9736 0,9675 0,9603 0,9520 0,9424
11 0,9980 0,9973 0,9964 0,9953 0,9938 0,9920 0,9898 0,9870 0,9837 0,9797
12 0,9996 0,9995 0,9992 0,9989 0,9986 0,9981 0,9974 0,9966 0,9956 0,9942
13 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9990 0,9987
14 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0001 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0010 0,0008 0,0006 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001
2 0,0066 0,0052 0,0041 0,0032 0,0025 0,0019 0,0015 0,0011 0,0009 0,0007
3 0,0271 0,0223 0,0182 0,0148 0,0120 0,0096 0,0077 0,0061 0,0048 0,0038
4 0,0807 0,0687 0,0582 0,0490 0,0411 0,0342 0,0283 0,0233 0,0190 0,0145
5 0,1849 0,1628 0,1427 0,1243 0,1077 0,0928 0,0795 0,0676 0,0572 0,0481
6 0,3418 0,3105 0,2807 0,2524 0,2258 0,2009 0,1778 0,1564 0,1368 0,1189
7 0,5287 0,4938 0,4592 0,4250 0,3915 0,3588 0,3272 0,2968 0,2678 0,2403
8 0,7072 0,6764 0,6444 0,6115 0,5778 0,5438 0,5094 0,4751 0,4409 0,4073
9 0,8451 0,8232 0,7996 0,7742 0,7473 0,7188 0,6890 0,6579 0,6258 0,5927
10 0,9314 0,9189 0,9049 0,8893 0,8720 0,8530 0,8323 0,8098 0,7856 0,7597
11 0,9750 0,9693 0,9628 0,9551 0,9463 0,9362 0,9247 0,9117 0,8972 0,8811
12 0,9926 0,9906 0,9882 0,9853 0,9817 0,9775 0,9725 0,9666 0,9598 0,9519
13 0,9983 0,9978 0,9971 0,9962 0,9951 0,9937 0,9921 0,9900 0,9875 0,9846
14 0,9997 0,9996 0,9994 0,9993 0,9990 0,9987 0,9983 0,9977 0,9971 0,9962
15 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 19
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8262 0,6812 0,5606 0,4604 0,3774 0,3086 0,2519 0,2051 0,1666 0,1351
1 0,9847 0,9454 0,8900 0,8249 0,7547 0,6829 0,6121 0,5440 0,4798 0,4203
2 0,9991 0,9939 0,9817 0,9616 0,9335 0,8979 0,8561 0,8092 0,7585 0,7054
3 1,0000 0,9995 0,9978 0,9939 0,9868 0,9757 0,9602 0,9398 0,9147 0,8850
4 1,0000 1,0000 0,9998 0,9993 0,9980 0,9956 0,9915 0,9853 0,9765 0,9648
5 1,0000 1,0000 1,0000 0,9999 0,9998 0,9994 0,9986 0,9971 0,9949 0,9914
6 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996 0,9991 0,9983
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9997
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,1092 0,0881 0,0709 0,0569 0,0456 0,0364 0,0290 0,0230 0,0182 0,0144
1 0,3658 0,3165 0,2723 0,2331 0,1985 0,1682 0,1419 0,1191 0,0996 0,0829
2 0,6512 0,5968 0,5432 0,4911 0,4413 0,3941 0,3500 0,3090 0,2713 0,2369
3 0,8510 0,8133 0,7725 0,7292 0,6841 0,6380 0,5451 0,5451 0,4995 0,4551
4 0,9498 0,9315 0,9096 0,8842 0,8556 0,8238 0,7524 0,7524 0,7136 0,6733
5 0,9865 0,9789 0,9710 0,9589 0,9463 0,9300 0,9109 0,8890 0,8643 0,8369
Tabelas estatísticas selecionadas 459

6 0,9970 0,9952 0,9924 0,9887 0,9837 0,9772 0,9690 0,9589 0,9468 0,9324
7 0,9995 0,9991 0,9984 0,9974 0,9959 0,9939 0,9911 0,9874 0,9827 0,9767
8 0,9999 0,9998 0,9997 0,9995 0,9992 0,9986 0,9979 0,9968 0,9953 0,9933
9 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9996 0,9993 0,9990 0,9984
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0113 0,0089 0,0070 0,0054 0,0042 0,0033 0,0025 0,0019 0,0015 0,0011
1 0,0687 0,0566 0,0465 0,0381 0,0310 0,0251 0,0203 0,0163 0,0131 0,0104
2 0,2058 0,1778 0,1529 0,1308 0,1113 0,0943 0,0795 0,0667 0,0557 0,0462
3 0,4123 0,3715 0,3329 0,2968 0,2631 0,2320 0,2035 0,1776 0,1542 0,1332
4 0,6319 0,5900 0,5480 0,5064 0,4654 0,4256 0,3871 0,3502 0,3152 0,2822
5 0,8071 0,7749 0,7408 0,7050 0,6677 0,6295 0,5907 0,5516 0,5125 0,4739
6 0,9157 0,8966 0,8751 0,8513 0,8251 0,7986 0,7664 0,7343 0,7005 0,6655
7 0,9693 0,9604 0,9497 0,9371 0,9225 0,9059 0,8871 0,8662 0,8432 0,8180
8 0,9907 0,9873 0,9831 0,9778 0,9713 0,9634 0,9541 0,9432 0,9306 0,9161
9 0,9977 0,9966 0,9953 0,9934 0,9911 0,9881 0,9844 0,9798 0,9742 0,9674
10 0,9995 0,9993 0,9989 0,9984 0,9977 0,9968 0,9956 0,9940 0,9920 0,9895
11 0,9999 0,9999 0,9998 0,9997 0,9995 0,9993 0,9990 0,9985 0,9980 0,9972
12 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0009 0,0007 0,0005 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001
1 0,0083 0,0065 0,0051 0,0040 0,0031 0,0024 0,0019 0,0014 0,0011 0,0008
2 0,0382 0,0314 0,0257 0,0209 0,0170 0,0137 0,0110 0,0087 0,0069 0,0055
3 0,1144 0,0978 0,0831 0,0703 0,0591 0,0495 0,0412 0,0341 0,0281 0,0230
4 0,2514 0,2227 0,1963 0,1720 0,1500 0,1301 0,1122 0,0962 0,0821 0,0696
5 0,4359 0,3990 0,3634 0,3293 0,2968 0,2661 0,2373 0,2105 0,1857 0,1629
6 0,6294 0,5927 0,5555 0,5182 0,4812 0,4446 0,4087 0,3739 0,3403 0,3081
7 0,7909 0,7619 0,7312 0,6990 0,6656 0,6310 0,5957 0,5599 0,5238 0,4878
8 0,8997 0,8814 0,8611 0,8388 0,8145 0,7884 0,7605 0,7309 0,6998 0,6675
9 0,9595 0,9501 0,9392 0,9267 0,9125 0,8965 0,8787 0,8590 0,8374 0,8139
10 0,9863 0,9824 0,9777 0,9720 0,9653 0,9574 0,9482 0,9375 0,9253 0,9115
11 0,9962 0,9949 0,9932 0,9911 0,9886 0,9854 0,9815 0,9769 0,9713 0,9648
12 0,9991 0,9988 0,9983 0,9977 0,9969 0,9959 0,9946 0,9930 0,9909 0,9884
13 0,9998 0,9998 0,9997 0,9995 0,9993 0,9991 0,9987 0,9983 0,9977 0,9969
14 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995 0,9994
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0006 0,0005 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0001 0,0000
2 0,0043 0,0033 0,0026 0,0020 0,0015 0,0012 0,0009 0,0007 0,0005 0,0004
3 0,0187 0,0151 0,0122 0,0097 0,0077 0,0061 0,0048 0,0037 0,0029 0,0022
4 0,0587 0,0492 0,0410 0,0340 0,0280 0,0229 0,0186 0,0150 0,0121 0,0096
5 0,1421 0,1233 0,1063 0,0912 0,0777 0,0658 0,0554 0,0463 0,0385 0,0318
6 0,2774 0,2485 0,2213 0,1961 0,1727 0,1512 0,1316 0,1138 0,0978 0,0835
(Continua)
460 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)

7 0,4520 0,4168 0,3824 0,3491 0,3169 0,2862 0,2570 0,2294 0,2036 0,1796
8 0,6340 0,5997 0,5647 0,5294 0,4940 0,4587 0,4238 0,3895 0,3561 0,3238
9 0,7886 0,7615 0,7328 0,7026 0,6710 0,6383 0,6046 0,5701 0,5352 0,5000
10 0,8960 0,8787 0,8596 0,8387 0,8159 0,7913 0,7649 0,7369 0,7073 0,6762
11 0,9571 0,9482 0,9379 0,9262 0,9129 0,8979 0,8813 0,8628 0,8425 0,8204
12 0,9854 0,9817 0,9773 0,9720 0,9658 0,9585 0,9500 0,9403 0,9291 0,9165
13 0,9960 0,9948 0,9933 0,9914 0,9891 0,9853 0,9829 0,9788 0,9924 0,9682
14 0,9991 0,9988 0,9984 0,9979 0,9972 0,9964 0,9954 0,9940 0,9924 0,9904
15 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9990 0,9987 0,9983 0,9978
16 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 20
p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,8179 0,6676 0,5438 0,4420 0,3585 0,2901 0,2342 0,1887 0,1516 0,1216
1 0,9831 0,9401 0,8802 0,8103 0,7358 0,6605 0,5869 0,5169 0,4516 0,3917
2 0,9990 0,9929 0,9790 0,9561 0,9245 0,8850 0,8390 0,7879 0,7334 0,6769
3 1,0000 0,9994 0,9973 0,9926 0,9841 0,9710 0,9529 0,9294 0,9007 0,8670
4 1,0000 1,0000 0,9997 0,9990 0,9974 0,9944 0,9893 0,9817 0,9710 0,9568
5 1,0000 1,0000 1,0000 0,9999 0,9997 0,9991 0,9981 0,9962 0,9932 0,9887
6 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9994 0,9987 0,9976
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,0972 0,0776 0,0617 0,0490 0,0388 0,0306 0,0241 0,0189 0,0148 0,0115
1 0,3376 0,2891 0,2461 0,2084 0,1756 0,1471 0,1227 0,1018 0,0841 0,0692
2 0,6198 0,5631 0,5080 0,4550 0,4049 0,3580 0,3146 0,2748 0,2386 0,2061
3 0,8290 0,7873 0,7427 0,6959 0,6477 0,5990 0,5504 0,5026 0,4561 0,4114
4 0,9390 0,9173 0,8917 0,8625 0,8298 0,7941 0,7557 0,7151 0,6729 0,6296
5 0,9825 0,9740 0,9630 0,9493 0,9327 0,9130 0,8902 0,8644 0,8357 0,8042
6 0,9959 0,9933 0,9897 0,9847 0,9781 0,9696 0,9591 0,9463 0,9311 0,9133
7 0,9992 0,9986 0,9976 0,9962 0,9941 0,9912 0,9873 0,9823 0,9759 0,9679
8 0,9999 0,9998 0,9995 0,9992 0,9987 0,9979 0,9967 0,9951 0,9929 0,9900
9 1,0000 1,0000 0,9999 0,9999 0,9998 0,9996 0,9993 0,9989 0,9983 0,9974
10 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9996 0,9994
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0090 0,0069 0,0054 0,0041 0,0032 0,0024 0,0018 0,0014 0,0011 0,0008
1 0,0566 0,0461 0,0374 0,0302 0,0243 0,0195 0,0155 0,0123 0,0097 0,0076
2 0,1770 0,1512 0,1284 0,1085 0,0913 0,0763 0,0635 0,0526 0,0433 0,0355
3 0,3690 0,3289 0,2915 0,2569 0,2252 0,1962 0,1700 0,1466 0,1256 0,1071
4 0,5858 0,5420 0,4986 0,4561 0,4148 0,3752 0,3375 0,3019 0,2685 0,2375
5 0,7703 0,7343 0,6965 0,6573 0,6172 0,5765 0,5357 0,4952 0,4553 0,4164
6 0,8929 0,8699 0,8442 0,8162 0,7858 0,7533 0,7190 0,6831 0,6460 0,6080
7 0,9581 0,9464 0,9325 0,9165 0,8982 0,8775 0,8545 0,8293 0,8018 0,7723
Tabelas estatísticas selecionadas 461

8 0,9962 0,9814 0,9754 0,9680 0,9591 0,9485 0,9360 0,9216 0,9052 0,8867
9 0,9962 0,9946 0,9925 0,9897 0,9861 0,9817 0,9762 0,9695 0,9615 0,9520
10 0,9991 0,9987 0,9981 0,9972 0,9961 0,9945 0,9926 0,9900 0,9868 0,9829
11 0,9998 0,9997 0,9996 0,9994 0,9991 0,9986 0,9981 0,9973 0,9962 0,9949
12 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9991 0,9987
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0006 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0000
1 0,0060 0,0047 0,0036 0,0028 0,0021 0,0015 0,0012 0,0009 0,0007 0,0005
2 0,0289 0,0235 0,0189 0,0152 0,0121 0,0096 0,0076 0,0060 0,0047 0,0036
3 0,0908 0,0765 0,0642 0,0535 0,0444 0,0366 0,0300 0,0245 0,0198 0,0160
4 0,2089 0,1827 0,1589 0,1374 0,1182 0,1011 0,0859 0,0726 0,0610 0,0510
5 0,3787 0,3426 0,3082 0,2758 0,2454 0,2171 0,1910 0,1671 0,1453 0,1256
6 0,5695 0,5307 0,4921 0,4540 0,4166 0,3803 0,3453 0,3118 0,2800 0,2500
7 0,7409 0,7078 0,6732 0,6376 0,6010 0,5639 0,5265 0,4892 0,4522 0,4159
8 0,8660 0,8432 0,8182 0,7913 0,7624 0,7317 0,6995 0,6659 0,6312 0,5956
9 0,9409 0,9281 0,9134 0,8968 0,8782 0,8576 0,8350 0,8103 0,7837 0,7553
10 0,9780 0,9721 0,9650 0,9566 0,9468 0,9355 0,9225 0,9077 0,8910 0,8725
11 0,9931 0,9909 0,9881 0,9846 0,9804 0,9753 0,9692 0,9619 0,9534 0,9435
12 0,9982 0,9975 0,9966 0,9955 0,9940 0,9921 0,9898 0,9868 0,9833 0,9790
13 0,9996 0,9994 0,9992 0,9989 0,9985 0,9979 0,9972 0,9963 0,9951 0,9935
14 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9991 0,9988 0,9984
15 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9998 0,9997
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001 0,0000 0,0000 0,0000
2 0,0028 0,0021 0,0016 0,0012 0,0009 0,0007 0,0005 0,0004 0,0003 0,0002
3 0,0128 0,0102 0,0080 0,0063 0,0049 0,0038 0,0029 0,0023 0,0017 0,0013
4 0,0423 0,0349 0,0286 0,0233 0,0189 0,0152 0,0121 0,0096 0,0076 0,0059
5 0,1079 0,0922 0,0783 0,0660 0,0553 0,0461 0,0381 0,0313 0,0255 0,0207
6 0,2220 0,1959 0,1719 0,1499 0,1299 0,1119 0,0958 0,0814 0,0688 0,0577
7 0,3804 0,3461 0,3132 0,2817 0,2520 0,2241 0,1980 0,1739 0,1518 0,1316
8 0,5594 0,5229 0,4864 0,4501 0,4143 0,3793 0,3454 0,3127 0,2814 0,2517
9 0,7252 0,6936 0,6606 0,6264 0,5914 0,5557 0,5196 0,4834 0,4474 0,4119
10 0,8520 0,8295 0,8051 0,7788 0,7507 0,7209 0,6896 0,6568 0,6229 0,5881
11 0,9321 0,9190 0,9042 0,8877 0,8692 0,8489 0,8266 0,8024 0,7762 0,7483
12 0,9738 0,9676 0,9603 0,9518 0,9420 0,9306 0,9177 0,9031 0,8867 0,8684
13 0,9916 0,9893 0,9864 0,9828 0,9786 0,9735 0,9674 0,9603 0,9520 0,9423
14 0,9978 0,9971 0,9962 0,9950 0,9936 0,9917 0,9895 0,9867 0,9834 0,9793
15 0,9996 0,9994 0,9992 0,9989 0,9985 0,9980 0,9973 0,9965 0,9954 0,9941
16 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9990 0,9987
17 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998
18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
n = 25
(Continua)
462 Pesquisa de Marketing

Tabela 2  Distribuição da probabilidade binomial cumulativa (cont.)


p
x 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
0 0,7778 0,6035 0,4670 0,3604 0,2774 0,2129 0,1630 0,1244 0,0946 0,0718
1 0,9742 0,9114 0,8280 0,7358 0,6424 0,5527 0,4686 0,3947 0,3286 0,2712
2 0,9980 0,9868 0,9620 0,9235 0,8729 0,8129 0,7466 0,6768 0,6063 0,5371
3 0,9999 0,9986 0,9938 0,9835 0,9659 0,9402 0,9064 0,8649 0,8169 0,7636
4 1,0000 0,9999 0,9992 0,9972 0,9928 0,9850 0,9726 0,9549 0,9314 0,9020
5 1,0000 1,0000 0,9999 0,9996 0,9988 0,9969 0,9935 0,9877 0,9790 0,9666
6 1,0000 1,0000 1,0000 1,0000 0,9998 0,9995 0,9987 0,9972 0,9946 0,9905
7 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9995 0,9989 0,9977
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9995
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
0 0,0543 0,0409 0,0308 0,0230 0,0172 0,0128 0,0095 0,0070 0,0052 0,0038
1 0,2221 0,1805 0,1457 0,1168 0,0931 0,0737 0,0580 0,0454 0,0354 0,0274
2 0,4709 0,4088 0,3517 0,3000 0,2537 0,2130 0,1774 0,1467 0,1204 0,0982
3 0,7066 0,6475 0,5877 0,5286 0,4711 0,4163 0,3648 0,3171 0,2734 0,2340
4 0,8669 0,8266 0,7817 0,7332 0,6821 0,6293 0,5759 0,5228 0,4708 0,4207
5 0,9501 0,9291 0,9035 0,8732 0,8385 0,7998 0,7575 0,7125 0,6653 0,6167
6 0,9844 0,9757 0,9641 0,9491 0,9305 0,9080 0,8815 0,8512 0,8173 0,7800
7 0,9959 0,9930 0,9887 0,9827 0,9745 0,9639 0,9505 0,9339 0,9141 0,8909
8 0,9991 0,9983 0,9970 0,9950 0,9920 0,9879 0,9822 0,9748 0,9652 0,9532
9 0,9998 0,9996 0,9993 0,9987 0,9979 0,9965 0,9945 0,9917 0,9878 0,9827
10 1,0000 0,9999 0,9999 0,9997 0,9995 0,9991 0,9985 0,9976 0,9963 0,9944
11 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997 0,9994 0,9990 0,9985
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9996
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
0 0,0028 0,0020 0,0015 0,0010 0,0008 0,0005 0,0004 0,0003 0,0002 0,0001
1 0,0211 0,0162 0,0123 0,0093 0,0070 0,0053 0,0039 0,0029 0,0021 0,0016
2 0,0796 0,0640 0,0512 0,0407 0,0321 0,0252 0,0196 0,0152 0,0117 0,0090
3 0,1987 0,1676 0,1403 0,1166 0,0962 0,0789 0,0642 0,0519 0,0417 0,0332
4 0,3730 0,3282 0,2866 0,2484 0,2137 0,1826 0,1548 0,1304 0,1090 0,0905
5 0,5675 0,5184 0,4701 0,4233 0,3783 0,3356 0,2956 0,2585 0,2245 0,2935
6 0,7399 0,6973 0,6529 0,6073 0,5611 0,5149 0,4692 0,4247 0,3817 0,3407
7 0,8642 0,8342 0,8011 0,7651 0,7265 0,6858 0,6435 0,6001 0,5560 0,5118
8 0,9386 0,9212 0,9007 0,8772 0,8506 0,8210 0,7885 0,7535 0,7162 0,6769
9 0,9760 0,9675 0,9569 0,9440 0,9287 0,9107 0,8899 0,8662 0,8398 0,8106
10 0,9918 0,9883 0,9837 0,9778 0,9703 0,9611 0,9498 0,9364 0,9205 0,9022
11 0,9976 0,9964 0,9947 0,9924 0,9893 0,9852 0,9801 0,9736 0,9655 0,9558
12 0,9994 0,9990 0,9985 0,9977 0,9966 0,9951 0,9931 0,9804 0,9870 0,9825
13 0,9999 0,9998 0,9996 0,9994 0,9991 0,9986 0,9979 0,9970 0,9967 0,9940
14 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995 0,9992 0,9988 0,9982
15 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9995
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Tabelas estatísticas selecionadas 463

p
x 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
0 0,0001 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0011 0,0008 0,0006 0,0004 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001
2 0,0068 0,0051 0,0039 0,0029 0,0021 0,0016 0,0011 0,0008 0,0006 0,0004
3 0,0263 0,0207 0,0162 0,0126 0,0097 0,0074 0,0056 0,0043 0,0032 0,0024
4 0,0746 0,0610 0,0496 0,0400 0,0320 0,0255 0,0201 0,0158 0,0123 0,0095
5 0,1656 0,1407 0,1187 0,0994 0,0826 0,0682 0,0559 0,0454 0,0367 0,0294
6 0,3019 0,2657 0,2321 0,2013 0,1734 0,1483 0,1258 0,1060 0,0886 0,0736
7 0,4681 0,4253 0,3837 0,3439 0,3061 0,2705 0,2374 0,2068 0,1789 0,1536
8 0,6361 0,5943 0,5518 0,5092 0,4668 0,4252 0,3848 0,3458 0,3086 0,2735
9 0,7787 0,7445 0,7081 0,6700 0,6303 0,5896 0,5483 0,5067 0,4653 0,4246
10 0,8812 0,8576 0,8314 0,8025 0,7712 0,7375 0,7019 0,6645 0,6257 0,5858
11 0,9440 0,9302 0,9141 0,8956 0,8746 0,8510 0,8249 0,7964 0,7654 0,7323
12 0,9770 0,9701 0,9617 0,9515 0,9396 0,9255 0,9093 0,8907 0,8697 0,8462
13 0,9917 0,9888 0,9851 0,9804 0,9745 0,9674 0,9588 0,9485 0,9363 0,9222
14 0,9974 0,9964 0,9950 0,9931 0,9907 0,9876 0,9837 0,9788 0,979 0,9656
15 0,9993 0,9990 0,9985 0,9979 0,9971 0,9959 0,9944 0,9925 0,9900 0,9868
16 0,9998 0,9998 0,9996 0,9995 0,9992 0,9989 0,9984 0,9977 0,9968 0,9957
17 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9992 0,9988
18 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9997
19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
20 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
p
x 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
2 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
3 0,0017 0,0013 0,0009 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001
4 0,0073 0,0055 0,0042 0,0031 0,0023 0,0017 0,0012 0,0009 0,0006 0,0005
5 0,0233 0,0184 0,0144 0,0112 0,0086 0,0066 0,0050 0,0037 0,0028 0,0020
6 0,0606 0,0495 0,0401 0,0323 0,0258 0,0204 0,0160 0,0124 0,0096 0,0073
7 0,1308 0,1106 0,0929 0,0773 0,0639 0,0523 0,0426 0,0342 0,0273 0,0216
8 0,2407 0,2103 0,1823 0,1569 0,1340 0,1135 0,0954 0,0795 0,0657 0,0539
9 0,3849 0,3465 0,3098 0,2750 0,2424 0,2120 0,1840 0,1585 0,1354 0,1148
10 0,5452 0,5044 0,4637 0,4235 0,3843 0,3462 0,3098 0,2751 0,2426 0,2122
11 0,9671 0,6603 0,6220 0,5826 0,5426 0,5022 0,4618 0,4220 0,3829 0,3450
12 0,8203 0,7920 0,7613 0,7285 0,6937 0,6571 0,6192 0,5801 0,5402 0,5000
13 0,9059 0,8873 0,8664 0,8431 0,8173 0,7891 0,7587 0,7260 0,9614 0,6550
14 0,9569 0,9465 0,9344 0,9203 0,9040 0,8855 0,8647 0,8415 0,8159 0,7878
15 0,9829 0,9780 0,9720 0,9647 0,9560 0,9457 0,9337 0,9197 0,9036 0,8852
16 0,9942 0,9922 0,9897 0,9866 0,9826 0,9778 0,9719 0,9648 0,9562 0,9461
17 0,9983 0,9977 0,9968 0,9956 0,9942 0,9923 0,9898 0,9868 0,9830 0,9784
18 0,9996 0,9994 0,9992 0,9988 0,9984 0,9977 0,9969 0,9959 0,9945 0,9927
19 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9992 0,9989 0,9985 0,9980
20 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9998 0,9997 0,9995
21 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
22 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Fonte: Daniel, W. W. Essentials of business statistics. Boston: Houghton Mifflin Co., 1984:408-430.
464 Pesquisa de Marketing

Tabela 3  Valores de z e a probabilidade associada (a) na distribuição normal

X−µ
Z=
σ

Segunda casa decimal em z


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3754 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
Fonte: Evrard,Yves et al. Market études et recherches em marketing – Fondements méthodes. Éditions Nathan, 1993:594 –
Tabela A.
Tabelas estatísticas selecionadas 465

Tabela 4  Distribuição t de Student – Níveis de significância (a), graus de liberdade (gl) e a probabilidade
associada em testes unicaudal e bicaudal

Nível de significância para teste unicaudal (a/2)


0,125 0,10 0,05 0,025 0,01 0,005 0,0005
gl Nível de significância para teste bicaudal (a)
0,25 0,20 0,10 0,05 0,02 0,01 0,001
1 1,000 3,078 6,314 12,706 31,821 63,657 636,619
2 0,817 1,886 2,920 4,303 6,965 9,925 31,598
3 0,765 1,638 2,353 3,182 4,541 5,841 12,941
4 0,741 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 1,476 2,015 2,571 3,365 4,032 6,859
6 0,718 1,440 1,943 2,447 3,143 3,707 5,959
7 0,711 1,415 1,895 2,365 2,998 3,499 5,405
8 0,706 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 1,341 1,753 2,131 2,602 2,947 4,073
16 0,690 1,337 1,746 2,120 2,583 2,921 4,015
17 0,689 1,333 1,740 2,110 2,567 2,898 3,965
18 0,688 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 1,325 1,725 2,086 2,528 2,845 3,850
21 0,686 1,323 1,721 2,080 2,518 2,831 3,819
22 0,686 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 1,319 1,714 2,069 2,500 2,807 3,767
24 0,685 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 1,316 1,708 2,060 2,485 2,787 3,725
26 0,684 1,315 1,706 2,056 2,479 2,779 3,707
27 0,684 1,314 1,703 2,052 2,473 2,771 3,690
28 0,683 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 1,311 1,699 2,045 2,462 2,756 3,659
30 0,683 1,310 1,697 2,042 2,457 2,750 3,646
40 0,681 1,303 1,684 2,021 2,423 2,704 3,551
60 0,679 1,296 1,671 2,000 2,390 2,660 3,460
120 0,677 1,289 1,658 1,980 2,358 2.617 3,373
∞ 0,675 1,282 1,645 1,960 2,326 2,576 3,291
Fontes: Malhotra, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman, 2001:
655 – Apêndice – Tabela 4; Siegel, S. Estatística não paramétrica para ciências do comportamento. São Paulo: McGraw-Hill,
1981:279 – Apêndice – Tábua B.
466 Pesquisa de Marketing

Tabela 5  Distribuição do qui-quadrado (χ2) – Níveis de significância (a), graus de liberdade (gl) e o valor
do qui-quadrado associado (χ2)

Nível de significância (a )
gl 0,99 0,95 0,90 0,75 0,25 0,10 0,05 0,025 0,01 0,005
1 0,000 0,004 0,016 0,102 1,323 2,706 3,841 5,024 6,635 7,879
2 0,020 0,103 0,211 0,575 2,773 4,605 5,991 7,378 9,210 10,597
3 0,115 0,352 0,584 1,200 4,108 6,251 7,815 9,348 11,345 12,838
4 0,297 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860
5 0,554 1,145 1,610 2,675 6,626 9,236 11,071 12,833 15,086 16,750
6 0,872 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548
7 1,239 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278
8 1,646 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955
9 2,088 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589
10 2,558 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188
11 3,053 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757
12 3,571 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,299
13 4,107 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,819
14 4,660 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319
15 5,229 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801
16 5,812 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267
17 6,408 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,718
18 7,015 9,390 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,156
19 7,633 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,190 38,582
20 8,260 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997
21 8,897 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401
22 9,542 12,338 14,042 17,240 26,039 30,813 33,924 36,781 40,289 42,796
23 10,196 13,091 14,848 18,137 27,141 32,007 35,172 38,076 41,638 44,181
24 10,856 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559
25 11,524 14,611 16,473 19,939 29,339 34,382 37,652 40,646 44,314 46,928
26 12,198 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290
27 12,879 16,151 18,114 21,749 31,528 36,741 40,113 43,194 46,963 49,645
28 13,565 16,928 18,939 22,657 32,620 37,916 41,337 44,461 48,278 50,993
29 14,257 17,708 19,768 23,567 33,711 39,087 42,557 45,722 49,588 52,336
30 14,954 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672
31 15,655 19,281 21,434 25,390 35,887 41,422 44,985 48,232 52,191 55,003
32 16,362 20,072 22,271 26,304 36,973 42,585 46,194 49,480 53,486 56,328
33 17,074 20,867 23,110 27,219 38,058 43,745 47,400 50,725 54,776 57,648
34 17,789 21,664 23,952 28,136 39,141 44,903 48,602 51,966 56,061 58,964
35 18,509 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275
36 19,233 23,269 25,643 29,973 41,304 47,212 50,998 54,437 58,619 61,581
37 19,960 24,075 26,492 30,893 42,383 48,363 52,192 55,668 59,892 62,883
38 20,691 24,884 27,343 31,815 43,462 49,513 53,384 56,896 61,162 64,181
39 21,426 25,695 28,196 32,737 44,539 50,660 54,572 58,120 62,428 65,476
Fontes: Malhotra, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman, 2001:653
– Apêndice – Tabela 3; Siegel, S. Estatística não paramétrica para ciências do comportamento. São Paulo: McGraw-Hill,
1981:280 – Apêndice – Tábua C.
Tabela 6  Distribuição F – Níveis de significância (a), graus de liberdade (gl1 e gl2) e o valor de F associado para a = 0,025; 0,05 e 0,10
a) Valores de F para a = 0,025.

F = SS j /SSe

Nível de significância a = 0,025


Numerador gl1
Denomi-
nador gl2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 993,1 997,2 1001 1006 1010 1014 1018
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,50
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 17,08 17,04 13,99 13,95 13,90
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,36 8,31 8,26
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,12 6,07 6,02
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,96 4,90 4,85

Tabelas estatísticas selecionadas


7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,42 4,36 4,31 4,25 4,20 4,14
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,78 3,73 3,67
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,45 3,39 3,33
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,82 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,20 3,14 3,08
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,17 3,12 3,06 3,00 2,94 2,88
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,85 2,73 2,72
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,89 2,84 0,78 2,72 2,66 2,60
14 6,30 4,83 4,25 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,79 2,73 2,67 2,61 2,55 2,49
(Continua)

467
468
Pesquisa de Marketing
Tabela 6  Distribuição F – Níveis de significância (a), graus de liberdade (gl1 e gl2) e o valor de F associado para a = 0,025; 0,05 e 0,10
a) Valores de F para a = 0,025. (cont.)
Nível de significância a = 0,025
Numerador gl1
Denomi-
nador gl2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,52 2,46 2,40
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,62 2,63 2,57 2,51 2,45 2,38 2,32
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,56 2,50 2,44 2,38 2,32 2,25
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,64 2,56 2,50 2,44 2,38 2,32 2,26 2,19
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,45 2,39 2,33 2,27 2,20 2,13
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,22 2,16 2,09
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,11 2,04
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,08 2,00
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,04 1,97
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,08 2,01 1,94
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 1,98 1,91
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,22 2,16 2,09 2,03 1,95 1,88
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,93 1,85
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,91 1,83
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,89 1,81
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,94 1,87 1,79
40 5,42 4,05 3,46 3,13 2,90 2,71 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,67 1,58 1,48
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31
∞ 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00
Fonte: Malhotra, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman, 2001:659 – Apêndice – Tabela 5.
Tabela 6  Distribuição F – Níveis de significância (a), graus de liberdade (gl1 e gl2) e o valor de F associado para a = 0,025; 0,05 e 0,10
b) Valores de F para a = 0,05.

F = SS j /SSe

Nível de significância a = 0,05


Numerador gl1
Denomi-
nador gl2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,55 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36

Tabelas estatísticas selecionadas


6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01

469
(Continua)
470
Pesquisa de Marketing
Tabela 6  Distribuição F – Níveis de significância (a), graus de liberdade (gl1 e gl2) e o valor de F associado para a = 0,025; 0,05 e 0,10
b) Valores de F para a = 0,05. (cont.)
Nível de significância a = 0,05
Numerador gl1
Denomi-
nador gl2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 ,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Fonte: Malhotra, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman, 2001:658 – Apêndice – Tabela 5.
Tabela 6  Distribuição F – Níveis de significância (a), graus de liberdade (gl1 e gl2) e o valor de F associado para a = 0,025; 0,05 e 0,10
c) Valores de F para a = 0,10.

F = SS j /SSe

Nível de significância a = 0,10


Numerador gl1
Denomi-
nador gl2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19 60,71 61,22 61,74 62,00 62,26 62,53 62,79 63,06 63,33
2 8, 53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,45 9,46 9,47 9,47 9,48 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,18 5,17 5,16 5,15 5,14 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,79 3,78 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,14 3,12 3,10
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,58 2,56 2,54 2,51 2,49 2,47

Tabelas estatísticas selecionadas


8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,34 2,32 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,28 2,25 2,23 2,21 2,18 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,18 2,16 2,13 2,11 2,08 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,21 2,17 2,12 2,10 2,08 2,05 2,03 2,00 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,04 2,01 1,99 1,96 1,93 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,10 2,05 2,01 1,98 1,96 1,93 1,90 1,88 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10 2,05 2,01 1,96 1,94 1,91 1,89 1,86 1,83 1,80
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,90 1,87 1,85 1,82 1,79 1,76
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,99 1,94 1,89 1,87 1,84 1,81 1,78 1,75 1,72
(Continua)

471
472
Pesquisa de Marketing
Tabela 6  Distribuição F – Níveis de significância (a), graus de liberdade (gl1 e gl2) e o valor de F associado para a = 0,025; 0,05 e 0,10
c) Valores de F para a = 0,10. (cont.)
Nível de significância a = 0,10
Numerador gl1
Denomi-
nador gl2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,96 1,91 1,86 1,84 1,81 1,78 1,75 1,72 1,69
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98 1,93 1,89 1,84 1,81 1,78 1,75 1,72 1,69 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,91 7,86 1,81 1,79 1,76 1,73 1,70 1,67 1,63
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,77 1,74 1,71 1,68 1,64 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92 1,87 1,83 1,78 1,75 1,72 1,69 1,66 1,62 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,86 1,81 1,76 1,73 1,70 1,67 1,64 1,60 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89 1,84 1,80 1,74 1,72 1,69 1,66 1,62 1,59 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,70 1,67 1,64 1,61 1,57 1,53
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,69 1,66 1,63 1,59 1,56 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86 1,81 1,76 1,71 1,68 1,65 1,61 1,58 1,54 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85 1,80 1,75 1,70 1,67 1,64 1,60 1,57 1,53 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,63 1,59 1,56 1,52 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83 1,78 1,73 1,68 1,65 1,62 1,58 1,55 1,51 1,47
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,64 1,61 1,57 1,54 1,50 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,47 1,42 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,51 1,48 1,44 1,40 1,35 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,45 1,41 1,37 1,32 1,26 1,19
∞ 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 1,60 1,55 1,49 1,42 1,38 1,34 1,30 1,24 1,17 1,00

Fonte: Daniel, W. W. Essentials of business statistics. Boston: Houghton Mifflin Co., 1984:435 – Apêndice – Tabela G.
Tabelas estatísticas selecionadas 473

Tabela 7  Valores críticos de T nos testes de Wilcoxon uni e bicaudais de pares conjugados
Nível de significância a para teste unicaudal
0,025 0,01 0,005
Nível de significância a para teste bicaudal
n 0,05 0,02 0,01
6 0 - -
7 2 0 -
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68
Fontes: Adaptado de Wilcoxon, F. Some rapid approximate statistical procedures. New York: American Cyanamid Company,
1949:13; In: Cooper, D. R.; Schindler, P. S. Métodos de pesquisa em administração. 7. ed. Porto Alegre: Bookman, 2003:596
– Apêndice F – Tabela F4.
474 Pesquisa de Marketing

Tabela 8  Valores críticos de D no teste Kolmogorov-Smirnov de uma amostra

Nível de significância a para D = Máximo F0 ( X ) − S N S n ( X )


Tamanho da
amostra n 0,20 0,15 0,10 0,05 0,01
1 0,900 0,925 0,950 0,975 0,995
2 0,684 0,726 0,776 0,842 0,929
3 0,565 0,597 0,642 0,708 0,828
4 0,494 0,525 0,564 0,624 0,733
5 0,446 0,474 0,510 0,565 0,669
6 0,410 0,436 0,470 0,521 0,618
7 0,381 0,405 0,438 0,486 0,577
8 0,358 0,381 0,411 0,457 0,543
9 0,339 0,360 0,388 0,432 0,514
10 0,322 0,342 0,368 0,410 0,490
11 0,307 0,326 0,352 0,391 0,468
12 0,295 0,313 0,338 0,375 0,450
13 0,284 0,302 0,325 0,361 0,433
14 0,274 0,292 0,314 0,349 0,418
15 0,266 0,283 0,304 0,338 0,404
16 0,258 0,274 0,295 0,328 0,392
17 0,250 0,266 0,286 0,318 0,381
18 0,244 0,259 0,278 0,309 0,371
19 0,237 0,252 0,272 0,301 0,363
20 0,231 0,246 0,264 0,294 0,356
25 0,210 0,220 0,240 0,270 0,320
30 0,190 0,200 0,220 0,240 0,290
35 0,180 0,190 0,210 0,230 0,270
1, 07 1,14 1, 22 1, 36 1, 63
Acima de 35
Nn Nn Nn Nn Nn
Fontes: Adaptado de Massey Jr., F. J. The Kolmogorov-Smirnov Test for Goodness of Fit. Journal of the American Statistical
Association. 1946:70. In: Cooper, D. R.; Schindler, P. S. Métodos de pesquisa em Administração. 7. ed. Porto Alegre: Bookman,
2003:597 – Apêndice F – Tabela F5.
Tabelas estatísticas selecionadas 475

Tabela 9  Valores críticos de Kt no teste Kolmogorov-Smirnov de duas amostras pequenas


Teste unicaudal Teste bicaudal
n Nível de significância a Nível de significância a
0,05 0,01 0,05 0,01
3 3 - - -
4 4 - 4 -
5 4 5 5 5
6 5 6 5 6
7 5 6 6 6
8 5 6 6 7
9 6 7 6 7
10 6 7 7 8
11 6 8 7 8
12 6 8 7 8
13 7 8 7 9
14 7 8 8 9
15 7 9 8 9
16 7 9 8 10
17 8 9 8 10
18 8 10 9 10
19 8 10 9 10
20 8 10 9 11
21 8 10 9 11
22 9 11 9 11
23 9 11 10 11
24 9 11 10 12
25 9 11 10 12
26 9 11 10 12
27 9 12 10 12
28 10 12 11 13
29 10 12 11 13
30 10 12 11 13
35 11 13 12
40 11 14 13
Fontes: Adaptado de Goodman, I. A. Kolmogorov-Smirnov Tests for Psychological Research. Psychological Bulletin,
1951:167; derivado de Table 1 de Massey Jr., F. J. The Distribution of the Maximum Deviation Between:The Sample Cumulative
Step Functions. Annals of Mathematical Statistics 23, 1951:126-127. In: Cooper, D. R.; Schindler, P. S. Métodos de pesquisa
em Administração. 7. ed. Porto Alegre: Bookman, 2003:598 – Apêndice F – Tabela F6.
476 Pesquisa de Marketing

Tabela 10  Valores de D no teste Kolmogorov-Smirnov de duas amostras grandes


Nível de significância a Valor de D é tão grande que exige rejeição de H0 no nível de
importância indicado, em que D = máximo |S n1 ( χ ) − S 2 ( χ )|
0,10 n1 + n2
1, 22
n1 n2
0,05 n1 + n2
1, 36
n1 n2
0,025 n1 + n2
1, 48
n1 n2
0,01 n1 + n2
1, 63
n1 n2
0,005 n1 + n2
1, 73
n1 n2
0,001 n1 + n2
1, 95
n1 n2

Fontes: Adaptado de Smirnov, N. Table for estimating the goodness of fit of empirical distribuition. Annals of Mathematical
Statistics 18, 1948:280-281. In: Cooper, D. R.; Schindler, P. S. Métodos de pesquisa em administração. 7. ed. Porto Alegre:
Bookman, 2003:599 – Apêndice F – Tabela F7.
Tabelas estatísticas selecionadas 477

Tabela 11  Valores de U no teste Mann-Whitney para n2 de 3 a 8


a) Para n2 = 3.
n1
U 1 2 3

0 0,250 0,100 0,050


1 0,500 0,200 0,100
2 0,750 0,400 0,200
3 0,600 0,350
4 0,500
5 0,650

b) Para n2 = 4.
n1
U 1 2 3 4

0 0,200 0,067 0,028 0,014


1 0,400 0,133 0,057 0,029
2 0,600 0,267 0,114 0,057
3 0,400 0,200 0,100
4 0,600 0,314 0,171
5 0,429 0,243
6 0,571 0,343
7 0,443
8 0,557

c) Para n2 = 5.
n1
U 1 2 3 4 5

0 0,167 0,047 0,018 0,008 0,004


1 0,333 0,095 0,036 0,016 0,008
2 0,500 0,190 0,071 0,032 0,016
3 0,667 0,286 0,125 0,056 0,028
4 0,429 0,196 0,095 0,048
5 0,571 0,286 0,143 0,075
6 0,393 0,206 0,111
7 0,500 0,278 0,155
8 0,607 0,365 0,210
9 0,452 0,274
10 0,548 0,345
11 0,421
12 0,500
13 0,579

d) Para n2 = 6.
n1
U 1 2 3 4 5 6
0 0,143 0,036 0,012 0,005 0,002 0,001
1 0,286 0,071 0,024 0,010 0,004 0,002
2 0,428 0,143 0,048 0,019 0,009 0,004
3 0,571 0,214 0,083 0,033 0,015 0,008
(Continua)
478 Pesquisa de Marketing

Tabela 11  Valores de U no teste Mann-Whitney para n2 de 3 a 8 (cont.)


n1
U 1 2 3 4 5 6 7
4 0,321 0,131 0,057 0,026 0,013
5 0,429 0,190 0,086 0,041 0,021
6 0,571 0,274 0,129 0,063 0,032
7 0,357 0,176 0,089 0,047
8 0,452 0,238 0,123 0,066
9 0,548 0,305 0,165 0,090
10 0,381 0,214 0,120
11 0,457 0,268 0,155
12 0,545 0,331 0,197
13 0,396 0,242
14 0,465 0,294
15 0,535 0,350
16 0,409
17 0,469
18 0,531

e) Para n2 = 7.
n1
U 1 2 3 4 5 6 7
0 0,125 0,028 0,008 0,003 0,001 0,001 0,000
1 0,250 0,056 0,017 0,006 0,003 0,001 0,001
2 0,375 0,111 0,033 0,012 0,005 0,002 0,001
3 0,500 0,167 0,058 0,021 0,009 0,004 0,002
4 0,625 0,250 0,092 0,036 0,015 0,007 0,003
5 0,333 0,133 0,055 0,024 0,011 0,006
6 0,444 0,192 0,082 0,037 0,017 0,009
7 0,556 0,258 0,115 0,053 0,026 0,013
8 0,333 0,158 0,074 0,037 0,019
9 0,417 0,206 0,101 0,051 0,027
10 0,500 0,264 0,134 0,069 0,036
11 0,583 0,324 0,172 0,090 0,049
12 0,394 0,216 0,117 0,064
13 0,464 0,265 0,147 0,082
14 0,538 0,319 0,183 0,104
15 0,378 0,223 0,130
16 0,438 0,267 0,159
17 0,500 0,314 0,191
18 0,562 0,365 0,228
19 0,418 0,267
20 0,473 0,310
21 0,527 0,355
22 0,402
23 0,451
24 0,500
25 0,549

f) Para n2  = 8.
Tabelas estatísticas selecionadas 479

n1
U 1 2 3 4 5 6 7 8 t Normal

0 0,111 0,022 0,006 0,002 0,001 0,000 0,000 0,000 3,308 0,001
1 0,222 0,044 0,012 0,004 0,002 0,001 0,000 0,000 3,203 0,001
2 0,333 0,089 0,024 0,008 0,003 0,001 0,001 0,000 3,098 0,001
3 0,444 0,133 0,042 0,014 0,005 0,002 0,001 0,001 2,993 0,001
4 0,556 0,200 0,067 0,024 0,009 0,004 0,002 0,001 2,888 0,002
5 0,267 0,097 0,036 0,015 0,006 0,003 0,001 2,783 0,003
6 0,356 0,139 0,055 0,023 0,010 0,005 0,002 2,678 0,004
7 0,444 0,188 0,077 0,033 0,015 0,007 0,003 2,573 0,005
8 0,556 0,248 0,107 0,047 0,021 0,010 0,005 2,468 0,007
9 0,315 0,141 0,064 0,030 0,014 0,007 2,363 0,009
10 0,387 0,184 0,085 0,041 0,020 0,010 2,258 0,012
11 0,461 0,230 0,111 0,054 0,027 0,014 2,153 0,016
12 0,539 0,285 0,142 0,071 0,036 0,019 2,048 0,020
13 0,341 0,177 0,091 0,047 0,025 1,943 0,026
14 0,404 0,217 0,114 0,060 0,032 1,838 0,033
15 0,467 0,262 0,141 0,076 0,041 1,733 0,041
16 0,533 0,311 0,172 0,095 0,052 1,628 0,052
17 0,362 0,207 0,116 0,065 1,523 0,064
18 0,416 0,245 0,140 0,080 1,418 0,078
19 0,472 0,286 0,168 0,097 1,313 0,094
20 0,528 0,331 0,198 0,117 1,208 0,113
21 0,377 0,232 0,139 1,102 0,135
22 0,426 0,268 0,164 0,998 0,159
23 0,475 0,306 0,191 0,893 0,185
24 0,525 0,347 0,221 0,788 0,215
25 0,389 0,253 0,683 0,247
26 0,433 0,287 0,578 0,282
27 0,478 0,323 0,473 0,318
28 0,522 0,360 0,368 0,356
29 0,399 0,263 0,396
30 0,439 0,158 0,437
31 0,480 0,052 0,481
32 0,520
Fontes: Reproduzido de Mann, H. B.; Whitney, D. R. On a test of whether one of two random variables is stochas-
tically larger than the other. Ann. Math. Statist., 18, 1947:52-54. In: Siegel, S. Estatística não paramétrica para ciências do
comportamento. São Paulo: McGraw-Hill, 1981:302-304 – Apêndice – Tábua J.
480 Pesquisa de Marketing

Tabela 12  Valores críticos de U no teste Mann-Whitney para n2 > 8


a) Teste unicaudal para a = 0,025 ou teste bicaudal para a = 0,05.
n2
n1 9 10 11 12 13 14 15 16 17 18 19 20

1
2 0 0 0 1 1 1 1 1 2 2 2 2
3 2 3 3 4 4 5 5 6 6 7 7 8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 16 17 19 21 22 24 25 27
7 12 14 16 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 66 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
16 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 65 72 78 85 92 99 106 113 119
20 48 55 62 69 76 83 90 98 105 112 119 127

b) Teste unicaudal para a = 0,05 ou teste bicaudal para a = 0,10.


n2
n1 9 10 11 12 13 14 15 16 17 18 19 20

1 0 0
2 1 1 1 2 2 2 3 3 3 4 4 4
3 3 4 5 5 6 7 7 8 9 9 10 11
4 6 7 8 9 10 11 12 14 15 16 17 18
5 9 11 12 13 15 16 18 19 20 22 23 25
6 12 14 16 17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 26 28 31 33 36 39 41 44 47
9 21 24 27 30 33 36 39 42 45 48 51 54
10 24 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 57 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37 42 47 51 56 61 65 70 75 80 84
14 36 41 46 51 56 61 66 71 77 82 87 92
15 39 44 50 55 61 66 72 77 83 88 94 100
16 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 94 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138
Fontes: Resumido de Auble, D. Extended Tables from the Mann-Whitney Statistic. Bulletin of the Institute of Educational
Research at Indiana University 1. n. 2. In: Cooper, D. R.; Schindler, P. S. Métodos de pesquisa em administração. 7. ed. Porto
Alegre: Bookman, 2003:600 – Apêndice F – Tabela F8.
Tabelas estatísticas selecionadas 481

Tabela 13  Valores de Rs no coeficiente de correlação de postos de Spearman


Nível de significância a (unicaudal)
N 0,05 0,01
4 1,000
5 0,900 1,000
6 0,829 0,943
7 0,714 0,893
8 0,643 0,833
9 0,600 0,783
10 0,564 0,746
12 0,506 0,712
14 0,456 0,645
16 0,425 0,601
18 0,399 0,564
20 0,377 0,534
22 0,359 0,508
24 0,343 0,485
26 0,329 0,465
28 0,317 0,448
30 0,306 0,432
Fontes: Adaptado de Olds, E. G. Distributions of sums of squares of rank differences for small numbers of individuals.
Ann. Math. Statist., 9, 1938:133-148; Olds E. G. The 5% significance levels for sums of squares of ranks differences and a
correction. Ann. Math. Statist., 20, 1949:117-118. In: Siegel, S. Estatística não paramétrica para ciências do comportamento.
São Paulo: McGraw-Hill, 1981:315 – Apêndice – Tábua P.

REFERÊNCIAS
AUBLE, D. Extended Tables from the Mann-Whitney Statistic. Bulletin of the Institute of
Educational Research at Indiana University 1. n. 2. In: COOPER, D. R.; SCHINDLER, P. S.
Métodos de pesquisa em Administração. 7. ed. p. 600 – Apêndice F – Tabela F8. Porto Alegre:
Bookman, 2003.
DANIEL, W. W. Essentials of business statistics. Boston: Houghton Mifflin Co, 1984.
EVRARD,Yves; PRAS, Bernard; ROUX, Elyette; CHOFFRAY, Jean-Marie; DUSSAIX, Anne-
Marie. Market études et recherches en marketing – Fondements méthodes. Éditions Nathan, 1993.
FRIEDMAN, M. A comparison of alternative tests of significance for the problem of rankings. Ann. Math.
Statist. 1940. In: SIEGEL, S. Estatística não paramétrica para ciências do comportamento. São Paulo:
McGraw-Hill, 1981.
GOODMAN, I. A. Kolmogorov-Smirnov Tests for Psychological Research. Psychological Bulletin,
1951.
KENDALL, M. G. Rank correlation methods. London: Charles Griffin & Company, Ltd. 1948. In:
SIEGEL, S. Estatística não paramétrica para ciências do comportamento. São Paulo: McGraw-Hill,
1981.
MALHOTRA, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3. ed. Porto Alegre:
Bookman, 2001.
MANN, H. B.;WHITNEY, D. R. On a test of whether one of two random variables is stochastically larger
than the other. Ann. Math. Statist. 1947. In: SIEGEL, S. Estatística não paramétrica para ciências do
comportamento. São Paulo: McGraw-Hill, 1981.
OLDS, E. G. The 5% significance levels for sums of squares of ranks differences and a correction. Ann.
Math. Statist., 1949. In: Siegel, S. Estatística não paramétrica para ciências do comportamento. São
Paulo: McGraw-Hill, 1981.
482 Pesquisa de Marketing

OLDS, E. G. Distributions of sums of squares of rank differences for small numbers of individuals. Ann.
Math. Statist., 1938.
SIEGEL, S. Estatística não paramétrica para ciências do comportamento. São Paulo: McGraw-Hill, 1981.
SMIRNOV, N. Table for estimating the goodness of fit of empirical distribuition. Annals of Mathematical
Statistics, 1948. In: COOPER, D. R.; SCHINDLER, P. S. Métodos de pesquisa em Administração.
7. ed. Porto Alegre: Bookman, 2003.
WILCOXON, F. Some rapid approximate statistical procedures. New York: Americam Cyanamid
Company, 1949. In: COOPER, D. R.; SCHINDLER, P. S. Métodos de pesquisa em adminis-
tração. 7. ed. Porto Alegre: Bookman, 2003.

Você também pode gostar