Você está na página 1de 46
FACULDADE PITÁGORAS UBERLÂNDIA

FACULDADE PITÁGORAS UBERLÂNDIA

Pesquisa de Mercado

Prof. Samir Rodrigues Mansour

Sumário

Capítulo 1 O que é pesquisa de marketing

3

1.1. Conceito de pesquisa de marketing

3

1.2. Tipos de pesquisa

5

1.3. O processo de pesquisa de marketing

7

Capítulo 2 Tipos, fontes e forma de coleta de dados

9

2.1. Dados primários e secundários e suas fontes

9

2.2. Métodos de coleta de dados primários

10

Capítulo 3 Medidas e instrumentos de coleta de dados

12

3.1. Escalas e medidas

12

3.2. Instrumentos de coleta

14

Capítulo 4 Amostragem

14

4.1. Fundamentos

15

4.2. Processo de amostragem

16

4.2.1. Conceitos sobre amostragem

17

4.2.2. Tipos de amostragem

17

4.2.3. Determinação do tamanho da amostra

19

Capítulo 5 Coleta e processamento dos dados

21

5.1. Coleta de dados

21

5.2. Processamento de dados

22

Capítulo 6 Análise dos dados

24

6.1. Escolha do método de análise

24

6.2. Métodos descritivos

25

6.3. Distribuição normal de probabilidade

27

6.4. Métodos inferenciais

28

6.4.1. Testes da média para uma amostra variável intervalar

31

6.4.2. Testes da proporção para uma amostra variável intervalar

36

6.4.3. Testes da diferença entre médias para duas amostras não-relacionadas variável intervalar

37

6.4.4. Testes para uma amostra variável nominal

40

6.4.5. Teste para duas amostras não-relacionadas variável nominal

42

Capítulo 7 Comunicação dos resultados da pesquisa

45

7.1. Elaboração do relatório da pesquisa

45

7.2. Apresentação dos resultados

45

Bibliografia

46

Capítulo 1 O que é pesquisa de marketing

Historicamente, o crescimento e desenvolvimento da Estatística Moderna podem ser relacionados a três fenômenos isolados: a necessidade do governo de coletar dados sobre os cidadãos, o desenvolvimento da teoria da probabilidade e o advento da informática. Durante as civilizações egípcia, grega e romana, os dados eram obtidos principalmente com o objetivo de recolher impostos e para o recenseamento militar. Na Idade Média, as instituições religiosas freqüentemente mantinham registros relativos a nascimentos, mortes e casamentos. A crescente necessidade dos censos ajudou a incentivar o desenvolvimento de equipamentos de tabulação no início do século XX, o que levou ao desenvolvimento de computadores. Esses progressos alteraram profundamente o campo da Estatística nos últimos 30 anos. Embora os programas de Estatística e de planilhas de cálculo tenham tornado possível até mesmo a análise mais sofisticada, surgem problemas quando usuários não-especializados em Estatística, que não compreendem os pressupostos dos procedimentos ou as limitações dos resultados obtidos, se enganam com os resultados estatísticos fornecidos por esses programas. Para o planejamento e controle da atividade do marketing, é essencial a disponibilidade de informações, além de sua confiabilidade e de sua correta interpretação e utilização. São exemplos de informações relevantes para um bom planejamento estratégico: análise do perfil do consumidor (seus desejos, necessidades, grau de satisfação, comportamento de compra), das ações dos concorrentes, da evolução do mercado, das capacitações e recursos disponíveis na empresa, da evolução nas vendas, lucros e participação no mercado por produtos e mercados, da interação com fornecedores e outros públicos como imprensa e governo, análise das tendências e expectativas em relação ao ramo de atividade e de inúmeras variáveis ambientais que afetam o marketing da empresa.

1.1. Conceito de pesquisa de marketing

PESQUISA DE MARKETING é a investigação de dados para descobrir e/ou descrever a existência de certos aspectos mercadológicos e determinar a relação entre eles, ou é a função que liga o consumidor, o cliente e o público ao marketing através da informação. A informação é usada para:

identificar e definir oportunidades e problemas de marketing;

gerar, refinar e avaliar a ação de marketing;

monitorar o desempenho de marketing;

aperfeiçoar o entendimento de marketing como um processo e;

reduzir a incerteza no processo decisório. Dessa forma a Pesquisa de Marketing:

especifica a informação necessária destinada a estes fins; RECONHECIMENTO E FORMULAÇÃO DO PROBLEMA DE PESQUISA

projeta o método para coletar informações; PLANEJAMENTO DA PESQUISA

gerencia e implementa o processo de coleta de dados; EXECUÇÃO DA PESQUISA

analisa os resultados e comunica os achados e suas implicações.

EXECUÇÃO DA PESQUISA

COMUNICAÇÃO DOS RESULTADOS

Existe uma diferenciação entre pesquisa de mercado e pesquisa de marketing. Enquanto a pesquisa de mercado tem foco na coleta e análise de informações externas à empresa, a pesquisa de marketing é mais ampla, pois envolve dados relacionados a qualquer atividade de marketing da empresa, incluindo os elementos da pesquisa de mercado. A pesquisa de marketing é importante, por exemplo, no diagnóstico do processo de decisão de compra do público-alvo, no conhecimento e avaliação de componentes de atitudes junto a públicos de interesse da empresa.

Tipos de atividades de pesquisa de marketing desenvolvidas pelas empresas:

A Economia de negócios e pesquisa corporativa

1. Características e tendências da indústria/mercado

2. Estudos para aquisições/diversificações

3. Análises da participação no mercado

4. Estudos internos dos recursos humanos

B Estabelecimento de preços

1. Análise de custos

2. Análise de lucros

3. Elasticidade de preços

4. Análise de demanda: potenciais de mercado, potenciais de vendas, previsões de vendas

5. Análises dos preços da concorrência

C Produto

1. Desenvolvimento e teste de conceitos

2. Geração e teste de marcas

3. Testes de mercado

4. Testes de produtos existentes

5. Estudos de embalagens

6. Estudos de produtos concorrentes

D Distribuição

1. Estudos para localização de fábricas/armazéns

2. Estudos sobre o desempenho dos canais

3. Estudos sobre a cobertura dos canais

4. Estudos internacionais e de exportação

E Promoção

1. Pesquisas de motivação

2. Pesquisas de meios de comunicação

3. Pesquisas sobre a eficácia da propaganda

4. Estudos sobre a propaganda da concorrência

5. Estudos de imagem

6. Estudos sobre a remuneração da força de vendas

7. Estudos de prêmios, cuponagens e amostras grátis

F Comportamento do consumidor

1. Preferências por marcas

2. Atitudes em relação a marcas

3. Satisfação com produtos

4. Comportamentos de compra

5. Intenções de compra

6. Consciência de marca

7. Estudos de segmentação

A pesquisa de marketing não é uma saída imediata ou óbvia para encontrar soluções para

todos os problemas de marketing. Existem alguns fatores que influenciam que a decisão pela pesquisa de marketing seja tomada: relevância, tipo e natureza da informação buscada,

momento, disponibilidade de recursos, análise custo-benefício.

No caso de sua realização ocorrer, um aspecto importante a ser considerado diz respeito à ética na pesquisa. Devem ser consideradas as quatro partes envolvidas num projeto de pesquisa de marketing:

1. o cliente, que patrocina o projeto;

2. o prestador de serviços, que planeja e executa a pesquisa;

3. os pesquisados, que fornecem as informações; e

4. o público, que recebe através de divulgação na mídia os resultados da pesquisa.

Códigos de ética detalhados são elaborados por associações de pesquisa e procuram orientar questões como propósitos implícitos na pesquisa, desonestidade no trato com os fornecedores de serviços, mau uso da informação da pesquisa, violação do sigilo do cliente,

execução imprópria da pesquisa, violação dos direitos do pesquisado.

1.2. Tipos de pesquisa

Existem diferentes classificações dos tipos de pesquisa, adotadas por diversos autores. Mattar considera o objetivo e o grau em que o problema de pesquisa está cristalizado e, a seguir, a natureza do relacionamento entre as variáveis estudadas, resultando na seguinte classificação:

- Pesquisas exploratórias; - Pesquisas conclusivas: descritivas ou causais.

PESQUISA EXPLORATÓRIA

É indicada para o início do processo de pesquisa, quando ainda se tem pouco ou nenhum

conhecimento sobre o problema a ser pesquisado. Através da pesquisa exploratória o pesquisador poderá desenvolver hipóteses e questões que o ajudarão até mesmo a estabelecer melhor o problema de pesquisa ou prioridades a pesquisar.

A pesquisa exploratória pode ainda ser usada para clarificar conceitos, de modo que os

mesmos sejam passíveis de mensuração.

Objetivos:

elevar o conhecimento, a compreensão e a familiaridade do pesquisador com o problema de pesquisa que se pretende investigar;

melhorar o nível de precisão da formulação do problema de pesquisa;

acumular antecipadamente informações disponíveis relacionadas a um problema de pesquisa conclusiva a ser realizada ou em andamento;

auxiliar no desenvolvimento ou criação de hipóteses explicativas de fatos que serão verificados numa pesquisa causal;

ajudar no desenvolvimento de questões de pesquisa relevantes para o objetivo

estabelecido;

determinar variáveis relevantes a serem consideradas num problema de pesquisa;

esclarecer conceitos;

auxiliar a delinear o projeto final da pesquisa;

verificar a existência e disponibilidade de pesquisas semelhantes, os métodos utilizados e resultados obtidos;

estabelecer prioridades para futuras pesquisas.

Métodos:

Levantamentos em fontes secundárias bibliográficos envolvem procura de informações em livros, revistas, teses, jornais e outros / documentais compreendem pesquisa em

registros da própria empresa ou arquivos públicos / estatísticos dizem respeito às diversas fontes estatísticas (IBGE, FIPE, etc) de dados que podem ajudar no delineamento do problema de pesquisa / pesquisas já efetuadas englobam informações analisadas e disponibilizadas de empresas de pesquisas, universidades, entre outras / levantamentos de experiências consistem na entrevista de profissionais com grande experiência no assunto que se pretende pesquisar. Estudos de casos selecionados envolvem o estudo de registros existentes, a observação

da ocorrência do fato, entrevistas e etc., com o objetivo de caracterizar e explicar

detalhadamente os aspectos do caso em perspectiva. Observação informal é desenvolvida no cotidiano do pesquisador e depende

imensamente de sua capacidade de percepção e seus interesses individuais.

PESQUISA DESCRITIVA

A pesquisa descritiva exige que o pesquisador possua profundo conhecimento do

problema a ser estudado, ele deve saber exatamente o que pretende. Este tipo de pesquisa é direcionado para a solução do problema propriamente dito, ou ainda, para a avaliação de alternativas de cursos de ação. O pesquisador precisa saber exatamente o que quer extrair da pesquisa: o que deseja medir, como, quando, onde e por que deverá fazê-lo.

Objetivos: descrever características de grupos; estimar proporção de elementos numa população que tenham determinadas características ou comportamentos; verificar existência de relação entre variáveis.

Tipos de pesquisa descritiva:

1. Levantamentos de campo muito amplo e pouco profundo, utilizado para se obter dados representativos (em relação ao número de casos incluídos) da população de interesse.

Demanda maiores custos e tempo e requer grande conhecimento técnico.

2. Estudos de campo medianamente amplos e profundos, utilizados quando se deseja conhecer o inter-relacionamento entre as diversas variáveis que ocasionam um fenômeno

ou quando for difícil entender o fenômeno sem este inter-relacionamento.

3. Pesquisas ocasionais (ou transversais) são os mais conhecidos e usados projetos de pesquisa descritiva, caracterizados pelo uso de uma amostra de elementos de determinada população que se deseja pesquisar, em que é feita a medida uma única vez no tempo e com um objetivo específico.

4. Pesquisas evolutivas (ou longitudinais) baseiam-se na coleta e análise periódica das mesmas variáveis, permitindo seu acompanhamento evolutivo no tempo. Se a amostra for sempre a mesma, a pesquisa evolutiva é chamada de Painel.

Métodos da pesquisa descritiva: entrevistas pessoais, por telefone, fax ou internet / questionários pessoais, pelo correio e outros / observação.

PESQUISA CAUSAL O senso comum que se faz de causalidade diz que um determinado fato (causa) pode explicar completamente outro (efeito). O pesquisador científico coloca a relação de causalidade em termos probabilísticos, ou seja, para um efeito pode haver inúmeras causas. A pesquisa causal vai estudar esta relação de causalidade através da identificação e observação

de determinados fenômenos e como podem influenciar a ocorrência de um efeito que se deseja medir.

Objetivo: determinar as relações de causa e efeito entre as variáveis de decisão de marketing.

Projetos experimentais

Antes-depois sem grupo de controle neste projeto é constituída uma unidade de teste (probabilisticamente) e é realizada uma medida antes e uma depois da exposição ao tratamento (experimento).

Apenas depois com um grupo de controle este tipo de projeto experimental apresenta maior validade, pois são constituídas duas unidades de teste, uma como grupo experimental e uma como grupo de controle, onde podem ser medidos os efeitos das variáveis estranhas. A medida é efetuada apenas depois da exposição ao tratamento.

Antes-depois com um grupo de controle semelhante ao projeto anterior, com a vantagem de serem efetuadas medidas antes e depois da exposição do grupo experimental ao tratamento.

Projetos quase experimentais: diferem dos projetos experimentais pela impossibilidade de controlar a exposição ao tratamento e de projetar as unidade de teste de forma probabilística.

Séries de tempo é definida uma unidade de teste sobre a qual são efetuadas, periodicamente, na variável dependente, várias medidas antes e várias depois da exposição

ao tratamento.

Séries de tempo com grupo de controle análogo ao projeto séries de tempo, com a vantagem da existência do grupo de controle.

TESTE DE MARKETING

O teste de marketing diz respeito à implantação e controle de um plano de marketing

numa pequena parte do mercado geográfico que se pretende atingir com determinado produto

ou serviço. Como o teste de marketing é uma ferramenta de custo bastante elevado, a empresa deve ponderar muito bem o custo-benefício de seu uso, analisando fatores como:

comparar o custo e o risco do insucesso com a lucratividade e a probabilidade de sucesso (produtos de baixo custo e baixo risco não precisam ser testados);

considerar os investimentos necessários para fazer o lançamento nacional e o lançamento

na região teste;

considerar os efeitos de um fracasso em nível nacional para a empresa (em termos de queda da imagem e prestígio da empresa, desgaste interno e externo e dificuldades para lançamentos futuros de novos produtos), se os efeitos forem muito drásticos o teste deverá ser realizado. Os objetivos principais do teste de marketing são: treinamento gerencial; efetuar previsões de vendas e ajustar as variáveis de produto (4 P’s) da empresa.

1.3. O processo de pesquisa de marketing

Um processo de pesquisa de marketing compreende quatro diferentes etapas, que estão interligadas, e, na verdade, formam um processo cíclico:

1)

Reconhecimento e formulação do problema de pesquisa

Exploração inicial do tema;

2)

Formulação, determinação ou constatação de um problema de pesquisa. Planejamento da pesquisa

Definição dos objetivos da pesquisa;

Estabelecimento das questões de pesquisa e (ou) formulação de hipóteses;

Estabelecimento das necessidades de dados e definição das variáveis e de seus indicadores;

Determinação das fontes de dados;

Determinação da metodologia

o

Determinação do tipo de pesquisa;

o

Determinação de métodos e técnicas de coleta dos dados;

o

Determinação da população de pesquisa, do tamanho da amostra e do processo de amostragem;

o

Planejamento da coleta de dados;

o

Previsão do processamento e análise dos dados.

Planejamento da organização, cronograma e orçamento;

Redação do projeto de pesquisa.

3)

Execução da pesquisa

Preparação de campo

o

Construção, pré-teste e reformulação dos instrumentos de pesquisa;

o

Impressão dos instrumentos;

o

Formulação da equipe de campo;

o

Distribuição do trabalho no campo.

Campo

o

Coleta de dados;

o

Conferência, verificação e correção dos dados.

Processamento e análise

o

Digitação;

o

Processamento;

o

Análises e interpretação, com intenso uso de estatística e computadores;

4)

Conclusões e recomendações. Comunicação dos resultados

o

Elaboração e entrega dos relatórios de pesquisa;

Preparação e apresentação oral dos resultados.

RECONHECIMENTO E FORMULAÇÃO DE UM PROBLEMA DE PESQUISA O interesse prático em pesquisa de marketing tem início com alguma indagação vivida pela administração de marketing da empresa, e para a qual é necessário encontrar respostas ou orientações para fundamentar a tomada de decisões. Estas indagações podem ter origem em um fato-problema constatado, numa dúvida quanto ao melhor curso de ação a ser tomado dentre vários possíveis, numa dúvida quanto ao comportamento presente ou futuro de determinadas variáveis de marketing, ou ainda num simples interesse em conhecer, de maneira mais aprofundada, determinados aspectos do mercado ou da atividade mercadológica. Para a elaboração do problema de pesquisa, inicialmente algumas tarefas podem auxiliar, como discussões com os responsáveis pelas decisões, entrevistas com peritos ou pessoas bem informadas, análise de dados secundários e, às vezes, pesquisa qualitativa. Além disso, também é importante conhecer o contexto ambiental do problema, incluindo informações passadas e previsões relativas ao setor e à empresa; recursos e restrições da empresa; objetivos do responsável pelas decisões; comportamento dos compradores; ambiente legal; ambiente econômico e as qualificações mercadológicas e tecnológicas da empresa.

A partir dessas tarefas iniciais, identificada uma situação de decisão em que a pesquisa de marketing pode colaborar, o pesquisador formula o problema de pesquisa, com um enunciado geral. Assim, definir o problema de pesquisa significa entender e explicitar quais os problemas ou oportunidades de marketing que geram a necessidade de informação para tomada de decisão.

PLANEJAMENTO DA PESQUISA

DEFINIÇÃO DOS OBJETIVOS DA PESQUISA

A definição do objetivo da pesquisa deve estar perfeitamente amarrada à solução do

problema de pesquisa, e a ele deve estar restrita. O pesquisador, para fazer a elaboração correta dos objetivos da pesquisa, deve se perguntar quais informações são necessárias para resolver o problema de pesquisa. Para sua formulação, devem ser considerados o tempo e recursos disponíveis, a acessibilidade aos detentores dos dados e disponibilidade de meios de captação dos dados. Às vezes, aproveitando os recursos que serão dispendidos na pesquisa, outros objetivos mais ou menos relacionados com o objetivo principal da pesquisa podem ser formulados.

ESTABELECIMENTO DAS QUESTÕES DE PESQUISA E (OU) FORMULAÇÃO DE HIPÓTESES As questões de pesquisa são indagações amplas que, para serem respondidas, vão exigir a colocação de um conjunto de perguntas específicas no questionário. Quando a pesquisa se trata da verificação de relações de causa e efeito entre variáveis, surge a necessidade do estabelecimento de hipóteses ou proposições de pesquisa. Elas são afirmações ou proposições não comprovadas a respeito de um fator ou fenômeno que é de interesse do pesquisador. Com freqüência, uma hipótese é uma possível resposta a uma das questões de pesquisa.

ESTABELECIMENTO DAS NECESSIDADES DE DADOS E DEFINIÇÃO DAS VARIÁVEIS E DE SEUS INDICADORES

A partir dos objetivos, questões e hipóteses da pesquisa, é possível estabelecer quais

dados serão necessários coletar, que definirão as variáveis da pesquisa. Algumas variáveis, as simples, são extremamente fáceis de serem identificadas e medidas: idade, altura, peso, sexo, escolaridade.

Já as variáveis chamadas complexas não são passíveis de medição direta, sendo preciso

identificar um conjunto de indicadores cuja variabilidade conjunta fornecerá medidas da variável complexa que se pretende medir: nível socioeconômico, cujos indicadores podem ser nível de escolaridade, atividade profissional, posse de bens, renda, local e tamanho da moradia.

Capítulo 2 Tipos, fontes e forma de coleta de dados

2.1. Dados primários e secundários e suas fontes

Os DADOS PRIMÁRIOS são gerados por um pesquisador para a finalidade específica de solucionar o problema em pauta. A coleta de dados primários envolve todas as etapas do processo de pesquisa de marketing definidas anteriormente. As fontes básicas de dados

primários são: o próprio pesquisado, pessoas que tenham informações sobre o pesquisado e situações similares (estudos de caso, experimentos ou simulações). Os DADOS SECUNDÁRIOS já foram coletados para objetivos que não os do problema em pauta. As fontes básicas de dados secundários são: a própria empresa que encomendou a pesquisa (secundários internos), publicações (revistas, jornais, publicações governamentais ou não), governos, instituições não-governamentais (universidades, faculdades, centros de pesquisa, associações, sindicatos) e serviços padronizados de informações de marketing (dados do consumidor, do varejo, do atacado, da indústria e dos veículos de comunicação). As principais vantagens e desvantagens da utilização de dados secundários estão apresentadas no quadro abaixo:

DADOS SECUNDÁRIOS

VANTAGENS

DESVANTAGENS

Poupam tempo, esforços e dinheiro.

Muito raramente apresentam adequação precisa às necessidades da pesquisa.

Ajuda a estabelecer melhor o problema de pesquisa.

Intervalos de classe diferentes.

Fonte de sugestão de métodos testados e aprovados de coleta.

Tempo decorrido entre a coleta de dados e a publicação.

Fonte de sugestão de outros tipos dados.

Confiabilidade em relação aos propósitos da pesquisa.

Fonte comparativa e complementar para os dados primários.

 

Os dados primários geralmente coletados podem ser categorizados nos seguintes tipos:

- Características demográficas, socioeconômicas e de estilo de vida;

- Atitudes e opiniões;

- Conscientização e conhecimento;

- Motivações;

- Comportamento;

- Intenções.

2.2. Métodos de coleta de dados primários

Existem

dois

observação.

meio

básicos

de

obtenção

MÉTODO DA COMUNICAÇÃO

de

dados

primários:

a

comunicação

e

a

Consiste no questionamento, oral ou escrito, dos respondentes para a obtenção do dado desejado, que será fornecido por declaração, verbal ou escrita, do próprio. Quanto ao grau de estruturação (perguntas e respostas estruturadas) e disfarce (transparência ao respondente sobre os propósitos da pesquisa) do instrumento de coleta de dados, podemos classificar o método da comunicação em:

Estruturado não disfarçado: questionário

Não estruturado não disfarçado: entrevista focalizada de grupo (ou pesquisa da motivação); entrevista focalizada individual (ou entrevista em profundidade)

Não estruturado disfarçado (técnicas projetivas): contar estórias; interpretação de papéis; completar histórias; associação de palavras; hierarquização de palavras

Estruturado disfarçado (tentam associar as vantagens das técnicas projetivas com as facilidades das técnicas estruturadas não disfarçadas): pouquíssimo utilizado em Pesquisa de Marketing pela dificuldade de aplicação e subjetividade de interpretação.

Quanto à forma de aplicação, o método da comunicação compreende:

Entrevista (pessoal / por telefone)

Questionários autopreenchíveis: pessoalmente; correio / fax / Internet; jornais /

revistas; acompanhando o produto; colocado à disposição.

MÉTODO DA OBSERVAÇÃO

Consiste no registro de comportamentos, fatos e ações relacionados com o objetivo da pesquisa, sem que haja comunicação com os pesquisados e não envolve questionamentos e respostas, verbais ou escritas.

Quanto ao grau de estruturação:

Observação estruturada: pesquisa em que problemas e objetivos estão claramente definidos. Utilizada para pesquisas descritivas ou causais.

Observação não estruturado: pesquisa em que problemas e objetivos NÃO estão claramente definidos. Necessidade de grande flexibilidade. Utilizada para pesquisas exploratórias.

Quanto ao grau de disfarce

Observação disfarçada: quando o fato da observação pode induzir a comportamento anormal.

Observação não disfarçada: quando o fato observado não envolve comportamentos ou este não for influenciado ou por restrições éticas e legais.

Quanto aos instrumentos utilizados

Observação humana

Observação por instrumentos (câmeras fotográficas / tv, audímetros, gravadores de som, leitura ótica, psicogalvanômetro, câmera de movimento dos olhos, pupilômetro, people meter ou smart sense, notebooks / palmtops / coletadores eletrônicos de dados, smart card)

Quanto ao ambiente

Observação natural

Observação de laboratório

Quanto ao objeto observado

Observação direta (no momento da ocorrência)

Observação indireta (registros deixados por comportamentos ou fatos passados)

As principais vantagens e desvantagens dos métodos da comunicação e da observação estão apresentadas no quadro a seguir:

MÉTODO

VANTAGENS

DESVANTAGENS

Comunicação

Mais versátil. Mais rápido. Menor custo. Pode ser usado para obter a grande maioria de tipos de dados.

Depende da boa vontade dos respondentes. Depende de o respondente dispor ou lembrar do dado solicitado. Depende da sinceridade dos respondentes. O instrumento de coleta ou a forma de coleta pode influenciar as respostas.

Observação

Independe da boa vontade dos respondentes. Não há influência do processo nas respostas. Certos dados só podem ser obtidos por este método. Independe da sinceridade dos respondentes. Independe de o respondente dispor ou lembrar do dado necessário. É mais preciso.

Menos versátil. Menos rápido. Maior custo. Dados coletados são de interpretação mais difícil. Não pode ser utilizado para obter dados de situações íntimas. Só pode ser usado para obter dados exteriorizados através de comportamentos.

Capítulo 3 Medidas e instrumentos de coleta de dados

3.1. Escalas e medidas

Na sua essência, a atividade de pesquisa de marketing é realizar medições, como por exemplo: medir a quantidade de consumidores que preferem um produto a outro, descrever

através de medidas quem são os consumidores de determinado produto em relação a características demográficas, socioeconômicas e psicológicas, medir qual o potencial de mercado para determinado produto, medir atitudes, comportamentos, percepções etc.

O processo de medição consiste em associar números a um objeto que, segundo uma

regra estabelecida, passam a representar as quantidades de suas características ou atributos. Segundo esse conceito, nós não medimos o objeto em si, e sim as suas características ou atributos. Também está implícito, segundo essa definição, que não podemos utilizar todas as características do sistema numérico na análise dos dados obtidos, mas restringi-las à regra que foi estabelecida.

O sistema numérico de 0 a 9 possui quatro características básicas:

1. Identidade: cada número na série é único, ou seja, representa uma quantidade

diferente.

2. Ordenação: existe uma convenção estabelecendo o ordenamento dos números, e é

através dela que sabemos que 4 < 7 e que 9 > 7, por exemplo.

3. Comparação de intervalos: há um intervalo homogêneo entre cada número na

seqüência, de forma que podemos afirmar que o intervalo entre 3 e 5 é igual ao intervalo entre 7 e 9 e entre 1 e 3, assim como podemos afirmar que 8 é duas vezes maior que 4 e que 6 é três vezes maior que 2.

4. Comparação entre proporções: podemos definir iguais proporções, como por

exemplo 8/4 = 6/3 = 4/2.

A utilização da matemática ou estatística na manipulação de números envolve o uso de

uma ou mais dessas características do sistema numérico. Para se evitar o problema de usarmos as características do sistema numérico, ao invés de usarmos as características que a realidade dos dados coletados permite, é importante definir quais destas quatro características estão presentes no fenômeno de marketing em estudo, que vão condicionar o uso das escalas e as análises estatísticas que podem ser feitas. Há quatro tipos de escala de medidas, que dependem da propriedade matemática do sistema numérico que está presente no fenômeno de marketing estudado:

Quadro 1: Características das escalas básicas de medição (Mattar, 1999)

Escala

Característica

Uso em Marketing

Estatísticas possíveis

Nominal

Identidade,

Marcas, sexo, raças,

Moda

Definição única

cores, tipos de lojas,

Porcentagens

de números

regiões, uso/não

Teste binomial

uso, gosta/não gosta

Teste qui-quadrado

McNemar

Cochran Q

Ordinal

Ordem dos

Atitudes,

Medianas

números

preferências,

Separatrizes

opiniões, classes

Teste Mann-Whitney

sociais, ocupações

Teste U

Kruskal Wallis

Correlação de postos

Intervalar

Comparação de

Atitudes, opiniões,

Média

intervalos

conscientização,

Intervalo

preferências,

Amplitude total

números-índices

Variância

Desvio-padrão

Testes z e t

Análise de variância

Correlação de produto-momento

Razão

Comparação de

Idade, preço,

Todos os do item anterior e mais:

medidas

número de

Média geométrica

absolutas,

consumidores,

Média harmônica

Comparação de

volume de vendas,

Coeficiente de variação

proporções

renda, patrimônio

- Escala Nominal: nela, os números servem apenas para nomear, identificar e / ou caracterizar dados sobre pessoas, objetos ou fatos. Exemplos: RG, CPF / CNPJ, marcas, cores, modelos, sexo, tipo de loja, regiões, uso / não uso, gosta / não gosta, ocupação etc. Com escalas nominais, a única operação possível é a contagem (moda).

- Escala Ordinal: os números, além de nomear, identificar e/ou categorizar, servem para ordenar, segundo um processo de comparação, as pessoas, objetos ou fatos, em relação a determinada característica. Exemplo: preferência ordenada por produtos concorrentes. As únicas medidas de tendência central nas escalas ordinais são a moda e a mediana.

- Escala de Intervalo: os intervalos entre os números mostram a posição e quanto as pessoas, objetos ou fatos estão distantes entre si em relação a determinada característica. Ela permite comparar diferenças entre as medições, mas não permite concluir quanto à magnitude absoluta das medições. Exemplo: temperatura, escalas para medir atitudes, opiniões e preferências, números-índices. Nesse caso, é legítimo o cálculo da média aritmética, mediana e moda.

- Escala de Razão: possui as mesmas características da escala de intervalo, com a vantagem de possuir o zero absoluto. Em função disso, é perfeitamente possível comparar as medições absolutas e inferir conclusões sobre quanto uma medida é maior ou menor que as outras. Em pesquisa de marketing, podem ser usadas escalas razão para idade, preços, número de consumidores, número de lojas, quantidade de produtos consumidos, valor das vendas, renda dos consumidores, lucros. Podem ser calculadas nesse caso média aritmética, geométrica, mediana e moda.

3.2. Instrumentos de coleta

O instrumento de coleta de dados é o documento através do qual as perguntas e questões

são apresentadas aos respondentes e onde são registradas as respostas e dados obtidos. Pode

ser um questionário, um formulário para anotação de observações, um roteiro com tópicos a serem seguidos durante uma entrevista de grupo focalizada, etc. Os erros que podem ocorrer numa pesquisa são classificados como amostrais e não- amostrais. Os amostrais ocorrem em função do número de elementos da amostra e do processo de seleção desses elementos. Já os erros amostrais têm diversos motivos e cabe ao

pesquisador ser o mais cuidadoso possível. Algumas das principais fontes desse tipo de erro são instrumentos mal-elaborados, com questões dúbias, escalas incorretas, duvidosas quanto ao seu preenchimento.

Os

principais pontos a se considerar na elaboração do instrumento são:

Listar todos os aspectos importantes e verificar se as perguntas formuladas estão voltadas aos objetivos da pesquisa;

Visar à linguagem do entrevistado;

Simular as possíveis respostas de cada pergunta para verificar se não há ambigüidades ou falta de alternativas.

As

precauções são:

Não fazer perguntas embaraçosas;

Não obrigar o respondente a fazer cálculos;

Não incluir perguntas que remetam a um passado distante;

Não incluir perguntas que já contenham respostas.

O

instrumento mais utilizado é o questionário (estruturado e não-disfarçado), que

geralmente é formado de cinco partes: dados de identificação; solicitação para cooperação; instruções para sua utilização; perguntas, questões e formas de registrar as respostas; e por fim

dados para classificar socioeconomicamente o respondente. Para sua construção, deve-se seguir os seguintes passos:

- determinação dos dados a coletar (sobre a pessoa que responde, a respeito de pessoas conhecidas de quem responde, sobre acontecimentos e condições que a pessoa conhece, razões e motivos para comportamentos e atitudes específicos);

- determinação do instrumento segundo o método de administração (depende do tipo de

pesquisa, tipo de respondente, assunto da pesquisa, disponibilidade de meios e do tipo de

análise e interpretação dos dados coletados);

- redação do rascunho (devem ser tomadas decisões sobre o conteúdo das questões, sua

redação, forma de apresentação da resposta perguntas abertas e fechadas, estas podendo ser

dicotômicas, de múltipla escolha e na forma de escala, seqüência das questões e especificações de uso);

- revisão e pré-testes;

- redação final.

Capítulo 4 Amostragem

O processo intuitivo de amostragem faz parte do dia-a-dia. Qualquer pessoa já teve a

experiência de utilizar amostras nesse sentido amplo. Por exemplo, experimentar uma pequena porção de uma bebida alcoólica para identificá-la como sendo vodca ou conversar com um grupo de quatro estudantes para formar uma opinião sobre sua escola. A amostragem também ocorre quando, diante de uma prateleira com centenas de unidades de um produto, as três primeiras tentativas de escolha resultarem em unidades defeituosas, levando o

consumidor a desconfiar que todo o estoque esteja com problemas. Apesar desses exemplos variarem em sua representatividade, todos são amostras.

A utilização de amostras é grande em atividades comerciais, governamentais, industriais e

científicas, como indicam os exemplos a seguir:

O IBGE seleciona amostras da população brasileira para conduzir periodicamente a PNAD Pesquisa Nacional por Amostragem Domiciliar;

Empresas industriais selecionam amostras de produtos para efetuar o controle de qualidade de suas compras e de sua produção;

Centros de pesquisas econômicas, como FIPE e FGV, selecionam amostras de residências para medir as taxas mensais de inflação e para a realização de estudos econômicos;

Agências de pesquisas de marketing e de opinião pública selecionam amostras da população para realizarem pesquisas eleitorais, medir a eficiência de propaganda, medir a preferência por produtos, medir os índices de audiência de rádio e TV, medir os índices de circulação e leitura de jornais e revistas, etc.;

Laboratórios farmacêuticos utilizam-se de amostras da população para testar a eficácia de novas drogas desenvolvidas ou em desenvolvimento;

Cientistas utilizam-se de amostras para verificar a existência de correlações entre a ocorrência de certas doenças e os usos e costumes em determinadas populações.

4.1. Fundamentos

Uma população pode ser definida como um conjunto de sujeitos que possuem algumas características comuns em relação ao problema de pesquisa. Um pesquisador de marketing está sempre interessado nas características de uma população. Por exemplo, a proporção de pessoas de uma cidade que assistem a determinado programa de TV ou o nível médio de utilização de um parque de diversões. Se todos os elementos da população forem pesquisados, o estudo é chamado censo e as medidas obtidas nesse estudo são chamadas parâmetros (por exemplo, a proporção de espectadores do programa de TV). Por outro lado, pode-se realizar o estudo selecionando-se uma parte da população, chamada de amostra e as medidas obtidas com base nesse subconjunto são chamadas estatísticas. Nesse caso, os pesquisadores procuram fazer uma

inferência sobre o parâmetro da população por meio do conhecimento da estatística relevante da amostra.

O processo de colher amostras de uma população, chamado amostragem, está baseado

em duas premissas. A primeira é que a amostra selecionada seja representativa da população, de tal forma que uns poucos elementos representarão adequadamente as características de toda a população. A segunda é que a discrepância entre os valores das variáveis da população (parâmetros) e os valores dessas variáveis obtidos na amostra (estatísticas) é minimizada, pois, enquanto algumas medições subestimam o valor do parâmetro, outras o superestimam e, desde que a amostra tenha sido adequadamente obtida, as variações nestes valores tendem a se

anular umas às outras, resultando em medidas na amostra que são, geralmente, próximas às medidas da população.

O censo é mais apropriado quando:

a população é pequena (exemplos: empresas da indústria petrolífera, montadoras de veículos);

os dados a respeito da população forem facilmente disponíveis num cadastro ou banco de dados computadorizado (exemplo: clientes de um banco, clientes de operadoras de telefonia);

os requisitos do estudo impõem a obtenção de informações sobre todos os sujeitos da população (exemplos: número de estudantes estrangeiros matriculados em uma universidade, número de portadores de determinada doença numa cidade);

por imposição legal (exemplos: recenseamento da população brasileira feito pelo IBGE a cada dez anos, eleições municipais, estaduais e federais);

os custos de uma decisão incorreta forem altos ou se os erros amostrais forem muitos. A amostragem apresenta muitas vantagens em relação ao censo:

a amostra economiza mão-de-obra e dinheiro.

a amostra economiza tempo e possibilita rapidez na obtenção dos resultados.

a amostra pode colher dados mais precisos. Este fato é resultante de inúmeras fontes de vieses, chamados de erros não-amostrais, que ocorrem num processo de pesquisa. Num censo, necessita-se de muitos entrevistadores, supervisores de campo e pessoas para lançar os dados coletados em programas de computador. Quanto menor a magnitude das operações de campo, mais fácil para exercer controle sobre o processo de coleta e tratamento dos dados. Com a amostragem, em certo período de tempo, pode-se dedicar mais atenção a cada entrevista, aumentando assim a qualidade da resposta.

a amostra é a única opção em estudos que resultam em destruição ou contaminação dos elementos pesquisados. Por exemplo, na verificação da aceitação de um novo sabor de iogurte. A execução de um projeto de pesquisa sempre introduz algum erro no estudo. O erro total em uma pesquisa é a diferença entre o valor verdadeiro (na população) da variável de interesse e seu valor observado (na amostra). Ele tem dois componentes: erros amostrais e erros não-amostrais. Se a diferença do valor (erro) entre o parâmetro da população e a estatística da amostra deve-se apenas à amostragem, chama-se de erro amostral. Por outro lado, algumas das fontes mais comuns de erros não-amostrais são erros de mensuração, erros de registro de dados, erros de análise de dados e erros de não-resposta. Em função de sua natureza, os erros amostrais podem ser minimizados por meio do aumento do tamanho da amostra. Entretanto, com esse aumento, a qualidade de controle da pesquisa pode tornar-se mais difícil, causando um aumento nos erros não-amostrais. Uma vez que os erros não-amostrais podem surgir de diversas fontes, eles são difíceis de identificar e controlar, por isso é preciso concentrar os esforços para reduzir seu número.

4.2. Processo de amostragem

Para que se possa inferir, o mais precisamente possível, características populacionais a partir de dados amostrais, a amostra deve ter algumas características:

Precisão: exatidão dos resultados obtidos na amostra em relação aos resultados que seriam obtidos na população. Quanto menor o erro amostral, mais precisa será a amostra.

Eficiência: na comparação entre diversos projetos amostrais, a amostra eficiente apresenta resultados mais confiáveis, ou mais precisos para um dado custo, ou menos dispendiosos para uma dada precisão.

Correção: grau de ausência de vieses não-amostrais na amostra. Uma amostra é dita correta (ou não-viesada) se as medidas superestimadas e as subestimadas forem compensadas entre os membros da amostra. Um exemplo de amostra não-correta é o da pesquisa eleitoral conduzida exclusivamente via telefone. Os passos para se realizar uma amostragem são:

1.

Definir a população de pesquisa;

2.

Identificar uma lista de todas as unidades amostrais da população;

 

3.

Decidir o tamanho da amostra;

4.

Selecionar um procedimento específico através do qual a amostra será determinada;

5.

Selecionar fisicamente a amostra tendo por base os

procedimentos

dos

passos

anteriores.

4.2.1. Conceitos sobre amostragem

Os principais conceitos referentes à amostragem são:

- população de pesquisa: é o agregado de todos os casos que se enquadram num conjunto

de especificações pré-estabelecidas; deve conter especificações dos elementos de pesquisa,

definição da unidade amostral, abrangência geográfica e período de tempo;

- elemento de pesquisa: é o objeto sobre o qual se procura obter os dados. Normalmente são pessoas, mas podem ser famílias, produtos, lojas, instituições, etc;

- unidade amostral: é o elemento (ou a unidade que contém o elemento) disponível para

seleção em algum estágio do processo de amostragem. Normalmente as unidades amostrais e

os elementos são os mesmos.

Exemplo:

População

de pesquisa: gerentes de produto mulheres da indústria de produtos

- alimentares do Estado de São Paulo em 2007.

- Elemento de pesquisa: Mulheres, gerentes de produto.

- Unidade amostral: Empresas do setor de produtos alimentícios; em seguida gerentes de produtos; em seguida mulheres.

- Abrangência: Estado de São Paulo.

- Período de tempo: 2007.

4.2.2. Tipos de amostragem

AMOSTRAGEM PROBABILÍSTICA

É aquela em que cada elemento da população tem uma chance conhecida e diferente de zero de ser selecionado para compor a amostra. O único significado de utilizar uma amostra probabilística é que o pesquisador terá total controle sobre o erro amostral. Mas esta é uma das inúmeras fontes de erro em pesquisas.

Amostra aleatória simples cada elemento da população tem probabilidade conhecida, diferente de zero e idêntica à dos outros elementos de ser selecionado para fazer parte da amostra. Seleção da amostra: todos os elementos devem estar identificados e a cada um deles deve ser atribuído um número. É feito então um sorteio ou utilizada uma tabela de números aleatórios.

Amostra aleatória estratificada é o processo de subdivisão da população de pesquisa em estratos (grupos representativos), seleção de amostras aleatórias simples em cada estrato e combinação dessas amostras em uma para estimar os parâmetros da população.

Amostra estratificada proporcional o tamanho da amostra é dividido em cada estrato, proporcionalmente ao tamanho de cada estrato na população.

Amostra estratificada não proporcional o tamanho ou peso dos estratos, para a composição da amostra, serão determinados em função da variabilidade das variáveis no estrato e da representatividade do estrato na população.

Amostra por conglomerados (ou grupos) também subdivide-se a população em grupos, chamados de conglomerados, seleciona-se aleatoriamente alguns conglomerados e todos os membros de cada conglomerado são entrevistados. Pode ter de um a “n” estágios. São bastante utilizadas por apresentarem o menor erro-padrão por unidade de custo. Seus principais tipos são a amostragem sistemática e a amostragem por área (um, dois ou multiestágios).

Amostra sistemática por exemplo, será constituída uma amostra sistemática de tamanho n = 4, da população de 40 supermercados. Primeiro sorteia-se um número entre 1 e 40/4 = 10 (vamos admitir que o número sorteado tenha sido 5). Depois adiciona-se 10, sucessivamente, ao número de ordem do elemento anterior, para determinar o elemento seguinte (1º elemento amostral: 5; 2º elemento amostral: 15; 3º elemento amostral: 25; 4º elemento amostral: 35).

Amostra por área é uma solução engenhosa que dispensa a necessidade de listagens dos elementos da população (comum nas outras técnicas de amostragem probabilística), mas em contrapartida exige a utilização de mapas detalhados de regiões, estados, municípios, cidades e bairros. Por exemplo, na amostragem por área de um estágio, listamos e enumeramos todos os quarteirões de uma cidade (população de quarteirões de tamanho N), sorteamos uma amostra aleatória simples ou sistemática de tamanho n de quarteirões e coletamos dados de todas as residências dos n quarteirões sorteados.

AMOSTRAGEM NÃO-PROBABILÍSTICA

É aquela em que a seleção dos elementos da população para compor a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador de campo. As mais utilizadas em pesquisas são:

Amostras por conveniência (ou acidentais) amostras selecionadas por alguma conveniência do pesquisador. É menos confiável, apesar de barata e simples, atendendo bem aos propósitos de uma pesquisa exploratória. Não é recomendada para pesquisas conclusivas. O elemento pesquisado foi escolhido por estar disponível no local e momento em que pesquisa foi feita. Exemplo: questionários destacáveis incluídos em revistas, entrevistas de abordagem em shoppings, Big Brother Brasil.

Amostras intencionais (ou por julgamento) pressupõe que a amostra será adequada para as necessidades da pesquisa, se a escolha dos casos incluídos dispuser de um bom julgamento e uma boa estratégia. Exemplo: realizar uma pesquisa para conhecer o perfil do estudante universitário, através de uma amostra selecionada com base em critérios de julgamento pré-estabelecidos, lojas de departamentos escolhidas para testar um novo sistema de display de mercadoria.

Amostras por quotas (ou proporcionais) nesse tipo de projeto de amostragem, o pesquisador procura obter uma amostra que seja similar à população, em alguns

aspectos. É necessário conhecer algumas características dessa população. Exemplo:

mulheres brancas de 18 a 35 anos podem ser consideradas categorias de controle relevante para um estudo que envolva compra de cosméticos, o pesquisador estima a proporção da população-alvo nessa categoria.

Amostras por tráfego pesquisas que envolvem a observação ou entrevistas de pessoas que trafegam por determinado local. Para que a amostra seja mais precisa, é conveniente que o trabalho de campo seja realizado em diferentes horas, dias e/ou semanas, de acordo com um conhecimento prévio das características de tráfego no local escolhido.

Amostras autogeradas quando o desconhecimento da população pelo pesquisador for muito grande, a ponto de não ser possível localizar seus elementos. Se o pesquisador tiver acesso a pelo menos um dos elementos, ele poderá solicitar que este indique conhecidos que façam parte dessa população, e assim construir a amostra. Exemplo: sócios de um clube social extremamente fechado.

As principais razões para o uso de amostragens não-probabilísticas são:

1. Não existe outra alternativa viável. Ex.: a população total não está disponível para ser sorteada.

2. A amostragem probabilística é superior na teoria, mas na prática podem ocorrer problemas no processo de pesquisa que enfraquecem sua superioridade. Ex.: o entrevistador não segue corretamente as instruções da pesquisa ou omite alguma pergunta; o entrevistado recusa-se a responder ou não é encontrado.

3. A obtenção de uma amostra de dados que reflita precisamente a população não é o propósito principal da pesquisa. Ex.: pesquisas exploratórias.

4. O tempo, os recursos financeiros, materiais e humanos necessários para realizar uma pesquisa probabilística podem inviabilizar a pesquisa. Ex.: pesquisas que aproveitam- se de oportunidades de eventos com grande número de visitantes.

4.2.3. Determinação do tamanho da amostra

A determinação do tamanho da amostra dependerá do conhecimento que se tem do tamanho da população e de seus parâmetros, do nível de confiança e da margem de erro da pesquisa. Podemos classificar uma população de pesquisa como finita ou infinita:

Finita - Consiste de um número finito ou fixo de elementos, medidas, observações. Número de elementos não excede a 100.000. Ex.: Alunos do mestrado, funcionários da Petrobrás, eleitores do Brasil, etc.

Infinita - Pelo menos hipoteticamente, um número infinito de elementos. Apresentam número superior a 100.000. Ex.: Nascimentos em uma cidade, produção de uma máquina, etc. São assim denominadas porque, acima de 100.000, qualquer que seja o número de elementos, o número de elementos da amostra selecionada será o mesmo. O nível de confiança de uma pesquisa é estabelecido pelo pesquisador, é aquele que indicará os desvios-padrão em relação à sua média. Numa curva normal, a área compreendida por um desvio-padrão, um à direita e um à esquerda da média corresponde a aproximadamente 68% de seu total. Verifique na curva normal (o estudo detalhado da distribuição normal será feito mais adiante):

 1 desvio-padrão = 68% de nível de confiança  2 desvios-padrão = 95,5% de

1 desvio-padrão = 68% de nível de confiança

2 desvios-padrão = 95,5% de nível de confiança

3 desvios-padrão = 99,7% de nível de confiança

Já o erro máximo de uma pesquisa (ou erro-padrão da estimativa) é expresso em percentuais e nas pesquisas sociais usualmente utiliza-se uma estimativa de erro entre 3 e 5%, pois os resultados de uma pesquisa obtidos por meio de uma amostra não são rigorosamente exatos em relação ao universo de onde foram extraídos. Esses resultados apresentam sempre um erro de medição, que diminui na proporção em que aumenta o tamanho da amostra. Então, se realizarmos um cálculo amostral que foi elaborado com 10% de erro, isto significa que há uma variação de 10% para mais ou para menos nos resultados obtidos. Pela teoria estatística de amostragem, o cálculo do tamanho da amostra dependerá do problema se tratar da média da variável ou de proporções de respostas dessa variável:

   

População finita

 

População infinita

Média

 

z

2

s

2

N

   

z

2

s

2

     

n

e

2

( N

1)

z

2

s

2

n

e

2

Proporção

z

2

p

q

N

z

2

p

q

n

e

2

( N

1

)

z

2

p

q

n

e

2

onde

 

População

Amostra

Número de elementos

N n

 

Média

x

 

Variância

2

s

2

Desvio-padrão

s

Proporção de ocorrência

P

p

Proporção de não-ocorrência

Q

q

e

e: erro-padrão da estimativa (estabelecido pelo pesquisador) z: valor da distribuição normal padronizada para um nível de confiabilidade estabelecido

Capítulo 5 Coleta e processamento dos dados

5.1. Coleta de dados

COLETA DE DADOS é a fase da pesquisa em que são efetuados os contatos com os respondentes, aplicados os instrumentos, registrados os dados, efetuada a primeira verificação do preenchimento dos instrumentos e enviados os instrumentos preenchidos para a central de processamento dos dados.

Planejamento das operações de coleta

1. Cronograma (início e término das operações, descrição e seqüência das

atividades). Por exemplo:

Descrição das atividades

 

 

semana

semana

semana

semana

Elaboração do projeto de pesquisa

 

X

     

Realização do pré-teste

 

X

     

Avaliação dos resultados do pré-teste

 

X

     

Reformulação do Instrumento de pesquisa

   

X

   

Impressão do Instrumento de pesquisa

   

X

   

Recrutamento,

seleção

e

treinamento

de

 

X

   

entrevistadores

Coleta de dados

   

X

 

Conferência e verificação dos dados

     

X

 

Digitação e processamento dos dados

     

X

 

Análise e interpretação dos dados

       

X

Conclusões

     

X

Elaboração do relatório final

       

X

2. Orçamento de despesas e saídas de caixa (previsão de todos os custos envolvidos e determinação do período de desembolso). Como exemplo de despesas, temos salários, transporte, alimentação, hospedagem, impressão dos documentos, despesas com telefones, etc.

3. Recursos humanos (o sucesso da coleta depende diretamente da qualidade do pessoal contratado para sua realização, portanto necessita-se extremo critério na contratação, treinamento e definição da forma de pagamento). Alguns erros geralmente cometidos em entrevistas pessoais ou por telefone:

a. Ausência de empatia entre entrevistador e entrevistado;

b. Forma de perguntar: apresentar os objetivos da pesquisa e prometer sigilo, familiarizar-se com o instrumento de coleta de dados, efetuar todas as perguntas, exatamente como estão escritas e na mesma seqüência do instrumento, usar técnicas apropriadas para obter respostas (repetir a pergunta, aguardar em silêncio, repetir a resposta dada, tranqüilizar o respondente, estimular através de perguntas neutras), anotar qualquer mudança que ocorrer durante a entrevista;

c. Forma de registrar a resposta: realizar a entrevista em local que facilite o registro das respostas, anotar as respostas durante a entrevista e não deixar para depois, utilizando as próprias palavras dos respondentes;

d.

Desonestidade: preenchimento, total ou parcial, do instrumento com dados

falsos ou com pessoas não indicadas na amostra. 4. Controle (supervisão geral do processo para que tudo saia conforme planejado). Por

exemplo:

a. Visitas ao campo para verificar o trabalho dos pesquisadores

b. Supervisão dos dados, verificando (porcentagem de respostas, porcentagem de recusas, porcentagem de contatos, total da amostra).

c. Contatos nas empresas pesquisadas para verificar quanto ao tipo de

abordagem.

5.2. Processamento de dados

O processamento compreende os passos necessários para transformação dos dados brutos coletados em informações que permitirão a realização das análises e interpretações. O objetivo principal da análise é a obtenção de significados nos dados coletados.

Fases do processamento

1. Verificação / edição: impor um padrão mínimo de qualidade aos dados brutos, deve

ser feita em campo e no escritório. Os dados devem estar completos, legíveis, uniformes, consistentes e precisos.

2. Codificação: procedimento técnico pelo qual os dados serão categorizados. Os processos serão diferentes para questões abertas e questões fechadas.

Questões fechadas: quando a questão possui uma única resposta, criam-se códigos, em geral numéricos, para representar cada categoria de resposta; e se a questão dá margem para respostas múltiplas, criam-se os códigos 1 (para a opção assinalada) e 0 (para a opção não-assinalada).

Questões abertas: um dos processos consiste em estabelecer a priori um

esquema de codificação, baseado no conhecimento do pesquisador sobre o assunto ou em algum referencial teórico; o outro processo consiste em esperar o término do campo e, a partir da leitura das respostas, ir construindo o esquema de codificação, criando as categorias pelas respostas obtidas.

3. Digitação: transcrever dados codificados para um banco de dados ou arquivo

eletrônico. Na planilha onde serão digitados os dados coletados, em geral utilizam-se as linhas para os registros de dados de cada respondente e as colunas são utilizadas para as variáveis do instrumento de coleta de dados. O ideal é que cada instrumento esteja identificado por um número na planilha de dados. Assim, se for detectado algum erro na digitação, é possível recuperar o dado original.

Crítica da consistência: após a digitação, pode-se proceder com a crítica eletrônica da consistência dos dados, observando: valores estranhos, valores extremados e a consistência de respostas a questões inter-relacionadas.

Completando o banco de dados: acréscimo e/ ou geração de outras variáveis:

acrescer dados não coletados durante o campo, disponíveis em outras fontes, que serão utilizados no processamento;

dividir uma variável contínua em categorias, ou combinar as categorias de uma variável de forma a trabalhar com menos categorias;

criar novas variáveis através da combinação de outras;

criar um índice que represente o resultado de um conjunto de variáveis.

4. Tabulação: contagem do número de casos que ocorre em cada categoria. Pode ser manual ou eletrônica, simples (apenas uma variável) ou cruzada (duas ou mais variáveis). No Excel, pode-se montar tabelas simples através da função cont.se, do pacote Análise de Dados ou da função freqüência e pode-se montar tabelas cruzadas usando o recurso da tabela dinâmica.

EXEMPLOS DE TABULAÇÕES

Tabulações simples

Tabela 1: Distribuição de freqüência de clientes por linha pesquisada

Linha

Freqüência

%

PORTO ALEGRE-CAXIAS DO SUL PORTO ALEGRE-GRAMADO PORTO ALEGRE-PELOTAS

521

52%

72

7%

407

41%

Total geral

1000

100%

Fonte: pesquisa de campo

Tabela 2: Distribuição de freqüência do tempo de utilização da empresa pelos clientes

Tempo de utilização

Freqüência

%

Até 2 anos Acima de 2 até 6 anos Acima de 6 até 10 anos Acima de 10 até 14 anos Acima de 14 até 18 anos Acima de 18 anos

131

13,1%

301

30,1%

199

19,9%

76

7,6%

188

18,8%

33

3,3%

Total geral

1000

93%

Tabulações cruzadas

Fonte: pesquisa de campo

Tabela 3: Tabela de contingência da linha pesquisada e tipo de serviço mais utilizado

Linha CONVENCIONAL EXECUTIVO LEITO N/D Total geral PORTO ALEGRE-CAXIAS DO SUL PORTO ALEGRE-GRAMADO PORTO
Linha
CONVENCIONAL
EXECUTIVO
LEITO
N/D
Total geral
PORTO ALEGRE-CAXIAS DO SUL
PORTO ALEGRE-GRAMADO
PORTO ALEGRE-PELOTAS
42
28
0
2
72
326
69
1
11
407
233
267
12
9
521
Total geral
601
364
13
22
1000

Fonte: pesquisa de campo

Tabela 4: Tabela de contingência da linha pesquisada e tipo de serviço mais utilizado (porcentagens baseadas no total geral)

Linha CONVENCIONAL EXECUTIVO LEITO N/D Total geral PORTO ALEGRE-CAXIAS DO SUL PORTO ALEGRE-GRAMADO PORTO
Linha
CONVENCIONAL
EXECUTIVO
LEITO
N/D
Total geral
PORTO ALEGRE-CAXIAS DO SUL
PORTO ALEGRE-GRAMADO
PORTO ALEGRE-PELOTAS
4,2%
2,8%
0,0%
0,2%
7,2%
32,6%
6,9%
0,1%
1,1%
40,7%
23,3%
26,7%
1,2%
0,9%
52,1%
Total geral
60,1%
36,4%
1,3%
2,2%
100,0%

Fonte: pesquisa de campo

Tabela 5: Tabela de contingência da linha pesquisada e tipo de serviço mais utilizado (porcentagens baseadas no total por linhas)

Linha CONVENCIONAL EXECUTIVO LEITO N/D Total geral PORTO ALEGRE-CAXIAS DO SUL PORTO ALEGRE-GRAMADO PORTO
Linha
CONVENCIONAL
EXECUTIVO
LEITO
N/D
Total geral
PORTO ALEGRE-CAXIAS DO SUL
PORTO ALEGRE-GRAMADO
PORTO ALEGRE-PELOTAS
58,3%
38,9%
0,0%
2,8%
100,0%
80,1%
17,0%
0,2%
2,7%
100,0%
44,7%
51,2%
2,3%
1,7%
100,0%
Total geral
60,1%
36,4%
1,3%
2,2%
100,0%

Fonte: pesquisa de campo

Tabela 6: Tabela de contingência da linha pesquisada e tipo de serviço mais utilizado (porcentagens baseadas no total por colunas)

Linha CONVENCIONAL EXECUTIVO LEITO N/D Total geral PORTO ALEGRE-CAXIAS DO SUL PORTO ALEGRE-GRAMADO PORTO
Linha
CONVENCIONAL
EXECUTIVO
LEITO
N/D
Total geral
PORTO ALEGRE-CAXIAS DO SUL
PORTO ALEGRE-GRAMADO
PORTO ALEGRE-PELOTAS
7,0%
7,7%
0,0%
9,1%
7,2%
54,2%
19,0%
7,7%
50,0%
40,7%
38,8%
73,4%
92,3%
40,9%
52,1%
Total geral
100,0%
100,0%
100,0%
100,0%
100,0%

Fonte: pesquisa de campo

Capítulo 6 Análise dos dados

6.1. Escolha do método de análise

Processo de interpretação dos dados já coletados, verificados, codificados e tabulados, que permitirá ao pesquisador estabelecer conclusões a partir destes dados. Na escolha do método deve-se considerar os seguintes fatores determinantes:

tipo de escala da variável (nominal, ordinal, intervalar e de razão);

nível de conhecimento dos parâmetros da população (uma técnica estatística é chamada

paramétrica quando o modelo do teste especifica certas condições sobre os parâmetros da população da qual a amostra foi obtida e é chamada não-paramétrica quando o modelo não

especifica tais condições);

tipo de análise (métodos descritivos ou métodos inferenciais);

número de variáveis a serem analisadas simultaneamente (métodos univariados, bivariados

ou multivariados);

relação entre as variáveis (dependência ou interdependência);

número de amostras a analisar e grau de relacionamento entre elas (amostra simples, duas

amostras relacionadas, duas amostras independentes, amostras múltiplas relacionadas,

amostras múltiplas independentes).

Todo o universo de técnicas estatísticas pode receber uma ampla classificação de técnicas univariadas e multivariadas, com base na natureza do problema. As técnicas univariadas são adequadas quando existe uma única mensuração de cada elemento da amostra, ou quando há várias medidas de cada elemento, mas cada variável é estudada isoladamante. Por outro lado, as técnicas multivariadas são adequadas para a análise de dados quando há duas ou mais mensurações de cada observação e as variáveis são analisadas simultaneamente. As técnicas univariadas podem ser classificadas de acordo com o tipo de dados sendo eles não-métricos (de escala nominal ou ordinal) ou métricos (de escala intervalar ou de razão). Os testes estatísticos não-paramétricos são empregados para analisar os dados não-

métricos, ou os dados métricos cujos parâmetros populacionais não sejam conhecidos, pois eles não requerem quaisquer premissas em relação à distribuição dos dados. Os testes paramétricos requerem algumas premissas em relação à distribuição dos dados na população da qual foi extraída a amostra, além dos dados serem métricos. Para ambos os tipos de dados, métricos ou não, o nível seguinte de classificação diz respeito à determinação de se estarão envolvidas uma única amostra ou múltiplas amostras. No caso de amostras múltiplas, os testes estatísticos adequados vão depender das amostras serem dependentes ou independentes.

6.2. Métodos descritivos

Têm o objetivo de proporcionar informações sumarizadas dos dados obtidos no total de elementos da(s) amostra(s) pesquisada(s) e compreendem: medidas de posição, de dispersão e de associação, sendo que os dois primeiros grupos dependem apenas do tipo de escala de medição da variável.

Medidas de posição Servem para caracterizar o que é “típico” no grupo. Compreendem as medidas de tendência central (média, mediana e moda) e as separatrizes (quartil, decil, percentil e mediana).

Moda: é o valor da categoria da variável que ocorre com a maior freqüência. Pode ser calculada para variáveis nominais, ordinais ou até mesmo intervalares ou de razão, desde que nestas últimas os dados tenham sido agrupados em classes.

Mediana: é o valor da variável que divide o grupo em dois subgrupos de igual tamanho, ou seja, é o valor da variável que é o elemento central da distribuição. Pode ser calculada para variáveis ordinais, intervalares ou de razão. Para calculá-la quando a variável é ordinal, primeiro ordena-se os valores dessa variável e depois procura-se o valor da variável correspondente ao elemento que divide o grupo em dois subgrupos de mesmo tamanho, quando a amostra tiver um número ímpar de elementos, ou a média dos valores dos dois elementos centrais, quando a amostra possuir um número par de elementos. Para uma variável intervalar ou de razão, o cálculo da mediana é dado através da mesma fórmula utilizada para o cálculo dos quartis, vista em seguida.

Quartis: são os valores da variável que correspondem aos três elementos que dividem o conjunto de dados em quatro subgrupos de tamanhos iguais. O 1º quartil é o valor do elemento que divide o grupo em duas partes, a primeira com 25% e a segunda com 75% dos elementos do grupo; o 2º quartil é o valor do elemento que divide o grupo ordenado em duas

partes de igual tamanho (ou seja, é a mediana) e o 3º quartil é o valor do elemento que divide

o grupo ordenado em duas partes, sendo que a primeira representa 75% e a segunda 25% dos

elementos do grupo. Os quartis podem ser calculados para variáveis ordinais, intervalares ou

de razão e o cálculo para variáveis no mínimo intervalares e divididas em intervalos de classes

é dado pela fórmula:

Q

k

l

*

f

*

*

k

n

4

(

F ant

)

 

.

h

onde

Q

k

: valor do quartil, k = 1, 2 ou 3

*

l : menor valor do intervalo da classe do quartil desejado n : número de elementos do conjunto de valores da variável F(ant) : freqüência acumulada da classe anterior à classe do quartil desejado

h

f

*

*

:

amplitude do intervalo da classe do quartil desejado

: freqüência do intervalo da classe do quartil desejado

Decis e percentis: correspondem, respectivamente, aos valores dos elementos que dividem o grupo em 10 e 100 partes iguais. Suas fórmulas correspondentes são análogas à do quartil, com a alteração do 4 por 10 ou 100.

Média: é uma medida de tendência central calculada apenas para dados intervalares ou de razão. Representa o ponto de equilíbrio do conjunto de dados e é afetada pelos valores extremos do conjunto (muito grandes ou muito pequenos). A média aritmética é dada pelas fórmulas abaixo:

Média aritmética

População

Amostra

Dados brutos

x

i

x x  i
x
x 
i
 

N

 

n

Dados agrupados

x

 

f

i

x

f

i

x

i

i

 

N

 

n

Medidas de dispersão Servem para medir como os indivíduos estão distribuídos no grupo. As medidas de tendência central nos informam a respeito do ponto de concentração da maioria das respostas, porém não diz nada a respeito do grau de concentração dessas respostas em torno desse ponto nem da maneira como as observações estão dispersas por toda a distribuição.

Amplitude: calculada para variáveis intervalares e de razão, é a diferença entre o maior e o menor valor da variável, observados numa amostra.

Variância: é a média aritmética dos quadrados dos desvios dos valores da variável em torno da média aritmética. Assim como a média aritmética, só pode ser calculada para dados intervalares ou de razão.

Desvio-padrão: é a raiz quadrada da variância e representa uma efetiva medida de dispersão absoluta dos dados em torno de sua média. Pode ser calculado através das seguintes fórmulas, também para dados intervalares ou de razão:

Desvio-padrão

População

Amostra

Dados brutos

 ( x i  ) 2   s N
 (
x
i  )
2
s
N
( x  x ) 2 i n  1
( x
 x
) 2
i
n  1

Dados agrupados

 ( x  ) 2  f   i i s  N
 (
x
)
2
f
i
i
s 
N
 ( x  x ) 2  f i i n  1
 (
x
x
)
2
f
i
i
n  1

Coeficiente de variação: é uma medida de dispersão relativa, usada quando há a necessidade de comparação de diversas distribuições que não possuam as mesmas médias ou que não estejam nas mesmas escalas ou unidades de medida. Também só pode ser calculado para variáveis intervalares e de razão, dado pela fórmula:

População:

CV

Amostra:

CV

s

 

x

6.3. Distribuição normal de probabilidade

A distribuição normal é usada para calcular o tamanho da amostra e serve de base para a inferência estatística clássica. Muitos fenômenos contínuos (algumas variáveis com escala de razão) seguem a distribuição normal ou podem ser aproximados por ela. A distribuição normal é uma distribuição dos valores de uma variável X por suas freqüências de ocorrência (ou probabilidade), de acordo com a seguinte regra empírica:

verifica-se que 68% de observações quaisquer dessa variável estão incluídas dentro de uma distância de 1 desvio-padrão em torno da média aritmética, e aproximadamente 95% das observações estão incluídas dentro de uma distância de 2 desvios-padrão em torno da média

aritmética. Assim, a distribuição normal fica definida pela média populacional desvio-padrão populacional. Ela tem algumas propriedades teóricas importantes:

e pelo

tem forma de sino e aparência simétrica;

suas medidas de tendência central (média, mediana e moda) são todas idênticas;

o valor da variável que tem maior freqüência é o ponto X = ;

valores da variável X mais próximos da média ocorrem com maior freqüência;

valores da variável X simétricos em relação à média ocorrem com a mesma freqüência;

o gráfico desta distribuição, delimitado pelo eixo x, tem área igual a 1.

Como existe um número infinito de combinações entre

e , existe um número infinito

de distribuições normais, o que exigiria um número infinito de tabelas. Padronizando os dados, é possível transformar qualquer variável X que segue a distribuição normal numa variável normal padronizada, chamada Z, através da fórmula:

z x

Dessa forma, a distribuição normal padronizada Z tem média 0 e desvio-padrão 1. O gráfico desta distribuição tem o seguinte formato, chamado curva de Gauss:

Prob.

Z

Uma tabela contendo os valores positivos de Z e a área compreendida sob a curva entre 0 e Z foi construída.

Exemplo 1: Calcule a probabilidade da variável normal padrão z assumir:

a) valores entre 0 e 1

b) valores maiores que 1

c) valores menores que 1

d) valores entre 2 e 1

e) valores entre 1,34 e 2,16

f) valores entre 2,25 e 1,27

g) valores entre 1,55 e 3,67

h) valores maiores que 2,64

i) valores menores que 1,05

j) valores menores que 0,02

k) valores maiores que 1,47

Exemplo 2: Determine o valor de a, sabendo-se que:

a) P(0 < z < a) = 0,4772

b) P(z < a) = 0,8051

c) P(z > a) = 0,96

d) P(z > a) = 0,01

6.4. Métodos inferenciais

As técnicas univariadas são adequadas quando existe uma única mensuração de cada elemento da amostra ou quando há diversas mensurações de cada objeto da amostra, mas cada variável é analisada em separado. Em particular, os métodos inferenciais univariados compreendem um conjunto grande de testes que servem para julgar a validade de hipóteses estatísticas sobre um parâmetro populacional ou para estimar seus parâmetros individualmente, a partir da análise dos dados de uma amostra dessa população. As técnicas inferenciais envolvem a estimação de parâmetros e os testes de hipóteses e fazem uso da teoria das probabilidades. Os métodos estatísticos utilizados, como explicado anteriormente, podem ser enquadrados como paramétricos ou não-paramétricos, dependendo do conhecimento que se tem dos dados populacionais. Testes paramétricos exigem que:

os dados sejam medidos no nível pelo menos intervalar;

as observações precisam ser independentes;

a(s) amostra(s) foi(ram) extraídas de populações com distribuições normais;

mesmas

as

populações

precisam

ter

variâncias

(quando

se

comparam

amostras);

várias

em alguns casos, a(s) amostra(s) seja(m) grande(s).

Esse conjunto de exigências raramente é atendido em pesquisas de marketing, daí a

importância das técnicas não-paramétricas nessa área.

Testes de hipóteses Em ciências do comportamento, muitas pesquisas são conduzidas com o objetivo de

verificar hipóteses construídas a partir de teorias conhecidas ou do conhecimento da realidade. Um pesquisador, para verificar a validade dessas suposições, muitas vezes se depara com a dificuldade de obter informações sobre toda a população, sendo necessário coletar dados de amostras dessa população. Para a realização de um teste de hipótese, que indicará a validade da generalização das conclusões obtidas para a população, segue-se um procedimento padronizado:

1. estabelecer a hipótese nula (H 0 ) e a hipótese alternativa (H 1 );

2. selecionar o teste estatístico adequado à situação;

3. determinar ou assumir a distribuição amostral da prova estatística;

4. estabelecer um nível de significância para o teste;

5. determinar as regiões de aceitação e rejeição da hipótese nula;

6. calcular o valor da prova estatística a partir dos dados amostrais;

7. tomar a decisão de aceitação ou rejeição da hipótese nula e, conseqüentemente, adoção ou não da hipótese alternativa.

1. Estabelecer a hipótese nula

A hipótese nula H 0 é formulada sobre um valor hipotético de um parâmetro da população

ou, no caso da comparação de dois ou mais grupos, é a alegação de que o parâmetro analisado é o mesmo nas duas ou mais populações. Isso quer dizer que, na decisão de aceitar essa

hipótese, considera-se que qualquer diferença observada da amostra para a população ou entre as amostras (no caso da comparação delas) pode ser encarada como casual, resultante apenas do erro amostral.

A hipótese alternativa H 1 corresponde à hipótese do projeto de pesquisa e é a alternativa

aceita quando a hipótese nula é rejeitada.

2. Selecionar o teste estatístico

A escolha do teste depende de vários fatores, a começar pela escala da variável e disponibilidade ou não de dados da população. Se os dados forem intervalares, os parâmetros populacionais forem conhecidos e atenderem aos requisitos necessários, usa-se um teste paramétrico. Caso contrário, usa-se um teste não-paramétrico.

A segunda escolha a ser feita ocorre quando houver mais de um tipo de teste que possa ser

aplicado à situação. Nesse caso, escolhe-se o teste que tiver o maior poder (explicado abaixo). Uma terceira escolha deverá ser feita tendo em vista o número de amostras selecionadas e o relacionamento entre elas. O quadro a seguir apresenta os tipos de teste apropriados em cada caso.

Não-paramétricos

Paramétricos

Escala de

mensuração da

variável

Testes de inferência

Método

Uma amostra

Duas amostras

Relacionadas

McNeumar

Wilcoxon

Teste t r

Várias amostras

Relacionadas

Não-relacionadas

Qui-quadrado -

Cochran Q

várias amostras

independentes

Mediana - várias

Análise de

amostras

variância em

independentes

 

duas direções

Análise de variância

de Friedman

numa direção de

Kruskal-Wallis

Teste t

aos

Análise de variância

pares

Binomial

Qui-quadrado -

uma amostra

Kolmogorov-

Smirnov

Teste z

Teste t

Não-relacionadas Qui-quadrado - duas amostras Mediana Mann-Whitney U Kolmogorov-Smirnov Comparação entre médias -

Não-relacionadas

Qui-quadrado - duas

amostras

Mediana

Mann-Whitney U

Kolmogorov-Smirnov

Comparação entre

médias - teste z ou t

Comparação entre

variâncias - teste F

Regressão

Nominal

Ordinal

Intervalar ou

Razão

3. Determinar ou assumir a distribuição amostral

A distribuição amostral é a distribuição formada por todas as possíveis amostras probabilísticas de mesmo tamanho de uma população. Para realizar o teste, o pesquisador precisa conhecer, ou assumir como conhecido, o tipo de distribuição amostral do parâmetro da população em estudo. Sabendo se essa distribuição será normal, binomial, qui-quadrado, etc., pode-se procurar em tabelas estatísticas padronizadas as probabilidades associadas ao teste.

4. Estabelecer o nível de significância

Como a decisão de um teste de hipótese será tomada de acordo com os dados de uma

amostra, há dois tipos de erros que podem ser cometidos.

O primeiro, chamado de erro tipo I, é o de rejeitar H 0 quando verdadeira. Ele ocorre

quando a amostra selecionada, dentre todas as possíveis da população de pesquisa, apresentar dados que contrariam os dados verdadeiros da população. Como não se sabe quando isso

ocorre, trabalha-se com sua probabilidade de ocorrência, denotada por

de significância do teste. Essa probabilidade deve ser estabelecida pelo pesquisador antes de iniciar os testes.

a

probabilidade de se cometer o erro tipo II. O poder do teste é definido como a probabilidade

de rejeitar H 0 quando falsa, ou seja, é

e chamada de nível

O segundo, chamado de erro tipo II, é o de aceitar H 0 quando falsa. Denota-se por

1

.

5. Determinar a região de rejeição de H 0

A partir da definição da hipótese alternativa, divide-se o gráfico da distribuição amostral

do parâmetro a ser avaliado em duas regiões: a região de aceitação de H 0 e a região de rejeição de H 0 , também conhecida como região crítica. O(s) valor(es) crítico(s) que divide(m)

essas regiões é(são) obtido(s) através de tabelas específicas para cada distribuição amostral considerada, podendo também ser obtido(s) através de programas estatísticos computacionais, considerando que o nível de significância será a área da região crítica. Assim, o marco decisório que permite tomar a decisão a partir dos dados amostrais é dado pelo(s) valor(es) crítico(s) tabelados, como nos exemplos dos gráficos abaixo:

Gráfico 1: teste unicaudal à esquerda Gráfico 2: teste bicaudal 6. Calcular o valor da

Gráfico 1: teste unicaudal à esquerda

Gráfico 1: teste unicaudal à esquerda Gráfico 2: teste bicaudal 6. Calcular o valor da prova

Gráfico 2: teste bicaudal

6. Calcular o valor da prova estatística

A partir dos dados da amostra pesquisada e das formulações aplicáveis à distribuição

amostral determinada ou assumida, calcula-se o valor da prova estatística, que também é chamado de valor calculado. Esse valor calculado pode ser apresentado na forma de probabilidade ou em forma de ordenada.

7. Tomar a decisão

Com base no valor calculado, o valor crítico (tabelado) e a região de rejeição (R.C.), pode- se facilmente decidir pela rejeição ou não de H 0 e, conseqüentemente, pela adoção ou não de

H 1 .

Assim, para valores apresentados em probabilidades (chamado valor-p):

Se a probabilidade calculada for menor ou igual ao nível de significância rejeita-se H 0 em prol de H 1 ;

Se a probabilidade calculada for maior que o nível de significância

,

, aceita-se

H 0 . E para valores expressos em ordenadas:

Se o valor calculado for maior ou igual ao valor crítico, está-se na região de rejeição de H 0 , ou seja, rejeita-se H 0 em prol de H 1 ;

Se o valor calculado for menor que o valor crítico, está-se na região de aceitação de H 0 , ou seja, aceita-se H 0 .

O número de testes de hipóteses que podem ser realizados é muito grande e depende de

diversos aspectos. A seguir, veremos alguns testes de hipóteses importantes (paramétricos e não-paramétricos), com o detalhamento de seu procedimento e sua utilização em pesquisas de marketing.

6.4.1. Testes da média para uma amostra variável intervalar

TESTE Z É utilizado em pesquisas de marketing para comparar a média de uma amostra com a média hipotética da população e decidir com base na média da amostra se a média hipotética da população pode ser aceita como verdadeira.

Condições para utilização:

- exclusivamente para variáveis intervalares ou de razão; - qualquer tamanho da amostra se o desvio-padrão populacional for conhecido; - somente para amostras de tamanho igual ou maior que 30 elementos, se o desvio-padrão populacional não for conhecido. Para amostras de tamanho menor do que 30, o teste t será o mais recomendado.

Teoria/conceito: o teste consiste em verificar se a média na amostra (

como a média hipotética da população (

).

x ) pode ser aceita

Procedimento sumarizado do teste:

1. Determinar H 0 como sendo a média da amostra igual à média hipotética da população (ou a negativa da existência de diferença entre essas duas médias). Conseqüentemente, H 1 , a hipótese alternativa, será a existência de diferença entre essas duas médias (teste bicaudal). Ou que a média da amostra é maior (ou menor) que a média hipotética da população (teste unicaudal).

2. Estabelecer um nível de significância

3. Determinar a região de rejeição de H 0 , ao nível de significância

Procurar na tabela da distribuição padronizada de Z o valor crítico para o nível de significância dado.

4. Calcular os valores de Z, segundo as fórmulas:

.

estabelecido.

n N  0,05 Caso 1 – a amostra representa no máximo 5% da população,
n
N
 0,05
Caso 1 – a amostra representa no máximo 5% da população, ou seja,
(ou a população é infinita), e o desvio-padrão da população
 é conhecido:
x 
z 
n
n
N
 0,05
Caso 2 – a amostra representa mais de 5% da população, ou seja,
, e o

desvio-padrão da população

é conhecido:

z

x    N  n  n N 1
x 
N
 n
n
N 1

Caso 3

z  x    N  n  n N 1 Caso 3 –

0,05

(ou a população é infinita), o desvio-padrão da população

não é conhecido e

n  30 x  : z  s n
n  30
x 
: z 
s
n
 0,05 Caso 4 - x   z  s N  n 
 0,05
Caso 4 -
x 
z 
s
N
 n
n
N 1

, o desvio-padrão da população

não é conhecido e

n 30

:

5. Decidir comparando os valores crítico e calculado. Se o valor de Z calculado for maior que o de Z tabelado, a hipótese nula H 0 é rejeitada e a hipótese alternativa H 1 é aceita.

Exemplo: O comprador de uma rede de 500 farmácias está interessado em verificar a viabilidade de adotar a comercialização de uma nova marca de sabonete de um fornecedor tradicional. Sua experiência anterior, em função da categoria do produto e da margem de comercialização oferecida, indica que para esta comercialização ser viável e lucrativa é necessário vender no mínimo uma média de 100 unidades/loja/dia. O fornecedor concordou em fornecer uma partida do produto que permitiu a realização de um teste de vendas numa amostra probabilística de 32 lojas da rede. Os resultados obtidos de vendas por loja encontram-se na tabela a seguir.

Vendas

Vendas

Loja

x

Loja

X

1 116

17

110

2 105

18

70

3 120

19

95

4 93

20

90

5 132

21

120

6 114

22

115

7 97

23

125

8 108

24

98

9 86

25

103

10 123

26

112

11 105

27

92

12 102

28

101

13 123

29

109

14 88

30

132

15 114

31

119

16 94

32

101

Com base nesses dados, o comprador deve decidir se adota ou não a comercialização dessa nova marca de sabonete.

Procedimento para o teste:

1. Determinação das hipóteses H 0 : a média de vendas de todas as lojas é menor ou igual a 100. H 1 : a média de vendas de todas as lojas é maior que 100. (teste unicaudal)

2. Nível de significância

3. Região de rejeição. Para

0,05 0,05

.

no teste unicaudal, o valor de Z tabelado é 1,65.

1,65
1,65

4.

5.

x   Calcular o valor de Z, utilizando a fórmula z  (pois s
x 
Calcular
o
valor
de
Z,
utilizando
a
fórmula
z 
(pois
s
N
 n
n
N 1
n
N  32
500
0 064
,
0 05
,
e o desvio-padrão populacional não é conhecido). Pela
tabela e hipóteses, temos:
n  32
x
x 
i
 106,625
 
( x
 x )
2
s
i
 14 3026
,
100
n
n  1
x 
106 625
,
 100
Logo
z
 2 7057
,
.
s
N
n
14 3026
,
500
32
n
N
 1
32
500
1

Decisão. Como o valor de Z calculado (2,7057) é maior do que o valor de Z tabelado (1,65), a hipótese nula H 0 é rejeitada, sendo aceita a hipótese alternativa H 1 para

. Portanto, a nova marca de sabonete deverá ser comercializada pela rede de

farmácias.

0,05

TESTE t Tem a mesma utilização em pesquisas de marketing que o teste Z.

Condições para utilização:

- exclusivamente para variáveis intervalares ou de razão; - quando o desvio-padrão populacional não for conhecido e o tamanho da amostra é menor que 30 elementos.

Teoria/conceito: o teste consiste em verificar se a média na amostra (

como a média hipotética da população (

).

x ) pode ser aceita

Procedimento sumarizado do teste: idêntico ao teste Z, apenas com a modificação das fórmulas:

4. Calcular os valores de Z, segundo as fórmulas:

Caso 1 a amostra representa no máximo 5% da população, ou seja,

população é infinita), o desvio-padrão da população

n N
n
N

0,05

(ou a

não é conhecido e

n 30

:

x  t  s n
x 
t 
s
n

onde o valor de t deve ser procurado na tabela correspondente, com n 1

graus de liberdade.

n N  0,05 Caso 2 – a amostra representa mais de 5% da população,
n
N
 0,05
Caso 2 – a amostra representa mais de 5% da população, ou seja,
n  30
, o
x 
desvio-padrão da população
 não é conhecido e
: t 
, com n –
s
N
 n
n
N 1

1 graus de liberdade.

Exemplo: Os salários dos funcionários de uma empresa se distribuem normalmente e apresentam uma média histórica de 4 salários mínimos. Uma política de aumento dos salários mais baixos combinada com a contenção dos salários mais altos, visa diminuir as diferenças, implementando uma distribuição salarial melhor. Após algum tempo de execução desta política, uma amostra aleatória de 25 salários selecionadas ao acaso forneceu média 5 salários e desvio-padrão de 1,2 salário mínimo. Teste ao nível de significância de 5% se não houve aumento no salário médio desta empresa.

Procedimento para o teste:

1. Determinação das hipóteses H 0 : a média de salário na empresa é menor ou igual a 4 salários mínimos, após a

política adotada. H 1 : a média de salário na empresa é maior que 4. (teste unicaudal)

2. Nível de significância

3. Região de rejeição. Para tabelado é 1,711.

0,05 0,05

.

e g.l. = 25 1 = 24 no teste unicaudal, o valor de t

1,711
1,711

4. Calcular o valor de t, utilizando a fórmula

t

x

s

n
n

(pois

n N  25 500
n
N  25
500

0 05

,

e

o

desvio-padrão populacional não é conhecido). Pelas hipóteses e dados fornecidos, temos:

x  5 s 1,2 n  25 x   5  4 Logo
x  5
s 1,2
n  25
x 
 5
 4
Logo
t
 
 4167
,
.
s 12
,
n
25

4

5.

Decisão. Como o valor de t calculado (4,167) é maior do que o valor de t tabelado (1,711), a hipótese nula H 0 é rejeitada e a hipótese alternativa H 1 é aceita para

0,05

. Portanto, a política salarial adotada na empresa provocou um aumento no

seu salário médio.

6.4.2. Testes da proporção para uma amostra variável intervalar

TESTE Z É utilizado em pesquisas de marketing para comparar a proporção de ocorrência de determinada característica de uma amostra com a proporção hipotética da população e decidir com base na proporção da amostra se a proporção hipotética da população pode ser aceita como verdadeira.

Condições para utilização:

- exclusivamente para variáveis intervalares ou de razão.

Teoria/conceito: o teste consiste em verificar se a proporção na amostra (p) pode ser aceita como a proporção hipotética da população (P).

Procedimento sumarizado do teste:

1. Determinar H 0 como sendo a proporção da amostra igual à proporção hipotética da população (ou a negativa da existência de diferença entre essas duas proporções). Conseqüentemente, H 1 , a hipótese alternativa, será a existência de diferença entre essas duas proporções (teste bicaudal). Ou que a proporção da amostra é maior (ou menor) que a proporção hipotética da população (teste unicaudal).

2. Estabelecer um nível de significância

3. Determinar a região de rejeição de H 0 , ao nível de significância

Procurar na tabela da distribuição padronizada de Z o valor crítico para o nível de significância dado.

4. Calcular os valores de Z, segundo as fórmulas:

(ou a

.

estabelecido.

Caso 1 a amostra representa no máximo 5% da população, ou seja,

n N
n
N

0,05

população é infinita):

z

p  P P  Q n
p
 P
P
Q
n

Caso 2 a amostra representa mais de 5% da população, ou seja,

z

p  P P  Q N  n  n N 1
p
 P
P  Q
N
 n
n
N
1
n N
n
N

0,05

:

5. Decidir comparando os valores crítico e calculado. Se o valor de Z calculado for maior que o de Z tabelado, a hipótese nula H 0 é rejeitada e a hipótese alternativa H 1 é aceita.

Exemplo: Uma estação de televisão A afirma que 60% dos televisores estavam ligados no seu programa especial da última segunda-feira. Uma rede competidora B deseja contestar essa afirmação e decide usar uma amostra de 200 famílias para um teste, obtendo 104

famílias que estavam assistindo ao programa. Com base nesses dados, a que conclusão pode chegar a rede concorrente B?

Procedimento para o teste:

1. Determinação das hipóteses H 0 : a proporção de audiência da rede A na segunda-feira foi de 60%. H 1 : a proporção de audiência da rede A na segunda-feira foi menor que 60%. (teste unicaudal)

2. Nível de significância

3. Região de rejeição. Para

0,01

.

0,01

no teste unicaudal, o valor de Z tabelado é 2,33.

R.A. R.C. -2,33
R.A.
R.C.
-2,33

4. Calcular o valor de Z, utilizando a fórmula

hipóteses e dados fornecidos, temos:

p

104

200

P 0,60

Logo

z

 0 52 , 0 52 ,  0 60 , 0 60 , 
0 52
,
0 52
,
 0 60
,
0 60
,
 0 40
,
200

q 1p 0,48

2 3094

,

.

z

p  P P  Q n
p
 P
P
Q
n

(pois N é infinita). Pelas

n 200

5. Decisão. Como o valor de Z calculado (2,3094) é menor do que o valor de Z tabelado

. Portanto, a rede de televisão A tem

(2,33), a hipótese nula H 0 é aceita para

razão em afirmar que a audiência do seu programa de segunda-feira foi de 60%.

0,01

6.4.3. Testes da diferença entre médias para duas amostras não-relacionadas variável intervalar

TESTE Z DA DIFERENÇA ENTRE DUAS MÉDIAS É utilizado em pesquisas de marketing para verificar se a diferença observada entre duas médias obtidas de amostras não-relacionadas é suficientemente grande para ser considerada significativa, ou seja, é uma diferença que pode ser considerada nas populações das quais as amostras foram extraídas.

Condições para utilização:

- exclusivamente para variáveis intervalares ou de razão;

- medições devem ser efetuadas na mesma unidade ou escala;

- qualquer tamanho de amostra, se o desvio-padrão for conhecido;

- para amostras de tamanho maior que 30 elementos, se o desvio-padrão da população não

for conhecido. Se o tamanho da amostra for menor ou igual a 30, o teste t é o recomendado.

Teoria/conceito: o princípio que norteia este teste é o de que, se as médias amostrais de duas são populações são normalmente distribuídas, a distribuição de sua soma ou diferença também será normalmente distribuída, desde que as populações que lhes deram origem sejam normalmente distribuídas ou as amostras sejam maiores que 30.

Procedimento sumarizado do teste: é o mesmo do teste Z para média de uma amostra, sendo que neste caso a fórmula para cálculo do valor de Z será:

Caso 1 - os desvios-padrão das populações 1 e 2 são conhecidos: ( x 1
Caso
1
-
os
desvios-padrão
das
populações
1
e
2
são
conhecidos:
( x
1  x
)
(
 1
)
z
2
2
.
2 
2
1
2
n
1 n
2
n
 n  30
1
2
Caso 2 - os desvios-padrão das populações 1 e 2 não são conhecidos e
:
( x
1  )
x
(
 1
)
z
2
2
.
s
2
s
2
1
2
n
n
1
2
x 1 x
2
onde
e 
e
são as médias das amostras 1 e 2, respectivamente;
1
2
são as médias desconhecidas das populações 1 e 2, respectivamente, que sob H 0 são

idênticas;

1 são os desvios-padrão das populações 1 e 2, respectivamente;

e

2

n

1

e

n

2 são os tamanhos das amostras 1 e 2, respectivamente.

Exemplo: Um fabricante de cigarros realizou uma pesquisa entre 100 fumantes em cada uma de duas classes econômicas e constatou que os fumantes da classe A/B fumam em média 20 cigarros/dia e os da classe C/D uma média de 25 cigarros/dia. Sabe-se de estudos anteriores que o desvio-padrão da população de fumantes na classe A/B é 10 e na classe C/D é 14. Esse fabricante deseja saber se a diferença verificada no consumo de cigarros entre as duas amostras deverá ser aceita como verdadeira na população ou atribuída apenas a variações eventuais decorrentes do processo de amostragem.

Procedimento para o teste:

1. Determinação das hipóteses H 0 : não há diferença significativa entre fumantes das classes A/B e C/D em relação ao

consumo de cigarros, ou seja,

H 1 : há diferença significativa, ou seja,

1

2

.

1

2

. (teste bicaudal)

2. Nível de significância

3. Região de rejeição. Para

0,05 0,05

.

no teste bicaudal, o valor de Z tabelado é 1,96.

-1,96 1,96
-1,96
1,96
4. Calcular o ( x  x )  (    ) z
4. Calcular
o
( x
x
)
(
)
z 
1
2
1
2
2 
2
1 
2
n
1 n
2

valor

de

z

pela

fórmula

( 20  25 )  0   2 906 , . 10 2
(
20
25
)
0
 2 906
,
.
10 2
14 2
100
100

5. Decisão. Como o valor calculado de Z (-2,906) é maior que o valor tabelado (-1,96), pode-se rejeitar a hipótese nula e aceitar a hipótese alternativa. Portanto, há uma diferença estatisticamente significativa no nível de 0,05 no consumo médio diário de cigarros entre as duas classes econômicas consideradas.

TESTE t DA DIFERENÇA ENTRE DUAS MÉDIAS Tem a mesma utilização em pesquisas de marketing que o teste Z para diferenças entre médias.

Condições para utilização:

- exclusivamente para variáveis intervalares ou de razão; - quando o desvio-padrão populacional não for conhecido e o tamanho da amostra é menor que 30 elementos.

Procedimento sumarizado do teste: idêntico ao teste Z, apenas com a modificação das fórmulas:

4. Calcular os valores de t, segundo a fórmula

graus de liberdade.

t

( x  x )  (    ) 1 2 1 2
( x
x
)
(
)
1
2
1
2
s
2
s
2
1
2
n
n
1
2

, com

n

1

n 2

2

Exemplo: Suponha que o teste para a adoção de uma nova marca de sabonete numa rede de supermercados tenha sido realizado em duas diferentes regiões e apresentou os seguintes resultados:

Região 1: amostra de 10 lojas, com média de vendas de 109,4 unidades/loja/dia e desvio- padrão de 4,55; Região 2: amostra de 10 lojas, com média de vendas de 99,1 unidades/loja/dia e desvio- padrão de 20,5. Com base nesses dados, deseja-se saber se há diferenças significativas no consumo do produto em teste entre essas duas regiões.

Procedimento para o teste:

1. Determinação das hipóteses H 0 : não há diferença entre as médias de consumo nas duas regiões (

1

2

).

H 1 : há diferença significativa entre as médias de consumo nas duas regiões, sendo

1

2

. (teste unicaudal)

2. Nível de significância

3. Região de rejeição. Para de t é 2,552

0,01

.

0,01

e g.l. = 10 + 10 2 = 18, temos que o valor crítico

2,552
2,552

4. Calcular

o

valor

de

t,

através

da

fórmula

t

( x  x )  (    ) 1 2 1 2
( x
x
)
(
)
1
2
1
2
s
2
s
2
1
2
n
n
1
2

( 109 4 ,  991 , )  0 4 55 , 2 20
(
109 4
,
991
,
)
0
4 55
,
2
20 5
2
 ,
10 10

155

,

.

5. Decisão. Como o valor calculado de t (1,55) é menor que o valor tabelado (2,552), então aceita-se a hipótese nula ao nível de significância de 0,05. Portanto,o consumo da nova marca de sabonete é semelhante nas duas regiões.

6.4.4. Testes para uma amostra variável nominal

TESTE QUI-QUADRADO DE UMA AMOSTRA É utilizado em pesquisas de marketing para se verificar se a distribuição de freqüência absoluta observada de uma variável em uma amostra é significativamente diferente da distribuição de freqüência esperada (teórica ou conhecida).

Condições para utilização:

- exclusivamente para variáveis nominais ou ordinais;

- observações independentes;

- não pode ser utilizado se mais de 20% das freqüências absolutas forem inferiores a 5 ou

se qualquer freqüência for inferior a 1. Neste caso, a solução para possibilitar a utilização do

teste é agrupar células até terem as condições atendidas.

Teoria/conceito: é uma prova do tipo aderência, isto é, o quanto a distribuição observada

E i ). Através da comparação entre as duas, aceita-se ou

(

rejeita-se H 0 , a determinado nível de significância

O i ) se ajusta à distribuição esperada (

.

Procedimento sumarizado do teste:

1. Determinar H 0 como sendo a inexistência de diferenças entre a distribuição de freqüência observada e a esperada.

2. Estabelecer um nível de significância

3. Distribuir as freqüências observadas

.

O i ’s pelas k categorias e, sob a hipótese H 0 ,

determinar a distribuição de freqüência esperada

E i ’s pelas k categorias.

4. Determinar a região de rejeição de H 0 . Determinar o valor dos graus de liberdade (gl), definido por gl = k 1 e procurar, a seguir, na tabela correspondente, o valor do qui-

quadrado tabelado correspondente para

e gl.

5. Calcular o valor de qui-quadrado a partir dos

2

k

i 1

(O

i

E

i

)

2

E

i

O

i

’s

segundo

a

fórmula:

6. Decisão: comparando o qui-quadrado calculado com o qui-quadrado tabelado, decidir- se pela aceitação ou rejeição de H 0 .

Exemplo: Um gerente de produto pretende verificar se a posição que o produto ocupa na prateleira dos supermercados tem influência sobre a quantidade vendida, através de um experimento. Um supermercado possui, geralmente, prateleiras com sete divisões verticais, sendo a posição 1 correspondente à mais próxima do piso. Para a realização do experimento, o gerente conseguiu que, durante um dia, todas as posições verticais da prateleira fossem ocupadas pelo seu produto. Ao final do dia, as tabulações das vendas por posição foram as seguintes:

 

Posição

 

Total

 

1

2

3

4

5

6

7

Vendas (unidades)

O i 11

10

15

25

29

19

17

126