Apostila Análise de Dados 2014

Você também pode gostar

Você está na página 1de 28

Centro Paula Sousa

CURSO GESTÃO EMPRESARIAL


DISCIPLINA Análise e Interpretação de Dados
DOCENTE Prof. Me. Marcos Pereira

“Pesquisar é buscar meios de transformar curiosidade


em informação”. A estatística auxilia o pesquisador a ir, por
inferência, mais longe do que seus olhos alcançam”.
Sérgio F. Costa.

Importante:
Este conjunto de textos visa apenas orientar o estudo dos alunos sobre
o conteúdo desenvolvido em sala de aula. Não substitui, portanto, as
discussões em sala de aula sobre os temas abordados ou exercícios nela
desenvolvidos. Nas avaliações realizadas, as anotações de aula e as
correções dos exercícios são igualmente importantes.

São Paulo

Fevereiro / 2014

1
ESTATÍSTICA
 Na Antiguidade, quando os agricultores precisaram de um
método para contar sua produção e seus animais, utilizaram
pequenas pedras, que em latim eram chamadas de calculus.

 No sec. IV, na Índia, adotou-se a numeração de base 10, ao


invés do 6. A introdução do zero deu-se no sec. IX e permitiu
operações mais complexas e precisas. Um século depois,
também na Índia, aparecem os algarismo indu-arábicos.

 A palavra estatística tem raiz latina, em status, de onde se


origina estado. Apenas no final do século XVIII a palavra
estatística surge na Enciclopédia Britânica pelas mãos do
historiador e jurista alemão Gottfried Achenwall.

 A teoria das probabilidades surge a partir do século XVII por


encomenda real. Soberanos queriam utilizar “macetes” que lhes
garantissem ganhar em jogos de azar. Até cientistas de renome
como Pascal e Newton estiveram envolvidos nesses estudos.

 Hoje a definimos como o conjunto de técnicas e métodos que


envolvem planejamento, coleta qualificada de dados,
processamento, análise e inferências sobre um experimento.
 Confere ordem, estrutura e significado aos dados, tornando-os
confiáveis para a tomada de decisões. Identifica variações e
tendências, transformando-os em informações. A variabilidade
(inconstância) dos dados torna a estatística necessária para
organizá-los e melhor interpretá-los.

1) PRINCIPAIS USOS DA ANÁLISE DE INFORMAÇÕES


a) Monitorar a imagem de uma organização/marca/produto e
dos competidores junto ao público visado.
b) Conhecer tendências sobre o público atual e o potencial
antes dos demais concorrentes.
c) Auxiliar na verificação das melhores oportunidades de
negócios, produtos mais valorizados ou em expansão.
d) Desenvolver estratégias de preço, distribuição e promoção
mais adaptados aos segmentos visados.
e) Permite criar parâmetros de desempenho e controle das
funções básicas de marketing.

2
2) TIPOS DE ESTATÍSTICAS
 Estatística descritiva - Descreve a realidade a partir dos dados
obtidos, como se fosse um retrato estático da situação. Permite,
através de medidas de contagem e variabilidade, construir
gráficos e tabelas, ordenar as variáveis, calcular médias e
porcentagens para dar ao pesquisar uma primeira idéia de como
um determinado fenômeno se comporta ou se distribui ao longo
do tempo e do espaço. É uma análise fixa, estática, não cogita
explicar o passado ou saber sobre o futuro. Serve para
organizar, analisar e interpretar os dados disponíveis.

 Estatística inferencial - É dinâmica e permite ao pesquisador


fazer previsões sobre o comportamento de um fenômeno e tomar
decisões mais acertadas, como se fosse uma “bola de cristal”.
Ao tirar conclusões de uma amostra e repassá-las à população-
mãe o pesquisador pode realizar erros de inferência. A Teoria
das probabilidades permite avaliar e o tamanho do erro que se
comete ao fazer generalizações (inferências).

3. TIPOS DE ESTUDOS
 ESTUDO EXPLORATÓRIO - Utilizado para descobrir
explicações novas para um determinado problema, relações de
causa e efeito. A formalidade dá lugar à flexibilidade e à
criatividade na coleta e análise dos dados. Utiliza primeiramente
fontes secundárias para se atualizar a cerca das hipóteses e
prováveis explicações a serem investigadas. Depois o
investigador parte para a pesquisa junto a indivíduos informados,
com forte associação ao problema. Requer do pesquisador um
bom conhecimento do problema.

 ESTUDO DESCRITIVO - Utilizado para descrever as


características de uma determinada situação, como pesquisas de
opinião pública, grau de satisfação de clientes e turistas, ou
identificação do perfil da demanda. Trata-se de um projeto mais
formal, que planeja em detalhes toda a coleta e interpretação dos
dados. Os estudos descritivos se dividem em:

Descritivo Quantitativo
Método Estatístico – Caracteriza-se por estudar uma quantidade
limitada de fatores em grande número de casos/entrevistas. Utiliza

3
forte base de cálculo para dar credibilidade às informações obtidas.
Pode sugerir, mas não comprovar relações de causa e efeito.

Descritivo Qualitativo
a) Método do Estudo de Caso - Analisa grande quantidade de
variáveis em uma unidade pesquisada (caso). Busca
interpretação das inter-relações associadas a um problema,
sendo indicado quando não é possível estudar isoladamente
uma variável. Há dificuldade de generalizar os resultados em
razão da avaliação de poucos casos.
Facilidades - Método bastante flexível, abrange todos os aspectos
importantes num único caso e analisa fenômenos em ambiente real,
sem abstrair partes da realidade.
Dificuldades - Subjetividade e amostra única - dificuldade de
generalizar conclusões, risco de ver só o que se quer ver (viés
antecipado), método mais demorado e necessidade de maior
experiência do pesquisador.
Pesquisador deve ser: observador, flexível, bom ouvinte, capaz de
não envolver seus julgamentos, correlacionar informações e
identificar contradições.
Coleta de dados deve ser: observação e entrevista – com
relatórios mais informais e narrativos (descritiva do que ocorre no
campo e reflexiva com comentários pessoais).
Qualidade dos resultados de um estudo de caso em 4 princípios:
 Massa crítica – múltiplas fontes de evidência.
 Validade interna – comparações e construções de explicações.
 Validade externa – possibilidade de reaplicar o estudo em
outros casos.
 Confiabilidade – protocolo de estudos, procedimentos
seguidos, registro de dados e tabulação de dados observáveis.

b) Pesquisa Documental – investigação de fontes como jornais,


revistas, diários/correspondências pessoais, relatórios,
fotografias, propagandas, filmes, obras literárias ou técnicas para
obter novas interpretações ou contribuições para um problema. É
bastante útil quando é impossível a entrevista com indivíduos
essenciais ao problema (distância, negação ou morte) ou para
interpretar mudanças comportamentais ao longo do tempo.

4
c) Pesquisa Etnográfica - descrição dos eventos que fazem parte
da vida social de um grupo, seja ele uma tribo indígena,
funcionários de uma empresa ou uma comunidade receptora.

 ESTUDO EXPERIMENTAL
Indicado para estabelecer relações de causa e efeito quando é
possível separar/isolar uma variável das demais. Utiliza
experiências artificialmente constituídas com a finalidade de
visualizar a influência dessa variável. Pode ser usado para testar
campanhas publicitárias antes de sua veiculação, promoções,
design de embalagens etc.

4. PESQUISAS QUALITATIVAS

Por se tratar de uma investigação mais profunda na mente humana,


é normalmente realizada por meio de entrevistas pessoais. O
questionário é um instrumento mais impessoal, frio e distante, não
estimula o entrevistado a se abrir e dar respostas confiáveis nesse
tipo de investigação. A seguir são apresentadas as formas mais
comuns e eficientes de realizar uma pesquisa qualitativa.

a) FOCUS GROUP

É utilizada para verificar critérios de escolha de um produto,


referenciais de valor (o que valorizam mais para decidir entre um ou
outro concorrente), conhecer a hierarquia dos atributos
considerados nas decisões do público, entender percepções ou
verificar tendências sobre um determinado mercado.

É uma entrevista com pequenos grupos de pessoas (geralmente


entre 8 a 12 pessoas) que pertençam ao segmento visado. Os
atributos fundamentais são aqueles mencionados por um maior
número de pessoas ou expressados com maior força pelos
entrevistados, possuindo maior peso na análise dos resultados.

Cada sessão pode durar cerca de 90 minutos, tempo suficiente para


ouvir a todos, mas sem cansá-los. O número de sessões dependerá
dos objetivos firmados e da qualidade e confiabilidade das
respostas obtidas, mas normalmente não passa de 5 a 6 sessões.

5
Entrevistadores experientes apenas introduzem os tópicos pelos
quais se interessam e os próprios participantes se encarregam de
conversar descontraidamente sobre o tema proposto. Ouvir é mais
importante do que falar, as pessoas adoram transmitir seus pontos
de vista, emoções e experiências quando são estimuladas. A
entrevista deve ser preparada apenas para as questões básicas. No
mais, o entrevistador deve deixar a conversa correr livremente.

b) FICHA DE AVALIAÇÃO DO CLIENTE

Um excelente método para conseguir avaliar continuamente o grau


de satisfação com os produtos ou serviços de uma empresa é a
aplicação sistemática da ficha de avaliação do cliente. Na verdade,
esse instrumento é mais do que um a pesquisa, trata-se de uma
ferramenta gerencial que otimiza os esforços para alcançar a
qualidade percebida pelos consumidores.

A seguir descrevemos em um exemplo os procedimentos


necessários para sua montagem e aplicação.
A) Aplicação aos clientes de uma tabela simples e concisa com
os atributos fundamentais.
B) Solicitar a classificação dos atributos de acordo com sua
importância.
C) Avaliação da qualidade percebida de cada atributo.
D) Dividir as avaliações em 3 níveis e analisar os resultados com
total imparcialidade.

Exemplo de FICHA DE AVALIAÇÃO – Hotel de praia


ATRIBUTO PRIORIDADE (1 a AVALIAÇÃO (5 a
maior e 12 a menor) maior e 1 a menor)
Beleza cênica/entorno 5 3
Serviço de praia 12 5
Área de lazer 4 4
Frequentadores 7 3
Atendimento recepção 9 5
Conforto 1 4
Bar e restaurante 8 4
Tamanho do apto. 11 3
Decoração 10 5
Café da manhã 6 2
Preço 2 3
Acesso 3 3
6
Todos os itens discriminados na tabela são importantes e merecem
atenção. Porém, a realidade empresarial mostra que a escassez de
recursos força a tomada de decisões sobre a ordem dessas
melhorias, ou seja, estabelecer prioridades. A interpretação da
Ficha de Avaliação dos Clientes ajuda empresas a hierarquizar os
investimentos a serem feitos. No exemplo dado, comparamos a
importância de cada atributo com a avaliação recebida.

É possível ver que dentre os itens de maior prioridade, conforto e


área de lazer foram bem avaliados, mas devem ser melhorados. Já
os itens preço e acesso receberam avaliações apenas regulares.
No atual momento competitivo, regular deve ser entendido como
ruim (não podemos nos contentar em apenas NÃO ser o pior).

No segundo nível de prioridades, café da manhã e frequentadores


não foram bem avaliados. Mas chama a atenção que os itens de
menor prioridade para o público receberam as melhores avaliações
dos entrevistados, o que reflete um descompasso entre a visão da
administração do hotel e a da sua demanda.

Em um primeiro momento de investimento, o hotel deveria


direcioná-lo para melhorar o conforto e área de lazer, a fim de
contrapor o preço e a localização, que não é possível melhorar no
curto prazo. Apesar de outros itens terem tido uma avaliação pior,
esses dois itens causam maior impacto junto ao público.

Após serem feitos os investimentos nos quesitos mais importantes e


que não receberam uma boa avaliação, devemos avaliar onde o
restante dos recursos deve ser aplicado. No segundo momento de
investimento devem ser incluídos o café da manhã e algo referente
ao público frequentador, em razão das baixas avaliações e médias
classificações. Por último, melhorias no bar e no restaurante
deveriam ser feitas num terceiro momento de investimento, já que a
avaliação foi boa e a prioridade é baixa.

5. DADOS E INFORMAÇÕES

Dado – aquilo que se toma por base para realizar uma análise
quantitativa ou qualitativa.

Informação - resultado do processamento, manipulação e


organização de dados, de forma a modificar o conhecimento da
pessoa ou organização que a recebe.
7
Exemplo 1 – Saber que 25,2% dos estrangeiros que visitaram o
Brasil em 2012 desaprovaram a sinalização turística é apenas um
dado, nada além disso. Mas verificar que esse índice é
históricamente o que mais desagrada esses visitantes, e que o seu
valor era de 15,1% em 2001, é mais que um dado, passa a ser uma
informação importante para o planejamento dessa atividade.

Percebe-se que o país tem falhado em resolver o que mais


atrapalha o seu público-alvo, já que o desagrado é contínuo e tem
aumentado. Isso modifica o conhecimento do planejador e pode
influenciar suas decisões.

Exemplo 2 - O assistente da gerência comercial de uma grande


empresa entrega seu relatório de vendas onde detalha a data de
cada venda, o nome do cliente, itens adquiridos, o valor bruto da
compra, desconto, valor líquido da venda e o prazo de pagamento.
Esses dados só se tornarão informações se o gerente comercial,
por sua conta, separar o valor líquido das vendas e perceber que
35% das vendas representam 70% da receita do mês, e que 75%
dos pedidos foram feitos na primeira quinzena do mês.

Identificar os principais compradores e os clientes menos rentáveis,


além do momento propício para oferecer os produtos, pode ser de
grande valia para essa gerência e alterar algumas políticas até
então adotadas pela empresa.

Levantar dados é um trabalho inicial, por vezes difícil ou trabalhoso,


e de grande importância. Porém, não são um fim em si mesmos.
Precisam ser adequadamente analisados/trabalhados para gerarem
informações, ou seja, agregar conhecimento.

6. FONTES DE INFORMAÇÃO

 Dados secundários - Informações já publicadas que auxiliam na


tomada de decisões. Podem vir de duas fontes:
 Externas - disponíveis em associações de classe, órgãos oficiais
e publicações em geral. Neles podemos encontrar dados
importantes sobre tendências sobre o tema pesquisado.
 Internas - encontrados na própria organização. Departamentos
produzem relatórios e estudos que podem igualmente ser
utilizados na elaboração de estratégias setores correlatos.

8
Antes da pesquisa de campo devemos esgotar a busca por dados
secundários. Isso reduz esforços desnecessários e oferece
indicações novas sobre o que deve ser levantado em campo. É
indicado consultar o IBGE, FGV, Bacen, Fundação Seade e
entidades de classe. A análise de dados secundários deve seguir
os seguintes princípios:
Encontrar – busca de dados em fontes confiáveis (pesquisadores
ou instituições renomadas, órgãos públicos/oficiais, associações de
classe, sindicatos ou indivíduos de notório saber sobre o tema)
Filtrar – Deve-se focar ao máximo no objetivo da pesquisa e
aproveitar o que de fato é relevante. O excesso de dados dificulta o
trabalho do pesquisador e a compreensão do leitor.
Interpretar – Apenas colocar os dados filtrados na pesquisa torna o
conteúdo do relatório fraco. Todos os dados citados/mostrados
merecem uma análise mais aprofundada, explicando como
interferem no resultado final. Dado X Informação !
Comunicar – Dados levantados e interpretados devem ser também
divulgados, sendo necessário fazê-los circular. Dados escondidos
não formam um banco de dados, mas um bando de dados.

 Dados primários - Informações ainda não pesquisadas devem


ser levantadas diretamente junto ao público visado. Por requerer
tempo, equipamentos e recursos humanos (sendo muitas vezes
cara), a pesquisa de dados primários deve ser muito bem
planejada para ser objetiva e evitar desperdícios de recursos.

7. PLANEJAMENTO DA PESQUISA
Algumas pesquisas não dão certo por falta de planejamento inicial.
Quer pela pressa em obter dados, ou pela falta de experiência, o
impulso imediato de logo elaborar um questionário e entrevistar o
público é o meio mais rápido de fracassar. Uma pesquisa é um
projeto, e como tal deve ser planejado em etapas:

A) Objetivos e tipo de estudo - razão pela qual está sendo


realizada, ou o problema-chave a ser investigado. Sem ele, muito
será investigado sem necessidade e questionamentos relevantes
ficarão de fora, por isso é a etapa mais importante do
planejamento. Um objetivo bem definido torna a pesquisa mais
simples aos entrevistados e útil ao entrevistador.
9
B) Orçamento - quanto custará ao município a sua realização. A
ausência da etapa anterior ajuda a elevar os custos da pesquisa.
C) Cronograma - quando será realizada cada etapa de seu projeto.
Não pode ser meramente figurativo, a indisciplina em segui-lo
torna a pesquisa mais onerosa e demorada.
D) Gestão - mostra quem ficará responsável por cada etapa.
Distribui tarefas e garante sua perfeita execução.
E) População e Amostra - definição da população a ser
pesquisada e amostra trabalhada:

 População = conjunto de todos os indivíduos que compõem o


universo de interesse do pesquisador.
 Amostra = subconjunto adequadamente extraído de uma
população, oferecendo um retrato próximo da realidade.
 A amostragem se faz necessário quando o processo de
pesquisa for: destrutivo, caro ou muito demorado. Se
toda a população for pesquisada, torna-se um censo.
F) Instrumento de coleta de dados - definição da forma como os
dados serão coletados; pessoalmente, correio, internet, telefone...

8. PESQUISA QUANTITATIVA

Utilizada para definir perfil do mercado, estimar a demanda de um


produto ou para verificar o grau de satisfação com a oferta de
produtos. Usa como instrumento básico de coleta de dados o
questionário. É dedutivo e conclusivo, mas não oferece explicações
sobre a ocorrência dos eventos pesquisados.

Métodos para dimensionamento da amostra


O cálculo da amostra necessária a uma determinada pesquisa
dependerá de 3 fatores básicos: o tamanho da população
(universo da pesquisa), erro máximo de estimativa que o
pesquisador permite e grau de confiança (probabilidade de que o
valor encontrado esteja dentro da margem de erro). Quanto maior o
grau de confiança e menor o erro permitido, maior será o tamanho
da amostra necessário ao pesquisador.
Apresentaremos a seguir 3 métodos de determinação da amostra.
O primeiro deles é dos autores Arkin e Colton, que construíram
uma tabela relacionando o tamanho do universo com a margem de
erro desejada, a partir de um coeficiente de confiança fixo em 95%:

10
Outro método é utilizado para universos grandes, onde se sabe que
a amostra será proporcionalmente pequena (menor do que 10% do
universo), e o pesquisador pode variar margem de erro e grau de
confiança. Esse cálculo pode ser realizado pela seguinte fórmula:

n = tamanho da amostra
(Zα/2) = valor crítico associado ao grau de confiança desejado
E = erro máximo permitido

O grau de confiança mostra o percentual de certeza com que se


quer trabalhar, sendo os mais comuns 90%, 95% e 99%. Através da
tabela t de Student (tabela de distribuição probabilística) pode-se
verificar o valor crítico associado a esses 3 níveis:

Grau de confiança Valor crítico

90% 1,645

95% 1,96

99% 2,575

11
Exemplo: Qual o tamanho da amostra que um pesquisador precisa
para saber a opinião dos turistas que visitaram à lazer um destino Y
sobre a receptividade local? Sabe-se que esse universo é composto
por 200 mil indivíduos/ano, o pesquisador quer um grau de
confiança de 95% e aceita uma margem de erro máxima de 3%.

Pelo tamanho do universo já se sabe que a amostra não será


proporcionalmente grande, ou seja, cabe utilizar a fórmula dada:

Ou seja, dentro dessas condições o pesquisador precisaria realizar


1.067 entrevistas, que representa 0,5% da população. Caso seja
mais exigente e queira trabalhar com apenas 1% de erro, a amostra
subiria para 9.604 entrevistas!!!! (4,8% da população).
Se quisesse trabalhar com grau de confiança de 90% e 5% de
margem de erro, o número de entrevistas cairia para 271 (0,13%).
Dependendo das condições o pesquisador pode fazer simulações
para determinar qual grau de confiança e margem de erro aceitará.

Nem sempre o pesquisador trabalha com grandes números, ele


pode se deparar com populações finitas, onde a amostra será
grande (%). Se uma empresa trabalha com grandes projetos e
possui 20 clientes, entrevistar 8 deles representa 40% da
população. Nesses casos utiliza-se uma correção na fórmula
anterior, como vemos a seguir:

Exemplo: Qual o tamanho da amostra que um pesquisador precisa


para saber a opinião dos expositores de um evento de médio porte
sobre as tendências do setor? O evento teve 80 expositores, o
pesquisador quer um grau de confiança de 95% e aceita uma
margem de erro máxima de 5%.

12
( )

Ou seja, dentro dessas condições o pesquisador precisaria


investigar 80% dos expositores, o que é um tanto difícil. Caso
aceitasse um grau de confiança de 90% e uma margem de erro de
10% ele teria que entrevistar apenas 37 expositores, ou 46% dos
expositores, tornando a tarefa bem mais facilitada sem
comprometer tanto a confiabilidade dos resultados.

 TÉCNICAS PARA ELABORAÇÃO DE QUESTIONÁRIOS

1) Conseqüência direta dos objetivos estabelecidos - quanto mais


específico e claro, mais simples e curto será ele.
2) Entrevistados não estão dispostos a responder todas as nossas
dúvidas, é necessário eleger prioridades. O questionário deve
ser curto, porém completo quanto às prioridades do pesquisador.
3) No caso de envio de formulários, a amostra deve ser maior do
que é necessário. Muitas pessoas não respondem as pesquisas.
4) Utilize preponderantemente questões fechadas, iniciando o
questionário com os dados pessoais. Uma ou duas questões
abertas podem ser feitas no final do questionário.
5) Ofereça alternativas de resposta por faixas quando for
necessário pesquisar idade e renda dos entrevistados.
6) As questões devem ser simples e de linguagem mais acessível
possível. O entrevistado não pode perder tempo tentando
entender o sentido do que lhe foi perguntado.
7) Evite perguntas genéricas, pesquisas de mercado precisam obter
dados objetivos e conclusivos. Saber que alguém qualificou algo
como bom, não nos leva a lugar algum.
8) Evite perguntas compostas ou que possam constranger o
entrevistado, induzindo-o a uma determinada resposta.
9) Faça um teste piloto para identificar deficiências e faça os
ajustes que julgar necessário no questionário final.
10) Faça cruzamento de respostas. Saber, por exemplo, que 20%
dos entrevistados não aprovaram um serviço é muito menos
significativo do que saber quem disse isso, qual sua renda,
quantas vezes visita comprou, a quanto tempo compra, etc.

13
9. PRINCIPAIS ESCALAS DE AVALIAÇÃO

 Escala de avaliação verbal


MUITO
ATRIBUTO ÓTIMO BOM REGULAR RUIM
BOM
Preço X
Café da manhã X
Business center X
Restaurante X
Decoração X
Espaço para X
eventos

 Escala de ordenação – medir a ordem de atitudes ou


preferências

Montadora Classificação Atributo Classificação


A 2º. Preço 1º.
B 4º. Financiamento 6º.
C 1º. Manutenção 4º.
D 6º. Consumo 5º.
E 3º. Conforto 3º.
F 5º. Design 2º.

 Escala comparativa
Melhor do Pior do Não sei
Concorrentes de A Igual a A
que A que A avaliar
Empresa B X
Empresa C X
Empresa D X
Empresa E X

 Escala Stapel
Atributo Avaliação
Pzo de pagamento -5 -4 -3 -2 -1 1 2 3 4 5
Assistência técnica -5 -4 -3 -2 -1 1 2 3 4 5
Atendimento -5 -4 -3 -2 -1 1 2 3 4 5

14
 Escala de soma constante – verificar a ordem e o intervalo
de preferência do consumidor.
Ex: Distribua 100 pontos entre as marcas abaixo de acordo
com sua preferência.
Concorrentes Pontos
Sansung 40
LG 30
Nokia 15
Motorola 10
Sony Ericsson 05

 Escala de diferencial semântico (Osgood)


Assinale sua opinião sobre os seguintes atributos do Bar X
Limpo ..... ..... ..... ..... ..... ..X.. ..... Sujo
Bonito ..... ..... ..X.. ..... ..... ..... ..... Feio
Barato ..... ..... ..... ..... ..X.. ..... ..... Caro

 Escala Likert
Afirmações Concordo Concordo Indeciso Discordo Discordo
totalmente pouco pouco totalmente
Ambiente é X
aconchegante
Atendimento é X
cortês
Pouco tempo X
de espera
Cardápio é X
variado

Pode também usar as expressões: aprovo totalmente, aprovo


parcialmente, indeciso, desaprovo um pouco, desaprovo totalmente

15
10. TIPOS DE GRÁFICOS

 COLUNA – é o nome popular do histograma, que representa a


distribuição de uma variável. São úteis para mostrar as
alterações de dados em um período de tempo ou para ilustrar
comparações ou contagem entre itens e escalas de medição.

 “PIZZA” - mostra o tamanho proporcional dos itens em uma


série de dados (exibidos como um percentual de toda a pizza).
Mais indicado para mostrar a distribuição de poucos itens, ou
quando nenhum deles for igual ou próximo de zero.

16
 LINHA – É o gráfico poligonal. Mostra a distribuição de dados
contínuos ao longo do tempo e, em intervalos iguais, como anos,
trimestres ou meses. Útil para demonstrar variações ou
flutuações cronológicas com freqüência acumulada.

17
 Barras – mostra comparações entre itens individuais,
normalmente quando os rótulos ou valores forem longos.

 Dispersão (XY) – mede a uniformidade dos valores. Uteis para


verificar a estabilidade da frequência da variável.

18
 De área - enfatiza as alterações das variáveis ao longo do tempo
mais a participação de cada uma delas para o valor total.

 Radar (ou Polar) - comparam os valores agregados de várias


séries de dados. Útil para demonstrar variações cíclicas.

19
11. MEDIDAS DE TENDÊNCIA CENTRAL

Busca o valor central de uma determinada série de dados.

a) MÉDIA ARITMÉTICA - indica a centralidade de um conjunto, que


pode configurar uma tendência, possibilitando que sejam
desenvolvidas ações para satisfazer a maior parte do público
estudado. Quando a série envolve muitos dados (por exemplo:
R$115,80, R$98,90, R$132,20, R$ 119,40, R$120,00, R$108, 50,
R$97,20, R$92,10, R$112, 00, R$86,30, R$149,80 e R$94,60;

é necessário utilizar a fórmula: X
_
Onde: X = símbolo da média
∑ Xi = somatório de todos os valores da variável
n = tamanho da amostra

Temos então:
_
X=∑ = 110,56

Com uma série grande de dados, como a que apresentamos a


seguir: (60, 19, 20, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36,
37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 49, 50, 55, 56, 57, 58, 60,
18, 19, 20, 20, 21, 22, 23, 23, 24, 25, 25, 25, 26, 26, 26, 30, 30, 30,
30, 31, 32, 33, 33, 34, 34, 34, 35, 41, 43, 44, 45, 46, 47, 48, 49, 50,
53, 55, 56, 57, 58, 27, 27, 27, 28, 28, 28, 28, 29, 29, 29, 36, 36, 36,
37, 37, 38, 38, 39, 38, 40, 38, 40, 38, 40, 40 e 40), a primeira coisa
a fazer é organizar os dados por ordem crescente:
18, 19, 19, 20, 20, 20, 21, 22, 22, 23, 23, 23, 24, 25, 25, 25, 25, 26,
26, 26, 26, 27, 27, 27, 27, 28, 28, 28, 28, 28, 29, 29, 29, 29, 30, 30,
30, 30, 30, 31, 31, 32, 32, 33, 33, 33, 34, 34, 34, 34, 35, 36, 36, 36,
36, 37, 37, 37, 38, 38, 38, 38, 38, 38, 39,39, 40, 40, 40, 40, 40, 40,
41, 41, 43, 43, 44, 44, 45, 45, 46, 46, 47, 47, 48, 49, 49, 50, 50, 53,
55, 55, 56, 56, 57, 57, 58, 58, 60 e 60.

o A média é uma medida única, fácil de ser entendida, calculada e


utilizada. Entretanto, pode ser afetada por valores extremos do
conjunto de dados. È a medida ideal quando precisamos saber o
quanto algo (processo, sistema...) se aproxima ou se distancia
do alvo (meta, controle de qualidade etc).

20
b) MEDIANA - Trata-se do valor situado no meio da distribuição,
depois que os dados forem ordenados.
o Se o conjunto de dados for ímpar, a mediana corresponde ao
valor situado no meio da distribuição. Se o conjunto de dados for
par, a mediana corresponde à média aritmética dos dois valores
centrais. No caso acima, onde a distribuição das idades forma
um conjunto de dados igual a 100:
Md = (34 + 35) / 2 = 34,5 anos

o A mediana é uma medida única, fácil de ser entendida e


calculada, além de não ser afetada pelos valores extremos.
Entretanto, como não considera todos os valores da variável,
costuma ser menos confiável que a média (exceto nos casos
onde os valores extremos são muito díspares).

c) MODA - Corresponde ao valor mais freqüente de uma


distribuição. Quando não há repetição de valores não é possível
identificar a moda (Mo).
o No caso estudado, há uma série de dados bimodal, 38 e 40
anos, que se repetem 6 vezes na distribuição dos dados.
o A moda é uma medida fácil de ser entendida e encontrada e não
é afetada por valores extremos do conjunto de dados. Como não
considera todos os valores da variável e pode estar distante do
centro dos valores, costuma ser menos confiável que a média.
o É a medida ideal quando é necessário saber o valor típico da
variável, como por exemplo, quantos itens de um produto são
mais comumente adquiridos pelos clientes de um supermercado.

12. MEDIDAS DE DISPERSÃO

Nem sempre as medias centrais caracterizam bem uma variável.


Por vezes um conjunto de dados possui alta dispersão, ou seja, se
afastam muito entre si, o que pode inviabilizar conclusões tiradas a
partir da observação apenas de suas médias. Faz-se, portanto,
necessário calcular a variabilidade da amostra para identificar se
um determinado conjunto de dados é estável.

21
a) VARIÂNCIA
o Imaginemos dois conjuntos de dados representando o número
de faltas de funcionários em dois departamentos da mesma
empresa em um determinado mês:

RH (2, 5, 3, 1, 4) e MKT (0, 10, 4, 1, 0)


_
o Ambos possuem n = 5 e X = 3, mas o bom senso nos diz que
eles não iguais, pois a distância entre os valores é muito grande.
o No RH o máximo de faltas é 5, enquanto que no MKT é 10.
Todos os funcionários de RH faltaram, e dois funcionários no
MKT nunca faltaram.

o Não há Mo em RH, e em MKT a Mo é 0.

o A Md de X é 3 e em MKT é 1. A Md representa bem Y?


o Para verificar o grau de variabilidade dos dados, foi desenvolvido
o cálculo da variância, demonstrado na tabela abaixo:
_ _
Xi Xi - X = xi Xi² Yi Yi - Y = yi Yi²
2 2-3 = -1 1 0 0-3 = -3 9
5 5-3 = 2 4 10 10-3 = 7 49
3 3-3 = 0 0 4 4-3 = 1 1
1 1-3= -2 4 1 1-3 = -2 4
4 4-3 = 1 1 0 0-3 = -3 9

∑Xi = 15 ∑xi = 0 ∑xi² = 10 ∑Yi = 15 ∑yi = 0 ∑yi² = 72

Variância = s² (X) = ∑xi² / n s² (y) = ∑yi² / n


2 2
⁄ ⁄

o No cálculo da variância n = tamanho da população, que no


exemplo visto é igual a 5. Ou seja, o total de funcionários de
cada departamento é 5. Caso o cálculo seja feito com uma
amostra, utiliza-se n-1. Se houvesse 30 funcionários no
departamento e utilizássemos uma amostra de 8 funcionários, a
variância trabalharia com n-1, ou seja, 7.

22
 DESVIO PADRÃO
o É fácil perceber quão pouco objetivo é trabalhar com medidas
como faltas/vendas/viagens/reclamações/peças rejeitadas/R$ ao
quadrado.
o Por esse motivo utiliza-se o desvio padrão, que mantém a
unidade de medida, porém de forma mais objetiva/prática. Sua
fórmula é: √ No caso acima, temos que:

S (X) = √ = 1,41 falta S(Y) = √ = 3,8 faltas

 COEFICIENTE DE VARIAÇÃO
o Para medir quanto o desvio padrão varia em relação ao conjunto
de dados é necessário calcular o coeficiente de variação (CV).
Sua fórmula é:

No caso das faltas temos:



o Esse coeficiente nos mostra que os dados de Y variam muito
mais em relação à média, sendo, portanto, um conjunto bastante
instável e pouco sensível às medidas de tendência central.

13. CORRELAÇÃO LINEAR SIMPLES

Duas variáveis podem estar associadas. Algumas vezes isso ocorre


de maneira evidente, como a ingestão de bebida alcoólica (X-
variável independente) e a normalidade da fala/equilíbrio (Y-
variável dependente). Quanto maior o evento de X, menor será o
de Y. Em outras situações, entretanto, é necessário calcular o
coeficiente de correlação para verificar se uma variável é a causa
de outra. Verificar essa dependência é o primeiro passo para
realizar boas previsões, e para tal, torna-se necessário:

1) Cuidadosa coleta de dados X e Y (conjunto estável de dados)


2) Construção do diagrama de dispersão e análise visual da
distribuição dos pontos no gráfico.
3) Cálculo do coeficiente de correlação linear simples de Pearson.

23
Para demonstração, exemplificamos com a situação de um
município Z que começou a receber investimentos para construção
de casas populares (X) e também viu crescer a venda de calçados
nas suas lojas (Y). É preciso saber então se há alguma correlação
entre essas variáveis. A primeira tarefa foi cumprida, a coleta de
dados confiáveis e estáveis, como mostrado a seguir.

Ano Casas Venda de calçados


2005 12.000 12.000
2006 14.000 12.000
2007 13.000 11.000
2008 15.000 13.000
2009 18.000 14.000
2010 20.000 17.000

O gráfico com os dados acima forma a seguinte configuração:


18.000

Casas populares X Calçados


16.000

14.000

12.000

10.000
Calçados
8.000

6.000

4.000

2.000

0
10.000 12.000 14.000 16.000 18.000 20.000 22.000

Como é possível verificar visualmente, a distribuição dos pontos é


bastante linear, sendo possível calcular o coeficiente de correlação
linear simples de Pearson, através da seguinte fórmula:

∑ ∑ ∑
√ ∑ ∑ ∑ ∑

24
Para facilitar a resolução dessa fórmula é preciso construir a tabela:

Xi Yi XiYi Xi² Yi²


12 12 144 144 144
14 12 168 196 144
13 11 143 169 121
15 13 195 225 169
18 14 252 324 196
20 17 340 400 289
∑ = 92 ∑ = 79 ∑ = 1.242 ∑ = 1.458 ∑ = 1.063

Temos então:

rxy = 0,93

Interpretação do resultado
 O coeficiente de correlação linear simples varia de -1 a 1.
 Zero significa ausência de correlação, os pares de valores se
distribuem em nuvem sem nenhuma tendência.
 Valor positivo significa crescimento das duas variáveis no
mesmo sentido. Quanto maior o coeficiente, maior será a relação
de dependência entre os pares de valores, como a relação entre
investimento em formação acadêmica e rendimento salarial.
 1 significa dependência positiva totalmente proporcional.
 Valor negativo significa que na medida em que uma variável
cresce, a outra decresce. Quanto maior a negatividade, maior
será a relação inversa de dependência entre os pares de valores,
como a correlação entre a iluminação pública e número de
ocorrências policiais em uma determinada área.
 -1 significa dependência negativa totalmente proporcional.

25
14. REGRESSÃO LINEAR SIMPLES

Havendo correlação entre duas variáveis, é possível estimar um


valor Y desconhecido a partir de um valor X conhecido, ou ainda, a
quantidade de pares de sapatos vendidos se a quantidade de casas
populares construídas subir para 25.000 unidades. Esse cálculo
(Regressão Linear) permite que o pesquisador possa fazer
projeções sobre o seu tema. Ele se baseia na equação da reta:

Y = a + bX, que atravessa a distribuição dos dados


correlacionados.
18.000

16.000

14.000

12.000
Calçados
10.000

8.000

6.000

4.000

2.000

0
10.000 12.000 14.000 16.000 18.000 20.000 22.000

Para determinar a, utiliza-se a seguinte fórmula:

∑ ∑ ∑ ∑
∑ ∑

Aplicando a fórmula de a no exemplo dado, temos:

Para determinar b, utiliza-se a seguinte fórmula:

∑ ∑ ∑
∑ ² ∑ ²

26
Aplicando a fórmula de a no exemplo dado, temos:

Tendo já determinado a e b, é possível determinar o volume de


vendas de calçados a partir do aumento na construção de casas
populares. Se a secretaria de habitação prevê investimentos
equivalentes a 25.000 casas populares, os lojistas de calçados
podem esperar vendas no patamar de:

Y = 3,23 + (0,65 x 25)


Y = 19,48 = 19.480 calçados

É possível também determinar quantas casas populares devem ser


construídas para elevar a venda de calçados a 20.000 pares.

20 = 3,23 + 0,65X
X = 20 – 3,23 / 0,65
X = 25.800 casas populares

27
Referências bibliográficas:

LAPPONI, Joan Carlos. Estatística usando Excel. São Paulo:


EDUSP, 1997
MATTAR, Fauze N. Pesquisa de Marketing. São Paulo: Atlas,
2002.
SHIRAISHI, Guilherme. Pesquisa de marketing. São Paulo:
Pearson, 2012.
TIBONI, Conceição Gentil. Estatística básica para o curso de
turismo. São Paulo: Atlas, 2003.

Referências eletrônicas:

Banco Central - http://www.bcb.gov.br/


Fundação Getúlio Vargas - http://portalibre.fgv.br/
Fundação SEADE - http://www.seade.gov.br/
IBGE - http://www.ibge.gov.br/home/

28

Você também pode gostar