Escolar Documentos
Profissional Documentos
Cultura Documentos
Primeiras impressões
Quero ficar bonita e
bem-arrumada para causar a
impressão certa.
Analise
Com os dados em mãos, vo
cê
pode analisá-los e gerar da
dos
estatísticos. É possível calcu
lar
a probabilidade de determi
nados
eventos ocorrerem, testar
idéias e
indicar a confiança que vo
cê tem nos
resultados obtidos.
A estatística é baseada em fatos, mas, mesmo assim, eles podem às vezes ser enganosos.
Podem ser usados para dizer a verdade — ou a mentira. O problema é como saber
quando estão dizendo a verdade a você e quando estão contando uma mentira.
Ter um bom conhecimento em estatística coloca você em uma posição privilegiada.
Você se torna muito mais bem preparado para dizer quando determinados dados
estatísticos estão errados ou são enganosos. Em outras palavras, o estudo da estatística é
uma excelente forma de ter certeza de que você não vai ser enganado.
Como exemplo, veja os lucros obtidos por uma empresa no último semestre do ano
passado.
1,5
1,0
0,5
0,0
Jul Ago Set Out Nov Dez
Mês
2,5
2,4
2,3
2,2
2,1
2,0
Jul Ago Set Out Nov Dez
Mês
4 Capítulo 1
visualizando informações
não existem
Perguntas Idiotas
P: Por que não se basear simplesmente nos P: Qual é a diferença entre informações e dados?
R:
dados? Por que colocá-los em um gráfico?
Outros
Armas 1.500
3.500
Ação
6.000
Esporte
Estratégia 27.500
11.500
PODERDO
CÉREBRO
Observe o gráfico de setores que o diretor elaborou. O que representa
cada fatia? O que você pode inferir com relação à popularidade relativa
dos diferentes gêneros de videogame?
8 Capítulo 1
visualizando informações
Falha no gráfico
O gráfico de setores funcionou tão perfeitamente para exibir as unidades
vendidas por gênero que o diretor executivo decidiu criar outro gráfico para
demonstrar a satisfação dos consumidores com os jogos da Manic Mango.
O diretor precisa de um gráfico que permita comparar a porcentagem de
jogadores satisfeitos para cada gênero de jogo. Ele rodou os dados novamente
no software gráfico, mas, dessa vez, não ficou tão impressionado assim.
Outros Esporte
O que houve aqui? Todas as 85% 99%
fatias têm o mesmo tamanho, mas
as porcentagens são todas diferentes
e muito maiores que as fatias. Será que
você poderia me ajudar a consertar
este gráfico? Agora?
Armas
95%
Estratégia
90%
Diretor
jogadores.
Geralmente, também é um pouco confuso
Gráficos
executivo da
Manic Mango
identificar os gráficos de setores com
porcentagens que não estão relacionadas à de setores
proporção total da fatia. Como exemplo, a fatia
referente a Esporte é identificada com 99%,
mas ela preenche somente cerca de 20% do
representam
gráfico. Outro problema é que não sabemos
se há um número igual de respostas para proporções
cada gênero; por isso, não sabemos se é justo
comparar a satisfação entre gêneros dessa forma.
PODERDO
CÉREBRO
Observe os dados e pense nos problemas que existem com este gráfico.
Que tipo de gráfico seria melhor para esse tipo de informação?
A escala
referente
às vendas
fica aqui. a as
A altura de cada barra mostr la região.
10000 de s pa ra aq ue
vendas em unida Vendas (unidades)
9000
8000 Cada barra
7000 representa uma Região Vendas
região. (unidades)
Vendas (unidades)
6000
A 1.000
5000
B 5.000
4000
C 7.500
3000
D 8.000
2000
E 9.500
1000
0
A B C D E
Vendas por Região em Unidades
10 Capítulo 1
visualizando informações
Estratégia
Gênero Porcentagem
Satisfeita
Ação Esporte 99%
Estratégias 90%
Armas Ação 85%
Armas 95%
Outros 80%
Outros
Estratégia
Ação
Armas
Outros
Aqui estão as porcentagens.
0 10 20 30 40 50 60 70 80 90 100
Porcentagem Satisfeita
12 Capítulo 1
visualizando informações
Esporte Satisfeitos
antas
Estratégia Este gráfico reflete qu
itas,
pessoas estão satisfe em.
ntag
em vez de usar porce
Ação
Armas
Outros
Esporte Satisfeitos
Insatisfeitos
Estratégia
Ação
Armas
Outros
Esporte Satisfeitos
Insatisfeitos
Estratégia
Ação
Armas
Outros
Continente Vendas
(unidades)
América do Norte 1.500
América do Sul 500
Europa 1.500
Ásia 2.000
Oceania 1.000
África 500
Antártida 1
2006
Esporte
2007
Estratégia
Gênero
Ação
Armas
Outros
Europa
Continente Vendas
Continente Ásia
(unidades)
Oceania
América do Norte 1.500
América do Sul 500 África
2007
Estratégia
16 Capítulo 1
visualizando informações
A freqüência é o
número de vezes que
Estes dados parecem uma pontuação é
diferentes dos outros tipos de atingida dentro de
dados que vimos até agora. Será que por cada intervalo.
causa disso devemos tratá-los de forma
diferente?
PODERDO
CÉREBRO
Faça uma revisão no capítulo. Que diferença você
acha que existe nesse tipo de dados? Que impacto
você acha que isso poderia ter nos gráficos?
Dados categóricos ou
qualitativos
A maioria dos dados que vimos
até agora é composta por dados
categóricos. Os dados são divididos em
raças
categorias que descrevem qualidades
ou características. Por esse motivo,
de cães
também são chamados de dados
qualitativos. Um exemplo de dados
qualitativos são os gêneros dos jogos;
cada gênero forma uma categoria
separada.
O principal a ser lembrado com tipo de
sobremesa
relação a dados qualitativos é que
os valores dos dados não podem ser
interpretados como números.
comprimento
tempo
Então, qual é o impacto que isso tem nos gráficos da Manic Mango?
18 Capítulo 1
visualizando informações
199 200
Histogramas não devem ter espaços vazios entre as barras; portanto, para resolver
esse problema, prolongamos seus intervalos um pouco. Em vez de um intervalo
que termina na pontuação 199 e outro que começa na pontuação 200, fazemos
com que os dois intervalos se encontrem em 199,5, da seguinte forma:
199.5
Ao fazer isso, você cria um limite único e tem a certeza de que não há
nenhum espaço vazio entre as barras no histograma. Se fizermos o
mesmo para o restante dos intervalos, obteremos os seguintes limites:
Cada intervalo abrange 200 pontuações, e a largura de cada intervalo é 200. Cada
intervalo tem a mesma largura.
Como todos os intervalos têm a mesma largura, criamos o histograma traçando
barras verticais para cada intervalo de pontuação, usando os limites para formar o
ponto inicial e final de cada barra. A altura de cada barra é igual à freqüência.
20 Capítulo 1
visualizando informações
Pontuação Freqüência
0–199 5
200–399 29
400–599 56
600–799 17
800–999 3
Tente usar os limites das classes para criar um histograma para esses dados.
Lembre-se de que a freqüência fica no eixo vertical.
60
50
40
30
20
10
0 100 200 300 400 500 600 700 800 900 1000
Pontuação Freqüência
0–199 5
200–399 29
400–599 56
600–799 17
800–999 3
Tente usar os limites das classes para criar um histograma para esses dados.
Lembre-se de que a freqüência fica no eixo vertical.
barra referente às
20 pontuações de 600
a 799 vai de 599,5 a
799,5.
10
0 100 200 300 400 500 600 700 800 900 1000
Pontuação
22 Capítulo 1
visualizando informações
não existem
Perguntas Idiotas
P: Então um histograma é usado basicamente
Como exemplo, se marcássemos o intervalo de 0 a 199
prolongando-o do valor 0 ao valor 199, a largura sobre o
para dados numéricos agrupados?
gráfico seria de apenas 199 – 0 = 199.
R: Sim. A vantagem de um histograma é que, por ser
numérico, você pode usá-lo para mostrar a largura de
P: Então por que fazemos com que as barras se
cada intervalo bem como a freqüência. encontrem no meio do caminho entre os dois?
PONTOS DE BALA
¢¢ Freqüência é uma forma estatística de dizer categóricos se os nomes das categorias
quantos itens existem em uma categoria. forem curtos.
¢¢ Gráficos de setores são adequados para ¢¢ Você pode representar vários conjuntos
representar proporções básicas. de dados em um gráfico de barras, e
pode escolher como fazer isso. É possível
¢¢ Gráficos de barras oferecem mais comparar freqüências mostrando barras
flexibilidade e precisão. relacionadas lado a lado em um gráfico de
¢¢ Dados numéricos trabalham com números barras com divisão de categorias. É possível
e quantidades; dados categóricos trabalham mostrar proporções e freqüências totais
com palavras e qualidades. empilhando as barras uma em cima da outra
em um gráfico de barras segmentado.
¢¢ Gráficos de barras horizontais são
usados para dados categóricos, ¢¢ As escalas dos gráficos de barras podem
principalmente onde os nomes das representar porcentagens ou freqüências.
categorias são muito longos. ¢¢ Existem muitas variedades para cada tipo de
¢¢ Gráficos de barras verticais são usados gráfico..
para dados numéricos, ou dados
Horas Freqüência
Este é o número de
horas 0–1 4,300 Esta é a freqüência com que
que as pessoas pa ss am as pessoas jogam durante
1–3 6,900
jogando esse espaço de tempo
3–5 4,900
5–10 2,000 Aqui o número 4,300 (por
10–24 2,100 exemplo) significa na
verdade 4300 (a vírgula
deve ser desconsiderada)
Há algo de engraçado
nesses dados. Eles estão
agrupados como da última vez,
mas nem todos os intervalos
têm a mesma largura.
PODERDO
CÉREBRO
No caso de histogramas, a freqüência é proporcional
à área de cada barra. Como você usaria esse fato
para criar um histograma para esses dados? O que
você deve levar em consideração?
24 Capítulo 1
visualizando informações
7000
6000
5000
4000
luna
Por que esta co
3000
é tão GRA N D E?
2000
1000
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Horas
e2
Este é o grupo de 1 a 3; ele abrang
e, por isso, a larg ura é 2.
horas inteiras
100
1 200
2 300
3
Amplitude de
Calculando o resto das larguras, obtemos:
classe
Horas Freqüência Largura
0–1 4,300 1
1–3 6,900 2
3–5 4,900 2
5–10 2,000 5
10–24 2,100 14
3000
ço
A quantidade de espa
Observe que não
2000
que as ba rra s oc up am
há espaços vazios está agora em propor
ção
1000 entre as barras. com os dados.
0
0 1 3 5 10 24
28 Capítulo 1
visualizando informações
A Densidade da Freqüência
Vista de Perto
A densidade da freqüência se refere à
concentração de valores nos dados. Ela está
relacionada com a freqüência, mas não
é a mesma coisa. Veja uma analogia para Aqui está todo o
demonstrar a relação entre as duas. suco dentro do
copo. Ele chega até
Suponha que você tenha despejado uma esse nível.
quantidade de suco em um copo, como ao lado:
Suco = Freqüência
Suponha que, em vez de despejar o suco em copos, você esteja
“despejando” a freqüência nas barras do seu gráfico. Assim como você
sabe a largura do copo, você também sabe a largura das barras. E, assim
como o espaço que o suco ocupa no copo (largura x altura) lhe diz
a quantidade de suco que está no copo, a área da barra no gráfico é
equivalente à sua freqüência.
A densidade da freqüência é, então, igual à altura da barra.
Continuando com nossa analogia, ela é equivalente ao nível ao qual o
suco chega em cada copo. Assim como um copo mais largo significa
que o suco chega a um nível mais baixo, uma barra mais larga significa
uma densidade de freqüência mais baixa.
Densidade da
Freqüência Suco
Barra
Freqüência
PONTOS DE BALA
não existem
Perguntas Idiotas
P: Por que usamos a área para representar
da altura. Para achar a densidade da freqüência, tome a
freqüência de um intervalo e divida-a pela largura.
a freqüência quando estamos construindo
histogramas?
P: Se eu tenho dados numéricos agrupados, mas
R: Essa é uma forma de ter certeza de que os
tamanhos relativos de cada grupo mantêm uma
todos os intervalos têm a mesma largura, posso
usar um gráfico de barras normal?
proporção com os dados e são fiéis. Com dados
agrupados, precisamos de uma maneira visual de R: O uso de um histograma representa melhor seus
dados, pois você ainda está trabalhando com dados
expressar a largura de cada grupo e também sua
freqüência. Alterar a largura das barras é uma maneira agrupados. Na verdade, você quer que sua freqüência
intuitiva de refletir o intervalo do grupo, mas tem o efeito seja proporcional à sua área, e não à altura.
colateral de fazer com que os tamanhos das barras
pareçam desproporcionais. Uma maneira de contornar P: Os histogramas têm obrigatoriamente de
tal situação é ajustar a altura da barra e usar a área representar dados agrupados? É possível usá-los
para representar a freqüência. Dessa forma, nenhum para números separados bem como para grupos de
grupo é representado erroneamente ocupando mais ou números?
menos espaço do que deveria.
30 Capítulo 1
visualizando informações
50
Representa 10 jogos
40
30
20
10
-1 0 1 2 3 4 5 6
–0,5 a 0,5 representa 0 nível, pois Nível
todos os valores dentro desse
intervalo são arredondados para 0.
50
Representa 10 jogos
40
30 Cada nível é um
número inteiro;
20 portanto, a barra
referente ao nível 3 vai
de 2,5 a 3,5.
10
-1 0 1 2 3 4 5 6
Nível
Precisamos achar o número total de jogos realizados, o que significa que precisamos achar a
freqüência total.
A freqüência total é igual à área de todas as barras somadas juntas. Em outras palavras,
multiplicamos a largura de cada barra pela sua densidade de freqüência para obter a
freqüência e, depois, somamos o conjunto todo.
Freqüência Total = 10 + 30 + 50 + 30 + 20
= 140
32 Capítulo 1
visualizando informações
5000 Representa
1000 Dias
4000
O histograma nos diz a
3000 densidade da freqüência de
determinados grupos. Mas ele
já não é tão útil assim ao nos
2000
dar informações sobre quantos
jogadores jogam abaixo de um
1000 certo número de horas.
0
0 1 3 5 10 24
Horas
É difícil ver rapidamente quais são os totais acumulados neste gráfico. Para achar
a freqüência de jogadores que jogam até 5 horas, precisamos somar freqüências
diferentes. Precisamos de outro tipo de gráfico... mas qual?
PODERDO
CÉREBRO
Que tipo de informações você acha que deveríamos mostrar no gráfico? Que
tipo de informações deveríamos marcar no gráfico? Escreva sua resposta
abaixo.
20000
17500
15000
o
12500 Defina este pont em
ras
10000 marcando 10 ho üência
freq
função de uma 00.
7500 18 .1
acumulada de
5000
2500
0.0
0 5 10 15 20 25
u Horas
Sempre comece se cia
a fre qü ên
gráfico onde
acumulada é 0.
não existem
Perguntas Idiotas
P: O que é freqüência P: Em alguns gráficos, é
sobrecarregado e você não consiga
ler as freqüências acumuladas e
acumulada? possível mostrar mais de um
comparar os conjuntos de dados.
conjunto de dados no mesmo
R: Freqüência acumulada de um
valor é a soma das freqüências até
gráfico. E no caso de gráficos de
freqüência acumulada? P: O que devo fazer para achar
a freqüência acumulada de um
aquele valor, inclusive. Ela lhe diz
a freqüência total até aquele ponto. R: Para gráficos de freqüência
valor?
Como exemplo, suponha que você
tenha dados que digam a idade das
acumulada, isso pode ser feito
traçando-se uma linha para R: Para achar a freqüência
acumulada, basta lê-la diretamente
pessoas. A freqüência acumulada cada conjunto de dados. Se, por
para o valor 27 lhe diz quantas exemplo, você quisesse comparar no gráfico. Encontre o valor para o
pessoas têm até 27 anos de idade, as freqüências acumuladas por qual você deseja achar a freqüência
inclusive. sexo, poderia traçar uma linha acumulada no eixo horizontal,
ache onde ele encontra a curva
P:
representando homens e outra
representando mulheres. Seria da freqüência acumulada e, em
Os gráficos de freqüências
bem mais eficaz mostrar as duas seguida, leia o valor da freqüência
acumuladas são usados só para
linhas em um único gráfico, pois acumulada no eixo vertical.
dados agrupados?
7500
5000
2500
0.0
0 10 20 30 40 50 60 70 80 90 100
Horas
Idades
7500
5000
2500
0.0
0 10 20 30 40 50 60 70 80 90 100
Idades
Horas
38 Capítulo 1
visualizando informações
Veja dois possíveis gráficos que o diretor executivo poderia usar em sua
apresentação. Sua tarefa é anotar algo sobre cada um e dizer, em sua
opinião, quais são os pontos fortes e fracos de um em relação ao outro.
Qual deles você escolheria?
Lucro em dólares
600
Manic Mango
500
Lucro (milhares)
Concorrente
400
300
200
100
0.0
2003 2004 2005 2006 2007
Ano
Lucro em dólares
600
Manic Mango
500
Lucro (milhares)
Concorrente
400
300
200
100
0
2003 2004 2005 2006 2007
Ano
Veja dois possíveis gráficos que o diretor executivo poderia usar em sua
apresentação. Sua tarefa é anotar algo sobre cada um e dizer, em sua
opinião, quais são os pontos fortes e fracos de um em relação ao outro.
Qual deles você escolheria?
Lucro em dólares
600
Manic Mango
500
Lucro (milhares)
Concorrente
400
O gráfico de barras funciona muito bem
300 para comparar o lucro de ano em ano
e é excelente se você deseja comparar
200 lucros em um único ano. Como
exemplo, podemos ver que, até 2007,
100
o concorrente teve um lucro maior,
0.0 mas em 2007 foi a Manic Mango que
2003 2004 2005 2006 2007 teve maior lucro.
Ano
Um dos pontos fracos deste gráfico é que, se o diretor executivo, de repente, decidisse
acrescentar um terceiro concorrente, poderia ficar um pouco mais difícil analisar o gráfico
com um rápido passar de olhos.
Lucro em dólares
600 Manic Mango
500 Concorrente
Lucro (milhares)
O gráfico de linhas é melhor para mostrar uma tendência, os lucros de ano em ano para cada
empresa. A linha de tendências para cada empresa é bem definida, o que significa que podemos
facilmente ver o padrão dos lucros: os lucros da Manic Mango estão crescendo bem, onde seu
concorrente está começando a ter uma queda. Seria fácil também acrescentar outra empresa sem
sobrecarregar o gráfico.
Um ponto fraco é que você também pode comparar o lucro de ano em ano, mas talvez o gráfico
de barras seja mais claro.
40 Capítulo 1
visualizando informações
A Densidade da Freqüência
Vista de Perto
Gráficos de linhas são bons para mostrar tendências em seus dados. Para cada
conjunto de dados, você marca os pontos e depois os une com linhas. É fácil mostrar
vários conjuntos de dados no mesmo gráfico sem sobrecarregá-lo. Mas deixe claro
qual linha é qual.
Assim como outros tipos de gráficos, você pode escolher entre mostrar a freqüência
ou as porcentagens no eixo vertical. A escala que você utiliza depende de quais
fatores deseja destacar.
Gráficos de linhas são geralmente usados para mostrar medidas de tempo. O tempo
sempre fica no eixo horizontal, e a freqüência no vertical. Você pode ler a freqüência
para qualquer período de tempo escolhendo o valor do tempo no eixo horizontal e
lendo a freqüência correspondente àquele ponto sobre a linha.
Lucro em dólares
600
500
Lucro (milhares)
400
300
200
100
0
2003 2004 2005 2006 2007
Ano
PONTOS DE BALA
¢¢ Use um gráfico de linhas se você deseja ¢¢ Não use gráficos de linhas para mostrar
mostrar tendências, por exemplo com dados categóricos a não ser que você
relação ao tempo. esteja mostrando tendências para cada
categoria, por exemplo com relação ao
¢¢ É possível mostrar mais de um conjunto de tempo. Se fizer isso, trace uma linha para
dados em um gráfico de linhas. Use uma cada categoria.
não existem
Perguntas Idiotas
P: Gráficos de linhas são a P: Gráficos de linhas podem P: Agora que sei como criar
mesma coisa que gráfico de série mostrar dados categóricos bem gráficos corretamente, posso
temporal? Acha que já ouvi esse como dados numéricos? usar softwares gráficos para fazer
nome sendo usado antes. o trabalho pesado?
P:
um gráfico de linhas para traçar continua tendo de decidir qual
Há alguma variedade linhas de categoria em categoria. gráfico representa melhor seus fatos,
P:
especial de gráficos de linhas? e é preciso verificar se o software
Então gráficos de linhas são gera exatamente o que você espera.
R: Sim. Na verdade, você já
se deparou com um deles. O
melhores para mostrar tendências
sobrepostas e gráficos de barras
gráfico de freqüência acumulada são melhores para comparar
é um tipo de gráfico de linhas que valores ou categorias?
mostra a freqüência total até um
determinado valor. R: Exatamente. A decisão
de qual gráfico você deve usar,
na verdade, se resume a qual
mensagem você deseja transmitir e
quais fatores você deseja minimizar.
42 Capítulo 1
visualizando informações
Excelente trabalho
com esses gráficos! Os
investidores estão fazendo fila
do lado de fora do escritório.
Tire longas férias, tudo por
minha conta!