Você está na página 1de 44

1 Visualizando informações

Primeiras impressões
Quero ficar bonita e
bem-arrumada para causar a
impressão certa.

Você não consegue diferenciar entre fatos e números? 


A estatística ajuda você a dar sentido aos confusos conjuntos de dados,
transformando aquilo que é complexo em algo simples. E, quando você tiver
descoberto o que realmente está acontecendo, será necessário achar uma
forma de visualizar a situação e contá-la para os outros. Portanto, se você
quer escolher o melhor gráfico para seu trabalho, pegue suas coisas, não se
esqueça da sua melhor régua de cálculo e embarque conosco nesta viagem à
Terra da Estatística.

este é um capítulo novo 1


bem-vindo à terra da estatística!

A estatística está por toda parte


Para qualquer lugar que você olhar, encontrará a estatística, seja navegando na
Internet, praticando esportes ou analisando sua pontuação no seu videogame
favorito. Mas o que realmente vem a ser estatística?
Estatística são números que resumem fatos e números puros dando-lhes algum
significado. Ela apresenta idéias-chave que podem não estar imediatamente
aparentes ao observar dados puros; quando usamos a palavra “dados”, queremos
dizer fatos ou números com base nos quais podemos tirar conclusões. Como
exemplo, não é preciso analisar minuciosamente toda a pontuação dos times
de futebol quando tudo que você deseja saber é a posição do seu time favorito
no campeonato. Nesse caso, basta um pouco de estatística para rapidamente ter
acesso às informações de que você precisa.
O estudo da estatística abrange vários aspectos, entre eles a origem da estatística,
como calculá-la e como usá-la de forma eficaz.
tão
Na raiz da estatística es
os dados. Estes po de m
Colha os dados ser colhidos analisand
o
as fontes existen tes ,
ou
realizando experiências
sq uis as.
conduzindo pe

Analise
Com os dados em mãos, vo

pode analisá-los e gerar da
dos
estatísticos. É possível calcu
lar
a probabilidade de determi
nados
eventos ocorrerem, testar
idéias e
indicar a confiança que vo
cê tem nos
resultados obtidos.

Tendo analisado os dados,


você toma decisões e faz
previsões.
Tire conclusões
2   Capítulo 1
visualizando informações

Mas por que aprender estatística?


Entender o que realmente está acontecendo em estatística lhe dá mais
poder. Se você realmente entender estatística, conseguirá tomar decisões
objetivas, fazer previsões precisas e inspiradas e transmitir a mensagem
que deseja da forma mais eficaz possível.
A estatística pode ser uma excelente maneira de resumir verdades
essenciais sobre dados, mas ela também possui um lado obscuro.

Você Você pode


pode usar a estatística dizer o que bem
para ajudar a explicar entender usando
coisas sobre o mundo. estatística. Até mesmo
mentir.

A estatística é baseada em fatos, mas, mesmo assim, eles podem às vezes ser enganosos.
Podem ser usados para dizer a verdade — ou a mentira. O problema é como saber
quando estão dizendo a verdade a você e quando estão contando uma mentira.
Ter um bom conhecimento em estatística coloca você em uma posição privilegiada.
Você se torna muito mais bem preparado para dizer quando determinados dados
estatísticos estão errados ou são enganosos. Em outras palavras, o estudo da estatística é
uma excelente forma de ter certeza de que você não vai ser enganado.
Como exemplo, veja os lucros obtidos por uma empresa no último semestre do ano
passado.

Mês Jul Ago Set Out Nov Dez


Lucro (milhões) 2,0 2,1 2,2 2,1 2,3 2,4

O lucro está Caramba! As


se mantendo constante, ações da empresa
mas não chega a ser algo estão simplesmente
extraordinário. detonando!

Como pode haver duas interpretações para os


mesmos dados? Vamos examinar isso mais de perto.

você está aqui 4 3


diferenças na interpretação de dados

A história de dois gráficos


Como explorar essas duas interpretações diferentes para os mesmos dados?
Precisamos de alguma maneira de visualizá-los. Se é preciso visualizar
informações, nada melhor que usar um gráfico. Gráficos podem ser uma
forma rápida de resumir informações puras e podem ajudá-lo a ter uma
noção do que está acontecendo com um rápido olhar. Mas é preciso ter
cuidado, pois até mesmo os gráficos mais simples podem ser usados para
sutilmente enganá-lo e confundi-lo.
Veja dois gráficos mostrando os lucros de uma empresa durante seis meses.
Eles são baseados nas mesmas informações, mas por que parecem diferentes?
Eles apresentam versões drasticamente diferentes das mesmas informações.

Lucro da empresa por mês


Viu só o que eu
Lucro (milhões de dólares)

2,5 disse? O lucro é


praticamente o mesmo
2,0 a cada mês.

1,5

1,0

0,5

0,0
Jul Ago Set Out Nov Dez
Mês

Ambos os gráficos são baseados nas


mesmas informações, mas parecem
De forma
totalmente diferentes. O que está
alguma! O lucro
acontecendo?
está esplêndido. Olhe
só como ele cresce! Lucro da empresa por mês
Lucro (milhões de dólares)

2,5

2,4

2,3

2,2

2,1

2,0
Jul Ago Set Out Nov Dez
Mês

4   Capítulo 1
visualizando informações

Observe os dois gráficos da página anterior. Em sua


opinião, quais seriam as diferenças principais? Como
pode haver diferença na primeira impressão que temos
dos dados?

não existem
Perguntas Idiotas
P: Por que não se basear simplesmente nos P: Qual é a diferença entre informações e dados?

R:
dados? Por que colocá-los em um gráfico?

R: Às vezes, é difícil enxergar o que realmente está


acontecendo observando-se simplesmente os dados puros.
Dados se referem a fatos e números puros que
foram colhidos. Informações são dados que possuem
algum tipo de significado adicional.
Pode haver padrões e tendências existentes nos dados,
Como exemplo, tome os números 5, 6 e 7. Sozinhos,
mas eles podem ser difíceis de identificar se você estiver
eles são simplesmente números. Não se sabe o que
analisando uma grande quantidade de números. Os gráficos
eles significam ou representam. Eles são dados. Se
oferecem uma forma de literalmente enxergar os padrões
alguém lhe disser que estas são as idades de três
existentes em seus dados. Eles permitem visualizar os dados
crianças, você passa a ter informações, pois os números
e ver o que está realmente acontecendo em um rápido
passam a ter um significado
passar de olhos.

você está aqui 4 5


aponte seu lápis solução

Observe os dois gráficos da página anterior. Em sua opinião,


quais seriam as diferenças principais? Como pode haver
diferença na primeira impressão que temos dos dados?

Ambos os gráficos são baseados nos Lucro da empresa por mês

Lucro (milhões de dólares)


mesmos dados existentes, mas cada um 2,5
deles envia uma mensagem diferente.
2,0
O primeiro gráfico mostra que o lucro é
relativamente constante. Isso é obtido 1,5
com o eixo vertical começando em 0 e,
em seguida, marcando-se o lucro para 1,0
cada mês em função disso.
0,5
Observe bem com
o
os eixos verticais 0,0
são diferentes em Jul Ago Set Out Nov Dez
cada gráfico. Mês
O segundo gráfico dá uma impressão Lucro da empresa por mês
Lucro (milhões de dólares)

diferente fazendo com que o eixo 2,5


vertical comece em um lugar diferente e
ajustando a escala proporcionalmente. À 2,4
primeira vista, os lucros parecem estar
aumentando drasticamente a cada mês. 2,3
Só quando você olha mais de perto é
que consegue ver o que está realmente 2,2
acontecendo.
2,1
O eixo desse gráfico começa em
2,0, e não em 0. Por isso, não é de 2,0
causar surpresa que o lucro pareça Jul Ago Set Out Nov Dez
tão esplêndido. Mês

Por que me preocupar


com gráficos? Os softwares
gráficos resolvem tudo por você; é
para isso que eles existem.

Softwares não podem pensar por você.


Softwares gráficos podem lhe poupar bastante tempo e gerar gráficos
eficientes, mas, ainda assim, é necessário entender o que está
acontecendo.
Ao final do dia, os dados são seus, e você é responsável por escolher
o gráfico certo para o trabalho e ter certeza de que seus dados sejam
apresentados da forma mais eficaz possível transmitindo a mensagem
que você deseja.
Softwares podem traduzir dados em gráficos, mas você é o
responsável por garantir que o gráfico esteja correto.
6   Capítulo 1
visualizando informações

A empresa Manic Mango precisa de alguns gráficos


Manic Mango, uma empresa de jogos criativos que está
começando a dominar o mundo, está precisando de alguém que
entenda de gráficos. O diretor executivo foi convidado a fazer uma
importante apresentação na próxima exposição mundial de jogos.
Ele precisa de alguma forma rápida e persuasiva de apresentar
dados e pediu que você providenciasse o que fosse necessário. Há
muita coisa pegando carona nesse barco. Se a apresentação for
boa, a Manic Mango conseguirá mais receitas de patrocinadores, e
é possível que você ganhe um bônus generoso pelo seu esforço.
A primeira coisa que o diretor deseja fazer é comparar a
porcentagem de jogadores satisfeitos para cada gênero de jogo.
Ele começou a tarefa inserindo os dados que possui em um
software gráfico, e aqui estão os resultados:

Outros
Armas 1.500
3.500
Ação
6.000

Esporte
Estratégia 27.500
11.500

Unidades Vendidas por Gênero

PODERDO
CÉREBRO
Observe o gráfico de setores que o diretor elaborou. O que representa
cada fatia? O que você pode inferir com relação à popularidade relativa
dos diferentes gêneros de videogame?

você está aqui 4 7


anatomia de um gráfico de setores

O humilde gráfico de setores


Gráficos de setores funcionam dividindo seus dados em categorias ou grupos
distintos. O gráfico consiste de um círculo dividido em fatias de pizza, cada
qual representando um grupo. O tamanho de cada fatia é proporcional à
quantidade de algo em cada grupo em comparação com os outros. Quanto
maior a fatia, maior a popularidade relativa daquele grupo. A quantidade de
algo em determinado grupo é chamada de freqüência.
Gráficos de setores dividem seu conjunto inteiro de dados em grupos distintos.
Isso significa que, se você somar a freqüência de cada fatia, obterá 100%.
Vamos examinar mais de perto nosso gráfico de setores mostrando a quantidade
de unidades vendidas por gênero:
Essa fatia é muito menor Gênero Unidades
que as outras, o que vendidas
significa que as vendas
Outros Esporte 27.500
são muito inferiores para
Armas 1.500 essa categoria. Estratégia 11.500
3.500 Essa fatia é muito Ação 6.000
Ação
maior que todas as Armas 3.500
6.000 outras, o que significa
que a freqüência é maior Outros 1.500
para essa categoria.
Esporte
Estratégia 27.500
11.500
r cada
Você pode identifica cia
ando sua freqüên
Unidades Vendidas por Gênero fatia us .
ou uma porcentagem

Então quando os gráficos de


setores são úteis?
Estatística vital
Já vimos que o tamanho de cada fatia representa Freqüência
a freqüência relativa de cada grupo de dados que
você está exibindo. Por causa disso, os gráficos de A freqüência descreve quantos itens
setores podem ser úteis se você deseja comparar existem em um determinado grupo
proporções básicas. Geralmente, é fácil dizer à ou intervalo. Ela é uma contagem
primeira vista quais grupos têm uma freqüência alta de quantos itens existem.
em comparação com os outros. Gráficos de setores
são menos úteis se todas as fatias tiverem tamanhos
semelhantes, pois se torna difícil visualizar
diferenças sutis entre os tamanhos das fatias.
E o gráfico de setores que o diretor executivo da
Manic Mango criou?

8   Capítulo 1
visualizando informações

Falha no gráfico
O gráfico de setores funcionou tão perfeitamente para exibir as unidades
vendidas por gênero que o diretor executivo decidiu criar outro gráfico para
demonstrar a satisfação dos consumidores com os jogos da Manic Mango.
O diretor precisa de um gráfico que permita comparar a porcentagem de
jogadores satisfeitos para cada gênero de jogo. Ele rodou os dados novamente
no software gráfico, mas, dessa vez, não ficou tão impressionado assim.

Outros Esporte
O que houve aqui? Todas as 85% 99%
fatias têm o mesmo tamanho, mas
as porcentagens são todas diferentes
e muito maiores que as fatias. Será que
você poderia me ajudar a consertar
este gráfico? Agora?
Armas
95%
Estratégia
90%

Gráficos de setores são usados Ação


para comparar as proporções de 85%
grupos ou categorias diferentes, Porcentagem de
mas, neste caso, há pouca variação Jogadores Satisfeitos
entre cada grupo. por Gênero
É difícil perceber à primeira vista qual categoria
tem um nível mais alto de satisfação entre

Diretor
jogadores.
Geralmente, também é um pouco confuso
Gráficos
executivo da
Manic Mango
identificar os gráficos de setores com
porcentagens que não estão relacionadas à de setores
proporção total da fatia. Como exemplo, a fatia
referente a Esporte é identificada com 99%,
mas ela preenche somente cerca de 20% do
representam
gráfico. Outro problema é que não sabemos
se há um número igual de respostas para proporções
cada gênero; por isso, não sabemos se é justo
comparar a satisfação entre gêneros dessa forma.

PODERDO
CÉREBRO
Observe os dados e pense nos problemas que existem com este gráfico.
Que tipo de gráfico seria melhor para esse tipo de informação?

você está aqui 4 9


dois tipos de gráfico de barras

Gráficos de barras oferecem mais precisão


Uma forma melhor para exibir esse tipo de dados é utilizar um gráfico
de barras. Assim como gráficos de setores, gráficos de barras permitem
comparar tamanhos relativos, mas a vantagem de utilizar um gráfico de
barras é que ele permite um maior grau de precisão. São ideais em situações
em que as categorias têm praticamente o mesmo tamanho, pois é possível
identificar com muito mais precisão qual categoria tem a freqüência mais
alta. Torna-se mais fácil enxergar as pequenas diferenças.
Em um gráfico de barras, cada barra representa uma determinada categoria,
e o comprimento da barra indica o valor. Quanto mais longa a barra, maior
o valor. Todas as barras têm a mesma largura, o que facilita sua comparação.
Gráficos de barras podem ser traçados vertical ou horizontalmente.

Gráficos de barras verticais


Gráficos de barras verticais mostram categorias no eixo horizontal e a
freqüência ou a porcentagem no eixo vertical. A altura de cada barra indica
o valor de sua categoria. Veja um exemplo mostrando os números das
vendas em unidades para cinco regiões, A, B, C, D e E:

A escala
referente
às vendas
fica aqui. a as
A altura de cada barra mostr la região.
10000 de s pa ra aq ue
vendas em unida Vendas (unidades)
9000
8000 Cada barra
7000 representa uma Região Vendas
região. (unidades)
Vendas (unidades)

6000
A 1.000
5000
B 5.000
4000
C 7.500
3000
D 8.000
2000
E 9.500
1000
0
A B C D E
Vendas por Região em Unidades

10   Capítulo 1
visualizando informações

Gráficos de barras horizontais


Gráficos de barras horizontais são como gráficos de barras verticais,
exceto pelo fato de que os eixos são invertidos. Em gráficos de barras
horizontais, as categorias são mostradas no eixo vertical e a freqüência ou
a porcentagem no eixo horizontal.
Veja um gráfico de barras horizontais para representar os dados que
o diretor colheu para cada gênero de jogos na página 9. Como pode
ser visto, é bem mais fácil identificar rapidamente qual categoria tem o
maior valor e qual tem o menor valor. O comprimento de cada barra
representa a porcentagem de
Todas as barras são jogadores satisfeitos para
desenhadas horizontalmente. aquele gênero.
Porcentagem de Jogadores
Satisfeitos por Gênero
Esporte Porcentagem Satisfeita

Estratégia
Gênero Porcentagem
Satisfeita
Ação Esporte 99%
Estratégias 90%
Armas Ação 85%
Armas 95%
Outros 80%
Outros

Cada barra s são


As porcentagen la
representa es ca
mostradas na
0 10 20 30 40 50 60 70 80 90 100
um gênero. Porcentagem Satisfeita horizontal.

Gráficos de barras verticais tendem a ser mais comuns, mas gráficos


de barras horizontais são úteis se os nomes de suas categorias forem
muito longos. Eles lhe dão mais espaço para mostrar o nome de cada
categoria sem ter de escrever de lado as identificações das barras.

O gráfico de barras verticais mostra


freqüência, e o gráfico de barras horizontais
mostra porcentagens. Mas quando devo
usar freqüências e quando devo usar
porcentagens?

Depende de qual mensagem você deseja transmitir.


Vamos olhar isso mais de perto.
você está aqui 4 11
uma olhada em escalas

É uma questão de escala


A compreensão do uso de escalas permite criar excelentes gráficos de
barras destacando os principais fatos que você deseja realçar. Mas tenha
cuidado — as escalas também podem esconder fatos essenciais sobre seus
dados. Vejamos como isso acontece.

Usando escalas de porcentagem


Vamos começar observando mais a fundo o gráfico de barras que mostra
a satisfação dos jogadores por gênero de jogo. O eixo horizontal mostra a
satisfação dos jogadores em termos de porcentagem, o número de pessoas em
cada grupo de 100 pessoas que estão satisfeitas com aquele gênero.
Porcentagem de Jogadores
Satisfeitos por Gênero
Esporte Porcentagem Satisfeita

Estratégia

Ação

Armas

Outros
Aqui estão as porcentagens.
0 10 20 30 40 50 60 70 80 90 100
Porcentagem Satisfeita

A finalidade deste gráfico é permitir a comparação de diferentes porcentagens e


também a leitura das porcentagens a partir do gráfico.
Mas há um probleminha — ele não nos diz quantos jogadores existem para cada gênero.
Isso pode não parecer importante, mas significa que não temos nenhuma idéia de
se ele reflete a visão de todos os jogadores, de apenas alguns deles ou até mesmo de
alguns poucos. Em outras palavras, não sabemos até que ponto essas informações são
representativas dos jogadores como um todo. A regra para traçar gráficos que mostram
porcentagens é tentar indicar as freqüências, no próprio gráfico ou ao lado dele.

Tenha bastante cuidado quando lhe for fornecida uma


porcentagem sem nenhuma freqüência ou uma
freqüência sem nenhuma porcentagem.
Às vezes, essa é uma tática usada para esconder fatos essenciais
sobre os dados existentes, pois apenas com base no gráfico é
impossível saber até que ponto ele é representativo dos dados. Você pode pensar
que uma grande porcentagem de pessoas prefere um determinado gênero de jogo,
mas descobrir que somente 10 pessoas foram questionadas. Ou, por outro lado, você
pode descobrir que 10.000 jogadores gostam mais de jogos esportivos, mas tal número
sozinho não lhe diz se essa é uma proporção alta ou baixa entre todos os jogadores
de videogame.

12   Capítulo 1
visualizando informações

Usando escalas de freqüência


É possível mostrar freqüências em sua escala em vez de
porcentagens. Isso facilita ver exatamente quais são as freqüências
e comparar valores.

Quantidade de Jogadores Satisfeitos por Gênero

Esporte Satisfeitos

antas
Estratégia Este gráfico reflete qu
itas,
pessoas estão satisfe em.
ntag
em vez de usar porce
Ação

Armas

Outros

0 5000 10000 15000 20000 25000 30000


Quantidade Satisfeita

Normalmente, sua escala deve começar em 0, mas tome cuidado! Nem


todos os gráficos fazem isso, e, como visto anteriormente na página 6,
usar uma escala que não começa em 0 pode dar uma primeira impressão
diferente para seus dados. Isso é algo a que você deve ficar atento nos
gráficos de outras pessoas, pois é muito fácil passar despercebido dando
a impressão errada sobre os dados.

Então você está


me dizendo que tenho que
escolher entre mostrar a
freqüência ou porcentagens?
E se eu quiser usar
ambas?

Há maneiras de se desenhar gráficos de barras


que lhe oferecem mais flexibilidade.
O problema com esses gráficos de barras é que eles mostram a
quantidade de jogadores satisfeitos ou a porcentagem e mostram
apenas jogadores satisfeitos.
Vejamos como dar um jeito nesse problema.

você está aqui 4 13


dois conjuntos de dados em um único gráfico de barras

Trabalhando com vários conjuntos de dados


Em gráficos de barras, na verdade, é bastante fácil mostrar mais de um conjunto
de dados. Como exemplo, podemos mostrar a porcentagem de jogadores
satisfeitos e a porcentagem de jogadores insatisfeitos no mesmo gráfico.

Gráfico de barras com divisão por categorias


Uma maneira de resolver essa questão é usar uma barra para a freqüência de
jogadores satisfeitos e outra para os insatisfeitos, para cada gênero. Esse tipo
de gráfico é útil se você deseja comparar freqüências, mas é difícil enxergar
proporções e porcentagens.

Satisfação dos Jogadores por Gênero

Esporte Satisfeitos
Insatisfeitos
Estratégia

Ação

Armas

Outros

0 5000 10000 15000 20000 25000 30000


Freqüência

Gráfico de barras segmentado


Se você deseja mostrar freqüências e porcentagens, tente usar um gráfico de
barras segmentado. Para isso, use uma barra para cada categoria, mas divida a
barra proporcionalmente. O comprimento total da barra reflete a freqüência total.
Esse tipo de gráfico permite rapidamente ver a freqüência total de cada categoria
— nesse caso, o número total de jogadores para cada gênero — e a freqüência da
satisfação dos jogadores. É possível também ver rapidamente as proporções.

Satisfação dos Jogadores por Gênero

Esporte Satisfeitos
Insatisfeitos
Estratégia

Ação

Armas

Outros

0 5000 10000 15000 20000 25000 30000


Freqüência
14   Capítulo 1
visualizando informações

O diretor executivo precisa de outro gráfico para a apresentação


que vai fazer. Observe os dados fornecidos e tente esboçar o
gráfico de barras.

Continente Vendas
(unidades)
América do Norte 1.500
América do Sul 500
Europa 1.500
Ásia 2.000
Oceania 1.000
África 500
Antártida 1

Veja outro quadro gerado pelo software. Qual foi o


gênero mais vendido em 2007? Como foram as vendas
desse gênero em 2006?

Vendas por Gênero

2006
Esporte

2007
Estratégia
Gênero

Ação

Armas

Outros

0 5000 10000 15000 20000 25000 30000


Vendas

você está aqui 4 15


soluções dos exercícios

O diretor executivo precisa de outro gráfico para a apresentação que vai


fazer. Observe os dados fornecidos e tente esboçar o gráfico de barras.
Vendas por Continente
América do Norte Vendas
(unidades)
América do Sul

Europa
Continente Vendas
Continente Ásia
(unidades)
Oceania
América do Norte 1.500
América do Sul 500 África

Europa 1.500 Antártida


Ásia 2.000
0 200 400 600 800 1000 1200 1400 1600 1800 2000
Oceania 1.000 Vendas
África 500
Antártida 1

Veja outro quadro gerado pelo software. Qual foi o


gênero mais vendido em 2007? Como foram as vendas
desse gênero em 2006?

Vendas por Gênero


2006
Esporte

2007
Estratégia

O gênero Esporte foi o que mais vendeu em


Gênero

Ação 2007. Foram vendidas 27.500 unidades.


Em 2006, foram vendidas apenas 14.000
Armas
unidades desse gênero; portanto, menos que
em 2007. Em 2006, o gênero Estratégia vendeu
mais unidades que qualquer outro gênero.
Outros

0 5000 10000 15000 20000 25000 30000


Vendas

16   Capítulo 1
visualizando informações

Seus gráficos de barras são o máximo


O diretor executivo está entusiasmado com os gráficos de barras que você construiu,
mas ainda há mais dados que ele precisa apresentar em sua conferência.

Ótimo trabalho! Estes gráficos vão ser um grande


sucesso na exposição. Tenho outra tarefa para você.
Estamos testando um novo jogo com um grupo de
voluntários e precisamos de um gráfico para mostrar
a divisão das pontuações por jogo. Veja os dados:

As pessoas podem marcar Pontuação Freqüência


entre 0 e 999 pontos, e 0-199 5
os dados são divididos em
grupos. Como exemplo, 200-399 29
alguns jogadores marcaram 400-599 56
entre 0 e 199 em cinco 600-799 17
ocasiões diferentes.
800-999 3

A freqüência é o
número de vezes que
Estes dados parecem uma pontuação é
diferentes dos outros tipos de atingida dentro de
dados que vimos até agora. Será que por cada intervalo.
causa disso devemos tratá-los de forma
diferente?

PODERDO
CÉREBRO
Faça uma revisão no capítulo. Que diferença você
acha que existe nesse tipo de dados? Que impacto
você acha que isso poderia ter nos gráficos?

você está aqui 4 17


dados numéricos e categóricos

Categorias versus números


Ao trabalhar com gráficos, uma das principais coisas que você precisa descobrir é
o tipo de dados com que está trabalhando. Descoberto isso, será muito mais fácil
tomar decisões importantes sobre qual gráfico é necessário para melhor representar
os seus dados.

Dados categóricos ou
qualitativos
A maioria dos dados que vimos
até agora é composta por dados
categóricos. Os dados são divididos em
raças
categorias que descrevem qualidades
ou características. Por esse motivo,
de cães
também são chamados de dados
qualitativos. Um exemplo de dados
qualitativos são os gêneros dos jogos;
cada gênero forma uma categoria
separada.
O principal a ser lembrado com tipo de
sobremesa
relação a dados qualitativos é que
os valores dos dados não podem ser
interpretados como números.

Dados numéricos ou quantitativos


Dados numéricos, por outro lado, trabalham com números.
Eles são dados onde os valores têm significado como
números, e isso envolve medidas ou contagens. Dados
numéricos também são chamados de dados quantitativos,
pois descrevem quantidades. peso

comprimento
tempo
Então, qual é o impacto que isso tem nos gráficos da Manic Mango?

18   Capítulo 1
visualizando informações

Trabalhando com dados agrupados


O último conjunto de dados do diretor As pontuações Pontuação Freqüência
executivo da Manic Mango é numérico, são numéricas 0-199 5
e, além disso, as pontuações estão e agrupadas em
200-399 29
agrupadas em intervalos. Portanto, qual intervalos
é a melhor forma de representar esses 400-599 56
dados em um gráfico? 600-799 17
800-999 3

É fácil, não basta usar


um gráfico de barras como
fizemos anteriormente?
Podemos tratar cada grupo como
uma categoria separada.

Sim, poderíamos, mas há uma maneira melhor.


Em vez de tratar cada intervalo de pontuação como uma categoria
separada, podemos aproveitar o fato de que os dados são
numéricos e apresentá-los usando uma escala numérica contínua.
Isso significa que, em vez de usar barras para representar um
único item, podemos usar cada barra para representar um
intervalo de pontuações.
Para isso, podemos criar um histograma.
Histogramas são como gráficos de barras, mas com duas
importantes diferenças. A primeira é que a área de cada barra é
proporcional à freqüência, e a segunda é que não há nenhum
espaço vazio entre as barras no gráfico. Veja um exemplo de
histograma mostrando o número médio de jogos comprados por
mês por residências na Terra da Estatística:

Número de Jogos Comprados por Mês


Freqüência

2 Não há espaços vazios


entre as barras.
A área de
cada barra é Os valores são
proporcional
1 mostrados em uma
à freqüência. escala numérica
contínua.
-1 0 1 2 3 4 5 6
Número de Jogos
você está aqui 4 19
construindo um histograma

Para criar um histograma, comece


achando as larguras das barras Pontuação Freqüência
O primeiro passo para criar um histograma é observar cada 0–199 5
intervalo e descobrir a largura que cada um deve ter, bem 200–399 29
como qual intervalo de valores cada um precisa cobrir.
Enquanto fazemos isso, precisamos ter certeza de que não 400–599 56
haja nenhum espaço vazio entre as barras no histograma. 600–799 17
Vamos começar com os dois primeiros intervalos, 0 a 800–999 3
199 e 200 a 399. Pelo que parece, o primeiro intervalo
termina com a pontuação 199, e o segundo começa com a
pontuação 200. No entanto, quando marcamos os pontos
dessa forma ocorre um problema. Acabaríamos tendo um
espaço vazio entre a pontuação 199 e 200, como a seguir:

199 200
Histogramas não devem ter espaços vazios entre as barras; portanto, para resolver
esse problema, prolongamos seus intervalos um pouco. Em vez de um intervalo
que termina na pontuação 199 e outro que começa na pontuação 200, fazemos
com que os dois intervalos se encontrem em 199,5, da seguinte forma:

199.5

Ao fazer isso, você cria um limite único e tem a certeza de que não há
nenhum espaço vazio entre as barras no histograma. Se fizermos o
mesmo para o restante dos intervalos, obteremos os seguintes limites:

0-199 200-399 400-599 600-799 800-999


-0.5 199.5 399.5 599.5 799.5 999.5

Cada intervalo abrange 200 pontuações, e a largura de cada intervalo é 200. Cada
intervalo tem a mesma largura.
Como todos os intervalos têm a mesma largura, criamos o histograma traçando
barras verticais para cada intervalo de pontuação, usando os limites para formar o
ponto inicial e final de cada barra. A altura de cada barra é igual à freqüência.

20   Capítulo 1
visualizando informações

Veja novamente os dados referentes à Manic Mango.

Pontuação Freqüência
0–199 5
200–399 29
400–599 56
600–799 17
800–999 3

Tente usar os limites das classes para criar um histograma para esses dados.
Lembre-se de que a freqüência fica no eixo vertical.

60

50

40

30

20

10

0 100 200 300 400 500 600 700 800 900 1000

você está aqui 4 21


solução do exercício

Veja novamente os dados referentes à Manic Mango.

Pontuação Freqüência
0–199 5
200–399 29
400–599 56
600–799 17
800–999 3

Tente usar os limites das classes para criar um histograma para esses dados.
Lembre-se de que a freqüência fica no eixo vertical.

A freqüência lhe fornece a


60 altura de cada barra.
Freqüência

Pontuações por jogo


50

40 Você usa os limites


de cada intervalo
para encontrar a
A
largura das barras.
30

barra referente às
20 pontuações de 600
a 799 vai de 599,5 a
799,5.
10

0 100 200 300 400 500 600 700 800 900 1000

Pontuação

22   Capítulo 1
visualizando informações

não existem
Perguntas Idiotas
P: Então um histograma é usado basicamente
Como exemplo, se marcássemos o intervalo de 0 a 199
prolongando-o do valor 0 ao valor 199, a largura sobre o
para dados numéricos agrupados?
gráfico seria de apenas 199 – 0 = 199.
R: Sim. A vantagem de um histograma é que, por ser
numérico, você pode usá-lo para mostrar a largura de
P: Então por que fazemos com que as barras se
cada intervalo bem como a freqüência. encontrem no meio do caminho entre os dois?

P: E se os intervalos tiverem larguras diferentes?


R: As barras têm de se encontrar, e isso geralmente
acontece no meio do caminho, mas tudo se resume a
Ainda assim, posso usar um histograma?
como você arredonda os seus valores. Ao arredondar
R: Com certeza. É mais comum encontrarmos
intervalos com a mesma largura, mas isso não é
valores, normalmente você os arredonda para o número
inteiro mais próximo. Isso significa que o intervalo de
valores de –0,5 a 0,5 é arredondado para 0, e, assim,
necessário quando se trata de histogramas. Existem
quando mostramos 0 no histograma, isso é feito usando
mais alguns passos que devem ser seguidos para criar
o intervalo de valores de –0,5 a 0,5.
um histograma com intervalos de tamanhos diferentes,
mas isso será mostrado mais adiante.
P: Há alguma exceção?
P: Por que histogramas não devem ter espaços
R: Sim, a idade é uma exceção. Se você tiver de
vazios entre as barras?
representar o intervalo de idades de 18 a 19 anos em
R: Há pelo menos dois bons motivos. O primeiro é
mostrar que não há espaços vazios nos valores e que
um histograma, isso normalmente será feito usando
um intervalo que vai de 18 a 20. O motivo é que
normalmente classificamos alguém como tendo 19
todos os valores estão incluídos. O segundo é para que
anos, por exemplo, até seu 20º aniversário. Na verdade,
a largura do intervalo reflita o intervalo dos valores que
arredondamos as idades para baixo.
você está incluindo.

PONTOS DE BALA
¢¢ Freqüência é uma forma estatística de dizer categóricos se os nomes das categorias
quantos itens existem em uma categoria. forem curtos.

¢¢ Gráficos de setores são adequados para ¢¢ Você pode representar vários conjuntos
representar proporções básicas. de dados em um gráfico de barras, e
pode escolher como fazer isso. É possível
¢¢ Gráficos de barras oferecem mais comparar freqüências mostrando barras
flexibilidade e precisão. relacionadas lado a lado em um gráfico de
¢¢ Dados numéricos trabalham com números barras com divisão de categorias. É possível
e quantidades; dados categóricos trabalham mostrar proporções e freqüências totais
com palavras e qualidades. empilhando as barras uma em cima da outra
em um gráfico de barras segmentado.
¢¢ Gráficos de barras horizontais são
usados para dados categóricos, ¢¢ As escalas dos gráficos de barras podem
principalmente onde os nomes das representar porcentagens ou freqüências.
categorias são muito longos. ¢¢ Existem muitas variedades para cada tipo de
¢¢ Gráficos de barras verticais são usados gráfico..
para dados numéricos, ou dados

você está aqui 4 23


um problema com intervalos de larguras diferentes

A Manic Mango precisa de outro gráfico


O diretor executivo está muito satisfeito com o histograma que
você criou para ele — tanto assim que ele quer que você crie outro
histograma. Desta vez, ele quer um gráfico que mostre quanto tempo os
jogadores tendem a passar jogando jogos da Manic Mango on-line num
período de 24 horas. Veja os dados:

Horas Freqüência
Este é o número de
horas 0–1 4,300 Esta é a freqüência com que
que as pessoas pa ss am as pessoas jogam durante
1–3 6,900
jogando esse espaço de tempo
3–5 4,900
5–10 2,000 Aqui o número 4,300 (por
10–24 2,100 exemplo) significa na
verdade 4300 (a vírgula
deve ser desconsiderada)

Há algo de engraçado
nesses dados. Eles estão
agrupados como da última vez,
mas nem todos os intervalos
têm a mesma largura.

Ele está certo, as larguras dos intervalos não são


todas iguais.
Se você observar os intervalos, poderá ver que eles têm larguras
diferentes. Como exemplo, o intervalo de 10 a 24 abrange muito mais
horas do que o intervalo de 0 a 1.
Se tivéssemos acesso aos dados puros, poderíamos tentar construir
intervalos com larguras iguais, mas, infelizmente, esses são todos os dados
de que dispomos. Precisamos de uma forma de construir um histograma
que permita que os dados tenham larguras diferentes.

PODERDO
CÉREBRO
No caso de histogramas, a freqüência é proporcional
à área de cada barra. Como você usaria esse fato
para criar um histograma para esses dados? O que
você deve levar em consideração?

24   Capítulo 1
visualizando informações

Acho que basta criar o histograma


exatamente como fizemos antes — não há maiores
problemas. Desenhamos barras em uma escala
numérica, mas, desta vez, as barras têm larguras
diferentes.

Você acha que ela está certa?


Veja o esboço do gráfico, usando a freqüência na escala vertical
e desenhando barras com larguras proporcionais ao tamanho
de cada intervalo. Você vê algum problema?

Horas de Jogo por Dia


Freqüência

7000

6000

5000

4000
luna
Por que esta co
3000
é tão GRA N D E?

2000

1000

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Horas

A área da barra de um histograma deve ser proporcional à freqüência


O problema que há neste gráfico é que, ao tentarmos fazer com que a largura
de cada barra refletisse a largura de cada intervalo, as barras acabaram ficando
desproporcionalmente grandes. Só de olhar o gráfico, é possível que você tenha
uma falsa impressão do número de horas por dia que as pessoas realmente passam
jogando. Como exemplo, a barra que ocupa a maior área é a barra que representa
o intervalo de 10 a 24 horas de jogo, embora a maioria das pessoas não jogue esse
tempo todo.
Como isso é um histograma, precisamos fazer a área da barra proporcional à
freqüência que ela representa. Como as barras têm larguras desiguais, o que
devemos fazer com a altura da barra?

você está aqui 4 25


ajustando a área da barra

Faça a área das barras do histograma proporcional à


freqüência
Até agora, pudemos usar a altura de cada barra para representar
a freqüência de um determinado número ou categoria.
Desta vez, estamos trabalhando com dados numéricos
agrupados onde as larguras dos intervalos são desiguais.
No caso de
Podemos fazer com que a largura de cada barra reflita a largura
de cada intervalo, mas o problema está no fato de que barras de histogramas,
largura diferente afetam a área total de cada barra.
Precisamos ter certeza de que a área de cada barra seja
a freqüência é
proporcional à sua freqüência. Isso significa que, se ajustarmos
a largura da barra, também precisamos ajustar a altura da barra.
representada
Dessa forma, podemos alterar as alturas das barras para que elas
reflitam a largura do grupo, mas mantemos o tamanho de cada pela área da
barra
barra proporcional à sua freqüência.
Façamos uma revisão sobre como criar esse novo histograma.

Passo 1: Ache as larguras das barras


Achamos a largura que as barras devem ter observando o intervalo de valores que
elas abrangem. Em outras palavras, precisamos descobrir quantas horas inteiras
são abrangidas por cada grupo.
Tomemos o grupo de 1 a 3. Esse grupo abrange 2 horas inteiras, 1 a 2 e 2 a 3. Isso
significa que a largura da barra precisa ser igual a 2, tendo 1 e 3 como limites.

e2
Este é o grupo de 1 a 3; ele abrang
e, por isso, a larg ura é 2.
horas inteiras

100
1 200
2 300
3
Amplitude de
Calculando o resto das larguras, obtemos:
classe
Horas Freqüência Largura
0–1 4,300 1
1–3 6,900 2
3–5 4,900 2
5–10 2,000 5
10–24 2,100 14

Agora que descobrimos as larguras das barras, podemos


dar um passo adiante e calcular as alturas.
26   Capítulo 1
visualizando informações

Passo 2: Ache as alturas das barras


Agora que temos as larguras de todos os grupos, podemos usá-las para achar as
alturas que as barras devem ter. Lembre-se de que precisamos ajustar as alturas das
barras para que a área total de cada barra seja proporcional à freqüência do grupo.
Primeiramente, vamos tomar a área de cada barra. Dissemos que a freqüência
e a área são equivalentes. Como já sabemos qual é a freqüência de cada grupo,
também sabemos quais devem ser as áreas:
Isto nos foi fornecido
Área da barra = Freqüência do grupo logo no início;
portanto, sabemos
Cada barra é basicamente apenas um retângulo, o que significa que a a área que estamos
área de cada barra é igual à largura multiplicada pela altura. Como a procurando.
área nos fornece a freqüência, isso significa que:

Freqüência = Largura da barra × Altura da barra

Achamos as larguras das barras no último passo, o que significa que


podemos usá-las para achar a altura que cada barra deve ter. Em
outras palavras,
Área = freqüência

Altura da barra = Freqüência


Altura
Largura
Altura da barra
Largura
A altura da barra é usada para medir a concentração da freqüência
em relação a um determinado grupo. É uma forma de medir a
densidade da freqüência, uma forma de dizer se os números são
largos ou finos na parte inferior. A altura da barra é chamada de
densidade da freqüência.

Qual deve ser a altura de cada barra? Complete a tabela.

Horas Freqüência Largura Altura (densidade da freqüência)


0–1 4,300 1 4,300 ÷ 1 = 4,300
1–3 6,900 2
3–5 4,900 2
5–10 2,000 5
10–24 2,100 14

você está aqui 4 27


Aqui novamente as vírgulas
desenhe o histograma devem ser desconsideradas
(4,300 = 4300)

Qual deve ser a altura de cada barra? Complete a tabela.

Horas Freqüência Largura Altura (densidade da freqüência)


0–1 4,300 1 4,300 ÷ 1 = 4,300
1–3 6,900 2 6,900 ÷ 2 = 3,450
3–5 4,900 2 4,900 ÷2 = 2,450
5–10 2,000 5 2,000 ÷ 5 = 400
10–24 2100 14 2,100 ÷ 14 = 150

Passo 3: Desenhe seu gráfico — um histograma


Agora que calculamos as larguras e as alturas de cada barra, podemos desenhar o histograma.
Desenhamos o histograma da mesma forma que fizemos antes, exceto pelo fato que, desta vez,
usamos a densidade da freqüência no eixo vertical, e não a freqüência.
Veja nosso histograma revisado.

Horas de Jogo por Dia


Densidade da Freqüência

5000 Esta legenda facilita


enxergar o que a área
representa. Ela é opcional. Representa 1.000 dias
4000

3000

ço
A quantidade de espa
Observe que não
2000
que as ba rra s oc up am
há espaços vazios está agora em propor
ção
1000 entre as barras. com os dados.

0
0 1 3 5 10 24

Embora a barra de 1 a 3 tenha uma As barras são desenhadas em Horas


freqüência mais alta, a densidade uma escala numérica contín
ua.
da freqüência é na verdade menor
do que para o intervalo de 0 a 1.

28   Capítulo 1
visualizando informações

A Densidade da Freqüência
Vista de Perto
A densidade da freqüência se refere à
concentração de valores nos dados. Ela está
relacionada com a freqüência, mas não
é a mesma coisa. Veja uma analogia para Aqui está todo o
demonstrar a relação entre as duas. suco dentro do
copo. Ele chega até
Suponha que você tenha despejado uma esse nível.
quantidade de suco em um copo, como ao lado:

E se você despejasse a mesma quantidade


de suco em um copo de tamanho diferente,
O copo é
por exemplo, um copo mais largo? O que mais largo
aconteceria com o nível do suco? Desta vez, o e, portanto,
copo é mais largo e, por isso, o nível ao qual o nível não
o suco chega é mais baixo. tem a mesma
altura.
O nível do suco varia de acordo com a
largura do corpo; quanto mais largo o copo,
mais baixo é o nível. O inverso também é
verdadeiro; quanto mais estreito o copo, mais
alto o nível do suco.

E o que o suco tem a ver com a densidade da freqüência?

Suco = Freqüência
Suponha que, em vez de despejar o suco em copos, você esteja
“despejando” a freqüência nas barras do seu gráfico. Assim como você
sabe a largura do copo, você também sabe a largura das barras. E, assim
como o espaço que o suco ocupa no copo (largura x altura) lhe diz
a quantidade de suco que está no copo, a área da barra no gráfico é
equivalente à sua freqüência.
A densidade da freqüência é, então, igual à altura da barra.
Continuando com nossa analogia, ela é equivalente ao nível ao qual o
suco chega em cada copo. Assim como um copo mais largo significa
que o suco chega a um nível mais baixo, uma barra mais larga significa
uma densidade de freqüência mais baixa.

Densidade da
Freqüência Suco
Barra
Freqüência

você está aqui 4 29


pontos de bala e nenhuma pergunta idiota

PONTOS DE BALA

¢¢ A densidade da freqüência está ¢¢ Ao desenhar histogramas, a largura de cada


relacionada à concentração das freqüências barra é proporcional à largura de seu grupo.
para dados agrupados. Ela é calculada As barras são mostradas em uma escala
através da fórmula numérica contínua.
¢¢ Em um histograma, a freqüência de um
Densidade da frequencia = Frequencia grupo é dada pela área de sua barra.
Largura do Grupo
¢¢ Um histograma não possui espaços vazios
¢¢ Histograma é um gráfico especializado entre suas barras.
em dados agrupados. Ele se parece com
um gráfico de barras, mas a altura de cada
barra é igual à densidade da freqüência, e
não igual à freqüência.

não existem
Perguntas Idiotas
P: Por que usamos a área para representar
da altura. Para achar a densidade da freqüência, tome a
freqüência de um intervalo e divida-a pela largura.
a freqüência quando estamos construindo
histogramas?
P: Se eu tenho dados numéricos agrupados, mas
R: Essa é uma forma de ter certeza de que os
tamanhos relativos de cada grupo mantêm uma
todos os intervalos têm a mesma largura, posso
usar um gráfico de barras normal?
proporção com os dados e são fiéis. Com dados
agrupados, precisamos de uma maneira visual de R: O uso de um histograma representa melhor seus
dados, pois você ainda está trabalhando com dados
expressar a largura de cada grupo e também sua
freqüência. Alterar a largura das barras é uma maneira agrupados. Na verdade, você quer que sua freqüência
intuitiva de refletir o intervalo do grupo, mas tem o efeito seja proporcional à sua área, e não à altura.
colateral de fazer com que os tamanhos das barras
pareçam desproporcionais. Uma maneira de contornar P: Os histogramas têm obrigatoriamente de
tal situação é ajustar a altura da barra e usar a área representar dados agrupados? É possível usá-los
para representar a freqüência. Dessa forma, nenhum para números separados bem como para grupos de
grupo é representado erroneamente ocupando mais ou números?
menos espaço do que deveria.

P: O que é densidade da freqüência mesmo?


R: Sim, é possível. O que você deve ter em mente
é que é preciso ter certeza de que não haja nenhum
espaço vazio entre as barras e que você faça cada barra
R: A densidade da freqüência é uma forma de
indicar a concentração dos valores em um determinado
com uma unidade de largura. Normalmente, isso é feito
posicionando o seu número no centro da barra. Como
intervalo. Ela oferece uma forma de comparar intervalos exemplo, para desenhar uma barra para representar o
diferentes que podem ter larguras diferentes. Além disso, número 1 separadamente, você desenharia uma barra
faz com que a freqüência seja proporcional à área de indo de 0,5 a 1,5, com o 1 no centro.
uma barra, em vez

30   Capítulo 1
visualizando informações

Veja um histograma representando o número de níveis completados


em cada jogo Vacas Loucas. Quantos jogos foram realizados no total?
Considere que cada nível seja um número inteiro.

Número de Níveis Completados por Jogo


Densidade da Freqüência

50
Representa 10 jogos
40

30

20

10

-1 0 1 2 3 4 5 6
–0,5 a 0,5 representa 0 nível, pois Nível
todos os valores dentro desse
intervalo são arredondados para 0.

você está aqui 4 31


solução do exercício

Veja um histograma representando o número de níveis completados


em cada jogo Vacas Loucas. Quantos jogos foram realizados no total?
Considere que cada nível seja um número inteiro.

Número de Níveis Completados por Jogo


Densidade da Freqüência

50
Representa 10 jogos
40

30 Cada nível é um
número inteiro;
20 portanto, a barra
referente ao nível 3 vai
de 2,5 a 3,5.
10

-1 0 1 2 3 4 5 6
Nível

Precisamos achar o número total de jogos realizados, o que significa que precisamos achar a
freqüência total.
A freqüência total é igual à área de todas as barras somadas juntas. Em outras palavras,
multiplicamos a largura de cada barra pela sua densidade de freqüência para obter a
freqüência e, depois, somamos o conjunto todo.

Nível Largura Densidade da Freqüência Freqüência


0 1 10 1x10 = 10
1 1 30 1x30 = 30
2 1 50 1x50 = 50
3 1 30 1x30 = 30
4–5 2 10 2x10 = 20

Freqüência Total = 10 + 30 + 50 + 30 + 20
= 140

32   Capítulo 1
visualizando informações

Histogramas não podem fazer tudo


Embora histogramas sejam uma excelente forma de exibir dados numéricos
agrupados, existem alguns tipos de dados cuja forma ideal de representação
não é através de histogramas — como totais acumulados…

Eu gostaria muito de poder ver rapidamente


quantas pessoas jogam abaixo de um determinado
número de horas. Por exemplo, em vez de ver
quantas pessoas jogam entre 3 e 5 horas, seria
possível fazer um gráfico que mostrasse quantas
pessoas jogam até 5 horas?

Vamos tentar ajudar o diretor executivo. Veja o


histograma que tínhamos antes.

Horas de Jogo por Dia


Densidade da Freqüência

5000 Representa
1000 Dias
4000
O histograma nos diz a
3000 densidade da freqüência de
determinados grupos. Mas ele
já não é tão útil assim ao nos
2000
dar informações sobre quantos
jogadores jogam abaixo de um
1000 certo número de horas.

0
0 1 3 5 10 24
Horas
É difícil ver rapidamente quais são os totais acumulados neste gráfico. Para achar
a freqüência de jogadores que jogam até 5 horas, precisamos somar freqüências
diferentes. Precisamos de outro tipo de gráfico... mas qual?

PODERDO
CÉREBRO
Que tipo de informações você acha que deveríamos mostrar no gráfico? Que
tipo de informações deveríamos marcar no gráfico? Escreva sua resposta
abaixo.

você está aqui 4 33


gráficos de freqüência acumulada

Introduzindo freqüência Estatística vital


acumulada Freqüência
O diretor executivo precisa de algum tipo de
gráfico que mostre a ele a freqüência total abaixo Acumulada
de um determinado valor: a freqüência acumulada.
Por freqüência acumulada queremos basicamente A freqüência total até um
dizer o total acumulado. determinado valor. Ela é
O que precisamos é criar algum tipo de gráfico que
basicamente um total acumulado
mostre as horas no eixo horizontal e a freqüência das freqüências.
acumulada no eixo vertical. Dessa forma, o diretor
executivo poderá tomar um valor e ler a freqüência
correspondente até aquele ponto. Ele poderá descobrir quantas Horas Freqüência
pessoas jogam até 5 horas, 6 horas ou qualquer que seja o 0–1 4,300
número de horas em que ele esteja interessado no momento.
1–3 6,900
Antes de desenharmos o gráfico, precisamos saber o que 3–5 4,900
exatamente necessitamos marcar no gráfico. Precisamos calcular
as freqüências acumuladas para cada um dos intervalos que 5–10 2,000
temos e calcular também o limite superior de cada intervalo. 10–24 2,100
Vamos começar observando os dados. Desconsidere a
vírgula
Aqui estão os dado
Então quais são as freqüências acumuladas? s.
Primeiro de tudo, suponhamos que o diretor executivo precise marcar no gráfico a freqüência
acumulada, ou a freqüência total, referente a até 1 hora. Se olharmos os dados, sabemos que a
freqüência do grupo de 0 a 1 é 4.300 e podemos ver que esse é o limite superior do grupo. Isso
significa que a freqüência acumulada de horas até 1 é 4.300.
Em seguida, vamos olhar a freqüência total até 3. Sabemos quais são as freqüências dos grupos
de 0 a 1 e de 1 a 3, e 3 é novamente o limite superior. Para achar a freqüência total de horas até
3, somamos a freqüência do grupo de 0 a 1 e do grupo de 1 a 3.
Você consegue ver um padrão existente? Se tomarmos o limite superior de cada um dos grupos
de horas, podemos achar a freqüência total de horas até aquele valor somando as freqüências.
Ao aplicarmos isso a todos os grupos, obtemos
jogar
is você não pode
Incluímos o 0, po 0 hora por semana.
de
jogos por MENOS
Horas Freqüência Limite superior Freqüência acumulada
0 0 0 0
0–1 4,300 1 4,300
1–3 6,900 3 4,300+6,900 = 11,200
3–5 4,900 5 4,300+6,900+4,900 = 16,100
5–10 2,000 10 4,300+6,900+4,900+2,000 = 18,100
10–24 2,100 24 4,300+6,900+4,900+2,000+2,100 = 20,200
34   Capítulo 1 Desconsidere a vírgula
polígono de frequência
acumulada ou Ogiva de
visualizando informações
Galton

Desenhando o gráfico de Freqüências


freqüências acumuladas acumuladas
nunca
Agora que temos os limites superiores e as freqüências podem
acumuladas, podemos marcá-las em um gráfico. diminuir.
Trace dois eixos, sendo o vertical para a freqüência
acumulada e o horizontal para as horas. Feito isso, Se sua freqüência
marque cada um dos limites superiores em função da acumulada diminuir em
sua freqüência acumulada e, depois, una os pontos qualquer ponto, confira seus
com uma linha da seguinte forma: cálculos.

Total Acumulado de Horas de Jogo


22500
Freqüência Acumulada

20000
17500
15000
o
12500 Defina este pont em
ras
10000 marcando 10 ho üência
freq
função de uma 00.
7500 18 .1
acumulada de
5000
2500
0.0
0 5 10 15 20 25
u Horas
Sempre comece se cia
a fre qü ên
gráfico onde
acumulada é 0.

O diretor executivo quer que você ache o número de


pessoas jogando on-line até 4 horas. Tente estimar esse
valor usando o diagrama de freqüências acumuladas.

você está aqui 4 35


solução do aponte seu lápis e nenhuma pergunta idiota

O diretor executivo quer que você ache o número de


pessoas jogando on-line até 4 horas. Tente estimar esse
valor usando o diagrama de freqüências acumuladas.
13750 15000
12500 Para fazer isso, achamos 4 no eixo horizontal,
10000 achamos onde esse valor encontra a linha
do gráfico e lemos a freqüência acumulada
7500 correspondente no eixo vertical.
5000
Isso nos dá uma resposta de
2500 aproximadamente 13.750. Em outras palavras,
0.0 há aproximadamente 13.750 ocorrências de
0 5 pessoas jogando on-line abaixo de 4 horas.
4

não existem
Perguntas Idiotas
P: O que é freqüência P: Em alguns gráficos, é
sobrecarregado e você não consiga
ler as freqüências acumuladas e
acumulada? possível mostrar mais de um
comparar os conjuntos de dados.
conjunto de dados no mesmo
R: Freqüência acumulada de um
valor é a soma das freqüências até
gráfico. E no caso de gráficos de
freqüência acumulada? P: O que devo fazer para achar
a freqüência acumulada de um
aquele valor, inclusive. Ela lhe diz
a freqüência total até aquele ponto. R: Para gráficos de freqüência
valor?
Como exemplo, suponha que você
tenha dados que digam a idade das
acumulada, isso pode ser feito
traçando-se uma linha para R: Para achar a freqüência
acumulada, basta lê-la diretamente
pessoas. A freqüência acumulada cada conjunto de dados. Se, por
para o valor 27 lhe diz quantas exemplo, você quisesse comparar no gráfico. Encontre o valor para o
pessoas têm até 27 anos de idade, as freqüências acumuladas por qual você deseja achar a freqüência
inclusive. sexo, poderia traçar uma linha acumulada no eixo horizontal,
ache onde ele encontra a curva
P:
representando homens e outra
representando mulheres. Seria da freqüência acumulada e, em
Os gráficos de freqüências
bem mais eficaz mostrar as duas seguida, leia o valor da freqüência
acumuladas são usados só para
linhas em um único gráfico, pois acumulada no eixo vertical.
dados agrupados?

R: Absolutamente; você pode


isso facilita a comparação dos dois
conjuntos de dados. P: Se eu já souber a freqüência
usá-los para qualquer tipo de dados
numéricos. O mais importante é se
P: Existe algum limite para
acumulada, posso usar o
gráfico para achar o valor
correspondente?
você deseja saber a freqüência total quantas linhas você pode mostrar
até um determinado valor ou se está em um gráfico?
R: Sim, pode. Procure a
mais interessado nas freqüências
de determinados valores. R: Não há um limite específico,
pois tudo depende dos seus dados.
freqüência acumulada no eixo
vertical, ache onde ela encontra a
Tente não fazer muitas linhas para curva da freqüência acumulada e,
que o gráfico não fique em seguida, leia o valor.
36   Capítulo 1
visualizando informações

Durante a apresentação da Manic Mango, o diretor executivo quer explicar


como ele pretende direcionar seu alvo para determinados grupos de idade.
Ele possui um gráfico de freqüência acumulada mostrando a freqüência
acumulada das idades, mas precisa também das freqüências, e seu
cachorro comeu a folha de papel em que elas estavam escritas. Tente usar
o gráfico de freqüência acumulada para estimar quais são as freqüências
de cada grupo.
O limite superior é 18, pois uma pessoa é classificada como
tendo
17 anos a partir do ponto do seu 17º aniversário até o ponto
em que
faz 18 anos. As idades são geralmente arredondadas para baixo
.
Faixa Limite Freqüência Freqüência
etária superior acumulada
<0 0 0 0
0–17 18
18–24
25–39
40–54
55–79
80–99

Número de Jogadores Abaixo de uma Determinada Idade


10000
Freqüência Acumulada

7500

5000

2500

0.0
0 10 20 30 40 50 60 70 80 90 100

Horas
Idades

você está aqui 4 37


solução do exercício

Durante a apresentação da Manic Mango, o diretor executivo quer explicar


como ele pretende direcionar seu alvo para determinados grupos de idade.
Ele possui um gráfico de freqüência acumulada mostrando a freqüência
acumulada das cidades, mas precisa também das freqüências, e seu
cachorro comeu a folha de papel em que elas estavam escritas. Tente usar
o gráfico de freqüência acumulada para estimar quais são as freqüências
de cada grupo.
Faixa Limite Freqüência Freqüência
etária superior acumulada
<0 0 0 0
0–17 18 2,000 2,000
18–24 25 4,500 4,500 - 2,000 = 2,500
25–39 40 6,500 6,500 - 4,500 = 2,000
40–54 55 8,500 8,500 - 6,500 = 2,000
55–79 80 9,400 9,400 - 8,500 = 900
80–99 100 9,500 9,500 - 9,400 = 100
Use o gráfico para
r as freqüências
achar as freqüência
s
Não se preocupe se você obtiver desconsidere Você pode acha acumulada
ncia
acumuladas. resultados ligeiramente diferentes as vírgulas tomando a freqüê do da primeira.
— eles são apenas estimativas. atual e subtrain
Número de Jogadores Abaixo de uma Determinada Idade
10000
Freqüência Acumulada

7500

5000

2500

0.0
0 10 20 30 40 50 60 70 80 90 100
Idades
Horas

38   Capítulo 1
visualizando informações

Escolhendo o gráfico certo


O diretor executivo está muito contente com seu trabalho com os gráficos de
freqüência acumulada, e seu bônus já está praticamente no bolso. Ele está quase
terminando de preparar a apresentação, mas ainda há mais uma coisa de que ele
precisa: um gráfico que mostre os lucros da Manic Mango em comparação com
os lucros dos seus principais rivais. Que gráfico ele deveria usar?

Veja dois possíveis gráficos que o diretor executivo poderia usar em sua
apresentação. Sua tarefa é anotar algo sobre cada um e dizer, em sua
opinião, quais são os pontos fortes e fracos de um em relação ao outro.
Qual deles você escolheria?

Lucro em dólares
600
Manic Mango
500
Lucro (milhares)

Concorrente
400

300

200

100

0.0
2003 2004 2005 2006 2007
Ano

Lucro em dólares
600
Manic Mango
500
Lucro (milhares)

Concorrente
400

300

200

100

0
2003 2004 2005 2006 2007
Ano

você está aqui 4 39


solução do exercício

Veja dois possíveis gráficos que o diretor executivo poderia usar em sua
apresentação. Sua tarefa é anotar algo sobre cada um e dizer, em sua
opinião, quais são os pontos fortes e fracos de um em relação ao outro.
Qual deles você escolheria?

Lucro em dólares
600
Manic Mango
500
Lucro (milhares)

Concorrente
400
O gráfico de barras funciona muito bem
300 para comparar o lucro de ano em ano
e é excelente se você deseja comparar
200 lucros em um único ano. Como
exemplo, podemos ver que, até 2007,
100
o concorrente teve um lucro maior,
0.0 mas em 2007 foi a Manic Mango que
2003 2004 2005 2006 2007 teve maior lucro.
Ano
Um dos pontos fracos deste gráfico é que, se o diretor executivo, de repente, decidisse
acrescentar um terceiro concorrente, poderia ficar um pouco mais difícil analisar o gráfico
com um rápido passar de olhos.

Lucro em dólares
600 Manic Mango

500 Concorrente
Lucro (milhares)

400 Escolheríamos o gráfico de linhas,


pois a tendência geral é mais clara
300 do que no gráfico de barras. Mas não
se preocupe se você escolher o outro;
200
o gráfico que você usa depende de
100 quais são os fatores principais que
você deseja enfatizar.
0
2003 2004 2005 2006 2007
Ano

O gráfico de linhas é melhor para mostrar uma tendência, os lucros de ano em ano para cada
empresa. A linha de tendências para cada empresa é bem definida, o que significa que podemos
facilmente ver o padrão dos lucros: os lucros da Manic Mango estão crescendo bem, onde seu
concorrente está começando a ter uma queda. Seria fácil também acrescentar outra empresa sem
sobrecarregar o gráfico.
Um ponto fraco é que você também pode comparar o lucro de ano em ano, mas talvez o gráfico
de barras seja mais claro.

40   Capítulo 1
visualizando informações

A Densidade da Freqüência
Vista de Perto
Gráficos de linhas são bons para mostrar tendências em seus dados. Para cada
conjunto de dados, você marca os pontos e depois os une com linhas. É fácil mostrar
vários conjuntos de dados no mesmo gráfico sem sobrecarregá-lo. Mas deixe claro
qual linha é qual.
Assim como outros tipos de gráficos, você pode escolher entre mostrar a freqüência
ou as porcentagens no eixo vertical. A escala que você utiliza depende de quais
fatores deseja destacar.
Gráficos de linhas são geralmente usados para mostrar medidas de tempo. O tempo
sempre fica no eixo horizontal, e a freqüência no vertical. Você pode ler a freqüência
para qualquer período de tempo escolhendo o valor do tempo no eixo horizontal e
lendo a freqüência correspondente àquele ponto sobre a linha.

Lucro em dólares
600

500
Lucro (milhares)

400

300

200

100

0
2003 2004 2005 2006 2007
Ano

Gráficos de linhas devem ser Esta linha de


usados somente para dados tendências não é
numéricos, e não categóricos. significativa. O que
Isso se deve ao fato de que faz 4 aconteceria se você
sentido comparar categorias reorganizasse as
diferentes, mas não faz categorias?
3
Freqüência

sentido traçar uma linha de


tendências. Use um gráfico de
linhas somente se você estiver 2
comparando categorias com
alguma unidade numérica,
como o tempo, e, neste caso, 1
você deve usar uma linha
separada para cada categoria.
Azul Castanho Verde Vermelho
Cor do Olho

você está aqui 4 41


pontos de bala e nenhuma pergunta idiota

PONTOS DE BALA

¢¢ Freqüência acumulada é a freqüência linha para cada conjunto de dados e deixe


total até um determinado valor. Ela é o total claro qual linha é qual.
acumulado das freqüências. ¢¢ É possível usar gráficos de linhas para fazer
¢¢ Use um gráfico de freqüência acumulada previsões básicas, pois é fácil ver o formato
para marcar o limite superior de cada da tendência. Basta prolongar a linha de
grupo de dados em função da freqüência tendências, tentando manter o mesmo
acumulada. formato básico.

¢¢ Use um gráfico de linhas se você deseja ¢¢ Não use gráficos de linhas para mostrar
mostrar tendências, por exemplo com dados categóricos a não ser que você
relação ao tempo. esteja mostrando tendências para cada
categoria, por exemplo com relação ao
¢¢ É possível mostrar mais de um conjunto de tempo. Se fizer isso, trace uma linha para
dados em um gráfico de linhas. Use uma cada categoria.

não existem
Perguntas Idiotas
P: Gráficos de linhas são a P: Gráficos de linhas podem P: Agora que sei como criar
mesma coisa que gráfico de série mostrar dados categóricos bem gráficos corretamente, posso
temporal? Acha que já ouvi esse como dados numéricos? usar softwares gráficos para fazer
nome sendo usado antes. o trabalho pesado?

R: O gráfico de série temporal


R: Gráficos de linha devem
somente ser usados para mostrar R: Claro que sim! Softwares
é, na verdade, um gráfico de linhas dados categóricos se você estiver gráficos podem lhe poupar muito
que se concentra em intervalos mostrando tendências para cada tempo e trabalho, e os resultados
de tempo, exatamente como os categoria, e não se esqueça de podem ser excelentes. O importante
exemplos que usamos. Um gráfico usar uma linha separada para cada ao usar softwares para gerar seus
de linhas, entretanto, não tem de se categoria. gráficos é lembrar que o software
concentrar só no tempo. O que você não deve fazer é usar não pode pensar por você. Você

P:
um gráfico de linhas para traçar continua tendo de decidir qual
Há alguma variedade linhas de categoria em categoria. gráfico representa melhor seus fatos,

P:
especial de gráficos de linhas? e é preciso verificar se o software
Então gráficos de linhas são gera exatamente o que você espera.
R: Sim. Na verdade, você já
se deparou com um deles. O
melhores para mostrar tendências
sobrepostas e gráficos de barras
gráfico de freqüência acumulada são melhores para comparar
é um tipo de gráfico de linhas que valores ou categorias?
mostra a freqüência total até um
determinado valor. R: Exatamente. A decisão
de qual gráfico você deve usar,
na verdade, se resume a qual
mensagem você deseja transmitir e
quais fatores você deseja minimizar.

42   Capítulo 1
visualizando informações

A Manic Mango conquistou o mercado de jogos!


Você ajudou a gerar alguns excelentes gráficos para a Manic Mango, e graças a você
a apresentação foi um enorme sucesso. A Manic Mango conseguiu uma enorme
quantidade de publicidade para seus jogos e está jorrando dinheiro vindo dos
patrocinadores e das propagandas. A você, só resta pensar em todas as coisas que
poderia fazer e os lugares que poderia ir com seu bônus bem merecido.
Você teve a primeira prova de como a estatística pode ajudá-lo e o que você pode
atingir entendendo o que realmente está acontecendo. Continue lendo e vamos
mostrar-lhe mais coisas que você pode fazer, começando a realmente alongar os
músculos da estatística.

Excelente trabalho
com esses gráficos! Os
investidores estão fazendo fila
do lado de fora do escritório.
Tire longas férias, tudo por
minha conta!

você está aqui 4 43

Você também pode gostar