Você está na página 1de 9

Capítulo 3

Gráficos

Objetivos do Capítulo

No capítulo anterior apresentamos alguns conceitos de estatística descritiva.


Especificamente, vimos como obter informações de um conjunto de medidas ou dados
através do cálculo de medidas de tendência central (média, mediana e moda) e de
medidas de dispersão (amplitude, variância e desvio padrão). Neste capítulo serão
discutidos outros modos de apresentação de dados envolvendo gráficos. A apresentação
de dados na forma de gráficos é largamente utilizado por revistas, jornais e outras
publicações. Ao término deste capítulo você será capaz de:

1. Construir gráficos do tipo:


barra
linha
histograma
torta
Pontos (dotplot)
Ramo e Folhas (stem-and-leaf)
Caixa (boxplot)
2. Discutir como um gráfico pode ser enganoso

33
3.1 - Gráfico de Barra

Gráficos são usados para apresentar dados e transmitir idéias de uma forma clara e
simples. Um gráfico é um método visual que pode nos ajudar a esclarecer idéias e mostrar
aspectos que possam estar escondidos em um monte de dados. Um dos tipos mais simples de
gráficos é o gráfico de barra. A tabela 3.1 mostra a porcentagem de eleitores, que votaram na
eleição presidencial americana, em 1980, segundo várias faixas de idade.

Tabela 3.1 – Porcentagem de eleitores.

Faixa de idade Porcentagem


18 – 20 36
21 - 24 43
25 –34 55
35 – 44 65
45 – 64 69
> 64 65

Usando a informação dada na tabela podemos construir o gráfico de barras mostrado


na figura 3.1. Pode-se observar que as faixas de idade estão no eixo horizontal e a
porcentagem é mostrada no eixo vertical.

80
Porcentagem

60

40

20

0
18 – 20 21 - 24 25 –34 35 – 44 45 – 64 > 64
Faixas de idade
Porcentagem

Figura 3.1 – Gráfico de barras mostrando a porcentagem de eleitores, em várias faixas de


idade, que votaram na eleição presidencial americana de 1980.

As principais características dos gráficos de barra são:

1. O eixo horizontal (eixo x) contém categorias tais como faixas de idade, anos, meses,
masculino, feminino, branco, preto e assim por diante.
2. Alguma medida quantitativa associada com uma dada categoria é representada pela
altura da barra.
3. As larguras de todas as barras são iguais.

34
4. As barras podem ser horizontais ou verticais e podem ser separadas ou serem
justapostas.

Exemplo 3.1 – Ilustra gráfico de barras

Nos anos 70, o índice de mortalidade infantil nos EUA era como mostrado abaixo na
tabela 3.2. Construa um gráfico de barras para estes dados.

Tabela 3.2 – Mortalidade infantil nos Estados Unidos (idade < 1 ano)
Ano Índice (mortes/1000)
Brancos Negros
1970 17,8 30,9
1971 17,1 28,5
1972 16,4 27,7
1973 15,8 26,2
1974 14,8 24,9
1975 14,2 24,2
1976 13,3 23,5
1977 12,3 21,7
1978 12,0 21,1
1979 11,4 19,8
Fonte: U.S. Department of Health and Human Services, Vital Statistics
of the United States (1979).

Solução:
O gráfico de barras é mostrado na figura 3.2. Ele permite observar que o índice de
mortalidade infantil dos negros diminuiu ao longo da década de 70, porém sempre se manteve
acima do índice de mortalidade dos brancos.

35,0
Mortes por 1000

30,0
25,0
20,0
15,0
10,0
5,0
0,0
70

71

72

73

74

75

76

77

78

79
19

19

19

19

19

19

19

19

19

19

Ano
Brancos Negros

Figura 3.2 – Gráfico de barra de mortalidade infantil.

35
3.2 – Gráfico de Pizza

O gráfico de pizza ou gráfico de círculo pode ser usado para mostrar a participação
de cada item com relação ao todo. A participação de cada item é dada como uma porcentagem
do todo. Para construir um gráfico de pizza, pense em um círculo como estando dividido em
360 partes iguais, formando ângulos centrais de 1 grau. Com isso, podemos facilmente dividir
o círculo, em pedaços de tamanho apropriado, multiplicando a porcentagem que representa
uma dada categoria por 360. Em outras palavras, 360 multiplicado por x% produz o número
de graus do ângulo central que define a porção do círculo (setor circular) a ser assinalada a
uma dada categoria.

Exemplo 3.2 – Ilustra a construção de um gráfico de pizza

Considere a tabela 3.3 que detalha os custos para sustentar um filho até os 17 anos.
Construa um gráfico de Pizza com os dados fornecidos.

Tabela 3.3 – Subdivisão dos custos


Item Custo (US$-1985) Porcentagem do total
Moradia 32200 22,6
Alimentação 32600 22,8
Transporte 32500 25,6
Vestuário 8900 6,2
Saúde 8500 6,0
Recreação 15000 10,5
Outros 9000 6,3
142700

Solução:
O gráfico é mostrado na figura 3.3.

Figura 3.3 – Gráfico de círculo (pizza) dos custos de criação até os 17 anos.
36
Visualmente fica fácil observar que moradia, transporte e alimentação são os itens de
maior peso no valor total gasto. O cálculo do número de graus do setor circular que irá
representar a porcentagem correspondente à alimentação (22,8%) é dado por:

360 x 0,228 = 82,08 graus

Desta maneira, um ângulo de 82 graus, aproximadamente, define a parte do círculo


que representa o custo com alimentação.

3.3 – Gráfico de Linha

Os gráficos de linha são especialmente úteis para mostrar tendências em um


determinado período de tempo. Neste caso, no eixo horizontal x colocamos uma escala de
tempo e no eixo vertical y colocamos as medições, isto é, os valores coletados.

Exemplo 3.3 – Ilustra a construção de um gráfico de linha

Usando os dados da tabela 3.2, traçar o gráfico de linha correspondente.

Solução:
O gráfico é mostrado na figura 3.4. A linha mais espessa corresponde aos valores da
segunda coluna (Brancos).

35
30
Mortes por 1000

25
20 Brancos
15 Negros
10
5
0
70

72

74

76

78
19

19

19

19

19

Ano

Figura 3.4 – Gráfico de linha dupla.

Novamente, o gráfico permite concluir que houve uma clara diminuição dos índices de
mortalidade ao longo da década de 70.

37
3.4 – Histogramas

Uma representação gráfica de uma distribuição de freqüência pode ser obtida através
da construção de um histograma. Um histograma é uma forma especial de gráfico de barra
no qual os intervalos das classes são representados pelas larguras das barras e as freqüências
dos dados que caem nas classes são representadas pela área das barras.

Para construir um histograma, primeiro desenhe uma linha horizontal que irá
representar o eixo das medições (dados) e marque os limites das classes adjacentes neste eixo.
Em seguida, acima de cada classe, desenhe um retângulo cuja área seja proporcional à
freqüência daquele intervalo. Assim se o intervalo i contém o dobro de observações do
intervalo j, então o retângulo acima do intervalo i deve ter uma área que seja o dobro da área
do retângulo acima do intervalo j. A tabela 2.13 do capítulo dois é uma tabela de freqüências
para os níveis de colesterol de vinte pacientes jovens. Para facilitar, esta tabela é aqui repetida
e identificada como tabela 3.4. O histograma para os dados dessa tabela pode ser visto na
figura 3.5.

Tabela 3.4 - Tabela de dados agrupados para os níveis de colesterol.

Nível de Freqüência Freqüência Ponto de Classe


colesterol Relativa
195 – 199 1 0,05 197
200 – 204 3 0,15 202
205 – 209 4 0,20 207
210 –214 7 0,35 212
215 –219 4 0,20 217
220 – 224 1 0,05 222
20 1,00

5
Freqüência

194,5 199,5 204,5 209,5 214,5 219,5 224,5

Nível de Colesterol
Figura 3.5 – Histograma para os dados da tabela 3.4.

38
Um histograma é mais fácil de ser construído se as classes possuírem mesma
amplitude. Neste caso, basta construir retângulos cujas alturas sejam proporcionais às
freqüências. É também mais fácil olhar para dois retângulos com bases de mesmo tamanho e
julgar que um é duas vezes mais alto do que o outro do que comparar as áreas de dois
retângulos que tem bases e alturas diferentes.

O eixo vertical no histograma acima poderia conter os valores das freqüências


relativas em vez das freqüências. Outra possibilidade é fazer a área de cada retângulo igual ao
valor da freqüência relativa. Com isso a soma das áreas seria igual a 1. Isso é feito fixando-se
o valor da base (amplitude do intervalo) e calculando-se a altura do retângulo pela divisão
(freqüência relativa)/(base).

3.5 – Disposição Ramo e Folhas (Stem-and-Leaf Display)

Assuma que um conjunto de dados contenha n elementos x1, x2, ..., xn, onde cada dado
consiste de pelo menos dois dígitos. Uma maneira simples de obter uma informação visual
dos dados é fazer uma disposição dos mesmos em uma forma denominada ramo e folhas. Para
isso divida cada dado xi em duas componentes: um ramo, constituído por um ou mais dígitos
iniciais do dado e, uma folha, constituída dos dígitos restantes. Em geral, para um conjunto de
dados típico, o número de troncos é pequeno, algo entre 6 e 20 é usualmente adequado.

Uma vez que os troncos tenham sido definidos, eles devem ser colocados segundo
uma ordem crescente de valores na forma de uma coluna do lado esquerdo da página. Ao lado
de cada tronco todas as folhas correspondentes aos valores dos dados são dispostas à direita
do tronco na ordem em que os dados aparecem no conjunto. O exemplo a seguir ilustra este
tipo de disposição de dados.

Exemplo 3.4 – Ilustra a construção de uma disposição ramo e folhas

Uma pesquisa sobre consumo de gasolina de carros de tamanho médio coletou os


seguintes valores, em km/l:

8,5 12,4 10,0 9,7 10,4 6,7 7,5


13,2 11,1 8,9 10,8 11,5 18,2 12,0
13,8 11,2 16,6 8,8 9,3 13,3 10,7
11,6 15,8 12,3 9,2 14,2 14,5 10,9

Coloque esses dados segundo uma disposição tronco e folhas.

Solução:
Como o menor valor presente entre os dados é 7,5 e o maior valor é 16,6, podemos
fazer uma escolha dos troncos como sendo 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, dando um total
de 10 troncos. A disposição fica como mostrada abaixo.

39
6 ,7
7 ,5
8 ,5; ,9; ,8
9 ,7; ,3; ,2
10 ,0; ,4; ,8; ,7; ,9
11 ,1; ,5; ,2; ,6
12 ,4; ,0; ,3
13 ,2; ,8; ,3
14 ,2; ,5
15 ,8
16 ,6
17
18 ,2

Pela disposição fica fácil observar que a maior parte das taxas de consumo se
encontram entre 8 e 13 km/l e que os valores se distribuem com uma forma de sino em torno
dos valores 10 e 11, isto é, pode-se observar que o valor médio é algo entre 10 e 11 km/l.

Este exemplo mostra que esta disposição dos dados nos auxilia a extrair alguns
aspectos importantes do conjunto de dados sob análise. A vantagem sobre um histograma é
que não perdemos informações sobre os valores.

3.6 – Diagrama de Pontos (dotplot)

Este tipo de diagrama é bastante simples e consiste em marcar a posição de cada dado
em um eixo horizontal com uma escala adequada para representar todos os valores do
conjunto de dados. O exemplo abaixo ilustra este tipo de diagrama.

Exemplo 3.4 – Ilustra a construção de um diagrama de pontos

Em um determinado mês, uma concessionária de energia elétrica registrou 11 quedas


de energia, em uma determinada região, com as seguintes durações em horas:

1,0 3,0 1,5 1,0 10,0 1,5

2,0 1,5 1,0 2,5 2,0 1,5

Construa um diagrama de pontos com esses valores.

Solução:
O diagrama está mostrado na figura 3.6. Os valores repetidos são colocados alinhados
em uma coluna acima do eixo.

40
Figura 3.6 – Diagrama de pontos para os tempos de duração das quedas de energia.

No diagrama nota-se que a maioria dos pontos estão situados entre 1 e 2 horas. O valor
excessivamente alto de 10 h aparece isolado no gráfico, mostrando que algo excepcional deve
ter ocorrido.

Exercícios – Seqüência 3.1

1) Um artigo no Environmental Concentration and Toxicology (“Trace Metals in Sea


Scallops”, vol.19) relatou a quantidade de Cádmio em conchas do mar observadas em
diferentes locais em águas do Atlântico Norte. Os valores coletados são:

5,1 14,4 14,7 10,8 6,5 5,7 7,7 14,1


3,7 8,9 7,9 7,9 4,5 10,1 5,0 9,6
5,1 11,4 8,0 12,1 7,5 8,5 13,1 6,4
27,0 18,9 10,8 13,1 8,4 16,9 2,7 9,6
12,4 5,5 12,7 17,1 9,5 5,5 18,0 4,5

a) Construa uma tabela de freqüência para o conjunto de dados acima adotando o


intervalo 0,0 – 4,0 como o primeiro intervalo.
b) Construa um histograma correspondente à distribuição de freqüência determinada em
(a) de modo que a área seja igual à freqüência relativa.

2) Um levantamento dos salários dos empregados de uma empresa resultou nos seguintes
valores em reais (a parte decimal foi omitida):

405 371 621 190 268 380 319 570


443 370 508 426 288 490 344 235

a) Determine a média e o desvio padrão dos dados.


b) Construa um diagrama ramo-e-folhas (stem-and-leaf display)
c) Construa um diagrama de caixa (boxplot)

Nota: Utilize um software de Estatística.

41

Você também pode gostar