Você está na página 1de 9

Gráficos box-plot e ramo-e-folhas

O gráfico box plot (gráfico de caixa) é uma ferramenta exploratória de análise de dados,
cujo principal propósito é dar ao usuário um método eficiente de examinar um conjunto
de dados, para se ter uma primeira idéia da distribuição desses dados.

Por sua vez, podemos usar os gráficos ramo-e-folhas para representar as distribuições de
frequências e também para pequenos conjuntos dados além de possibilitar a
visualização completa das observações.

Construção de um gráfico ramo-e-folhas

Na construção, cada observação é dividida em duas partes, o ramo e as suas folhas, do


mesmo jeito que ocorre numa árvore.

Logo que finalizamos a sua construção, se observarmos os dados coletados gerados em


um ângulo de noventa graus, veremos um diagrama bem semelhante a um histograma,
só que feito com valores em vez de retângulos.

Esta representação possui duas vantagens em relação ao histograma:

 seus valores são os valores reais;


 é simples de construir

Vejamos um exemplo para aclarar essa visualização!

 Exemplo de gráfico ramo-e-folhas

Imaginemos que desejamos visualizar a distribuição dos valores de tempo de


antiguidade – em meses – dos funcionários de uma determinada empresa. Coletados
esses dados, os 20 valores de tempo de antiguidade (em meses) já ordenados são:

8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83, 100, 104.

Podemos, para construir nosso gráfico, organizar os dados, separando-os pelas dezenas:
uma em cada linha do gráfico, da seguinte forma:
8, 9
11, 17, 17, 19
20
44, 45
53, 57, 57, 57, 58
70
81, 82, 83
100, 104

E, assim obtemos uma primeira aproximação do gráfico. Porém, como muitos valores,
em cada linha, tem as dezenas em comum, podemos colocar as dezenas em evidência,
separando-as das unidades por um traço:

Figura 3.8 - Construção de um diagrama de ramo-e-folhas

0 89
1 1779
2 0
3 -
4 45
RAMO 5 3 7 7 7 8 FOLHAS
6 -
7 0 Legenda:
8 123 5 | 3 = 53 meses
9 - 10| 4 = 104 meses
10 4
Fonte: Elaboração do autor (2011).

Ao dispor os dados dessa maneira, estamos construindo um diagrama de ramo-e-


folhas. O lado esquerdo, com as dezenas, é chamado de ramo, no qual estão
dependuradas as unidades, chamadas folhas, à direita da linha vertical.

Para sabermos o que está sendo representado, um ramo-de-folhas


deve ter sempre uma legenda, indicando o que significam os ramos e as
folhas. Assim, se o tempo de empresa dos funcionários estivesse medido
em dias, por exemplo, usando esse mesmo ramo de folhas, poderíamos
estabelecer que o ramo representaria as centenas e as folhas, as dezenas.
Assim, 0|8 seria igual a 80 dias e 10|4 seria igual a 104 dias.

Como podemos agora interpretar este gráfico? Analisando o ramo-e-folhas para o


tempo de empresa dos funcionários, percebemos a existência de três grupos:
 o grupo com os recém-contratados (até 20 meses);
 o grupo com os que já tem algum tempo de empresa (de 44 a 58 meses);
 o grupo com os mais velhos (mais de 70 meses) com destaque, aqui, para
dois funcionários que já estão na empresa à mais de oito anos!

O que mais podemos fazer com este mesmo gráfico do exemplo? O ramo-e-folhas
também pode ser usado para comparar duas distribuições de valores. Assim,
aproveitando o mesmo ramo do diagrama do tempo de empresa, podemos fazer o
diagrama das mulheres que trabalham nesta empresa, utilizando o lado esquerdo. Logo
após serem coletados os dados, resultou o seguinte gráfico:

Figura 3.9 - Gráfico ramo-e-folhas

998 0 89
99876610001 1 1779
3111 2 0
5444322 3 -
55 4 45
8651 5 37778
8 6 -
0 7 0
31 8 123
- 9 -
- 10 04
5 11 -
- 12 -
- 13 - Legenda:
- 14 - 5 | 5 | = 55 meses para homem
7 15 - | 5 | 3 = 53 meses para mulher
Fonte: Elaboração do autor (2011).

Podemos observar que as folhas das mulheres são dependuradas de modo espelhado,
assim como explica a legenda, que agora deve ser dupla!

Observando a tabela, notamos que as mulheres têm menos tempo de empresa do que os
homens, embora possuam dois funcionários com mais tempo na empresa. Também
podemos observar rapidamente que a empresa tem mais empregados homens que
mulheres.

Construção de um gráfico box-plot


O box-plot é especialmente útil quando trabalhamos com conjuntos limitados de dados
para os quais outras ferramentas, como histogramas que requerem dados com mais de
30 pontos, não permitem auxiliar o estudo pois a quantidade de dados pode ser
insuficiente para se obter uma conclusão.

Através da disposição dos valores em ordem crescente, tem-se uma ideia clara sobre a
localização e a dispersão dos dados. Para a construção do gráfico box–plot, precisamos
calcular:

 limite inferior;
 limite superior;
 primeiro quartil;
 terceiro quartil;
 mediana.

Estas cinco medidas são denominadas de estatística de ordem.

Vejamos as partes componentes de um box-plot:

Figura 3.10 - Componentes de um box-plot

Fonte: Elaboração do autor (2011).

As informações dadas pelo resumo destes cinco números são apresentadas na forma de
um gráfico de caixa que agrega uma série de informações sobre a distribuição, como:

 posição;
 dispersão;
 assimetria;
 caudas;
 dados discrepantes (outliers).

Figura 3.11 - Componentes de um box-plot: nomes usuais

Fonte: Elaboração do autor (2011).

Assim, a posição central dos valores é dada pela mediana e a dispersão, pela amplitude
interquartílica; as posições relativas da mediana e dos quartis e o formato dos bigodes
dão uma noção da simetria e do tamanho das caudas da distribuição.

 Algumas propriedades dos box-plot para a sua interpretação

Quando a distribuição dos dados é simétrica, a linha da mediana estará localizada no


centro do retângulo e as duas linhas que partem das extremidades do retângulo terão
quase os mesmos comprimentos.

Quando a distribuição dos dados é assimétrica à direita, a linha da mediana estará mais
próxima de Q1 do que de Q3; e, por sua vez, quando a distribuição é assimétrica à
esquerda, a linha da mediana estará mais próxima de Q3 do que de Q1.

Assim, podemos observar os seguintes exemplos de assimetrias negativas, positivas e


dados simétricos, respectivamente, de esquerda à direita:

Figura 3.12 - Assimetrias


Fonte: Elaboração do autor (2011).

O box plot também pode ser desenhado na posição vertical ou na horizontal. Pode ser
utilizado na comparação de dois ou mais conjuntos de dados e na comparação com
outras ferramentas, por exemplo, junto com os histogramas.

 Dicas para a construção do box-plot

 colete os n dados referentes à variável de interesse;


 disponha os dados em ordem crescente. Calcule a mediana, Q1 e Q3;
 identifique o valor (min) e o valor (max) da amostra.
 trace um eixo e o marque com uma escala adequada e de fácil leitura;
 sobre o eixo, desenhe um retângulo da seguinte forma:
o posicione a extremidade inferior do retângulo em Q1;
o posicione a extremidade superior do retângulo em Q3 e, no interior
do retângulo, trace a mediana;
o feche o retângulo para obter o box;
 desenhe uma linha a partir da extremidade inferior do retângulo com
distância de até 1,5x(Q3-Q1) para construir o bigode inferior;
 desenhe uma linha a partir da extremidade superior do retângulo com uma
distância de 1,5x(Q3-Q1) para construir o bigode superior;
 desenhe asteriscos para marcar as observações localizadas a uma distância de
1,5x(Q3-Q1) a 3x(Q3-Q1) de cada extremidade do retângulo, que são os
possíveis outliers.
 desenhe círculos para marcar as observações localizadas a uma distância
superior a 3x(Q3-Q1) de cada extremidade do retângulo, que são os
prováveis outliers.
 registre as informações importantes que devam constar no gráfico, como
título, período, coleta de dados, tamanho da amostra, identificação dos eixos.

Os valores que estiverem acima do limite superior (haste superior) ou abaixo do limite
inferior (haste inferior) do box-plot serão considerados outliers.

Estes valores são considerados discrepantes, ou seja, não fazem parte do


comportamento esperado do grupo em estudo.

Assim o box-plot resulta:

Figura 3.13 - Box-plot

Limite haste superior: 3°quartil + 1,5 x (3° quartil – 1° quartil)

Limite haste superior: 3°quartil - 1,5 x (3° quartil – 1° quartil)

Fonte: Elaboração do autor (2011).

Complicado? Sim, um pouco, mas com a ajuda de um “truque” no Excel, podemos


fazer, ao menos, um esquema de box-plot,ainda que o melhor seja sempre trabalhar com
algum programa de estatística que esteja preparado para desenhar este tipo de gráfico.

Dentre os programas grátis de estatísticas que podem ser


achados na internet, uns dos mais completos é o PAST
(http://folk.uio.no/ohammer/past/) da Universidade de Oslo
(Noruega).

Na internet, podem ser achados vários tutoriais explicando como fazer um box-plot
completo no Excel, é só procurar com um site de buscas como o Google ou outro
semelhante que você esteja acostumado a utilizar no seu dia a dia.
 Exemplo de como construir um box-plot no Excel.

Em uma nova planilha, digite os seguintes dados, que são os valores necessários para
construir o box-plot e que foram calculados a partir de três conjuntos de dados de um
certo levantamento de campo:

Figura 3.14 – Box-plot em Excel

Fonte: Elaboração do autor (2011).

a) selecionar as células A2:D7;


b) em seguida, ir ao menu Inserir e clicar em gráfico;
c) Na guia tipos padrão, clique em ações, depois em tipo de gráfico e, em
seguida, clique no quarto gráfico de subtipo:

Figura 3.15 - Box-plot em Excel

Fonte: Elaboração do autor (2011).

d) clique em Avançar;
e) na guia Intervalo de dados, clique em linhas, depois em sequências em e, em
seguida, clique em Avançar;
f) na guia Legenda, clique para desmarcar a caixa de seleção Mostrar legenda;
g) na guia Eixos, clique para desmarcar a caixa de seleção eixo (Y) em eixo
secundário e, em seguida, clique em Concluir;
h) clique uma vez em qualquer uma das colunas coloridas para selecionar a série.
Não clique em uma das colunas em branco;
i) no menu Gráfico, clique em Tipo de gráfico;
j) em Tipo de gráfico, clique em Linha e, em seguida, clique em OK.
Figura 3.16 - Box-plot em Excel

Fonte: Elaboração do autor (2011).

k) uma linha que conecta as três colunas em branco aparecerá no gráfico;


l) clique uma vez na linha e, em seguida, clique com o botão direito do mouse em
formatar serie de dados para indicar nenhuma linha e marcador;
m) pronto, o esquema do box-plot já está construído. Somente agora você deve
botar as informações importantes do gráfico.

Figura 3.17 - Box-plot em Excel

Fonte: Elaboração do autor (2011).

Você também pode gostar