Escolar Documentos
Profissional Documentos
Cultura Documentos
O gráfico box plot (gráfico de caixa) é uma ferramenta exploratória de análise de dados,
cujo principal propósito é dar ao usuário um método eficiente de examinar um conjunto
de dados, para se ter uma primeira idéia da distribuição desses dados.
Por sua vez, podemos usar os gráficos ramo-e-folhas para representar as distribuições de
frequências e também para pequenos conjuntos dados além de possibilitar a
visualização completa das observações.
8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83, 100, 104.
Podemos, para construir nosso gráfico, organizar os dados, separando-os pelas dezenas:
uma em cada linha do gráfico, da seguinte forma:
8, 9
11, 17, 17, 19
20
44, 45
53, 57, 57, 57, 58
70
81, 82, 83
100, 104
E, assim obtemos uma primeira aproximação do gráfico. Porém, como muitos valores,
em cada linha, tem as dezenas em comum, podemos colocar as dezenas em evidência,
separando-as das unidades por um traço:
0 89
1 1779
2 0
3 -
4 45
RAMO 5 3 7 7 7 8 FOLHAS
6 -
7 0 Legenda:
8 123 5 | 3 = 53 meses
9 - 10| 4 = 104 meses
10 4
Fonte: Elaboração do autor (2011).
O que mais podemos fazer com este mesmo gráfico do exemplo? O ramo-e-folhas
também pode ser usado para comparar duas distribuições de valores. Assim,
aproveitando o mesmo ramo do diagrama do tempo de empresa, podemos fazer o
diagrama das mulheres que trabalham nesta empresa, utilizando o lado esquerdo. Logo
após serem coletados os dados, resultou o seguinte gráfico:
998 0 89
99876610001 1 1779
3111 2 0
5444322 3 -
55 4 45
8651 5 37778
8 6 -
0 7 0
31 8 123
- 9 -
- 10 04
5 11 -
- 12 -
- 13 - Legenda:
- 14 - 5 | 5 | = 55 meses para homem
7 15 - | 5 | 3 = 53 meses para mulher
Fonte: Elaboração do autor (2011).
Podemos observar que as folhas das mulheres são dependuradas de modo espelhado,
assim como explica a legenda, que agora deve ser dupla!
Observando a tabela, notamos que as mulheres têm menos tempo de empresa do que os
homens, embora possuam dois funcionários com mais tempo na empresa. Também
podemos observar rapidamente que a empresa tem mais empregados homens que
mulheres.
Através da disposição dos valores em ordem crescente, tem-se uma ideia clara sobre a
localização e a dispersão dos dados. Para a construção do gráfico box–plot, precisamos
calcular:
limite inferior;
limite superior;
primeiro quartil;
terceiro quartil;
mediana.
As informações dadas pelo resumo destes cinco números são apresentadas na forma de
um gráfico de caixa que agrega uma série de informações sobre a distribuição, como:
posição;
dispersão;
assimetria;
caudas;
dados discrepantes (outliers).
Assim, a posição central dos valores é dada pela mediana e a dispersão, pela amplitude
interquartílica; as posições relativas da mediana e dos quartis e o formato dos bigodes
dão uma noção da simetria e do tamanho das caudas da distribuição.
Quando a distribuição dos dados é assimétrica à direita, a linha da mediana estará mais
próxima de Q1 do que de Q3; e, por sua vez, quando a distribuição é assimétrica à
esquerda, a linha da mediana estará mais próxima de Q3 do que de Q1.
O box plot também pode ser desenhado na posição vertical ou na horizontal. Pode ser
utilizado na comparação de dois ou mais conjuntos de dados e na comparação com
outras ferramentas, por exemplo, junto com os histogramas.
Os valores que estiverem acima do limite superior (haste superior) ou abaixo do limite
inferior (haste inferior) do box-plot serão considerados outliers.
Na internet, podem ser achados vários tutoriais explicando como fazer um box-plot
completo no Excel, é só procurar com um site de buscas como o Google ou outro
semelhante que você esteja acostumado a utilizar no seu dia a dia.
Exemplo de como construir um box-plot no Excel.
Em uma nova planilha, digite os seguintes dados, que são os valores necessários para
construir o box-plot e que foram calculados a partir de três conjuntos de dados de um
certo levantamento de campo:
d) clique em Avançar;
e) na guia Intervalo de dados, clique em linhas, depois em sequências em e, em
seguida, clique em Avançar;
f) na guia Legenda, clique para desmarcar a caixa de seleção Mostrar legenda;
g) na guia Eixos, clique para desmarcar a caixa de seleção eixo (Y) em eixo
secundário e, em seguida, clique em Concluir;
h) clique uma vez em qualquer uma das colunas coloridas para selecionar a série.
Não clique em uma das colunas em branco;
i) no menu Gráfico, clique em Tipo de gráfico;
j) em Tipo de gráfico, clique em Linha e, em seguida, clique em OK.
Figura 3.16 - Box-plot em Excel