Você está na página 1de 2

Gráfico de Boxplot

Em 1977, John Tukey publicou uma proposta que posteriormente foi


reconhecida como sendo um eficiente método para mostrar cinco
número que sumarizam qualquer conjunto de dados. O gráfico
proposto é chamado de boxplot (também conhecido como box and
whisker plot) e resume as seguintes medidas estatísticas:

• mediana
• quantis superior e inferior
• os valores mínimos e máximos

Interpretando o Boxplot

O gráfico de boxplot interpreta-se da seguinte forma:

• A caixa (box) propriamente contém a metade 50% dos data. O


limite superior da caixa indica o percentil de 75% dos dados
e o limite inferior da caixa indica o percentil de 25%. A
distancia entre esses dois quantis é conhecida como inter-
quartil.

• A linha na caixa indica o valor de mediana dos dados.

• Se a linha mediana dentro da caixa não é eqüidistante dos


extremos, diz-se então que os dados são assimétricos.

• Os extremos do gráfico indicam os valores mínimo e máximo, a


menos que valores outliers estejam presentes, nesse caso o
gráfico de estende ao máximo de 1.5 vezes da distância
inter-quartil.

• Os pontos fora do gráfico são então outliers ou suspeitos de


serem outliers.
Vantagens do Boxplots

O Boxplot possui as seguintes vantagens:

• Mostra graficamente a posição central dos dados (mediana) e a


tendência.
• Prove-e algum indicativo de simetria ou assimetria dos dados.
• Ao contrário de muitas outras formas de mostrar os dados, o
boxplots mostra os outliers.
• Utilizando o boxplot para cada variável categórica de lado-a-
lado no mesmo gráfico, pode-se facilmente comparar os dados.

Um detalhe do box-plot é que ele tende a enfatizar as caudas da


distribuição, que são os pontos ao extremo nos dados. Também
fornece detalhes da distribuição dos dados. Mostrar o histograma
em conjunto com o box-plot ajuda a entender a distribuição dos
dados, constituindo estes dos gráficos ferramentas importantes na
análise exploratória.

Você também pode gostar