O documento descreve o gráfico de boxplot, proposto por John Tukey em 1977 para resumir conjuntos de dados em cinco números: a mediana, os quantis superior e inferior e os valores mínimo e máximo. Ele interpreta os componentes do boxplot, incluindo a caixa, a linha mediana, os valores fora da caixa e outliers. Também destaca as vantagens do boxplot, como mostrar a posição central e tendências dos dados de forma gráfica.
O documento descreve o gráfico de boxplot, proposto por John Tukey em 1977 para resumir conjuntos de dados em cinco números: a mediana, os quantis superior e inferior e os valores mínimo e máximo. Ele interpreta os componentes do boxplot, incluindo a caixa, a linha mediana, os valores fora da caixa e outliers. Também destaca as vantagens do boxplot, como mostrar a posição central e tendências dos dados de forma gráfica.
O documento descreve o gráfico de boxplot, proposto por John Tukey em 1977 para resumir conjuntos de dados em cinco números: a mediana, os quantis superior e inferior e os valores mínimo e máximo. Ele interpreta os componentes do boxplot, incluindo a caixa, a linha mediana, os valores fora da caixa e outliers. Também destaca as vantagens do boxplot, como mostrar a posição central e tendências dos dados de forma gráfica.
Em 1977, John Tukey publicou uma proposta que posteriormente foi
reconhecida como sendo um eficiente método para mostrar cinco número que sumarizam qualquer conjunto de dados. O gráfico proposto é chamado de boxplot (também conhecido como box and whisker plot) e resume as seguintes medidas estatísticas:
• mediana • quantis superior e inferior • os valores mínimos e máximos
Interpretando o Boxplot
O gráfico de boxplot interpreta-se da seguinte forma:
• A caixa (box) propriamente contém a metade 50% dos data. O
limite superior da caixa indica o percentil de 75% dos dados e o limite inferior da caixa indica o percentil de 25%. A distancia entre esses dois quantis é conhecida como inter- quartil.
• A linha na caixa indica o valor de mediana dos dados.
• Se a linha mediana dentro da caixa não é eqüidistante dos
extremos, diz-se então que os dados são assimétricos.
• Os extremos do gráfico indicam os valores mínimo e máximo, a
menos que valores outliers estejam presentes, nesse caso o gráfico de estende ao máximo de 1.5 vezes da distância inter-quartil.
• Os pontos fora do gráfico são então outliers ou suspeitos de
serem outliers. Vantagens do Boxplots
O Boxplot possui as seguintes vantagens:
• Mostra graficamente a posição central dos dados (mediana) e a
tendência. • Prove-e algum indicativo de simetria ou assimetria dos dados. • Ao contrário de muitas outras formas de mostrar os dados, o boxplots mostra os outliers. • Utilizando o boxplot para cada variável categórica de lado-a- lado no mesmo gráfico, pode-se facilmente comparar os dados.
Um detalhe do box-plot é que ele tende a enfatizar as caudas da
distribuição, que são os pontos ao extremo nos dados. Também fornece detalhes da distribuição dos dados. Mostrar o histograma em conjunto com o box-plot ajuda a entender a distribuição dos dados, constituindo estes dos gráficos ferramentas importantes na análise exploratória.