Escolar Documentos
Profissional Documentos
Cultura Documentos
Boxplot
Histograma
Um histograma é a representação visual de uma frequência ou frequência
relativa da distribuição de dados quantitativos.
• A altura da barra representa a frequência da classe respectiva
• A largura da barra representa o tamanho da classe
2
Descrevendo distribuições
As distribuições podem ser simétricas ou assimétricas
3
Distribuições assimétricas
Assimétrica positiva (à direita)
A maioria dos valores são pequenos e concentrados, mas
alguns são grandes
A cauda aponta para a direita
4
Tendência central e simetria
5
Distribuições bimodais
Uma distribuição bimodal são distribuições com duas modas. Nesse caso,
você verá dois picos no gráfico.
Distribuições multimodais têm dois ou mais picos.
6
Exemplo
O histograma abaixo mostra a frequência relativa da mediana da renda familiar nos
50 estados dos EUA.
7
Boxplot
Um boxplot (Box & Whiskers plot) permite que você:
• Mostre graficamente a distribuição de um conjunto de dados
• Compare duas ou mais distribuições
• Identifique outliers em um conjunto de dados
Outliers Whiskers
Box
**
8
Sumário de 5 números
• Min = menor valor
• Max = maior valor
• Q1 = primeiro quartil
• Q2 = mediana = segundo quartil
• Q3 = terceiro quartil
Min Max
9
Detectando outliers
• Calcule a amplitude interquartil: IQR = Q3-Q1
• Calcule 1,5*IQR
• Compute o limite inferior: Q1-1,5*IQR
• E o limite superior: Q3+1,5*IQR
• Qualquer valor maior que o limite superior ou menor que o limite
inferior é um outlier
• Os outliers são identificados por *
10
Descrevendo a distribuição
Simétrica
Assimétrica positiva
Assimétrica negativa
11
Relação histograma e boxplot
12
Exemplo
13