Você está na página 1de 13

Histograma e

Boxplot
Histograma
Um histograma é a representação visual de uma frequência ou frequência
relativa da distribuição de dados quantitativos.
• A altura da barra representa a frequência da classe respectiva
• A largura da barra representa o tamanho da classe

2
Descrevendo distribuições
As distribuições podem ser simétricas ou assimétricas

Simétrica: imagem espelhada partindo do centro

3
Distribuições assimétricas
Assimétrica positiva (à direita)
A maioria dos valores são pequenos e concentrados, mas
alguns são grandes
A cauda aponta para a direita

Assimétrica negativa (à esquerda)


A maioria dos valores são grandes e concentrados, mas
alguns são pequenos
A cauda aponta para a esquerda

4
Tendência central e simetria

5
Distribuições bimodais
Uma distribuição bimodal são distribuições com duas modas. Nesse caso,
você verá dois picos no gráfico.
Distribuições multimodais têm dois ou mais picos.

6
Exemplo
O histograma abaixo mostra a frequência relativa da mediana da renda familiar nos
50 estados dos EUA.

(a) A distribuição é simétrica, assimétrica positiva, ou assimétrica negativa?


Assimétrica positiva
(b) Quantos estados tem a mediana da renda familiar entre $35.000 e $55.000?
0,66 ou 66%
0,66 x 50 estados = 33 estados

7
Boxplot
Um boxplot (Box & Whiskers plot) permite que você:
• Mostre graficamente a distribuição de um conjunto de dados
• Compare duas ou mais distribuições
• Identifique outliers em um conjunto de dados

Outliers Whiskers
Box

**
8
Sumário de 5 números
• Min = menor valor
• Max = maior valor
• Q1 = primeiro quartil
• Q2 = mediana = segundo quartil
• Q3 = terceiro quartil

Min Max

9
Detectando outliers
• Calcule a amplitude interquartil: IQR = Q3-Q1
• Calcule 1,5*IQR
• Compute o limite inferior: Q1-1,5*IQR
• E o limite superior: Q3+1,5*IQR
• Qualquer valor maior que o limite superior ou menor que o limite
inferior é um outlier
• Os outliers são identificados por *

10
Descrevendo a distribuição
Simétrica

Assimétrica positiva

Assimétrica negativa

11
Relação histograma e boxplot

12
Exemplo

13

Você também pode gostar