Escolar Documentos
Profissional Documentos
Cultura Documentos
Baseado em
Murteira, B. J. F., Análise Exploratória de Dados. McGraw-Hill, Lisboa, 1993.
Mário de Castro. Notas de aula de Análise Exploratória de Dados. ICMC-USP, 2010.
8
Frequência
6
4
2
0
1 2 3 4 5
Notas do produto
1 2 3 4 5
7.5
frequências
5.0
2.5
0.0
1 2 3 4 5
notas
0.75
count
0.50
0.25
0.00
1 2 3 4 5
x
Construção:
1 Escolha do número de classes (k). Usualmente, 5 ≤ k ≤ 15.
2 Cálculo da amplitude (A) : A = max − min, sendo que min e max
são o menor e o maior valor dos dados.
3 Cálculo da amplitude de classe (h) : h = A/k .
4 Obtenção dos limites das classes: LI1 = min, LS1 = LI1 + h,
LI2 = LS1, LS2 = LI2 + h, ..., LIk = LSk − 1, LSk = max.
Observações:
fj fj ?
fdj = ou fd?j = , j = 1, . . . , k
hj hj
Representação gráfica:
Histograma (histogram - Karl Pearson, 1895):
Propriedades do histograma:
k k k
X X fj X
hj fdj = hj = fj = n
hj
j=1 j=1 j=1
k k k
X X fj? X
hj fd?j = hj = fj? = 1
hj
j=1 j=1 j=1
50 Histograma de co2
Frequency
30
10
0
x
O histograma fornece uma ideia da distribuição dos dados.
Densidade
0.000
0.000
310 330 350 370 310 330 350 370
CO2(ppm) CO2(ppm)
0.000 0.025
Densidade
Densidade
0.000
310 330 350 370 300 320 340 360 380
CO2(ppm) CO2(ppm)
Histograma humano.
Fonte: The American Statistican 56(3), 223 - 229, 2002.
30
10
0
CO2(ppm)
0.14
Frequencia relativa
0.10
0.06
0.02
CO2(ppm)
0.8
0.6
0.4
0.2
0.0
CO2(ppm)
1.0
Frequencia relativa acumulada
0.8
0.6
0.4
0.2
0.0
CO2(ppm)
Gráfico de pontos
CO2(ppm)
Prof. []
Cibele Russo Visualização e Exploração de Dados Estatística e Ciência de Dados 20 / 30
Gráfico de pontos
Gráfico de pontos
(com arredondamento)
CO2(ppm)
300
100
Time
9000
8000
7000
Sexo
Salario
F
M
6000
5000
F M
Sexo