Escolar Documentos
Profissional Documentos
Cultura Documentos
UNIFESP
Eng. Química
Estatística
2,25 mL
T = 30; 25; 32; 34; 31; 29; 28; 30; 32; 34; 34; 32; 30; 26; 43.
Gráfico Ramo e Folha
“RAMO” “FOLHA”
Histogramas - variáveis discretas
Média amostral:
Notações:
n = tamanho da amostra
xi = i-ésima observação de uma dada variável “x”
Média amostral
Dados brutos
x = 30; 25; 32; 34; 26; 29; 33; 25; 28; 34; 34; 27; 30; 26; 43
x = 30,4 ºC
Média amostral
50
45
“outlier”
40
Temperatura (ºC)
35
30
25
20
15
10
0
0 2 4 6 8 10 12 14 16
Observações
Média populacional
N = tamanho da população
x Inferência
Mediana
x1 , x2 , x3 , x4 , x5
mediana amostral
Mediana
x1 , x2 , x3 , x4 , x5 , x6
x3 + x4
mediana amostral 2
Dados brutos
x = 30; 25; 32; 34; 26; 29; 33; 25; 28; 34; 34; 27; 30; 26; 43
Rol:
x = 25; 25; 26; 26; 27; 28; 29; 30; 30; 32; 33; 34; 34; 34; 43
x = 30,4ºC
x = 30,0 ºC outlier
Mediana
Rol:
x = 25; 25; 26; 26; 27; 28; 29; 30; 30; 32; 33; 34; 34; 34; 80
x = 32,9ºC x = 30,0 ºC outlier
Medidas de dispersão
A soma dos desvios pode refletir o grau da dispersão:
Dados brutos:
20 11 2,5 5 5 5,5 3 3,5 3 0,4 3,2 5 3 3,2 7,4 6
✓ Valor mínimo
✓ Primeiro quartil (Q1)
✓ Mediana (segundo quartil Q2)
✓ Terceiro quartil (Q3)
✓ Valor máximo
Supondo (genérico):
Q1 = 5; Q2 = 7; Q3 = 8.
v v v v v v v v v v v v v v v v v v v v
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Supondo ainda:
Mínimo = 3; Máximo = 15
v v v v v v v v v v v v v v v v v v v v
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Os valores atípicos, são valores muito afastados da
grande maioria dos dados. Supondo que todas as
observações sejam menores que ou iguais a 10, e
apenas uma observação seja igual a 15. Então 15 é
um valor atípico ou outliers.
v v v v v v v v v v v v v v v v v v v v
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Consideremos o conjunto de dados que gerou o
boxplot ; há 18 observações.
AIQ = Q3 – Q1
v v v v v v v v v v v v v v v v v v v v
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20