Escolar Documentos
Profissional Documentos
Cultura Documentos
Inferência Estatística:
Generalizações (Amostra → População)
Características Importantes:
Variáveis Qualitativas
• qualitativa ordinal → possível ordenação
•qualitativa nominal → não há possibilidade de
ordenação
Variáveis Quantitativas
Critérios:
k = n , n ≤ 100
i) Critério de Oliveira (1994):
k = 5.log( n), n > 100
A3 n
ii) Critério de Scott(1979): k= S
3, 49
• Média
– Média populacional → µ (mi)
• Mediana
– Mediana populacional → µd
– Mediana amostral → Md
• Moda
– Moda populacional → µo
– Moda amostral → Mo
Média para dados não agrupados
N
∑X
i =1
i
X1 + X 2 + ⋯ + X N
– Média populacional: µ= =
N N
∑X i
X1 + X 2 + ⋯ + X n
– Média amostral: X= i =1
=
n n
∑X
i =1
i ∑X
i =1
i
X 1 + X 2 + ⋯ + X 7 10 + 14 + 13 + 15 + 16 + 18 + 12
X= = = =
n 7 7 7
98
X= = 14 peças/dia
7
Média para dados agrupados
k k
– Média populacional: µ = ∑ X i fi N ou µ = ∑ X i f i N
i =1 i =1
k k
– Média amostral: X = ∑ X i f i n ou X = ∑ X i f i n
i =1 i =1
7
Nº. de gols por partida ( X i ) fi X i fi ∑X f
i i
X 1 f1 + X 2 f 2 + ⋯ X 7 f 7
0 7 0 X= i =1
=
1 12 12 60 60
2 16 32 0 + 12 + ⋯ + 12
3 12 36 X=
60
4 9 36
5 2 10 138
X= = 2, 3 gols por partida
6 2 12 60
Σ 60 138
Média para dados agrupados
∑fX
i =1
i i
f1 X 1 + f 2 X 2 + f3 X 3 + f 4 X 4
X= =
40 40
5 * 0, 25 + 10 * 0, 45 + 8 * 0, 65 + 17 * 0, 85
X=
40
25, 40
X= = 0, 635.
40
Mediana para dados não agrupados
X n + X n+ 2
n 2 2
Se n é par: E = ⇒ Md =
2 2
n +1
Se n é ímpar: E = ⇒ Md = X n +1
2
2
Exemplo: Considere a seguinte amostra de dados: 9, 9, 8, 11, 12, 13, 13, 14.
X n + X n+2 X 8 + X 8+2
n 8
2
2
2
2
X ( 4 ) + X (5 ) 11 + 12
E = = = 4 ⇒ Md = = = = = 11, 5
2 2 2 2 2 2
n +1 7 +1
E= = = 4 ⇒ Md = X n+1 = X 7 +1 = X ( 4) = 11
2 2
2
2
Mediana para dados agrupados
• Se a variável é discreta: o procedimento é o mesmo.
Exemplo para variável discreta: Número de gols por partida.
nº. de gols por partida ( X i ) fi Fi
0 7 7
E = n 2 = 60 2 = 30
1 12 19 X n + X n+2
2 16 35
2
2
X (30 ) + X ( 31)
3 12 47 Md = =
2 2
4 9 56
5 2 58 2+2 4
Md = = = 2 gols por partida
6 2 60 2 2
Σ 60 -
n
− F ( anterior )
2
Md = LI Md + ×h
Md
f i Md
Mediana para dados agrupados
E = n 2 = 40 2 = 20
n 40
− F( anterior ) × h − 15 × 0, 20
2 2
Md = LI Md + = 0, 55 +
f i Md 8
( 5 ) × 0, 20 1
Md = 0, 55 + + = 0, 55 + = 0, 55 + 0,125 = 0, 675.
8 8
Moda para dados não agrupados
Exemplo: Considere a seguinte amostra: 8, 9, 9, 11, 13, 13, 13, 14. O valor
que mais se repete é o 13, que aparece três vezes, portanto a moda é Mo =
13 (unimodal).
Observação:
Pode haver mais de uma moda em uma série.
Exemplo: A série: 8, 9, 9, 11, 12, 13, 13, 14 então, os valores 9 e 13 ocorrem
com maior frequencia que os demais. Esta série apresenta duas modas,
sendo dita bimodal.
É possível encontrar séries de dados nas quais nenhum valor apareça mais
do que os outros.
Exemplo: A série 8, 9, 10, 11, 13, 14 então, esta série é dita amodal.
Moda para dados agrupados
• Se a variável é discreta
discreta:: observa a maior frequencia (muito simples).
Exemplo: Número de circuitos defeituosos por sistema, observados em
uma amostra de 19 sistemas.
nº. de circuitos defeituosos ( X i ) f i A maior freqüência foi a da
1 10 primeira “classe”, cujo valor é 1
2 7 circuito defeituoso por sistema ,
3 1
4 1 por isso a moda da distribuição é
Σ 19 Mo = 1 circuito defeituoso/sistema.
• Se a variável é contínua
contínua:: o estimador muda.
∆1
Mo = LI Mo + × h Mo
∆1 + ∆ 2
Moda para dados agrupados
Exemplo para variável contínua: Coeficiente de atrito cinético.
∆1 (17 − 8)
Mo = LI Mo + × h Mo = 0, 75 + × 0, 20
∆1 + ∆ 2 (17 − 8) + (17 − 0)
(9) 9 1, 8
Mo = 0, 75 + × 0, 20 = 0, 75 + × 0, 20 = 0, 75 +
(9) + (17) 26 26
Mo = 0, 75 + 0, 0692 = 0, 8192
ASSIMETRIA
Assimetria: significa desvio ou afastamento da simetria, (grau de
deformação de uma curva).
# Simétrica, se a média e a moda coincidem.
# Assimétrica à esquerda ou negativa, se a média é
menor que a moda.
# Assimétrica à direita ou positiva, se a média é maior
que a moda.
Natureza da distribuição dos dados
freq freq.
Assimétrica Assimétrica
à esquerda à direita
ou negativa ou positiva
Média Moda
Moda Média
Mediana Mediana
freq.
Simétrica
A B C
X A = 6 meses X B = 6 meses X C = 6 meses
Medidas de Dispersão
• Amplitude → A
• Variância
– Variância populacional → σ2
– Variância amostral → S2
• Desvio Padrão
– Desvio Padrão Populacional → σ
– Desvio Padrão Amostral → S
• Coeficiente de Variação → CV
• Erro Padrão da Média
– Erro Padrão da Média Populacional → σX
– Erro Padrão da Média Amostral → SX
Amplitude para dados agrupados e não agrupados
Variância Populacional
N N
2
N
∑( Xi − µ ) ∑ ∑
2
N Xi Xi
ou σ 2 = ∑ X i2 − i =1 , em que µ = i =1
1
σ2 = i =1
N N i =1 N N
Variância Amostral
n n
2
n
∑( Xi − X ) ∑ ∑
2
n Xi Xi
1 i =1 , em que X = i =1
S2 = i =1
n −1
ou S 2 = ∑ i
n − 1 i =1
X 2
−
n n
Desvio Padrão para dados não agrupados
N N
2
N
∑( Xi − µ )
2
∑ Xi
1 N 2 i =1 ∑ Xi
σ= i =1
N
ou σ = ∑
N i =1
Xi −
N
, em que µ = i =1
N
n n
2
n
∑( X ∑ ∑
2
i −X) n Xi Xi
X i2 − i =1 , em que X = i =1
1
S= i =1
n −1
ou S = ∑
n − 1 i =1 n n
Variância e Desvio Padrão para dados não agrupados
∑( X ∑X
2
−X)
Situação 1: Estimador não simplificado
i i
2 i =1 i =1
S = , em que X =
n −1 n
n
∑X
i =1
i
40.000 + 40.500 + ⋯ + 32.300
X= = = 37.450 km
n 8
8
2
∑( Xi − X ) ( 40.000 − 37.450 )
2 2
+ ( 40.500 − 37.450 ) + ⋯ + ( 32.300 − 37.450 )
2
S2 = i =1
=
n −1 8 −1
60.300.000
S2 = = 8.614.285, 714 km 2
7
1
n ∑ Xi
i =1
Situação 2: Estimador simplificado S 2
= ∑ i
n − 1 i =1
X 2
−
n
2
2 1 2 2 2 ( 40 . 000 + 40 .500 + ⋯ + 32 .300 )
S = ( 40.000 + 40.500 + ⋯ + 32.300 ) −
8 − 1 8
2
2 1 10 ( 299.600 ) 1
S = 1,128032 * 10 − = 1,128032 * 1010 − 1,122002 * 1010
7 8 7
1
S2 = [60.300.000] = 8.614.285, 714 km2
7
k
2
k ∑ X i fi
X i2 f i − i =1
1
S2 = ∑
n − 1 i =1 n
k
2
k ∑ X i fi
1 X 2 f − i =1
S2 = ∑ i i
n − 1 i =1 n
Desvio Padrão para dados agrupados
Desvio Padrão Amostral para variável contínua
k
2
1 k 2 ∑ X i fi
i =1
S= ∑ i i
n − 1 i =1
X f −
n
k
2
k ∑ X i fi
X i2 fi − i =1
1
S= ∑
n − 1 i =1 n
Variância e Desvio Padrão para dados agrupados
Exemplo: Coeficiente de atrito cinético (variável contínua)
Classes de Coeficiente de Atrito Cinético fi Xi
0,15 ├ 0,35 5 0,25
0,35 ├ 0,55 10 0,45
0,55 ├ 0,75 8 0,65
0,75 ├ 0,95 17 0,85
Σ 40 -
2
k
k ∑ X i fi
1
S2 = ∑ X i2 f i − i =1
n − 1 i =1 n
2
2 1 2 2 ( 0, 25 * 5 + ⋯ + 0, 85 * 17 )
S = ( 0, 25 * 5 + ⋯ + 0, 85 * 17 ) −
40 − 1 40
2
2 1 ( 25, 4 ) 1
S = 18 − = [18 − 16,129] = 0, 0480
39 40 39
S = 0, 0480 = 0, 2190
Variância e Desvio padrão para dados agrupados
Exemplo: Número de ovos danificados (variável discreta)
Número de ovos quebrados ( X i ) fi
0 13
1 9
2 3
3 3
4 1
5 1
Σ 30
2
k
k ∑ X i fi
1 X 2 f − i =1
S2 = ∑
n − 1 i =1
i i
n
2
2 1 2 2 2 ( 0 * 13 + 1* 9 + ⋯ + 5 * 1)
S = ( 0 * 13 + 1 * 9 + ⋯ + 5 * 1) −
30 − 1 30
2
1 ( 33 ) 1
2
S = 89 − = [89 − 36, 3] = 1, 8172 ( ovos danificados )2
29 30 29
σ
Coeficiente de Variação Populacional CV = 100%
µ
S
Coeficiente de Variação Amostral CV = 100%
X
S S2
Erro Padrão da Média Amostral SX = =
n n
Coeficiente de Variação
SA 0, 8 SB 1, 2
CVA = x100 = x100 = 20% CVB = x100 = x100 = 15%
XA 4, 0 XB 8, 0
Histograma;
Polígono de Frequencia.
Ilustração gráfica
Exemplo: Nível de instrução no setor de orçamento de uma companhia.
Grau de instrução fi fr fp.(%)
Fundamental 12 0,3333 33,33
Médio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1,00 100,00
24
18
Frequencia
12
0
Fundamental Médio Superior
Grau de Instrução
6; 16,7%
12; 33,3%
18; 50,0%
Marca Frequencia
Corsa 4 Gráfico de "Pizza"
Gol 8 4
Ka 1 9 16% Corsa
Uno 9 Ka
Σ 25 8 Pálio
3 32% Uno
1
12% 4%
Figura 4 – Gráfico de pizza para a variável marca de
carros populares predominantes em 25 cidade
do triângulo.
Ilustração gráfica
Gráfico de Barras
8
Marca Frequencia 7
Corsa 4 6
Gol 8
Frequencia
5
Ka 1
4
Pálio 3
3
Uno 9
2
Σ 25
1
0
Corsa Gol Ka Pálio Uno
Marcas ou modelos predominantes
Marca Frequencia
Corsa 4
Gol 8
4
Ka 1
3
Pálio 3
Uno 9
1
Σ 25
16
14
12
Frequencias
10
8
6
4
2
0
0,25 0,45 0,65 0,85
Coeficiente de atrito cinético
Histograma
17
10
8