Escolar Documentos
Profissional Documentos
Cultura Documentos
Disperso
Estatstica descritiva
Recapitulando: As trs principais caractersticas
de um conjunto de dados so:
Um valor representativo do conjunto de dados: uma
mdia (Medidas de Tendncia Central)
Uma medida de disperso ou variao.
A natureza ou forma da distribuio dos dados: sino,
uniforme, assimtrica,... (Tabelas de frequncia e
histogramas)
Medidas de Variao
Determina a caracterstica de variao de um
conjunto de dados
Amplitude
Desvio
Desvio mdio ou desvio absoluto
Desvio padro
Varincia
Amplitude
Diferena entre o
maior e o menor valor
Subtraia o menor valor
do maior
Amplitude = 1,88
1,60 = 0,28 m
Anlise Estatstica da
Turma de Prob. e
Eventos
x
Aluno 1
1,72
Aluno 2
1,60
Aluno 3
1,74
Aluno 4
1,88
Aluno 5
1,82
Aluno 6
1,75
Aluno 7
1,82
Aluno 8
1,75
Aluno 9
1,73
Aluno 10
1,75
Aluno 11
1,80
Aluno 12
1,75
Aluno 13
1,73
Aluno 14
1,84
Aluno 15
1,76
Aluno 16
1,78
Aluno 17
1,75
Aluno 18
1,69
31,66
Soma
1,759
Mdia
0,28
Amplitude
xx
xx
n
Desvio Padro
Desvio padro: medida
da variao dos valores
em relao mdia.
Ex.: Calcular o desvio
padro do conjunto de
dados ao lado.
Passo 1: Calcule a mdia;
Passo 2: Calcule o
DESVIO de cada medida
sobre a mdia
Desvio =
xx
Desvio Padro
Calcule o desvio
padro do conjunto
de dados ao lado.
Passo 3: Eleve ao
quadrado cada uma
das diferenas;
Passo 4: Some todos
os quadrados obtidos
(x x)
Desvio Padro
Passo 5: Divida o
total por (n-1), onde n
o nmero de dados
coletados (amostra);
Passo 6: Extraia a
raiz quadrada do
resultado anterior
2
(
x
x
)
n 1
Desvio Padro
(x x) =
n 1
2
0,062
Desvio Padro
De uma amostra
s=
(x x)
n 1
De uma populao
=
2
(
)
x
x
Observao:
A unidade do desvio padro
a mesma unidade dos
valores originais, ou
conjunto de dados.
s=
n(n 1)
Vantagens e desvantagens:
Mais conveniente para uso com nmeros extensos e com
grandes conjuntos de valores
Maior facilidade de uso com calculadoras e computadores
(apenas trs registros: n, x e x2)
Elimina erros de arredondamento
No evidencia o conceito de desvio mdio da frmula
tradicional
Varincia
Desvio padro ao quadrado
s2 varincia amostral
2 varincia populacional
(x x)
n 1
(x x)
=
N
Observao:
A unidade da varincia a
mesma unidade do
conjunto de dados, elevada
ao quadrado.
Consideraes finais
Arredondamento:
Tomar uma casa decimal a mais em relao s que
constam dos dados originais.
Arredondar apenas o resultado final e no os
resultados intermedirios.
Se necessitarmos arredondar os resultados
intermedirios, acrescente duas casas decimal a
mais em relao s que constam dos dados originais
Teorema de Tchebichev
A proporo de qualquer conjunto de dados a menos de K desviospadro a contar da mdia sempre ao menos 1-1/k2, onde k um
nmero positivo maior do que 1. Para k=2 e k=3, temos:
Teorema de Tchebichev
A frao (porcentagem) de QUALQUER conjunto de dados, a
menos de K desvios a contar da mdia, SEMPRE ao menos:
1 - 1/ K2
onde K>1
[x 2s, x + 2s]
[ x 3s, x + 3s]
Teorema de Tchebichev
Barbeadores eltricos sem fio da marca XYZ tm vida mdia de 8,0 anos,
com desvio padro de 3,0 anos.
Identificando outliers
Outliers so valores estranhos que se localizam muito distantes
da mdia
Por isso, as estatsticas descritivas so, usualmente, muito
influenciadas (contaminadas) por eles
Podem se originar em erros de coleta OU em desvios de processo
Esses outliers devem ser muito bem analisados antes de um
possvel descarte!
Identificando outliers
Tchebichev pode nos ajudar na
identificao de outliers
Valores fora do intervalo de +/- 2s devem
ser analisados para um possvel
descarte
[x 2s, x + 2s]
s
CV =
x
(amostra)
CV =
(populao)
Medidas de disperso
Seja o seguinte conjunto de preos de geladeiras em 7 lojas distintas
750,00
800,00
790,00
810,00
x = 787,14
820,00
760,00
780,00
s = 25,63
45,00
55,00
x = 49,14
43,00
52,00
45,00
s = 4,81
54,00
Medidas de disperso
Uma vez que, em geral, uma geladeira custa bem mais que um
liquidificador, a tendncia que o desvio-padro da geladeira seja tambm
maior!
O coeficiente de variao uma medida adimensional que normaliza o
desvio padro em relao mdia
CV geladeira =
25,63
= 3,3 %
787 ,14
CVliquidific ador =
4,81
= 9,8 %
49 ,14
Dj = Q3 - Q1 = P0,75 - P0,25
Q2 = Md = 16,5
Dj = 28 - 10 = 18
Q3 = 28
Q4 = 44
Escore Padronizado
xx
z=
s
z=
Exerccio
As alturas da populao de homens
adultos tm mdia =1,752m, desvio
padro =0,071m e distribuio grfica
em forma de sino (normal). O jogador de
basquete Michael Jordan, que mede
1,98m, pode ser considerado
excepcionalmente alto? Determine o
escore padro z para ele.
Resoluo
Calcula-se o escore z conforme segue:
x 1,981,752
3,211
z=
=
0,071