Você está na página 1de 25

Medidas de Variao ou

Disperso

Estatstica descritiva
Recapitulando: As trs principais caractersticas
de um conjunto de dados so:
Um valor representativo do conjunto de dados: uma
mdia (Medidas de Tendncia Central)
Uma medida de disperso ou variao.
A natureza ou forma da distribuio dos dados: sino,
uniforme, assimtrica,... (Tabelas de frequncia e
histogramas)

Medidas de Variao
Determina a caracterstica de variao de um
conjunto de dados
Amplitude
Desvio
Desvio mdio ou desvio absoluto
Desvio padro
Varincia

Amplitude
Diferena entre o
maior e o menor valor
Subtraia o menor valor
do maior
Amplitude = 1,88
1,60 = 0,28 m

Anlise Estatstica da
Turma de Prob. e
Eventos
x
Aluno 1
1,72
Aluno 2
1,60
Aluno 3
1,74
Aluno 4
1,88
Aluno 5
1,82
Aluno 6
1,75
Aluno 7
1,82
Aluno 8
1,75
Aluno 9
1,73
Aluno 10
1,75
Aluno 11
1,80
Aluno 12
1,75
Aluno 13
1,73
Aluno 14
1,84
Aluno 15
1,76
Aluno 16
1,78
Aluno 17
1,75
Aluno 18
1,69
31,66
Soma
1,759
Mdia
0,28
Amplitude

Desvio e desvio absoluto


Desvio
diferena entre cada valor
e a mdia

xx

Desvio mdio ou absoluto


Mdia dos desvios em
termos absolutos

xx
n

Anlise Estatstica da Turma de


Prob. e Estatstica
Eventos
x
x-x
|x-x|
Aluno 1
1,72
-0,04
0,04
Aluno 2
1,60
-0,16
0,16
Aluno 3
1,74
-0,02
0,02
Aluno 4
1,88
0,12
0,12
Aluno 5
1,82
0,06
0,06
Aluno 6
1,75
-0,01
0,01
Aluno 7
1,82
0,06
0,06
Aluno 8
1,75
-0,01
0,01
Aluno 9
1,73
-0,03
0,03
Aluno 10 1,75
-0,01
0,01
Aluno 11 1,80
0,04
0,04
Aluno 12 1,75
-0,01
0,01
Aluno 13 1,73
-0,03
0,03
Aluno 14 1,84
0,08
0,08
Aluno 15 1,76
0,00
0,00
Aluno 16 1,78
0,02
0,02
Aluno 17 1,75
-0,01
0,01
Aluno 18 1,69
-0,07
0,07
Soma Desvio
Mdia
desvios mdio
1,759 0,000
0,043

Desvio Padro
Desvio padro: medida
da variao dos valores
em relao mdia.
Ex.: Calcular o desvio
padro do conjunto de
dados ao lado.
Passo 1: Calcule a mdia;
Passo 2: Calcule o
DESVIO de cada medida
sobre a mdia

Desvio =

xx

Anlise Estatstica da Turma de


Prob. e Estatstica
x-x
Eventos
x
Aluno 1
1,72
-0,04
Aluno 2
1,60
-0,16
Aluno 3
1,74
-0,02
Aluno 4
1,88
0,12
Aluno 5
1,82
0,06
Aluno 6
1,75
-0,01
Aluno 7
1,82
0,06
Aluno 8
1,75
-0,01
Aluno 9
1,73
-0,03
Aluno 10
1,75
-0,01
Aluno 11
1,80
0,04
Aluno 12
1,75
-0,01
Aluno 13
1,73
-0,03
Aluno 14
1,84
0,08
Aluno 15
1,76
0,00
Aluno 16
1,78
0,02
Aluno 17
1,75
-0,01
Aluno 18
1,69
-0,07
31,66
0,00
Soma
1,759
------Mdia

Desvio Padro
Calcule o desvio
padro do conjunto
de dados ao lado.
Passo 3: Eleve ao
quadrado cada uma
das diferenas;
Passo 4: Some todos
os quadrados obtidos

(x x)

Anlise Estatstica da Turma de Prob. e


Estatstica
x-x
(x-x) 2
Eventos
x
Aluno 1
1,72
-0,04
0,0015
Aluno 2
1,60
-0,16
0,0252
Aluno 3
1,74
-0,02
0,0004
Aluno 4
1,88
0,12
0,0147
Aluno 5
1,82
0,06
0,0037
Aluno 6
1,75
-0,01
0,0001
Aluno 7
1,82
0,06
0,0037
Aluno 8
1,75
-0,01
0,0001
Aluno 9
1,73
-0,03
0,0008
Aluno 10
1,75
-0,01
0,0001
Aluno 11
1,80
0,04
0,0017
Aluno 12
1,75
-0,01
0,0001
Aluno 13
1,73
-0,03
0,0008
Aluno 14
1,84
0,08
0,0066
Aluno 15
1,76
0,00
0,0000
Aluno 16
1,78
0,02
0,0004
Aluno 17
1,75
-0,01
0,0001
Aluno 18
1,69
-0,07
0,0047
31,66
0,00
0,065
Soma

Desvio Padro
Passo 5: Divida o
total por (n-1), onde n
o nmero de dados
coletados (amostra);
Passo 6: Extraia a
raiz quadrada do
resultado anterior
2
(
x

x
)

n 1

Desvio Padro

Anlise Estatstica da Turma de Prob. e


Estatstica
x-x
(x-x) 2
Eventos
x
Aluno 1
1,72
-0,04
0,0015
Aluno 2
1,60
-0,16
0,0252
Aluno 3
1,74
-0,02
0,0004
Aluno 4
1,88
0,12
0,0147
Aluno 5
1,82
0,06
0,0037
Aluno 6
1,75
-0,01
0,0001
Aluno 7
1,82
0,06
0,0037
Aluno 8
1,75
-0,01
0,0001
Aluno 9
1,73
-0,03
0,0008
Aluno 10
1,75
-0,01
0,0001
Aluno 11
1,80
0,04
0,0017
Aluno 12
1,75
-0,01
0,0001
Aluno 13
1,73
-0,03
0,0008
Aluno 14
1,84
0,08
0,0066
Aluno 15
1,76
0,00
0,0000
Aluno 16
1,78
0,02
0,0004
Aluno 17
1,75
-0,01
0,0001
Aluno 18
1,69
-0,07
0,0047
31,66
0,00
0,065
Soma
1,759
------------Mdia

(x x) =
n 1
2

0,062

Desvio Padro
De uma amostra

s=

(x x)

n 1

De uma populao
=

2
(

)
x
x

Observao:
A unidade do desvio padro
a mesma unidade dos
valores originais, ou
conjunto de dados.

Frmula abreviada para o desvio


padro
n( x ) ( x )
2

s=

n(n 1)

Vantagens e desvantagens:
Mais conveniente para uso com nmeros extensos e com
grandes conjuntos de valores
Maior facilidade de uso com calculadoras e computadores
(apenas trs registros: n, x e x2)
Elimina erros de arredondamento
No evidencia o conceito de desvio mdio da frmula
tradicional

Varincia
Desvio padro ao quadrado
s2 varincia amostral
2 varincia populacional

(x x)

n 1

(x x)

=
N

Observao:
A unidade da varincia a
mesma unidade do
conjunto de dados, elevada
ao quadrado.

Consideraes finais
Arredondamento:
Tomar uma casa decimal a mais em relao s que
constam dos dados originais.
Arredondar apenas o resultado final e no os
resultados intermedirios.
Se necessitarmos arredondar os resultados
intermedirios, acrescente duas casas decimal a
mais em relao s que constam dos dados originais

Para que serve o desvio padro?


Indica a disperso dos dados; quanto mais dispersos, maior o
desvio padro
Regra prtica

Desvio padro amplitude/4 *(s usar em casos muito extremos)


Portanto:
valor mnimo mdia 2.(s)
Valor mximo mdia + 2.(s)

Teorema de Tchebichev
A proporo de qualquer conjunto de dados a menos de K desviospadro a contar da mdia sempre ao menos 1-1/k2, onde k um
nmero positivo maior do que 1. Para k=2 e k=3, temos:

Ao menos (75%) de todos os valores esto no intervalo de 2 desviospadro em torno da mdia


Ao menos 8/9 (89%) de todos os valores esto no intervalo de 3 desviospadro em torno da mdia

Teorema de Tchebichev
A frao (porcentagem) de QUALQUER conjunto de dados, a
menos de K desvios a contar da mdia, SEMPRE ao menos:

1 - 1/ K2

onde K>1

Para k = 2 e k = 3 isto significa, por exemplo:

[x 2s, x + 2s]

75% dos dados

Ou seja, ao menos de todos os valores esto neste intervalo

[ x 3s, x + 3s]

89% dos dados

Teorema de Tchebichev
Barbeadores eltricos sem fio da marca XYZ tm vida mdia de 8,0 anos,
com desvio padro de 3,0 anos.

Faa uma estimativa:


da vida mais breve =>
da vida mais longa =>

Tchebichev tambm til para identificar valores estranhos em


um conjunto de dados: aqueles que ficam de fora do intervalo !

Identificando outliers
Outliers so valores estranhos que se localizam muito distantes
da mdia
Por isso, as estatsticas descritivas so, usualmente, muito
influenciadas (contaminadas) por eles
Podem se originar em erros de coleta OU em desvios de processo
Esses outliers devem ser muito bem analisados antes de um
possvel descarte!

Identificando outliers
Tchebichev pode nos ajudar na
identificao de outliers
Valores fora do intervalo de +/- 2s devem
ser analisados para um possvel
descarte

[x 2s, x + 2s]

fora deste intervalo, estranho

Mais medidas de disperso


O Coeficiente de Variao indica a magnitude
relativa do desvio-padro quando comparado com a
mdia do conjunto de valores

s
CV =
x

(amostra)

CV =

(populao)

O Coeficiente de Variao til para compararmos


a variabilidade (disperso) de dois conjuntos de
dados de ordem de grandezas diferentes

Medidas de disperso
Seja o seguinte conjunto de preos de geladeiras em 7 lojas distintas
750,00

800,00

790,00

810,00

x = 787,14

820,00

760,00

780,00

s = 25,63

Seja o seguinte conjunto de preos de liquidificadores nas mesmas


lojas acima
50,00

45,00

55,00

x = 49,14

43,00

52,00

45,00

s = 4,81

Qual dos produtos tm uma maior variabilidade de preos?

54,00

Medidas de disperso
Uma vez que, em geral, uma geladeira custa bem mais que um
liquidificador, a tendncia que o desvio-padro da geladeira seja tambm
maior!
O coeficiente de variao uma medida adimensional que normaliza o
desvio padro em relao mdia

CV geladeira =

25,63
= 3,3 %
787 ,14

CVliquidific ador =

4,81
= 9,8 %
49 ,14

Com o CV podemos concluir que os preos da geladeira tm uma menor


variabilidade que os do liquidificador

Medida de Disperso: Intervalo


interquartil (amplitude
interquartlica)
Uma medida de disperso alternativa que pode ser
empregada o chamado intervalo interquartil ou
amplitude interquartlica
a diferena entre o terceiro e o primeiro quartis
S aproveita 50% dos dados
Pouco influenciada pelos valores extremos

Dj = Q3 - Q1 = P0,75 - P0,25

Medidas de posio e disperso


Para o conjunto de valores abaixo:
05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 44
Q1 = 10

Q2 = Md = 16,5
Dj = 28 - 10 = 18

Q3 = 28

Se alterarmos significativamente o ltimo valor:


05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 200
Dj = 28 - 10 = 18 !!!

Q4 = 44

Escore Padronizado
xx
z=
s

z=

Nmero de desvios-padro pelo qual um


valor dista da mdia (para mais ou para
menos)

Exerccio
As alturas da populao de homens
adultos tm mdia =1,752m, desvio
padro =0,071m e distribuio grfica
em forma de sino (normal). O jogador de
basquete Michael Jordan, que mede
1,98m, pode ser considerado
excepcionalmente alto? Determine o
escore padro z para ele.

Resoluo
Calcula-se o escore z conforme segue:

x 1,981,752
3,211
z=
=
0,071

Este resultado indica que a altura de Michael Jordan


est a 3,21 desvios-padro acima da mdia da
populao. Considerando incomuns valores acima ou
abaixo de 2 desvios da mdia, conclui-se que Michael
Jordan de fato excepcionalmente alto comparando
com a populao geral.

Você também pode gostar