Você está na página 1de 25

Medidas de Variao ou Disperso

Estatstica descritiva
Recapitulando: As trs principais caractersticas de um conjunto de dados so:
Um valor representativo do conjunto de dados: uma mdia (Medidas de Tendncia Central) Uma medida de disperso ou variao. A natureza ou forma da distribuio dos dados: sino, uniforme, assimtrica,... (Tabelas de frequncia e histogramas)

Medidas de Variao
Determina a caracterstica de variao de um conjunto de dados
Amplitude Desvio Desvio mdio ou desvio absoluto Desvio padro Varincia

Amplitude
Diferena entre o maior e o menor valor
Subtraia o menor valor do maior Amplitude = 1,88 1,60 = 0,28 m

Anlise Estatstica da Turma de Prob. e Eventos x Aluno 1 1,72 Aluno 2 1,60 Aluno 3 1,74 Aluno 4 1,88 Aluno 5 1,82 Aluno 6 1,75 Aluno 7 1,82 Aluno 8 1,75 Aluno 9 1,73 Aluno 10 1,75 Aluno 11 1,80 Aluno 12 1,75 Aluno 13 1,73 Aluno 14 1,84 Aluno 15 1,76 Aluno 16 1,78 Aluno 17 1,75 Aluno 18 1,69 31,66 Soma 1,759 Mdia 0,28 Amplitude

Desvio e desvio absoluto


Desvio
diferena entre cada valor e a mdia

xx

Desvio mdio ou absoluto


Mdia dos desvios em termos absolutos

xx
n

Anlise Estatstica da Turma de Prob. e Estatstica Eventos x x-x |x-x| Aluno 1 1,72 -0,04 0,04 Aluno 2 1,60 -0,16 0,16 Aluno 3 1,74 -0,02 0,02 Aluno 4 1,88 0,12 0,12 Aluno 5 1,82 0,06 0,06 Aluno 6 1,75 -0,01 0,01 Aluno 7 1,82 0,06 0,06 Aluno 8 1,75 -0,01 0,01 Aluno 9 1,73 -0,03 0,03 Aluno 10 1,75 -0,01 0,01 Aluno 11 1,80 0,04 0,04 Aluno 12 1,75 -0,01 0,01 Aluno 13 1,73 -0,03 0,03 Aluno 14 1,84 0,08 0,08 Aluno 15 1,76 0,00 0,00 Aluno 16 1,78 0,02 0,02 Aluno 17 1,75 -0,01 0,01 Aluno 18 1,69 -0,07 0,07 Soma Desvio Mdia desvios mdio 1,759 0,000 0,043

Desvio Padro
Desvio padro: medida da variao dos valores em relao mdia. Ex.: Calcular o desvio padro do conjunto de dados ao lado.
Passo 1: Calcule a mdia; Passo 2: Calcule o DESVIO de cada medida sobre a mdia

Desvio =

xx

Anlise Estatstica da Turma de Prob. e Estatstica x-x Eventos x Aluno 1 1,72 -0,04 Aluno 2 1,60 -0,16 Aluno 3 1,74 -0,02 Aluno 4 1,88 0,12 Aluno 5 1,82 0,06 Aluno 6 1,75 -0,01 Aluno 7 1,82 0,06 Aluno 8 1,75 -0,01 Aluno 9 1,73 -0,03 Aluno 10 1,75 -0,01 Aluno 11 1,80 0,04 Aluno 12 1,75 -0,01 Aluno 13 1,73 -0,03 Aluno 14 1,84 0,08 Aluno 15 1,76 0,00 Aluno 16 1,78 0,02 Aluno 17 1,75 -0,01 Aluno 18 1,69 -0,07 31,66 0,00 Soma 1,759 ------Mdia

Desvio Padro
Calcule o desvio padro do conjunto de dados ao lado.
Passo 3: Eleve ao quadrado cada uma das diferenas; Passo 4: Some todos os quadrados obtidos
Anlise Estatstica da Turma de Prob. e Estatstica x-x (x-x) 2 Eventos x Aluno 1 1,72 -0,04 0,0015 Aluno 2 1,60 -0,16 0,0252 Aluno 3 1,74 -0,02 0,0004 Aluno 4 1,88 0,12 0,0147 Aluno 5 1,82 0,06 0,0037 Aluno 6 1,75 -0,01 0,0001 Aluno 7 1,82 0,06 0,0037 Aluno 8 1,75 -0,01 0,0001 Aluno 9 1,73 -0,03 0,0008 Aluno 10 1,75 -0,01 0,0001 Aluno 11 1,80 0,04 0,0017 Aluno 12 1,75 -0,01 0,0001 Aluno 13 1,73 -0,03 0,0008 Aluno 14 1,84 0,08 0,0066 Aluno 15 1,76 0,00 0,0000 Aluno 16 1,78 0,02 0,0004 Aluno 17 1,75 -0,01 0,0001 Aluno 18 1,69 -0,07 0,0047 31,66 0,00 0,065 Soma

(x x)

Desvio Padro
Passo 5: Divida o total por (n-1), onde n o nmero de dados coletados (amostra); Passo 6: Extraia a raiz quadrada do resultado anterior
2 ( x x )

n 1

Anlise Estatstica da Turma de Prob. e Estatstica x-x (x-x) 2 Eventos x Aluno 1 1,72 -0,04 0,0015 Aluno 2 1,60 -0,16 0,0252 Aluno 3 1,74 -0,02 0,0004 Aluno 4 1,88 0,12 0,0147 Aluno 5 1,82 0,06 0,0037 Aluno 6 1,75 -0,01 0,0001 Aluno 7 1,82 0,06 0,0037 Aluno 8 1,75 -0,01 0,0001 Aluno 9 1,73 -0,03 0,0008 Aluno 10 1,75 -0,01 0,0001 Aluno 11 1,80 0,04 0,0017 Aluno 12 1,75 -0,01 0,0001 Aluno 13 1,73 -0,03 0,0008 Aluno 14 1,84 0,08 0,0066 Aluno 15 1,76 0,00 0,0000 Aluno 16 1,78 0,02 0,0004 Aluno 17 1,75 -0,01 0,0001 Aluno 18 1,69 -0,07 0,0047 31,66 0,00 0,065 Soma 1,759 ------------Mdia

Desvio Padro

(x x) = n 1
2

0,062

Desvio Padro
De uma amostra

s=

(x x)
n 1

Observao:
A unidade do desvio padro a mesma unidade dos valores originais, ou conjunto de dados.

De uma populao
=
2 ( ) x x

Frmula abreviada para o desvio padro


s= n( x ) ( x )
2 2

n(n 1)

Vantagens e desvantagens: Mais conveniente para uso com nmeros extensos e com grandes conjuntos de valores Maior facilidade de uso com calculadoras e computadores (apenas trs registros: n, x e x2) Elimina erros de arredondamento No evidencia o conceito de desvio mdio da frmula tradicional

Varincia
Desvio padro ao quadrado
s2 varincia amostral 2 varincia populacional

(x x) = n 1
N

Observao:
A unidade da varincia a mesma unidade do conjunto de dados, elevada ao quadrado.

(x x) =

Consideraes finais
Arredondamento:
Tomar uma casa decimal a mais em relao s que constam dos dados originais. Arredondar apenas o resultado final e no os resultados intermedirios. Se necessitarmos arredondar os resultados intermedirios, acrescente duas casas decimal a mais em relao s que constam dos dados originais

Para que serve o desvio padro?


Indica a disperso dos dados; quanto mais dispersos, maior o desvio padro Regra prtica
valor mnimo mdia 2.(s) Valor mximo mdia + 2.(s)

Desvio padro amplitude/4 *(s usar em casos muito extremos) Portanto:

Teorema de Tchebichev
A proporo de qualquer conjunto de dados a menos de K desviospadro a contar da mdia sempre ao menos 1-1/k2, onde k um nmero positivo maior do que 1. Para k=2 e k=3, temos:

Ao menos (75%) de todos os valores esto no intervalo de 2 desviospadro em torno da mdia Ao menos 8/9 (89%) de todos os valores esto no intervalo de 3 desviospadro em torno da mdia

Teorema de Tchebichev
A frao (porcentagem) de QUALQUER conjunto de dados, a menos de K desvios a contar da mdia, SEMPRE ao menos:

1 - 1/ K2

onde K>1

Para k = 2 e k = 3 isto significa, por exemplo:

[x 2s, x + 2s]

75% dos dados

Ou seja, ao menos de todos os valores esto neste intervalo

[ x 3s, x + 3s]

89% dos dados

Teorema de Tchebichev
Barbeadores eltricos sem fio da marca XYZ tm vida mdia de 8,0 anos, com desvio padro de 3,0 anos.

Faa uma estimativa:


da vida mais breve => da vida mais longa =>

Tchebichev tambm til para identificar valores estranhos em um conjunto de dados: aqueles que ficam de fora do intervalo !

Identificando outliers
Outliers so valores estranhos que se localizam muito distantes da mdia Por isso, as estatsticas descritivas so, usualmente, muito influenciadas (contaminadas) por eles Podem se originar em erros de coleta OU em desvios de processo Esses outliers devem ser muito bem analisados antes de um possvel descarte!

Identificando outliers
Tchebichev pode nos ajudar na identificao de outliers Valores fora do intervalo de +/- 2s devem ser analisados para um possvel descarte

[x 2s, x + 2s]

fora deste intervalo, estranho

Mais medidas de disperso


O Coeficiente de Variao indica a magnitude relativa do desvio-padro quando comparado com a mdia do conjunto de valores

s CV = x

(amostra)

CV =

(populao )

O Coeficiente de Variao til para compararmos a variabilidade (disperso) de dois conjuntos de dados de ordem de grandezas diferentes

Medidas de disperso
Seja o seguinte conjunto de preos de geladeiras em 7 lojas distintas
750,00 800,00 790,00 810,00 820,00 760,00 780,00

x = 787,14

s = 25,63

Seja o seguinte conjunto de preos de liquidificadores nas mesmas lojas acima


50,00 45,00 55,00 43,00 52,00 45,00 54,00

x = 49,14

s = 4,81

Qual dos produtos tm uma maior variabilidade de preos?

Medidas de disperso
Uma vez que, em geral, uma geladeira custa bem mais que um liquidificador, a tendncia que o desvio-padro da geladeira seja tambm maior! O coeficiente de variao uma medida adimensional que normaliza o desvio padro em relao mdia

CV geladeira =

25,63 = 3,3 % 787 ,14

CVliquidific ador =

4,81 = 9,8 % 49 ,14

Com o CV podemos concluir que os preos da geladeira tm uma menor variabilidade que os do liquidificador

Medida de Disperso: Intervalo interquartil (amplitude interquartlica)


Uma medida de disperso alternativa que pode ser empregada o chamado intervalo interquartil ou amplitude interquartlica a diferena entre o terceiro e o primeiro quartis S aproveita 50% dos dados
Pouco influenciada pelos valores extremos

Dj = Q3 - Q1 = P0,75 - P0,25

Medidas de posio e disperso


Para o conjunto de valores abaixo: 05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 44 Q1 = 10 Q2 = Md = 16,5 Dj = 28 - 10 = 18 Q3 = 28 Q4 = 44

Se alterarmos significativamente o ltimo valor: 05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 200 Dj = 28 - 10 = 18 !!!

Escore Padronizado
xx z= s

z=

Nmero de desvios-padro pelo qual um valor dista da mdia (para mais ou para menos)

Exerccio
As alturas da populao de homens adultos tm mdia =1,752m, desvio padro =0,071m e distribuio grfica em forma de sino (normal). O jogador de basquete Michael Jordan, que mede 1,98m, pode ser considerado excepcionalmente alto? Determine o escore padro z para ele.

Resoluo
Calcula-se o escore z conforme segue:

x 1,981,752 3,211 z= = 0,071


Este resultado indica que a altura de Michael Jordan est a 3,21 desvios-padro acima da mdia da populao. Considerando incomuns valores acima ou abaixo de 2 desvios da mdia, conclui-se que Michael Jordan de fato excepcionalmente alto comparando com a populao geral.

Você também pode gostar