Você está na página 1de 36

MEDIDAS DE DISPERSO

Recordando
Definimos Medidas Estatsticas como
Valores Numricos calculados sobre o
conjunto de valores observados da
Varivel Quantitativa em estudo, cuja
interpretao fornece informaes
especficas sobre o comportamento da
varivel naquele conjunto de dados.
Recordando
Medidas de Posio expressam a
caracterstica dos dados observados
tenderem a se agrupar em torno dos
valores centrais, e que elas representam
valores intermedirios da srie (entre o
menor e o maior valor), em torno dos
quais os elementos da srie esto
distribudos.
Recordando
As Medidas de Posio tentam traduzir a semelhana que os dados
estatsticos referentes observao de um fenmeno apresentam entre
si, conforme se pode notar pela observao das sries abaixo.
13 13 13 13 13 13 13 13 13 13 13 13
1
3
3
13 13 13 14 14 13 13 13 13 13 13 12
1
2
2
10 10,5 13 35 20 18 15 11 10 10 7 3 1 1
Moda Mediana Mdia Valores Srie
As Medidas de Tendncia Central no so suficientes para caracterizar
completamente uma srie numrica, conforme pode ser observado nas sries de
dados acima.
Medidas de Disperso ou
Variabilidade
Chamamos de disperso ou variabilidade,
maior ou menor diversificao dos valores de
uma varivel em torno de um valor de tendncia
central tomado como ponto de comparao.
Medidas de Disperso ou
Variabilidade
Principais Medidas de Disperso:
Amplitude Total ou Range
Varincia
Desvio Padro
Coeficiente de Variao
Intervalo Interquartlico
BoxPlot
Medidas de Disperso ou Variabilidade
Amplitude Total ou Range:
a diferena entre o maior e o menor valor de um
conjunto de dados. Fcil de calcular, a amplitude
tem a desvantagem de levar em considerao
apenas os dois valores extremos, desprezando
todos os outros. uma medida absoluta (carrega
consigo a unidade da varivel).
Amplitude Total (AT) ou Range (R) = X(mx) X(mn)
Amplitude Total (AT) ou Range (R)
13 13 13 13 13 13 13 13 13 13 13 13 13 3
13 13 13 14 14 13 13 13 13 13 13 12 12 2
10 10,5 13 35 20 18 15 11 10 10 7 3 1 1
Moda Mediana Mdia Valores Srie
Nas sries acima temos:
R1=(35-1)=34; R2=(14-12)=2; R3=(13-13)=0
Medidas de Disperso ou Variabilidade
Varincia (s
2
) ou (
2
):
Varincia uma mdia aritmtica calculada a
partir dos quadrados dos desvios (ou
diferenas) entre os valores dos elementos da
srie e sua prpria mdia.
Ela tem a desvantagem de ser expressa em unidades da
varivel ao quadrado.
) 1 n (
) x x (
n
1 i
2
i
2

=

=
s
N
) x x (
N
1 i
2
i
2

=

=
Varincia
Populacional (
2
)
Varincia
Amostral (s
2
)
Desvio Padro (s) ou ():
O Desvio Padro a raiz quadrada positiva da
Varincia.
O Desvio Padro expresso na mesma unidade
de medida da Varivel em estudo, e por isso
mesmo se enquadra como uma medida
absoluta.
Medidas de Disperso ou Variabilidade
2
2
s = s
2
2
o =
Desvio Padro
Populacional ()
Desvio Padro
Amostral (s)
Medidas de Disperso ou Variabilidade
Coeficiente de Variao (CV):
O Coeficiente de Variao a razo entre o Desvio
Padro e a Mdia Aritmtica, e geralmente expresso
em porcentagem.
Trata-se de um nmero puro (sem unidade de medida),
sendo portanto uma medida relativa.
A grande utilidade do Coeficiente de Variao permitir
a comparao de variabilidade de diferentes
conjuntos de dados.
100 . ) (
100 . ) (

=
=
populao CV
x
amostra CV
s
Intervalo Interquartlico (IIQ):
O Intervalo Interquartlico (ou simplesmente Intervalo
Quartlico) corresponde diferena entre o 3 quartil (Q3 =
75%) e o 1 quartil (Q1 = 25%).
Suas caractersticas mais importantes so:
Medida simples e fcil de ser calculada.
Mede a distribuio da metade central dos dados, em torno
da mediana.
uma medida resistente, pois no afetada pelos extremos.
No suficiente para avaliar a variabilidade, pois despreza
50% dos dados (os extremos).
Medidas de Disperso ou Variabilidade
Intervalo Interquartlico (IIQ):
O Intervalo Interquartlico (ou simplesmente Intervalo
Quartlico) corresponde diferena entre o 3 quartil (Q3 =
75%) e o 1 quartil (Q1 = 25%).
Suas caractersticas mais importantes so:
Medida simples e fcil de ser calculada.
Mede a distribuio da metade central dos dados, em torno
da mediana.
uma medida resistente, pois no afetada pelos extremos.
No suficiente para avaliar a variabilidade, pois despreza
50% dos dados (os extremos).
Medidas de Disperso ou Variabilidade
Intervalo Interquartlico (IIQ):
O Intervalo Interquartlico utilizado na determinao de
outliers (dados suspeitos) de uma amostra.
Normalmente, se considera um dado como suspeito, quando
seu valor se afasta mais de 1,5 a 3 vezes o valor do IIQ,
abaixo de Q1 ou acima de Q3.
Medidas de Disperso ou Variabilidade
BoxPlot ou Diagrama em Caixas:
Embora as trs medidas Q1, Mediana e Q3 mostrem a forma
da distribuio de 50% dos valores ao redor da mediana, a
adio dos valores Mnimo e Mximo a estas trs medidas
permite obter um conjunto mais completo de informaes
sobre a forma da distribuio.
O BoxPlot a forma grfica de representar estas cinco
medidas estatsticas (Five Number Summary) num nico
conjunto de resultados
Medidas de Disperso ou Variabilidade
Medidas de Disperso ou Variabilidade
BoxPlot ou Diagrama em Caixas:
Exemplo: 7 9 12 15 17 21 23
Q
1
= 9 Q
2
= 15 Q
3
=21
25
20
15
10
C
1
23
7
Max
Min
Q2
Q3
Q1
Clculo de Medidas
Dados Isolados ou No Agrupados:
0 13 13 Conjunto 3
2 14 12 Conjunto 2
34 35 1 Conjunto 1
Range Mximo Mnimo
Clculo da Amplitude Total (AT) ou Range (R):
13 13 13 13 13 13 13 13 13 13 13 13 13 3
13 13 13 14 14 13 13 13 13 13 13 12 12 2
10 10,5 13 35 20 18 15 11 10 10 7 3 1 1
Moda Mediana Mdia Valores Srie
Clculo de Medidas
Clculo da Varincia:
Independentemente da forma com que se apresentam os
dados, o clculo da Varincia dever seguir sempre esta
seqncia de etapas:
1. Calcular a mdia aritmtica:
2. Subtrair a mdia de cada valor do conjunto, obtendo-se o
que chamamos de desvio:
3. Elevar cada desvio ao quadrado:
4. Somar os quadrados dos desvios:
5. Dividir a soma por (n-1) quando se tratar de dados
amostrais, ou simplesmente por N se os dados representam
todos os valores de uma populao.
x
) x x ( d
i i
=
2
i
2
i
) x x ( d =

=
2
i
2
i
) x x ( d
0 130 4 130 864 130
0 0 13 1 1 14 484 22 35 10
0 0 13 1 1 14 49 7 20 9
0 0 13 0 0 13 25 5 18 8
0 0 13 0 0 13 4 2 15 7
0 0 13 0 0 13 4 -2 11 6
0 0 13 0 0 13 9 -3 10 5
0 0 13 0 0 13 9 -3 10 4
0 0 13 0 0 13 36 -6 7 3
0 0 13 1 -1 12 100 -10 3 2
0 0 13 1 -1 12 144 -12 1 1
di
2
di xi di
2
di xi di
2
di xi i
Conjunto 3 Conjunto 2 Conjunto 1
0,00
2
0,40
2
86,40
2
0,00 s
2
0,44 s
2
96,00 s
2
13 Mdia 13 Mdia 13 Mdia
Conjunto 3
Conjunto 2
Conjunto 1
0 130 4 130 864 130
Clculo do Desvio Padro:
De acordo com sua definio, para calcular o Desvio
Padro basta extrair a raiz quadrada da respectiva
Varincia. Assim, temos:
0,00 0,63 9,30
0,00 s 0,67 s 9,80 s
Conjunto 3 Conjunto 2 Conjunto 1
Clculo de Medidas
Clculo de Medidas
Clculo do Coeficiente de Variao:
Considerando a frmula de clculo do Coeficiente de Variao
abaixo, o clculo do CV imediato aps os clculos realizados
para determinar o Desvio Padro.
100 100 = =

CVp ou
x
s
CVa
0,0% CVp 4,9% CVp 71,5% CVp
0,0% CVa 5,1% CVa 75,4% CVa
Conjunto 3 Conjunto 2 Conjunto 1
Clculo de Medidas
Clculo do Intervalo Interquartlico:
Considerando que para o clculo do IIQ necessitamos
calcular duas medidas de posio (Q1 e Q3) para cada
conjunto de dados.
0,00 13,00 13,00 13 13 13 13 13 13 13 13 13 13 3
0,00 13,00 13,00 14 14 13 13 13 13 13 13 12 12 2
9,50 17,25 7,75 35 20 18 15 11 10 10 7 3 1 1
IIQ Q3 Q1 Valores
Conjunt
o
75 , 7 7 75 , 0 25 , 0 * 3
3 ::: 10 ) 4 ( 7 ) 3 (
25 , 3 1
100
) 1 10 ( * 25
1
% 100
) 1 ( * %
) (
= + =
= = <==> =
= +

= ====> +

=
unidades diferena posio posio
x
n p
posio x
Montagem do BoxPlot:
13,0 13,0 17,3 Q3
13,0 14,0 35,0 Mximo
13,0 13,0 10,5 Mediana
13,0 12,0 1,0 Mnimo
13,0 13,0 7,8 Q1
Conjunto 3 Conjunto 2 Conjunto 1
Observe como o grfico BoxPlot nos
mostra a grande diferena na
disperso dos dados dos conjuntos 1
e 2.
Note ainda que o grfico mostra as
assimetrias da distribuio do
Conjunto1: a distancia de Q3 at o
Mximo bem maior que a distncia
do Mnimo at Q1, e a distncia da
Mediana (Q2) at Q3 tambm bem
maior que a distncia de Q1 at a
Mediana.
Dados Agrupados Sem Intervalos
de Classe
Idade dos Alunos numa
Turma (em anos)
50
4 21
8 20
17 19
18 18
3 17
f
i
x
i
Amplitude Total (AT) ou Range (R) =
Xmx - Xmn
Para aplicar o conceito DF acima,
identificamos Xmx =21 e Xmn =17 .
Logo, R=21-17 e R=4 anos.
Dados Agrupados Sem Intervalos
de Classe
Clculo da Varincia
O clculo da Varincia dever seguir esta seqncia de etapas:
1. Calcular a mdia aritmtica.
2. Subtrair a mdia de cada valor do conjunto, obtendo-se o que
chamamos de desvio. Necessitamos na DF de uma coluna auxiliar (di) para
registro dos desvios.
3. Elevar cada desvio ao quadrado, obtendo o que denominamos de desvio
quadrtico. Necessrio uma coluna auxiliar para armazenar di
2
.
4. Multiplicar cada desvio quadrtico pela respectiva freqncia, registrando
os desvios quadrticos ponderados numa coluna auxiliar com cabealho
di
2
xfi.
5. Somar os desvios quadrticos ponderados, obtendo o numerador da
frmula de clculo da Varincia: .
6. Dividir a soma por (n-1) quando se tratar de dados amostrais, ou
simplesmente por N se os dados representam todos os valores de uma
populao.
) 1 n (
f ) x x (
i
k
1 i
2
i
2


=

=
s
Dados Agrupados Sem Intervalos
de Classe
Clculo da Varincia
) 1 n (
f ) x x (
i
k
1 i
2
i
2


=

=
s
x x d
i i
=
52,72 942 50
18,6624 4,6656 2,16 84 4 21
10,7648 1,3456 1,16 160 8 20
0,4352 0,0256 0,16 323 17 19
12,7008 0,7056 -0,84 324 18 18
10,1568 3,3856 -1,84 51 3 17
d
i
2
x f
i
d
i
2
x
i
xf
i
f
i
x
i
84 , 18 50 942 x = =
0544 , 1 50 72 , 52
2
= = o
0759 , 1 ) 1 50 ( 72 , 52 s
2
= =
Dados Agrupados Sem Intervalos
de Classe
Clculo do Desvio Padro:
O Desvio Padro em todos os casos sempre definido como a
raiz quadrada positiva da Varincia. Assim temos:
:
1,03 1,04 s
1,0544
2
1,0759 s
2
Clculo do Coeficiente de Variao:
Considerando a frmula de clculo do Coeficiente de Variao abaixo,
o clculo do CV imediato aps os clculos realizados para determinar o
Desvio Padro.
100 CVp ou 100
x
s
CVa

o
= =
5,45% CVp 5,51% CVa
1,03 1,04 s
18,84 Mdia 18,84 Mdia
Clculo do Intervalo Interquartlico
Dados Agrupados Sem Intervalos
de Classe
50
50 4 21
46 8 20
38 17 19
21 18 18
3 3 17
F
i
f
i
x
i
1 IIQ= Q3-Q1
19 37,5 Q3
19 25 Q2
18 12,5 Q1
Valor np
Montagem do BoxPlot:
17
21
16
17
18
19
2 0
2 1
2 2
BoxPlot das Idades
Montagem do BoxPlot:
17
21
16
17
18
19
2 0
2 1
2 2
BoxPlot das Idades
50
19 Q3 50 4 21
21 Mximo 46 8 20
19 Mediana 38 17 19
17 Mnimo 21 18 18
18 Q1 3 3 17
F
i
f
i
x
i
Dados Agrupados COM
Intervalos de Classe
40
2 800 |---- 700
9 700 |---- 600
11 600 |---- 500
13 500 |---- 400
3 400 |---- 300
2 300 |---- 200
f
i
Salrios ($)
Clculo da Amplitude Total (AT) ou Range (R)
identificamos Xmx =800 e Xmn =200 ,
o que resulta em R=800-200, R=$600.
Dados Agrupados COM Intervalos
de Classe
Clculo da Varincia
00 , 520 $ 40 20800 x = =
14100 40 564000
2
= = o 14462 39 564000 s
2
= =
Salrios da Empresa X
564000 20800 40
105800 52900 230 1500 750 2 800 |---- 700
152100 16900 130 5850 650 9 700 |---- 600
9900 900 30 6050 550 11 600 |---- 500
63700 4900 -70 5850 450 13 500 |---- 400
86700 28900 -170 1050 350 3 400 |---- 300
145800 72900 -270 500 250 2 300 |---- 200
d
i
2
xf
i
d
i
2
d
i
x
i
xf
i
x
i
f
i
Salrios ($)
Mdia:
Varincia
Populacional
; Varincia Amostral
.
Dados Agrupados COM Intervalos
de Classe
Clculo da Varincia
14100 40 564000
2
= = o
14462 39 564000 s
2
= =
Salrios da Empresa X
564000 20800 40
105800 52900 230 1500 750 2 800 |---- 700
152100 16900 130 5850 650 9 700 |---- 600
9900 900 30 6050 550 11 600 |---- 500
63700 4900 -70 5850 450 13 500 |---- 400
86700 28900 -170 1050 350 3 400 |---- 300
145800 72900 -270 500 250 2 300 |---- 200
d
i
2
xf
i
d
i
2
d
i
x
i
xf
i
x
i
f
i
Salrios ($)
Varincia
Populacional
; Varincia Amostral
.
O Desvio Padro em
todos os casos sempre
definido como a raiz
quadrada positiva da
Varincia
Clculo do Desvio Padro
O Desvio Padro em todos os casos sempre definido como a raiz quadrada
positiva da Varincia. Assim temos:
$118,74 $120,26 s
14100
2
14462 s
2
Clculo do Coeficiente de Variao
O clculo do Coeficiente de Variao imediato aps os clculos realizados
para determinar o Desvio Padro.
100 CVp ou 100
x
s
CVa

o
= =
22,83% CVp 23,13% CVa
118,74 120,26 s
520,00 Mdia 520,00 Mdia
h
fi
fac
n
l Q
ANT

(
(
(
(


|
.
|

\
|
+ =
4
inf 1
Clculo do Intervalo Interquartlico:
O clculo do IIQ requer o clculo de duas separatrizes, mais
especificamente Q1 e Q3
40
40 2 800 |---- 700
38 9 700 |---- 600
29 11 600 |---- 500
18 13 500 |---- 400
5 3 400 |---- 300
2 2 300 |---- 200
F
i
f
i
Salrios ($)
Para Q1 temos: n=40; p=25%; np=10;
Classe: 3; linf=400; fi=13; Facant=5 e
h=500-400=100.
Aplicando os valores na formula,
obtemos:
46 , 438 $ 100
13
5 10
400 1 Q =

+ =
.
11 , 611 $ 100
9
29 30
600 3 Q =

+ =
40
40 2 800 |---- 700
38 9 700 |---- 600
29 11 600 |---- 500
18 13 500 |---- 400
5 3 400 |---- 300
2 2 300 |---- 200
F
i
f
i
Salrios ($)
Montagem do BoxPlot:
611,11 Q3
800,00 Mximo
518,18 Mediana
200,00 Mnimo
438,46 Q1

Você também pode gostar