Você está na página 1de 7

Medidas de Dispersão ou variabilidade – Profª. Drª.

Alessandra Querino

As medidas de posição geralmente são insuficientes para descrever satisfatoriamente um


conjunto de dados.
Por exemplo, se você for a um supermercado e pesar 10 pacotes de arroz de 5kg, será que
todos terão exatamente o mesmo peso? Se um artesão fizer duas peças de crochê da mesma forma e
com o mesmo material, será que elas ficarão idênticas? Essas diferenças existiram por causa da
variabilidade inerente em todos os processos.

Compare os dois conjuntos de dados: A = {1, 2, 5, 8, 9} e B ={3, 4, 5, 6, 7}

Qual o valor da média de cada um?

x A  5 e xB  5

Ambos têm a mesma média. Logo, observando os valores do conjunto de dados percebe-se,
intuitivamente, que o conjunta A apresenta maior dispersão (variabilidade) do que B. Então, é
necessário estabelecer medidas que indiquem esse grau de variabilidade. Essas medidas serão
apresentadas a seguir.

Medidas de variabilidade para dados brutos

1) Amplitute Total (A)

A amplitude total, que será denotada por A, é a diferença entre o maior e o menor
valor de um conjunto de dados (série):

A = maior valor – menor valor

Note que essa é uma medida de dispersão muito limitada, pois depende apenas dos valores
externos, não considerando os valores internos, o que pode afetar a magnitude da dispersão.

Exemplos:

1
a) Para a série 10, 12, 20, 22, 25, 33, 38, a amplitude total será

A = 38 – 10 = 28

b) Considerando os conjuntos apresentados anteriormente,


A = {1, 2, 5, 8, 9} => Amplitute total = 9 - 1 = 8
B ={3, 4, 5, 6, 7} => Amplitute total = 7 – 3 = 4

Observa-se que apesar de A e B possuírem a mesma média, as amplitudes totais são


diferentes, indicando que o conjunto A possui maior variabilidade do que B.

Como essa medida não mede bem a dispersão dos valores pelo fato de considerar apenas os
valores externos, é necessário estabelecer um medida que calcule a dispersão em torno de sua
média levando em consideração todos os valores do conjunto de dados. Essa medida será
denominada variância.

2) Variância Amostral (S2)

A variância mede o grau de concentração ou dispersão de um conjunto de dados em torno da


média. Considera-se a soma de quadrado de cada desvio, di  xi  x . Logo, a variância amostral é
dada por:
n n

 di2  (x  x )
i
2

S2  i 1
 i 1
n 1 n 1

 (x  x )
i
2
( x1  x )2  ( x2  x )2  ...  ( xn  x ) 2
S2  i 1

n 1 n 1

2
 n 
n   xi 
 xi   i 1 
2

n
Ou também pode ser calculada como: S 2  i 1
n 1
n

x i
x1  x2  x3  x4    xn
x i 1

n n

2
Exemplos: Obtenha o valor da variância dos conjuntos de dados A = {1, 2, 5, 8, 9}
e B ={3, 4, 5, 6, 7}
Qual o valor da média de cada um? x A  5 e xB  5
Calculando a variância amostral para A: tem-se que n = 5
n

 (x  x ) i
2
( x1  x ) 2  ( x2  x ) 2  ( x3  x )2  ( x4  x )2  ( x5  x ) 2
S2  i 1

n 1 5 1
(1  5) 2  (2  5)2  (5  5) 2  (8  5) 2  (9  5) 2 16  9  0  9  16 50
S A2     12,5 unidades 2
5 1 4 4

Analogamente, calcula-se a variância para o conjunto B, obtendo-se


10
S B2   2, 5 unidades 2
4

3) Desvio Padrão (S)


Como a variância possui a desvantagem de apresentar as unidades elevadas ao quadrado, o
que dificulta a interpretação, é necessário estabelecer uma medida equivalente e que apresente a
mesma unidade dos dados. Essa medida é denominada desvio padrão, sendo definida como raiz

quadrada da variância, isto é, S  variância  S 2

Exemplos:
50
a) Se a variância de A é S A 2   12, 5 unidades 2 então o desvio padrão será
4
S A  12, 5 = 3,53 unidades

10
b) Se S B2   2, 5 unidades 2 então S B  2,5  1, 58 unidades
4

4) Coeficiente de Variação (CV)

O coeficiente de variação é útil para comparar em termos relativos (em porcentagem) o grau
de concentração em torno da média de séries de dados distintas. Ele é calculado como
S
CV   100
x
sendo S = desvio padrão e x a média amostal.

3
Exemplo: ainda considerando os dados do conjunto A e B, obtenha o coeficiente de variação
e discuta os resultados.
a) A = {1, 2, 5, 8, 9} tem-se x A  5 e S A  3,53 unidades então

S 3, 53
CV   100   100  70, 6%
x 5

b) B ={3, 4, 5, 6, 7} tem-se xB  5 e S B  1,58 unidades , logo:

S 1,58
CV   100   100  31, 6%
x 5
Observa-se que o conjunto a apresentou 70,6% de variabilidade em torno da média e o
conjunto B, 31,6%.

Medidas de variabilidade para dados agrupados (apresentados em forma de tabelas)

1. Variância amostral para dados agrupados

1 k  ( xi  x ) 2 fi
S2   ( xi  x )2 fi  i 1 n  1
n  1 i 1

2
 k 
k   xi  fi 
 ( xi 2  f i )   i 1 
n
Ou S 2  i 1
n 1
sendo n= tamanho da amostra, fi é a frequência absoluta(simples) da classe e k = número
de classes de uma tabela

2) Desvio Padrão - É a raiz quadrada da variância: S = S2

4
Exemplos: Calcule todas as medidas de dispersão estudadas para as tabelas dadas:

a) Tabela 1. Distribuição do número de automóveis por residência


Número de automóveis Nº. de
xi residências xi f i xi2 xi2 f i
fi
0 1 0 0 0
1 3 3 1 3
2 5 10 4 20
3 1 3 9 9
Total 10 16 - 32
k

x f i i
16
Resolução: Primeiramente será calculada a média: x  i 1
  1, 6 carros por residência
n 10
amplitude total: A= 3- 0 = 3 automóveis

A variância foi calculada como


2
 k 
 k  
  i 1
xi  f i 
 162
  xi  fi  
2
32 
S 2   i 1  n
 10  32  25, 6  0, 71 (automoveis) 2
n 1 9 9

O Desvio Padrão é a raiz quadrada da variância: S = S 2 = 0, 71  0,84 automoveis

S 0,84
O coeficiente de variação: CV   100   100  52,5%
x 1, 6

5
b) Tabela 2 – Renda familiar, em salários mínimos, de 40 famílias da cidade de XX, em abril
de 2019
Renda familiar No de Ponto médio
por mês (em sm) famílias xi ou pmi xi f i xi2 xi2 f i
fi

2  4 5 3 15 9 45

4  6 10 5 50 25 250

6  8 14 7 98 49 686

8  10 8 9 72 81 648

10  12 3 11 33 121 363

Total 40 - 268 1992


Fonte: Dados fictícios

2
 k 
  xi  f i 
   i 1  268 
k 2

  xi
2
 f i  1992 
S 2   i 1  n
 40  1992  1795,6  196, 4  5, 04(renda) 2
n 1 40  1 40  1 39
S  S 2  5, 04  2, 24 salários min .

 k 
  pmi fi 
x   i 1   268  6, 7
n 40

S 2, 24
CV  100  100  33, 4%
x 6, 7

Observações: Se estivermos trabalhando com os dados de uma população, a notação de variância


populacional é  2 .
A variância populacional para dados brutos é calculada como:
2
 N 
N N   xi 
 (x  )
i
2
 xi   i 1 
2

N
2  i 1
ou  2  i 1
N N

6
com N = número de elementos da população e µ é a média populacional

A variância populacional para dados agrupados é calculada como:


2
 k 
k k   xi  f i 
 (x  )
i
2
fi  ( xi 2  f i )   i 1 
N
 
2 i 1
ou  2  i 1
N N

E o desvio padrão populacional é a raiz quadrada da variância populacional:    2


Coeficiente de Variação (CV) populacional: CV  100 sendo σ = desvio padrão

populacional e µ a média populacional.

Você também pode gostar