Você está na página 1de 14

Medidas de Dispersão

Themis da Costa Abensur Leão

Universidade Federal do Amazonas

Themis Leão (DE-UFAM) Medidas de Dispersão 1 / 14


Motivação

Apesar de as medidas de tendência central fornecerem uma ideia do


comportamento das variáveis, elas escondem informações sobre a variabilidade
dos dados.

Exemplo 1: Um bairro nobre do Rio de Janeiro inclui uma das maiores favelas da
cidade. O que podemos dizer sobre a renda média do bairro? A variabilidade é
captada pela média?

Exemplo 2: dois (ou mais) grupos de dados podem apresentar a mesma média,
mas possuem valores diferentes:

A: 25 50 75
B: 50 10 90

Os conjuntos A e B apresentam média x̄A = x̄B = 50, mas a distribuição dos


valores de cada conjunto é diferente.

Themis Leão (DE-UFAM) Medidas de Dispersão 2 / 14


Exemplo 3: Considere duas linhas de produção de uma peça. O comprimento médio da
peça é de 75cm e ambas as linhas estão produzindo peças com médias próximas desse
valor. Podemos considerar que as peças produzidas por ambas as linhas são adequadas?

é claro que as peças produzidas pela primeira linha de produção são melhores que a
segunda. Isso ocorre porque a dispersão dos elementos em torno da média é menor, ou
seja, os elementos estão mais concentrados em torno da média na primeira linha de
produção.

Themis Leão (DE-UFAM) Medidas de Dispersão 3 / 14


Medidas de dispersão

1 Amplitude total;

2 Desvio médio;

3 Desvio absoluto médio;

4 Desvio-padrão;

5 Coeficiente de Variação.

Themis Leão (DE-UFAM) Medidas de Dispersão 4 / 14


Amplitude total

Amplitude total é definida pela diferença entre o maior valor (max) e o


menor valor (min) dos dados,

AT = max{x1 , . . . , xn } − min{x1 , . . . , xn }.

Porém a ampliude só leva em conta 2 valores de todo o conjunto de dados,


sendo uma medida pouco informativa.

Themis Leão (DE-UFAM) Medidas de Dispersão 5 / 14


Desvio médio

Desvio é a distância dos dados em relação à média x̄,

di = xi − x̄.

Desvio médio é a média aritmética de todos os desvios obtidos dos dados

1X
n
d¯ = di .
n
i =1

A desvantagem de se usar o desvio médio é que a soma dos desvios sempre


dá zero se o cálculo for feito sem arredondamento e, portanto, a média
deles será sempre zero. Essa medida não é nada informativa.

Themis Leão (DE-UFAM) Medidas de Dispersão 6 / 14


Desvio absoluto médio

O desvio absoluto médio é uma medida de dispersão alternativa que não


é afetada pelo problema da soma nula dos desvios.

é definido pela média dos desvios absolutos |di | > 0, ou seja,

1X 1X
n n
d¯a = |di | = |xi − x̄|.
n n
i =1 i =1

Themis Leão (DE-UFAM) Medidas de Dispersão 7 / 14


Desvio-padrão
A variância é a medida mais apropriada para mensurar dispersão da média dos
dados.

é definida como a média dos desvios ao quadrado em relação à média:

1X
n
var = (xi − x̄)2 =⇒ variância populacional,
n
i =1

1 X
n
var = (xi − x̄)2 =⇒ variância amostral.
n−1
i =1

Para manter a mesma unidade (métrica) dos dados originais, é conveniente


definirmos o desvio-padrão como sendo:

DP = var.

Themis Leão (DE-UFAM) Medidas de Dispersão 8 / 14


Coeficiente de variação

é uma medida de dispersão utilizada quando queremos comparar a


variabilidade de dois (ou mais) conjuntos de dados.

é definido como a razão entre o desvio-padrão e a média amostral e é


usualmente expresso em porcentagem:
DP
CV = × 100%.

No Exemplo 2, os grupos A e B possuem a mesma média, isto é,


x̄A = x̄B = 50, mas os desvios-padrão são bem diferentes, ou seja,
DPA = 25 e DPB = 40. Os coeficientes de variação são, respectivamente,
CVA = 50% e CVB = 80%. A dispersão é maior no grupo B.

Themis Leão (DE-UFAM) Medidas de Dispersão 9 / 14


Exemplo 4

Suonha que um grupo de estudantes foi submetido a um teste e as seguintes


notas foram obtidas: 5, 0 3, 5 9, 0 1, 6 7, 4 8, 0.

Temos então os seguintes resultados:

rol: 1, 6 3, 5 5, 0 7, 4 8, 0 9, 0

5,0+7,4
mediana: md = 2 = 6, 2

1,6+3,5+···+9,0 34.5
média: x̄ = 6 = 6 = 5, 75

(1,6−5,75)2 +···(9,0−5,75)2 41,195


variância: var = 5 = 5 = 8, 239

desvio-padrão: DP = 8, 239 = 2, 87

Themis Leão (DE-UFAM) Medidas de Dispersão 10 / 14


Variância e Desvio-padrão para dados em distribuição de frequências

O cálculo da variância e do desvio-padrão é dado da seguinte forma:


k
1 X √
var = ni (xi − x̄)2 e DP = var,
n − 1 i =1

em que
k é o número de resultados possíveis da variável X ;
n é o total de observações no conjunto de dados;
ni é a frequência absoluta do resultado xi , com i = 1, . . . , k.

xi ni (xi − x̄)2 ni (xi − x̄)2


x1 n1 (x1 − x̄)2 n1 (x1 − x̄)2
x2 n2 (x2 − x̄)2 n2 (x2 − x̄)2

.. .. .. ..
. . . .
xk nk (xk − x̄ )2 nk (xk − x̄)2
Pk 2
Total n i =1 ni (xi − x̄)

Themis Leão (DE-UFAM) Medidas de Dispersão 11 / 14


Exemplo 5
Numa faculdade com 371 estudantes registrou-se quantos computadores havia em suas
residências. Seja X o número de computadores.
xi ni fi Fi ni xi (xi − x̄ )2 ni (xi − x̄)2
0 156 0,420 0,420 0 1 156
1 135 0,364 0,784 135 0 0
2 47 0,127 0,911 94 1 47
3 25 0,067 0,978 75 4 100
4 8 0,022 1 32 9 72
Total 371 1 336 375

moda: mo = 0

mediana: md = 1

336
média: x̄ = 371
= 0, 90 ≈ 1

375
variância: var = 370
= 1, 01 ≈ 1

desvio-padrão: DP = 1, 01 ≈ 1
Themis Leão (DE-UFAM) Medidas de Dispersão 12 / 14
Variância e Desvio-padrão para dados agrupados em classes

O valor xi que será utilizado no cálculo da variância será o ponto médio dos limites dos
intervalos: xi∗ = (Ii + Si )/2.

Variância e desvio-padrão serão dados por


k
1 X √
var = ni (xi∗ − x̄)2 ; e DP = var,
n − 1 i =1
em que
k
1X
x̄ = ni xi∗ .
n i =1

Classe xi∗ ni (xi∗ − x̄)2 ni (xi∗ − x̄)2


I1 ⊢ S1 x1∗ n1 (x1∗ − x̄)2 n1 (x1∗ − x̄)2
I2 ⊢ S 2 x2∗ n2 (x2∗ − x̄)2 n2 (x2∗ − x̄)2

.. .. .. .. ..
. . . . .
Ik ⊢ S k xk∗ nk (xk∗ − x̄)2 nk (xk∗ − x̄)2
Pk 2
i =1 ni (xi − x̄)

Total n

Themis Leão (DE-UFAM) Medidas de Dispersão 13 / 14


Exemplo 6
Quantidade de salários mínimos de 70 professores do ensino médio de uma escola.

Salário xi∗ ni Ni dsi fi Fi ni xi∗ (xi∗ − x̄)2 ni (xi∗ − x̄)2


1⊢3 2 14 14 0,100 0,200 0,200 28 9 126
3⊢5 4 25 39 0,179 0,357 0,557 100 1 25
5⊢7 6 18 57 0,129 0,257 0,814 108 1 18
7⊢9 8 9 66 0,064 0,129 0,943 72 9 81
9 ⊢ 11 10 4 70 0,029 0,057 1 40 25 100
Total 70 1 348 350
(3∗0,100)+(5∗0,129)
moda: mo = 0,100+0,129
= 4, 12 ≈ 4
 
(70/2)−14
mediana: md = 3 + 25
2 = 4, 68 ≈ 5

348
média: x̄ = 70
= 4, 97 ≈ 5

350
variância: var = 69
= 5, 07 ≈ 5

desvio-padrão: DP = 5, 07 = 2, 25 ≈ 2
Themis Leão (DE-UFAM) Medidas de Dispersão 14 / 14

Você também pode gostar