Você está na página 1de 18

MEDIDAS DE DISPERSÃO

Introdução

Uma breve reflexão sobre as medidas de tendência central permite-nos


concluir que elas não são suficientes para caracterizar totalmente uma
sequência numérica.
Se observarmos as sequências:
X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10.
Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13.
Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13
concluiremos que todas possuem a mesma media 13.
No entanto, são sequências completamente distintas do ponto de vista da
variabilidade dos dados.
Na sequência Z não há variabilidade de dados.
A média 13 representa bem qualquer valor da série.
Na sequência Y, a média 13 representa bem a série, mas existem
elementos da série levemente diferenciados da média 13.
Na sequência X existem muitos elementos bastante diferenciados da
média 13.
Concluímos que a média 13 representa otimamente a sequência Z,
representa bem a sequência Y, mas não representa bem a sequência X.
O nosso objetivo é construir medidas que avaliem a representatividade da
média. Para isto usaremos as medidas de dispersão.
Observe que na sequência Z os dados estão totalmente concentrados
sobre a média 13.
Não há dispersão de dados. Na sequência Y há forte concentração dos
dados sobre a média 13, mas há fraca dispersão de dados. Já na série X há
fraca concentração de dados em torno da média 13 e forte dispersão de dados
em relação à média 13.

Medidas de Dispersão Absoluta

As principais medidas de dispersão absolutas são: amplitude total, desvio


médio simples, variância e desvio padrão.
Amplitude Total

É a diferença entre o maior e o menor valor da sequência.

Cálculo da Amplitude Total

1º caso: dados brutos ou rol

Basta identificar o maior e o menor valor da sequência e efetuar a


diferença entre estes valores.
Exemplo: Determine a amplitude total da sequência X: 11, 12, 9, 10, 10,
15.
Solução: O maior valor desta sequência é 15 e o menor valor é 9.
Portanto, a amplitude total da sequência é At = 15 − 9 = 6 unidades.

2º caso: variável discreta

Como os valores já se apresentam ordenados, a amplitude total é a


diferença entre o último e o primeiro elemento da série.
Exemplo: Determine a amplitude total da série.

𝒙𝒊 𝒇𝒊
2 1
3 6
5 10
7 3

Solução: O maior valor da série é 7 e o menor valor da série é 2. Portanto,


a amplitude total da série é At = 7 − 2 = 5 unidades.

3º caso: variável contínua

Nesta situação, por desconhecer o maior e o menor valor da série,


devemos fazer um cálculo aproximado da amplitude total da série.
Consideraremos como maior valor da série o ponto médio da última classe
e como o menor valor da série o ponto médio da primeira classe. A amplitude
total é a diferença entre estes valores.
Exemplo: Determinar a amplitude total da série:

Classe Intervalo de classe 𝒇𝒊


1 2 |--- 4 5
2 4 |--- 6 10
3 6 |--- 8 20
4 8 |--- 10 7
5 10 |--- 12 2

Solução: O ponto médio da última classe é 11 e o ponto médio da primeira


classe é 3. Portanto, At = 11 − 3 = 8 unidades.

COMENTÁRIO: Apesar da facilidade de obtenção da amplitude total, esta


medida apresenta a inconveniência de depender apenas de dois valores da
série. É possível modificar completamente a dispersão ou a concentração dos
elementos em torno da média, sem alterar a amplitude total da série. É uma
medida que tem pouca sensibilidade estatística.

Desvio Médio Simples

O conceito estatístico de desvio corresponde ao conceito matemático de


distância.
A dispersão dos dados em relação à média de uma sequência pode ser
avaliada através dos desvios de cada elemento da sequência em relação à
média da sequência.
O desvio médio simples que indicaremos por DMS é definido como sendo
uma média aritmética dos desvios de cada elemento da série para a média da
série.

Cálculo do Desvio Médio Simples

1º caso: dados brutos ou rol


Calculamos inicialmente a média da sequência. Em seguida,
identificamos a distância de cada elemento da sequência para a sua média.
Finalmente, calculamos a média destas distâncias.
Se a sequência for representada por X: x1, x2, ..., xn, então o DMS admite
como fórmula de cálculo:
∑|𝑥𝑖 − 𝑥̅ |
DMS =
𝑛

Exemplo: Calcule o DMS para a sequência:


X: 2, 8, 5, 6
Solução: determinamos inicialmente a média da série:
∑ 𝑥𝑖 2+8+5+6
𝑥̅ = 𝑛
=
4
= 5,25
Em seguida determinamos as distancias de cada elemento da série para
a média da série:
|𝑥1 − 𝑥̅ | = |2 − 5,25| = 3,25
|𝑥2 − 𝑥̅ | = |8 − 5,25| = 2,75
|𝑥3 − 𝑥̅ | = |5 − 5,25| = 0,25
|𝑥4 − 𝑥̅ | = |6 − 5,25| = 0,75

O DMS é a média aritmética simples destes valores.


3,25+3,75+0,25+0,75 7
DMS = = = 1,75
4 4
Interpretação: Em média cada elemento da sequência está afastado do
valor 5,25 por 1,75 unidades.

2º caso: variável discreta

No caso da apresentação de uma variável discreta, lembramos que a


frequência simples de cada elemento representa o número de vezes que este
valor figura na série. Consequentemente, haverá repetições de distâncias iguais
de cada elemento distinto da série para a média da série. Assim, a média
indicada para estas distâncias é uma média aritmética ponderada.
A fórmula do cálculo do DMS é:
∑|𝑥𝑖 − 𝑥̅ | 𝑓𝑖
DMS =
∑ 𝑓𝑖

Exemplo 1: Determinar o DMS para a série:

𝒙𝒊 𝒇𝒊
1 2
3 5
4 2
5 1

Solução: O número de elementos da série é n = ∑ fi = 10.


A média da série é:
∑ 𝑥𝑖 𝑓𝑖
𝑥̅ = ∑ 𝑓𝑖

Usaremos a disposição da tabela, acrescentando novas colunas para a


resolução dos cálculos.

𝒙𝒊 𝒇𝒊 𝒙𝒊 𝒇𝒊
1 2 2
3 5 15
4 2 8
5 2 8

A média da série é:
∑ 𝑥𝑖 𝑓𝑖 30
𝑥̅ = ∑ 𝑓𝑖
=
10
=3

O DMS é dado por:


∑|𝑥𝑖 − 𝑥̅ | 𝑓𝑖
DMS =
∑ 𝑓𝑖

Incluiremos outra coluna para efetuar estes cálculos:


𝒙𝒊 𝒇𝒊 𝒙𝒊 𝒇𝒊 |𝒙𝒊 − 𝒙
̅ | 𝒇𝒊
1 2 2 4
3 5 15 0
4 2 8 2
5 2 8 2
∑ 𝒇𝒊 = 10 ∑ 𝒙𝒊 𝒇𝒊 = 30 ∑|𝒙𝒊 − 𝒙
̅ | 𝒇𝒊 = 8

O desvio médio simples é:


∑|𝑥𝑖 − 𝑥̅ | 𝑓𝑖 8
DMS =
∑ 𝑓𝑖
= 10 = 0,8 unidades
Interpretação: Em média, cada elemento da série está afastado do valor
3 por 0,8 unidade.

3º caso: variável contínua

Nesta situação, por desconhecer os valores individuais dos elementos


componentes da série, substituiremos os valores Xi, pelos pontos médios de
classe.
Desta forma, o desvio médio simples tem por cálculo a fórmula:
∑|𝑥𝑖 − 𝑥̅ | 𝑓𝑖
DMS =
∑ 𝑓𝑖

Exemplo: Determine o DMS para a série.

Classe Intervalo de classe 𝒇𝒊


1 2 |--- 4 5
2 4 |--- 6 10
3 6 |--- 8 4
4 8 |--- 10 1

Solução: O número de elementos da série é n = ∑ fi = 20.


Usaremos a disposição da tabela acrescentando as colunas necessárias
para a resolução dos cálculos.
Inicialmente acrescentamos a coluna dos pontos médios das classes:
Intervalo de
Classe 𝒇𝒊 𝒙𝒊
classe
1 2 |--- 4 5 3
2 4 |--- 6 10 5
3 6 |--- 8 4 7
4 8 |--- 10 1 9
∑ 𝒇𝒊 = 20
∑ 𝑥𝑖 𝑓𝑖
Em seguida calculamos a média da série 𝑥̅ = :
∑ 𝑓𝑖

Intervalo de
Classe 𝒇𝒊 𝒙𝒊 𝒙𝒊 𝒇𝒊
classe
1 2 |--- 4 5 3 15
2 4 |--- 6 10 5 50
3 6 |--- 8 4 7 28
4 8 |--- 10 1 9 9
∑ 𝒇𝒊 = 20 ∑ 𝒙𝒊 𝒇𝒊 = 102

A média da série é:
∑ 𝑥𝑖 𝑓𝑖 102
𝑥̅ = ∑ 𝑓𝑖
=
20
= 5,1

∑|𝑥𝑖 − 𝑥̅ | 𝑓𝑖
O DMS é dado por DMS =
∑ 𝑓𝑖

Intervalo de
Classe 𝒇𝒊 𝒙𝒊 𝒙𝒊 𝒇𝒊 |𝒙𝒊 − 𝒙
̅ | 𝒇𝒊
classe
1 2 |--- 4 5 3 15 10,5
2 4 |--- 6 10 5 50 1,0
3 6 |--- 8 4 7 28 7,6
4 8 |--- 10 1 9 9 3,9
∑ 𝒇𝒊= 20 ∑ 𝒙𝒊 𝒇𝒊 = 102 ∑|𝒙𝒊 − 𝒙
̅| 𝒇𝒊 = 23
∑|𝑥𝑖 − 𝑥̅ | 𝑓𝑖 23
O DMS =
∑ 𝑓𝑖
= 20 = 1,15 unidades
Interpretação: em média cada elemento da série está afastado de 5,1 por
1,15 unidades.
COMENTÁRIO: o desvio médio simples depende de cada componente da
série. Se mudarmos o valor de um único elemento da série, mudamos também
o DMS. Portanto, o desvio médio simples tem perfeita sensibilidade estatística.
A maior dificuldade desta medida é envolver módulos, cujas propriedades, em
geral, não são suficientemente conhecidas pelas pessoas que normalmente
desenvolvem estes cálculos.

Variância e Desvio Padrão

Introdução: Observamos no item anterior que a dificuldade em se operar


com o DMS se deve à presença do módulo, para que as diferenças 𝑥𝑖 − 𝑥̅
possam ser interpretadas como distâncias.
Outra forma de se conseguir que as diferenças 𝑥𝑖 − 𝑥̅ se tornem sempre

positiva é considerar o quadrado destas diferenças, isto é: (𝑥𝑖 − 𝑥̅ )2

Se substituirmos, nas fórmulas do DMS a expressão 𝑥𝑖 − 𝑥̅ por (𝑥𝑖 −

𝑥̅ )2, obteremos nova medida de dispersão chamada variância.


Portanto, variância é uma média aritmética calculada a partir dos
quadrados dos desvios obtidos entre os elementos da série e sua média.
O desvio padrão é a raiz quadrada positiva da variância.
Em particular, para estas medidas levaremos em consideração o fato de
a sequência de dados representar toda uma população ou apenas uma amostra
de uma população.
No final desta sessão justificaremos esta necessidade.
Notações: Quando a sequência de dados representa uma População, a
variância será denotada por 𝜎 2 (𝑥) e o desvio padrão correspondente por 𝜎(𝑥).
Quando a sequência de dados representa uma amostra, a variância será
denotada por 𝑠 2 (𝑥) e o desvio padrão correspondente por 𝑠(𝑥).

Cálculo da Variância e Desio Padrão

1º caso: dados brutos ou rol

a) Se a sequência representa uma População, a variância é calculada


pela fórmula:
∑(𝑥𝑖 − 𝑥̅ )2
𝜎 2 (𝑥) = 𝑛

Exemplo: Calcule a variância e o desvio padrão da sequência X: 4, 5, 8,


5.
A sequência contém n = 4 elementos e tem por média:
∑ 𝑥𝑖 4+5+8+5
𝑥̅ = = = 5,5
𝑛 4
Os quadrados das diferenças (𝑥𝑖 − 𝑥̅ )2 valem:

(𝑥1 − 𝑥̅ )2 = (4 − 5,5)2 = 2,25

(𝑥2 − 𝑥̅ )2 = (5−5,5)2 = 0,25

(𝑥3 − 𝑥̅ )2 = (8 − 5,5)2 = 6,25

(𝑥4 − 𝑥̅ )2 = (5 − 5,5)2 = 0,25


̅)2 = 9.
Somando estes valores obtém-se ∑(𝑥𝑖 − 𝑥
Substituindo esses valores na fórmula da variância, teremos:
∑(𝑥𝑖 − 𝑥̅ )2 9
𝜎 2 (𝑥) = = = 2,25.
𝑛 4
Como o desvio padrão é a raiz quadrada positiva da variância,

𝜎(𝑥) = √𝜎 2 (𝑥) = √2,25 = 1,5 unidades.

b) Se a sequência anterior representasse uma amostra, a variância seria


denotada por s2(x) e o desvio padrão por s(x).
Neste caso,

2 (𝑥)
∑(𝑥𝑖 − 𝑥̅ )2
𝑠 =
𝑛−1
e

𝑠(𝑥) = √𝑠 2 (𝑥)
Note que a única diferença entre a fórmula de 𝜎 2 (𝑥) (indicado para
Populações) e s2(x) (indicado para amostras) é o denominador.
∑(𝑥𝑖 − 𝑥̅ )2 9
𝑠 2 (𝑥) = = = 1,73 e o desvio padrão s(x) = √3 = 1,73.
𝑛−1 3

2º caso: variável discreta


Como há repetições de elementos na série, definimos a variância como
sendo uma média aritmética ponderada dos quadrados dos desvios dos
elementos da série para a média da série.
1. Se a variável discreta é representativa de uma População, então a
variância é dada por:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝜎 2 (𝑥) = ∑ 𝑓𝑖

e o desvio padrão é:
𝜎(𝑥) = √𝜎 2 (𝑥)

2. Se a variável discreta é representativa de uma amostra, então a


variância é dada por:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑠 2 (𝑥) = ∑ 𝑓𝑖 −1

e o desvio padrão é:
𝑠(𝑥) = √𝑠 2 (𝑥)

Exemplo 1: Calcule a variância da série abaixo, representativa de uma


população.

𝒙𝒊 𝒇𝒊
2 3
3 5
4 8
5 4

Solução: O número de elementos da série é n = ∑ fi = 20.


∑ 𝑥𝑖 𝑓𝑖
A média desta série é 𝑥̅ = ∑ 𝑓𝑖
𝒙𝒊 𝒇𝒊 𝒙𝒊 𝒇𝒊
2 3 6
3 5 15
4 8 32
5 4 20
∑ 𝒇𝒊 = 20 ∑ 𝒙𝒊 𝒇𝒊 = 73

∑ 𝑥𝑖 𝑓𝑖 73
A média desta série é 𝑥̅ = = = 3,65
∑ 𝑓𝑖 20

Como estamos trabalhando com uma População, a variância é dada por:

2 (𝑥)
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝜎 =
∑ 𝑓𝑖
Desenvolvendo nova coluna para estes cálculos, obtém-se:

𝒙𝒊 𝒇𝒊 𝒙𝒊 𝒇𝒊 ̅ ) 𝟐 𝒇𝒊
(𝒙𝒊 − 𝒙
2 3 6 8,1675
3 5 15 2,1125
4 8 32 0,9800
5 4 20 7,2900
∑ 𝒇𝒊= 20 ∑ 𝒙𝒊 𝒇𝒊 = 73 ∑|𝒙𝒊 − 𝒙
̅| 𝒇𝒊 = 18,55
A variância é:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖 18,55
𝜎 2 (𝑥) = ∑ 𝑓𝑖
= = 0,9275
20

e o desvio padrão correspondente é 𝜎(𝑥) = √0,9275 = 0,963.

Exemplo 2: Se a variável discreta fosse representativa de uma amostra, a


variância seria indicada por
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖 18,55
𝑠 2 (𝑥) = ∑ 𝑓𝑖 −1
= = 0,9763
19

O desvio padrão seria calculado por s(𝑥) = √0,9763 = 0,988.


3º caso: variável contínua

Novamente, por desconhecer os particulares valores xi da série,


substituiremos nas fórmulas anteriores estes valores pelos pontos médios da
classe.
A fórmula da variância para uma variável contínua representativa de uma
população é:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝜎 2 (𝑥) =
∑ 𝑓𝑖
onde xi é o ponto médio da classe i.
Se a variável contínua representa uma amostra então a variância é
denotada por 𝑠 2 (𝑥) e sua fórmula de cálculo é:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑠 2 (𝑥) =
∑ 𝑓𝑖 − 1
Exemplo 1: Calcule a variância e o desvio padrão para a série
representativa de uma População.

Intervalo de
Classe 𝒇𝒊
classe
1 0 |--- 4 1
2 4 |--- 8 3
3 8 |--- 12 5
4 12 |--- 16 1

Solução: O número de elementos da série é n = ∑ fi = 10.


∑ 𝑥𝑖 𝑓𝑖
A média desta série é 𝑥̅ = onde xi são os pontos médios de classe.
∑ 𝑓𝑖

Intervalo de
Classe 𝒇𝒊 𝒙𝒊 𝒙𝒊 𝒇𝒊
classe
1 0 |--- 4 1 2 2
2 4 |--- 8 3 6 18
3 8 |--- 12 5 10 50
4 12 |--- 16 1 14 14
∑ fi = 10 ∑ xifi = 84
∑ 𝑥𝑖 𝑓 𝑖 84
𝑥̅ = ∑ 𝑓𝑖
= = 8,4.
10

Como a variável contínua é representativa de uma população, então a


variância é dada por:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝜎 2 (𝑥) =
∑ 𝑓𝑖

Intervalo de
Classe 𝒇𝒊 𝒙𝒊 𝒙𝒊 𝒇𝒊 ̅)𝟐 𝒇𝒊
(𝒙𝒊 − 𝒙
classe
1 0 |--- 4 1 2 2 40,96
2 4 |--- 8 3 6 18 17,28
3 8 |--- 12 5 10 50 12,80
4 12 |--- 16 1 14 14 31,36
∑ 𝒇𝒊= 10 ∑ 𝒙𝒊 𝒇𝒊 = 84 ∑|𝒙𝒊 − 𝒙
̅| 𝒇𝒊 = 102,4
A variância é:
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖 102,4
𝜎 2 (𝑥) = ∑ 𝑓𝑖
= = 10,24
10

e o desvio padrão correspondente é 𝜎(𝑥) = √10,24 = 3,2.

Exemplo 2: Se a variável contínua fosse representativa de uma amostra,


a variância seria indicada por
∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖 102,4
𝑠 2 (𝑥) = ∑ 𝑓𝑖 −1
= = 11,38
9

O desvio padrão seria calculado por s(𝑥) = √11,68 = 3,373.

COMENTÁRIOS:
1. No cálculo da variância, quando elevamos ao quadrado a diferença
(𝑥𝑖 − 𝑥̅ )2 , a unidade de medida da série fica também elevada ao
quadrado.
Portanto, a variância é dada sempre no quadrado da unidade de
medida da série.
Se os dados são expressos em metros, a variância é expressa em
metros quadrados.
Em algumas situações, a unidade de medida da variância nem faz
sentido é o caso por exemplo em que os dados são expressos em
livros a variância será expressa em litros quadrados.
Portanto, o valor da variância não pode ser comparado diretamente
com os dados da série, ou seja: variância não tem interpretação.
2. Exatamente para suprir esta deficiência da variância é que se define
o desvio padrão.
Como o desvio padrão é a raiz quadrada da variância, o desvio padrão
terá sempre a mesma unidade de medida da série e, portanto, admite
interpretação.

Interpretação do Desvio Padrão

O desvio padrão é, sem dúvida, a mais importante das medidas de


dispersão.
É fundamental que o interessado consiga relacionar o valor obtido do
desvio padrão com os dados da série.
Quando uma curva de frequência representativa da série é perfeitamente
simétrica como a curva abaixo, podemos afirmar que o intervalo [𝑥̅ − 𝜎, 𝑥̅ + 𝜎 ]
contém aproximadamente 68% dos valores da série.

O intervalo [𝑥̅ − 2𝜎, 𝑥̅ + 2𝜎 ] contém aproximadamente 95% dos valores


da série.
O intervalo [𝑥̅ − 3𝜎, 𝑥̅ + 3𝜎 ] contém aproximadamente 99% dos valores
da série.

Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão


mais tarde ser comprovados, com maior precisão, no estudo da distribuição
normal de probabilidades.
Para uma compreensão inicial do desvio padrão, estas noções são
suficientes.
Quando a distribuição não é perfeitamente simétrica estes percentuais
apresentam pequenas variações para mais ou para menos, segundo o caso.
De modo que, quando se afirma que uma série apresenta média 𝑥̅ = 100
e desvio padrão 𝜎(x) = 5, podemos interpretar estes valores da seguinte forma:
1. Os valores da série estão concentrados em torno de 100.
2. O intervalo [95, 105] contém aproximadamente 68% dos valores da
série.
O intervalo [90, 110] contém aproximadamente 95% dos valores da
série.
O intervalo [85, 115] contém aproximadamente 99% dos valores da
série.
É importante que se tenha percebido que, ao aumentar o tamanho do
intervalo, aumenta-se o percentual de elementos contidos no intervalo.
Adiante verificaremos que é possível controlar o tamanho do intervalo de
modo que contenha exatamente o percentual que queremos.
3. As medidas de dispersão vistas até agora absolutas e portanto avaliam
a dispersão absoluta da série. Todas elas são diretamente
proporcionais a dispersão absoluta.
Assim, se a série X apresenta 𝑥̅ = 20 e 𝜎(x) = 3 e se a série Y apresenta
𝑦̅ = 22 e 𝜎(x) = 2, podemos afirmar, comparando os desvios padrão, que a série
X apresenta maior dispersão absoluta.
4. Para justificar que o denominador da variância amostral deve ser n –
1 e não n, usaremos o seguinte argumento:
O modelo matemático que calcula a variância de uma amostra não pode
ser
∑(𝑥𝑖 − 𝑥̅ )2
𝜎 2 (𝑥) = ,
𝑛

pois caso isto fosse verdadeiro, este modelo deveria determinar a


variância para qualquer tamanho de amostra.
Suponha uma amostra constituída de um único elemento X1.
O valor médio da amostra também é x1.
Calculando a variância pelo modelo acima, teremos:
∑(𝑥𝑖 − 𝑥𝑖 )2
𝜎 2 (𝑥) = = 0.
1

Seríamos induzidos a afirmar que a dispersão da população de onde


provém a amostra é zero, isto é, a população é constituída em sua totalidade por
elementos idênticos. O que é, em geral, uma afirmação falsa.
Para corrigir o modelo matemático, basta colocar no denominador n-1. O
modelo é escrito então:
∑(𝑥𝑖 − 𝑥̅ )2
𝑠 2 (𝑥) =
𝑛−1
Observe que agora o modelo é coerente. Mesmo quando a amostra tiver
apenas um elemento x1, o cálculo de s2(x) leva-nos a uma indeterminação do
0
tipo . O que significa que a variância existe, mas não está determinada.
0
Significa também que amostras de apenas um elemento não nos fornece
informações sobre a variância da série.
Medidas de Dispersão Relativa

Introdução: Se uma série X apresenta 𝑥̅ = 10 e 𝜎(x) = 2 e uma série Y


apresenta 𝑦̅ = 100 e 𝜎(x) = 5, do ponto de vista da dispersão absoluta, a série Y
apresenta maior dispersão que a série X.
No entanto, se levarmos em consideração as médias das séries, o desvio
padrão de Y (que é 5 em relação a 100) é um valor menos significativo que o
desvio padrão de X (que é 2 em relação a 10).
Isto nos leva a definir as medidas de dispersão relativas: coeficiente de
variação e variância relativa.
O coeficiente de variação de uma série X é indicado por 𝐶𝑉(𝑥) definido por:
𝜎 (𝑥)
𝐶𝑉(𝑥) =
𝑥̅
A variância relativa de uma série X é indicada por V(x) e definida por:
𝜎 2 (𝑥)
𝑉(𝑥) =
(𝑥̅ )2
Note que o coeficiente de variação, como é uma divisão de elementos de
mesma unidade, é um número puro. Portanto, pode ser expresso em percentual.
Este fato justifica a utilização do denominador (𝑥̅ )2 na definição de V(x).
Deste modo, se calcularmos o coeficiente de variação da série X citada
no início obteremos:
2
𝐶𝑉(𝑥) = = 0,2 ou 20%
10

Calculando o coeficiente de variação da série Y obteremos:


5
𝐶𝑉(𝑦) = = 0,05 ou 5%
100

Comparando os valores destes dois coeficientes concluímos que a série


X admite maior dispersão relativa.
Como a medida de dispersão relativa leva em consideração a medida de
dispersão absoluta e a média da série, é uma medida mais completa que a
medida de dispersão absoluta.
Portanto, a medida de dispersão relativa prevalece sobre a medida de
dispersão absoluta. Podemos afirmar que a série que tem a maior dispersão
relativa, tem de modo geral a maior dispersão.
Concluindo o exemplo anterior:
A série Y apresenta maior dispersão absoluta.
A série X apresenta maior dispersão relativa.
Portanto, a série X apresenta maior dispersão.

Você também pode gostar