Você está na página 1de 21

ESTATÍSTICA APLICADA

MEDIDAS DE DISPERSÃO

CAP UBIRATAN
Medidas de Dispersão

A dispersão mede quão próximo uns dos outros estão os valores


do grupo
pequena dispersão

grande dispersão

A  25,28,31,34,37  B  17,23,30,39,46
x A  31 xB  31

A variabilidade de B é maior que de A


Uma medida de Uma medida de
Uma boa posição dispersão
representação = +
(quase sempre a (quase sempre o
de dados média) desvio padrão)
Medidas de Dispersão

Amplitude, range ou intervalo

É expresso pela diferença entre o maior e o menor valor num grupo, ou


pela identificação desses dois números.

intervalo
números diferença do menor ao maior
(1 ; 5 ; 7 ; 13) 13 – 1 = 12 de 1 a 13
(14 ; 3 ; 17 ; 4 ; 8 ; 73 ; 36 ; 48) 73 – 3 = 70 de 3 a 73
(3,2 ; 4,7 ; 5,6 ; 2,1 ; 1,9 ; 10,3) 10,3 – 1,9 = 8,4 de 1,9 a 10,3
Medidas de Dispersão

Amplitude, range ou intervalo

1 • • • • • • • • • • distribuição uniforme – o
intervalo é uma boa medida

2 • • •• • • ••• • é uma medida apenas


razoável
3 •••••• •• • • é uma medida ruim da
dispersão
intervalo

LIMITAÇÃO: só leva em conta os dois valores extremos do


conjunto, nada informando sobre os outros valores.
Medidas de Dispersão

Desvio médio absoluto

 |xi–x |
DMA = n

DMA é fácil de mas é pouco usado como medida de


entender e calcular dispersão

outras medidas apresentam propriedades


matemáticas mais interessantes
Medidas de Dispersão

Desvio médio absoluto

Exercício: Calcule o DMA do conjunto de dados 2, 4, 6, 8, 10.


Calcular o desvio médio.

X = (2 +4 +6 +8 +10) / 5 = 6

Xi - X
2–6= -4
4–6= -2  |xi–x |
DMA = n
6–6= 0
8–6= 2
10 – 6 = 4 DMA = (4 +2 +0 +2 + 4 ) / 5 = 2,4
soma 0
Medidas de Dispersão

Variância

A Variância é uma medida de dispersão muito utilizada.

 x i - ( x i ) / n
2 2
 (x i - x )
2
Sx =
2 OU S x2 =
N n-1

n–1 amostra
n população

ATENÇÃO
Medidas de Dispersão

Variância

Exercício: Calcule a variância da amostra 2, 4, 6, 8, 10.

A média desse conjunto é 6.


xi x x i- x (x i - x ) 2
2 6 -4 16
 (x - x ) 2
40 = 10
4 6 -2 4 S x2 = i
=
n-1 5-1
6 6 0 0
8 6 +2 4
10 6 +4 16 Se esses valores representassem
somas 0 40 toda a população, a variância
seria 40/5 = 8.
Medidas de Dispersão

Desvio padrão

É a raiz quadrada da variância.


2 -
x ( i / n
x ) 2
 (x i - x )
2  i
Sx = n-1 Sx =
n-1

n–1 amostra só raiz positiva


n população da variância

O desvio padrão é mais comumente usado porque se apresenta na


mesma unidade da variável em análise. Assim, se a unidade da
variável for mm, o desvio padrão também será mm.
Isso não acontece com a variância.
Medidas de Dispersão

Desvio padrão

O desvio padrão é a medida de dispersão mais usada. Quanto maior


é o desvio padrão maior é a dispersão dos dados em torno da média.

emtodos os casos temos 7 medidas


s=0
7
6 com média X  4
5
freqüência

4
3 s = 0,8 s = 1,0 s=3
2
1
0
1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

O desvio-padrão cresce quando a dispersão dos dados aumenta


Medidas de Dispersão

Coeficiente de variação

É a relação entre o desvio padrão e a média do conjunto de dados.

amostra população
Sx σ . 100
CV (%) = . 100 ou CV(%) =
x µ

Nos dá a idéia do tamanho do desvio padrão em relação à média.


Uma pequena dispersão absoluta pode ser na verdade considerável
quando comparada com os valores da variável

Conjunto de dado com s = 15 e Conjunto de dado com s = 20 e


média 100 média 1000
CV = 15% CV = 2%
Médias e Desvio-padrão - Exemplos

Exemplo: Calcular o desvio-padrão da amostra


representada por: 1, 2, 4, 5, 7.
2
i Xi (Xi - X ) (Xi - X )
1 1 (1 – 3,8) = -2,8 (-2,8)2 = 7,84
2 2 (2 – 3,8) = -1,8 (-1,8)2 = 3,24
3 4 (4 – 3,8) = 0,2 (0,2)2 = 0,04
4 5 (5 – 3,8) = 1,2 (1,2)2 = 1,44
5 7 (7 – 3,8) = 3,2 (3,2)2 = 10,24
= 3,8
 X  X 
5
X 2
 22,8
i
1
Médias e Desvio-padrão - Exemplos

i Xi (Xi - X ) (Xi - X )2
1 1 (1 – 3,8) = -2,8 (-2,8)2 = 7,84
2 2 (2 – 3,8) = -1,8 (-1,8)2 = 3,24
3 4 (4 – 3,8) = 0,2 (0,2)2 = 0,04
4 5 (5 – 3,8) = 1,2 (1,2)2 = 1,44
5 7 (7 – 3,8) = 3,2 (3,2)2 = 10,24
= 3,8
 X  X 
5
X 2
 22,8
i
1

 
Logo : n 2
1 1 22,8
S . X i  X  .22,8   2,39
n 1 i 5 1 4
Médias e Desvio-padrão - Exercícios

Exercício 1: Vamos supor que eu quero comprar uma lâmpada


para a minha casa e quero que ela dure pelo menos 700 h. Eu
solicito a dois fabricantes o tempo de vida útil de suas lâmpadas
e eles me fornecem os seguintes dados:

Fabricante A (h) Fabricante B (h)


730 1000
710 687
705 700
720 850
765 587
750 710

Supondo que as duas lâmpadas custam o mesmo valor,


qual delas eu deveria comprar?
Médias e Desvio-padrão - Exercícios

Para chegarmos à uma conclusão é necessário calcularmos o


tempo de vida útil médio para cada fabricante e saber qual é
variabilidade dos dados.

Fabricante A (h) Fabricante B (h)


730 1000
710 687
705 700
720 850
765 587
750 710

X A  730 h X B  755,67 h
SA = 23,45 h SB = 146,25 h

Critério de escolha: tempo de vida útil = média  desvio-padrão


Médias e Desvio-padrão - Exercícios

Fabricante A : 730 ± 23,45 h

X A  S A  730  23,45 h X A  730 h X A  S A  730  23,45 h

Fabricante A:[706,55 – 753,45= -46,9] Conclusão :


Escolheria o
fabricante A.
Fabricante B : 755,67 ± 146,25 h

X B  S B  755,67  146,25 h X B  755,67 h X B  S B  755,67  146,25 h

Fabricante B : [609,42 – 901,92= -292,5]


Médias e Desvio-padrão - Exercícios

Exercício 2: Um comerciante está interessado em comprar 100 garrafas


de cachaça para o seu estabelecimento. No entanto, como é de
preferência de sua clientela, é necessário que a cachaça escolhida
apresente um teor alcoólico de no mínimo 33% em volume. Ele
consultou alguns fornecedores e obteve as seguintes informações:

Teor alcoólico de três tipos de aguardente pesquisadas.


Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)
38,7 35,7 38,7
33,5 36,4 33,5
32,5 35,9 34,5
31,2 33,2 34,2
35,9 34,1 35,9

Na sua opinião, qual deveria ser a marca escolhida pelo


comerciante?
Médias e Desvio-padrão - Exercícios
Teor alcoólico de três tipos de aguardente pesquisadas.
Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)
38,7 35,7 38,7
33,5 36,4 33,5
32,5 35,9 34,5
31,2 33,2 34,2
35,9 34,1 35,9

As marcas B e C
Marca A: 34,36 ± 2,97 [31,39–37,33=-5,94] atendem ao requisito
(>33%),no entanto
Marca B: 35,06 ± 1,35 [33,71–36,41=-2,7] escolheria a marca C
pelo preço. Assim,
teria um economia de
Marca C:35,36 ± 2,06  [33,3–37,42=-4,12] R$ 45,00!
Na preparação para os jogos Olímpicos de Atenas, três atletas do salto em altura ao
realizarem um treinamento diário, consideraram seus quatro melhores saltos em
centímetros. Veja:

Dentre os atletas, a melhor média foi a do Atleta Z, veja:

Atleta X = (144 + 171 + 150 + 138) / 4 = 150,75


Atleta Y = (146 + 170 + 152 + 137) / 4 = 151,25
Atleta Z = (145 + 169 + 154 + 140) / 4 = 152
Atleta W = (150 + 167 + 149 + 141) / 4 = 151,75
Em situações que envolvam disputas olímpicas, o atleta com melhor média, às vezes
não é considerado o mais indicado, pois verifica-se a questão da regularidade dos
resultados obtidos. É referente a esses casos que aplicamos os cálculos ligados à
Variância e ao Desvio Padrão.
• o Desvio Padrão e a Variância.
• São utilizadas em situações que grupos de
médias iguais com valores diferentes,
possuem características diferentes. O Desvio
Padrão analisa a regularidade dos valores, e a
Variância resulta os desvios em relação à
média aritmética.
• O coeficiente de variação é uma medida relativa de variabilidade. É da unidade
de medida utilizada, sendo que a unidade dos dadindependente os observados pode
ser diferente que seu valor não será alterado.
• Vejamos um exemplo onde se pretende comparar dois conjuntos de dados quanto
às suas variabilidades. O primeiro conjunto de 84 famílias possui um desvio
padrão para o salário de casa de s1 = R$ 28,04. O segundo conjunto composto
também por 84 famílias possui um desvio padrão para o gasto diário de s 2 = R$
61,00. É difícil uma comparação racional entre esses valores, pois os desvios só
podem ser devidamente avaliados quando comparados sob a mesma grandeza.
Assim, sabendo-se que a média de salário das 84 famílias foi de Média1 = R$
405,83 e considerando que o gasto médio diário no segundo conjunto foi de R$
241,00, os coeficientes de variação são respectivamente:
• CV1 = 100 x 28,04/405,83 = 6,91%
CV2 = 100 x 6/24 = 25%
• Verifica-se que o CV para o gasto médio diário é muito maior do que para o salário
de casa. Logo concluímos através do CV de cada grupo, que o CV do grupo 2 é
muito maior que do grupo 1.
• O coeficiente de variação tem, portanto, aplicações na pesquisa para comparar a
precisão de diferentes experimentos. Entretanto, a qualificação de um coeficiente
como alto ou baixo requer familiaridade com o material que é objeto de pesquisa.

Você também pode gostar