Você está na página 1de 18

UNIDADE IV: MEDIDAS DE DISPERSÃO OU VARIABILIDADE

OBJETIVO DA UNIDADE:

- Entender a definição de medida de dispersão ou variabilidade;


- Saber calcular variância e desvio padrão;
- Conceituar intervalo padrão ou zona de normalidade;
- Identificar dados homogêneos e heterogêneos através do coeficiente de variação.

Já estudamos que um conjunto de valores pode ser sintetizado por


meio de procedimento matemático, como o cálculo da média, moda,
mediana, quartis e percentis. No entanto, a interpretação de dados
estatísticos exige que se realize um número maior de estudos, além dos
estudados nas unidades precedentes. Torna-se necessário ter uma idéia de
como se apresentam os dados, qual a variação em torno da média, qual a
concentração. Vejamos o seguinte exemplo:
Foram avaliados três grupos de executivos, cada um com cinco
elementos, no que se refere à criatividade e os testes mostraram os
seguintes resultados:

Grupo A: - 5 5 5 5 5
Grupo B: - 3 4 5 6 7
Grupo C: - 1 2 5 7 10

Para representar cada grupo, podemos calcular a média e vamos


verificar que os três grupos têm a mesma média x = 5, entretanto
observando a variação dos dados podemos perceber que os grupos se
comportam de forma diferente, apesar de todos terem a mesma média.
Nesse caso, a média ainda que considerada como um número que pode
representar uma seqüência de números, não pode destacar o grau de
homogeneidade ou heterogeneidade que existe entre os valores que
compõem o conjunto. Desse modo, precisamos efetuar outros
procedimentos matemáticos para caracterizar melhor os dados de cada
grupo com o objetivo de tirarmos conclusões qualitativas.
As medidas que mostram a variação dos dados de um conjunto são
chamadas de Medidas de Dispersão ou Variabilidade:

I) Medida de Dispersão Absoluta:


- Amplitude total;
- Desvio médio;
- Variância e desvio-padrão.

II) Medidas de Dispersão relativa:


- Coeficiente de variação de Pearson;

4.1 Medidas de Dispersão Absoluta

4.1.1 Amplitude Total ou Intervalo Total

O Símbolo da Amplitude Total é: AT


Definição: A amplitude total de um conjunto de números é a
diferença entre os valores extremos do conjunto observado:

AT  x Max  x Min
Exemplo 1: Calcular a amplitude total dos seguintes conjuntos de
números:
A = {10, 12, 13, 20, 25, 34, 45}
B = {17, 18, 19, 20, 21, 22, 23}
C = {-4, -3, -2, 3, 5}
Solução:
Para o conjunto A, temos: AT = 45 - 10 = 35
Para o conjunto B, temos: AT = 23 - 17 = 6
Para o conjunto C, temos: AT = 5 - (-4) = 9

Se os dados vierem dispostos em uma tabela de freqüências, com os


valores agrupados em classes, há duas formas de se definir a amplitude
total:

Primeiro Método: AT = Ponto médio da última classe - ponto médio da


primeira classe.
Segundo Método: AT = Limite superior da última classe - limite inferior
da primeira classe.

Exemplo 2: Calcular a amplitude total dos valores dispostos na tabela 8.1.

Tabela 4.1 - Consumo de água do Bairro Santa Mônica /06


Classes Fj Xj
10 ├ 20 5 15
20 ├ 30 12 25
30 ├ 40 20 35
40 ├ 50 14 45
50 ├ 60 10 55
60 ├ 70 4 65
n = 65

Pelo primeiro método: AT = 65 - 15 = 50  AT = 50


Nesse método, os valores extremos são eliminados.

Pelo segundo método: AT = 70 - 10 = 60  AT = 60

4.1.2 Restrições ao uso da Amplitude Total

Embora a amplitude total seja a mais simples das medidas de


dispersão, há uma forte restrição ao seu uso em virtude de sua grande
instabilidade, uma vez que ela leva em conta apenas os valores extremos da
série. Comparemos os conjuntos A e B do exemplo 1:

Tabela 4.2
Conjunto Média Amplitude Total: A t

A = {10, 12, 13, 15, 20, 25, 45} x = 20 AT A = 35


B = {17, 18, 19, 20, 21, 22, 23} x = 20 AT B = 6

A média aritmética de cada um desses conjuntos é igual a 20.


Portanto, no que diz respeito a uma medida de posição, ambos os conjuntos
podem ser considerados idênticos. Ao calcularmos a amplitude total,
verificaremos que os valores do conjunto A apresentam maior dispersão.
Todavia, no cálculo da amplitude total não são levados em consideração os
valores da série que se encontram entre os extremos, o que poderia
conduzir o analista a interpretações equivocadas. Muitas vezes, um valor
particularmente anormal poderá afetar de maneira acentuada a medida. O
conjunto A, por exemplo, apresenta o último valor (45) sensivelmente
distante do penúltimo (25), fato que talvez tenha provocado uma amplitude
total de tal magnitude (35).
Além da insensibilidade aos valores entre os extremos anormais, a
amplitude total é sensível ao tamanho de amostra. Ao aumentar essa
última, a amplitude total tende a aumentar, ainda que não
proporcionalmente. Finalmente, a amplitude total apresenta muita variação
de uma amostra para outra, mesmo que ambas sejam extraídas da mesma
população.
Apesar dos inconvenientes dessa medida, os quais não justificam, na
maioria das vezes, seu uso, há situações especiais em que ela resulta
satisfatória. É o caso, por exemplo, da amplitude da temperatura em um
dia ou no ano. Outra situação seria aquela em que os dados são raros ou
demasiadamente esparsos para justificar o emprego de uma medida mais
precisa.
É importante acrescentar que, ao descrever uma série por uma
medida de posição (média, por exemplo) e de dispersão, se essa última for
a amplitude total, é recomendável que se indiquem os valores extremos da
série.

Pratique resolvendo mais alguns exemplos: Determine a amplitude total em


cada um dos casos.

1. A12,15,25,32,45,18,36,19  AT  xMáx  xMin  45  12  AT  33


2. Tabela 4.2.1 Número de faltas dos acadêmicos da Turma A
Faltas Acadêmicos
2 15
3 10
5 8
6 6
9 4
total 43

AT  9  2  7  AT  7

3. Tabela 4.2.2. Notas da atividade 1, dos acadêmicos da Turma A


Notas Acadêmicos
3,8 ├ 4,8 5
4,8 ├ 5,8 6
5,8 ├ 6,8 12
6,8 ├ 7,8 15
7,8 ├ 8,8 5
total 43

Pelo primeiro método: AT = 8,3 – 4,3 = 4 AT = 4


Nesse método, os valores extremos são eliminados.

Pelo segundo método: AT = 8,8 - 3,8 = 5  AT = 5


4.2 Desvio Médio (Símbolo: Dm)

O desvio médio ou média dos desvios é igual à média aritmética dos


valores absolutos dos desvios tomados em relação a uma das seguintes
medidas de tendência central: média ou mediana.
4.2.1 Desvio Médio para Dados Brutos

Quando os valores não vierem dispostos em uma tabela de


freqüências, o desvio médio será calculado, de acordo com a definição,
através do emprego de uma das seguintes fórmulas:

x i
x
(1) desvio em relação à média aritmética.
Dm  i 1

f i

x i
 xmd
(2) desvio em relação à mediana.
Dm  i 1

f i

As barras verticais indicam que são tomados os valores absolutos dos


desvios.

Exemplo: Calcular o desvio médio dos conjuntos de números apresentados


no exemplo 1:
A= {10, 12, 13, 20, 25, 34, 45}
B= {17, 18, 19, 20, 21, 22, 23}
C= {-4, -3, -2, 3, 5}
Os dados necessários para o cálculo do desvio são:

10  12  13  20  25  34  45 159
xA    22,71 e x mdA  20
7 7
17  18  19  20  21  22  23 140
xB    20 e x mdB  20
7 7

(-4)  (-3)  (-2)  3  5  1


xC    0,2 e xmdC  2
5 5

É conveniente colocarmos os valores dispostos em uma tabela,


considerando:

a) Desvio Médio do Conjunto A: onde temos x  22,71 e x md  20

Tabela 4.3 - Elementos do Conjunto A


xi ( xi  x ) xi  x ( xi  xmd ) xi  xmd
10 10 – 22,71 = -12,71 12,71 10 – 20 = -10 10
12 12 – 22,71 = -10,71 10,71 12 – 20 = -8 8
13 13 – 22,71 = -9,71 9,71 13 - 20 = -7 7
20 20 – 22,71 = -2,71 2,71 20 – 20 = 0 0
25 25 – 22,71 = 2,29 2,29 25 – 20 = 5 5
34 34 – 22,71 = 11,29 11,29 34 – 20 = 14 14
45 45 – 22,71 = 22,29 22,29 45 – 20 = 25 25
 = 61,71  = 69
Usando as fórmulas (1) e (2), chegaremos a:
Pela Média
7

x i
- 22,71
71,71 Dm=
Dm  i 1
  10,24 10,24
7 7
Pela Mediana

x i
 20
69 Dm = 9,86
Dm  i 1
  9,86
7 7

b) Desvio Médio do Conjunto B: onde temos x  20 e xmd  20


Tabela 4.4 - Elementos do Conjunto B
xi ( xi  x ) xi  x ( xi  xmd ) xi  xmd
17 17 – 20 = -3 3 17 – 20 = -3 3
18 18 – 20 = -2 2 18 – 20 = -2 2
19 19 – 20 = -1 1 19 – 20 = -1 1
20 20 – 20 = 0 0 20 – 20 = 0 0
21 21 – 20 = 1 1 21 – 20 = 1 1
22 22 – 20 = 2 2 22 – 20 = 2 2
23 23 – 20 = 3 3 23 – 20 = 3 3
x i
 x  12 x i
 xmd  12

Neste caso, o desvio médio é igual, tanto quando calculado a partir


da média como da mediana, uma vez que x  x md  20
Pela Média

Dm =
x i - 20
12
i 1
  1,71 Dm = 1,71
7 7
Pela Mediana
7

Dm =
x i - 20
12
i 1
  1,71
7 7

c) Desvio Médio do Conjunto C: onde temos x  0,2 e xmd  2


Tabela 4.5 - Elementos do Conjunto C
xi ( xi  x ) xi  x ( xi  xmd ) xi  xmd
-4 (-4) – (-0,2) = - 3,8 3,8 -4 – (-2) = -2 2
-3 (-3) – (-0,2) = -2,8 2,8 -3 – (-2) = -1 1
-2 (-2) – (-0,2) = -1,8 1,8 -2 – (-2) = 0 0
3 3 – (-0,2) = 3,2 3,2 3 – (-2) = 5 5
5 5 – (-0,2) = 5,2 5,2 5 – (-2) = 7 7
x i
 x  16,8 x i
 xmd  15

Pela Média

Dm=  x i  (-0,2) 16,8 Dm = 3,36


  3,36
5 5
Pela Mediana

Dm=
 xi  (-2)

15
3 Dm = 3
5 5
Como ocorreu para o primeiro conjunto, o desvio médio neste caso é
menor quando tomado em relação à mediana do que em relação à média.

4.2.2 Desvio Médio para Dados Tabulados sem Intervalo de Classe

Se os valores vierem dispostos em uma tabela de frequências,


agrupados ou não em classes, serão usadas as seguintes fórmulas:

Cálculo pela Média


 x  x.f i i
Dm  i 1

f i
Onde X j representa um valor individual ou um ponto médio da classe.

Cálculo pela Mediana


x i
 xmd . f i
Dm  i 1

f i

Exemplo: Calcular o desvio médio em relação à média e em relação à


mediana do número de empregados por estabelecimentos comerciais
conforme a tabela 4.6.

Tabela 4.6 Número de empregados por estabelecimentos comerciais


Emp/esta f Fa xi f i xi  4,71  f i xi  5  f i
b
1 2 2 2 3,71. 4.(2)=8
(2)=7,42
2 3 5 6 2,71. 3.(3)=9
(3)=8,13
3 3 8 9 1,71. 2.(3)=6
(3)=5,13
4 5 13 20 0,71. 1.(5)=5
(5)=3,55
5 6 19 30 0,29. 0.(6)=0
(6)=1,74
6 4 23 24 1,29. 1.(4)=4
(4)=5,16
7 3 26 21 2,29. 2.(3)=6
(3)=6,87
10 2 28 20 5,29. 5.(2)=6
(2)=10,58
28  xi f i  132   48,58   44
Inicialmente completamos a tabela 4.6 com a coluna da frequência
acumulada Fa para o cálculo da mediana e da coluna para xi f i para o
cálculo da média. Após determinarmos os valores da median e da média
devemos colocar mais duas colunas para o cálculo do desvio com a média e
com a mediana.
132
Cálculo da média x   4,71
28
Para encontrarmos o valor do desvio em relação à média completamos a
tabela com a coluna 5.
48,58
Cálculo do Desvio médio em relação à Média Dm   1,74
28

Cálculo da Mediana  Posição da mediana


f 
28
 14( posição)
2 2
Na coluna da Fa vemos que o elemento de ordem 14° está na classe 5, onde
o valor de x é 5, ou seja xmd  5
Para encontrarmos o valor do desvio em relação à mediana completamos a
tabela com a coluna 6.
48
Cálculo do Desvio médio em relação à Mediana Dm   1,71
28

4.2.3. Desvio Médio para dados Tabulados com Intervalo de Classe.

Exemplo: Calcular o desvio médio dos valores representativos do consumo


de energia elétrica (em Kwh) de 80 usuários.

Tabela 4.7 - Consumo de energia elétrica de consumidores de Campo


Grande/MS/06

xj x j fj xi  x f i xi  xmd f i Fa
Consumo (Kwh) fj
5 ├ 25 4 15 60 64,5 x 4 = 258 62,31 x 4 = 249,24 4
25 ├ 45 6 35 210 44,5 x 6 = 267 42,31 x 6 = 253,86 10
45 ├ 65 14 55 770 24,5 x 14 = 343 22,31 x 14 = 312,34 24
65 ├ 85 26 75 1950 4,5 x 27 = 117 2,31 x 27 = 60,06 50
85 ├ 105 14 95 1330 15,5 x 14 = 217 17,69 x 14 = 247,66 64
105├ 125 8 115 920 35,5 x 8 = 284 37,69 x 8 = 301,52 72
125├ 145 6 135 810 55,5 x 6 = 333 57,69 x 6 = 346,14 78
145├ 165 2 155 310 75,5 x 2 = 150 77,69 x 2 = 155,38 80

80
 =6360 1970   1926,2

Iniciamos com o cálculo da média e da mediana


6360
Média  x   79,5
80
40  24
Mediana  xmd  65   20  xmd  77,31
26
Completamos as tabelas com as diferenças e os produtos necessários para
o cálculo do desvio médio.
8

Cálculo pela média:


 x 79,5 f i i
1970
Dm  i 1
  Dm  24,63Kwh
80 80
8

Cálculo pela mediana:


 x 77,31 f
i i
1926,2
Dm  i 1
  Dm  24,08Kwh
80 80
Podemos observar novamente que o desvio médio, calculado com
base na mediana, é menor que o calculado com base na média aritmética.

Observações:
1. O desvio médio apresenta resultado mais vantajoso que as medidas de
dispersão precedentes, principalmente pelo fato de, em seu cálculo, levar
em consideração todos os valores da distribuição.
2. O desvio médio, calculado levando-se em consideração os desvios em
torno da mediana, é mínimo, ou seja, é menor do que qualquer desvio
médio calculado com base em qualquer outra medida de tendência central.
3. Apesar de o desvio médio expressar aceitavelmente a dispersão de uma
amostra não é tão freqüentemente empregado como o desvio-padrão, o
qual será estudado a seguir, pois este se adapta melhor a uma ampla gama
de aplicações. Além disso, o desvio médio não considera o fato de alguns
desvios serem negativos e outros positivos, pois essa medida os trata como
se fossem todos positivos, como valores absolutos. Contudo, será preferível
o uso do desvio médio em lugar do desvio-padrão, quando esse for
indevidamente influenciado pelos desvios extremos.

Pratique resolvendo mais alguns exemplos: Determine o desvio médio


em cada um dos casos, pela média.

1. A 12, 15, 25, 32, 18, 19

Para facilitar vamos colocar os valores em uma tabela:

xi xi  25,25
12 13,25
15 10,25
18 7,25
19 6,25
25 0,25
32 6,75
  202 44
44
Dm   7,33
6

2. Tabela 4.2.1 Número de faltas dos acadêmicos da Turma A


Falta Acadêmic xi f i xi  4 xi  4 f i
s os
2 15 30 2 30
3 10 30 1 10
5 8 40 1 8
6 6 36 2 12
9 4 36 5 20
total 43 172 80

Para o cálculo do Dm, precisamos da média, dos módulos dos desvios e do


produto dos desvios pela frequência, em seguida é só aplicarmos a fórmula:

 x  x.f
i i
Dm 
80
 1,86
Dm  i 1
43
f i

3. Tabela 4.2.2. Notas da atividade 1, dos acadêmicos da Turma A


Notas Acadêmi xi xi f i xi  6,51 xi  6,51 f i
cos
3,8 ├ 5 4,3 21,5 2,21 11,05
4,8
4,8 ├ 6 5,3 31,8 1,21 7,26
5,8
5,8 ├ 12 6,3 75,6 0,21 2,52
6,8
6,8 ├ 15 7,3 109,5 0,79 11,85
7,8
7,8 ├ 5 8,3 41,5 1,79 8,95
8,8
total 43 279,9 41,63

Para o cálculo do Dm, precisamos dos valores de xi , da média, dos


módulos dos desvios e do produto dos desvios pela frequência, em seguida
é só aplicarmos a fórmula:
279,9
x  6,51
43
k

 x  x.f
i i
Dm 
41,63
 0,97
Dm  i 1
43
f i

4.3 Variância (Símbolo: S2)

Vimos que a Amplitude total e o Desvio Médio são medidas que se


deixam influenciar pelos valores extremos, que em grande maioria são
devidos ao acaso.
A variância é uma medida que leva em consideração valores
extremos e os valores intermediários, isto é, expressa melhor os resultados
obtidos. A variância relaciona os desvios em torno da média, ou mais
claramente, é a média aritmética dos quadrados dos desvios.

Variância de uma população:


 x  x 
2
d i2
S  2 i

n n

Sendo:
S 2 = variância
x = valor da média aritmética
di =  xi  x 
n =  fi

Observação: É mais comum na estatística o trabalho com amostra e não


com a população. Neste caso o denominador passa a ser (n - 1) em vez de
n, pois assim teremos uma melhora na estimativa do parâmetro da
população:

Variância de uma amostra:

 x  x d
2 2

S  2 i
 i

n 1 n 1

4.4 Desvio-padrão (Símbolo: S)

O desvio-padrão é a medida de dispersão mais usada, tendo em


comum com o desvio médio o fato de em ambos serem considerados os
desvios com relação à média ( x ). Só que, no cálculo do desvio-padrão, em
lugar de serem usados os valores absolutos das discrepâncias ou desvios,
calculam-se os quadrados desses. O desvio-padrão não é senão uma média
quadrática dos desvios em relação à média aritmética de um conjunto de
números, ou seja, é a raiz quadrada da média aritmética dos quadrados dos
desvios, tomados a partir da média aritmética.

4.4.1 Desvio-padrão de Dados Brutos

Seja o seguinte conjunto de números: X = {x1, x2,... xn}. O desvio-


padrão ou a média quadrática dos desvios ou afastamento em relação à
média aritmética desse conjunto será definido por:
n n

d 2 i  x  x
2
i
S i 1
 i 1

n n

ou resumidamente: S  (x i x)2


n
Exemplo: Calcular o desvio padrão do conjunto de números A1,3,5,7
Vamos utilizar uma tabela para o cálculo do desvio padrão. Iniciamos
calculando o valor da média.
1 3  5  7
x  4 x  4
4
Tabela 4.8. Cálculo do Desvio Padrão
xi  xi  4  2
1 (1 - 4)2 = 9
3 (3 - 4)2 = 1
5 (5 - 4)2 = 1
7 (7 - 4)2 = 9
 (x i
 4) 2  20

Aplicando a fórmula do desvio padrão temos:


20
S  5  S  2,24
4

Observação: quando o desvio-padrão representar uma descrição da


amostra e não da população, caso mais freqüente em estatística, o
denominador das expressões será igual a n - 1, em vez de n. A razão desse
procedimento reside no fato de que, utilizando o divisor (n - 1), obtém-se
uma estimativa melhor do parâmetro de população. Além do mais, apenas
n - 1 das discrepâncias (xi - x) são independentes, uma vez que essas (n -
1) discrepâncias determinam automaticamente a n-ésima. Para valores
grandes de n (n > 30) não há grande diferença entre os resultados
proporcionados pela utilização de qualquer dos dois divisores, n ou n - 1.
Entretanto, daremos preferência para a fórmula que proporciona uma
estimativa mais justa do desvio-padrão da população, ou seja:

n n

d 2 i  x  x
2
i
S i 1
 i 1

n 1 n 1

4.4.2 Desvio-padrão de Dados Tabulados sem Intervalo de Classe

Quando os valores vierem dispostos em uma tabela de frequências, o


cálculo do desvio-padrão se fará através de uma das seguintes fórmulas:

Desvio padrão para dados populacionais

k k

 d i2 f i  x  x fi
2
i
S i 1
 i 1

n n
Desvios padrão para dados amostrais

k k

 d i2 f i   x  x
2
i
fi
S i 1
 i 1

n 1 n 1
xi = valor isolado da variável, ou ponto médio da classe, se os valores
vierem agrupados em classe.

Exemplo: Calcular o desvio padrão da tabela 4.9

Tabela 4.9 Número de faltas/mês dos funcionários da empresa Agro Sul / 08


N° de faltas / mês f xi f i
0 4 0
1 3 3
2 2 4
3 1 3
4 1 4
5 2 10
6 1 6
7 1 7
* pesquisa f  15 x i f i  37
populacional

Inicialmente calculamos a média  x 


x f i i

37
 2,47 faltas / mês
f 15

Em seguida, inserimos mais uma coluna na tabela 4.9 onde vamos fazer os
cálculos necessários para o cálculo do desvio padrão:

Tabela 4.10 Número de faltas/mês dos funcionários da empresa Agro Sul / 08


N° de faltas / mês f xi f i ( xi  2,47) 2 f i
0 4 0 ( 0 - 2,47 )2. ( 4 ) =
24,40
1 3 3 ( 1 - 2,47 )2. ( 3 ) =
6,48
2 2 4 ( 2 - 2,47 )2. ( 2 ) =
0,44
3 1 3 ( 3 - 2,47 )2. ( 1 ) =
0,28
4 1 4 ( 4 - 2,47 )2. ( 1 ) =
2,34
5 2 10 ( 5 - 2,47 )2.( 2 ) =
12,80
6 1 6 ( 6 - 2,47 )2.( 1 ) =
12,46
7 1 7 ( 7 - 2,47 )2.( 1 ) =
20,52
* pesquisa f  15 x i f i  37 79,72
populacional

SP 
 (x  x)
i
2

 SP 
79,72
 5,31  2,3  S P  2,3
f 15

Exemplo: Foi realizada uma pesquisa amostral para conhecer o número de


filhos dos funcionários da Empresa Coisas & Tal. Determine o desvio
padrão da quantidade de filhos.
Tabela 4.11 Número de filhos/funcionários da empresa Cisas & Tal /08
N° de filhos f xi f i ( xi  x ) 2 f i
/func
0 3 0
1 5 5
2 2 4
3 1 3
4 1 4
5 1 5
6 1 6
14 27

Inicialmente calculamos a média  x 


x fi i

27
 1,93 filhos / func
f 14
Em seguida, vamos completar na tabela, na próxima coluna com os desvios
ao quadrado, multiplicado pela frequência, obtendo assim a soma total
para aplicarmos na fórmula.

Tabela 4.12 Número de filhos/funcionários da empresa Coisas & Tal /08


N° de filhos /func f xi f i ( xi  1,93) 2 f i
0 3 0 ( 0 – 1,93 )2. ( 3 ) =
11,17
1 5 5 ( 1 – 1,93 )2. ( 5 ) =
4,32
2 2 4 ( 2 – 1,93 )2. ( 2 ) =
0,01
3 1 3 ( 3– 1,93 )2. ( 1 ) =
1,15
4 1 4 ( 4 – 1,93 )2. ( 1 ) =
4,28
5 1 5 ( 5 – 1,93 )2. ( 1 ) =
9,42
6 1 6 ( 6 – 1,93 )2. ( 1 ) =
16,56
* pesquisa 14 27 46,91
amostral

SA 
 (x  x)
i
2

 SA 
46,91

46,91
 3,61  1,9  S A  1,9
 f 1 14  1 13

4.4.3 Desvio padrão de Dados Tabulados com Intervalo de Classes

Quando tivermos que calcular o desvio padrão para tabelas de dados


tabulados com intervalos de classes usaremos as mesmas fórmulas para
dados sem intervalos de classes, utilizando para xi os pontos médios de
cada classe, seguindo com os mesmos procedimentos.
Exwmplo: Com dados da tabela a seguir, calcule o desvio-padrão da
distribuição de frequências do consumo de energia elétrica (Kwh) :

Tabela 4.13 Distribuição de freqüências do consumo de energia


elétrica
Número xi xi f i ( xi  79,5) ( xi  79,5) 2 ( x i 79,5) 2 f i
Consum de
o usuários
fi
5 ├ 25 4 15 60 - 64,5 4160,25 16641,0
25├ 45 6 35 210 - 44,5 1980,25 11881,5
45├ 65 14 55 770 - 24,5 600,25 8403,5
65├ 85 26 75 1950 - 4,5 20,25 526,5
85├ 105 14 95 1330 15,5 240,25 3363,5
105├ 8 11 920 35,5 1260,25 10082,0
125 5
125├ 6 13 810 55,5 3080,25 18481,5
145 5
145├ 2 15 310 75,5 5700,25 11400,5
165 5
 6360 80780

A média aritmética do consumo já foi calculada anteriormente:

x
x i fi

6360
 79,5
n 80

Cálculo do Desvio-padrão pela Fórmula Original :

x  x  79,5 f j


k 2 8

j  x
2
fj j
80780
S j 1
 j 1
  1022,53  S  31,98
n 1 80  1 79

O desvio-padrão do consumo de energia elétrica é 31,98 Kwh.


Lembre-se que o desvio médio já foi calculado, resultando em D m = 24,63
Kwh.

Pratique resolvendo mais alguns exemplos: Determine o desvio padrão


em cada um dos casos, pela média.

1. A 12, 15, 25, 32, 18, 19

Para facilitar vamos colocar os valores em uma tabela:

xi xi  25,25 xi  25,25
2

12 13,25 175,5625
15 10,25 105,0625
18 7,25 52,5625
19 6,25 39,0625
25 0,25 0,0625
32 6,75 45,5625
  202 44 417,875

Para o cálculo do desvio padrão precisamos elevar ao quadrado os desvios


em relação á média
SP 
 (x  x)
i
2

 SP 
417,88
 9,5  3,08  S P  3,08
f 44

2. Tabela 4.2.1 Número de faltas dos acadêmicos da Turma A


Falta Acadêmic xi f i xi  4 xi  4
2 2
xi  4 f i
s os
2 15 30 2 4 60
3 10 30 1 1 10
5 8 40 1 1 8
6 6 36 2 4 24
9 4 36 5 25 100
total 43 172 202

Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos


módulos dos desvios multiplicado pela frequência, em seguida é só
aplicarmos a fórmula:

 x  x  4 f j
k 2 8
 x fj
2

j 1
j
j 1
j
202
S    4,81  S  2,19
n 1 43  1 42

3. Tabela 4.2.2. Notas da atividade 1, dos acadêmicos da Turma A


Notas Acadêmi xi xi f i xi  6,51 2
xi  6,51 f i
cos
3,8 ├ 5 4,3 21,5 2,21 24,4205
4,8
4,8 ├ 6 5,3 31,8 1,21 8,7846
5,8
5,8 ├ 12 6,3 75,6 0,21 0,5292
6,8
6,8 ├ 15 7,3 109,5 0,79 9,3615
7,8
7,8 ├ 5 8,3 41,5 1,79 16,0205
8,8
total 43 279,9 59,1163

Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos


módulos dos desvios multiplicado pela frequência, em seguida é só
aplicarmos a fórmula:

 x  x  6,51 f j
k 2 8
 x fj
2

j 1
j
j 1
j
59,12
S    1,41  S  1,19
n 1 43  1 42

4.5 Interpretação do desvio padrão


Neste item vamos apresentar duas regras para interpretação do desvio
padrão:

1ª) Regra Empírica


Para qualquer distribuição amostral com média x e desvio padrão S, tem-
se:
 O intervalo  x  S, x  S contém entre 60% e 80% de todas as
observações amostrais. A porcentagem aproxima-se de 70% para
distribuições fortemente simétricas, chegando a 90% para
distribuições fortemente assimétricas.
 O intervalo  x  2S , x  2S  contém aproximadamente 95% das
observações amostrais para distribuições simétricas e
aproximadamente 100% para distribuições com assimetria elevada.
 O intervalo  x  3S, x  3S  contém aproximadamente 100% das
observações amostrais, para distribuições simétricas.

2º) Teorema de Tchebychef


Para qualquer distribuição amostral com media x e desvio padrão S,
tem-se:
 O intervalo  x  2S , x  2 S  contém, no mínimo, 75% de todas as
observações amostrais.
 O intervalo  x  3S, x  3S  contém, no mínimo, 89% de todas as
observações amostrais.

Observação: O intervalo padrão é definido por um conjunto de valores (ou


uma região) em torno da média aritmética, contidos num intervalo de
amplitude “2S ” (duas vezes o desvio-padrão), ou seja, -S (antes da média) e
+S (depois da média). Conforme estudos matemáticos, essa região engloba
68,26% dos valores da série ou dos dados pesquisados.

Gráfico da zona de Normalidade pg 80 da apostila atual


Exemplo: O restaurante “Sabor em kilo” fez um levantamento para saber o
consumo médio e obteve média de 580 g e o desvio padrão de 210 g,
calcule:

a) a amplitude de intervalo da zona de normalidade;


b) a amplitude dos 95% centrais.

Solução:
a) Zona de normalidade: de ( x  S ) até ( x  S )
Sendo x = 580 g e S = 210 g calcula-se o intervalo:
( x  S ) = 580 - 210 = 370 g
( x  S ) = 580 + 210 = 790 g

Assim, a zona de normalidade é de 370 g até 790 g. Isso representa que


68% dos clientes do restaurante consomem entre 370 g e 790 g.
b) amplitude dos 95% centrais: ( x  2 S ) de até ( x  2 S )
( x  2 S ) = 580 – 2.(210) = 160 g
( x  2S ) = 580 + 2.(210) = 1000 g

Assim, a amplitude dos 95% centrais é de 160 g até 1000. Essa amplitude
indica que 95% dos clientes consomem entre 160 g e 1000 g.

4.6 Intervalo Padrão ou Zona de Normalidade

Como pudemos estudar no item 4.5 sobre a interpretação do Desvio


Padrão, o Intervalo Padrão ou Zona de Normalidade engloba cerca de 68%
da pesquisa realizada. Em muitos casos utilizamos o intervalo padrão para
especificar com maior precisão o que realmente pode ser considerado
padrão. Observamos esse fato nos exames de sangue que realizamos para
saber se estamos dentro do padrão. Temos sempre um valor mínimo e um
valor máximo na normalidade. Isso é facilmente percebido para vários
fenômenos cotidianos

Exemplo: Consideremos o exemplo: Número de faltas por mês dos


funcionários da Empresa Coisas & tal agosto/08
Média calculada  x  2 faltas / func.
Desvio padrão  S P  2 faltas / func.
Para calcular o Intervalo padrão ou número padrão de faltas / mês dos
funcionários usamos a fórmula:
 x S P
; x  S P    2  2; 2  2    0; 4
Portanto, o número padrão de faltas por funcionários da Empresa
Coisas&Tal é de 0 a 4.

Exemplo: Consideremos o exemplo: Número de filhos dos funcionários da


Empresa Total/08

Média calculada  x  2 filhos / func.


Desvio padrão  S P  3 filhos / func.
Para calcular o Intervalo padrão ou número padrão de faltas / mês dos
funcionários usamos a fórmula:
 x S P
; x  S P    2  3; 2  3   0; 5
Portanto, o número padrão de filhos por funcionários da Empresa
Coisas&Tal é de 0 a 5.

4.7 Coeficiente de Variação de Pearson

O desvio-padrão por si só não revela muita coisa. Assim, um desvio


padrão pode ser considerado pequeno para uma média e para outra é
extremamente grande. Por exemplo, um desvio-padrão de 40 pode ser
considerado pequeno para uma média de 35, entretanto, se a média for 4,
este se torna muito grande.
Quando precisamos comparar duas ou mais séries de valores quanto
à sua dispersão e variabilidade e esses conjuntos estão expressos em
grandezas diferentes é preciso dispor de outra medida. Para contornar
essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados de maneira relativa ao seu valor médio. Essa
medida que mede o grau de concentração dos valores em torno da média é
denominada de Coeficiente de Variação.
S
C.V .   100 onde S = desvio-padrão amostral e x = média
x
amostral
Podemos realizar interpretações do coeficiente de variação através de
algumas regras empíricas:

Se: C.V < 15% tem-se baixa dispersão


Se: 15% < C.V. < 30% tem-se média dispersão
Se: C.V > 30% tem-se elevada dispersão

Podemos classificar as distribuições em homogêneas ou heterogêneas da


seguinte forma:
Distribuição homogênea: tem coeficiente da variação com baixa ou média
dispersão (até 30% de variação)
Distribuição heterogênea: tem coeficiente da variação com elevada
dispersão (acima de 30% de variação)

Exemplo . Na Empresa Carrefour, o salário médio dos homens é de R$


1500,00 com desvio-padrão de R$ 650,00 e o salário médio das mulheres é
de R$ 1200,00 com desvio padrão de 580,00. A dispersão relativa dos
salários é maior para os homens?
Solução: Homens: x H  1500 e S H  650
Mulheres x M  1200 e S M  580

SH 650
Para os homens: C.V .   100   43,3%
xH 1500

SM 580
Para as mulheres: C.V .   100   48,3%
xM 1200
Os Salários das mulheres têm dispersão relativa maior que os
salários dos homens. As duas distribuições apresentam alta dispersão (C.V.
> 30%).

LISTA DE EXERCÍCIOS 4.1 DA APOSTILA ATUAL

ATIVIDADE 4.1 DA APOSTILA ATUAL

Você também pode gostar