Escolar Documentos
Profissional Documentos
Cultura Documentos
OBJETIVO DA UNIDADE:
Grupo A: - 5 5 5 5 5
Grupo B: - 3 4 5 6 7
Grupo C: - 1 2 5 7 10
Para representar cada grupo, podemos calcular a média e vamos verificar que os três
grupos têm a mesma média x = 5, entretanto observando a variação dos dados podemos
perceber que os grupos se comportam de forma diferente, apesar de todos terem a mesma
média. Nesse caso, a média ainda que considerada como um número que pode representar uma
seqüência de números, não pode destacar o grau de homogeneidade ou heterogeneidade que
existe entre os valores que compõem o conjunto. Desse modo, precisamos efetuar outros
procedimentos matemáticos para caracterizar melhor os dados de cada grupo com o objetivo de
tirarmos conclusões qualitativas.
As medidas que mostram a variação dos dados de um conjunto são chamadas de
Medidas de Dispersão ou Variabilidade:
AT x Max xMin
Primeiro Método: AT = Ponto médio da última classe - ponto médio da primeira classe.
Segundo Método: AT = Limite superior da última classe - limite inferior da primeira classe.
Embora a amplitude total seja a mais simples das medidas de dispersão, há uma forte
restrição ao seu uso em virtude de sua grande instabilidade, uma vez que ela leva em conta
apenas os valores extremos da série. Comparemos os conjuntos A e B do exemplo 1:
Tabela 4.2
Conjunto Média Amplitude Total: A t
A média aritmética de cada um desses conjuntos é igual a 20. Portanto, no que diz
respeito a uma medida de posição, ambos os conjuntos podem ser considerados idênticos. Ao
calcularmos a amplitude total, verificaremos que os valores do conjunto A apresentam maior
dispersão. Todavia, no cálculo da amplitude total não são levados em consideração os valores
da série que se encontram entre os extremos, o que poderia conduzir o analista a interpretações
equivocadas. Muitas vezes, um valor particularmente anormal poderá afetar de maneira
acentuada a medida. O conjunto A, por exemplo, apresenta o último valor (45) sensivelmente
distante do penúltimo (25), fato que talvez tenha provocado uma amplitude total de tal
magnitude (35).
Além da insensibilidade aos valores entre os extremos anormais, a amplitude total é
sensível ao tamanho de amostra. Ao aumentar essa última, a amplitude total tende a aumentar,
ainda que não proporcionalmente. Finalmente, a amplitude total apresenta muita variação de
uma amostra para outra, mesmo que ambas sejam extraídas da mesma população.
Apesar dos inconvenientes dessa medida, os quais não justificam, na maioria das vezes,
seu uso, há situações especiais em que ela resulta satisfatória. É o caso, por exemplo, da
amplitude da temperatura em um dia ou no ano. Outra situação seria aquela em que os dados
são raros ou demasiadamente esparsos para justificar o emprego de uma medida mais precisa.
É importante acrescentar que, ao descrever uma série por uma medida de posição
(média, por exemplo) e de dispersão, se essa última for a amplitude total, é recomendável que se
indiquem os valores extremos da série.
Pratique resolvendo mais alguns exemplos: Determine a amplitude total em cada um dos casos.
AT 9 2 7 AT 7
O desvio médio ou média dos desvios é igual à média aritmética dos valores absolutos
dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou
mediana.
4.2.1 Desvio Médio para Dados Brutos
Quando os valores não vierem dispostos em uma tabela de freqüências, o desvio médio
será calculado, de acordo com a definição, através do emprego de uma das seguintes fórmulas:
x i x
(1) desvio em relação à média aritmética.
Dm i 1
f i
k
x i xmd
(2) desvio em relação à mediana.
Dm i 1
f i
As barras verticais indicam que são tomados os valores absolutos dos desvios.
10 12 13 20 25 34 45 159
xA 22,71 e xmdA 20
7 7
17 18 19 20 21 22 23 140
xB 20 e xmdB 20
7 7
x i - 22,71
71,71 Dm= 10,24
Dm i 1
10,24
7 7
Pela Mediana
x i 20
69 Dm = 9,86
Dm i 1
9,86
7 7
Neste caso, o desvio médio é igual, tanto quando calculado a partir da média como da
mediana, uma vez que x xmd 20
Pela Média
Dm =
x i - 20
12
i 1
1,71 Dm = 1,71
7 7
Pela Mediana
7
Dm =
x i - 20
12
i 1
1,71
7 7
Pela Média
f i
Onde X j representa um valor individual ou um ponto médio da classe.
f i
Exemplo: Calcular o desvio médio dos valores representativos do consumo de energia elétrica
(em Kwh) de 80 usuários.
80
=6360 1970 1926,2
Observações:
1. O desvio médio apresenta resultado mais vantajoso que as medidas de dispersão precedentes,
principalmente pelo fato de, em seu cálculo, levar em consideração todos os valores da
distribuição.
2. O desvio médio, calculado levando-se em consideração os desvios em torno da mediana, é
mínimo, ou seja, é menor do que qualquer desvio médio calculado com base em qualquer outra
medida de tendência central.
3. Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra não é tão
freqüentemente empregado como o desvio-padrão, o qual será estudado a seguir, pois este se
adapta melhor a uma ampla gama de aplicações. Além disso, o desvio médio não considera o
fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se
fossem todos positivos, como valores absolutos. Contudo, será preferível o uso do desvio médio
em lugar do desvio-padrão, quando esse for indevidamente influenciado pelos desvios extremos.
Pratique resolvendo mais alguns exemplos: Determine o desvio médio em cada um dos casos,
pela média.
xi xi 25,25
12 13,25
15 10,25
18 7,25
19 6,25
25 0,25
32 6,75
202 44
44
Dm 7,33
6
Para o cálculo do Dm, precisamos da média, dos módulos dos desvios e do produto dos desvios
pela frequência, em seguida é só aplicarmos a fórmula:
x x.fi i
Dm
80
1,86
Dm i 1
43
f i
Para o cálculo do Dm, precisamos dos valores de xi , da média, dos módulos dos desvios e do
produto dos desvios pela frequência, em seguida é só aplicarmos a fórmula:
279,9
x 6,51
43
k
x x.fi i
Dm
41,63
0,97
Dm i 1
43
f i
Vimos que a Amplitude total e o Desvio Médio são medidas que se deixam influenciar
pelos valores extremos, que em grande maioria são devidos ao acaso.
A variância é uma medida que leva em consideração valores extremos e os valores
intermediários, isto é, expressa melhor os resultados obtidos. A variância relaciona os desvios
em torno da média, ou mais claramente, é a média aritmética dos quadrados dos desvios.
x x
2
d i2
S
2 i
n n
Sendo:
S 2 = variância
x = valor da média aritmética
di = xi x
n = fi
Observação: É mais comum na estatística o trabalho com amostra e não com a população.
Neste caso o denominador passa a ser (n - 1) em vez de n, pois assim teremos uma melhora na
estimativa do parâmetro da população:
x x d
2 2
S2 i
i
n 1 n 1
d x x
2 2
i i
S i 1
i 1
n n
ou resumidamente: S (x i
x)2
n
Exemplo: Calcular o desvio padrão do conjunto de números A1,3,5,7
Vamos utilizar uma tabela para o cálculo do desvio padrão. Iniciamos calculando o valor da
média.
1 3 5 7
x 4 x 4
4
Tabela 4.8. Cálculo do Desvio Padrão
xi x i 4
2
1 (1 - 4)2 = 9
3 (3 - 4)2 = 1
5 (5 - 4)2 = 1
7 (7 - 4)2 = 9
(x i
4) 2 20
n n
d x x
2 2
i i
S i 1
i 1
n 1 n 1
k k
d i2 f i x x fi
2
i
S i 1
i 1
n n
Desvios padrão para dados amostrais
k k
d i2 f i x x
2
i
fi
S i 1
i 1
n 1 n 1
xi = valor isolado da variável, ou ponto médio da classe, se os valores vierem agrupados em
classe.
Em seguida, inserimos mais uma coluna na tabela 4.9 onde vamos fazer os cálculos necessários
para o cálculo do desvio padrão:
SP (x x)
i
2
SP
79,72
5,31 2,3 S P 2,3
f 15
Exemplo: Foi realizada uma pesquisa amostral para conhecer o número de filhos dos
funcionários da Empresa Coisas & Tal. Determine o desvio padrão da quantidade de filhos.
Tabela 4.11 Número de filhos/funcionários da empresa Cisas & Tal /08
N° de filhos /func f xi f i ( xi x ) 2 f i
0 3 0
1 5 5
2 2 4
3 1 3
4 1 4
5 1 5
6 1 6
14 27
SA
(x x) i
2
SA
46,91
46,91
3,61 1,9 S A 1,9
f 1 14 1 13
Quando tivermos que calcular o desvio padrão para tabelas de dados tabulados com intervalos
de classes usaremos as mesmas fórmulas para dados sem intervalos de classes, utilizando para
xi os pontos médios de cada classe, seguindo com os mesmos procedimentos.
Exwmplo: Com dados da tabela a seguir, calcule o desvio-padrão da distribuição de frequências
do consumo de energia elétrica (Kwh) :
x
x i
fi
6360
79,5
n 80
j x
2
fj j
80780
S j 1
j 1
1022,53 S 31,98
n 1 80 1 79
O desvio-padrão do consumo de energia elétrica é 31,98 Kwh. Lembre-se que o desvio
médio já foi calculado, resultando em Dm = 24,63 Kwh.
Pratique resolvendo mais alguns exemplos: Determine o desvio padrão em cada um dos
casos, pela média.
xi xi 25,25 xi 25,25
2
12 13,25 175,5625
15 10,25 105,0625
18 7,25 52,5625
19 6,25 39,0625
25 0,25 0,0625
32 6,75 45,5625
202 44 417,875
Para o cálculo do desvio padrão precisamos elevar ao quadrado os desvios em relação á média
SP
(x x) i
2
SP
417,88
9,5 3,08 S P 3,08
f 44
Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos módulos dos desvios
multiplicado pela frequência, em seguida é só aplicarmos a fórmula:
x x 4 f j
k 2 8
x fj
2
j 1
j
j 1
j
202
S 4,81 S 2,19
n 1 43 1 42
Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos módulos dos desvios
multiplicado pela frequência, em seguida é só aplicarmos a fórmula:
Neste item vamos apresentar duas regras para interpretação do desvio padrão:
Observação: O intervalo padrão é definido por um conjunto de valores (ou uma região) em
torno da média aritmética, contidos num intervalo de amplitude “2S ” (duas vezes o desvio-
padrão), ou seja, -S (antes da média) e +S (depois da média). Conforme estudos matemáticos,
essa região engloba 68,26% dos valores da série ou dos dados pesquisados.
Assim, a zona de normalidade é de 370 g até 790 g. Isso representa que 68% dos clientes do
restaurante consomem entre 370 g e 790 g.
b) amplitude dos 95% centrais: ( x 2 S ) de até ( x 2 S )
Assim, a amplitude dos 95% centrais é de 160 g até 1000. Essa amplitude indica que 95% dos
clientes consomem entre 160 g e 1000 g.
Como pudemos estudar no item 4.5 sobre a interpretação do Desvio Padrão, o Intervalo Padrão
ou Zona de Normalidade engloba cerca de 68% da pesquisa realizada. Em muitos casos
utilizamos o intervalo padrão para especificar com maior precisão o que realmente pode ser
considerado padrão. Observamos esse fato nos exames de sangue que realizamos para saber se
estamos dentro do padrão. Temos sempre um valor mínimo e um valor máximo na normalidade.
Isso é facilmente percebido para vários fenômenos cotidianos
Exemplo: Consideremos o exemplo: Número de faltas por mês dos funcionários da Empresa
Coisas & tal agosto/08
Média calculada x 2 faltas / func.
Desvio padrão S P 2 faltas / func.
Para calcular o Intervalo padrão ou número padrão de faltas / mês dos funcionários usamos a
fórmula:
x S P ; x S P 2 2; 2 2 0; 4
Portanto, o número padrão de faltas por funcionários da Empresa Coisas&Tal é de 0 a 4.
O desvio-padrão por si só não revela muita coisa. Assim, um desvio padrão pode ser
considerado pequeno para uma média e para outra é extremamente grande. Por exemplo, um
desvio-padrão de 40 pode ser considerado pequeno para uma média de 35, entretanto, se a
média for 4, este se torna muito grande.
Quando precisamos comparar duas ou mais séries de valores quanto à sua dispersão e
variabilidade e esses conjuntos estão expressos em grandezas diferentes é preciso dispor de
outra medida. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão
ou variabilidade dos dados de maneira relativa ao seu valor médio. Essa medida que mede o
grau de concentração dos valores em torno da média é denominada de Coeficiente de Variação.
S
C.V . 100 onde S = desvio-padrão amostral e x = média amostral
x
Podemos realizar interpretações do coeficiente de variação através de algumas regras empíricas:
Exemplo . Na Empresa Carrefour, o salário médio dos homens é de R$ 1500,00 com desvio-
padrão de R$ 650,00 e o salário médio das mulheres é de R$ 1200,00 com desvio padrão de
580,00. A dispersão relativa dos salários é maior para os homens?
Solução: Homens: x H 1500 e S H 650
Mulheres x M 1200 e S M 580
SH 650
Para os homens: C.V . 100 43,3%
xH 1500
SM 580
Para as mulheres: C.V . 100 48,3%
xM 1200
Os Salários das mulheres têm dispersão relativa maior que os salários dos homens. As
duas distribuições apresentam alta dispersão (C.V. > 30%).