Escolar Documentos
Profissional Documentos
Cultura Documentos
Já estudamos que um conjunto de valores pode ser sintetizado por meio de procedimento
matemático, como o cálculo da média, moda, mediana, quartis e percentis. No entanto, a
interpretação de dados estatísticos exige que se realize um número maior de estudos, além dos
estudados nas unidades precedentes. Torna-se necessário ter uma idéia de como se apresentam os
dados, qual a variação em torno da média, qual a concentração. Vejamos o seguinte exemplo:
Foram avaliados três grupos de executivos, cada um com cinco elementos, no que se refere
à criatividade e os testes mostraram os seguintes resultados:
Grupo A: - 5 5 5 5 5
Grupo B: - 3 4 5 6 7
Grupo C: - 1 2 5 7 10
Para representar cada grupo, podemos calcular a média e vamos verificar que os três
grupos têm a mesma média x = 5, entretanto observando a variação dos dados podemos perceber
que os grupos se comportam de forma diferente, apesar de todos terem a mesma média. Nesse
caso, a média ainda que considerada como um número que pode representar uma seqüência de
números, não pode destacar o grau de homogeneidade ou heterogeneidade que existe entre os
valores que compõem o conjunto. Desse modo, precisamos efetuar outros procedimentos
matemáticos para caracterizar melhor os dados de cada grupo com o objetivo de tirarmos
conclusões qualitativas.
As medidas que mostram a variação dos dados de um conjunto são chamadas de Medidas
de Dispersão ou Variabilidade:
AT = xMax − xMin
Primeiro Método: AT = Ponto médio da última classe - ponto médio da primeira classe.
Segundo Método: AT = Limite superior da última classe - limite inferior da primeira classe.
Embora a amplitude total seja a mais simples das medidas de dispersão, há uma forte
restrição ao seu uso em virtude de sua grande instabilidade, uma vez que ela leva em conta apenas
os valores extremos da série. Comparemos os conjuntos A e B do exemplo 1:
Tabela 4.2
Conjunto Média Amplitude Total: A t
A = {10, 12, 13, 15, 20, 25, 45} x = 20 AT A = 35
B = {17, 18, 19, 20, 21, 22, 23} x = 20 AT B =6
A média aritmética de cada um desses conjuntos é igual a 20. Portanto, no que diz respeito
a uma medida de posição, ambos os conjuntos podem ser considerados idênticos. Ao calcularmos a
amplitude total, verificaremos que os valores do conjunto A apresentam maior dispersão. Todavia,
no cálculo da amplitude total não são levados em consideração os valores da série que se encontram
entre os extremos, o que poderia conduzir o analista a interpretações equivocadas. Muitas vezes,
um valor particularmente anormal poderá afetar de maneira acentuada a medida. O conjunto A, por
exemplo, apresenta o último valor (45) sensivelmente distante do penúltimo (25), fato que talvez
tenha provocado uma amplitude total de tal magnitude (35).
Além da insensibilidade aos valores entre os extremos anormais, a amplitude total é
sensível ao tamanho de amostra. Ao aumentar essa última, a amplitude total tende a aumentar,
ainda que não proporcionalmente. Finalmente, a amplitude total apresenta muita variação de uma
amostra para outra, mesmo que ambas sejam extraídas da mesma população.
Apesar dos inconvenientes dessa medida, os quais não justificam, na maioria das vezes, seu
uso, há situações especiais em que ela resulta satisfatória. É o caso, por exemplo, da amplitude da
temperatura em um dia ou no ano. Outra situação seria aquela em que os dados são raros ou
demasiadamente esparsos para justificar o emprego de uma medida mais precisa.
É importante acrescentar que, ao descrever uma série por uma medida de posição (média,
por exemplo) e de dispersão, se essa última for a amplitude total, é recomendável que se indiquem
os valores extremos da série.
Pratique resolvendo mais alguns exemplos: Determine a amplitude total em cada um dos casos.
AT = 9 − 2 = 7 AT = 7
O desvio médio ou média dos desvios é igual à média aritmética dos valores absolutos dos
desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana.
Quando os valores não vierem dispostos em uma tabela de freqüências, o desvio médio
será calculado, de acordo com a definição, através do emprego de uma das seguintes fórmulas:
x i −x
Dm = i =1
(1) desvio em relação à média aritmética.
fi
k
x i − xmd
Dm = i =1 (2) desvio em relação à mediana.
f i
As barras verticais indicam que são tomados os valores absolutos dos desvios.
xA =
10 + 12 + 13 + 20 + 25 + 34 + 45 159
= = 22,71
e xmdA = 20
7 7
xB =
17 + 18 + 19 + 20 + 21 + 22 + 23 140
= = 20
e xmdB = 20
7 7
= 61,71 = 69
x i - 22,71
71,71 Dm= 10,24
Dm = i =1
= = 10,24
7 7
Pela Mediana
Dm = 9,86
x i − 20
69
Dm = i =1
= = 9,86
7 7
b) Desvio Médio do Conjunto B: onde temos x = 20 e xmd = 20
Tabela 4.4 - Elementos do Conjunto B
xi ( xi − x ) xi − x ( xi − xmd ) xi − xmd
17 17 – 20 = -3 3 17 – 20 = -3 3
18 18 – 20 = -2 2 18 – 20 = -2 2
19 19 – 20 = -1 1 19 – 20 = -1 1
20 20 – 20 = 0 0 20 – 20 = 0 0
21 21 – 20 = 1 1 21 – 20 = 1 1
22 22 – 20 = 2 2 22 – 20 = 2 2
23 23 – 20 = 3 3 23 – 20 = 3 3
x i − x = 12 x i − xmd = 12
Neste caso, o desvio médio é igual, tanto quando calculado a partir da média como da
mediana, uma vez que x = xmd = 20
Pela Média
7
Dm =
x i - 20
12
i =1
= = 1,71
Dm = 1,71 7 7
Pela Mediana
7
x i - 20
12
Dm = i =1
= = 1,71
7 7
Pela Média
Dm =
x i − (-0,2) 16,8 Dm = 3,36
= = 3,36
5 5
Pela Mediana
xi − (-2) 15
Dm = = =3 Dm = 3
5 5
Como ocorreu para o primeiro conjunto, o desvio médio neste caso é menor quando
tomado em relação à mediana do que em relação à média.
2.2.2 Desvio Médio para Dados Tabulados sem Intervalo de Classe
xi − x . f i
Cálculo pela Média Dm = i =1
fi
Onde X j representa um valor individual ou um ponto médio da classe.
x i − xmd . f i
Cálculo pela Mediana Dm = i =1
f i
Exemplo: Calcular o desvio médio dos valores representativos do consumo de energia elétrica (em
Kwh) de 80 usuários.
Tabela 2.7 - Consumo de energia elétrica de consumidores de Campo Grande/MS/06
80
=6360 1970 = 1926,2
x −79,5 f i i
1970
Cálculo pela média: Dm = i =1
= Dm = 24,63Kwh
80 80
8
x −77,31 f i i
1926,2
Cálculo pela mediana: Dm = i =1
= Dm = 24,08 Kwh
80 80
Podemos observar novamente que o desvio médio, calculado com base na mediana, é
menor que o calculado com base na média aritmética.
Observações:
1. O desvio médio apresenta resultado mais vantajoso que as medidas de dispersão precedentes,
principalmente pelo fato de, em seu cálculo, levar em consideração todos os valores da distribuição.
2. O desvio médio, calculado levando-se em consideração os desvios em torno da mediana, é
mínimo, ou seja, é menor do que qualquer desvio médio calculado com base em qualquer outra
medida de tendência central.
3. Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra não é tão
freqüentemente empregado como o desvio-padrão, o qual será estudado a seguir, pois este se
adapta melhor a uma ampla gama de aplicações. Além disso, o desvio médio não considera o fato
de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem
todos positivos, como valores absolutos. Contudo, será preferível o uso do desvio médio em lugar
do desvio-padrão, quando esse for indevidamente influenciado pelos desvios extremos.
Pratique resolvendo mais alguns exemplos: Determine o desvio médio em cada um dos casos,
pela média.
12 13,25
15 10,25
18 7,25
19 6,25
25 0,25
32 6,75
= 202 44
44
Dm = = 7,33
6
Para o cálculo do Dm, precisamos da média, dos módulos dos desvios e do produto dos desvios
pela frequência, em seguida é só aplicarmos a fórmula:
k
xi − x . f i
80
Dm = i =1
Dm = = 1,86
fi 43
Para o cálculo do Dm, precisamos dos valores de xi , da média, dos módulos dos desvios e do
produto dos desvios pela frequência, em seguida é só aplicarmos a fórmula:
279,9
x= = 6,51
43
k
xi − x . f i
41,63
Dm = i =1
Dm = = 0,97
fi 43
2.3 Variância (Símbolo: S2)
Vimos que a Amplitude total e o Desvio Médio são medidas que se deixam influenciar
pelos valores extremos, que em grande maioria são devidos ao acaso.
A variância é uma medida que leva em consideração valores extremos e os valores
intermediários, isto é, expressa melhor os resultados obtidos. A variância relaciona os desvios em
torno da média, ou mais claramente, é a média aritmética dos quadrados dos desvios.
(x − x) d i2
2
S =
2 i
=
n n
Sendo:
S 2 = variância
x = valor da média aritmética
(
di = xi − x )
n= f i
Observação: É mais comum na estatística o trabalho com amostra e não com a população. Neste
caso o denominador passa a ser (n - 1) em vez de n, pois assim teremos uma melhora na estimativa
do parâmetro da população:
(x − x)
2
d i2
S =
2 i
=
n −1 n −1
(x − x)
n n
d 2 2
i i
S= i =1
= i =1
n n
ou resumidamente: S = (x i
− x)2
n
Exemplo: Calcular o desvio padrão do conjunto de números A 1,3,5,7
Vamos utilizar uma tabela para o cálculo do desvio padrão. Iniciamos calculando o valor da média.
1+ 3 + 5 + 7
x= =4 x =4
4
Tabela 2.8. Cálculo do Desvio Padrão
xi (x i
− 4)
2
1 (1 - 4)2 = 9
3 (3 - 4)2 = 1
5 (5 - 4)2 = 1
7 (7 - 4)2 = 9
(x i − 4) 2 = 20
(x − x)
n n
d 2 2
i i
S= i =1
= i =1
n −1 n −1
(x − x) fi
k k
d 2 2
i fi i
S= i =1
= i =1
n n
(x − x) fi
k k
d i2 f i
2
i
S= i =1
= i =1
n −1 n −1
xi = valor isolado da variável, ou ponto médio da classe, se os valores vierem agrupados em classe.
Em seguida, inserimos mais uma coluna na tabela 4.9 onde vamos fazer os cálculos necessários para
o cálculo do desvio padrão:
SP =
(x − x)
i
2
SP =
79,72
= 5,31 = 2,3 S P = 2,3
f 15
Exemplo: Foi realizada uma pesquisa amostral para conhecer o número de filhos dos funcionários
da Empresa Coisas & Tal. Determine o desvio padrão da quantidade de filhos.
Tabela 4.11 Número de filhos/funcionários da empresa Cisas & Tal /08
N° de filhos /func f x f (x − x)2 f
i i i i
0 3 0
1 5 5
2 2 4
3 1 3
4 1 4
5 1 5
6 1 6
14 27
SA =
(x − x) i
2
SA =
46,91
=
46,91
= 3,61 = 1,9 S A = 1,9
f −1 14 − 1 13
Quando tivermos que calcular o desvio padrão para tabelas de dados tabulados com intervalos de
classes usaremos as mesmas fórmulas para dados sem intervalos de classes, utilizando para xi os
pontos médios de cada classe, seguindo com os mesmos procedimentos.
Exwmplo: Com dados da tabela a seguir, calcule o desvio-padrão da distribuição de frequências do
consumo de energia elétrica (Kwh) :
Consumo
Número de xi xi f i ( xi − 79,5) ( xi − 79,5) 2 ( x i −79,5) 2 f i
usuários fi
5 ├ 25 4 15 60 - 64,5 4160,25 16641,0
25├ 45 6 35 210 - 44,5 1980,25 11881,5
45├ 65 14 55 770 - 24,5 600,25 8403,5
65├ 85 26 75 1950 - 4,5 20,25 526,5
85├ 105 14 95 1330 15,5 240,25 3363,5
105├ 125 8 115 920 35,5 1260,25 10082,0
125├ 145 6 135 810 55,5 3080,25 18481,5
145├ 165 2 155 310 75,5 5700,25 11400,5
6360 80780
x=
x i fi
=
6360
= 79,5
n 80
(x ) (x − 79,5) f j
k 2 8
− x fj
2
j j
80780
S= j =1
= j =1
= = 1022,53 S = 31,98
n −1 80 − 1 79
xi xi − 25,25 xi − 25,25
2
12 13,25 175,5625
15 10,25 105,0625
18 7,25 52,5625
19 6,25 39,0625
25 0,25 0,0625
32 6,75 45,5625
= 202 44 417,875
Para o cálculo do desvio padrão precisamos elevar ao quadrado os desvios em relação á média
SP =
(x − x)
i
2
SP =
417,88
= 9,5 = 3,08 S P = 3,08
f 44
2 15 30 2 4 60
3 10 30 1 1 10
5 8 40 1 1 8
6 6 36 2 4 24
9 4 36 5 25 100
total 43 172 202
Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos módulos dos desvios
multiplicado pela frequência, em seguida é só aplicarmos a fórmula:
(x ) (x − 4) f j
k 2 8
−x
2
j fj j
j =1 j =1 202
S= = = = 4,81 S = 2,19
n −1 43 − 1 42
Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos módulos dos desvios
multiplicado pela frequência, em seguida é só aplicarmos a fórmula:
(x ) (x − 6,51) f j
k 2 8
−x
2
j fj j
j =1 j =1 59,12
S= = = = 1,41 S = 1,19
n −1 43 − 1 42
Neste item vamos apresentar duas regras para interpretação do desvio padrão:
Observação: O intervalo padrão é definido por um conjunto de valores (ou uma região) em torno
da média aritmética, contidos num intervalo de amplitude “2S ” (duas vezes o desvio-padrão), ou
seja, -S (antes da média) e +S (depois da média). Conforme estudos matemáticos, essa região
engloba 68,26% dos valores da série ou dos dados pesquisados.
Exemplo: O restaurante “Sabor em kilo” fez um levantamento para saber o consumo médio e
obteve média de 580 g e o desvio padrão de 210 g, calcule:
Solução:
a) Zona de normalidade: de (x − S) até (x + S)
Sendox = 580 g e S = 210 g calcula-se o intervalo:
( x − S ) = 580 - 210 = 370 g
( x + S ) = 580 + 210 = 790 g
Assim, a zona de normalidade é de 370 g até 790 g. Isso representa que 68% dos clientes do
restaurante consomem entre 370 g e 790 g.
b) amplitude dos 95% centrais: ( x − 2S ) de até ( x + 2S )