Escolar Documentos
Profissional Documentos
Cultura Documentos
4 Medidas de dispersão
Dois grupos de dados podem ter médias idênticas mas um ter dados que se afastam
mais da média que o outro:
Amostra A: 1 2 1 36 média: 10
Amostra B: 8 9 10 13 média: 10
mas “Quão dispersos são os dados?” precisamos de indicadores para capturar essa
dispersão.
Amplitude (total)
Desvantagens:
− Influenciado por outliers nos valores extremos da amostra;
− Não revela a posição relativa dos valores individuais face ao valor típico;
− Para grandes amostras, não utiliza de forma eficiente as observações pois ignora
todas exceto duas, os extremos
− Diferença entre o 3.º Quartil (ou Percentil 75) e o 1.º Quartil (Percentil 25): Q3 – Q1;
− Mede a dispersão de 50% dos dados do meio;
25% 25%
Q1 Me Q3
50%
25% 25%
25% 25%
Q1 Me Q3
o Valor pequeno traduz pouca dispersão; valor grande traduz muita dispersão
ou existência de valores extremos.
− Desvio médio (ou média dos desvios) é de pouca utilidade pois é sempre zero:
( x x)
( x x) 0
i
“Média” dos desvios: mas i
n
0 5 1 5 2 5 3 5 4 5 5 5
6 5 7 5 8 5 9 5 10 5
11
5 4 3 2 1 0 1 2 3 4 5
0
0
11 11
x x i
x x x x x
i 1
i 1 2 x x3 x ... xn 1 x xn x
0 1 2 3 4 5 6 7 8 9 10 x5
Desvio absoluto médio:
0 5 1 5 2 5 3 5 4 5 5 5
6 5 7 5 8 5 9 5 10 5
dm
11
5 4 3 2 1 0 1 2 3 4 5
11
5 4 3 2 1 0 1 2 3 4 5 30
2.73
11 11
Média: 70
Determinação dos desvios face à média: -60 -50 20 130
Desvio absoluto médio: 65
antiguidade
Indivíduo na empresa
A 10
B 20
C 30
D 40
E 50
Média é 30 anos.
O Desvio absoluto médio é: 12 anos.
Resolução:
n j xj x k
f j x j x onde nj é a frequência
j 1
Dados agrupados simples: d m
n j 1
Numa empresa com 100 trabalhadores recolheu-se junto dos trabalhadores, a seguinte informação:
antiguidade na empresa Nº
(anos) trabalhadores
10 35
20 25
30 10
40 20
50 10
100
Resolução:
desvio desvio
antiguidade na empresa Nº desvio faceabsoluto face absoluto
(anos) trabalhadores média à média total
10 35 -14.5 14.5 507.5
20 25 -4.5 4.5 112.5
30 10 5.5 5.5 55
40 20 15.5 15.5 310
50 10 25.5 25.5 255
100 1240
12.4
Desvio absoluto médio =[14.5x35 trab + 4.5x25 trab + 5.5x10 trab + 15.5x40 trab + 25.5x10 trab]/100
=12.4
Média: 24.5
Variância
− Diz-nos o quão longe da média está cada valor de uma base de dados.
Como se calcula?
− Variância da população
N
1
xi
2 2
N i 1
− Variância amostral
1 n
i
2
s
2
x x
n 1 i 1
Nota: Usamos esta correção porque as amostras são, normalmente, de dimensão
reduzida em relação à população e porque se demonstra que só assim o
estimador da variância é um estimador cêntrico (ou não enviesado).
Especificamente, o cálculo da variância implica o cálculo da média, o que se
traduz na perda de uma observação (ou de um “grau de liberdade”).
Exemplo 1
Média: 70
antiguidade
Indivíduo na empresa
A 10
B 20
C 30
D 40
E 50
Cálculo da média 30
n j x j
1 k
Variância da população (dados agrupados): 2
2
N j 1
nj xj x
1 k
2
Variância amostral (dados agrupados): s 2
n 1 j 1
n j c j e s 2 nj c j x .
1 k 1 k
2
seja 2
2
N j 1 n 1 j 1
Variância na população =[(-14.5^2)x35 trab + (-4.5^2)x25 trab + (5.5^2)x10 trab + (15.5^2)x40 trab + (25.5^2)x10 trab]/100
194.75
Desvio padrão 13.955 arredondado a três casas decimais
Exemplo #4
Observações: 3, 9, 4, 7 (amostra)
s2 = 22.75/3 =7.583….
s = 2.754 (resultado final arredondado a 3 casas decimais, sem arredondar cálculos intermédios)
Exemplo #5 (amostra)
Observações: 15, 10, 12, 8, 7, 11, 20, 5, 14, 17, 16, 12 (amostra)
Calcule o desvio padrão. Arredonde o resultado final a três casas decimais, sem
arredondar cálculos Intermédios.
Exemplo #6
Um professor ensina dois turnos de Estatística e escolhe aleatoriamente uma amostra
de resultados do primeiro teste de avaliação contínua.
Turno A: 50 60 70 80 90
Turno B: 72 68 70 74 66
Calcule a amplitude total dos dados, a média, e o desvio padrão por turno.
Solução:
MédiaA = 70 AmplitudeA = 40 sA = 15.81 (variância 250)
MédiaB = 70 AmplitudeB = 8 sB = 3.16 (variância 10)
− CV da população:
CV 100%
− CV da amostra:
s
CV 100%
x
Exemplo:
Bibliografia
Cap. 3 Describing data: numerical
Newbold, Paul, William L. Carlson, e Betty M. Thorne (2003). Statistics for business and economics. 5ª
edição, Prentice-Hall.
Cap. 5. Noções básicas de Estatística descritiva
Chaves, Cristina, Elisabete Maciel, Paulo Guimarães e José Carlos Ribeiro (2000), Instrumentos
Estatísticos de Apoio à Economia, McGraw-Hill