Você está na página 1de 10

2.2.

4 Medidas de dispersão

Dois grupos de dados podem ter médias idênticas mas um ter dados que se afastam
mais da média que o outro:

Amostra A: 1 2 1 36 média: 10
Amostra B: 8 9 10 13 média: 10

mas “Quão dispersos são os dados?” precisamos de indicadores para capturar essa
dispersão.

Amplitude (total)

− Mede o afastamento entre os dados.


− Diferença entre a observação mais elevada e a observação mais pequena.
− Dados em classes: Diferença entre os limites da última e da primeira classe, ou a
diferença entre as marcas da última e da primeira classe numa tabela de
frequências.

Desvantagens:
− Influenciado por outliers nos valores extremos da amostra;
− Não revela a posição relativa dos valores individuais face ao valor típico;
− Para grandes amostras, não utiliza de forma eficiente as observações pois ignora
todas exceto duas, os extremos

Amplitude ou Intervalo interquartis (“interquartile range”)

− Diferença entre o 3.º Quartil (ou Percentil 75) e o 1.º Quartil (Percentil 25): Q3 – Q1;
− Mede a dispersão de 50% dos dados do meio;

Acetatos de apoio a EACP | LCP + LRI |2021/2022 63


50%
25% 25%

25% 25%

Q1 Me Q3

50%

25% 25%

25% 25%

Q1 Me Q3

o Valor pequeno traduz pouca dispersão; valor grande traduz muita dispersão
ou existência de valores extremos.

Desvio absoluto médio

− O desvio de um valor observado é a sua distância relativamente ao valor central da

distribuição, i.e., a diferença entre o seu valor e a média: Desvio = ( xi  x)


− Interessa-nos descrever a variabilidade dos valores individuais em torno da tendência
central [distâncias/desvios dos vários números em relação ao centro da distribuição].

− Desvio médio (ou média dos desvios) é de pouca utilidade pois é sempre zero:

 ( x  x)
 ( x  x)  0
i
“Média” dos desvios: mas i
n

Acetatos de apoio a EACP | LCP + LRI |2021/2022 64


Exemplo: 0 1 2 3 4 5 6 7 8 9 10  x5
Se calcularmos o desvio (simples) em relação à média:

 0  5  1  5   2  5   3  5    4  5    5  5  
  6  5    7  5   8  5    9  5   10  5 

11


 5   4    3   2    1   0   1   2    3   4   5  
0
0
11 11

Desvio absoluto médio

 x x i

 Dados não agrupados: dm  i 1


n
n

 x x  x x  x
i 1
i 1 2  x  x3  x  ...  xn 1  x  xn  x

Continuação do Exemplo (Dados não agrupados)

0 1 2 3 4 5 6 7 8 9 10  x5
Desvio absoluto médio:

0  5  1 5  2  5  3  5  4  5  5  5 
 6  5  7  5  8  5  9  5  10  5
dm  
11
5  4  3  2  1  0  1  2  3  4  5
 
11
5  4  3  2  1  0  1  2  3  4  5 30
   2.73
11 11

Acetatos de apoio a EACP | LCP + LRI |2021/2022 65


Exemplo 1:

Considere seguintes valores de uma variável para a respetiva população: 10 20 50 200

Média: 70
Determinação dos desvios face à média: -60 -50 20 130
Desvio absoluto médio: 65

Exemplo 2 (dados desagregados):

Numa micro empresa recolheu-se junto dos 5 trabalhadores, as seguintes informações:

antiguidade
Indivíduo na empresa
A 10
B 20
C 30
D 40
E 50

Média é 30 anos.
O Desvio absoluto médio é: 12 anos.

Resolução:

antiguidade desvio desvio absoluto


Indivíduo na empresa face média face à média
A 10 -20 20
B 20 -10 10
C 30 0 0
D 40 10 10
E 50 20 20
total 0 60
desvio absoluto médio 12

Acetatos de apoio a EACP | LCP + LRI |2021/2022 66


k

n j xj  x k
  f j x j  x onde nj é a frequência
j 1
Dados agrupados simples: d m 
n j 1

absoluta da classe e fj é a frequência relativa da classe

Exemplo 3 (dados agrupados):

Numa empresa com 100 trabalhadores recolheu-se junto dos trabalhadores, a seguinte informação:

antiguidade na empresa Nº
(anos) trabalhadores
10 35
20 25
30 10
40 20
50 10
100

Resolução:

desvio desvio
antiguidade na empresa Nº desvio faceabsoluto face absoluto
(anos) trabalhadores média à média total
10 35 -14.5 14.5 507.5
20 25 -4.5 4.5 112.5
30 10 5.5 5.5 55
40 20 15.5 15.5 310
50 10 25.5 25.5 255
100 1240
12.4
Desvio absoluto médio =[14.5x35 trab + 4.5x25 trab + 5.5x10 trab + 15.5x40 trab + 25.5x10 trab]/100
=12.4
Média: 24.5

Acetatos de apoio a EACP | LCP + LRI |2021/2022 67


Variância e desvio-padrão

Variância

− A variância é a média dos quadrados dos desvios das observações em relação à


média da amostra/ população; ou seja, é a média da “soma dos quadrados”.

− Diz-nos o quão longe da média está cada valor de uma base de dados.

Como se calcula?

1. Calcular a diferença entre cada observação e a média: calcular os “desvios


em relação à média”;
2. Como há diferenças positivas e negativas, não podemos simplesmente somá-
las (ou dá... zero, como vimos no desvio médio sem correção do valor
absoluto); por isso, calculamos o quadrado de cada um desses desvios – a
“soma dos quadrados” [SQ], ou seja a soma dos desvios ao quadrado.
3. Calcular a média dos desvios ao quadrado.

No caso de dados não agrupados:

− Variância da população
N
1
    xi   
2 2

N i 1
− Variância amostral
1 n
 i 
2
s 
2
x  x
n  1 i 1
Nota: Usamos esta correção porque as amostras são, normalmente, de dimensão
reduzida em relação à população e porque se demonstra que só assim o
estimador da variância é um estimador cêntrico (ou não enviesado).
Especificamente, o cálculo da variância implica o cálculo da média, o que se
traduz na perda de uma observação (ou de um “grau de liberdade”).

Exemplo 1

Considere seguintes valores de uma variável para a respetiva população: 10 20 50 200

Média: 70

Variância na população: 5850


Desvio padrão: 76.485 (arredondado a duas casas decimais)

Acetatos de apoio a EACP | LCP + LRI |2021/2022 68


Exemplo 2 (dados desagrupados ou desagregados):

Numa micro empresa recolheu-se junto dos 5 trabalhadores, as seguintes informações:

antiguidade
Indivíduo na empresa
A 10
B 20
C 30
D 40
E 50

Cálculo da média 30

Variância da população 200

Desvio padrão 14.142 arredondado a três casas decimais

No caso de dados agrupados (em k classes):

 n j x j   
1 k
Variância da população (dados agrupados):  2 
2

N j 1

nj  xj  x 
1 k

2
Variância amostral (dados agrupados): s 2 
n  1 j 1

Nota: No caso de dados agrupados em intervalos: xj substitui-se por cj (centro do intervalo), ou

n j c j    e s 2  nj c j  x  .
1 k 1 k
 
2
seja  2 
2

N j 1 n  1 j 1

Exemplo 3 (dados agrupados ou agregados):

antiguidade na empresa Nº desvio face desvio ^2


(anos) trabalhadores média total
10 35 -14.5 7358.75
20 25 -4.5 506.25
30 10 5.5 302.5
40 20 15.5 4805
50 10 25.5 6502.5
100 19475
194.75

Variância na população =[(-14.5^2)x35 trab + (-4.5^2)x25 trab + (5.5^2)x10 trab + (15.5^2)x40 trab + (25.5^2)x10 trab]/100
194.75
Desvio padrão 13.955 arredondado a três casas decimais

Acetatos de apoio a EACP | LCP + LRI |2021/2022 69


Notas sobre a variância:

1. O número mínimo de observações necessário para calcular a variância é 2.


2. Uma vez que a variância é calculada a partir da soma dos quadrados, já não é
medida na unidade de medida da variável original. Por exemplo, se a amostra se
referir à altura dos alunos em cm, a variância está medida em cm quadrados; Se a
amostra se referir ao peso dos alunos em kg, a variância está medida em kg
quadrados.

3. Para estandardizar as unidades de forma a ser consistente com as unidades


de medida originais, calculamos a raiz quadrada da variância, obtendo assim
o desvio-padrão (“standard deviation”):

Desvio padrão da população:    2

Desvio padrão amostral: s  s 2 (“standard deviation”)

Exemplo #4

Observações: 3, 9, 4, 7 (amostra)

Média = 5.75; Mediana = 5.5

Desvio absoluto médio: 2.25

SQ   3  5.75    9  5.75    4  5.75    7  5.75   22.75


2 2 2 2

s2 = 22.75/3 =7.583….

s = 2.754 (resultado final arredondado a 3 casas decimais, sem arredondar cálculos intermédios)

Exemplo #5 (amostra)

Observações: 15, 10, 12, 8, 7, 11, 20, 5, 14, 17, 16, 12 (amostra)

Calcule o desvio padrão. Arredonde o resultado final a três casas decimais, sem
arredondar cálculos Intermédios.

Acetatos de apoio a EACP | LCP + LRI |2021/2022 70


x  12.25
SQ  212.25
212.25
s2   19.295 …
12  1
s  19.295=4.3927
 Desvio padrão amostral é 4.393 (arredondado a 3
casas decimais)

 O conhecimento do desvio padrão permite-nos efetuar a comparação de valores


pertencentes a diferentes séries, como no exemplo seguinte:

Exemplo #6
Um professor ensina dois turnos de Estatística e escolhe aleatoriamente uma amostra
de resultados do primeiro teste de avaliação contínua.
Turno A: 50 60 70 80 90
Turno B: 72 68 70 74 66
Calcule a amplitude total dos dados, a média, e o desvio padrão por turno.
Solução:
MédiaA = 70 AmplitudeA = 40 sA = 15.81 (variância 250)
MédiaB = 70 AmplitudeB = 8 sB = 3.16 (variância 10)

Acetatos de apoio a EACP | LCP + LRI |2021/2022 71


Coeficiente de variação

− Medida de dispersão relativa que expressa o desvio padrão como percentagem


da média (desde que a média seja positiva):

− CV da população:

CV  100%

− CV da amostra:
s
CV  100%
x
Exemplo:

Comparação da distribuição de pesos dos elefantes (em kg) e dos ratos


(em gr).

A comparação dos valores absolutos não faz sentido. Recorrendo ao


coeficiente de variação podemos verificar se o peso dos elefantes
apresenta uma menor/maior variabilidade do que o peso dos ratos.
Considerando as seguintes amostras:

Elefantes: 4500 6000 5000 3250 5500

Ratos: 22.5 16.25 27.5 25 30

xE  4850 sE  1054.75 CVE  21.74%


xR  24.25 sR  5.27 CVR  21.74%

 Bibliografia
Cap. 3 Describing data: numerical
Newbold, Paul, William L. Carlson, e Betty M. Thorne (2003). Statistics for business and economics. 5ª
edição, Prentice-Hall.
Cap. 5. Noções básicas de Estatística descritiva
Chaves, Cristina, Elisabete Maciel, Paulo Guimarães e José Carlos Ribeiro (2000), Instrumentos
Estatísticos de Apoio à Economia, McGraw-Hill

Acetatos de apoio a EACP | LCP + LRI |2021/2022 72

Você também pode gostar