Você está na página 1de 16

Capítulo 4

Estatística Descritiva: Medidas de


Dispersão ou Variabilidade
Introdução
É a maior ou menor diversificação dos valores de uma variável em torno de um valor
de tendência central (média, mediana ou moda) tomado como ponto de comparação.
A média ainda que considerada como um número que tem a capacidade de representar
uma série de valores, não pode por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:
X = {70, 70, 70, 70, 70}; Y = {68, 69, 70 ,71 ,72}; Z = {5, 15, 50, 120, 160}
Observamos então que os três conjuntos apresentam a mesma média aritmética: 350/5
= 70.
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z,
já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que
o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média
representativa.
Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y
apresenta uma dispersão menor que o conjunto Z.

4.1 Medidas de Dispersão Absoluta (AT)


Amplitude total: É a única medida de dispersão que não tem na média o ponto de
referência. Quando os dados não estão agrupados a amplitude total é a diferença entre o maior
e o menor valor observado: AT = Xmáximo - Xmínimo.
Com intervalos de classe a amplitude total é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe. Então AT = Lmáximo - Lmínimo
A amplitude total tem o inconveniente de só levar em consideração os dois valores
extremos da série, descuidando do conjunto de valores intermediários.
4.2 Desvio Padrão (σ)
É a medida de dispersão que determina a variabilidade entre cada escore e a respectiva
média aritmética da população ou da amostra, conforme o caso. Essa medida é a mais
empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um
indicador de variabilidade bastante estável.
O desvio padrão representa a variabilidade em termos de unidade da medida utilizada,
baseia-se nos desvios em torno da média aritmética dado pela equação:
n

( x −  )
2
i
= i =1
(4.1)
N
A Equação acima é empregada quando tratamos de uma população de dados não
agrupados.
Quando nosso interesse não se restringe à descrição dos dados, mas partindo da
amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em usar o divisor n - 1 em lugar de N. A equação ficará então:

( x − x )
2

s= i
(4.2)
n −1

O desvio padrão possui algumas propriedades:


a) Somando ou subtraindo uma constante a todos os valores isso não altera o valor do
desvio padrão.
b) Quando multiplicamos ou dividimos os valores por uma constante o desvio padrão
fica multiplicado ou dividido por essa constante.
Exemplo 4.1: Calcule o desvio padrão amostral dos números 8, 3, 5, 12, 10.
A média desses valores já foi calculada no Capítulo anterior, sendo X = 7, 6 podemos
calcular o desvio em torno da média.
( 8 − 7, 6 ) ( 3 − 7, 6 ) ( 5 − 7, 6 ) (12 − 7, 6 ) (10 − 7, 6 )
2 2 2 2 2

s= + + + +
5 −1 5 −1 5 −1 5 −1 5 −1
( 0, 4 ) ( −4, 6 ) ( −2, 6 ) ( 4, 4 ) ( 2, 4 )
2 2 2 2 2

s= + + + +
4 4 4 4 4
0,16 + 21,16 + 6, 76 + 19,36 + 5, 76 53, 2
s= =  3, 65
4 4

Para dados agrupados calculamos o desvio padrão populacional a partir da equação


(4.3) e o amostral pela equação (4.4)

 ( x −  )  fi 
2

=
i  (4.3)
f i

 ( x − x )  f 
2
i i
s= (4.4)
 f −1 i

Exemplo 4.2: Calcule o desvio padrão populacional da Tabela 3.1 do Capítulo 3.


Tabela 3.1. Membros familiares, Escola B, São Paulo, 2000.
Membros familiares (Xi) Número de Estudantes (fi)
2 58
3 106
4 95
5 74
N = 333
A média para esses dados é de  = 3,56 , substituindo na equação (4.3):

( 2 − 3,56 )  58 ( 3 − 3,56 ) 106 ( 4 − 3,56 )  95 ( 5 − 3,56 )  74


2 2 2 2

= + + +
333 333 333 333
2, 43  58 0,31106 0,19  95 2, 07  74 346, 23
= + + + =  1, 02
333 333 333 333 333
Não podemos dizer que o desvio padrão do exemplo 4.2 é menor que o do exemplo
4.1, já que possuem unidades de medidas diferentes.
4.3 Variância (σ²)
É o desvio padrão elevado ao quadrado e é simbolizado por σ². A variância é uma
medida que tem pouca utilidade como estatística descritiva, porém é extremamente
importante na inferência estatística.
Mede a variabilidade total dos dados, a variância populacional é dada pela equação
(4.5) e a variância amostral pela equação (4.6).
n

( x − )
2
i
2 = i =1
(4.5)
N

( x − x )
2
i
s2 = i =1
(4.6)
n −1
A equação a seguir, pode ser bastante útil no cálculo da soma dos quadrados dos desvios:

( X − X ) =  X i2 −
1
(  Xi )
2 2
i (4.7)
n
Exemplo 4.3: utilizando o valor do desvio padrão do Exemplo 4.1, tem-se:
s = 3, 65
s ² = 3, 65² = 13,3

4.4 Erros
4.4.1 Bias ou Viés
Chama-se bias ou viés a diferença entre o valor de uma estatística amostral pela
estatística populacional, ou seja, a diferença entre o estimado subtraído pelo parâmetro.
Exemplo 4.4: Dado uma média amostral x = 1250 e a média populacional  = 1200 , o bias
ou viés é dado por:
Bias ou viés = 1250 – 1200 = 50
Dizemos que os dados estão viesados ao menos 50 unidades.
4.4.2 Erro Amostral
O erro amostral ocorre em amostras aleatórias e é decorrente da variação entre
indivíduos, de um mesmo indivíduo em momentos diferentes, de instrumentos de medição
etc.
Então, fica intuitivo admitir que ocorra alguma diferença entre as estatísticas
(estimativas) e os parâmetros. Pode-se reduzir e medir o erro amostral.

4.4.3 Redução do Erro Amostral


Podemos reduzir o erro amostral realizando diferentes amostras aleatórias ou
aumentando o tamanho amostral, essa última é mais usualmente utilizada.
Vamos supor uma população de tamanho N = 10, constituída das seguintes unidades:
10, 20, 30, 40, 50, 60, 70, 80, 90 e 100. Sua média paramétrica é igual a μ = 55. Se
escolhermos três amostras de tamanhos n1 = 3 e representarmos o Erro amostral pelo Quadro
4.1.
Quadro 4.1
n=3 x μ Erro amostral
n1: 20, 50, 70 46,7 55 46,4-55 = -8,3
n2: 10, 30, 90 43,3 55 43,3-55 = -11,7
n3: 40, 60, 80 60 55 60-55 = +5
O bias ou viés por erro amostral variou de -11,7 a +5.
Agora se tivermos três amostras de tamanho n2 = 5, teremos o Quadro 4.2 para
representar o Erro amostral.
Quadro 2
n =5 x μ Erro amostral
n1: 10, 50, 60, 80, 90 58,0 55 58,0-55 = +3
n2: 20, 40, 50, 70, 100 56,0 55 56,0-55 = +1
n3: 20, 30, 5, 70, 90 52,0 55 52.0-55 = -3
O bias ou viés por erro amostral variou de -3 a +3, sendo a redução do mesmo
decorrente do aumento do tamanho da amostra, que aumentou de três para cinco.

4.4.4 Erro Padrão


A medição do erro amostral é efetuada por um coeficiente amostral, denominado de
Erro Padrão. É uma medida de variabilidade entre médias amostrais, ou entre estas e a média
paramétrica. É o quociente entre o desvio padrão do Universo ou da amostra e a raiz quadrada
do tamanho amostral. Quando se desconhece o desvio padrão paramétrico, utiliza-se, com
boa aproximação, o desvio padrão da amostra, como pode ser visto pela equação (4.7):
 s
x =  sx = (4.7)
N n
O erro padrão mensura a diferença entre médias, mede o Erro amostral observado
nas amostras aleatórias, decorrente da variabilidade natural das unidades do Universo
estudado e do fato de que nem todos os indivíduos da população participam da amostra. O
Erro Padrão diminui quando a amostra obtida é aleatória e à medida que se aumenta o
tamanho da amostra. Veja que o denominador é dado pela raiz quadrada de n.
Exemplo 4.4: Calcule o Erro Padrão do Exemplo 4.1 e do Exemplo 4.2.
Como o desvio padrão do Exemplo 4.1 é dado por s = 3,65 e temos n = 5, substituindo
na equação (4.7).
3,65
sx =  1,63
5

Agora para o Exemplo 4.2 temos σ = 1,02 e n = 333, calculando:

1,02
sx =  0,06
333

Semelhante à explicação para o desvio padrão, também não podemos comparar os


dois erros padrão. Isso só é possível se tivermos um coeficiente que não leve em consideração
as unidades de medidas da variável, sendo aceitável a comparação da variabilidade nesse
caso.

4.5 Medidas De Dispersão Relativa


4.5.1 Coeficiente de Variação de Pearson
Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um
desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo
valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita
o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à
sua dispersão ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de
Coeficiente de Variação de Pearson (CVP), sendo a razão entre o desvio padrão e a média
referentes aos dados de uma mesma série. O resultado neste caso é expresso em percentual
para o caso populacional ou amostral;
 
CVP =   .100 (4.8)

ou
S 
CVP =   .100 (4.9)
X
Exemplo 4.5: Calcule o Coeficiente de variação do Exemplo 4.1 e do Exemplo 4.2.
Não poderíamos comparar a variabilidade dos dois exemplos, pois eles possuem
unidade de medidas diferentes, no entanto, com o coeficiente de variação de Pearson
podemos realizar essa comparação.
Para o Exemplo 4.1, temos X = 7, 6 e s = 3,65, substituindo na equação (4.9):

 3, 65 
CVP =    100 = 0, 4803  100 = 48, 03%
 7, 6 
Para o Exemplo 4.2, temos  = 3,56 e σ = 1,02, calculando novamente:

 1, 02 
CVP =   100 = 0, 2865  100  28, 65%
 3,56 
4.6 Medidas De Forma
Quando as amostras são examinadas sob a forma de histograma, onde o valor de cada
variável e respectiva frequência é considerado, verifica-se que elas podem se apresentar sob
diferentes formas, como será discutido a seguir.
4.6.1 Simetria
As curvas das amostras, considerando a Simetria, podem apresentar:
a) Curva Simétrica: quando a média aritmética, a média e a moda apresentam o mesmo
valor e as caudas têm a mesma configuração. Assim sob a forma gráfica e símbolos
temos:

b) Curva Assimétrica Positiva: apresenta uma cauda mais alongada para o lado direito
do observador, a média é maior que a mediana, com a seguinte representação gráfica:

c) Curva assimétrica Negativa: neste caso, a cauda mais alongada é para esquerda do
observador, a média é menor que a mediana, com a seguinte representação gráfica:

4.6.2 Coeficiente de assimetria


No que diz respeito à assimetria, pode-se determinar se a curva é simétrica,
assimétrica positiva ou negativa, por meio do coeficiente de Assimetria, calculado pela
equação (4.10).
(X − X )
3
n 2  m3
g1 = , sendo m3 =  (4.10)
( n − 1)  (n − 2)  s³ n

Interpretando o coeficiente:
a) g1 = 0, curva Simétrica
b) g1 > 0, curva Assimétrica Positiva
c) g1 < 0, curva Assimétrica Negativa
Exemplo 4.6: Calcule o coeficiente de Assimetria do Exemplo 4.2.
Primeiramente calculamos o valor de m3, sabendo que μ  3,5556.

( 2 − 3,5556 )  58 + ( 3 − 3,5556 ) 106 + ( 4 − 3,5556 )  95 + ( 5 − 3,5556 )  74


3 3 3 3

m3 = = −0, 01556
333
Sabendo que s  1,0212, logo s³ = 1,06494. Substituindo o valor de m3, s³ e n = 333
na equação (4.10).
3332  (−0, 01556)
g1 =  −0.01
( 333 − 1)  (333 − 2) 1, 06494
O resultado mostra que os dados possuem levemente assimetria negativa, quase sendo
simétrica.

4.6.2 Medidas De Curtose


Denominamos curtose o grau de achatamento de uma distribuição em relação a uma
distribuição padrão, denominada curva normal (curva correspondente a uma distribuição
teórica de probabilidade).
Quando a distribuição apresenta uma curva de frequência mais fechada que a normal
(ou mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocúrtica.
Representado pela figura abaixo.
Quando a distribuição apresenta uma curva de frequência mais aberta que a normal
(ou mais achatada em sua parte superior), ela recebe o nome de platicúrtica. Veja figura
abaixo.

A curva normal, que é a nossa base referencial, recebe o nome de mesocúrtica. Como
mostrado na figura.

4.6.3 Coeficiente de curtose


A Curtose pode ser determinada, independentemente do gráfico, pelo coeficiente de
Curtose, designado pela equação (4.11).
n 2  ( n + 1)  m4 − 3  m2  m2  ( n − 1)  n 2
g2 = ,
( n − 1)  (n − 2)  (n − 3)  s 4
(4.11)
(X − X ) (X − X )
2 4

sendo m2 =  e m4 = 
n n

a) g2 = 0, curva Mesocúrtica
b) g2 > 0, curva Leptocúrtica
c) g2 < 0, curva Platicúrtica
Exemplo 4.7: Calcule o coeficiente de Curtose do Exemplo 4.2.
Calculando o valor de m4, sabendo que μ  3,5556.

( 2 − 3,5556 )  58 + ( 3 − 3,5556 ) 106 + ( 4 − 3,5556 )  95 + ( 5 − 3,5556 )  74


4 4 4 4

m4 = = 2, 0286
333
Sabendo que s  1,0212, logo s4 = 1,08751 e m2 = 1,03971. Substituindo o valor de
m4, s4 e n = 333 na equação (4.10).
3332  ( 333 + 1)  2, 02865 − 3 1, 039711, 03971 ( 333 − 1)  3332
g2 =  −1,12
( 333 − 1)  (333 − 2)  (333 − 3) 1, 08751
Indica que a distribuição é platicúrtica, ou seja, sua média não é muito distante em
relação aos demais valores.

4.7 Separatrizes
Além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana
relativamente à sua característica de separar a série em duas partes que apresentam o mesmo
número de valores.
Essas medidas são os quartis, os decis e os percentis, que juntamente com a mediana,
são conhecidas pelo nome genérico de separatrizes. Assim como na mediana, aqui são
fornecidos os valores da posição onde se encontra as separatrizes.

4.7.1 Quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a série em quatro partes iguais.
O primeiro quartil é o valor que divide o conjunto de dados em duas partes, sendo que
25% dos valores são menores que esse coeficiente e 75%, maiores, para isso ordenamos os
valores em um Rol crescente e calculamos o elemento do primeiro quartil, dado por:
1 n
Q1 = (4.12)
4
onde n é o número de valores do conjunto da amostra.
O segundo quartil também divide o conjunto de dados em duas partes, sendo que 50%
dos valores são maiores e 50% são menores. De forma análoga ao primeiro quartil segue:
2 n
Q2 = (4.13)
4
O terceiro quartil também divide em duas partes nas quais 75% dos valores são
menores que o coeficiente e 25% são maiores, dado por:
3 n
Q3 = (4.14)
4
4.7.2 Decis
A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da
porcentagem de valores que ficam aquém e além do decil que se pretende calcular.
O primeiro decil divide o conjunto em duas partes, sendo que a primeira representa
10% dos valores, enquanto a segunda constitui 90%, ordenando-se os valores em Rol
crescente, calcula-se por:
in
D1 = (4.15)
10
onde i representa o decil a ser calculado (de 1 a 9) e n o número de observações da amostra.

4.7.3 Percentis ou Centis


Denominamos percentis ou centis como sendo os noventa e nove valores que separam
uma série em 100 partes iguais, sendo a primeira corresponde a 1% e a segunda, 99% dos
valores, assim o segundo centil representa 2% e a segunda 98%. É dado por:
in
C1 = (4.16)
100
onde i representa o centil a ser calculado (de 1 a 99) e n o número de observações da amostra.
Para dados agrupados, calcula-se do mesmo modo que é feito para a mediana, a
diferença está na representatividade de cada medida de separatriz.
Utiliza-se para dados agrupados em classe a equação muito semelhante à da mediana,
como pode ser visto na equação (4.17).
 i   f i  
 − Faa   a 
 100  
Pi = l +  (4.17)
f
Onde i é o percentil desejado.
Deve-se destacar que o segundo Quartil, o Quinto decil e o quinquagésimo centil são
iguais à mediana.
a) Q1 = P25
b) Q2 = D5 = P50 = Mediana
c) Q3 = P25

4.7.4 Intervalo Interquartílico


O desvio Interquartílico é uma medida de dispersão representando a diferença entre
o Terceiro e o Primeiro Quartis, constituindo 50% das observações. Assim, temos:
IQ = Q3 - Q1 ( 4.18)
4.7.6 Outlier e valor Extremo
Na detecção de Outlier é utilizada a equação (4.18), enquanto para um valor extremo
a equação (4.19).
Q3 + 1,5  IQ Valor Superior
(4.19)
Q1 − 1,5  IQ Valor Inferior

Q3 + 3  IQ Valor Superior
(4.20)
Q1 − 3  IQ Valor Inferior

4.7.7 Gráfico Box-Plot


Esse gráfico permite visualizar a mediana e os quartis, os limites superior e inferior
e, ao mesmo tempo, detectar valores outliers e extremos. O gráfico é ilustrado na Figura 4.1.
Figura 1

Exemplo 4.8: Considerando a quarta questão do Exercício do Capítulo 4, no qual temos as


notas de um teste de inteligência aplicado a 100 alunos de um estabelecimento de ensino:
62 72 78 85 89 95 99 104 111 119
63 73 79 87 90 95 99 104 112 120
64 74 80 87 90 96 99 105 112 120
65 74 80 88 91 97 100 106 113 120
65 74 81 88 91 97 100 107 114 121
67 74 82 89 92 97 101 108 116 122
68 75 83 89 92 98 101 109 117 125
68 76 83 89 92 98 102 110 119 128
68 78 85 89 93 99 102 110 119 128
68 78 85 89 95 99 103 110 119 130

Calcule as medidas de Separatrizes (Quartis, Decis e Percentis).


Os quartis são calculados utilizando as equações (4.12), (4.13) e (4.14).

1100
Q1 = = 25º
4
2 100
Q2 = = 50º
4
3 100
Q3 = = 75º
4

O primeiro quartil (Q1) é referente aos 25% dos alunos que ficam abaixo do número
82, dividindo em 25% dos dados menores que esse valor e 75% maiores.
O segundo quartil (Q2) é referente ao número 95 que ocupa a 50º posição dos dados
em rol, dividindo em 50% dos dados menores que esse valor e 50% maiores. Esse valor é
igual ao da mediana.
O terceiro quartil (Q3) é referente ao número 107 que ocupa a 25º posição dos dados
em rol, dividindo em 75% dos dados menores que esse valor e 25% maiores.
Com o auxílio dos quartis o pesquisador consegue visualizar o comportamento do seu
conjunto de dados nas diferentes concentrações de ocorrências. Podendo obter estimativas
para cada grupo dividido, ou seja, o pesquisador poderia querer conhecer a média das notas
do teste de inteligência para os primeiros 25%, 50% e 75% da amostra.
Para os decis utilizaremos a equação (4.15) indicando como é realizado o seu cálculo
para alguns.
1100
D1 = = 10º
10
2 100
D2 = = 20º
10
3 100
D3 = = 35º
10

9 100
D9 = = 90º
10

Sendo D1, D2, D3 e D9 referentes aos seguintes números 68, 78, 85 e 119.
Os percentis são calculados pela equação (4.16), como anteriormente é realizado para
alguns casos como exemplo.
1 100
C1 = = 1º
100
2  100
C2 = = 2º
100
3  100
C3 = = 3º
100

45  100
C45 = = 45º
100
Sendo C1, C2, C3 e C45 referentes aos seguintes números 62, 63, 64 e 91.
O Intervalo interquartílico é calculado pela equação (4.18).
IQ = Q3 – Q1 = 107 – 82 = 25
Então sabemos que a variabilidade dos prováveis valores ocorrerem é de 25 pontos.
Verificando a existência de valores Outliers e extremos pelas equações (4.19) e (4.20),
respectivamente.
Outliers Valor extremo
107 + 1,5  25 = 144,5 Valor Superior 107 + 3  25 = 182 Valor Superior
82 − 1,5  25 = 44,5 Valor Inferior 82 − 3  25 = 7 Valor Inferior

Para o caso do cálculo de valores Outliers é mostrado que só seria considerado um


Outlier se existisse um valor que fosse superior a 144 ou inferior a 45, enquanto, para valor
extremo teríamos que ter um valor acima a 182 e abaixo de 7 para ser considerado extremo.
A Figura 2 mostra o gráfico de Box-Plot construído com base nessas informações,
sintetizando essas interpretações.
Figura 2
EXERCÍCIOS
1. Refaça os exercícios do Capítulo 3 calculando as medidas de Variabilidade.
2. Refaça os exercícios do Capítulo 3 calculando as medidas de Forma.
3. Refaça os exercícios do Capítulo 3 calculando as medidas de Separatrizes.

Você também pode gostar