Você está na página 1de 8

ESTATÍSTICA APLICADA

ESTATÍSTICA APLICADA

Graduação

1
ESTATÍSTICA APLICADA

MEDIDAS DE DISPERSÃO
UNIDADE 4
Estudaremos aqui as medidas de dispersão. Elas permitem calcular a
dispersão (como os dados estão espalhados) existente entre os dados
observados, estejam eles agrupados ou não, em relação à média aritmética.

OBJETIVOS DA UNIDADE:
Compreender as medidas de dispersão, calcular essas medidas, para
dados não agrupados e dados agrupados em classes de freqüências.

PLANO DA UNIDADE:
• Amplitude total.

• Variância.

• Desvio padrão.

• Coeficiente de variação.

Bons estudos!

49
UNIDADE 4 - MEDIDAS DE DISPERSÃO

A média aritmética, a moda e a mediana são valores representativos


do todo, portanto a obtenção desses valores se faz fundamental no estudo
de um conjunto de valores. Porém, para analisarmos um fenômeno estatístico,
não basta obtermos apenas medidas de posição ou gráficos estatísticos.
Para uma análise mais profunda, devemos saber como esses dados estão
distribuídos no todo. As medidas de variabilidade ou dispersão nos dão
exatamente isso. Elas fazem uma descrição de como os dados estão
espalhados no todo. Existem diversas medidas de dispersão, porém, em nossa
disciplina, estudaremos quatro delas, que são:

· Amplitude total;

· Variância;

· Desvio padrão;

· Coeficiente de variação;

Ex.: Observe os seguintes conjuntos de valores referentes à mesma variável:


EXEMPLIFICANDO

X = {20, 20, 20, 20, 20}

Y = {05, 15, 20, 30 ,30}

Z = {01, 01, 03, 05, 90}

Os três conjuntos apresentam a mesma média aritmética ,


porém é fácil notar que o primeiro conjunto de valores é mais homogêneo

que os outros dois, pois todos os valores são iguais. Já o segundo é mais

homogêneo que o terceiro, pois este é o mais disperso de todos. Portanto

não adianta dois ou mais conjuntos de valores terem a mesma média

aritmética, algumas outras análises se fazem necessárias.

AMPLITUDE TOTAL (AT)


Amplitude Total (AT) é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe, ou seja, é a diferença entre os
valores extremos de um conjunto de dados .

Trata-se da única medida de dispersão que não tem a média como


ponto de referência. A amplitude total é instável, pois só leva em consideração
os valores extremos dos conjuntos de dados, descuidando do conjunto de
valores intermediários, por isso é pouco utilizada.

Uma de suas utilizações é na hora de decidirmos por uma distribuição


de freqüência com ou sem intervalos de classes. Fazemos uso da amplitude
total quando queremos determinar a amplitude da temperatura em um dia,
por exemplo, medida de cálculo rápido sem muita exatidão.

50
ESTATÍSTICA APLICADA

EXEMPLIFICANDO Ex.:

Dada a série 2, 3, 5, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 21, 22, 23, 23, 23, 24, 25,
25, 27, 27, 48, 60 e 70 a amplitude amostral será:

Agrupando os dados sem intervalos de classe:

Com intervalos de classe:

VARIÂNCIA (S2)
A variância mede o grau de variabilidade em torno da média. É a média
aritmética dos quadrados dos desvios (cada valor menos a média).
Diferente da amplitude total que se deixa influenciar pelos extremos, a
variância leva em consideração todos os valores da variável em estudo.
Ela baseia-se nos desvios em torno da média.

51
UNIDADE 4 - MEDIDAS DE DISPERSÃO

Variância Amostral
· Para dados isolados:

= cada valor observado.

= média dos valores observados.

n = tamanho da amostra.

· Para dados agrupados:

IMPORTANTE
No denominador da fórmula da variância trabalhamos sempre
com n-1 graus de liberdade para diminuir o erro do cálculo da
variância com agrupamento da distribuição.

Em que:

= cada valor observado, no caso de dados agrupados com intervalos


de classe, é o ponto médio do intervalo de classe.

= média dos valores observados.

i= somatório das freqüências (n).

fi = freqüência de cada classe.

Ex.: Ao analisarmos as idades dos pacientes atendidos num dia em duas


EXEMPLIFICANDO
clínicas de saúde A e B, temos:

Clínica A

52
ESTATÍSTICA APLICADA

Clínica B

Podemos observar que a variância da Clínica A é bem menor do que a


variância da Clínica B, apesar de as médias aritméticas serem iguais. Isso
significa que os dados referentes às idades dos pacientes atendidos na
primeira clínica são mais homogêneos, ou seja, mais concentrados em torno
da média que os da segunda clínica, que são mais dispersos.

DESVIO PADRÃO
O desvio padrão é a medida de dispersão mais empregada, pois
leva em consideração a totalidade dos valores da variável em estudo e o
seu resultado está na mesma unidade de medida da variável, diferente da
variância, que é uma medida quadrática. Quanto maior o desvio padrão mais
heterogêneos são os dados. O desvio é um indicador de variabilidade
bastante estável. Ele baseia-se nos desvios em torno da média aritmética.
EXEMPLIFICANDO É a média quadrática dos desvios, isto é, a raiz quadrada da variância.

No nosso exemplo temos:

Propriedades do desvio padrão

· 1ª = Somando-se (ou subtraindo-se) uma constante a todos


os valores de uma variável, o desvio padrão não se altera;

· 2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma


variável por uma constante (diferente de zero), o desvio padrão
fica multiplicado (ou dividido) por essa constante.

53
UNIDADE 4 - MEDIDAS DE DISPERSÃO

COEFICIENTE DE VARIAÇÃO DE PEARSON - CVP


O desvio padrão tem algumas limitações. Um desvio padrão de 5
unidades, por exemplo, pode ser considerado pequeno para uma série de
valores cujo valor médio é 500, porém, se a média for igual a 15, essa relação
muda completamente.

IMPORTANTE
Outra questão a ser considerada é que o fato de o desvio
padrão ser expresso na mesma unidade dos dados, o que
não nos permite comparar duas ou mais séries de valores
expressas em unidades diferentes.

Para contornar essas dificuldades e limitações, utilizamos o


coeficiente de variação CV. O coeficiente de variação é uma
medida de dispersão relativa, ou seja, é admensional, é a relação entre o
desvio padrão e uma medida de tendência central. Portanto, existem
diversos tipos de coeficientes de variação. Aqui, estudaremos apenas um: o
coeficiente de variação de Pearson.

EXEMPLIFICANDO

OBS.: O CV pode ser expresso em decimal ou em porcentagem.

Ex.: Consideremos os pesos e as alturas de um grupo de jovens atletas


de uma escola de ensino fundamental da baixada fluminense: qual das
medidas (Estatura ou Peso) possui maior homogeneidade?

Apenas através do desvio padrão não podemos dizer nada, pois este
só pode ser comparado no caso de dados com a mesma unidade de medida.
Teremos, então, que calcular o CVP da Estatura e o CVP do Peso. O menor
resultado será o de menor dispersão ou variabilidade, ou seja, o de maior
homogeneidade.

Comparando os CVP, concluímos que as estaturas apresentam maior


homogeneidade que os pesos. Se levarmos em consideração o coeficiente
de variação das duas variáveis, podemos afirmar que a média dos dados é

54
ESTATÍSTICA APLICADA

representativa, pois o CV é bem pequeno, tanto para estaturas quanto para


os pesos.

Estudamos nesta unidade as medidas de dispersão. O cálculo do desvio


padrão é de grande importância no estudo da Estatística. Por ser um valor
que se encontra na mesma unidade da variável, fica fácil seu entendimento.
Ele mostra, em valores, o afastamento das observações em relação à média
aritmética.

Quando precisamos trabalhar variáveis diferentes, podemos compará-las


através do coeficiente de variação. O estudo da dispersão ou afastamento
dos dados é muito importante na nossa disciplina.

É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de
estudo, presentes no caderno de exercício! Elas irão ajudá-
lo a fixar o conteúdo, além de proporcionar sua autonomia
no processo de ensino-aprendizagem. Caso prefira, redija
as respostas no caderno e depois as envie através do nosso
ambiente virtual de aprendizagem (AVA). Interaja conosco!

Veremos, na próxima unidade, como calcular uma amostra.

55

Você também pode gostar