Você está na página 1de 14

1

UNIDADE 3- MEDIDAS DE DISPERSÃO OU VARIABILIDADE

3.1 - INTRODUÇÃO
Como foi visto anteriormente, procura-se representar uma série estatística através de
medidas de posição. Entretanto quase sempre essa representação é incompleta, visto que essas
medidas descrevem somente o posicionamento dos valores da série em relação a elas, sem explicar
ou determinar como se dá esse posicionamento ou, ainda, sem identificar como os valores da série se
distribuem ou se dispersam relativamente àquelas medidas. Assim sendo, é inviável representar
séries exclusivamente por medidas de posição. Para suprir essa insuficiência usam-se as medidas de
dispersão, que demonstram o grau de dispersão dos valores componentes das séries, relativamente
às medidas de posição.
As medidas de dispersão indicam se os valores da série estão relativamente próximos uns
dos outros, ou separados. Estas informações podem ser obtidas pelo estudo de medidas de
dispersão absolutas e relativas, sendo que as primeiras nos oferecem condições para analisarmos
até que ponto estes valores apresentam oscilações para mais ou para menos, em relação a uma
medida de posição fixada, e que vem expressa na mesma unidade de medida dos valores, a as
segundas em termos relativos ou percentuais.
Podemos, então definir medidas de dispersão da seguinte maneira: “Dadas duas ou mais
séries de valores, podemos dizer que a melhor delas, a mais homogênea, ou a menos dispersa
é aquela que apresentar menor medida de dispersão ou variabilidade”.

3.2 - MEDIDAS DE DISPERSÃO ABSOLUTA


Essa medida nos permite observar até que ponto os valores das séries observadas
apresentam oscilações para mais ou para menos, em relação a uma medida de posição fixada, e que
vem expressa na mesma unidade de medida dos valores.

3.2.1 - Amplitude Total (AT)


É a mais simples das medidas de dispersão, é representada pela diferença entre o maior e o
menor dos valores da série. Na distribuição de freqüências a amplitude total é expressa pela diferença
entre o último limite superior e o primeiro limite inferior. A amplitude total das séries examinadas indica
a maior ou menor dispersão de cada uma delas.
A amplitude total, também conhecida como Intervalo total, é uma medida de dispersão pouco
utilizada na análise estatística, porque, sendo calculada apenas com os dois valores extremos da
série, é muito “instável”. Basta quer ocorra um valor excepcionalmente alto ou baixo na série, para
que essa medida de dispersão acuse um valor inadequado.
Fórmulas de recorrência:

AT = Ls - Li (para série de valores)


AT = Lsmax - Limin (para distribuição de freqüências por classes)
Exemplo:
Dadas as séries, identificar a menos dispersa.
X1 = { 3, 4, 5, 8, 9, 12, 15, 16} e X2 = { 2, 5, 8, 9, 10, 13, 15, 20}
AT1 = 16 - 3 = 13 AT2 = 20 - 2 = 18
R: A série menos dispersa é X1, porque apresentou menor medida de dispersão.

3.2.2 - Intervalo Quartil (Iq)


É usado para eliminar as flutuações do acaso, abandonando-se os valores extremos da
distribuição. A variabilidade é medida através dos quartis inferior e superior, desprezando-se 25% dos
valores mais baixos da distribuição e 25% dos valores mais altos. O intervalo quartil, também
chamado intervalo interquartil, é representado pela diferença entre o quartil superior e o quartil inferior.
Fórmula de recorrência: Iq = Q3 - Q1
2

Exemplo:
Sabe-se que foi encontrado de duas distribuições A e B os seguintes quartis: A: Q 1 = 22 cm e Q3 = 30
cm e B: Q1 = 18 cm e Q3 = 28 cm. Qual das duas distribuições é a mais dispersa?

IqA = 30 - 22 = 8 cm IqB = 28 - 18 = 10 cm

R: A distribuição mais dispersa é a B, porque apresentou maior medida de dispersão.

3.2.3- Intervalo Semiquartil (Q)

O intervalo semiquartil é conhecido também pelos seguintes nomes: desvio quartil, intervalo
semi-interquartil e afastamento provável.
Intervalo semiquartil é a metade do intervalo quartil. Ao dividirmos o intervalo quartil por 2,
presumimos que a distribuição não se afaste muito da forma simétrica. Numa distribuição
rigorosamente simétrica coincidem a média, a moda e a mediana. Ainda mais: os quartis são
eqüidistantes da mediana, de modo que, se dividirmos por 2 o intervalo quartil, obteremos a distância
da mediana ao 1o quartil e a distância da mediana ao 3 o quartil.
Fórmula de recorrência: Q = Q3 - Q1
2

Exemplo:
Sabe-se que foi encontrado de duas distribuições C e D os seguintes quartis: C: Q 1 = 22 cm e Q3 = 30
cm e D: Q1 = 18 cm e Q3 = 28 cm. Utilizando o intervalo quartil, identificar qual das duas distribuições
é a mais homogênea.

QC = (30 - 22)/2 = 4 cm QD = (28 - 18)/2 = 5 cm

R: A distribuição mais homogênea é a C, porque apresentou menor medida de dispersão.

3.2.4 - Desvio Médio (Dm)

O desvio médio é definido como sendo a média aritmética dos desvios absolutos da
distribuição, medidos em relação a uma medida de tendência central: média ou mediana. É mais
usado em relação à média.
Fórmula de recorrência:

a) para série Dm = x 


n
b) para distribuição de freqüências Dm =  F.x  onde x = X - X ou X - Me.
F

3.2.4.1- Características do Desvio Médio

1) Depende de todos os valores da distribuição, fazendo com que seu resultado apresente maiores
seguranças em relação à amplitude total e desvio quartílico.
2) Seu cálculo pode ser efetuado a partir da média ou da mediana, sendo mínimo quando calculado a
partir da mediana.
3) Não leva em consideração a existência de desvios negativos; isto porque seu cálculo é medido em
termos absolutos.
4) Quando partimos do Desvio Médio das duas partes de um conjunto de valores, não chegamos ao
Desvio Médio do conjunto.
5) Poderá substituir o desvio padrão, quando este for influenciado indevidamente pelos desvios
extremos.
3

Exemplo1:

Seja X = {2, 5, 8, 15, 20}. Encontre o Dm.

X =  X /n = 50/5 = 10 x = {-8, -5, -2, +5, +10} x  = 8+5+2+5+10 = 30

Dm = x  / n = 30/5 = 6 R : Dm = 6

Exemplo 2:
Dada a tabela calcular o Dm

X F XF x =X - X x F
5 2 10 5 - 8,37 = 3,37 6,74
6 5 30 6 - 8,37 = 2,37 11,85
8 13 104 8 - 8,37 = 0,37 4,81
10 3 30 10 - 8,37 =1,63 4,89
11 7 77 11 - 8,37 = 2,63 18,41
 30 251 - 46,70

X = XF/F = 251/ 30 = 8,37 Dm = x F /  F = 46,70/30 = 1,56 R: Dm = 1,56

Exemplo 3:
dada a tabela calcular o Dm

Classes F Xi XF x = X - X x F
05 10 5 7,5 37,5 7,5 - 17,5 = 10 50
10 15 10 12,5 125,0 12,5 - 17,5 = 5 50
15 20 15 17,5 262,5 17,5 - 17,5 = 0 0
20 25 10 22,5 225,5 22,5 - 17,5 = 5 50
25 30 5 27,5 127,5 27,5 - 17,5 = 10 50
 45 - 787,5 - 200

X =  XF/ F = 787,5 /45 = 17,5 Dm =  F.x  /  F = 200 / 45 = 4,44 R: Dm = 4,44


4

3.2.5 - Variância ( 2 ) e Desvio padrão (  )

Calcula-se a variância da mesma forma que o desvio médio, sendo que os desvios são
elevados ao quadrado antes da soma. O desvio padrão é simplesmente a raiz quadrada positiva da
variância. Por definição, o desvio padrão é a média quadrática dos desvios tomados em relação à
média aritmética.
O desvio padrão é o índice de variabilidade mais estável e mais geralmente empregado no
trabalho experimental e de pesquisa. Seu processo de cálculo difere em vários aspectos do cálculo do
desvio médio porque, embora se baseie, também, em propriedade da média aritmética (“A soma dos
quadrados dos desvios em relação à média é um mínimo”), não trabalha com valores absolutos
desses desvios (ou afastamentos), contornando o problema dos sinais elevando os desvios (ou
afastamentos) ao quadrado.
Fórmula de recorrência:

2 = (X - X )2 ou 2 = x2 onde x = X - X ;


n n

 =  2

3.2.5.1 - Outras Fórmulas de cálculo da variância e do desvio padrão:


a) Para séries sem valores repetidos

2 = (X - X)2 =  x2 ( 1)  =  2
n n
b) Para séries com números repetidos ou tabelas(para ser usada sempre que os valores não forem
muito grandes)

2 = (X - X)2F (2)  =  2


F
ou
2 = (X2F /F) - (XF/F)2 (2)  =  2

c) Para tabelas (para ser usada sempre que os valores forem grandes)

2 = (d2F /F ) - (dF/F)2 (3)  =  2 , onde d = X - X0

X0 é valor arbitrado( escolhido) na coluna X.


d) Para tabelas onde o h (intervalo de classe) seja constante

2 = h2[(Z2F /F) - (ZF/F)2] (4)  =  2 , onde Z = (X - X0 ) / h

Obs: se o conjunto de números constitui uma população, ou se a finalidade de somar os dados é


apenas para descrevê-los, e não fazer inferências sobre uma população, então se deve usar n no
denominador. Se estivermos trabalhando com amostra usamos no denominador n - 1. Consideramos
para a variância da amostra o símbolo S2 e para o desvio padrão o símbolo S.
5

Exemplo 1:
Calcular a variância e o desvio padrão da série: 3, 6, 9, 12, 15.

Usaremos a fórmula (1), que é a mais conveniente, neste caso, pois a série não possui números
repetidos.

X =  X/n = 45/5 = 9

2 = (X - X)2 /n = [(3-9)2+(6-9)2+(9-9)2+(12-9)2+(15-9)2] / 5 = 90/5 = 18 2 = 18


 =  2 =  18 = 4,24  = 4,24

Exemplo 2:
Calcular a variância e o desvio padrão da série de notas do 1o GQ: 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10.

Notas No de XF X2F
Alunos
1 15 15 15
2 7 14 28
3 5 15 45
4 2 8 32
5 6 30 150
6 3 18 108
7 6 42 294
8 3 24 192
9 6 54 486
10 1 10 100
 54 230 1450

Usaremos a fórmula (2), que é a mais conveniente nesse caso, pois os números da coluna X não são
grandes.

2 = (X2F /F ) - (XF/F)2 = 1450/54 - ( 230/54 )2 = 26,8519 - 18,1413 = 8,7106 2 = 8,7106


 =  2 =  8,7106 = 2,9514  = 2,9514

Exemplo 3:
Calcular a variância e o desvio padrão da tabela abaixo

Pesos F d = X - X0 dF d2F
(kg)
170 19 -60 - 1.140 68.400
195 25 -35 - 875 30.625
230 = X0 33 0 0 0
250 17 20 340 6.800
290 11 60 660 39.600
310 6 80 480 38.400
 111 - -535 183.825

Usaremos a fórmula (3 ), que é a mais conveniente, neste caso, pois os números da coluna X são
grandes.
2 =(d2F /F) - (dF/F)2 =183.825/111 - (-535/111)2 =1.656,0811 - 23,2307 = 1632,8504
2 = 1.632,8504
 =  2 =  1.632,8504 = 40,4085  = 40,4085 kg
6

Exemplo 4:
Calcular a variância e o desvio padrão da tabela abaixo

Pesos F Z ZF Z2F
(kg)
170 19 -2 -38 76
175 28 -1 -28 28
180 = X0 37 0 0 0
185 13 1 13 13
190 11 2 22 44
195 6 3 18 54
 114 - -13 215

Usaremos a fórmula (4), que é a mais conveniente, neste caso, pois o h é constante ( h=5 ).
2 = h2[(Z2F/F) - (ZF/F)2] = 52[215/114-(-13/114)2] =25[1,8860 - 0,0130] = 25[1,8730] = 46,8250
2 = 46,8250
 =   =  46,8250 = 6,8429
2  = 6,8429 kg

OBS: Se a tabela for uma distribuição de freqüências por classes temos que calcular o ponto
médio das classes antes de utilizar quaisquer das três fórmulas, (2), (3) ou (4).

Exemplo 5:
Calcular a variância e o desvio padrão da tabela abaixo

Estaturas F Xi Z ZF Z2F
(cm)
150 156 12 153 -2 -24 48
156 162 23 159 -1 -23 23
162 168 34 165=X0 0 0 0
168 174 18 171 1 18 18
174 180 8 177 2 16 32
180 186 6 183 3 18 54
 101 - - 5 175
Usaremos a fórmula (4), que é a mais conveniente, neste caso, pois o h é constante (h = 6).

2 = h2 [( Z2F/  F) - ( ZF /  F)2 ] = 62[175/101 -(5/101)2] = 36[1,7327-0,0025] =


36[1,7302] = 62,2872 cm2 2 = 62,2872 cm2
 =  2 =  62,2872 = 7,8922 cm  = 7,8922  7,89  7,9 cm

3.2.5.2 - Propriedades da variância e do desvio padrão

Primeira:
A variância e o desvio padrão de uma distribuição não se alteram se acrescentarmos
algebricamente uma constante k a todos os termos da distribuição, isto é:

y2 = x2 e y = x
Demonstração:
Seja o conjunto X = {X1, X2, X3,..., Xn }, acrescentemos algebricamente a constante k a todos
os termos do conjunto X, desta forma criamos um novo conjunto, digamos, Y, formados pelos termos:
X1 + k, X2 + k, X3 + k,..., Xn + k.
Assim sendo podemos afirmar que a variância do conjunto X é x2 =  (X - X)2 / n e a
variância do conjunto Y é y2 =  [(X + k) - ( X + k ) ]2 / n.
Desenvolvendo matematicamente a variância de Y, temos:

y2 =  [(X + k) - ( X + k ) ]2 / n = [ X + k - X - k]2 / n =  (X - X )2 / n = x2,


7

logo y2 = x2 e y = x , quando acrescentamos algebricamente uma constante k a todos os


elementos do conjunto.

Exemplo 1:
Do conjunto X = { 10, 20, 30, 40} cuja variância vale 125 e o desvio padrão 11,2, foi diminuído de cada
um de seus termos 5 unidades. Mostre que a variância do novo conjunto formado é também 125 e o
desvio padrão é 11,2.
Dados: x2 = 125 e x = 11,2 k = - 5

Y = [(10-5), (20-5), (30-5), (40-5)] = {5, 15, 25, 35}; Y =  Y/ n = 80 / 4 = 20.

y2 =  (Y – Y )2 / n = [(5-20)2+(15-20)2+(25-20)2+(35-20)2]/4 = [225+25+25+225]/4 = 500/4 = 125


y2 = 125
y = y2 =  125 = 11,2 y = 11,2

Exemplo 2:
Apurou-se de determinada distribuição uma variância igual a 400, em seguida, todos o seus termos
foram aumentados de 10 unidade. Qual é o desvio padrão da nova distribuição?

Dados: x2 = 400, K = 10 e queremos y ?

Como houve acréscimo de 10 unidades, então podemos afirmar que x2 = y2 = 400 e x = y,
logo y = y2 =  400 = 20 então y = 20.

Segunda
Se multiplicarmos (ou dividirmos) todos os termos de uma distribuição por uma constante k
(ou 1/k), a variância da nova distribuição é igual à variância da primitiva multiplicada por k2 (ou por
1/k2) e o desvio padrão é igual ao da primitiva multiplicado por k ( ou por 1/k), isto é:

para a multiplicação: y2 = k2x2 e y = k x

para a divisão: y2 = (1/k2)x2 e y = (1/ k) x

Demonstração:
Seja o conjunto X = {X1, X2, X3,..., Xn } , se multiplicarmos por k todos os termos do conjunto
criamos um novo conjunto, digamos Y, formado pelos termos: k X 1,k X2, kX3, ..., kXn.
Assim sendo, podemos escrever que a variância do conjunto X é x2 =  (X - X)2 / n e a
variância do conjunto Y é y2 = [(X k) - (X k)]2 /n.
Desenvolvendo matematicamente a variância de Y, temos:

y2 = [(X k) - (X k)]2 /n = [k(X - X)]2/n = k2(X - X)2/n = k2 ( X - X)2/n = k2x2, logo

y2 = k2x2 e y = k x, quando multiplicamos todos os termos de uma distribuição por uma
constante k.

Exemplo 1:
Do conjunto X = {10, 20, 30, 40}, cuja variância vale 125 e o desvio padrão 11, 2, multiplicou-se cada
um de seus termos por 2 unidades. Mostre que a variância do novo conjunto formado é igual ao da
primitiva multiplicado por 22 e que o desvio padrão é igual ao da primitiva multiplicado por 2.

Dados: x2 = 125 ; x = 11,2 e k = 2

Y = {(10.2), (20.2), (30.2), (40.2)} = {20, 40, 60, 80}; Y =  Y/ n = 200/4 = 50


y2 = (Y – Y)2 / n = [(20-50)2+(40-50)2+(60-50)2+(80-50)2]/4 = [900+100+100+900]/4 = 2000/4 = 500
y2 = 500  500 = 22 (125) = 4(125), logo y2 = k2x2
8

y = y2 =  500 = 22,4  y = 22,4  22,4 = 2(11,2), logo y = k x.

Exemplo 2:
Apurou-se de determinada distribuição uma variância igual a 400, em seguida, todos os seus termos
foram multiplicados por 2. Qual é o desvio padrão da nova distribuição?

Dados: x2 = 400; k = 2 e queremos y?

Como houve a multiplicação por 2 unidades, então podemos afirmar que y2= k2 x2 = 22. 400 e
y = k x , logo y =  k2 y2 =  22 400 = 2 .20 =40 então y = 40.

Terceira:
A variância de uma distribuição é igual à média aritmética dos quadrados dos seus termos
menos o quadrado de sua média aritmética, isto é:

2 = (X2/ n) - X2

Demonstração:

2 =  (X - X)2/n =  (X2 - 2X.X + X2)/n = (X2 - 2.XX + X2)/n = X2/n - 2.X. X/n + nX2/n

= X2/n - 2.X.X + X2 = X2/n - 2X2 + X2 = X2/ n - X2

Exemplo:
Qual é o desvio padrão de uma distribuição composta de 20 termos cuja soma dos quadrados dos
termos é 500 e sua média aritmética é 4?

Dados: n = 20, X2 = 500 X = 4 e queremos  ?

2 = (X2/ n) - X2 = 500/20 - 42 = 25 - 16 = 9, como  = 2 =  9 =3


então  = 3

Quarta: Variância de distribuição combinada

Muitas vezes desejamos reunir em uma só distribuição de freqüências dados obtidos em dois
ou mais grupos, dos quais já conhecemos as respectivas médias e variâncias.
Podemos reunir as variâncias já calculadas em uma única medida, sem ter que refazer os
cálculos para a distribuição total. Para tanto, valemo-nos da seguinte fórmula:

t2 = [n1(12 + h12)+ n2(22 + h22)]/n

onde:
t2 é a variância total da distribuição.
n1 é o número de elementos da 1ª distribuição; n2 é o número de elementos da 2ª distribuição.
12 é o número de elementos da 1ª distribuição; 22 é o número de elementos da 2ª distribuição.
h12 = (X1-Xt)2 e h22 = (X2-Xt)2 sendo X1 a média aritmética da 1ª distribuição, X2 a média
aritmética da 2ª distribuição e Xt é a média aritmética da distribuição total ( é a média das médias).
n é o número de elementos total da distribuição, isto é, n = n1 + n2.
OBS: essa fórmula foi adaptada para dois grupos, e pode ser expandida para mais grupos.

Exemplo:
Um teste de raciocínio foi aplicado a duas turmas da mesma escola. A turma A, com 35 alunos,
obteve média aritmética 6,11 com desvio padrão 2,38. A turma B, com 40 alunos obteve média
9

aritmética 6,29 com desvio padrão 2,25. Qual a variância total se considerarmos as duas turmas
conjuntamente?

Dados: n1 = 35 ; X1 = 6,11; 1 = 2,38; n2 = 40; X2 = 6,29 ; 2 = 2,25 e queremos t2 ?

Cálculo da média total (média das médias) Xt

Xt = (n1X1 + n2X2)/(n1 + n2 ) = [35.(6,11) + 40.(6,29)]/(35+40) = [213,85+251,6]/75 = 6,21

Cálculo de h12 e h22

h12 = (X1-Xt)2 = (6,11 - 6,21)2 = ( - 0,1)2 = 0,01


h22 = (X2-Xt)2 = (6,29 - 6,21)2 = ( 0,08)2 = 0,0064

Cálculo da variância total t2

1 = 2,38  12 = 5,6644 e 2 = 2,25  22 = 5,0625

t2 = [n1(12 + h12) + n2(22 + h22)]/n = [35(5,6644+0,01) + 40(5,0625+0,0064)]/75 =


[198,604 + 202,756]/75 = 401,36/75= 5,3515 t2 = 5,3515

Quinta:

Numa distribuição normal de freqüências, entre os valores X -  e X + , há 68,26% do total


de ocorrências.
Entre os valores X - 2 e X + 2, teremos 95,46% do total dos valores.
Entre os valores X - 3 e X + 3, há 99,73% do total dos valores, praticamente 100%, ou seja,
quase a totalidade dos valores da distribuição.

Sexta

O desvio padrão é maior que o desvio-médio.

3.2.6 - Covariância

A covariância de uma estatística de duas variáveis (X e Y), define-se como a média aritmética
dos produtos dos desvios padrões de cada uma das variáveis em relação à média aritmética.
Dessa forma, covariância é:

Sxy = (Xi - X)(Yi - Y) =  (xy)


n n
onde: n é o número de pares de informação;
x = (Xi - X) e y = ( Yi - Y)

Obs: pode-se, também, calcular os desvios-padrão a partir das variâncias de X e Y.

Exemplo:
Duas variáveis X e Y observadas conjuntamente apresentaram os seguintes resultados:

Sujeitos A B C D E
X 4 6 10 12 13
Y 0 1 2 3 4
10

Calcular a covariância.

X Y x = (X - X) y = (Y - Y) xy
4 0 -5 -2 10
6 1 -3 -1 3
10 2 +1 0 0
12 3 +3 +1 3
13 4 +4 +2 8
45 10 - - 24

X =  X = 45 = 9 Y =  Y = 10 = 2
n 5 n 5

Sxy =  (xy) = 24 = 4,8


n 5

A covariância é utilizada para verificar a independência de duas variáveis ( X e Y ). Se as


variáveis X e Y forem independentes a covariância será nula.

3.3 - MEDIDAS DE DISPERSÃO RELATIVA

As medidas de dispersão relativas nos oferecem um grau maior de confiabilidade do que as


absolutas. Alem disso, nos permite comparar diversas distribuições, mesmo sedo referentes a
fenômenos diferentes. Os resultados analíticos são efetuados entre uma medida de dispersão
absoluta e uma medida de posição, e seu resultado final é expresso em termos relativos ou
percentuais.

3.3.1 - Desvio quartil reduzido ( Dq)


Sua aplicação é bastante restritiva, visto que não abrange todos os valores da distribuição.
Seu cálculo é bastante simples, bastando conhecer o primeiro e o terceiro quartil e a mediana.
Fórmula de recorrência:
Dq = [(Q3 - Q1) / 2Me ] . 100 %

Exemplo:
Uma distribuição de freqüências apresentou os seguintes parâmetros:
Q1 = 2,04 ; Q3 = 6,65 e Me = 4,7 . Calcule o desvio quartil.

Dq = [(Q3 - Q1) /2Me ] . 100 % = [(6,65 - 2,04)/2(4,7)]. 100% = 49,04 Dq = 49,04%

3.3.2 - Coeficiente de variação (Cv)

Esta medida de variação relativa ou percentual foi proposta por Karl Pearson e é o quociente
entre a dispersão absoluta (desvio-padrão) e a medida de tendência central (média aritmética).
Fórmula de recorrência:

Cv = (/X) .100%

Com o Cv medimos o grau de heterogeneidade das distribuições, o valor máximo de Cv


é 1 ou 100%; então quanto mais próximo de 1 ou 100% for o Cv encontrado, mais heterogênea
é a distribuição, isto quer dizer que mais dispersos estão os valores de Xi em torno da média.

Utilizamos essa medida para comparar a variabilidade de grupos de resultados em situações,


tais como:
11

a) médias muito diferentes numa mesma escala

Exemplo:
Um grupo de meninos de 8 anos apresentou para média aritmética de suas alturas 128 cm com
desvio-padrão de 12cm e um grupo de meninos de 12 anos apresentou para média das alturas 158
cm com desvio-padrão de 14 cm. Qual dos dois grupos é o mais disperso?

Solução: Cv (8 anos) = (12/128).100 = 9,38%


Cv (12 anos) = (14/158).100 = 8,86%

Embora o grupo de meninos de 12 anos pareça mais disperso quanto à altura  (12 anos) = 14 cm> 
(8 anos) = 12 cm, após calcular o Cv de cada grupo, verificamos que o grupo de meninos de 8 anos é
mais variável que o de 12 anos.

R: O grupo de meninos de 8 anos porque apresentou maior Cv.

b) diferentes escalas de medidas


Exemplo:
Determinado grupo de crianças apresentou as seguintes estatísticas: altura média 129 cm com
desvio-padrão de 12 cm e peso médio de 45 kg com desvio-padrão de 5 kg. Qual das distribuições é
a mais homogênea?

Solução: Cv(altura) = (12 cm/129 cm).100 = 9,30 %


Cv (peso) = (5 kg / 45 kg).100 =11,11%

R: A distribuição das alturas é mais homogênea, pois apresentou menor Cv.

EXERCÍCIOS DA UNIDADE 3
1 ) Calcule a amplitude para os dados: 1, 2, 3, 4, 5.
a) 2; b) 0; c) 4; d) 3; e) 1.

2) Calcule a variância e o desvio-padrão para os dados X = {0, 2,4, 6, 8} .


a) 8 e 4; b) 8 e 2,8; c) 8 e 2; d) 8 e 3; e) 4 e 8.

3) Para obter o peso médio de um conjunto de ratos tanto se pode pesar cada rato por vez como
pesar todos os ratos de uma vez. No entanto obtemos mais informações se pesarmos um rato por
vez. Por quê?

a) é mais prático; b) não se consegue pesar todos os ratos ao mesmo tempo; c) auxilia na contagem
do número de ratos; d) os pesos individuais permitem calcular a variância, que mede a dispersão; e)
os pesos individuais permitem determinar o tamanho dos ratos.

4) De acordo com alguns, Estatística é uma ciência engraçada porque, se formos ao restaurante e eu
comer um frango, enquanto você não come nenhum, em média comemos, cada um, meio frango e
estamos muito satisfeitos. Discuta a validade dessa média. ( média = 0,5 ; variância = 0,5 ).

a) A média não tem significado porque a variabilidade é muito grande; b) a média é significativa
porque é igual à variância; c) nada se pode afirmar quanto à média; d) a média representa com
clareza o consumo realizado; e) a média tem significado porque a variabilidade é muito pequena.

Com os dados abaixo responder as perguntas 5, 6, 7 e 8.

Xi 2 3 4 5 6 7 8
Fi 1 3 5 8 5 4 2
12

5) Qual a amplitude total da distribuição?


a) 2; b) 5; c) 7; d) 4; e) 6.

6) Qual o desvio-padrão?
a) 5,2 b) 1,51 c) 2,29 d) 64,12 e) 28.

7) Como podemos analisar a homogeneidade da distribuição?

a) através da variância; b) através da amplitude total; c) através do coeficiente de variabilidade;


8) através da média; e) através do desvio padrão.

8) A distribuição é homogênea?
a) sim b) não.

9) Sabendo-se que um conjunto de dados apresenta para média aritmética e para desvio-padrão,
respectivamente, 18,3 e 1,47, calcule e interprete o coeficiente de variação.

a) 0,08,a distribuição é pouco homogênea e isto significa que os X i estão bastante afastados da
média aritmética, levando-nos a não acreditar na tipicidade da média aritmética;
b) 0,08,a distribuição é bastante homogênea e isto significa que os X i estão bastante próximos da
média aritmética, levando-nos a acreditar na sua tipicidade da média aritmética.

Consideremos duas variáveis X e Y, cuja amostra de 5 pares de observações nos fornecem os


seguintes resultados:
X 10 20 30 40 50
Y 6 8 7 8 6
Com esses dados responda as perguntas 10, 11 e 12.

10) Qual a covariância da distribuição?


a) 4 b) 7 c) 14,14 d) 0,89 e) 0.

11) Qual o desvio padrão da variável X e da variável Y?


a) 14,14 e 0,89 b) 0,89 e 14,14 c) 14,14 e 7 d) 0,89 e 30 e) 30 e 7.

12) As variáveis X e Y são independentes?


a) sim b) não

13) Dadas as estaturas de 140 universitários fluminenses abaixo calcular a variância e o desvio
padrão das estaturas.

Estaturas No de Xi
(cm) Alunos
145  150 2
150  155 10
155  160 27
160  165 38
165  170 27
170  175 21
175  180 8
180  185 7
 140 -
a) 61,96 e 5,89 b) 7,87 e 61,96 c) 61,96 e 7,87 d) 8,89 e 30 e) 30 e 7.
13

SOLUÇÃO DOS EXERCÍCIOS DA UNIDADE 3

1) AT = Ls – Li = 5 – 1 = 4 c)

2) X = { 0, 2, 4, 6, 8 }
X = Xi = 20 = 4
n 5
2 = ( X – X )2 = (0 – 4)2+(2 – 4)2+(4 –4)2+(6 – 4)2+(8 – 4)2 = 16+4+0+4+16 = 40 = 8 2 = 8
n 5 5 5
 = 2 =  8 = 2,8  = 2,8 b)

2) d)
3) d)

X F XF X2F
2 1 2 4
3 3 9 27
4 5 20 80
5 8 40 200
6 5 30 180
7 4 28 196
8 2 16 128
 28 145 815

5) AT = Ls – Li = 8 – 2= 6 e)

6)  ?

2 =  X2F - ( XF )2 = 815 – ( 145 )2 = 29,1071 – 26,8176 = 2,2895


F F 28 28

 = 2 =  2,2895 = 1,51  = 1,51 b)

7) c)

8) Cv =  . 100% ?
X

X = XF = 145 = 5,18 Cv = 1,51. 100% = 29,15%, logo a distribuição é homogênea. a)


F 28 5,18

9) b)

X Y x = (X – X ) y = (Y – Y ) xy x2 y2
10 6 (10 – 30) = -20 (6 – 7) = -1 20 400 1
20 8 (20 – 30) = -10 (8 – 7) = 1 -10 100 1
30 7 (30 – 30) = 0 (7 – 7) = 0 0 0 0
40 8 (40 – 30) =10 (8 – 7) = 1 10 100 1
50 6 (50 – 30) = 20 ( 6 – 7) = -1 -20 400 1
150 35 0 0 0 1.000 4

X = X = 150 = 30 ; Y = Y = 35 = 7
n 5 n 5
10) Sxy =  (xy) = 0 = 0 Sxy = 0 e)
n 5
14

11) x? e y?

x2 = (X - X)2 =  x2 = 1.000 = 200 x =  x2 =  200 = 14,14


n n 5

y2 = (Y - Y)2 =  y2 = 4 = 0,80 x =  x2 =  0,80 = 0,89


n n 5

12) a)

13)
Estaturas No de Xi Z ZF Z2F
(cm) Alunos
145  150 2 147,5 -3 -6 18
150  155 10 152,5 -2 -20 40
155  160 27 157,5 -1 -27 27
160  165 38 162,5 0 0 0
165  170 27 167,5 1 27 27
170  175 21 172,5 2 42 84
175  180 8 177,5 3 24 72
180  185 7 182,5 4 28 112
 140 - - 68 380

2 = h2[ Z2F - ( ZF )2 ] = 52[ 380 - ( 68 )2 ] = 25[ 2,7143 – 0,2359 ] = 25 [2,4784] = 61,96 cm2
F F 140 140

 =  2 =  61,96 = 7,87 cm. c)

Você também pode gostar