Você está na página 1de 8

Estatstica Prof Eldimar Barcellos CAPTULO V - Medidas de Disperso 1.

Introduo
Uma breve reflexo sobre as medidas de tendncia central permite-nos concluir que elas no so suficientes para caracterizar totalmente uma seqncia numrica. Se observarmos as seqncias: X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10. Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13. Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13. concluiremos que todas possuem a mesma mdia 13. No entanto, so seqncias completamente distintas do ponto de vista da variabilidade de dados. Na seqncia Z no v variabilidade de dados. A mdia 13 representa bem qualquer valor da srie. Na seqncia Y, a mdia 13 representa bem a srie, mas existem elementos da srie levemente diferenciados da mdia 13. Na seqncia X existem muitos elementos bastante diferenciados da mdia 13. Conclumos que a mdia 13 representa otimamente a seqncia Z, representa bem a seqncia Y, mas no representa bem a seqncia X. Precisaremos, ento, de medidas que avaliem a representatividade da mdia. Para isto usaremos as medidas de disperso. Observe que na seqncia Z os dados esto totalmente concentrados sobre a mdia 13. No h disperso de dados. Na seqncia Y h forte concentrao dos dados sobre a mdia 13, mas h fraca disperso de dados. J na srie X h fraca concentrao de dados em torno da mdia 13 e forte disperso de dados em relao mdia. As principais medidas de disperso absolutas so: desvio mdio, varincia e desvio padro.

2. Clculo das medidas de disperso para dados no agrupados


2.1. Desvio Mdio O conceito estatstico de desvio corresponde ao conceito matemtico de distncia. A disperso dos dados em relao mdia de uma seqncia pode ser avaliada atravs dos desvios de cada elemento da seqncia em relao mdia da seqncia. O desvio mdio definido como sendo uma mdia aritmtica dos desvios de cada elemento da srie para a mdia da srie. Exemplo 1: Considere as notas 2 8 5 6 obtidas por 4 alunos, numa avaliao de Biologia, distribudas na tabela abaixo. Determine o desvio mdio.

Interpretao: Em mdia, cada elemento da seqncia est afastado do valor 5,25 por 1,75 unidades.

2.2. Varincia (s2) e Desvio padro (s) Pelo exemplo anterior, observamos que a dificuldade em se operar o DM se deve presena do mdulo, para que as diferenas xi X possam se interpretadas como distncias. Outra forma de se conseguir que as diferenas xi X se tornem sempre positivas ou nulas considerar o quadrado destas diferenas, isto , (xi X )2. Se substituirmos, na frmula do DM a expresso x i - X por (xi X )2, obteremos nova medida de disperso chamada varincia. A varincia pode, tambm, ser representada por 2 (sigma ao quadrado). O smbolo a letra grega minscula sigma. Podemos abreviar tambm a varincia por Var. A frmula geral da varincia : s
2

x -X ) + ( x -X ) + ( x -X ) = (
2 2 1 2 3

+ ... + xn -X

x - x) = (
i

O desvio padro a raiz quadrada da varincia. Em particular, para estas medidas levaremos em considerao o fato de a seqncia de dados representar toda uma populao ou apenas uma amostra de uma populao. Se conhecermos todos os valores da populao de interesse, s2 e s so chamados varincia populacional e desvio padro populacional. Se estivermos trabalhando com uma amostra, sem conhecermos o verdadeiro valor da mdia ou do desvio padro, admitimos que a mdia da amostra ( X ) esteja prxima do valor da mdia populacional, e que a varincia da amostra (varincia amostral) esteja prxima da varincia populacional. A raiz quadrada da varincia amostral chamada desvio padro amostral. H duas frmulas diferentes para o clculo da varincia: verso 1: s
2
1

x - x) + ( x - x) + ( x - x) = (
2 2 2 3

+ ... + xn - x

x = (

- x .fi n

= (varincia populacional)

verso 2: s
2

x - X) + ( x = (
2 1

- X + x3 - X + ... + xn - X n -1

) (
2

x = (

- x .fi

n -1

(varincia amostral)

Exemplo 2: Considere as notas 2 8 5 6 obtidas por 4 alunos, numa avaliao de Biologia, distribudas na tabela abaixo. Calcule o desvio padro.

3. Clculo do desvio padro para dados agrupados sem intervalos de classe


Exemplo: Calcule o desvio padro da srie abaixo, representativa de uma populao. xi 2 3 4 5 fi 3 5 8 4 xi . fi
xi - x

(x i - x ) 2

(xi - x)2 .fi

4. Clculo do desvio padro para dados agrupados com intervalos de classe


Exemplo: Calcule o desvio padro da srie abaixo, representativa de uma populao. Classe 1 2 3 4 Int. classe 0 | 4 4 | 8 8 | 12 12 | 16 fi 1 3 5 1 xi xi . fi
xi - x

(xi - x)2

(xi - x)2 .fi

Comentrios: a) No clculo da varincia, quando elevamos ao quadrado a diferena (xi X ), a unidade de medida da srie fica tambm elevada ao quadrado. Portanto, a varincia dada sempre no quadrado da unidade de medida da srie. Se os dados so expressos em metros, a varincia expressa em metros quadrados. Em algumas situaes, a unidade de medida da varincia nem faz sentido. o caso, por exemplo, em que os dados so expressos em litro. A varincia ser expressa em litros quadrados. Portanto, o valor da varincia no pode ser comparado diretamente com os dados da srie, ou seja: varincia no tem interpretao. b) Exatamente para suprir esta deficincia da varincia que se define o desvio padro. Como o desvio padro a raiz quadrada da varincia, o desvio padro ter sempre a mesma unidade de medida da srie e, portanto admite interpretao.

5. Coeficiente de variao (CV)


Se uma srie X apresenta x e s = 2 e uma srie Y apresenta y = 100 e s = 5, do ponto de vista da disperso absoluta, a srie Y apresenta maior disperso que a srie X. No entanto, se levarmos em considerao as mdias das sries, o desvio padro de Y que 5 em relao a 100 um valor menos significativo que o desvio padro de X que em relao a 10. Isto nos leva a definir a medida de disperso relativa, o coeficiente de variao. Esta medida til quando queremos saber se a disperso muito grande em relao mdia.

s . X Calculando, ento, o coeficiente de variao das sries citadas tem: 2 5 CVx = = 0,2 ou 20% CVy = = 0,05 ou 5% 10 100 O coeficiente de variao indicado por: CV = Comparando os valores destes dois coeficientes conclumos que a srie X admite maior disperso relativa. Como a medida de disperso relativa leva em considerao a medida de disperso absoluta e a mdia da srie, uma medida mais completa que a medida de disperso absoluta.

6. O uso do desvio padro


O desvio padro a mais importante das medidas de disperso. Na curva normal o valor da mdia aritmtica igual ao valor da moda e igual ao valor da mediana. = Md = Mo. x Quando uma curva de freqncia representativa da srie perfeitamente simtrica como a curva abaixo (ver fig. 5.1.), podemos afirmar que o intervalo [ x - s, x + s] contm aproximadamente 68% dos valores da srie.

68%

-S

+S

Zona de normalidade (2S)

fig. 5.1. O intervalo [ x - 2s, x + 2s] contm aproximadamente 95% dos valores da srie. O intervalo [ x - 3s, x + 3s] contm aproximadamente 99% dos valores da srie. Esses percentuais 68%, 95% e 99% citados na interpretao sero comprovadas, com maior preciso, no estudo da distribuio normal de probabilidades. Quando a distribuio no perfeitamente simtrica estes percentuais apresentam pequenas variaes para mais ou para menos, segundo o caso. De modo que, quando se afirma que uma srie mdia x = 100 e desvio padro s = 5, podemos interpretar estes valores da seguinte forma: a) Os valores da srie esto concentrados em torno de 100. b) O intervalo [95, 105] contm aproximadamente, 68% dos valores da srie. c) O intervalo [90, 110] contm aproximadamente, 95% dos valores da srie. d) O intervalo [85, 115] contm aproximadamente, 99% dos valores da srie. importante perceber que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contido no intervalo.

Exemplo 1: Foi observado que as contas de luz para uma rea municipal, no ms de junho, so normalmente distribudas. Se a mdia das contas for $ 42,00 e o desvio padro $ 12,00, entre que intervalo de valores esto 68% das contas? E 95% das contas?
x s = 42,00 12,00 = 30,00 x + s = 42,00 + 12,00 = 54,00

68% das contas esto entre os valores de $ 30,00 e $ 54,00


x 2s = 42,00 2 12,00 = 42,00 24,00 = 18,00 x + 2s = 42,00 + 2 12,00 = 42,00 + 24,00 = 66,00

95% das contas esto entre os valores de $ 18,00 e $ 66,00 Exemplo 2: No exemplo das pizzas, com uma mdia de 49 e um desvio padro de 8,731, temos que dois desvios padro abaixo da mdia correspondem a 49 - 2 x 8,731 = 49 - 17,462 = 31,538 e dois desvios padro acima da mdia correspondem a 49 + 17,462 = 66,462. Exerccios 60) Calcule o desvio padro da distribuio: Classes fi 2 | 6 | 10 | 14 | 18 | 22 5 12 21 15 7

61) Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o desvio padro, 0,80. Em Estatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro, 0,76. Em que disciplina foi maior a disperso? 62) Medidas as estaturas de 1017 indivduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso mdio desses mesmos indivduos 52 kg, com um desvio padro de 2,3 kg. Esses indivduos apresentam maior variabilidade em estatura ou em peso? 63) Um grupo de 85 moas tem estatura mdia de 160,6 cm, com um desvio padro igual a 5,97 cm. Outro grupo de 125 moas tem uma estatura mdia de 161,9 cm, sendo o desvio padro igual a 6,01 cm. Qual o coeficiente de variao de cada um dos grupos? Qual o grupo mais homogneo? 64) Um grupo de cem estudantes tem uma estatura mdia de 163,8 cm, com um coeficiente de variao de 3,3%. Qual o desvio padro desse grupo? 65) Uma distribuio apresenta as seguintes estatsticas: s = 1,5 e CV = 2,9%. Determine a mdia da distribuio. 66) Numa fbrica de rolamentos, retirou-se da produo de um determinado dia uma amostra de 10 rolamentos, dos quais se mediu o dimetro externo, em mm, obtendo-se: 20,2 21,7 21,4 20,4 20,8 22,0 19,6 20,5 22,1 19,3

Calcular a mdia e o desvio padro desta amostra.

67) Calcular a mdia e o desvio padro da seguinte distribuio de uma varivel X.

faixas de observaes 0 | 10 10 | 20 20 | 30 30 | 40 40 | 50 Total

freqncia 25 48 66 44 17 200

68) Usando o histograma da distribuio do exerccio anterior, calcular: a) a porcentagem das observaes compreendidas entre X - S e X + S. b) a porcentagem das observaes compreendidas entre X - 2S e X + 2S. 69) Em 120 experimentos, onde cada um consiste em lanar 3 moedas e contar o nmero de caras, obtivemos os seguintes resultados: N de caras N de experimentos 0 18 1 40 2 49 3 13

Calcular a mdia, a varincia e o desvio padro do nmero de caras observado em cada experimento. 70) Dado um conjunto de observaes de uma varivel quantitativa X, se somarmos 3 unidades a cada observao o que ocorrer: a) com a mdia? b) com a varincia? c) com o desvio padro? 71) Uma amostra de 900 lmpadas foi testada para se determinar a durabilidade. Os dados foram: Durabilidade em horas 1000 | 1100 1100 | 1200 1200 | 1300 1300 | 1400 1400 | 1500 1500 | 1600 1600 | 1700 1700 | 1800 1800 | 1900 1900 | 2000 Total freqncia 15 30 82 94 107 136 158 144 95 39 900 xi . fi (xi X )2 . fi

O fabricante garante que no mximo 3% das lmpadas tm durabilidade menor que 1200 horas e que a durabilidade mdia de 1575 horas. Na amostra testada a) qual a porcentagem de lmpadas que duraram menos de 1200 horas? b) qual a durabilidade mdia? c) qual o desvio padro?

72) A tabela representa as estaturas de 35 crianas nascidas numa mesma maternidade numa certa semana.

estatura (cm) 45 46 46 47 47 48 48 49 49 50 50 51 51 52 52 53

no de crianas 1 4 6 12 8 3 0 1

Determinar a mdia e o desvio-padro das estaturas destas crianas: a) ao nascerem. b) ao completarem o primeiro ms de vida, supondo que no primeiro ms cada criana cresce 4 cm. 73) Um restaurante cobra o almoo de cada cliente atravs do peso (por quilo) da quantidade de alimento consumida. Foi observado, durante um ms, que as quantidades de alimento consumidas so normalmente distribudas. Se a mdia consumida for 550 g e o desvio padro 200 g, calcular: a) a amplitude do intervalo da zona de normalidade; b) a amplitude dos 95% centrais. 74) Os pratos produzidos por uma indstria tm dimetro mdio de 19 cm e desvio padro de 0,2 cm. Dois pratos A e B cujos dimetros medem respectivamente 19,8 cm e 18,3cm sero testados pelo Controle Estatstico de Qualidade, que admite uma tolerncia de trs desvios acima e trs abaixo da mdia. Assinale a alternativa correta: a) O prato A ser aprovado b) Ambos os pratos sero reprovados c) o prato A ser reprovado e o prato B aprovado d) o prato B ser reprovado. 75) O desvio padro de um conjunto de dados 16. A varincia ser: a)16 c) 256 b) 64 d) 4 76) A varincia de um conjunto de dados 16. O desvio padro ser: a) 4 c) 36 b) 256 d) 2 77) Calcule o desvio padro das seguintes populaes: a) X: 2, 3, 7, 9, 11, 13. b) Y: 5, 12, 4, 20, 13, 17. 78) Calcule o desvio padro das seguintes amostras: a) Z: 15, 16, 17, 20, 21. b) T: 6, 5, 10, 12, 19.