Escolar Documentos
Profissional Documentos
Cultura Documentos
3.1 - INTRODUÇÃO
Como foi visto anteriormente, procura-se representar uma série estatística através de
medidas de posição. Entretanto quase sempre essa representação é incompleta, visto que essas
medidas descrevem somente o posicionamento dos valores da série em relação a elas, sem explicar
ou determinar como se dá esse posicionamento ou, ainda, sem identificar como os valores da série se
distribuem ou se dispersam relativamente àquelas medidas. Assim sendo, é inviável representar
séries exclusivamente por medidas de posição. Para suprir essa insuficiência usam-se as medidas de
dispersão, que demonstram o grau de dispersão dos valores componentes das séries, relativamente
às medidas de posição.
As medidas de dispersão indicam se os valores da série estão relativamente próximos uns
dos outros, ou separados. Estas informações podem ser obtidas pelo estudo de medidas de
dispersão absolutas e relativas, sendo que as primeiras nos oferecem condições para analisarmos
até que ponto estes valores apresentam oscilações para mais ou para menos, em relação a uma
medida de posição fixada, e que vem expressa na mesma unidade de medida dos valores, a as
segundas em termos relativos ou percentuais.
Podemos, então definir medidas de dispersão da seguinte maneira: “Dadas duas ou mais
séries de valores, podemos dizer que a melhor delas, a mais homogênea, ou a menos dispersa
é aquela que apresentar menor medida de dispersão ou variabilidade”.
Exemplo:
Sabe-se que foi encontrado de duas distribuições A e B os seguintes quartis: A: Q 1 = 22 cm e Q3 = 30
cm e B: Q1 = 18 cm e Q3 = 28 cm. Qual das duas distribuições é a mais dispersa?
IqA = 30 - 22 = 8 cm IqB = 28 - 18 = 10 cm
O intervalo semiquartil é conhecido também pelos seguintes nomes: desvio quartil, intervalo
semi-interquartil e afastamento provável.
Intervalo semiquartil é a metade do intervalo quartil. Ao dividirmos o intervalo quartil por 2,
presumimos que a distribuição não se afaste muito da forma simétrica. Numa distribuição
rigorosamente simétrica coincidem a média, a moda e a mediana. Ainda mais: os quartis são
eqüidistantes da mediana, de modo que, se dividirmos por 2 o intervalo quartil, obteremos a distância
da mediana ao 1o quartil e a distância da mediana ao 3 o quartil.
Fórmula de recorrência: Q = Q3 - Q1
2
Exemplo:
Sabe-se que foi encontrado de duas distribuições C e D os seguintes quartis: C: Q 1 = 22 cm e Q3 = 30
cm e D: Q1 = 18 cm e Q3 = 28 cm. Utilizando o intervalo quartil, identificar qual das duas distribuições
é a mais homogênea.
O desvio médio é definido como sendo a média aritmética dos desvios absolutos da
distribuição, medidos em relação a uma medida de tendência central: média ou mediana. É mais
usado em relação à média.
Fórmula de recorrência:
1) Depende de todos os valores da distribuição, fazendo com que seu resultado apresente maiores
seguranças em relação à amplitude total e desvio quartílico.
2) Seu cálculo pode ser efetuado a partir da média ou da mediana, sendo mínimo quando calculado a
partir da mediana.
3) Não leva em consideração a existência de desvios negativos; isto porque seu cálculo é medido em
termos absolutos.
4) Quando partimos do Desvio Médio das duas partes de um conjunto de valores, não chegamos ao
Desvio Médio do conjunto.
5) Poderá substituir o desvio padrão, quando este for influenciado indevidamente pelos desvios
extremos.
3
Exemplo1:
Dm = x / n = 30/5 = 6 R : Dm = 6
Exemplo 2:
Dada a tabela calcular o Dm
X F XF x =X - X x F
5 2 10 5 - 8,37 = 3,37 6,74
6 5 30 6 - 8,37 = 2,37 11,85
8 13 104 8 - 8,37 = 0,37 4,81
10 3 30 10 - 8,37 =1,63 4,89
11 7 77 11 - 8,37 = 2,63 18,41
30 251 - 46,70
Exemplo 3:
dada a tabela calcular o Dm
Classes F Xi XF x = X - X x F
05 10 5 7,5 37,5 7,5 - 17,5 = 10 50
10 15 10 12,5 125,0 12,5 - 17,5 = 5 50
15 20 15 17,5 262,5 17,5 - 17,5 = 0 0
20 25 10 22,5 225,5 22,5 - 17,5 = 5 50
25 30 5 27,5 127,5 27,5 - 17,5 = 10 50
45 - 787,5 - 200
Calcula-se a variância da mesma forma que o desvio médio, sendo que os desvios são
elevados ao quadrado antes da soma. O desvio padrão é simplesmente a raiz quadrada positiva da
variância. Por definição, o desvio padrão é a média quadrática dos desvios tomados em relação à
média aritmética.
O desvio padrão é o índice de variabilidade mais estável e mais geralmente empregado no
trabalho experimental e de pesquisa. Seu processo de cálculo difere em vários aspectos do cálculo do
desvio médio porque, embora se baseie, também, em propriedade da média aritmética (“A soma dos
quadrados dos desvios em relação à média é um mínimo”), não trabalha com valores absolutos
desses desvios (ou afastamentos), contornando o problema dos sinais elevando os desvios (ou
afastamentos) ao quadrado.
Fórmula de recorrência:
= 2
2 = (X - X)2 = x2 ( 1) = 2
n n
b) Para séries com números repetidos ou tabelas(para ser usada sempre que os valores não forem
muito grandes)
c) Para tabelas (para ser usada sempre que os valores forem grandes)
Exemplo 1:
Calcular a variância e o desvio padrão da série: 3, 6, 9, 12, 15.
Usaremos a fórmula (1), que é a mais conveniente, neste caso, pois a série não possui números
repetidos.
X = X/n = 45/5 = 9
Exemplo 2:
Calcular a variância e o desvio padrão da série de notas do 1o GQ: 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10.
Notas No de XF X2F
Alunos
1 15 15 15
2 7 14 28
3 5 15 45
4 2 8 32
5 6 30 150
6 3 18 108
7 6 42 294
8 3 24 192
9 6 54 486
10 1 10 100
54 230 1450
Usaremos a fórmula (2), que é a mais conveniente nesse caso, pois os números da coluna X não são
grandes.
Exemplo 3:
Calcular a variância e o desvio padrão da tabela abaixo
Pesos F d = X - X0 dF d2F
(kg)
170 19 -60 - 1.140 68.400
195 25 -35 - 875 30.625
230 = X0 33 0 0 0
250 17 20 340 6.800
290 11 60 660 39.600
310 6 80 480 38.400
111 - -535 183.825
Usaremos a fórmula (3 ), que é a mais conveniente, neste caso, pois os números da coluna X são
grandes.
2 =(d2F /F) - (dF/F)2 =183.825/111 - (-535/111)2 =1.656,0811 - 23,2307 = 1632,8504
2 = 1.632,8504
= 2 = 1.632,8504 = 40,4085 = 40,4085 kg
6
Exemplo 4:
Calcular a variância e o desvio padrão da tabela abaixo
Pesos F Z ZF Z2F
(kg)
170 19 -2 -38 76
175 28 -1 -28 28
180 = X0 37 0 0 0
185 13 1 13 13
190 11 2 22 44
195 6 3 18 54
114 - -13 215
Usaremos a fórmula (4), que é a mais conveniente, neste caso, pois o h é constante ( h=5 ).
2 = h2[(Z2F/F) - (ZF/F)2] = 52[215/114-(-13/114)2] =25[1,8860 - 0,0130] = 25[1,8730] = 46,8250
2 = 46,8250
= = 46,8250 = 6,8429
2 = 6,8429 kg
OBS: Se a tabela for uma distribuição de freqüências por classes temos que calcular o ponto
médio das classes antes de utilizar quaisquer das três fórmulas, (2), (3) ou (4).
Exemplo 5:
Calcular a variância e o desvio padrão da tabela abaixo
Estaturas F Xi Z ZF Z2F
(cm)
150 156 12 153 -2 -24 48
156 162 23 159 -1 -23 23
162 168 34 165=X0 0 0 0
168 174 18 171 1 18 18
174 180 8 177 2 16 32
180 186 6 183 3 18 54
101 - - 5 175
Usaremos a fórmula (4), que é a mais conveniente, neste caso, pois o h é constante (h = 6).
Primeira:
A variância e o desvio padrão de uma distribuição não se alteram se acrescentarmos
algebricamente uma constante k a todos os termos da distribuição, isto é:
y2 = x2 e y = x
Demonstração:
Seja o conjunto X = {X1, X2, X3,..., Xn }, acrescentemos algebricamente a constante k a todos
os termos do conjunto X, desta forma criamos um novo conjunto, digamos, Y, formados pelos termos:
X1 + k, X2 + k, X3 + k,..., Xn + k.
Assim sendo podemos afirmar que a variância do conjunto X é x2 = (X - X)2 / n e a
variância do conjunto Y é y2 = [(X + k) - ( X + k ) ]2 / n.
Desenvolvendo matematicamente a variância de Y, temos:
Exemplo 1:
Do conjunto X = { 10, 20, 30, 40} cuja variância vale 125 e o desvio padrão 11,2, foi diminuído de cada
um de seus termos 5 unidades. Mostre que a variância do novo conjunto formado é também 125 e o
desvio padrão é 11,2.
Dados: x2 = 125 e x = 11,2 k = - 5
Exemplo 2:
Apurou-se de determinada distribuição uma variância igual a 400, em seguida, todos o seus termos
foram aumentados de 10 unidade. Qual é o desvio padrão da nova distribuição?
Como houve acréscimo de 10 unidades, então podemos afirmar que x2 = y2 = 400 e x = y,
logo y = y2 = 400 = 20 então y = 20.
Segunda
Se multiplicarmos (ou dividirmos) todos os termos de uma distribuição por uma constante k
(ou 1/k), a variância da nova distribuição é igual à variância da primitiva multiplicada por k2 (ou por
1/k2) e o desvio padrão é igual ao da primitiva multiplicado por k ( ou por 1/k), isto é:
Demonstração:
Seja o conjunto X = {X1, X2, X3,..., Xn } , se multiplicarmos por k todos os termos do conjunto
criamos um novo conjunto, digamos Y, formado pelos termos: k X 1,k X2, kX3, ..., kXn.
Assim sendo, podemos escrever que a variância do conjunto X é x2 = (X - X)2 / n e a
variância do conjunto Y é y2 = [(X k) - (X k)]2 /n.
Desenvolvendo matematicamente a variância de Y, temos:
y2 = [(X k) - (X k)]2 /n = [k(X - X)]2/n = k2(X - X)2/n = k2 ( X - X)2/n = k2x2, logo
y2 = k2x2 e y = k x, quando multiplicamos todos os termos de uma distribuição por uma
constante k.
Exemplo 1:
Do conjunto X = {10, 20, 30, 40}, cuja variância vale 125 e o desvio padrão 11, 2, multiplicou-se cada
um de seus termos por 2 unidades. Mostre que a variância do novo conjunto formado é igual ao da
primitiva multiplicado por 22 e que o desvio padrão é igual ao da primitiva multiplicado por 2.
Exemplo 2:
Apurou-se de determinada distribuição uma variância igual a 400, em seguida, todos os seus termos
foram multiplicados por 2. Qual é o desvio padrão da nova distribuição?
Como houve a multiplicação por 2 unidades, então podemos afirmar que y2= k2 x2 = 22. 400 e
y = k x , logo y = k2 y2 = 22 400 = 2 .20 =40 então y = 40.
Terceira:
A variância de uma distribuição é igual à média aritmética dos quadrados dos seus termos
menos o quadrado de sua média aritmética, isto é:
2 = (X2/ n) - X2
Demonstração:
2 = (X - X)2/n = (X2 - 2X.X + X2)/n = (X2 - 2.XX + X2)/n = X2/n - 2.X. X/n + nX2/n
Exemplo:
Qual é o desvio padrão de uma distribuição composta de 20 termos cuja soma dos quadrados dos
termos é 500 e sua média aritmética é 4?
Muitas vezes desejamos reunir em uma só distribuição de freqüências dados obtidos em dois
ou mais grupos, dos quais já conhecemos as respectivas médias e variâncias.
Podemos reunir as variâncias já calculadas em uma única medida, sem ter que refazer os
cálculos para a distribuição total. Para tanto, valemo-nos da seguinte fórmula:
onde:
t2 é a variância total da distribuição.
n1 é o número de elementos da 1ª distribuição; n2 é o número de elementos da 2ª distribuição.
12 é o número de elementos da 1ª distribuição; 22 é o número de elementos da 2ª distribuição.
h12 = (X1-Xt)2 e h22 = (X2-Xt)2 sendo X1 a média aritmética da 1ª distribuição, X2 a média
aritmética da 2ª distribuição e Xt é a média aritmética da distribuição total ( é a média das médias).
n é o número de elementos total da distribuição, isto é, n = n1 + n2.
OBS: essa fórmula foi adaptada para dois grupos, e pode ser expandida para mais grupos.
Exemplo:
Um teste de raciocínio foi aplicado a duas turmas da mesma escola. A turma A, com 35 alunos,
obteve média aritmética 6,11 com desvio padrão 2,38. A turma B, com 40 alunos obteve média
9
aritmética 6,29 com desvio padrão 2,25. Qual a variância total se considerarmos as duas turmas
conjuntamente?
Quinta:
Sexta
3.2.6 - Covariância
A covariância de uma estatística de duas variáveis (X e Y), define-se como a média aritmética
dos produtos dos desvios padrões de cada uma das variáveis em relação à média aritmética.
Dessa forma, covariância é:
Exemplo:
Duas variáveis X e Y observadas conjuntamente apresentaram os seguintes resultados:
Sujeitos A B C D E
X 4 6 10 12 13
Y 0 1 2 3 4
10
Calcular a covariância.
X Y x = (X - X) y = (Y - Y) xy
4 0 -5 -2 10
6 1 -3 -1 3
10 2 +1 0 0
12 3 +3 +1 3
13 4 +4 +2 8
45 10 - - 24
X = X = 45 = 9 Y = Y = 10 = 2
n 5 n 5
Exemplo:
Uma distribuição de freqüências apresentou os seguintes parâmetros:
Q1 = 2,04 ; Q3 = 6,65 e Me = 4,7 . Calcule o desvio quartil.
Esta medida de variação relativa ou percentual foi proposta por Karl Pearson e é o quociente
entre a dispersão absoluta (desvio-padrão) e a medida de tendência central (média aritmética).
Fórmula de recorrência:
Cv = (/X) .100%
Exemplo:
Um grupo de meninos de 8 anos apresentou para média aritmética de suas alturas 128 cm com
desvio-padrão de 12cm e um grupo de meninos de 12 anos apresentou para média das alturas 158
cm com desvio-padrão de 14 cm. Qual dos dois grupos é o mais disperso?
Embora o grupo de meninos de 12 anos pareça mais disperso quanto à altura (12 anos) = 14 cm>
(8 anos) = 12 cm, após calcular o Cv de cada grupo, verificamos que o grupo de meninos de 8 anos é
mais variável que o de 12 anos.
EXERCÍCIOS DA UNIDADE 3
1 ) Calcule a amplitude para os dados: 1, 2, 3, 4, 5.
a) 2; b) 0; c) 4; d) 3; e) 1.
3) Para obter o peso médio de um conjunto de ratos tanto se pode pesar cada rato por vez como
pesar todos os ratos de uma vez. No entanto obtemos mais informações se pesarmos um rato por
vez. Por quê?
a) é mais prático; b) não se consegue pesar todos os ratos ao mesmo tempo; c) auxilia na contagem
do número de ratos; d) os pesos individuais permitem calcular a variância, que mede a dispersão; e)
os pesos individuais permitem determinar o tamanho dos ratos.
4) De acordo com alguns, Estatística é uma ciência engraçada porque, se formos ao restaurante e eu
comer um frango, enquanto você não come nenhum, em média comemos, cada um, meio frango e
estamos muito satisfeitos. Discuta a validade dessa média. ( média = 0,5 ; variância = 0,5 ).
a) A média não tem significado porque a variabilidade é muito grande; b) a média é significativa
porque é igual à variância; c) nada se pode afirmar quanto à média; d) a média representa com
clareza o consumo realizado; e) a média tem significado porque a variabilidade é muito pequena.
Xi 2 3 4 5 6 7 8
Fi 1 3 5 8 5 4 2
12
6) Qual o desvio-padrão?
a) 5,2 b) 1,51 c) 2,29 d) 64,12 e) 28.
8) A distribuição é homogênea?
a) sim b) não.
9) Sabendo-se que um conjunto de dados apresenta para média aritmética e para desvio-padrão,
respectivamente, 18,3 e 1,47, calcule e interprete o coeficiente de variação.
a) 0,08,a distribuição é pouco homogênea e isto significa que os X i estão bastante afastados da
média aritmética, levando-nos a não acreditar na tipicidade da média aritmética;
b) 0,08,a distribuição é bastante homogênea e isto significa que os X i estão bastante próximos da
média aritmética, levando-nos a acreditar na sua tipicidade da média aritmética.
13) Dadas as estaturas de 140 universitários fluminenses abaixo calcular a variância e o desvio
padrão das estaturas.
Estaturas No de Xi
(cm) Alunos
145 150 2
150 155 10
155 160 27
160 165 38
165 170 27
170 175 21
175 180 8
180 185 7
140 -
a) 61,96 e 5,89 b) 7,87 e 61,96 c) 61,96 e 7,87 d) 8,89 e 30 e) 30 e 7.
13
1) AT = Ls – Li = 5 – 1 = 4 c)
2) X = { 0, 2, 4, 6, 8 }
X = Xi = 20 = 4
n 5
2 = ( X – X )2 = (0 – 4)2+(2 – 4)2+(4 –4)2+(6 – 4)2+(8 – 4)2 = 16+4+0+4+16 = 40 = 8 2 = 8
n 5 5 5
= 2 = 8 = 2,8 = 2,8 b)
2) d)
3) d)
X F XF X2F
2 1 2 4
3 3 9 27
4 5 20 80
5 8 40 200
6 5 30 180
7 4 28 196
8 2 16 128
28 145 815
5) AT = Ls – Li = 8 – 2= 6 e)
6) ?
7) c)
8) Cv = . 100% ?
X
9) b)
X Y x = (X – X ) y = (Y – Y ) xy x2 y2
10 6 (10 – 30) = -20 (6 – 7) = -1 20 400 1
20 8 (20 – 30) = -10 (8 – 7) = 1 -10 100 1
30 7 (30 – 30) = 0 (7 – 7) = 0 0 0 0
40 8 (40 – 30) =10 (8 – 7) = 1 10 100 1
50 6 (50 – 30) = 20 ( 6 – 7) = -1 -20 400 1
150 35 0 0 0 1.000 4
X = X = 150 = 30 ; Y = Y = 35 = 7
n 5 n 5
10) Sxy = (xy) = 0 = 0 Sxy = 0 e)
n 5
14
12) a)
13)
Estaturas No de Xi Z ZF Z2F
(cm) Alunos
145 150 2 147,5 -3 -6 18
150 155 10 152,5 -2 -20 40
155 160 27 157,5 -1 -27 27
160 165 38 162,5 0 0 0
165 170 27 167,5 1 27 27
170 175 21 172,5 2 42 84
175 180 8 177,5 3 24 72
180 185 7 182,5 4 28 112
140 - - 68 380
2 = h2[ Z2F - ( ZF )2 ] = 52[ 380 - ( 68 )2 ] = 25[ 2,7143 – 0,2359 ] = 25 [2,4784] = 61,96 cm2
F F 140 140