Escolar Documentos
Profissional Documentos
Cultura Documentos
𝒏
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒊 𝟏
𝒙= = 𝒙𝒊 𝒄𝒐𝒎 𝒊 = 𝟏, 𝟐, 𝟑 … . , 𝒏
𝒏 𝒏
𝒊=𝟏
Se ni representa a freqüência da observação 𝒙𝒊 𝒐𝒏𝒅𝒆 𝒊 = 𝟏, 𝟐, … , 𝒌 , então
𝒌
𝒏𝟏 . 𝒙𝟏 + 𝒏𝟐 . 𝒙𝟐 + 𝒏𝟐 . 𝒙𝟑 + ⋯ + 𝒏𝒌 . 𝒙𝒌 𝟏
𝒙= = 𝒏 𝒊 . 𝒙𝒊
𝒏 𝒏
𝒊=𝟏
𝒌
𝒏𝟏 . 𝒙𝟏 + 𝒏𝟐 . 𝒙𝟐 + 𝒏 𝟐 . 𝒙𝟑 + ⋯ + 𝒏𝒌 . 𝒙𝒌 𝟏
𝒙= = 𝒏𝒊 . 𝒙 𝒊
𝒏 𝒏
𝒊=𝟏
𝒏
em que se 𝐧 = 𝒌𝒊=𝟏 𝒏𝒊 ; e se𝒇𝒊 = 𝒏𝒊 representa a freqüência relativa da
observação xi, i = 1, 2, ..., k, então a equação anterior também pode ser escrita
como:
𝒌
𝒙= 𝒇𝒊 . 𝒙𝒊
𝒊=𝟏
𝒌
𝟏 𝟏𝟓𝟎. 𝟏 + 𝟏𝟓𝟏. 𝟏 + ⋯ + 𝟏𝟔𝟖. 𝟐 + ⋯ + 𝟏𝟕𝟑. 𝟏 𝟔𝟒𝟐𝟓
𝒙= 𝒏𝒊 . 𝒙𝒊 = = = 𝟏𝟔𝟎, 𝟔𝟐𝟓 𝛀
𝒏 𝟒𝟎 𝟒𝟎
𝒊=𝟏
E usando a frequência relativa:
𝒙= 𝒇𝒊 . 𝒙𝒊
𝒊=𝟏
R(W) Frequência Frequencia relativa(fi= ni/n) xi.fi
150 1 0,025 3,75
151 1 0,025 3,775
152 1 0,025 3,8
153 1 0,025 3,825
154 1 0,025 3,85
155 4 0,1 15,5
156 3 0,075 11,7
157 1 0,025 3,925
158 2 0,05 7,9
160 5 0,125 20
161 4 0,1 16,1
162 2 0,05 8,1
163 2 0,05 8,15
164 3 0,075 12,3
165 1 0,025 4,125
166 1 0,025 4,15
167 1 0,025 4,175
168 2 0,05 8,4
169 1 0,025 4,225
170 1 0,025 4,25
172 1 0,025 4,3
173 1 0,025 4,325
∑ 40 1 160,625
Média ponderada 𝒙𝒑
Em algumas situações, as observações têm graus de
importância diferentes. Usa-se então a média ponderada.
𝒏
𝒊=𝟏 𝝎𝒊 𝒙𝒊 𝟏𝟎𝟎𝟎. 𝟎, 𝟎𝟕 + 𝟐𝟕𝟎𝟎. 𝟎, 𝟏𝟑 + 𝟑𝟐𝟕𝟓𝟎. 𝟎, 𝟓𝟎 + 𝟐𝟕𝟓𝟓𝟔𝟒. 𝟎, 𝟑𝟎
𝒙𝒑 = 𝒏 =
𝒊=𝟏 𝝎𝒊 𝟎, 𝟎𝟕 + 𝟎, 𝟏𝟑 + 𝟎, 𝟓𝟎 + 𝟎, 𝟑𝟎
Para 39 valores:
𝑀𝑑 = 162
Para 40 valores:
𝑀𝑑 = 160
Solução.
O número de observações ≤ 𝑸𝟏 é 𝟎, 𝟐𝟓. 𝟏𝟒 = 𝟑, 𝟓, ou seja 4, ≥ 𝑸𝟏 é
𝟎, 𝟕𝟓. 𝟏𝟒 = 𝟏𝟎, 𝟓, ou seja 10.
Contando 4 valores do menor para o maior e 10 valores do maior para o menor,
encontramos 155.
R(Ω) 150 151 153 155 155 155 156 156 157 158 158 160 160 160
1 2 3 4 5 6 7 8 9 10 11 12 13 14
𝒌 𝒌
𝟏 𝟏𝟓𝟎. 𝟏 + 𝟏𝟓𝟏. 𝟏 + ⋯ + 𝟏𝟔𝟖. 𝟐 + ⋯ + 𝟏𝟕𝟑. 𝟏
𝒙= 𝒏𝒊 . 𝒙𝒊 = 𝒇 𝒊 . 𝒙𝒊 =
𝒏 𝟒𝟎
𝒊=𝟏 𝒊=𝟏
𝒙 = 𝟏𝟔𝟎, 𝟔𝟐𝟓
EXEMPLO:
Exemplo 4. Considerando os dados agrupados em intervalos de classes das
resistências elétricas, determine a mediana
A mediana corresponde ao ponto médio da classe que contém a mediana.
R(Ω) Frequência Frequência Acumulada
150 1 1
151 1 2
152 1 3
153 1 4
154 1 5
155 4 9
156 3 12
157 1 13
158 2 15
Posição 16 17 18 19 20 21 22 23 24
160 5 20
161 4 24 R(Ω) 160 160 160 160 160 161 161 161 161
162 2 26
163 2 28
164 3 31
165 1 32
166 1 33
167 1 34
168 2 36
169 1 37
170 1 38
172 1 39
173 1 40
Total 40
A moda será:
𝟗𝟒 + 𝟗𝟔
𝑴𝒐 = = 𝟗𝟓 𝛀
𝟐
Medidas de dispersão ou
variabilidade
Medidas de dispersão ou variabilidade
𝑨 = {𝟐𝟓, 𝟐𝟖, 𝟑𝟏, 𝟑𝟒, 𝟑𝟕} 𝑩 = {𝟏𝟕, 𝟐𝟑, 𝟑𝟎, 𝟑𝟗, 𝟒𝟔}
16,07
3,07
-6,93 -5,93
Assim a alternativa para se eliminar os valores negativos é se elevar ao quadrado
os desvios e soma-los e depois extrair a raiz quadrada. Assim vem:
𝒏
𝟐
𝒙𝒊 − 𝒙
𝒊=𝟏
R(Ω) 150 151 153 155 155 155 156 156 157 158 158 160 160 173 ∑
Desvio (xi -xm) -6,93 -5,93 -3,93 -1,93 -1,93 -1,93 -0,93 -0,93 0,07 1,07 1,07 3,07 3,07 16,07 0,00
(xi -xm)2 48,01 35,15 15,43 3,72 3,72 3,72 0,86 0,86 0,01 1,15 1,15 9,43 9,43 258,29 390,93
xm = 156,93
O uso deste total, no entanto, pode causar dificuldades quando se comparam
conjuntos de dados com números diferentes de observações. Deste modo,
exprime-se esta medida como média ou seja, a variância.
Variância (Var)
𝒏
𝟐 𝒊=𝟏(𝒙𝒊 − 𝒙)𝟐
𝑽𝒂𝒓 𝑿 = 𝝈 =
𝒏
Onde 𝑿 = 𝒙𝒊 , 𝒆 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒏
Será visto no estudo de“Estatística e distribuição amostral” que a variância de uma amostra
é calculada, por motivos associados à inferência estatística, usando 𝒏 − 𝟏 em lugar de 𝒏
nessa expressão, no entanto, para grandes amostras, pouca diferença fará o uso d𝒆 n ou
𝒏 − 𝟏.
𝑨 = {𝟐𝟓, 𝟐𝟖, 𝟑𝟏, 𝟑𝟒, 𝟑𝟕} 𝑩 = {𝟏𝟕, 𝟐𝟑, 𝟑𝟎, 𝟑𝟗, 𝟒𝟔}
𝒌 𝟐 𝒌
𝒊=𝟏 𝒏 𝒊 . 𝒙𝒊
𝑽𝒂𝒓 𝑿 = − 𝒙𝟐 = 𝒇𝒊 𝒙𝟐𝒊 − 𝒙𝟐
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏(𝒙𝒊 − 𝒙)𝟐
𝑫𝒑 𝑿 = 𝝈 𝒙 =
𝒏
Note que a unidade de medida do desvio padrão será a mesma dos dados
originais.
• 68% dos valores da série estão até 1 desvio padrão de distância da média, isto
é, estão entre 𝒙 − 𝝈 𝒙 e 𝒙 + 𝝈 𝒙
• 95% dos valores da série estão até 2 desvios padrão de distância da média,
isto é, estão entre 𝒙 − 𝟐𝝈 𝒙 e 𝒙 + 𝟐𝝈 𝒙
• 99,7% dos valores da série estão até 3 desvios padrão de distância da média,
isto é, estão entre 𝒙 − 𝟑𝝈 𝒙 e 𝒙 + 𝟑𝝈 𝒙
No exemplo dos conjuntos A e B
A 25 28 31 34 37 A 25 28 31 34 370
B 17 23 30 39 46 B 17 23 30 39 46
𝑥 31 𝑥 97,6
𝑥 31 𝑥 31
(𝑥 −𝑥 )( ) -6 -3 0 3 6 (𝑥 −𝑥 )( ) -72,6 -69,6 -66,6 -63,6 272,4
(𝑥 −𝑥 )( ) -14 -8 -1 8 15 (𝑥 −𝑥 )( ) -14 -8 -1 8 15
(𝑥 −𝑥 ) ( ) 36 9 0 9 36 90 (𝑥 −𝑥 ) ( ) 5270,76 4844,16 4435,56 4044,96 74201,76 92797,2
(𝑥 −𝑥 ) ( ) 196 64 1 64 225 550 (𝑥 −𝑥 ) ( ) 196 64 1 64 225 550
𝒏 𝒏
𝒊=𝟏(𝒙𝒊−𝑥 )𝟐 𝒊=𝟏(𝒙𝒊−𝑥 )𝟐
(A) (A)
𝒏 𝒏
18 18559,44
𝒏 𝒏
𝒊=𝟏(𝒙𝒊−𝑥 )𝟐 𝒊=𝟏(𝒙𝒊−𝑥 )𝟐
(B) (B)
𝒏 110 𝒏 110
𝒏 (𝒙 −𝑥 )𝟐 𝒏 (𝒙 −𝑥 )𝟐
𝒊=𝟏 𝒊 𝒊=𝟏 𝒊
(A) (A)
𝒏 4,242640687 𝒏 136,2330356
𝒏 (𝒙 −𝑥 )𝟐 𝒏 (𝒙 −𝑥 )𝟐
𝒊=𝟏 𝒊 𝒊=𝟏 𝒊
(B) 10,48808848 (B) 10,48808848
𝒏 𝒏
No caso do exemplo, onde foi mostrado que a mediana é uma medida resistente,
utilizando-se as observações 25, 28, 31, 34 e 37, obtêm-se 𝑫𝒑 =4,24.
A 25 28 31 34 37 A 25 28 31 34 370
B 17 23 30 39 46 B 17 23 30 39 46
𝑥 31 𝑥 97,6
𝑥 31 𝑥 31
(𝑥 −𝑥 )( ) -6 -3 0 3 6 (𝑥 −𝑥 )( ) -72,6 -69,6 -66,6 -63,6 272,4
(𝑥 −𝑥 )( ) -14 -8 -1 8 15 (𝑥 −𝑥 )( ) -14 -8 -1 8 15
(𝑥 −𝑥 ) ( ) 36 9 0 9 36 90 (𝑥 −𝑥 ) ( ) 5270,76 4844,16 4435,56 4044,96 74201,76 92797,2
(𝑥 −𝑥 ) ( ) 196 64 1 64 225 550 (𝑥 −𝑥 ) ( ) 196 64 1 64 225 550
𝒏 𝒏
𝒊=𝟏(𝒙𝒊−𝑥 )𝟐 𝒊=𝟏(𝒙𝒊−𝑥 )𝟐
(A) (A)
𝒏 𝒏
18 18559,44
𝒏 𝒏
𝒊=𝟏(𝒙𝒊−𝑥 )𝟐 𝒊=𝟏(𝒙𝒊−𝑥 )𝟐
(B) (B)
𝒏 110 𝒏 110
𝒏 (𝒙 −𝑥 )𝟐 𝒏 (𝒙 −𝑥 )𝟐
𝒊=𝟏 𝒊 𝒊=𝟏 𝒊
(A) (A)
𝒏 4,242640687 𝒏 136,2330356
𝒏 (𝒙 −𝑥 )𝟐 𝒏 (𝒙 −𝑥 )𝟐
𝒊=𝟏 𝒊 𝒊=𝟏 𝒊
(B) 10,48808848 (B) 10,48808848
𝒏 𝒏
% teórico %real
A 26,76 35,24 60
68% B 20,51 41,49 60
A 22,51 39,49 100
95% B 10,02 51,98 100
A 18,27 43,73 100
99,70% B -0,46 62,46 100
(𝑥 −𝑥) 2
=
6,23609564 6,23832242
O desvio padrão para 𝑪𝑬 = 𝑪𝑰 = 𝟔, 𝟐𝟒 𝒏𝑭, pode ser considerado pequeno, se
obtido em 𝑪𝑰 com capacitância média 𝑪𝑰 = 𝟔𝟐𝟓, 𝟓 𝒏𝑭, mas seria considerado
grande se calculado para o equipamento com 𝑪𝑬 = 𝟓𝟎, 𝟑𝟑 𝒏𝑭.
Calculando o CV para cada um dos grupos, tem-se:
CE (nF) CI (nF) (𝑥 −𝑥) ( ) (𝑥 −𝑥) ( ) (𝑥 −𝑥) ( 1 ) (𝑥 −𝑥) ( )
40 620 -10,33333333 -5,5 106,7777778 30,25
48 623 -2,333333333 -2,5 5,444444444 6,25
52 624 1,666666667 -1,5 2,777777778 2,25
49 622 -1,333333333 -3,5 1,777777778 12,25
61 639 10,66666667 13,5 113,7777778 182,25
52 625 1,666666667 -0,5 2,777777778 0,25
∑ Clique para adicionar
302 3753 -1,42109E-14 0 233,3333333 233,5
𝑥
𝑥= texto
50,3333333 625,5
(𝑥 −𝑥)2
=
38,8888889 38,9166667
(𝑥 −𝑥)
=
6,23609564 6,23832242
=
12,389594 0,99733372
Deste modo, o CV pode ser usado como um índice de variabilidade, sendo que
sua grande utilidade é permitir a comparação das variabilidades de diferentes
conjuntos de dados.
Estudo Complementar
Quantis de dados agrupados
Processo gráfico
Histograma
Usando-se o histograma, pode ser formulado o seguinte
procedimento para se encontrar quantis de uma variável com
dados agrupados.
O cálculo do quantil desejado, por exemplo, a mediana (2o quartil),
é feito, conforme sua definição, localizando-se o ponto da abscissa
que divide a área do histograma em duas partes iguais (50% para
cada lado).
Então, usando argumentos geométricos pode-se encontrar um
ponto satisfazendo esta propriedade.
Como exemplo considere um conjunto de valores já distribuídos
em dados agrupados referente a medidas de frequências ruidosas
detectadas entre 4,00 kHz e 24,00 kHz.
md
Como a mediana encontra-se na classe 8,00 Ⱶ 12,00, seu valor pode ser
determinado por proporcionalidade de áreas.
A proporcionalidade entre a área e a base dos retângulos que define a mediana
(linha vermelha) e o que define a classe mediana.
𝒃𝒂𝒔𝒆 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒒𝒖𝒆 𝒄𝒐𝒏𝒕é𝒎 𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 𝒃𝒂𝒔𝒆 𝒅𝒐 𝒓𝒆𝒕â𝒏𝒈𝒖𝒍𝒐 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒐 𝒑𝒆𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
=
á𝒓𝒆𝒂 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒒𝒖𝒆 𝒄𝒐𝒏𝒕é𝒎 𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 á𝒓𝒆𝒂 𝒅𝒐 𝒓𝒆𝒕â𝒏𝒈𝒖𝒍𝒐 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒐 𝒑𝒆𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
50 % 50 %
md
𝒃𝒂𝒔𝒆 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒒𝒖𝒆 𝒄𝒐𝒏𝒕é𝒎 𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 𝒃𝒂𝒔𝒆 𝒅𝒐 𝒓𝒆𝒕â𝒏𝒈𝒖𝒍𝒐 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒐 𝒑𝒆𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
=
á𝒓𝒆𝒂 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒒𝒖𝒆 𝒄𝒐𝒏𝒕é𝒎 𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 á𝒓𝒆𝒂 𝒅𝒐 𝒓𝒆𝒕â𝒏𝒈𝒖𝒍𝒐 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒐 𝒑𝒆𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
𝟏𝟐, 𝟎𝟎 − 𝟖, 𝟎𝟎 𝑴𝒅 − 𝟖, 𝟎𝟎
= = 𝟏𝟎, 𝟔𝟔𝟔 = 𝟏𝟎, 𝟔𝟕 𝒌𝑯𝒛
𝟑𝟑, 𝟑𝟑 (𝟓𝟎, 𝟎𝟎 − 𝟐𝟕, 𝟕𝟖)
50 % 50 %
𝒃𝒂𝒔𝒆 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒒𝒖𝒆 𝒄𝒐𝒏𝒕é𝒎 𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 𝒃𝒂𝒔𝒆 𝒅𝒐 𝒓𝒆𝒕â𝒏𝒈𝒖𝒍𝒐 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒐 𝒑𝒆𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
=
á𝒓𝒆𝒂 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒒𝒖𝒆 𝒄𝒐𝒏𝒕é𝒎 𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 á𝒓𝒆𝒂 𝒅𝒐 𝒓𝒆𝒕â𝒏𝒈𝒖𝒍𝒐 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒐 𝒑𝒆𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
𝟏𝟐, 𝟎𝟎 − 𝟖, 𝟎𝟎 𝟏𝟐, 𝟎𝟎 − 𝑴𝒅
= = 𝟏𝟎, 𝟔𝟔𝟔 = 𝟏𝟎, 𝟔𝟕 𝒌𝑯𝒛
𝟑𝟑, 𝟑𝟑 (𝟓𝟎, 𝟎𝟎 − (𝟐𝟐, 𝟐𝟐 + 𝟏𝟑, 𝟖𝟗 + 𝟐, 𝟕𝟖))
Esse procedimento de cálculo pressupõe que as observações
estejam em ordem crescente e igualmente espaçadas dentro de
cada classe.
𝒌 𝟐 𝒌
𝒊=𝟏 (𝒙𝒊 − 𝒙𝟐 ). 𝒏𝒊 𝟐
𝑽𝒂𝒓 𝑿 = = 𝒇𝒊 𝒙𝒊 − 𝒙
𝒏
𝒊=𝟏
Chega-se a:
𝒌 𝟐 𝒌
𝒊=𝟏 𝒏𝒊 . 𝒙𝒊
𝑽𝒂𝒓 𝑿 = − 𝒙𝟐 = 𝒇𝒊 𝒙𝟐𝒊 − 𝒙𝟐
𝒏
𝒊=𝟏
𝒌
onde 𝒊=𝟏 𝒏𝒊 . 𝒙𝒊 = 𝒏𝒙
Sendo a variância uma medida que expressa um desvio quadrático médio, pode
causar alguns problemas de interpretação. Para evitar isto, costuma-se usar o
desvio padrão
Medidas de dispersão para dados agrupados
O cálculo das medidas de dispersão, neste caso, é feito de modo análogo àquele
usado para encontrar a média, ou seja, considerando-se que todas as
observações no intervalo de classe, estão localizadas no ponto médio do
intervalo. Para exemplificar, considere a tabela abaixo:
𝟗𝟕, 𝟏𝟑 − 𝟒, 𝟐𝟏 𝛀 𝒆 𝟗𝟕, 𝟏𝟑 + 𝟒, 𝟐𝟏 𝛀
Ou seja:
𝟗𝟐, 𝟗𝟐 𝛀 𝒆 𝟏𝟎𝟏, 𝟑𝟒 𝛀
Ao se observar a tabela com os dados originais verifica-se que vários valores
encontram-se fora deste intervalo.
PRÓXIMA AULA
Medidas de dispersão ou
variabilidade