Você está na página 1de 5

INSTITUTO DE TECNOLOGIA E LIDERANÇA

Encontros de Instrução de Matemática e Física

Fórmulas de média, variância e desvio-padrão


padrão

1 Objetivo

Esse é um material complementar que revê os conceitos de média, variância e desvio


padrão e demonstra algumas propriedades importantes. Ele é indicado para os alunos que
desejam aprofundamento em matemática.

2 Média

Considere uma população com 𝑁 amostras 𝑋 , 𝑋 , … , 𝑋 .


Vimos que a média 𝑋 dos elementos é calculada da seguinte forma:

𝑋 + 𝑋 + ⋯+ 𝑋
𝑋= (1)
𝑁

somatório, como*:
A equação ( 1 ) pode ser escrita, com notação de somatório

𝑵
𝟏
𝑿= 𝑿𝒊 (2)
𝑵
𝒊 𝟏

Note que ( 1 ) e ( 2 ) são duas formas diferentes de representar a mesma equação.


equação A
diferença é apenas a forma de escre
escrever, que em ( 2 ) é mais compacta. É importante que os
alunos se habituem com a notação de somatório, que usaremos com freqüência no curso.
A partir da equação ( 2 ),, multiplicando os dois termos por 𝑁,, podemos escrever que:

𝑁𝑋 = 𝑋 (3)

Analisando o primeiro termo da equação ( 3 ), 𝑁𝑋, observamos que ele equivale a somar
𝑁 vezes o valor 𝑋. Podemos escrever essa equivalência na forma de somatório, lembrando que
a média 𝑋 é um valor constante
nstante que não varia com o termo de iteração 𝑖:

𝑁𝑋 = 𝑋 + 𝑋 + ⋯ + 𝑋 = 𝑋 (4)
(𝑁 vezes)

Substituindo a equação ( 4 ) no primeiro termo de ( 3 ), temos:

𝑋= 𝑋

*
As equações mais importantes neste texto estão destacadas com moldura e negrito. Recomenda
Recomenda-se a
sua memorização.

Prof. Henrique Paiva Página 1 de 5


𝑋 − 𝑋=0 (5)

Observe que os dois somatórios em ( 5 ) possuem as mesmos iterações (partem de 𝑖 = 1


vão até 𝑖 = 𝑁). Assim, eles podem ser agrupados em um somatório único:

(𝑿𝒊 − 𝑿) = 𝟎 (6)
𝒊 𝟏

A equação ( 6 ) indica uma propriedade importante da média. Note que (𝑋 − 𝑋) é a


diferença de cada amostra em relação à média. A equação indica que, se você somar todas
essas diferenças, o resultado é nulo.

3 Variância populacional

A variância populacional 𝜎 é definida da seguinte forma:

𝑵
𝟏
𝟐
𝝈 = (𝑿𝒊 − 𝑿)𝟐 (7)
𝑵
𝒊 𝟏

Observe que (𝑋 − 𝑋) é a diferença de cada amostra em relação à média, e que esse valor
é elevado ao quadrado. Em seguida, todos esses quadrados são somados e o resultado é
dividido pelo número de amostras 𝑁; ou seja, essa é uma operação de média.
Assim, expressando a equação em palavras, a variância populacional é definida como a
média dos quadrados da diferença de cada amostra em relação à média.
É importante memorizar a definição. Fica a critério de cada aluno decidir se tem mais
facilidade de memorizar no formato de equação ou no formato textual.
Vamos trabalhar na equação ( 7 ) para chegar a um resultado equivalente. Inicialmente,
expandimos o quadrado da diferença:

1 1
𝜎 = (𝑋 − 𝑋) = 𝑋 − 2𝑋 𝑋 + 𝑋 (8)
𝑁 𝑁

Em ( 8 ), separamos os três termos do somatório em três somatórios distintos:

1
𝜎 = 𝑋 − 2𝑋 𝑋 + 𝑋 (9)
𝑁

O segundo e o terceiro somatório em ( 9 ) podem ser simplificados se notarmos que 𝑋


não é função do parâmetro 𝑖 do somatório.
Para simplificar o segundo somatório em ( 9 ), fazemos a expansão e agrupamento
apresentados em ( 10 ). Observe que o resultado final equivale a colocar em evidência o termo
multiplicativo que não é função de 𝑖.

Prof. Henrique Paiva Página 2 de 5


2𝑋 𝑋 = 2𝑋 𝑋 + 2𝑋 𝑋 + ⋯ + 2𝑋 𝑋 = 2𝑋(𝑋 + 𝑋 + ⋯ + 𝑋 ) = 2𝑋 𝑋 ( 10 )

Para simplificar o terceiro somatório em ( 9 ), devemos observar que estamos somando 𝑁


vezes o mesmo termo 𝑋 . Ou seja:

𝑋 + 𝑋 + ⋯+ 𝑋 ( 11 )
𝑋 = =𝑁𝑋
(𝑁 vezes)

Substitundo ( 10 ) e ( 11 ) em ( 9 ), temos:

1
𝜎 = 𝑋 − 2𝑋 𝑋 +𝑁𝑋 =
𝑁

1 1 1
= 𝑋 − 2𝑋 𝑋 + 𝑁𝑋 ( 12 )
𝑁 𝑁 𝑁

Observe que o termo destacado em vermelho em ( 12 ) é a própria expressão de média


apresentada em ( 2 ). Portanto:

1 1
𝜎 = 𝑋 − 2𝑋𝑋 + 𝑁𝑋 =
𝑁 𝑁

1
= 𝑋 − 2𝑋 + 𝑋 ( 13 )
𝑁

Assim†:

𝑵
𝟏
𝟐
𝝈 = 𝑿𝟐𝒊 − 𝑿𝟐 ( 14 )
𝑵
𝒊 𝟏

Ou seja, a equação ( 14 ) indica, conforme visto em aula, a variância populacional pode ser
calculada como a média dos quadrados menos o quadrado da média. Sabendo disso, podemos
reescrever a equação ( 14 ) da forma mais compacta a seguir, na qual 𝑿𝟐 indica a média dos
quadrados e 𝑿𝟐 indica o quadrado da média:

𝝈𝟐 = 𝑿 𝟐 − 𝑿 𝟐 ( 15 )

As equações ( 14 ) e ( 15 ) expressam a mesma igualdade, usando apenas notações


diferentes. Fica a seu critério definir qual das duas formas é mais simples de memorizar.
Note que essa não é a definição de variância, mas sim uma forma alternativa de realizar o
cálculo, que leva ao mesmo resultado. Computacionalmente, é a forma que costuma ser
usada, por ser mais estável numericamente.


Os parênteses na equação ( 14 ) não são necessários. Optou-se por colocá-lo apenas para deixar bem
claro onde termina o somatório.

Prof. Henrique Paiva Página 3 de 5


4 Variância amostral

Considere que, em vez da população inteira, temos uma amostra, com 𝑛 elementos. A
letra minúscula 𝑛 é para indicar que é um número diferente do total 𝑁 de elementos da
população inteira (logo, 𝑛 < 𝑁). Para a amostra, não calculamos a variância populacional, mas
sim a variância amostral.
Conforme vimos em sala, a variância amostral, calculada quando se deseja calcular a
dispersão dos elementos de uma amostra e não da população inteira, envolve a divisão por 𝑛-
1 em vez de divisão por 𝑁.
A variância amostral 𝑠 é definida da seguinte forma:

𝒏
𝟏
𝟐
𝒔 = (𝑿𝒊 − 𝑿)𝟐 ( 16 )
𝒏−𝟏
𝒊 𝟏

5 Desvio padrão

O desvio padrão é sempre a raiz quadrada da variância – ou, alternativamente, a variância


é o quadrado do desvio padrão. Note que, nas equações ( 7 ) e ( 16 ), definimos a variância
como 𝝈𝟐 e 𝒔𝟐 , ou seja, já como o quadrado do desvio. Essa é a notação habitual.
Assim:
 O desvio padrão populacional 𝜎 é a raiz quadrada da variância populacional.

𝑵
𝟏
𝝈= (𝑿𝒊 − 𝑿)𝟐 ( 17 )
𝑵
𝒊 𝟏

 O desvio padrão amostral 𝑠 é a raiz quadrada da variância amostral.

𝒏
𝟏
𝒔= (𝑿𝒊 − 𝑿)𝟐 ( 18 )
𝒏−𝟏
𝒊 𝟏

Prof. Henrique Paiva Página 4 de 5


6 Notas

 As equações de média que precisam de memorização são as que estão em


destaque: ( 2 ) e ( 6 ).
 As equações de variância e desvio-padrão que precisam de memorização são as
que estão em destaque: ( 7 ), ( 15 ), ( 16 ), ( 17 ), ( 18 ).
o A memorização de ( 7 ) e ( 15 ) pode ficar mais fácil se você se lembrar de
sua descrição em palavras que foi apresentada no texto.
o A memorização de ( 16 ) é facilitada se você compará-la com ( 7 ) e
lembrar-se da diferença entre a variância populacional e amostral.
o A memorização de ( 17 ) e ( 18 ) é trivial se você souber ( 7 ) e ( 16 ) e
lembrar-se que o desvio-padrão é a raiz quadrada da variância.
 O professor considerou importante mostrar que a propriedade ( 6 ) é
conseqüência direta da definição ( 2 ) e que a fórmula alternativa de calculo da
variância, expressa em ( 15 ), é consequência direta da definição ( 7 ).
o Essa formalização é importante para os alunos que tem interesse no
aprofundamento do estudo.
o Entretanto, não há problema se você preferir apenas aceitar que as
equações ( 6 ) e ( 15 ) estão corretas, sem estudar a demonstração.

Prof. Henrique Paiva Página 5 de 5

Você também pode gostar