Você está na página 1de 4

AED - Propriedades algébricas da média aritmética e da variância (continuação)

Sejam:

k , V: números reais quaisquer; m: média aritmética; VAR: variância; DP: desvio-padrão

X = {x1, x2, ..., , xn} e Y = {y1, y2, ..., yn} conjunto de n observações através de duas variáveis, X e Y.

Lembre-se da propriedade 1.4 da média aritmética , sobre a repartição de n em g subgrupos:


Aplicando duas outras propriedades à relação abaixo, onde
consideramos a i-ésima observação no j-ésimo subgrupo, j= 1,2, ... , g e i=1,2, ..., nj

Ou seja, a média aritmética é a média ponderada das médias dos subgrupos, onde os pesos
correspondem aos respectivos tamanhos de cada subgrupo.

Já verificamos anteriormente (propriedade 2.1) que a VAR é o menor dos desvios-quadráticos


médios (momento centrado na média de ordem 21). Vamos agora verificar outra propriedade
importante da variância, também em relação aos subgrupos

2
Sabemos que : ............................................................. (1)

que pode ser re-escrito como:

Desenvolvendo o termo do somatório e aplicando a propriedade 1.5 da média aritmética


(centro geométrico do conjunto de dados), teremos:

1
Veremos o conceito de momento em aulas futuras.
Substituindo por (1), teremos:

A interpretação da relação acima é bastante utilizada em Estatística:

A variação total do conjunto total de dados (formado pelos g subgrupos) é igual à variação
dentro (“within”) dos subgrupos adicionada à variação entre (“between”) os subgrupos.

Variação total = variação “dentro” + variação “entre”

Lembrar que a variação entre os subgrupos é entendida como a variação da média de cada
subgrupo em relação á média total , que verificamos ser a média ponderada das médias dos
subgrupos (propriedade 1.4, já vista em aula anterior e revista acima na parte inicial).

Essa partição da variação é muito utilizada para o cálculo da razão entre a variação média
“entre” subgrupos e a variação média “dentro” de cada subgrupo, que informa onde há mais
variação, se entre os subgrupos (determinados por uma variável categórica que classifica as
observações que formam o conjunto de dados em cada subgrupo) ou dentro dos subgrupos.
Em inferência estatística essa razão é utilizada em uma metodologia denominada Análise de
Variância.

Exemplo:

Supor que 30 empresas de cada um dos setores de produtos agrícolas, produtos de


panificação e bebidas foram selecionadas, totalizando 90 empresas para análise (n = 90). Os
índices de liquidez corrente de cada empresa são mostrados no quadro abaixo, onde Índice de
Liquidez Corrente = Ativo circulante / Passivo circulante (O ativo circulante normalmente
inclui caixa, títulos negociáveis, contas a receber e estoques. O passivo circulante consiste em
contas a pagar, títulos de curto prazo, impostos a pagar e outros valores, principalmente
salários).

Índice de Liquidez Corrente por Setores


Observações Setores Total
Agrícola Panificação Bebidas
1 2,40 1,30 1,60
2 2,60 1,50 1,50
3 2,70 1,40 1,40
4 2,80 1,60 1,30
5 2,40 1,80 1,40
6 2,30 1,40 1,50
7 2,10 1,20 1,70
8 1,90 1,10 1,40
9 2,80 1,40 1,20
10 2,70 1,50 2,30
11 2,30 1,60 2,60
12 2,40 1,70 1,70
13 1,80 1,80 2,80
14 1,50 1,50 2,60
15 1,60 1,40 1,70
16 1,80 1,60 1,50
17 1,90 1,20 1,30
18 1,50 1,10 1,50
19 1,70 1,00 1,50
20 1,80 1,40 1,40
21 1,20 1,10 1,60
22 1,30 1,20 1,40
23 1,90 1,30 1,30
24 1,80 1,50 1,50
25 2,20 1,20 1,50
26 2,50 1,40 1,60
27 2,60 1,20 1,40
28 2,70 1,50 1,80
29 2,80 1,10 1,30
30 1,50 1,00 1,20

 63,50 41,00 48,50


 
j i
= 153
i
Xj 2,12 1,37 1,61 1,7

A seguir estão os Box-plots que representam os dados acima:


3,0
73

74
71
2,5
70

2,0

1,5

1,0

,5
22
21
0,0
N = 30 30 30

P.Q.Agrícola Pan if icaç ão Be bidas

se tore s an alisa dos

Utilizando a relação encontrada acima sobre a variação total:

Temos: Variação total = 22,16

Variação “dentro” dos subgrupos = 13,42

Variação “entre” os três subgrupos = 8,42

Através do cálculo das variações médias (momentos centrados de 2ª ordem) pode-se verificar
a razão entre as mesmas e descobrir se a variação média devida aos subgrupos (“entre”) é
maior que a variação média observada no conjunto total de dados (“dentro”) que é sempre
entendida como a variação residual dos dados em relação à média total.

Você também pode gostar