Você está na página 1de 11

Análise de Variância

Econometria
Alexandre Gori Maia
Ementa:
• Soma dos Quadrados;
• Coeficiente de Determinação;
• Teste F para Tabela ANOVA;
• Coeficiente de Determinação Ajustado;

Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 7.
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado

Soma dos Quadrados - Conceito


Quando X explica Y Quando X não explica Y
Y Maior Soma dos Y Menor Soma dos
Quadrados da Quadrados da
Regressão Regressão

Y Y
^
Y
^
Y

X X
n n n
STQ   (Yi  Y ) 2
SQReg   (Yˆi  Y ) 2 SQRes   (Yi  Yˆi ) 2
i 1 i 1 i 1

2/11
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado

Soma dos Quadrados - Definição


Soma Total dos Quadrados (STQ): Y
n n
STQ   (Yi  Y ) 2   yi  y T y  nY 2 STQ
2

i 1 i 1
X1 X2
Variabilidade total da variável dependente. Representa as distâncias
quadráticas dos valores de Y em relação à média aritmética.

Soma dos Quadrados da Regressão (SQReg):


n Y
SQReg   (Yˆi  Y )  βˆ X y  nY
2 T T 2
SQReg
i 1
X1 X
Variabilidade da variável dependente explicada pelo conjunto de variáveis 2
independentes. Representa as distâncias quadráticas dos valores
ajustados pelo modelo em relação à média aritmética.
Soma dos Quadrados dos Resíduos (SQRes): Y
n SQRes
SQRes   (Yi  Yˆi ) 2  eˆ T eˆ  y T y  βˆ T XT y
i 1
X1 X2
Variabilidade da variável dependente não explicada pelo conjunto de
variáveis independentes. Representa as distâncias quadráticas entre os
valores observados de Y e seus valores ajustados pelo modelo.
3/11
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado

Análise de Variância
Soma dos Quadrados
Fonte GL Quadrados F
Médios

SQReg F
SQReg/k
Regressão k βˆ T XT y  nY 2 k SQRes/ (n  k  1)

SQRes
Resíduos n  (k  1) y y  βˆ T XT y
T
n  (k  1)

Total n 1 yT y  nY 2

4/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação

Coeficiente de Determinação
Coeficiente de Determinação (R2):
Definição: Estima a proporção da variabilidade da variável dependente
(Y) que é explicada pelo conjunto das k variáveis independentes do
modelo de regressão (X).
Y
SQReg SQRes
R2   1 X1
STQ STQ X2

Escala para R2:

0 1
Independência Relação
linear linear exata
5/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação

Soma dos Quadrados - Exemplo


Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Yi  1,9  1X 1i  0,06 X 2i  eˆi

Y X1 X2
(Renda) (Anos (Idade)
Estudo)
4 1 20

8 4 30

10 6 40

12 7 50 SQReg 34,8
R2    0,994
4 STQ 35
  As variáveis anos de estudo e
8
STQ  y y  nY  4 8 10 12    4(8,5)  324  289  35 idade explicam, conjuntamente,
T 2 2
10
  quase a totatilidade (99,4%) da
12 
  variabilidade observada para a
 34  renda familiar na amostra.
 
SQReg  βˆ T XT y  nY 2  1,9 1 0,06  180   4(8,5)  323,8  289  34,8
2

1320 
 
SQ Re s  STQ  SQ Re g  35  34,8  0,2
6/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

Teste F para ANOVA- Exemplo


Seja o modelo de RLM com duas variáveis: Y    1 X1  2 X 2  e

H 0 : 1   2  0
E as hipóteses: 
H1 : Pelo menos um  j  0

Possíveis resultados do modelo:

Y Y Y
Y

X2 X1
X1 X2
X1 X2 X1 X2

10 20 1=0 20 10 2=0 1=0 2=0


Nenhuma variável
X1 e X2 contribuem Apenas X2 contribui Apenas X1 contribui
contribui para
para explicar Y. H0 para explicar Y. H0 para explicar Y. H0
explicar Y. H0 não
deveria ser rejeitado deveria ser rejeitado deveria ser rejeitado
deveria ser rejeitado

7/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

Teste F para ANOVA


Seja o modelo de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para testarmos a contribuição do conjunto de k variáveis independentes do modelo,
teremos as hipóteses:

H0: 1=...=k =0 (não contribui)


H1: Pelo menos um j 0 (contribui) F ~ Fn,nk 1
A estatística de teste será Considerando
H0 verdadeiro, a
SQReg/k fdp de F será... p
F
SQRes/ (n  k  1) F
Rejeitar H0 significa afirmar que o modelo contribui para explicar Y, ou seja, há
relação significativa entre pelo menos uma variável explicativa e a variável
dependente.

8/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

Teste F para ANOVA - Exemplo


Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Y  1,9  1X  0,06 X  eˆ
i 1i 2i i

SQReg/ 2
~ F2 ,1
SQRes/1

0,076
F  87,0

valor p = 0,076
Há evidências moderadas para
afirmar que o modelo contribui
para explicar a variabilidade da
renda familiar. A probabilidade de
erro ao fazermos tal afirmação é
de aproximadamente 7,6%.
9/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

R2 Ajustado - Definição
Seja o ajuste: Incorporando uma variável independente adicional (X3):
Yi    ˆ1 X 1i  ˆ2 X 2i  eˆi Yi    ˆ1 X 1i  ˆ2 X 2i  ˆ3 X 3i  eˆi
Poderemos ter: Ry2123  Ry212
Ry2123  Ry212
SQReg
Y Ry212  Y Y
STQ X3 X3
SQReg SQReg ou SQReg
X1 X X1 X2 X1 X
2 2

O R2 nunca diminui quando incorporamos variáveis


independentes adicionais no modelo.
_
Coeficiente de _Determinação Ajustado (R2):
O R2 ajustado (R2) pondera o coeficiente de determinação (R2) pelo número de variáveis
explicativas e pelo número de observações da amostra. É particularmente útil quando
desejamos comparar modelos de regressão múltipla que prevêem a mesma variável
dependente, pois penaliza aquele modelo com maior número de variáveis independentes.
Será dado por:
SQRes/ [n  (k  1)] n 1
R 2  1  1  (1  R 2 )
STQ/ (n  1) n  (k  1) 10/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

R2 Ajustado - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Y  1,9  1X  0,06 X  eˆ
i 1i 2i i

R 2  0,994
4 1
R 2  1  (1  0,994)  0,982
4  (2  1)
Não há mudanças expressivas no coeficiente de determinação ajustado pelo número de
observações e variáveis do modelo é expressivamente inferior ao R2. Reflexo, sobretudo,
do elevadíssimo valor encontrado para o R2.

11/11

Você também pode gostar