Você está na página 1de 23

Econometria I (IS 211)

Modelo de Regressão Múltipla:


Inferência
Lucas Siqueira de Castro
lucascastro@ufrrj.br

Referência

 WOOLDRIDGE, J. Introdução à
econometria: uma abordagem
moderna. São Paulo: Cengage
Learning, 6a edição, 2017, capítulo
4.

Modelo de Regressão Múltipla

 Dadas as hipóteses de Gauss-


Markov, estimador de MQO é BLUE
 Não-viesado
 Eficiente (menor variância)

 Para fazer teste de hipótese


clássico, é preciso de mais uma
hipótese

1
Normalidade

 Hipótese RLM6: Normalidade


 O erro populacional u é independente
das variáveis explicativas x1, x2,…, xk e
é normalmente distribuído com média
zero e variância constante s2.
 u~Normal(0, s2)
 Hipótese importante para pequenas e
médias amostras (amostras finitas)
 Hipótese forte
 RLM6 assume que RLM4 e RLM5 estão
satisfeitas

Modelo Linear Clássico

 As hipóteses RLM1 a RLM6 são


chamadas de hipóteses do modelo
linear clássico (MLC)

 Uma forma alternativa de resumir


as hipóteses é:
 y|x ~ Normal(b 0 + b 1x1 +…+ b kxk, s2)

Hipóteses do MLC

 Sob as hipóteses do MLC (RLM1 a


RLM6), os estimadores de MQO são
estimadores não viesados de
variância mínima
 Ao contrário do resultado do
Teorema de Gauss-Markov, não
precisa se restringir apenas aos
estimadores lineares

2
Distribuição Normal com
Homocedasticidade
y
f(y|x)

.E(y|x) = b + b1x
.
0

Distribuições normais

x11 x21
7

Exemplo 1

 O que se quer saber é se a


distribuição do erro (e de y) pode
ser aproximado por uma normal
 A variável dependente salárioh é
distribuída normalmente?
 salárioh nunca é zero
 Salário-mínimo impõe um piso na
distribuição
 Mas uma transformação de salárioh pode
se parecer com uma normal
 log(salárioh)

Exemplo 2

 No modelo de crime, a variável


dependente npre86 é o número de
vezes que um homem jovem é
preso
 npre86 segue uma normal?
 Não
 Pequenos valores inteiros
 Muitos zeros

3
Não-Normalidade

 E se o termo de erro u (e a variável


y) não seguir uma normal, nem
aproximadamente?

 A não normalidade dos erros não é


um problema sério com tamanhos
grandes de amostra
 Veremos isso no capítulo 5!

Quiz 1

 Suponha que o termo de erro u é


independente das variáveis
explicativas, e que assume os
valores -2, -1, 0, 1, 2 com
probabilidade igual a 1/5.
 Isso infringe as hipóteses de Gauss-
Markov?
 Isso infringe as hipóteses de MLC?

Distribuição Amostral Normal

 Sob as hipóteses MLC

bˆ j ~ Normal b j ,Var b j 

 Padronizando:

bˆ
j bj 
~ Normal 0,1
 
ep bˆ j

4
Teste t de Student

 Sob as hipóteses MLC


bˆ j bj ~t
 
ep bˆ j
n  k 1

  
em que ep b̂ j é calculado usando sˆ
2

 Ou seja, a variância do erro estimada,


uma vez que não se conhece a variância
do erro populacional
 Nessa situação, usa-se a distribuição t
com n-k-1 graus de liberdade.

Teste t de Student

 Outro jeito de ver a estatística t:


(estimativa  valorhipotético)
t
erro  padrão

 O conhecimento da distribuição
amostral do estimador permite
fazer o teste de hipóteses

Teste t de Student

 Teste de Hipóteses
 H0: b j=0
 H1: b j≠0
 Se não rejeitar H0, então xj não exerce
efeito sobre y
 Para implementar esse teste,
calcula-se a estatística:
bˆ j
t bˆ 
j
ep bˆ j  

5
Teste t de Student

 Teste de Hipóteses
 Componentes
 H0: Hipótese nula
 H1: hipótese alternativa
 Nível de significância (a)
 1% ou 5%

 Hipótese alternativa (H1)


 Unilateral (ou monocaudal)
 H1: bj > 0 (ou H1: bj < 0)
 Bilateral (ou bicaudal)
 H1: bj ≠ 0

Teste t de Student

 Nível de significância (a)


 Com uma probabilidade de 5% de
rejeitar H0, se ela é verdadeira, então
se diz que o nível de significância é de
5% (a0,05).
 Escolher um nível de significância de 5%
envolve olhar valor para o percentil 95%
da distribuição t com n-k-1 graus de
liberdade.
 Valor crítico c

Teste t

 Critério de decisão do teste


 Se a estatística t calculada for maior
que o valor crítico
 Rejeita-se H0
 Se a estatística t calculada for menor
que o valor crítico
 Não se rejeita H0

6
Exemplo de Teste Unilateral

Exemplo de Teste Unilateral

Exemplo

7
Teste t

 A distribuição t é simétrica
 Testar H1: bj < 0 é direto
 Considerar o valor crítico c negativo

 Para o teste bilateral


 Determinar o valor crítico c baseado
em a/2
 Rejeitar H1: b j ≠ 0 se o valor absoluto
da estatística t calculada for maior que
o valor crítico c

Exemplo de Teste Bilateral

Resumo para H0:b j=0

 Se não ficar explícito do contrário,


assume-se que o teste é bilateral

 Se H0 é rejeitada a 5% de nível de
significância, diz-se:

“O coeficiente bj é estatisticamente
significativo no nível de 5%”

8
Testando Outras Hipóteses

 Forma mais geral para o teste t


 Testar H0: bj=aj
 aj é um valor hipotético qualquer

 Nesse caso geral, a estatística t é:

bˆ j  a j
t
 
ep bˆ j

Exemplo

Exemplo (cont.)

 Teste
 H0:b1=-1

 Estatística t: (-0,954 + 1)/0,117=0,393

 t calculado menor que o valor crítico

 Então, não se rejeita H0


 Logo, existem evidências de que b1=-1

9
Cálculo de p-valores do teste t

 Dado o valor observado da


estatística t, qual é o menor nível
de significância ao qual a hipótese
nula seria rejeitada?
 Este nível de significância é o p-valor
do teste
 O p-valor é o nível de significância do
teste quando usamos o valor da
estatística de teste como o valor crítico

Cálculo de p-valores do teste t

Cálculo de p-valores do teste t

10
p-valor do Exemplo

Cálculo de p-valores do teste t

 Cálculo de p-valores de alternativas


unilaterais
 H1: b j>0

ou
 H1: b j<0

 Metade do p-valor de um teste bicaudal


 Isso porque a distribuição t é simétrica

Quiz 2

11
“Significâncias”

 Significância estatística versus


Significância econômica
 Significância estatística
 Tamanho das estatísticas t
 Significância econômica
 Magnitude e o sinal do coeficiente
 Cuidado!
 Pôr muita ênfase sobre a significância
estatística pode levar à conclusão de que
uma variável é “importante” embora seu
efeito é pequeno.

Significância Estatística

 Estatística t para o teste bilateral


 H0: b j=0
bˆ j
t bˆ 
j
 
ep bˆ j
 t grande
 𝛽 grande
 𝑒𝑝 𝛽 pequeno

Significância Estatística

 Amostras grandes levam a erros-


padrão 𝑒𝑝 𝛽 pequenos
 Estimativas com precisão (eficiência)
 Que nível de significância usar?
 Muito pequenas
 10%
 Pequenas ou médias amostras
 5%
 Grandes amostras
 1%

12
Significância Estatística

 Olhar a significância estatística


 Se o coeficiente não for
estatisticamente significativo indica que
o coeficiente não é diferente de zero
em termos estatísticos.
 Ou seja, a variável explicativa não
afeta a variável dependente (y)

Significância Econômica

 Sinal do coeficiente estimado


 De acordo com a teoria?

 Magnitude do coeficiente
 De acordo com a teoria?
 Tamanho do efeito da variável
explicativa na variável dependente

Intervalos de Confiança

 Outro teste estatístico clássico


 Construir um intervalo de confiança,
usando o mesmo valor crítico c adotado
no teste bilateral
 Um intervalo de (1-a)% de
confiança é definido:

 
bˆ j  c  ep bˆ j
 Em que c é percentil (1-(a/2)) numa
distribuição t com graus de liberdade
n-k-1

13
Intervalos de Confiança

Intervalos de Confiança

 Fazer teste de hipóteses com IC


 H0:bj=aj
 H1:bj≠aj

 Critério de decisão
 H0 é rejeitada em favor de H1 no nível
de significância de 5% (a=0,05) se aj
não está no intervalo de confiança de
95%

Exemplo

14
Exemplo

Testando uma Restrição Linear

 Em vez de b1 ser igual a um número


a, se quer testar, por exemplo, se
b1 é igual a outro parâmetro
 H0: b 1=b 2

 Estatística t:
bˆ1  bˆ2
t

ep bˆ1  bˆ2 

Testando uma Restrição Linear


Já que
  
ep bˆ1  bˆ2  Var bˆ1  bˆ2 , 
Então :
 
    
Var bˆ1  bˆ2  Var bˆ1  Var bˆ2  2Cov bˆ1 , bˆ2 
ep bˆ  bˆ   ep bˆ   ep bˆ   2 s 
1
2 2 2
1 2 1 2 12

em que s12 é uma estimativa de Cov bˆ1 , bˆ2  


45

15
Exemplo

 Em vez de estimar ep bˆ1  bˆ2 é  


possível estimar um modelo
diferente que produz o erro-padrão
de interesse.
 Seja o modelo:
 log(salárioh) = b 0 + b1cp + b2univ +
b3exper + u
 Interesse em saber se:
 H0: b1 =b2

Exemplo

 Reescrevendo o modelo,
considerando que q1=b1-b2:

 Log(salarioh) = b0 + (q1+b2)cp + b 2univ


+ b3exper + u
 Log(salarioh) = b0 + q1cp +
b2(cp+univ) + b 3exper + u

 Logo a estatística t que o Eviews ou o Stata


lançar para q1 será a do nosso interesse

Restrições Lineares Múltiplas

 Teste múltiplo de hipóteses


 k parâmetros são conjuntamente
significativos?
 Teste de restrições de exclusão
 Testar se um grupo de parâmetros é
igual a zero
 H0: b k-q+1=0,..., b k=0
 H1: H0 não é verdadeira
 Teste t para cada b não é válido
agora
 Usar outra distribuição

16
Exemplo

Teste Múltiplo de Hipóteses

 Testando a produtividade b3=0


 H0: b 3=0, b4=0, b 5=0
 H1: H0 não é verdadeira
 Note que basta um beta ser diferente de
zero que se rejeita H0
 Por ex., b3≠0
 Que tal usar a estatística t?
 Bad ideia!
 Um t particular testa uma hipótese que
não coloca restrições sobre os outros
parâmetros

Teste Múltiplo de Hipóteses

 Implementação do teste
 Estimar o modelo restrito
 Com xk-q+1 variáveis excluídas
 Estimar o modelo irrestrito
 Sem variáveis excluídas
 Intuição
 A mudança em SQR é “suficientemente
grande” quando se excluem aquelas
variáveis?

17
Exemplo

n=353, SQR=183,186, R2=0,6278

Exemplo

Teste F

 Estatística F
SQRr  SQRir 
Fq ,n k 1 
q
ou
SQRr  SQRir   n  k  1
SQRir SQRir q
n  k  1
 SQRr é a soma de quadrados dos
resíduos do modelo restrito
 SQRir é a soma de quadrados dos
resíduos do modelo irrestrito
 F é sempre positivo
 SQRr > SQRir

18
Teste F

 Note que:
 q: número de restrições
 n-k-1: graus de liberdade do modelo
irrestrito (glir)
 Mede quanto varia a soma dos
quadrados dos resíduos (SQR) quando
se passa de um modelo irrestrito para
o modelo restrito

Teste F

 Quanto a variação relativa em SQR


é “suficientemente grande” quando
se passa do modelo irrestrito para o
restrito?
 Distribuição amostral de F

Distribuição do Teste F

57

19
Exemplo

A Relação entre F e t

 E se usar a estatística F para testar


a exclusão de uma única variável
(q=1)?
 Desde que a hipótese alternativa (H1)
seja bilateral, a estatística F para testar
uma variável excluída é igual ao
quadrado da estatística t
correspondente.
 F=t2

A Forma R-quadrado da
Estatística F

 Dado que SQR = SQT*(1-R2) para


qualquer regressão
 Uso dessa informação para derivar
outra fórmula para F
 Outra fórmula da estatística F:
R
 Rr2 2

R 2  R 2  n  k  1
ir
q
F  ir 2r 
1  Rir  1  Rir 
2
q
n  k  1

20
A Forma R-quadrado da
Estatística F

Exemplo

Quiz 3

 Duas equações foram estimadas:


 taxafreq = 47,13 + 13,37nmgradp
(2,87) (1,09)
 n=680, R2=0,183

 taxafreq =75,70+17,26nmgradp+ 1,72tac


(3,88) (1,08) (?)
 n=680, R2=0,291
 Qual é o erro-padrão do coeficiente de
tac?

21
Significância Geral da Regressão

 Um caso especial de restrições de


exclusão é testar:
 H0: b 1=b 2=...=b k=0

 Nesse caso em particular, a


estatística F:
R2
q
F
1  R 
2

n  k  1

Restrições Lineares Gerais

 Procedimento do teste F para


qualquer conjunto de restrições
lineares:
 1º passo: estime o modelo irrestrito
 2º passo: estime o modelo restrito
 3º passo: anote o SQR de cada modelo
 4º passo: calcule a estatística F

Restrições Lineares Gerais

 Procedimento do teste F
(continuação)
 5º passo: defina um nível de
significância (por exemplo, a5%)
 6º passo: observe a tabela de
distribuição de F para esse nível de
significância e para os graus de
liberdade do numerador (q) e do
denominador (n-k-1), e obtenha o
valor crítico c

22
Restrições Lineares Gerais

 Procedimento do teste F
(continuação)
 7º passo: adote o seguinte critério de
decisão
 Se F ≥ c, rejeite H0
 Se F < c, não rejeite H0
 Note que:
 Pode-se substituir os passos 5 e 6, se o
software fornecer o p-valor
 Com o p-valor, toma-se a decisão de
rejeitar ou não (passo 7)

23

Você também pode gostar