Você está na página 1de 6

Notes

Análise Multivariada I
Graduação em Ciências Atuariais

Henrique Castro
hcastro@usp.br

Universidade de São Paulo

2017

1 of 23

Notes

Lecture 7
Análise de regressão múltipla: outros testes de
hipóteses

2 of 23

Notes
Introdução
Lecture 7: Testando combinação de parâmetros

• Na aula anterior vimos como usar a estatística t e intervalos de


confiança para testar hipóteses acerca dos valores dos βj .
• Vimos como testar cada βj individualmente.
• Agora veremos como testar hipóteses que envolvem mais de um
parâmetro da população.

3 of 23

Notes
Exemplo 1
Lecture 7: Testando combinação de parâmetros

• Considere um modelo que compara os retornos da educação de


cursos superiores profissionalizantes de dois anos (junior college) e
de cursos superiores de quatro anos (universities):
log(wage) = β0 + β1 jc + β2 univ + β3 exper + u, (L7.1)
tal que jc é o número de anos frequentados em junior college, univ
é o número de anos frequentados em universidade e exper é o total
de experiência profissional.
• A hipótese de interesse é se um ano de junior college é igual a um
ano na universidade, ou seja:
H0 : β1 = β2
H1 : β1 < β2
4 of 23
Notes
Exemplo 1: teste t
Lecture 7: Testando combinação de parâmetros

• Não podemos usar as estatísticas t individuais para β̂1 e β̂2 para


testar H0 .
• A hipótese nula pode ser reescrita como H0 : β1 − β2 = 0, e a
alternativa como H1 : β1 − β2 < 0.
• O teste de hipóteses adequado é

β̂1 − β̂2
t= . (L7.2)
ep(β̂1 − β̂2 )
• O que torna o teste em (L7.2) mais difícil é encontrar o valor do
denominador.

5 of 23

Notes
Exemplo 1: estratégia
Lecture 7: Testando combinação de parâmetros

• Uma forma de tratar esse problema é criar um coeficiente


θ = β1 − β2 e testarmos H0 : θ = 0 contra H1 : θ < 0.
• A partir da equação (L7.1), substituindo β1 = θ + β2 , temos:

log(wage) = β0 + β1 jc + β2 univ + β3 exper + u


= β0 + (θ + β2 )jc + β2 univ + β3 exper + u
= β0 + θjc + β2 (jc + univ ) + β3 exper + u. (L7.3)

• Da equação (L7.3), testamos se θ = 0.

6 of 23

Notes
Exemplo 1: estimação
Lecture 7: Testando combinação de parâmetros

• Usando o arquivo TWOYEAR.dta para estimar as equações (L7.1) e


(L7.3), temos:

\ = 1.472 + 0.0667 jc + 0.0769 univ + 0.0049 exper


lwage
(0.021) (0.0068) (0.0023) (0.0002)

n = 6763 R 2 = 0.222

\ = 1.472 − 0.0102 jc + 0.0769 totcoll + 0.0049 exper


lwage
(0.021) (0.0069) (0.0023) (0.0002)

n = 6763 R 2 = 0.222

7 of 23

Notes
Exemplo 1: estimação
Lecture 7: Testando combinação de parâmetros

• Há alguma evidência (mas não forte) contra H0 em um teste


unicaudal:

Coefficient Std. Error t-ratio p-value


const 1.47 0.0211 69.91 0.000
jc −0.0102 0.00694 −1.47 0.142
totcoll 0.0769 0.00231 33.30 0.000
exper 0.00494 0.000157 31.40 0.000

8 of 23
Notes
Exemplo 1: estimação
Lecture 7: Testando combinação de parâmetros

• É possível obter esse teste diretamente em muitos softwares


estatísticos, como o Gretl:

Restriction:
b[jc] - b[univ] = 0

Test statistic: F(1, 6759) = 2.15402, with p-value = 0.142

9 of 23

Notes
Introdução
Lecture 7: Testando múltiplas restrições lineares: teste F

• Até agora testamos hipóteses em relação a uma única restrição


linear.
• Mas podemos querer testar múltiplas restrições lineares.
• Exemplo: como saber se um conjunto de variáveis independentes
têm efeito parcial sobre a variável dependente?

10 of 23

Notes
Testando restrições de exclusão
Lecture 7: Testando múltiplas restrições lineares: teste F

• Agora queremos testar se um grupo de variáveis tem ou não efeito sobre


a variável resposta.
• Seja o seguinte modelo, estimado com jogadores da MLB:
log(salary ) = β0 + β1 years + β2 gamesyr + β3 bavg
+ β4 hrunsyr + β5 rbisyr + u, (L7.4)
tal que salary é o salário total em 1993, years é o tempo de liga, gamesyr
é a média de jogos por ano, bavg é a média de rebatidas na carreira,
hrunsyr é home runs por ano, rbisyr é a quantidade de rebatidas que
geraram corrida por ano.
• Queremos testar se as três últimas variáveis, que medem a produtividade
dos atletas, têm efeito sobre salário controlando por years e gamesyr :
H0 : β3 = 0, β4 = 0, β5 = 0. (L7.5)
11 of 23

Notes
Restrições de exclusão
Lecture 7: Testando múltiplas restrições lineares: teste F

• A hipótese nula em (L7.5) constitui três restrições de exclusão:


se (L7.5) for verdadeira, então as três variáveis não tem efeito
sobre salário e podem ser excluídas do modelo.
• Esse teste é também chamado de teste de hipótese conjunto.
• A hipótese alternativa a (L7.5) é: estatísticas de desempenho são
importantes para explicar salários após controlarmos por years e
gamesyr .

H1 : β3 6= 0, ou β4 6= 0, ou β5 6= 0. (L7.6)

12 of 23
Notes
Como testar hipóteses de restrições de
exclusão?
Lecture 7: Testando múltiplas restrições lineares: teste F

• É tentador querer usar testes t individuais para cada variável.


• Mas qual resultado implicaria em rejeição de (L7.5)? As três
hipóteses teriam que ser rejeitadas, ou bastaria uma delas?
• Essa não é uma questão simples de responder. Felizmente, há
outra forma de conduzir esse teste.

13 of 23

Notes
Modelos restrito e irrestrito
Lecture 7: Testando múltiplas restrições lineares: teste F

• Para testar (L7.5) precisamos estimar dois modelos:


◦ Modelo irrestrito: o que contém todas as variáveis, conforme (L7.4).
◦ Modelo restrito: equação (L7.4) sem as três variáveis sob investigação.
• De cada modelo guardamos a soma dos quadrados dos resíduos
(SSR) e computamos uma estatística F :

(SSRr − SSRir )/q


F ≡ ∼ Fq,n−k−1 , (L7.7)
SSRir /(n − k − 1)

tal que os subscritos r e ir são para o modelo restrito e irrestrito, q


é a quantidade de restrições de exclusão, n é o tamanho da
amostra, e k + 1 é o número de parâmetros do modelo irrestrito.

14 of 23

Notes
Exemplo 2
Lecture 7: Testando múltiplas restrições lineares: teste F

• Usando os dados em MLB1.dta, obtemos os modelos irrestrito e


restrito:

\ = 11.19 + 0.0689 years + 0.0126 gamesyr + 0.00098 bavg


lsalary
(0.29) (0.0121) (0.0026) (0.00110)

+ 0.0144 hrunsyr + 0.0108 rbisyr


(0.0161) (0.0072)

n = 353 R 2 = 0.6278 SSR = 183.1863

\ = 11.22 + 0.0713 years + 0.0202 gamesyr


lsalary
(0.11) (0.0125) (0.0013)

n = 353 R 2 = 0.5971 SSR = 198.3115


15 of 23

Notes
Exemplo 2
Lecture 7: Testando múltiplas restrições lineares: teste F

• A estatística F calculada é:

(198.3115 − 183.1863)/3
F = ≈ 9.55.
183.1863/(353 − 6)
• O valor crítico da distribuição F a 5% com 3 graus de liberdade no
numerador e 347 graus de liberdade no denominador é 2.60.
• O valor crítico a 1% é 3.78.
• Portanto, rejeitamos H0 .

16 of 23
Notes
Exemplo 2
Lecture 7: Testando múltiplas restrições lineares: teste F

• Diversos softwares estatísticos oferecem esse teste diretamente.


• No Gretl, temos:

Restriction set
1: b[bavg] = 0
2: b[hrunsyr] = 0
3: b[rbisyr] = 0

Test statistic: F(3, 347) = 9.550, with p-value = 4.47e-06

17 of 23

Notes
Outra versão do teste F
Lecture 7: Testando múltiplas restrições lineares: teste F

• É possível testar restrições de exclusão usando o teste F e os


valores de R 2 da regressão no lugar de SSR.
• Basta lembrar que SSR = SST (1 − R 2 ).
• A nova estatística de teste é:

(Rir2 − Rr2 )/q


F = . (L7.8)
(1 − Rir2 )/(n − k − 1)

18 of 23

Notes
Teste F para significância global
Lecture 7: Testando múltiplas restrições lineares: teste F

• Um caso especial de restrições de exclusão é geralmente reportado nas


saídas de softwares estatísticos.
• É o teste da seguinte hipótese nula:

H0 : x1 , x2 , . . . , xk não ajudam a explicar y .

• Em outras palavras,

H0 : β1 = β2 = · · · = βk = 0. (L7.9)

• A hipótese alternativa é que algum βj é diferente de zero.


• A estatística F que testa (L7.9) é

R 2 /k
F ≡ ∼ Fk,n−k−1 . (L7.10)
(1 − R 2 )/(n − k − 1)
19 of 23

Notes
Teste de restrições lineares gerais
Lecture 7: Testando múltiplas restrições lineares: teste F

• Considere a seguinte equação (HPRICE1.dta):


log(price) =β0 + β1 log(assess) + β2 log(lotsize)
+ β3 log(sqrft) + β4 bdrms + u, (L7.11)
tal que price é o preço da casa, assess é o valor avaliado da casa antes
dela ser vendida, lotsize é o tamanho do terreno em pés quadrados, sqrft
é a área em pés quadrados e bdrms é a quantidade de dormitórios.
• Você quer testar se o preço da avaliação das casas é uma avaliação
racional: uma variação de 1% em assess deve estar associada a uma
variação de 1% em preço, isto é, β1 = 1.
• Além disso, as outras variáveis não devem ajudar a explicar o log do
preço, uma vez que o valor de avaliação prévia já está controlado.
• Juntas, essas hipóteses são:
H0 : β1 = 1, β2 = β3 = β4 = 0. (L7.12)
20 of 23
Notes
Exemplo 3
Lecture 7: Testando múltiplas restrições lineares: teste F

• A equação estimada é:

\ = 0.264 + 1.043 lassess + 0.007 llotsize − 0.103 lsqrft


lprice
(0.570) (0.151) (0.039) (0.138)

+ 0.0338 bdrms, n = 88 R 2 = 0.773.


(0.0221)

• No Gretl, temos:
Restriction set
1: b[lassess] = 1
2: b[llotsize] = 0
3: b[lsqrft] = 0
4: b[bdrms] = 0

Test statistic: F(4, 83) = 0.668, with p-value = 0.616


21 of 23

Notes
Guia para relatar resultados
Lecture 7: Reportando resultados da regressão

• Os coeficientes estimados devem sempre ser informados.


• As variáveis chave da análise devem ter os coeficientes estimados
interpretados.
• A importância econômica das estimativas das variáveis chave
devem ser discutidas.
• Os erros-padrão devem sempre ser incluídos juntamente com os
coeficientes estimados. Ter os erros-padrão torna mais fácil
calcular os intervalos de confiança.
• O R-quadrado da regressão deve sempre ser incluído.
• O número de observações usado na estimação de qualquer equação
deve aparecer próximo da equação estimada.
22 of 23

Notes
Guia para relatar resultados
Lecture 7: Reportando resultados da regressão

• Quando alguns modelos são estimados, apresente-os assim:

Dependent variable: lwage


(1) (2) (3)

Constant 0.584∗∗∗ 0.284∗∗∗ 0.202∗∗


(0.097) (0.104) (0.101)
educ 0.083∗∗∗ 0.092∗∗∗ 0.085∗∗∗
(0.008) (0.007) (0.007)
exper 0.004∗∗ 0.029∗∗∗
(0.002) (0.005)
tenure 0.022∗∗∗ 0.037∗∗∗
(0.003) (0.007)
expersq −0.001∗∗∗
(0.0001)
tenursq −0.001∗∗
(0.0002)

Observations 526 526 526


R2 0.186 0.316 0.367
∗ ∗∗ ∗∗∗
Note: p<0.1; p<0.05; p<0.01

23 of 23

Notes

Você também pode gostar