Você está na página 1de 17

Econometria I (IS 211)

Modelo de Regressão Múltipla:


Problemas Adicionais

Lucas Siqueira de Castro


lucascastro@ufrrj.br

Referência

 WOOLDRIDGE, J. Introdução à
econometria: uma abordagem
moderna. São Paulo: Cengage
Learning, 6a edição, 2017, capítulo
6.

Mudança de Escala

 Mudança de escala da variável y


⚫ Provoca mudança na escala de todos os
coeficientes estimados
 Exemplo
⚫ Se a variável dependente é multiplicada por
um número c, todos os coeficientes e os seu
erros-padrão são multiplicados também por
c
 As estatísticas t e F ficam inalteradas

1
Exemplo

Exemplo

Mudança de Escala

 Mudança de escala de uma variável


explicativa x
⚫ Se xj for multiplicado por um número c,
seus coeficientes e os respectivos
erros-padrão são divididos por c.
 As estatísticas t e F não se alteram

2
Exemplo

Quiz 1

 Na equação original sobre pesos dos


recém-nascidos, suponha que
faminc seja medida em dólares em
vez de milhares de dólares. Desse
modo, defina a variável
fincdol=1000*faminc
 Como mudam os resultados MQO
quando fincdol substitui faminc?

Mudança de Escala e Logaritmo

3
Mudança de Escala e Logaritmo

Forma Funcional

 MQO
⚫ Uso de relações não-lineares entre y e
x por adotar funções não lineares de y
ex
 Mas permanece a linearidade dos
parâmetros
⚫ Exemplos de funções não lineares de y
ex
 log(y) ou log(x)
 Formas quadráticas de x
 Interações de variáveis x

Interpretação de Modelos com Log

 Modelo log-log

ln(y) = b0 + b1ln(x) + u

 Interpretação
⚫ b1 é a elasticidade constante de y com
respeito a x
⚫ Um aumento de Dx% em x provoca um
aumento de b1Dx% em y

4
Interpretação de Modelos com Log

 Modelo log-nível
ln(y) = b0 + b1x + u
 Interpretação
⚫ b1 é a mudança percentual em y dada
uma mudança de 1 unidade em x
 b1 é chamado de semielasticidade
 Um aumento de Dx provoca um aumento
aproximado de (100.b1)Dx em y
 Um aumento de Dx provoca um aumento
exato de 100[exp(b1Dx)-1] em y

Exemplo
Elasticidade constante

Semielasticidade

Exemplo

 Interpretação
⚫ Um aumento de 1% em oxn faz cair o
preço em 0,718%
 Elasticidade constante
⚫ Quando comods aumenta em 1, o
preço aumenta em aproximadamente
100*(0,306)=30,6% ou exatamente
100*[exp(0,306*1)-1]=35,8%
⚫ Neste exemplo, Dx=Dcomods=1
⚫ O ajuste não é tão crucial para pequenas
mudanças percentuais
⚫ Semielasticidade do preço em relação a
comods

5
Por Que Usar Modelos com Logs?

 Modelos em log são invariantes à


escala das variáveis uma vez que
medem variações percentuais
 Para y>0:
⚫ Distribuição condicional de y
 heterocedástica ou com cauda
⚫ Distribuição condicional de log(y)
 Menos heterocedástica
 Menos cauda
 Às vezes, elimina a heterocedasticidade e
a cauda ao mesmo tempo

Por Que Usar Modelos com Logs?

 Uso de log estreita a amplitude dos


valores das variáveis
⚫ Estimativas menos sensíveis a
observações extremas (outliers) na
variável dependente e nas variáveis
independentes
⚫ Indução de normalidade do termo de
erro

Que Variáveis são Transformadas


em Log?
 Quando a variável é um valor
monetário positivo, costuma-se
transformar em log
⚫ Salários, vendas no comércio, valor de
mercado das empresas
 Mas isso não é regra!

 Variáveis com valores muito grandes


⚫ População
⚫ Número de empregados

6
Que Variáveis Costumam Não Ser
Transformadas em Log?

 Variáveis com especificação em


nível
⚫ Variáveis medidas em anos
 Escolaridade
 Experiência
 Idade

⚫ Variáveis que são proporção ou


porcentagem
 Taxa de desemprego
 Taxa de estudantes aprovados

Que Variáveis São Transformadas


em Log?

 Pode ser variáveis que são


proporção ou porcentagem
⚫ Mas cuidado com a interpretação!
⚫ Variação em pontos percentuais versus
Variação percentual
 desemp é variável de taxa de desemprego
⚫ Quando desemp passa de 8 para 9,
aumentou 1 pp
 Equivalente a 12,5% sobre o nível de

desemprego original (1/8)


⚫ Quando se usa log(desemp), se quer saber a
variação percentual na taxa de desemprego:
 log(9) – log(8) ≈ 0,118 ou 11,8%

Problema de se Aplicar Log

 Não existe log de valores negativos


ou zero
 Quando a variável y assume alguns
valores nulos, o que fazer?
 Solução
⚫ Aplicar log(1 + y)
⚫ Interpretação ainda de elasticidade
constante

7
Modelos Quadráticos

 Modelo
⚫ y = b 0 + b 1x + b 2x2 + u

⚫ b 1 não pode ser interpretado como a


única medida da influência de x sobre y
⚫ b 2 também mede uma parte da
influência de x sobre y

Modelos Quadráticos

 Efeito sobre y

( )
Dyˆ  bˆ1 + 2 bˆ2 x Dx

 Ou
Dyˆ ˆ
 b1 + 2 bˆ2 x
Dx

Modelos Quadráticos

 Suponha que o coeficiente de x


(b1>0) seja positivo e o coeficiente
de x2 seja negativo (b2<0)
⚫ y cresce primeiro chega a um máximo
e depois decresce em relação a x
 O ponto de máximo é:

( )
x* = bˆ1 2 bˆ2

8
Modelos Quadráticos

 Suponha que o coeficiente de x


(b1<0) seja negativo e o coeficiente
de x2 seja positivo (b2>0)
⚫ y decresce primeiro chega a um
mínimo e depois cresce em relação a x
 O ponto de mínimo é:

( )
x* = bˆ1 2 bˆ2

⚫ Note que o ponto de mínimo e o ponto de


máximo são os mesmos x*

Exemplo

Exemplo

 Interpretação
⚫ exper tem efeito de redução sobre
salárioh
⚫ O primeiro ano de experiência vale:
US$0,298 por hora
⚫ O segundo ano vale menos:
 US$0,298 – 2(0,0061)(1)~0,286
⚫ Aumentando de 10 para 11:
 US$0,298 - 2(0,0061)(10)~0,176

9
Exemplo

Termos de Interação

 Modelo
⚫ y = b 0 + b 1x1 + b 2x2 + b 3x1x2 + u

 Medição do efeito de x1 sobre y


⚫ papel de b1
⚫ papel de b3
⚫ Fórmula: Dy = b1 + b 3 x 2
Dx1

⚫ Qual x2?
 x2 médio: x2

10
Modelo Hedônico

Exemplo

Exemplo

11
Ainda o R-quadrado
 Indicador de quanto da variação de
y é explicada por x1, x2,..., xj

 Não é importante para se


considerar se o estimador é justo
(não-viesado)

 Superestimação de sua importância

Ainda o R-quadrado

 R2 alto
⚫ s2u baixo
⚫ O estimador pode ser viesado ou não
 Isso depende da hipótese de média
condicional zero
 R2 baixo
⚫ s2u alto
⚫ Vários fatores não foram levados em
conta no lado direito da regressão

R-Quadrado Ajustado

 R2 sempre aumenta à medida que


se inserem variáveis no lado direito
do modelo de regressão
 R2 ajustado leva em conta o número
de variáveis no modelo

R 2  1−
SQR (n − k − 1)
SQT (n − 1)
 Ou
sˆ 2
R 2  1−
SQT (n − 1)

12
R-Quadrado Ajustado

 R2 ajustado como medida de ajuste


da regressão
⚫ Imposição de uma penalidade à
inclusão de variáveis independentes
adicionais
⚫ Comparação entre dois modelos que
tenham a mesma var. dependente
 Não se usa para comparar modelos com
variáveis dependentes diferentes
⚫ Exemplo: um modelo com y e o outro com
log(y)

R-Quadrado Ajustado

 R2 ajustado em função do R2:

(1 − R 2 )(n − 1)
R 2 = 1−
(n − k − 1)

 Exemplo
⚫ R2=0,30; n=51 e k=10

0,70(50)
R 2 = 1− = 0,125
40

R-Quadrado Ajustado
 R-quadrado ajustado pode ser
negativo!!!
 Exemplo
⚫ R2=0,10, n=51, k=10

0,90(50)
R2 = 1− = −0,125
40
⚫ R-quadrado ajustado negativo indica
ajuste ruim da regressão aos dados

13
Ajuste da Regressão

 Não se deve supervalorizar o R2 ou


R2 ajustado
⚫ Olhar a teoria e o bom senso
 A não inclusão de uma variável que
influencie y no modelo não invalida
o efeito ceteris paribus dos
coeficiente das outras variáveis
⚫ A não ser que haja omissão de variável
relevante

Adição de Regressores na
Regressão

 1º caso:
⚫ Inclusão de regressores que afetam y e
estão correlacionados com outros
regressores
 Redução da variância do erro
 Multicolinearidade
 Efeito sobre o erro-padrão indefinido
𝜎ො
𝑒𝑝 𝛽መ𝑗 =
𝑆𝑄𝑇𝑗 1 − 𝑅𝑗2

Adição de Regressores na
Regressão

 2º caso:
⚫ Inclusão de regressores que afetam y e
não estão correlacionados com outros
regressores
 Redução da variância do erro
 Menor erro-padrão das estimativas
 Maior eficiência

 Maior precisão

14
Intervalos de Confiança de
Previsões

 Considere a equação estimada


𝑦ො = 𝛽መ0 +𝛽መ1 𝑥1 + 𝛽መ2 𝑥2 + ⋯ + 𝛽መ𝑘 𝑥𝑘

⚫ Quando se inserem valores específicos


das variáveis explicativas nesta
equação, obtém-se uma previsão para
a variável dependente y

Intervalos de Confiança de
Previsões

 Sejam c1, c2,..., ck valores


particulares de cada uma das
variáveis explicativas
𝐸 𝑦 𝑥1 = 𝑐1 , 𝑥2 = 𝑐2 , … , 𝑥𝑘 = 𝑐𝑘

 Em outros termos:
𝜃෠0 = 𝛽መ0 +𝛽መ1 𝑐1 + 𝛽መ2 𝑐2 + ⋯ + 𝛽መ𝑘 𝑐𝑘
 𝜃෠0 : valor previsto de y

Intervalos de Confiança de
Previsões

 Como construir um intervalo de


confiança de 𝜃෠0 ?
⚫ Ou seja, construir um indicador de
incerteza nesse valor previsto de y
 Para construir um IC de 95% de
confiança para 𝜃෠0 , é preciso um
erro-padrão de 𝜃෠0 :
𝜃෠0 ± 2 ∙ 𝑒𝑝 𝜃෠0
⚫ Note que esse IC é aproximado!
 Válido para tamanho de amostra (n) grande

15
Intervalos de Confiança de
Previsões

 Vamos usar um truque para obter o


desconhecido 𝑒𝑝 𝜃෠0
 Escreva:
𝛽0 = 𝜃0 − 𝛽1 𝑐1 − 𝛽2 𝑐2 − ⋯ − 𝛽𝑘 𝑐𝑘
 E junte isso à equação:
 𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝑢
 Obtendo:
 𝑦 = 𝜃0 + 𝛽1 𝑥1 − 𝑐1 + 𝛽2 𝑥2 − 𝑐2 + ⋯ +
𝛽𝑘 𝑥𝑘 − 𝑐𝑘 + 𝑢

Intervalos de Confiança de
Previsões

 De modo prático, subtrai-se o valor


cj de cada observação de xj, e
depois computa-se a seguinte
regressão:
⚫ Rodar yi contra uma constante, (xi1-
c1),..., (xik - ck)
para i=1,2,...,n
 O valor previsto de y e seu erro-padrão
são obtidos da constante desta regressão

Análise de Resíduos

 Resíduos:
uˆi = yi − yˆ i
 Informação útil pode ser obtida,
observando-se os resíduos
⚫ Exemplo: modelo de preços hedônicos
 Regressão dos preços das residências
contra um conjunto de características
dessas residências
⚫ Resíduos negativos indicam boas
oportunidades de compra
⚫ Resíduos positivos indicam maus negócios

16
Quiz 2

 Como você usaria a análise de


resíduo para determinar quais
jogadores de futebol estão sendo
pagos demais ou estão sendo mal
pagos com relação aos seus
desempenhos?

Resíduo de Solow

 Seja o modelo de Solow:


𝑦 = 𝐴𝐾𝛽1 𝐿𝛽2 𝑒 𝑢

 Linearizando (aplicando ln):


𝑙𝑛𝑦 = 𝑙𝑛𝐴 +𝛽1 𝐾 +𝛽2 𝐿 + 𝑢

⚫ ො “resíduo de Solow”
𝑢:
 Medida de produtividade total de fatores
(PTF)

17

Você também pode gostar