Você está na página 1de 47

Econometria

1.

Inferncia

Danielle Carusi Machado - UFF Econometria


1/2016

Distribuio Normal de

Usada para facilitar as derivaes de


estatsticas de testes em amostras finitas.
Derivao das distribuies exatas das
estatsticas t, F.

/ X ~ N 0, I
2

Inferncia hiptese de
normalidade

b | X ~ N , ( X ' X )
2

Distribuio normal multivariada, desta forma, cada elemento


de b, tem uma distribuio normal da seguinte forma:

bk | X ~ N k , ( X ' X ) kk
2

Testes de hipteses clssico

Usando a regresso linear gostaramos de testar a


validade de uma teoria que formulamos no
nosso modelo estatstico.
O modelo usado para testar uma hiptese sobre
o processo de gerao de dados, descrito pelo
nosso modelo.

Testando a Hiptese para um


parmetro: Intervalo de confiana
bk = a estimativa pontual
dp[bk] = raiz quadrada de {[2(XX)-1]kk} = vk
Assumindo normalidade de :

bk ~ N[k,vk2] para o valor verdadeiro de k.


(bk-k)/vk ~ N[0,1]

Considere um conjunto de valores possveis para k dada a


estimativa pontual bk. bk +/- erro de amostragem.

Erro de amostragem em termos de unidades de desvios padro


Construo do Intervalo de confiana: Pr(|(bk k)/ vk| < z*)
Quanto maior z* maior a probabilidade (confiana) maior
a regio de aceitao!
Dada a normalidade, z* = 1.96 95%, z*=1.64590%

Valores possveis de k esto no intervalo

bk z* vk IC

Estimando um Intervalo de
Confiana
Assumindo normalidade de :

bk ~ N[k,vk2] para o verdadeiro k.


(bk-k)/vk ~ N[0,1]

vk = [2(XX)-1]kk no conhecida pois 2 deve ser


estimada.
Usando s2 ao invs de 2, (bk-k)/est.(vk) ~ t[n-K].
(Prova: razo de uma normal e da raiz quadrada de uma
qui-quadrada/grau de liberdade)
Utilizamos os valores crticos de uma distribuio t-student
ao invs de uma normal padro.
Pr ob (bk t / 2 s bk k bk t / 2 s bk ) 1

Testando a hiptese usando um


intervalo de confiana
O IC nos d o conjunto de valores plausveis
regio de aceitao!
Testando a hiptese que um coeficiente igual a
zero ou igual a qualquer outro valor particular:
O valor hipottico est dentro do IC?
O valor hipottico est dentro do conjunto de
valores plausveis?

Testando a hiptese para um


parmetro teste t

Comece com a hiptese nula.


Por exemplo, H0: j=0
Se aceitamos a nula, aceitamos que xj, aps
controlarmos pelos outros xs, no tem efeito em
y. Precisamos de uma hiptese alternativa, H1, e
um nvel de significncia.
H1 pode ser unicaudal ou bicaudal.
H1: j > 0 e H1: j < 0 so unicaudais.
H1: j 0 bicaudal.

Testando a hiptese para um


parmetro teste t - unilateral

Se queremos apenas 5% de probabilidade de


rejeitar H0 caso ela seja, ento dizemos que
nosso nvel de significncia de 5%.
Escolhido um nvel de significncia, , olhamos
no (1 )-simo percentil na distribuio t com n
k graus de liberdade e chamamos esse valor, c,
de valor crtico.
Rejeitamos a hiptese nula se a estatstica t
maior que o valor crtico.
Se a estatstica t for menor que o valor crtico,
ento no rejeitamos a nula

Testando a hiptese para um


parmetro teste t

yi = 0 + 1xi1 + + kxik + ui
H 0 : j = 0

H 1 : j > 0

No rejeitamos

Rejeitamos

Testando a hiptese para um


parmetro teste t

Como a distribuio t simtrica, testar H1: j <


0 direto. O valor crtico simplesmente o
negativo do anterior.
Rejeitamos a nula se t < c; se t > c, ento no
rejeitamos a nula.
Para um teste bicaudal, escolhemos um valor
crtico baseado em /2 e rejeitamos H1: j 0 se
o valor absoluto da estatstica t for > c.

Testando a hiptese para um parmetro


teste t hiptese bilateral

yi = 0 + 1Xi1 + + kXik + ui
H 0 : j = 0

H 1 : j 0
No rejeitamos

Rejeitamos

Rejeitamos

-c

Testando a hiptese para um


parmetro teste t

Como a distribuio t simtrica, testar H1: j <


0 direto. O valor crtico simplesmente o
negativo do anterior.
Rejeitamos a nula se t < c; se t > c, ento no
rejeitamos a nula.
Para um teste bicaudal, escolhemos um valor
crtico baseado em /2 e rejeitamos H1: j 0 se
o valor absoluto da estatstica t for > c.

Resumo de H0: j = 0

A menos que seja explicitado ao contrrio,


estaremos considerando a alternativa bicaudal.
Se rejeitamos a nula, dizemos que xj
estatisticamente significante ao nvel de %
Se no rejeitamos a nula, dizemos xj
estatisticamente no significativo ao nvel de
%

Calculando o p-valor do teste t

Uma alternativa ao procedimento clssico de


teste perguntar: qual o menor nvel de
significncia ao qual a nula seria rejeitada?
Calcule a estatstica t, e olhe em que percentil
ela est na distribuio t apropriada este o
p-valor.
O p-valor a probabilidade de observarmos
valores iguais ou maiores (em valor absoluto)
estatstica t obtida se a nula for verdadeira.

Testando a Hiptese para uma


combinao linear: Intervalo de confiana
Aplicao: Decomposio Oaxaca Blinder
Em um estudo de oferta de trabalho so estimadas duas
regresses separadas, uma para homens (nm) e outra
para mulheres (nf).
lnwagem ,i x 'm ,i m m ,i onde i 1...nm
lnwagef , j x 'f , j f f , j onde j 1...nf

Estamos interessados em comparar estas duas regresses


e, particularmente, se h discriminao salarial.

Testando a Hiptese para uma


combinao linear: Intervalo de confiana
Comparao das funes de regresso:
E [lnwagem ,i ] E [lnwagef , j ] x 'm ,i m - x 'f , j f
x 'm ,i m - x 'm ,i f x 'm ,i f x 'f , j f
x 'm ,i ( m - f ) (x m ,i x f , j )' f

1. Termo: diferenas no log dos salrios que no so


explicadas pelas diferenas nas dotaes de capital
humano.
2. Termo: diferenas de dotaes de capital humano.

Testando a Hiptese para uma


combinao linear: Intervalo de confiana
Esta decomposio pode ser computada usando a mdia
dos regressores e estaremos interessados em formular
um intervalo de confiana para o 1. termo.
Por hiptese, considera-se que os dois conjuntos de
observaes so independentes.
Os estimadores bm e bf so independentes com mdias
iguais a m e f e matrizes de covarincia m2(XmXm)-1
e f2(XfXf)-1
A matriz de covarincia da diferena a soma destas duas
matrizes: m2(XmXm)-1 + f2(XfXf)-1
IC para d = bm bf

Mltiplas restries lineares

Podemos testar conjuntamente mltiplas


hipteses sobre os parmetros.
Um exemplo do restrio de excluso
queremos testar se um grupo de parmetros
igual a zero.
Agora, a hiptese nula algo do tipo
H0: k-q+1 = 0, , k = 0
A alternativa H1: H0 falsa, ou seja, pelo
menos um dos s diferente de zero.

Mltiplas restries lineares

No podemos apenas fazer cada teste t


isoladamente.
Queremos saber se os q parmetros so
conjuntamente significativos a um certo nvel
possvel que nenhum seja individualmente
significante a este nvel.
Modelo restrito
Modelo irrestrito

Teste de restrio de excluso

O teste feito estimando o modelo


restrito sem xk-q+1,, , xk, assim como o
modelo irrestrito com todos os xs.
Intuitivamente, queremos saber se xk-q+1,,
, xk causam uma variao suficientemente
grande na SQR

SQRr SQRir q
F
, onde
SQRir n k 1
r restrito e ir irrestrito.

A estatstica F

A estatstica F sempre positiva, uma vez que


a SQR do modelo restrito no pode ser menor
que a do modelo irrestrito.
A estatstica F mede o crescimento relativo na
SQR quando se passa do modelo irrestrito para
o modelo restrito.
q = nmero de restries
n k 1 = grau de liberdade do modelo
irrestrito

A estatstica F

Para decidir se o aumento na SQR grande o


suficiente para rejeitar as excluses,
precisamos conhecer a distribuio amostral de
nossa estatstica F.
No de se surpreender que F ~ Fq,n-k-1, onde
q o nmero de graus de liberdade do
numerador e n k 1 o nmero de graus de
liberdade do denominador.

A estatstica F

f(F)

Rejeita H0 ao
nvel de
significncia se
F>c

No rejeita

Rejeita

A estatstica F em funo do R2

Podemos usar o fato de que, em qualquer


regresso, SQR = SQT(1 R2) e substituir
na frmula:

R q
, onde
F
1 R n k 1

2
ir
2
ir

2
r

r restrito e ir irrestrito.

Significncia da regresso

Um caso especial o teste


H0: 1 = 2 == k = 0.
Como o R2 do modelo com apenas o
intercepto ser zero, a estatstica F ser
simplesmente:

R k
F
2
1 R n k 1

Restries lineares gerais

A forma bsica da estatstica F vlida para


qualquer restrio linear.
Primeiro estime os modelos irrestrito e restrito.
Em cada caso, anote a SQR e substitua na
frmula.

Exemplo:

O modelo is votoA = 0 + 1log(gastoA) +


2log(gastoB) + 3prtystrA + u.
Agora a nula H0: 1 = 1, = 0.
Substituindo a restrio: votoA = 0 +
log(gastoA) + 2log(gastoB) + u.
Agora votoA - log(gastoA) = 0 +
2log(gastoB) + u o modelo restrito.

Estatstica F: Resumo

Da mesma forma que no teste t, o p-valor


pode ser calculado olhando no percentil da
distribuio F apropriada.
Se apenas uma excluso est sendo testada,
ento F = t2 e o p-valor ser o mesmo.

Formas funcionais e mudana


estrutural

Variveis binrias
No linearidade nas variveis
Modelagem e teste de mudana estrutural

Variveis binrias numa regresso


Variveis binrias ou dummy:
-valor 1 para algumas observaes (efeito ou pertencem a algum grupo) e zero para
observaes restantes.
-Deslocamentos discretos de uma funo dentro do modelo de regresso.
- Efeito tratamento
- Exemplos: efeito da universidade nos ganhos ao longo da vida, diferenas de sexo no
comportamento da oferta de trabalho, etc.

Diversas categorias
-Conjunto de variveis binrias
Exemplo: dummies para correo de fatores sazonais

-Armadilha da varivel dummy

Diversos grupos
- Exemplo: vrios estados para 10 anos.

Fatores qualitativos
-Exemplo: nveis educacionais

Varivel discreta: 0 sem escolaridade (SE), 1 Fundamental (F), 2 Mdio (M), 3


Superior (S).
O que acontece???
Modelo mais flexvel (mais alto nvel alcanado)

Fazer esperana condicional: E(renda/idade, SE), E(renda/idade, F), E(renda/idade, M),


E(renda/idade, S)

Regresso Spline
- Dados cross section para indivduos de diversas idades: alguns padres so especficos
para determinadas faixas etrias.
- 18 anos: fim do ensino mdio
- 22 anos: fim da faculdade.
-Amostra pode ser dividida em 3 grupos.

No linearidade de variveis
- O modelo de regresso dever ser escrito de uma forma mais geral.
um conjunto de funes linearmente independentes de z.
Seja g(y) uma funo do y observado, o modelo de regresso nesta forma geral :

Como o modelo de regresso linear??

Formas funcionais

Termos de interao
Exemplos

O teste de Chow

Estima-se o SQR do modelo restrito, estimando o


modelo para cada grupo: obtenha a SQR1; depois,
faa o mesmo para o outro grupo e obtenha a SQR2:
Estima-se o modelo restrito considerando todos os
grupos juntos e obtenha a SQR. Ento:

SQR SQR1 SQR2 n 2k 1


F
SQR1 SQR2

k 1

Teste Chow: exemplo

Algebra Teste Chow


Unrestricted regression is
0
y1960-1973 X1960-1973
1 1960-1973

y
0
X

1974-1995 2
1974-1995
1974-1995
Restricted regression is
y1960-1973 X1960-1973
1960-1973 1960-1973

y1974-1995 X1974-1995
1974-1995 1974-1995
In the unrestricted model, R = [I,-I], q=0.
Rb - q=b1 b2 ;
R[Var(b1 , b2 )]R' = Var[b1 ] Var[b2 ] (no covariance)

Econometria
Multicolinearidade
4. Testes de hipteses no modelo de regresso linear
5. Propriedades assintticas dos estimadores MQO

Danielle Carusi Machado - UFF - Econometria


2/2015

Multicolinearidade
Caracterstica do banco de dados que afeta a matriz de covarincia do
Estimador de MQO.
Considere um estimador de um dos parmetros k: E[bk] = k (no viesado)
Var[b] = 2(XX)-1 .
A varincia de bk o k-simo elemento da diagonal da matriz 2(XX)-1
Escreva [X,z] sendo [outros xs, xk] = [X1,x2]
M1 matriz que gera os resduos da projeo de um vetor no subespao
formado pelas colunas de X1.
O elemento da diagonal ser: [x2M1x2]-1 que corresponde ao recproco da
soma do quadrado dos resduos da regresso de x2 em X1.

Varincia do estimador de MQO


A varincia estimada de bk
Var[bk/X] =

s2
n

2
2
(1 R2. ) ( xi 2 x 2 )

i 1

s2
(1

R22. ) S 22

Quanto maior o fit da regresso de x2 em X1, maior a varincia. No


limite, um ajuste perfeito produz uma varincia infinita.

Varincia do estimador de MQO


Forma mais geral
Defina a matriz X que contm uma constante e K-1 variveis explicativas
A varincia estimada de bk
Var[bk/X] =

s2

1 R x
2
k.

i 1

ik

xk 2

Multicolinearidade
No existe cura para a colinearidade (anlise componente principal).
Existem medidas de multicolinearidade, contudo no h soluo.
Entender as implicaes para a estimao:
1)
Pequenas mudanas nos dados causam grandes variaes nas estimativas
dos parmetros;
2)
Os coeficientes estimados podem ter erro padro elevado e baixo nvel de
significncia, apesar da significncia conjunta e de um bom grau de
ajuste;
3)
Os coeficientes podem ter o sinal contrrio e magnitudes implausveis.

Multicolinearidade
O que melhor:
1)

Incluir uma varivel que causa colinearidade, ou;

2)

Elimin-la e gerar um estimador viesado?

Você também pode gostar