Você está na página 1de 21

EAE0325 – Econometria II

Professora: Fabiana Fontes Rocha

Segunda Lista Teórica de Exercícios

NÃO É NECESSÁRIO ENTREGAR ESSA LISTA!

Bloco 1 – Exercícios teóricos do Wooldridge

Exercício 1 (13.2) – As seguintes equações foram estimadas usando os dados


contidos em KIELMC, dos anos de 1978 a 1981:

1) ̂
( )
(0,26) (0,058) (0,080)
N=321,

2) ̂
( )
(0,27) (0,044) (0,067)
N=321,

Compare as estimativas do termo de interação com as


estimativas da equação 13.9 (exemplo 13.3 do efeito da localização de um
incinerador de lixo sobre os preços dos imóveis). Por que as estimativas são
diferentes?

A primeira equação omite a dummy anual de 1981 (a81), e dessa maneira não
permite nenhuma apreciação/ depreciação nos preços nominais das casas ao
do período de três anos que ocorreria mesmo na ausência de um incinerador.
O termo de interação nesse caso está simplesmente captando o fato de que
até casas localizadas próximas ao incinerador tiveram seu valor apreciado no
decorrer dos anos. Essa equação sofre de viés de variável omitida.

A segunda equação omite a dummy que indica se o imóvel se localiza próximo


ao incinerador (proxincin), o que significa que ela não permite diferenças
sistemáticas entre casas próximas e afastadas do incinerador antes que este
fosse construído. Se, como parece ser o caso, o incinerador foi localizado perto
de casas menos valorizadas, então a omissão da variável proxincin atribui
esses preços mais baixos dos imóveis como efeito do incinerador de lixo.
Novamente, nós temos um problema de viés de variável omitida.
Exercício 2 (13.3) – Por que não podemos utilizar as primeiras diferenças
quando temos cortes transversais independentes em dois anos (ao contrário
dos dados de painel)?

Em cortes transversais independentes não acompanhamos as mesmas


observações da cross-section ao longo do tempo, e não faz sentido fazer a
diferenciação de pares de observações distintas ao longo do tempo.

Exercício 3 (13.5) – Suponha que queremos estimar o efeito de diversas


variáveis sobre a poupança anual e que temos um conjunto de dados de painel
sobre indivíduos coletado em 31/01/1990 e 31/01/1992. Se incluirmos uma
dummy anual para o ano de 1992 e usarmos a primeira diferenciação,
poderemos também incluir a idade no modelo original? Explique.

Não poderemos incluir idade como uma variável explicativa no modelo original.
Cada pessoa do banco de dados em painel terá exatamente 2 anos a mais em
31/01/1992, o que significa que para todas as observações da
amostra. A equação que gostaríamos de estimar tem a forma:
onde é coeficiente da dummy anual para o ano de 1992.
Como a idade muda para todos os indivíduos da mesma forma, não
conseguiremos distinguir o efeito da idade do efeito agregado do tempo.

Exercício 4 (13.6) – Em 1985, nem a Flórida nem a Geórgia tinham leis


banindo recipientes abertos de bebidas alcóolicas nos compartimentos de
veículos de passageiros. Em 1990, a Flórida sancionou tal lei, mas a Geórgia
não.

i. Suponha que você colete amostras aleatórias da população com idade


para dirigir em ambos os estados, de 1985 a 1990. Defina prisão como
uma variável binária igual à unidade se uma pessoa foi presa por dirigir
embriagada durante o ano. Sem controlar quaisquer outros fatores,
escreva um modelo de probabilidade linear que possibilite verificar se a
lei de recipientes abertos reduziu a probabilidade de alguém ser preso
por dirigir embriagado. Que coeficiente em seu modelo mede o efeito da
lei?

Seja FL uma variável binária igual a 1 se a pessoa mora na Flórida, e zero caso
contrário. Seja y90 uma dummy do ano de 1990. Então, temos que o modelo
de probabilidade linear é dado por:

O efeito da lei é medido por , que é a mudança na probabilidade de detenção


dirigindo bêbado devido à nova lei na Flórida. A inclusão de y90 permite
tendências agregadas em prisões por embriaguez que afetam ambos os
Estados; e a inclusão de FL permite diferenças sistemáticas entre Flórida e
Geórgia quanto ao comportamento de dirigir embriagado ou à aplicação da lei.

ii. Por que você pode querer controlar outros fatores nesse modelo? Quais
poderiam ser esses fatores?

Pode ser que as populações dos motoristas nos dois estados mudem de
formas diferentes ao longo do tempo. Por exemplo, idade, raça ou distribuições
de gênero podem ter mudado. Os níveis de educação médios entre os dois
estados podem ter mudado. Como estes fatores podem afetar o fato de alguém
ser preso por dirigir bêbado, podendo ser importante controla-los. No mínimo,
há a possibilidade de obter um estimador mais preciso de reduzindo a
variância do erro. Essencialmente, qualquer variável explicativa que afeta a
prisão pode ser usado para essa finalidade.

iii. Agora, suponha que somente seja possível coletar dados de 1985 e
1990 em nível de municípios dos dois estados. A variável dependente
seria a fração dos motoristas habilitados presos por dirigirem
embriagados durante o ano. Como essa estrutura de dados difere dos
dados em nível individual descritos na parte (i)? Que método
econométrico você usaria?

Teríamos agora um painel de municípios, e não um agrupamento de cortes


transversais independentes de indivíduos. Poderíamos usar ainda o método de
diferença-em-diferenças, pois ele também é aplicável aos dados em painel.
Além disso, nossa variável dependente não seria mais uma variável binária, e
assim não seria mais um modelo de probabilidade linear.

Exercício 5 (14.4) – Para determinar os efeitos do desempenho atlético


universitário dos candidatos, você coleta dados desses candidatos de uma
amostra das faculdades da Divisão I dos anos de 1985,1990 e 1995.

i. Que indicadores de êxito atlético você incluiria em uma equação? Quais


seriam alguns dos problemas temporais?

Porcentagens de vitórias nos esportes mais populares dentre os universitáiros


são boas possibilidades, assim como indicadores relacionados à participação
em campeonatos. Devemos estar seguros de as medidas usadas de êxito
atlético estavam disponíveis antes dos prazos de aplicação. Então, poderíamos
usar o desempenho atlético de anos anteriores.
ii. Que outros fatores você controlaria na equação?

Taxa de matrícula pode ser importante: ceteris paribus, taxas mais altas devem
significar menos inscrições. Medidas de qualidade da universidade que mudam
ao longo do tempo, tais como razões aluno/faculdade, financiamento e
subsídios poderiam ser importantes.

iii. Escreva uma equação que possibilite estimar os efeitos do êxito atlético
sobre a mudança percentual nas inscrições. Como você estimaria essa
equação? Por que você escolheria esse método?

Um modelo de efeitos não observados é dado por:

( ) ( )

A variável é uma abreviação para uma medida de sucesso atlético; nós


poderíamos incluir várias medidas, são dummies temporais, e
( ) é o log da taxa de matrícula. É provável que esteja
correlacionada com o êxito atlético, a taxa de matrícula, e sendo assim o
estimador de efeitos fixos é o mais adequado (alternativamente poderíamos
usar também o estimador de primeiras diferenças).

Exercício 6 (15.1) – Considere um modelo simples para estimar o efeito da


propriedade de um computador pessoal na nota média de graduação de
formandos de uma grande universidade pública:

Onde: PC é uma variável binária indicando a propriedade de um computador


pessoal.

i. Por que a propriedade um PC pode estar correlacionada com u?

Um fato já conhecido é que o status socioeconômico afeta o desempenho do


aluno. O termo de erro u contém, dentre outras coisas, a renda familiar, que
tem um efeito positivo nota média de graduação e também muito
provavelmente é correlacionada com a propriedade um PC.

ii. Explique por que PC possivelmente está relacionada à renda anual dos
pais. Isso significa que a renda dos pais será uma boa VI de PC? Por
quê?
Famílias com rendimentos mais elevados terão recursos para comprar
computadores para seus filhos. Portanto, a renda familiar satisfaz certamente
um dos requisitos para uma variável instrumental: ele está correlacionado com
a variável explicativa endógena. Todavia, a renda familiar também tem um
efeito positivo sobre a nota média de graduação e, portanto, a renda dos pais
não será exógena na equação da renda. Se tivéssemos a variável de renda
dos pais nós iríamos incluí-la como uma variável explicativa na equação; se
ela é a única variável omitida importante correlacionada com PC, poderíamos
então estimar a equação expandida por MQO

iii. Suponha que, quatro anos atrás, a universidade tenha concedido


subvenções para a compra de computadores à aproximadamente
metade dos alunos novos, e que os alunos que receberam essas
subvenções tenham sido escolhidos aleatoriamente. Explique
cuidadosamente como você usaria essa informação para construir uma
variável instrumental de PC.

Este é um experimento natural que afeta se alguns alunos possuem


computadores ou não. Alguns estudantes que compram computadores quando
dada a concessão não teriam comprado sem o subsídio. (Estudantes que não
receberam as bolsas podem ainda assim possuir computadores.) Defina uma
variável dummy concessão igual a um se o estudante recebeu uma concessão,
e zero caso contrário. Então, se a concessão foi distribuída aleatoriamente, ela
será não correlacionada com o erro (exógena). Em particular, será não
correlacionada com a renda familiar e outros fatores socioeconômicos contidos
no erro. Além disso, concessão deve ser correlacionada com o PC: a
probabilidade de possuir um PC deve ser significativamente maior para o aluno
que recebeu subsídio. Aliás, se a universidade deu prioridade de concessão
para estudantes de baixa renda, concessão seria negativamente
correlacionada com o erro, e a IV seria inválida.

Exercício 7 (15.2) – Suponha que você queira estimar o efeito da frequência


escolar sobre o desempenho dos alunos, como no Exemplo 6.3. Um modelo
básico é: , onde as
variáveis foram definidas no capítulo 6.

i. Defina dist como a distância da residência do aluno até o local de


estudos. Você consideraria que dist é não correlacionado com u?

Considero que dist poderá ser correlacionado com u. Por exemplo, se alunos
com maior renda alugam apartamentos próximos à faculdade; ou se a
faculdade está localizada em algum lugar central da cidade, e os alunos mais
pobres moram mais longe da faculdade (ou o contrário).
ii. Assumindo que dist e u sejam não correlacionados, que outras
hipóteses dist deverá satisfazer para ser uma IV válida de taxafreq?

A variável dist deve ser parcialmente correlacionada com taxafreq. Mais


precisamente, na forma reduzida:
, devemos ter . Dado uma amostra de dados podemos testar
, usando um teste t .

iii. Suponha que adicionemos um termo de interação .


Se taxafreq for correlacionado com u, então, em geral a interação
também será. O que poderíamos usar como uma boa IV de
?

Agora precisamos de variáveis instrumentais para taxafreq e para o termo de


interação . Sob a hipótese de exogeneidade de dist e
nmgradp qualquer função dessas variáveis será não correlacionada com o erro.
Em particular, a interação será não correlacionada com o erro.
Se dist é parcialmente está correlacionada com taxafreq, então
também será parcialmente correlacionada com . Assim,
podemos estimar a equação
por MQ2E como variáveis instrumentais as
variáveis exógenas do modelo junto com e .

Exercício 8 (15.6)

i. No modelo com uma variável explicativa endógena, uma variável


explicativa exógena e uma variável exógena extra, considere a forma
reduzida de : inserindo-a na equação
estrutural . Isso produzirá a forma reduzida
de Encontre os em termos de e .

( ) .
( ) ( ) ( )

( )
( )

ii. Encontre a forma reduzida do erro, , em termos de , e os


parâmetros.

( )
iii. Como você estimaria consistentemente os ?

Por hipótese, tem média zero e é não correlacionado com e


também tem essas propriedades por definição. Assim tem média zero e é
não correlacionado com , o que significa que os são consistentemente
estimados por MQO.

Exercício 9 (15.7) – O que segue é um modelo simples para medir o efeito de


um programa de escolha de escola sobre o desempenho em um teste
padronizado: onde nota é a nota de
um teste de âmbito estadual, escolha é uma variável binária indicando se o
aluno frequentou uma escola de sua escolha no último ano e rendfam é a
renda familiar.

A VI de escolha é conc, o montante em dólares concedido aos alunos para ser


usado como pagamento da anuidade da escola particular de sua escolha. O
montante da concessão difere conforme o nível de renda familiar, razão pela
qual controlamos rendfam na equação.

i. Mesmo com rendfam na equação por que escolha pode ser


correlacionada com ?

Mesmo em um dado nível de renda, alguns alunos estão mais motivados e/ou
mais capazes do que outros, e suas famílias podem dar um apoio maior à
educação dos filhos que outras famílias. Portanto, é provável que haja um
problema de auto-seleção: estudantes que iriam melhor de qualquer forma
também eram mais propensos a frequentar uma escola de sua escolha.

ii. Se no interior de cada classe de rendimento os montantes de concessão


fossem atribuídos aleatoriamente, conc seria não correlacionada com
?

Supondo que a forma funcional de rendfam está correta, conc seria não
correlacionada com Como não contém a renda, a atribuição aleatória de
subvenções dentro de cada classe de renda implica que a designação da
concessão não está correlacionada com fatores não observáveis como a
capacidade do aluno, motivação e apoio da família.

iii. Escreva a forma reduzida da equação de escolha. O que é necessário


para que conc seja parcialmente correlacionado com escolha?

A forma reduzida é dada por:


Para que conc seja parcialmente correlacionado com escolha é necessário
. Em outras palavras, após o controle pelos rendimentos, o montante da
concessão deve ter algum efeito na escolha. Isso parece razoável, desde que
os montantes de concessão sejam diferentes dentro de cada classe de renda.

iv. Escreva a equação da forma reduzida de nota. Explique por que isso é
importante.

A forma reduzida para pontuação é apenas uma função linear das variáveis
exógenas:

Esta equação nos permite estimar diretamente o efeito de aumentar o


montante de concessão sobre a pontuação no teste, mantendo a renda familiar
constante.

Exercício 10 (15.8) – Suponha que você queira testar se as meninas que


frequentam uma escola de ensino médio só para meninas se saem melhor em
matemática do que as que frequentam escolas mistas. Você tem uma amostra
aleatória de meninas veteranas de escolas de ensino médio de um estado dos
Estados Unidos, e nota é a nota de um teste padronizado de matemática
Defina meninaem como uma variável dummy indicando se uma aluna frequenta
uma escola de ensino médio só para meninas.

i. Que outros fatores você controlaria na equação?

Renda e outras variáveis relacionadas ao background familiar, como educação


dos pais.

ii. Escreva uma equação relacionando nota com meninaem e os outros


fatores que você listou na parte (i).

O modelo populacional será dado por:

iii. Suponha que o suporte e o incentivo dos pais sejam fatores não
indicados no termo erro na parte (ii). É possível que eles sejam
correlacionados com meninaem? Explique.

Sim, é possível que tais fatores sejam correlacionados com meninaem. Os pais
que são motivados e dão o suporte necessário para suas filhas tenham um
bom desempenho na escola também podem ser mais propensos a matricular
suas filhas em uma escola de ensino médio só para meninas. Isso traria uma
correlação entre o termo erro e meninaem, tornando os estimadores de MQO
viesados e inconsistentes.
iv. Discuta as hipóteses necessárias para que o número de escolas do
ensino médio só para meninas situadas em um raio de 20 milhas da
residência de uma menina seja uma VI válida de meninaem.

Seja nummen o número de escolas de ensino médio só para meninas dentro


de um raio de 20 quilômetros da casa de uma menina. Para ser uma VI válida
de meninaem, nummen deve satisfazer dois requisitos: deve ser não
correlacionada com o erro não observado (exógena) e deve ser parcialmente
correlacionada com meninaem.

v. Escreva a equação da forma reduzida de nota. Explique por que isso é


importante.

Esta equação nos permite estimar diretamente o efeito de aumentar o o


número de escolas de ensino médio só para meninas sobre a nota, mantendo a
renda familiar, e a educação dos pais fixos.

Exercício 11 (15.9) – Suponha que na equação


você não tenha uma boa candidata a variável instrumental de faltas. Entretanto,
você tem duas outras informações sobre os alunos: a nota média ponderada de
habilidade verbal e matemática do estudante para ingresso em curso superior
(sat) e a nota média acumulada anterior ao semestre (nmgradc). O que você
faria em vez da estimação de VI?

Faria a estimação de mínimos quadrados ordinários em uma equação


expandida, onde sat e nmgradc são adicionadas como variáveis proxy para a
capacidade do aluno e motivação.

Exercício 12 (15.10) – Em um artigo recente, Evans e Schwab (1995)


estudaram os efeitos que frequentar uma escola de ensino médio teria sobre a
probabilidade de cursar uma faculdade. Concretamente, defina faculdade como
uma variável binária igual a um se o aluno estiver na faculdade, e zero caso
contrário. Defina EMcat como uma variável binária igual a um se o aluno
frequenta uma escola católica no ensino médio. Um modelo de probabilidade
linear é dado por: onde,
entre outros fatores, estão sexo, raça, renda familiar e instrução dos pais.

i. Por que EMcat pode ser correlacionado com u?

Estudantes melhores e mais sérios tendem a ir para a faculdade, e esse


mesmo tipo de alunos pode ter uma maior/menor probabilidade de estudar em
escolas católicas. A correlação resultante entre u e EMcat é outro exemplo de
problema de auto-seleção: alunos se auto selecionam em direção de colégios
católicos, ao invés de ser aleatoriamente atribuídos a eles.

ii. Evans e Schwab tinham dados sobre a nota de um teste padronizado


feito quando cada estudante era aluno do 2º ano. O que pode ser feito
com essa variável para melhorar a estimativa ceteris paribus de
frequentar uma escola católica de ensino médio?

A nota de um teste padronizado é uma medida da capacidade do aluno. Sendo


assim, essa variável pode ser usada como uma proxy em uma regressão por
MQO. A existência dessa medida em uma regressão de MQO traz uma
melhoria, pois temos algum controle da capacidade do aluno.

iii. Defina Relcat como uma variável binária igual a um se o estudante for
católico. Detalhe os dois requisitos necessários para que essa seja uma
VI válida de EMcat na equação precedente. Qual deles pode ser
testado?

O primeiro requisito é que EMcat seja não correlacionada com a motivação e


capacidade não observadas do estudante (o que não é capturado por qualquer
proxies) e outros fatores, no termo de erro. Isto será válido se o fato de ser
católico (ao contrário de frequentar uma escola católica) não fizer de você um
melhor aluno. Parece razoável supor que os católicos não têm uma capacidade
inata maior do que os não-católicos. Se fato de ser católico está relacionado
com a motivação do aluno, ou à preparação para o ensino médio, é uma
questão um pouco mais controversa. Não conseguiremos testar esse requisito.

O segundo requisito é que o fato de ser católico tenha algum efeito sobre a
frequentar uma escola católica, controlando-se por outros fatores exógenos
que aparecem no modelo estrutural. Isso pode ser testado estimando a forma
reduzida de EMcat e verificando se o coeficiente de Relcat é estatisticamente
significativo.

iv. Não surpreendentemente, o fato de ser católico tem um efeito


significante sobre frequentar uma escola católica no ensino médio. Você
julga que Relcat é uma variável instrumental válida de EMcat?

Evans e Schwab (1995) acharam que ser católico aumenta substancialmente a


probabilidade de frequentar uma escola católica. Além disso, parece razoável
assumir que Relcat é exógena na equação estrutural.

Exercício 13 (16.1) – Escreva um sistema de duas equações na forma de


“oferta e demanda”, isto é, com a mesma variável aparecendo do lado
esquerdo:
i. Se ou , explique por que existe uma forma reduzida de .
Se e , encontre a forma reduzida de

Se então, , e assim o lado direito depende apenas da


variável exógena e o termo de erro . Essa, então, é a forma reduzida para
. Se , a forma reduzida para é

Se e , podemos substituir na primeira equação e


resolver para :

( )

ii. Se , e , encontre a forma reduzida de A variável


tem uma forma reduzida nesse caso?

( )

( ) ( )

Sim, variável tem uma forma reduzida.

iii. A condição é possível de ser encontrada em exemplos de


demanda? Explique.

Em exemplos de oferta e demanda, é muito razoável. Se a primeira


equação é a função de oferta, geralmente esperamos , e se a segunda
equação é a função de demanda, As formas reduzidas podem existir
mesmo em casos onde a função de oferta não é positivamente inclinada e a
função de demanda não é negativamente inclinada, mas a utilidade de tais
modelos é questionável.
Exercício 14 (16.2) – Defina milho como o consumo per capita de milho em
toneladas de grãos, no nível de município, preço como o preço por tonelada de
milho, renda como a renda per capita do município, e defina precpluv como a
precipitação pluviométrica em polegadas durante a última safra de plantio de
milho. O seguinte modelo de equações simultâneas impõe a condição de
equilíbrio em que a oferta se iguala à demanda:

Qual é a equação de oferta e qual é a de demanda? Explique.

A primeira equação deve ser a função de demanda, como depende da renda,


que é um determinante comum da demanda. A segunda equação contém a
variável que afeta produção agrícola e, portanto, a oferta de milho.

Exercício 15 (16.3) – No problema 3.3 do Capítulo 3, estimamos uma equação


para testar uma relação de substituição entre minutos por semana gastos
dormindo (dormir) e minutos por semana gastos trabalhando (trabtot) de uma
amostra aleatória de indivíduos. Também incluímos educação e idade na
equação. Como dormir e trabtot são escolhidos conjuntamente por indivíduo, a
relação de substituição entre dormir e trabalhar estimada está sujeita a uma
crítica de “viés de simultaneidade”? Explique.

Não. Neste exemplo, estamos interessados em estimar a relação entre dormir


e trabalhar, controlando para alguns outros fatores. O MQO é perfeitamente
adequado para isso, desde que nós sejamos capazes de controlar para todos
os outros fatores relevantes. Enquanto é verdade que os indivíduos, por
hipótese, alocam otimamente seu tempo sujeito a restrições, isso não resulta
em um sistema de equações simultâneas. Se escrevermos tal sistema, não há
nenhum sentido que cada equação tenha um significado por si só, e nenhuma
delas teria uma interpretação ceteris paribus interessante. Além disso, não
poderíamos estimar as equações porque o raciocínio econômico não nos
permite que excluamos nenhuma variável exógena de alguma dessas
equações.

Exercício 16 (16.4) – Suponha que os ganhos e o consumo de álcool sejam


determinados pelo MÊS:

( )

( ) ( )

Onde preço é o índice local de preços do álcool, que inclui impostos locais e
estaduais. Assuma que educ e preço sejam exógenos. Se , , e
forem todas diferentes de zero, qual equação será identificada? Como você
estimaria essa equação?

Podemos ver facilmente que a condição de ordem não será satisfeita n


segunda equação: não há nenhuma variável exógena que apareça na primeira
equação e não esteja também na segunda equação. Assim, como essa
condição é necessária para a identificação, essa equação não será
identificada.

A primeira equação é identificada desde . Isso nos daria uma variável


exógena excluída da primeira equação, log (preço), que pode ser usado como
VI para álcool e estimaríamos a primeira equação por MQ2E.

Exercício 17 (16.5) – Um modelo simples para determinar a eficácia do uso de


camisinha na redução das doenças sexualmente transmissíveis entre alunos
do ensino médio sexualmente ativos é:

Onde taxainf é a porcentagem de alunos sexualmente ativos que tenham


contraído doença venérea, usacamis é a porcentagem de rapazes que afirmam
usar camisinha regularmente, rendfam é a renda familiar média e cidade é uma
variável dummy indicando se a escola está em uma cidade; o modelo é
construído no nível de escolas.

i. Interpretando a equação precedente de uma maneira causal, ceteris


paribus, qual deverá ser o sinal de ?

Tudo o mais constante, uma maior taxa de uso de preservativos deve reduzir o
índice de doenças sexualmente transmissíveis (DSTs). Assim, .

ii. Por que taxainf e usacamis podem ser conjuntamente determinadas?

Se os estudantes sexualmente ativos se comportam racionalmente, e o uso de


preservativo previne doenças sexualmente transmissíveis, o uso de
preservativo deve aumentar com o aumento da taxa de infecção.

iii. Se o uso de camisinha aumentar com a taxa de doenças venéreas, de


forma que na equação:
qual será o provável viés na estimativa de por
MQO?

Se substituirmos a equação estrutural de taxainf em:


vemos que irá depende Como
>0, está positivamente relacionada com Na verdade, se o erro
estrutural ( ) na equação de é não correlacionado com
( ) ( ) Se ignorarmos as outras variáveis
explicativas na equação taxainf, podemos concluir a direção do viés:
(̂ ) , pois ( ) , onde ̂ denota o estimador de
MQO. Uma vez que consideramos β1 < 0, o MQO é viesado em direção ao
zero. Em outras palavras, se nós usarmos MQO sobre a equação de taxainf, é
provável que subestimemos a importância do uso do preservativo na redução
de doenças sexualmente transmissíveis.

iv. Defina distcamis como uma variável binária igual a um se uma escola
tiver um programa de distribuição de camisinhas. Explique como isso
pode ser usado para estimar (e os outros betas) por IVs. O que
teremos de assumir sobre distcamis em cada equação?

Nós teríamos de assumir que distcamis não aparece na equação de taxainf.


Isso parece razoável, pois é seu uso que deve afetar diretamente a obtenção
doenças sexualmente transmissíveis, e não apenas ter um programa de
distribuição. Temos também de assumir que distcamis é exógena na equação
de taxainf: ela não pode ser correlacionada com fatores não observados que
também afetam taxainf. Também temos assumir que distcamis tem algum
efeito parci al nos uso de camisinha, algo que pode ser testado estimando-se a
forma reduzida de

Exercício 18 (16.8) – O quanto é grande o efeito dos gastos escolares por


aluno sobre os preços de habitação local? Defina preçoc como sendo a
medianda dos preços de habitação em um distrito escolar e defina gasto como
os gastos por aluno. Usando dados de painel dos anos de 1992,1994 e 1996,
postulamos o modelo:

Onde polícia são os gastos policiais per capita, medrend é a mediana da renda
e imppro é a alíquota do imposto sobre a propriedade, e l denota o logaritmo
natural. Gastos e preços de habitação são determinados simultaneamente
porque o valor dos imóveis afeta diretamente as receitas disponíveis para
financiar as escolas. Suponha que, em 1994, a maneira pela qual as escolas
eram financiadas tenha mudado drasticamente: em vez de serem financiadas
pelos impostos locais sobre a propriedade, os financiamentos das escolas
tenham sido determinados basicamente em nível estadual. Defina lalest como
o log da alocação da verba estadual ao distrito i no ano t, que é exógeno na
equação precedente, uma vez que controlemos gastos e o efeito fixo de um
distrito. Como você estimaria os ?

Primeiramente, temos que eliminar o efeito não observado, . A diferenciação


das variáveis ao longo do tempo nos dá:

Para t = 2,3, e onde denota diferentes intercepta em dois anos.


O pressuposto fundamental é que a mudança no log da alocação da verba
estadual ( ) é exógena nesta equação. Naturalmente, está
correlacionada com porque as despesas locais dependem, pelo
menos em parte, do subsídio do estado. A mudança de política em 1994
significa que deve haver uma variação significativa no , pelo menos, de
1994 a 1996. Portanto, podemos estimar esta equação por MQ2E agrupado,
usando como um IV para , supondo que as outras variáveis
explicativas na equação são exógenas.

Bloco 2 – Assinale se as alternativas são verdadeiras (V) ou falsas (F) e


justifique.

1. Um banco de dados em painel é tal que acompanhamos a mesma


observação da cross-section ao longo do tempo. V

Um conjunto de dados em painel consiste em uma série de tempo para cada


membro do corte transversal do conjunto de dados.

2. Um experimento natural ocorre quando um evento exógeno altera o


meio no qual os agentes operam. V

Um experimento natural ocorre quando um evento exógeno algum evento


exógeno, como, por exemplo, uma mudança de política do governo, muda o
ambiente no qual indivíduos, famílias, firmas ou cidades, (etc..) operam.

3. A existência de 2 grupos e períodos de tempo distintos é suficiente para


a utilização do método de diferenças-em-diferenças. F

Esse método é utilizado na análise do efeito de um experimento natural. Assim


sendo, a utilização do método de diferenças-em-diferenças pressupõe a
ocorrência de um evento exógeno que alterou o meio no qual os agentes
operam.

4. Quando temos um banco de dados de painel podemos estimar nosso


modelo por MQO agrupado (sem nenhuma transformação das variáveis)
caso o erro idiossincrático tenha média zero. F

Para que possamos estimar consistentemente nosso modelo por MQO


agrupado deverá ser válida a hipótese que o efeito fixo não observado é não
correlacionado com as variáveis explicativas ao longo do tempo. (Assumindo
que o erro idiossincrático também não tenha correlação com tais variáveis).
5. O estimador de primeiras diferenças exige que as variáveis de controle
utilizadas na análise variem ao longo do tempo. V

Uma condição crucial do estimador de primeiras diferenças é que a


diferenciação das variáveis explicativas ao longo do tempo tenha alguma
variação entre as observações da amostra.

6. A hipótese de exogeneidade estrita nos diz que deve ser não


correlacionado com o erro de composição. F

A hipótese de exogeneidade estrita nos diz que, para cada período de tempo, o
valor esperado do erro idiossincrático, dadas as variáveis explicativas em todos
os períodos de tempo e os efeitos não observados, é zero.

7. Para dois períodos de tempo, os estimadores de efeitos fixos, primeiras


diferenças e efeitos aleatórios são idênticos. F

Para dois períodos de tempo, os estimadores de efeitos fixos e primeiras


diferenças são idênticos. Eles só serão idênticos ao estimador de efeitos
aleatórios se na transformação do EA tivermos que

8. Sob a hipótese de ausência de correlação entre o efeito fixo não


observado e as variáveis independentes, o estimador de efeitos
aleatórios será o mais adequado relativamente ao estimador de efeitos
fixos. V

Sob a hipótese de ausência de correlação entre o efeito fixo não observado e


as variáveis independentes, o estimador de efeitos aleatórios será mais
eficiente que o estimador de efeitos fixos, e ambos os estimadores serão
consistentes.

9. O estimador de efeitos aleatórios permite a inclusão de variáveis de


controle constantes ao longo do tempo. V

A transformação do estimador de efeitos aleatórios subtrai uma fração da


média temporal. Dessa forma, ela possibilita a inclusão de variáveis
explicativas que sejam constantes ao longo do tempo.

10. O teste de Hausman serve para testar se o estimador de efeitos fixos é


consistente. F

O teste de Hausman compara as estimativas do estimador de efeitos fixos e


aleatórios para verificar se as variávteis explicativas são correlacionadas com o
efeito fixo, assumindo que o erro idiossincrático e as variáveis de controle são
não correlacionados ao longo do tempo. Sob a hipótese nula das estimativas
serem suficientemente próximas, teremos que ambos os estimadores são
consistentes (pois é um indício de ausência de correlação das explicativas e do
efeito fixo), e o EA seria mais adequado. Se rejeitamos a nula, somente o
estimador de efeitos fixo é consistente, e esse estimador será o mais
adequado. Em suma, o teste de Hausman testa a consistência do estimador de
efeitos aleatórios, pois o EF será consistente sob as duas hipóteses.

11. O problema de endogeneidade surge quando as variáveis explicativas


são correlacionadas entre si. F

O problema de endogeneidade surge quando as variáveis explicativas são


correlacionadas com o erro não observado.

12. Uma boa variável instrumental deve ser uma variável exógena excluída
da equação estrutural que tenha alguma correlação com a explicativa
endógena. V

Seja u o erro não observado e x uma variável explicativa endógena Uma


variável instrumental z deve satisfazer as seguintes hipóteses:

1. Cov(Z,u) = 0

2. Cov(Z,x) ≠ 0

13. O estimador de variável instrumental será não viesado sob as hipóteses


usuais associadas a esse estimador. F

Uma das características do estimador de variável instrumental é que, quando


houver alguma explicativa endógena, a estimação por IV será necessariamente
viesada. Como esse estimador é consistente na presença de uma variável
instrumental válida, vemos que deveremos utilizar amostras grandes ao
utilizarmos o estimador de variáveis instrumentais.

14. O uso de uma variável proxy e do método de variável instrumental são


duas possíveis formas de lidar o viés de variável omitida. V

A abordagem da variável proxy tenta resolver o problema da variável omitida


substituindo a variável não observada por uma variável proxy. O método de
variável instrumental deixa a variável omitida no erro, mas reconhece a
presença da variável omitida em sua estimação.

15. O método mais utilizado na estimação de modelos de equações


simultâneas é o método de mínimos quadrados generalizados. F

O método mais utilizado na estimação de modelos de equações simultâneas é


o método de mínimos em dois estágios.

16. Um instrumento fraco terá boas propriedades assintóticas. F


Um instrumento fraco faz com que o estimador de VI possa ter um grande viés
assintótico, mesmo se a correlação entre o erro e o instrumento for muito
pequena.

(ANPEC 1998 - Questão 14)


Considere o seguinte conjunto de equações simultâneas:

Q  1  1 P   1Y  1 : função de demanda
Q  2  2 P  2 : função de oferta

onde Q (quantidade) e P (preços) são as variáveis endógenas, Y (renda) é a


variável exógena e 1 , 2 , representam os resíduos. Os valores 1 ,  2 , 1 ,
 1 e 2 são os parâmetros do modelo.

Então, pode -se afirmar que:

1. As equações na forma reduzida são definidas como:


Q  1   2Y  1
P   3   4 Y  2
   21     1 1
1  1 2  2   1 2 3  2 4 
onde, 1  2 , 1  2 , 1  2 , 1   2 ,
   2 1   2
v1  1 2 2   1
1  2 e 1   2 . V

Em equilíbrio:

( )
( ) ( ) ( )

( )
{ }
( ) ( ) ( )

( ) ( )
( ) ( ) ( )
2. As funções de demanda e oferta são identificadas. F

A função de demanda não satisfaz a condição necessária de ordem, e,


portanto, não será identificada.

3. A estimação dos parâmetros das equações na forma reduzida por


Mínimos Quadrados Ordinários produz estimadores consistentes. V

A forma reduzida nos fornece as variáveis explicativas endógenas como função


das variáveis exógenas do modelo. Como o erro da forma reduzida (que é uma
função linear dos erros estruturais) será não correlacionado com as exógenas,
não haverá problema de endogeneidade na equação da forma reduzida e os
parâmetros da forma reduzida poderão ser consistentemente estimados por
Mínimos Quadrados Ordinários.

4. Os resíduos 1 e  2 são independentes. F


( )
e
( ) ( )

( ) ( )
( )
( )
( ( ) ( ))
( )
( )
( )
( ) {[ ][ ]}
( ) ( )

( ) ( ) ( ) ( )

O enunciado não nos deu as hipóteses necessárias para calcular a covariância


entre os erros da forma reduzida. Todavia, mesmo assumindo que os erros
estruturais possuem média zero e que os erros estruturais das equações são
não correlacionados entre si, ainda sim teremos uma covariância não nula
entre os erros da forma reduzida. Sendo assim, os erros serão correlacionados,
e consequentemente, não serão independentes.
(ANPEC 2002 - Questão 11)

Considere as seguintes equações do modelo estrutural:

Equação de Demanda: Qt = a0 + a1 Pt+ a2Rt + u1t


Equação de oferta: Qt = b0 + b1 Pt+ b2Pt-1 + u1t

em que no período t, Qt é a quantidade de produto; Pt , o preço (endógeno) do


produto; Rt , a renda do consumidor; uit , o distúrbio aleatório da equação de
demanda e u2t , o distúrbio aleatório da equação de oferta. A partir destas
equações são obtidas as equações na forma reduzida:

Pt = p0 + p1 Rt+ p2Pt-1 + v1t e Qt = p3 + p4 Rt+ p5Pt-1 +wt.

  0 2 2
0  0 1  2 
(0) Assim sendo, 1  1 , 1  1 e 1  1 . F

Dada a condição de equilíbrio:

( ) ( )
( ) ( ) ( ) ( )

( )
( )

(1) A condição de posto indica que a primeira e a segunda equações são


identificadas. V

Como temos uma variável endógena explicativa incluída em cada equação e


uma variável exógena excluída de cada equação, satisfazendo a condição de
ordem (que é a condição necessária) válida. Para satisfazer a condição de
posto (condição suficiente), precisamos que o posto de e
seja igual a 1, e isso será satisfeito sempre que tais coeficientes forem
não nulos.
(2) Se multiplicarmos a equação de demanda por  (0 <  < 1) e a equação de
oferta por (1- ) e somá-las, desde que o resultado dessa soma seja
diferente da equação de oferta e da equação de demanda, as duas serão
identificadas. F
Multiplicando a equação de demanda por :

Multiplicando a equação de oferta por (1-):


( ) ( ) ( ) ( ) ( )

Somando as duas equações acima:


[ ( ) ] [ ( ) ] ( )
[ ( ) ]

Não é identificada, pois não conseguiremos distinguir a oferta da demanda.

(3) O método de mínimos quadrados ordinários produz estimadores


consistentes e eficientes dos parâmetros da forma estrutural. F
Temos que o preço será uma variável endógena nas equações de demanda e
oferta ( ( ) ( ) ) e sob endogeneidade teremos
estimadores inconsistentes de MQO.

(4) Para verificar se qualquer equação do sistema é identificável, basta aplicar


a condição de ordem. F
A condição de ordem é uma condição necessária para a identificação do
sistema, porém ela não é suficiente.

Você também pode gostar