Você está na página 1de 8
Modelo de regressao simples _ 61 em que By B; Sio os parmetros do intercepto e da inclinagao populacionais, respectivamente. Hipotese RLS.2 (Amostragem aleatéria) ‘Temos uma amostra aleat6ria de tamanho n, {(x, y,): populacional na Hipétese RLS.1. ,n}, seguindo o modelo Hipdtese RLS.3 (Variagao amostral na variavel explicativa) Os resultados amostrais em x, a saber {x; / = 1, ... 71}, ndo so todos de mesmo valor. Hipotese RLS.4 (Média condicional zero) O erro w tem zero como valor esperado, quaisquer que sejam os valores das variéveis. Em outras palavras, Em outras palavras: Termos-chave ‘Gheficiente de determinagio ‘Geadicdes de primeira ordem ‘Covaridvel Fanzio de regressao epulacional (FRP) s de Gauss-Markov mas E(ulx) = 0. Hipotese RLS.5 (Homoscedasticidade) erro u tem a mesma varidncia quaisquer que sejam os valores das variéveis explicativas. Var(ulx) Minimos quadrados ordinarios (MQO) Modelo de elasticidade Parametro de inclinagio Parametro do intercepto Semielasticidade Soma dos quadrados explicada (SQE) kids = By + Byeduc + u, em que u é um erro nao observavel. Soma dos quadrados dos residuos (SQR) Soma dos quadrados total Eiasticidade constante (SQr) Ee> padrlo da regressiio (EPR) Modelo de regressio linear _Termo de erro (perturbaao) Exo padrio de B; simples Valor estimado ‘Variancia do erro Varidvel de controle ‘Fanclo de regressio amostral__ Regressando Varidvel de resposta RA) Regressao através da origem —_Varidvel dependente ‘Gems de liberdade Regressor Variével explicada ‘Bexeroscedasticidade Residuos Varivel explicativa “Bipstese de média Reta de regressio MQO Varidvel independente eadicional zero R-quadrado Varidvel previsora Varidvel prevista 1. Seja kids o nimero de filhos de uma mulher, e educ os anos de educagao da mulher. Um modelo simples que relaciona a fertilidade a anos de educagio € Introdugao @ econometria (i) Que tipos de fatores estdo contidos em u? E provavel que eles estejam correlacio- nados com o nivel de educagiio? (ii) Uma andlise de regressio simples mostraré 0 efeito ceteris paribus da educagio sobre a fertilidade? Explique. No modelo de regressao linear simples y = By + B.x + u, suponha que E(u) # 0. Fazendo a) = E(u), mostre que 0 modelo pode sempre ser reescrito com a mesma inclinagao, mas com um novo intercepto € erro, em que 0 novo erro tem um valor esperado zero. A tabela seguinte contém as varidveis GPA (nota média em curso superior nos Estados Unidos) e ACT (nota do teste de avaliagdo de conhecimentos para ingresso em curso superior nos Estados Unidos) com as notas hipotéticas de oito estudantes de curso su- perior. GPA esta baseado em uma escala de quatro pontos e foi arredondado para um digito apés o ponto decimal. PUTT (i) Estime a relagao entre GPA e ACT usando MQO; isto é, obtenha as estimativas de intercepto ¢ de inclinagio da equacio GPA = By + B,ACT. Comente a diregao da relacao. O intercepto tem uma interpretaco ttil aqui? Ex- plique. Qual deveria ser 0 valor previsto do GPA se a nota ACT aumentasse em cinco pontos? (ii) Calcule os valores estimados ¢ os res{duos de cada observagao e verifique que a soma dos residuos ¢ (aproximadamente) zero. (iii) Qual € 0 valor previsto do GPA quando ACT = 20? (iv) Quanto da variag&o do GPA dos 8 estudantes € explicado pela ACT? Explique. Os dados do arquivo BWGHT contém informagées de nascimentos por mulheres nos Estados Unidos. As duas varidveis de interesse so: a varidvel dependente, peso dos recém-nascidos em ongas (bwght), ¢ a varidvel explicativa, ntimero médio de cigarros que a mie fumou por dia durante a gravidez (cigs). A seguinte regressio simples foi estimada usando dados de n = 1.388 nascimentos Bwghi = 119,77 — 0,514 cigs (i) Qual € 0 peso de nascimento previsto quando cigs = 0? E quando cigs = 20 (um mago por dia)? Comente a diferenga. imo 2 Modelo de regressao simples 63. a” (ii) O modelo de regressdo simples necessariamente captura uma relagdo causal entre © peso de nascimento da crianga e os habitos de fumar da mae? Explique. (iii) Para prever um peso de nascimento de 125 ongas, qual deveria ser a magnitude de cigs? Comente. (iv) A proporgiio de mulheres que nao fumou durante a gravidez na amostra € cerca de 0,85. Isso ajuda a reconciliar sua conclusio do item (iii)? Na fungo de consumo linear Cons = By + Biinc, a MPC ~ propensdo marginal a consumir (estimada) é simplesmente a inclinagio B, a0 passo que a APC —propensdo média a consumir € Cons/inc = Boline+ B,. Usando as observacdes de renda e consumo anuais de 100 familias (ambas medidas em déla- res), obteve-se a seguinte equacao: Cons = —124,84 + 0,853 ine = 100, R° = 0,692. (i) Interprete 0 intercepto dessa equacdo e comente seu sinal e magnitude. Gi) Qual é 0 consumo previsto quando a renda familiar € US$ 30.000? (iii) Com ine sobre o eixo de x, desenhe um gréfico da MPC e da APC estimadas. Usando dados de casas vendidas em 1988 em Andover, Massachusetts [Kiel e Mc- Clain (1995)], a equacdio seguinte relaciona os pregos das casas (price) & distancia de um incinerador de lixo recentemente construdo (dist): ee Tog(price) = 9,40 + 0,312 log(dist) 135, R? = 0,162. n (i) Interprete 0 coeficiente de log(dist). O sinal dessa estimativa € 0 que voce esperava? (ii) Vocé considera que a regressio simples oferece um estimador nao viesado da elasti- cidade ceteris paribus de prego (price) em relagio a disténcia (dist)? (Pense sobre a decisio da cidade em instalar o incinerador naquele local.) (iii) Quais outros fatores relativos a casas afetam seu prego? Eles poderiam estar cor- relacionados com a distancia do incinerador? Considere a fungao de poupanga Sav = By + Byinc + u,u = Vince, em que e € uma varidvel aleatéria com E(e) = 0-¢ Var(e) = 02, Considere e indepen- dente de inc. (i) Mostre que E(ulinc) = 0, de modo que a hipétese de média condicional zero (Hi- potese RLS.4) seja satisfeita. [Dica: se e é independente de inc, entio E(elinc) = E(e).] (ii) Mostre que Var(ulinc) = a? inc, de modo que a hipétese de homoscedasticidade RLS.5é violada, Em particular, avaridncia de sav aumentacom inc. [Dica: Var(e/inc) = Var(e), se ¢ ¢ inc forem independentes.] (iii) Faga uma discussdo que sustente a hipstese de que a varidncia da poupanga au- menta com a renda da familia. — Introdugao & econometria 10. Considere o modelo de regressio simples padrdio y = By + Byx + u sob as hipdteses de Gauss Markov RLS.1 a RLS.5. Os estimadores usuais By ¢ By sio nao viesados para seus respectivos parametros populacionais. Seja B; 0 estimador de B, obtido ao assumir que o intercepto é zero (veja a Segao 2.6). (i) Encontre E@;) em termos de x;, By € By. Verifique que By é nao viesado para By quando 0 intercepto populacional (8p) € zero. Ha outros casos em que B, € nao viesado? (ii) Encontre a variancia de B,. [Dica: a variancia nao depende de Bo.) (iii) Mostre que Var(B;) = Var( ,). [Dica: para qualquer amostra de dados, St xt = Di (4) 2, com a desigualdade estrita preponderando, a nao ser que ¥=0) (iv) Comente a relagio entre viés e varidncia ao escolher entre Bie Bi. (i) Sejam By e B; 0 intercepto ¢ a inclinagdo da regressdo de y, sobre *;, usando n ob- servag6es. Sejam c; € c2 constantes, com c, # 0. Sejam Boe By intercepto ¢ & inclinago da regressio de cyy; sobre czt}. Mostre que B, = (ci/e2) Boe By = ciBo. verificando as observagGes sobre as unidades de medida da Segdo 2.4, [Dica: para obter B;, insira as transformagdes de x ¢ y em (2.19). Em seguida, use (2.17) para By, estando seguro de usar as transformagdes de xe y ¢ a inclinagao correta. ] (ii) Agora, sejam ye B, 0s pardimetros estimados da regressio de (c; + y;) sobre (cx + x) (sem nenhuma restrigao sobre c; ou c;). Mostre que Bh = he = Ato — By (iii) Agora, sejam Bye A; as estimativas de MQO da regressio log(y7) sobre x, para & qual devemos assumir y, > 0 para todo i. Para ¢, > 0, sejam Bye By 0 intercepto a inclinagdo da regressao de log(ciy,) sobre x,. Mostre que Bi = Bi e By = logic) + Bo. (iv) Agora, assumindo que x; > 0 para todo i, sejam Bye By 0 intercepto e a inclina- do da regressio de y; sobre log(c2%;). Como Bye By se comparam com o inter- cepto € a inclinagao da regressio de y; sobre log(x,)? Sejam Bye A, 0s estimadores MQO do intercepto € da inclinagio, respectivamente, € que i seja a média amostral dos erros (ndio os resfduos!). (i) Demonstre que i pode ser escrita como B = B, + S/W, em que w; = d/SQT. ed,=x,- (ii) Use 0 item (i), juntamente com 21-1, = 0, para demonstrar que By, eit sto nio correlacionadas. [Dica: Vocé esta sendo solicitado a demonstrar que E[ — B:) i) = 01. (iii) Demonstre que By pode ser escrito da seguinte forma By = Bo + @- (B, — B® (iv) Use os itens (ii) e (iii) para provar que Var(By) = o7/n + oy /SQT,. (v) Faga 0s célculos para simplificar a expressio no item (iv) para a equagdo (2.58) [Dica: SQT Jn = n'Zfaat — @P. |. Suponha que vocé esteja interessado em estimar o efeito das horas gastas com um curso de preparagio para o vestibular (hours) no total das notas do vestibular (sar). & populagdo so todos os pré-universitérios graduados no ensino médio em determinade ano. (i) Suponha que Ihe tenha sido dada uma subvengdo para executar um experimento controlado. Explique como vocé estruturaria o experimento para estimar 0 efeito causal de horas (hours) no vestibular (sat). etme 2 Modelo de regressdo simples _ 65 (ii) Considere 0 caso mais realistico em que os alunos decidem quanto tempo gasta- ro com um curso de preparaco, e voce s6 pode fazer amostragens aleatérias de sat e hours da populagdo. Escreva modelo populacional da seguinte forma sat = By + Byhours = u em que, como sempre, num modelo com um intercepto, podemos assumir E(u) = 0. Liste pelo menos dois fatores contidos em u. Existe a probabilidade de eles terem correlagdo negativa ou positiva com as horas gastas (hours)? (iii) Na equagiio do item (ii), qual deve ser o sinal de By se 0 curso de preparagao for eficaz? (iv) Na equagao do item (ii), qual é a interpretago de Bo? 12. Considere o problema descrito no fim da Segao 2.6: rodar uma regressao e estimar somente um intercepto. (i) Dada a amostra {y, e ser a solugio para 1,2,...,n},de }? aya S01 Mostre que B = ¥, isto é, a média amostral minimiza a soma dos quadrados dos residuos. (Dica: vocé pode usar cdlculos de uma varidvel ou mostrar 0 resultado diretamente ao adicionar ou subtrair y dentro do quadrado dos residues e, assim, usar um pouco de dlgebra.) (ii) Defina os residuos como i, = duos sempre somam zero. Exercicios em computador C1 Os dados do arquivo 401K sao um subconjunto de dados analisados por Papke (1995) para estudar a relaco entre a participagdo em um plano de pensio 401k e a genero- sidade do plano. A varidivel prate € a porcentagem de trabalhadores aptos ¢ com uma conta ativa; esta € a varidvel que gostarfamos de explicar. A medida da generosidade a taxa de contribuigao do plano, mrare. Esta varidvel mostra a quantia média com que a empresa contribui para o fundo trabalhista a cada US$ | de contribuigao do trabalha- dor. Por exemplo, se a mrate = 0,50, entdo uma contribuigao de US$ 1 do trabalhador corresponde a uma contribuiciio de US$ 0,50 da empresa. (i) Encontre a taxa de participagao ¢ a taxa de contribuigdo médias na amostra de planos. (ii) Agora, estime a equagao de regressao simples — J. Dé argumentos justificando que estes resi- prate = B, + B, mrate, ¢€ relate os resultados ao lado do tamanho da amostra e do R-quadrado. (iii) Interprete o intercepto de sua equagio. Interprete 0 coeficiente de mrate. (iv) Encontre a prate prevista quando mrate = 3,5. Esta é uma previsio razodvel? Ex- plique o que estd ocorrendo aqui. (v) Quanto da variagao da prate é explicada pela mrate? Na sua opiniao, isso é bastante? €2 O conjunto de dados do arquivo CEOSAL2 contém informagdes sobre CEOs de cor- poragdes norte-americanas. A varidvel salary é a compensaco anual, em milhares de délares, e ceoten é 0 nimero prévio de anos como CEO da empresa. 66 _Introdugaio & econome! (i) Encontre o salario médio e a permanéncia média na amostra. (ii) Quantos CEOs esto em seu primeiro ano no cargo (isto é, ceoten = 0)? Qual é a permanéncia mais longa como CEO? (iii) Estime o modelo de regressao simples log(salary) = By + Byceoten + u, e registre seus resultados da forma usual. Qual & 0 aumento percentual previsto (aproximado) no salério quando se tem um ano a mais como CEO? €3 Use os dados do arquivo SLEEP75, de Biddle ¢ Hamermesh (1990), para estudar se hé uma compensagio entre o tempo gasto dormindo por semana e o tempo gasto em um trabalho remunerado, Podemos usar qualquer varidvel como a varidivel dependente. Para materializar, estime o modelo sleep + By + Bytotwrk + u, em que sleep so os minutos dormidos & noite por semana e totwrk € 0 total de minutos trabalhados durante a semana. (i Registre seus resultados em uma equacdo junto com o mimero de observagdes e 0 R®. O que o intercepto desta equagio significa? (ii) Se tonwrk aumentar 2 horas, quanto vocé estima que sleep caira? Vocé acha que este é um efeito grande? C4. Use 0s dados do arquivo WAGE2 para estimar uma regressdo simples que explique 0 salario mensal (wage) em termos da pontuacao do QI (/Q). (@) Encontre 0 salério médio e o 1Q médio da amostra. Qual € 0 desvio padrao amos- tral do 10? (Pontuagdes de /Q sao padronizadas, por isso, a média na populagio € 100 com um desvio padrao igual a 15.) (ii) Estime um modelo de regresso simples em que um aumento de um ponto em 1Q altere wage em uma quantia constante de délares. Use este modelo para encontrar ‘© aumento previsto do saliirio para o caso de um acréscimo de 15 pontos de /Q. O 10 explica a maior parte da variagdo em wage? (iii) Agora, estime um modelo em que cada acréscimo de um ponto em /Q tenha 0 mesmo efeito percentual em wage. Se JQ aumentar 15 pontos, qual seré 0 au- mento percentual previsto aproximado em wage? C5 Para a populagdo de empresas do setor quimico, defina rd como os gastos anuais em pesquisa e desenvolvimento, e sales como as vendas anuais (ambos em milhées de délares).. (i) Escreva um modelo (nao uma equagao estimada) que implique uma elas constante entre rd e sales. Qual € 0 parametro da elasticidade? (ii) Agora, estime 0 modelo usando os dados do arquivo RDCHEM. Monte a equa- Go estimada da forma usual. Qual é a elasticidade estimada de rd em relacio a sales? Explique 0 que essa elasticidade significa. C6 Usamos 0s dados do arquivo MEAP93 no Exemplo 2.12. Agora, queremos explorar a relacdo entre a taxa de aprovagdo em matemitica (math/0) e os gastos por estudante (expend). (i) Vocé acha que cada délar adicional gasto tem o mesmo efeito sobre a taxa de aprovacaio ou um efeito decrescente seria mais razodvel? Explique. (ii) No modelo populacional dade 2 Modelo de regressao simples 67 math10 = By + B, log(expend) + u argumente que B,/10 é a porcentagem de alteragdo em math /0 dado um aumento de 10% em gasto. (iii) Use os dados do arquivo MEAP93 para estimar 0 modelo (ii). Descreva a equa- cdo estimada da forma usual, incluindo 0 tamanho da amostra e o R-quadrado (iv) Quiio grande € 0 efeito de gastos estimado? Em outras palavras, se os gastos au- mentarem 10%, qual serd o aumento percentual estimado em math10? (v) Alguns podem se preocupar com 0 fato de que a anélise de regressio pode pro- duzir valores ajustados para math10 maiores do que 100. Por que isso néio € tao preocupante neste conjunto de dados? (7 Use 0s dados do arquivo CHARITY [retirado de Franses e Paap (2001)] para respon- der as seguintes questdes: (i) Qual é a doacdo (gift) média da amostra de 4.268 pessoas (em florins holande- ses)? Qual é a porcentagem de pessoas com nenhuma doagio? (ii) Qual é a média de envios por ano? Quais sdo os valores minimos e méximos? (iii) Estime 0 modelo gift = By + Bunailsyear + u por MQO e registre os resultados da forma usual, incluindo o tamanho da amostra e 0 R-quadrado. (iv) Imterprete 0 coeficiente de inclinago. Se cada envio custa um florim, a institui- cdo de caridade espera obter um lucro Iiquido em cada um dos envios? Isso quer dizer que a instituicaio obtém um lucro Ifquido em todos os envios? Explique. (v) Qual é a menor contribuicdo a instituigdo prevista na amostra? Usando essa and- lise de regressdo simples, vocé pode prever zero de gift? ©8 Para completar este exercicio, vocé precisard de um programa que Ihe permita gerar dados das distribuigdes uniforme e normal. (i) Comece gerando 500 observagdes em x; ~ a varidvel explicativa — a partir da dis- tribuigéio uniforme com variagiio [0.10]. (A maioria dos programas estatfsticos tem um comando para distribuigdo Uniforme(0,1); s6 multiplique esas observa- ges por 10.) Qual é a média da amostra e o desvio padrao da amostra de x;? Gi) Gere, de forma aleatéria, 500 erros, u,, a partir da distribuigio Normal(0,36). Se vocé gerar uma Normal(0,1), como geralmente est disponivel, simplesmente multiplique os resultados por seis.) A média amostral de u; € exatamente zero? Por que sim ou por que nao? Qual € o desvio padraio amostral de u,? (Gi) Agora gere y, como y= E+ 2x; + = Bo + Bix + isto é, 0 intercepto da populacio é um e a inclinacio populacional é dois. Use os dados para executar a regressiio de y,em x;. Quais so suas estimativas de inter- cepto e inclinagao? Elas so iguais aos valores populacionais da equacao acima? Explique. (iv) Obtenha os residuos MQO, fj, € verifique se a equagio (2.60) se mantém (sujeita a erros de arredondamento). 68 — Introdugao a econometria (v) Calcule as mesmas quantidades da equagio (2.60), mas use os erros u, no lugar dos residuos. Agora, 0 que vocé conelui’? (vi) Repita os itens (i), (ji) ¢ (iii) com uma nova amostra de dados, comegando com geragio de x;. Agora, 0 que vocé obtém de By. 8; Por que isto é diferente do que vocé obteve no item (iii)? €9 Use os dados do arquivo COUNTYMURDERS para responder a essas questdes. Uti- lize somente os dados de 1996, (i) Quantos condados tiveram zero assassinatos em 1996? Quantos condados tive- ram pelo menos uma execugdo? Qual é 0 maior nimero de execugdes? (ii) Estime a equagdo abaixo, em que murders corresponde ao niimero de assassinatos. murders = By+ Byexecs + « por MQO e relate os resultados da forma usual, incluindo o tamanho da amostra 0 R-quadrado. (iii) Interprete 0 coeficiente de inclinagdo registrado no item (ii). A equacao estimada sugere um efeito dissuasor da pena capital? (iv) Qual € 0 menor ntimero de assassinatos que pode ser previsto pela equagio? Qual €0 residuo de um condado com zero execug6es € zero assassinatos? (v) Explique por que uma anilise de regressao simples nao é adequada para determi- nar se a pena capital tem um efeito dissuasor sobre os assassinatos. C100 conjunto de dados do arquivo CATHOLIC inclui informagdes de pontuacdes de testes de mais de 7.000 estudantes dos Estados Unidos que cursaram a oitava série em 1988. As varidveis mate12 e leitul2 sao notas padronizadas de matemiatica e leitura, respectivamente. (i) Quantos estudantes existem na amostra? Encontre as médias e desvios padrao de matel2 e leitul2. (ii) Compute a regressao simples de mate12 sobre leitu12 para obter o intercepto MQO ¢ as estimativas de inclinagao. Reporte os resultados na forma matel2 = By + Byleitul2 n=2R =? em que vocé vai preencher os valores de By e B;, além de substituir os pontos de interrogacio. (iii) O intercepto registrado na parte (ii) tem uma interpretagao significativa? Expligue. (iv) Vocé est surpreso pelo B, encontrado? E quanto ao R°? (v) Suponha que vocé apresente suas descobertas ao superintendente distrital de edu- cago e ele diga: “Suas descobertas mostram que, para aumentar as notas de ma- temdtica, precisamos somente melhorar as notas de leitura; portanto, devemos contratar mais professores de leitura”. Como vocé responderia a este comentario? (Dica: Se vocé calculasse a regressio de leitu12 sobre mate12, ao jnvés do con- trério, o que esperaria descobrir?) he “as. x

Você também pode gostar