Você está na página 1de 16

Sumrio

Captulo 1

A Natureza da Econometria e dos Dados Econmicos 1.1 1.2 1.3 1.4 O que Econometria? Passos na Anlise Econmica Emprica A Estrutura dos Dados Econmicos A Causalidade e a Noo de Ceteris Paribus na Anlise Economtrica

1 1 2 5 12

PARTE 1 ANLISE DE REGRESSO COM DADOS DE CORTE TRANSVERSAL Captulo 2 O Modelo de Regresso Simples 2.1 2.2 2.3 2.4 2.5 2.6 Captulo 3 Definio do Modelo de Regresso Simples Derivao das Estimativas de Mnimos Quadrados Ordinrios Mecnica do Mtodo MQO Unidades de Medida e Forma Funcional Valores Esperados e Varincias dos Estimadores de MQO Regresso atravs da Origem

19 20 20 25 34 39 45 58 64 64 69 80 91 99 110 110 113 131 134 137 149

Anlise de Regresso Mltipla: Estimao 3.1 3.2 3.3 3.4 3.5 Funcionabilidade da Regresso Mltipla Mecnica e Interpretao dos Mnimos Quadrados Ordinrios O Valor Esperado dos Estimadores de MQO A Varincia dos Estimadores de MQO Eficincia de MQO: O Teorema de Gauss-Markov

Captulo 4

Anlise de Regresso Mltipla: Inferncia 4.1 4.2 4.3 4.4 4.5 4.6 Distribuies Amostrais dos Estimadores de MQO Testes de Hipteses sobre um nico Parmetro Populacional: O Teste t Intervalos de Confiana Testes de Hipteses sobre uma Combinao Linear dos Parmetros Testes de Restries Lineares Mltiplas: O Teste F Descrio dos Resultados da Regresso

xv

xvi

Introduo Econometria Editora Thomson

Captulo 5

Anlise de Regresso Mltipla: MQO Assimpttico 5.1 5.2 5.3 Consistncia Normalidade Assimpttica e Inferncia de Amostras Grandes Eficincia Assimpttica de MQO

158 158 163 169 174 174 179 189 195 195 199 201 203 204 207 207 209 216 221 230 243 243 244 251 256 266 272 272 278 285 292

Captulo 6

Anlise de Regresso Mltipla: Problemas Adicionais 6.1 6.2 6.3 6.4 Efeitos da Dimenso dos Dados nas Estatsticas MQO Um pouco mais sobre a Forma Funcional Um pouco mais sobre o Grau de Ajuste e a Seleo de Regressores Previso e Anlise de Resduos Intervalos de Confiana de Previses Anlise de Resduos Previso de y quando a Varivel Dependente log(y) Resumo Problemas

Captulo 7

Anlise de Regresso Mltipla com Informaes Qualitativas: Variveis Binrias (ou Dummy) 7.1 7.2 7.3 7.4 7.5 7.6 A Descrio das Informaes Qualitativas Uma nica Varivel Dummy Independente O Uso de Variveis Dummy para Categorias Mltiplas Interaes Envolvendo Variveis Dummy Uma Varivel Dependente Binria: O Modelo de Probabilidade Linear Um Pouco mais sobre Anlise e Avaliao de Polticas e

Captulo 8

Heteroscedasticidade 8.1 8.2 8.3 8.4 8.5 Conseqncias da Heteroscedasticidade para o Mtodo MQO Inferncia Robusta em Relao Heteroscedasticidade aps e Estimao MQO O Teste da Existncia de Heteroscedasticidade Estimao de Mnimos Quadrados Ponderados O Modelo de Probabilidade Linear Revisitado

Captulo 9

Problemas Adicionais de Especificao e de Dados 9.1 9.2 9.3 9.4 M Especificao da Forma Funcional Utilizando Variveis Proxy para Variveis Explicativas No-Observadas Propriedades do Mtodo MQO quando h Erros de Medida Ausncia de Dados, Amostras No-Aleatrias e Observaes Extremas

PARTE 2 ANLISE DE REGRESSO COM DADOS DE SRIES TEMPORAIS Captulo 10 O Bsico da Anlise de Regresso com Dados de Sries Temporais 10.1 A Natureza dos Dados das Sries Temporais

305 306 306

Wooldridge

Sumrio

xvii

10.2 10.3 10.4 10.5

Exemplos de Modelos de Regresso de Sries Temporais Propriedades de Amostra Finita do MQO sob as Hipteses Clssicas Forma Funcional, Variveis Dummy e Nmeros-ndices Tendncia e Sazonalidade

307 311 320 327 340 340 345 352 360 363

Captulo 11 Questes Adicionais quanto ao Uso do MQO com Dados de Sries Temporais 11.1 11.2 11.3 11.4 11.5 Sries Temporais Estacionrias e Fracamente Dependentes Propriedades Assimptticas do MQO O Uso de Sries Temporais Altamente Persistentes na Anlise de Regresso Modelos Dinamicamente Completos e a Ausncia de Correlao Serial A Hiptese de Homoscedasticidade para Modelos de Sries Temporais

Captulo 12 Correlao Serial e Heteroscedasticidade em Regresses de Sries Temporais 12.1 12.2 12.3 12.4 12.5 12.6 As Propriedades do MQO com Erros Serialmente Correlacionados O Teste da Correlao Serial A Correo da Correlao Serial com Regressores Estritamente Exgenos Diferenciao e Correlao Serial Inferncia Robusta em Relao Correlao Serial aps o MQO Heteroscedasticidade em Regresses de Sries Temporais

368 368 372 380 387 388 392

PARTE 3 TPICOS AVANADOS Captulo 13 O Agrupamento de Cortes Transversais ao Longo do Tempo. Mtodos Simples de Dados de Painel O Agrupamento Independente de Cortes Transversais ao Longo do Tempo Anlise de Decises Governamentais com Agrupamentos Anlise de Dados de Painel de dois Perodos Anlise de Decises Governamentais com Dados de Painel de dois Perodos 13.5 A Diferenciao com mais de dois Perodos de Tempo Captulo 14 Mtodos Avanados de Dados de Painel 13.1 13.2 13.3 13.4

401

402 403 414 421 424 433

14.1 Estimao de Efeitos Fixos 433 14.2 Modelos de Efeitos Aleatrios 441 14.3 A Aplicao de Mtodos de Dados de Painel a outras Estruturas de Dados 445 Captulo 15 Estimao de Variveis Instrumentais e Mnimos Quadrados de dois Estgios 15.1 15.2 15.3 15.4 15.5 Motivao: Variveis Omitidas em um Modelo de Regresso Simples Estimao de VI do Modelo de Regresso Mltipla Mnimos Quadrados de dois Estgios Solues de VI de Problemas de Erros nas Variveis O Teste de Endogeneidade e o Teste de Restries 453 454 464 468 473

xviii

Introduo Econometria Editora Thomson

Sobreidentificadoras 15.6 O MQ2E com Heteroscedasticidade 15.7 A Aplicao do MQ2E a Equaes de Sries Temporais 15.8 A Aplicao do MQ2E em Cortes Transversais Agrupados e em Dados de Painel Captulo 16 Modelos de Equaes Simultneas 16.1 16.2 16.3 16.4 16.5 16.6 A Natureza dos Modelos de Equaes Simultneas Vis de Simultaneidade no MQO A Identificao e a Estimao de uma Equao Estrutural Sistemas com mais de duas Equaes Modelos de Equaes Simultneas com Sries Temporais Modelos de Equaes Simultneas com Dados de Painel

475 478 479 481 491 491 496 498 505 506 510 517 518 529 537 542 549 559 560 567 572 574 581 602 602 604 605 609 613 629 637 645 667

Captulo 17 Modelos com Variveis Dependentes Limitadas e Correes da Seleo Amostral 17.1 17.2 17.3 17.4 17.5 Modelos Logit e Probit de Resposta Binria O Modelo Tobit para Resposta de Soluo de Canto O Modelo de Regresso de Poisson Modelos de Regresso Censurada e Truncada Correes da Seleo Amostral

Captulo 18 Tpicos Avanados sobre Sries Temporais 18.1 18.2 18.3 18.4 18.5 Modelos de Defasagem Distribuda Infinita O Teste de Razes Unitrias Regresso Espria Co-Integrao e Modelos de Correo de Erro Previso

Captulo 19 A Montagem de um Projeto na Prtica 19.1 19.2 19.3 19.4 19.5 A Formulao de uma Pergunta A Reviso da Literatura A Compilao dos Dados A Anlise Economtrica A Redao de um Ensaio Emprico

Apndice G Tabelas Estatsticas Referncias Bibliogrficas Glossrio ndice Remissivo

1
A Natureza da Econometria e dos Dados Econmicos

Captulo 1 examina o escopo da econometria e prope questes gerais que resultam da aplicao dos mtodos economtricos. A Seo 1.3 examina os tipos de dados usados em negcios, economia e outras cincias sociais. A Seo 1.4 faz uma discusso intuitiva das dificuldades associadas com a inferncia da causalidade nas cincias sociais.

1.1 O QUE ECONOMETRIA?


Imagine que voc seja contratado pelo governo de seu Estado para avaliar a eficcia de um programa de treinamento financiado com recursos pblicos. Suponha que esse programa ensine aos trabalhadores vrias maneiras de como usar computadores no processo produtivo. O programa, com durao de 20 semanas, oferece cursos fora do horrio do expediente. Qualquer trabalhador horista da produo pode participar, e a matrcula em todo o programa, ou em parte dele, voluntria. Voc deve determinar qual o efeito, se houver, do programa de treinamento sobre o salrio-hora de cada trabalhador. Suponha, agora, que voc trabalhe para um banco de investimentos. Voc deve estudar os retornos de diferentes estratgias de investimento que envolvem ttulos do Tesouro dos Estados Unidos para decidir se elas esto de acordo com as teorias econmicas a elas associadas. A tarefa de responder a tais questes pode parecer desanimadora primeira vista. Nesse ponto, voc deve ter somente uma vaga idia de qual tipo de dados coletar. At o fim deste curso de princpios de econometria, voc provavelmente saber como usar os mtodos economtricos para avaliar, formalmente, um programa de treinamento ou testar uma simples teoria econmica. A econometria baseada no desenvolvimento de mtodos estatsticos para estimar relaes econmicas, testar teorias, avaliar e implementar polticas de governo e de negcios. A aplicao mais comum da econometria a previso de importantes variveis macroeconmicas, tais como taxas de juros, taxas de inflao e produto interno bruto (PIB). Ainda que as previses de indicadores econmicos sejam bastante visveis e, muitas vezes, extensamente publicadas, os mtodos economtricos podem ser usados em reas econmicas que no tm nada a ver com previses macroeconmicas. Por exemplo, estudaremos os efeitos de gastos em campanhas polticas sobre os resultados de eleies. No campo da educao, consideraremos o efeito de gastos pblicos com escolas sobre o desempenho de estudantes. Alm disso, aprenderemos como usar mtodos economtricos para prever sries de tempo econmicas. A econometria evoluiu como uma disciplina separada da estatstica matemtica, porque enfoca problemas inerentes coleta e anlise de dados econmicos no-experimentais. Dados no-experimentais no so acumulados por meio de experimentos controlados de indivduos, firmas ou seg-

Introduo Econometria Editora Thomson

mentos da economia. (Dados no-experimentais so, s vezes, chamados de dados observacionais para enfatizar o fato de que o pesquisador um coletor passivo de dados.) Dados experimentais so freqentemente coletados em ambientes de laboratrio nas cincias naturais, mas so muito mais difceis de serem obtidos nas cincias sociais. Embora seja possvel realizar alguns experimentos sociais, geralmente impossvel conduzir os tipos de experimentos controlados necessrios para avaliar questes econmicas, seja porque eles so proibitivamente dispendiosos ou moralmente repugnantes. Na Seo 1.4, apresentaremos alguns exemplos especficos das diferenas entre dados experimentais e no-experimentais. Naturalmente, os econometristas, sempre que possvel, valem-se dos estatsticos matemticos. O mtodo de anlise da regresso mltipla o esteio de ambos os campos, mas seu foco e sua interpretao podem diferir de forma marcante. Alm disso, os economistas criaram novas tcnicas para lidar com as complexidades dos dados econmicos e para testar as previses das teorias econmicas.

1.2 PASSOS NA ANLISE ECONMICA EMPRICA


Os mtodos economtricos so relevantes em, virtualmente, todos os ramos da economia aplicada. Eles entram em cena quando temos uma teoria econmica para testar ou quando temos em mente uma relao que apresenta alguma importncia para decises de negcios ou anlises de polticas pblicas. Uma anlise emprica usa dados para testar uma teoria ou estimar uma relao. Como se estrutura uma anlise econmica emprica? Pode parecer bvio, mas importante enfatizar que o primeiro passo em qualquer anlise emprica a formulao cuidadosa da questo de interesse. Essa questo pode ser a de testar certo aspecto de uma teoria ou os efeitos de uma poltica governamental. Em princpio, mtodos economtricos podem ser usados para responder a uma gama de questes. Em alguns casos, especialmente aqueles que envolvem o teste de teorias econmicas, constri-se um modelo econmico formal. Um modelo econmico consiste em equaes matemticas que descrevem vrias relaes. Os economistas so conhecidos por suas construes de modelos os quais descrevem um amplo leque de comportamentos. Por exemplo, em microeconomia intermediria, as decises de consumo individual, sujeitas a uma restrio oramentria, so descritas por modelos matemticos. A premissa bsica que fundamenta esses modelos a maximizao da utilidade. A hiptese de que os indivduos fazem escolhas para maximizar seu bem-estar, sujeitas s restries de recursos, oferecenos um arcabouo muito poderoso para criar modelos econmicos tratveis e fazer previses bem definidas. No contexto das decises de consumo, a maximizao da utilidade leva a um conjunto de equaes de demanda. Em uma equao de demanda, a quantidade demandada de cada produto depende do seu prprio preo, do preo dos bens substitutos e complementares, da renda do consumidor e das caractersticas individuais que influem no gosto. Essas equaes podem formar a base de uma anlise economtrica da demanda do consumidor. Os economistas tm usado ferramentas econmicas bsicas, tais como o arcabouo da maximizao da utilidade, para explicar comportamentos que, primeira vista, podem parecer de natureza no econmica. Um exemplo clssico o modelo econmico de Becker (1968) sobre o comportamento criminoso.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

EXEMPLO 1.1 (Modelo Econmico do Crime)

Em um artigo inspirador, o prmio Nobel Gary Becker postulou um arcabouo da maximizao da utilidade para descrever a participao de um indivduo no crime. Certos crimes tm recompensas econmicas evidentes, mas muitos comportamentos criminosos tm custos. O custo de oportunidade do crime impede o criminoso de participar de outras atividades, como um emprego legal. Alm disso, h custos associados com a possibilidade de ser capturado, e, se condenado, h os custos associados com o cumprimento de pena. Da perspectiva de Becker, a deciso de empreender a atividade ilegal uma deciso de alocao de recursos com os benefcios e custos das atividades concorrentes sendo considerados. Sob hipteses gerais podemos derivar uma equao que descreve a quantidade de tempo gasto na atividade criminosa como uma funo de vrios fatores. Podemos representar tal funo como y = f (x1, x2, x3, x4, x5, x6, x7), em que y = horas gastas em atividades criminosas, x1 = salrio por hora ocupada em atividade criminosa, x2 = salrio-hora em emprego legal, x3 = renda de outras atividades que no o crime ou um emprego legal, x4 = probabilidade de ser capturado, x5 = probabilidade de ser condenado se capturado, x6 = sentena esperada se condenado, e x7 = idade. Outros fatores geralmente afetam a deciso de uma pessoa de participar de atividades criminosas, mas a lista acima representa o que poderia resultar de uma anlise econmica formal. Como comum na teoria econmica, no fomos especficos sobre a funo f ( ) em (1.1). Essa funo depende de uma funo utilidade subjacente, raramente conhecida. Entretanto, podemos usar a teoria econmica ou a introspeco para prever o efeito que cada varivel teria sobre as atividades criminosas. Essa a base para uma anlise economtrica das atividades criminosas individuais. (1.1)

A modelagem econmica formal , s vezes, o ponto de partida da anlise emprica, porm mais comum usar a teoria econmica de modo menos formal, ou mesmo contar inteiramente com a intuio. Voc pode concordar quanto aos determinantes do comportamento criminoso que aparecem na equao (1.1) serem razoavelmente baseados no senso comum; poderamos chegar a tal equao diretamente, sem partir da maximizao da utilidade. Essa viso tem algum mrito, embora haja casos em que derivaes formais geram idias que a intuio pode ignorar. Vejamos o exemplo de uma equao que foi derivada por meio de um raciocnio um tanto informal.

Introduo Econometria Editora Thomson

EXEMPLO 1.2 (Treinamento e Produtividade do Trabalhador)

Considere o problema proposto no incio da Seo 1.1. Um economista especializado em trabalho gostaria de examinar os efeitos do treinamento sobre a produtividade do trabalhador. Nesse caso, h pouca necessidade de teoria econmica formal. Um entendimento econmico bsico suficiente para perceber que fatores tais como educao, experincia e treinamento influenciam a produtividade do trabalhador. Os economistas tambm esto bem cientes de que os trabalhadores so pagos de acordo com sua produtividade. Esse raciocnio simples leva a um modelo tal que salrioh = f(educ, exper, treina), (1.2)

em que salrioh o salrio-hora, educ representa os anos de educao formal, exper refere-se aos anos de experincia no mercado de trabalho e treina corresponde a semanas ocupadas em treinamento. Novamente, outros fatores geralmente influenciam a taxa de salrio, mas (1.2) captura a essncia do problema.

Aps especificarmos um modelo econmico, precisamos voltar ao que chamamos de modelo economtrico. Visto que trabalharemos com modelos economtricos ao longo deste texto, importante saber como eles se relacionam com os modelos econmicos. Considere a equao (1.1) como exemplo. A forma da funo f( ) deve ser especificada antes de podermos empreender uma anlise economtrica. Uma segunda questo concernente a (1.1) como lidar com variveis que no podem ser razoavelmente observadas. Por exemplo, considere o salrio que uma pessoa pode receber na atividade criminosa. Em princpio, tal quantidade bem-definida, mas poderia ser difcil, se no impossvel, observar o salrio para um determinado indivduo. Mesmo variveis como a probabilidade de ser preso no podem ser obtidas de modo realista para um determinado indivduo, mas pelo menos podemos observar estatsticas de deteno relevantes e derivar uma varivel que se aproxime da probabilidade de priso. Muitos outros fatores que no podemos listar, nem mesmo observar, afetam o comportamento criminoso, mas devemos de algum modo consider-los. As ambigidades inerentes ao modelo econmico do crime so resolvidas ao se especificar um modelo economtrico particular, tal como: crime = 0 + 1salriom + 2 outrenda + 3 freqpris + 4 freqcond + 5 sentmed + 6 idade + u,

(1.3)

em que crime alguma medida de freqncia da atividade criminosa, salriom o salrio que poderia ser ganho em um emprego legal, outrenda a renda de outras fontes (ativos, herana etc.), freqpris a freqncia de prises por infraes anteriores (para aproximar a probabilidade de deteno), freqcond a freqncia de condenaes e sentmed a durao mdia da sentena aps as condenaes. A escolha dessas variveis determinada pela teoria econmica e por consideraes sobre os dados. O termo u contm fatores no observados, tais como o salrio da atividade criminosa, o carter moral, a formao da famlia e erros na mensurao de coisas como a atividade criminosa e a probabilidade de de teno. Podemos adicionar variveis de formao da famlia ao modelo, tais como o nmero de irmos, a educao dos pais, e assim por diante, mas nunca poderemos eliminar u inteiramente. De fato, lidar com esse termo de erro ou termo de disturbncia , talvez, o componente mais importante de qualquer anlise economtrica.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

As constantes 0, 1, ..., 6 so os parmetros do modelo economtrico e descrevem as direes e as influncias da relao entre crime e os fatores usados para determinar crime no modelo. Um modelo economtrico completo para o Exemplo 1.2 poderia ser salrio = 0 + 1edu + 2 exper + 3 treina + u, (1.4)

em que o termo u contm fatores tais como aptido inata, qualidade da educao, formao da famlia e uma mirade de outros fatores que podem influenciar o salrio de uma pessoa. Se estivermos especialmente interessados nos efeitos do treinamento de trabalho, ento 3 o parmetro de interesse. Na maioria dos casos, a anlise economtrica comea pela especificao de um modelo economtrico, sem considerao de detalhes da criao do modelo. Geralmente seguimos essa abordagem, pois, em grande parte, a derivao cuidadosa de algo como o modelo econmico do crime toma muito tempo e pode nos levar para algumas reas especializadas e freqentemente difceis da teoria econmica. O raciocnio econmico desempenhar um papel importante em nossos exemplos, e incorporaremos toda teoria econmica subjacente na especificao do modelo economtrico. No modelo econmico do exemplo do crime, comearamos com um modelo economtrico tal como (1.3) e usaramos o raciocnio econmico e o senso comum como guias para escolher as variveis. Embora essa abordagem perca algumas das profuses da anlise econmica, ela comum e efetivamente aplicada por pesquisadores cautelosos. Visto que um modelo economtrico tal como (1.3) ou (1.4) tenha sido especificado, vrias hipteses de interesse podem ser formuladas em termos dos parmetros desconhecidos. Por exemplo, na equao (1.3), poderamos levantar a hiptese de que salriom, o salrio que poderia ser ganho no emprego legal, no tem efeito sobre o comportamento criminoso. No contexto desse modelo economtrico especfico, a hiptese equivalente a 1 = 0. Uma anlise emprica, por definio, requer dados. Aps os dados sobre as variveis relevantes terem sido coletados, os mtodos economtricos so usados para estimar os parmetros do modelo economtrico e para, formalmente, testar as hipteses de interesse. Em alguns casos, o modelo economtrico usado para fazer previses com a finalidade de testar de uma teoria a estudo do impacto de uma poltica. Como a coleta de dados muito importante em trabalhos empricos, a Seo 1.3 descrever os tipos de dados com os quais, provavelmente, nos defrontaremos.

1.3 A ESTRUTURA DOS DADOS ECONMICOS


Os dados econmicos apresentam-se em uma variedade de tipos. Embora alguns mtodos economtricos possam ser aplicados com pouca ou nenhuma modificao para muitos tipos diferentes de informaes, as caractersticas especiais de alguns dados devem ser consideradas ou deveriam ser exploradas. Descreveremos a seguir as estruturas de dados mais importantes encontradas nos trabalhos aplicados.

Dados de Corte Transversal


Um conjunto de dados de corte transversal consiste em uma amostra de indivduos, consumidores, empresas, cidades, estados, pases ou uma variedade de outras unidades, tomada em um determinado ponto no tempo. s vezes, os dados de todas as unidades no correspondem precisamente ao mesmo perodo. Por exemplo, muitas famlias podem ser pesquisadas durante diferentes semanas de um ano. Em uma an-

Introduo Econometria Editora Thomson

lise pura de dados de corte transversal, ignoraramos, na coleta de dados, quaisquer diferenas de tempo no importantes. Se o conjunto de famlias fosse pesquisado durante diferentes semanas do mesmo ano, ainda veramos isso como um conjunto de dados de corte transversal. Uma importante caracterstica dos dados de corte transversal que no podemos, freqentemente, assumir que eles foram obtidos por amostragem aleatria da populao subjacente. Por exemplo, se obtemos informaes sobre salrios, educao, experincia e outras caractersticas ao extrair aleatoriamente 500 pessoas de uma populao de trabalhadores, teremos uma amostra aleatria da populao de todas as pessoas que trabalham. A amostragem aleatria, matria aprendida nos cursos introdutrios de estatstica, simplifica a anlise de dados de corte transversal. Uma reviso sobre amostragem aleatria aparece no Apndice C disponvel em www.thomsonlearning.com.br, na pgina deste livro. Algumas vezes, a amostragem aleatria no apropriada como uma hiptese para analisar dados de corte transversal. Por exemplo, suponha que estejamos interessados em estudar fatores que influenciam na acumulao de riqueza das famlias. Podemos estudar uma amostra aleatria de famlias, mas algumas talvez se recusem a relatar suas riquezas. Se, por exemplo, for menos provvel que famlias mais ricas revelem sua riqueza, a amostra resultante sobre a riqueza no uma amostra aleatria extrada da populao de todas as famlias. Este um exemplo de um problema de seleo amostral, um tpico avanado que discutiremos no Captulo 17. Outra violao da amostragem aleatria ocorre quando construmos uma amostra a partir de unidades grandes relacionadas populao, em especial a unidades geogrficas. O problema provvel em tais casos que a populao no suficientemente grande para se supor, de maneira razovel, que as observaes so extraes independentes. Por exemplo, se queremos explicar novas atividades de negcios entre estados, como funo de taxas de salrios, preos de energia, alquotas de impostos, servios prestados, qualidade da fora de trabalho e outras caractersticas estaduais, improvvel que as atividades de negcios em um Estado prximo a outro sejam independentes. Isso revela que os mtodos economtricos que discutimos funcionam, de fato, em tais situaes, mas algumas vezes necessitam ser refinados. Na maioria dos casos, ignoraremos as complexidades que surgem ao analisar tais situaes e trataremos esses problemas dentro do arcabouo da amostragem aleatria, mesmo quando no for tecnicamente correto faz-lo. Os dados de corte transversal so amplamente usados em economia e em outras cincias sociais. Em economia, a anlise de dados de corte transversal est intimamente alinhada com campos da microeconomia aplicada, tais como economia do trabalho, finanas pblicas estaduais e locais, organizao industrial, economia urbana, demografia e economia da sade. Dados sobre indivduos, famlias, empresas e cidades em um determinado ponto do tempo so importantes para testar hipteses microeconmicas e avaliar polticas governamentais. Para a anlise economtrica, os dados de corte transversal usados podem ser representados e armazenados em computadores. A Tabela 1.1 contm, de forma abreviada, um conjunto de dados de corte transversal para o ano de 1976, de 526 trabalhadores. (Esse um subconjunto dos dados do arquivo WAGE1.RAW*.) As variveis incluem salrioh (salrio por hora), educ (anos de educao formal), exper (anos de experincia no mercado de trabalho), feminino (indicador de gnero) e casado (estado civil). Estas duas ltimas variveis so binrias (zero-um) por natureza, e servem para indicar caractersticas qualitativas dos indivduos. (A pessoa do sexo feminino ou no; a pessoa casada ou no.) Falaremos mais sobre variveis binrias no Captulo 7 e seguintes.

* NRT:

Todos os arquivos mencionados no texto tm a designao *.RAW, mas no banco de dados os arquivos so planilhas em Excel (.XLS), e os arquivos de trabalho de programas economtricos (como *.WF1, do Eviews). Portanto, a designao *.RAW genrica e d um significado de *.matriaprima para aplicaes e exerccios.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

Tabela 1.1 Conjunto de Dados de Corte Transversal sobre Salrios e outras Caractersticas Individuais

nobsi 1 2 3 4 5 . . . 525 526

salrioh 3,10 3,24 3,00 6,00 5,30 . . . 11,56 3,50

educ 11 12 11 8 12 . . . 16 14

exper 2 22 2 44 7 . . . 5 5

feminino 1 1 0 0 0 . . . 0 1

casado 0 1 0 1 1 . . . 1 0

A varivel nobsi na Tabela 1.1 o nmero da observao atribudo a cada indivduo na amostra. Diferentemente das outras variveis, ela no uma caracterstica do indivduo. Todos os programas economtricos e estatsticos atribuem a cada unidade um nmero de observao. A intuio deveria dizer-lhe que, para dados como os da Tabela 1.1, no importa qual pessoa classificada como observao um, qual pessoa designada pela observao dois, e assim por diante. O fato de que a ordenao dos dados no importa para a anlise economtrica uma caracterstica fundamental dos conjuntos de dados de corte transversal obtidos a partir da amostragem aleatria. s vezes, variveis diferentes correspondem a diferentes perodos nos conjuntos de dados de corte transversal. Por exemplo, a fim de determinar os efeitos de polticas governamentais sobre o crescimento econmico de longo prazo, os economistas tm estudado a relao entre crescimento do PIB per capita real ao longo de certo perodo (digamos, 1960 a 1985) e variveis determinadas, em parte, pela poltica governamental em 1960 (consumo do governo como percentagem do PIB e taxas de ensino mdio de adultos). Tais conjuntos de dados poderiam ser representados como na Tabela 1.2, a qual constitui parte do conjunto de dados usados no estudo de De Long e Summers (1991) sobre as taxas de crescimento entre pases. A varivel cpibpcr representa o crescimento mdio do PIB per capita real ao longo do perodo 1960 a 1985. O fato de que consgov60 (consumo do governo como percentagem do PIB) e second60 (percentagem da populao adulta com ensino mdio) correspondem ao ano de 1960, enquanto cpibpcr o crescimento mdio ao longo do perodo 1960 a 1985, no leva a quaisquer problemas especiais ao tratar essas informaes como um conjunto de dados de corte transversal. As observaes esto ordenadas alfabeticamente por pas, mas essa ordenao no afeta em nada qualquer anlise subseqente.

Introduo Econometria Editora Thomson

Tabela 1.2 Conjunto de Dados sobre Taxas de Crescimento Econmico e Caractersticas de Pases

nobsp 1 2 3 4 . . . 61

pas Argentina ustria Blgica Bolvia . . . Zimbbue

cpibpcr 0,89 3,32 2,56 1,24 . . . 2,30

consgov60 9 16 13 18 . . . 17

second60 32 50 69 12 . . . 6

Dados de Sries de Tempo


Um conjunto de dados de sries de tempo consiste em observaes sobre uma varivel ou muitas variveis ao longo do tempo. Exemplos de dados de sries temporais incluem preos de aes, oferta de moeda, ndice de preos ao consumidor, produto interno bruto, taxas anuais de homicdios e nmeros de vendas de automveis. Como eventos passados podem influenciar eventos futuros, e como, nas cincias sociais, as defasagens do comportamento so prevalecentes, o tempo uma dimenso importante em um conjunto de dados de sries de tempo. Diferentemente do arranjo dos dados de corte transversal, a ordenao cronolgica das observaes em uma srie de tempo transmite informaes potencialmente importantes. Uma caracterstica essencial dos dados de sries de tempo que torna mais difcil a anlise do que os dados de corte transversal o fato de que raramente possvel assumir (se que possvel) que as observaes econmicas so independentes ao longo do tempo. A maioria das sries de tempo econmicas, bem como de outras sries de tempo, est relacionada muitas vezes fortemente relacionada com seus histricos recentes. Por exemplo, saber algo sobre o produto interno bruto do ltimo trimestre nos diz muito sobre a provvel variao do PIB durante este trimestre, visto que o PIB tende a permanecer razoavelmente estvel de um trimestre para o prximo. Embora muitos procedimentos economtricos possam ser usados tanto com dados de corte transversal como com dados de sries de tempo, outros pontos podem ser considerados para especificar, apropriadamente, os modelos economtricos que usam dados de sries de tempo. Alm disso, as modificaes e embelezamentos das tcnicas economtricas comuns foram desenvolvidas com a finalidade de considerar e explorar a natureza dependente das sries de tempo e para tratar de outras questes, tal como o fato de que algumas variveis econmicas tendem a exibir claras tendncias ao longo do tempo. Outra caracterstica dos dados de sries de tempo que pode requerer ateno especial a freqncia dos dados, na qual eles so coletados. Em economia, as freqncias mais comuns so: diria, semanal, mensal, trimestral e anual. Os preos de aes so registrados em intervalos dirios (excluindo sbados e domingos). A oferta de moeda na economia dos Estados Unidos informada semanalmente. Muitas sries macroeconmicas so tabuladas mensalmente, incluindo as taxas de inflao e desemprego. Outras sries macroeconmicas so registradas menos freqentemente, como a cada trs meses (todo trimestre). O produto interno bruto um exemplo importante de uma srie trimestral. Outras sries de tempo, como as taxas de mortalidade infantil dos estados norte-americanos, esto disponveis somente em bases anuais.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

Muitas sries de tempo econmicas, sejam semanais, mensais ou trimestrais, exibem um forte padro sazonal, o qual pode ser um importante fator na anlise de sries de tempo. Por exemplo, dados mensais sobre o incio da construo de moradias se diferenciam entre os meses simplesmente devido a mudanas das condies climticas. Aprenderemos como trabalhar com sries de tempo no Captulo 10. A Tabela 1.3 contm um conjunto de dados de sries de tempo, obtido de um artigo de CastilloFreeman e Freeman (1992), sobre os efeitos do salrio mnimo em Porto Rico. O ano mais antigo no conjunto de dados a primeira observao, e o ano mais recente disponvel a ltima observao. Quando os mtodos economtricos so utilizados para analisar dados de sries de tempo, os dados devem ser armazenados em ordem cronolgica.
Tabela 1.3 Salrio Mnimo, Desemprego e Dados Relacionados para Porto Rico

nobsa 1 2 3 . . . 37 38

ano 1950 1951 1952 . . . 1986 1987

minmed 0,20 0,21 0,23 . . . 3,35 3,35

cobmed 20,1 20,7 22,6 . . . 58,1 58,2

desemp 15,4 16,0 14,8 . . . 18,9 16,8

pnb 878,7 925,0 1.015,9 . . . 4.281,6 4.496,7

A varivel minmed se refere ao salrio mnimo mdio no ano, cobmed a taxa de cobertura mdia (o percentual de trabalhadores cobertos pela lei de salrio mnimo), desemp a taxa de desemprego e pnb o produto nacional bruto. Usaremos esses dados mais adiante em uma anlise de sries de tempo do efeito do salrio mnimo sobre o emprego.

Cortes Transversais Agrupados


Alguns conjuntos de dados tm tanto caractersticas de corte transversal quanto de sries de tempo. Por exemplo, suponha que dois estudos sobre famlias sejam realizados nos Estados Unidos com dados de corte transversal, um em 1985 e outro em 1990. Em 1985, uma amostra aleatria de famlias pesquisada para variveis tais como renda, poupana, tamanho da famlia, e assim por diante. Em 1990, uma nova amostra aleatria de famlias extrada usando as mesmas questes da pesquisa. A fim de aumentar nosso tamanho de amostra, podemos formar um corte transversal agrupado ao combinar os dois anos. Agrupar cortes transversais de diferentes anos , freqentemente, um modo eficaz de analisar os efeitos de uma nova poltica de governo. A idia coletar dados de anos anteriores e posteriores a uma importante mudana de poltica governamental. Como exemplo, considere o seguinte conjunto de dados sobre os preos da moradia coletados em 1993 e 1995 nos Estados Unidos, quando houve uma reduo nos impostos sobre a propriedade em 1994. Suponha que tenhamos dados sobre 250 residncias para 1993 e sobre 270 para 1995. Um modo de armazenar tais dados apresentado na Tabela 1.4.

10

Introduo Econometria Editora Thomson

Tabela 1.4 Cortes-Transversais Agrupados: Dois Anos de Preos de Moradias

nobsm 1 2 3 . . . 250 251 252 253 . . . 520

ano 1993 1993 1993 . . . 1993 1995 1995 1995 . . . 1995

preoc 85.500 67.300 134.000 . . . 243.600 65.000 182.400 97.500 . . . 57.200

imppro 42 36 38 . . . 41 16 20 15 . . . 16

arquad 1.600 1.440 2.000 . . . 2.600 1.250 2.200 1.540 . . . 1.100

qtdorm 3 3 4 . . . 4 2 4 3 . . . 2

banhos 2,0 2,5 2,5 . . . 3,0 1,0 2,0 2,0 . . . 1,5

As observaes 1 a 250 correspondem s residncias vendidas em 1993, e as observaes 251 a 520 correspondem s 270 residncias vendidas em 1995. Embora a ordem na qual armazenamos os dados no se revele crucial, no se esquea de que o ano de cada observao , geralmente, muito importante. Essa a razo de introduzirmos ano como uma varivel separada. A anlise de um corte transversal agrupado muito parecida com a de um corte transversal padro, exceto pelo fato de que precisamos, freqentemente, considerar diferenas peridicas das variveis ao longo do tempo. De fato, alm de aumentar o tamanho da amostra, a caracterstica de uma anlise de corte transversal agrupada , freqentemente, ver como uma relao fundamental mudou ao longo do tempo.

Dados de Painel ou Longitudinais


Um conjunto de dados de painel (ou dados longitudinais) consiste em uma srie de tempo para cada membro do corte transversal do conjunto de dados. Como exemplo, suponha que tenhamos o histrico de salrio, educao e emprego para um conjunto de indivduos ao longo de um perodo de dez anos, ou que possamos coletar informaes, tais como dados de investimento e financeiros, sobre o mesmo conjunto de empresas ao longo de um perodo de cinco anos. Dados de painel tambm podem ser coletados para unidades geogrficas. Por exemplo, podemos coletar dados para o mesmo conjunto de municpios dos Estados Unidos sobre fluxos de imigrao, impostos, taxas de salrios, gastos governamentais etc., para os anos de 1980, 1985 e 1990.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

11

A caracterstica essencial dos dados de painel que os distingue dos dados de corte transversal agrupado o fato de que as mesmas unidades do corte transversal (indivduos, empresas ou municpios nos exemplos anteriores) so acompanhadas ao longo de um determinado perodo. Os dados na Tabela 1.4 no so considerados um conjunto de dados de painel porque as residncias vendidas so provavelmente diferentes em 1993 e 1995; se houver quaisquer repeties, o nmero provavelmente bem pequeno para ser significante. Em contraste, a Tabela 1.5 contm um conjunto de dados de painel de dois anos sobre o crime e as estatsticas relacionadas para 150 cidades nos Estados Unidos. H vrias caractersticas interessantes na Tabela 1.5. Primeiro, a cada cidade foi dado um nmero de 1 a 150. Qual cidade decidimos chamar de cidade 1, cidade 2, e assim por diante, irrelevante. Assim como em um corte transversal puro, a ordenao no corte transversal de um conjunto de dados de painel no importante. Poderamos usar o nome da cidade em lugar de um nmero, mas freqentemente til ter ambos.
Tabela 1.5 Conjunto de Dados de Painel sobre Estatsticas de Crime nas Cidades para Dois Anos

nobsc 1 2 3 4 . . . 297 298 299 300

cidade 1 1 2 2 . . . 149 149 150 150

ano 1986 1990 1986 1990 . . . 1986 1990 1986 1990

homicds 5 8 2 1 . . . 10 6 25 32

populao 350.000 359.200 64.300 65.100 . . . 260.700 245.000 543.000 546.200

desemp 8,7 7,2 5,4 5,5 . . . 9,6 9,8 4,3 5,2

polcia 440 471 75 75 . . . 286 334 520 493

Um segundo ponto que os dois anos dos dados para a cidade 1 preenchem as duas primeiras linhas ou observaes. As observaes 3 e 4 correspondem cidade 2, e assim por diante. Como cada uma das 150 cidades tem duas linhas de dados, qualquer pacote economtrico ver isso como 300 observaes. Esse conjunto de dados pode ser tratado como um corte transversal agrupado, em que as mesmas cidades aparecem em cada ano. Porm, como veremos nos Captulos 13 e 14, podemos tambm usar a estrutura de painel para responder a questes que no podem ser respondidas simplesmente vendo isso como um corte transversal agrupado. Ao organizar as observaes na Tabela 1.5, colocamos os dois anos dos dados de cada cidade um ao lado do outro, com o primeiro ano antecedendo o segundo em todos os casos. Apenas por questes prticas, esse o modo preferido de se ordenar conjuntos de dados de painel. Essa organizao contrasta com o modo pelo qual os cortes transversais agrupados so armazenados na Tabela 1.4. Em resu-

12

Introduo Econometria Editora Thomson

mo, a razo para ordenar os dados de painel como na Tabela 1.5 que precisaremos fazer transformaes dos dados para cada cidade nos dois anos. Como os dados de painel requerem a repetio das mesmas unidades ao longo do tempo, os conjuntos de dados de painel, especialmente aqueles sobre indivduos, famlias e empresas, so mais difceis de se obter que os cortes transversais agrupados. No surpreendentemente, observar as mesmas unidades ao longo do tempo traz vrias vantagens sobre os dados de corte transversal ou mesmo sobre os de dados de cortes transversais agrupados. O benefcio que salientaremos neste livro que ter mltiplas observaes sobre as mesmas unidades nos permite controlar certas caractersticas no observveis dos indivduos, firmas etc. Como veremos, o uso de mais de uma observao pode facilitar a inferncia causal em situaes em que inferir causalidade seria muito difcil se somente um nico corte transversal estivesse disponvel. Uma segunda vantagem dos dados de painel que eles, freqentemente, nos permitem estudar a importncia das defasagens do comportamento ou o resultado de tomar decises. Essa informao pode ser importante, visto que se pode esperar o impacto em muitas polticas pblicas somente aps algum tempo. A maior parte dos livros para cursos de nvel superior no contm uma discusso de mtodos economtricos para dados de painel. Entretanto, os economistas agora reconhecem que algumas questes so difceis, se no impossveis, de serem respondidas satisfatoriamente sem dados de painel. Como voc ver, podemos fazer considerveis progressos com anlises simples de dados de painel, um mtodo que no muito mais difcil do que trabalhar com um conjunto de dados de corte transversal padro.

Um Comentrio sobre Estruturas de Dados


A Parte 1 deste livro cobre a anlise de dados de corte transversal, j que ela prope menos conceitos e dificuldades tcnicas. Ao mesmo tempo, ela ilustra muitos dos temas essenciais da anlise economtrica. Usaremos os mtodos e as idias da anlise de corte transversal no restante do texto. Embora a anlise economtrica de sries de tempo use muitas das mesmas ferramentas que a anlise de corte transversal, ela mais complicada devido existncia de tendncia que traduz a natureza altamente persistente de muitas sries de tempo econmicas. Acredita-se que agora so considerados falhos muitos exemplos que tm sido tradicionalmente usados para ilustrar a maneira pela qual os mtodos economtricos podem ser aplicados a dados de sries de tempo. Faz pouco sentido usar tais exemplos inicialmente, visto que esse hbito somente refora uma prtica economtrica insatisfatria. Portanto, postergaremos o tratamento da econometria de sries de tempo at a Parte 2, quando questes importantes concernentes a tendncia, persistncia, dinmica e sazonalidade sero introduzidas. Na Parte 3, trataremos explicitamente de cortes transversais agrupados e dados de painel. A anlise de cortes transversais independentemente agrupados e a anlise simples de dados de painel so ambas independentemente, extenses claras e diretas da anlise pura de corte transversal. Entretanto, vamos esperar at o Captulo 13 para tratar desses tpicos.

1.4 A CAUSALIDADE E A NOO DE CETERIS PARIBUS NA ANLISE ECONOMTRICA


Em muitos testes de teoria econmica, e certamente para avaliar polticas pblicas, o objetivo do economista inferir que uma varivel (tal como a educao) tem um efeito causal sobre outra varivel (tal como a produtividade do trabalhador). Encontrar simplesmente uma associao entre duas ou mais variveis pode ser sugestivo, mas, a no ser que se possa estabelecer uma causalidade, raramente ela convincente.