Você está na página 1de 16

Sumrio

Captulo 1

A Natureza da Econometria e dos Dados Econmicos


1.1
1.2
1.3
1.4

O que Econometria?
Passos na Anlise Econmica Emprica
A Estrutura dos Dados Econmicos
A Causalidade e a Noo de Ceteris Paribus na Anlise Economtrica

1
1
2
5
12

PARTE 1
ANLISE DE REGRESSO COM DADOS DE CORTE TRANSVERSAL

19

Captulo 2

O Modelo de Regresso Simples

20

2.1
2.2
2.3
2.4
2.5
2.6

20
25
34
39
45
58

Captulo 3

Captulo 4

Definio do Modelo de Regresso Simples


Derivao das Estimativas de Mnimos Quadrados Ordinrios
Mecnica do Mtodo MQO
Unidades de Medida e Forma Funcional
Valores Esperados e Varincias dos Estimadores de MQO
Regresso atravs da Origem

Anlise de Regresso Mltipla: Estimao

64

3.1
3.2
3.3
3.4
3.5

64
69
80
91
99

Funcionabilidade da Regresso Mltipla


Mecnica e Interpretao dos Mnimos Quadrados Ordinrios
O Valor Esperado dos Estimadores de MQO
A Varincia dos Estimadores de MQO
Eficincia de MQO: O Teorema de Gauss-Markov

Anlise de Regresso Mltipla: Inferncia

110

4.1
4.2
4.3
4.4
4.5
4.6

110
113
131
134
137
149

Distribuies Amostrais dos Estimadores de MQO


Testes de Hipteses sobre um nico Parmetro Populacional: O Teste t
Intervalos de Confiana
Testes de Hipteses sobre uma Combinao Linear dos Parmetros
Testes de Restries Lineares Mltiplas: O Teste F
Descrio dos Resultados da Regresso

xv

xvi

Introduo Econometria Editora Thomson

Captulo 5

Captulo 6

Captulo 7

Anlise de Regresso Mltipla: MQO Assimpttico

158

5.1
5.2
5.3

158
163
169

Anlise de Regresso Mltipla: Problemas Adicionais

174

6.1
6.2
6.3
6.4

174
179
189
195
195
199
201
203
204

A Descrio das Informaes Qualitativas


Uma nica Varivel Dummy Independente
O Uso de Variveis Dummy para Categorias Mltiplas
Interaes Envolvendo Variveis Dummy
Uma Varivel Dependente Binria: O Modelo de Probabilidade Linear
Um Pouco mais sobre Anlise e Avaliao de Polticas e

Heteroscedasticidade
8.1
8.2
8.3
8.4
8.5

Captulo 9

Efeitos da Dimenso dos Dados nas Estatsticas MQO


Um pouco mais sobre a Forma Funcional
Um pouco mais sobre o Grau de Ajuste e a Seleo de Regressores
Previso e Anlise de Resduos
Intervalos de Confiana de Previses
Anlise de Resduos
Previso de y quando a Varivel Dependente log(y)
Resumo
Problemas

Anlise de Regresso Mltipla com Informaes Qualitativas:


Variveis Binrias (ou Dummy)
7.1
7.2
7.3
7.4
7.5
7.6

Captulo 8

Consistncia
Normalidade Assimpttica e Inferncia de Amostras Grandes
Eficincia Assimpttica de MQO

Conseqncias da Heteroscedasticidade para o Mtodo MQO


Inferncia Robusta em Relao Heteroscedasticidade
aps e Estimao MQO
O Teste da Existncia de Heteroscedasticidade
Estimao de Mnimos Quadrados Ponderados
O Modelo de Probabilidade Linear Revisitado

207
207
209
216
221
230
243
243
244
251
256
266

Problemas Adicionais de Especificao e de Dados

272

9.1
9.2
9.3
9.4

272
278
285
292

M Especificao da Forma Funcional


Utilizando Variveis Proxy para Variveis Explicativas No-Observadas
Propriedades do Mtodo MQO quando h Erros de Medida
Ausncia de Dados, Amostras No-Aleatrias e Observaes Extremas

PARTE 2
ANLISE DE REGRESSO COM DADOS DE SRIES TEMPORAIS

305

Captulo 10 O Bsico da Anlise de Regresso com Dados de Sries Temporais

306

10.1 A Natureza dos Dados das Sries Temporais

306

Wooldridge

Sumrio

10.2
10.3
10.4
10.5

xvii

Exemplos de Modelos de Regresso de Sries Temporais


Propriedades de Amostra Finita do MQO sob as Hipteses Clssicas
Forma Funcional, Variveis Dummy e Nmeros-ndices
Tendncia e Sazonalidade

307
311
320
327

Captulo 11 Questes Adicionais quanto ao Uso do MQO com Dados de


Sries Temporais
11.1
11.2
11.3
11.4
11.5

Sries Temporais Estacionrias e Fracamente Dependentes


Propriedades Assimptticas do MQO
O Uso de Sries Temporais Altamente Persistentes na Anlise de Regresso
Modelos Dinamicamente Completos e a Ausncia de Correlao Serial
A Hiptese de Homoscedasticidade para Modelos de Sries Temporais

Captulo 12 Correlao Serial e Heteroscedasticidade em Regresses de


Sries Temporais
12.1
12.2
12.3
12.4
12.5
12.6

340

As Propriedades do MQO com Erros Serialmente Correlacionados


O Teste da Correlao Serial
A Correo da Correlao Serial com Regressores Estritamente Exgenos
Diferenciao e Correlao Serial
Inferncia Robusta em Relao Correlao Serial aps o MQO
Heteroscedasticidade em Regresses de Sries Temporais

340
345
352
360
363

368
368
372
380
387
388
392

PARTE 3
TPICOS AVANADOS

401

Captulo 13 O Agrupamento de Cortes Transversais ao Longo do Tempo.


Mtodos Simples de Dados de Painel

402

13.1
13.2
13.3
13.4

O Agrupamento Independente de Cortes Transversais ao Longo do Tempo


Anlise de Decises Governamentais com Agrupamentos
Anlise de Dados de Painel de dois Perodos
Anlise de Decises Governamentais com Dados de Painel
de dois Perodos
13.5 A Diferenciao com mais de dois Perodos de Tempo
Captulo 14 Mtodos Avanados de Dados de Painel

403
414
421
424
433

14.1 Estimao de Efeitos Fixos


433
14.2 Modelos de Efeitos Aleatrios
441
14.3 A Aplicao de Mtodos de Dados de Painel a outras Estruturas de Dados 445
Captulo 15 Estimao de Variveis Instrumentais e Mnimos
Quadrados de dois Estgios
15.1
15.2
15.3
15.4
15.5

Motivao: Variveis Omitidas em um Modelo de Regresso Simples


Estimao de VI do Modelo de Regresso Mltipla
Mnimos Quadrados de dois Estgios
Solues de VI de Problemas de Erros nas Variveis
O Teste de Endogeneidade e o Teste de Restries

453
454
464
468
473

xviii

Introduo Econometria Editora Thomson

Sobreidentificadoras
15.6 O MQ2E com Heteroscedasticidade
15.7 A Aplicao do MQ2E a Equaes de Sries Temporais
15.8 A Aplicao do MQ2E em Cortes Transversais Agrupados
e em Dados de Painel
Captulo 16 Modelos de Equaes Simultneas
16.1
16.2
16.3
16.4
16.5
16.6

A Natureza dos Modelos de Equaes Simultneas


Vis de Simultaneidade no MQO
A Identificao e a Estimao de uma Equao Estrutural
Sistemas com mais de duas Equaes
Modelos de Equaes Simultneas com Sries Temporais
Modelos de Equaes Simultneas com Dados de Painel

Captulo 17 Modelos com Variveis Dependentes Limitadas e


Correes da Seleo Amostral
17.1
17.2
17.3
17.4
17.5

Modelos Logit e Probit de Resposta Binria


O Modelo Tobit para Resposta de Soluo de Canto
O Modelo de Regresso de Poisson
Modelos de Regresso Censurada e Truncada
Correes da Seleo Amostral

Captulo 18 Tpicos Avanados sobre Sries Temporais


18.1
18.2
18.3
18.4
18.5

Modelos de Defasagem Distribuda Infinita


O Teste de Razes Unitrias
Regresso Espria
Co-Integrao e Modelos de Correo de Erro
Previso

Captulo 19 A Montagem de um Projeto na Prtica


19.1
19.2
19.3
19.4
19.5

A Formulao de uma Pergunta


A Reviso da Literatura
A Compilao dos Dados
A Anlise Economtrica
A Redao de um Ensaio Emprico

475
478
479
481
491
491
496
498
505
506
510
517
518
529
537
542
549
559
560
567
572
574
581
602
602
604
605
609
613

Apndice G Tabelas Estatsticas

629

Referncias Bibliogrficas

637

Glossrio

645

ndice Remissivo

667

1
A Natureza da Econometria e dos
Dados Econmicos

Captulo 1 examina o escopo da econometria e prope questes gerais que resultam da aplicao dos mtodos economtricos. A Seo 1.3 examina os tipos de dados usados em negcios,
economia e outras cincias sociais. A Seo 1.4 faz uma discusso intuitiva das dificuldades
associadas com a inferncia da causalidade nas cincias sociais.

1.1 O QUE ECONOMETRIA?


Imagine que voc seja contratado pelo governo de seu Estado para avaliar a eficcia de um programa
de treinamento financiado com recursos pblicos. Suponha que esse programa ensine aos trabalhadores vrias maneiras de como usar computadores no processo produtivo. O programa, com durao de
20 semanas, oferece cursos fora do horrio do expediente. Qualquer trabalhador horista da produo
pode participar, e a matrcula em todo o programa, ou em parte dele, voluntria. Voc deve determinar qual o efeito, se houver, do programa de treinamento sobre o salrio-hora de cada trabalhador.
Suponha, agora, que voc trabalhe para um banco de investimentos. Voc deve estudar os retornos de diferentes estratgias de investimento que envolvem ttulos do Tesouro dos Estados Unidos para
decidir se elas esto de acordo com as teorias econmicas a elas associadas.
A tarefa de responder a tais questes pode parecer desanimadora primeira vista. Nesse ponto,
voc deve ter somente uma vaga idia de qual tipo de dados coletar. At o fim deste curso de princpios de econometria, voc provavelmente saber como usar os mtodos economtricos para avaliar,
formalmente, um programa de treinamento ou testar uma simples teoria econmica.
A econometria baseada no desenvolvimento de mtodos estatsticos para estimar relaes econmicas, testar teorias, avaliar e implementar polticas de governo e de negcios. A aplicao mais
comum da econometria a previso de importantes variveis macroeconmicas, tais como taxas de
juros, taxas de inflao e produto interno bruto (PIB). Ainda que as previses de indicadores econmicos sejam bastante visveis e, muitas vezes, extensamente publicadas, os mtodos economtricos
podem ser usados em reas econmicas que no tm nada a ver com previses macroeconmicas.
Por exemplo, estudaremos os efeitos de gastos em campanhas polticas sobre os resultados de eleies. No campo da educao, consideraremos o efeito de gastos pblicos com escolas sobre o
desempenho de estudantes. Alm disso, aprenderemos como usar mtodos economtricos para prever sries de tempo econmicas.
A econometria evoluiu como uma disciplina separada da estatstica matemtica, porque enfoca
problemas inerentes coleta e anlise de dados econmicos no-experimentais. Dados no-experimentais no so acumulados por meio de experimentos controlados de indivduos, firmas ou seg-

Introduo Econometria Editora Thomson

mentos da economia. (Dados no-experimentais so, s vezes, chamados de dados observacionais


para enfatizar o fato de que o pesquisador um coletor passivo de dados.) Dados experimentais so
freqentemente coletados em ambientes de laboratrio nas cincias naturais, mas so muito mais difceis de serem obtidos nas cincias sociais. Embora seja possvel realizar alguns experimentos sociais,
geralmente impossvel conduzir os tipos de experimentos controlados necessrios para avaliar questes econmicas, seja porque eles so proibitivamente dispendiosos ou moralmente repugnantes. Na
Seo 1.4, apresentaremos alguns exemplos especficos das diferenas entre dados experimentais e
no-experimentais.
Naturalmente, os econometristas, sempre que possvel, valem-se dos estatsticos matemticos. O
mtodo de anlise da regresso mltipla o esteio de ambos os campos, mas seu foco e sua interpretao podem diferir de forma marcante. Alm disso, os economistas criaram novas tcnicas para lidar
com as complexidades dos dados econmicos e para testar as previses das teorias econmicas.

1.2 PASSOS NA ANLISE ECONMICA EMPRICA


Os mtodos economtricos so relevantes em, virtualmente, todos os ramos da economia aplicada. Eles
entram em cena quando temos uma teoria econmica para testar ou quando temos em mente uma relao que apresenta alguma importncia para decises de negcios ou anlises de polticas pblicas.
Uma anlise emprica usa dados para testar uma teoria ou estimar uma relao.
Como se estrutura uma anlise econmica emprica? Pode parecer bvio, mas importante
enfatizar que o primeiro passo em qualquer anlise emprica a formulao cuidadosa da questo
de interesse. Essa questo pode ser a de testar certo aspecto de uma teoria ou os efeitos de uma poltica governamental. Em princpio, mtodos economtricos podem ser usados para responder a uma
gama de questes.
Em alguns casos, especialmente aqueles que envolvem o teste de teorias econmicas, constri-se
um modelo econmico formal. Um modelo econmico consiste em equaes matemticas que descrevem vrias relaes. Os economistas so conhecidos por suas construes de modelos os quais descrevem
um amplo leque de comportamentos. Por exemplo, em microeconomia intermediria, as decises de
consumo individual, sujeitas a uma restrio oramentria, so descritas por modelos matemticos. A
premissa bsica que fundamenta esses modelos a maximizao da utilidade. A hiptese de que os
indivduos fazem escolhas para maximizar seu bem-estar, sujeitas s restries de recursos, oferecenos um arcabouo muito poderoso para criar modelos econmicos tratveis e fazer previses bem definidas. No contexto das decises de consumo, a maximizao da utilidade leva a um conjunto de equaes de demanda. Em uma equao de demanda, a quantidade demandada de cada produto depende do
seu prprio preo, do preo dos bens substitutos e complementares, da renda do consumidor e das
caractersticas individuais que influem no gosto. Essas equaes podem formar a base de uma anlise
economtrica da demanda do consumidor.
Os economistas tm usado ferramentas econmicas bsicas, tais como o arcabouo da maximizao da utilidade, para explicar comportamentos que, primeira vista, podem parecer de natureza
no econmica. Um exemplo clssico o modelo econmico de Becker (1968) sobre o comportamento criminoso.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

EXEMPLO 1.1
(Modelo Econmico do Crime)

Em um artigo inspirador, o prmio Nobel Gary Becker postulou um arcabouo da maximizao da utilidade
para descrever a participao de um indivduo no crime. Certos crimes tm recompensas econmicas evidentes, mas muitos comportamentos criminosos tm custos. O custo de oportunidade do crime impede o
criminoso de participar de outras atividades, como um emprego legal. Alm disso, h custos associados com
a possibilidade de ser capturado, e, se condenado, h os custos associados com o cumprimento de pena.
Da perspectiva de Becker, a deciso de empreender a atividade ilegal uma deciso de alocao de recursos com os benefcios e custos das atividades concorrentes sendo considerados.
Sob hipteses gerais podemos derivar uma equao que descreve a quantidade de tempo gasto na atividade criminosa como uma funo de vrios fatores. Podemos representar tal funo como
y = f (x1, x2, x3, x4, x5, x6, x7),

(1.1)

em que
y = horas gastas em atividades criminosas,
x1 = salrio por hora ocupada em atividade criminosa,
x2 = salrio-hora em emprego legal,
x3 = renda de outras atividades que no o crime ou um emprego legal,
x4 = probabilidade de ser capturado,
x5 = probabilidade de ser condenado se capturado,
x6 = sentena esperada se condenado, e
x7 = idade.
Outros fatores geralmente afetam a deciso de uma pessoa de participar de atividades criminosas, mas a
lista acima representa o que poderia resultar de uma anlise econmica formal. Como comum na teoria
econmica, no fomos especficos sobre a funo f () em (1.1). Essa funo depende de uma funo utilidade subjacente, raramente conhecida. Entretanto, podemos usar a teoria econmica ou a introspeco
para prever o efeito que cada varivel teria sobre as atividades criminosas. Essa a base para uma anlise
economtrica das atividades criminosas individuais.

A modelagem econmica formal , s vezes, o ponto de partida da anlise emprica, porm mais
comum usar a teoria econmica de modo menos formal, ou mesmo contar inteiramente com a intuio. Voc pode concordar quanto aos determinantes do comportamento criminoso que aparecem na
equao (1.1) serem razoavelmente baseados no senso comum; poderamos chegar a tal equao diretamente, sem partir da maximizao da utilidade. Essa viso tem algum mrito, embora haja casos em
que derivaes formais geram idias que a intuio pode ignorar.
Vejamos o exemplo de uma equao que foi derivada por meio de um raciocnio um tanto
informal.

Introduo Econometria Editora Thomson

EXEMPLO 1.2
(Treinamento e Produtividade do Trabalhador)

Considere o problema proposto no incio da Seo 1.1. Um economista especializado em trabalho gostaria
de examinar os efeitos do treinamento sobre a produtividade do trabalhador. Nesse caso, h pouca necessidade de teoria econmica formal. Um entendimento econmico bsico suficiente para perceber que fatores tais como educao, experincia e treinamento influenciam a produtividade do trabalhador. Os economistas tambm esto bem cientes de que os trabalhadores so pagos de acordo com sua produtividade. Esse
raciocnio simples leva a um modelo tal que
salrioh = f(educ, exper, treina),

(1.2)

em que salrioh o salrio-hora, educ representa os anos de educao formal, exper refere-se aos anos de
experincia no mercado de trabalho e treina corresponde a semanas ocupadas em treinamento. Novamente,
outros fatores geralmente influenciam a taxa de salrio, mas (1.2) captura a essncia do problema.

Aps especificarmos um modelo econmico, precisamos voltar ao que chamamos de modelo economtrico. Visto que trabalharemos com modelos economtricos ao longo deste texto, importante
saber como eles se relacionam com os modelos econmicos. Considere a equao (1.1) como exemplo. A forma da funo f() deve ser especificada antes de podermos empreender uma anlise economtrica. Uma segunda questo concernente a (1.1) como lidar com variveis que no podem ser
razoavelmente observadas. Por exemplo, considere o salrio que uma pessoa pode receber na atividade criminosa. Em princpio, tal quantidade bem-definida, mas poderia ser difcil, se no impossvel, observar o salrio para um determinado indivduo. Mesmo variveis como a probabilidade de
ser preso no podem ser obtidas de modo realista para um determinado indivduo, mas pelo menos
podemos observar estatsticas de deteno relevantes e derivar uma varivel que se aproxime da probabilidade de priso. Muitos outros fatores que no podemos listar, nem mesmo observar, afetam o
comportamento criminoso, mas devemos de algum modo consider-los.
As ambigidades inerentes ao modelo econmico do crime so resolvidas ao se especificar um
modelo economtrico particular, tal como:
crime = 0 + 1salriom + 2 outrenda + 3 freqpris + 4 freqcond
+ 5 sentmed + 6 idade + u,

(1.3)

em que crime alguma medida de freqncia da atividade criminosa, salriom o salrio que poderia
ser ganho em um emprego legal, outrenda a renda de outras fontes (ativos, herana etc.), freqpris
a freqncia de prises por infraes anteriores (para aproximar a probabilidade de deteno), freqcond
a freqncia de condenaes e sentmed a durao mdia da sentena aps as condenaes. A escolha dessas variveis determinada pela teoria econmica e por consideraes sobre os dados. O termo
u contm fatores no observados, tais como o salrio da atividade criminosa, o carter moral, a formao da famlia e erros na mensurao de coisas como a atividade criminosa e a probabilidade de
de teno. Podemos adicionar variveis de formao da famlia ao modelo, tais como o nmero de
irmos, a educao dos pais, e assim por diante, mas nunca poderemos eliminar u inteiramente. De fato,
lidar com esse termo de erro ou termo de disturbncia , talvez, o componente mais importante de qualquer anlise economtrica.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

As constantes 0, 1, ..., 6 so os parmetros do modelo economtrico e descrevem as direes


e as influncias da relao entre crime e os fatores usados para determinar crime no modelo.
Um modelo economtrico completo para o Exemplo 1.2 poderia ser
salrio = 0 + 1edu + 2 exper + 3 treina + u,

(1.4)

em que o termo u contm fatores tais como aptido inata, qualidade da educao, formao da famlia
e uma mirade de outros fatores que podem influenciar o salrio de uma pessoa. Se estivermos especialmente interessados nos efeitos do treinamento de trabalho, ento 3 o parmetro de interesse.
Na maioria dos casos, a anlise economtrica comea pela especificao de um modelo economtrico, sem considerao de detalhes da criao do modelo. Geralmente seguimos essa abordagem, pois,
em grande parte, a derivao cuidadosa de algo como o modelo econmico do crime toma muito tempo
e pode nos levar para algumas reas especializadas e freqentemente difceis da teoria econmica. O
raciocnio econmico desempenhar um papel importante em nossos exemplos, e incorporaremos toda
teoria econmica subjacente na especificao do modelo economtrico. No modelo econmico do
exemplo do crime, comearamos com um modelo economtrico tal como (1.3) e usaramos o raciocnio econmico e o senso comum como guias para escolher as variveis. Embora essa abordagem perca
algumas das profuses da anlise econmica, ela comum e efetivamente aplicada por pesquisadores
cautelosos.
Visto que um modelo economtrico tal como (1.3) ou (1.4) tenha sido especificado, vrias hipteses de interesse podem ser formuladas em termos dos parmetros desconhecidos. Por exemplo, na
equao (1.3), poderamos levantar a hiptese de que salriom, o salrio que poderia ser ganho no
emprego legal, no tem efeito sobre o comportamento criminoso. No contexto desse modelo
economtrico especfico, a hiptese equivalente a 1 = 0.
Uma anlise emprica, por definio, requer dados. Aps os dados sobre as variveis relevantes
terem sido coletados, os mtodos economtricos so usados para estimar os parmetros do modelo economtrico e para, formalmente, testar as hipteses de interesse. Em alguns casos, o modelo economtrico usado para fazer previses com a finalidade de testar de uma teoria a estudo do impacto de uma
poltica.
Como a coleta de dados muito importante em trabalhos empricos, a Seo 1.3 descrever os
tipos de dados com os quais, provavelmente, nos defrontaremos.

1.3 A ESTRUTURA DOS DADOS ECONMICOS


Os dados econmicos apresentam-se em uma variedade de tipos. Embora alguns mtodos economtricos possam ser aplicados com pouca ou nenhuma modificao para muitos tipos diferentes de
informaes, as caractersticas especiais de alguns dados devem ser consideradas ou deveriam ser
exploradas. Descreveremos a seguir as estruturas de dados mais importantes encontradas nos trabalhos aplicados.

Dados de Corte Transversal


Um conjunto de dados de corte transversal consiste em uma amostra de indivduos, consumidores,
empresas, cidades, estados, pases ou uma variedade de outras unidades, tomada em um determinado ponto
no tempo. s vezes, os dados de todas as unidades no correspondem precisamente ao mesmo perodo.
Por exemplo, muitas famlias podem ser pesquisadas durante diferentes semanas de um ano. Em uma an-

Introduo Econometria Editora Thomson

lise pura de dados de corte transversal, ignoraramos, na coleta de dados, quaisquer diferenas de tempo
no importantes. Se o conjunto de famlias fosse pesquisado durante diferentes semanas do mesmo ano,
ainda veramos isso como um conjunto de dados de corte transversal.
Uma importante caracterstica dos dados de corte transversal que no podemos, freqentemente,
assumir que eles foram obtidos por amostragem aleatria da populao subjacente. Por exemplo, se
obtemos informaes sobre salrios, educao, experincia e outras caractersticas ao extrair aleatoriamente 500 pessoas de uma populao de trabalhadores, teremos uma amostra aleatria da populao
de todas as pessoas que trabalham. A amostragem aleatria, matria aprendida nos cursos introdutrios
de estatstica, simplifica a anlise de dados de corte transversal. Uma reviso sobre amostragem aleatria aparece no Apndice C disponvel em www.thomsonlearning.com.br, na pgina deste livro.
Algumas vezes, a amostragem aleatria no apropriada como uma hiptese para analisar dados
de corte transversal. Por exemplo, suponha que estejamos interessados em estudar fatores que influenciam na acumulao de riqueza das famlias. Podemos estudar uma amostra aleatria de famlias, mas
algumas talvez se recusem a relatar suas riquezas. Se, por exemplo, for menos provvel que famlias
mais ricas revelem sua riqueza, a amostra resultante sobre a riqueza no uma amostra aleatria extrada
da populao de todas as famlias. Este um exemplo de um problema de seleo amostral, um tpico
avanado que discutiremos no Captulo 17.
Outra violao da amostragem aleatria ocorre quando construmos uma amostra a partir de unidades grandes relacionadas populao, em especial a unidades geogrficas. O problema provvel em
tais casos que a populao no suficientemente grande para se supor, de maneira razovel, que as
observaes so extraes independentes. Por exemplo, se queremos explicar novas atividades de
negcios entre estados, como funo de taxas de salrios, preos de energia, alquotas de impostos, servios prestados, qualidade da fora de trabalho e outras caractersticas estaduais, improvvel que as
atividades de negcios em um Estado prximo a outro sejam independentes. Isso revela que os mtodos economtricos que discutimos funcionam, de fato, em tais situaes, mas algumas vezes necessitam ser refinados. Na maioria dos casos, ignoraremos as complexidades que surgem ao analisar tais
situaes e trataremos esses problemas dentro do arcabouo da amostragem aleatria, mesmo quando
no for tecnicamente correto faz-lo.
Os dados de corte transversal so amplamente usados em economia e em outras cincias sociais.
Em economia, a anlise de dados de corte transversal est intimamente alinhada com campos da
microeconomia aplicada, tais como economia do trabalho, finanas pblicas estaduais e locais, organizao industrial, economia urbana, demografia e economia da sade. Dados sobre indivduos, famlias, empresas e cidades em um determinado ponto do tempo so importantes para testar hipteses
microeconmicas e avaliar polticas governamentais.
Para a anlise economtrica, os dados de corte transversal usados podem ser representados e
armazenados em computadores. A Tabela 1.1 contm, de forma abreviada, um conjunto de dados de
corte transversal para o ano de 1976, de 526 trabalhadores. (Esse um subconjunto dos dados do arquivo WAGE1.RAW*.) As variveis incluem salrioh (salrio por hora), educ (anos de educao formal),
exper (anos de experincia no mercado de trabalho), feminino (indicador de gnero) e casado (estado
civil). Estas duas ltimas variveis so binrias (zero-um) por natureza, e servem para indicar caractersticas qualitativas dos indivduos. (A pessoa do sexo feminino ou no; a pessoa casada ou no.)
Falaremos mais sobre variveis binrias no Captulo 7 e seguintes.

* NRT:

Todos os arquivos mencionados no texto tm a designao *.RAW, mas no banco de dados os arquivos so planilhas em Excel (.XLS), e os arquivos de trabalho de programas economtricos (como
*.WF1, do Eviews). Portanto, a designao *.RAW genrica e d um significado de *.matriaprima para aplicaes e exerccios.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

Tabela 1.1
Conjunto de Dados de Corte Transversal sobre Salrios e outras Caractersticas Individuais

nobsi

salrioh

educ

exper

feminino

casado

3,10

11

3,24

12

22

3,00

11

6,00

44

5,30

12

525

11,56

16

526

3,50

14

A varivel nobsi na Tabela 1.1 o nmero da observao atribudo a cada indivduo na amostra.
Diferentemente das outras variveis, ela no uma caracterstica do indivduo. Todos os programas
economtricos e estatsticos atribuem a cada unidade um nmero de observao. A intuio deveria
dizer-lhe que, para dados como os da Tabela 1.1, no importa qual pessoa classificada como observao um, qual pessoa designada pela observao dois, e assim por diante. O fato de que a ordenao dos dados no importa para a anlise economtrica uma caracterstica fundamental dos conjuntos de dados de corte transversal obtidos a partir da amostragem aleatria.
s vezes, variveis diferentes correspondem a diferentes perodos nos conjuntos de dados de corte
transversal. Por exemplo, a fim de determinar os efeitos de polticas governamentais sobre o crescimento econmico de longo prazo, os economistas tm estudado a relao entre crescimento do PIB per
capita real ao longo de certo perodo (digamos, 1960 a 1985) e variveis determinadas, em parte, pela
poltica governamental em 1960 (consumo do governo como percentagem do PIB e taxas de ensino
mdio de adultos). Tais conjuntos de dados poderiam ser representados como na Tabela 1.2, a qual
constitui parte do conjunto de dados usados no estudo de De Long e Summers (1991) sobre as taxas
de crescimento entre pases.
A varivel cpibpcr representa o crescimento mdio do PIB per capita real ao longo do perodo
1960 a 1985. O fato de que consgov60 (consumo do governo como percentagem do PIB) e second60
(percentagem da populao adulta com ensino mdio) correspondem ao ano de 1960, enquanto
cpibpcr o crescimento mdio ao longo do perodo 1960 a 1985, no leva a quaisquer problemas
especiais ao tratar essas informaes como um conjunto de dados de corte transversal. As observaes esto ordenadas alfabeticamente por pas, mas essa ordenao no afeta em nada qualquer anlise subseqente.

Introduo Econometria Editora Thomson

Tabela 1.2
Conjunto de Dados sobre Taxas de Crescimento Econmico e Caractersticas de Pases

nobsp

pas

cpibpcr

consgov60

second60

Argentina

0,89

32

ustria

3,32

16

50

Blgica

2,56

13

69

Bolvia

1,24

18

12

61

Zimbbue

2,30

17

Dados de Sries de Tempo


Um conjunto de dados de sries de tempo consiste em observaes sobre uma varivel ou muitas variveis ao longo do tempo. Exemplos de dados de sries temporais incluem preos de aes, oferta de moeda,
ndice de preos ao consumidor, produto interno bruto, taxas anuais de homicdios e nmeros de vendas
de automveis. Como eventos passados podem influenciar eventos futuros, e como, nas cincias sociais,
as defasagens do comportamento so prevalecentes, o tempo uma dimenso importante em um conjunto de dados de sries de tempo. Diferentemente do arranjo dos dados de corte transversal, a ordenao cronolgica das observaes em uma srie de tempo transmite informaes potencialmente importantes.
Uma caracterstica essencial dos dados de sries de tempo que torna mais difcil a anlise do que
os dados de corte transversal o fato de que raramente possvel assumir (se que possvel) que as
observaes econmicas so independentes ao longo do tempo. A maioria das sries de tempo econmicas, bem como de outras sries de tempo, est relacionada muitas vezes fortemente relacionada
com seus histricos recentes. Por exemplo, saber algo sobre o produto interno bruto do ltimo trimestre nos diz muito sobre a provvel variao do PIB durante este trimestre, visto que o PIB tende
a permanecer razoavelmente estvel de um trimestre para o prximo. Embora muitos procedimentos
economtricos possam ser usados tanto com dados de corte transversal como com dados de sries de
tempo, outros pontos podem ser considerados para especificar, apropriadamente, os modelos economtricos que usam dados de sries de tempo. Alm disso, as modificaes e embelezamentos das tcnicas economtricas comuns foram desenvolvidas com a finalidade de considerar e explorar a natureza dependente das sries de tempo e para tratar de outras questes, tal como o fato de que algumas
variveis econmicas tendem a exibir claras tendncias ao longo do tempo.
Outra caracterstica dos dados de sries de tempo que pode requerer ateno especial a freqncia dos dados, na qual eles so coletados. Em economia, as freqncias mais comuns so: diria, semanal,
mensal, trimestral e anual. Os preos de aes so registrados em intervalos dirios (excluindo sbados e
domingos). A oferta de moeda na economia dos Estados Unidos informada semanalmente. Muitas sries
macroeconmicas so tabuladas mensalmente, incluindo as taxas de inflao e desemprego. Outras
sries macroeconmicas so registradas menos freqentemente, como a cada trs meses (todo trimestre).
O produto interno bruto um exemplo importante de uma srie trimestral. Outras sries de tempo, como
as taxas de mortalidade infantil dos estados norte-americanos, esto disponveis somente em bases anuais.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

Muitas sries de tempo econmicas, sejam semanais, mensais ou trimestrais, exibem um forte
padro sazonal, o qual pode ser um importante fator na anlise de sries de tempo. Por exemplo, dados
mensais sobre o incio da construo de moradias se diferenciam entre os meses simplesmente devido a
mudanas das condies climticas. Aprenderemos como trabalhar com sries de tempo no Captulo 10.
A Tabela 1.3 contm um conjunto de dados de sries de tempo, obtido de um artigo de CastilloFreeman e Freeman (1992), sobre os efeitos do salrio mnimo em Porto Rico. O ano mais antigo no
conjunto de dados a primeira observao, e o ano mais recente disponvel a ltima observao.
Quando os mtodos economtricos so utilizados para analisar dados de sries de tempo, os dados
devem ser armazenados em ordem cronolgica.
Tabela 1.3
Salrio Mnimo, Desemprego e Dados Relacionados para Porto Rico

nobsa

ano

minmed

cobmed

desemp

pnb

1950

0,20

20,1

15,4

878,7

1951

0,21

20,7

16,0

925,0

1952

0,23

22,6

14,8

1.015,9

37

1986

3,35

58,1

18,9

4.281,6

38

1987

3,35

58,2

16,8

4.496,7

A varivel minmed se refere ao salrio mnimo mdio no ano, cobmed a taxa de cobertura mdia
(o percentual de trabalhadores cobertos pela lei de salrio mnimo), desemp a taxa de desemprego e
pnb o produto nacional bruto. Usaremos esses dados mais adiante em uma anlise de sries de tempo
do efeito do salrio mnimo sobre o emprego.

Cortes Transversais Agrupados


Alguns conjuntos de dados tm tanto caractersticas de corte transversal quanto de sries de tempo. Por
exemplo, suponha que dois estudos sobre famlias sejam realizados nos Estados Unidos com dados de
corte transversal, um em 1985 e outro em 1990. Em 1985, uma amostra aleatria de famlias pesquisada para variveis tais como renda, poupana, tamanho da famlia, e assim por diante. Em 1990, uma nova
amostra aleatria de famlias extrada usando as mesmas questes da pesquisa. A fim de aumentar nosso
tamanho de amostra, podemos formar um corte transversal agrupado ao combinar os dois anos.
Agrupar cortes transversais de diferentes anos , freqentemente, um modo eficaz de analisar os
efeitos de uma nova poltica de governo. A idia coletar dados de anos anteriores e posteriores a uma
importante mudana de poltica governamental. Como exemplo, considere o seguinte conjunto de
dados sobre os preos da moradia coletados em 1993 e 1995 nos Estados Unidos, quando houve uma
reduo nos impostos sobre a propriedade em 1994. Suponha que tenhamos dados sobre 250 residncias para 1993 e sobre 270 para 1995. Um modo de armazenar tais dados apresentado na Tabela 1.4.

10

Introduo Econometria Editora Thomson

Tabela 1.4
Cortes-Transversais Agrupados: Dois Anos de Preos de Moradias

nobsm

ano

preoc

imppro

arquad

qtdorm

banhos

1993

85.500

42

1.600

2,0

1993

67.300

36

1.440

2,5

1993

134.000

38

2.000

2,5

250

1993

243.600

41

2.600

3,0

251

1995

65.000

16

1.250

1,0

252

1995

182.400

20

2.200

2,0

253

1995

97.500

15

1.540

2,0

520

1995

57.200

16

1.100

1,5

As observaes 1 a 250 correspondem s residncias vendidas em 1993, e as observaes 251 a


520 correspondem s 270 residncias vendidas em 1995. Embora a ordem na qual armazenamos os
dados no se revele crucial, no se esquea de que o ano de cada observao , geralmente, muito
importante. Essa a razo de introduzirmos ano como uma varivel separada.
A anlise de um corte transversal agrupado muito parecida com a de um corte transversal padro,
exceto pelo fato de que precisamos, freqentemente, considerar diferenas peridicas das variveis ao
longo do tempo. De fato, alm de aumentar o tamanho da amostra, a caracterstica de uma anlise de corte
transversal agrupada , freqentemente, ver como uma relao fundamental mudou ao longo do tempo.

Dados de Painel ou Longitudinais


Um conjunto de dados de painel (ou dados longitudinais) consiste em uma srie de tempo para cada
membro do corte transversal do conjunto de dados. Como exemplo, suponha que tenhamos o histrico de salrio, educao e emprego para um conjunto de indivduos ao longo de um perodo de dez anos,
ou que possamos coletar informaes, tais como dados de investimento e financeiros, sobre o mesmo
conjunto de empresas ao longo de um perodo de cinco anos. Dados de painel tambm podem ser coletados para unidades geogrficas. Por exemplo, podemos coletar dados para o mesmo conjunto de municpios dos Estados Unidos sobre fluxos de imigrao, impostos, taxas de salrios, gastos governamentais etc., para os anos de 1980, 1985 e 1990.

Wooldridge

Captulo 1

A Natureza da Econometria e dos Dados Econmicos

11

A caracterstica essencial dos dados de painel que os distingue dos dados de corte transversal
agrupado o fato de que as mesmas unidades do corte transversal (indivduos, empresas ou municpios
nos exemplos anteriores) so acompanhadas ao longo de um determinado perodo. Os dados na Tabela
1.4 no so considerados um conjunto de dados de painel porque as residncias vendidas so provavelmente diferentes em 1993 e 1995; se houver quaisquer repeties, o nmero provavelmente bem
pequeno para ser significante. Em contraste, a Tabela 1.5 contm um conjunto de dados de painel de
dois anos sobre o crime e as estatsticas relacionadas para 150 cidades nos Estados Unidos.
H vrias caractersticas interessantes na Tabela 1.5. Primeiro, a cada cidade foi dado um nmero de 1 a 150. Qual cidade decidimos chamar de cidade 1, cidade 2, e assim por diante, irrelevante.
Assim como em um corte transversal puro, a ordenao no corte transversal de um conjunto de dados
de painel no importante. Poderamos usar o nome da cidade em lugar de um nmero, mas freqentemente til ter ambos.
Tabela 1.5
Conjunto de Dados de Painel sobre Estatsticas de Crime nas Cidades para Dois Anos

nobsc

cidade

ano

homicds

populao

desemp

polcia

1986

350.000

8,7

440

1990

359.200

7,2

471

1986

64.300

5,4

75

1990

65.100

5,5

75

297

149

1986

10

260.700

9,6

286

298

149

1990

245.000

9,8

334

299

150

1986

25

543.000

4,3

520

300

150

1990

32

546.200

5,2

493

Um segundo ponto que os dois anos dos dados para a cidade 1 preenchem as duas primeiras
linhas ou observaes. As observaes 3 e 4 correspondem cidade 2, e assim por diante. Como cada
uma das 150 cidades tem duas linhas de dados, qualquer pacote economtrico ver isso como 300
observaes. Esse conjunto de dados pode ser tratado como um corte transversal agrupado, em que as
mesmas cidades aparecem em cada ano. Porm, como veremos nos Captulos 13 e 14, podemos tambm usar a estrutura de painel para responder a questes que no podem ser respondidas simplesmente vendo isso como um corte transversal agrupado.
Ao organizar as observaes na Tabela 1.5, colocamos os dois anos dos dados de cada cidade um
ao lado do outro, com o primeiro ano antecedendo o segundo em todos os casos. Apenas por questes
prticas, esse o modo preferido de se ordenar conjuntos de dados de painel. Essa organizao contrasta com o modo pelo qual os cortes transversais agrupados so armazenados na Tabela 1.4. Em resu-

12

Introduo Econometria Editora Thomson

mo, a razo para ordenar os dados de painel como na Tabela 1.5 que precisaremos fazer transformaes dos dados para cada cidade nos dois anos.
Como os dados de painel requerem a repetio das mesmas unidades ao longo do tempo, os conjuntos de dados de painel, especialmente aqueles sobre indivduos, famlias e empresas, so mais difceis de se obter que os cortes transversais agrupados. No surpreendentemente, observar as mesmas
unidades ao longo do tempo traz vrias vantagens sobre os dados de corte transversal ou mesmo sobre
os de dados de cortes transversais agrupados. O benefcio que salientaremos neste livro que ter mltiplas observaes sobre as mesmas unidades nos permite controlar certas caractersticas no observveis dos indivduos, firmas etc. Como veremos, o uso de mais de uma observao pode facilitar a
inferncia causal em situaes em que inferir causalidade seria muito difcil se somente um nico
corte transversal estivesse disponvel. Uma segunda vantagem dos dados de painel que eles, freqentemente, nos permitem estudar a importncia das defasagens do comportamento ou o resultado
de tomar decises. Essa informao pode ser importante, visto que se pode esperar o impacto em muitas polticas pblicas somente aps algum tempo.
A maior parte dos livros para cursos de nvel superior no contm uma discusso de mtodos economtricos para dados de painel. Entretanto, os economistas agora reconhecem que algumas questes
so difceis, se no impossveis, de serem respondidas satisfatoriamente sem dados de painel. Como
voc ver, podemos fazer considerveis progressos com anlises simples de dados de painel, um mtodo que no muito mais difcil do que trabalhar com um conjunto de dados de corte transversal padro.

Um Comentrio sobre Estruturas de Dados


A Parte 1 deste livro cobre a anlise de dados de corte transversal, j que ela prope menos conceitos
e dificuldades tcnicas. Ao mesmo tempo, ela ilustra muitos dos temas essenciais da anlise economtrica. Usaremos os mtodos e as idias da anlise de corte transversal no restante do texto.
Embora a anlise economtrica de sries de tempo use muitas das mesmas ferramentas que a
anlise de corte transversal, ela mais complicada devido existncia de tendncia que traduz a
natureza altamente persistente de muitas sries de tempo econmicas. Acredita-se que agora so
considerados falhos muitos exemplos que tm sido tradicionalmente usados para ilustrar a maneira pela qual os mtodos economtricos podem ser aplicados a dados de sries de tempo. Faz pouco
sentido usar tais exemplos inicialmente, visto que esse hbito somente refora uma prtica economtrica insatisfatria. Portanto, postergaremos o tratamento da econometria de sries de tempo at
a Parte 2, quando questes importantes concernentes a tendncia, persistncia, dinmica e sazonalidade sero introduzidas.
Na Parte 3, trataremos explicitamente de cortes transversais agrupados e dados de painel. A anlise de cortes transversais independentemente agrupados e a anlise simples de dados de painel so
ambas independentemente, extenses claras e diretas da anlise pura de corte transversal. Entretanto,
vamos esperar at o Captulo 13 para tratar desses tpicos.

1.4 A CAUSALIDADE E A NOO DE CETERIS PARIBUS NA


ANLISE ECONOMTRICA
Em muitos testes de teoria econmica, e certamente para avaliar polticas pblicas, o objetivo do economista inferir que uma varivel (tal como a educao) tem um efeito causal sobre outra varivel
(tal como a produtividade do trabalhador). Encontrar simplesmente uma associao entre duas ou
mais variveis pode ser sugestivo, mas, a no ser que se possa estabelecer uma causalidade, raramente ela convincente.

Você também pode gostar