Escolar Documentos
Profissional Documentos
Cultura Documentos
Campina Grande
2012
Sumrio
1 Introduo
1.1 O que econometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Caractersticas dos dados econmicos . . . . . . . . . . . . . . . . . . . .
1.3 Fonte dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Introduo ao Gretl
2.1 Instalao . . . . . . . . . .
2.2 Entrada de dados . . . . . .
2.3 Importao de dados . . . .
2.4 Anlise dos dados . . . . . .
2.4.1 Estatstica descritiva
2.4.2 Correlao . . . . . .
2.4.3 Exerccio prtico . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
4
4
6
6
6
9
10
10
13
16
31
ii
Lista de Figuras
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
8
8
8
9
9
9
10
11
11
14
14
3.1
3.2
19
20
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Lista de Tabelas
2.1
2.2
2.3
Dados hipotticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Valores do coeficiente de correlao e qualificao da correlao. . . . . .
Dados para exerccio prtico . . . . . . . . . . . . . . . . . . . . . . . . .
15
16
17
3.1
3.2
19
21
4.1
28
29
4.2
iv
1 Introduo
O presente texto rene notas de aula da disciplina Econometria I, ministrada no curso
de Cincias Econmicas da Universidade Federal de Campina Grande. Voltado no s
para os alunos que se matriculam nesta disciplina, mas tambm para qualquer pessoa
interessada em aprender a interpretar dados estatsticos sobre a realidade econmica
do Brasil e internacional. A ferramenta bsica um modelo economtrico que alia
fundamentos da teoria econmica com a tcnica estatstica da anlise de regresso. O
modelo explica o comportamento de uma ou diversas variveis econmicas.
O curso tem um carter eminentemente aplicado, onde exemplos prticos servem para
introduzir conceitos de anlise emprica e economtrica. Um aspecto importante do
curso que os alunos so treinados no uso de um software economtrico: o pacote
economtrico Gretl, que usa licena open source e que vem sendo adotado nos principais
centros de ensino e laboratrios de econometria do mundo.
No h pretenso de substituir os manuais consagrados de econometria, mas servir de
auxiliar ao processo de aprendizagem. Os exemplos sero resolvidos passo-a-passo com
o pacote economtrico referido acima.
(1.1)
2 Introduo ao Gretl
2.1 Instalao
O software Gretl 1 gratuito e est disponvel no site oficial em portugus http://
gretl.sourceforge.net/gretl_portugues.html. A verso para instalao no sistema
operacional Windows est no link http://gretl.sourceforge.net/win32/index_pt.
html. Baixar o arquivo gretl_install.exe. Para executar o arquivo de instalao
basta clicar duas vezes com o boto esquerdo do mouse sobre este arquivo.
Grande parte do software est em portugus do Brasil, mas ainda h muitas pginas
de ajuda em ingls. um projeto colaborativo e aos poucos essas lacunas vo sendo
preenchidas pela colaborao voluntria 2 .
Depois de instalado o programa aparecer na rea de trabalho um cone com o desenho de uma figura feminina, uma camponesa. Clicando duas vezes neste cone com o
mouse ou seguindo a seqencia na barra de comandos do Windows Iniciar > Todos os
programas > gretl > gretl, ser iniciado o programa apresentando a janela reproduzida na Figura 2.1. Como ainda no foi carregado nenhum arquivo de dados apenas as
opes de menu esto disponveis Arquivo e Ferramentas, as demais opes aparecem
em cinza indicando que no esto disponveis.
Gretl um acrnimo para Gnu Regression, Econometrics and Time-series Library. Trata-se de uma
biblioteca de funes estatsticas e economtricas para anlise de regresso e de sries temporais.
Segundo Adkins(2007), de fcil uso e razoavelmente poderoso.
2
Para se informar sobre os aspectos de colaborao e voluntariado na comunidade de software aberto
o leitor poder comear pelo link http://pt.wikipedia.org/wiki/Software_livre.
10
seqncia de comandos utilizando o mouse: Arquivo > Abrir dados > Importar >
Excel. Abre-se uma janela onde o usurio deve informar o caminho da planilha que
contm os dados para anlise. O software solicita a confirmao da estrutura de dados,
no caso Corte transversal.
11
n
1X
Xi
n i=1
N
1 X
(xi x)2
N 1 i=1
var(X)
A varincia e o desvio padro tero valor zero quando todos os dados de uma varivel
assumirem o mesmo valor. Assim, quanto mais prximo de zero indica que o conjunto
de valores bastante concentrado e homogneo.
A outra medida de disperso informada pelo Gretl o coeficiente de variao (C.V.).
Relaciona o desvio padro com a mdia e se define como
dp(X)
X
O coeficiente de variao comumente expresso como uma percentagem, assim devese multiplicar por 100 o valor informado pelo Gretl. A disperso dos dados ser tanto
maior quanto o valor do C.V. se aproxime de 1 ou de 100%.
As duas ltimas medidas fornecidas pelo Gretl informam a respeito da forma da distribuio: Enviesamento (assimetria) e Curtose Ex (excesso de curtose). Uma distribuio
dita assimtrica se no simtrica em relao mdia. Segundo Merrill e Fox (op.
C.V. =
12
1
n
Pn
i=1 (Xi
s3
3
X)
onde s3 o cubo do desvio padro. Para uma distribuio simtrica, 3 zero. Valores positivos de 3 indicam que a distribuio positivamente assimtrica, ou seja,
seu grfico (histograma) apresenta uma longa cauda direita. Para valores negativos,
apresentar uma cauda longa esquerda.
O coeficiente de curtose a medida de achatamento da distribuio. A medida da
curtose fornecida pelo clculo de 4 , definido como
4 =
1
n
Pn
i=1 (Xi
s4
4
X)
2.4.2 Correlao
Um tpico importante na anlise de variveis scio-econmicas diz respeito ao grau
de associao entre elas. A resposta fornecida pelo clculo do coeficiente de correlao
que informa o grau de associao, mas no pode ser usado para determinar a existncia
13
14
Y
0, 3730 X
1, 0000 Y
15
16
17
(3.1)
18
(3.2)
19
pais significativa para explicar a mdia de notas dos alunos efetua-se a verificao do
intervalo de confiana dos parmetros e o teste da nulidade H0 : 1 = 0.
Significncia dos parmetros
Para se obter os intervalos de confiana no Gretl, ativar a janela de resultados Modelo
1 e clicar no menu Anlise -> Intervalos de confiana para os coeficientes.
Surgir a janela da figura 3.2.
20
0,01
Muito significativo
0,05
Significativo
0,10
Pouco significativo
21
Qualidade do ajustamento
Conforme Pindyck e Rubinfeld(op.cit), uma boa regresso aquela que ajuda a explicar uma grande proporo da varincia de Y . A medida desse grau de explicao
dada pelo R2 ou R-quadrado. O R2 d a proporo da variao total de Y explicada pela
regresso de Y contra X. Varia entre 0 e 1 e normalmente se interpreta em porcentagem.
Se R2 ' 0 indica um ajuste fraco, mas ao contrrio, quanto mais prximo de 1 melhor
ser o ajuste. O caso de R2 = 1 ocorre apenas quando todos os pontos esto sobre a
linha de regresso. Na Figura 3.1, o valor de R-quadrado 0,782407 ou 78,24% o que
indica um bom ajuste, ou seja que a renda dos pais ajuda a explicar 78% da variao
nas mdias de notas da amostra de 8 pessoas. Mas Wooldridge (op.cit) adverte que um
R-quadrado aparentemente baixo no significa, necessariamente, que uma equao de
regresso de MQO intil. (...) usar o R-quadrado como o principal padro de medida
de sucesso de uma anlise economtrica pode levar a confuses.
Resumindo os resultados da regresso
Os resultados da estimao do modelo de regresso podem ser apresentados de forma
resumida na forma de uma equao de regresso ajustada
b = 1, 37500 + 0, 120370 X
Y
(0,36878)
(0,025915)
T = 8 R = 0, 7461
(erros padro entre parnteses)
Intervalo de confiana da previso
Aps a obteno do modelo estimado e da verificao do seu alcance explicativo atravs
dos testes de hiptese, pode-se utilizar a equao estimada para realizar previses de
Y para dado X. Porm assim como os valores estimados de 0 e 1 tm um intervalo
de confiana, o valor previsto yb0 para um dado x0 no observado, mas com valor no
muito distante de X, tambm tem um intervalo de confiana. Para isto ser necessrio
conhecer o desvio padro da previso dado pela equao 3.3(Hill et.al.)
dp(f ) =
v "
u
u
t
2 1 +
1
(x0 x)2
+P
(xt x)2
T
(3.3)
(3.4)
Para o modelo de mdia de notas em funo da renda dos pais, considere-se a equao
estimada
Yb = 1, 375 + 0, 12X
22
2
+ (x0 x)2 var(b
2)
(3.5)
T
Antes de apresentar o cdigo sugerido deve-se informar o leitor que o software Gretl
tem mais de um ambiente de operao. O ambiente at agora comentado chamado
de ambiente grfico ou interface grfica com o usurio (sigla GUI em ingls), onde a
interao realizada atravs de menus acionados com cliques do mouse. Outros dois
ambientes esto disponveis. Um chamado de console e acionado clicando com o
mouse no terceiro cone , da esquerda para a direita, na barra inferior de comandos na
janela principal do Gretl. O console tambm acionado digitando o comando gretlcli
seguido de Enter na janela do DOS do Windows, que est em Iniciar - Programas Acessrios.
No console os comandos so digitados informando parmetros e variveis de sada. O
outro ambiente no tem um nome mas acionado clicando com o mouse no segundo
cone, antes do cone do console. Seu cone parecido com o Bloco de Notas do Windows,
uma folha e um lpis. Neste ambiente os comandos so digitados em uma seqncia e
depois so todos executados de uma vez clicando-se no cone com o desenho de uma
roda dentada, na barra de menus da janela.
Ao executar um modelo, em qualquer dos ambientes, o Gretl salva os resultados de
alguns clculos em variveis do sistema. Assim, os valores estimados dos coeficientes da
regresso so salvos na varivel $coeff. Ento para acessar o valor estimado do coeficiente da constante digita-se no console o comando adequado informando o parmetro
$coeff(const). A soma dos quadrados dos resduos salva na varivel $ess. Os graus
de liberdade e o nmero de observaes esto nas variveis $df e $nobs. Para computar
x utiliza-se a funo interna mean(x) e para se obter o valor crtico de uma distribuio
a funo critical.
Abaixo o cdigo sugerido seguido de comentrios.
var(f
)=
2 +
ols Y const X
genr yhat0 = $coeff(const)+$coeff(X)*20
genr sig2 = $ess/$df
genr f = sig2 + sig2/$nobs + ((20 - mean(X))^2)*($stderr(X)^2)
genr l_inf = yhat0 - critical(t,$df,0.025)*sqrt(f)
genr l_sup = yhat0 + critical(t,$df,0.025)*sqrt(f)
Comentrio do cdigo:
23
1. Na primeira linha o comando ols informa que o mtodo dos mnimos quadrados
ordinrios ser utilizado para estimar a equao de regresso de Y em X 1 . A
partcula const instrui que a reta tem um intercepto.
2. Na segunda linha feito o clculo do Y previsto com o valor de X = 20 utilizandose dos valores estimados dos coeficientes salvos nas variveis $coeff(const) para
0 e $coeff(X) para 1 . O valor previsto ser salvo na varivel yhat0.
3. Na terceira linha gerado o
2 da equao 3.5. Que o resultado da diviso
da Soma resid. quadrados informada na janela de resultados do modelo (salvo
na varivel $ess) pelos graus de liberdade do modelo nmero de observaes
menos o nmero de parmetros salvo na varivel $df.
4. Na quarta linha calculada a var(f
). Descrevendo: $nobs o nmero de observaes da amostra; mean(X) calcula a mdia da varivel X;e ($stderr(X)^2)
calcula o erro padro de 1 , o coeficiente de X.
5. Na quinta linha calculado o limite inferior do intervalo de previso,salvo na
varivel l_inf. Aqui usado o comando critical: critical(t, $ df,0.025)
d o valor crtico da distribuio t com graus de liberdade salvo na varivel $df
com o = 0, 05/2 = 0, 025; sqrt(f) a raiz quadrada do f calculado na quarta
linha.
6. Na ltima linha do cdigo calculado o limite superior do intervalo de previso,
salvo an varivel l_sup.
Ento o valor previsto da mdia para X = 20 yhat0=3,7824 com o seguinte intervalo
de predio, considerando o nvel = 0, 05 de confiana: valor mnimo da mdia igual
l_inf=2,832 e valor mximo da mdia igual a l_sup=4,723 ou [2.832, 4.723].
24
25
(4.1)
26
(4.2)
(4.3)
= 6, 0696
d
RT
(4.4)
27
Tabela 4.1: Observaes semanais sobre receitas, preo e gastos com propaganda para
a cadeia de lanchonetes
Semana
RT
p
a Semana
RT
p
a
1 123.10 1.92 12.40
27 124.20 2.12 8.80
2 124.30 2.15 9.90
28 98.40 2.13 3.20
3 89.30 1.67 2.40
29 114.80 1.89 5.40
4 141.30 1.68 13.80
30 142.50 1.50 17.30
5 112.80 1.75 3.50
31 122.60 1.93 11.20
6 108.10 1.55 1.80
32 127.70 2.27 11.20
7 143.90 1.54 17.80
33 113.00 1.66 7.90
8 124.20 2.10 9.80
34 144.20 1.73 17.00
9 110.10 2.44 8.30
35 109.20 1.59 3.30
10 111.70 2.47 9.80
36 106.80 2.29 7.10
11 123.80 1.86 12.60
37 145.00 1.86 15.30
12 123.50 1.93 11.50
38 124.00 1.91 12.70
13 110.20 2.47 7.40
39 106.70 2.34 6.10
14 100.90 2.11 6.10
40 153.20 2.13 19.60
15 123.30 2.10 9.50
41 120.10 2.05 6.30
16 115.70 1.73 8.80
42 119.30 1.89 9.00
17 116.60 1.86 4.90
43 150.60 2.12 18.70
18 153.50 2.19 18.80
44 92.20 1.87 2.20
19 149.20 1.90 18.90
45 130.50 2.09 16.00
20 89.00 1.67 2.30
46 112.50 1.76 4.50
21 132.60 2.43 14.10
47 111.80 1.77 4.30
22 97.50 2.13 2.90
48 120.10 1.94 9.30
23 106.10 2.33 5.90
49 107.40 2.37 8.30
24 115.30 1.75 7.60
50 128.60 2.10 15.40
25 98.50 2.05 5.30
51 124.60 2.29 9.20
26 135.10 2.35 16.80
52 127.20 2.36 10.20
Fonte: Hill et.al. ( op. cit)
A medida do grau de ajuste da regresso informada pelo R-quadrado (R2 ) agora
tem de ser complementada pelo R-quadrado ajustado. A explicao, segundo Hill
et.al.(op.cit.)
Uma dificuldade com R2 que seu valor pode ser aumentado adicionandose cada vez mais variveis, mesmo que essas variveis no tenham qualquer
justificativa econmica.(...) Os programas de regresso para computador
frequentemente apresentam uma medida alternativa de aderncia, chamada
2
R2 ajustado, em geral simbolizada por R
28
const
p
a
Coeficiente
Erro Padro
razo-t
104,786
6,64193
2,98430
6,48272
3,19119
0,166936
16,1638 0,0000
2,0813 0,0427
17,8769 0,0000
120,3231
1805,168
0,867085
159,8280
166,0111
343,8759
p-valor
29
nela principal do Gretl. Assim, clicando em Ferramentas, Tabelas estatsticas e selecionando a aba F preenchemos as informaes solicitadas: gl(numerador), digitamos
2; gl(denominador), digitamos 49; e probabilidade da cauda direita, digitamos
0,05. Ento clicando em OK, aparece a janela com o resultado: Valor crtico = 3,18658.
Desta forma, a hiptese nula rejeitada no modelo 1, concluindo-se que a relao estimada significativa. mesma concluso chegamos observando o valor da estatstica
P-valor(F ) =3,37e-22. O nmero 3,37 vezes 1022 , ou 0.000000000000000000000337,
muito menor do que 0, 05, implicando na rejeio da hiptese nula.
30
Referncias
ADKINS, L. C. Using gretl for Principles of Econometrics. 3rd Edition, Version 1.3131,
2010. Disponvel em : http://www.learneconometrics.com/gretl/. Acessado em :28
de setembro de 2011.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica bsica. 5. ed. So Paulo: Saraiva,
2005.
COTTRELL, A.; LUCCHETTI, R. Gretl Users Guide. Disponvel em: http://gretl.
sourceforge.net/gretl_portugues.html. Acessado em: 15/02/2011.
FRANSES, P. H. A concise introduction to econometrics: an intuitive guide. CambridgeUK : Cambridge University Press, 2002.
HILL, R. C.; GRIFFITHS, W. E.; JUDGE, G. G. Econometria. So Paulo:Saraiva,
1999.
HOFFMAN, R. Estatstca para economistas. So Paulo: Pioneira, 1980.
LEVIN, J. Estatstica aplicada a cincias humanas. 2. ed. So Paulo: Harbra, 1987.
KEYNES, J. M. A teoria geral do emprego, do juro e da moeda. 2. ed. So Paulo:
Nova Cultural, 1985.
KLEIN, L. R. Introduo econometria. So Paulo: Atlas, 1978.
MERRIL, W. C.; FOX, K. A. Estatstica econmica: uma introduo. So Paulo: Atlas,
1980.
PINDYCK, R. S.; RUBINFELD, D. L. Econometria: modelos e previses. Rio de Janeiro: Elsevier, 2004.
WOOLDRIDGE, J. M. Introduo Econometria: uma abordagem moderna. So Paulo:
Thomson Pioneira, 2006.
31