Você está na página 1de 35

Noes de Econometria

Tutorial com aplicao do software Gretl.

Carlos Antnio Soares de Andrade


Professor de Economia da
Universidade Federal de Campina Grande

Campina Grande

2012

Sumrio
1 Introduo
1.1 O que econometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Caractersticas dos dados econmicos . . . . . . . . . . . . . . . . . . . .
1.3 Fonte dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Introduo ao Gretl
2.1 Instalao . . . . . . . . . .
2.2 Entrada de dados . . . . . .
2.3 Importao de dados . . . .
2.4 Anlise dos dados . . . . . .
2.4.1 Estatstica descritiva
2.4.2 Correlao . . . . . .
2.4.3 Exerccio prtico . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

1
1
4
4
6
6
6
9
10
10
13
16

3 Regresso linear simples


18
3.1 Uma aplicao no Gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.1 Diagnstico da regresso . . . . . . . . . . . . . . . . . . . . . . . 19
3.1.2 Exerccio prtico . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4 Regresso linear mltipla
26
4.1 Estimao de mnimos quadrados ordinrios utilizando Gretl . . . . . . . 27
4.2 Anlise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2.1 Teste de significncia do modelo . . . . . . . . . . . . . . . . . . . 29
Referncias Bibliogrficas

31

ii

Lista de Figuras
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13

Tela inicial do Gretl . . . . . . . . . . . . . . . . . .


Menu Arquivo do Gretl . . . . . . . . . . . . . . . .
Selecionando a entrada manual de dados . . . . . .
Janela para informar nmero de observaes . . . .
Janela para informar a estrutura dos dados . . . . .
Tela para confirmao da estrutura de dados. . . .
Tela para informar o nome da primeira varivel . .
Tela de insero dos dados . . . . . . . . . . . . . .
Seqencia para importao de dados . . . . . . . .
Dados da Companhia MB importados para o Gretl
Estatsticas descritivas da varivel salrio . . . . . .
Histograma da varivel salrio . . . . . . . . . . . .
Diagrama de caixa com as variveis salrio e idade.

.
.
.
.
.
.
.
.
.
.
.
.
.

7
7
8
8
8
9
9
9
10
11
11
14
14

3.1
3.2

Resultados do Modelo de Mnimos Quadrados Ordinrios. . . . . . . . .


Intervalos de confiana para os coeficientes. . . . . . . . . . . . . . . . . .

19
20

iii

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

Lista de Tabelas
2.1
2.2
2.3

Dados hipotticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Valores do coeficiente de correlao e qualificao da correlao. . . . . .
Dados para exerccio prtico . . . . . . . . . . . . . . . . . . . . . . . . .

15
16
17

3.1
3.2

Mdia de notas escolares e renda familiar . . . . . . . . . . . . . . . . . .


Esquema de asteriscos e nveis de significncia no Gretl. . . . . . . . . . .

19
21

4.1

Observaes semanais sobre receitas, preo e gastos com propaganda para


a cadeia de lanchonetes . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultado da regresso do modelo da cadeia de lanchonetes . . . . . . . .

28
29

4.2

iv

1 Introduo
O presente texto rene notas de aula da disciplina Econometria I, ministrada no curso
de Cincias Econmicas da Universidade Federal de Campina Grande. Voltado no s
para os alunos que se matriculam nesta disciplina, mas tambm para qualquer pessoa
interessada em aprender a interpretar dados estatsticos sobre a realidade econmica
do Brasil e internacional. A ferramenta bsica um modelo economtrico que alia
fundamentos da teoria econmica com a tcnica estatstica da anlise de regresso. O
modelo explica o comportamento de uma ou diversas variveis econmicas.
O curso tem um carter eminentemente aplicado, onde exemplos prticos servem para
introduzir conceitos de anlise emprica e economtrica. Um aspecto importante do
curso que os alunos so treinados no uso de um software economtrico: o pacote
economtrico Gretl, que usa licena open source e que vem sendo adotado nos principais
centros de ensino e laboratrios de econometria do mundo.
No h pretenso de substituir os manuais consagrados de econometria, mas servir de
auxiliar ao processo de aprendizagem. Os exemplos sero resolvidos passo-a-passo com
o pacote economtrico referido acima.

1.1 O que econometria


Segundo o prmio Nobel de Economia, Lawrence Klein (1978)
O principal objetivo da econometria dar contedo emprico ao raciocnio
econmico apriorstico. Este raciocnio apriorstico composto, principalmente, pelo que chamamos de teoria econmica. Mas podem servir tambm
como estrutura e objeto da anlise econmica as descries gerais no quantitativas das instituies econmicas e seu funcionamento inter-relacionado,
desde que as proposies apriorsticas possam ser colocadas em forma matemtica.
Conforme o economista Jeffrey M. Wooldridge(2006),
A econometria baseada no desenvolvimento de mtodos estatsticos para
estimar relaes econmicas, testar teorias, avaliar e implementar polticas de
governo e de negcios. A aplicao mais comum da econometria a previso
de importantes variveis macroeconmicas, tais como taxas de juros, taxas de
inflao e produto interno bruto (PIB). Ainda que as previses de indicadores
econmicos sejam bastante visveis e, muitas vezes, extensamente publicadas,
os mtodos economtricos podem ser usados em reas econmicas que no
tm nada a ver com previses macroeconmicas.

A econometria tem sido usada em campos de estudo da cincia poltica (efeitos de


gastos em campanhas polticas sobre os resultados de eleies), da educao (efeito de
gastos pblicos com escolas sobre o desempenho de estudantes) e outros. ,portanto, a
combinao de teoria econmica, estatstica e, nos dias atuais, cincia da computao.
A teoria econmica proporciona a base para identificar as variveis econmicas importantes. Para se estruturar uma anlise econmica emprica, o primeiro passo a
formulao cuidadosa da questo de interesse, segundo Wooldridge (op. cit).
A questo de interesse ou problema pode se referir a um aspecto da teoria para ser
testado ou os efeitos de uma poltica governamental. Os mtodos economtricos podem
ser aplicados para responder a uma gama de questes.
Um estudo de economia aplicada segue um fluxo de tarefas constitudas das seguintes
etapas: formulao do problema, coleta de dados, especificao do modelo economtrico,
estimao dos parmetros desconhecidos do modelo, diagnstico do modelo estimado,
re-especificao do modelo se necessrio e, por fim, aplicao do modelo.
Formulao do problema. A formulao do problema muito importante para a
especificao do modelo economtrico: definio das variveis dependente e independente, forma funcional do relacionamento entre estas variveis e quantidade e
disponibilidade dos dados para a anlise.
Na opinio do professor Philip Hans Franses (2002), a econometria no se restringe
a validar ou testar teorias. O econometrista tambm pode descobrir novas regularidades estatsticas de dados econmicos. Na tarefa de validar ou no uma teoria,
os dados disponveis podem no permitir rejeitar a hiptese. A teoria econmica
frequentemente se refere ao longo prazo, contudo focar no curto-prazo pode ser
mais frutfero. Para a questo so os carros mdios igualmente caros no Japo
e nos Estados Unidos, aps o ajuste da taxa de cmbio ente esses dois pases?,
parece ser uma formulao melhor do que a hiptese da paridade do poder de
compra permanece para o Japo e os EUA?.
Coleta dos dados. Nesta etapa alguns cuidados so necessrios. Concentrar-se
em coletar dados estatsticos relevantes para a soluo da questo de interesse.
Atentar para o fato de que diferentes definies embasam a coleta e publicao de
dados por diferentes instituies pblicas e privadas como IBGE, FIESP, FGV,
IPEA, e outras. H problemas tambm concernentes disponibilidade dos dados:
dados faltantes, interrupo da srie de coleta, credibilidade da fonte.
Especificao do modelo economtrico. Esta etapa depende das duas anteriores.
Aps a reviso da teoria e da coleta dos dados relevantes questo de interesse,
passa-se declarao da hiptese de pesquisa e especificao matemtica e estatstica do modelo. Segundo Hill (1999), a teoria econmica no objetiva prever
o comportamento especfico de um indivduo ou firma, mas descreve o comportamento mdio ou sistemtico de muitos indivduos. Um exemplo a clssica
formulao de Keynes (1985) da relao entre consumo e renda:

A lei psicolgica fundamental em que podemos basear-nos com inteira


confiana, tanto a priori, partindo do nosso conhecimento da natureza
humana, como a partir dos detalhes dos ensinamentos da experincia,
consiste em que os homens esto dispostos, de modo geral e em mdia, a
aumentar o seu consumo medida que a sua renda cresce, embora no
em quantia igual ao aumento de sua renda
Embora Keynes no tenha especificado a relao funcional entre renda e consumo,
ficou estabelecida nos estudos economtricos a relao linear entre as duas variveis, como na equao
Y = 1 + 2 X + 

(1.1)

Onde Y a despesa de consumo, X a renda e 1 e 2 so os parmetros a serem


estimados, respectivamente, coeficiente de intercepto e coeficiente de inclinao.
O parmetro  o componente aleatrio, chamado tambm erro aleatrio. Esse
componente incorpora as demais variveis no consideradas na funo e outros
fatores.
Estimao dos parmetros do modelo.
A equao 1.1 acima um modelo economtrico cujos parmetros 1 e 2 , desconhecidos sero estimados por algum mtodo da estatstica matemtica. Dentre os
mais utilizados tem-se o mtodo da anlise de regresso e o mtodo dos mnimos
quadrados ordinrios. Dada a evoluo recente da econometria e a disponibilidade
de computadores para cada pesquisador individual, esta tarefa vem sendo realizada
com o auxlio dos softwares chamados pacotes estatsticos. Dentre eles o Gretl.
Diagnstico do modelo.
Uma vez especificado o modelo, e tendo os valores estimados dos parmetros o
momento de avaliar se o modelo coerente com os pressupostos tericos e a percepo do analista. Consiste esta etapa na aplicao de vrios testes de hipteses
sobre os parmetros estimados e no modelo completo, objetivando verificar se foi
bem especificado. Enfim, busca-se responder s questes: as variveis explicativas eram todas importantes? Utilizou-se a forma funcional correta? Qual o grau
de explicao do modelo? No se obtendo respostas satisfatrias, procede-se
mudana do modelo aproveitando o conhecimento obtido da primeira anlise.
Aplicao do modelo.
Chegando-se ao modelo mais adequado, depois de todos os testes e confrontos com
os pressupostos tericos,passa-se aplicao do modelo para tarefas de previso
ou avaliao dos efeitos de uma poltica.

1.2 Caractersticas dos dados econmicos


Diferentemente de estudos das reas das cincias exatas e naturais, onde os dados
para anlise so gerados em experimentos controlados em laboratrio, em economia e
na anlise emprica economtrica os dados so obtidos da observao dos fenmenos
econmicos e sociais, so dados no experimentais. Segundo Hill . et. al.(1999), a
maioria dos dados econmicos coletada para fins administrativos e no como objeto de
pesquisa.
Os dados econmicos podem ser quanto ao tipo dados quantitativos, quando assumem valores numricos sejam monetrios, volume, extenso e propores; ou dados
qualitativos quando assumirem valores expressos por atributos como sexo (masculino,
feminino), respostas binrias (sim e no ou 0 e 1).
Conforme Wooldridge(2006), quanto apresentao os dados podem corresponder s
seguintes estruturas:
Dados de corte transversal Consiste em uma amostra de indivduos, consumidores,
empresas, cidades, estados, pases ou uma variedade de outras unidades, tomada
em um determinado ponto no tempo. Ignoram-se quaisquer diferenas de tempo.
Dados de sries de tempo consiste em observaes sobre uma ou muitas variveis ao
longo do tempo. Normalmente referindo-se a cronologias como anos, trimestres,
meses e dias. So exemplos de sries temporais produto interno bruto, ndice de
preos ao consumidor e volume de vendas de automveis.
Cortes transversais agrupados uma combinao de dados de corte transversal e de
sries temporais. Um exemplo quando se utilizam duas amostra de dados da
PNAD (Pesquisa Nacional por Amostra de Domiclios),efetuada anualmente pelo
IBGE, uma para o ano de 2005 e outra para o ano de 2009. As mesmas variveis
so estudadas como renda, anos de estudo, condio do domiclio, etc. O detalhe
que os indivduos amostrados no so os mesmos.
Dados de painel ou longitudinais Consiste em uma srie de tempo para cada membro
do corte transversal do conjunto de dados. Como exemplo temos quando coletamos
dados de investimento e financeiros sobre um conjunto de empresas ao longo de
um perodo de cinco anos. Aqui as mesmas empresas so acompanhadas ao longo
de um determinado perodo.

1.3 Fonte dos dados


A compilao dos dados para um estudo economtrico uma tarefa crtica. Depende
da acessibilidade, da periodicidade em que so colocados disposio do pblico e do
formato de apresentao (impressos em relatrios ou boletins, gravados em meio digital
como arquivo de planilhas ou texto no formatado).
No Brasil, fontes de dados econmicos e sociais podem ser obtidos das pginas de
internet de instituies como o IBGE (http://www.ibge.gov.br), Banco Central do

Brasil (www.bcb.gov.br/) e do IPEA ( Instituto de Pesquisa Econmica Aplicada) que


mantm uma pgina de dados econmicos intitulada IPEADATA (www.ipeadata.gov.
br).
Alguns livros e manuais de economia (micro, macro, economia brasileira e economia
internacional) trazem tabelas com dados, mas para utiliz-los h o inconveniente de
manualmente inseri-los nas planilhas.

2 Introduo ao Gretl
2.1 Instalao
O software Gretl 1 gratuito e est disponvel no site oficial em portugus http://
gretl.sourceforge.net/gretl_portugues.html. A verso para instalao no sistema
operacional Windows est no link http://gretl.sourceforge.net/win32/index_pt.
html. Baixar o arquivo gretl_install.exe. Para executar o arquivo de instalao
basta clicar duas vezes com o boto esquerdo do mouse sobre este arquivo.
Grande parte do software est em portugus do Brasil, mas ainda h muitas pginas
de ajuda em ingls. um projeto colaborativo e aos poucos essas lacunas vo sendo
preenchidas pela colaborao voluntria 2 .
Depois de instalado o programa aparecer na rea de trabalho um cone com o desenho de uma figura feminina, uma camponesa. Clicando duas vezes neste cone com o
mouse ou seguindo a seqencia na barra de comandos do Windows Iniciar > Todos os
programas > gretl > gretl, ser iniciado o programa apresentando a janela reproduzida na Figura 2.1. Como ainda no foi carregado nenhum arquivo de dados apenas as
opes de menu esto disponveis Arquivo e Ferramentas, as demais opes aparecem
em cinza indicando que no esto disponveis.

2.2 Entrada de dados


A entrada manual de dados no gretl realizada atravs do comando Novo conjunto
de dados do menu Arquivo, como mostram a Figura 2.2 e a Figura 2.3.
Surgir uma pequena janela Figura 2.4 solicitando a informao de quantas observaes sero inseridas.
Aps ser informada a quantidade de observaes, deve-se selecionar a estrutura dos
dados, conforme a Figura 2.5: Dados de corte referindo-se a dados de corte transversal,
Srie temporal indicando se os dados so de srie temporal e Painel se os dados esto
na estrutura Painel.
Em seguida, pede-se para confirmar a estrutura do conjunto de dados conforme a
Figura 2.6. Antes de clicar no boto Aplicar, clicar com o mouse no quadrado,
assinalando-o, onde se l Inicie a introduo de valores.
1

Gretl um acrnimo para Gnu Regression, Econometrics and Time-series Library. Trata-se de uma
biblioteca de funes estatsticas e economtricas para anlise de regresso e de sries temporais.
Segundo Adkins(2007), de fcil uso e razoavelmente poderoso.
2
Para se informar sobre os aspectos de colaborao e voluntariado na comunidade de software aberto
o leitor poder comear pelo link http://pt.wikipedia.org/wiki/Software_livre.

Figura 2.1: Tela inicial do Gretl

Figura 2.2: Menu Arquivo do Gretl


Como mostra a Figura 2.7, pede-se um nome para a primeira varivel. No gretl
as variveis sero nomeadas com um mximo de 15 caracteres; iniciar com uma letra e
depois nmeros e letras e o caractere sublinhado _ ; no usar acentos como em salrio;

Figura 2.3: Selecionando a entrada manual de dados

Figura 2.4: Janela para informar nmero de observaes

Figura 2.5: Janela para informar a estrutura dos dados


no ter espaos como em Segundo Grau completo;
A janela
de insero de dados na Figura 2.8 tem no canto superior esquerdo trs
cones:+, ,. Correspondem respectivamente s aes inserir mais uma varivel, confirmar os dados inseridos e fechar a janela de insero de dados.

Figura 2.6: Tela para confirmao da estrutura de dados.

Figura 2.7: Tela para informar o nome da primeira varivel

Figura 2.8: Tela de insero dos dados

2.3 Importao de dados


A outra maneira de inserir dados no gretl atravs da seqencia Arquivo - Abrir
dados - Importar. Como se v na Figura 2.9. Nota-se que h uma variedade de formatos
de dados, mas neste texto faremos referncia apenas s opes texto/CSV e Excel.

Figura 2.9: Seqencia para importao de dados

2.4 Anlise dos dados


O software Gretl tem como foco a anlise de regresso e de sries temporais, mas
tem ferramentas que auxiliam na descrio estatstica sumria de variveis. Na barra
de menu superior h duas formas de se obter o resumo estatstico de uma varivel ou
um conjunto selecionado: o comando Ver com a opo Estatsticas descritivas e
o comando Varivel tambm com a opo Estatsticas descritivas. A resposta
ao comando uma janela de resultados informando mdia, mediana, mnimo, mximo,
desvio padro, coeficiente de variao, enviesamento(assimetria) e excesso de curtose.

2.4.1 Estatstica descritiva


O objetivo da anlise descritiva resumir um conjunto de dados, extraindo as caractersticas e informaes mais relevantes para o estudo.
Sejam os dados da empresa fictcia Companhia MB, apresentados no livro Estatstica
bsica, de Bussab e Morettin(2005), pgina 11, Tabela 2.1. Para serem lidos pelo Gretl,
os dados foram digitados em uma planilha adaptando os ttulos das colunas extraindo
os caracteres til, circunflexo e cedilha.
Salva a planilha, ento procedeu-se importao dos dados pelo Gretl usando a

10

seqncia de comandos utilizando o mouse: Arquivo > Abrir dados > Importar >
Excel. Abre-se uma janela onde o usurio deve informar o caminho da planilha que
contm os dados para anlise. O software solicita a confirmao da estrutura de dados,
no caso Corte transversal.

Figura 2.10: Dados da Companhia MB importados para o Gretl


Para se obter uma descrio numrica da distribuio da varivel salrio, procede-se
seqncia : selecionar a varivel salrio clicando com o mouse deixando-a destacada. Clicar com o mouse no comando Ver ou Varivel e clicar em Estatsticas descritivas
e uma janela com os resultados surgir na tela do computador, como se v na Figura
2.11.

Figura 2.11: Estatsticas descritivas da varivel salrio

Medidas descritivas da distribuio


A mdia e a mediana so medidas de posio. O desvio padro e o coeficiente de variao (C.V.) so medidas de disperso. Com o nome de Enviesamento tem-se o coeficiente

11

de assimetria da distribuio e com o nome de Curtose Ex. o excesso de curtose.


Segundo Merrill e Fox(1980) 3 , define-se a mdia aritmtica de um conjunto de dados
como
X=

n
1X
Xi
n i=1

No clculo da mdia, leva-se em conta cada nmero do conjunto de observaes, com


igual peso. Cada conjunto de nmeros tem uma nica mdia.
A mdia tem como desvantagem sofrer alterao em seu valor com a presena de
observaes de valores extremamente grandes ou extremamente pequenos.
A mediana o valor central de um conjunto de observaes dispostas por ordem de
grandeza. A mediana no afetada por valores extremos.
A estas medidas de posio deve-se acrescentar a informao sobre a variabilidade
em trono da mdia. So as medidas de disperso. Com os valores Mnimo e Mximo,
fornecidos pelo Gretl, obtemos a Amplitude Total, ou seja,
Amplitude T otal = M a
ximo Minimo
As medidas de disperso mais utilizadas so desvio padro e varincia. O desvio
padro definido como a raiz quadrada positiva da varincia. A varincia de um conjunto
de dados se define como a mdia dos quadrados dos desvios dos dados com relao
mdia. Gretl calcula a varincia como
var(X) =

N
1 X
(xi x)2
N 1 i=1

Portanto o desvio padro ser


dp(X) =

var(X)

A varincia e o desvio padro tero valor zero quando todos os dados de uma varivel
assumirem o mesmo valor. Assim, quanto mais prximo de zero indica que o conjunto
de valores bastante concentrado e homogneo.
A outra medida de disperso informada pelo Gretl o coeficiente de variao (C.V.).
Relaciona o desvio padro com a mdia e se define como
dp(X)

X
O coeficiente de variao comumente expresso como uma percentagem, assim devese multiplicar por 100 o valor informado pelo Gretl. A disperso dos dados ser tanto
maior quanto o valor do C.V. se aproxime de 1 ou de 100%.
As duas ltimas medidas fornecidas pelo Gretl informam a respeito da forma da distribuio: Enviesamento (assimetria) e Curtose Ex (excesso de curtose). Uma distribuio
dita assimtrica se no simtrica em relao mdia. Segundo Merrill e Fox (op.
C.V. =

Fonte das definies seguintes.

12

cit.), o coeficiente de assimetria 3 a medida de assimetria mais usada, e se define


como
3 =

1
n

Pn

i=1 (Xi
s3

3
X)

onde s3 o cubo do desvio padro. Para uma distribuio simtrica, 3 zero. Valores positivos de 3 indicam que a distribuio positivamente assimtrica, ou seja,
seu grfico (histograma) apresenta uma longa cauda direita. Para valores negativos,
apresentar uma cauda longa esquerda.
O coeficiente de curtose a medida de achatamento da distribuio. A medida da
curtose fornecida pelo clculo de 4 , definido como
4 =

1
n

Pn

i=1 (Xi
s4

4
X)

onde s4 a quarta potncia do desvio padro. A distribuio normal muito utilizada


como referncia para medida do achatamento. Para a distribuio normal, 4 igual a 3.
Desta forma, se 4 excede 3 (Curtose Ex. positiva) , a distribuio dita leptocrtica
(mais apontada do que a distribuio normal), e se 4 menor do que 3 (Curtose Ex.
negativa), a distribuio dita platicurtica (menos apontada do que a distribuio
normal).
Representao grfica da distribuio
A representao grfica de uma distribuio de freqncia chama-se histograma e no
Gretl pode ser obtido pela seqncia, usando o mouse: Varivel > Distribuio de
freqncia, informar o nmero de classes que se deseja (o Gretl sugere 7), clicar na
caixa mostrar grfico e clicar em OK. O grfico ser exibido em uma janela como a da
Figura 2.12. Clicando com o boto direito do mouse sobre a janela do grfico surgir
um menu com as opes de salvamento do grfico para insero no texto de um relatrio
ou no corpo de um artigo para publicao.
Outro grfico utilizado para descrever uma distribuio de freqncia conhecido como
grfico de caixa, tambm chamado de desenho esquemtico em Bussab e Morettin(2005).
Pode ser obtido no Gretl pela seqncia: clicar em Varivel, Grfico das variveis,
Diagramas de caixa, informar o nome de uma varivel ou mais de uma varivel (neste
caso separadas por espao) e OK. O resultado aparece em uma janela como a Figura 2.13.
Clicando com o boto direito do mouse sobre a janela do grfico surgir um menu com
as opes de salvamento do grfico para insero no texto de um relatrio ou no corpo
de um artigo para publicao.

2.4.2 Correlao
Um tpico importante na anlise de variveis scio-econmicas diz respeito ao grau
de associao entre elas. A resposta fornecida pelo clculo do coeficiente de correlao
que informa o grau de associao, mas no pode ser usado para determinar a existncia

13

Figura 2.12: Histograma da varivel salrio

Figura 2.13: Diagrama de caixa com as variveis salrio e idade.


de um vnculo de causalidade entre as variveis. Segundo Hoffman(1980), para uma
amostra de n pares de valores Xi , Yi (com i = 1, ..., n) a estimativa de correlao linear
entre X e Y dada por
P
xi y i
r = qP P
x2i yi2
e yi = Yi Y , com X
= 1 P Xi e Y = 1 P Y i .
onde xi = Xi X
n
n
Considere os dados da tabela 2.1
Para calcular o coeficiente de correlao entre X e Y no Gretl utiliza-se a seqncia
de menus Ver - Matriz de correlao - Variveis selecionadas- OK. A sada ser

14

Tabela 2.1: Dados hipotticos.


X Y
1 1
2 9
3 2
4 7
5 6
igual ao contedo do quadro abaixo

Coeficientes de correlao, usando as observaes 1 5


5% valor crtico (bilateral) = 0,8783 para n = 5
X
1, 0000

Y
0, 3730 X
1, 0000 Y

Segundo Levin(1987), o coeficiente de correlao oscila entre os valores 1, 00 e +1, 00


e sendo interpretados segundo a Tabela 2.2.

15

Tabela 2.2: Valores do coeficiente de correlao e qualificao da correlao.


Valor do coeficiente Interpretao
1, 00 correlao negativa perfeita
:
0, 95 correlao negativa forte
:
0, 50 correlao negativa moderada
:
0, 10 correlao negativa fraca
:
0, 00 ausncia de correlao
:
+0, 10 correlao positiva fraca
:
+0, 50 correlao positiva moderada
:
+0, 95 correlao positiva forte
:
+1, 00 correlao positiva perfeita
Logo, o coeficiente de correlao entre X e Y sendo igual a 0, 03730 pode ser interpretado como uma correlao positiva entre fraca e moderada.

2.4.3 Exerccio prtico


1. A Tabela 2.3 traz informaes sobre 30 alunos distribudas nas variveis Idade (em
anos), Altura (em metros), Peso (em quilogramas), TV (horas gastas assistindo
TV , por semana) e IMC (ndice de Massa Corprea, calculado pela frmula:
P eso
IM C = Altura
2 ). Usando o Gretl, realize as tarefas a seguir.
a) Obtenha as estatsticas descritivas das variveis e relate sobre o formato de
cada distribuio e a disperso dos dados.
b) Obtenha para cada varivel os grficos histograma e diagrama de caixa. O
que informam estes grficos?
c) Obtenha a matriz de correlao entre as variveis e comente o resultado.

16

Tabela 2.3: Dados para exerccio prtico


Aluno Idade Altura Peso TV IMC
1
17
1.60 60.5 16 23.630
2
18
1.69 55.0
7 19.255
3
18
1.85 72.8 15 21.275
4
25
1.85 80.9 20 23.638
5
19
1.58 55.0
5 22.030
6
19
1.76 60.0
2 19.367
7
20
1.60 58.0
7 22.650
8
18
1.64 47.0 10 17.471
9
18
1.62 57.8 12 22.029
10
17
1.64 58.0 10 21.537
11
18
1.72 70.0
8 23.655
12
18
1.66 54.0
0 19.516
13
21
1.70 58.0 30 20.022
14
19
1.78 68.5
2 21.617
15
18
1.65 63.5 10 23.369
16
19
1.63 47.4 18 17.862
17
17
1.82 66.0 10 19.952
18
18
1.80 85.2 10 26.263
19
20
1.60 54.5
5 21.200
20
18
1.68 52.5 14 18.662
21
21
1.70 60.0
5 20.747
22
18
1.65 58.5
5 21.458
23
18
1.57 49.2 10 19.948
24
20
1.55 48.0 28 19.955
25
20
1.69 51.6
4 18.069
26
19
1.54 57.0
5 24.013
27
23
1.62 63.0
5 24.084
28
18
1.62 52.0 10 19.859
29
18
1.57 49.0 12 19.805
30
25
1.65 59.0
2 21.649

17

3 Regresso linear simples


Como ensina Kmenta(1988), a teoria econmica preocupa-se sobretudo com relaes
entre variveis. Relaes de oferta e procura, funo custo, funo produo e muitas
outras (...), a econometria se preocupa em testar as proposies tericas incorporadas
nestas relaes e em estimar os parmetros nelas envolvidos.
Sendo x e y duas variveis relacionadas em alguma proposio terica ou emprica, a
tarefa estudar como y varia com variaes em x? Conforme Wooldridge (op.cit),
Ao escrever um modelo que explicar y em termos de x, defrontamo-nos
com trs questes. Primeira, como nunca h uma relao exata entre duas
variveis, como consideramos outros fatores que afetam y ? Segunda, qual
a relao funcional entre y e x? E terceira, como podemos estar certos de
que estamos capturando uma relao ceteris paribus entre y e x (se esse for
um objetivo desejado)?
As ambigidade resolve-se com a especificao do modelo que relaciona y a x. Uma
equao tal como
y = 0 + 1 x + u

(3.1)

A equao 3.1 chamada de modelo de regresso ou equao de regresso. As variveis


x e y tm vrios nomes mas os mais descritivos so varivel explicada para y e varivel
explicativa para x. A varivel u , que em alguns livros representada por , chamada de
termo de erro ou perturbao da relao, representa outros fatores alm de x que afetam
y como no observados. O parmetro 1 chamado de parmetro de inclinao da
relao entre x e y e muito importante na anlise em economia aplicada. O parmetro
de intercepto 0 tem seus usos mas raramente central para uma anlise (Wooldridge,
2006).

3.1 Uma aplicao no Gretl


Sejam os dados da tabela 3.1, retirados do livro de Pindyck e Rubinfeld (op. cit.).
Entrando esses dados no Gretl, tal como descrito na seo 2.4.1, procede-se seqncia
de menus Modelo -> Mnimos Quadrados Ordinrios e na janela que se abre informar
como varivel dependente a varivel Y selecionando-a com o mouse e clicando na seta
azul. Depois selecionar a varivel X e clicar na seta verde inserindo-a como varivel
independente. Notar que o Gretl j colocou a constante como const. Por fim, clicar no
boto OK e aparecer a janela com os resultados, indicados a seguir na Figura 3.1.

18

Tabela 3.1: Mdia de notas escolares e renda familiar


Y
X
(mdia das notas) (renda dos pais em US$ 1000,00)
4,0
21,0
3,0
15,0
15,0
3,5
2,0
9,0
3,0
12,0
3,5
18,0
2,5
6,0
2,5
12,0

Figura 3.1: Resultados do Modelo de Mnimos Quadrados Ordinrios.


Lendo os resultados do Gretl, temos na primeira coluna o termo const que se refere
ao intercepto da equao e X a varivel independente. Na segunda coluna os valores
estimados dos coeficientes 0 e 1 , respectivamente 1,37500 e 0,120370, desta forma o
modelo estimado fica como na equao 3.2
Yb = 1, 375 + 0, 12X

(3.2)

Segundo a equao 3.2, para cada unidade de X a mais, Y aumenta em 0,12. Os


demais itens da janela de resultados servem para diagnosticar se o modelo significativo
nos parmetros e se a equao tem um bom ajuste com relao aos dados da amostra.

3.1.1 Diagnstico da regresso


O pressuposto do Modelo 1 que a renda dos pais explica a mdia de notas dos alunos.
Tendo o modelo estimado, procede-se verificao da significncia dos parmetros, em
especial de 1, o coeficiente de X, renda dos pais. Assim, para verificar se a renda dos

19

pais significativa para explicar a mdia de notas dos alunos efetua-se a verificao do
intervalo de confiana dos parmetros e o teste da nulidade H0 : 1 = 0.
Significncia dos parmetros
Para se obter os intervalos de confiana no Gretl, ativar a janela de resultados Modelo
1 e clicar no menu Anlise -> Intervalos de confiana para os coeficientes.
Surgir a janela da figura 3.2.

Figura 3.2: Intervalos de confiana para os coeficientes.


O nvel de confiana padro = 0, 05, que pode ser modificado clicando no boto
com o na barra de comandos. Observando os resultados, o intervalo de confiana para
0 [0, 472639 ; 2, 27736] e para 1 [0, 0569589 ; 0, 183782]. O zero no est includo,
ento para esta amostra os parmetros no so zero com 95% de probabilidade.
Para o teste de hiptese Hill et. al.(op.cit.) sugerem as quatro etapas a seguir:
1. Determine as hipteses nula (H0 ) e alternativa (H1 ).
2. Especifique a estatstica de teste e sua distribuio se a hiptese nula verdadeira.
3. Escolha e determine a regio de rejeio.
4. Calcule o valor amostral da estatstica de teste.
Aplicando ao estudo das mdias de notas e renda dos pais.
1. A hiptese nula H0 : 1 = 0 . A hiptese alternativa H1 : 1 6= 0. Se a hiptese
nula verdadeira, no h relao entre a renda dos pais e as mdias de notas. Se
a hiptese alternativa verdadeira, ento h relao entre a renda dos pais e as
mdias de notas.
k
2. Estatstica de teste tc = dp(
t(T 2) se a hiptese nula verdadeira. Onde
k)
dp(k ) o erro-padro do coeficiente e T o nmero de observaes. Os graus de
liberdade da distribuio tc igual a T menos o nmero de parmetros envolvidos.

20

3. O um valor de probabilidade, em geral utiliza-se = 0, 01 ou = 0, 05.


Neste caso = 0, 05. A regio de rejeio dada pelos valores de e graus de
liberdade ( 8 observaes menos dois parmetros = 6). Assim o valor crtico de tc
ser dado em uma tabela estatstica da distribuio t de Student para tgl=6,=0,05/2 ,
pois o teste bicaudal se a hiptese alternativa H1 : 1 6= 0. No Gretl o valor
crtico de tc pode ser obtido de forma automtica pela seqncia de menus da
janela principal: Ferramentas -> Tabelas estatsticas -> t e preencher as
janelas gl com os graus de liberdade e probabilidade da cauda direita com o
valor de escolhido. O valor de tc crtico para a amostra de mdias de notas igual
a 2,447. A regra de rejeio da hiptese nula em favor da hiptese alternativa
dada pela condio do valor amostral de t 2, 447 ou t 2, 447, ou, equivalente,
se |t| 2, 447.
4. Por fim, o valor amostral da estatstica t de cada parmetro dado na janela
de resultados do Modelo 1 na coluna razo - t, que o resultado da diviso do
valor do coeficiente pelo erro padro. Verifica-se que a razo - t de cada um dos
coeficientes supera o valor crtico da estatstica t da amostra (2,447). Portanto para
cada um dos parmetros a hiptese de nulidade foi rejeitada ao nvel de = 0, 05.
Mais importante, no caso de 1 ter sido rejeitada a hiptese de nulidade, significa
que a varivel X, rendimento dos pais, significativa no modelo.
Outra forma de avaliar a significncia dos parmetros observar a coluna p-valor.
Segundo Hill et. al.(op.cit), podemos decidir se rejeitamos uma hiptese nula
comparando-o com o nvel de significncia . A regra :
Regra de rejeio para um teste de hiptese: Quando o P-valor de um
teste de hiptese menor do que o valor escolhido , o procedimento de teste
conduz rejeio da hiptese nula.

A consequncia prtica que conhecendo o P-valor do teste, a deciso de rejeio


da hiptese nula vai resultar da comparao do P-valor com o nvel de significncia
escolhido.
Outra facilidade fornecida pelo Gretl so os asteriscos () ao lado dos p-valores.
O esquema da Tabela 3.2 demonstra que quanto mais asteriscos melhor ou mais
significante a estimativa.
Tabela 3.2: Esquema de asteriscos e nveis de significncia no Gretl.
Asteriscos Valor do
Interpretao

0,01
Muito significativo

0,05
Significativo

0,10
Pouco significativo

21

Qualidade do ajustamento
Conforme Pindyck e Rubinfeld(op.cit), uma boa regresso aquela que ajuda a explicar uma grande proporo da varincia de Y . A medida desse grau de explicao
dada pelo R2 ou R-quadrado. O R2 d a proporo da variao total de Y explicada pela
regresso de Y contra X. Varia entre 0 e 1 e normalmente se interpreta em porcentagem.
Se R2 ' 0 indica um ajuste fraco, mas ao contrrio, quanto mais prximo de 1 melhor
ser o ajuste. O caso de R2 = 1 ocorre apenas quando todos os pontos esto sobre a
linha de regresso. Na Figura 3.1, o valor de R-quadrado 0,782407 ou 78,24% o que
indica um bom ajuste, ou seja que a renda dos pais ajuda a explicar 78% da variao
nas mdias de notas da amostra de 8 pessoas. Mas Wooldridge (op.cit) adverte que um
R-quadrado aparentemente baixo no significa, necessariamente, que uma equao de
regresso de MQO intil. (...) usar o R-quadrado como o principal padro de medida
de sucesso de uma anlise economtrica pode levar a confuses.
Resumindo os resultados da regresso
Os resultados da estimao do modelo de regresso podem ser apresentados de forma
resumida na forma de uma equao de regresso ajustada

b = 1, 37500 + 0, 120370 X
Y
(0,36878)

(0,025915)

T = 8 R = 0, 7461
(erros padro entre parnteses)
Intervalo de confiana da previso
Aps a obteno do modelo estimado e da verificao do seu alcance explicativo atravs
dos testes de hiptese, pode-se utilizar a equao estimada para realizar previses de
Y para dado X. Porm assim como os valores estimados de 0 e 1 tm um intervalo
de confiana, o valor previsto yb0 para um dado x0 no observado, mas com valor no
muito distante de X, tambm tem um intervalo de confiana. Para isto ser necessrio
conhecer o desvio padro da previso dado pela equao 3.3(Hill et.al.)
dp(f ) =

v "
u
u
t
2 1 +

1
(x0 x)2
+P
(xt x)2
T

(3.3)

Assim, o intervalo de confiana da previso ser dado por


y0 tc dp(f )

(3.4)

Para o modelo de mdia de notas em funo da renda dos pais, considere-se a equao
estimada
Yb = 1, 375 + 0, 12X

22

e desejamos prever a mdia de nota y0 para uma renda de x0 = 20 mil. Temos


y0 = 1, 375 + 0, 12 (20) = 3, 7824
A obteno do intervalo de confiana da previso no Gretl no feita de forma direta.
No livro de Adkins(2010) h uma sugesto de cdigo com base na frmula 3.5

2
+ (x0 x)2 var(b
2)
(3.5)
T
Antes de apresentar o cdigo sugerido deve-se informar o leitor que o software Gretl
tem mais de um ambiente de operao. O ambiente at agora comentado chamado
de ambiente grfico ou interface grfica com o usurio (sigla GUI em ingls), onde a
interao realizada atravs de menus acionados com cliques do mouse. Outros dois
ambientes esto disponveis. Um chamado de console e acionado clicando com o
mouse no terceiro cone , da esquerda para a direita, na barra inferior de comandos na
janela principal do Gretl. O console tambm acionado digitando o comando gretlcli
seguido de Enter na janela do DOS do Windows, que est em Iniciar - Programas Acessrios.
No console os comandos so digitados informando parmetros e variveis de sada. O
outro ambiente no tem um nome mas acionado clicando com o mouse no segundo
cone, antes do cone do console. Seu cone parecido com o Bloco de Notas do Windows,
uma folha e um lpis. Neste ambiente os comandos so digitados em uma seqncia e
depois so todos executados de uma vez clicando-se no cone com o desenho de uma
roda dentada, na barra de menus da janela.
Ao executar um modelo, em qualquer dos ambientes, o Gretl salva os resultados de
alguns clculos em variveis do sistema. Assim, os valores estimados dos coeficientes da
regresso so salvos na varivel $coeff. Ento para acessar o valor estimado do coeficiente da constante digita-se no console o comando adequado informando o parmetro
$coeff(const). A soma dos quadrados dos resduos salva na varivel $ess. Os graus
de liberdade e o nmero de observaes esto nas variveis $df e $nobs. Para computar
x utiliza-se a funo interna mean(x) e para se obter o valor crtico de uma distribuio
a funo critical.
Abaixo o cdigo sugerido seguido de comentrios.
var(f
)=
2 +

ols Y const X
genr yhat0 = $coeff(const)+$coeff(X)*20
genr sig2 = $ess/$df
genr f = sig2 + sig2/$nobs + ((20 - mean(X))^2)*($stderr(X)^2)
genr l_inf = yhat0 - critical(t,$df,0.025)*sqrt(f)
genr l_sup = yhat0 + critical(t,$df,0.025)*sqrt(f)
Comentrio do cdigo:

23

1. Na primeira linha o comando ols informa que o mtodo dos mnimos quadrados
ordinrios ser utilizado para estimar a equao de regresso de Y em X 1 . A
partcula const instrui que a reta tem um intercepto.
2. Na segunda linha feito o clculo do Y previsto com o valor de X = 20 utilizandose dos valores estimados dos coeficientes salvos nas variveis $coeff(const) para
0 e $coeff(X) para 1 . O valor previsto ser salvo na varivel yhat0.
3. Na terceira linha gerado o
2 da equao 3.5. Que o resultado da diviso
da Soma resid. quadrados informada na janela de resultados do modelo (salvo
na varivel $ess) pelos graus de liberdade do modelo nmero de observaes
menos o nmero de parmetros salvo na varivel $df.
4. Na quarta linha calculada a var(f
). Descrevendo: $nobs o nmero de observaes da amostra; mean(X) calcula a mdia da varivel X;e ($stderr(X)^2)
calcula o erro padro de 1 , o coeficiente de X.
5. Na quinta linha calculado o limite inferior do intervalo de previso,salvo na
varivel l_inf. Aqui usado o comando critical: critical(t, $ df,0.025)
d o valor crtico da distribuio t com graus de liberdade salvo na varivel $df
com o = 0, 05/2 = 0, 025; sqrt(f) a raiz quadrada do f calculado na quarta
linha.
6. Na ltima linha do cdigo calculado o limite superior do intervalo de previso,
salvo an varivel l_sup.
Ento o valor previsto da mdia para X = 20 yhat0=3,7824 com o seguinte intervalo
de predio, considerando o nvel = 0, 05 de confiana: valor mnimo da mdia igual
l_inf=2,832 e valor mximo da mdia igual a l_sup=4,723 ou [2.832, 4.723].

3.1.2 Exerccio prtico


1. Use o Gretl e os dados seguintes sobre preo e consumo de arroz para estimar uma
= a + bP , onde Q o consumo de arroz em milhares
funo procura da forma Q
de toneladas , e P o preo de varejo em dlares por tonelada .
Agora, responda ao seguintes quesitos:
=
a) Qual a interpretao econmica dos coeficientes a e b na funo procura Q
a + bP ?
b) Os coeficientes estimados de a e de b so consistentes com aquilo que se
esperaria com base na teoria econmica?
c) Teste as hipteses: H0 : a = 0 contra HA : a 6= 0 e H0 : b = 0 contra
HA : b < 0 fixando o nvel de confiana em5%.
1

O Gretl faz distino entre maisculas e minsculas. Assim X diferente de x.

24

Ano Consumo Preo


1957
178
105
1958
224
105
1959
160
130
1960
315
130
1961
229
130
1962
250
150
1963
181
150
1964
306
170
1965
237
170
1966
300
180
d) Qual o grau de bondade do ajuste, R2 ?
e) Usando a funo procura estimada, projete o consumo para o preo de $ 200
por tonelada.
f) Qual a sua concluso sobre o modelo estimado?

25

4 Regresso linear mltipla


O modelo de regresso linear mltipla uma extenso do modelo de regresso linear
simples. A principal diferena que o modelo contm mais de uma varivel explicativa.
Isto muda a interpretao dos coeficientes estimados e requer mais algumas suposies.
A forma geral do modelo mostrada na equao 4.1
Y = 1 + 2 X2 + + k Xk + 

(4.1)

onde Y a varivel dependente, Xk k-sima varivel explicativa, k = 2, 3, . . . , K,  o


erro aleatrio, e 1 , 2 , . . . , k so os parmetros a serem estimados. Tal como na regresso linear simples,  tem mdia zero, varincia constante e no auto-correlacionado.
Os parmetros so independentes e no podem estar perfeitamente correlacionados.
Os parmetros 2 , 3 , . . . , k medem o efeito de uma umidade em cada uma das variveis Xk sobre o valor esperado de Y ,mantidas constantes todas as outras variveis
explicativas. O parmero 1 o termo de intercepto.
Como exemplo prtico utilizaremos o modelo aplicado para explicar a receita total
em uma cadeia de lanchonetes publicado em Hill et. al. (op. cit., p. 147). O gerente de
uma cadeia de lanchonetes deve decidir quanto gastar com propaganda e que atrativos,
como preos mais baixos, deve introduzir para aquela semana. As questes de interesse
para a gerncia esto descritas a seguir:
(...) o quanto a receita total varia em funo do nvel de despesas com a
propaganda. Um aumento nessas despesas gera um aumento da receita total?
Em caso afirmativo, o aumento da receita justifica o aumento das despesas
com propaganda? A gerncia tem interesse tambm na estratgia de preos.
A reduo dos preos conduz a um aumento ou a diminuio da receita
total? Se uma reduo dos preos implica apenas um pequeno aumento da
quantidade vendida, a receita total cair (a demanda inelstica em relao
ao preo); uma reduo de preo que conduza a um grande aumento na
quantidade vendida produzir um aumento na receita total (a demanda
elstica em relao ao preo).
A tarefa construir um modelo econmico em que a receita total dependa de uma
ou mais variveis explicativas. Com base na hiptese de que a receita total, RT , esteja
relacionada linearmente com o preo, p, e com as despesas com anncios/propagandas,
a, especificamos o modelo econmico
RT = 1 + 2 p + 3 a

26

(4.2)

O modelo econmico (equao 4.2) descreve o comportamento esperado de muitos


pontos de venda distintos. Para considera a diferena entre a receita total observvel e o
valor esperado receita total, adicona-se ao modelo um erro aleatrio,  = RT E(RT ).
Esse erro aleatrio contm todos os fatores que fazem a receita total semanal difira de
seu valor esperado. Entre estes fatores no considerados explicitamente na equao do
modelo esto as condies meteorolgicas, o comportamento dos concorrentes e outros.
Assim o modelo economtrico para a receita total da cadeia de lanchonetes ser
RT = 1 + 2 p + 3 a + 

(4.3)

4.1 Estimao de mnimos quadrados ordinrios


utilizando Gretl
Os dados do exemplo esto na tabela 4.1. Depois de inseridos os dados no Gretl,
clicamos no menu Modelo, seguido de Mnimos Quadrados Ordinrios. Surgir uma
janela onde colocamos a varivel RT como varivel dependente e as variveis p e a como
variveis independentes. Aps clicar no boto OK, a janela com os resultados ser
mostrada na tela do computador, tendo na barra de ttulos gretl: modelo 1. Durante
uma sesso do Gretl a cada vez que executamos um modelo este ser momeado em
sequncia modelo 1, modelo 2, etc.
O resultado dos clculos efetuados pelo Gretl aparecem, no modo tabular, como mostrados na tabela 4.2 e na forma de equao como na equao 4.4, com erros-padro entre
parnteses.
= 104, 786 6, 642p + 2, 984a
(6, 483)
(3, 1912)
(0, 167)
2
R = 0, 8617
F (2, 49) = 159, 83
T = 52

= 6, 0696
d
RT

(4.4)

4.2 Anlise dos resultados


Comparando-se janela de resultados da regresso linear simples, a novidade para
a regresso mltipla a adio da linha referente a mais uma varivel independente.
Agora temos const, p e a. As colunas so iguais: coeficiente, erro-padro, razo-t
e p-valor. Para se obter o intervalo de confiana dos coeficientes estimados segue-se
o menu da janela gretl:modelo 1: Anlise e Intervalos de confiana para os
coeficientes.
O teste de significncia de cada um dos coeficientes individualmente segue o mesmo
procedimento: comparao da razo-t do coeficiente com o valor crtico da estatstica
t para a amostra sob anlise, ou comparao do p-valor com o nvel de significncia
especificado para a anlise.

27

Tabela 4.1: Observaes semanais sobre receitas, preo e gastos com propaganda para
a cadeia de lanchonetes
Semana
RT
p
a Semana
RT
p
a
1 123.10 1.92 12.40
27 124.20 2.12 8.80
2 124.30 2.15 9.90
28 98.40 2.13 3.20
3 89.30 1.67 2.40
29 114.80 1.89 5.40
4 141.30 1.68 13.80
30 142.50 1.50 17.30
5 112.80 1.75 3.50
31 122.60 1.93 11.20
6 108.10 1.55 1.80
32 127.70 2.27 11.20
7 143.90 1.54 17.80
33 113.00 1.66 7.90
8 124.20 2.10 9.80
34 144.20 1.73 17.00
9 110.10 2.44 8.30
35 109.20 1.59 3.30
10 111.70 2.47 9.80
36 106.80 2.29 7.10
11 123.80 1.86 12.60
37 145.00 1.86 15.30
12 123.50 1.93 11.50
38 124.00 1.91 12.70
13 110.20 2.47 7.40
39 106.70 2.34 6.10
14 100.90 2.11 6.10
40 153.20 2.13 19.60
15 123.30 2.10 9.50
41 120.10 2.05 6.30
16 115.70 1.73 8.80
42 119.30 1.89 9.00
17 116.60 1.86 4.90
43 150.60 2.12 18.70
18 153.50 2.19 18.80
44 92.20 1.87 2.20
19 149.20 1.90 18.90
45 130.50 2.09 16.00
20 89.00 1.67 2.30
46 112.50 1.76 4.50
21 132.60 2.43 14.10
47 111.80 1.77 4.30
22 97.50 2.13 2.90
48 120.10 1.94 9.30
23 106.10 2.33 5.90
49 107.40 2.37 8.30
24 115.30 1.75 7.60
50 128.60 2.10 15.40
25 98.50 2.05 5.30
51 124.60 2.29 9.20
26 135.10 2.35 16.80
52 127.20 2.36 10.20
Fonte: Hill et.al. ( op. cit)
A medida do grau de ajuste da regresso informada pelo R-quadrado (R2 ) agora
tem de ser complementada pelo R-quadrado ajustado. A explicao, segundo Hill
et.al.(op.cit.)
Uma dificuldade com R2 que seu valor pode ser aumentado adicionandose cada vez mais variveis, mesmo que essas variveis no tenham qualquer
justificativa econmica.(...) Os programas de regresso para computador
frequentemente apresentam uma medida alternativa de aderncia, chamada
2
R2 ajustado, em geral simbolizada por R

28

Tabela 4.2: Resultado da regresso do modelo da cadeia de lanchonetes


Modelo 1: MQO, usando as observaes 152
Varivel dependente: RT

const
p
a

Coeficiente

Erro Padro

razo-t

104,786
6,64193
2,98430

6,48272
3,19119
0,166936

16,1638 0,0000
2,0813 0,0427
17,8769 0,0000

Mdia var. dependente


Soma resd. quadrados
R2
F (2, 49)
Log da verossimilhana
Critrio de Schwarz

120,3231
1805,168
0,867085
159,8280
166,0111
343,8759

p-valor

D.P. var. dependente 16,31873


E.P. da regresso
6,069611
2
R ajustado
0,861660
P-valor(F )
3,37e22
Critrio de Akaike
338,0222
HannanQuinn
340,2664

4.2.1 Teste de significncia do modelo


Com a possibilidade de integrar mais variveis ao modelo, surge a necessidade de se
efetuar um teste conjunto da relevncia de todas as variveis includas.
A hiptese nula a ser testada que conjuntamente todos os coeficientes, exceto o
associado ao termo constante ou seja o coeficiente estimado de const so zero.
Isto , a formulao das hipteses nula e alternativa seria
H0 : 2 = 0, 3 = 0, . . . , k = 0
H1 : ao menos um dos k e dif erente de zero
Caso a hiptese nula no seja rejeitada, nenhuma das variveis explicativas tem influncia sobre a varivel dependente. A estatstica de teste a estatstica F . A hiptese
nula rejeitada se o valor de F do modelo calculado pelo Gretl for maior ou igual ao
valor critico da estatstica F tabelada.
O valor crtico da estatstica F tabelado encontrado com base na informao dos
graus de liberdade, v1 e v2 , e do nvel de confiana .
Observando o resultado do modelo 1 na tabela 4.2, verificamos que a a estatstica
F calculada para o modelo pelo Gretl F (2, 49) = 159, 8280. O termo antes do sinal
de igualdade F (2, 49) informa que os graus de liberdade no numerador da estatstica F
igual a 2 resultado de 3 1, trs parmetros (1 , 2 e 3 ) menos o parmetro da
constante (1 ); os graus de liberdade no denominador da estatstica F igual a 49
resultado de 523, o nmero de observaes (52) menos o nmero de total de parmetros
no modelo(3).
O valor crtico da estatstica F (2, 49), considerando um nvel de confiana = 0, 05,
pode ser obtido consultando uma tabela de F ou utilizando o menu Ferramentas, na ja-

29

nela principal do Gretl. Assim, clicando em Ferramentas, Tabelas estatsticas e selecionando a aba F preenchemos as informaes solicitadas: gl(numerador), digitamos
2; gl(denominador), digitamos 49; e probabilidade da cauda direita, digitamos
0,05. Ento clicando em OK, aparece a janela com o resultado: Valor crtico = 3,18658.
Desta forma, a hiptese nula rejeitada no modelo 1, concluindo-se que a relao estimada significativa. mesma concluso chegamos observando o valor da estatstica
P-valor(F ) =3,37e-22. O nmero 3,37 vezes 1022 , ou 0.000000000000000000000337,
muito menor do que 0, 05, implicando na rejeio da hiptese nula.

30

Referncias
ADKINS, L. C. Using gretl for Principles of Econometrics. 3rd Edition, Version 1.3131,
2010. Disponvel em : http://www.learneconometrics.com/gretl/. Acessado em :28
de setembro de 2011.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica bsica. 5. ed. So Paulo: Saraiva,
2005.
COTTRELL, A.; LUCCHETTI, R. Gretl Users Guide. Disponvel em: http://gretl.
sourceforge.net/gretl_portugues.html. Acessado em: 15/02/2011.
FRANSES, P. H. A concise introduction to econometrics: an intuitive guide. CambridgeUK : Cambridge University Press, 2002.
HILL, R. C.; GRIFFITHS, W. E.; JUDGE, G. G. Econometria. So Paulo:Saraiva,
1999.
HOFFMAN, R. Estatstca para economistas. So Paulo: Pioneira, 1980.
LEVIN, J. Estatstica aplicada a cincias humanas. 2. ed. So Paulo: Harbra, 1987.
KEYNES, J. M. A teoria geral do emprego, do juro e da moeda. 2. ed. So Paulo:
Nova Cultural, 1985.
KLEIN, L. R. Introduo econometria. So Paulo: Atlas, 1978.
MERRIL, W. C.; FOX, K. A. Estatstica econmica: uma introduo. So Paulo: Atlas,
1980.
PINDYCK, R. S.; RUBINFELD, D. L. Econometria: modelos e previses. Rio de Janeiro: Elsevier, 2004.
WOOLDRIDGE, J. M. Introduo Econometria: uma abordagem moderna. So Paulo:
Thomson Pioneira, 2006.

31

Você também pode gostar