Você está na página 1de 43

ECONOMETRIA

Notas de Aula
Prof. Cludio Andr

PARTE I
A Econometria atravs de um estudo de caso...
O Sr. Econopoulos o representante exclusivo em Fortaleza das camionetas APRIGIUS, as mais espaosas e resistentes do mercado. O preo de uma camioneta nova e de seus opcionais determinado pela fbrica e, portanto, no uma varivel de controle dele. Entretanto, a sua loja encarrega-se tambm da venda de camionetas usadas e os seus preos no sofrem qualquer ingerncia da montadora. O problema seria, ento, determinar o preo de um modelo usado. De posse dessa informao, o ganho em cada venda poderia ser otimizado. Mais especificamente, o Sr. Econopoulos est preocupado que os preos determinados pelo Sr. Picaretti, o seu gerente de vendas de camionetas usadas, no estejam sendo determinados de forma clara e previsvel. Depois de comparecer a um seminrio sobre vendas, ele decidiu implantar um sistema de determinao de preos em sua revendedora. Mas, que sistema implantar? O Sr. Econopoulos pensou bastante sobre o assunto, e lembrou-se que um dos palestrantes falou sobre a possibilidade de utilizar a ECONOMETRIA na determinao dos preos de revenda de veculos.

Mas, o que Econometria?


O Sr. Econopoulos no sabia, mas ficou bastante curioso para aprender na tentativa de solucionar o seu problema. E, ento, o que a Econometria? Em suas leituras introdutrias, o Sr. Econopoulos descobriu que a Econometria consiste basicamente da utilizao da teoria econmica, da Matemtica e da Estatstica na tentativa de mensurar as relaes existentes entre variveis econmicas. No caso, o papel da teoria seria o de sugerir variveis e relaes importantes entre elas, enquanto que a Matemtica e a Estatstica serviriam para quantificar estas relaes. Com base nessas idias bsicas, o Sr. Econopoulos pensou: Se eu conseguir escolher um conjunto de variveis importantes para determinar o preo de revenda de camionetas usadas, ento, eu poderei aumentar os lucros obtidos em cada venda.

Muito entusiasmado, ele conversou com o Sr. Picaretti a este respeito que prontamente respondeu: Eu sinceramente acho que isto uma total perda de tempo! A determinao do preo de veculos usados antes de tudo uma arte. No fundo, a experincia e a percepo do avaliador que contam. Mas, o Sr. Econopoulos no concordou... Ele j havia percebido que a Econometria seria capaz de lhe dar uma resposta mais precisa, isto , menos dependente de juzos de valor.

Ento, como os preos seriam determinados?


O Sr. Econopoulos verificou que as anlises economtricas partem sempre de uma abordagem terica do tema em questo. Portanto, o primeiro passo para implantar um sistema de avaliao de camionetas usadas seria a formulao de um modelo terico. No caso, os modelos mais simples tratam da relao entre duas variveis, uma chamada de dependente (a que se quer explicar) e outra chamada de varivel independente ou explicativa. E, ento? Quais seriam as variveis que mais se adequariam neste contexto? O Sr. Econopoulos no teve dvidas quanto varivel dependente neste caso. Esta seria exatamente o preo de revenda da camioneta, em reais, que doravante ser representado por pr. Mas, qual seria a varivel explicativa neste caso? Utilizando a sua experincia, o Sr. Econopoulos verificou que o ano de fabricao da camioneta (af) seria fundamental para determinar o seu valor de revenda. E, que tipo de relao existiria entre estas duas variveis? No caso, o Sr. Econopoulos espera que a relao entre elas seja positiva, ou seja, ele espera que quanto mais nova a camioneta (i.e., quanto maior for o seu ano de fabricao), maior tender a ser o seu preo de revenda. BOX: Os tipos de relaes Basicamente as relaes, se existirem, entre variveis econmicas podem ser de dois tipos: Positivas: quando dos dados tendem a se mover na mesma direo (e.g., Lei da Oferta) Negativas: quando dos dados tendem a se mover na direo oposta (e.g., Lei da Demanda).

Obs.: duas variveis que tendem a se mover em um padro relativamente previsvel no possuem necessariamente uma relao que possa ser teoricamente interpretada.

BOX: Os tipos de relaes (continuao) Por exemplo, pode haver uma correlao muito forte entre a taxa de crescimento do PIB brasileiro e a taxa de crescimento da populao de borboletas na Monglia. Ser que voc poderia explicar esse fenmeno? Este um exemplo de uma relao espria. Mas, como representar esta idia matematicamente? Com base em seus estudos, o Sr. Econopoulos representou a sua relao terica entre as variveis da seguinte forma:

+ pr = af
No caso, o preo da camioneta seria uma funo (representada pela letra grega psi) do ano de fabricao da camioneta. O sinal positivo acima da varivel explicativa significa que a relao entre ela e a dependente positiva ou diretamente proporcional. Mas, na prtica, que forma deveria assumir esta funo genrica especificada acima? O Sr. Econopoulos havia lido que os modelos matemticos mais bsicos so os modelos lineares. Portanto, o seu modelo poderia ser escrito da seguinte forma:

pr = (af ) = 1 + 2 .af
1 representa o intercepto desta funo, ou seja, seria o valor de pr quando af = 0. Neste caso, este termo no teria um significado econmico bvio. 2, por sua vez, representa o coeficiente de declividade desta funo, isto , ele mede a variao de pr dada uma variao em af. Formalmente:

2 =
Graficamente:

pr dpr af daf

Como, neste caso, a relao esperada entre pr e af positiva, ento, supe-se que 2 > 0. Em termos prticos, tem-se que cada ano adicional de uso reduz o preo de revenda da camioneta em 2 reais. Exemplo: Considere a funo Y = 5 + 2.X Verifique que, neste caso, 1 = 5 e 2 = 2. Logo: Se X = 0, ento Y = 5 = 1 Se X = 1, ento Y = 5 + 2.1 = 7 Considerando-se esses dois casos, ento, tem-se que: Y = 7 5 = 2 e X = 1 0 =1 Logo, Y/X = 2/1 = 2 = 2 Assim, para cada unidade que X aumenta, Y crescer em 2 unidades. Um ponto fundamental que o Sr. Econopoulos desconhece os valores de 1 e de 2 e, por conseguinte, o modelo econmico proposto ter utilidade limitada para a realizao de seus objetivos. Outro ponto de essencial importncia que, na prtica, as relaes entre variveis econmicas nunca perfeita. Os economistas formulam modelos simplificando a realidade, pois, ela muito complexa. O argumento fundamental que os modelos no precisam ser realistas, desde que proporcionem boas previses (e.g., um mapa). Desta forma, para levar em considerao esses dois aspectos, faz-se necessrio desenvolver um modelo economtrico a partir do modelo econmico proposto. E, o que diferencia o modelo economtrico do modelo matemtico?

O modelo economtrico
O Sr. Econopoulos aprendeu que o modelo economtrico diferencia-se do modelo econmico, pois, deixa explcito que a relao entre as variveis no perfeita, i.e., que outras variveis podem afetar a varivel dependente em anlise. No caso em questo, quais seriam, portanto, as outras variveis que podem afetar o valor de uma camioneta usada mas que no foram includas no modelo? Vrios

exemplos poderiam ser mencionados, tais como a incluso ou no de acessrios opcionais, o cuidado do dono anterior, o tipo de pintura, etc. Os econometristas tambm consideram que os modelos tericos no so perfeitos por dois outros motivos adicionais, quais sejam: - as relaes entre variveis econmicas possuem sempre um certo grau de indeterminao (fator humano); e - podem haver erros de medio das variveis em anlise. De fato, o Sr. Econopoulos j havia percebido que, em certos casos, camionetas com mais anos de uso poderiam ser vendidas por preos maiores que os das mais novas. Isto se deve exatamente aos outros fatores alm do ano de fabricao que afetam o preo e no esto contidos no modelo. Ento, o primeiro passo para se formular um modelo economtrico admitir claramente o que est implcito na anlise econmica, de que os modelos tericos no tem a pretenso de descrever todos os casos possveis, mas sim apenas como as relaes entre as variveis se verificam na mdia. Logo, o modelo terico deveria ser reescrito da seguinte forma:

E(pr |af ) = (af ) = 1 + 2 .af


onde E representa a esperana matemtica. Note que utiliza-se, na verdade, a esperana condicional, i.e., considera-se como varivel dependente o valor esperado do preo de revenda dado o ano de fabricao. Nessa nova formulao do modelo, que ser a forma utilizada daqui em diante, tem-se que: 1 representa o intercepto da funo, ou seja, seria o valor de E(pr|af) quando af = 0. Neste caso, este termo no teria um significado econmico bvio. 2, por sua vez, representa o coeficiente de declividade da funo, isto , ele mede a variao de E(pr|af) dada uma variao em af. Considera-se, portanto, que cada ano adicional de uso reduz o preo de revenda da camioneta em 2 reais, em mdia. Aps essa reformulao do modelo econmico, ento, possvel construir economtrico, que se divide em duas partes: um termo determinstico (dado pelo modelo terico reformulado) e um componente aleatrio, (imprevisvel a priori), que representaria exatamente os fatores que tendem a distorcer as relaes entre as variveis econmicas. Desta forma, o modelo economtrico poderia ser escrito como se segue:

pr = E(pr |af ) + = 1 + 2 .af +

Para perceber verdadeiramente a necessidade de se incluir o termo aleatrio no modelo, o Sr. Econopoulos deveria tentar primeiramente coletar dados referentes s variveis em questo. Mas, que tipo de dados coletar? Os tipos de dados mais bsicos que existem so aqueles que so coletados para as variveis ao longo do tempo (sries temporais) ou aqueles que so coletados em um determinado ponto do tempo (sries transversais). BOX: Sries temporais X sries transversais Sries temporais so aquelas coletadas, como o nome sugere, ao longo do tempo. A freqncia depende da situao, podendo ser anuais, semestrais, trimestrais, mensais, semanais, dirias etc. Sries transversais so aquelas coletadas em um ponto do tempo (que depende do contexto). Ento, como reconhecer esses tipos de sries? Nos modelos com sries temporais, as variveis tm observaes referentes a um pas, empresa, famlia etc. durante vrios perodos de tempo. J nos modelos com sries transversais, em um determinado perodo, so coletadas informaes de vrios pases, regies, estados, municpios, empresas, pessoas, famlias etc. Exemplos: - PIB anual do Brasil de 1970 a 2000 Sries temporais (observaes do PIB anual do Brasil em um certo perodo, ano a ano). - PIBs dos pases da Comunidade Europia em 2000 Sries transversais (observaes dos PIBs de vrios pases em um determinado ano).

Ento, o Sr. Econopoulos coletou uma amostra que consistia nas camionetas usadas vendidas por sua firma durante o ano de 20031. Esta amostra consiste de 30 observaes, de dados transversais, cujos valores das variveis em questo so apresentados a seguir:

obs 1 2 3 4 5 6 7 8 9 10

af 2002 2001 2001 2001 2000 2000 2000 2000 2000 1999

pr 38600 41900 46800 38500 46500 41000 27200 33100 51200 30000

obs 11 12 13 14 15 16 17 18 19 20

af 1999 1999 1999 1999 1999 1999 1998 1998 1998 1998

pr 29000 27800 42300 44200 38600 32300 36500 39400 25000 32400

obs 21 22 23 24 25 26 27 28 29 30

af 1997 1997 1997 1996 1996 1996 1996 1995 1995 1995

pr 32500 25200 30600 28900 29300 23100 25400 22700 21500 19800

Para que os valores de pr sejam comparveis, eles so dados em termos reais, i.e., j descontada a inflao mensal.

Graficamente,
60000

50000

40000 pr 30000 20000 10000 1994

1996

1998 af

2000

2002

2004

Aps tabular os dados e de represent-los graficamente atravs de um diagrama de disperso, o Sr. Econopoulos constatou que camionetas que foram fabricadas no mesmo ano, de fato, foram revendidos por preos diferentes. Ademais, ele tambm confirmou a hiptese que, na mdia, carros mais novos so mais caros que os mais antigos. BOX: Construo e interpretao de um diagrama de disperso De acordo com os dados disponveis, crie uma caixa retangular onde os valores da varivel explicativa (genericamente representada por X) devem ser colocados na linha e os da dependente (genericamente representada por Y) na coluna. Para cada observao, forme pontos definidos por suas respectivas coordenadas de X e Y. Interprete o diagrama da seguinte forma:
Uma relao positiva Uma relao negativa

Y
X

Mas, conforme foi salientado antes, ele ainda desconhece os valores de 1 e de 2. Como ele tem apenas informaes de uma amostra com 30 observaes, ele ser capaz de estimar os valores destes parmetros desde que certas hipteses sejam satisfeitas. E que hipteses so estas? Isto o que ser visto na prxima parte.

PARTE II
Linearidade e estimao dos parmetros do modelo de regresso
O Sr. Econopoulos deseja estimar os parmetros desconhecidos de seu modelo economtrico (os s). Mas, antes de utilizar um mtodo para tanto, ele verificou que a hiptese de linearidade dos parmetros do modelo fundamental. No caso, essa hiptese atesta que a relao entre as variveis explicativas X2, .... XK, e a varivel dependente Y linear nos parmetros, ou seja, o modelo poder ser escrito da seguinte forma:

Yi = 1 + 2 .X 2i + K + K .XKi + i , i = 1 K ,n ,
onde 1 o parmetro de intercepto, e os ks, para k = 2,...,K, representam os coeficientes de declividade entre cada uma das variveis independentes X e a varivel dependente Y. BOX: Linearidade nos parmetros Basicamente, um modelo linear nos parmetros aquele apresenta o formato acima, i.e., todos os parmetros desconhecidos devem estar multiplicando variveis explicativas ou transformaes delas. Considere os seguintes exemplos: (i) (ii) (iii) (iv) (v) (vi)

Yi = 1 + 2 .X i + 3 .Z i + i
Yi = 1 + 2 .X i + 3 .X i2 + i Yi = 1 + 2 .X i + 3 .X i + i log(Yi ) = 1 + 2 . log(X i ) + i Yi = A.X i . i Yi = A.X i + i

Ento, quais so lineares nos parmetros? De acordo com o conceito, seriam os modelos (i), (ii) e (iv). Por qu? Obs.: No confundir a terminologia. Linear nos parmetros no quer dizer necessariamente que a relao entre a varivel dependente e cada uma das explicativas linear nas variveis, i.e., que pode ser expressa por uma reta ou equivalente. Veja o caso dos exemplos (ii) e (iv) acima.

Se dispusermos de uma amostra com n observaes distintas, ento, ser possvel escrever o sistema de equaes da seguinte forma:

Y1 = 1 + 2 .X 21 + K + K .XK1 + 1 Y2 = 1 + 2 .X 22 + K + K .XK 2 + 2 Y3 = 1 + 2 .X 23 + K + K .XK 3 + 3 K


Na forma matricial:

Yn = 1 + 2 .X 2n + K + K .XKn + n

(n 1)
Ou simplesmente:

Y1 1 X 21 Y 1 X 22 2 = M M M Yn 1 X 2n

(n K )

X 31 L XK1 1 1 X 32 L XK 2 2 2 . + M M M M X 3n K x Kn K n

(K 1) (n 1)

Y = X. +
Essa a representao genrica de um modelo linear de regresso (apenas devese ter em mente que a cada caso n e K podem ser diferentes).

Estimao dos Parmetros do Modelo


A partir do modelo geral apresentado anteriormente, tem-se que:

= Y X.
O mtodo de estimao dos Mnimos Quadrados Ordinrios (M.Q.O.) consiste em determinar uma soluo para o seguinte problema:

Min
i 's

i =1

2 i

ou Min ('. )

Portanto, o vetor b seria aquele que minimizaria a soma dos resduos ao quadrado. Assim, encontraria-se a curva que melhor descreveria o comportamento mdio da relao entre as variveis explicativas e a dependente. Pode-se mostrar que, na forma matricial:

b = (X' X ) X' Y
1

No modelo de regresso linear simples, esta frmula equivalente a

b2 =

. (X X)(Y Y )
n i=1 i i

(X X)
n i=1 i

b1 = Y b 2 .X .

Observao: No caso do modelo linear (cuja curva estimada uma reta), a reta estimada passa

exatamente no ponto em que X i = X e Yi = Y . Por qu? Y = b1 + b 2 .X i e b1 = Y b 2 .X Y = b1 + b 2 .X Logo: Se X i = X , ento Yi = Y .


Um exemplo

O Sr. Econopoulos agora ser capaz de obter estimativas para os parmetros desconhecidos de seu modelo, utilizando os estimadores de mnimos quadrados. O modelo proposto era o seguinte:

pr = 1 + 2 .af +

Logo, a equao estimada ser dada por:

pri = 6187470 + 3113,02.afi


Observaes:

[a] Perceba que na equao estimada utiliza-se pr j que atravs dessa equao sero obtidas estimativas de pr e no necessariamente os seus reais valores.
[b] No faz sentido somar o termo aleatrio na equao estimada. Por qu?

Como interpretar os resultados do ponto de vista econmico? - Neste caso, a constante no possui significado econmico, apenas matemtico. Seria o valor de pr caso o ano de fabricao fosse igual a zero. - De acordo com a estimativa do coeficiente de declividade, a cada ano mais nova for a camioneta o seu preo de revenda tender a aumentar em aproximadamente R$ 3.113,02 ou cada ano adicional de uso reduz o preo de revenda em R$ 3.113,02, em mdia.

Graficamente:
PR vs. AF 60000

50000

40000 R P

E(PR)
30000

20000

10000 1994

E(AF)
1996 1998 AF 2000 2002 2004

E, para que servem esses resultados? Para fazer previses da varivel dependente. Por exemplo:

Se afi = 2000 pri = 6187470 + 3113,02.2000 = $38.570


Ento, o preo esperado de revenda para uma camioneta fabricada no ano 2000 seria de $38.570, aproximadamente. Com isto, o Sr. Econopoulos poderia tentar maximizar os seus lucros, j que ele teria uma boa idia de qual seria o preo de revenda de uma determinada camioneta.

ANEXO II.1
DERIVAO DOS ESTIMADORES DE M.Q.O.
Considere o seguinte modelo de regresso:

Yi = 1 + 2 .X i + i
Ento:

i = Yi (1 + 2 .X i )
Pelo mtodo dos Mnimos Quadrados Ordinrios (MQO) deseja-se

Min S = i2 ou Min S = (Yi 1 2 .X i )


1 , 2 i 1 , 2 i

Condies de primeira ordem do problema:

S = 2. (Yi 1 2 .X i ) = 0 (1) 1 i
S = 2. (Yi 1 2 .X i ).X i = 0 2 i

(2)

Reescrevendo essas equaes, temos que:

Y
i
i

n.1 2 . X i = 0 1
i

( )
( )

Y .X
i

1 . X i 2 . X i2 = 0 2
i i

Ento:

n.1 + 2 . X i = Yi
i i

1 . X i + 2 . X i2 = Yi .X i
i i i

Logo, na forma matricial:

n X i i

X X
i i

Yi . 1 = i 2 2 Yi .X i i i
i

Ento, utilizando-se a Regra de Cramer temos que:

n b2 = =
2

X
i

Y Y .X
i i i i i

X
i

X X
i i

i 2 i

n
desde que

X
i

X X
i i

i 2 i

Logo:

b2 =

n. Yi .X i Yi . X i
i i i

n. X X i i i
2 i

Mas, esta expresso pode tambm ser escrita de uma forma alternativa:

b2 =

Yi .X i
i

Y . X
i i i

n
2

Xi X i2 i n i

b2 =

Yi .X i
i

Y . X
i i i

Y . X
i i i

n
2

Y . X
i i i

n
2

Xi Xi X i2 2. i n + i n i

b2 =

Y .X
i i

Y . X
i i i

Y . X
i i i

n
2

+ n.

X Y
i i

Xi Xi Xi i + n. i 2 . i X i 2. n n n i

b2 =

Y .X
i i i

X. Yi Y. X i + n.X.Y
i i 2 i

X
(Y .X
i i i

2.X. X i + n.X
i

b2 =

(X

Yi .X X i Y + X.Y
2 i

2.X.X i + X

b2

. (Y Y )(X X ) = = (X X )
i i i 2 i i

(Y
i i

Y . Xi X n 1 Xi X n 1

)(

)
= Cv(X, Y ) Vr(X )

Agora, b1 poder ser facilmente derivado a partir de

(1 ):

Y
i

n.b 1 b 2 . X i = 0
i

n.b 1 = Yi b 2 . X i
i i

b1 =

Y
i

b2.

X
i

b 1 = Y b 2 .X
Desta forma, diz-se que (b 1 , b 2 ) = Arg Min S j que eles formam a soluo para o problema proposto. Uma forma mais geral de derivar os estimadores de M.Q.O., que poder ser utilizada para qualquer modelo linear de regresso simples ou mltipla apresentada a seguir: Considere o seguinte modelo de regresso:

Y = X. + = Y X.
Pelo mtodo dos Mnimos Quadrados Ordinrios (MQO) deseja-se

Min S = '. = (Y X. )'.(Y X. ) = Y '.Y Y '.X. '.X '.Y + '.X '.X.

Condio de primeira ordem do problema:

S = X '.Y + X '.X. = 0 '


Ento:

X '.X. = X '.Y

(X'.X )1 .(X'.X ). = (X'.X )1 .X'.Y

b = = (X '.X ) .X '.Y
1

Aqui diz-se que b = Arg Min S pois o vetor soluo para o problema.

ANEXO II.2
UM EXEMPLO UTILIZANDO MATRIZES Considere os valores da tabela abaixo: Y 800 1160 1580 2010 1890 2600 X2 2 4 6 8 7 12 X3 0,8 0,7 0,5 0,4 0,2 0,2 Y 2070 1890 1830 1740 1380 1060 X2 11 10 9 8 6 4 X3 0,8 0,7 0,6 0,1 0,5 0,4

Estime a regresso de Y em funo de X2 e X3. O modelo a ser estimado o seguinte:

Yi = 1 + 2 .X 2i + 3 .X 3i + i , i = 1 12. ,...,
Em notao matricial:

Y1 1 Y 1 2 Y3 1 Y4 1 Y5 1 Y6 1 Y = 1 7 Y8 1 Y 1 9 Y10 1 Y11 1 Y12 1

X 21 X 22 X 23 X 24 X 25 X 26 X 27 X 28 X 29 X 210 X 211 X 212

X 31 1 1 800 1 2 0,8 1160 1 4 0,7 X 32 2 2 3 3 1580 1 6 0,5 X 33 X 34 4 4 2010 1 8 0,4 5 5 1890 1 7 0,2 X 35 1 1 X 36 6 2600 1 12 0,2 6 . 2 + 2070 = 1 11 0,8 . 2 + X 37 7 3 3 7 X 38 8 8 1890 1 10 0,7 1830 1 9 0,6 X 39 9 9 10 10 1740 1 8 0,1 X 310 X 311 11 11 1380 1 6 0,5 12 12 1060 1 4 0,4 X 312

Y(12 x1) = X (12 x 3 ) . (3 x1) + (12 x1)

A matriz XX e a sua inversa sero dadas por:

1 2 0,8 1 4 0,7 1 6 0,5 1 8 0,4 1 7 0,2 1 1 1 1 1 1 1 1 1 1 1 1 2 .1 12 0,2 X' X = 4 6 8 7 12 11 10 9 8 6 4 1 11 0,8 0,8 0,7 0,5 0,4 0,2 0,2 0,8 0,7 0,6 0,1 0,5 0,4 1 10 0,7 1 9 0,6 1 8 0,1 1 6 0,5 1 4 0,4
12 87 5,9 X' X = 87 731 41 5,9 41 3,53
E, a matriz XY ser:

(X' X)

1,25 0,09 1,04 = 0,09 0,01 0,03 1,04 0,03 1,67

20010 X' Y = 160810 9309


A estimativa de ser dada, ento, por:

b = (X' X )

1,25 0,09 1,04 20010 789,33 X' Y = 0,09 0,01 0,03 .160810 = 149,56 1,04 0,03 1 67 9309 419,26 ,

Portanto, o modelo estimado :

Y = 789,33 + 149,56.X 2 419,26.X 3

PARTE III
O coeficiente de determinao
Considerando-se o modelo bsico de regresso

Yi = 1 + 2 .X 2i + K + K .XKi + i , i = 1 K,n ,
Vale relembrar que a varivel dependente (Y) varia em funo das variveis independentes (Xs). Em termos gerais, o que se procura escolher as variveis independentes de tal forma que esta explique o mximo possvel da variao de Y. Para se estabelecer uma medida de variao em Y que seja explicada pelo modelo, deve-se separar os seus componentes explicvel e no explicvel. Assim, tem-se que

Yi = 1 + 2 .X 2i + K + K .XKi + i = E(Yi ) + i

onde E(Yi) o componente explicvel (ou sistemtico) e i o componente noexplicvel (aleatrio). Como os verdadeiros valores dos s no so conhecidos, ento, utiliza-se o mtodo dos mnimos quadrados ordinrios para se obter suas estimativas para um determinado conjunto de dados.Assim, ser possvel decompor o valor de Yi em

Yi = Yi + e i onde Yi = b1 + b 2 .X 2 i + K + b K .X Ki e e i = Yi Yi .
Subtraindo a mdia de Y de ambos os membros da equao acima, obteremos

Yi Y = Yi Y + e i ,
evidenciando que a diferena entre Y e a sua mdia consiste em uma parte explicada pelo modelo e outra parte no-explicada. Aps algumas transformaes (ver o Anexo III.1), pode-se mostrar que

(Y Y ) = (Y Y ) + (e )
2 2 i i i

SQT

SQR

SQE

Onde: SQT = Soma de Quadrados Total SQR = Soma de Quadrados da Regresso SQE = Soma de Quadrados dos Erros

Portanto, SQT seria uma medida de variao total em Y em relao sua mdia amostral, enquanto que SQR seria a parcela desta variao total que seria explicada pelo modelo de regresso. Logo, SQE seria a parcela de variao total de Y em relao sua mdia que no explicada pelo modelo. Assim, pode-se escrever simplesmente que:

SQT = SQR + SQE


Ento, ter-se- que:

SQT SQR SQE = + SQT SQT SQT


O que implica que

R2 =

SQR SQE = 1 SQT SQT

O componente SQR / SQT representa o chamado Coeficiente de Determinao e usualmente representado por R2. O coeficiente de determinao mostra a capacidade de explicao do modelo de regresso. Note que se o modelo for capaz de explicar 100% da variao em Y, o R2 seria necessariamente igual a 1, pois, SQE = 0, neste caso. Caso o modelo no consiga explicar de forma alguma a variao total de Y, ento ser o caso que R2 = 0. Portanto, pode-se concluir que 0 R2 1. Uma observao importante que o R2 no mede por si mesmo a qualidade do modelo de regresso. Portanto, no recomendvel seguir uma estratgia de regresso que vise apenas a sua maximizao. Lembre-se que a escolha do modelo economtrico deve estar intrinsecamente vinculada teoria econmica. Perceba ainda que o R2 sensvel tanto s variveis independentes escolhidas como ao tipo de modelo economtrico adotado. Ademais, mais fcil obter um R2 alto quando se lida com sries temporais. No caso, sries transversais, em geral, apresentam uma maior heterogeneidade.

Um exemplo: O Sr. Econopoulos deseja, portanto, saber o grau de ajustamento de seu modelo. No seu caso:

R2 =
ou

SQR 6782,92 = = 0,5413 SQT 1253182 ,

R 2 = 1

SQE 5748,896 = 1 = 1 0,4587 = 0,5413 . SQT 1253182 ,

Como interpretar este resultado? No caso, o modelo economtrico escolhido explica 54,13% da variao de pr em relao a sua mdia. O modelo possui um grau de ajustamento razovel.

Diferentes Formas Funcionais e o R2


O R2, que representa o grau de ajustamento do modelo, e este indicador sensvel forma funcional escolhida para o modelo. A forma mais utilizada a forma linear (nas variveis), que a que se tem utilizado at o presente momento.

[1]

Yi = 1 + 2 .X i + i

(LINEAR)

Outras formas funcionais podem ser utilizadas de acordo com o contexto e/ou com a teoria que fundamenta o modelo economtrico. Mas, que outras formas funcionais so mais utilizadas?

[2]

log(Yi ) = 1 + 2 . log(X i ) + i

(LOG LOG)

O modelo LOG-LOG derivado a partir de uma funo potncia, tal como:

Yi = A.X2 .ui i
No caso do modelo acima, tem-se que:

1 = log(A ) e i = log(ui )
O modelo LOG-LOG muito importante especialmente devido ao significado do parmetro 2 . No caso, este parmetro mede a elasticidade de X em relao a Y, representada por . Relembrando:

% Y d log(Y ) dY X . = 2 = = % X d log(X ) dX Y

A elasticidade mede a variao percentual de Y dada uma variao percentual em X, i.e., para cada 1% que X variar, Y variar em 2%. Este modelo tambm conhecido como o modelo de elasticidade constante.

[3]

log(Yi ) = 1 + 2 .X i + i

(LOG LINEAR)

O modelo LOG-LINEAR derivado a partir de uma funo exponencial, tal como:

Yi = A.e2 . Xi .ui
No caso do modelo acima, tem-se que:

1 = log(A) e i = log(ui )

[4]

Yi = 1 + 2 . log(X i ) + i

(LINEAR LOG)

O modelo LINEAR-LOG apropriado para descrever valores crescentes, mas que crescem a taxas decrescentes.

[5]

Yi = 1 + 2 .

1 + i Xi

(RECPROCO)

O modelo RECPROCO apropriado para descrever valores que se comportam como uma funo Hiprbole.

[6]

Yi = 1 + 2 .X i + K + n .X n1 + i i

(POLINOMIAL )

O modelo POLINOMIAL apropriado para descrever vrias situaes. O formato da curva estimada depender do grau do polinmio em questo. Neste caso, o grau do polinmio ser igual a n - 1. Perceba que se o grau for 1, o modelo polinomial ser exatamente igual ao modelo linear.

ANEXO III.1
DERIVAO DO R2
Considere o seguinte modelo de regresso:

Yi = 1 + 2 .X i + i
Aps a estimao do modelo tem-se que:

Yi = Yi + e i ,

onde

Yi = b1 + b 2 .X i .

Ento, algumas operaes podem ser feitas na expresso acima, quais sejam:

Yi Y = Yi Y + e i
(Y Y ) = (Y Y + e )
2 i i i i i 2

(Y Y )
i i

= Yi Y
i

) + (Y Y ).e + (e )
2 i i i i i

Mas, pode-se mostrar que

(Y Y ).e
i i i

= 0 . No caso:

(Y Y ).e = Y .e
i i i i i

Y. e i
i

Mas,

e
i i

= 0 , pois:
i i i i i 1

e = (Y Y ) = Y Y = Y (b
i i i i i i

+ b 2 .X i )

e = Y n.b
i i i i i i i i

b 2 . X i = Yi n. Y b 2 .X b 2 . X i
i i i 2

e = Y n.Y + n.b

.X b 2 . X i
i

e = Y Y + b . X
i i i i i i 2 i

b 2 . X i = 0
i

Logo:

(Y Y ).e = Y .e = (b
i i i i i i i

+ b 2 .X i ).e i

(Y Y ).e
i i

= b1. e i + b 2 . X i .e i = b 2 . X i .e i
i i i

que s ser igual a zero se e somente se

X .e
i i i i

= 0 . Mas,
i i i i 1

X .e = X .(Y Y ) = X .Y X .Y = X .Y X .(b
i i i i i i i i i i i i

+ b 2 .X i )

X .e = X .Y b . X
i i i i i i 1 i i i i i i i 2

b 2 . X i2
i i

X .e = X .Y (Y b .X ). X
i

b 2 . X i2
i

X .e = X .Y Y. X
i i i i i i i

+ b 2 .X. X i b 2 . X i2
i i

2 1 1 X i .e i = X i .Yi n . Yi . X i b 2 . X i2 n . X i i i i i i i

Mas,

b2 =

(X
i i

X . Yi Y
i

)(

)
=

n. X i .Yi X i . Yi
i i i

(X

n. X X i i i
2 i

1 X i .Yi . X i . Yi n i i i 1 X . X i n i i
2 i 2

Ento:

X .e = X .Y n . Y . X
i i i i i i i i i

1 X i .Yi . Yi . X i = 0 n i i i

Portanto:

(Y Y ) = (Y Y ) + (e )
2 2 i i i i i i

SQT
onde:

SQR

SQE

SQT = Soma de Quadrados Total SQR = Soma de Quadrados da Regresso SQE = Soma de Quadrados do Erro Assim:

SQT = SQR + SQE SQT SQR + SQE = SQT SQT SQR SQE + =1 SQT SQT
Ento, defina:

R2 =

SQR SQE = 1 SQT SQT

Ou alternativamente:

R2 =

(Y Y )
i i i i

(Y Y )

= 1

e
i i i

2 i 2

(Y Y )

(C.Q.D.)

PARTE IV
Hipteses do modelo de regresso linear e as propriedades dos estimadores de mnimos quadrados
Hipteses do modelo de regresso O modelo geral de regresso pode ser completamente especificado com base nas oito hipteses a seguir: [1] Linearidade dos parmetros Ver a explicao na Parte II. [2] As variveis explicativas devem ser consideradas determinsticas (i.e., no so aleatrias) e linearmente independentes entre si, i.e., uma varivel X no pode ser uma funo linear de outra. De uma maneira geral, uma varivel determinstica quando se considera que os seus valores podem ser pr-fixados, i.e., quando so fixos em repetidas amostras. Assim, no caso do Sr. Econopoulos poderamos pr-determinar um ano de fabricao qualquer, digamos 2000, e ento sortear aleatoriamente uma camioneta usada e observar o seu preo de revenda. Depois, mantendo-se o mesmo ano de fabricao, poderamos sortear mais uma camioneta usada e observar mais uma vez o preo por que foi revendida. E, assim por diante. As variveis explicativas tambm devem ser linearmente independentes, i.e., no possvel estimar um modelo em que uma varivel explicativa uma combinao linear de outras variveis explicativas. Portanto, como ficar mais claro futuramente, no ser possvel estimar, por exemplo o seguinte modelo:

Yi = 1 + 2 .X i + 3 .Mi + 3 .SBCi + i
onde Xi representa exportaes do pas i , Mi as importaes do pas i , e SBCi o saldo da balana comercial do pas i . fcil perceber que:

SBCi = X i Mi
Essa hiptese tambm implica que os valores de uma determinada varivel explicativa no podem ser todos iguais.

[3] E( i |X 2i ,K , XKi ) = E( i ) = 0, i ou E(|X ) = E( ) = 0 .


Essa hiptese diz que, dados os valores de X, o valor esperado do termo aleatrio deve ser zero para todas as observaes. Em outras palavras, o modelo no comete erros sistemticos, i.e., comete erros para mais ou para menos, mas que tendem a se cancelar. Essa hiptese equivalente a dizer que

E(Yi |X 2i ,K , XKi ) = 1 + 2 .X 2 i + K + K .XKi , i ou E(|X ) = X. ,

ou seja, o modelo terico est, na mdia, correto. Graficamente (em uma regresso simples):

[4] A distribuio de probabilidade de cada termo aleatrio i (i = 1,2, ...,n) tal que todas as distribuies apresentam a mesma varincia (Homocedasticidade). Formalmente, tem-se que: Var(1) = Var(2) = ... = Var(n) = 2 (cte.) Graficamente:

[5] A distribuio de probabilidade de cada termo aleatrio i (i = 1,2, ...,n) tal que todos eles no se correlacionam (hiptese da no-autocorrelao dos resduos). Formalmente, tem-se que: Cov(p, q) = 0, p,q , tal que p q. [6] O nmero de observaes n deve ser maior que o nmero de parmetros a serem estimados. Caso contrrio, o modelo de regresso no poder ser estimado. [7] O modelo economtrico est bem especificado, i.e., ele deve ser compatvel com a teoria que deseja testar e no conter erros de especificao. [8] Os valores aleatrios i (i = 1,2, ...,n) tem distribuio normal com mdia 0 e varincia 2, ou seja: i ~ N(0, 2) ou ~ N(0, 2.I) (Forma matricial) Estas hipteses, em conjunto, vo garantir propriedades estatsticas desejveis ao modelo, permitindo a estimao dos parmetros desconhecidos. Propriedades dos estimadores de mnimos quadrados O Sr. Econopoulos ficou muito contente com os resultados encontrados atravs da utilizao dos estimadores de mnimos quadrados na estimao dos parmetros desconhecidos.

Mas, uma questo especfica o preocupou: Ser que se eu coletasse outra amostra diferente as estimativas obtidas para o modelo seriam as mesmas? Ele pensou a respeito e percebeu que j que a frmula utilizada a mesma, ento, obviamente, amostras diferentes gerariam estimativas diferentes para os parmetros desconhecidos. Assim, ele percebeu que o valor assumido pelos estimadores no poderiam ser previstos a priori. Logo, os estimadores de M.Q. seriam, na verdade, variveis aleatrias. E, se so V.A.s, podem ser calculadas suas mdias e varincias. Assim, utilizando o conceito de esperana matemtica, o Sr. Econopoulos foi capaz de mostrar que

E (bk ) = k , k
n ou, em forma matricial

E (b ) =
n Ou seja, o Sr. Econopoulos descobriu que o valor esperado dos estimadores de M.Q. igual ao verdadeiro valor, desde que as hipteses bsicas do modelo de regresso sejam mantidas. Desta forma, os estimadores de M.Q. satisfazem uma propriedade estatstica muito importante. Eles so ditos no tendenciosos ou no viesados. Perceba que esta propriedade no garante que, ao estimar um modelo por este mtodo, os resultados sero os verdadeiros valores dos parmetros. Ela garante que, se forem computadas as estimativas de um nmero muito grande de amostras, os valores mdios destas estimativas devero ser iguais aos verdadeiros valores dos parmetros. Esta , sem dvida, uma propriedade desejvel. J que o Sr. Econopoulos no pode ter certeza absoluta se os valores dos parmetros estimados so iguais aos verdadeiros valores, ele pelo menos gostaria de ter um certo grau de confiana de que os valores estimados pelo modelo so representativos da realidade. Para que isto seja possvel, primeiramente necessrio calcular a varincia dos estimadores de M.Q. No caso, pode-se mostrar que

Var (b ) = 2 .( X ' X )

Mais especificamente, as varincias dos parmetros sero das pelos elementos da diagonal principal da matriz acima.

O problema que a varincia do termo aleatrio, 2, tambm desconhecida. Ento, o que fazer? O Sr. Econopoulos leu a respeito e verificou que um estimador no tendencioso de 2 o seguinte:

s2 =
onde,

n e'.e = ei2 n K i =1

(n K )

e = Y Y = Y X .b
ou

ei = Yi Yi = Yi b1 b2 .X 2i ... bK .X Ki
que representa o resduo estimado de mnimos quadrados. Assim, ele poderia estimar Var(b) da seguinte forma:

Var (b ) = s 2 .( X ' X )

E, ento, os erros padres dos parmetros poderiam ser calculados da seguinte frmula:

ep(bk ) = Var (bk )


O erro padro uma estimativa do desvio-padro do parmetro e uma medida da variabilidade do parmetro.

Um Exemplo Numrico
Utilizando a sua amostra, o Sr. Econopoulos foi capaz de fazer os clculos vistos anteriormente. No caso:

s2 =

e'.e 9 ,25.10 8 = 33.035.714 nK 30 2 Var (b1 ) = 1,17 1012


ep(b1 ) = Var (b1 )

ep(b1 ) = 1.082.318

Var (b2 ) = 293.341,5


ep (b2 ) = Var (b2 ) ep (b2 ) = 541,6101

O Caso do Modelo de Regresso Simples


Modelo bsico: Yi = 1 + 2 .X i + i

Equao estimada: Yi = b1 + b2 .X i Erro amostral: ei = Yi Yi = Yi b1 b2 .X i


Estimador da varincia dos erros: s 2 =

e
i =1

2 i

n2

Varincia amostral e erro padro de b1 e b2:


n X i2 var (b1 ) = s 2 . n i =1 n. X X i i =1

e ep(b1 ) = var (b1 ) 2

var (b2 ) =

s2

(X
n i =1

X)

e ep(b2 ) = var (b2 )

O Teorema de Gauss-Markov
O Sr. Econopoulos ficou intrigado, pois, havia descoberto frmulas para as mdias e varincias dos estimadores de M.Q., mas no sabia ainda se os resultados obtidos eram confiveis. Neste sentido, a primeira coisa a verificar seria se existem outros estimadores que produzem resultados melhores que os de M.Q. O teorema de Gauss-Markov garante que, se as hipteses do modelo de regresso linear forem satisfeitas (a hiptese de normalidade no necessria), ento, os estimadores de M.Q. sero MELNT (Melhores Estimadores Lineares No Tendenciosos). No caso, os estimadores de M.Q. sero os melhores estimadores lineares no tendenciosos, pois, possuem a menor varincia se comparados a qualquer outro estimador no-tendencioso. Em outras palavras, os estimadores de M.Q. so eficientes.

O teorema de Gauss Markov, portanto, mostra que nenhum outro estimador no tendencioso poder produzir resultados melhores do que os dos estimadores de M.Q. dado o conjunto de hipteses do modelo de regresso linear. Se o modelo no der bons resultados utilizando-se os estimadores de M.Q., ento, com certeza no melhorar utilizando-se qualquer outro estimador.

A Consistncia dos Estimadores de Mnimos Quadrados


Quais so as propriedades dos estimadores de mnimos quadrados se temos uma amostra grande, i.e., quando n ? A resposta para os estimadores de mnimos quadrados quer os erros sejam normais ou no encontra-se em duas propriedades j estabelecidas para eles: Os estimadores de mnimos quadrados so no-tendenciosos. As varincias dos estimadores de mnimos quadrados convergem para zero quando n . medida que o tamanho da amostra aumenta, as distribuies dos estimadores de mnimos quadrados tendem a concentrar-se em torno dos verdadeiros parmetros. E, quando n , a probabilidade de uma estimativa b estar prxima de tende para um. Assim, dizemos que os estimadores de mnimos quadrados so consistentes.

PARTE V
O teste de significncia dos parmetros
O Sr. Econopoulos continua em sua busca por uma maior confiabilidade nos resultados obtidos atravs da estimao do modelo. Ele percebeu que, apesar dos estimadores de M.Q. possurem propriedades estatsticas desejveis, no se pode ter certeza absoluta se os valores estimados dos parmetros so verdadeiramente representativos da realidade. Mais especificamente, alm da estimativa pontual dos parmetros, faz sentido levar tambm em considerao a sua variabilidade amostral. E, assim, deseja-se excluir a hiptese de que cada um dos parmetros possa ser igual a zero. Se a hiptese de normalidade dos resduos for satisfeita, ento, ser possvel desempenhar um teste para verificar se tal hiptese pode ou no pode ser refutada. Testes de Hipteses Um teste de hipteses constitudo por 4 elementos: [1] Uma hiptese nula (H0) [2] Uma hiptese alternativa (H1) [3] Um teste estatstico [4] Uma regio de rejeio de H0. O Teste de Significncia dos Parmetros O teste de significncia dos parmetros um teste de hipteses particular em que as hipteses nula e alternativa so sempre as seguintes: H0: k = 0 H1: k 0 para k = 1,...,K, ou seja, o teste deve ser efetuado para todos os parmetros do modelo individualmente. Perceba que a hiptese nula aquela que se quer colocar prova. De acordo com o teste estatstico ser possvel rejeit-la ou, ento, no haver como afirmar com um alto grau de certeza que o parmetro em questo , de fato, diferente de zero. No caso em anlise, o teste que ser utilizado ser o teste t, cuja estatstica dada por:

t=

b k k ep(bk )

Se H0 for verdadeira, ento, pode-se mostrar que

t=

bk ~ t (nK ) ep(bk )

Caso contrrio, t no seguir a distribuio t com n - K graus de liberdade. E, como saber se o teste rejeita ou no rejeita a hiptese nula? Deve-se comparar o valor obtido da estatstica t com um valor crtico determinado de acordo com a distribuio t. Este valor ser representado por tc. No caso, tem-se que

P(t > t c ) = P(t < t c ) =

o nvel de significncia do teste, que representa um valor de probabilidade que usualmente escolhido como 5%. Perceba que o valor de tc tambm depende do nmero de graus de liberdade do modelo que igual a n K. Em geral, quanto mais graus de liberdade, menores sero os valores de tc.

Perceba que a probabilidade do valor de t estar direita de tc ou esquerda de tc igual metade do nvel de significncia, ou 2,5%. Como a distribuio t simtrica, isto significa dizer que a probabilidade do t calculado estar em cada uma das caudas da distribuio de 2,5%. Como conseqncia,

P( t c t t c ) = 1 = 95%
A partir dessas idias, ento, possvel definir um regra clara para a rejeio ou no rejeio de H0. Assim, como regra geral, tem-se que se t < - tc ou se t > tc ento rejeita-se a hiptese nula e, portanto, diz-se que o parmetro estatisticamente significante ou significativamente diferente de zero ao nvel de significncia .

Mas, se - tc t tc ento no se poder rejeitar a hiptese nula e, portanto, diz-se que o parmetro em questo no estatisticamente significante ao nvel de significncia . Note ainda que no teste de significncia usualmente deseja-se rejeitar a hiptese de que os parmetros sejam individualmente iguais a zero, para que as variveis explicativas escolhidas tenham realmente algum poder de explicao da varivel dependente. Caso contrrio, ter-se-, por exemplo, que:

Yi = 1 + 2 .X 2i + ... + 0.X ji + ... + K .XKi + i


Ou seja, o impacto da varivel explicativa Xj sobre Y ser desprezvel. No caso do teste de significncia, quando no se rejeita a hiptese nula, isto no quer dizer que o verdadeiro valor do parmetro igual a zero. O ponto fundamental que no ser possvel afirmar com um alto nvel de confiana que o parmetro diferente de zero. Portanto, do ponto de vista estatstico, se pode ser igual a zero, ento, deve ser tratado como se fosse zero. Exemplo: Preo de revenda de camionetas (I) Seja =0,05. O valor crtico tc 2,048 para uma distribuio t com (T2) = 28 graus de liberdade. A estimativa de mnimos quadrados de 2 b2 = 3.133,02 com erro padro ep(b2)= 541,61. O valor da estatstica do teste

t=

b2 3113,02 = = 5,747710 > t c = 2,048 ep(b 2 ) 541,61

Concluso: J que t = 5,74 > tc = 2,048, ns rejeitamos H0: 2=0 e no rejeitamos a alternativa, H1: 20. Assim, existe uma relao estatisticamente significante entre a o preo de revenda e o ano de fabricao da camioneta. O P-Valor do Teste de Hiptese Um problema com a anlise anterior que nem sempre o valor do t crtico fornecido pelos pacotes economtricos. Assim, o p-valor do teste calculado encontrando qual a probabilidade da distribuio t tomar um valor igual ou maior do que o valor absoluto do valor amostral da estatstica do teste.

Regra de rejeio: quando o p-valor do teste de hiptese menor do que o valor escolhido de , ento o procedimento do teste leva rejeio da hiptese nula. Se o p-valor for maior do que , ns no rejeitamos a hiptese nula. Exemplos grficos: t1 < tc e t2 > tc

Exemplo: Preo de revenda de camionetas (II) Considerando-se agora o p-valor tem-se que para 2 : O p-valor para o teste de hiptese p = 0,0000 que a rea nas caudas da distribuio t(28), onde |t| 5,74. J que p , ns rejeitamos a hiptese nula de que 2 = 0 e no rejeitamos a alternativa de que 2 0. Assim, existe uma relao estatisticamente significante entre pr e af. Perceba esta anlise deve tambm ser feita para 1 e para os demais parmetros do modelo quando for o caso. Mais especificamente, neste exemplo, p-valor para 1 foi igual a zero, mostrando que a constante neste caso estatisticamente diferente de zero. Exemplo: Preo de revenda de camionetas (III) Considere agora o seguinte modelo:

pri = 1 + 2 .afi + 3 .nfi + i

onde nf representa o nmero de filhos dos donos anteriores. A estimao do modelo mostra que os p-valores de 1 e de 2 so iguais a 0,0000 enquanto que o p-valor de 3 igual a 0,8961. Assim, conclui-se 3 no estatisticamente significante, i.e., pode ser igual a zero, e, portanto, esta varivel adicionada no possui qualquer impacto sobre o modelo. Em outras palavras, a varivel adicionada redundante, pois, ela no explica os movimentos de pr.

PARTE VI
O R2 ajustado e o teste de significncia do modelo
Depois de aprender sobre o coeficiente de determinao, o Sr. Econopoulos percebeu que ainda poderia melhorar o grau de ajustamento de seu modelo. No caso, a forma funcional escolhida parecia-lhe apropriada para analisar o problema em questo. Ento, o que fazer? Uma opo seria incluir variveis explicativas no modelo, pois, medida em que elas so acrescentadas, o R2 do modelo necessariamente no se reduzir ( provvel que aumente). Logo, a questo ser que varivel ou variveis explicativas incluir. O Sr. Econopoulos pensou bastante e lembrou-se que as camionetas APRIGIUS possuem trs tipos de motorizao. O modelo padro vem com motor de 2000 cilindradas, mas o cliente poder optar por motores de 3000 ou 4000 cilindradas. Ento, o Sr. Econopoulos decidiu acrescentar o nmero de cilindradas (cc) da camioneta como uma varivel explicativa adicional do modelo. No caso, ele espera que o sinal do coeficiente que multiplica esta varivel seja positivo, pois, quanto mais cilindradas maior dever ser o preo de revenda da camioneta, em mdia. O seu modelo economtrico ser agora:

pri = 1 + 2 .afi + 3 .cc i + i


A estimao do modelo por M.Q. produziu os seguintes resultados:

pri = 5664873 + 2843,19.afi + 7,02.cc i t

( 7,82)

(7,84 )

(6,04 )

R 2 = 0,804755
Como pode-se perceber, o parmetro da varivel cc significativamente diferente de zero, conforme indica o seu teste t. E, o sinal de seu coeficiente foi compatvel com o que era esperado. O coeficiente estimado indica, neste caso, que cada cilindrada a mais no motor, aumentar o preo de revenda em R$ 7,02 aproximadamente. Ademais, o grau de ajustamento do modelo aumentou bastante depois da incluso desta varivel, passando de 54% para mais de 80%.

Este resultado foi bastante animador para o Sr. Econopoulos, pois, a sua confiana no modelo aumentou. O R2 ajustado Uma dificuldade com o R2 que ele pode ser aumentado pela incluso de novas variveis, mesmo se as variveis acrescentadas no apresentarem qualquer justificativa econmica. Novas variveis tendem a reduzir SQE. Uma medida alternativa para mensurar a qualidade do ajustamento chamada de R2 ajustado. Ele calculado como

R 2 = 1

SQE (n K ) SQT (n 1)

Perceba que, no caso do R2 ajustado, o SQE est dividido por (n - K) e se forem adicionadas novas variveis ao modelo ele no necessariamente crescer. Mais especificamente, o quanto mais elevados e prximos forem o R2 e o R2 ajustado, melhor ser a qualidade do modelo estimado. Quanto mais variveis insignificantes forem introduzidas no modelo, maior tende a ser a diferena entre o R2 e o R2 ajustado. Isto sugere que no se deve adotar a estratgia de aumentar o R2 incluindo indiscriminadamente o maior nmero de variveis explicativas possvel. Para testar estas idias, o Sr. Econopoulos resolveu acrescentar a varivel nf ao modelo para comparar os resultados com o seu modelo atual. Ele obteve os seguintes resultados:

pri = 5664873 + 2843,19.afi + 7,02.cc i t

( 7,82)

(7,84 )

(6,04 )

R 2 = 0,804755

R 2 = 0,790292

pri = 5482767 + 2751,47.afi + 7,17.cc i + 439,71.nfi t

( 7,34 )

(7,36 )

(6,11)

(1,00 )

R 2 = 0,811954

R 2 = 0,790256

Como se pode perceber, a introduo de uma varivel que no significativa no modelo aumentou o R2 e ainda provocou uma pequena queda no R2 ajustado do modelo.

Mais especificamente, pode-se notar que a diferena entre estes dois indicadores aumentou, o que indica que esta varivel adicional est inflando o R2 sem melhorar necessariamente o poder de explicao do modelo. O R2 ajustado no tem o mesmo significado que o R2. Ele apenas mostra se a incluso de variveis adicionais justificvel.

O teste de significncia do modelo O Sr. Econopoulos tambm verificou que no suficiente verificar a significncia dos parmetros individualmente. Claro!, pensou o Sr. Econopoulos. Quando assisto a uma partida de futebol eu no analiso apenas a performance individual dos jogadores. Eu tambm estou interessado em saber se o time jogou bem! Assim, o Sr. Econopoulos deve encontrar uma maneira de verificar se o modelo escolhido significante. Como fazer isto?O Sr. Econopoulos considerou o seguinte modelo:

pri = 1 + 2 .afi + 3 .cc i + i

Este ser considerado o modelo sem restries. Ele deseja, ento, testar as seguintes hipteses: H0: 2 = 0 e 3 = 0 H1: 2 0 e/ou 3 0 Se a hiptese nula for verdadeira, ento:

pri = 1 + i
Este ser o modelo restrito, representado por R. Desta forma, o teste que ser efetuado o seguinte:

F=

(SQER SQE ) J SQE (n K )

J o nmero de hipteses, que no caso do teste de significncia do modelo igual a K - 1. Deve-se perceber que:

SQER SQE 0

Ou seja, a soma de quadrados dos erros do modelo restrito sempre maior ou igual soma de quadrados dos erros do modelo irrestrito. Lembre-se que a incluso de variveis explicativas no modelo no pode piorar o seu poder de explicao! Portanto, o que o teste tenta medir exatamente se a incluso de todas as variveis explicativas desejadas provocaram uma reduo significativa em SQE.Se a hiptese nula for verdadeira, ento a estatstica F tem uma distribuio F com J graus de liberdade no numerador e (n - K) graus de liberdade no denominador. Deve-se rejeitar a hiptese nula se o valor da estatstica do teste F se tornar muito grande (os dois modelos sero muito diferentes). preciso comparar o valor de F com um valor crtico que deixa uma probabilidade na cauda superior da distribuio F com J e (n - K) graus de liberdade. Assim, como no teste t, um nvel de significncia de 5% usualmente utilizado neste caso. A figura abaixo mostra o valor de Fc no caso em que h dois graus de liberdade no numerador (m=2) e 27 graus de liberdade no denominador (n=27). Tem-se que Fc = 3,36.

Existe uma frmula mais simples para o teste de significncia do modelo com a qual no necessrio comparar dois modelos diferentes. Basta pensar no modelo sem restrio (que o modelo proposto). Esta frmula parte da idia que SQER = SQT (Soma de Quadrados Total do modelo sem restries). Ento:

F=

(SQT SQE ) (K 1) = SQR (K 1) SQE (n K ) SQE (n K )

F=

(SQR SQT ) (K 1) = R2 (K 1) (SQE SQT ) (n K ) (1 R 2 ) (n K )

Exemplo No caso do modelo do Sr. Econopoulos, tem-se que n = 30; K = 3; e R2 = 0,804755. Ento:

F=

0,804755 (3 1) 55,64 (1 0,804755 ) (30 3)

Ento, pode-se perceber que F = 55,64 > 3,36 = Fc. Assim, rejeita-se a hiptese nula de que os parmetros 2 e 3 so simultaneamente iguais a zero. Logo, o modelo estatisticamente significativo.

P-valor = 0,0500

P-valor = 0,0000

Você também pode gostar