Escolar Documentos
Profissional Documentos
Cultura Documentos
I Metodologia da Econometria
O termo regresso foi introduzido por Francis Galton. Ele verificou que, embora houvesse uma
tendncia de pais altos terem filhos altos e de pais baixos terem filhos baixos, a altura mdia dos filhos de pais
de uma dada altura tendia a se deslocar ou regredir at a altura mdia da populao como um todo. Em outras
palavras, a altura dos filhos de pais extraordinariamente altos ou baixos tende a se mover para a altura mdia da
populao.
A interpretao moderna da regresso diferente ocupa-se do estudo da dependncia de uma varivel
(chamada varivel endgena, resposta ou dependente), em relao a uma ou mais variveis, as variveis
explicativas (ou exgenas), com o objetivo de estimar e/ou prever a mdia (da populao) ou valor mdio de
dependente em termos dos valores conhecidos ou fixos (em amostragem repetida) das explicativas.
importante ressaltar que embora a anlise de regresso lide com a dependncia de uma varivel em
relao a outras variveis, ela no implica necessariamente em causa. Uma relao estatstica, por mais forte e
sugestiva que seja, jamais pode estabelecer uma relao causal. As idias sobre causa devem vir de fora da
estatstica, enfim, de outra teoria.
A anlise de regresso conceitualmente muito diferente da anlise de correlao, cujo objetivo bsico
medir a intensidade ou o grau de associao linear entre duas variveis. Por exemplo, podemos estar
interessados em achar a correlao entre o hbito de fumar e o cncer no pulmo. Ou ainda, a correlao entre
as pontuaes em exames de estatstica e de matemtica.
Na anlise de regresso no estamos interessados em tal medio. Em vez disso, tentamos estimar ou
prever o valor mdio de uma varivel com base nos valores fixados de outras variveis. Assim, podemos querer
saber se possvel prever a nota mdia em uma prova de estatstica sabendo a nota de um estudante em uma
prova de matemtica. O coeficiente de correlao mede a intensidade da associao (linear)
A mdia condicional uma funo de X i , em que f(X i ) indica alguma funo da varivel explicativa X i .
A equao (2.1) conhecida como funo de regresso populacional (FRP) (ou equao de regresso linear) de
1
duas variveis. Como uma primeira aproximao ou uma hiptese de trabalho, podemos supor que FRP
E(Y/Xi) seja uma funo linear de Xi, do tipo
Especificao estocstica
(2.3) Y = 1 + 2 X i + u i . Onde ui uma varivel aleatria no-observvel que pode assumir valores
positivos ou negativos, tambm conhecido como termo de erro estocstico ou perturbao estocstica.
Na maioria das situaes prticas somente uma amostra de valores Y correspondentes e alguns Xs
fixos. A nossa tarefa estimar a FRP com base nas informaes da amostra.
Analogamente a FRP, que fundamenta a reta de regresso da populao, podemos desenvolver o
conceito de FUNO DE REGRESSO AMOSTRAL (FRA) para representar a reta de regresso amostral. A
amostra contrapartida da Equao (2.2) pode ser escrita como
Yi 1 2 X i , onde:
Yi = estimador de E(Y/X i )
1 = estimador de 1
2 = estimador de 2
Estimador e Estimativa
Estimador, tambm conhecido como uma estatstica (baseado na amostra), simplesmente uma regra,
frmula ou mtodo que nos diz como estimar o parmetro da populao a partir das informaes dadas pela
amostra disponvel.
Estimativa um valor numrico particular obtido pelo estimador em uma aplicao conhecido como
uma estimativa.
Yi 1 2 X i u i
Yi = 1 + 2 Xi + ui
Yi 1 2 X i u i
2
Yi = 1 + 2Xi + ui
Yi 1 2 X i u i
Y Y u
i i i
Onde:
Yi o valo (mdia condicional) estimado de Yi.
u Y Y
i i i
u i Y i 1 2 X i u i
u Y
i i
Yi seja a menor possvel. Se adotarmos o critrio de minimizar esta soma todos os
resduos recebem o mesmo peso na soma embora alguns resduos estejam muito mais prximos de FRA que
outros. Ou seja, os resduos tm igual importncia, independentemente de quo prximas ou dispersas as
observaes individuais sejam relativamente a FRA.
A soma algbrica desses resduos zero. Podemos evitar este problema adotando o critrio dos mnimos
quadrados, segundo o qual a FRA pode ser fixada de tal modo que:
u Y
2
Yi
2
i i
u Y 2
1 2 X i
2
i i
Ao elevar u i ao quadrado, este mtodo d maior peso a resduos prximos da FRA do que os distantes.
A soma dos resduos elevados ao quadrado alguma funo dos estimadores e ; 1 2
O Mtodo dos mnimos quadrados escolhe 1 e 2 de tal maneira que, para uma dada amostra ou
u
2
conjunto de dados, i a menor possvel. Ou seja, para uma dada amostra, o mtodo dos mnimos
quadrados nos fornece estimativas nicas de 1 2 que do o menor valor possvel de u
2
i .
Para chegar a este resultado trata-se de um exerccio simples de clculo diferencial.
3
DERIVAO DE ESTIMATIVAS POR MNIMOS QUADRADOS
EQUAES NORMAIS
Passo 1:
(Y i 1 2 X i )
2
( i2 ) ( (Y i Yi )
2
1 1 1
2 (Y i 1 2 X i ) ( 1)
2 (Yi 1 2 X i )
2 i2 ( equao 3 .1)
(Y i 1 2 X i )
2
( i2 ) ( (Y i Yi )
2
2
2
2
2 (Y X ) ( X )
i 1 2 i i
2 (Y i 1 2 X i ) X i
2 i2 X i ( equao 3 .2 )
Passo 2: Equaes Normais. Para achar o ponto de mnimo igualamos as equaes do passo 1 a zero:
2 (Yi 1 2 X i ) 0
(Y X ) 0
i 1 2 i
Y X 0
i 1 2 i
Y n X 0
i 1 2 i
(equao3.3) Y n X i 1 2 i
2 (Yi 1 2 X i ) X i 0
(Y X ) X 0
i 1 2 i i
Y X X X 0
i i 1 i 2 i
2
Y X X X 0
i i 1 i 2 i
2
Y X X X 0
i i 1 i 2 i
2
(equao3.4) Y X X X i i 1 i 2 i
2
4
(equao3.3) Yi n1 2 X i
n1 Yi 2 X i
(equao3.3.1) 1
Y i
2
X i
n n
ou
(equao3.3.1) 1 Y 2 X
(equao3.4) X i Yi 1 X i 2 X i2
Yi X
X Y 2 X i 2 X i
i 2
i i
n n
X Y X 2
X Y 2 X i2
i i i
i i 2
n n
X Y Xi
2
X Y 2 X i
i i 2
i i
n n
X 2
X i Yi i i
X Y
2 X i
2 i
n n
n X i2 X i 2 n X i Yi X i Yi
2
n n
2 (1 / n) n X i2 X i
2
(1/ n)n X Y X Y
i i i i
(1 / n) n X i Yi X i Yi
2
(1 / n) n X i2 X i
2
n X i Yi X i Yi
2
n X i2 X i
2
2
X X Y Y
i i
X X
2
i
ou
2
X X Y Y
i i
X X
2
i
2
x y
i i
x
2
i
Onde:
xi X i X
y i Yi Y
x i 2 X i X
5
O Modelo Clssico de Regresso Linear: As Hipteses Subjacentes ao Mtodo dos Mnimos Quadrados
O nosso objetivo no somente obter 1 e 2 , mas tambm fazer inferncias sobre os verdadeiros 1 e
2 . Por exemplo, gostaramos de saber quo prximo Yi do verdadeiro E(Y/X i ). Para tanto, devemos no
apenas especificar a forma funcional do modelo, como, mas tambm formular certas hipteses sobre o modo
pelo qual Yi so gerados.
As estimativas por mnimos quadrados so uma funo dos dados da amostra. Mas como os dados
provavelmente variam de amostra para amostra, as estimativas variaro. Conseqentemente, o que se necessita
de alguma medida de confiabilidade ou preciso dos estimadores 1 e 2 . Na estatstica, a preciso de uma
estimativa medida por seu erro-padro (ep).
Data as hipteses os erros-padro das estimativas por MQO podem ser obtidos:
2
var( 2 )
x 2
i
ep( 2 )
x 2
i
var( 1 )
X i
2
2
n x 2
i
ep( 1 )
X i
2
n x 2
i
2
u 2
i
n2
Dada as hipteses do modelo clssico de regresso linear, as estimativas por mnimos quadrados
possuem algumas propriedades ideais ou timas. Estas propriedades esto contidas no conhecido teorema de
Gauss-Markov. Para entender este teorema, precisa considerar a propriedade do melhor estimador linear
no-viesado para um estimador.
O estimador de MQO 2 , um melhor estimador linear no-viesado (MELNV) de 2 , caso seja vlido
o seguinte:
1. linear, isto , uma funo linear de uma varivel aleatria, tal como a varivel dependente Y no
modelo de regresso.
2. no-viesado, isto , seu valor mdio ou esperado, E( 2 ), igual ao valor verdadeiro, 2 .
3. Tem mnima varincia na classe de todos esses estimadores lineares no-viesados; um estimador no-
viesado com a menor varincia conhecido como um estimador eficiente.
6
O Coeficiente de Determinao r2: Uma Medida do Grau de Ajuste.
Y Y
2
SQE
2 i
r
Y Y
2
i
SQT
Seja:
SQT = SQE + SQR
r 2
1
u 2
i
Y Y
2
i
SQR
1
SQT
A quantidade r2 assim definida conhecida como coeficiente de determinao (da amostra) e a medida
utilizada do grau de ajuste de uma reta de regresso. Traduzindo, r2 mede a proporo ou a porcentagem da
variao total em Y explicada pelo modelo de regresso.
Duas propriedades de r2 podem ser destacadas: