Você está na página 1de 124

Anlise de Regresso com Dados

de Corte Transversal

parte 1 do texto aborda a anlise de regresso com dados de corte transversal. Ela se apia na
lgebra estudada nos cursos superiores e em conceitos bsicos de probabilidade e estatstica.
Os Apndices A, B e C contm revises completas sobre esses tpicos.
O Captulo 2 tem incio com o modelo de regresso linear simples, no qual explicamos uma varivel
em termos de outra. Embora a regresso simples no seja amplamente usada em econometria aplica
da, ela utilizada ocasionalmente e serve como um ponto de partida natural, pois sua lgebra e suas
interpretaes so relativamente simples.
Os captulos 3 e 4 cobrem os fundamentos da anlise de regresso mltipla, em que permitimos
que mais variveis afetem a varivel que estamos tentando explicar. A regresso mltipla ainda o
mtodo mais geralmente usado na pesquisa emprica, de modo que esses captulos merecem ateno
cuidadosa. O captulo 3 enfatiza a lgebra do mtodo de mnimos quadrados ordinrios (MQO), esta
belecendo ainda as condies necessrias para que os estimadores MQO sejam no-viesados e tambm
os melhores estimadores lineares no-viesados. O Captulo 4 trata do importante tpico da inferncia
estatstica.
O Captulo 5 discute as propriedades referentes s amostras grandes, ou assintticas, dos esti
madores MQO. Essa discusso oferece a justificativa para os procedimentos de inferncia do Captulo 4
quando os erros em um modelo de regresso no so normalmente distribudos. O captulo 6 cobre
alguns tpicos adicionais da anlise de regresso, incluindo questes avanadas sobre forma funcional,
transformao dos dados, previso e grau de ajuste da estimao. O Captulo 7 explica como a infor
mao qualitativa pode ser incorporada em modelos de regresso mltipla.
O Captulo 8 ilustra como testar e corrigir o problema da heteroscedasticidade, ou varincia no-
constante, no termo erro. Mostramos como as estatsticas MQO usuais podem ser ajustadas e tambm
apresentamos uma extenso do mtodo MQO, conhecida como mtodo dos mnimos quadrados pon
derados, que explica diretamente as diferentes varincias dos erros. O Captulo 9 explora o importante
problema da correlao entre o termo erro e uma ou mais das variveis explicativas. Demonstramos
como a utilizao de uma varivel proxy pode resolver o problema de variveis omitidas.
Adicionalmente, determinamos o vis e a inconsistncia dos estimadores MQO na presena de certos
tipos de erros de medida nas variveis. Diversos problemas de tratamento dos dados so tambm dis
cutidos, incluindo o problema dos outliers.
0 Modelo de Regresso Simples

modelo de regresso simples pode ser usado para estudar a relao entre duas variveis. Por
razes que veremos adiante, o modelo de regresso simples tem limitaes enquanto ferramenta
geral para a anlise emprica. No entanto, s vezes ele apropriado como ferramenta emprica.
Aprender como interpretar o modelo de regresso simples uma boa prtica para estudar a regresso
mltipla, o que faremos nos captulos subseqentes.

2.1 DEFINIO DO MODELO DE REGRESSO SIMPLES

Grande parte da anlise economtrica comea com a seguinte premissa: y e x so duas variveis, repre
sentando alguma populao, e estamos interessados em explicar y em termos de x, ou em estudar
como y varia com variaes em x. Discutimos alguns exemplos no Captulo 1, incluindo: y a produ
o de soja, e x, a quantidade de fertilizantes; y o salrio-hora, e x, anos de educao; e y uma taxa
de criminalidade em uma comunidade, e x, o nmero de policiais.
Ao escrever um modelo que explicar y em termos de x, defrontamo-nos com trs questes.
Primeira, como nunca h uma relao exata entre duas variveis, como consideramos outros fatores
que afetam y? Segunda, qual a relao funcional entre y e x? E terceira, como podemos estar certos
de que estamos capturando uma relao ceteris paribus entre y e x (se esse for um objetivo desejado)?
Podemos resolver essas ambigidades escrevendo uma equao que relaciona y a x. Uma equao
simples

y = Po + Pix + u. (2.1)

A equao (2.1), que supostamente vlida para a populao de interesse, define o modelo de regres
so linear simples. Ela tambm chamada modelo de regresso linear de duas variveis ou modelo
de regresso linear bivariada, pois relaciona as duas variveis x e y. Vamos discutir, agora, o signifi
cado de cada uma das quantidades em (2.1). (A propsito, o termo regresso tem origens que no so
especialmente importantes para muitas das aplicaes economtricas modernas, de modo que no
o explicaremos aqui. Veja Stigler (1986) para uma histria interessante da anlise de regresso.)
Quando relacionadas por (2.1), as variveis y e x tm vrios nomes diferentes, os quais so inter-
cambiveis, como explicado em seguida, y chamada a varivel dependente, a varivel explicada,
a varivel de resposta, a varivel prevista, ou o regressando, x chamada a varivel independen
te, a varivel explicativa, a varivel de controle, a varivel previsora, ou o regressor. (O termo

20
Wooldridge Captulo 2 O Modelo de Regresso Simples 21

covarivel tambm usado para x.) Os termos varivel dependente e varivel independente so
usados com freqncia em econometria. Mas esteja consciente de que o nome independente no se
refere aqui noo estatstica de independncia entre variveis aleatrias (veja Apndice B, dispon
vel na pgina do livro, no site www.thomsonleaming.com.br).
Os termos variveis explicada e explicativa so, provavelmente, os mais descritivos.
Resposta e controle so muito usados nas cincias experimentais, em que a varivel x est sob o
controle do pesquisador. No usaremos os termos varivel prevista e previsora, embora algumas
vezes voc os veja no texto. Nossa terminologia para a regresso simples est resumida na Tabela 2.1.

Tabela 2,1_____________________________________________________________________________
Terminologia para a Regresso Simples

y X

Varivel Dependente Varivel Independente

Varivel Explicada Varivel Explicativa

Varivel de Resposta Varivel de Controle

Varivel Prevista Varivel Previsora

Regressando Regressor

A varivel u, chamada de termo erro ou perturbao da relao, representa outros fatores, alm
de x, que afetam y. Uma anlise de regresso simples trata, efetivamente, todos os fatores, alm de a,
que afetam) como no-observados. Voc pode pensar em u, convenientemente, como representando o
no-observado.
A equao (2.1) tambm trata da questo da relao funcional entre y e x. Se os outros fatores em u
so mantidos fixos, de modo que a variao em u zero, An = 0, ento x tem um efeito linear sobre v:

Ay = /3,Ax se An = 0. (2.2)

Assim, a variao em y , simplesmente, /3, multiplicado pela variao em x.ilsso significa que 1, o
parmetro de inclinao da relao entre y e x, mantendo fixos os outros faW es em ; ele de inte
resse fundamental em economia aplicada. O parmetro de intercepto /30 tambm tm seus usos,
embora ele raramente seja central para uma anlise.

EXEMPLO 2.1
(Produo de Soja e Fertilizantes)
Suponha que a produo de soja seja determinada pelo modelo

produo = /30 + /3, fertilizante + n, (2.3)


22 Introduo Econometria - Editora Thomson

EXEMPLO 2.1 (continuao)


de modo quey = p ro d u o e x = fe rtiliza n te s. O pesquisador agrcola est interessado no efeito dos ferti
lizantes sobre a produo, mantendo outros fatores fixos. Esse efeito dado por /3,. O termo erro u contm
fatores como qualidade da terra, chuva etc. O coeficiente mede o efeito dos fertilizantes sobre a produo,
mantendo outros fatores fixos: A p ro d u o = p ^ fe r tiliz a n te .

EXEMPLO 2.2
(Uma Equao Simples do Salrio)
Um modelo que relaciona o salrio de uma pessoa educao observada e outros fatores no-observados

salrioh = f30 + p leduc + u. (2.4)

Se sal rio h medido em dlares por hora e e d u c corresponde a anos de educao formal, y3, mede a varia
o no salrio-hora dado um ano a mais de educao, mantendo todos os outros fatores fixos. Alguns des
ses fatores incluem experincia da fora de trabalho, aptido inata, permanncia com o empregador atual,
tica no trabalho e inumerveis outras coisas.

A linearidade de (2.1) implica que uma variao de uma unidade em * tem o mesmo efeito sobre
y, independentemente do valor inicial de x. Isso irrealista para muitas aplicaes econmicas. Por
exemplo, no salrio-educao, poderamos querer considerar retornos crescentes: o prximo ano de
educao teria, em relao ao anterior, um efeito maior sobre os salrios. Veremos como considerar
tais possibilidades na Seo 2.4.
A questo mais difcil saber se o modelo (2.1) realmente nos permite tirar concluses ceteris
paribus sobre como x afeta y. Acabamos de ver, na equao (2.2), que /3, mede, de fato, o efeito de x
sobre y, mantendo todos os outros fatores (em u) fixos. Encerra-se com isso a questo da causalidade?
Infelizmente, no. Como podemos esperar aprender algo, em geral, sobre o efeito ceteris paribus de x
sobre y, mantendo outros fatores fixos, quando estamos ignorando todos aqueles outros fatores?
A Seo 2.5 mostrar que somos capazes de obter estimadores confiveis de p 0 e p t de uma amos
tra aleatria de dados somente quando fazemos uma hiptese que restrinja a maneira de como o termo
no-observvel u est relacionado varivel explicativa x. Sem tal restrio, no seremos capazes de
estimar o efeito ceteris paribus, /?,. Como u e x so variveis aleatrias, precisamos de um conceito
baseado em probabilidade.
Antes de expormos a hiptese crucial de como x e u so relacionados, podemos sempre fazer uma
hiptese sobre u. Se o intercepto /30 est includo na equao, nada se perde ao assumir que o valor
mdio de u na populao zero.
Matematicamente,

E (w) = 0. (2.5)
Wooldridge Captulo 2 O Modelo de Regresso Simples 23

A hiptese (2.5) no diz nada sobre a relao entre w e x; ela simplesmente faz uma afirmao sobre a
distribuio dos fatores no-observveis na populao. Usando os exemplos anteriores como ilustra
o, podemos ver que a hiptese (2.5) no muito restritiva. No Exemplo 2.1, no perdemos nada ao
normalizar os fatores no-observveis que afetam a produo de soja, tal como a qualidade da terra,
para ter uma mdia zero na populao de todos os lotes cultivados. O mesmo verdadeiro para os fato
res no-observveis do Exemplo 2.2. Sem perda de generalidade, podemos assumir que coisas como a
mdia da aptido so zero na populao de todas as pessoas que trabalham. Se voc no est conven
cido, pode trabalhar com o Problema 2.2 para ver que podemos sempre redefinir o intercepto na equa
o (2.1) para tomar (2.5) verdadeiro.
Agora, vamos voltar hiptese crucial concernente u e x como so relacionados. Uma medida
natural de associao entre duas variveis aleatrias o coeficiente de correlao. (Veja Apndice B,
disponvel no site da Thomson, para definio e propriedades.) Se u e x so no-correlacionados, logo,
enquanto variveis aleatrias, no so linearmente relacionados. Assumir que u e x so no-relaciona-
dos requer um caminho longo para definir o sentido em que u c x deveriam ser no-correlacionados na
equao (2.1). Mas isso no vai longe o suficiente, pois a correlao mede somente a dependncia
linear entre u e x. A correlao tem uma caracterstica algo contra-intuitiva: possvel que u seja no-
correlacionado com x e seja correlacionado com funes de x, tal como x2. (Veja Seo B.4 para uma
discusso adicional.) Essa possibilidade no aceitvel para muitos propsitos da regresso, visto que
causa problemas para interpretar o modelo e para derivar propriedades estatsticas. Uma hiptese
melhor envolve o valor esperado de u, dado x.
Como u e x so variveis aleatrias, podemos definir a distribuio condicional de u, dado qual
quer valor de x. Em particular, para qualquer x, podemos obter o valor esperado (ou mdio) de u para
aquela fatia da populao descrita pelo valor de x. A hiptese crucial que o valor mdio de u no
depende do valor de x. Podemos escrever isso como

E(m|x) = E(n) = 0, (2.6)

em que a segunda igualdade resulta de (2.5). A primeira igualdade na equao (2.6) a hiptese nova.
Ela diz que, para qualquer valor de x, a mdia dos fatores no-observveis a mesma e, portanto, deve
igualar-se ao valor mdio de u na populao. Quando combinamos a primeira igualdade da equao
(2.6) com a hiptese (2.5), obtemos a hiptese de mdia condicional zero.
Vamos ver o que (2.6) acarreta ao exemplo do salrio. Para simplificar a discusso, assuma que
u seja o mesmo que aptido inata. Ento, (2.6) requer que o nvel mdio de aptido seja o mesmo,
independentemente dos anos de educao formal. Por exemplo, se E(aptido\%) representa a aptido
mdia para o grupo de todas as pessoas com oito anos de educao formal, e E(aptido]l6) repre
senta a aptido mdia entre pessoas na populao com 16 anos de educao formal, portanto (2.6)
implica que essas mdias devem ser as mesmas. De fato, o nvel de aptido mdia deve ser o mesmo
para todos os nveis de educao. Se, por exemplo, entendemos que a aptido mdia aumenta com os
anos de educao formal, ento (2.6) falsa. (Isso aconteceria se, em mdia, pessoas com maior
aptido escolhessem tomar-se mais educadas.) Como no podemos observar aptido inata, no temos
um modo de saber se a aptido mdia ou no a mesma para todos os nveis de educao. Essa uma
questo que devemos resolver antes de aplicar a anlise de regresso simples.
No exemplo dos fertilizantes, se as quantidades de fertilizantes so escolhidas independentemente
de outras caractersticas dos lotes, ento (2.6) se sustentar: a qualidade mdia da terra no depender
da quantidade de fertilizantes. Entretanto, se mais fertilizantes forem usados em lotes de terra de melhor
qualidade, ento o valor esperado de u varia com o nvel de fertilizantes, e (2.6) no se sustenta.
24 Introduo Econometria Editora Thomson

Suponha que a nota de um exame final (n o ta ) dependa da freqncia s aulas (freq ) e de fatores no-obser-
vados que afetam o desempenho dos estudantes (tal como a aptido). Ento:

nota = j80 + /3, freq + u. (2.7)

Em que situao voc esperaria que esse modelo satisfaa (2.6)?

A hiptese (2.6) d a jS, outra interpretao que , freqentemente, til. Considerando o valor
esperado de (2.1) condicionado a r e usando E(u\x) = 0, obtm-se

E(jy|x) = /30 + P ix- (2.8)

(A equao (2.8) mostra que a funo de regresso populacional (FRP), E(y|x), uma funo linear
de x. A linearidade significa que o aumento de uma unidade em x faz com que o valor esperado de v
varie segundo a magnitude de Para qualquer valor dado de x, a distribuio de y est centrada ao
redor de E(y|x), como ilustrado na Figura 2.1.

Figura 2 4 ________________________________ ; __________________________________ _


E(y|x) como funo linear de x.
Wooldridge Captulo 2 O Modelo de Regresso Simples 2S

Quando (2.6) verdadeira, til dividir y em dois componentes. A parte (it) + fi ,x algumas vezes
chamada a parte sistemtica de y isto , a parte de y explicada por x , e chamado a parte no-
sistemtica, ou a parte de y no explicada por x. Usaremos a hiptese (2.6) na prxima seo para encon
trar as estimativas de /30 e jS,. Essa hiptese tambm crucial para a anlise estatstica na Seo 2.5.

2.2 DERIVAO DAS ESTIMATIVAS DE MNIMOS QUADRADOS


ORDINRIOS

Agora que discutimos os ingredientes bsicos do modelo de regresso simples, trataremos da impor
tante questo de como estimar os parmetros /30 e /3, da equao (2.1). Para tanto, necessitamos de uma
amostra da populao. Vamos considerar {(x,-, v,): /' = 1,..., n} como uma amostra aleatria de tamanho
n da populao. Visto que esses dados vm de (2.1), podemos escrever

y t = Po + P l x i + Un (2.91

para cada i. Aqui, w, o termo erro para a observao i, uma vez que ele contm todos os fatores, alm
de x que afetam v,.
Como um exemplo, x, poderia ser a renda anual e y a poupana anual para a famlia i durante um
determinado ano. Se coletarmos dados de 15 famlias, ento n = 15. Um grfico de tal conjunto de
dados dado pela Figura 2.2, juntamente com a funo de regresso populacional (necessariamente
fictcia).
Devemos decidir como usar esses dados, a fim de obter estimativas do intercepto e da inclinao
na regresso populacional da poupana sobre a renda.
H muitas maneiras de colocar em prtica o seguinte procedimento de estimao. Usaremos (2.5)
e uma importante implicao da hiptese (2.6): na populao, u tem mdia zero e no-correlaciona-
do com x. Portanto, vemos que u tem valor esperado zero e que a covarincia entre x e u zero:

E (u) = 0 (2.10)

Cov (x , m) = E(xu) = 0, (2.11)

onde a primeira igualdade em (2.11) resulta de (2.10). (Veja Seo B.4 do Apndice B, disponvel no
site da Thomson, para definio e propriedades da covarincia.) Em termos das variveis observveis
x e y e dos parmetros desconhecidos /30 e /3h as equaes (2.10) e (2.11) podem ser escritas como

E(y j30 ftx) = 0 (2.12)

E[x(y - & - A x)] = 0, (2.13)


26 Introduo Econometria Editora Thomson

respectivamente. As equaes (2.12) e (2.13) implicam duas restries sobre a distribuio de proba
bilidade conjunta de (x,y) na populao. Como h dois parmetros desconhecidos para estimar, pode
ramos esperar que as equaes (2.12) e (2.13) pudessem ser usadas para obter bons estimadores de /?0
e /?!. De fato, elas podem ser usadas. Dada uma amostra de dados, escolhemos as estimativas e
para resolver as equivalncias amostrais de (2.12) e (2.13):

Figura 2.2__________________________________________________________________________
Grfico da disperso de poupana e renda de 15 famlias e a regresso populacional E\poup\renda) =
/30 + p trenda.

n 'Cy, - o ~ \ x i) = 0 (2.14)
1=1

'jU -fy ~ o ~ \x,) = - (2.15)


1=1
Wooldridge Captulo 2 O Modelo de Regresso Simples 27

Esse um exemplo da abordagem do mtodo dos momentos para a estimao. (Veja a Seo C.4 do
Apndice C, disponvel no site da Thomson, para uma discusso das diferentes abordagens de estima
o.) Essas equaes podem ser resolvidas para (30 e .
Usando as propriedades bsicas do operador somatrio a partir do Apndice A (disponvel no site
da Thomson), a equao (2.14) pode ser escrita como

y = Po + P\ x, (2.16)

em que y = n 2 ) a mdia amostrai de y e igualmente para x. Essa equao nos permite escrever

/80 em termos de /3,, y e x:

0 o = y - $ tx. (2.17)

Portanto, uma vez que temos a estimativa de inclinao /3,, obtm-se diretamente a estimativa de inter
cepto (30, dados y c x.
Suprimindo o n~1 em (2.15) (j que ele no afeta a soluo) e inserindo (2.17) em (2.15), obtemos

x,v, - (y - j8 , jc ) - /S,*,.] = 0
1=1

a qual, aps rearranjo, pode ser escrita

2 xfy, ~ y ) = P u L xi ( )
t=l /=1

Das propriedades bsicas do operador somatrio [veja (A.7) e (A.8) disponvel no site da Thomson],

*,(*; - x ) = X (x. - x ) 2 e ' ^ Jxi(yj - y ) = ](x,. - * ) (y; - y).

Portanto, desde que

](*, - x ) 2 > 0 , (2.18)


i=1

a inclinao estimada

c *,_ * ) 0/ y)
i = l ______________________
(2.19)
o , - * )2
i=i
28 Introduo Econometria Editora Thomson

A equao (2.19) simplesmente a covarincia amostrai entre x e y, dividida pela varincia amostrai
de x. (Veja Apndice C, disponvel no site da Thomson. Dividir tanto o numerador como o denominador
por n - 1 no altera o resultado.) Isso faz sentido, pois f i , igual covarincia populacional dividida
pela varincia de x quando E(u) = 0 e Cov(x,w) = 0. Uma implicao imediata que se x e v so posi
tivamente correlacionados na amostra, ento /31 positivo; se x e y so negativamente correlacionados,
ento y3j negativo.
Embora o mtodo para obter (2.17) e (2.19) decorra de (2.6), a nica hiptese necessria para se
calcular as estimativas para uma amostra particular (2.18). Mas essa raramente uma hiptese: (2.18)
verdadeira sempre que os x, na amostra no so todos iguais a um mesmo valor. Se (2.18) no se sus
tentar, ento fomos infelizes em obter nossa amostra da populao, ou no especificamos um proble
ma interessante (x no varia na populao). Por exemplo, se y = salrioh e x = educ, ento (2.18) no
se mantm se todos na amostra tm a mesma quantidade de anos de educao formal. (Por exemplo, se
todos tm o equivalente ao ensino mdio concludo. Veja a Figura 2.3.) Se apenas uma pessoa tem uma
quantidade diferente de anos de educao formal, ento (2.18) se sustenta, e as estimativas de MQO
podem ser calculadas.

Figura2,3- , , ,, . . . ^
Grfico da disperso de salrios e educao, quando educ, - 12 para todo i.

salrioh

0 12 educ

As estimativas dadas em (2.17) e (2.19) so chamadas de estimativas de mnimos quadrados


ordinrios (MQO) de /30 e /3,. Para justificar esse nome, defina, para qualquer /30 e /3,, um valor esti
mado para y quando x = x,, tal como

St = o + i x P (2.20)
Wooldridge Capitulo 2 0 Modelo de Regresso Simples 29

para o intercepto e a inclinao dados. Esse o valor que prevemos para y quando x = x,. H um valor
estimado para cada observao na amostra. O resduo para a observao i a diferena entre o valor ver
dadeiro de y, e seu valor estimado:

, = y t - >, = y, - $o - /3,x,, (2.21J

Novamente, h n desses resduos. [Eles no so iguais aos erros em (2.9), um ponto ao qual retomare
mos na Seo 2.5.] Os valores estimados e os resduos esto indicados na Figura 2.4.

'Figura 2.4 . " : ; _______________________ _________________________________


Valores estimados e resduos.

Agora, suponha que escolhemos /30 e /3[ com a finalidade de tomar a soma dos resduos qua
drados,

?= (* - /M ,)2. (2.22)
;=i ;=i

to pequena quanto possvel. O apndice deste captulo mostra que as condies necessrias para (j80,
j8,) minimizarem (2.22) so dadas exatamente pelas equaes (2.14) e (2.15), sem n ~ \ As equaes
(2.14) e (2.15) so freqentemente chamadas de condies de primeira ordem para as estimativas de
MQO, um termo que vem da otimizao utilizada em clculo (veja o Apndice A, disponvel no site
da Thomson). De nossos clculos anteriores, sabemos que as solues para as condies de primeira
30 Introduo Econometria Editora Thomson

ordem de MQO so dadas por (2.17) e (2.19). O nome mnimos quadrados ordinrios vem do fato
de que essas estimativas minimizam a soma dos resduos quadrados.
Quando vemos o mtodo de mnimos quadrados ordinrios como um mtodo que minimiza a
soma dos resduos quadrados, natural perguntar: por que no minimizar alguma outra funo dos
resduos, como o valor absoluto dos resduos? De fato, como discutiremos brevemente na Seo 9.4,
minimizar a soma dos valores absolutos dos resduos , algumas vezes, muito til. Mas esse procedi
mento tambm tem suas desvantagens. Primeiro, no podemos obter frmulas para os estimadores
resultantes; dado um conjunto de dados, as estimativas devem ser obtidas por rotinas de otimizao
numrica. Em conseqncia, a teoria estatstica para estimadores que minimizam a soma dos resduos
absolutos muito complicada. Minimizar outras funes dos resduos, como a soma de cada resduo
elevado quarta potncia, tem desvantagens similares. (Nunca deveramos escolher nossos estima
dores para minimizar, por exemplo, a soma dos prprios resduos, pois resduos grandes em magnitu
de e com sinais opostos tendem a se cancelar.) Com o mtodo MQO, seremos capazes de derivar, de
modo relativamente fcil, inexistncia de vis, consistncia e outras importantes propriedades estats
ticas. E mais, como as equaes (2.13) e (2.14) sugerem, e como veremos na Seo 2.5, o mtodo
MQO adequado para estimar os parmetros que aparecem na funo de mdia condicional (2.8).
Uma vez determinados os estimadores de intercepto e inclinao de MQO, construmos a reta de
regresso de MQO:

y = o + /M> (2.23)

em que [(] e /3, foram obtidos ao usar as equaes (2.17) e (2.19). A notao y leia-se v chapu
enfatiza que os valores previstos da equao (2.23) so estimativas. O intercepto /30 o valor pre
visto de y quando x = 0, embora, em alguns casos, no faa sentido considerar x = 0. Nestas situa
es, 0o no , por si mesmo, muito interessante. Ao usar (2.23) para calcular os valores previstos de
y para vrios valores de x, devemos considerar o intercepto nos clculos. A equao (2.23) tambm
chamada funo de regresso amostrai (FRA), pois ela a verso estimada da funo de regresso
populacional E(j|x) == /30 + (3 ,x. importante lembrar que a FRP algo fixo, porm desconhecido, na
populao. Como a FRA obtida para uma dada amostra de dados, uma amostra nova gerar uma incli
nao e um intercepto diferentes na equao (2.23).
Em muitos casos, a estimativa do coeficiente de inclinao, que podemos escrever como

j8, = Ay/Ax, (2.24)

de interesse fundamental. Ela nos diz o quanto varia y quando x aumenta em uma unidade. Equi
valentemente,

Ay = 1Ax, (2.2S)

de modo que, dada qualquer variao em x (seja positiva ou negativa), podemos calcular a variao pre
vista em y.
Agora, vamos apresentar vrios exemplos de regresses simples obtidas de dados reais. Em outras
palavras, vamos encontrar as estimativas de intercepto e de inclinao a parjtir das equaes (2.17) e
(2.19). Como esses exemplos compreendem muitas observaes, os clculos foram feitos usando pro-
Wooldridge Captulo 2 O Modelo de Regresso Simples 31

gramas economtricos. Neste ponto, no se preocupe muito em interpretar as regresses; elas no


esto, necessariamente, revelando uma relao causal. At aqui, no dissemos nada sobre as proprie
dades estatsticas do mtodo MQO. Na Seo 2.5, consideraremos as propriedades depois de impor
mos explicitamente hipteses sobre a equao do modelo populacional (2.1).

EXEMPLO 2.3
(Salrios de Diretores Executivos e Retornos de Aes)
Para a populao de diretores executivos, seja y o salrio anual (salrio ) em milhares de dlares. Assim, y =
856,3 indica um salrio anual de $ 856.300, e y = 1.452,6 indica um salrio de $ 1.452.600. Seja x o retorno
mdio da ao sobre o patrimnio (rm a ), dos trs anos anteriores, da empresa do diretor executivo. (0 retor
no da ao sobre o patrimnio definido em termos de renda lquida, como uma percentagem do patrimnio
comum.) Por exemplo, se rm a = 10, ento o retorno mdio da ao sobre o patrimnio de 10%.
Para estudar a relao entre essa medida do desempenho das empresas e a remunerao dos seus dire
tores executivos, postulamos o modelo simples

s a l r io = /30 + fi^ r m a + u.

0 parmetro de inclinao /3, mede a variao no salrio anual, em milhares de dlares, quando o retorno
da ao aumenta em um ponto percentual. Como um rm a mais elevado melhor para a empresa, espera
mos que > 0.
O conjunto de dados do arquivo CEOSAL1 .RAW contm informaes sobre 209 diretores executivos para
o ano de 1990; esses dados foram obtidos da revista Business W eek (6.5.91). Na amostra, o salrio mdio
anual $ 1.281.120; sendo que o menor e o maior so $ 223.000 e $ 14.822.000, respectivamente. O retor
no mdio das aes para os anos 1988,1989 e 1990 de 17,18%, sendo que os valores menor e maior so
de 0,5 e 56,3%, respectivamente.
Usando os dados do arquivo CEOSAL1 .RAW, a reta de regresso de MQO que relaciona salrio a rm a

salrio = 963,191 + 18,501 rma, (2 .26 )

na qual as estimativas de intercepto e de inclinao foram arredondadas em trs casas decimais; usamos "sal
rio chapu" para indicar que essa uma equao estimada. Como interpretamos a equao? Primeiro, se o
retorno da ao zero, rm a = 0, ento o salrio previsto o intercepto, 963,191, que igual a $ 963.191,
visto que salrio mensurado em milhares. Em seguida, podemos escrever a variao prevista no salrio como
uma funo da variao em rm a: A salrio = 18,501 (Arma). Isso significa que se o retorno da ao aumenta
um ponto percentual, A rm a = 1, ento espera-se que salrio variar cerca de 18,5, ou $ 18.500. Como (2.26)
uma equao linear, esse valor a variao estimada independentemente do salrio inicial.
Podemos facilmente usar (2.26) para comparar salrios previstos para valores diferentes de rm a.
Suponha rm a = 30. Portanto, salrio = 963,191 + 18,501(30) = 1.518,221, o que est pouco acima
de $ 1,5 milho. Entretanto, isso n o significa que um determinado diretor executivo, cuja empresa tenha
um rm a = 30, ganhe $ 1.518.221. Muitos outros fatores afetam o salrio. Essa somente a nossa pre
viso a partir da reta de regresso de MQO de (2.26). A reta estimada est representada na Figura 2.5, jun
tamente com a funo de regresso populacional E(sa/ro|rma). Nunca conheceremos a FRP; assim, no
podemos dizer o quo prxima a FRA est da FRP. Outra amostra de dados levar a uma reta de regresso
diferente, que pode estar, ou no, mais prxima da reta de regresso populacional.
32 Introduo Econometria Editora Thomson

Figura 2.5_________________ " " ' - ______________________;_____ ;_____


A reta de regresso de MQO salrio = 963,191 + 18,501 ima e a funo de regresso populacional
(desconhecida).

EXEMPLO 2.4
(Salrios e Educao)
Para a populao de pessoas na fora de trabalho em 1976, seja y = salrioh, em que sal rio h mensura
do em dlares por hora. Assim, para uma determinada pessoa, se salrioh = 6,75, o salrio-hora $ 6,75.
Vamos chamar anos de escolaridade formal de x = educ; por exemplo, e d u c = 12 corresponde ao ensino
mdio completo (nos Estados Unidos). 0 salrio horrio mdio na amostra $ 5,90, o que equivale, de acor
do com o ndice de preos ao consumidor dos Estados Unidos, a $ 16,64 em dlares de 1997.
Usando os dados do arquivo WAGE1.RAW, em que n = 526 indivduos, obtemos a seguinte reta de
regresso de MQO (ou funo de regresso amostrai):

salrio = 0,90 + 0,54 educ. (2.27)

Devemos interpretar essa equao com cautela. 0 intercepto de -0 ,9 0 significa, literalmente, que uma pes
soa sem nenhuma educao formal tem um salrio-hora previsto de - 9 0 centavos de dlar por hora. Isso,
evidentemente, tolice. Ocorre que apenas 18 pessoas na amostra de 526 tm menos que oito anos de edu
cao formal. Conseqentemente, no surpreendente que a reta de regresso no faa boas previses para
Wooldridge Captulo 2 O Modelo de Regresso Simples 33

EXEMPLO 2.4 (continuao)


nveis de educao formal muito baixos. Para uma pessoa com oito anos de educao formal, o salrio pre
visto salrio = - 0 ,9 0 + 0,54(8) = 3,42, ou $ 3,42 por hora (em dlares de 1976).
A inclinao estimada em (2.27) implica que um ano a mais de educao formai aumenta o salrio
horrio em 54 centavos de dlar por hora. Portanto, quatro anos a mais de educao formal aumentam o
salrio horrio previsto em 4(0,54) = 2,16, ou $ 2,16 por hora. Esses efeitos so razoavelmente grandes.
Devido natureza linear de (2.27), outro ano de educao formal aumenta o salrio na mesma quantidade,
independentemente do nvel inicial de educao. Na Seo 2.4, discutiremos alguns mtodos que levam em
considerao efeitos marginais no-constantes de nossas variveis explicativas.

0 salrio horrio estimado em (2.27), quando e du c = 8, $ 3,42, em dlares de 1976. Qual esse valor em
dlares de 1997? (S ugesto : voc tem informao suficiente, no Exemplo 2.4, para responder a essa questo.)

EXEMPLO 2.5
(Resultados Eleitorais e Gastos de Campanha)
0 arquivo VOTE1.RAW contm dados sobre resultados eleitorais e gastos de campanha de 173 disputas
entre dois partidos, para a H ouse o f R epresentatives dos Estados Unidos (equivalente a uma cmara fede
ral). H dois candidatos em cada disputa: A e B. Seja v o to A a percentagem de votos recebida pelo
Candidato A e p a rtA a percentagem dos gastos totais de campanha que cabem ao Candidato A. Muitos
outros fatores alm de p a rtA afetam o resultado eleitoral (incluindo a qualidade dos candidatos e os valo
res absolutos dos gastos de A e B). No entanto, podemos estimar um modelo de regresso simples para
descobrir se gastar mais do que o concorrente implica uma percentagem maior de votos.
A equao estimada usando as 173 observaes

voto A = 26,81 + 0,464 partA. ( 2.28)

Isso significa que, se a parte dos gastos do Candidato A aumenta em um ponto percentual, o Candidato
A recebe quase meio ponto percentual (0,464) a mais da votao total. No fica claro se isso revela ou
no um efeito causal, mas isso crvel. Se p a rtA = 50, prev-se que v o to A ser cerca de 50, ou metade
da votao.

Em alguns casos, a anlise de regresso no usada para determinar a causalidade, mas para sim
plesmente observar se duas variveis so positiva ou negativamente relacionadas, de modo muito pare
cido com uma anlise padro de correlao. Um exemplo disso ocorre no Problema 2.12, que pede que
voc use os dados de Biddle e Hamermesh (1990) referentes ao tempo que se gasta dormindo e traba
lhando a fim de investigar a relao entre esses dois fatores.
34 Introduo Econometria - Editora Thomson

No Exemplo 2.5, qual a votao prevista para o Candidato A se partA = 60 (que significa 60%)? A res
posta parece razovel?

Uma Nota sobre Term inologia


Em muitos casos, indicaremos a estimao de uma relao atravs de MQO ao escrever uma equao
como (2.26), (2.27) ou (2.28). Algumas vezes, por motivo de brevidade, til indicar que uma regres
so de MQO foi estimada sem realmente escrever a equao. Freqentemente, indicaremos que a
equao (2.23) foi obtida por MQO ao dizer que ns rodamos a regresso de

y sobre x, (2.29)

ou simplesmente que regredimos y sobre x. As posies de y e x em (2.29) indicam qual a varivel


dependente e qual a varivel independente: Sempre regredimos a varivel dependente sobre a vari
vel independente.) Para aplicaes especficas, substituiremos y e x por seus nomes. Assim, para obter
(2.26), regredimos salrio sobre rma, ou, para obter (2.28), regredimos votoA sobre partA.
Ao usarmos essa terminologia em (2.29), sempre estaremos dizendo que planejamos estimar o
intercepto, /30, juntamente com o coeficiente de inclinao, /3,. Esse caso apropriado para a maioria
das aplicaes. Ocasionalmente, podemos querer estimar a relao entre y e x assumindo que o inter
cepto zero (de modo que x = 0 implica y = 0); cobriremos esse caso, brevemente, na Seo 2.6. A
no ser que seja explicitamente dito de outro modo, sempre estimaremos um intercepto juntamente
com uma inclinao.

2.3 MECNICA DO MTODO MQO


Nesta seo, cobriremos algumas propriedades algbricas da reta de regresso de MQO estimada.
Talvez, a melhor maneira de pensar nessas propriedades perceber que elas so caractersticas de
MQO para uma determinada amostra de dados. Elas podem ser contrastadas com as propriedades esta
tsticas de MQO, o que requer a derivao das caractersticas das distribuies amostrais dos estima-
dores. Discutiremos as propriedades estatsticas na Seo 2.5.
Muitas das propriedades algbricas que derivaremos parecero triviais. No entanto, ter uma com
preenso dessas propriedades ajuda-nos a entender o que acontece com as estimativas de MQO e esta
tsticas relacionadas quando os dados so manipulados de determinadas maneiras, como quando
variam as unidades de medida das variveis dependente e independentes.

Valores E stim ados e Resduos


Assumimos que as estimativas de intercepto e de inclinao, /30 e , foram obtidas de uma dada amos
tra de dados. Dados /30 e /3,, podemos obter o valor estimado _yi para cada observao. [Isso dado pela
equao (2.20).] Por definio, cada valor estimado de y. est sobre a reta de regresso de MQO. O
resduo de MQO associado a cada observao i, r a diferena entre y, e seu valor estimado, como
dado na equao (2.21). Se i positivo, a reta subestima y ,; se i negativo, a reta superestima y,. O
caso ideal para a observao i quando i = 0, mas na maior parte dos casos todos os resduos so
Wooldridge Capitulo 2 O Modelo de Regresso Simples 35

diferentes de zero. Em outras palavras, nenhum dos pontos dos dados deve, realmente, estar sobre a
reta de MQO.

EXEMPLO 2.6
(Salrio de Diretores Executivos e Retornos de Aes)
A Tabela 2.2 contm uma lista das 15 primeiras observaes do conjunto de dados dos salrios dos diretores
executivos, juntamente com os valores estimados, chamados de salchapu, e os resduos, estimados de
uchapu.

Tabela 2.2_________________________________________________________________________
Valores Estimados e Resduos dos 15 Primeiros Diretores Executivos

nobsd rma salrio salchapu uchapu

1 14,1 1.095 1.224,058 -129,0581

2 10,9 1.001 1.164,854 -163,8542

3 23,5 1.122 1.397,969 -275,9692

4 5,9 578 1.072,348 -494,3484

5 13,8 1.368 1.218,508 149,4923

6 20,0 1.145 1.333,215 -188,2151

7 16,4 1.078 1.266,611 -188,6108

8 16,3 1.094 1.264,761 -170,7606

9 10,5 1.237 1.157,454 79,54626

10 26,3 833 1.449,773 -616,7726

11 25,9 567 1.442,372 -875,3721

12 26,8 933 1.459,023 -526,0231

13 14,8 1.339 1.237,009 101,9911

14 22,3 937 1.375,768 -438,7678

15 56,3 2.011 2.004,808 6,191895

Os quatro primeiros diretores executivos tm salrios menores do que os previstos a partir da reta de regres
so de MQO (2.26); em outras palavras, dado somente o rm a da empresa, esses diretores executivos ganham
menos do que prevemos. Como pode ser visto dos u chapus p ositivo s, o quinto diretor executivo ganha
mais do que prevemos a partir da reta de regresso de MQO.
36 Introduo Econometria Editora Thomson

Propriedades Algbricas das E statsticas de MQO


H vrias propriedades algbricas teis das estimativas de MQO e das estatsticas a elas associadas.
Vamos discutir as trs mais importantes.
(1) A soma, e portanto a mdia amostrai, dos resduos de MQO, zero. Matematicamente,

2 fi, = 0. (2.30)
i=i

Essa propriedade no precisa de prova; ela resulta, imediatamente, da condio de primeira ordem de
MQO (2.14), quando lembramos que os resduos so definidos por i = y, /30 /3,x,. Em outras
palavras, as estimativas de MQO /30 e /3, so escolhidas para fazer com que a soma dos resduos seja
zero (para qualquer conjunto de dados). Isso no diz nada sobre o resduo de qualquer observao i em
particular.
(2) A covarincia amostrai entre os regressores e os resduos de MQO zero. Isso resulta da co
dio de primeira ordem (2.15), que pode ser escrita em termos dos resduos, como

2 * ^ = 0. (2.31)
i=i

A mdia amostrai dos resduos de MQO zero, de modo que o lado esquerdo de (2.31) proporcio
nal covarincia amostrai entre xt e r
(3) O ponto (x , y) sempre est sobre a reta de regresso de MQO. Em outras palavras, s
considerarmos a equao (2.23) e inserirmos x no lugar de x, ento o valor estimado y. Isso exata
mente o que a equao (2.16) nos mostrou.

EXEMPLO 2.7
(Salrios e Educao)
Para os dados do arquivo em WAGE1 .RAW, o salrio-hora mdio da amostra 5,90, arredondado para duas
casas decimais, e a educao formal mdia (medida em anos) 12,56. Se inserirmos educ = 12,56 na reta
de regresso de MQO (2.27), obtemos sarioh = - 0,90 + 0,54(12,56) = 5,8824, igual a 5,9 quando arre
dondamos para uma casa decimal. A razo de esses nmeros no serem exatamente os mesmos que ns
arredondamos o salrio-hora e os anos de educao formal mdios, assim como as estimativas de intercepto e
de inclinao. Se, inicialmente, no tivssemos arredondado nenhum dos valores, obteramos respostas mais
aproximadas, mas essa prtica teria pouco efeito til.

Ao escrever cada como o seu valor estimado mais seu resduo, temos outro modo de interpre
tar uma regresso de MQO. Para cada i, escreva

(2.32)

Da propriedade (1), a mdia dos resduos zero; equivalentemente, a mdia amostrai dos valores
estimados, yh a mesma que a mdia amostrai de y ou y = y. Alm disso, as propriedades (1) e (2)
Wooldridge Captulo 2 O Modelo de Regresso Simples 37

podem ser usadas para mostrar que a covarincia amostrai entre y; e i zero. Portanto, podemos ver
MQO como um mtodo que decompe cada y,- em duas partes: um valor estimado e um resduo. Os
valores estimados e os resduos so no-correlacionados na amostra.
Defina a soma dos quadrados total (SQT), a soma dos quadrados explicada (SQE) e a soma
dos quadrados dos resduos (SQR) (tambm conhecida como a soma dos resduos quadrados), como
a seguir:

SQT - 2 ( y , - y ) 2. (2.33)
1=1

SQE - (v , - )2. (2.34)


=1

SQR 2 (2.35)
i=1

SQT uma medida da variao amostrai total em y ,; isto , ela mede o quo dispersos esto os y,- na
amostra. Se dividirmos SQT por n 1, obteremos a varincia amostrai de y, como discutido no Apn
dice C; no site da Thomson. Semelhantemente, SQE mede a variao amostrai em y. (em que usamos
o fato de que y = y), e SQR mede a variao amostrai em r A variao total em y pode sempre ser
expressa como a soma da variao explicada e da variao no-explicada SQR. Assim,

SQT = SQE + SQR. (2.36)

Provar (2.36) no difcil; mas requer o uso de todas as propriedades do operador somatrio apresen
tadas no Apndice A, no site da Thomson. Escreva

2 0 \ - )2 = 2 [ ( j ,- v ,) + t y , - ? ) ] 2
=l /=1

= t &, + (y, - )]2


/= 1

= 2+ 2 ,(y, - y ) + (Si )2
i=I 1=1 1=1

= SQR + 2 2 . (y, - y) + SQE.

Agora, (2.36) vlida se mostrarmos que

n
2 ,(y , - ) = 0 . (2.37)
38 Introduo Econometria Editora Thomson

Mas j dissemos que a covarincia amostrai entre os resduos e os valores estimados zero, e essa
covarincia justamente a equao (2.37) dividida por n 1. Conseqentemente, confirmamos (2.36).
Algumas palavras de precauo sobre SQT, SQE e SQR devem ser mencionadas. No h concor
dncia uniforme sobre os nomes e abreviaes das trs quantidades definidas nas equaes (2.33),
(2.34) e (2.35). A soma dos quadrados total chamada SQT ou STQ, de modo que aqui no h grandes
confuses. Infelizmente, ,a soma dos quadrados explicada , s vezes, chamada de soma dos quadra
dos da regresso. Se a esse termo dado sua abreviao natural, ele pode ser facilmente confundido
com o termo soma dos quadrados dos resduos. Alguns programas economtricos referem-se soma
dos quadrados explicada como soma dos quadrados do modelo.
Para tomar as coisas ainda piores, a soma dos quadrados dos resduos freqentemente chamada
de soma dos quadrados dos erros i Esse termo um tanto inadequado, pois, como veremos na Seo
2.5, os erros e os resduos so quantidades diferentes. Assim, sempre chamaremos (2.35) de soma dos
quadrados dos resduos ou soma dos resduos quadrados. Preferimos usar a abreviao SQR para repre
sentar a soma dos resduos quadrados, pois ela mais comum nos programas economtricos.

Grau de Ajuste
At aqui, no apresentamos uma maneira de mensurar o quanto bem a varivel explicativa ou indepen
dente, x, explica a varivel dependente, y. Muitas vezes, til calcular um nmero que resume o quo
bem a reta de regresso de MQO se ajusta aos dados. Na discusso seguinte, lembre-se de que assumi
mos estimar o intercepto com a inclinao.
Ao assumirmos que a soma dos quadrados total, SQT, no igual a zero o que verdadeiro, a
no ser no evento muito improvvel de todos os yt- serem iguais a um mesmo valor , podemos divi
dir (2.36) por SQT para obter 1 = SQE/SQT + SQR/SQT. O /{-quadrado da regresso, algumas
vezes chamado coeficiente de determinao, definido como

R2 = SQE/SQT = 1 - SQR/SQT. (2.38)

R2 a razo entre a variao explicada e a variao total; assim, ele interpretado como a frao da
variao amostrai em y que explicada por x. A segunda equao em (2.38) fornece outra maneira de
calcular R2.
De (2.36), o valor de R2 est sempre entre zero e um, visto que SQE no pode ser maior que SQT.
Quando interpretamos R2, usualmente o multiplicamos por 100 para transform-lo em percentual:
100 R 2 a percentagem da variao amostrai em y que explicada por x.
Se todos os pontos dos dados estiverem sobre a mesma reta, MQO fornece um ajuste perfeito aos
dados. Nesse caso, R2 = 1. Um valor de R2 quase igual a zero indica um ajuste ruim da reta de MQO:
muito pouco da variao em y, capturado pela variao em y, (que est sobre a reta de regresso
de MQO). De fato, pode ser mostrado que R 2 igual ao quadrado do coeficiente de correlao amos
trai entre _v, e y . . da que vem o termo R-quadrado. (A letra R era, tradicionalmente, usada para
denominar uma estimativa do coeficiente de correlao populacional, e seu uso sobreviveu na an
lise de regresso.)
Wooldridge Captulo 2 O Modelo de Regresso Simples 39

EXEMPLO 2.8
(Salrio de Diretores Executivos e Retornos de Aes)
Na regresso de salrios de diretores executivos, estimamos a seguinte equao:

salrio = 963,191 + 18,501 rma (2.39)

n = 209, R2 = 0,0132.

Por motivos de clareza, reproduzimos a reta de regresso de MQO e o nmero de observaes. Usando o R-
quadrado (arredondado para quatro casas decimais) apresentado para essa equao, podemos ver quanto
da variao no salrio , realmente, explicada pelo retorno da ao. A resposta : no muito. 0 retorno da
ao da empresa explica somente 1,3% da variao nos salrios dessa amostra de 209 diretores executivos.
Isso significa que 98,7% das variaes salariais desses diretores executivos so deixadas sem explicao.
Essa falta de poder explicativo no deve ser surpreendente demais, j que muitas outras caractersticas, tanto
da empresa como do diretor executivo individual, devem influenciar o salrio; esses fatores esto, necessa
riamente, includos nos erros de uma anlise de regresso simples.

Nas cincias sociais no so incomuns /{-quadrados baixos nas equaes de regresso, especial
mente na anlise de corte transversal. Discutiremos essa questo, de modo mais geral, sob a anlise de
regresso mltipla, mas vale a pena enfatizar agora que um /{-quadrado aparentemente baixo no sig
nifica, necessariamente, que uma equao de regresso de MQO intil. Ainda, possvel que (2.39)
seja uma boa estimativa da relao ceteris paribus entre salrio e rma; se isso for verdade ou no, no
depende diretamente da magnitude do /{-quadrado. Os estudantes que esto se defrontando com eco
nometria pela primeira vez tendem, ao avaliar equaes de regresso, a pr muito peso na magnitude do
/{-quadrado. Por enquanto, esteja ciente de que usar o /{-quadrado como o principal padro de medida
de sucesso de uma anlise economtrica pode levar a confuses.
Algumas vezes, a varivel explicativa elucida uma parte substancial da variao amostrai na vari
vel dependente.

EXEMPLO 2.9
(Resultados Eleitorais e Gastos de Campanha)
Na equao de resultados eleitorais (2.28), R2 = 0,856. Assim, a participao dos candidatos nos gastos de
campanha explica mais de 85% da variao nos resultados eleitorais nessa amostra. Essa uma explicao
considervel.

2.4 UNIDADES DE MEDIDA E FORMA FUNCIONAL


Duas questes importantes em economia aplicada so: (1) entender como, ao mudar as unidades de
medida das variveis dependente e/ou independente, so afetadas as estimativas de MQO e (2) saber
como incorporar, anlise de regresso, formas funcionais populares usadas em economia.
A matemtica necessria para uma compreenso completa das questes sobre a forma funcional
est revista no Apndice A, disponvel no site da Thomson.
40 Introduo Econometria Editora Thomson

Os Efeitos de M udanas das U nidades de M edida sobre a s E statsticas


de MQO
No Exemplo 2.3, escolhemos mensurar o salrio anual em milhares de dlares, e o retomo das aes
foi medido como uma percentagem (em vez de um decimal). E crucial saber como salrio e rma so
medidos nesse exemplo, a fim de dar sentido s estimativas da equao (2.39).
Devemos tambm saber que as estimativas de MQO mudam de maneira completamente espera
da, quando as unidades de medida das variveis dependente e independente mudam. No Exemplo 2.3,
suponhamos que, em vez de medir o salrio em milhares de dlares, ns o medimos em dlares.
Seja salardol o salrio em dlares (salardol = 845.761 seria interpretado como $ 845.761).
Evidentemente, salardol tem uma relao simples com o salrio medido em milhares de dlares:
salardol = 1.000. salrio. No precisamos, realmente, computar a regresso salardol sobre rma para
saber que a equao estimada :

salrdol = 963.191 + 18.501 rma. (2.40)

Obtemos o intercepto e a inclinao em (2.40) ao, simplesmente, multiplicarmos o intercepto e o coefi


ciente de inclinao em (2.39) por 1.000. Isso d s equaes (2.39) e (2.40) a mesma interpretao.
Olhando para (2.40), se rma = 0, ento salrdol = 963.191, de modo que o salrio previsto $ 963.191
[o mesmo valor que obtivemos da equao (2.39)]. Alm disso, se rma aumenta em um, ento o sal
rio previsto aumenta em $ 18.501; novamente, isso o que conclumos de nossa anlise anterior da
equao (2.39).
Em geral, fcil fazer uma idia do que acontece s estimativas de intercepto e de inclinao
quando se altera a unidade de medida da varivel dependente. Se a varivel dependente multiplicada
pela constante c o que significa dizer que cada valor na amostra multiplicado por c , ento as
estimativas de MQO de intercepto e de inclinao tambm so multiplicadas por c. (Isso assume que
nada foi alterado com respeito varivel independente.) No exemplo do salrio dos diretores execu
tivos, c = 1.000 ao passarmos de salrio para salardol.

Suponha que o salrio seja mensurado em centenas de dlares, em vez de milhares de dlares, e o chamemos
salarcent. Quais sero as estimativas de intercepto e de inclinao na regresso de salarcent sobre rm a l

Tambm podemos usar o exemplo do salrio dos diretores executivos para ver o que acontece
quando as unidades de medida da varivel independente so mudadas. Defina rmadec = rma/100
como sendo o equivalente decimal de rma; assim, rmadec = 0,23 significa um retomo da ao de 23%.
A fim de centrarmos o foco na mudana das unidades de medida da varivel independente, retomare
mos nossa varivel dependente original, salrio, mensurada em milhares de dlares. Quando regre
dimos salrio sobre rmadec, obtemos

salrio = 963,191 + 1.850,1 rmadec. (2.41)

O coeficiente de rmadec 100 vezes o coeficiente de rma em (2.39). Isso o que deveria ser. Variar
rma em um ponto percentual equivalente a Armadec = 0,01. De (2.41), se Armadec = 0,01, ento
Wooldridge Captulo 2 O Modelo de Regresso Simples 41

hsalrio = 1.850,1(0,01) = 18,501, que igual ao obtido ao se usar (2.39). Observe que, ao passar
mos de (2.39) para (2.41), a varivel independente foi dividida por 100, e assim a estimativa de incli
nao de MQO foi multiplicada por 100, preservando a interpretao da equao. Em geral, se a
varivel independente dividida ou multiplicada por alguma constante diferente de zero, c, ento o
coeficiente de inclinao de MQO multiplicado ou dividido por c, respectivamente.
O intercepto no mudou em (2.41), pois rmadec = 0 ainda corresponde a um retomo zero da ao.
Em geral, mudar somente as unidades de medida da varivel independente no afeta o intercepto.
Na seo anterior, definimos A-quadrado como uma medida de grau de ajuste para a regresso de
MQO. Podemos tambm questionar o que acontece ao R~ quando mudada a unidade de medida da
varivel independente ou da varivel dependente. Sem fazer nenhuma lgebra, deveramos saber o
resultado: o grau de ajuste do modelo no depende das unidades de medida de nossas variveis. Por
exemplo, a quantidade de variao no salrio, explicada pelo retomo da ao, no deve depender de o
salrio ser medido em dlares ou em milhares de dlares, ou de o retomo da ao ser uma percenta
gem ou um decimal. Essa intuio pode ser verificada matematicamente: usando a definio de R2,
pode ser mostrado que R2 , de fato, invariante a mudanas nas unidades de y ou x.

Incorporao de N o-Linearidades n a R egresso Simples


At aqui, enfatizamos as relaes lineares entre as variveis dependente e independente. Como men
cionamos no Captulo 1, relaes lineares no so, em geral, suficientes para todas as aplicaes
econmicas. Felizmente, bastante fcil incorporar muitas no-linearidades na anlise de regresso
simples ao definir apropriadamente as variveis dependente e independente. Vamos tratar aqui de
duas possibilidades que freqentemente aparecem em trabalhos aplicados.
Ao ler trabalhos aplicados nas cincias sociais, com freqncia voc encontrar equaes de
regresso em que a varivel dependente aparece na forma logartmica. Por que isso feito? Lembre-se
do exemplo salrios-educao, em que regredimos o salrio-hora sobre os anos de educao formal.
Obtivemos uma estimativa da inclinao de 0,54 [veja a equao (2.27)], d, que significa dizer que, para
cada ano adicional de educao, previsto um aumento de 54 centavos de dlar no salrio-hora,
Devido natureza linear de (2.27), 54 centavos de dlar o aumento tanto para o primeiro ano de edu
cao quanto para o vigsimo ano; isso pode no ser razovel.
Suponha, em vez disso, que o aumento percentual no salrio o mesmo, dado um ano a mais de
educao formal. O modelo (2.27) no implica um aumento percentual constante: o aumento depende
do salrio inicial. Um modelo que gera (aproximadamente) um efeito percentual constante

log (salrioh) = f$0 + fi^educ + u, (2.42)

em que log(-) o logaritmo natural. (Veja Apndice A, disponvel no site da Thomson, para uma revi
so sobre logaritmos.) Em particular, se An = 0, ento

%Asalrioh ~ (100 (i^ ed u c. (2.43)


42 Introduo Econometria Editora Thomson

Figura 2.6___________________________
salrioh = exp(j0 + Redite), com i > 0.

Observe como multiplicamos /S] por 100 para obter a variao percentual em salrioh dado um ano
adicional de educao formal. Como a variao percentual em salrioh a mesma para cada ano adi
cional de educao, a variao em salrioh, para um ano extra de educao formal, aumenta quando a
educao formal aumenta; em outras palavras, (2.42) implica um retomo crescente da educao for
mal. Com a exponenciao de (2.42), podemos escrever salrioh = exp(jS0 + (3,educ + u). O grfico
dessa equao aparece na Figura 2.6, com u = 0.
Quando se usa a regresso simples, a estimao de um modelo como (2.42) imediata. Apenas
defina a varivel dependente, y, como y = log(salrioh). A varivel independente representada por
x = educ. A mecnica de MQO a mesma de antes: as estimativas de intercepto e de inclinao so
dadas pelas frmulas (2.17) e (2.19). Em outras palavras, obtemos /30 e /3, da regresso de MQO de
log (salrioh) sobre educ.

EXEMPLO 2.10
{Uma Equao do Logaritmo dos Salrios-Hora)
Utilizando os mesmos dados do Exemplo 2.4, mas usando log (salrioh) como a varivel dependente, obte
mos a seguinte relao:

log (salrio) = 0,584 + 0,083 educ (2.44)


Wooldridge Captulo 2 O Modelo de Regresso Simples 43

EXEMPLO 2.10 (continuao)

n = 526, R2 = 0,186.

0 coeficiente de e d u c tem uma interpretao percentual quando ele multiplicado por 100: para cada ano
adicional de educao formal, sal rio h aumenta 8,3%. Isso o que os economistas querem dizer quando se
referem ao "retorno de um ano adicional de educao formal".
importante relembrar que a principal razo para usar o log de salrioh em (2.42) impor um efeito
percentual constante da educao formal sobre salrioh. Uma vez obtida a equao (2.42), o log natural de
salrioh raramente mencionado. Em particular, n o correto dizer que um ano adicional de educao for
mal aumenta log {salrioh) em 8,3%.
0 intercepto em (2.42) no tem muito significado, visto que ele o \oq(salrioh) previsto quando
educ = 0. O /?-quadrado mostra que e d u c explica cerca de 18,6% da variao em log (salrioh) (no em
salrio). Finalmente, a equao (2.44) pode no capturar toda a no-linearidade da relao entre salrio-
hora e escolaridade formal. Se houver "efeitos-diplom a", o dcimo segundo ano de educao forma
tura do ensino mdio nos Estados Unidos deve ser muito mais valioso que o dcimo primeiro ano. No
Captulo 7 aprenderemos como lidar com esse tipo de no-linearidade.

Outro uso importante do log natural est em obter um modelo de elasticidade constante.

EXEMPLO 2.11
(Salrios de Diretores Executivos e Vendas das Empresas)
Podemos estimar um modelo de elasticidade constante que relaciona o salrio dos diretores executivos s
vendas das empresas. 0 conjunto de dados o mesmo utilizado no Exemplo 2.3, exceto que agora relacio
namos salrio a vendas. Seja vendas as vendas anuais das empresas, mensurada em milhes de dlares. Um
modelo de elasticidade constante

log (salrio) = 0 + { log (vendas) + u, (2.451

em que (5] a elasticidade de sal rio com respeito a vendas. Esse modelo est compreendido no modelo
de regresso simples ao se definir a varivel dependente como y = log (salrio), e a varivel independente
como x = log(vendas). Ao estimar essa equao por MQO, temos

log (salrio) = 4,822 + 0,2571og (vendas) (2.46)


n = 209, R2 = 0,211.

0 coeficiente de log (vendas) a elasticidade estimada de salrio em relao a vendas. Ela implica que um
aumento de 1% nas vendas das empresas aumenta o salrio dos diretores executivos em cerca de 0,257%
a interpretao usual de uma elasticidade.
44 Introduo Econometria Editora Thomson

As duas formas consideradas nesta seo surgiro no restante deste texto. Tratamos aqui de mode
los que contm logaritmos naturais porque eles aparecem muito frequentemente em trabalhos aplicados.
A interpretao desses modelos no ser muito diferente no caso da regresso mltipla.
tambm til observar o que acontece s estimativas de intercepto e de inclinao se mudarmos
as unidades de medida da varivel dependente quando ela aparece na forma logartmica. Pelo fato de
a variao da forma logartmica aproximar-se de uma variao proporcional, faz sentido que nada
acontea com a inclinao. Podemos ver isso ao escrever a varivel em uma nova escala como c,y, para
cada observao i. A equao original log(y,) = /30 + /3,x, + ur Se adicionamos log(ci) a ambos os
lados da equao, obtemos log (c,) + logy,j = [log (c,) + /30] + /^x, + n, ou log (cLv,) = [log (c,) +
13()] + /3 ,x, + m,. (Lembre-se de que a soma dos logs igual ao log de seus produtos, como mostrado
no Apndice A, disponvel no site da Thomson.) Portanto, a inclinao ainda /3,, mas o intercepto
agora log (c,) + /30. Semelhantemente, se a varivel independente for log(x), e mudarmos as unida
des de medida de x antes de considerarmos o log, a inclinao permanece a mesma, mas o intercepto
muda. Pediremos que voc verifique essas asseres no Problema 2.9.
Finalizamos esta subseo resumindo quatro combinaes de formas funcionais construdas a
partir da varivel original ou de seu logaritmo natural. Na Tabela 2.3, x e y representam as variveis
em suas formas originais. O modelo com y como a varivel dependente e x como a varivel indepen
dente chamado modelo nvel-nvel, pois cada varivel aparece em sua forma de nvel. O modelo com
log(y) como a varivel dependente e x como a varivel independente chamado modelo log-nvel.
No discutiremos aqui, explicitamente, o modelo nvel-log, pois ele aparece menos freqentemente
na prtica. De qualquer forma, veremos exemplos desse modelo em outros captulos.
A ltima coluna na Tabela 2.3 mostra a interpretao de /31. No modelo log-nvel, 100 (31 algu
mas vezes chamado semi-elasticidade de y em relao a x. Como mencionamos no Exemplo 2.11, no
modelo log-log /3, a elasticidade de y em relao a x. A Tabela 2.3 requer um estudo cuidadoso, j
que vamos, com frequncia, nos referir a ela no restante do texto.

O Significado da R egresso "Linear"


O modelo de regresso simples que estudamos neste captulo tambm chamado modelo de regresso
linear simples. No entanto, como acabamos de ver, o modelo geral tambm permite certas relaes
no-lineares. Portanto, o que significa linear aqui? Voc pode observar, ao olhar a equao (2.1), que
y = P o + P i x + u!yO importante que essa equao linear nos parmetros, /30 e /3|. No h restri
es de como y e x se relacionam com as variveis explicada e explicativa originais de interesse. Como
vimos nos Exemplos 2.7 e 2.8, j e x podem ser os logaritmos naturais de variveis, e isso muito
comum em aplicaes. Mas no precisamos parar aqui. Por exemplo, nada nos impede de usar a regres
so simples para estimar um modelo tal como cons = /30 + /3, V rend + u, em que cons o consumo
anual e rend a renda anual.

Tabela 2.3_____________________________________________________________________________
Resumo das Formas Funcionais Envolvendo Logaritmos

Varivel Varivel
Modelo Interpretao de ,
Dependente Independente
nvel-nvel y X Ay = /3,Ax

nvel-log y log(x) Ay = QS,/100)%Ax

log-nvel logey) X %Ay = (100/3, )Ax

log-log logCy) log(x) %Ay = /3,%Ax


Wooldridge Captulo 2 O Modelo de Regresso Simples 45

Embora a mecnica da regresso simples no dependa de como v e x so definidos, a interpretao


dos coeficientes depende, realmente, de suas definies. Para que os trabalhos empricos sejam bem-
sucedidos, muito mais importante tomar-se proficiente em interpretar coeficientes do que eficiente
no clculo de frmulas como (2.19). Obteremos muito mais prtica em como interpretar as estimativas
da reta de regresso de MQO quando estudarmos a regresso mltipla.
Muitos modelos no podem ser considerados modelos de regresso linear, porque eles no so
lineares em seus parmetros; um exemplo cons = 1/Q80 + ( i, rend) + u. A estimao desses modelos
leva-nos ao campo mbito do modelo de regresso no-linear, o qual est alm do escopo deste texto.
Para muitas aplicaes, suficiente escolher um modelo que possa ser expresso dentro do arcabouo
da regresso linear.

2.5 VALORES ESPERADOS E VARINCIAS DOS ESTIMADORES DE MQO


Na Seo 2.1 definimos o modelo populacional y = /3() + (3 ,x + u e afirmamos que a hiptese funda
mental para que a anlise de regresso simples seja til que o valor esperado de u, dado qualquer
valor de x, seja zero. Nas sees 2.2, 2.3 e 2.4 discutimos as propriedades algbricas da estimao de
MQO. Retomamos agora ao modelo populacional e estudaremos as propriedades estatsticas da esti
mao de MQO. Em outras palavras, veremos agora /30 e como estimadores dos parmetros )30 e
que aparecem no modelo populacional. Isso significa que estudaremos as propriedades das distribui
es de /30 e j, de diferentes amostras aleatrias da populao. (O Apndice C, disponvel o site da
Thomson, contm as definies de estimadores e revises de algumas de suas principais propriedades.)

Inexistncia de Vis em MQO


Vamos iniciar estabelecendo a inexistncia de vis do mtodo MQO sob um conjunto simples de hip
teses. Para referncias futuras, til numerar essas hipteses usando o prefixo RLS para regresso
linear simples. A primeira hiptese define o modelo populacional.

HI P TE S E R L S . l (LINEAR NOS PARMETROS)


No modelo populacional, a varivel dependente y est relacionada varivel independente x e ao erro (ou
perturbao) u como

y = 0 + \ x + K (2.47)

em que Qe ^ so os parmetros de intercepto e de inclinao populacionais, respectivamente.

Ao especificar o modelo populacional e para ser realista , y, x e u so todos vistos como


variveis aleatrias. Discutimos, em alguma extenso, a interpretao desse modelo na Seo 2.1 e
demos vrios exemplos. Na seo anterior aprendemos que a equao (2.47) no to restritiva quan
to inicialmente parecia; escolhendo y e x apropriadamente, podemos obter relaes no-lineares inte
ressantes (como os modelos de elasticidade constante).
46 Introduo Econometria Editora Thomson

Estamos interessados em usar os dados de y e x para estimar os parmetros (30 e, especialmente,


fl | . Assumimos que nossos dados foram obtidos de uma amostra aleatria. (Veja o Apndice C, dispo
nvel no site da Thomson, para uma reviso sobre amostragem aleatria.)

H I P T E S E R L S . 2 (AMOSTRAGEM ALEATRIA)
Podemos usar uma amostra aleatria de tamanho n, {(xy/): / = 1,2,..., n), proveniente de um modelo
populacional.

Em captulos posteriores que abordam a anlise de sries de tempo e problemas de seleo de amos
tra, teremos de dar um tratamento ao fato de a hiptese de amostragem aleatria no ser mais vlida.
Nem todas as amostras de corte transversal podem ser vistas como resultados de amostras aleatrias,
mas muitas podem ser assim entendidas.
Podemos escrever (2.47), em termos da amostra aleatria como

j P0 + + ut, i = 1,2,...,, (2.48)

em que m, o erro ou perturbao da observao i (por exemplo, pessoa i, empresa /, cidade i etc.).
Assim, , contm os fatores no-observveis da observao i que afetam y,. Os w, no devem ser con
fundidos com os resduos, definidos na Seo 2.3. Mais adiante, exploraremos a relao entre os
erros e os resduos. Para interpretar /30 e /3, em uma aplicao particular, (2.47) mais instrutiva, mas
(2.48) tambm necessria para algumas derivaes estatsticas.
A relao (2.48) pode ser colocada em um grfico para um registro particular dos dados, como
mostrado na Figura 2.7.
A fim de obter estimadores no-viesados de /30 e /3,, precisamos impor a hiptese de mdia condi
cional zero que discutimos, com algum detalhe, na Seo 2.1. Agora, vamos adicion-la explicitamente
nossa lista de hipteses.

H I P T E S E R L S . 3 (MEDIA CONDICIONAL ZERO)


E(u|x) = 0.

Para uma amostra aleatria, essa hiptese implica que E(m,|x,) = 0, para todo i = 1,2,..., .
Alm de restringir a relao entre u e i n a populao, a hiptese de mdia condicional zero
juntamente com a hiptese de amostra aleatria permite uma simplificao tcnica conveniente. Em
particular, podemos derivar as propriedades estatsticas dos estimadores de MQO como condicionais
aos valores de x(- em nossa amostra. Tecnicamente, em derivaes estatsticas, condicionar aos valores
amostrais da varivel independente o mesmo que tratar x, como fixo em amostras repetidas. Esse pro
cesso envolve vrios passos. Primeiro, escolhemos valores amostrais para x,, x2, ..., x. (Esses valores
podem ser repetidos.) Dados esses valores, obtemos uma amostra de y (efetivamente, obtendo uma
amostra aleatria de ,). Em seguida, obtm-se outra amostra de y, usando novamente os mesmos xh
x2, ..., x. E assim por diante.
Wooldridge Captulo 2 O Modelo de Regresso Simples 47

Figura 2.7_________________
Grfico de y, = 0 + + u,.

O fixo no cenrio de amostras repetidas no muito realista no contexto no-experimental. Por


exemplo, na amostragem de indivduos do exemplo salrios-educao, faz pouco sentido pensar em
escolher os valores de educ antecipadamente e, em seguida, fazer uma amostra de indivduos com
aqueles nveis particulares de educao formal. A amostragem aleatria, na qual os indivduos so
escolhidos aleatoriamente e seus salrios e anos de educao formal so registrados, um processo
representativo de como muitos conjuntos de dados so obtidos para a anlise emprica nas cincias
sociais. J que assumimos E(|x) = 0, e temos amostragem aleatria, nada se perde nas derivaes ao
tratar os x, como no-aleatrios. O perigo que o fixo na hiptese de amostras repetidas sempre impli
ca que n, e x, so independentes. Ao decidir quando a anlise de regresso simples produzir estima-
dores no-viesados, crucial pensar em termos da hiptese RLS.3.
Visto que concordamos em condicionar as derivaes estatsticas aos valores de x precisamos de
uma ltima hiptese para a inexistncia de vis.

HI P TES E R L S . 4 (VARIAO AMOSTRAL NA VARIVEL INDEPENDENTE)


Na amostra, as variveis independentes x i = 1 , 2 no so todas iguais a uma mesma constante. Isso
exige alguma variao em x na populao.

Encontramos a hiptese RLS.4 quando derivamos as frmulas dos estimadores de MQO; ela
n
equivalente a ^ (x, x)2 > 0. Das quatro hipteses feitas, esta a menos importante, pois ela essen-
48 Introduo Econometria Editora Thomson

cialmente nunca falha em aplicaes interessantes. Se a hiptese RLS.4 no se sustentar, no podemos


calcular os estimadores de MQO, o que significa que a anlise estatstica irrelevante.
n n
Usando o fato de que 2 (*, x)(v, y) = 2 (x: x)yi (veja o Apndice A, no site da Thomson),
;=i ;= i
podemos escrever o estimador de inclinao de MQO na equao (2.19) como

{xj - x)yi
, = ^ -------------- (2.49)
(*,. - x f
i1

Como agora estamos interessados no comportamento de ao longo de todas as amostras possveis,


j3, apropriadamente visto como uma varivel aleatria.
Podemos escrever /3, em termos dos coeficientes populacionais e dos erros ao substituir o lado
direito de (2.48) em (2.49). Temos

n n

2 (x, ~ x ')y, 2 (x, - *)(0 + \x, + ,), (2.50)


, SQT SQT

onde definimos a variao total em x, como SQTt = 2 (*, ~ x)~, a fim de simplificar a notao. (Essa
= i
expresso no exatamente a varincia amostrai de x pois no a dividimos por n - 1.) Usando a lge
bra do operador somatrio, vamos escrever o numerador de /3, como

2 (*, - -OA, + 2 (*,- - x )i xi + 2 (x, - x)ui

(2.51)
o 2 {xi - x)-y- i E (x, - x)xi + (*, - x ) ;

n n n

Como mostrado no Apndice A, ^ (x* x ) ~ 0 e X (xi x ) x. = ^ (x ~ x )2 = Portanto, pode-


/=i t=i /=i
n
mos escrever o numerador de /3, como jS^QT^ + 2 (x; x)w;. Escrevendo isso no denominador
/=!
resulta

2 (x, - x)ut
l = , + ----- = , + (1/SQT) 2 d .ur (2.52)
Wooldridge Captulo 2 O Modelo de Regresso Simples 49

onde di = x, x. Vemos agora que o estimador /3, igual inclinao populacional /3, mais um termo
que uma combinao linear dos erros {uuu2,...,u}. Condicionada aos valores de x a aleatoriedade
em /3, deve-se inteiramente aos erros na amostra. O fato de que esses erros sejam, em geral, diferentes
de zero o que faz com que /3, seja diferente de j8,.
Ao usar a representao em (2.52), podemos provar a primeira importante propriedade estatstica
do mtodo MQO.

TEOREMA 2. 1 (INEXISTNCIA DE VIS EM MQO)


Usando as hipteses RLS.l a RLS.4,

E03o) = / 3 o e E 0 3 1) = j 3 1, (2.S3)

para quaisquer valores de >30 e/3,. Em outras palavras, /30 no-viesado para/30, e/3, no-viesado para /3,.
PROVA: Nesta prova, os valores esperados esto condicionados aos valores amostrais da varivel indepen
dente. Visto que SQT* e d, so funes somente de x,, eles so no-aleatrios quando condicionais. Portanto,
de (2.52), e mantendo o condicionamento a {x1(x2,...,xn} implcito, temos

ECjSj) = 13, + E[(l/SQ Tv) t d, I = j8, + (1/SQT ) f E(d u )


i=1 /=!

= /3, + (1/SQT,) 2 di E(,) = jS, + (1/SQT,) J, 0 = /3


1= 1 1=1

onde usamos o fato de que o valor esperado de cada u, (condicional a {x1(x2,...,xn}) zero sob as hipteses
RLS.2 e RLS.3. Como a inexistncia de vis se mantm para qualquer resultado condicionado a {x,,x2.... xn],
a inexistncia de vis tambm se mantm sem se condicionar a {x1(x2,...,xn}.
A prova para /30 agora direta. Obtenha a mdia de (2.48) atravs de / para obter y = (50 + /3, x + ,
e insira essa equao na frmula de /30 :

P0 = y ~/3, x = p 0 + f3l x + >3, T = )30 + 03, -j3 ,)x + .

Ento, condicional aos valores de x

E(/0) = A) + E[(j8, - / 3 , ) x ] + E() = + E[Q3, - /3,)]x,

j que, pelas hipteses RLS.2 e RLS.3, E() = 0. No entanto, mostramos que E(/3,) = /3,, o que implica que
E[(/3, - >3n)] = 0. Assim, E(/30) = /30. Ambos os argumentos so vlidos para quaisquer valores de y30 e jS,,
e assim estabelecemos a inexistncia de vis.
50 Introduo Econometria Editora Thomson

Lembre-se de que a inexistncia de vis uma caracterstica das distribuies amostrais de /3, e
(30, o que no nos diz nada sobre a estimativa que obtemos de uma dada amostra. Esperamos que, se a
amostra que obtemos de algum modo tpica, ento nossa estimativa deve estar prxima do valor
populacional. Infelizmente, sempre possvel obter uma amostra ruim que nos d uma estimativa pon
tual distante de J3h e ns nunca saberemos, com certeza, se esse o caso. Neste ponto, voc pode que
rer revisar o material sobre estimadores no-viesados no Apndice C (disponvel no site da Thomson),
especialmente o exerccio de simulao da Tabela C .l, o qual ilustra o conceito de inexistncia de vis.
Em geral, a inexistncia de vis no vlida se qualquer uma das nossas quatro hipteses no
for vlida. Isso significa que importante pensar na veracidade de cada hiptese em uma aplicao
particular. Como j discutimos, se a hiptese RLS.4 no for vlida, ento no seremos capazes de
obter as estimativas de MQO. A hiptese RLS.l requer que y e x sejam linearmente relacionados com
uma perturbao adicionada. Certamente, isso pode no ser vlido. Mas sabemos tambm que y e x
podem ser escolhidos de forma que possam produzir relaes no-lineares interessantes. Estudar com
a no validade de (2.47) requer mtodos mais avanados, que esto alm do escopo deste texto.
Posteriormente, veremos como relaxar a hiptese RLS.2, a hiptese de amostragem aleatria, na
anlise de sries de tempo. Porm, o que dizer de seu uso na anlise de corte transversal? A amostra
gem aleatria pode no ser vlida em um corte transversal quando as amostras no so representativas
da populao subjacente; de fato, alguns conjuntos de dados so construdos fazendo-se, intencional
mente, amostras de partes diferentes da populao. Discutiremos os problemas de amostragem no-
aleatria nos Captulos 9 e 17.
A hiptese na qual devemos nos concentrar agora a RLS.3. Se RLS.3 se mantm, as estimativas
de MQO so no-viesadas. Do mesmo modo, se RLS.3 no se mantm, os estimadores de MQO sero,
em geral, viesados. H maneiras de determinar a direo e o tamanho provveis do vis, algo que estu
daremos no Captulo 3.
A possibilidade de que x seja correlacionado com u quase sempre uma preocupao na anlise
de regresso simples com dados no-experimentais, como indicamos por meio de vrios exemplos na
Seo 2.1. Usar a regresso simples quando u contm fatores que afetam y e que tambm esto corre
lacionados comxpode resultar em correlao espria: isto , achamos uma relao entre y e x que se
deve, em verdade, a outros fatores que afetam y e que tambm esto correlacionados com x.

EXEMPLO 2.12
(Desempenho em Matemtica de Estudantes e o Programa de Merenda Escolar)
Seja m a te i0 a percentagem de alunos do primeiro ano do ensino mdio aprovados em um exame de mate
mtica. Suponha que desejamos estimar o efeito do programa de merenda escolar financiado pelo governo
sobre o desempenho dos alunos. Esperamos que o programa de merenda tenha um efeito cete ris p a rib u s
positivo sobre o desempenho: todos os outros fatores permanecendo iguais, se um estudante, bastante pobre
para ter regularmente refeies, torna-se qualificado para o programa de merenda escolar, seu desempenho
deveria melhorar. Seja p rg a lm a percentagem de estudantes que esto aptos para participar do programa de
merenda escolar. Portanto, o modelo de regresso simples

mate 10 = 0 + ^prgalm + u, (2.54)

em que u contm caractersticas da escola e do estudante que afetam o desempenho escolar total. Usando
os dados do arquivo de MEAP93.RAW de 408 escolas de Michigan no ano escolar 1992-1993, obtemos
Wooldridge Captulo 2 O Modelo de Regresso Simples 51

EXEMPLO 2.12 (continuao)

mate 10 = 32,14 0,319 prgalm

n = 408, R2 = 0,171.

Essa equao prev que se a participao dos estudantes no programa de merenda escolar aumenta em dez
pontos percentuais, a percentagem de estudantes que passa no exame de matemtica cai cerca de 3,2 pon
tos percentuais. Realmente devemos acreditar que a participao maior no programa de merenda escolar
causa, de fato , um desempenho pior? Muito provavelmente no. Uma explicao melhor que o termo erro
u na Equao (2.54) est correlacionado com p rg a lm . De fato, u contm fatores como a taxa de pobreza
das crianas que freqentam a escola, que afeta o desempenho dos estudantes e est altamente correlacio
nada com a qualificao no programa de merenda. Variveis como qualidade e recursos da escola tambm
esto contidas em u e, provavelmente, esto correlacionados com p rg a lm . importante lembrar que a esti
mativa -0,319 somente para essa amostra particular, mas seu sinal e magnitude nos fazem suspeitar de
que o e x sejam correlacionadas, de modo que a regresso linear viesada.

Alm de variveis omitidas, h outras razes para que x esteja correlacionado com u no modelo
de regresso simples. Como essas mesmas questes surgiro na anlise de regresso mltipla, poster
garemos at l um tratamento sistemtico do problema.

Varincias dos E stim adores de MQO


Alm de saber que a distribuio amostrai de /3, est centrada em tomo de /3, (/3, no-viesado),
importante saber o quo distante, em mdia, podemos esperar que /3, esteja de /3,. Entre outras coisas,
isso nos permite escolher o melhor estimador entre todos os estimadores no-viesados ou pelo
menos entre uma ampla classe deles. A medida de disperso da distribuio de /3, (e /30) com a qual
mais fcil trabalhar a varincia, ou sua raiz quadrada, o desvio-padro. (Veja o Apndice C, dispon
vel no site da Thomson, para uma discusso mais detalhada.)
A varincia dos estimadores de MQO pode ser calculada sob as hipteses RLS.l a RLS.4.
Entretanto, as expresses dessas varincias so complexas. Em vez disso, vamos adicionar uma hip
tese que tradicional na anlise de corte transversal. Essa hiptese afirma que a varincia do termo
no-observvel, u, condicionado a r , constante. Ela conhecida como a hiptese de homoscedasti-
cidade ou de varincia constante.

H I P T E S E R L S . 5 (HOMOSCEDASTICIDADE)
Var(u|x) = cr2.

Devemos enfatizar que a hiptese de homoscedasticidade completamente distinta da hiptese de


mdia condicional zero, E(|x) 0. A hiptese RLS.3 compreende o valor esperado de u, enquanto a
hiptese RLS.5 diz respeito varincia de u (ambos condicionados a x). Lembre-se de que ns esta
belecemos a inexistncia de vis de MQO sem a hiptese RLS.5: a hiptese de homoscedasticidade
no desempenha qualquer papel para mostrar que /30 e /3, so no-viesados. Adicionamos a hiptese
52 Introduo Econometria Editora Thomson

RLS.5 pois ela simplifica os clculos da varincia de /30 e )3, e porque ela implica que o mtodo de
mnimos quadrados ordinrios tenha certas propriedades de eficincia, algo que veremos no Captulo
3. Se assumssemos que u e x so independentes, a distribuio de u, dado x, no dependeria de x, e
assim E(w|x) = E(w) = 0 e Var(|x) = a 2. No entanto, algumas vezes independncia , uma hiptese
forte demais.
Como Var(|jr) = E(m2|x) - [E(ulx)]2 e E(u\x) = 0, a 2= E(h2Ix), o que significa que cr2 tambm
a esperana no-condicional de u2. Portanto, cr2 = E(u2) = Var(w), pois E(u) = 0. Em outras pala
vras, cr2 a varincia no-condicional de u, e por isso cr2 freqentemente chamado de varincia do
erro ou varincia da perturbao. A raiz quadrada de a 2, a, o desvio-padro do erro. Um a grande
significa que a distribuio dos fatores no-observveis que afetam y mais dispersa.
Freqentemente, til escrever as hipteses RLS.3 e RLS.5 em termos da mdia condicional e da
varincia condicional de y:

E(y|x) = 0 + ix. (2.55)

Var(y|x) = a 2. (2.56)

Em outras palavras, a esperana condicional de y, dado x, linear em a, mas a varincia de v, dado


x, constante. Essa situao est ilustrada na Figura 2.8, em que f t > 0 e j 8 , > 0 .
Quando Var(w|x) depende de x, diz-se que o termo erro apresenta heteroscedasticidade (ou
varincia no-constante). Como Var(|x) = Var(_y|x), a heteroscedasticidade est presente sempre que
Var( v |xj uma funo de x.

Figura 2.8__________________________________________________________________________
0 modelo de regresso simples sob homoscedasticidade.
Wooldridge Captulo 2 O Modelo de Regresso Simples 53

EXEMPLO 2.13
(Heteroscedasticidade em uma Equao de Salrios)
A fim de obter um estimador no-viesado do efeito ceteris p a rib u s de e d u c sobre salroh, devemos assu
mir que E(u\educ) = 0, e isso implica (s a l rio h \e d u c ) = f30 + /3,educ. Se tambm usarmos a hiptese de
homoscedasticidade, ento Var(u|educ) = <x2 no depende do nvel de educao formal, que o mesmo
que assumir que V ar(salrioh\educ) = cr2. Assim, enquanto se deixa o salrio-hora mdio aumentar com o
nvel de educao formal - essa taxa de crescimento que estamos interessados em descrever - assume-se
que a variabilidade no salrio horrio em torno de sua mdia constante atravs de todos os nveis de edu
cao formal: isso pode no ser realista. provvel que pessoas com mais tempo de educao formal tenham
uma variedade maior de interesses e de oportunidades de trabalho, o que poderia levar a uma variabilidade
maior nos nveis de educao formal mais elevados. Pessoas com nveis de educao formal bastante baixos
tm muito poucas oportunidades e, freqentemente, precisam trabalhar recebendo salrio mnimo; isso tem
o efeito de reduzir a variabilidade salarial nos nveis baixos de educao formal. Essa situao mostrada
na Figura 2.9. Em ltima anlise, se a hiptese RLS.5 se mantm ou no uma questo emprica. No Captulo
8 mostraremos como testar a hiptese RLS.5.

Figura 2.9 _____________________


Var (salroh/educ} crescendo com educ.

f(salrioh/educ)

salrioh

E(salriohieduc) =
P0 + P,ecfuc

educ
54 Introduo Econometria - EditoraThomson

Com a hiptese apropriada de homoscedasticidade, estamos prontos para provar o seguinte:

T E ORE MA 2 . 2 {VARIANCIAS AMOSTRAIS EM MQO)


Sob as hipteses RLS.1 a RLS.5,

Var03,) = -s = ^ 2/SQ T , (2.57)


2 (*,- - x )2

cr2n ' 2 xf
Var(/30) = ----- '=! , (2.58)
2 (x i - x ) 2
i=1

as quais esto condicionadas aos valores amostrais [x u ...,xn].


PROVA: Derivaremos a frmula para V ar(/3,), deixando a outra derivao como exerccio. 0 ponto de par-
n
tida a equao (2.52): /3, = 0 , + (1/SQTX) X Visto que /3, exatamente uma constante, condido-
_ /= 1
nal aos x SQTX e d, = x, - x tambm so no-aleatrios. Alm disso, como os u, so variveis aleatrias
independentes para todos os / (por amostragem aleatria), a varincia da soma a soma das varincias.
Usando esses fatos, temos

Var(/3,) = (l/SQ Tt)2 Var dt u. = (l/SQTx)2 2 d Var (,)

= (1/SQTa)2( 2 V2 rr2 ) [visto que Var(;) = o-2 para todos os r]

= o-2 ( 1 / S Q T / ( 2 d 2 ) = o-2 / S Q T / S Q T = o-2/S Q T r

que o que queramos provar.

As equaes (2.57) e (2.58) so as frmulas padres para a anlise de regresso simples, mas
no so vlidas na presena de heteroscedasticidade. Isso ser importante quando tratarmos dos inter
valos de confiana e dos testes de hipteses na anlise de regresso mltipla.
Para a maior parte dos propsitos, estamos interessados em Var(j8,). E fcil resumir como essa
varincia depende da varincia do erro, cr2, e da variao total em [X], x2,..., x}, SQTt. Primeiro, quan
to maior a varincia do erro, maior Var(j3,). Isso faz sentido, j que uma variao maior nos fatores
Wooldridge Captulo 2 O Modelo de Regresso Simples 55

no-observveis que afetam y faz com que seja mais difcil estimar com preciso /3,. Em contraparti
da, prefervel maior variabilidade na varivel independente;_quando a variabilidade nos x, aumenta,
a varincia de diminui. Isso tambm tem um sentido intuitivo, visto que quanto mais dispersa for a
amostra das variveis independentes, mais fcil ser descrever a relao entre Efy|x) e x. Isto , ser
mais fcil estimar jS,. Se h pouca variao nos x h pode ser difcil estabelecer com preciso como
Efy|x) varia com x. Quando o tamanho da amostra cresce, do mesmo modo cresce a variao total nos
Xj. Portanto, um tamanho de amostra maior resulta em uma varincia menor de P ].
Essa anlise mostra que, se estamos interessados em 0 ,, e temos uma escolha, ento devemos
escolher os x; to dispersos quanto possvel. As vezes, isso possvel com dados experimentais, mas
raramente temos esse luxo nas cincias sociais: usualmente, temos de pegar os x, que obtemos via
amostragem aleatria. Algumas vezes, temos uma possibilidade de obter amostras maiores, embora
isso possa ser dispendioso.

Mostre que, ao estimar p 0, melhor ter x = 0. Qual a Var(/0) nesse caso? [Sugesto: para qualquer
n n
amostra de nmeros, 2 x 2 2 (*,- - x )2> mantendo-se a igualdade somente se x = 0.]
i=i =i

Para o propsito de construir intervalos de confiana e derivar estatsticas de testes, precisaremos


trabalhar com os desvios padro de 0 , e 0 (l, d p (0 ,) e dp(0o). Lembre-se de que eles so obtidos ao cal
cular as razes quadradas das varincias em (2.57) e (2.58). Particularmente, dp(0,) = er/V SQ T, em
que (r a raiz quadrada de cr2 e V SQ Tj a raiz quadrada de SQTX.

Estimao da V arincia do Erro


As frmulas em (2.57) e (2.58) permitem-nos isolar os fatores que contribuem para Var(0 ,) e Var(0o).
No entanto, essas frmulas so desconhecidas, exceto no caso extremamente raro em que cr~ conheci
do. No obstante, podemos usar os dados para estimar cr2, o qual conseqentemente nos permite estimar
Varf/3,) e Var(0).
Este um bom momento para enfatizar a diferena entre os erros (ou perturbaes) e os resduos,
j que essa discusso crucial para a construo de um estimador de cr2. A equao (2.48) mostra como
escrever o modelo populacional em termos de uma observao extrada aleatoriamente como yt = /30
+ f i ]xl + m em que , o erro da observao i. Podemos expressar tambm _v, em termos de seu valor
estimado e do resduo, como na equao (2.32): yt = 0 (l + 0,x, + r Comparando essas duas equa
es, vemos que o erro aparece na equao que contm os parmetros populacionais, p 0 e yS|. Em con
trapartida, os resduos aparecem na equao estimada com 0 Oe 0 ,. Os erros nunca so observveis,
enquanto os resduos so calculados a partir dos dados.
Podemos usar as equaes (2.32) e (2.48) para escrever os resduos como uma funo dos erros:

m, = - j0 - /3 ,x , = (jS0 - ( i ix , + Ui) - 30 - P xx ,

OU

/ = Ui - (00 - 0o) ~ (01 _ 0 l ) */ (2.S9)


56 Introduo Econometria Editora Thomson

Embora o valor esperado de (3n iguale-se a /30, e similarmente para /3| , i no o mesmo que A
diferena entre eles tem, de fato, um valor esperado igual a zero.
Agora que entendemos a diferena entre os erros e os resduos, podemos retomar para estimar a 2.
n
Primeiro, a 2 = E(n2), de modo que um estimador no-viesado de <r2 1 ^ uj. Infelizmente, esse
= i
no um estimador verdadeiro, pois no observamos os erros ut. Mas, temos, de fato, as estimativas de
uh a saber, os resduos , de MQO. Se substitumos os erros pelos resduos de MQO, temos
n
w ' 2 ] ~ SQR/. Esse um estimador verdadeiro, porque ele fornece uma regra computvel para
!~ 1
qualquer amostra de dados sobre x e y . Uma ligeira desvantagem desse estimador que ele resulta viesa-
do (embora o vis seja pequeno para n grande). Como fcil calcular um estimador no-viesado, usamos
esse como substituto.
O estimador SQRIn viesado, essencialmente, porque ele no explica a razo de duas restries
que devem ser satisfeitas pelos resduos de MQO. Essas restries so dadas pelas duas condies de
primeira ordem de MQO:

, = 0> V , = - (2.60)
i=i ;=i

Uma maneira de ver essas restries esta: se ns conhecemos n 2 dos resduos, podemos sempre
obter os outros dois resduos usando as restries implicadas pelas condies de primeira ordem em
(2.60). Assim, h somente n 2 graus de liberdade nos resduos de MQO, em oposio a n graus de
liberdade nos erros. Se substitussemos j por n, em (2.60), as restries no mais se manteriam. O
estimador no-viesado de cr2 que utilizaremos faz um ajustamento dos graus de liberdade:

&2 = ^ = SQR/( ~ 2)' *2 '61*

(Esse estimador , s vezes, denominado por s2, mas continuaremos a usar a conveno de colocar
chapus sobre os estimadores.)

T E ORE MA 2. 3 (ESTIMAO NO-VIESADA DE tf2)


Sob as hipteses RLS.1 a RLS.5,
E ( 2) = a \

PROVA: Se construirmos a mdia da equao (2.59) para todos os / e usarmos o fato de que os resduos de
MQO tm mdia igual a zero, temos 0 = u - (j3 0 - /30) - (/?, - j8 ,)x ; subtraindo essa equao de
(2.59), resulta i = (uj - n) - (/3, - /3])(xi - x). Portanto, j = (ut - )2 + ()3, - y3,)2(x, - x f -
n n
2(n,- - ) ( - /SjXx,- - x ). A soma ao longo de todos os / resulta na equao 2 j = X (M,- ~ )2 +
i=1 i=
( /3, - 18,)2 2 (x i ~ x ) 2 - 2( - yS,) 2 , (x; - x ) . Agora, o valor esperado do primeiro termo
;=i i=i
(.n l)c r2, algo que est mostrado no Apndice C, no site da Thomson.
Wooldridge Captulo 2 0 Modelo de Regresso Simples 57

TEOREMA 2 . 3 (ESTIMAO NO-VIESADA DE a ) (continuao)


0 valor esperado do segundo termo , simplesmente, cr2, porque E[(y3t - /S,)2] = V a r /l,) = a 2/s].

Finalmente, o terceiro termo pode ser escrito como: 2( /3, - (3 ,)2s2; aplicando as esperanas, resulta em 2 a 2.

Colocando esses trs termos juntos, obtemos E ^ ) j = (n - l)c r 2 + cr2 - 2cr2 = (n - 2) a 2, de modo

que E [SQ R /(n - 2)] = a 1.

Se 2 for inserido nas frmulas da varincia (2.57) e (2.58), ento teremos estimadores no-vie-
sados de Var(/3,) e Var(/30). Posteriormente, necessitaremos de estimadores dos desvios padro de /,
e/30, e isso requer estimar a. O estimador natural de a

(2 .62 )

e chamado erro-padro da regresso (EPR). (Outros nomes para so erro-padro da estimativa


e raiz do erro quadrado mdio, mas no os usaremos.) Ainda que no seja um estimador no-viesa-
do de a, podemos mostrar que ele um estimador consistente de cr (veja Apndice C, disponvel no
site da Thomson), e que ele servir muito bem para nossos propsitos.
A estimativa & interessante, j que ela uma estimativa do desvio-padro dos fatores no obser
vveis que afetam v; equivalentemente, ela estima o desvio-padro em y aps os efeitos de x terem sido
retirados. A maior parte dos programas economtricos informa o valor de & juntamente com o f?-qua-
drado, o intercepto, a inclinao e outras estatsticas de MQO (sob um dos vrios nomes listados ante
riormente). Por enquanto, nosso principal interesse est em usar & para estimar os desvios-padro de
p 0 e /?,. Como dp(/8j) = a/sx, o estimador natural de dp(/3,)

ep(/3,) = &/sx = (j/^X U-, - x ) 2

que chamado de erro-padro de /3,. Observe que ep(/,) visto como uma varivel aleatria quan
do pensamos em processar o mtodo MQO usando diferentes amostras de y, isso ocorre porque a 2
varia com diferentes amostras. Para uma dada amostra, ep(/8,) um nmero, exatamente como /3,
simplesmente um nmero quando ns o calculamos a partir de dados conhecidos.
Semelhantemente, ep(/30) obtido de dpi/3()) ao substituir a por &. O erro-padro de qualquer
estimativa nos d uma idia de qual preciso o estimador. Os erros-padro desempenham um papel
central em todo este texto; ns os usaremos para construir estatsticas de testes e intervalos de confian
a para todos os procedimentos economtricos que cobriremos, a partir do Captulo 4.
58 Introduo Econometria Editora Thomson

2.6 REGRESSO ATRAVS DA ORIGEM


Em raros casos, desejamos impor a restrio de que, quando x = 0, o valor esperado de y zero. H
certas relaes para as quais isso razovel. Por exemplo, se a renda (x) for zero, ento os gastos com
o imposto de renda (j) devem ser zero. Alm disso, h problemas quando um modelo que originalmen
te tem um intercepto diferente de zero transformado em um modelo sem um intercepto.
Formalmente, ns escolhemos agora um estimador da inclinao, que chamaremos de 0 t, e uma
reta da forma

= i x, (2.63)

em que os sinais grficos do til sobre /3j e y so usados para distinguir esse problema do problema
muito mais comum de estimar um intercepto juntamente com uma inclinao.) Costuma-se chamar
(2.63) de regresso atravs da origem, pois a reta (2.63) passa pelo ponto x = 0, y = 0. Para obter a
estimativa de inclinao em (2.63), ns ainda contamos com o mtodo de mnimos quadrados ordin
rios, que minimiza, nesse caso, a soma dos resduos quadrados:

S O i-tM ,')2- (2.64)


i1

Usando clculo, pode-se mostrar que deve resolver a condio de primeira ordem:

i *,) = 0. (2.65)
;* 1

Da, podemos resolver para /?,:

(2 .66 )

i=i

desde que nem todos os x, sejam zero um caso que exclumos.


Observe como j8, se compara com a estimativa de inclinao quando tambm estimamos o inter
cepto (em vez de determin-lo igual a zero). Essas duas estimativas so as mesmas se, e somente se,
x = 0. [Veja a equao (2.49) para /3r ] Obter uma estimativa de /3, usando a regresso atravs da ori
gem no frequente em trabalhos aplicados, e por boas razes: se o intercepto /30 A 0, logo /3, um
estimador viesado de (31. Voc ser solicitado a provar isso no Problema 2.8.
Wooldridge Captulo 2 O Modelo de Regresso Simples 59

Neste captulo introduzimos o modelo de regresso simples e cobrimos suas propriedades bsicas.
Dada uma amostra aleatria, o mtodo de mnimos quadrados ordinrios usado para estimar os par
metros de inclinao e de intercepto no modelo populacional. Demonstramos a lgebra da reta de
regresso de MQO, incluindo os clculos dos valores estimados e dos resduos, e a obteno das
variaes previstas na varivel dependente a partir de uma dada variao na varivel independente.
Na Seo 2.4 discutimos duas questes de importncia prtica: (1) o comportamento das estimativas
de MQO quando mudamos as unidades de medida da varivel dependente ou da varivel independen
te e (2) o uso do log natural na elaborao de modelos de elasticidade constante e de sem-elasticida-
de constante.
Na Seo 2.5, mostramos que, sob as quatro hipteses RLS.l a RLS.4, os estimadores de MQO
so no-viesados. A hiptese fundamental que o termo erro u tem mdia zero, dado qualquer valor
da varivel independente x. Infelizmente, h razes para pensar que isso falso em muitas aplicaes da
regresso simples nas cincias sociais, em que os fatores omitidos em u esto frequentemente corre
lacionados com x. Quando adicionamos a hiptese de que a varincia do erro, dado x, constante, obti
vemos frmulas simples das varincias amostrais dos estimadores de MQO. Como vimos,(a varincia
do estimador de inclinao cresce quando a varincia do erro cresce, e ela decresce quando h mais
variao amostrai na varivel independente. Tambm derivamos um estimador no-viesado para
<72 = Var(u).
Na Seo 2.6, discutimos brevemente a regresso atravs da origem, cujo estimador de inclinao
obtido sob a hiptese de que o intercepto zero. As vezes, tal regresso til, mas ela no aparece
com frequncia em trabalhos aplicados.
Temos ainda muito trabalho por fazer. Por exemplo, ainda no sabemos como testar hipteses
sobre os parmetros populacionais, /30 e f j. Assim, embora saibamos que o mtodo MQO , sob as
hipteses RLS.l a RLS.4, no-viesado para os parmetros populacionais, no temos um modo de fazer
inferncias sobre a populao. Outros tpicos, tais como a eficincia de MQO relativa a outros proce
dimentos possveis, tambm foram omitidos.
As questes de intervalos de confiana, testes de hipteses e eficincia tambm so centrais para
a anlise de regresso mltipla. Como a maneira que construmos os intervalos de confiana e as esta
tsticas de testes muito similar para a regresso mltipla e porque a regresso simples um caso
especial da regresso mltipla , nosso tempo ser mais bem gasto se nos movermos para a regresso
mltipla, que muito mais aplicvel que a regresso simples. Nosso propsito, no Captulo 2, foi fazer
voc pensar nas questes que surgem na anlise economtrica dentro de uma estrutura clara e simples.

2.1 Seja filhos o nmero de filhos de uma mulher e educ os anos de educao da mulher. Um mode
lo simples que relaciona a fertilidade a anos de educao

filhos = f50 + fi | educ + u,

em que u um erro no-observvel.


(i) Que tipos de fatores esto contidos em w? provvel que eles estejam correlacionados com
o nvel de educao?
60 Introduo Econometria - Editora Thomson

(ii) Uma anlise de regresso simples mostrar o efeito ceteris paribus da educao sobre a fer
tilidade? Explique.
2.2 No modelo de regresso linear simples y = /30 + (3tx + u, suponha que E(u) + 0. Fazendo
oc0 = E(m), mostre que o modelo pode sempre ser reescrito com a mesma inclinao, mas com um
novo intercepto e erro, em que o novo erro tem um valor esperado zero.
2.3 A tabela seguinte contm as variveis nmgrad (nota mdia em curso superior nos Estados
Unidos) e tac (nota do teste de avaliao de conhecimentos para ingresso em curso superior nos
Estados Unidos) com as notas hipotticas de oito estudantes de curso superior. A nota nmgrad est
baseada em uma escala de quatro pontos e foi arredondada para um dgito aps o ponto decimal. A
nota tac baseia-se em uma escala de 36 pontos e foi arredondada para um nmero inteiro.

Estudante nmgrad tac

1 2,8 21

2 3,4 24

3 3,0 26

4 3,5 27

5 3,6 29

6 3,0 25

7 2,7 25

8 3,7 30

(i) Estime a relao entre nmgrad e tac usando MQO; isto , obtenha as estimativas de inter
cepto e de inclinao da equao

nmgrad = 0 O+ j3ttac.

Comente a direo da relao. O intercepto tem uma interpretao til aqui? Explique. Qual
deveria ser o valor previsto de nmgrad se a nota tac aumentasse em cinco pontos?
(ii) Calcule os valores estimados e os resduos de cada observao e verifique que a soma dos
resduos (aproximadamente) zero.
(iii) Qual o valor previsto de nmgrad quando tac = 20?
(iv) Quanto da variao de nmgrad dos 8 estudantes explicada por taci Explique.
2.4 Os dados do arquivo BWGHT.RAW contm dados de nascimentos por mulheres nos Estados
Unidos. As duas variveis de interesse so: a varivel dependente, peso dos recm-nascidos em onas*
(pesonas), e a varivel explicativa, nmero mdio de cigarros que a me fumou por dia durante a gra
videz (cigs). A seguinte regresso simples foi estimada usando dados de n = 1.388 nascimentos:

pesonas = 119,77 0,514 cigs

NT: 1 ona = 31,10 g.


Wooldridge Captulo 2 O Modelo de Regresso Simples 61

(i) Qual o peso de nascimento previsto quando cigs = 0? E quando cigs = 20 (um mao por
dia)? Comente a diferena.
(ii) O modelo de regresso simples necessariamente captura uma relao causal entre o peso de
nascimento da criana e os hbitos de fumar da me? Explique.
(iii) Para prever um peso de nascimento de 125 onas, qual deveria ser a magnitude de cigs'!
Comente.
(iv) Qual a frao de mulheres na amostra que no fumaram enquanto estiveram grvidas? Isso
ajuda a reconciliar sua concluso da parte (iii)?
2.5 Na funo de consumo linear

cns = 0 O+ f31rend.

a propenso marginal a consumir PMgC (estimada) simplesmente a inclinao (3,, enquanto a pro
penso mdia a consumir PmeC cns/rend = [30/rend + (3r Usando as observaes de renda e
consumo anuais de 100 famlias (ambas medidas em dlares), obteve-se a seguinte equao:

cns = 124,84 + 0,853 rend


n = 100, R(i)2 = 0,692.

(i) Interprete o intercepto dessa equao e comente seu sinal e magnitude.


(ii) Qual o consumo previsto quando a renda familiar $ 30.000?
(iii) Com rend sobre o eixo de x, desenhe um grfico da PMgC e da PmeC estimadas.
2.6 Usando dados de casas vendidas em 1988 em Andover, Massachusetts [Kiel e McClain (1995)],
a equao seguinte relaciona os preos das casas (preo) distncia de um incinerador de lixo recen
temente construdo (dist):

log (preo) = 9,40 + 0,312 log (dist)

n = 135, R2 = 0,162.

(i) Interprete o coeficiente de log(dist). O sinal dessa estimativa o que voc esperava?
(ii) Voc considera que a regresso simples oferece um estimador no-viesado da elasticidade cete-
ris paribus de preo em relao a dist? (Pense na deciso da cidade sobre onde colocar o inci
nerador.)
(iii) Quais outros fatores relativos a casas afetam seu preo? Eles poderiam estar correlaciona
dos com a distncia do incinerador?
2.7 Considere a funo de poupana

poup = /30 + /3i rend + u, u = V rend e,

onde e uma varivel aleatria com E(e) = 0 e Var(e) = cr2. Assuma que e independente de rend.
62 Introduo Econometria Editora Thomson

(i) Mostre que E(u\rend) = 0, de modo que a hiptese de mdia condicional zero (hiptese
RLS.3) satisfeita. [Sugesto: se e independente de rend, ento E (tjrend) = E(e).]
(ii) Mostre que Var(n|reJ) = cr~ rend, de modo que a hiptese de homoscedasticidade RLS.5
violada. Em particular, a varincia de poup aumenta com rend. [Sugesto: Var(e|rend) =
Varie), se e e rend so independentes.]
(iii) Faa uma discusso que sustente a hiptese de que a varincia da poupana aumenta com a
renda da famlia.
2.8 Considere o modelo de regresso simples padro y = f30 + /3]X + u, sob as hipteses RLS.l a
RLS.4. Os estimadores usuais /30 e /3, so no-viesados para seus respectivos parmetros populacio
nais. Seja jS{ o estimador de /3, obtido ao assumir que o intercepto zero (veja a Seo 2.6).
(i) Encontre EQ3,) em termos de xh /30 e /3,. Verifique que /3, no-viesado para (5, quando o
intercepto populacional (jS0) zero. H outros casos em que /3, no-viesado?
(ii) Encontre a varincia de /3,. [Sugesto: a varincia no depende de ji{]. ]
/I
(iii) Mostre que Var(/3,) < Var(/3,). [Swgejo: para qualquer amostra de dados, 2 2
;=i ;=i
(x. a )2, com a desigualdade estrita preponderando, a no ser que x = 0.]
(iv) Comente a relao entre vis e varincia, ao escolher entre /3, e /3r
2.9 (i) Sejam /3(1e /3 o intercepto e a inclinao da regresso de y, sobre x usando n observaes. Se
jam c, e c2 constantes, com c2 A 0. Sejam )30 e /3, o intercepto e a inclinao da regresso
de c xyi sobre c2x,. Mostre que j8, = ( C ] / c 2) /3, e j80 = c, )30, verificando as observaes
sobre as unidades de medida da Seo 2.4. [Sugesto: para obter /3P insira as transfor
maes de x e y em (2.19). Em seguida, use (2.17) para /3(), estando seguro de usar as trans
formaes d e x e y e a inclinao correta.]
(ii) Agora, sejam /30 e /3, os parmetros estimados da regresso de (c, + v,) sobre (c2 + x,) (sem
qualquer restrio sobre C] ou c2). Mostre que = )3, e 0 Q = 0 (j + c, c2 f i v
(iii) Agora, sejam fi(t e /3, as estimativas de MQO da regresso log(v,j sobre x para a qual deve
mos assumir yt > 0 para todo i. Para c , > 0, sejam )80 e /3, o intercepto e a inclinao da
regresso de logc^,) sobre x,. Mostre que >3, = /3, e )30 = log(c,) +
(iv) Agora, assumindo que x, > 0 para todo /, sejam /30 c / j ( o intercepto e a inclinao da regres
so de y, sobre log(c2x,). Como /30 e /3, comparam-se com o intercepto e a inclinao da
regresso de _v, sobre log(x,)?

Minimizando a Soma dos Resduos Quadrados___________________________________


Mostramos aqui que as estimativas de MQO /30 e jS, minimizam a soma dos resduos quadrados,
como afirmado na Seo 2.2. Formalmente, o problema caracterizar as solues /30 e /S, para o pro
blema de minimizao
Wooldridge Captulo 2 O Modelo de Regresso Simples 63

min n
2 1 O,- - bo b , X,.)2,
bv b \

onde b0 e,bx so argumentos dummies para o problema de otimizao; por simplicidade, chame essa
funo Q(b0,bi). De um resultado fundamental do clculo multivariado (veja Apndice A, dispon
vel no site de Thomson), uma condio necessria para /30 e /3, resolverem o problema de minimi-
zao que as derivadas parciais de Q(b0,bx) em relao a b() e b , devem ser zero quando avaliadas
com /3(J e j8,: dQ(fi, j i x)ldb0 = 0 e rjQ(fi(t,( il)/iJbl = 0. Usando a regra da cadeia do clculo, essas
duas equaes tomam-se

- 2 ' 2 ( y i - 0 - lxl) = d
1=1
- 2 2 x i (yi - 0 ~ xx ) = 0.
i=l

Essas duas equaes so exatamente (2.14) e (2.15) multiplicadas por -2 n e, portanto, so solucio
nadas pelos mesmos 0 e r
Como sabemos que, realmente, minimizamos a soma dos resduos quadrados? As condies de
primeira ordem so necessrias, mas no so suficientes. Uma maneira de verificar que minimiza
mos a soma dos resduos quadrados escrever, para qualquer b0 e b x,

Q(b0, b x) = 2 b) - J0 - j8,X, + 08o - b0) + 03, - *,) X,]2


i=1

= [, + ( 0 - V + 031 - fe|)x,]2
/= 1

= + ( j80 " bi)2 + ~ b \)2 A2 + 2(o ~ bo)(i ~ b A


/= 1 /=1 /= 1

onde usamos as equaes (2.30) e (2.31). A soma dos resduos quadrados no depende de b0 e b u
enquanto a soma dos ltimos trs termos pode ser escrita como

2 [(/30 - fc0) + (0 , - b v) x $ ,
;= i

como pode ser verificado diretamente por lgebra. Visto que essa expresso uma soma de termos
quadrados, ela maior que zero. Portanto, seu menor valor ocorre quando b0 = )30 e bx = /3,.
Anlise de Regresso Mltipla:
Estimao

o Captulo 2 aprendemos a usar a anlise de regresso simples para explicar uma varivel depen
dente y como funo de uma nica varivel independente x. A desvantagem principal de usar a
anlise de regresso simples em trabalhos empricos o fato de ser muito difcil obter conclu
ses ceteris paribus sobre como x afeta y: a hiptese fundamental, RLS.3 todos os outros fatores
que afetam y so no-correlacionados com x , frequentemente irreal.
A anlise de regresso mltipla mais receptiva anlise ceteris paribus, pois ela nos permite
controlar explicitamente muitos outros fatores que, de maneira simultnea, afetam a varivel dependen
te. Isso importante tanto para testar teorias econmicas quanto para avaliar efeitos da poltica gover
namental quando devemos nos basear em dados no-experimentais. Como os modelos de regresso
mltipla podem acomodar muitas variveis explicativas que podem estar correlacionadas, podemos
esperar inferir causalidade nos casos em que a anlise de regresso simples seria enganosa.
Naturalmente, se adicionarmos ao nosso modelo mais fatores que so teis para explicar y, ento
mais da variao de y poder ser explicada. Assim, a anlise de regresso mltipla pode ser usada para
construir modelos melhores para prever a varivel dependente.
Uma vantagem adicional da anlise de regresso mltipla que ela pode incorporar, completa
mente, relaes de formas funcionais gerais. No modelo de regresso simples, somente a funo de
uma varivel explicativa pode aparecer na equao. Como veremos, o modelo de regresso mltipla
permite muito mais flexibilidade.
A Seo 3.1 introduz, formalmente, o modelo de regresso mltipla e, mais adiante, discute as van
tagens da regresso mltipla sobre a regresso simples. Na Seo 3.2, demonstramos como estimar os
parmetros do modelo de regresso mltipla por meio do mtodo de mnimos quadrados ordinrios. Nas
sees 3.3, 3.4 e 3.5 descrevemos vrias propriedades dos estimadores de MQO, incluindo a inexistn
cia de vis e a eficincia.
O modelo de regresso mltipla ainda o veculo mais extensamente usado da anlise emprica
em economia e em outras cincias sociais. Igualmente, o mtodo de mnimos quadrados ordinrios
popularmente usado para estimar os parmetros do modelo de regresso mltipla.

3.1 FUNCIONALIDADE DA REGRESSO MLTIPLA

Modelo com Duas Variveis Independentes


Iniciaremos com alguns exemplos simples para mostrar como a anlise de regresso mltipla pode ser
usada para resolver problemas que no podem ser resolvidos pela regresso simples.

64
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 65

O primeiro exemplo uma variao simples da equao do salrio introduzida no Captulo 2 para
obter o efeito da educao sobre o salrio-hora:

salrioh = f3() + /3, educ + f32exper + u, (3.1

em que exper representa anos de experincia no mercado de trabalho. Assim, salrioh determinado por
duas variveis explicativas ou independentes, educao e experincia, e por outros fatores no-observa-
dos, contidos em u. Basicamente, ainda estamos interessados no efeito de educ sobre salrioh, manten
do fixos todos os outros fatores que afetam salrioh; isto , estamos interessados no parmetro /3,.
Comparada com uma anlise de regresso simples que relaciona salrioh a educ, a equao (3.1)
remove, efetivamente, exper do termo erro e a coloca explicitamente na equao. Como exper aparece
na equao, seu coeficiente, f32, mede o efeito ceteris paribus de exper sobre salrioh, que tambm
de algum interesse.
No surpreendentemente, assim como na regresso simples, teremos de fazer hipteses sobre
como u, em (3.1), est relacionado s variveis independentes, educ e exper. Entretanto, como vere
mos na Seo 3.2, h uma coisa da qual podemos estar seguros: visto que (3.1) contm a experincia
de modo explcito, seremos capazes de mensurar o efeito da educao sobre o salrio horrio, man
tendo a experincia fixa. Na anlise de regresso simples que coloca exper no termo erro , tera
mos de assumir que experincia no-correlacionada com educao, uma hiptese tnue.
Como segundo exemplo, considere o problema de explicar o efeito do gasto pblico por estudan
te (gasto) sobre a nota mdia padronizada (notmed) do ensino mdio. Suponha que a nota mdia depen
da do gasto pblico, da renda familiar mdia (rendfam) e de outros fatores no-observveis:

notmed = /30 + /3, gasto + fi2rendfam + u. (3.2)

Para o propsito de anlise da poltica governamental, o coeficiente de interesse /3l5 o efeito ceteris
paribus de gasto sobre notmed. Ao incluir rendfam explicitamente no modelo, somos capazes de con
trolar seu efeito sobre notmed. Isso provavelmente importante, pois a renda familiar mdia tende a
estar correlacionada com o gasto pblico por estudante: os nveis de gasto pblico so, freqentemen-
te, determinados tanto por impostos locais sobre a propriedade como sobre a renda. Na anlise de
regresso simples, rendfam estaria includa no termo erro, que estaria provavelmente correlacionado
com gasto, fazendo com que o estimador de /3, de MQO fosse viesado no modelo de duas variveis.
Nesses dois exemplos similares, mostramos que outros fatores observveis, alm da varivel de
interesse primordial [educ na equao (3.1) e gasto na equao (3.2)] podem ser includos em um
modelo de regresso. Em geral, podemos escrever um modelo com duas variveis independentes como

y ~ Po 3" Plx l ^2X2 (3-3)

em que j30 o intercepto, /3, mede a variao em y com relao a x,, mantendo fixos outros fatores, e
p2 mede a variao em y com relao a x2, mantendo outros fatores fixos.
A anlise de regresso mltipla tambm til para generalizar relaes funcionais entre variveis.
Como exemplo, suponha que o consumo da famlia (cons) uma funo quadrtica da renda familiar
(rend):
66 Introduo Econometria Editora Thomson

cons = 0 + 1rend + 2rend2 + u, (3.41

em que u contm outros fatores que afetam o consumo. Nesse modelo, o consumo depende somente
de um fator observado, a renda; desse modo, pareceria que ele pode ser tratado dentro do arcabou
o da regresso simples. No entanto, esse modelo est fora do padro da regresso simples, porque
ele contm duas funes da renda, rend e rend2 (e, portanto, trs parmetros: f3. /3, e (i2). Portanto,
a funo consumo facilmente escrita como modelo de regresso com duas variveis, e fazendo x t
= rend e x2 = rend2.
Mecanicamente, no h nenhuma diferena em usar o mtodo de mnimos quadrados ordinrios
(introduzido na Seo 3.2) para estimar equaes to diferentes como (3.1) e (3.4). Cada uma dessas
equaes pode ser escrita como (3.3), que tudo o que importa para os clculos. H, entretanto, uma
diferena importante em como interpretar os parmetros. Na equao (3.1), /3, o efeito coeteris pari-
bus de educ sobre salrioh. O parmetro j3, no tem tal interpretao em (3.4). Em outras palavras,
no faz sentido medir o efeito de rend sobre cons mantendo, ao mesmo tempo, rend~ fixo, porque se
rend varia, ento rend2 deve variar! Em vez disso, a variao no consumo com respeito variao na
renda a propenso marginal a consumir aproximada por

Acons
== /3, + 22 rend
Arend

Para os clculos necessrios quanto a derivao dessa equao, veja o Apndice A, disponvel na pgi
na do livro, no site www.thomsonleaming.com.br. Em outras palavras, o efeito marginal da renda sobre
o consumo depende tanto de fi2 como de e do nvel de renda. Esse exemplo mostra que, em qual
quer aplicao particular, as definies das variveis independentes so cruciais. Mas, para o desenvol
vimento terico da regresso mltipla, podemos ser vagos com relao a tais detalhes. No Captulo 6
estudaremos exemplos como esse de forma mais completa.
No modelo com duas variveis independentes, a hiptese fundamental sobre como u est relacio
nado a x, e x 2

E(m|x!, x2) = 0. (3.5)

A interpretao da condio (3.5) similar interpretao da hiptese RLS.3 da anlise de regresso


simples. Ela significa que, para qualquer valor de x, e x2 na populao, o fator no-observvel mdio
igual a zero. Assim como na regresso simples, a parte importante da hiptese que o valor espera
do de u o mesmo para todas as combinaes de x, e x2; dizer que esse valor comum zero est longe
de ser uma hiptese, desde que o intercepto /30 esteja includo no modelo (veja a Seo 2.1).
Como podemos interpretar a hiptese de mdia condicional zero no exemplo anterior? Na equa
o (3.1), a hiptese E(u\educ,exper) = 0. Isso implica que outros fatores que afetam salrioh no
esto, em mdia, relacionados a educ e exper. Portanto, se entendermos que aptido inata parte de u,
ento precisaremos que os nveis mdios de aptido sejam os mesmos em todas as combinaes de
educao e experincia na populao que trabalha. Isso pode ou no ser verdadeiro, mas, como vere
mos na Seo 3.3, essa a questo que precisamos fazer a fim de determinar se o mtodo de mnimos
quadrados ordinrios produz estimadores no-viesados.
O exemplo que mede o desempenho dos estudantes [equao (3.2)] similar equao do sal
rio. A hiptese de mdia condicional zero E(u\gasto,rendfam) = 0, o que significa que os outros fato
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 67

res que afetam as notas caractersticas das escolas e dos estudantes so, em mdia, no-relacio-
nados aos gastos pblicos por estudante e renda familiar mdia.

Um modelo simples para explicar as taxas de homicdio nas cidades ( ta x a h o m ) em termos da probabilidade
de condenao (p rc o n d ) e da durao mdia da sentena (se n tm e d )

taxhom = f3(j + [31prcond + (32sentmed + u.

Que fatores esto contidos em u? Voc entende ser provvel que a hiptese (3.5) se mantenha?

Quando aplicada funo quadrtica do consumo em (3.4), a hiptese da mdia condicional zero tem
uma interpretao ligeiramente diferente. A equao (3.5), escrita literalmente, E(u\rend,rend2) = 0.
Como rend2 conhecido quando se conhece rend, redundante incluir rend2 na esperana:
Wu\rend,rend2) = 0 o mesmo que E(u\rend) = 0. No h problema em colocar rend2 junto com rend
na esperana quando expressamos a hiptese, mas E(u\rend) = 0 mais conciso.

Modelo com k Variveis Independentes


Como estamos no contexto da regresso mltipla, no h necessidade de ficarmos com duas variveis
independentes. A anlise de regresso mltipla permite que muitos fatores observados afetem y. No
exemplo do salrio, poderamos tambm incluir semanas de treinamento de trabalho, anos de perma
nncia com o empregador atual, medidas de aptido e mesmo variveis demogrficas, como o nmero
de irmos ou a educao da me. No exemplo do gasto pblico por estudante, poderiam ser includos
variveis adicionais que medissem a qualidade dos professores e o tamanho das escolas.
O modelo de regresso linear mltipla geral (tambm chamado modelo de regresso mltipla)
pode ser escrito, na populao, como

y = A) + jSi*, + /32x2 + @3*3 + - + Pk*k + K, 13.6)

onde /30 0 intercepto, /3, o parmetro associado a v ,, ji , o parmetro associado a x2, e assim por
diante. Como h k variveis independentes e um intercepto, a equao (3.6) contm k + 1 parmetros
(desconhecidos) populacionais. Para simplificar, algumas vezes vamos nos referir aos outros parme
tros que no o intercepto como parmetros de inclinao, ainda que, literalmente, nem sempre eles
tenham esse significado. [Veja a equao (3.4), em que nenhum dos parmetros, (3{ e jS2, , por si mes
mo, uma inclinao, mas juntos determinam a inclinao da relao entre o consumo e a renda.]
A terminologia da regresso mltipla similar quela da regresso simples e apresentada na
Tabela 3.1. Exatamente como na regresso simples, a varivel u o termo erro ou perturbao. Ele
contm outros fatores, alm de r,, x2, ..., xk, que afetam y. No importa quantas variveis explicativas
inclumos em nosso modelo, pois sempre haver fatores que no podemos incluir, e eles esto conti
dos, coletivamente, em u.
68 Introduo Econometria - Editora Thomson

Tabela 3.1________________________
Terminologia para a Regresso Mltipla

y X 2, Xk

Varivel Dependente Variveis Independentes

Varivel Explicada Variveis Explicativas

Varivel de Resposta Variveis de Controle

Varivel Prevista Variveis Previsoras

Regressando Regressores

Ao aplicar o modelo de regresso mltipla geral, devemos saber como interpretar os parmetros.
Agora e nos captulos subseqentes vamos adquirir bastante prtica, mas til, neste ponto, relembrar
mos algumas coisas que j sabemos. Suponha que os salrios (salrio) dos diretores executivos este
jam relacionados s vendas das empresas (vendas) e permanncia dos diretores executivos nas empre
sas (permceo) pela equao

log(salrio) = 0 + tlog(vendas) + 2permceo + 3permceo2 + u. (3.7)

Essa equao enquadra-se no modelo de regresso mltipla (com k = 3) ao definirmos y = \og(sal-


rio), x x = log(vendas), x2 = permceo e x 3 = permceo2. Como sabemos do Captulo 2, o parmetro (i\
a elasticidade (ceteris paribus) de salrio em relao a vendas. Se )33 = 0, ento 100 j32 , aproxi
madamente, o aumento percentual ceteris paribus em salrio quando permceo aumenta em um ano.
Quando /33 ^ 0, o efeito de permceo sobre salrio mais complicado. Postergaremos at o Captulo 6
um tratamento detalhado de modelos com termos quadrticos.
A equao (3.7) fornece um lembrete importante sobre a anlise de regresso mltipla. O termo
linear na expresso modelo de regresso linear mltipla significa que a equao (3.6) linear nos
parmetros, fy. A equao (3.7) um exemplo de modelo de regresso mltipla que, ao mesmo tempo,
linear nos fy e uma relao no-linear entre salrio e as variveis vendas e permceo. Muitas apli
caes da regresso mltipla envolvem relaes no-lineares entre as variveis subjacentes.
E fcil expressar a hiptese essencial para o modelo de regresso mltipla geral em termos de uma
esperana condicional:

E(u\xu x 2, ...,**) = 0. (3.8)

No mnimo, a equao (3.8) requer que todos os fatores no termo erro no-observado sejam no-cor-
relacionados com as variveis explicativas. Ela tambm significa que consideramos corretamente a
relao funcional entre as variveis explicada e as explicativas. Qualquer problema que faa com que
u seja correlacionado com qualquer varivel independente fazem com que (3.8) no seja vlida. Na
Seo 3.3 mostraremos que a hiptese (3.8) implica que o mtodo MQO no-viesado e derivaremos
o vis que surge quando uma varivel-chave for omitida da equao. Nos captulos 15 e 16 estudare
mos outras razes que podem fazer com que (3.8) no seja vlida e mostraremos o que pode ser feito
nesses casos.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 69

3.2 MECNICA E INTERPRETAO DOS MNIMOS QUADRADOS


ORDINRIOS
Vamos resumir, agora, algumas caractersticas computacionais e algbricas do mtodo de mnimos
quadrados ordinrios, quando ele se aplica a um conjunto particular de dados. Discutiremos tambm
como interpretar a equao estimada.

Obteno das Estim ativas de MQO


Vamos considerar, primeiramente, a estimao do modelo com duas variveis independentes. A equa
o de MQO estimada escrita de forma similar ao caso da regresso simples:

y p 0 + P l x l + P2x 2 <3.9|

onde 0O a estimativa de 0, 0, a estimativa de jS,, e 0 2 a estimativa de 0 2. Porm, como obtemos


j80, /3, e 0 2? O mtodo de mnimos quadrados ordinrios escolhe as estimativas que minimizam a
soma dos resduos quadrados. Isto , dadas n observaes de y, x, e x 2, {(x,|,x2,v,): i = 1,2,..., n}, as
estimativas 0 O, 0, e 0 2 so escolhidas, simultaneamente, para fazer com que a expresso

2 Iv, ~ ) P\x ,i ~ P 2 x a> (3.10)

tenha o menor tamanho possvel.


A fim de entender o que o meetodo MQO est fazendo, importante dominar o significado da
indexao das variveis independentes em (3.10). As variveis independentes tm, aqui, dois subscri
tos: i seguido de 1 ou 2. O subscrito i refere-se ao nmero da observao. Assim, a soma em (3.10)
contempla todas as observaes de i = 1 a n. O segundo ndice simplesmente um mtodo para dis
tinguir as diferentes variveis independentes. No exemplo que relaciona salrioh a educ e exper, x,, =
eduCj a educao formal da pessoa i na amostra, e xa = exper, a experincia da pessoa i. A soma
dos resduos quadra-
n
dos na equao (3.10) ^ (salrioi 0 OP [educi (i-.experf. No que vem a seguir, o subscrito i
i =i
reservado para indexar o nmero da observao. Se escrevermos x,y, ento isso significa a -sima
observao da y-sima varivel independente. (Alguns autores preferem mudar a ordem do nmero da
observao e do nmero da varivel, de modo que x u a observao i da varivel um. Mas isso ape
nas um problema de gosto notacional.)
No caso geral com k variveis independentes, procuramos estimar /30, >3,,..., fik na equao

y = ) + P ix i + A ,x>+ - + Pkxk-

As k + 1 estimativas de MQO delas foram escolhidas para minimizar a soma dos resduos quadrados:

2 O', ~ i /3i*,i - ... - p kx.k)2. (3.12)


i= I
70 Introduo Econometria Editora Thomson

Esse problema de minimizao pode ser resolvido usando clculo multivariado (veja o Apndice 3A,
disponvel no site da Thomson. Isso leva a k + 1 equaes lineares com k + 1 estimadores /30, j3p ..., /3(
desconhecidos:

2 <yt ~ o ~ i x n ~ - k x u) = 0
i =1
n
2 *,-i < y , - 0 i xn k Xi l ) 0
i=1
n
2 x,2 (y, - n - i x n - .. - k x ik) = 0 (3.13)
i=1

x i k ( y t - 0 ~ i x n - - k x i = -
;= 1

Essas equaes so,, chamadas freqentemente de condies de primeira ordem de MQO. Assim,
como no modelo de regresso simples da Seo 2.2, as condies de primeira ordem de MQO podem
ser obtidas pelo mtodo dos momentos: sob a hiptese (3.8), E(m) = 0 e E(x;n) = 0, onde j = 1,2,..., k.
As equaes em (3.13) so contrapartidas amostrais desses momentos da populao, embora tenhamos
omitido a diviso pelo tamanho da amostra n.
Mesmo para n e k de tamanhos moderados, resolver as equaes em (3.13) fazendo os clculos
manualmente tedioso. No obstante, computadores modernos que processam programas padres de
estatstica e econometria podem resolver essas equaes com n e k grandes muito rapidamente.
H somente um pequeno aviso: devemos assumir que as equaes em (3.13) podem ser resolvi
das unicamente para os /3 . Por enquanto, assumimos apenas isso, como usualmente o caso em mode
los bem definidos. Na Seo 3.3 formulamos a hiptese necessria para a existncia de estimativas de
MQO nicas (veja a hiptese RLM.4).
Como na anlise de regresso simples, a equao (3.11) chamada reta de regresso de MQO
ou a funo de regresso amostrai (FRA). Chamaremos /30 a estimativa de intercepto de MQO
e /3,, ..., (3k de estimativas de inclinao de MQO (correspondentes s variveis independentes x,,
x2, ..., xk).
A fim de indicar que uma regresso de MQO foi computada, escreveremos a equao (3.11) com
ye X| , ..., xk substitudos pelos seus nomes de varivel (tais como salrioh, educ e exper), ou diremos
que rodamos uma regresso de MQO de y sobre x,, x2, ..., xk ou que regredimos y sobre x b x2, ..., xk.
Essas expresses so modos de dizer que o mtodo de mnimos quadrados ordinrios foi usado para
obter a equao de MQO (3.11). A no ser que afirmemos explicitamente, sempre estimaremos um
intercepto juntamente com as inclinaes.

Interpretao d a Equao de R egresso de MQO


Mais importante que os detalhes subjacentes computao dos j8. a interpretao da equao esti
mada. Iniciaremos com o caso de duas variveis independentes:

y a i xi & 2 X2' {3.14}


Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 71

O intercepto /30 na equao (3.14) o valor previsto de y quando x, = 0 e x2 = 0. s vezes, colocar x,


ex2 iguais a zero um cenrio interessante; em outros casos, isso no far sentido. No obstante, para
obter uma previso de y a partir da reta de regresso de MQO, o intercepto sempre necessrio, como
(3.14) deixa claro.
As estimativas /?, e j82 tm interpretaes de efeito parcial, ou ceteris paribus. Da equao
(3.14) , temos

Ay = /.Ax, + /32Ax2,

de modo que podemos obter a variao prevista em y dadas as variaes em x, e x2. (Observe que o
intercepto no tem nada a ver com as variaes em y.) Em particular, quando x2 mantido fixo, de
modo que Ax2 = 0, ento

Ay = p l A xu

mantendo x2 fixo. O ponto fundamental que, ao incluir x2 no nosso modelo, obtemos um coeficiente
de X] com uma interpretao ceteris paribus. Essa a razo de a anlise de regresso mltipla ser to
til. Semelhantemente,

Ay = j62Ax2,

mantendo x, fixo.

EXEMPLO 3.1
(Determinantes da Nota Mdia em Curso Superior nos Estados Unidos)
As variveis do arquivo GPA1.RAW incluem a nota mdia em um curso superior (n m g ra d ), a nota mdia do
ensino mdio (n m e m ) e a nota do teste de avaliao de conhecimentos para ingresso em curso superior
(ac) para uma amostra de 141 estudantes de uma grande universidade dos Estados Unidos; tanto n m g ra d
como nm em esto baseados em uma escala de quatro pontos. Obtemos a seguinte reta de regresso de
MQO para estimar n m g ra d a partir de n m e m e tac:

nmgrad = 1,29 + 0,453 nmem + 0,0094 tac. (3.15)

Como interpretamos essa equao? Primeiro, o intercepto de 1,29 o valor previsto de n m g ra d se tanto
n m e m como ta c forem iguais a zero. Como ningum que freqenta um curso superior teve nota mdia no
ensino mdio igual a zero ou uma nota no teste de ingresso no curso superior igual a zero, o intercepto
nessa equao no , por si mesmo, significativo.
As estimativas mais interessantes so os coeficientes de inclinao de n m e m e tac. Como espera
do, h uma relao parcial positiva entre n m g ra d e n m e m : mantendo ta c fixo, um ponto adicional em
nm em est associado a 0,453 de um ponto em n m g ra d , ou quase meio ponto. Em outras palavras, se
escolhermos dois estudantes, A e B, e esses estudantes tiverem a mesma nota tac, mas n m e m do estu
dante A um ponto maior que a n m e m do estudante B, prevemos que o estudante A tem n m g ra d
72 Introduo Econometria Editora Thomson

EXEMPLO 3.1 (continuao)


0,453 maior que nrngrad do estudante B. (Isso no diz nada sobre quaisquer duas pessoas reais, mas a
nossa melhor previso.)
O sinal tac implica que, mantendo nmem fixo, uma variao de 10 pontos na nota em tac uma varia
o muito grande, visto que a nota mdia na amostra de cerca de 24, com um desvio-padro menor que
trs afeta nm grad em menos de um dcimo de um ponto. Esse um efeito pequeno e sugere que, uma
vez considerada o n m em , a nota do ta c no um forte previsor de nmgrad. (Naturalmente, h muitos outros
fatores que contribuem para nmgrad, mas aqui estamos enfatizamos as estatsticas disponveis de estudan
tes do ensino mdio.) Posteriormente, aps discutirmos a inferncia estatstica, mostraremos que o coeficien
te de tac no somente pequeno na prtica, mas ele tambm estatisticamente no significante.
Se colocarmos o foco na anlise de regresso simples relacionando somente nm grad e tac, obtemos

nmgrad = 2,40 + 0,0271 tac;

assim, o coeficiente ta c quase trs vezes maior que a estimativa em (3.15). No entanto, essa equao no
nos permite comparar duas pessoas com o mesmo nmem; ela corresponde a um experimento diferente. Mais
adiante, falaremos mais sobre as diferenas entre as regresses mltipla e simples.

O caso com mais de duas variveis independentes similar. A reta de regresso de MQO

y = o+ i* i + i x2 + - + kxk- 3 *, 6

Escrita em termos de variaes,

Ay = /3j Ax, + 2A x2 + ... + k A xk. (3.17)

O coeficiente de Xj mede a variao em y devido a um aumento de uma unidade em x ,, mantendo todas


as outras variveis independentes fixas. Isto ,

Ay = t A xu (3.18)

mantendo x2, x3, ..., xk fixos. Assim, controlamos as variveis x2, x3, ..., xk ao estimar o efeito de x,
sobre y. Os outros coeficientes tm uma interpretao similar.
O exemplo seguinte contm trs variveis independentes.

EXEMPLO 3.2
(Equao do Salrio Horrio)
Usando as 526 observaes de trabalhadores do arquivo WAGE1.RAW, inclumos educ (anos de educao
formal), exper (anos de experincia no mercado de trabalho) e perm (anos com o empregador atual) na
equao que explica log(salrioh). A equao estimada
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 73

EXEMPLO 3.2 (continuao)

log{salrioh) = 0,284 + 0,092 educ + 0,0041 exper + 0,022 perm. (3.19)

Como no caso da regresso simples, os coeficientes tm uma interpretao de percentagem. A nica dife
rena que eles tambm tm uma interpretao ceters p arib us. 0 coeficiente 0,092 significa que, manten
do exper e perm fixos, um ano a mais de educao formal aumenta o valor esperado de \og(salrioh) em
0,092, o que se traduz em um aumento aproximado de 9,2% [100(0,092)] em salrioh. Alternativamente,
se considerarmos duas pessoas com os mesmos nveis de experincia e permanncia no trabalho, o coefi
ciente de educ a diferena proporcional no salrio horrio previsto quando seus nveis de educao dife
rem em um ano. Essa medida de retorno da educao mantm fixos ao menos dois importantes fatores de
produtividade; saber se ela uma boa estimativa do retorno ceteris p a rib u s de mais um ano de educao
formal requer que estudemos as propriedades estatsticas de MQO (veja a Seo 3.3).

Sobre o Significado de "M anter Outros Fatores Fixos" na Regresso


Mltipla
Como a interpretao de efeito parcial dos coeficientes de inclinao na anlise de regresso mltipla
pode causar alguma confuso, assim, vamos tentar impedir o surgimento desse problema agora.
No Exemplo 3.1, observamos que o coeficiente tac mede a diferena prevista em nmgrad, man
tendo nmem fixo. O poder da anlise de regresso mltipla que ela proporciona uma interpretao
ceteris paribus mesmo que os dados no sejam coletados de uma maneira ceteris paribus. Ao dar ao
coeficiente de tac uma interpretao de efeito parcial, pode parecer que, realmente, samos a campo e
extramos amostras compostas de pessoas com a mesma nmem e, possivelmente, com diferentes notas
do tac. Isso no verdade. Os dados so uma amostra aleatria de uma universidade grande: no
h restries colocadas sobre os valores amostrais de nmem ou tac na obteno dos dados. De fato,
raramente temos o luxo de manter certas variveis fixas na obteno de nossa amostra. Se pudssemos
coletar uma amostra de indivduos com a mesma nmem, ento poderamos realizar uma anlise de
regresso simples relacionando nmgrad a tac. A regresso mltipla nos permite, efetivamente, simular
essa situao sem restringir os valores de quaisquer variveis independentes.
O poder que a anlise de regresso mltipla tem que ela nos permite fazer, em ambientes no-
experimentais, o que os cientistas naturais so capazes de fazer em um ambiente controlado de labora
trio: manter outros fatores fixos.

Variao de m ais de um a Varivel Independente Sim ultaneam ente


s vezes, queremos variar mais que uma varivel independente ao mesmo tempo para encontrar o
efeito resultante sobre a varivel dependente. Isso facilmente feito usando a equao (3.17). Por
exemplo, na equao (3.19), podemos obter o efeito estimado sobre salrioh quando um indivduo
permanece na mesma empresa por mais um ano: ambos exper (experincia geral da fora de traba
lho) e perm aumentam em um ano. O efeito total (mantendo educ fixo)

Alog (salrioh) = 0,0041 Aexper + 0,022 Aperm = 0,0041 + 0,022 = 0,0261,


74 Introduo Econometria - Editora Thomson

ou cerca de 2,6%. Como exper e perm aumentam, cada um, em um ano, apenas somamos os coeficien
tes de exper e perm e multiplicamos por 100 para converter o efeito em uma percentagem.

Valores Estim ados e Resduos de MQO


Aps obter a reta de regresso de MQO (3.11), podemos obter um valor ajustado ou predito para cada
observao. Para a observao i, o valor ajustado simplesmente

= ) P ixn + @2Xi2 + &kxik 13.20)

que exatamente o valor previsto obtido inserindo os valores das variveis independentes da observao
i na equao (3.11). Ao obter os valores estimados, no devemos esquecer do intercepto; de outro modo,
a resposta pode ser muito equivocada. Como exemplo, se em (3.15) nmem, = 3,5 e tac, = 24, nmgradj =
1,29 + 0,453(3,5) + 0,0094(24) = 3,101 (arredondado em trs casas aps o decimal).
Normalmente, para qualquer observao i, o valor real v, no se iguala ao valor previsto, y O
mtodo de MQO minimiza o erro quadrado mdio de previso, que no diz nada sobre o erro de pre
viso de qualquer observao especfica. O resduo da observao i definido exatamente como no
caso da regresso simples,

(3.21)

H um resduo para cada observao. Se j > 0, ento y,. est abaixo de y o que significa que, para
essa observao, y, subestimado. Se i < 0, ento y , < y ,, e y , superestimado.
Os valores estimados de MQO e os resduos tm algumas propriedades importantes que so exten
ses imediatas do caso da varivel nica:
1. A mdia amostrai dos resduos zero.
2. A covarincia amostrai entre cada varivel independente e os resduos de MQO zero.
Conseqentemente, a covarincia amostrai entre os valores estimados de MQO e os resduos
de MQO zero.
3. O ponto (3t,, 3c2, ..., x k, y) est sempre sobre a reta de regresso de MQO: y = 0 + l x l +
i xi 4" ... + kxk-
As duas primeiras propriedades so consequncias imediatas do conjunto de equaes usadas para
obter as estimativas de MQO. A primeira equao em (3.13) diz que a soma dos resduos zero. As
equaes restantes so da forma 2 A = 0, implicando que cada varivel independente tem cova-
i=i J
rincia amostrai zero com r A Propriedade 3 decorre imediatamente da Propriedade 1.

No Exemplo 3.1, a reta estimada de MQO que explica n m g ra d em termos de n m e m

nmgrad = 1,29 + 0,453 nmem + 0,0094 tac.

Se n m em mdio de cerca de 3,4 e a nota mdia do tac est em torno de 24,2, qual o n m g ra d mdio
na amostra?
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 75

Interpretao de "Parcialidade" da R egresso Mltipla


Ao aplicar o mtodo MQO, no precisamos saber as frmulas explcitas dos /3 que solucionam o sis
tema de equaes em (3.13). Entretanto, para certas derivaes, precisamos de frmulas explcitas dos
jij. Essas frmulas tambm ajudam a esclarecer o funcionamento de MQO.
Considere, uma vez mais, o caso com k = 2 variveis independentes, em que y = /30 + /3,.v, +
P2x2. Para uma idia mais concreta, vamos enfatizar /3,. Um modo de expressar /?,

= ( ^ / ( (3.22J

onde os r, so os resduos de MQO de uma regresso simples de x, sobre x 2, usando a amostra


mo. Regredimos nossa primeira varivel independente, x t, sobre nossa segunda varivel indepen
dente, x2, e, em seguida, obtemos os resduos (y no desempenha nenhum papel aqui). A equao
(3.2) mostra que podemos, portanto, fazer uma regresso simples de y sobre r, para obter f l .
(Observe que os resduos r , tm uma mdia amostrai zero, e assim a estimativa de inclinao
usual da regresso simples.)
A representao da equao (3.22) d outra demonstrao da interpretao do efeito parcial de /3r
Os resduos rn so a parte de xn que no-correlacionada com x/2. Outro modo de dizer isso que r,
xn aps o efeito de x i2 ter sido isolado, ou deduzido. Assim, 0 t mede a relao amostrai entre y e x,
aps x2 ter sido imparcializado.
Na anlise de regresso simples, no h parcializao de outras variveis, porque outras variveis
no esto includas na regresso. O Problema 3.17 o conduzir, passo a passo, pelo processo de par
cializao usando os dados de salrios do Exemplo 3.2. Para propsitos prticos, o importante que /?,,
na equao y = 0 O + /3,x, + 0 2 x2, mede a variao em y, dado um aumento de uma unidade em
Xi, mantendo x2 fixo.
No modelo geral com k variveis explicativas, /3, pode ainda ser escrito como na equao (3.22),
mas os resduos rn vm da regresso de X] sobre x2, ..., xk. Assim, (3[ mede o efeito de x, sobre y aps
jc2, ..., xk terem sido isolados ou deduzidos.

Comparao das Estim ativas das Regresses Simples e Mltipla


H dois casos especiais em que tanto a regresso simples de y sobre x { como a regresso de y sobre x,
e x2 produziro a mesma estimativa de MQO de x ,. Para maior preciso, escreva a regresso simples
dey sobre x, como y = \30 + /?, x,, e escreva a regresso mltipla como y = j30 + /3,x, + P2 x2.
Sabemos que o coeficiente da regresso simples /3, no se iguala, geralmente, ao coeficiente da regres
so mltipla $ v Acontece que h uma relao simples entre /3, e /3, , que permite comparaes interes
santes entre as regresses simples e mltipla:

Pi = /3, + /M i>

em que , o coeficiente de inclinao da regresso simples de x(2 sobre x;1, i = 1, ..., n. Essa equa
o mostra como /S, difere do efeito parcial de x, sobre y. O termo que pode causar confuso o efei
to parcial de x2 sobre y multiplicado pela inclinao da regresso amostrai de x2 sobre x ,. (Veja a Seo
3A.4, no apndice do captulo, disponvel no site da Thomson, para uma verificao mais geral.)
76 Introduo Econometria Editora Thomson

A relao entre /3, e /3, tambm mostra que h dois casos distintos em que eles so iguais:

1. O efeito parcial de x2 sobre y zero na amostra, isto , 0 2 = 0.


2. x, e x7 so no-correlacionados na amostra, isto , <5, = 0.

Ainda que as estimativas das regresses mltipla e simples quase nunca sejam idnticas, podemos
usar a frmula anterior para caracterizar o motivo pelo qual elas deveriam ser muito diferentes ou bas
tante similares. Por exemplo, se /32 pequeno, deveramos esperar que as estimativas das regresses
mltipla e simples de f i ] sejam semelhantes. No Exemplo 3.1, a correlao amostrai entre nmem e tac
de cerca de 0,346, o que no uma correlao trivial. Porm, o coeficiente de tac razoavelmente
pequeno. No surpreendente descobrir que a regresso de nmgrad sobre nmem produz uma estimati
va de inclinao de 0,482, no muito diferente da estimativa de 0,453 em (3.15).

EXEMPLO 3.3
(Participao nos Planos de Penso 401 (k))
Vamos usar os dados do arquivo em 401K.RAW para estimar o efeito de uma taxa de contribuio para um
plano (taxcont) sobre a taxa de participao (taxap) dos trabalhadores nos planos de penso de contribuio
definida existentes nos Estados Unidos. A taxa de contribuio a quantidade com a qual a firma contribui
para um fundo de trabalhadores, para cada dlar de contribuio do trabalhador (at certo limite); assim,
taxcont = 0,75 significa que a firma contribui com 75 centavos de dlar para cada dlar contribudo pelo
trabalhador. A taxa de participao a percentagem de trabalhadores habilitados a ter uma conta no plano
de penso. A varivel idade a idade do plano de penso. H 1.534 planos no banco de dados, a taxap
mdia 87,36, a taxcont mdia 0,732 e a idade mdia 13,2.
Regredindo taxap sobre taxcont e idade resulta na equao

taxap = 80,12 + 5,52 taxcont + 0,243 idade. (3.23)

Assim, taxcont e idade tm os efeitos esperados. 0 que aconteceria se no controlssemos a varivel idade ?
0 efeito estimado de idade no trivial, e portanto poderamos esperar uma variao grande no efeito esti
mado de taxcont se idade fosse excluda da regresso. Entretanto, a regresso simples de taxap sobre tax
cont produz taxap = 83,08 + 5,86 taxcont. A estimativa de regresso simples do efeito de taxcont sobre
taxap , claramente, diferente da estimativa de regresso mltipla, mas a diferena no muito grande. (A
estimativa da regresso simples somente cerca de 6,2% maior que a estimativa da regresso mltipla.) Isso
pode ser explicado pelo fato de a correlao amostrai entre taxcont e idade ser somente de 0,12.

No caso com k variveis independentes, a regresso simples de y sobre x, e a regresso mltipla


de y sobre x lt x 2, ..., xk produzem uma estimativa idntica de x, somente se: (1) os coeficientes de MQO
de x2 at xk forem todos zero ou (2) x, for no-correlacionado com cada um dos x 2, xk. Na prtica,
nenhuma dessas possibilidades muito provvel. Porm, se os coeficientes de x2 at xk forem peque
nos, ou as correlaes amostrais entre x, e as outras variveis independentes forem pouco substanciais,
ento as estimativas das regresses simples e mltiplas do efeito de x, sobre y podem ser similares.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 77

Grau de Ajuste
Assim como na regresso simples, podemos definir a Soma dos Quadrados Total (SQT), a Soma dos
Quadrados Explicada (SQE) e a Soma dos Quadrados dos Resduos ou Soma dos Resduos Qua
drados (SQR) como

n
SQT - 2 (y, - f f (3.24)
i=I

SQE ^ 2 (y,. - f (3.25)


i=1

SQR = u). (3.26)


i=1

Usando o mesmo argumento utilizado no caso da regresso simples, podemos mostrar que

SQT = SQE + SQR. (3.27)

Em outras palavras, a variao total em {y,} a soma das variaes totais em {v,} e em { w;}.
Assumindo que a variao total em y no zero como o caso, a no ser que y, seja constan
te na amostra , podemos dividir (3.27) por SQT para obter

SQR/SQT + SQE/SQT = 1.

Exatamente como no caso da regresso simples, o A-quadrado definido como

R2 = SQE/SQT = 1 - SQR/SQT,- (3.28)

e interpretado como a proporo da variao amostrai em y, que explicada pela reta de regresso de
MQO. Por definio, R2 um nmero entre zero e um.
Pode-se tambm mostrar que R2 igual ao quadrado do coeficiente de correlao entre os valores
reais v, real e os valores estimados v( ajustado. Isto ,

2 (y. - m -T )
R2 (3.29)
S / y . - j O 2 )! 2 < > , - * >

[Inserimos a mdia de y, em (3.29) por coerncia com a frmula do coeficiente de correlao; sabe
mos que essa mdia igual a y, porque a mdia amostrai dos resduos zero e v, = y. + ..]
Um fato importante sobre R2 que ele nunca diminui, e geralmente aumenta, quando outra
varivel independente adicionada regresso. Esse fato algbrico ocorre por definio, pois a
78 Introduo Econometria Editora Thomson

soma dos resduos quadrados nunca aumenta quando regressores adicionais so acrescentados ao
modelo.
O fato de que R2 nunca diminui quando qualquer varivel for adicionada a uma regresso faz dele um
instrumento fraco para decidir se uma varivel ou diversas variveis deveriam ser adicionadas ao modelo.
O fator que deve determinar se uma varivel explicativa pertence a um modelo se a varivel explicativa
tem, na populao, um efeito parcial sobre y diferente de zero. No Captulo 4, quando cobrirmos a infe
rncia estatstica, mostraremos como testar essa hiptese. Veremos tambm que, quando usado apropria
damente, R2 permite-nos testar um grupo de variveis com a finalidade de ver se ele importante para
explicar y. Por enquanto, usaremos R2 como uma medida do grau de ajuste para um dado modelo.

EXEMPLO 3.4
(Determinantes de nmgrad)
Da regresso de nmgrad que fizemos anteriormente, a equao com R2

nmgrad = 1,29 + 0,453 nmem + 0,0094 tac


n = \ A \,R 2 = 0,176.

Isso significa que nmen e tac explicam, juntos, cerca de 17,6% da variao em nm grad da amostra de estu
dantes. Isso pode no parecer uma percentagem alta, mas devemos nos lembrar de que h muitos outros
fatores incluindo formao da famlia, personalidade, qualidade da educao do ensino mdio, afinidade
com o curso escolhido que contribuem para o desempenho dos estudantes. Se nmem e tac explicassem
quase toda a variao em nmgrad, ento o desempenho no curso superior seria predeterminado pelo
desempenho no ensino mdio!

EXEMPLO 3.S
(Explicando os Registros de Prises)
0 arquivo CRIME1.RAW contm dados de prises durante o ano de 1986 e outras informaes sobre 2.725
homens nascidos em 1960 ou 1961 na Califrnia. Cada homem na amostra foi preso pelo menos uma vez antes
de 1986. A varivel npre86 o nmero de vezes que determinado homem foi preso em 1986: ela zero para
muitos homens da amostra (72,29%), e varia de 0 a 12. (A percentagem de homens presos uma vez em 1986
foi de 20,51%.) A varivel pcond a proporo (no a percentagem) de prises anteriores a 1986 que leva
ram condenao, sentmed a durao mdia da sentena cumprida por condenao prvia (zero para mui
tas pessoas), ptem p86 so os meses passados na priso em 1986 e empr86 o nmero de trimestres duran
te o qual determinado homem ficou empregado em 1986 (de zero a quatro).
Um modelo linear explicando as prises

npre86 = /30 + fi tpcond + f}2sentmed + fipiem p86 + f34empr86 + u,

em que pcond uma varivel (proxy) da probabilidade de um homem ser condenado por um crime, e sent
med uma medida do rigor esperado da pena, em caso de condenao. A varivel ptem p86 captura o efei
to de confinamento do crime: se um indivduo est na priso, ele no pode ser preso por um crime fora da
priso. As oportunidades no mercado de trabalho so capturadas grosseiramente por empr86.
Primeiro, estimamos o modelo sem a varivel sentmed. Obtemos
Wooldridge Capitulo 3 Anlise de Regresso Mltipla: Estimao 79

EXEMPLO 3.5 (continuao}


npre86 = 0,712 0,150 pcond 0,034 ptemp86 0,104 empr86
n = 2.725, R2 = 0,0413.

, Essa equao diz que, como um grupo, as trs variveis p co nd , p te m p 8 6 e e m p r8 6 explicam cerca de 4,1 %
I da variao em n pre 8 6 .
Cada um dos coeficientes de inclinao de MQO tem o sinal esperado. Um aumento na proporo de
; condenaes diminui o nmero previsto de prises. Se aumentarmos p c o n d em 0,50 (um aumento grande
na probabilidade de condenao), ento, mantendo os outros fatores fixos, A n p re 8 6 = -0,150(0,50) =
[ -0,075. Isso pode parecer pouco usual, porque uma priso no pode ser uma frao. No entanto, podemos
! usar esse valor para obter a variao prevista das prises esperadas de um grande grupo de homens. Por
' exemplo, entre cem homens, a queda esperada de prises quando p c o n d aumenta em 0,50 -7 ,5 .
Semelhantemente, um perodo de priso mais longo leva a um nmero previsto menor de prises. De
, fato, se p te m p 8 6 aumenta de 0 para 12, as prises previstas para um determinado homem diminuem em
| 0,034(12) = 0,408. Um trimestre a mais no qual o emprego legal informado diminui as prises esperadas
| em 0,104, o que significaria 10,4 prises entre cem homens.
i Se sentm ed for adicionado ao modelo, sabemos que R2 aumentar. A equao estimada

npre86 = 0,707 0,151 pcond + 0,0074 sentmed 0,037 ptemp86 0,103 empr86
n = 2.725, R2 = 0,0422.

Assim, ao adicionar a varivel sentena mdia, R2 aumenta de 0,0413 para 0,0422, um efeito praticamente
insignificante. O sinal do coeficiente de s e n tm e d tambm inesperado: ele diz que uma durao mais longa
da sentena mdia aumenta a atividade criminal.

O Exemplo 3.5 merece uma palavra final de cautela. O fato de as quatro variveis explicativas
includas na segunda regresso explicarem somente 4,2% da variao em npre86 no necessariamente
significa que a equao intil. Ainda que, coletivamente, essas variveis no expliquem muito da
variao nas prises, possvel que as estimativas de MQO sejam estimativas confiveis dos efeitos
ceteris paribus de cada varivel independente sobre npre86. Como veremos, se esse for o caso, isso
no depende, diretamente, do tamanho do R2. Em geral, um R2 baixo indica que difcil prever resul
tados individuais sobre y com muita preciso, algo que estudaremos com mais detalhes no Captulo 6.
No exemplo da priso, o R 2 pequeno reflete algo sobre o qual suspeitamos nas cincias sociais: geral
mente, muito difcil prever o comportamento individual.

Regresso atravs da Origem


Algumas vezes, uma teoria econmica, ou o senso comum, sugere que /30 deveria ser zero, e por isso
devemos mencionar, brevemente, a estimao de MQO quando o intercepto zero. Especificamente,
vamos agora buscar uma equao da forma

9 = Pi *, + >*2 + - + Pkxk> (3.301

em que o smbolo grfico sobre as estimativas utilizado para distingui-las das estimativas de MQO
obtidas juntamente com o intercepto [como em (3.11)]. Em (3.30), quando x, = 0, x2 = 0,.... xk = 0, o
80 Introduo Econometria Editora Thomson

valor previsto zero. Nesse caso, diz-se que /8,, /3t so as estimativas de MQO da regresso de y
sobre x,, x2, ..., xk atravs da origem.
As estimativas de MQO em (3.30), como sempre, minimizam a soma dos resduos quadrados, mas
com o intercepto igualado a zero. Voc deve estar prevenido de que as propriedades de MQO que deri
vamos anteriormente no se mantm mais para a regresso atravs da origem. Em particular, os resduos
de MQO no tm mais uma mdia amostrai zero. Alm disso, se R2 for definido como 1 SQR/SQT,
n
em que SQT est dado em (3.24) e SQR agora 2 (v, jS, xn ... /3t xn y . ento R2 pode ser, de
/= i
fato, negativo. Isso significa que a mdia amostrai, y, explica mais da variao em y, do que as vari
veis explicativas.
Devemos incluir um intercepto na regresso ou devemos concluir que as variveis explicativas
explicam fracamente y. A fim de sempre ter um R-quadrado no-negativo, alguns economistas prefe
rem calcular R2 como o quadrado do coeficiente de correlao entre os valores reais e estimados de y,
como em (3.29). (Nesse caso, o valor estimado mdio deve ser calculado diretamente, j que ele no
mais igual a y.) Entretanto, no h um conjunto de regras sobre como calcular o R-quadrado para a
regresso atravs da origem.
Uma desvantagem sria com a regresso atravs da origem que, se o intercepto /30 for diferente
de zero no modelo populacional, ento os estimadores dos parmetros de inclinao sero viesados. O
vis pode ser severo em alguns casos. O custo de estimar um intercepto quando /30 realmente zero
que as varincias dos estimadores de inclinao de MQO so maiores.

3.3 0 VALOR ESPERADO DOS ESTIMADORES DE MQO


Vamos nos voltar, agora, para as propriedades estatsticas do mtodo de MQO, para estimar os par
metros de um modelo da populao subjacente. Nesta seo, derivamos o valor esperado dos estima
dores de MQO. Em particular, formulamos e discutimos quatro hipteses, que so extenses diretas
das hipteses do modelo de regresso simples, sob as quais os estimadores de MQO so estimadores
no-viesados dos parmetros da populao. Tambm obtemos explicitamente o vis em MQO, quando
uma varivel importante for omitida da regresso.
Voc deve lembrar que propriedades estatsticas no tm nada a ver com uma amostra particular,
mas sim, mais precisamente, com a propriedade dos estimadores quando a amostragem aleatria feita
repetidamente. Assim, as sees 3.3, 3.4 e 3.5 so um pouco abstratas. Apesar de darmos exemplos de
derivao do vis de modelos especficos, no significativo falar sobre as propriedades estatsticas de
um conjunto de estimativas de uma nica amostra.
A primeira hiptese que vamos fazer define, simplesmente, o modelo de regresso linear mltipla
(RLM).

H I P T E S E RLM. l (LINEAR NOS PARMETROS)


0 modelo na populao pode ser escrito como

y = 0o + Pi Xi + (32x 2 + ... + PkXk + u, (3.31)

em que j30, ..., { i K so os parmetros desconhecidos (constantes) de interesse, e u u m erro aleatrio


no-observvel ou um termo de perturbao aleatria.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 81

A equao (3.31) especifica, formalmente, o modelo populacional, algumas vezes chamado


modelo verdadeiro, para considerar a possibilidade de podermos estimar um modelo diferente de
(3.31). A caracterstica fundamental que o modelo linear nos parmetros (h u ..., k. Como sabe
mos, (3.31) bastante flexvel, pois y e as variveis independentes podem ser funes arbitrrias de
variveis subjacentes de interesse, como os logaritmos naturais e os quadrados [veja, por exemplo, a
equao (3.7)].

HI PTESE RLM. 2 (AMOSTRAGEM ALEATRIA)


; lemos uma amostra aleatria de n observaes, {(x,i,x,2,...,x*,y,): /' = 1 , 2 , do modelo populacional des
crito por (3.31).

As vezes, precisamos escrever a equao de uma observao particular i: para uma observao
extrada aleatoriamente da populao, temos

(3.32}

Lembre-se de que i refere-se observao, enquanto o segundo subscrito em x o nmero da varivel.


Por exemplo, podemos escrever uma equao do salrio de diretores executivos para um diretor execu
tivo especfico particular i como

log (salrio) = 0 + og {vendas,) + 2permceOi + 3perceof + ut. (3.33)

0 termo w, contm os fatores no-observveis para o diretor executivo i que afetam seu salrio. Nas
aplicaes, usualmente mais fcil escrever o modelo na forma populacional, como em (3.31). Ela
menos desordenada e enfatiza que estamos interessados em estimar a relao populacional.
A luz do modelo (3.31), os estimadores de MQO /30, j8,, /32, ..., f$k da regresso de y sobre xu ...,
xk so agora considerados estimadores de /30, /3,, ..., [3k. Vimos, na Seo 3.2, que MQO escolhe as
estimativas de uma amostra particular, de modo que os resduos sejam, em mdia, iguais a zero e a
correlao amostrai entre cada varivel independente e os resduos seja zero. Para que MQO seja no-
viesado, preciso que a verso populacional dessa condio seja verdadeira.

{ h i p t e s e r l m . 3 (m d ia c o n d ic io n a l z e r o )
0 erro u tem um valor esperado igual a zero, dados quaisquer valores das variveis independentes. Em outras
palavras,

E(k|*,,x2..... x k) = 0. (3.34)

Uma maneira como a hiptese RLM.3 pode ser violada quando a relao funcional entre as
variveis explicadas e explicativas est mal-especificada na equao (3.31): por exemplo, se esquece-
82 Introduo Econometria Editora Thomson

mos de incluir o termo quadrtico rend2 na funo consumo cons = (it) + (3, rend + (32rend2 + u
quando estimamos o modelo. Outra forma funcional mal-especificada ocorre quando usamos o nvel
da varivel e, de fato, o log da varivel que aparece no modelo populacional, ou vice-versa. Por exem
plo, se o modelo verdadeiro tiver log (salrio) como varivel dependente, mas usarmos salrio como
varivel dependente em nossa anlise de regresso, ento os estimadores sero viesados. Intuitiva-
mente, isso deveria ser muito claro. No Captulo 9 discutiremos maneiras de detectar a m especifica
o da forma funcional.
Omitir um fator importante que est correlacionado com qualquer uma das variveis jc,, x 2, ..., xk
faz com que a hiptese RLM.3 tambm no se sustente. Com a anlise de regresso mltipla, somos
capazes de incluir muitos fatores entre as variveis explicativas e, por isso, variveis omitidas so
menos provveis de serem um problema na anlise de regresso mltipla do que na anlise de regres
so simples. No obstante, em qualquer aplicao, h sempre muitos fatores que, devido limitao de
dados ou ignorncia deles, no somos capazes de incluir. Se acharmos que esses fatores devem ser
controlados e que eles esto correlacionados com uma ou mais variveis independentes, ento a
hiptese RLM.3 ser violada. Posteriormente, derivaremos esse vis.
H outros modos pelos quais u pode estar correlacionado com uma varivel explicativa. No
Captulo 15 discutiremos o problema do erro de medida em uma varivel explicativa. No Captulo 16
cobriremos o problema, conceitualmente mais difcil, em que uma ou mais variveis explicativas
determinada conjuntamente com y. Vamos postergar nosso estudo desses problemas at que tenhamos
um domnio firme da anlise de regresso mltipla sob um conjunto ideal de hipteses.
Quando a hiptese RLM.3 se mantm, dizemos frequentemente que temos variveis explicativas
exgenas. Se Xj for correlacionado com u por alguma razo, ento se diz que a , uma varivel expli
cativa endgena. Os termos exgena e endgena originaram-se da anlise de equaes simult
neas (veja Captulo 16), mas o significado do termo varivel explicativa endgena evoluiu e passou
a incluir qualquer caso em que uma varivel explicativa pode estar correlacionada com o termo erro.
A ltima hiptese de que precisamos para mostrar que MQO no-viesado assegura que os esti
madores de MQO so, realmente, bem definidos. Para a regresso simples, precisamos assumir que a
nica varivel independente no era constante na amostra. A hiptese correspondente para a anlise de
regresso mltipla mais complicada.

H I P T E S E RLM. 4 (COLINEARIDADE NO PERFEITA)


Na amostra (e, portanto, na populao), nenhuma das variveis independentes constante, e no h rela
es lineares exatas entre as variveis independentes.

A hiptese de colinearidade no perfeita somente diz respeito s variveis independentes. Estudantes


de econometria iniciantes tendem a confundir as hipteses RLM.4 e RML.3, de modo que enfatizamos
aqui que RLM.4 no diz nada sobre a relao entre u e as variveis explicativas.
A hiptese RLM.4 mais complicada que sua contrapartida na regresso simples, pois agora
devemos examinar as relaes entre todas as variveis independentes. Se uma varivel independente
em (3.31) uma combinao linear exata de outras variveis independentes, dizemos que o modelo
sofre'de colinearidade perfeita, e ele no pode ser estimado por MQO.
importante observar que a hiptese RLM.4 permite, de fato, que as variveis independentes
sejam correlacionadas; elas apenas no podem ser correlacionadas perfeitamente. Se no permitsse
mos qualquer correlao entre as variveis independentes, ento a regresso mltipla no seria muito
til para a anlise economtrica. Por exemplo, no modelo que relaciona notas de estudantes aos gastos
com educao e renda familiar,
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 83

notmed = [30 + [3 ,gasto + (32rendfam + u,

esperamos, com certeza, que gasto e rendfam sejam correlacionados: distritos escolares com rendas
familiares mdias altas tendem a gastar mais em educao por estudante. De fato, a principal motiva
o para incluir rendfam na equao que suspeitamos que ela seja correlacionada com gasto, e,
desse modo, gostaramos de mant-la fixa na anlise. A hiptese RLM.4 somente exclui a correlao
perfeita entre gasto e rendfam em nossa amostra. Teramos muito azar se obtivssemos uma amostra
em que os gastos por estudante fossem perfeitamente correlacionados com a renda familiar mdia.
Porm, espera-se que haja alguma correlao talvez uma quantidade substancial e certamente
ela permitida.
A maneira mais simples como duas variveis independentes podem ser perfeitamente correla
cionadas quando uma varivel um mltiplo constante da outra. Isso pode acontecer quando um
pesquisador, inadvertidamente, coloca a mesma varivel medida em unidades diferentes dentro da
equao de regresso. Por exemplo, ao estimar a relao entre consumo e renda, no faz sentido
incluir como variveis independentes a renda mensurada em dlares e a renda mensurada em milha
res de dlares. Uma delas redundante. Que sentido faria manter a renda mensurada em dlares fixa,
enquanto a renda mensurada em milhares de dlares varia?
J sabemos que diferentes funes no-lineares da mesma varivel podem aparecer entre os
regressores. Por exemplo, o modelo cons = (3n + (31rend + fi2 rend2 + u no viola a hiptese RLM.4:
ainda que x 2 = rend2 seja uma funo exata de x, = rend, rend2 no uma funo linear de rend.
Incluir rend2 no modelo uma maneira til de generalizar a forma funcional, diferentemente de incluir
a renda mensurada em dlares e em milhares de dlares.
O senso comum nos diz para no incluir a mesma varivel explicativa medida em diferentes
unidades na mesma equao de regresso. H tambm maneiras mais sutis de uma varivel indepen
dente poder ser um mltiplo de outra. Suponha que gostaramos de estimar uma extenso da funo de
consumo de elasticidade constante. Poderia parecer natural especificar um modelo tal como

log (cons) = /30 + /Jjlog (rend) + (32\og(rend2) + u, (3.35)

em que x, = log(rend) e x 2 = log(rend2). Usando as propriedades bsicas do log natural (veja o


Apndice A, disponvel no site de Thomson), log (rend2) = 2-log {rend). Isto , x2 = 2xh e naturalmente
isso vlido para todas as observaes na amostra. Isso viola a hiptese RLM.4. Em vez disso, deve
ramos incluir [log(rend)]2, e no log (rend2), juntamente com log (rend). Essa uma extenso prudente
do modelo de elasticidade constante, e veremos como interpretar tais modelos no Captulo 6 .
Outra maneira de as variveis independentes serem perfeitamente colineares ocorre quando uma
varivel independente pode ser expressa como uma funo linear exata de duas ou mais das outras va
riveis independentes. Por exemplo, suponha que queremos estimar o efeito dos gastos de campanha
sobre os resultados da campanha. Por simplicidade, assuma que cada eleio tem dois candidatos.
Seja votoA a percentagem de votos do Candidato A; seja gastoA os gastos de campanha do Candidato A;
seja gastoB os gastos de campanha do Candidato B; e seja totalgasto os gastos totais de campanha;
todas as ltimas trs variveis so medidas em dlares. Pode parecer natural especificar o modelo
como

v o to A = (3() + jSi g a s t o A + ji^ g a s to B + jS3t o t a l g a s t o + u, (3.36)


84 Introduo Econometria Editora Thomson

a fim de isolar os efeitos dos gastos de cada candidato e da quantidade total de gastos. No entanto, esse
modelo viola a hiptese RLM.4, porque x3 = x x + ar2 por definio. Tentar interpretar essa equao ao
estilo ceteris paribus revela o problema. Supe-se que o parmetro de /3, na equao (3.36) mea o
efeito de um aumento de um dlar nos gastos do Candidato A sobre os votos do Candidato A, manten
do os gastos do Candidato B e os gastos totais fixos. Isso uma tolice, pois, se gastoB e totalgasto
forem mantidos fixos, no podemos aumentar gastoA.
A soluo para a colinearidade perfeita em (3.36) simples: retire qualquer uma das trs vari
veis do modelo. Provavelmente, tiraramos totalgasto, e conseqentemente o coeficiente de gastoA
mensuraria o efeito de aumentar os gastos de A sobre a percentagem de votos recebidos por A, man
tendo os gastos de B fixos.
O exemplo anterior mostra que a hiptese RLM.4 pode ser violada se no formos cuidadosos ao
especificar nosso modelo. Essa hiptese tambm no se mantm se o tamanho da amostra, n, muito
pequeno em relao ao nmero de parmetros que so estimados. No modelo de regresso geral da
equao (3.31), h k + 1 parmetros, e RLM.4 no se mantm se n < k + 1. Intuitivamente, isso faz
sentido: para estimar k + 1 parmetros, necessitamos de pelo menos k + 1 observaes. No surpreen
dentemente, melhor ter tantas observaes quanto possvel, algo que veremos em nossos clculos da
varincia na Seo 3.4.

No exemplo anterior, se usarmos como variveis explicativas g a sto A , gastoB e p a rtA , em que p a rtA =
]0 0 -{g a s to A /to ta lg a s to ) a participao percentual dos gastos totais de campanha feitos pelo Candidato
A, isso viola a hiptese RLM.4?

Se o modelo for cuidadosamente especificado e n s k + 1, a hiptese RLM.4 pode no se man


ter em casos raros devido a um azar ao coletar a amostra. Por exemplo, em uma equao de salrios,
com educao e experincia como variveis, poderamos obter uma amostra aleatria em que cada
indivduo tivesse exatamente duas vezes mais educao que anos de experincia. Esse cenrio faria
com que a hiptese RLM.4 falhasse, mas isso pode ser considerado muito improvvel, a no ser que
tenhamos um tamanho de amostra extremamente pequeno.
Agora, estamos prontos para mostrar que, sob essas quatro hipteses da regresso mltipla, os
estimadores de MQO so no-viesados. Como no caso da regresso simples, as esperanas esto con
dicionadas aos valores das variveis independentes da amostra, mas no mostraremos esse condiciona
mento explicitamente.

T E O R E M A 3 . 1 ( I N E X I S T N C I A D E V I S D E M Q O )

Sob as hipteses RLM.1 a RLM.4,

m p = I3j , j = 0 , l , . . . , k , (3.37)

para qualquer valor do parmetro populacional fy . Em outras palavras, os estimadores de MQO so estima
dores no-viesados dos parmetros da populao.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 85

Em nossos exemplos empricos anteriores, a hiptese RLM.4 foi satisfeita (visto que fomos
capazes de calcular as estimativas de MQO). Alm disso, em sua maior parte, as amostras so aleato
riamente escolhidas de uma populao bem-definida. Se acreditamos que os modelos especificados
esto corretos sob a hiptese fundamental RLM.3, ento podemos concluir que MQO no-viesado
nesses exemplos.
Como estamos nos aproximando do ponto em que podemos usar a regresso mltipla no trabalho
emprico til lembrar o significado de inexistncia de vis. E tentador, nos exemplos como o da equa
o do salrio em (3.19), dizer algo como 9,2% uma estimativa no-viesada do retomo da educa
o. Como sabemos, uma estimativa no pode ser viesada: uma estimativa um nmero fixo, obtido
de uma amostra particular, usualmente diferente do parmetro populacional. Quando dizemos que
MQO no-viesado sob as hipteses RLM. 1 a RLM.4, estamos dizendo que o procedimento pelo qual
as estimativas de MQO foram obtidas no-viesado, e tal procedimento visto como algo aplicado em
todas as amostras aleatrias possveis. Esperamos que tenhamos obtido uma amostra que nos d uma
estimativa prxima do valor da populao, mas, infelizmente, isso no pode ser garantido.

Incluso de Variveis Irrelevantes em um Modelo de R egresso


Uma questo que podemos dispensar com rapidez razovel a incluso de uma varivel irrelevante
ou a superespecificao do modelo na anlise de regresso mltipla. Isso significa que uma (ou mais)
das variveis independentes est includa no modelo, embora ela no tenha efeito parcial sobre y na
populao. (Isto , seu coeficiente populacional zero.)
Para ilustrar a questo, suponha que especificamos o modelo como

y = (30 + /8 [X, + fi2x2 + /33 x3 + u, (3.38)

e esse modelo satisfaz as hipteses RLM.l a RLM.4. Entretanto, x 3 no tem efeito sobre v aps x, e x 2
terem sido controlados, o que significa que = 0. A varivel x 3 pode ou no ser correlacionada com
Xj e x2; 0 que importa que, uma vez que x, e x 2 estejam controlados, x 3 no tem efeito sobre y. Em
termos de esperanas condicionais, E(y|xl,x 2 ,x3) = Evlx,,x2) = /30 + /3,x , + /32x2.
Como no sabemos que /33 = 0, somos inclinados a estimar a equao com x3:

y = Po + / V i + &2X2 + & * 3- (3.39)

Inclumos a varivel irrelevante, x3, em nossa regresso. Qual o efeito de incluir x 3 em (3.39), quan
do seu coeficiente no modelo populacional (3.38) zero? Em termos da inexistncia de vis de /, e
jiy no h nenhum efeito. Essa concluso no requer nenhuma derivao especial, j que ela decorre
imediatamente do Teorema 3.1. Lembre-se, a inexistncia de vis significa E/3) = (f para qualquer
valor de fy, incluindo /3; = 0. Assim, podemos concluir que E(/30) = /3(), EQ3,) = f i h E(/3Q = /L e
E(j33) = 0 (para quaisquer valores de /30, /3, e j32). Mesmo que S3, por si mesmo, nunca seja exa
tamente zero, seu valor mdio obtido de muitas amostras aleatrias ser zero.
A concluso do exemplo anterior muito mais geral: incluir uma ou mais variveis irrelevantes
no modelo de regresso mltipla, ou superespecificar o modelo, no afeta a inexistncia de vis dos
estimadores de MQO. Isso significa que incluir variveis irrelevantes incuo? No. Como veremos
na Seo 3.4, incluir variveis irrelevantes pode ter efeitos indesejveis sobre as varincias dos esti
madores de MQO.
86 Introduo Econometria Editora Thomson

Vis de Varivel Omitida: O Caso Sim ples


Suponha agora que, em vez de incluir uma varivel irrelevante, omitimos uma varivel que, realmen
te, pertence ao modelo verdadeiro (ou populacional). Isso freqentemente chamado problema de
excluir uma varivel relevante ou de subespecificar o modelo. No Captulo 2, e anteriormente neste
captulo, afirmamos que esse problema geralmente faz com que os estimadores de MQO sejam viesa-
dos. Agora o momento de mostrar isso explicitamente e, no menos importante, derivar a direo e
o tamanho do vis.
Derivar o vis causado ao omitir uma varivel importante um exemplo de anlise de m-espe-
cificao. Iniciaremos com o caso em que o modelo populacional verdadeiro tem duas variveis expli
cativas e um termo erro:

y = o + \X\ + 2x2 + K,
(3.40)

e assumimos que esse modelo satisfaz as hipteses RLM. 1 a RLM.4.


Suponha que nosso interesse primordial esteja em j3 ,,o efeito parcial de x, sobre y. Por exemplo,
y o salrio horrio (ou log do salrio horrio), x, educao e x2 uma medida de aptido inata. A
fim de obter um estimador no-viesado de /3,, deveramos computar a regresso de y sobre x, e x 2 (o
que resulta em estimadores no-viesados de f)0, f i , e (i2)- Entretanto, devido nossa ignorncia ou
indisponibilidade de dados, estimamos o modelo excluindo x2Em outras palavras, executamos somen
te uma regresso simples de y sobre x u obtendo a equao

y = P o + P ix v (3 -41)

Usamos o smbolo grfico em vez de A para enfatizar que j3, vem de um modelo subespecificado.
Ao aprender, pela primeira vez, o problema de varivel omitida, pode ser difcil para o estudante
distinguir entre o modelo verdadeiro subjacente, (3.40) nesse caso, e o modelo que realmente estima
mos, capturado pela regresso em (3.41). Pode parecer bobagem omitir a varivel x 2 se ela pertence ao
modelo, mas freqentemente no temos escolha. Por exemplo, suponha que salrioh seja determinado
pela equao

salrioh = 0 + xeduc + 2aptid + u. (3.42)

Como a aptido no observada, estimamos, em vez disso, o modelo

salrioh = + /3, educ + v,

onde v = f}2aptid + u. O estimador de /l, da regresso simples de salrioh sobre educ o que esta
mos chamando /3r
Vamos derivar o valor esperado de j3, condicionado aos valores amostrais de x , e x2. Derivar essa
esperana no difcil, pois /3, exatamente o estimador de inclinao de MQO de uma regresso
simples, e j estudamos esse estimador extensivamente no Captulo 2. A diferena aqui que deve
mos analisar suas propriedades quando o modelo de regresso simples mal-especificado devido a
uma varivel omitida.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 87

Da equao (2.49), podemos expressar x como

2 (*/i - *i )
/=1
x = (3.43)
2 (* *i )2
/=1

O prximo passo o mais importante. Visto que (3.40) o modelo verdadeiro, escrevemos y para cada
observao i como

y, = + ,x n + 2x,2 + u, (3.44)

(e no yt = f30 + (3\Xn + un j que o modelo verdadeiro contm x2). Seja SQT, o denominador em
(3.43). Se inserirmos em (3.43) o de (3.44), o numerador em (3.43) passa a ser

2 (x, - Xl)(0 + l Xn + ^ci2 + u)


i =1

= l (*/i - *,)2 + 2 2 (X,I - X1)x i2 + 2 (*n ~ V H (3.45)


1=1 1=1 /= 1

= /3,SQT, + 2 2 (xn - x,)x/2 + 2 (xn - x,)w;.


i= i i=i

Se dividirmos (3.45) por SQT,, considerarmos a esperana condicionada aos valores das variveis
independentes e usarmos E(u,) = 0, obteremos

2 (* - x {) x i2
E(/3t) = / 3 , ---------------- (3.46)
2 (* - *i >2
i=1

Assim, E(/3,) no , geralmente, igual a /?,: )3, viesado para /3,.


A razo que multiplica fi2 em (3.46) tem uma interpretao simples: ela exatamente o coeficien
te de inclinao da regresso de x 2 sobre x,, utilizando nossa amostra de variveis independentes, que
pode ser escrita como

x 2 = S 0 + SjX,. (3.47)

Como estamos condicionados aos valores amostrais de ambas as variveis independentes, 5, no


aleatrio aqui. Portanto, podemos escrever (3.46) como

E(i) - i + 2Sp (3.48)


88 Introduo Econometria Editora Thomson

o que implica que o vis em /3, E(/3,) /3, = j82 <5,. Essa expresso chamada frequentemente de
vis de varivel omitida.
Da equao (3.48), vemos que h dois casos em que jS, no-viesado. O primeiro bastante
bvio: se /32 = 0 de modo que x 2 no aparece no modelo verdadeiro (3.40) , ento /3, no-vie
sado. J sabemos isso da anlise de regresso simples do Captulo 2. O segundo caso mais interes
sante. Se S, = 0 , ento /3, no-viesado para /3,, mesmo se j82 * 0.
Como Sf a covarincia amostrai entre x, e x 2 sobre a varincia amostrai de x u S, = 0 se, e
somente se, x, e x2 forem no-correlacionados na amostra. Assim, temos a importante concluso de
que, se x, e x 2 forem no-correlacionados na amostra, ento /3, no-viesado. Isso no surpreen
dente: na Seo 3.2, mostramos que o estimador da regresso simples f3{ e o estimador da regresso
mltipla f$! so iguais quando x x e x 2 forem no-correlacionados na amostra. [Podemos tambm mos
trar que /3, no-viesado sem condicionar a xi2 se E(x2lxt) = E(x2); ento, para a estimao de /3,,
deixar x 2 no termo erro no viola a hiptese de mdia condicional zero do erro, uma vez que ajusta
mos o intercepto.]
Quando x, e x 2 forem correlacionados, <5, tem o mesmo sinal da correlao entre x, e x2: <5, >
0 se X, e x2 forem positivamente correlacionados, e 6 , < 0 se x, e x 2 forem negativamente correlacio
nados. O sinal do vis em depende tanto do sinal de ]32 como de <5, e est resumido na Tabela 3.2
para os quatro casos possveis quando h vis. A Tabela 3.2 justifica um estudo cuidadoso. Por exem
plo, o vis em )31 positivo se (i2 > 0 (x2 tem um efeito positivo sobre y) e x, e x2 so positivamen
te correlacionados; o vis negativo se /32 > 0 e x, e x 2 so negativamente correlacionados, e assim
por diante.

Tabela 3.2_____________________________________________________________________________
Sumrio do Vis em /3, quando xz Omitida na Estimao da Equao (3.40)

C orr(xlrr2) > 0 Corr(xj^tr2) < 0

2 > 0 vis positivo vis negativo

j2 < 0 vis negativo vis positivo

A Tabela 3.2 resume a direo do vis, mas o tamanho do vis tambm muito importante. Um
vis pequeno de qualquer dos dois sinais no precisa ser causa de preocupao. Por exemplo, se o retor
no da educao formal de 8 ,6 % na populao e o vis do estimador de MQO de 0,1% (um dcimo
de um ponto percentual), ento no precisaramos ficar muito preocupados. De outro lado, um vis da
ordem de trs pontos percentuais seria muito mais srio. O tamanho do vis determinado pelos tama
nhos de / ? 2 eS j.
Na prtica, como /32 um parmetro populacional desconhecido, no podemos estar certos se jS2
positivo ou negativo. Entretanto, temos geralmente uma boa idia sobre a direo do efeito parcial de
x 2 sobre y. Alm disso, ainda que o sinal da correlao entre x, e x 2 no possa ser conhecido se x 2 no
observado, em muitos casos, podemos fazer uma suposio criteriosa sobre se x, e x 2 so positiva ou
negativamente correlacionados.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 89

Na equao do salrio (3.42), por definio, mais aptido conduz a uma produtividade maior e,
portanto, a salrios maiores: f32 > 0. H tambm razes para acreditar que educ e aptid sejam positi
vamente correlacionados: em mdia, indivduos com mais aptido inata escolhem nveis maiores de
educao formal. Assim, as estimativas de MQO da equao de regresso simples do salrioh = /30 +
$ xeduc + v so, em mdia, muito grandes. Isso no significa que a estimativa obtida de nossa amos
tra seja enorme. Somente podemos dizer que, se coletarmos muitas amostras aleatoriamente e obtiver
mos as estimativas da regresso simples a cada vez, a mdia dessas estimativas ser maior que /3,.

EXEMPLO 3.6
(Equao do Salrio Horrio)
j Suponha que o modelo log(salrioh) = /30 + fi^ e d u c + /32apf/cy + u satisfaa as hipteses RLM.1 a
RLM.4. 0 conjunto de dados no arquivo WAGE1.RAW no contm dados sobre aptido, de modo que esti-
j mamos jS, a partir da regresso simples

\og(saldrioh) = 0,584 + 0,083 educ


ii 526. K - 0.186.

: Esse somente o resultado de uma nica amostra, de modo que no podemos dizer que 0,083 maior que
I /S o retorno verdadeiro da educao poderia ser menor ou maior que 8,3% (nunca saberemos com certeza).
! Entretanto, sabemos que a mdia dos estimadores de todas as amostras aleatrias seria bastante grande.

Como um segundo exemplo, suponha que, no nvel fundamental do ensino, a nota mdia dos estu
dantes de um exame padronizado seja determinado por

notmed = j30 + (i igasto + fiaaxpob 4- u,

em que gasto o gasto pblico por estudante, e taxpob a taxa de pobreza das crianas da escola.
Usando dados do distrito da escola, temos somente observaes da percentagem de estudantes com
uma nota de aprovao e gastos pblicos por estudante; no temos informaes sobre taxas de pobre
za. Assim, estimamos /3, a partir da regresso simples de notmed sobre gasto.
Podemos obter, uma vez mais, o vis provvel em /3,. Primeiro, fi2 provavelmente negativo: h
ampla evidncia de que crianas que vivem na pobreza tm, em mdia, notas mais baixas em testes
padronizados. Segundo, o gasto pblico mdio por estudante , provavelmente, negativamente corre
lacionado com a taxa de pobreza: quanto maior a taxa de pobreza menor o gasto pblico mdio por
estudante, de modo que Corrix,,x2) < 0. De acordo com a Tabela 3.2, /3 ter um vis positivo. Essa
observao tem implicaes importantes. Pode ser que o efeito verdadeiro do gasto pblico fosse zero:
isto , /3, = 0 . Entretanto, a estimativa de /3, da regresso simples ser, geralmente, maior que zero, e
isso poderia nos levar a concluir que os gastos pblicos so importantes quando eles no so.
Ao ler e ao fazer trabalhos empricos em economia, importante dominar a terminologia associa
da aos estimadores viesados. No contexto de omisso de uma varivel do modelo (3.40), se E(/3,) > /3,,
ento dizemos que /3, tem um vis para cima. Quando E(/3,) < /3,, yS, tem um vis para baixo. Essas
definies so as mesmas, seja /S, positivo ou negativo. A expresso viesado para zero refere-se aos
casos em que E(/3,) est mais prxima de zero do que de /3,. Portanto, se /3, for positivo, /3, ser vie
sado para zero se ele tiver um vis para baixo. De outro lado, se /3, < 0, /3, ser viesado para zero se
ele tiver um vis para cima.
90 Introduo Econometria Editora Thomson

Vis de Varivel Omitida: Casos m ais Gerais


mais difcil derivar o sinal do vis de varivel omitida quando h mltiplos regressores no modelo esti
mado. Devemos lembrar que a correlao entre uma nica varivel explicativa e o erro resulta, geralmen
te, em todos os estimadores de MQO serem viesados. Por exemplo, suponha que o modelo populacional

y = f0 + @lx l + j i ^ 2 + /33x 3 + u (3.49)

satisfaa as hipteses RLM.l a RLM.4. No entanto, omitimos x 3 e estimamos o modelo como

9 = o + i x i + i xr (3.50)

Agora suponha que x2 e x 3 sejam no-correlacionados, mas que x, correlacionado com x3. Em outras
palavras, xj correlacionado com a varivel omitida, mas x 2 no . E tentador pensar que, embora pro
vavelmente /3, seja viesado com base na derivao da subseo anterior, /3, seja no-viesado, pois x 2
no-correlacionado com x (. Infelizmente, esse no , geralmente, o caso: normalmente, tanto j3, como
/32 sero viesados. A nica exceo a isso ocorre quando x t e x 2 tambm so no-correlacionados.
Mesmo em um modelo razoavelmente simples como o apresentado, pode ser difcil obter a dire
o do vis em /3, e (32. Isso se deve ao fato de que x,, x2 e x 3 podem estar correlacionados aos pares.
Entretanto, uma aproximao , frequentemente, til na prtica. Se assumirmos que x, e x 2 so no-
correlacionados, podemos estudar o vis em (3I como se x 2 estivesse ausente dos modelos populacional
e estimado. De fato, quando x, e x 2 so no-correlacionados, pode-se mostrar que

n
2 (Ai - )a 3
E(/3,) = jS, + /S3 ^ ----------------
(Ai - A )2
i= i

Essa equao exatamente igual a (3.46), mas 0 3 substitui 0 2, e x 3 substitui x2. Portanto, o vis em /3,
obtido ao se substituir 0 2 por /33 e x2 por x 3 na Tabela 3.2. Se 0 3 > 0 e Corr(xi,x3) > 0, o vis em
/3j positivo, e assim por diante.
Como um exemplo, suponha que acrescentamos exper ao modelo do salrio:

salrioh j8 0 + f i ,educ + f}2exper + (33aptid + u.

Se aptid for omitida do modelo, ambos os estimadores de (3, e (32 sero viesados, mesmo se assumir
mos que exper no-correlacionado com aptid. Estamos principalmente interessados no retomo da
educao formal, de modo que seria bom se pudssemos concluir que /3, tem um vis para cima ou
para baixo devido omisso da aptido. Essa concluso no possvel sem hipteses adicionais.
Como uma aproximao, suponhamos que, alm de exper e aptid serem no-correlacionadas, educ e
exper tambm sejam no-correlacionadas. (Na realidade, elas so negativamente correlacionadas.)
Como 0 3 > 0 e educ e aptid so positivamente correlacionadas, f3 teria um vis para cima, exata
mente como se exper no estivesse no modelo.
O raciocnio usado no exemplo anterior , muitas vezes, compreendido como um guia aproxima
do para obter o vis provvel dos estimadores em modelos mais complicados. Geralmente, o foco est
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 91

na relao entre uma varivel explicativa particular, por exemplo x t, e o fator omitido fundamental.
Estritamente falando, ignorar todas as outras variveis explicativas uma prtica vlida somente quan
do cada uma delas no-correlacionada com x,, mas essa ainda uma orientao til. O Apndice 3 A
(disponvel no site de Thomson) contm uma anlise mais cuidadosa do vis de varivel omitida com
mltiplas variveis explicativas.

3.4 A VARIANCIA DOS ESTIMADORES DE MQO


Obteremos, agora, a varincia dos estimadores de MQO, de modo que, alm de conhecermos as ten
dncias centrais dos /3 ., tambm teremos uma medida da disperso de sua distribuio amostrai. Antes
de encontrarmos as varincias, vamos adicionar uma hiptese de homoscedasticidade, como no
Captulo 2. Fazemos isso por duas razes. Primeira, ao impor a hiptese de varincia constante do erro,
as frmulas so simplificadas. Segunda, veremos na Seo 3.5 que MQO tem uma propriedade impor
tante de eficincia se acrescentamos a hiptese de homoscedasticidade.
No arcabouo da regresso mltipla, a homoscedasticidade expressa como a seguir:

H I P T E S E R L M . 5 ( H O M O S C E D A S T I C I D A D E )

Var(u|x1,...,xlt) = cr2.

A hiptese RLM.5 significa que a varincia do termo erro, u, condicionada s variveis explica
tivas, a mesma para todas as combinaes de resultados das variveis explicativas. Se essa hiptese
violada, o modelo exibe heteroscedasticidade, exatamente como no caso de duas variveis.
Na equao

salrioh = /30 + fi\educ + (i2exper + fi^perm + w,

a homoscedasticidade requer que a varincia do erro no-observado u no dependa dos nveis de edu
cao, experincia ou permanncia. Isto ,

Var( u |educ,exper,perm) = cr2.

Se a varincia varia com qualquer uma das trs variveis explicativas, ento a heteroscedasticidade est
presente.
As hipteses RLM. 1 a RLM.5 so, em conjunto, conhecidas como as hipteses de Gauss-Markov
(para a regresso de corte transversal). At agora, nossas asseres sobre as hipteses so adequadas
somente quando aplicadas anlise de corte transversal com amostragem aleatria. Como veremos, as
hipteses de Gauss-Markov para a anlise de sries de tempo e para outras situaes, como a anli
se de dados de painel so mais difceis de se manterem, embora haja muitas similaridades.
Na discusso a seguir, usaremos o smbolo x para representar o conjunto de todas as variveis
independentes, (xt, ..., xk). Assim, na regresso do salrio horrio com educ, exper e perm como vari
veis independentes, x = (educ, exper, perm). Conseqentemente, podemos escrever as hipteses
RLM.l e RLM.3 como

E(y|ar) = /30 + f lx l + fi2x2 + - + 183*3 >


92 Introduo Econometria - Editora Thomson

e a hiptese RLM.5 a mesma que Var(_\jx) = cr2. Expressar as hipteses desse modo ilustra como a
hiptese RLM.5 difere muito da hiptese RLM.3. Esta diz que o valor esperado de y, dado x, linear
nos parmetros, mas ele certamente depende de x h x2, ..., xk. A hiptese RLM.5 diz que a varincia de
y, dado x, no depende dos valores das variveis independentes.
Podemos obter, agora, as varincias dos ., que uma vez mais, esto condicionadas aos valores
amostrais das variveis independentes. A prova est no apndice deste captulo.

T E O R E M A 3 . 2 ( V A R I N C I A S A M O S T R A I S D O S E S T I M A D O R E S D E I N C L I

N A O D E M Q O )

Sob as hipteses RLM.1 a RLM.5, condicionadas aos valores amostrais das variveis independentes,

o2
Var ( = (3.51)
SQ Tjd - Rj)

para j = 1, 2,..., k, em que SQT;. = ^ (*, xp 2 a variao amostrai total em x;, e Rj o R-quadra-
/= i
do da regresso x. sobre todas as outras variveis independentes (incluindo um intercepto).

Antes de estudarmos a equao (3.51) mais detalhadamente, importante saber que todas as
hipteses de Gauss-Markov so usadas na obteno dessa frmula. Embora no necessitemos da hip
tese de homoscedasticidade para concluir que MQO no-viesado, precisamos dela para validar a
equao (3.51).
O tamanho de Var(/3) importante na prtica. Uma varincia maior significa um estimador
menos preciso, e isso se traduz em intervalos de confiana maiores e testes de hipteses menos acu
rados (como veremos no Captulo 4). Na prxima subseo, discutiremos os elementos que com
preendem (3.51).

Os Com ponentes das Varincias de MQO: M ulticolinearidade


A equao (3.51) mostra que a varincia de depende de trs fatores: cr2, SQT, e Rj. Lembre-se de
que o ndice j representa simplesmente qualquer uma das variveis independentes (como a educao
ou a taxa de pobreza). Agora, vamos considerar cada um dos fatores que afetam Var0 ) .

A VARINCIA DO ERRO, a 2. Da equao (3.51), um cr2 maior significa varincias maiores dos esti-
madores de MQO. Isso no totalmente surpreendente: mais rudo na equao (um cr2 maior) toma
mais difcil estimar o efeito parcial de qualquer uma das variveis independentes sobre y, e isso refle
tido nas varincias maiores dos estimadores de inclinao de MQO. Visto que cr2 uma caracterstica
da populao, ele no tem nada a ver com o tamanho da amostra. Ele o componente de (3.51) que
desconhecido. Veremos mais adiante como obter um estimador no-viesado de cr2.
Para uma dada varivel dependente y, h de fato somente uma maneira de reduzir a varincia do
erro, que adicionar mais variveis explicativas equao (retirar alguns fatores do termo erro). Isso
nem sempre possvel, nem sempre desejvel, por razes discutidas posteriormente neste captulo.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 93

A VARIAO AMOSTRAL TOTAL EM x]r SQT). Da equao (3.51), vemos que quanto maior a
variao total em x,-, menor Var(/,), Assim, tudo o mais sendo igual para estimar /3, preferimos ter
tanta variao amostrai em x,- quanto possvel. J descobrimos isso no caso da regresso simples, no
Captulo 2. Embora raramente seja possvel escolher os valores amostrais das variveis independentes,
h uma maneira de aumentar a variao amostrai em cada uma das variveis independentes: aumentar
o tamanho da amostra. De fato, na amostragem aleatria de uma populao, SQT, aumenta sem limi
te quando o tamanho da amostra toma-se maior. Esse o componente da varincia que depende siste
maticamente do tamanho da amostra.
Quando SQT, pequeno, Var(/3,) pode ficar muito grande, mas um SQT, pequeno no uma vio
lao da hiptese RLM.4. Tecnicamente, quando SQT, tende a zero, Var(j3,) aproxima-se do infinito.
0 caso extremo de nenhuma variao amostrai em x,, SQT, = 0, no permitido pela hiptese RLM.4.

AS RELAES LINEARES ENTRE AS VARIVEIS INDEPENDENTES, R2. O termo Rj na


equao (3.51) o mais difcil dos trs componentes de se entender. Esse termo no aparece na an
lise de regresso simples porque h somente uma varivel independente em tal caso. E importante
compreender que esse ?-quadrado distinto do R-quadrado da regresso de y sobre x u x 2, ..., xk: R~
obtido de uma regresso que envolve somente as variveis independentes do modelo original, em
que Xj desempenha o papel de uma varivel dependente.
Considere, primeiro, o caso k = 2: y = f30 + /3,jc, + f32x2 + u. Ento, Vari/3,) = <j 2/[SQT|(1
?2)], em que R 2 o R-quadrado da regresso simples de x, sobre x2 (e um intercepto, como sempre).
Como o R-quadrado mede o grau de ajuste, um valor de R\ prximo de um indica que x2 explica bas
tante da variao de x, na amostra. Isso significa que x, e x 2 so altamente correlacionados.
Quando R 2 cresce em direo a um, Var(/3j) toma-se maior. Assim, um grau elevado de relao
linear entre x, e x2 pode levar a varincias grandes dos estimadores de inclinao de MQO. (Um argu
mento similar se aplica a 0 2.) Veja a Figura 3.1 para a relao entre Var(j3,) e o R-quadrado da regres
so de Xj sobre x2.
No caso geral, R2 a proporo da variao total de x, que pode ser explicada pelas outras vari
veis independentes que aparecem na equao. Para dados cr2 e SQT,, a menor Var(/3;) obtida quando
R2 = 0, que ocorre se, e somente se, x, tem correlao amostrai zero com cada uma das outras vari
veis independentes. Esse o melhor caso para estimar /?,, mas raramente encontrado.
O outro caso extremo, R 2 = 1, excludo pela hiptese RLM.4, pois R j2 = 1 significa que,
na amostra, x, um a com binao linear perfeita de algumas das outras variveis independen
tes da regresso. Um caso mais relevante quando R 2 est prxim o de um. Da equao (3.51)
e da Figura 3.1, vemos que isso pode fazer com que Var(jS,-) seja grande: Var(/3,) > quando
R2 1. Correlao alta (mas no perfeita) entre duas ou mais variveis independentes cha
mada multicolinearidade.
Antes de discutirmos mais a questo da multicolinearidade, importante que uma coisa esteja
bem clara: um caso em que R? est prximo de um no uma violao da hiptese RLM.4.
Como a multicolinearidade no viola nenhuma de nossas hipteses, o problema da multico
linearidade no , de fato, bem definido. Ao dizer que a multicolinearidade surge ao estimarmos /?,,
quando R2 est prximo de um, colocamos prximo dentro de aspas porque no h um nme
ro absoluto que podemos citar para concluir que a multicolinearidade um problema. Por exemplo,
R2 = 0,9 significa que 90% da variao amostrai em x, pode ser explicada pelas outras variveis
independentes do modelo de regresso. Inquestionavelmente, isso significa que x, tem uma forte
relao linear com as outras variveis independentes. No entanto, se isso se traduz em uma V a r(^ )
que grande demais para ser til, depende dos tamanhos de a 2 e SQT,. Como veremos no Captulo
94 Introduo Econometria Editora Thomson

4, para a inferncia estatstica, o que essencialmente importa quanto /3r grande com relao a
seu desvio-padro.

Figura 3 . 1 _____________________________ _____________ _____________________


Var(jS;) como uma funo de Rj.

Assim como um valor grande de Rj pode causar uma Var(j8 .) grande, um valor pequeno de SQTy
tambm pode fazer com que Var(/3.) seja grande. Portanto, um tamanho pequeno da amostra pode tam
bm levar a varincias amostrais grandes. Preocupar-se com graus elevados de correlao entre vari
veis independentes da amostra no , de fato, diferente de se preocupar com um tamanho pequeno da
amostra: ambos funcionam para aumentar Var(/3p.
O famoso econometrista da Universidade de Wisconsin Arthur Goldberger, reagindo obsesso
dos econometristas pela multicolinearidade, criou (jocosamente) o termo micronumerosidade, que ele
define como o problema do tamanho pequeno da amostra. [Para uma discusso interessante sobre
multicolinearidade e micronumerosidade, veja Goldberger (1991).]
Embora o problema da multicolinearidade no possa ser claramente definido, uma coisa clara:
tudo mais sendo igual, para estimar /3;, melhor ter menos correlao entre ,v; e as outras variveis
independentes. Essa observao muitas vezes leva a uma discusso de como resolver o problema da
multicolinearidade. Nas cincias sociais, em que somos geralmente coletores passivos de dados, no
h uma boa maneira de reduzir as varincias dos estimadores no-viesados que no seja coletar mais
dados. Para um determinado conjunto de dados, podemos tentar, num esforo para reduzir a multico
linearidade, suprimir outras variveis independentes do modelo. Infelizmente, suprimir uma varivel
que pertence ao modelo populacional pode levar vis, como vimos na Seo 3.3.
Neste ponto, talvez um exemplo ajude a esclarecer algumas das questes aqui levantadas relativas
multicolinearidade. Suponha que estamos interessados em estimar o efeito de vrias categorias de
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 93

despesas de escolas sobre o desempenho de estudantes. provvel que as despesas com salrios de
professores, materiais institucionais, atletismo etc. estejam altamente correlacionadas: escolas mais
ricas tendem a gastar mais com tudo, e escolas mais pobres gastam menos com tudo. No surpreen
dentemente, pode ser difcil estimar o efeito de qualquer categoria de despesa especfica sobre o
desempenho dos estudantes quando h pouca variao em uma categoria que no pode ser, em grande
medida, explicada por variaes das outras categorias de despesas (isso leva a um Rj alto para cada
uma das variveis de despesas). Esses problemas de multicolinearidade podem ser mitigados ao cole
tar mais dados mas assim, em certo sentido, ns mesmos nos impusemos o problema: estamos formu
lando questes que podem ser sutis demais para que os dados disponveis as respondam com alguma
preciso. Provavelmente, podemos fazer algo muito melhor mudando o escopo da anlise e agrupando
todas as categorias de despesa em uma nica categoria, desde que no mais estivssemos tentando esti
mar o efeito parcial de cada categoria separadamente.
Outro ponto importante que um elevado grau de correlao entre certas variveis independentes
pode ser irrelevante no que diz respeito a quo bem podemos estimar outros parmetros do modelo.
Por exemplo, considere um modelo com trs variveis independentes:

y = j8 0 + >3, jr, + p 2x2 + p 3x2 + m,

em que x2 e x 2 so altamente correlacionados. Ento, Var(/32) e Var( /3,) podem ser grandes. Mas o
valor da correlao entre x 2 e x, no tem efeito direto sobre Var( /3,). De fato, se .v, no-correlacio-
nado com x 2 e x,, ento R] = 0 e Var(/3,) = crVSQT,, independentemente da quantia de correlao
existir entre x 2 e x v Se j8 , o parmetro de interesse, realmente no devemos nos preocupar com o
valor da correlao entre x 2 e x,.

Suponha que voc postula um modelo que explica a nota do exame final em termos da freqncia s aulas.
Assim, a varivel dependente a nota do exame final, e a principal varivel explicativa o nmero de aulas
freqentadas. A fim de controlar as aptides dos estudantes e pelos esforos fora da sala de aula, voc inclui
entre as variveis explicativas a nota acumulada durante todo o curso, a nota do teste de avaliao de co
nhecimentos para ingresso em curso superior e as medidas do desempenho do estudante no ensino mdio.
Algum diz: "Voc no pode esperar aprender nada com esse exerccio, pois todas essas variveis so, pro
vavelmente, altamente colineares". Qual seria sua resposta?

A observao anterior importante porque os economistas frequentemente incluem muitas vari


veis de controle a fim de isolar o efeito causal de uma varivel particular. Por exemplo, ao olhar para
a relao entre as taxas de aprovao de emprstimos e a percentagem de minorias em uma regio,
poderamos incluir variveis como renda mdia, valor mdio das moradias, medidas de inadimplncia,
e assim por diante, pois esses fatores precisam ser considerados a fim de se extrair concluses causais
sobre a discriminao. Renda, preos de moradia e inadimplncia so, geralmente, altamente correla
cionados entre si. No entanto, correlaes altas entre essas variveis no tomam mais difcil determi
nar os efeitos da discriminao.
96 Introduo Econometria Editora Thomson

Varincias em Modelos Mal Especificados


A escolha de incluir ou no uma varivel particular em um modelo de regresso pode ser feita ao ana
lisar o dilema entre vis e varincia. Na Seo 3.3 derivamos o vis produzido pela omisso de uma
varivel relevante quando o modelo verdadeiro contm duas variveis explicativas. Vamos continuar a
anlise desse modelo comparando as varincias dos estimadores de MQO.
Escreva o modelo populacional verdadeiro que satisfaz as hipteses de Gauss-Markov, como

y = 0O + 0 1 * 1 + 0 2 * 2 + "

Consideremos dois estimadores de /S,. O estimador /3, proveniente da regresso mltipla

9 0 o 0 i *i 0 2 * 2" (3.S2)

Em outras palavras, inclumos x2, juntamente com x,, no modelo de regresso. O estimador f3 obti
do ao omitir x2 do modelo e computando uma regresso simples de y sobre x ,:

y = 00 + 01*1- (3.53)

Quando /32 * 0, a equao (3.53) exclui uma varivel relevante do modelo e, como vimos na Seo 3.3,
isso induz um vis em f i ], a no ser que x, e x 2 sejam no-correlacionados. De outro lado, /3, no-
viesado para jSj, para qualquer valor de j32, incluindo (i2 = 0. Segue-se que, se o vis for usado como
nico critrio, f i t prefervel a p r
A concluso de que /3j sempre prefervel a /3, no se sustenta quando trazemos a varincia para
dentro da anlise. Condicionando aos valores de x, e x 2 na amostra, temos, de (3.51),

VarS,) = o-2/[SQT,(1 - R ])l (3.54)

em que SQT, a variao total em x,, e /?, o /{-quadrado da regresso de x, sobre x2. Alm disso,
uma simples modificao da prova para a regresso de duas variveis do Captulo 2 mostra que

V a r(j3 ,) = cr2/ S Q T (3.55)

Comparar (3.55) a (3.54) mostra que Var(/3,) sempre menor que Var(0 ,), a menos que x, e x2 sejam
no-correlacionados na amostra, caso em que os dois estimadores /3, e /8 , so os mesmos. Ao assumir
que X] e x2 so no-correlacionados, podemos ter as seguintes concluses:

1. Quando fi2 ^ 0, viesado, /3, no-viesado e Var(/j() < Var(f i {).


2. Quando /32 = 0, j8 , e J3, so ambos no-viesados e Var /3,) < Var(/3 ).

Da segunda concluso, claro que /8 , preferido se /32 = 0. Intuitivamente, se x2 no tem um efeito


parcial sobre y, inclu-lo no modelo pode somente exacerbar o problema da multicolinearidade, o que
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 97

leva a um estimador menos eficiente de /3,. O custo de incluir uma varivel irrelevante no modelo
uma varincia maior do estimador de
O caso em que / ? 2 * 0 mais difcil. Omitindo x 2 do modelo leva a um estimador viesado de
(3l. Tradicionalmente, econometristas tm sugerido comparar o tamanho provvel do vis devido
omisso de x 2 com a reduo na varincia resumida no tamanho de R\ para decidir se x 2 deve
ser includo. Entretanto, quando /S2 * 0, h duas razes favorveis para incluir x 2 no modelo. A mais
importante delas que qualquer vis em /3, no diminui quando o tamanho da amostra cresce; de
fato, o vis no segue, necessariamente, qualquer padro. Portanto, podemos em geral pensar o vis
como mais ou menos o mesmo para qualquer tamanho de amostra. De outro lado, Var(/3,) e Var(/3,)
tendem a zero quando n torna-se grande, o que significa que a multicolinearidade induzida pela adi
o de x2 toma-se menos importante quando o tamanho da amostra cresce. Em amostras grandes,
preferiramos /3r
A outra razo para preferir mais sutil. A frmula da varincia em (3.55) est condicionada
aos valores de x, e x 2 na amostra, o que oferece o melhor cenrio para /3,. Quando f}2 * 0, a varin
cia de /3j condicionada somente ax , maior que aquela apresentada em (3.55). Intuitivamente, quan
do /32 ^ 0 e x 2 excludo do modelo, a varincia do erro aumenta porque o erro efetivamente contm
parte de x2. Mas, (3.55) ignora o aumento da varincia do erro porque ela trata ambos os regressores
como no-aleatrios. Uma discusso completa de quais variveis independentes deveriam ser condi
cionadas nos desviaria demais de nosso caminho. suficiente dizer que (3.55) bastante generosa
quando ela aparece para medir a preciso de j3r

Estimao de o-2: Os Erros-Padro dos E stim adores de MQO


Vamos, agora, mostrar como escolher um estimador no-viesado de cr2, que nos permitir obter esti
madores no-viesados de Var/T).
Como cr2 = E(n2), um estimador no-viesado de cr2 a mdia amostrai dos erros quadrados:
Ti
n 12 ur Infelizmente, esse no um estimador verdadeiro, pois no observamos os u,. No obstante,
i~ 1
lembre-se de que os erros podem ser escritos como n = yi /30 /3, xn (32xj2 ... {3k xjk, e a
razo real de no observarmos os w, que no conhecemos os (3r Quando substitumos cada /3; por seu
estimador de MQO, obtemos os resduos de MQO:

i = yt - 0 0 0 1 *l - 0 2 *.-2 - - - 0A -

Parece natural estimar a 2 ao substituir n, por u.. No caso da regresso simples, vimos que isso leva a
um estimador viesado. O estimador no-viesado de cr2 no caso geral da regresso mltipla

-2 = ( S ? j/ ( n - k - l ) = SQR/(n Jfc 1). (3.56}

J encontramos esse estimador no caso k = 1 da regresso simples.


O termo n k - 1 em (3.56) representa os graus de liberdade (gl) do problema geral de MQO
com n observaes e k variveis independentes. Como h k + 1 parmetros em um modelo de regres
so com k variveis independentes e um intercepto, podemos escrever
98 Introduo Econometria Editora Thomson

gl = n (k + 1 )
(3.57}
= (nmero de observaes) (nmero de parmetros estimados)

Essa a maneira mais fcil de calcular os graus de liberdade em uma aplicao particular: conte o
nmero de parmetros, incluindo o intercepto, e subtraia esse valor do nmero de observaes. (No
caso raro em que o intercepto no estimado, o nmero de parmetros diminui em um.)
Tecnicamente, a diviso por n k 1 em (3.56) proveniente do fato de que o valor esperado
da soma dos resduos quadrados E(SQR) = (n k 1) cr2. Intuitivamente, podemos entender
porque o ajustamento de graus de liberdade necessrio ao retomarmos s condies de primeira
n n
ordem dos estimadores de MQO. Elas podem ser escritas como ^ ,= 0 e ^ x (m = 0, onde / = 1,
-, = 1

2,..., k. Assim, na obteno dos estimadores de MQO, k + 1 restries so impostas sobre os resduos
de MQO. Isso significa que, dados n (k + 1) dos resduos, os k + 1 resduos restantes so conhe
cidos: h somente n (k + 1) graus de liberdade nos resduos. (Isso pode ser contrastado com os
erros ur os quais tm n graus de liberdade na amostra.)
Para referncia, vamos resumir essa discusso com o Teorema 3.3. Provamos esse teorema para o
caso da anlise de regresso simples no Captulo 2 (veja o Teorema 2.3). (No Apndice E, disponvel
no site de Thomson, dada uma prova geral, que requer lgebra matricial.)

T E O R E M A 3 . 3 ( E S T I M A D O R N O - V I E S A D O D E c r 2 )

Sob as hipteses de Gauss-Markov RLM.1 a RLM.5, E(-2) = a 1.

A raiz quadrada positiva de cf2, denominada <f, chamada Erro-Padro da Regresso (EPR).
O EPR um estimador do desvio-padro do termo erro. Essa estimativa usualmente informada pelos
programas de regresso, embora ela seja chamada de nomes diferentes pelos diferentes programas.
(Alm de EPR, <x tambm chamado erro-padro da estimativa e a raiz do erro quadrado mdio.)
Observe que <f pode diminuir ou aumentar quando outra varivel independente acrescentada a
uma regresso (para uma dada amostra). Isso ocorre pois, embora SQR deva cair quando outra vari
vel explicativa adicionada, os graus de liberdade tambm diminuem em um. Como SQR est no
numerador e gl est no denominador, no podemos dizer, de antemo, qual efeito prevalecer.
Para construir intervalos de confiana e conduzir testes no Captulo 4, precisaremos estimar o des
vio-padro de jj, que exatamente a raiz quadrada da varincia:

dp(li) = cr/[SQT ( 1 - R])}m .

Como a desconhecido, ele substitudo pelo seu estimador, cf. Isso nos d o erro-padro de

ep(/3.) = <x/[SQT.(l - R])]m . (3.58)

Assim como as estimativas de MQO podem ser obtidas para qualquer amostra dada, os erros-padro
tambm podem. Como ep(/3 ) depende de cf, o erro-padro tem uma distribuio amostrai, que desem
penhar um papel importante no Captulo 4.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 99

Devemos enfatizar algo sobre os erros-padro. Como (3.58) obtido diretamente da frmula da
varincia em (3.51), e como (3.51) se apia na hiptese de homoscedasticidade RLM.5, a frmula do
erro-padro em (3.58) no um estimador vlido de dp(/3;) se os erros exibem heteroscedasticidade.
Assim, enquanto a presena de heteroscedasticidade no causa vis emj3j, ela leva vis da frmula
usual da Varj/J,), o que invalida, portanto, os erros-padro. Isso importante porque qualquer progra
ma de regresso calcula (3.58) como o erro-padro bsico de cada coeficiente (com uma interpretao
um pouco diferente para o intercepto). Se suspeitarmos de heteroscedasticidade, ento os erros-padro
de MQO habituais no so vlidos, e alguma ao corretiva deve ser tomada. No Captulo 8 , vere
mos quais mtodos esto disponveis para trabalhar com a heteroscedasticidade.

3.5 EFICINCIA DE MQO: 0 TEOREMA DE GAUSS-MARKOV


Nesta seo, apresentaremos e discutiremos o importante Teorema de Gauss-Markov, que justifica o
uso do mtodo de MQO em vez de usar uma variedade de estimadores concorrentes. J conhecemos
uma justificativa para MQO: sob as hipteses RLM. 1 a RLM.4, MQO no-viesado. Entretanto, h
muitos estimadores no-viesados de (j sob essas hipteses (por exemplo, veja o Problema 3.12).
Poderia haver outros estimadores no-viesados com varincias menores que as dos estimadores de
MQO?
Se limitarmos apropriadamente a classe de estimadores concorrentes, podemos mostrar que MQO
o melhor dentro de sua classe. Especificamente, argumentamos que, sob as hipteses RLM.l a
RLM.5, o estimador de MQO /T para /3; o melhor estimador linear no-viesado (Best Linear
Unbiased Estimator BLUE). A fim de formular o teorema, precisamos entender cada componente
da sigla BLUE. Primeiro, sabemos o que um estimador: ele uma regra que pode ser aplicada a
qualquer amostra de dados para produzir uma estimativa. Tambm sabemos o que um estimador no-
viesado: no contexto corrente, um estimador, por exemplo j8 ., de fy um estimador no-viesado de /3;
se E(/3.) = (3j para qualquer j8 0, j8 ,, ..., (ik.
E o que dizer sobre o significado do termo linear? No contexto atual, um estimador /T de (3t linear
se, e somente se, ele puder ser expresso como uma funo linear dos dados da varivel dependente:

P,= l hv y,. (3.59)


i= i

em que cada Wy pode ser uma funo dos valores amostrais de todas as variveis independentes. Os
estimadores de MQO so lineares, como pode ser visto na equao (3.22).
Finalmente, como definir o melhor? Para o teorema corrente, o melhor definido como a
varincia menor. Dados dois estimadores no-viesados, lgico preferir aquele com a varincia menor
(veja o Apndice C, disponvel no site de Thomson).
Agora, vamos chamar de /30, jS ,,..., os estimadores de MQO do modelo (3.31) sob as hipte
ses RLM.l a RLM.5. O Teorema de Gauss-Markov diz que, para qualquer estimador /3; que
linear e no-viesado, Var(/3,) ^ Var(/3;), e a desigualdade geralmente estrita. Em outras palavras,
na classe dos estimadores lineares no-viesados, MQO tem a menor varincia (sob as cinco hipteses
de Gauss-Markov). De fato, o teorema diz mais do que isso. Se desejarmos estimar qualquer funo
linear de /3,, a combinao linear correspondente dos estimadores de MQO alcana a menor varincia
entre todos os estimadores no-viesados. Vamos concluir com um teorema, o provado no Apndice 3A,
disponvel no site da Thomson.
100 Introduo Econometria Editora Thomson

T E O R E M A 3 . 4 ( T E O R E M A D E G A U S S - M A R K O V )

Sob as hipteses RLM.1 a RLM.5, p o, p t ,..., p k so os melhores estimadores lineares no-viesados (BLUEs)
de p 0, p h p k, respectivamente.

por causa desse teorema que as hipteses RLM.l a RLM.5 so conhecidas como as hipteses de
Gauss-Markov (para a anlise de corte transversal).
A importncia do Teorema de Gauss-Markov que, quando um conjunto padro de hipteses se
mantm, no necessitamos procurar por estimadores no-viesados alternativos da forma expressa em
(3.59): nenhum ser melhor que MQO. Equivalentemente, se somos apresentados a um estimador que
tanto linear como no-viesado, ento sabemos que a varincia desse estimador pelo menos to gran
de quanto a varincia de MQO; nenhum clculo adicional necessrio para mostrar isso.
Para nossos propsitos, o Teorema 3.4 justifica o uso de MQO para estimar modelos de regresso
mltipla. Se qualquer uma das hipteses de Gauss-Markov for violada, o teorema no mais vlido.
J sabemos que a falha da hiptese de mdia condicional zero (hiptese RLM.3) faz com que MQO
seja viesado, de modo que o Teorema 3.4 tambm deixa de ser vlido. Tambm sabemos que a hete-
roscedasticidade (falha da hiptese RLM.5) no faz com que MQO seja viesado. Entretanto, MQO no
tem mais a menor varincia entre os estimadores lineares no-viesados na presena da heteroscedasti-
cidade. No Captulo 8 , analisaremos um estimador que melhora MQO quando conhecemos o tipo da
heteroscedasticidade.123456

1. O modelo de regresso mltipla nos permite, efetivamente, manter os outros fatores fixos ao exa
minarmos os efeitos de uma varivel independente particular sobre a varivel dependente. Ele permite,
explicitamente, que as variveis sejam correlacionadas.
2. Embora o modelo seja linear em seus parmetros, ele pode ser usado para modelar relaes
no-lineares ao se escolher, apropriadamente, as variveis dependente e independente.
3. O mtodo de mnimos quadrados ordinrios facilmente aplicado para estimar o modelo de re
gresso mltipla. Cada estimativa de inclinao mede o efeito parcial da varivel independente corres
pondente sobre a varivel dependente, mantendo todas as outras variveis independentes fixas.
4 . R 2 a proporo da variao amostrai da varivel dependente explicada pelas variveis indepen
dentes, e utilizado como uma medida do grau de ajuste. E importante no dar importncia demais ao
valor do R2 na avaliao de modelos economtricos.
5. Sob as primeiras quatro hipteses de Gauss-Markov (RLM.l a RLM.4), os estimadores de MQO
so no-viesados. Isso implica que incluir uma varivel irrelevante em um modelo no tem nenhum
efeito sobre a inexistncia de vis dos estimadores de intercepto e de inclinao. De outro lado, omitir
uma varivel importante faz com que MQO seja viesado. Em muitas circunstncias, a direo do vis
pode ser determinada.
6. Sob as cinco hipteses de Gauss-Markov, a varincia de um estimador de inclinao de MQO
dada por Var(/T) = cr2/[SQT;( 1 R2)]. Quando a varincia do erro cr2 cresce, o mesmo ocorre com
Var(j8 .), enquanto Var( /T) diminui quando a variao amostrai em x;, SQT;, aumenta. O termo R2
mede a magnitude da colinearidade entre x-t e as outras variveis explicativas. Quando R2 aproximas
se de um, Var( p p ilimitada.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 101

7. Adicionar uma varivel irrelevante a uma equao geralmente aumenta as varincias dos demais
estimadores de MQO, por causa da multicolinearidade.
8. Sob as hipteses de Gauss-Markov (RLM.l a RLM.5), os estimadores de MQO so os melhores
estimadores lineares no-viesados (BLUE).

3.1 Usando os dados do arquivo GPA2.RAW sobre 4.137 estudantes de curso superior nos Estados
Unidos, estimou-se a seguinte equao por MQO:

nmgrad = 1,392 0,0135 emperc + 0,00148 sat


n = 4.137, R2 = 0,273,

em que nmgrad mensurada em uma escala de quatro pontos, emperc o percentil da turma de for
mados do ensino mdio (definido de modo que, por exemplo, emperc = 5 significa os cinco por
cento melhores da sala), e sat uma nota mdia ponderada de matemtica e habilidade verbal do
estudante para ingresso em curso superior.
(i) Por que faz sentido que o coeficiente de emperc seja negativo?
(ii) Qual o valor previsto de nmgrad quando emperc = 20 e sat = 1.050?
(iii) Suponha que dois alunos do ensino mdio, A e B, estejam no mesmo percentil no ensino
mdio, mas a nota sat do Estudante A foi 140 pontos maior (cerca de um desvio-padro na
amostra). Qual a diferena prevista em nmgrad para esses dois estudantes? A diferena
grande?
(iv) Mantendo emperc fixo, que diferena na nota sat levaria a uma diferena prevista de nmgrad
de 0,50? Comente sua resposta.
3.2 Os dados do arquivo WAGE2.RAW, sobre homens que trabalham, foram utilizados para estimar
a seguinte equao:

educ = 10,36 0,094 irms + 0,131 educm + 0,210 educp


n = 722, R 2 = 0,214,

em que educ anos de escolaridade formal, irms o nmero de irmos, educm anos de escolari
dade formal da me e educp anos de escolaridade formal do pai.
(i) irms tem o efeito esperado? Explique. Mantendo educm e educp fixos, em quanto deveria
irms aumentar para reduzir os anos previstos da educao formal em um ano? (Uma respos
ta incompleta aceitvel aqui.)
(ii) Discuta a interpretao do coeficiente de educm.
(iii) Suponha que o Homem A no tenha irmos, e sua me e seu pai tenham, cada um, 12 anos
de educao formal. Suponha tambm que o Homem B no tenha irmos, e sua me e seu
pai tenham, cada um, 16 anos de educao formal. Qual a diferena prevista em anos de
educao formal entre B e A?
102 Introduo Econometria Editora Thomson

3.3 O modelo seguinte uma verso simplificada do modelo de regresso mltipla usado por Biddle
e Hamermesh (1990) para estudar a escolha entre o tempo gasto dormindo e trabalhando e para
observar outros fatores que afetam o sono:

dormir = j30 + j8 1frabof+ j32ednc + /33idade + u,

em que dormir e trabtot (trabalho total) so mensurados em minutos por semana e educ e idade so
mensurados em anos. (Veja tambm o Problema 2.12.)
(i) Se os adultos escolhem entre dormir e trabalhar, qual sinal de ( i, ?
(ii) Que sinais voc espera que /32 e /S3 tero?
(iii) Usando os dados do arquivo SLEEP75.RAW, a equao estimada

dormir = 3.638,25 0,148 trabtot 11,13 educ + 2,20 idade


n = 706, R2 = 0,113.

Se algum trabalha 5 horas a mais por semana, qual a queda, em minutos, no valor esper
ado de dormir? Esse valor representa uma escolha grande?
(iv) Discuta o sinal e a magnitude do coeficiente de educ.
(v) Voc diria que trabtot, educ e idade explicam muito da variao de dormir? Quais outros
fatores poderiam afetar o tempo gasto dormindo? E provvel que eles sejam correlaciona
dos com trabio f!
3.4 O salrio inicial (mediano) para recm-formados em direito determinado pela equao
log (salrioim) = f30 + f , Isat + f}2nmgrad + f33log(volbib) + (i4\og(custo) + (35rank + u,

em que Isat a nota mediana do Isat (nota de ingresso no curso de direito) dos recm-formados,
nmgrad a nota mediana dos recm-formados nas disciplinas do curso de direito, volbib o nme
ro de volumes da biblioteca da escola de direito, custo o custo anual da escola de direito e rank
a classificao da escola de direito (com rank = 1 sendo o melhor posto de classificao).
(i) Explique a razo de esperarmos /35 < 0.
(ii) Quais so os sinais que voc espera para os outros parmetros de inclinao? Justifique sua
resposta.
(iii) Utilizando os dados do arquivo LAWSCH85.RAW, a equao estimada

log (salrioim) = 8,34 + 0,0047 Isat + 0,248 nmgrad + 0,095 log (volbib)
+ 0,038 log(cnso) 0,0033 rank
n = 136, R2 = 0,842.

Qual a diferena ceteris paribus prevista no salrio para as escolas com um nmgrad media
no diferente em um ponto? (Descreva sua resposta em percentual.)
(iv) Interprete o coeficiente da varivel \og(volbib).
(v) Voc diria que melhor freqentar uma escola de direito que tem uma classificao melhor?
Qual a diferena no salrio inicial esperado para uma escola que tem uma classificao
igual a 2 0 ?
3.5 Em um estudo que relaciona a nota mdia em curso superior (nmgrad) ao tempo gasto em vrias
atividades, voc distribui uma pesquisa para vrios estudantes. Os estudantes devem responder quan
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 103

tas horas eles despendem, em cada semana, em quatro atividades: estudo, sono, trabalho e lazer. Toda
atividade colocada em uma das quatro categorias, de modo que, para cada estudante, a soma das
horas nas quatro atividades deve ser igual a 168.
(i) No modelo

nmgrad = f30 + f3}estudar + ji2dormir + fjrabalhar + f34lazer + u,

faz sentido manter dormir, trabalhar e lazer fixos, enquanto estudar varia?
(ii) Explique a razo de esse modelo violar a hiptese RLM.4.
(iii) Como voc poderia reformular o modelo, de modo que seus parmetros tivessem uma inter
pretao til e ele satisfizesse a hiptese RLM.4?
3.6 Considere o modelo de regresso mltipla contendo trs variveis independentes, sob as hipte
ses RLM. 1 a RLM.4:

y - o + \ x \ + i x2 + + u.

Voc est interessado em estimar a soma dos parmetros de x, e x2; chame-a de 0, = ] + 2.


Mostre que = /?, + 2 um estimador no-viesado de 0,.
3.7 Quais dos seguintes itens podem fazer com que os estimadores de MQO sejam viesados?
(i) Heteroscedasticidade.
(ii) Omitir uma varivel importante.
(iii) Um coeficiente de correlao amostrai de 0,95 entre duas variveis independentes includas
no modelo.
3.8 Suponha que a produtividade mdia do trabalhador da indstria (prodmed) dependa de dois fato
res horas mdias de treinamento do trabalhador (treinmed) e aptido mdia do trabalhador
(aptidmed):

prodmed = /30 + /3, treinmed + f2aptidmed + u.

Assuma que essa equao satisfaa as hipteses de Gauss-Markov. Se um subsdio foi dado s
empresas cujos trabalhadores tm uma aptido menor do que a mdia, de modo que treinmed e
aptidmed sejam negativamente correlacionados, qual o provvel vis em /3j obtido da regresso
simples de prodmed sobre treinmedl
3.9 A equao seguinte descreve o preo mediano das residncias de uma comunidade em termos
da quantidade de poluio (oxn, de xido nitroso) e do nmero mdio de cmodos nas residncias da
comunidade (comods):

log(preo) = 13 0 + /3,log (oxn) + (i2comods + u.

(i) Quais so os provveis sinais de /3, e (i2 ! Qual a interpretao de /3, ? Explique.
(ii) Por que oxn [ou, mais precisamente, log(oxn)] e comods deveriam ser negativamente corre
lacionados? Se esse o caso, a regresso simples de log (preo) sobre log (oxn) produz um
estimador viesado para cima ou para baixo de /3, ?
104 Introduo Econometria Editora Thomson

(iii) Utilizando os dados do arquivo HPRICE2.RAW foram estimadas as seguintes equaes:

log(preo) = 11,71 1,043 log(oxn), n = 506, R2 = 0,264.


log(preo) = 9,23 0,718 log(axn) + 0,306 comods, n = 506, R2 = 0,514.

A relao entre as estimativas da elasticidade do preo das regresses simples e mltipla a que voc
previu, tomando como base suas respostas na parte (ii)? Pode-se dizer que 0,718 est claramente
mais prximo da elasticidade verdadeira que 1,043?
3.10 Suponha que o modelo populacional que determina y seja:

y = 00 + 01*1 + 02*2 + 0 3 * 3 + .

e esse modelo satisfaz as hipteses de Gauss-Markov. Entretanto, estimamos o modelo que omite x3.
Sejam /30, 0j e /32 os estimadores de MQO da regresso de y sobre x, e x2. Mostre que o valor espe
rado de /3, (dados os valores das variveis independentes da amostra)

rn xa
2
E(/3.) = 0, + 0 3 ri------ ,
i= i

em que os rn so os resduos de MQO da regresso de x, sobre x2. [Sugesto: a frmula de /3,


proveniente da equao (3.22). Coloque y, = j80 + 0 jx,, + 0 2x i2 + /3 , x ,3 + , nessa equao. Aps
alguma lgebra, aplique o operador esperana, tratando x ,3 e rn como no-aleatrios.]
3.11 A seguinte equao representa os efeitos das receitas totais de impostos sobre o crescimento
subseqente do emprego para a populao de municpios dos Estados Unidos:

cresc = (30 + (3 \pare^ + f32parcr + 0 2parcv + outros fatores,

em que cresc a variao percentual do emprego de 1980 a 1990, enquanto o total das receitas de
impostos tem a seguinte distribuio: parcp a parcela dos impostos sobre a propriedade, parcr a
parcela das receitas de impostos sobre a renda e parcv a parcela das receitas de impostos sobre as
vendas. Todas essas variveis esto mensuradas em 1980. A parcela omitida, parcv inclui taxas e
impostos variados. Por definio, as quatro parcelas somam um. Outros fatores incluiriam despesas
com educao, infra-estrutura, e assim por diante (todos mensurados em 1980).
(i) Por que devemos omitir uma das variveis de parcela de impostos da equao?
(ii) D uma interpretao cuidadosa de
3.12 (i) Considere o modelo de regresso simples y = /30 + 0 ,x + u, sob as primeiras quatro hipte
ses de Gauss-Markov. Para alguma funo g(x), por exemplo, g(x) = x2 ou g(x) = log(l + x2),
defina z, = g(x,). Defina um estimador de inclinao como

01 = (Z/ - z)3i j / ^ | (Z/ -


Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 105

Mostre que [3 linear e no-viesado. Lembre-se: como E(w|x) = 0, voc pode tratar tanto x, como
Zj como no-aleatrios em sua derivao.
(ii) Acrescente a hiptese de homoscedasticidade, RLM.5. Mostre que

Var(i8 ,) = o-2( 2 (z,


z , - z ) 2) / 2
:= 1
~ z ) x i

(iii) Mostre diretamente que, sob as hipteses de Gauss-Markov, Vart/l,) < Var(/3,), em que /3,
o estimador de MQO. [Sugesto: a desigualdade de Cauchy-Schwartz do Apndice B
(disponvel no site da Thomson) implica que

(n~' 2 - z)(A _ 2 (z, ~ z ) 2^ j ( n ~ ' 2 (a _

Observe que podemos retirar x da covarincia amostrai.]

3 A .1 D e r i v a o d a s C o n d i e s d e P r i m e i r a O r d e m d a E q u a o ( 3 . 1 3 ) ______________________________________________

A anlise muito similar do caso da regresso simples. Devemos caracterizar as solues para o
problema

min
2 < J, - K - b x X, bk A*)2-
K hv / -1

Considerando as derivadas parciais em relaao a cada um dos (veja o Apndice A, disponvel no


site da Thomson), avaliando-as nas solues e igualando-as a zero resulta

-2 2 (A - A> ~ A Al - - - A A*) = 0
1= 1
n

-2 2 A/Cv, - A) - A Al ~ - ~ A A a) = > P ^ 3 todo2 = 1. k.


i 1

Cancelando 2 obtemos as condies de primeira ordem em (3.13).

3 A .2 D e r i v a o d a E q u a o ( 3 . 2 2 ) _____________________________________________________________________________________________________________

Para derivar (3.22), escreva xn em termos de seus valores estimados e seus resduos a partir da
regresso de x, sobre x2, .... xk: xix = xn + r ,, para todo i = 1,..., n. Agora, insira essa expresso na
segunda equao de (3.13):

2 (t + r ) ( y , - A A Ai cA*) = 0 (3.60|
106 Introduo Econometria Editora Thomson

Pela definio do resduo de MQO m., como xn exatamente uma funo linear das variveis expli-
n
cativas xi2, x ik, segue que 2 -/j w. = 0. Portanto, a equao (3.60) pode ser expressa como
i= 1

2 rn <yt - Po-Pi xn - - - Pkxn) = - (3.61|


i =1
n
Como os f n so os resduos da regresso de x, sobre x2, ..., xk, ^ x.. rn = 0, para todo j = 2 , k.
N
Portanto, (3.61) equivalente a ^ r , (y /3, x(1) 0. Finalmente, usamos o fato de que ^ x n rjX = 0,
'=1 t= i
o que significa que /3, soluciona

2 = o.
i =1
n
Agora, com um pouco de lgebra chegamos a (3.22), desde que, evidentemente, ^ rft > 0; isso
/= i
garantido pela hiptese RLM.4.

3A.3 Prova do Teorema 3.1__________________________________________________________


Vamos provar o Teorema 3.1 para {; a prova para os outros parmetros de inclinao , virtualmen
te, idntica. (Veja o Apndice E, disponvel no site da Thomson para uma prova mais sucinta utili
zando matrizes.) Sob a hiptese RLM.4, os estimadores de MQO existem, e podemos escrever j3,
como em (3.22). Sob a hiptese RLM.l, podemos escrever y, como em (3.32); substitua-o pelo y, de
n n n n
(3.22). Ento, usando ^ rn 0, ^ xjX rn = 0, para todo j = 2, ..., k e ^ xjX rjX = ^ rfv temos
i= 1 = 1 /= 1 /= 1

P t = P i + ( .2 (3.62J

Agora, sob as hipteses RLM.2 e RLM.3, o valor esperado de cada w dadas todas as variveis inde
pendentes na amostra, zero. Como os rn so justamente funes das variveis independentes da
amostra, segue-se que

E(/3JX) = j8, + ( rn E(,.|X )^

em que X representa os dados de todas as variveis independentes, e E( {\X) o valor esperado de


v dado x;l, ...., x ik, para todo i = 1,..., n. Isso completa a prova.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 107

3A.4 Vis de Varivel Omitida no Modelo Geral_________________________________________


Podemos derivar o vis de varivel omitida no modelo geral da equao (3.31) sob as quatro primei
ras hipteses de Gauss-Markov. Em particular, sejam /3, / = 0, 1, k os estimadores de MQO da
regresso ao se usar o conjunto completo de variveis explicativas. Sejam /3 j = 0, 1, ..., k 1 os
estimadores de MQO da regresso que omite xk. Sejam 5., j = 1, ..., k 1 os coeficientes de incli
nao d e Xj da regresso auxiliar de xik sobre x n , xi2, ..., xkk _ ,, i = 1, ..., n. Um fato til que

p J = p j + p k 8j . (3.63)

Isso mostra explicitamente que, quando no controlamos xk na regresso, o efeito parcial esti
mado de Xj igual ao efeito parcial quando inclumos xk mais o efeito parcial de xk sobre y vezes a
relao parcial entre a varivel omitida, xk, e Xj,j < k. Condicionado ao conjunto inteiro de variveis
explicativas, X , sabemos que os /3. so todos no-viesados para os correspondentes f3j,j = 1, ..., k.
Alm disso, como 5, exatamente uma funo de X, temos

E (pj\X ) = EU3j\X) + E(fik\X) 8J


= fi i + M r

A equao (3.64) mostra que f[ viesado para /37, a menos que f3k = 0 caso em que x, no
tem efeito parcial na populao , ou 8; igual a zero, o que significa que xik e x,; so parcialmente
no-correlacionados na amostra. A chave para obter a equao (3.64) a equao (3.63). Para mostrar
a equao (3.63), podemos usar a equao (3.22) vrias vezes. Por simplicidade, vamos olhar para7 = 1 .
Agora, jS, o coeficiente de inclinao da regresso simples de y, sobre rn, i = 1 ..., n, em que os rn
so os resduos de MQO da regresso de xn sobre xi2, xi3, ..., xik _ ,. Considere o numerador da
~ n
expresso de /3,: ^ f n yr Para cada i, podemos escrever y; = /30 -t- j8 , xn + ... + f3t xik + : e colocar
;=1
em y,. Agora, pelas propriedades dos resduos de MQO, os rn tm mdia amostrai zero e so no-
correlacionados com x a , x,3, ..., xi k _ | na amostra. Semelhantemente, os i tm mdia amostrai zero e
correlao amostrai zero com jc;1, xa , ..., xik. Segue-se que os f n e j so no-correlacionados na amos
tra (visto que os rn so exatamente uma combinao linear de x iU x i2, ..., xl k _ ,). Assim

2 - r n y, = fii 2 M 2 (3.65)
i= 1 i= 1

Agora, 2 ?n x -,\= 2 ^ue tambm o denominador de /3r Portanto, mostramos que


i=1 i= 1

fit = fit

= + p k8 r

Essa a relao que queramos mostrar.


108 Introduo Econometria Editora Thomson

3A.S Prova do Teorema 3.2 _________________________________________________


Novamente, vamos provar o teorema para y = 1. Escreva /3, como na equao (3.62). Agora, sob
RLM.5, Var(n,|A") = a 2, para todo i = 1, ..., n. Sob amostragem aleatria, os n, so independentes,
mesmo condicionados a X, e os rn so no-aleatrios condicionados a X. Portanto,

VarC/3, \X) r^ V a r(u JX )^

n n
2 _
Agora, visto que 2 A a soma dos quadrados dos resduos da regresso de x, sobre x2. ,At, 2
i= 1 i=I
SQT|( 1 R2). Isso completa a prova.

3A.6 Prova do Teorema 3.4__________________________________________________________


Mostramos que, para qualquer outro estimador linear no-viesado /3, de f i u Var( /S,) > Var(/3,), em
que /, o estimador de MQO. No se perde generalidade ao jogarmos o foco em j = 1.
Para /3, como na equao (3.59), podemos inserir em v,- para obter

n n n n n

r f t E w,-i + Pt 2 w,i Ai + Az + - + w., At + 2 wn


t= 1 1=1 1=1 1=1 1=1

Agora, visto que os wn so funes de xy,

E0 3 ,\ X ) = P 0 wn + /3, w,iAi + 0z w.-iAz + - + Pk w,iAt + w/i E(, W


/=1 /= 1 /= 1 /=1 1= 1
n n n n

= w,-i + 01 2 A 1A 1 + P2 2 W/iA-2 + - + 0* 2 wiiAt


f 1 =1 /= I /= l

porque E( k(-|.X) = 0, para todo i = 1,..., n, sob RLM.2 e RLM.3. Portanto, para E(yS] \X) igualar-se a
j3, para quaisquer valores dos parmetros, devemos ter

2 w n = 0, 2 wrt = 1 , 2 W/i Ay = 7 = 2, , fc. {3.66}


=1 i=1 I= 1

Agora, sejam rn os resduos da regresso de x;l sobre x i2, ..., x;Vt. Ento, de (3.66), segue-se que

= 1 (3.67}
;= 1

n
visto que xn = xn + rn e 2 = 0. Agora, considere a diferena entre Var( , \X) e Var(/3, |A)
sob RLM.l a RLM.5:
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 109

o2 2 w n ~ -2l [ 2 ) (3.68)

Por causa de (3.67), podemos escrever a diferena em (3.68), sem cr2, como

(3.69)

No entanto, (3.69) simplesmente

2 K i - ?i ^ii)2 (3.70)

em que y x = 2 w,\ rn jf 2 'n )> como pode ser visto ao se elevar cada termo em (3.70) ao quadra
do, somando e cancelando os termos. Como (3.70) exatamente a soma dos resduos quadrados da
regresso simples de vv,, sobre rn lembre-se de que a mdia amostrai de rn zero , (3.70) deve
ser no-negativo. Isso completa a prova.
Anlise de Regresso Mltipla:
Problemas Adicionais

ste captulo articula vrios problemas da anlise de regresso mltipla que no foram tratados
convenientemente nos captulos anteriores. Estes tpicos no so to fundamentais quanto os dis
cutidos nos captulos 3 e 4, mas so importantes para a aplicao da regresso mltipla em uma
ampla gama de problemas empricos.

6.1 EFEITOS DA DIMENSO DOS DADOS NAS ESTATSTICAS MQO


No Captulo 2, sobre regresso bivariada, discutimos de forma sucinta os efeitos da mudana nas
unidades de medida sobre os interceptos e as estimativas de inclinao do MQO. Tambm mostramos
que a mudana nas unidades de medida no afeta o /?-quadrado. Agora retomaremos ao problema da
dimenso dos dados e examinaremos o efeito do redimensionamento das variveis dependente ou inde
pendente sobre os erros-padro, estatsticas t, estatsticas F e intervalos de confiana.
Veremos que tudo o que esperamos acontecer, acontecer. Quando as variveis so redimensiona-
das, os coeficientes, erros-padro, intervalos de confiana, estatsticas t e F mudam de tal maneira que
preservam todos os efeitos mensurados e os resultados dos testes. Embora isso no seja uma grande
surpresa - alis, ficaramos muito preocupados se no fosse assim - til ver o que ocorre explicita
mente. Muitas vezes, o redimensionamento de dados usado com finalidade cosmtica, tal como redu
zir o nmero de zeros depois da vrgula, em um coeficiente estimado. Escolhendo-se criteriosamente
as unidades de medida, podemos melhorar a aparncia de uma equao estimada sem alterar nada que
seja essencial.
Poderamos tratar deste problema de maneira generalizada, mas ele mais bem ilustrado com
exemplos. Da mesma forma, ser de pouca valia neste ponto introduzirmos uma notao abstrata.
Comeamos com uma equao relacionando o peso dos recm-nascidos com o hbito de fumar e
a renda familiar:

pesnas = y30 + yS, cigs + (3-,rendfam |6 . 1)

onde pesnas o peso dos recm-nascidos, em onas, cigs o nmero mdio de cigarros que a me
fumou por dia durante a gravidez, e rendfam a renda anual familiar, em milhares de dlares. As
estimativas desta equao, obtidas utilizando dados contidos no arquivo BWGHT.RAW, so dadas
na primeira coluna da Tabela 6.1. Os erros-padro esto relacionados entre parnteses. A estimativa
de cigs mostra que se uma mulher fumar cinco ou mais cigarros por dia, o peso previsto dos recm-

174
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 175

nascidos deve estar em torno de 0,4634(5) = 2,317 onas a menos. A estatstica t de cigs -5,06,
de modo que a varivel estatisticamente bastante signiicante.

Tabela 6.1___________________________________________________________________ _________


Efeitos da Dimenso dos Dados

Varivel Dependente (1) pesonas (2) pesonaslb (3) pesonas

Variveis Independentes

cigs -0,4634 -0,0289


(0,0916) (0,0057)

maos -9,268
(1,832)

rendfam 0,0927 0,0058 0,0927


(0,0292) (0,0018) (0,0292)

intercepto 116,974 7,3109 116,974


(1,049) (0,0656) (1,049)

Observaes 1.388 1.388 1.388

/{-quadrado 0,0298 0,0298 0,0298

SQR 557.485,51 2.177,6778 557.485,51

EPR 20,063 1,2539 20,063

Agora, suponha que decidimos medir o peso dos recm-nascidos em libras, em vez de onas.
Faamos pesonaslb = pesonas/ 16 ser o peso dos recm-nascidos em libras. O que acontece com nos
sas estatsticas MQO se usarmos essa varivel dependente em nossa equao? E fcil verificar o efei
to no coeficiente da estimativa pela simples manipulao da equao (6.1). Divida a equao inteira
por 16:

pesnasl 16 =/30/16 + (/,/! 6)cigs + (j32l\6)rendfam.

Como o termo da esquerda o peso dos recm-nascidos em libras, segue-se que cada novo coeficien
te corresponder ao coeficiente antigo dividido por 16. Para verificar isso, a regresso de pesonaslb
sobre cigs e rendfam est registrada na coluna (2) da Tabela 6.1. At quatro dgitos, o intercepto e as
inclinaes da coluna (2) so exatamente os da coluna (1) divididos por 16. Por exemplo, o coeficien
te de cigs agora 0,0289; isso significa que, se cigs fosse cinco vezes mais alto, o peso de nascimen
to seria 0,0289(5) = 0,1445 libras mais baixo. Em termos de onas, temos 0,1445(16) = 2,312, que
um pouco diferente dos 2,317 que obtivemos anteriormente devido ao erro de arredondamento. A ques
to importante que, uma vez que os efeitos tenham sido transformados nas mesmas unidades, obte
mos exatamente a mesma resposta, independentemente de como a varivel dependente seja medida.
176 Introduo Econometria - Editora Thomson

E quanto significncia estatstica? Como esperado, a alterao da varivel dependente de onas


para libras no tem efeito sobre o quanto so estatisticamente importantes as variveis independentes.
Os erros-padro na coluna (2) so 16 vezes menores que os da coluna (1). Alguns clculos rpidos mos
tram que as estatsticas t na coluna (2 ) so, realmente, idnticas s da coluna ( 1 ). Os pontos extremos
dos intervalos de confiana na coluna (2 ) so exatamente os pontos extremos na coluna ( 1 ) divididos
por 16. Isso ocorre porque os ICs mudam pelos mesmos fatores dos erros-padro. (Lembre-se de que
o IC de 95% neste caso /3. 1,96 ep(/3;).
Em termos de grau de ajuste, os /?-quadrados das duas regresses so idnticos, como esperado.
Observe que a soma dos resduos quadrados, SQR, e o erro-padro da regresso, EPR, diferem nas
equaes. Essas diferenas so facilmente explicadas. Seja j o resduo da observao i na equao ori
ginal (6.1). Ento, quando pesonaslbs a varivel dependente, o resduo simplesmente j 16. Assim,
o resduo quadrado na segunda equao ( .J 16)2 = ]/256. Essa a razo pela qual a soma dos res
duos quadrados na coluna (2) igual SQR na coluna (1) dividida por 256.
Como EPR & = V SQ R /(k 1) = VSQR/1.385, SQR na coluna (2) 16 vezes menor do
que na coluna (1). Outra maneira de ver isso que o erro na equao com pesonaslb como a varivel
dependente tem um desvio-padro 16 vezes menor do que o desvio-padro do erro original. Isso no
significa que tenhamos reduzido o erro ao alterarmos a maneira pela qual o peso dos recm-nascidos
medido: o EPR menor simplesmente reflete uma diferena nas unidades de medida.
Continuando, retomemos unidade de medida original da varivel dependente: pesonas medi
do em onas. Vamos alterar a unidade de medida de uma das variveis independentes, cigs. Defina
maos como sendo a quantidade de maos de cigarros fumados por dia. Assim, maos = cigs/20.
Agora, o que acontece com os coeficientes e outras estatsticas MQO? Dessa forma, podemos escrever

pesnas = 0 + (20f(cigs/20) + 1rendfam = {) + (20/3, )maos + 2rendfam.

Portanto, o intercepto e o coeficiente de inclinao de rendfam no se alteraram, mas o coeficien


te de maos 20 vezes o de cigs. Isso intuitivamente atraente. Os resultados da regresso de pesonas
sobre maos e rendfam esto na coluna (3) da Tabela 6.1. A propsito, lembre-se de que no teria sen
tido incluir tanto cigs como maos na mesma equao; isso induziria multicolinearidade perfeita e
no teria nenhum significado interessante.

Na equao original sobre o peso dos recm-nascidos (6.1), suponha que re n d fa m seja medida em dlares
em lugar de milhares de dlares. Desse modo, defina a varivel re n d fa m d o l = 1.000 -re n d fa m . Como
mudam as estatsticas MQO quando re n d fa m d o l substitui re n d fa m l Para o propsito de apresentar os
resultados da regresso, voc acha melhor medir a renda em dlares ou em milhares de dlares?

Alm do coeficiente de maos, existe outra estatstica na coluna (3) que difere da mostrada na
coluna (1): o erro-padro de maos 20 vezes maior que o de cigs na coluna (1). Isso significa que a
estatstica t para verificar a significncia do hbito de fumar a mesma, quer ele seja medido em cigar
ros ou em maos. Isso natural.
O exemplo anterior explica claramente a maioria das possibilidades que surgem quando a vari
vel dependente e as variveis independentes so redimensionadas. O redimensionamento muitas
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 177

vezes feito com os valores monetrios em economia, especialmente quando os montantes so muito
grandes.
No Captulo 2, argumentamos que, se a varivel dependente aparecer na forma logartmica, a
alterao na unidade de medida no afetar o coeficiente de inclinao. Isso tambm acontece aqui: a alte
rao na unidade de medida da varivel dependente, quando aparece na forma logartmica, no afeta
qualquer das estimativas de inclinao. Isso resulta do simples fato de que l o g i c = log(Cj) + logiv,)
para qualquer constante c t > 0. O novo intercepto ser logic, j + f30. De forma semelhante, a alterao
da unidade de medida de qualquer xjt onde log(jc;) aparece na regresso, afeta somente o intercepto. Isso
corresponde ao que conhecemos sobre alteraes em porcentagens e, em particular, em elasticidades:
elas no sofrem alteraes quando mudam as unidades de medida de y ou de x;. Por exemplo, se tivs
semos especificado a varivel dependente em (6 . 1 ) como log(pesonas), estimssemos a equao, e
depois a tivssemos reestimado com log(jpesonaslb) como a varivel dependente, os coeficientes de cigs
e rendfam seriam os mesmos em ambas as regresses; somente o intercepto seria diferente.

Os Coeficientes Beta
Algumas vezes, em aplicaes economtricas, uma varivel-chave medida em uma dimenso de
difcil interpretao. Economistas especializados na rea de trabalho freqentemente incluem a pon
tuao de testes de conhecimentos em equaes salariais, e a dimenso em que tais testes so registra
dos muitas vezes arbitrria e de difcil interpretao (pelo menos para os economistas!). Em quase
todos os casos estamos interessados em saber como a pontuao de um indivduo em particular se com
para com a populao. Assim, em lugar de perguntarmos a respeito do efeito sobre o salrio por hora
se, digamos, a pontuao do teste for dez pontos mais alta, faz mais sentido perguntar o que acontece
quando a pontuao do teste for um desvio-padro mais alto.
Nada impede que vejamos o que acontece com a varivel dependente quando uma varivel inde
pendente em um modelo estimado aumenta certo nmero de desvios-padro, supondo que tenhamos
obtido o desvio-padro da amostra (o que fcil na maioria dos programas de regresso). Geralmente,
essa uma boa idia. Assim, por exemplo, quando observamos o efeito de uma pontuao de teste
padronizada, como o SAT (nota de ingresso em curso superior nos Estados Unidos), sobre a nota mdia
em curso superior, podemos encontrar o desvio-padro de SAT e verificar o que acontece quando essa
pontuao aumenta em um ou dois desvios-padro.
Algumas vezes til obter resultados de regresso quando todas as variveis envolvidas, a depen
dente e todas as independentes, tenham sido padronizadas. Uma varivel padronizada em uma amos
tra pela subtrao de sua mdia e dividindo o resultado por seu desvio-padro (veja Apndice C
disponvel no site do livro, no site www.thomsonleaming.com.br). Isso significa que computamos a
transformao z de cada varivel na amostra. Depois, fazemos a regresso usando os valores de z-
Por que a padronizao til? E mais fcil comearmos com a equao MQO original, com as
variveis em suas formas originais:

yt = 0o + 0, Ui + 02-U-2 + - + 0*U* + 16.2

Inclumos o subscrito de observao i para enfatizar que nossa padronizao aplicada a todos os
valores da amostra. Agora, se ao calcularmos a mdia de (6.2), usarmos o fato de que , tem uma mdia
de amostra zero, e subtrairmos o resultado de (6 .2 ), temos

u - y = 0i(ui ~ u ) + 02(*a - xi> + - + 0*(u*_ u ) + r


178 Introduo Econometria - Editora Thomson

Em seguida, definamos como o desvio-padro da amostra da varivel dependente, tr, como o


dp da amostra d ax,, r2 como o dp da amostra d ex2, e assim sucessivamente. Agora, um pouco de lge
bra produz a equao

O', - y )/ y = { ^ lla y) l[(xn - x ,)/^ ,] + ...


(6.3)
+ ( it/ p &[(*,* - + ( i ^ ) -

Cada varivel em (6.3) foi padronizada pela substituio de suas mdias por seus valores de z, e isso
resultou em novos coeficientes de inclinao. Por exemplo, o coeficiente de inclinao de (x;l x, (/cr,
(y-,,)/},. Isso simplesmente o coeficiente original, /3,, multiplicado pela razo do desvio-padro de
X, sobre o desvio-padro de v. O intercepto simplesmente desapareceu.
til reescrever (6.3), eliminando o subscrito i, como

zy ~ b l z l + b2 z2 + ... + bk zk + erro, (6.4)

onde zv o valor de z de v, z, o valor de z de x u e assim por diante. Os novos coeficientes so

bj = ( j l ^ P j para 7 = 1 ,..., k. (6.5)

Esses bj so tradicionalmente chamados de coeficientes padronizados ou coeficientes beta.


(Esta ltima denominao mais comum, mas um pouco inadequada, j que temos usado o beta cha
pu para representar as estimativas MQO usuais.)
Os coeficientes beta recebem seus interessantes significados a partir da equao (6.4): Se x,
aumentar em um desvio-padro, y, ento, ser alterado em b t desvios-padro. Assim, estamos medin
do os efeitos no em termos das unidades originais de y ou de x;, mas em unidades de desvios-padro.
Como isso toma a dimenso dos regressores irrelevante, essa equao coloca as variveis explicativas
em p de igualdade. Em uma equao MQO padro, no possvel simplesmente verificar o tamanho
dos diferentes coeficientes e concluir que a varivel explicativa com o maior coeficiente a mais
importante. Acabamos de ver que a magnitude dos coeficientes pode ser mudada vontade pela alte
rao das unidades de medida das variveis x;. Mas, quando cada xy padronizado, a comparao das
magnitudes dos coeficientes beta resultantes mais convincente.
Para obter os coeficientes beta, podemos sempre padronizar v, x,,..., xk e em seguida computar a
regresso MQO do valor de z de y sobre os valores de z de x,,..., xk - no qual no necessrio incluir
um intercepto, j que ele ser zero. Isso pode ser tedioso com muitas variveis independentes. Alguns
programas economtricos produzem coeficientes beta com um simples comando. O exemplo seguinte
ilustra o uso de coeficientes beta.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 179

EXEMPLO 6.1
(Efeitos da Poluio sobre os Preos de Imveis)
Utilizamos os dados do Exemplo 4.5 (do arquivo HPRICE2.RAW) para ilustrar o uso de coeficientes beta.
Lembre-se de que a principal varivel independente oxn, uma medida do xido nitroso no ar em cada
comunidade. Uma maneira de entender o tamanho do efeito da poluio - sem entrar na questo cientfica
do efeito do xido de nitrognio sobre a qualidade do ar computar os coeficientes beta. (0 Exemplo 4.5
contm um mtodo alternativo: obtivemos uma elasticidade-preo em relao a oxn usando p reo e oxn em
forma logartmica.)
A equao populacional o modelo nvel-nvel

preo = /30 + fi 1oxn + (32crime + (i^comods + (iAdist + ftpaz.estud + u,

onde todas as variveis exceto c rim e foram definidas no Exemplo 4.5; crim e o nmero de crimes registra
dos p e r capita. Os coeficientes beta aparecem na seguinte equao (portanto cada varivel foi convertida
ao seu valor de z):

zpreo = 0,340 zoxn 0,143 zcrime + 0,514 zcomods 0,235 zdist 0,270 zmzestud.

Esta equao mostra que o aumento de um desvio-padro em oxn reduz o preo em 0,34 desvio-padro; o
aumento de um desvio-padro em c rim e reduz o preo em 0,14 desvio-padro. Assim, o mesmo movimen
to relativo da poluio na populao tem um efeito maior sobre os preos dos imveis do que o da crimina
lidade. 0 tamanho do imvel, medido pelo nmero de cmodos (c o m o d s ), tem o maior efeito padronizado.
Se quisermos saber os efeitos de cada varivel independente sobre o valor da mediana dos preos dos im
veis, teremos que usar as variveis no padronizadas.
0 uso de variveis padronizadas ou no padronizadas no afetar a significncia estatstica: as esta
tsticas f sero as mesmas, em ambos os casos.

6.2 UM POUCO MAIS SOBRE A FORMA FUNCIONAL


Em vrios dos exemplos anteriores, encontramos o artifcio mais comum em econometria para
permitir relaes no lineares entre a varivel explicada e as variveis explicativas: o uso de logaritmos
das variveis dependentes ou independentes. Tambm vimos modelos contendo os quadrados de algu
mas variveis explicativas, mas ainda precisamos discorrer sobre um tratamento sistemtico desses
tpicos. Nesta seo, trataremos de algumas variaes e extenses sobre formas funcionais que surgem
freqentemente em trabalhos aplicados.

Um pouco m ais sobre o Uso de Formas Funcionais Logartmicas


Comeamos revendo como interpretar os parmetros no modelo

lo g ( p r e o ) = /30 + /3]log( o x n ) + p 2c o m o d s + u, (6.6)


180 Introduo Econometria Editora Thomson

onde essas variveis so as mesmas do Exemplo 4.5. Lembre-se de que em todo o texto log(x) o log
natural de x. O coeficiente /3, a elasticidade do preo em relao a oxn (poluio). O coeficiente /32
a mudana em log (preo), quando txcomods = 1 ; como vimos muitas vezes, quando multiplicada por
100, essa a percentagem aproximada de mudana em preo. Lembre-se de que 100 /L algumas
vezes chamado de semi-elasticidade do preo em relao a comods.
Quando estimamos utilizando os dados do arquivo HPRICE2.RAW, obtemos

\og(preo) = 9,23 0,718 log (oxn) + 0,306 comods

(0,19) (0,66) (0,019) {6.7)


n = 506, R2 = 0,514.

Assim, quando oxn aumenta em 1%, preo cai em 0,718%, mantendo-se apenas comods fixo.
Quando comods aumenta em um, preo aumenta em aproximadamente 100(0,306) = 30,6%.
A estimativa de que um cmodo a mais aumenta o preo em cerca de 30,6% acaba por ser de certa
forma impreciso para esta aplicao. O erro de aproximao ocorre porque, como a mudana em log(y)
se torna cada vez maior, a aproximao %Ay ~ 1 0 0 Alog(v) se mostra cada vez mais imprecisa.
Felizmente, existe um clculo simples para computar a percentagem exata de mudana.
Para descrever o procedimento, consideremos o modelo estimado de forma geral

lgCv) = (30 + (3, loglx,) + /Lx2.

(A incluso de variveis independentes adicionais no altera o procedimento.) Agora, fixando x h


temos Alg(jy) = /32Ax2. O uso de simples propriedades algbricas das funes exponenciais e logart
micas produz a percentagem exata de mudana no y estimado como

% y = 100-[exp(/32Ax2) 1], ( 6.8)

onde a multiplicao por 100 transforma a mudana proporcional em uma mudana percentual.
Quando Ax2 = 1,

% hy = 1 0 0 -[exp(j2) - 1 ], (6.9)

A plicada ao exemplo dos preos dos imveis com x 2 = comods e = 0,306, %Apro =
100[exp(0,306) 1] = 35,8%, que visivelmente maior do que a percentagem aproximada de mudan
a, 30,6%, obtida diretamente de (6.7). {A propsito, esse no um estimador no-viesado, pois exp(-)
uma funo no-linear; ele , porm, um estimador consistente de 100[expQ32) 1]- Isso assim
porque o limite de probabilidade calculado por meio de funes contnuas, enquanto o operador valor
esperado no calculado dessa forma. Veja Apndice C, no site da Thomson.}
O ajuste na equao (6 .8 ) no to crucial para pequenas mudanas percentuais. Por exemplo,
quando inclumos na equao (6.7) a relao aluno-professor, seu coeficiente estimado 0,052, o que
significa que, se razestud aumentar em um, preo diminui em aproximadamente 5,2%. A mudana pro
porcional exata exp(0,052) 1 == 0,051, ou 5,1%. De outro lado, se aumentarmos razestud em
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 181

cinco, ento a mudana percentual aproximada em preo ser 26%, enquanto a mudana exata obtida
da equao (6 .8 ) 100[exp(0,26) 1] = 22,9%.
Vimos que o uso de logs naturais leva a coeficientes com interpretaes interessantes e podemos
ignorar o fato de as unidades de medida das variveis aparecerem em forma logartmica, pois os coe
ficientes de inclinao so invariantes em relao a redimensionamentos. Existem vrias outras razes
pelas quais os logs so to usados em trabalhos aplicados. Em primeiro lugar, quando y > 0, os mode
los que usam log(y) como a varivel dependente geralmente satisfazem as hipteses do MLC mais
apropriadamente do que os modelos que usam o nvel de y. Variveis estritamente positivas frequente
mente possuem distribuies condicionais que so heteroscedsticas ou concentradas; o uso do log
pode aliviar, se no eliminar, ambos os problemas.
Alm disso, o uso de logs normalmente estreita a amplitude dos valores das variveis, em alguns
casos em quantidade considervel. Isso toma as estimativas menos sensveis a observaes dspares (ou
extremas) na varivel dependente ou nas variveis independentes. Abordaremos a questo das obser
vaes extremas no Captulo 9.
Existem algumas regras prticas padronizadas para o uso de logs, embora nenhuma definitiva.
Quando a varivel um valor monetrio positivo, ele freqentemente transformado em log. Temos
visto isso para variveis como salrios, vendas de empresas e valores de mercado das empresas.
Variveis como populao, nmero total de empregados e matrculas escolares freqentemente apare
cem em forma logartmica; elas tm a caracterstica comum de serem grandes valores inteiros.
Variveis que so medidas em anos como educao, experincia, tempo de permanncia,
idade etc. normalmente aparecem em sua forma original. Uma varivel que seja uma proporo ou
uma percentagem como a taxa de desemprego, a taxa de participao em planos de aposentadoria,
a taxa de estudantes aprovados em um exame padronizado e a taxa de deteno sobre crimes registra
dos pode aparecer tanto em sua forma original como logartmica, embora haja uma tendncia em
us-la em forma de nvel. Isso se deve ao fato de que quaisquer coeficientes de regresso envolvendo
a varivel original seja ela a varivel dependente ou independente tero uma interpretao de
mudana de pontos percentuais. (Veja Apndice A, no site da Thomson, para uma reviso sobre a
distino entre mudana percentual e mudana de pontos percentuais.) Se usarmos, digamos,
log(desemp) em uma regresso, onde desemp a percentagem de indivduos desempregados, precisa
mos ter muito cuidado para distinguir entre uma mudana de pontos percentuais e uma mudana percen
tual. Lembre-se, quando desemp aumenta de oito para nove, isso um acrscimo de um ponto per
centual, equivalente a um incremento de 12,5% sobre o nvel de desemprego inicial. O uso do log
significa que queremos saber a mudana percentual da taxa de desemprego: log(9) log(8 ) ~ 0,118
ou 11,8%, que a aproximao logartmica do aumento efetivo de 12,5%.

Suponha que o nmero anual de prises por direo de veculo sob embriaguez1 seja determinado por

logiprises) = j30 + P\\og (pop) + p 2i^adeJ6_25 + outros fatores,

onde idade! 6_25 a proporo da populao entre 16 e 25 anos de idade. Mostre que p 2 tem a seguinte
interpretao (ceteris paribus): ela a mudana percentual em prises quando a percentagem da popula
o com idade entre 16 e 25 anos aumenta em um ponto percentual.

I NE: Nos Eslados Unidos.


182 Introduo Econometria Editora Thomson

Uma limitao do log que ele no pode ser usado, caso uma varivel assuma valor zero ou nega
tivo. Em casos nos quais a varivel y no seja negativa, mas pode assumir o valor 0, log(l + y) algu
mas vezes usado. As interpretaes de mudana percentual so, em geral, estritamente preservadas,
exceto para mudanas comeando em y = 0 (em que a percentagem de mudana no sequer defini
da). Geralmente, usar log(l + y) e depois interpretar as estimativas como se a varivel fosse log(y)
aceitvel quando os dados em y no so dominados por zeros. Um exemplo pode ser o de y represen
tar horas de treinamento por funcionrio da populao industrial, quando uma grande frao das
empresas oferece treinamento a, pelo menos, um de seus funcionrios.
Uma desvantagem de usar uma varivel dependente na forma logartmica est na dificuldade de se
prever a varivel original. O modelo original nos permite prever log(y), e no y. No entanto, razoavel
mente fcil transformar uma previso de log(y) em uma previso de y (veja Seo 6.4). Uma questo
relacionada que no vlido comparar /?-quadrados de modelos nos quais y a varivel dependente
em um caso e log(y) a varivel dependente no outro. Essas medidas explicam variaes em diferentes
variveis. Discutimos como computar medidas comparveis de graus de ajuste na Seo 6.4.

Modelos com Funes Quadrticas


As funes quadrticas tambm so usadas com bastante frequncia em economia aplicada para
capturar efeitos marginais crescentes ou decrescentes. Seria interessante rever as propriedades das fun
es quadrticas no Apndice A, no site da Thomson.
No caso mais simples, y depende de um nico fator observado x, mas de uma forma quadrtica:

y = /30 + /3,x + /32x 2 + u.

Por exemplo, considere y = salrioh x = exper. Como discutimos no Captulo 3, esse modelo no
se enquadra na anlise de regresso simples, mas facilmente trabalhado em regresso mltipla.
importante lembrar que /3] no mede a mudana em y em relao a x; no faz sentido manter x2
fixo quando se altera x. Se escrevermos a equao estimada como

y = Po + P i x + /M 2 (6.10)

teremos a aproximao

Ay ** (/3, + 2 2x)Ax, e assim Ay/Ax = , + 2 2x. (6.11)

Isso nos mostra que a inclinao da relao entre x e y depende do valor de x; a inclinao esti
mada /3, + 2/32x. Se inserirmos x = 0, veremos que /3, pode ser interpretado como a inclinao apro
ximada na alterao de x = 0 para x = 1. Para outras mudanas no valor de x, o segundo termo, 2/3 ^x,
deve ser levado em conta.
Se estivermos interessados em somente computar a mudana prevista em y dado um valor inicial
de x e uma mudana de x, poderamos usar (6 . 1 0 ) diretamente: no h nenhuma razo para usar clcu
los de aproximao. Porm, normalmente estamos mais interessados em resumir rapidamente o efeito
de x em y, e a interpretao de /3, e de /32 na equao (6.11) fornece esse resumo. Em geral, podemos
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 183

inserir o valor mdio de x na amostra, ou outros valores de interesse, como a mediana ou os valores
dos quartis inferior ou superior de x.
Em muitas aplicaes, j3, positivo, e /32 negativo. Por exemplo, utilizando os dados de sal
rios contidos no arquivo WAGE1.RAW, obtemos

salrioh = 3,73 + 0,298 exper 0,0061 exper2

(0,35) (0,041) (0,0009) (6.12)

n = 526, R2 = 0,093.

A equao estimada sugere que exper tem um efeito de reduo sobre salrioh. O primeiro ano
de experincia vale aproximadamente 30 centavos de dlar por hora (0,298 dlares). O segundo ano de
experincia vale menos [cerca de 0,298 2(0,0061 )(1) ~ 0,286, ou 28,6 centavos de dlar, de acordo
com a aproximao em (6.11) com x = 1]. Aumentando de 10 para 11 os anos de experincia, a pre
viso de aumento do salrio-hora de cerca de 0,298 2(0,0061)(10) = 0,176 ou 17,6 centavos de
dlar. E assim por diante.
Quando o coeficiente de x positivo e o coeficiente de x 2 negativo, a funo quadrtica tem um
formato parablico. Sempre existe um valor positivo de x, no qual o efeito de x sobre y zero; antes
desse ponto, x tem um efeito positivo sobre y; aps esse ponto, x tem um efeito negativo sobre y. Na
prtica, pode ser importante saber onde fica esse ponto crtico.
Na equao estimada (6.10) com /3, > 0 e / ? 2 < 0, esse ponto crtico (ou o mximo da funo)
sempre alcanado na relao entre o coeficiente de x e duas vezes o valor absoluto do coeficiente de x~:

x* = |/8 ,/(2 0 2)|. (6.13)

No exemplo dos salrios, x* = exper* 0,298/(2(0,0061)] ~ 24,4. (Observe como simplesmente


eliminamos o sinal de menos em 0,0061 ao fazermos esse clculo.) Esta relao quadrtica est ilus
trada na Figura 6 .1.
Na equao dos salrios (6.12), o retomo da experincia passa a ser zero por volta dos 24,4 anos.
0 que devemos concluir disso? Existem, pelo menos, trs explicaes possveis. Primeiro, pode ser que
poucas pessoas na amostra tenham mais de 24 anos de experincia, e assim a parte da curva direita
de 24 pode ser ignorada. A consequncia de se usar uma funo quadrtica para capturar efeitos decres
centes que a partir de certo ponto ela acabar fazendo um movimento inverso. Se esse ponto estiver
alm de uma pequena percentagem das pessoas na amostra, isso no ser motivo para grande preocu
pao. Mas no conjunto de dados do arquivo WAGE1.RAW, cerca de 28% das pessoas na amostra tm
mais de 24 anos de experincia; essa uma percentagem alta demais para se ignorar.
E possvel que o retorno de exper realmente se tome negativo em algum ponto, mas difcil acre
ditar que isso acontea aos 24 anos de experincia. Uma possibilidade mais provvel que o efeito
estimado de exper sobre salrioh seja viesado, por no termos controlado outros fatores ou porque a
relao funcional entre salrioh e exper na equao (6 .12) no est totalmente correta. O Problema
6.9 pede que voc explore essa possibilidade controlando a educao, alm de usar log(salrioh)
como a varivel dependente.
184 Introduo Econometria - Editora Thomson

Figura 6.1___________________________
Relao quadrtica entre salnoh e expei.

Quando um modelo tem uma varivel dependente na forma logartmica e uma varivel explicati
va como uma funo quadrtica, necessrio certo cuidado para fazer uma boa interpretao. O exem
plo seguinte tambm mostra que a funo quadrtica pode ter um formato em U, em vez de uma forma
parablica. A forma em U surge na equao (6.10) quando 0 t negativo e /32 positivo; isso captura
um efeito crescente de x sobre y.

EXEMPLO 6.2
(Efeitos da Poluio sobre os Preos dos Imveis)
Modificamos o modelo dos preos dos imveis do Exemplo 4.5 para incluir um termo quadrtico em comods:

log (p re o ) = /30 + /3, log(oxn) + (32 lo g (d is t) + (3 3 c o m o d s


(6.14)
+ /34 c o m o d s 2 + )S5 ra z e s tu d + u.

0 modelo estimado utilizando os dados contidos no arquivo HPRICE2.RAW

log(preo) = 13,39 0,902 log(ojcn) 0,087 \og(dist)

(0,57) (0,115) (0,043)


Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 185

EXEMPLO 6.2 (continuao)

0,545 comods + 0,062 comods' 0,48 razestud

(0,165) (0,013) (0,006)

n = 506, R2 = 0,603.

0 termo quadrtico comods2 tem uma estatstica t em torno de 4,77 e, portanto, estatisticamente bastan
te significante. Mas o que possvel afirmar sobre a interpretao do efeito de comods sobre log(preo)?
Inicialmente, o efeito parece ser estranho. Como o coeficiente de comods negativo e o coeficiente de
comods2 positivo, a equao literalmente sugere que, com valores baixos de comods, um cmodo adicio
nal tem um efeito negativo sobre log(preo). Em algum ponto, o efeito se torna positivo, e a forma quadr
tica significa que a semi-elasticidade de preo em relao a comods cresce na mesma proporo do cresci
mento de comods. Esta situao mostrada na Figura 6.2.
Obtemos o valor do ponto crtico de comods usando a equao (6.13) (embora /3, seja negativo e
p 2 seja positivo). O valor absoluto do coeficiente de comods, 0,545, dividido pelo dobro do coeficiente de
comods2, 0,062, resulta em com ods* = 0,545/(2(0,062)] ~ 4,4; este ponto est marcado na Figura 6.2.

Figura 6.2__________________________________
log (preo) como uma funo quadrtica de comods.

log(preo)

4,4 cm odos
186 Introduo Econometria Editora Thomson

EXEMPLO 6.2 (continuao)


Ser que podemos acreditar que se iniciarmos com trs cmodos e aumentarmos para quatro isso efeti
vamente reduzir o valor esperado do imvel? Provavelmente no. Acontece que somente cinco das 506 comu
nidades na amostra possuem imveis com mdia de 4,4 cmodos ou menos, cerca de 1% da amostragem. Isso
to pequeno que a funo quadrtica esquerda de 4,4 pode, para fins prticos, ser ignorada. direita de
4,4, vemos que a adio de outro cmodo tem um efeito crescente na mudana percentual no preo:

Alog(preo) ~ {[0,545 + 2(0,062)]comods} Acomods

e assim

%Apreo ~ 100{[0,545 + 2(0,062)]comods]Acomods

= (54,5 + 12,Acomods) Acomods.

Portanto, um aumento em comods, digamos de cinco para seis, aumenta o preo em aproximadamente
-5 4 ,5 + 12,4(5) = 7,5%; o aumento de seis para sete aumenta o preo em aproximadamente -5 4 ,5 +
12,4(6) = 19,9%. Esse um efeito crescente bastante forte.

Existem muitas outras possibilidades de usar funes quadrticas juntamente com logaritmos. Por
exemplo, uma extenso de (6.14) que permita uma elasticidade no-constante entre preo e oxn

log (preo) = /30 + j8,log (oxn) + (32[\og(oxn)]2


+ fi3crime + (34 comods + P5comods2 + /36 razestud + u. t

Se f32 = 0, f { ser a elasticidade do preo em relao a oxn. Caso contrrio, essa elasticidade
depender do nvel de oxn. Para verificar isso, podemos combinar os argumentos dos efeitos parciais
nos modelos quadrtico e logartmico para mostrar que

%Apreo ~ [ t + 2 2\og(oxn)]%Aoxn: (6.16)

portanto, a elasticidade do preo em relao a oxn f3\ + 2/3 Aog( oxn), de forma que ela depende de
log (oxn).
Finalmente, outros termos polinomiais podem ser includos nos modelos de regresso. Certa
mente a funo quadrtica vista com mais freqncia, mas um termo cbico ou at de quarta potn
cia aparece de vez em quando. Uma forma funcional frequentemente razovel de uma funo de custo
total

custo = 0 + quantidade + 2quantidade2 + ^quantidade2 + u.

No complicado estimar este modelo. A interpretao dos parmetros mais trabalhosa (embo
ra objetiva com o uso de clculo infinitesimal); no estudaremos este modelo com mais detalhes.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 187

Modelos com Termos de Interao


Algumas vezes, natural que o efeito parcial, a elasticidade, ou a semi-elasticidade da varivel
dependente, em relao a uma varivel explicativa, dependa da magnitude de outra varivel explicati
va. Por exemplo, no modelo

preo = (i{) + (ipirquad + fi2qtdorm + (i^irquad qtdorm + (jianhos + u,

o efeito parcial de qtdorm sobre preo (mantendo fixas todas as outras variveis)

= fi2 + fi^rquad. (6.17J

Se / ? 3 > 0, (6.17) sugere que um quarto a mais produz um aumento maior no preo dos imveis maio
res. Em outras palavras, existe um efeito de interao entre a rea do imvel e o nmero de quartos.
Ao resumirmos o efeito de qtdorm sobre preo, devemos avaliar (6.17) quanto aos valores de interes
se de arquad, como o valor mdio, ou os quartis inferior ou superior na amostra. Se /33 zero ou no,
algo que podemos verificar facilmente.
Pode ser complicado interpretar os parmetros das variveis originais quando inclumos um termo
de interao. Por exemplo, na equao anterior sobre preos de imveis, a equao (6.17) mostra que /32
o efeito de qtdorms sobre preo para um preo com zero de rea construda! Esse efeito, obviamente,
no muito interessante. Em vez disso, devemos ser cuidadosos ao inserirmos valores de interesse da
rea do imvel, como o valor mdio ou a mediana da amostra, na verso estimada da equao (6.17).
Freqentemente, vantajoso reparametrizar um modelo para que os coeficientes das variveis ori
ginais tenham significados interessantes. Considere um modelo com duas variveis explicativas e uma
interao:

y = jSo + P \ x i + p2x 2 + P?P\X 2 + U.

Como acabamos de mencionar, f32 o efeito parcial de x 2 quando x, = 0. Muitas vezes, isso no
de interesse. Em vez disso, podemos reparametrizar o modelo como

y = o + S ,x , + 82x 2 + /33(x, - fL i)(x 2 - n 2) + u,

onde /jl] a mdia populacional de x, e p.2 a mdia populacional de x2. Podemos facilmente ver
que agora o coeficiente de x2, 2, o efeito parcial de x2 sobre y no valor mdio de x ,. (Multiplicando
a interao na segunda equao e comparando os coeficientes, podemos mostrar com facilidade que
2 = j8 2 + O parmetro 8 j tem uma interpretao semelhante.) Portanto, se subtrairmos as
mdias das variveis na prtica, elas seriam, tipicamente, as mdias da amostra antes de criar
mos o termo de interao, os coeficientes das variveis originais tero uma interpretao til. E mais,
obteremos imediatamente os erros-padro dos efeitos parciais ao nvel dos valores mdios. Nada nos
impede de substituir /x, ou pt2 por outros valores das variveis explicativas que possam ser de interesse.
0 exemplo seguinte ilustra como podemos usar os termos de interao.
188 Introduo Econometria Editora Thomson

EXEMPLO 6.3
(Efeitos da Freqncia Escolar no Desempenho de Exames Finais)
Um modelo para explicar o resultado padronizado de um exame final (respad) em termos da taxa de fre-
qncia escolar, da nota mdia anterior* ao curso superior at o penltimo semestre, e da nota do teste de
avaliao de conhecimentos para ingresso em curso superior

respad = / 30 + ffaxafreq + (i2nmgradp + [33tac 4- 4nmgradp2


+ (3fac2 + fipimgradp taxafreq + u.

(Utilizamos o resultado padronizado do exame pelos motivos discutidos na Seo 6.1: mais fcil interpretar o
desempenho de um aluno em relao ao restante da classe.) Alm dos termos quadrticos em n m g ra d p e tac,
este modelo inclui uma interao entre n m g ra d p e taxafreq. A idia que a freqncia s aulas pode ter um
efeito diferente nos alunos que tiveram desempenhos diferentes no passado, como medido por nmgradp.
Estamos interessados nos efeitos da freqncia sobre as notas do exame final: A re s p a d IA ta x a fre q = /S, +
f i 6nm gradp.
Usando as 680 observaes do arquivo ATTEND.RAW para estudantes da rea de economia, a equa
o estimada

respad = 2,05 0,0067 taxafreq 1,63 nmgradp 0,128 tac


(1,36) (0,0102) (0,48) (0,098)

+ 0,296 nmgradp2 + 0,0045 tac2 + 0,0056 nmgradp taxafreq (6.19)


(0,101) (0,0022) (0,0043)

n = 680, R2 = 0,229, R2 = 0,222.

Devemos interpretar essa equao com extremo cuidado. Se simplesmente olharmos o coeficiente de
taxa freq , concluiremos de forma errnea que a freqncia tem um efeito negativo na nota do exame final.
Porm, esse coeficiente supostamente mede o efeito quando n m g ra d p = 0, o que no interessante (nessa
amostra, a menor nota mdia do ensino mdio cerca de 0,86). Tambm devemos ter cuidado para no exa
minarmos separadamente as estimativas de y3, e /36 e concluirmos que, como cada estatstica t no signi-
ficante, no podemos rejeitar H0: /3, = 0, /36 = 0. Alis, o p-valor do teste Fdessa hiptese conjunta 0,014,
de modo que com certeza rejeitamos H0 ao nvel de 5%. Este um bom exemplo de como o exame em sepa
rado de estatsticas t, quando estamos testando uma hiptese conjunta, pode nos levar a equvocos.
Como devemos estimar o efeito parcial de ta x a fre q sobre re s p a d l Devemos inserir valores de interes
se de n m g ra d p para obter o efeito parcial. O valor mdio de n m g ra d p na amostra 2,59, de modo que
nesse valor mdio o efeito de taxa fre q sobre re spa d -0 ,0 0 6 7 + 0,0056(2,59) ~ 0,0078. Qual o signi
ficado disso? Como taxa freq medida como um percentual, isso significa que um aumento de dez pontos
percentuais em ta x a fre q aumenta respad em 0,078 desvios-padro da nota mdia do exame final.
Como podemos dizer se a estimativa 0,0078 estatisticamente diferente de zero? Temos que compu
tar novamente a regresso, substituindo n m g r a d p ta x a fre q por (n m g ra d p - 2,59) -ta x a fre q . Isso pro
duz, como o novo coeficiente de taxafreq, o efeito estimado quando n m g ra d p = 2,59, juntamente com
seu erro-padro; nada mais alterado na regresso. (Descrevemos esse mecanismo na Seo 4.4.) A execu
o dessa nova regresso fornece o erro-padro de /3n + /36(2,59) = 0,0078 como 0,0026, o que produz
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 189

EXEMPLO 6.3 (continuao)


t = 0,0078/0,026 = 3. Portanto, na nmgradp mdia, conclumos que a taxa de freqncia s aulas tem um
efeito positivo estatisticamente significante nas notas do exame final.
ainda mais complicado encontrar o efeito de nmgradp sobre respad, devido ao termo quadrtico
nmgradp2. Para encontrar o efeito no valor mdio de nmgradp e na taxa mdia de freqncia, 0,82, subs
titumos nm gradp2 por (nmgradp - 2,59)2 e nmgradp taxafreq por nmgradp (taxafreq - 0,82). O coe
ficiente de nmgradp se tornar o efeito parcial nos valores mdios e obteremos seu erro-padro. (Veja o
Problema 6.14.)

Se adicionarmos o termo fSjtac-taxafreq equao (6.18), qual ser o efeito parcial de taxafreq sobre respadl

6.3 UM POUCO MAIS SOBRE O GRAU DE AJUSTE E A SELEO DE


REGRESSORES
At agora, no dedicamos muita ateno ao tamanho do R 2 na avaliao de nossos modelos de regres
so, porque estudantes iniciantes tendem a colocar muito peso no P-quadrado. Como em breve vere
mos, a seleo de um conjunto de variveis explicativas com base no tamanho do /{-quadrado pode
levar a modelos absurdos. No Captulo 10 descobriremos que /{-quadrados obtidos de regresses de
sries temporais podem ser artificialmente altos e podem resultar em concluses enganosas.
Nada nas hipteses do modelo linear clssico exige que o R2 esteja acima de qualquer valor em
particular; o R 2 simplesmente uma estimativa do quanto da variao em y explicado por x ,, x2, ...,
xk na populao. Vimos vrias regresses que tinham /^-quadrados bastante pequenos. Embora isso sig
nifique que no tenhamos avaliado vrios fatores que afetam y, isso no quer dizer que os fatores em
u sejam correlacionados com as variveis independentes. A hiptese de mdia condicional zero RLM.3
a que determina se obteremos estimadores no-viesados dos efeitos ceteris paribus das variveis
independentes, e o tamanho do P-quadrado no tem influncia direta nisso.
Um /{-quadrado pequeno sugere que a varincia do erro grande em relao varincia de v, o
que significa que podemos ter muito trabalho para estimar /S, com preciso. Porm, lembre-se: vimos
na Seo 3.4 que uma varincia grande do erro pode ser compensada por uma amostra de tamanho
grande: se tivermos dados suficientes, podemos ter condies de estimar com preciso os efeitos par
ciais, mesmo que no tenhamos controlado muitos dos fatores no-observados. Se podemos ou no
obter estimativas suficientemente precisas, depende da aplicao que estamos pesquisando. Por exem
plo, suponha que alguns alunos ingressantes de uma grande universidade recebam, aleatoriamente,
subsdios para a compra de computadores. Se o montante do subsdio for determinado de forma real
mente aleatria, podemos estimar o efeito ceteris paribus do montante do subsdio sobre a nota de
aproveitamento dos alunos, com o uso de uma anlise de regresso simples. (Devido atribuio alea
tria, todos os outros fatores que afetam a nota de aproveitamento seriam no-correlacionados com o
montante do subsdio.) Parece provvel que o montante de subsdio explique pouco da variao na nota
de aproveitamento, de modo que o /{-quadrado de tal regresso provavelmente ser muito pequeno.
Mas se tivermos uma amostra de grande tamanho, ainda poderemos ter condies de obter uma esti
mativa razoavelmente precisa do efeito do subsdio.
190 Introduo Econometria Editora Thomson

Lembre-se, porm, de que a mudana relativa no //-quadrado, quando variveis so adicionadas


equao, muito til: a estatstica F em (4.41) para testar a significncia conjunta depende de forma
crucial da diferena nos //-quadrados entre o modelo sem restries e o modelo restrito.

O R- Quadrado Ajustado
A maioria dos programas economtricos registra, juntamente com o //-quadrado, uma estatstica
chamada R -quadrado ajustado. Como o //-quadrado ajustado descrito em muitos trabalhos aplica
dos, e como ele tem algumas caractersticas teis, trataremos dele nesta subseo.
Para verificar como o //-quadrado usual pode ser ajustado, til escrev-lo como

R 2 = 1 - (SQR/)/(SQT/), (6.20)

onde SQR a soma dos resduos quadrados e SQT a soma dos quadrados total; comparada com a
equao (3.28), tudo o que fizemos foi dividir tanto SQR como SQT por n. Essa expresso revela o que
R2 est realmente estimando. Defina a 2 como a varincia populacional de y e faa com que cr2, repre
sente a varincia populacional do termo erro, u. (At agora temos usado cr para representar cr, mas e'
vantajoso ser mais especfico neste caso.) O //-quadrado da populao definido como 1 cr2/ cr.,2;
essa a proporo da variao em y na populao explicada pelas variveis independentes. Isso o que,
supostamente, R2 deve estar estimando.
O R~ estima cr por SQR/, que sabemos ser viesado. Ento, por que no substituir SQR/ por
SQR/Li k 1)? Alm disso, podemos usar SQT/( 1) em lugar de SQT/, j que o primeiro o
estimador no-viesado de cr2. Usando esses estimadores, chegamos ao //-quadrado ajustado:

R 2 = 1 - [SQR/( - k - l)]/[SQT/( - 1)] ( 2 .


= 1 - -2/[SQT/( - 1)], 1 1

j que cr2 = SQR/(n k 1). Devido notao usada para representar o //-quadrado ajustado, ele ,
algumas vezes, chamado de R-barra-quadrado.
O //-quadrado ajustado algumas vezes chamado de R-quadrado corrigido, mas esse no um
bom nome, pois sugere que / / 2 de alguma forma melhor que R2 como um estimador do //-quadrado
da populao. Infelizmente, R2 no reconhecido, de forma geral, como um melhor estimador. ten
tador imaginar que R2 corrige o vis de R2 na estimativa do //-quadrado da populao, mas ele no
faz isso: a razo de dois estimadores no-viesados no um estimador no-viesado.
O ponto mais atraente do R2 que ele impe uma penalidade incluso de variveis independentes
adicionais em um modelo. Sabemos que R2 nunca pode diminuir quando uma nova varivel indepen
dente includa em uma equao de regresso: isso ocorre porque SQR nunca aumenta (e normal
mente diminui) quando novas variveis independentes so adicionadas. Mas a frmula do R2 mostra
que ele depende explicitamente de k, o nmero de variveis independentes. Se uma varivel indepen
dente for adicionada a uma regresso, SQR diminui, mas o mesmo acontece com os gl na regresso,
k 1. Portanto, SQR/( k 1) pode aumentar ou diminuir quando uma nova varivel indepen
dente adicionada a uma regresso.
Um fato algbrico interessante o seguinte: se adicionarmos uma nova varivel independente a uma
equao de regresso, R 2 aumenta se, e somente se, a estatstica t da nova varivel for maior que um
em valor absoluto. (Uma extenso disto que R2 aumenta quando um grupo de variveis adicionado
a uma regresso se, e somente se, a estatstica F da significncia conjunta das novas variveis for maior
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 191

que a unidade.) Assim, vemos imediatamente que usar o R2 para decidir se determinada varivel inde
pendente (ou conjunto de variveis) pertence a um modelo nos fornece uma resposta diferente daque
las fornecidas pelos testes usuais t ou F (j que uma estatstica t ou F igual unidade no estatistica
mente significante aos nveis tradicionais de significncia).
Algumas vezes til termos uma frmula do R2 em termos de R~. A lgebra simples mostra que

R2 = 1 - d - R2)(n - l)/(n - k - 1 ). ( 6 .22 )

Por exemplo, se R2 = 0,30, n 51, e k = 10, ento R2 = 1 0,70(50)/40 = 0,125. Assim, para
n pequeno e k grande, R2 pode estar substancialmente abaixo de R2. De fato, se o /f-quadrado normal
for pequeno, e n k 1 for pequeno, R2 pode, na realidade, ser negativo! Por exemplo, podemos con
siderar/ ? 2 = 0,10, n = 51, e k = 10 para verificar que R2 = 0,125. Um R2 negativo indica uma adap
tao muito pobre do modelo relativamente ao nmero de graus de liberdade.
O /?-quadrado_ajustado algumas vezes descrito junto com o /?-quadrado habitual ernregresses,
e algumas vezes o R 2 descrito em lugar do R2. importante^lembrar que o R2, e no o R2, que apa
rece na estatstica F em (4.41). A mesma frmula com R2 e R2r no vlida.

0 Uso do A -quadrado Ajustado para a Escolha entre Modelos


No-Aninhados
Na Seo 4.5 aprendemos como calcular uma estatstica F para testar a significncia conjunta de
um grupo de variveis; isso nos possibilita decidir, em um nvel particular de significncia, se pelo
menos uma varivel no grupo afeta a varivel dependente. Esse teste no nos permite decidir qual das
variveis tem um efeito. Em alguns casos, queremos escolher um modelo sem variveis independentes
redundantes, e o /?-quadrado ajustado pode nos ajudar nessa tarefa.
No exemplo dos salrios dos jogadores da principal liga de beisebol na Seo 4.5, vimos que nem
hrunano nem rebrunano eram individualmente significantes. Essas duas variveis so altamente cor
relacionadas, de modo que podemos querer optar entre os modelos

log (salrio) = j30 + (i^anos + (i^ogosano 4- fi^rebmed + fijirunano + u

log (salrio) = /30 + ( i ,anos + p 2jogosano + fiq-ebmed + fi4rebrunano + u.

Esses dois exemplos so modelos no-aninhados, pois nenhuma equao um caso especial da
outra. A estatstica F, que estudamos no Captulo 4, nos permite testar somente modelos aninhados:
um modelo (o modelo restrito) um caso especial do outro modelo (o modelo sem restries). Veja
as equaes (4.32) e (4.28) para exemplos dos modelos restritos e sem restries. Uma possibilidade
criar um modelo combinado que contenha todas as variveis explicativas dos modelos originais e depois
testar cada modelo contra o modelo geral usando o teste F. O problema deste processo que ambos os
modelos podero ser rejeitados, ou nenhum modelo poder ser rejeitado (como acontece com o exemplo
dos salrios dos jogadores da principal liga de beisebol na Seo 4.5). Assim, esse processo nem sem
pre fornece uma maneira de fazermos a distino entre modelos com regressores no-aninhados.
192 Introduo Econometria Editora Thomson

_Na regresso dos salrios dos jogadores de beisebol, o R2 da regresso contendo hrunano 0,6211
e o R2 da regresso contendo rebrunano 0,6226. Portanto, com base no R-quadrado ajustado, existe
uma preferncia muito pequena para o modelo com rebrunano. Mas a diferena, na prtica, muito
pequena, e podemos obter uma resposta diferente controlando algumas das variveis no Problema 4.16.
(Como ambos os modelos no-aninhados contm cinco parmetros, o R-quadrado habitual pode ser
usado para fornecer a mesma concluso.)
A comparao dos R2 para optarmos entre os diferentes conjuntos no-aninhados de variveis
independentes pode ser de grande valia quando essas variveis representam formas funcionais diferen
tes. Considere dois modelos relacionando a intensidade de P&D s vendas de uma empresa:

pdintens = fi( + (3 llog( vendas) + u. (6.23)

pdintens = f3n + (31vendas + [2vendas 2 + u. (6.24)

O primeiro modelo captura um rendimento decrescente pela incluso de vendas na forma logart
mica; o segundo modelo faz isso com o uso de um termo quadrtico. Assim, o segundo modelo con
tm um parmetro a mais que o primeiro.
Quando as equaes so estimadas usando as 32 observaes das empresas de produtos qumicos
do arquivo RDCHEM.RAW, o R2 0,061, e o R2 da equao (6.24) 0,148. Portanto, parece que a
funo quadrtica faz um ajuste muito melhor. Mas uma comparao dos R-quadrados habituais com
o primeiro modelo injusta, porque ele contm um parmetro a menos que a equao (6.24). Isto ,
(6.23) um modelo mais parcimonioso que (6.24).
Tudo o mais igual, modelos mais simples so melhores. Como o R-quadrado habitual no penali
za modelos mais complicados, melhor usar o R2. O R2 de (6.23) 0,030, enquanto o R2 de (6.24)
0,090. Portanto, mesmo depois dos ajustes das diferenas nos graus de liberdade, o modelo quadrti
co o melhor. O modelo quadrtico tambm o preferido quando margens de lucro so includas em
cada regresso. _
Existe uma limitao importante no uso do R2 para escolher entre modelos no-aninhados: no
podemos us-lo para a escolha entre diferentes formas funcionais da varivel dependente. Isso uma
pena, pois muitas vezes queremos saber se y ou log( v) (ou talvez alguma outra transformao) deve ser
usada como a varivel dependente com base no grau de ajuste. Mas nem o R2 nem o R2 podem ser usa
dos para esse fim. A razo simples: esses R-quadrados medem a proporo explicada do total da va
riao de qualquer varivel dependente que estejamos usando na regresso, e diferentes funes da
varivel dependente tero diferentes montantes de variao a ser explicadas. Por exemplo, as variaes
totais em y e log(y) no so as mesmas. A comparao dos R-quadrados ajustados dessas regresses
com essas diferentes formas das variveis dependentes no nos d nenhuma informao sobre qual
modelo se adapta melhor; eles estimam duas variveis dependentes separadas.

Explique por que escolher um modelo maximizando R2 ou minimizando (o erro-padro da regresso) a


mesma coisa.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 193

EXEMPLO 6.4
(Remunerao de Diretores Executivos e Desempenho de Empresas)
Considere dois modelos estimados relacionando a remunerao de diretores executivos ao desempenho de
empresas:

salrio = 830,63 + 0,0163 vendas + 19,63 rma


(223,90) (0,0089) (11,08) (6.25)
n = 209, R 2 = 0,029, R2 = 0,20

Isalrio = 4,36 + 0,275 Ivendas + 0,0179 rma


(0,29) (0,033) (0,0040) (6.26)
n = 209, R2 = 0,282, R2 = 0,275,

onde rma o retorno das aes, discutido no Captulo 2. Para simplificar, Isalrio e Ivendas representam os
logs naturais de salrio e vendas. J sabemos como interpretar essas diferentes equaes estimadas. Mas
podemos dizer se um modelo ajusta os dados melhor que o outro?
0 /?-quadrado da equao (6.25) mostra que vendas e rma explicam somente cerca de 2,9% da variao
do salrio dos diretores executivos na amostra. Tanto vendas como rma tm significncia estatstica marginal.
A equao (6.26) mostra que log(i/endas) e rma explicam cerca de 28,2% da variao do log(salrio).
Em termos de grau de ajuste, esse ff-quadrado bem mais alto parece sugerir que o modelo (6.26)
bem melhor, mas esse no necessariamente o caso. A soma dos quadrados total de salrio na amostra
391.732.982, enquanto a soma dos quadrados total de log(salrio) somente 66,72. Assim, h muito
menos variao em \og{salrio) que precisa ser explicada.
Neste ponto, podemos usar outros recursos alm do R2 e do R2 para optar entre esses modelos. Por
exemplo, log(vendas) e rma so muito mais significantes, estatisticamente, em (6.26) do que so vendas e
rma em (6.25), e os coeficientes em (6.26) provavelmente so de maior interesse. Para termos certeza,
porm, precisaremos fazer uma comparao vlida dos graus de ajuste.

Na Seo 6.4 forneceremos um indicador que efetivamente nos permita comparar modelos nos
quais y aparece tanto na forma em nvel como na forma logartmica.

0 Controle de m uitos Fatores na Anlise de R egresso


Em muitos dos exemplos que tratamos, e certamente em nossa discusso sobre o vis de variveis
omitidas no Captulo 3, temos nos preocupado com a omisso de fatores importantes em modelos que
possam estar correlacionados com as variveis independentes. Tambm possvel controlarmos gran
de quantidade de variveis em uma anlise de regresso.
Se enfatizarmos exageradamente o grau de ajuste, estaremos nos propondo a controlar fatores em
um modelo de regresso que no deveriam ser controlados. Para evitar este equvoco, precisamos nos
lembrar da interpretao ceteris paribus de modelos de regresso mltipla.
194 Introduo Econometria - Editora Thomson

Para ilustrar esse problema, suponha que estejamos fazendo um estudo para avaliar o impacto dos
impostos estaduais sobre a cerveja em acidentes fatais de trnsito. A idia que um imposto mais ele
vado sobre a cerveja reduzir o consumo de bebidas alcolicas e, da mesma forma, o hbito de dirigir
sob embriaguez, resultando em menos acidentes fatais de trnsito. Para medirmos o efeito ceteris pari-
bus dos impostos sobre esses acidentes, podemos modelar fatalidades como uma funo de diversos
fatores, inclusive o imposto sobre a cerveja:

fatalidades = /30 + (3, imposto + jpnilhas + p 3percmasc + f34perc 16 21 + ...,

onde milhas o total de milhas dirigidas, percmasc a percentagem masculina da populao do


Estado, e percl6_21 a percentagem da populao entre 16 e 21 anos de idade, e assim por diante.
Observe que no inclumos uma varivel medindo o consumo per capita de cerveja. Estaremos come
tendo um erro de variveis omitidas? A resposta no. Se controlarmos o consumo de cerveja nessa
equao, de que forma o imposto sobre cerveja afetar as fatalidades no trnsito? Na equao

fatalidades = (30 + f3\imposto + f32conscerv + ...,

/31 mede a diferena nas fatalidades devido ao aumento de um ponto percentual no imposto, mantendo
conscerv lixo. E difcil de entender por que isso seria de interesse. No deveramos controlar as diferen
as de conscerv entre os Estados, a menos que quisssemos verificar algum tipo de efeito indireto do
imposto sobre a cerveja. Outros fatores, como a distribuio por sexo e idade, deveriam ser controlados.
A questo de decidir se devemos ou no controlar certos fatores nem sempre bem definida. Por
exemplo, Betts (1995) estuda o efeito da qualidade do ensino mdio sobre a renda subseqente. Ele
salienta que, se qualidade melhor de ensino resulta em mais educao, ento controlar a educao na
regresso juntamente com avaliao da qualidade subestimar o retomo da qualidade. Betts faz a an
lise com e sem anos de escolaridade na equao para obter uma gama de efeitos estimados da qualidade
de ensino.
Para verificar claramente como a nfase em /^-quadrados altos pode criar problemas, considere o
exemplo do preo dos imveis da Seo 4.5 que ilustra a verificao de mltiplas hipteses. Naquele
caso, queramos verificar a racionalidade da avaliao dos preos dos imveis. Fizemos a regresso de
log(preo) sobre log(ava/), \og(tamterr), \ogiarquad), e qtdorm e verificamos se as trs ltimas variveis
tinham coeficientes populacionais zero enquanto \og(aval) tinha um coeficiente unitrio. Entretanto, se
quisermos estimar um modelo de preo hednico, como no Exemplo 4.8, onde os valores marginais de
vrias caractersticas dos imveis so obtidos? Devemos incluir log(aval) na equao? O /^-quadrado
ajustado da regresso com \og{aval) 0,762, enquanto o 7?-quadrado ajustado sem ele 0,630. Com
base somente no grau de ajuste, devemos incluir log(avaZ). Contudo, isso ser incorreto se nossa meta
for determinar os efeitos do tamanho da propriedade, rea construda e nmero de quartos nos valores
dos imveis. A incluso de log(aval) na equao equivale a manter um indicador de valor fixo e indagar
quanto a adio de um quarto alterar outro indicador de valor. Essa medida no faz sentido na avalia
o das caractersticas dos imveis.
Se lembrarmos que modelos diferentes servem a propsitos diferentes, e nos concentrarmos na inter
pretao ceteris paribus da regresso, no incluiremos os fatores errados em um modelo de regresso.

A Adio de R egressores para Reduzir a Varincia do Erro


Acabamos de ver alguns exemplos nos quais certas variveis independentes no devem ser inclu
das em um modelo de regresso, mesmo que elas sejam correlacionadas com a varivel dependente.
Do Captulo 3, sabemos que a adio de uma nova varivel independente em uma regresso pode exa
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 195

cerbar o problema da multicolinearidade. De outro lado, como estamos retirando algo do termo erro, a
adio de uma varivel geralmente reduz a varincia do erro. De forma geral, no podemos saber que
efeito ser dominante.
Porm, h um caso que bvio: devemos sempre incluir variveis independentes que afetem y e
que sejam no-correlacionadas com todas as variveis independentes de interesse. A razo para esta
incluso simples: a adio dessa varivel no induz multicolinearidade na populao (e, portanto, a
multicolinearidade na amostra deve ser desprezvel), mas reduzir a varincia do erro. Em amostras de
tamanho grande, os erros-padro de todos os estimadores MQO sero reduzidos.
Como exemplo, considere estimar a demanda individual por cerveja como uma funo do preo
mdio da cerveja no municpio. Pode ser razovel assumir que as caractersticas individuais sejam no-
correlacionadas com os preos em nvel de municpios, e assim uma regresso simples do consumo de
cerveja sobre o preo nos municpios seria suficiente para estimar o efeito do preo sobre a demanda
individual. Entretanto, possvel obter uma estimativa mais precisa da elasticidade-preo da demanda por
cerveja com a incluso de caractersticas individuais, como a idade e o grau de escolaridade. Se esses
fatores afetarem a demanda e forem no-correlacionados com o preo, o erro-padro do coeficiente do
preo ser menor, pelo menos em amostras grandes.
Como segundo exemplo, considere o subsdio para equipamentos de computao dado no incio
da Seo 6.3. Se, alm da varivel do subsdio, controlarmos outros fatores que possam explicar a nota
mdia em curso superior, poderemos provavelmente conseguir uma estimativa mais precisa do efeito
do subsdio. Variveis indicadoras da nota mdia no ensino mdio, a classificao da instituio, as
pontuaes sat e tac e os antecedentes familiares so bons candidatos. Como os montantes do subsdio
so determinados aleatoriamente, todas as variveis de controle adicionais sero no-correlacionadas
com o montante de subsdio; nessa amostra, a multicolinearidade entre o montante do subsdio e as
outras variveis independentes deve ser mnima. Porm, a adio de controles extras pode reduzir sig-
nificantemente a varincia do erro, conduzindo a uma estimativa mais precisa do efeito do subsdio.
Lembre-se, neste caso, de que o problema no a inexistncia de vis: obteremos um estimador no-
viesado e consistente, quer incluamos ou no as variveis de desempenho no ensino mdio e de antece
dentes familiares. O problema est na obteno de um estimador com uma menor varincia amostrai.
Infelizmente, casos em que temos informaes sobre as variveis explicativas adicionais que
sejam no-correlacionadas com as variveis explicativas de interesse so raros no campo das cincias
sociais. Porm, vale a pena lembrar que, quando essas variveis esto disponveis, elas podero ser
includas em um modelo para reduzir a varincia do erro sem induzir multicolinearidade.

6.4 PREVISO E ANLISE DE RESDUOS


No Captulo 3 definimos os valores previstos ou estimados do MQO e os resduos do MQO. As
previses certamente so teis, mas esto sujeitas variao amostrai, j que elas so obtidas com o
uso dos estimadores MQO. Assim, nesta seo, mostramos como obter intervalos de confiana de pre
vises da linha de regresso MQO.
Sabemos, dos captulos 3 e 4, que os resduos so usados para obter a soma dos resduos quadra
dos e o /?-quadrado, de modo que eles so importantes para o grau de ajuste e os testes de hipteses.
Algumas vezes, os economistas estudam os resduos de uma observao especfica para obter
informaes sobre os indivduos (ou empresas, imveis etc.) na amostra.

Intervalos de Confiana de Previses


Suponha que tenhamos estimado a equao
196 Introduo Econometria Editora Thomson

y a ^ \ x \ ~^$2X2~^~ k x k' (6.27)

Quando inserimos valores especficos das variveis independentes nessa equao, obtemos uma pre
viso de y, que uma estimativa do valor esperado de y, dados os valores especficos das variveis
explicativas. Para enfatizar, sejam c,, c2, ck valores particulares de cada uma das k variveis inde
pendentes; elas podero ou no corresponder a um ponto efetivo dos dados em nossa amostra. O par
metro que gostaramos de estimar

60 = o + 01C1 + lC2 + - + fk (6.28)


= E(y tje, = c ,,x 2 = c2, ...,xk = ck).

O estimador de 0 O

0 = 0 + l Cl + l C2 + - + kCf (6.29)

Na prtica, isso fcil de ser computado. Entretanto, se o que quisermos for um indicador da
incerteza nesse valor previsto? natural construir um intervalo de confiana de 0 Oque seja centrado
em 60.
Para obter um intervalo de confiana de 0Oprecisamos de um erro-padro de 0O. Ento, com
um grande gl, poderemos construir um intervalo de confiana de 95% utilizando a regra prtica
0O 2 ep(<?(l). (Como sempre, podemos usar os percentis exatos em uma distribuio t.)
Como obtemos o erro-padro de 0O? Este o mesmo problema que encontramos na Seo 4.4:
precisamos obter um erro-padro de uma combinao linear dos estimadores MQO. Aqui, o problema
ainda mais complicado, pois todos os estimadores MQO geralmente aparecem em 0O(a menos que
algum Cj seja zero). No entanto, o mesmo truque que usamos na Seo 4.4 funcionar aqui. Escreva
/30 = 60 - /3,c, ... - fkck e agregue isso equao

y - P o + /3 1-^1 + + PkXk + u

para obter

y = e0 + P 1( X - c,) 4- j3 2(x , - c2) + ... + f3k(xk - ct) + u. (6.30)

Em outras palavras, subtramos o valor c; de cada observao de x;, e depois computamos a regres
so de

yi sobre (xn - c ,) ,..., (xik - ck), i = 1 , 2 ,..., n. (8.31)

O valor previsto em (6.29) e, mais importante, seu erro-padro, so obtidos do intercepto (ou
constante) na regresso (6.31).
Como exemplo, obtemos um intervalo de confiana de uma previso a partir de uma regresso de
nota mdia em curso superior, das quais usamos informaes do ensino mdio.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 197

EXEMPLO 6.5
(Intervalo de Confiana de nmgrad Previsto)
Utilizando os dados contidos no arquivo GPA2.RAW, obtemos a seguinte equao para prever n m g ra d :

nmgrad = 1,493 + 0,00149 sat 0,01386 emperc


(0,075) (0,00007) (0,00056)

0,06088 tamclas + 0,00546 tamclas2 (6.32)


(0,1650) (0,00227)

n = 4.137, R 2 = 0,278, R 2 = 0,277, = 0,560,

onde apresentamos as estimativas com vrias casas decimais para reduzir o erro de arredondamento. Qual
a previso de n m g ra d quando s a t = 1.200, e m p e rc = 30 e tam clas = 5 (o que significaria 500)? Isso
fcil de ser obtido, incorporando esses valores na equao (6.32): n m g fa d = 2,70 (arredondado para duas
casas decimais). Infelizmente, no podemos usar diretamente a equao (6.32) para obter um intervalo
de confiana da n m g ra d esperada com os valores dados das variveis independentes. Uma maneira simples de
obter um intervalo de confiana definir um novo conjunto de variveis independentes: satO = sat - 1.200,
empercO = e m p e rc - 30, tam dasO = tam clas - 5 e tam d a sq u a d O = tam clas2 - 25. Quando fazemos
a regresso de n m g ra d sobre essas novas variveis independentes, obtemos

nmgrad = 2,700 + 0,00149 satO 0,01386 empercO


(0,020) (0,00007) (0,00056)
0,06088 tamclasO + 0,00546 tamclasquadO
(0,1650) (0,00227)

n = 4.137, R 2 = 0,278, R 2 = 0,277, = 0,560.

A nica diferena entre esta regresso e aquela em (6.32) o intercepto, que a previso que quere
mos, juntamente com seu erro-padro, 0,020. No por acidente que os coeficientes de inclinao, seus
erros-padro, /?-quadrado etc. so os mesmos de antes; esse fato fornece uma maneira de verificarmos se
foram feitas as transformaes adequadas. Podemos construir com facilidade um intervalo de confiana de
95% da nota mdia esperada: 2,70 1,96(0,020) ou em torno de 2,66 a 2,74. Este intervalo de confian
a suficientemente estreito devido ao tamanho bastante grande da amostra.

Como a varincia do estimador do intercepto a menor quando cada varivel explicativa tem
mdia amostrai zero (veja a Questo 2.5 para o caso da regresso simples), segue da regresso em
(6.31) que a varincia da previso nos valores mdios de x-t (isto , c; = x, para todo j) a menor. Este
resultado no to surpreendente, j que o ponto de maior confiabilidade em nossa linha de regresso
est prximo ao centro dos dados. Na medida em que os valores de c; se afastam de .v;, Var( y) se toma
cada vez maior.
O mtodo anteriof nos possibilita colocar um intervalo de confiana em tomo da estimativa MQO
de E(j>jx|, ..., xf ) para quaisquer valores das variveis explicativas. Em outras palavras, obtemos um
198 Introduo Econometria Editora Thomson

intervalo de confiana do valor mdio de y da subpopulao com determinado conjunto de covariadas.


Entretanto, um intervalo de confiana da mdia pessoal na subpopulao no a mesma coisa que um
intervalo de confiana de uma unidade particular (indivduo, famlia, empresa etc.) da populao. Na
formao de um intervalo de confiana de um resultado desconhecido de y, devemos avaliar outra fonte
muito importante de variao: a varincia no erro no observado, que registra nosso desconhecimento
dos fatores no observados que afetam y.
Seja y o valor para o qual gostaramos de construir um intervalo de confiana, que algumas vezes
chamamos de intervalo de previso. Por exemplo, y poderia representar uma pessoa ou uma empre
sa que no esteja em nossa amostra original. Faamos x ... , x k serem os novos valores das variveis
independentes, que assumimos observar, e u ser o erro no observado. Portanto, temos

/ = j30 + p rf + p2x2+ ... + pkxk + u. {6.33)

Como antes, nossa melhor previso de y o valor esperado de _y, dadas as variveis explicativas
que estimamos da linha de regresso MQO: y0 = 0 Q+ 0 t x + 0 2x2 + + Pi O erro de previ
so com o uso de v para prever y

? = y - y = ( P0+ PA + - + Pk4) + - 5>- (6 .3 4 )

Agora, E( v) = E (0 O) + E (0 l )xl + E (0 2)x2 + ... + E (0 k)xk = (3n + /3,*',1 + ... + /3kxk, porque
os 0, so no-viesados. (Como antes, essas expectativas so todas condicionais aos valores amostrais
das variveis independentes.) Como u tem mdia zero, E() = 0. Mostramos que o erro de previso
esperado zero.
Ao encontrar a varincia de , observe que u no-correlacionado com cada 0., porque m no-
correlacionado com os erros na amostra usada para a obteno de /3 . Pelas propriedades bsicas da
covarincia (veja Apndice B, no site da Thomson), u e y so no-correlacionados. Portanto, a va
rincia do erro de previso (condicional a todos os valores das variveis independentes includas na
amostra) a soma das varincias:

Vari0) = Var(y) + Var() = Var(>) + cr2, (6.35)

onde cr2 = Var() a varincia do erro. Existem duas fontes de varincia em . A primeira o erro de
amostragem em y, que surge por termos estimado /3r Como cada 0j tem uma varincia proporcional a
1In, na qual n o tamanho da amostra, Var(v) proporcional a Mn. Isso significa que, para amostras
grandes, Var( v ) pode ser muito pequena. Em contraposio, <r2 a varincia do erro na populao; ela
no muda com o tamanho da amostra. Em muitos exemplos, cr2 ser o termo dominante em (6.35).
Sob as hipteses do modelo linear clssico, /3; e u so normalmente distribudos, e assim tam
bm normalmente distribudo (condicional a todos os valores amostrais das variveis explicativas).
Anteriormente, descrevemos como obter um estimador ne-viesado de Var(_y), e obtivemos nosso esti-
mador no-viesado de cr2 no Captulo 3. Com o uso desses estimadores, podemos definir o erro-padro
de como
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 199

ep() = (fep(v)l2 + 2f \ (6.36)

Utilizando o mesmo raciocnio para as estatsticas t de /3., /ep(") tem uma distribuio t com
n (k + 1) graus de liberdade. Portanto,

P [-o ,<>25 - /ep() < f0023] = 0,95,

onde t0 025 o 97,5 percentil na distribuio Para n - k - 1 grande, lembre-se de que /n 02s 5=5
1,96. Inserindo = y y e fazendo a reordenao, obtemos um intervalo de previso de 95% para v:

>'" f0,025 eP(y (6.37)

como sempre, exceto para gl pequeno, uma boa regra prtica y 2ep("). Isso mais amplo que o
prprio intervalo de confiana de y, devido a 2 em (6.36); normalmente ela muito mais ampla para
refletir os fatores em w que no tenhamos controlado.

EXEMPLO 6.6
(Intervalo de Confiana de Notas Mdias Futuras)
Suponha que desejamos um IC de 95% de n m g ra d futuro de um aluno do ensino mdio com s a t = 1.200,
emperc = 30 e tam clas = 5. No Exemplo 6.5 obtivemos um intervalo de confiana de 95% da m dia da
nota mdia entre todos os alunos com as caractersticas particulares s a t = 1.200, e m p e rc = 30 e tam clas
= 5. Agora, queremos um intervalo de confiana de 95% de qualquer aluno que e sp e cifica m e n te tenha
essas caractersticas. 0 intervalo de previso de 95% deve registrar a variao na caracterstica individual,
no-observada, que afeta o desempenho universitrio. Temos tudo que preciso para obter um IC de
nmgrad. Sabemos que ep(y) = 0,020 e & = 0,560 e, portanto, de (6,36), ep() = [(0,020)2 +
(0,560)2]1/2 ~ 0,560. Observe o quanto ep(y) pequeno em relao a & : virtualmente, toda a variao em
vem da variao em u. O IC de 95% 2,70 1,96(0,560) ou est entre 1,60 e 3,80. Este um inter
valo de confiana enorme, e mostra que, com base nos fatores que inclumos na regresso, no podemos
definir com clareza a futura nota de graduao de determinado indivduo. (Em certo sentido, isso bom, por
significar que a classificao no curso mdio e o desempenho no teste de aptido acadmica no predeter
minam o desempenho de algum na faculdade.) Evidentemente, as caractersticas no observadas variam
amplamente de um indivduo para o outro com as mesmas notas no teste de aptido acadmica e na clas
sificao no curso mdio observadas.

Anlise de Resduos
Algumas vezes, til examinar as observaes individuais para verificar se o valor efetivo da
varivel dependente est acima ou abaixo do valor previsto; isto , examinar os resduos das observa
es individuais. Este processo chamado anlise de resduos. Os economistas so conhecidos por
examinarem os resduos de uma regresso para auxili-los, por exemplo, na compra de um imvel.
200 Introduo Econometria Editora Thomson

O exemplo seguinte sobre preos de imveis ilustra a anlise de resduos. Os preos dos imveis
esto relacionados a vrias caractersticas observadas do imvel. Podemos relacionar todas as carac
tersticas que julgarmos importantes, como tamanho, nmero de quartos, nmero de banheiros, e
assim por diante. Podemos usar uma amostra de imveis para estimar o relacionamento entre o preo
e as caractersticas, e terminamos obtendo um valor previsto e um valor real de cada imvel. Ento,
podemos construir os resduos, uj = v, yr O imvel com o maior resduo negativo , pelo menos
com base nos fatores que estamos controlando, o mais barato em relao s suas caractersticas
observadas. claro que um preo de venda substancialmente inferior ao seu preo previsto poderia
indicar alguma caracterstica indesejvel do imvel que deixamos de avaliar, e que portanto est con
tido no erro no-observado. Alm da obteno da previso e do resduo, tambm faz sentido computar
o intervalo de confiana de qual seria o preo de venda do imvel no futuro, utilizando o mtodo
descrito na equao (6.37).
Utilizando os dados contidos no arquivo HPRICE1.RAW, computamos a regresso de preo sobre
tamterr, arquade qtdorm. Na amostra de 88 imveis, o resduo mais negativo 120,206, do 8 Ia im
vel. Portanto, o preo pedido por esse imvel est US$120.206,00 abaixo de seu preo previsto.
Existem muitos outros usos da anlise de resduos. Uma maneira de classificar as faculdades de
direito fazer a regresso da mediana dos salrios iniciais sobre uma variedade de caractersticas dos
alunos (como a mediana das notas de ingresso nos cursos para novos alunos, a mediana das notas
mdias de graduao para novos alunos etc.) e obter um valor previsto e um resduo de cada faculdade
de direito. A faculdade de direito com o maior resduo ter o maior valor agregado previsto. (Natu
ralmente, ainda existir muita incerteza sobre como o salrio inicial de um indivduo se compararia
com a mediana geral de uma faculdade de direito.) Esses resduos podero ser usados juntamente com
mensalidades cobradas pelas faculdades de direito para determinarmos o valor mais vantajoso; isso exi
gir um desconto apropriado dos ganhos futuros.
A anlise de resduos tambm tem participao em decises judiciais. Um artigo publicado no jor
nal The New York Times intitulado Juiz Diz que Pobreza de Alunos, e No a Segregao, Prejudica
Aproveitamento Escolar (28.06.95) descreve um importante processo legal. A questo era se o fraco
desempenho nos exames padronizados do Distrito Escolar de Hartford, em relao ao desempenho nos
distritos vizinhos, era devido baixa qualidade de ensino nas escolas altamente segregadas. O juiz con
cluiu que a disparidade nas notas de aproveitamento escolar no indica que Hartford esteja fazendo
um trabalho inadequado ou insuficiente na educao de seus alunos ou que suas escolas sejam defi
cientes, pois as notas de aproveitamento previstas com base em relevantes fatores socioeconmicos
esto prximas dos nveis esperados. Esta concluso foi, quase com certeza, baseada em uma anlise
de regresso das notas de aproveitamento mdias ou de suas medianas sobre as caractersticas socioe-
conmicas de vrios distritos escolares de Connecticut. A concluso do juiz sugere que, considerando
o nvel de pobreza dos alunos das escolas de Hartford, as notas de aproveitamento efetivas dos alunos
eram semelhantes s previstas em uma anlise de regresso: o resduo de Hartford no era suficiente
mente negativo para se concluir que as escolas em si mesmas eram responsveis pelas baixas notas de
aproveitamento escolar.


Como voc poderia usar a anlise de resduos para determinar quais atores cinematogrficos so remunera- >
dos em nveis acima da bilheteria dos filmes em que atuam? j

Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 201

Previso de y quando a Varivel D ependente log(y)


Como a transformao do log natural usada com tanta frequncia na varivel dependente em
economia emprica, dedicamos esta subseo ao problema de prognosticar y quando a varivel depen
dente logj). Como um subproduto, obteremos um indicador de grau de ajuste do modelo log que
possa ser comparado com o R-quadrado do modelo em nvel.
Para obter uma previso til definirmos logy = log(y); isso reala o fato de que o log de y que
ser previsto no modelo

logy = 0 + yxi + 2x2 + - + kXk + u. (6.38)

Nesta equao os xf podero ser transformaes de outras variveis; por exemplo, poderamos ter
X, = log(vendas), x2 = log (valmerc), x2 = permceo no exemplo do salrio dos diretores executivos.
Dados os estimadores MQO, sabemos como prever logy para qualquer valor das variveis inde
pendentes:

lgy = Q + y X ] + 2x2 + ... + kxk. (6.39)

Agora, como o exponencial desfaz o log, nossa primeira suposio para prever y simples
mente exponenciar o valor previsto de log(y): v = exp(lgy). Isso no funciona; alis, isso sistemati
camente subestimar o valor esperado de y. De fato, se o modelo (6.38) obedecer s hipteses do
modelo linear clssico RLM .l at RLM.6, pode ser demonstrado que

E (j|x ) = exp(cr/2) expQ3 + j8,x, + 2x2 + ... + kxk)

onde x representa as variveis independentes e cr2 a varincia de u. [Se u ~ Normal(0,cr2), o valor


esperado de exp(w) ser exp(<r2/2)|. Esta equao mostra que um ajuste simples necessrio para pre
vermos y:

v = exp(cr2/2)exp(lgy), (6.40)

onde cr2 simplesmente o estimador no-viesado de cr2. Como \ o erro-padro da regresso, sem
pre conhecido, a obteno de valores previstos de y ser fcil. Como <x2 > 0, exp(2/2) > 1. Para um
2 grande, esse fator de ajuste poder ser substancialmente maior que a unidade.
A previso em (6.40) no no-viesada, mas consistente. No existem previses no-viesadas
de y, e em muitos casos (6.40) funciona bem. Porm, ela depende da normalidade do termo erro, u.
No Captulo 5, mostramos que o MQO possui propriedades desejveis, mesmo quando u no for nor
malmente distribudo. Portanto, vantajoso ter uma previso que no dependa da normalidade. Se
simplesmente assumirmos que u independente das variveis explicativas, teremos

ECy|jr) = a0exp(j80 + y x t + 2x2 + ... + kxk), (6.41)

onde a0 o valor esperado de exp(n), que deve ser maior que a unidade.
202 Introduo Econometria Editora Thomson

Dada uma estimativa de 0, podemos prever v como

y = 0 exp (lgy), (6.42)

que mais uma vez simplesmente requer que faamos a exponenciao do valor previsto do modelo log
e que multipliquemos o resultado por 0.
O resultado que um estimador consistente de 0 facilmente obtido.

PREVISO DE y QUANDO A V A R I V EL DEPENDENTE LOG(y):


(i) Obtenha os valores estimados l g y da regresso de logy sobre a ,..... xk.
(ii) Para cada observao i, crie m( = exp {lgy,).
(iii) Agora, faa a regresso de y sobre a varivel nica m sem um intercepto; isto , faa uma
regresso simples passando pela origem. O coeficiente de m, o nico coeficiente que existe,
a estimativa de a 0.
Quando 0 for obtido, ele poder ser usado juntamente com previses de logy para prever y. Os
passos so os seguintes:
(i) Para valores dados de x t, x 2, .... xk, obtenha lgy de (6.39).
(ii) Obtenha a previso de y de (6.42).

EXEMPLO 6.7
(Previso de Salrios de Diretores Executivos)
0 modelo de interesse
log {salrio) = /80 + /3,log {vendas) + (i2\og(valmerc) + /32permceo + u,

de forma que ^ e /32 so elasticidades e 100 /S3 uma semi-elasticidade. A equao estimada utilizando
os dados contidos no arquivo CE0SAL2.RAW

Isario = 4,504 + 0,163 Ivendas + 0,109 Ivalmerc + 0,0117 permceo


(0,257) (0,039) (0,050) (0,0053) |6.43)
n = 177, R 2 = 0,318,

onde, para maior clareza, Isario representa o log de sal rio e, de forma semelhante, Ivendas e Ivalmerc
representam o log de vendas e valm erc. A seguir, obtemos rh, = exp(lslrio-) de cada observao na amos
tra. A regresso de salrio sobre m (sem uma constante) produz 0 = 1,117.
Podemos usar esse valor de 0 juntamente com (6.43) para prever salrio de qualquer valor de vendas, val
m e rc e p e rm c e o . Encontremos a previso de vendas = 5.000 (que significa 5 bilhes de dlares, j que
vendas est em milhes de dlares), valm erc = 10.000 (10 bilhes de dlares), e p e rm ce o = 10. Da equa
o (6.43), a previso de Isario 4,504 + 0,163 log(5.000) + 0,109 - log( 10.000) + 0,0117(10) = 7,013.
0 salrio previsto , portanto, 1,117- exp(7,013) = 1.240,967, ou 1.240.967 dlares. Se esquecermos de
multiplicar por 0 = 1,117, obteremos uma previso de 1.110.983 dlares.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 203

Podemos usar o mtodo anterior de obter previses para determinar o quanto o modelo com log(y)
como varivel dependente explica bem a varivel y. J temos indicadores para modelos quando v a
varivel dependente: o P-quadrado e o P-quadrado ajustado. O objetivo encontrar um bom indicador
de grau de ajuste no modelo logCv) que possa ser comparado com um /?-quadrado de um modelo no
qual y a varivel dependente.
Existem vrias maneiras de encontrarmos esse indicador, mas apresentamos um mtodo que
fcil de ser implementado. Aps computar a regresso de y sobre m passando pela origem no passo
(iii), obtemos os valores estimados dessa regresso, = 0m.. Em seguida, encontramos a correlao
amostrai entre yt e o verdadeiro na amostra. O quadrado dessa correlao amostrai pode ser compa
rado com o /?-quadrado que obtemos com o uso de v como a varivel dependente em um modelo de
regresso linear. Lembre-se de que o P-quadrado na equao estimada

y = P0 + /M i + - + /V *

exatamente a correlao quadrada entre yt e v, (veja a Seo 3.2).

EXEMPLO 6.8
(Previso de Salrios de Diretores Executivos)
Aps o passo (iii) no procedimento precedente, obtemos os valores estimados salrio = 0m,. A correlao
simples entre salrio, e salrio na amostra 0,493; o quadrado desse valor est por volta de 0,243. Esse
o nosso indicador de quanto da variao de salrio explicada pelo modelo log; no se trata do ^-quadra
do de (6.43), que 0,318.
Suponha que estimemos um modelo com todas as variveis em nvel:

salrio = /30 + ( i , vendas + f32valmerc + fi3permceo + u.

0 /?-quadrado obtido estimando esse modelo, usando as mesmas 177 observaes, 0,201. Assim, o modelo
log explica mais da variao em salrio, e assim o nosso preferido com base no grau de ajuste. 0
modelo log tambm o escolhido porque parece ser mais realista e seus parmetros so mais fceis de ser
interpretados.

Neste captulo, tratamos de alguns tpicos importantes sobre a anlise de regresso mltipla.
A Seo 6.1 mostrou que uma mudana nas unidades de medida de uma varivel independente
altera o coeficiente do MQO da maneira esperada: se x- for multiplicado por c, seu coeficiente ser
dividido por c. Se a varivel dependente multiplicada por c, todos os coeficientes de MQO so mul
tiplicados por c. Nem a estatstica t nem a F so alteradas pela mudana das unidades de medida de
quaisquer variveis.
Discutimos os coeficientes beta, que medem os efeitos das variveis independentes sobre a vari
vel dependente em unidades de desvios-padro. Os coeficientes beta so obtidos de uma regresso
204 Introduo Econometria Editora Thomson

MQO padro depois de as variveis dependente e independentes terem sido transformadas em valores
padronizados.
Como vimos em vrios exemplos, a forma funcional logartmica produz coeficientes com inter
pretaes de efeitos percentuais. Comentamos sobre suas vantagens adicionais na Seo 6.2. Tambm
vimos como computar o efeito percentual exato quando um coeficiente em um modelo log-nvel
grande. Modelos com termos quadrticos consideram efeitos marginais decrescentes ou crescentes.
Modelos com interaes possibilitam que o efeito marginal de uma varivel explicativa dependa do
nvel de outra varivel explicativa. _
Introduzimos o -quadrado ajustado, R2, como uma alternativa ao /Cquadrado habitual para medir
o grau de ajuste. Enquanto o R2 nunca pode cair quando outra varivel adicionada na regresso, o R2
penaliza o nmero de regressores e pode cair quando uma varivel independente adicionada. Isso faz
do R2 o preferido para a opo entre modelos no-aninhados com diferentes quantidades de variveis
explicativas. Nem o R2 nem o R2 podem ser usados para comparar modelos com variveis dependen
tes diferentes. No entanto, bastante fcil obter indicadores de graus de ajuste para optarmos entre y e
log( v) como a varivel dependente, como mostrado na Seo 6.4.
Na Seo 6.3 discutimos o problema de certa forma sutil de dependermos demasiadamente do R2
ou do R2 para chegarmos a um modelo final: possvel controlarmos grandes quantidades de fatores
em um modelo de regresso. Por essa razo, importante pensar frente sobre a especificao de
modelos, particularmente sobre a natureza ceteris paribus da equao de regresso mltipla. Variveis
explicativas que afetem y e sejam no-correlacionadas com todas as outras variveis explicativas
podem ser usadas para reduzir a varincia do erro sem induzir multicolinearidade.
Na Seo 6.4 demonstramos como obter um intervalo de confiana de uma previso feita de uma
linha de regresso MQO. Tambm mostramos como um intervalo de confiana pode ser construdo
para um valor futuro e desconhecido de y.
Ocasionalmente, queremos prever y quando log( v) usado como a varivel dependente em um
modelo de regresso. A Seo 6.4 explica esse mtodo simples. Finalmente, algumas vezes estamos
interessados em conhecer o sinal e a magnitude dos resduos de observaes especficas. A anlise de
resduos pode ser usada para determinarmos se elementos especficos da amostra possuem valores pre
vistos que estejam bem acima, ou bem abaixo, dos verdadeiros resultados.

6.1 A seguinte equao foi estimada utilizando os dados contidos no arquivo CEOSAL1.RAW:

log (salrio) = 4,322 + 0,276 log(vendas) + 0,0215 rma 0,00008 rma2


(0,324) (0,33) (0,129) (0,00026)

n = 209, R2 = 0,282.

Esta equao permite que rma tenha um efeito decrescente sobre log (salrio). Essa generalidade
necessria? Justifique.
6.2 Sejam /30, /,, ..., as estimativas MQO da regresso de y, sobre xn , ..., xik, i = 1, 2,..., n. Para
constantes diferentes de zero c u ..., ck, argumente que o intercepto e as inclinaes MQO da regresso
de coy, sobre c xxn , ..., c&ik, i = 1, 2,..., n so dados por /3() = cn f}Q, /3, = (c,/c,) jS,,..., /3( = (c/c*)
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 205

k. (Sugesto: Use o fato de que /3 soluciona as condies de primeira ordem em (3.13), e que .
deve solucionar as condies de primeira ordem envolvendo as variveis dependente e independen
tes redimensionadas.)
6.3 Utilizando os dados contidos no arquivo RDCHEM.RAW, a seguinte equao foi obtida por
MQO:

pdihtens = 2,613 + 0,00030 vendas - 0,0000000070 vendas2


(0,429) (0,00014) (0,0000000037)

n = 32, R2 = 0,1484.

(i) Em que ponto o efeito marginal de vendas sobre pdintens se toma negativo?
(ii) Voc manteria o termo quadrtico no modelo? Explique.
(iii) Defina vendasbil como vendas expressas em bilhes de dlares: vendasbil = vendas!1.000.
Reescreva a equao com vendasbil e vendasbil2 como as variveis independentes.
Certifique-se de descrever os erros-padro e o R-quadrado. [Sugesto: Observe que ven
dasbil2 = vendas2!{1.000)2.]
(iv) Com o propsito de descrever os resultados, qual equao voc prefere?
6.4 O seguinte modelo permite que o retomo da educao dependa da educao total dos pais, cha
mada edupais:

log(salrio) = /30 + /3,educ + /32 educ edupais + fi^exper + fi^perm + u.

(i) Mostre que, em forma decimal, o retomo de mais um ano de educao nesse modelo

A\og( salrio)/Aeduc = /3, + /32edupais.

Que sinal voc espera para j i / l Por qu?


(ii) Utilizando os dados contidos no arquivo WAGE2.RAW, a equao estimada

logCsalrio) = 5,65 + 0,047 educ + 0,00078 educ-edupais +


(0,13) (0,010) (0,00021)
0,019 exper + 0,010 perm
(0,004) (0,003)

n = 722, R2 = 0,169.

(Somente 722 observaes contm todas as informaes sobre a educao dos pais.)
Interprete o coeficiente do termo de interao. Pode ser interessante escolher dois valores
especficos para edupais, por exemplo, edupais = 32 se ambos tiverem educao superior,
ou edupais = 24 se ambos tiverem educao de nvel mdio e comparar o retomo esti
mado de educ.
206 Introduo Econometria Editora Thomson

(iii) Quando edupais adicionada como uma varivel separada na equao, obtemos:

log(salrio) = 4,94 + 0,097 educ + 0,033 edupais + 0,0016 ed u c edupais


(0,38) (0,027) (0,017) (0,0012)
+ 0,020 exper + 0,010 perm
(0,004) (0,003)
n = 722, R2 = 0,174.

O retomo da educao agora depende positivamente da educao dos pais? Teste a hip
tese nula de que o retomo da educao no depende da educao dos pais.
6.5 No Exemplo 4.2, no qual a percentagem de alunos aprovados em um exame de matemtica
do 10" ano (matelO) a varivel dependente, faz sentido incluir cienll a percentagem de alunos do
11" ano aprovados em um exame de cincias como uma varivel explicativa adicional?
6.6 Quando taxafreq2 e tactaxafreq so adicionadas equao (6.19), o ft-quadrado passa a ser
0,232. Esses termos adicionais so conjuntamente significantes no nvel de 10%? Voc os incluiria
no modelo?
6.7 As trs seguintes equaes foram estimadas utilizando-se as 1,534 observaes contidas no
arquivo 401K.RAW.

txap = 80,29 + 5,44 taxcomp + 0,269 idade 0,00013 totemp


(0,78) (0,52) (0,045) (0,00004)

R2 = 0,100, R2 = 0,098.

txap = 97,32 + 5,02 taxcomp + 0,314 idade 2,66 log (totemp)


(1,95) (0,51) (0,044) (0,28)

R2 = 0,144, R2 = 0,142.

txap = 80,62 + 5,34 taxcomp + 0,290 idade 0,00043 totemp


(0,78) (0,52) (0,045) (0,00009)

+ 0,0000000039 totemp2
( 0 , 0000000010)

R2 = 0,108, R2 = 0,106.
Qual desses trs modelos voc prefere? Por qu?

Você também pode gostar