de Corte Transversal
parte 1 do texto aborda a anlise de regresso com dados de corte transversal. Ela se apia na
lgebra estudada nos cursos superiores e em conceitos bsicos de probabilidade e estatstica.
Os Apndices A, B e C contm revises completas sobre esses tpicos.
O Captulo 2 tem incio com o modelo de regresso linear simples, no qual explicamos uma varivel
em termos de outra. Embora a regresso simples no seja amplamente usada em econometria aplica
da, ela utilizada ocasionalmente e serve como um ponto de partida natural, pois sua lgebra e suas
interpretaes so relativamente simples.
Os captulos 3 e 4 cobrem os fundamentos da anlise de regresso mltipla, em que permitimos
que mais variveis afetem a varivel que estamos tentando explicar. A regresso mltipla ainda o
mtodo mais geralmente usado na pesquisa emprica, de modo que esses captulos merecem ateno
cuidadosa. O captulo 3 enfatiza a lgebra do mtodo de mnimos quadrados ordinrios (MQO), esta
belecendo ainda as condies necessrias para que os estimadores MQO sejam no-viesados e tambm
os melhores estimadores lineares no-viesados. O Captulo 4 trata do importante tpico da inferncia
estatstica.
O Captulo 5 discute as propriedades referentes s amostras grandes, ou assintticas, dos esti
madores MQO. Essa discusso oferece a justificativa para os procedimentos de inferncia do Captulo 4
quando os erros em um modelo de regresso no so normalmente distribudos. O captulo 6 cobre
alguns tpicos adicionais da anlise de regresso, incluindo questes avanadas sobre forma funcional,
transformao dos dados, previso e grau de ajuste da estimao. O Captulo 7 explica como a infor
mao qualitativa pode ser incorporada em modelos de regresso mltipla.
O Captulo 8 ilustra como testar e corrigir o problema da heteroscedasticidade, ou varincia no-
constante, no termo erro. Mostramos como as estatsticas MQO usuais podem ser ajustadas e tambm
apresentamos uma extenso do mtodo MQO, conhecida como mtodo dos mnimos quadrados pon
derados, que explica diretamente as diferentes varincias dos erros. O Captulo 9 explora o importante
problema da correlao entre o termo erro e uma ou mais das variveis explicativas. Demonstramos
como a utilizao de uma varivel proxy pode resolver o problema de variveis omitidas.
Adicionalmente, determinamos o vis e a inconsistncia dos estimadores MQO na presena de certos
tipos de erros de medida nas variveis. Diversos problemas de tratamento dos dados so tambm dis
cutidos, incluindo o problema dos outliers.
0 Modelo de Regresso Simples
modelo de regresso simples pode ser usado para estudar a relao entre duas variveis. Por
razes que veremos adiante, o modelo de regresso simples tem limitaes enquanto ferramenta
geral para a anlise emprica. No entanto, s vezes ele apropriado como ferramenta emprica.
Aprender como interpretar o modelo de regresso simples uma boa prtica para estudar a regresso
mltipla, o que faremos nos captulos subseqentes.
Grande parte da anlise economtrica comea com a seguinte premissa: y e x so duas variveis, repre
sentando alguma populao, e estamos interessados em explicar y em termos de x, ou em estudar
como y varia com variaes em x. Discutimos alguns exemplos no Captulo 1, incluindo: y a produ
o de soja, e x, a quantidade de fertilizantes; y o salrio-hora, e x, anos de educao; e y uma taxa
de criminalidade em uma comunidade, e x, o nmero de policiais.
Ao escrever um modelo que explicar y em termos de x, defrontamo-nos com trs questes.
Primeira, como nunca h uma relao exata entre duas variveis, como consideramos outros fatores
que afetam y? Segunda, qual a relao funcional entre y e x? E terceira, como podemos estar certos
de que estamos capturando uma relao ceteris paribus entre y e x (se esse for um objetivo desejado)?
Podemos resolver essas ambigidades escrevendo uma equao que relaciona y a x. Uma equao
simples
y = Po + Pix + u. (2.1)
A equao (2.1), que supostamente vlida para a populao de interesse, define o modelo de regres
so linear simples. Ela tambm chamada modelo de regresso linear de duas variveis ou modelo
de regresso linear bivariada, pois relaciona as duas variveis x e y. Vamos discutir, agora, o signifi
cado de cada uma das quantidades em (2.1). (A propsito, o termo regresso tem origens que no so
especialmente importantes para muitas das aplicaes economtricas modernas, de modo que no
o explicaremos aqui. Veja Stigler (1986) para uma histria interessante da anlise de regresso.)
Quando relacionadas por (2.1), as variveis y e x tm vrios nomes diferentes, os quais so inter-
cambiveis, como explicado em seguida, y chamada a varivel dependente, a varivel explicada,
a varivel de resposta, a varivel prevista, ou o regressando, x chamada a varivel independen
te, a varivel explicativa, a varivel de controle, a varivel previsora, ou o regressor. (O termo
20
Wooldridge Captulo 2 O Modelo de Regresso Simples 21
covarivel tambm usado para x.) Os termos varivel dependente e varivel independente so
usados com freqncia em econometria. Mas esteja consciente de que o nome independente no se
refere aqui noo estatstica de independncia entre variveis aleatrias (veja Apndice B, dispon
vel na pgina do livro, no site www.thomsonleaming.com.br).
Os termos variveis explicada e explicativa so, provavelmente, os mais descritivos.
Resposta e controle so muito usados nas cincias experimentais, em que a varivel x est sob o
controle do pesquisador. No usaremos os termos varivel prevista e previsora, embora algumas
vezes voc os veja no texto. Nossa terminologia para a regresso simples est resumida na Tabela 2.1.
Tabela 2,1_____________________________________________________________________________
Terminologia para a Regresso Simples
y X
Regressando Regressor
A varivel u, chamada de termo erro ou perturbao da relao, representa outros fatores, alm
de x, que afetam y. Uma anlise de regresso simples trata, efetivamente, todos os fatores, alm de a,
que afetam) como no-observados. Voc pode pensar em u, convenientemente, como representando o
no-observado.
A equao (2.1) tambm trata da questo da relao funcional entre y e x. Se os outros fatores em u
so mantidos fixos, de modo que a variao em u zero, An = 0, ento x tem um efeito linear sobre v:
Ay = /3,Ax se An = 0. (2.2)
Assim, a variao em y , simplesmente, /3, multiplicado pela variao em x.ilsso significa que 1, o
parmetro de inclinao da relao entre y e x, mantendo fixos os outros faW es em ; ele de inte
resse fundamental em economia aplicada. O parmetro de intercepto /30 tambm tm seus usos,
embora ele raramente seja central para uma anlise.
EXEMPLO 2.1
(Produo de Soja e Fertilizantes)
Suponha que a produo de soja seja determinada pelo modelo
EXEMPLO 2.2
(Uma Equao Simples do Salrio)
Um modelo que relaciona o salrio de uma pessoa educao observada e outros fatores no-observados
Se sal rio h medido em dlares por hora e e d u c corresponde a anos de educao formal, y3, mede a varia
o no salrio-hora dado um ano a mais de educao, mantendo todos os outros fatores fixos. Alguns des
ses fatores incluem experincia da fora de trabalho, aptido inata, permanncia com o empregador atual,
tica no trabalho e inumerveis outras coisas.
A linearidade de (2.1) implica que uma variao de uma unidade em * tem o mesmo efeito sobre
y, independentemente do valor inicial de x. Isso irrealista para muitas aplicaes econmicas. Por
exemplo, no salrio-educao, poderamos querer considerar retornos crescentes: o prximo ano de
educao teria, em relao ao anterior, um efeito maior sobre os salrios. Veremos como considerar
tais possibilidades na Seo 2.4.
A questo mais difcil saber se o modelo (2.1) realmente nos permite tirar concluses ceteris
paribus sobre como x afeta y. Acabamos de ver, na equao (2.2), que /3, mede, de fato, o efeito de x
sobre y, mantendo todos os outros fatores (em u) fixos. Encerra-se com isso a questo da causalidade?
Infelizmente, no. Como podemos esperar aprender algo, em geral, sobre o efeito ceteris paribus de x
sobre y, mantendo outros fatores fixos, quando estamos ignorando todos aqueles outros fatores?
A Seo 2.5 mostrar que somos capazes de obter estimadores confiveis de p 0 e p t de uma amos
tra aleatria de dados somente quando fazemos uma hiptese que restrinja a maneira de como o termo
no-observvel u est relacionado varivel explicativa x. Sem tal restrio, no seremos capazes de
estimar o efeito ceteris paribus, /?,. Como u e x so variveis aleatrias, precisamos de um conceito
baseado em probabilidade.
Antes de expormos a hiptese crucial de como x e u so relacionados, podemos sempre fazer uma
hiptese sobre u. Se o intercepto /30 est includo na equao, nada se perde ao assumir que o valor
mdio de u na populao zero.
Matematicamente,
E (w) = 0. (2.5)
Wooldridge Captulo 2 O Modelo de Regresso Simples 23
A hiptese (2.5) no diz nada sobre a relao entre w e x; ela simplesmente faz uma afirmao sobre a
distribuio dos fatores no-observveis na populao. Usando os exemplos anteriores como ilustra
o, podemos ver que a hiptese (2.5) no muito restritiva. No Exemplo 2.1, no perdemos nada ao
normalizar os fatores no-observveis que afetam a produo de soja, tal como a qualidade da terra,
para ter uma mdia zero na populao de todos os lotes cultivados. O mesmo verdadeiro para os fato
res no-observveis do Exemplo 2.2. Sem perda de generalidade, podemos assumir que coisas como a
mdia da aptido so zero na populao de todas as pessoas que trabalham. Se voc no est conven
cido, pode trabalhar com o Problema 2.2 para ver que podemos sempre redefinir o intercepto na equa
o (2.1) para tomar (2.5) verdadeiro.
Agora, vamos voltar hiptese crucial concernente u e x como so relacionados. Uma medida
natural de associao entre duas variveis aleatrias o coeficiente de correlao. (Veja Apndice B,
disponvel no site da Thomson, para definio e propriedades.) Se u e x so no-correlacionados, logo,
enquanto variveis aleatrias, no so linearmente relacionados. Assumir que u e x so no-relaciona-
dos requer um caminho longo para definir o sentido em que u c x deveriam ser no-correlacionados na
equao (2.1). Mas isso no vai longe o suficiente, pois a correlao mede somente a dependncia
linear entre u e x. A correlao tem uma caracterstica algo contra-intuitiva: possvel que u seja no-
correlacionado com x e seja correlacionado com funes de x, tal como x2. (Veja Seo B.4 para uma
discusso adicional.) Essa possibilidade no aceitvel para muitos propsitos da regresso, visto que
causa problemas para interpretar o modelo e para derivar propriedades estatsticas. Uma hiptese
melhor envolve o valor esperado de u, dado x.
Como u e x so variveis aleatrias, podemos definir a distribuio condicional de u, dado qual
quer valor de x. Em particular, para qualquer x, podemos obter o valor esperado (ou mdio) de u para
aquela fatia da populao descrita pelo valor de x. A hiptese crucial que o valor mdio de u no
depende do valor de x. Podemos escrever isso como
em que a segunda igualdade resulta de (2.5). A primeira igualdade na equao (2.6) a hiptese nova.
Ela diz que, para qualquer valor de x, a mdia dos fatores no-observveis a mesma e, portanto, deve
igualar-se ao valor mdio de u na populao. Quando combinamos a primeira igualdade da equao
(2.6) com a hiptese (2.5), obtemos a hiptese de mdia condicional zero.
Vamos ver o que (2.6) acarreta ao exemplo do salrio. Para simplificar a discusso, assuma que
u seja o mesmo que aptido inata. Ento, (2.6) requer que o nvel mdio de aptido seja o mesmo,
independentemente dos anos de educao formal. Por exemplo, se E(aptido\%) representa a aptido
mdia para o grupo de todas as pessoas com oito anos de educao formal, e E(aptido]l6) repre
senta a aptido mdia entre pessoas na populao com 16 anos de educao formal, portanto (2.6)
implica que essas mdias devem ser as mesmas. De fato, o nvel de aptido mdia deve ser o mesmo
para todos os nveis de educao. Se, por exemplo, entendemos que a aptido mdia aumenta com os
anos de educao formal, ento (2.6) falsa. (Isso aconteceria se, em mdia, pessoas com maior
aptido escolhessem tomar-se mais educadas.) Como no podemos observar aptido inata, no temos
um modo de saber se a aptido mdia ou no a mesma para todos os nveis de educao. Essa uma
questo que devemos resolver antes de aplicar a anlise de regresso simples.
No exemplo dos fertilizantes, se as quantidades de fertilizantes so escolhidas independentemente
de outras caractersticas dos lotes, ento (2.6) se sustentar: a qualidade mdia da terra no depender
da quantidade de fertilizantes. Entretanto, se mais fertilizantes forem usados em lotes de terra de melhor
qualidade, ento o valor esperado de u varia com o nvel de fertilizantes, e (2.6) no se sustenta.
24 Introduo Econometria Editora Thomson
Suponha que a nota de um exame final (n o ta ) dependa da freqncia s aulas (freq ) e de fatores no-obser-
vados que afetam o desempenho dos estudantes (tal como a aptido). Ento:
A hiptese (2.6) d a jS, outra interpretao que , freqentemente, til. Considerando o valor
esperado de (2.1) condicionado a r e usando E(u\x) = 0, obtm-se
(A equao (2.8) mostra que a funo de regresso populacional (FRP), E(y|x), uma funo linear
de x. A linearidade significa que o aumento de uma unidade em x faz com que o valor esperado de v
varie segundo a magnitude de Para qualquer valor dado de x, a distribuio de y est centrada ao
redor de E(y|x), como ilustrado na Figura 2.1.
Quando (2.6) verdadeira, til dividir y em dois componentes. A parte (it) + fi ,x algumas vezes
chamada a parte sistemtica de y isto , a parte de y explicada por x , e chamado a parte no-
sistemtica, ou a parte de y no explicada por x. Usaremos a hiptese (2.6) na prxima seo para encon
trar as estimativas de /30 e jS,. Essa hiptese tambm crucial para a anlise estatstica na Seo 2.5.
Agora que discutimos os ingredientes bsicos do modelo de regresso simples, trataremos da impor
tante questo de como estimar os parmetros /30 e /3, da equao (2.1). Para tanto, necessitamos de uma
amostra da populao. Vamos considerar {(x,-, v,): /' = 1,..., n} como uma amostra aleatria de tamanho
n da populao. Visto que esses dados vm de (2.1), podemos escrever
y t = Po + P l x i + Un (2.91
para cada i. Aqui, w, o termo erro para a observao i, uma vez que ele contm todos os fatores, alm
de x que afetam v,.
Como um exemplo, x, poderia ser a renda anual e y a poupana anual para a famlia i durante um
determinado ano. Se coletarmos dados de 15 famlias, ento n = 15. Um grfico de tal conjunto de
dados dado pela Figura 2.2, juntamente com a funo de regresso populacional (necessariamente
fictcia).
Devemos decidir como usar esses dados, a fim de obter estimativas do intercepto e da inclinao
na regresso populacional da poupana sobre a renda.
H muitas maneiras de colocar em prtica o seguinte procedimento de estimao. Usaremos (2.5)
e uma importante implicao da hiptese (2.6): na populao, u tem mdia zero e no-correlaciona-
do com x. Portanto, vemos que u tem valor esperado zero e que a covarincia entre x e u zero:
E (u) = 0 (2.10)
onde a primeira igualdade em (2.11) resulta de (2.10). (Veja Seo B.4 do Apndice B, disponvel no
site da Thomson, para definio e propriedades da covarincia.) Em termos das variveis observveis
x e y e dos parmetros desconhecidos /30 e /3h as equaes (2.10) e (2.11) podem ser escritas como
respectivamente. As equaes (2.12) e (2.13) implicam duas restries sobre a distribuio de proba
bilidade conjunta de (x,y) na populao. Como h dois parmetros desconhecidos para estimar, pode
ramos esperar que as equaes (2.12) e (2.13) pudessem ser usadas para obter bons estimadores de /?0
e /?!. De fato, elas podem ser usadas. Dada uma amostra de dados, escolhemos as estimativas e
para resolver as equivalncias amostrais de (2.12) e (2.13):
Figura 2.2__________________________________________________________________________
Grfico da disperso de poupana e renda de 15 famlias e a regresso populacional E\poup\renda) =
/30 + p trenda.
n 'Cy, - o ~ \ x i) = 0 (2.14)
1=1
Esse um exemplo da abordagem do mtodo dos momentos para a estimao. (Veja a Seo C.4 do
Apndice C, disponvel no site da Thomson, para uma discusso das diferentes abordagens de estima
o.) Essas equaes podem ser resolvidas para (30 e .
Usando as propriedades bsicas do operador somatrio a partir do Apndice A (disponvel no site
da Thomson), a equao (2.14) pode ser escrita como
y = Po + P\ x, (2.16)
em que y = n 2 ) a mdia amostrai de y e igualmente para x. Essa equao nos permite escrever
0 o = y - $ tx. (2.17)
Portanto, uma vez que temos a estimativa de inclinao /3,, obtm-se diretamente a estimativa de inter
cepto (30, dados y c x.
Suprimindo o n~1 em (2.15) (j que ele no afeta a soluo) e inserindo (2.17) em (2.15), obtemos
x,v, - (y - j8 , jc ) - /S,*,.] = 0
1=1
2 xfy, ~ y ) = P u L xi ( )
t=l /=1
Das propriedades bsicas do operador somatrio [veja (A.7) e (A.8) disponvel no site da Thomson],
a inclinao estimada
c *,_ * ) 0/ y)
i = l ______________________
(2.19)
o , - * )2
i=i
28 Introduo Econometria Editora Thomson
A equao (2.19) simplesmente a covarincia amostrai entre x e y, dividida pela varincia amostrai
de x. (Veja Apndice C, disponvel no site da Thomson. Dividir tanto o numerador como o denominador
por n - 1 no altera o resultado.) Isso faz sentido, pois f i , igual covarincia populacional dividida
pela varincia de x quando E(u) = 0 e Cov(x,w) = 0. Uma implicao imediata que se x e v so posi
tivamente correlacionados na amostra, ento /31 positivo; se x e y so negativamente correlacionados,
ento y3j negativo.
Embora o mtodo para obter (2.17) e (2.19) decorra de (2.6), a nica hiptese necessria para se
calcular as estimativas para uma amostra particular (2.18). Mas essa raramente uma hiptese: (2.18)
verdadeira sempre que os x, na amostra no so todos iguais a um mesmo valor. Se (2.18) no se sus
tentar, ento fomos infelizes em obter nossa amostra da populao, ou no especificamos um proble
ma interessante (x no varia na populao). Por exemplo, se y = salrioh e x = educ, ento (2.18) no
se mantm se todos na amostra tm a mesma quantidade de anos de educao formal. (Por exemplo, se
todos tm o equivalente ao ensino mdio concludo. Veja a Figura 2.3.) Se apenas uma pessoa tem uma
quantidade diferente de anos de educao formal, ento (2.18) se sustenta, e as estimativas de MQO
podem ser calculadas.
Figura2,3- , , ,, . . . ^
Grfico da disperso de salrios e educao, quando educ, - 12 para todo i.
salrioh
0 12 educ
St = o + i x P (2.20)
Wooldridge Capitulo 2 0 Modelo de Regresso Simples 29
para o intercepto e a inclinao dados. Esse o valor que prevemos para y quando x = x,. H um valor
estimado para cada observao na amostra. O resduo para a observao i a diferena entre o valor ver
dadeiro de y, e seu valor estimado:
Novamente, h n desses resduos. [Eles no so iguais aos erros em (2.9), um ponto ao qual retomare
mos na Seo 2.5.] Os valores estimados e os resduos esto indicados na Figura 2.4.
Agora, suponha que escolhemos /30 e /3[ com a finalidade de tomar a soma dos resduos qua
drados,
?= (* - /M ,)2. (2.22)
;=i ;=i
to pequena quanto possvel. O apndice deste captulo mostra que as condies necessrias para (j80,
j8,) minimizarem (2.22) so dadas exatamente pelas equaes (2.14) e (2.15), sem n ~ \ As equaes
(2.14) e (2.15) so freqentemente chamadas de condies de primeira ordem para as estimativas de
MQO, um termo que vem da otimizao utilizada em clculo (veja o Apndice A, disponvel no site
da Thomson). De nossos clculos anteriores, sabemos que as solues para as condies de primeira
30 Introduo Econometria Editora Thomson
ordem de MQO so dadas por (2.17) e (2.19). O nome mnimos quadrados ordinrios vem do fato
de que essas estimativas minimizam a soma dos resduos quadrados.
Quando vemos o mtodo de mnimos quadrados ordinrios como um mtodo que minimiza a
soma dos resduos quadrados, natural perguntar: por que no minimizar alguma outra funo dos
resduos, como o valor absoluto dos resduos? De fato, como discutiremos brevemente na Seo 9.4,
minimizar a soma dos valores absolutos dos resduos , algumas vezes, muito til. Mas esse procedi
mento tambm tem suas desvantagens. Primeiro, no podemos obter frmulas para os estimadores
resultantes; dado um conjunto de dados, as estimativas devem ser obtidas por rotinas de otimizao
numrica. Em conseqncia, a teoria estatstica para estimadores que minimizam a soma dos resduos
absolutos muito complicada. Minimizar outras funes dos resduos, como a soma de cada resduo
elevado quarta potncia, tem desvantagens similares. (Nunca deveramos escolher nossos estima
dores para minimizar, por exemplo, a soma dos prprios resduos, pois resduos grandes em magnitu
de e com sinais opostos tendem a se cancelar.) Com o mtodo MQO, seremos capazes de derivar, de
modo relativamente fcil, inexistncia de vis, consistncia e outras importantes propriedades estats
ticas. E mais, como as equaes (2.13) e (2.14) sugerem, e como veremos na Seo 2.5, o mtodo
MQO adequado para estimar os parmetros que aparecem na funo de mdia condicional (2.8).
Uma vez determinados os estimadores de intercepto e inclinao de MQO, construmos a reta de
regresso de MQO:
y = o + /M> (2.23)
em que [(] e /3, foram obtidos ao usar as equaes (2.17) e (2.19). A notao y leia-se v chapu
enfatiza que os valores previstos da equao (2.23) so estimativas. O intercepto /30 o valor pre
visto de y quando x = 0, embora, em alguns casos, no faa sentido considerar x = 0. Nestas situa
es, 0o no , por si mesmo, muito interessante. Ao usar (2.23) para calcular os valores previstos de
y para vrios valores de x, devemos considerar o intercepto nos clculos. A equao (2.23) tambm
chamada funo de regresso amostrai (FRA), pois ela a verso estimada da funo de regresso
populacional E(j|x) == /30 + (3 ,x. importante lembrar que a FRP algo fixo, porm desconhecido, na
populao. Como a FRA obtida para uma dada amostra de dados, uma amostra nova gerar uma incli
nao e um intercepto diferentes na equao (2.23).
Em muitos casos, a estimativa do coeficiente de inclinao, que podemos escrever como
de interesse fundamental. Ela nos diz o quanto varia y quando x aumenta em uma unidade. Equi
valentemente,
Ay = 1Ax, (2.2S)
de modo que, dada qualquer variao em x (seja positiva ou negativa), podemos calcular a variao pre
vista em y.
Agora, vamos apresentar vrios exemplos de regresses simples obtidas de dados reais. Em outras
palavras, vamos encontrar as estimativas de intercepto e de inclinao a parjtir das equaes (2.17) e
(2.19). Como esses exemplos compreendem muitas observaes, os clculos foram feitos usando pro-
Wooldridge Captulo 2 O Modelo de Regresso Simples 31
EXEMPLO 2.3
(Salrios de Diretores Executivos e Retornos de Aes)
Para a populao de diretores executivos, seja y o salrio anual (salrio ) em milhares de dlares. Assim, y =
856,3 indica um salrio anual de $ 856.300, e y = 1.452,6 indica um salrio de $ 1.452.600. Seja x o retorno
mdio da ao sobre o patrimnio (rm a ), dos trs anos anteriores, da empresa do diretor executivo. (0 retor
no da ao sobre o patrimnio definido em termos de renda lquida, como uma percentagem do patrimnio
comum.) Por exemplo, se rm a = 10, ento o retorno mdio da ao sobre o patrimnio de 10%.
Para estudar a relao entre essa medida do desempenho das empresas e a remunerao dos seus dire
tores executivos, postulamos o modelo simples
s a l r io = /30 + fi^ r m a + u.
0 parmetro de inclinao /3, mede a variao no salrio anual, em milhares de dlares, quando o retorno
da ao aumenta em um ponto percentual. Como um rm a mais elevado melhor para a empresa, espera
mos que > 0.
O conjunto de dados do arquivo CEOSAL1 .RAW contm informaes sobre 209 diretores executivos para
o ano de 1990; esses dados foram obtidos da revista Business W eek (6.5.91). Na amostra, o salrio mdio
anual $ 1.281.120; sendo que o menor e o maior so $ 223.000 e $ 14.822.000, respectivamente. O retor
no mdio das aes para os anos 1988,1989 e 1990 de 17,18%, sendo que os valores menor e maior so
de 0,5 e 56,3%, respectivamente.
Usando os dados do arquivo CEOSAL1 .RAW, a reta de regresso de MQO que relaciona salrio a rm a
na qual as estimativas de intercepto e de inclinao foram arredondadas em trs casas decimais; usamos "sal
rio chapu" para indicar que essa uma equao estimada. Como interpretamos a equao? Primeiro, se o
retorno da ao zero, rm a = 0, ento o salrio previsto o intercepto, 963,191, que igual a $ 963.191,
visto que salrio mensurado em milhares. Em seguida, podemos escrever a variao prevista no salrio como
uma funo da variao em rm a: A salrio = 18,501 (Arma). Isso significa que se o retorno da ao aumenta
um ponto percentual, A rm a = 1, ento espera-se que salrio variar cerca de 18,5, ou $ 18.500. Como (2.26)
uma equao linear, esse valor a variao estimada independentemente do salrio inicial.
Podemos facilmente usar (2.26) para comparar salrios previstos para valores diferentes de rm a.
Suponha rm a = 30. Portanto, salrio = 963,191 + 18,501(30) = 1.518,221, o que est pouco acima
de $ 1,5 milho. Entretanto, isso n o significa que um determinado diretor executivo, cuja empresa tenha
um rm a = 30, ganhe $ 1.518.221. Muitos outros fatores afetam o salrio. Essa somente a nossa pre
viso a partir da reta de regresso de MQO de (2.26). A reta estimada est representada na Figura 2.5, jun
tamente com a funo de regresso populacional E(sa/ro|rma). Nunca conheceremos a FRP; assim, no
podemos dizer o quo prxima a FRA est da FRP. Outra amostra de dados levar a uma reta de regresso
diferente, que pode estar, ou no, mais prxima da reta de regresso populacional.
32 Introduo Econometria Editora Thomson
EXEMPLO 2.4
(Salrios e Educao)
Para a populao de pessoas na fora de trabalho em 1976, seja y = salrioh, em que sal rio h mensura
do em dlares por hora. Assim, para uma determinada pessoa, se salrioh = 6,75, o salrio-hora $ 6,75.
Vamos chamar anos de escolaridade formal de x = educ; por exemplo, e d u c = 12 corresponde ao ensino
mdio completo (nos Estados Unidos). 0 salrio horrio mdio na amostra $ 5,90, o que equivale, de acor
do com o ndice de preos ao consumidor dos Estados Unidos, a $ 16,64 em dlares de 1997.
Usando os dados do arquivo WAGE1.RAW, em que n = 526 indivduos, obtemos a seguinte reta de
regresso de MQO (ou funo de regresso amostrai):
Devemos interpretar essa equao com cautela. 0 intercepto de -0 ,9 0 significa, literalmente, que uma pes
soa sem nenhuma educao formal tem um salrio-hora previsto de - 9 0 centavos de dlar por hora. Isso,
evidentemente, tolice. Ocorre que apenas 18 pessoas na amostra de 526 tm menos que oito anos de edu
cao formal. Conseqentemente, no surpreendente que a reta de regresso no faa boas previses para
Wooldridge Captulo 2 O Modelo de Regresso Simples 33
0 salrio horrio estimado em (2.27), quando e du c = 8, $ 3,42, em dlares de 1976. Qual esse valor em
dlares de 1997? (S ugesto : voc tem informao suficiente, no Exemplo 2.4, para responder a essa questo.)
EXEMPLO 2.5
(Resultados Eleitorais e Gastos de Campanha)
0 arquivo VOTE1.RAW contm dados sobre resultados eleitorais e gastos de campanha de 173 disputas
entre dois partidos, para a H ouse o f R epresentatives dos Estados Unidos (equivalente a uma cmara fede
ral). H dois candidatos em cada disputa: A e B. Seja v o to A a percentagem de votos recebida pelo
Candidato A e p a rtA a percentagem dos gastos totais de campanha que cabem ao Candidato A. Muitos
outros fatores alm de p a rtA afetam o resultado eleitoral (incluindo a qualidade dos candidatos e os valo
res absolutos dos gastos de A e B). No entanto, podemos estimar um modelo de regresso simples para
descobrir se gastar mais do que o concorrente implica uma percentagem maior de votos.
A equao estimada usando as 173 observaes
Isso significa que, se a parte dos gastos do Candidato A aumenta em um ponto percentual, o Candidato
A recebe quase meio ponto percentual (0,464) a mais da votao total. No fica claro se isso revela ou
no um efeito causal, mas isso crvel. Se p a rtA = 50, prev-se que v o to A ser cerca de 50, ou metade
da votao.
Em alguns casos, a anlise de regresso no usada para determinar a causalidade, mas para sim
plesmente observar se duas variveis so positiva ou negativamente relacionadas, de modo muito pare
cido com uma anlise padro de correlao. Um exemplo disso ocorre no Problema 2.12, que pede que
voc use os dados de Biddle e Hamermesh (1990) referentes ao tempo que se gasta dormindo e traba
lhando a fim de investigar a relao entre esses dois fatores.
34 Introduo Econometria - Editora Thomson
No Exemplo 2.5, qual a votao prevista para o Candidato A se partA = 60 (que significa 60%)? A res
posta parece razovel?
y sobre x, (2.29)
diferentes de zero. Em outras palavras, nenhum dos pontos dos dados deve, realmente, estar sobre a
reta de MQO.
EXEMPLO 2.6
(Salrio de Diretores Executivos e Retornos de Aes)
A Tabela 2.2 contm uma lista das 15 primeiras observaes do conjunto de dados dos salrios dos diretores
executivos, juntamente com os valores estimados, chamados de salchapu, e os resduos, estimados de
uchapu.
Tabela 2.2_________________________________________________________________________
Valores Estimados e Resduos dos 15 Primeiros Diretores Executivos
Os quatro primeiros diretores executivos tm salrios menores do que os previstos a partir da reta de regres
so de MQO (2.26); em outras palavras, dado somente o rm a da empresa, esses diretores executivos ganham
menos do que prevemos. Como pode ser visto dos u chapus p ositivo s, o quinto diretor executivo ganha
mais do que prevemos a partir da reta de regresso de MQO.
36 Introduo Econometria Editora Thomson
2 fi, = 0. (2.30)
i=i
Essa propriedade no precisa de prova; ela resulta, imediatamente, da condio de primeira ordem de
MQO (2.14), quando lembramos que os resduos so definidos por i = y, /30 /3,x,. Em outras
palavras, as estimativas de MQO /30 e /3, so escolhidas para fazer com que a soma dos resduos seja
zero (para qualquer conjunto de dados). Isso no diz nada sobre o resduo de qualquer observao i em
particular.
(2) A covarincia amostrai entre os regressores e os resduos de MQO zero. Isso resulta da co
dio de primeira ordem (2.15), que pode ser escrita em termos dos resduos, como
2 * ^ = 0. (2.31)
i=i
A mdia amostrai dos resduos de MQO zero, de modo que o lado esquerdo de (2.31) proporcio
nal covarincia amostrai entre xt e r
(3) O ponto (x , y) sempre est sobre a reta de regresso de MQO. Em outras palavras, s
considerarmos a equao (2.23) e inserirmos x no lugar de x, ento o valor estimado y. Isso exata
mente o que a equao (2.16) nos mostrou.
EXEMPLO 2.7
(Salrios e Educao)
Para os dados do arquivo em WAGE1 .RAW, o salrio-hora mdio da amostra 5,90, arredondado para duas
casas decimais, e a educao formal mdia (medida em anos) 12,56. Se inserirmos educ = 12,56 na reta
de regresso de MQO (2.27), obtemos sarioh = - 0,90 + 0,54(12,56) = 5,8824, igual a 5,9 quando arre
dondamos para uma casa decimal. A razo de esses nmeros no serem exatamente os mesmos que ns
arredondamos o salrio-hora e os anos de educao formal mdios, assim como as estimativas de intercepto e
de inclinao. Se, inicialmente, no tivssemos arredondado nenhum dos valores, obteramos respostas mais
aproximadas, mas essa prtica teria pouco efeito til.
Ao escrever cada como o seu valor estimado mais seu resduo, temos outro modo de interpre
tar uma regresso de MQO. Para cada i, escreva
(2.32)
Da propriedade (1), a mdia dos resduos zero; equivalentemente, a mdia amostrai dos valores
estimados, yh a mesma que a mdia amostrai de y ou y = y. Alm disso, as propriedades (1) e (2)
Wooldridge Captulo 2 O Modelo de Regresso Simples 37
podem ser usadas para mostrar que a covarincia amostrai entre y; e i zero. Portanto, podemos ver
MQO como um mtodo que decompe cada y,- em duas partes: um valor estimado e um resduo. Os
valores estimados e os resduos so no-correlacionados na amostra.
Defina a soma dos quadrados total (SQT), a soma dos quadrados explicada (SQE) e a soma
dos quadrados dos resduos (SQR) (tambm conhecida como a soma dos resduos quadrados), como
a seguir:
SQT - 2 ( y , - y ) 2. (2.33)
1=1
SQR 2 (2.35)
i=1
SQT uma medida da variao amostrai total em y ,; isto , ela mede o quo dispersos esto os y,- na
amostra. Se dividirmos SQT por n 1, obteremos a varincia amostrai de y, como discutido no Apn
dice C; no site da Thomson. Semelhantemente, SQE mede a variao amostrai em y. (em que usamos
o fato de que y = y), e SQR mede a variao amostrai em r A variao total em y pode sempre ser
expressa como a soma da variao explicada e da variao no-explicada SQR. Assim,
Provar (2.36) no difcil; mas requer o uso de todas as propriedades do operador somatrio apresen
tadas no Apndice A, no site da Thomson. Escreva
2 0 \ - )2 = 2 [ ( j ,- v ,) + t y , - ? ) ] 2
=l /=1
= 2+ 2 ,(y, - y ) + (Si )2
i=I 1=1 1=1
n
2 ,(y , - ) = 0 . (2.37)
38 Introduo Econometria Editora Thomson
Mas j dissemos que a covarincia amostrai entre os resduos e os valores estimados zero, e essa
covarincia justamente a equao (2.37) dividida por n 1. Conseqentemente, confirmamos (2.36).
Algumas palavras de precauo sobre SQT, SQE e SQR devem ser mencionadas. No h concor
dncia uniforme sobre os nomes e abreviaes das trs quantidades definidas nas equaes (2.33),
(2.34) e (2.35). A soma dos quadrados total chamada SQT ou STQ, de modo que aqui no h grandes
confuses. Infelizmente, ,a soma dos quadrados explicada , s vezes, chamada de soma dos quadra
dos da regresso. Se a esse termo dado sua abreviao natural, ele pode ser facilmente confundido
com o termo soma dos quadrados dos resduos. Alguns programas economtricos referem-se soma
dos quadrados explicada como soma dos quadrados do modelo.
Para tomar as coisas ainda piores, a soma dos quadrados dos resduos freqentemente chamada
de soma dos quadrados dos erros i Esse termo um tanto inadequado, pois, como veremos na Seo
2.5, os erros e os resduos so quantidades diferentes. Assim, sempre chamaremos (2.35) de soma dos
quadrados dos resduos ou soma dos resduos quadrados. Preferimos usar a abreviao SQR para repre
sentar a soma dos resduos quadrados, pois ela mais comum nos programas economtricos.
Grau de Ajuste
At aqui, no apresentamos uma maneira de mensurar o quanto bem a varivel explicativa ou indepen
dente, x, explica a varivel dependente, y. Muitas vezes, til calcular um nmero que resume o quo
bem a reta de regresso de MQO se ajusta aos dados. Na discusso seguinte, lembre-se de que assumi
mos estimar o intercepto com a inclinao.
Ao assumirmos que a soma dos quadrados total, SQT, no igual a zero o que verdadeiro, a
no ser no evento muito improvvel de todos os yt- serem iguais a um mesmo valor , podemos divi
dir (2.36) por SQT para obter 1 = SQE/SQT + SQR/SQT. O /{-quadrado da regresso, algumas
vezes chamado coeficiente de determinao, definido como
R2 a razo entre a variao explicada e a variao total; assim, ele interpretado como a frao da
variao amostrai em y que explicada por x. A segunda equao em (2.38) fornece outra maneira de
calcular R2.
De (2.36), o valor de R2 est sempre entre zero e um, visto que SQE no pode ser maior que SQT.
Quando interpretamos R2, usualmente o multiplicamos por 100 para transform-lo em percentual:
100 R 2 a percentagem da variao amostrai em y que explicada por x.
Se todos os pontos dos dados estiverem sobre a mesma reta, MQO fornece um ajuste perfeito aos
dados. Nesse caso, R2 = 1. Um valor de R2 quase igual a zero indica um ajuste ruim da reta de MQO:
muito pouco da variao em y, capturado pela variao em y, (que est sobre a reta de regresso
de MQO). De fato, pode ser mostrado que R 2 igual ao quadrado do coeficiente de correlao amos
trai entre _v, e y . . da que vem o termo R-quadrado. (A letra R era, tradicionalmente, usada para
denominar uma estimativa do coeficiente de correlao populacional, e seu uso sobreviveu na an
lise de regresso.)
Wooldridge Captulo 2 O Modelo de Regresso Simples 39
EXEMPLO 2.8
(Salrio de Diretores Executivos e Retornos de Aes)
Na regresso de salrios de diretores executivos, estimamos a seguinte equao:
n = 209, R2 = 0,0132.
Por motivos de clareza, reproduzimos a reta de regresso de MQO e o nmero de observaes. Usando o R-
quadrado (arredondado para quatro casas decimais) apresentado para essa equao, podemos ver quanto
da variao no salrio , realmente, explicada pelo retorno da ao. A resposta : no muito. 0 retorno da
ao da empresa explica somente 1,3% da variao nos salrios dessa amostra de 209 diretores executivos.
Isso significa que 98,7% das variaes salariais desses diretores executivos so deixadas sem explicao.
Essa falta de poder explicativo no deve ser surpreendente demais, j que muitas outras caractersticas, tanto
da empresa como do diretor executivo individual, devem influenciar o salrio; esses fatores esto, necessa
riamente, includos nos erros de uma anlise de regresso simples.
Nas cincias sociais no so incomuns /{-quadrados baixos nas equaes de regresso, especial
mente na anlise de corte transversal. Discutiremos essa questo, de modo mais geral, sob a anlise de
regresso mltipla, mas vale a pena enfatizar agora que um /{-quadrado aparentemente baixo no sig
nifica, necessariamente, que uma equao de regresso de MQO intil. Ainda, possvel que (2.39)
seja uma boa estimativa da relao ceteris paribus entre salrio e rma; se isso for verdade ou no, no
depende diretamente da magnitude do /{-quadrado. Os estudantes que esto se defrontando com eco
nometria pela primeira vez tendem, ao avaliar equaes de regresso, a pr muito peso na magnitude do
/{-quadrado. Por enquanto, esteja ciente de que usar o /{-quadrado como o principal padro de medida
de sucesso de uma anlise economtrica pode levar a confuses.
Algumas vezes, a varivel explicativa elucida uma parte substancial da variao amostrai na vari
vel dependente.
EXEMPLO 2.9
(Resultados Eleitorais e Gastos de Campanha)
Na equao de resultados eleitorais (2.28), R2 = 0,856. Assim, a participao dos candidatos nos gastos de
campanha explica mais de 85% da variao nos resultados eleitorais nessa amostra. Essa uma explicao
considervel.
Suponha que o salrio seja mensurado em centenas de dlares, em vez de milhares de dlares, e o chamemos
salarcent. Quais sero as estimativas de intercepto e de inclinao na regresso de salarcent sobre rm a l
Tambm podemos usar o exemplo do salrio dos diretores executivos para ver o que acontece
quando as unidades de medida da varivel independente so mudadas. Defina rmadec = rma/100
como sendo o equivalente decimal de rma; assim, rmadec = 0,23 significa um retomo da ao de 23%.
A fim de centrarmos o foco na mudana das unidades de medida da varivel independente, retomare
mos nossa varivel dependente original, salrio, mensurada em milhares de dlares. Quando regre
dimos salrio sobre rmadec, obtemos
O coeficiente de rmadec 100 vezes o coeficiente de rma em (2.39). Isso o que deveria ser. Variar
rma em um ponto percentual equivalente a Armadec = 0,01. De (2.41), se Armadec = 0,01, ento
Wooldridge Captulo 2 O Modelo de Regresso Simples 41
hsalrio = 1.850,1(0,01) = 18,501, que igual ao obtido ao se usar (2.39). Observe que, ao passar
mos de (2.39) para (2.41), a varivel independente foi dividida por 100, e assim a estimativa de incli
nao de MQO foi multiplicada por 100, preservando a interpretao da equao. Em geral, se a
varivel independente dividida ou multiplicada por alguma constante diferente de zero, c, ento o
coeficiente de inclinao de MQO multiplicado ou dividido por c, respectivamente.
O intercepto no mudou em (2.41), pois rmadec = 0 ainda corresponde a um retomo zero da ao.
Em geral, mudar somente as unidades de medida da varivel independente no afeta o intercepto.
Na seo anterior, definimos A-quadrado como uma medida de grau de ajuste para a regresso de
MQO. Podemos tambm questionar o que acontece ao R~ quando mudada a unidade de medida da
varivel independente ou da varivel dependente. Sem fazer nenhuma lgebra, deveramos saber o
resultado: o grau de ajuste do modelo no depende das unidades de medida de nossas variveis. Por
exemplo, a quantidade de variao no salrio, explicada pelo retomo da ao, no deve depender de o
salrio ser medido em dlares ou em milhares de dlares, ou de o retomo da ao ser uma percenta
gem ou um decimal. Essa intuio pode ser verificada matematicamente: usando a definio de R2,
pode ser mostrado que R2 , de fato, invariante a mudanas nas unidades de y ou x.
em que log(-) o logaritmo natural. (Veja Apndice A, disponvel no site da Thomson, para uma revi
so sobre logaritmos.) Em particular, se An = 0, ento
Figura 2.6___________________________
salrioh = exp(j0 + Redite), com i > 0.
Observe como multiplicamos /S] por 100 para obter a variao percentual em salrioh dado um ano
adicional de educao formal. Como a variao percentual em salrioh a mesma para cada ano adi
cional de educao, a variao em salrioh, para um ano extra de educao formal, aumenta quando a
educao formal aumenta; em outras palavras, (2.42) implica um retomo crescente da educao for
mal. Com a exponenciao de (2.42), podemos escrever salrioh = exp(jS0 + (3,educ + u). O grfico
dessa equao aparece na Figura 2.6, com u = 0.
Quando se usa a regresso simples, a estimao de um modelo como (2.42) imediata. Apenas
defina a varivel dependente, y, como y = log(salrioh). A varivel independente representada por
x = educ. A mecnica de MQO a mesma de antes: as estimativas de intercepto e de inclinao so
dadas pelas frmulas (2.17) e (2.19). Em outras palavras, obtemos /30 e /3, da regresso de MQO de
log (salrioh) sobre educ.
EXEMPLO 2.10
{Uma Equao do Logaritmo dos Salrios-Hora)
Utilizando os mesmos dados do Exemplo 2.4, mas usando log (salrioh) como a varivel dependente, obte
mos a seguinte relao:
n = 526, R2 = 0,186.
0 coeficiente de e d u c tem uma interpretao percentual quando ele multiplicado por 100: para cada ano
adicional de educao formal, sal rio h aumenta 8,3%. Isso o que os economistas querem dizer quando se
referem ao "retorno de um ano adicional de educao formal".
importante relembrar que a principal razo para usar o log de salrioh em (2.42) impor um efeito
percentual constante da educao formal sobre salrioh. Uma vez obtida a equao (2.42), o log natural de
salrioh raramente mencionado. Em particular, n o correto dizer que um ano adicional de educao for
mal aumenta log {salrioh) em 8,3%.
0 intercepto em (2.42) no tem muito significado, visto que ele o \oq(salrioh) previsto quando
educ = 0. O /?-quadrado mostra que e d u c explica cerca de 18,6% da variao em log (salrioh) (no em
salrio). Finalmente, a equao (2.44) pode no capturar toda a no-linearidade da relao entre salrio-
hora e escolaridade formal. Se houver "efeitos-diplom a", o dcimo segundo ano de educao forma
tura do ensino mdio nos Estados Unidos deve ser muito mais valioso que o dcimo primeiro ano. No
Captulo 7 aprenderemos como lidar com esse tipo de no-linearidade.
Outro uso importante do log natural est em obter um modelo de elasticidade constante.
EXEMPLO 2.11
(Salrios de Diretores Executivos e Vendas das Empresas)
Podemos estimar um modelo de elasticidade constante que relaciona o salrio dos diretores executivos s
vendas das empresas. 0 conjunto de dados o mesmo utilizado no Exemplo 2.3, exceto que agora relacio
namos salrio a vendas. Seja vendas as vendas anuais das empresas, mensurada em milhes de dlares. Um
modelo de elasticidade constante
em que (5] a elasticidade de sal rio com respeito a vendas. Esse modelo est compreendido no modelo
de regresso simples ao se definir a varivel dependente como y = log (salrio), e a varivel independente
como x = log(vendas). Ao estimar essa equao por MQO, temos
0 coeficiente de log (vendas) a elasticidade estimada de salrio em relao a vendas. Ela implica que um
aumento de 1% nas vendas das empresas aumenta o salrio dos diretores executivos em cerca de 0,257%
a interpretao usual de uma elasticidade.
44 Introduo Econometria Editora Thomson
As duas formas consideradas nesta seo surgiro no restante deste texto. Tratamos aqui de mode
los que contm logaritmos naturais porque eles aparecem muito frequentemente em trabalhos aplicados.
A interpretao desses modelos no ser muito diferente no caso da regresso mltipla.
tambm til observar o que acontece s estimativas de intercepto e de inclinao se mudarmos
as unidades de medida da varivel dependente quando ela aparece na forma logartmica. Pelo fato de
a variao da forma logartmica aproximar-se de uma variao proporcional, faz sentido que nada
acontea com a inclinao. Podemos ver isso ao escrever a varivel em uma nova escala como c,y, para
cada observao i. A equao original log(y,) = /30 + /3,x, + ur Se adicionamos log(ci) a ambos os
lados da equao, obtemos log (c,) + logy,j = [log (c,) + /30] + /^x, + n, ou log (cLv,) = [log (c,) +
13()] + /3 ,x, + m,. (Lembre-se de que a soma dos logs igual ao log de seus produtos, como mostrado
no Apndice A, disponvel no site da Thomson.) Portanto, a inclinao ainda /3,, mas o intercepto
agora log (c,) + /30. Semelhantemente, se a varivel independente for log(x), e mudarmos as unida
des de medida de x antes de considerarmos o log, a inclinao permanece a mesma, mas o intercepto
muda. Pediremos que voc verifique essas asseres no Problema 2.9.
Finalizamos esta subseo resumindo quatro combinaes de formas funcionais construdas a
partir da varivel original ou de seu logaritmo natural. Na Tabela 2.3, x e y representam as variveis
em suas formas originais. O modelo com y como a varivel dependente e x como a varivel indepen
dente chamado modelo nvel-nvel, pois cada varivel aparece em sua forma de nvel. O modelo com
log(y) como a varivel dependente e x como a varivel independente chamado modelo log-nvel.
No discutiremos aqui, explicitamente, o modelo nvel-log, pois ele aparece menos freqentemente
na prtica. De qualquer forma, veremos exemplos desse modelo em outros captulos.
A ltima coluna na Tabela 2.3 mostra a interpretao de /31. No modelo log-nvel, 100 (31 algu
mas vezes chamado semi-elasticidade de y em relao a x. Como mencionamos no Exemplo 2.11, no
modelo log-log /3, a elasticidade de y em relao a x. A Tabela 2.3 requer um estudo cuidadoso, j
que vamos, com frequncia, nos referir a ela no restante do texto.
Tabela 2.3_____________________________________________________________________________
Resumo das Formas Funcionais Envolvendo Logaritmos
Varivel Varivel
Modelo Interpretao de ,
Dependente Independente
nvel-nvel y X Ay = /3,Ax
y = 0 + \ x + K (2.47)
H I P T E S E R L S . 2 (AMOSTRAGEM ALEATRIA)
Podemos usar uma amostra aleatria de tamanho n, {(xy/): / = 1,2,..., n), proveniente de um modelo
populacional.
Em captulos posteriores que abordam a anlise de sries de tempo e problemas de seleo de amos
tra, teremos de dar um tratamento ao fato de a hiptese de amostragem aleatria no ser mais vlida.
Nem todas as amostras de corte transversal podem ser vistas como resultados de amostras aleatrias,
mas muitas podem ser assim entendidas.
Podemos escrever (2.47), em termos da amostra aleatria como
em que m, o erro ou perturbao da observao i (por exemplo, pessoa i, empresa /, cidade i etc.).
Assim, , contm os fatores no-observveis da observao i que afetam y,. Os w, no devem ser con
fundidos com os resduos, definidos na Seo 2.3. Mais adiante, exploraremos a relao entre os
erros e os resduos. Para interpretar /30 e /3, em uma aplicao particular, (2.47) mais instrutiva, mas
(2.48) tambm necessria para algumas derivaes estatsticas.
A relao (2.48) pode ser colocada em um grfico para um registro particular dos dados, como
mostrado na Figura 2.7.
A fim de obter estimadores no-viesados de /30 e /3,, precisamos impor a hiptese de mdia condi
cional zero que discutimos, com algum detalhe, na Seo 2.1. Agora, vamos adicion-la explicitamente
nossa lista de hipteses.
Para uma amostra aleatria, essa hiptese implica que E(m,|x,) = 0, para todo i = 1,2,..., .
Alm de restringir a relao entre u e i n a populao, a hiptese de mdia condicional zero
juntamente com a hiptese de amostra aleatria permite uma simplificao tcnica conveniente. Em
particular, podemos derivar as propriedades estatsticas dos estimadores de MQO como condicionais
aos valores de x(- em nossa amostra. Tecnicamente, em derivaes estatsticas, condicionar aos valores
amostrais da varivel independente o mesmo que tratar x, como fixo em amostras repetidas. Esse pro
cesso envolve vrios passos. Primeiro, escolhemos valores amostrais para x,, x2, ..., x. (Esses valores
podem ser repetidos.) Dados esses valores, obtemos uma amostra de y (efetivamente, obtendo uma
amostra aleatria de ,). Em seguida, obtm-se outra amostra de y, usando novamente os mesmos xh
x2, ..., x. E assim por diante.
Wooldridge Captulo 2 O Modelo de Regresso Simples 47
Figura 2.7_________________
Grfico de y, = 0 + + u,.
Encontramos a hiptese RLS.4 quando derivamos as frmulas dos estimadores de MQO; ela
n
equivalente a ^ (x, x)2 > 0. Das quatro hipteses feitas, esta a menos importante, pois ela essen-
48 Introduo Econometria Editora Thomson
{xj - x)yi
, = ^ -------------- (2.49)
(*,. - x f
i1
n n
onde definimos a variao total em x, como SQTt = 2 (*, ~ x)~, a fim de simplificar a notao. (Essa
= i
expresso no exatamente a varincia amostrai de x pois no a dividimos por n - 1.) Usando a lge
bra do operador somatrio, vamos escrever o numerador de /3, como
(2.51)
o 2 {xi - x)-y- i E (x, - x)xi + (*, - x ) ;
n n n
2 (x, - x)ut
l = , + ----- = , + (1/SQT) 2 d .ur (2.52)
Wooldridge Captulo 2 O Modelo de Regresso Simples 49
onde di = x, x. Vemos agora que o estimador /3, igual inclinao populacional /3, mais um termo
que uma combinao linear dos erros {uuu2,...,u}. Condicionada aos valores de x a aleatoriedade
em /3, deve-se inteiramente aos erros na amostra. O fato de que esses erros sejam, em geral, diferentes
de zero o que faz com que /3, seja diferente de j8,.
Ao usar a representao em (2.52), podemos provar a primeira importante propriedade estatstica
do mtodo MQO.
E03o) = / 3 o e E 0 3 1) = j 3 1, (2.S3)
para quaisquer valores de >30 e/3,. Em outras palavras, /30 no-viesado para/30, e/3, no-viesado para /3,.
PROVA: Nesta prova, os valores esperados esto condicionados aos valores amostrais da varivel indepen
dente. Visto que SQT* e d, so funes somente de x,, eles so no-aleatrios quando condicionais. Portanto,
de (2.52), e mantendo o condicionamento a {x1(x2,...,xn} implcito, temos
onde usamos o fato de que o valor esperado de cada u, (condicional a {x1(x2,...,xn}) zero sob as hipteses
RLS.2 e RLS.3. Como a inexistncia de vis se mantm para qualquer resultado condicionado a {x,,x2.... xn],
a inexistncia de vis tambm se mantm sem se condicionar a {x1(x2,...,xn}.
A prova para /30 agora direta. Obtenha a mdia de (2.48) atravs de / para obter y = (50 + /3, x + ,
e insira essa equao na frmula de /30 :
j que, pelas hipteses RLS.2 e RLS.3, E() = 0. No entanto, mostramos que E(/3,) = /3,, o que implica que
E[(/3, - >3n)] = 0. Assim, E(/30) = /30. Ambos os argumentos so vlidos para quaisquer valores de y30 e jS,,
e assim estabelecemos a inexistncia de vis.
50 Introduo Econometria Editora Thomson
Lembre-se de que a inexistncia de vis uma caracterstica das distribuies amostrais de /3, e
(30, o que no nos diz nada sobre a estimativa que obtemos de uma dada amostra. Esperamos que, se a
amostra que obtemos de algum modo tpica, ento nossa estimativa deve estar prxima do valor
populacional. Infelizmente, sempre possvel obter uma amostra ruim que nos d uma estimativa pon
tual distante de J3h e ns nunca saberemos, com certeza, se esse o caso. Neste ponto, voc pode que
rer revisar o material sobre estimadores no-viesados no Apndice C (disponvel no site da Thomson),
especialmente o exerccio de simulao da Tabela C .l, o qual ilustra o conceito de inexistncia de vis.
Em geral, a inexistncia de vis no vlida se qualquer uma das nossas quatro hipteses no
for vlida. Isso significa que importante pensar na veracidade de cada hiptese em uma aplicao
particular. Como j discutimos, se a hiptese RLS.4 no for vlida, ento no seremos capazes de
obter as estimativas de MQO. A hiptese RLS.l requer que y e x sejam linearmente relacionados com
uma perturbao adicionada. Certamente, isso pode no ser vlido. Mas sabemos tambm que y e x
podem ser escolhidos de forma que possam produzir relaes no-lineares interessantes. Estudar com
a no validade de (2.47) requer mtodos mais avanados, que esto alm do escopo deste texto.
Posteriormente, veremos como relaxar a hiptese RLS.2, a hiptese de amostragem aleatria, na
anlise de sries de tempo. Porm, o que dizer de seu uso na anlise de corte transversal? A amostra
gem aleatria pode no ser vlida em um corte transversal quando as amostras no so representativas
da populao subjacente; de fato, alguns conjuntos de dados so construdos fazendo-se, intencional
mente, amostras de partes diferentes da populao. Discutiremos os problemas de amostragem no-
aleatria nos Captulos 9 e 17.
A hiptese na qual devemos nos concentrar agora a RLS.3. Se RLS.3 se mantm, as estimativas
de MQO so no-viesadas. Do mesmo modo, se RLS.3 no se mantm, os estimadores de MQO sero,
em geral, viesados. H maneiras de determinar a direo e o tamanho provveis do vis, algo que estu
daremos no Captulo 3.
A possibilidade de que x seja correlacionado com u quase sempre uma preocupao na anlise
de regresso simples com dados no-experimentais, como indicamos por meio de vrios exemplos na
Seo 2.1. Usar a regresso simples quando u contm fatores que afetam y e que tambm esto corre
lacionados comxpode resultar em correlao espria: isto , achamos uma relao entre y e x que se
deve, em verdade, a outros fatores que afetam y e que tambm esto correlacionados com x.
EXEMPLO 2.12
(Desempenho em Matemtica de Estudantes e o Programa de Merenda Escolar)
Seja m a te i0 a percentagem de alunos do primeiro ano do ensino mdio aprovados em um exame de mate
mtica. Suponha que desejamos estimar o efeito do programa de merenda escolar financiado pelo governo
sobre o desempenho dos alunos. Esperamos que o programa de merenda tenha um efeito cete ris p a rib u s
positivo sobre o desempenho: todos os outros fatores permanecendo iguais, se um estudante, bastante pobre
para ter regularmente refeies, torna-se qualificado para o programa de merenda escolar, seu desempenho
deveria melhorar. Seja p rg a lm a percentagem de estudantes que esto aptos para participar do programa de
merenda escolar. Portanto, o modelo de regresso simples
em que u contm caractersticas da escola e do estudante que afetam o desempenho escolar total. Usando
os dados do arquivo de MEAP93.RAW de 408 escolas de Michigan no ano escolar 1992-1993, obtemos
Wooldridge Captulo 2 O Modelo de Regresso Simples 51
n = 408, R2 = 0,171.
Essa equao prev que se a participao dos estudantes no programa de merenda escolar aumenta em dez
pontos percentuais, a percentagem de estudantes que passa no exame de matemtica cai cerca de 3,2 pon
tos percentuais. Realmente devemos acreditar que a participao maior no programa de merenda escolar
causa, de fato , um desempenho pior? Muito provavelmente no. Uma explicao melhor que o termo erro
u na Equao (2.54) est correlacionado com p rg a lm . De fato, u contm fatores como a taxa de pobreza
das crianas que freqentam a escola, que afeta o desempenho dos estudantes e est altamente correlacio
nada com a qualificao no programa de merenda. Variveis como qualidade e recursos da escola tambm
esto contidas em u e, provavelmente, esto correlacionados com p rg a lm . importante lembrar que a esti
mativa -0,319 somente para essa amostra particular, mas seu sinal e magnitude nos fazem suspeitar de
que o e x sejam correlacionadas, de modo que a regresso linear viesada.
Alm de variveis omitidas, h outras razes para que x esteja correlacionado com u no modelo
de regresso simples. Como essas mesmas questes surgiro na anlise de regresso mltipla, poster
garemos at l um tratamento sistemtico do problema.
H I P T E S E R L S . 5 (HOMOSCEDASTICIDADE)
Var(u|x) = cr2.
RLS.5 pois ela simplifica os clculos da varincia de /30 e )3, e porque ela implica que o mtodo de
mnimos quadrados ordinrios tenha certas propriedades de eficincia, algo que veremos no Captulo
3. Se assumssemos que u e x so independentes, a distribuio de u, dado x, no dependeria de x, e
assim E(w|x) = E(w) = 0 e Var(|x) = a 2. No entanto, algumas vezes independncia , uma hiptese
forte demais.
Como Var(|jr) = E(m2|x) - [E(ulx)]2 e E(u\x) = 0, a 2= E(h2Ix), o que significa que cr2 tambm
a esperana no-condicional de u2. Portanto, cr2 = E(u2) = Var(w), pois E(u) = 0. Em outras pala
vras, cr2 a varincia no-condicional de u, e por isso cr2 freqentemente chamado de varincia do
erro ou varincia da perturbao. A raiz quadrada de a 2, a, o desvio-padro do erro. Um a grande
significa que a distribuio dos fatores no-observveis que afetam y mais dispersa.
Freqentemente, til escrever as hipteses RLS.3 e RLS.5 em termos da mdia condicional e da
varincia condicional de y:
Var(y|x) = a 2. (2.56)
Figura 2.8__________________________________________________________________________
0 modelo de regresso simples sob homoscedasticidade.
Wooldridge Captulo 2 O Modelo de Regresso Simples 53
EXEMPLO 2.13
(Heteroscedasticidade em uma Equao de Salrios)
A fim de obter um estimador no-viesado do efeito ceteris p a rib u s de e d u c sobre salroh, devemos assu
mir que E(u\educ) = 0, e isso implica (s a l rio h \e d u c ) = f30 + /3,educ. Se tambm usarmos a hiptese de
homoscedasticidade, ento Var(u|educ) = <x2 no depende do nvel de educao formal, que o mesmo
que assumir que V ar(salrioh\educ) = cr2. Assim, enquanto se deixa o salrio-hora mdio aumentar com o
nvel de educao formal - essa taxa de crescimento que estamos interessados em descrever - assume-se
que a variabilidade no salrio horrio em torno de sua mdia constante atravs de todos os nveis de edu
cao formal: isso pode no ser realista. provvel que pessoas com mais tempo de educao formal tenham
uma variedade maior de interesses e de oportunidades de trabalho, o que poderia levar a uma variabilidade
maior nos nveis de educao formal mais elevados. Pessoas com nveis de educao formal bastante baixos
tm muito poucas oportunidades e, freqentemente, precisam trabalhar recebendo salrio mnimo; isso tem
o efeito de reduzir a variabilidade salarial nos nveis baixos de educao formal. Essa situao mostrada
na Figura 2.9. Em ltima anlise, se a hiptese RLS.5 se mantm ou no uma questo emprica. No Captulo
8 mostraremos como testar a hiptese RLS.5.
f(salrioh/educ)
salrioh
E(salriohieduc) =
P0 + P,ecfuc
educ
54 Introduo Econometria - EditoraThomson
cr2n ' 2 xf
Var(/30) = ----- '=! , (2.58)
2 (x i - x ) 2
i=1
As equaes (2.57) e (2.58) so as frmulas padres para a anlise de regresso simples, mas
no so vlidas na presena de heteroscedasticidade. Isso ser importante quando tratarmos dos inter
valos de confiana e dos testes de hipteses na anlise de regresso mltipla.
Para a maior parte dos propsitos, estamos interessados em Var(j8,). E fcil resumir como essa
varincia depende da varincia do erro, cr2, e da variao total em [X], x2,..., x}, SQTt. Primeiro, quan
to maior a varincia do erro, maior Var(j3,). Isso faz sentido, j que uma variao maior nos fatores
Wooldridge Captulo 2 O Modelo de Regresso Simples 55
no-observveis que afetam y faz com que seja mais difcil estimar com preciso /3,. Em contraparti
da, prefervel maior variabilidade na varivel independente;_quando a variabilidade nos x, aumenta,
a varincia de diminui. Isso tambm tem um sentido intuitivo, visto que quanto mais dispersa for a
amostra das variveis independentes, mais fcil ser descrever a relao entre Efy|x) e x. Isto , ser
mais fcil estimar jS,. Se h pouca variao nos x h pode ser difcil estabelecer com preciso como
Efy|x) varia com x. Quando o tamanho da amostra cresce, do mesmo modo cresce a variao total nos
Xj. Portanto, um tamanho de amostra maior resulta em uma varincia menor de P ].
Essa anlise mostra que, se estamos interessados em 0 ,, e temos uma escolha, ento devemos
escolher os x; to dispersos quanto possvel. As vezes, isso possvel com dados experimentais, mas
raramente temos esse luxo nas cincias sociais: usualmente, temos de pegar os x, que obtemos via
amostragem aleatria. Algumas vezes, temos uma possibilidade de obter amostras maiores, embora
isso possa ser dispendioso.
Mostre que, ao estimar p 0, melhor ter x = 0. Qual a Var(/0) nesse caso? [Sugesto: para qualquer
n n
amostra de nmeros, 2 x 2 2 (*,- - x )2> mantendo-se a igualdade somente se x = 0.]
i=i =i
m, = - j0 - /3 ,x , = (jS0 - ( i ix , + Ui) - 30 - P xx ,
OU
Embora o valor esperado de (3n iguale-se a /30, e similarmente para /3| , i no o mesmo que A
diferena entre eles tem, de fato, um valor esperado igual a zero.
Agora que entendemos a diferena entre os erros e os resduos, podemos retomar para estimar a 2.
n
Primeiro, a 2 = E(n2), de modo que um estimador no-viesado de <r2 1 ^ uj. Infelizmente, esse
= i
no um estimador verdadeiro, pois no observamos os erros ut. Mas, temos, de fato, as estimativas de
uh a saber, os resduos , de MQO. Se substitumos os erros pelos resduos de MQO, temos
n
w ' 2 ] ~ SQR/. Esse um estimador verdadeiro, porque ele fornece uma regra computvel para
!~ 1
qualquer amostra de dados sobre x e y . Uma ligeira desvantagem desse estimador que ele resulta viesa-
do (embora o vis seja pequeno para n grande). Como fcil calcular um estimador no-viesado, usamos
esse como substituto.
O estimador SQRIn viesado, essencialmente, porque ele no explica a razo de duas restries
que devem ser satisfeitas pelos resduos de MQO. Essas restries so dadas pelas duas condies de
primeira ordem de MQO:
, = 0> V , = - (2.60)
i=i ;=i
Uma maneira de ver essas restries esta: se ns conhecemos n 2 dos resduos, podemos sempre
obter os outros dois resduos usando as restries implicadas pelas condies de primeira ordem em
(2.60). Assim, h somente n 2 graus de liberdade nos resduos de MQO, em oposio a n graus de
liberdade nos erros. Se substitussemos j por n, em (2.60), as restries no mais se manteriam. O
estimador no-viesado de cr2 que utilizaremos faz um ajustamento dos graus de liberdade:
(Esse estimador , s vezes, denominado por s2, mas continuaremos a usar a conveno de colocar
chapus sobre os estimadores.)
PROVA: Se construirmos a mdia da equao (2.59) para todos os / e usarmos o fato de que os resduos de
MQO tm mdia igual a zero, temos 0 = u - (j3 0 - /30) - (/?, - j8 ,)x ; subtraindo essa equao de
(2.59), resulta i = (uj - n) - (/3, - /3])(xi - x). Portanto, j = (ut - )2 + ()3, - y3,)2(x, - x f -
n n
2(n,- - ) ( - /SjXx,- - x ). A soma ao longo de todos os / resulta na equao 2 j = X (M,- ~ )2 +
i=1 i=
( /3, - 18,)2 2 (x i ~ x ) 2 - 2( - yS,) 2 , (x; - x ) . Agora, o valor esperado do primeiro termo
;=i i=i
(.n l)c r2, algo que est mostrado no Apndice C, no site da Thomson.
Wooldridge Captulo 2 0 Modelo de Regresso Simples 57
Finalmente, o terceiro termo pode ser escrito como: 2( /3, - (3 ,)2s2; aplicando as esperanas, resulta em 2 a 2.
Colocando esses trs termos juntos, obtemos E ^ ) j = (n - l)c r 2 + cr2 - 2cr2 = (n - 2) a 2, de modo
Se 2 for inserido nas frmulas da varincia (2.57) e (2.58), ento teremos estimadores no-vie-
sados de Var(/3,) e Var(/30). Posteriormente, necessitaremos de estimadores dos desvios padro de /,
e/30, e isso requer estimar a. O estimador natural de a
(2 .62 )
que chamado de erro-padro de /3,. Observe que ep(/,) visto como uma varivel aleatria quan
do pensamos em processar o mtodo MQO usando diferentes amostras de y, isso ocorre porque a 2
varia com diferentes amostras. Para uma dada amostra, ep(/8,) um nmero, exatamente como /3,
simplesmente um nmero quando ns o calculamos a partir de dados conhecidos.
Semelhantemente, ep(/30) obtido de dpi/3()) ao substituir a por &. O erro-padro de qualquer
estimativa nos d uma idia de qual preciso o estimador. Os erros-padro desempenham um papel
central em todo este texto; ns os usaremos para construir estatsticas de testes e intervalos de confian
a para todos os procedimentos economtricos que cobriremos, a partir do Captulo 4.
58 Introduo Econometria Editora Thomson
= i x, (2.63)
em que os sinais grficos do til sobre /3j e y so usados para distinguir esse problema do problema
muito mais comum de estimar um intercepto juntamente com uma inclinao.) Costuma-se chamar
(2.63) de regresso atravs da origem, pois a reta (2.63) passa pelo ponto x = 0, y = 0. Para obter a
estimativa de inclinao em (2.63), ns ainda contamos com o mtodo de mnimos quadrados ordin
rios, que minimiza, nesse caso, a soma dos resduos quadrados:
Usando clculo, pode-se mostrar que deve resolver a condio de primeira ordem:
i *,) = 0. (2.65)
;* 1
(2 .66 )
i=i
Neste captulo introduzimos o modelo de regresso simples e cobrimos suas propriedades bsicas.
Dada uma amostra aleatria, o mtodo de mnimos quadrados ordinrios usado para estimar os par
metros de inclinao e de intercepto no modelo populacional. Demonstramos a lgebra da reta de
regresso de MQO, incluindo os clculos dos valores estimados e dos resduos, e a obteno das
variaes previstas na varivel dependente a partir de uma dada variao na varivel independente.
Na Seo 2.4 discutimos duas questes de importncia prtica: (1) o comportamento das estimativas
de MQO quando mudamos as unidades de medida da varivel dependente ou da varivel independen
te e (2) o uso do log natural na elaborao de modelos de elasticidade constante e de sem-elasticida-
de constante.
Na Seo 2.5, mostramos que, sob as quatro hipteses RLS.l a RLS.4, os estimadores de MQO
so no-viesados. A hiptese fundamental que o termo erro u tem mdia zero, dado qualquer valor
da varivel independente x. Infelizmente, h razes para pensar que isso falso em muitas aplicaes da
regresso simples nas cincias sociais, em que os fatores omitidos em u esto frequentemente corre
lacionados com x. Quando adicionamos a hiptese de que a varincia do erro, dado x, constante, obti
vemos frmulas simples das varincias amostrais dos estimadores de MQO. Como vimos,(a varincia
do estimador de inclinao cresce quando a varincia do erro cresce, e ela decresce quando h mais
variao amostrai na varivel independente. Tambm derivamos um estimador no-viesado para
<72 = Var(u).
Na Seo 2.6, discutimos brevemente a regresso atravs da origem, cujo estimador de inclinao
obtido sob a hiptese de que o intercepto zero. As vezes, tal regresso til, mas ela no aparece
com frequncia em trabalhos aplicados.
Temos ainda muito trabalho por fazer. Por exemplo, ainda no sabemos como testar hipteses
sobre os parmetros populacionais, /30 e f j. Assim, embora saibamos que o mtodo MQO , sob as
hipteses RLS.l a RLS.4, no-viesado para os parmetros populacionais, no temos um modo de fazer
inferncias sobre a populao. Outros tpicos, tais como a eficincia de MQO relativa a outros proce
dimentos possveis, tambm foram omitidos.
As questes de intervalos de confiana, testes de hipteses e eficincia tambm so centrais para
a anlise de regresso mltipla. Como a maneira que construmos os intervalos de confiana e as esta
tsticas de testes muito similar para a regresso mltipla e porque a regresso simples um caso
especial da regresso mltipla , nosso tempo ser mais bem gasto se nos movermos para a regresso
mltipla, que muito mais aplicvel que a regresso simples. Nosso propsito, no Captulo 2, foi fazer
voc pensar nas questes que surgem na anlise economtrica dentro de uma estrutura clara e simples.
2.1 Seja filhos o nmero de filhos de uma mulher e educ os anos de educao da mulher. Um mode
lo simples que relaciona a fertilidade a anos de educao
(ii) Uma anlise de regresso simples mostrar o efeito ceteris paribus da educao sobre a fer
tilidade? Explique.
2.2 No modelo de regresso linear simples y = /30 + (3tx + u, suponha que E(u) + 0. Fazendo
oc0 = E(m), mostre que o modelo pode sempre ser reescrito com a mesma inclinao, mas com um
novo intercepto e erro, em que o novo erro tem um valor esperado zero.
2.3 A tabela seguinte contm as variveis nmgrad (nota mdia em curso superior nos Estados
Unidos) e tac (nota do teste de avaliao de conhecimentos para ingresso em curso superior nos
Estados Unidos) com as notas hipotticas de oito estudantes de curso superior. A nota nmgrad est
baseada em uma escala de quatro pontos e foi arredondada para um dgito aps o ponto decimal. A
nota tac baseia-se em uma escala de 36 pontos e foi arredondada para um nmero inteiro.
1 2,8 21
2 3,4 24
3 3,0 26
4 3,5 27
5 3,6 29
6 3,0 25
7 2,7 25
8 3,7 30
(i) Estime a relao entre nmgrad e tac usando MQO; isto , obtenha as estimativas de inter
cepto e de inclinao da equao
nmgrad = 0 O+ j3ttac.
Comente a direo da relao. O intercepto tem uma interpretao til aqui? Explique. Qual
deveria ser o valor previsto de nmgrad se a nota tac aumentasse em cinco pontos?
(ii) Calcule os valores estimados e os resduos de cada observao e verifique que a soma dos
resduos (aproximadamente) zero.
(iii) Qual o valor previsto de nmgrad quando tac = 20?
(iv) Quanto da variao de nmgrad dos 8 estudantes explicada por taci Explique.
2.4 Os dados do arquivo BWGHT.RAW contm dados de nascimentos por mulheres nos Estados
Unidos. As duas variveis de interesse so: a varivel dependente, peso dos recm-nascidos em onas*
(pesonas), e a varivel explicativa, nmero mdio de cigarros que a me fumou por dia durante a gra
videz (cigs). A seguinte regresso simples foi estimada usando dados de n = 1.388 nascimentos:
(i) Qual o peso de nascimento previsto quando cigs = 0? E quando cigs = 20 (um mao por
dia)? Comente a diferena.
(ii) O modelo de regresso simples necessariamente captura uma relao causal entre o peso de
nascimento da criana e os hbitos de fumar da me? Explique.
(iii) Para prever um peso de nascimento de 125 onas, qual deveria ser a magnitude de cigs'!
Comente.
(iv) Qual a frao de mulheres na amostra que no fumaram enquanto estiveram grvidas? Isso
ajuda a reconciliar sua concluso da parte (iii)?
2.5 Na funo de consumo linear
cns = 0 O+ f31rend.
a propenso marginal a consumir PMgC (estimada) simplesmente a inclinao (3,, enquanto a pro
penso mdia a consumir PmeC cns/rend = [30/rend + (3r Usando as observaes de renda e
consumo anuais de 100 famlias (ambas medidas em dlares), obteve-se a seguinte equao:
n = 135, R2 = 0,162.
(i) Interprete o coeficiente de log(dist). O sinal dessa estimativa o que voc esperava?
(ii) Voc considera que a regresso simples oferece um estimador no-viesado da elasticidade cete-
ris paribus de preo em relao a dist? (Pense na deciso da cidade sobre onde colocar o inci
nerador.)
(iii) Quais outros fatores relativos a casas afetam seu preo? Eles poderiam estar correlaciona
dos com a distncia do incinerador?
2.7 Considere a funo de poupana
onde e uma varivel aleatria com E(e) = 0 e Var(e) = cr2. Assuma que e independente de rend.
62 Introduo Econometria Editora Thomson
(i) Mostre que E(u\rend) = 0, de modo que a hiptese de mdia condicional zero (hiptese
RLS.3) satisfeita. [Sugesto: se e independente de rend, ento E (tjrend) = E(e).]
(ii) Mostre que Var(n|reJ) = cr~ rend, de modo que a hiptese de homoscedasticidade RLS.5
violada. Em particular, a varincia de poup aumenta com rend. [Sugesto: Var(e|rend) =
Varie), se e e rend so independentes.]
(iii) Faa uma discusso que sustente a hiptese de que a varincia da poupana aumenta com a
renda da famlia.
2.8 Considere o modelo de regresso simples padro y = f30 + /3]X + u, sob as hipteses RLS.l a
RLS.4. Os estimadores usuais /30 e /3, so no-viesados para seus respectivos parmetros populacio
nais. Seja jS{ o estimador de /3, obtido ao assumir que o intercepto zero (veja a Seo 2.6).
(i) Encontre EQ3,) em termos de xh /30 e /3,. Verifique que /3, no-viesado para (5, quando o
intercepto populacional (jS0) zero. H outros casos em que /3, no-viesado?
(ii) Encontre a varincia de /3,. [Sugesto: a varincia no depende de ji{]. ]
/I
(iii) Mostre que Var(/3,) < Var(/3,). [Swgejo: para qualquer amostra de dados, 2 2
;=i ;=i
(x. a )2, com a desigualdade estrita preponderando, a no ser que x = 0.]
(iv) Comente a relao entre vis e varincia, ao escolher entre /3, e /3r
2.9 (i) Sejam /3(1e /3 o intercepto e a inclinao da regresso de y, sobre x usando n observaes. Se
jam c, e c2 constantes, com c2 A 0. Sejam )30 e /3, o intercepto e a inclinao da regresso
de c xyi sobre c2x,. Mostre que j8, = ( C ] / c 2) /3, e j80 = c, )30, verificando as observaes
sobre as unidades de medida da Seo 2.4. [Sugesto: para obter /3P insira as transfor
maes de x e y em (2.19). Em seguida, use (2.17) para /3(), estando seguro de usar as trans
formaes d e x e y e a inclinao correta.]
(ii) Agora, sejam /30 e /3, os parmetros estimados da regresso de (c, + v,) sobre (c2 + x,) (sem
qualquer restrio sobre C] ou c2). Mostre que = )3, e 0 Q = 0 (j + c, c2 f i v
(iii) Agora, sejam fi(t e /3, as estimativas de MQO da regresso log(v,j sobre x para a qual deve
mos assumir yt > 0 para todo i. Para c , > 0, sejam )80 e /3, o intercepto e a inclinao da
regresso de logc^,) sobre x,. Mostre que >3, = /3, e )30 = log(c,) +
(iv) Agora, assumindo que x, > 0 para todo /, sejam /30 c / j ( o intercepto e a inclinao da regres
so de y, sobre log(c2x,). Como /30 e /3, comparam-se com o intercepto e a inclinao da
regresso de _v, sobre log(x,)?
min n
2 1 O,- - bo b , X,.)2,
bv b \
onde b0 e,bx so argumentos dummies para o problema de otimizao; por simplicidade, chame essa
funo Q(b0,bi). De um resultado fundamental do clculo multivariado (veja Apndice A, dispon
vel no site de Thomson), uma condio necessria para /30 e /3, resolverem o problema de minimi-
zao que as derivadas parciais de Q(b0,bx) em relao a b() e b , devem ser zero quando avaliadas
com /3(J e j8,: dQ(fi, j i x)ldb0 = 0 e rjQ(fi(t,( il)/iJbl = 0. Usando a regra da cadeia do clculo, essas
duas equaes tomam-se
- 2 ' 2 ( y i - 0 - lxl) = d
1=1
- 2 2 x i (yi - 0 ~ xx ) = 0.
i=l
Essas duas equaes so exatamente (2.14) e (2.15) multiplicadas por -2 n e, portanto, so solucio
nadas pelos mesmos 0 e r
Como sabemos que, realmente, minimizamos a soma dos resduos quadrados? As condies de
primeira ordem so necessrias, mas no so suficientes. Uma maneira de verificar que minimiza
mos a soma dos resduos quadrados escrever, para qualquer b0 e b x,
= [, + ( 0 - V + 031 - fe|)x,]2
/= 1
onde usamos as equaes (2.30) e (2.31). A soma dos resduos quadrados no depende de b0 e b u
enquanto a soma dos ltimos trs termos pode ser escrita como
2 [(/30 - fc0) + (0 , - b v) x $ ,
;= i
como pode ser verificado diretamente por lgebra. Visto que essa expresso uma soma de termos
quadrados, ela maior que zero. Portanto, seu menor valor ocorre quando b0 = )30 e bx = /3,.
Anlise de Regresso Mltipla:
Estimao
o Captulo 2 aprendemos a usar a anlise de regresso simples para explicar uma varivel depen
dente y como funo de uma nica varivel independente x. A desvantagem principal de usar a
anlise de regresso simples em trabalhos empricos o fato de ser muito difcil obter conclu
ses ceteris paribus sobre como x afeta y: a hiptese fundamental, RLS.3 todos os outros fatores
que afetam y so no-correlacionados com x , frequentemente irreal.
A anlise de regresso mltipla mais receptiva anlise ceteris paribus, pois ela nos permite
controlar explicitamente muitos outros fatores que, de maneira simultnea, afetam a varivel dependen
te. Isso importante tanto para testar teorias econmicas quanto para avaliar efeitos da poltica gover
namental quando devemos nos basear em dados no-experimentais. Como os modelos de regresso
mltipla podem acomodar muitas variveis explicativas que podem estar correlacionadas, podemos
esperar inferir causalidade nos casos em que a anlise de regresso simples seria enganosa.
Naturalmente, se adicionarmos ao nosso modelo mais fatores que so teis para explicar y, ento
mais da variao de y poder ser explicada. Assim, a anlise de regresso mltipla pode ser usada para
construir modelos melhores para prever a varivel dependente.
Uma vantagem adicional da anlise de regresso mltipla que ela pode incorporar, completa
mente, relaes de formas funcionais gerais. No modelo de regresso simples, somente a funo de
uma varivel explicativa pode aparecer na equao. Como veremos, o modelo de regresso mltipla
permite muito mais flexibilidade.
A Seo 3.1 introduz, formalmente, o modelo de regresso mltipla e, mais adiante, discute as van
tagens da regresso mltipla sobre a regresso simples. Na Seo 3.2, demonstramos como estimar os
parmetros do modelo de regresso mltipla por meio do mtodo de mnimos quadrados ordinrios. Nas
sees 3.3, 3.4 e 3.5 descrevemos vrias propriedades dos estimadores de MQO, incluindo a inexistn
cia de vis e a eficincia.
O modelo de regresso mltipla ainda o veculo mais extensamente usado da anlise emprica
em economia e em outras cincias sociais. Igualmente, o mtodo de mnimos quadrados ordinrios
popularmente usado para estimar os parmetros do modelo de regresso mltipla.
64
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 65
O primeiro exemplo uma variao simples da equao do salrio introduzida no Captulo 2 para
obter o efeito da educao sobre o salrio-hora:
em que exper representa anos de experincia no mercado de trabalho. Assim, salrioh determinado por
duas variveis explicativas ou independentes, educao e experincia, e por outros fatores no-observa-
dos, contidos em u. Basicamente, ainda estamos interessados no efeito de educ sobre salrioh, manten
do fixos todos os outros fatores que afetam salrioh; isto , estamos interessados no parmetro /3,.
Comparada com uma anlise de regresso simples que relaciona salrioh a educ, a equao (3.1)
remove, efetivamente, exper do termo erro e a coloca explicitamente na equao. Como exper aparece
na equao, seu coeficiente, f32, mede o efeito ceteris paribus de exper sobre salrioh, que tambm
de algum interesse.
No surpreendentemente, assim como na regresso simples, teremos de fazer hipteses sobre
como u, em (3.1), est relacionado s variveis independentes, educ e exper. Entretanto, como vere
mos na Seo 3.2, h uma coisa da qual podemos estar seguros: visto que (3.1) contm a experincia
de modo explcito, seremos capazes de mensurar o efeito da educao sobre o salrio horrio, man
tendo a experincia fixa. Na anlise de regresso simples que coloca exper no termo erro , tera
mos de assumir que experincia no-correlacionada com educao, uma hiptese tnue.
Como segundo exemplo, considere o problema de explicar o efeito do gasto pblico por estudan
te (gasto) sobre a nota mdia padronizada (notmed) do ensino mdio. Suponha que a nota mdia depen
da do gasto pblico, da renda familiar mdia (rendfam) e de outros fatores no-observveis:
Para o propsito de anlise da poltica governamental, o coeficiente de interesse /3l5 o efeito ceteris
paribus de gasto sobre notmed. Ao incluir rendfam explicitamente no modelo, somos capazes de con
trolar seu efeito sobre notmed. Isso provavelmente importante, pois a renda familiar mdia tende a
estar correlacionada com o gasto pblico por estudante: os nveis de gasto pblico so, freqentemen-
te, determinados tanto por impostos locais sobre a propriedade como sobre a renda. Na anlise de
regresso simples, rendfam estaria includa no termo erro, que estaria provavelmente correlacionado
com gasto, fazendo com que o estimador de /3, de MQO fosse viesado no modelo de duas variveis.
Nesses dois exemplos similares, mostramos que outros fatores observveis, alm da varivel de
interesse primordial [educ na equao (3.1) e gasto na equao (3.2)] podem ser includos em um
modelo de regresso. Em geral, podemos escrever um modelo com duas variveis independentes como
em que j30 o intercepto, /3, mede a variao em y com relao a x,, mantendo fixos outros fatores, e
p2 mede a variao em y com relao a x2, mantendo outros fatores fixos.
A anlise de regresso mltipla tambm til para generalizar relaes funcionais entre variveis.
Como exemplo, suponha que o consumo da famlia (cons) uma funo quadrtica da renda familiar
(rend):
66 Introduo Econometria Editora Thomson
em que u contm outros fatores que afetam o consumo. Nesse modelo, o consumo depende somente
de um fator observado, a renda; desse modo, pareceria que ele pode ser tratado dentro do arcabou
o da regresso simples. No entanto, esse modelo est fora do padro da regresso simples, porque
ele contm duas funes da renda, rend e rend2 (e, portanto, trs parmetros: f3. /3, e (i2). Portanto,
a funo consumo facilmente escrita como modelo de regresso com duas variveis, e fazendo x t
= rend e x2 = rend2.
Mecanicamente, no h nenhuma diferena em usar o mtodo de mnimos quadrados ordinrios
(introduzido na Seo 3.2) para estimar equaes to diferentes como (3.1) e (3.4). Cada uma dessas
equaes pode ser escrita como (3.3), que tudo o que importa para os clculos. H, entretanto, uma
diferena importante em como interpretar os parmetros. Na equao (3.1), /3, o efeito coeteris pari-
bus de educ sobre salrioh. O parmetro j3, no tem tal interpretao em (3.4). Em outras palavras,
no faz sentido medir o efeito de rend sobre cons mantendo, ao mesmo tempo, rend~ fixo, porque se
rend varia, ento rend2 deve variar! Em vez disso, a variao no consumo com respeito variao na
renda a propenso marginal a consumir aproximada por
Acons
== /3, + 22 rend
Arend
Para os clculos necessrios quanto a derivao dessa equao, veja o Apndice A, disponvel na pgi
na do livro, no site www.thomsonleaming.com.br. Em outras palavras, o efeito marginal da renda sobre
o consumo depende tanto de fi2 como de e do nvel de renda. Esse exemplo mostra que, em qual
quer aplicao particular, as definies das variveis independentes so cruciais. Mas, para o desenvol
vimento terico da regresso mltipla, podemos ser vagos com relao a tais detalhes. No Captulo 6
estudaremos exemplos como esse de forma mais completa.
No modelo com duas variveis independentes, a hiptese fundamental sobre como u est relacio
nado a x, e x 2
res que afetam as notas caractersticas das escolas e dos estudantes so, em mdia, no-relacio-
nados aos gastos pblicos por estudante e renda familiar mdia.
Um modelo simples para explicar as taxas de homicdio nas cidades ( ta x a h o m ) em termos da probabilidade
de condenao (p rc o n d ) e da durao mdia da sentena (se n tm e d )
Que fatores esto contidos em u? Voc entende ser provvel que a hiptese (3.5) se mantenha?
Quando aplicada funo quadrtica do consumo em (3.4), a hiptese da mdia condicional zero tem
uma interpretao ligeiramente diferente. A equao (3.5), escrita literalmente, E(u\rend,rend2) = 0.
Como rend2 conhecido quando se conhece rend, redundante incluir rend2 na esperana:
Wu\rend,rend2) = 0 o mesmo que E(u\rend) = 0. No h problema em colocar rend2 junto com rend
na esperana quando expressamos a hiptese, mas E(u\rend) = 0 mais conciso.
onde /30 0 intercepto, /3, o parmetro associado a v ,, ji , o parmetro associado a x2, e assim por
diante. Como h k variveis independentes e um intercepto, a equao (3.6) contm k + 1 parmetros
(desconhecidos) populacionais. Para simplificar, algumas vezes vamos nos referir aos outros parme
tros que no o intercepto como parmetros de inclinao, ainda que, literalmente, nem sempre eles
tenham esse significado. [Veja a equao (3.4), em que nenhum dos parmetros, (3{ e jS2, , por si mes
mo, uma inclinao, mas juntos determinam a inclinao da relao entre o consumo e a renda.]
A terminologia da regresso mltipla similar quela da regresso simples e apresentada na
Tabela 3.1. Exatamente como na regresso simples, a varivel u o termo erro ou perturbao. Ele
contm outros fatores, alm de r,, x2, ..., xk, que afetam y. No importa quantas variveis explicativas
inclumos em nosso modelo, pois sempre haver fatores que no podemos incluir, e eles esto conti
dos, coletivamente, em u.
68 Introduo Econometria - Editora Thomson
Tabela 3.1________________________
Terminologia para a Regresso Mltipla
y X 2, Xk
Regressando Regressores
Ao aplicar o modelo de regresso mltipla geral, devemos saber como interpretar os parmetros.
Agora e nos captulos subseqentes vamos adquirir bastante prtica, mas til, neste ponto, relembrar
mos algumas coisas que j sabemos. Suponha que os salrios (salrio) dos diretores executivos este
jam relacionados s vendas das empresas (vendas) e permanncia dos diretores executivos nas empre
sas (permceo) pela equao
No mnimo, a equao (3.8) requer que todos os fatores no termo erro no-observado sejam no-cor-
relacionados com as variveis explicativas. Ela tambm significa que consideramos corretamente a
relao funcional entre as variveis explicada e as explicativas. Qualquer problema que faa com que
u seja correlacionado com qualquer varivel independente fazem com que (3.8) no seja vlida. Na
Seo 3.3 mostraremos que a hiptese (3.8) implica que o mtodo MQO no-viesado e derivaremos
o vis que surge quando uma varivel-chave for omitida da equao. Nos captulos 15 e 16 estudare
mos outras razes que podem fazer com que (3.8) no seja vlida e mostraremos o que pode ser feito
nesses casos.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 69
y p 0 + P l x l + P2x 2 <3.9|
y = ) + P ix i + A ,x>+ - + Pkxk-
As k + 1 estimativas de MQO delas foram escolhidas para minimizar a soma dos resduos quadrados:
Esse problema de minimizao pode ser resolvido usando clculo multivariado (veja o Apndice 3A,
disponvel no site da Thomson. Isso leva a k + 1 equaes lineares com k + 1 estimadores /30, j3p ..., /3(
desconhecidos:
2 <yt ~ o ~ i x n ~ - k x u) = 0
i =1
n
2 *,-i < y , - 0 i xn k Xi l ) 0
i=1
n
2 x,2 (y, - n - i x n - .. - k x ik) = 0 (3.13)
i=1
x i k ( y t - 0 ~ i x n - - k x i = -
;= 1
Essas equaes so,, chamadas freqentemente de condies de primeira ordem de MQO. Assim,
como no modelo de regresso simples da Seo 2.2, as condies de primeira ordem de MQO podem
ser obtidas pelo mtodo dos momentos: sob a hiptese (3.8), E(m) = 0 e E(x;n) = 0, onde j = 1,2,..., k.
As equaes em (3.13) so contrapartidas amostrais desses momentos da populao, embora tenhamos
omitido a diviso pelo tamanho da amostra n.
Mesmo para n e k de tamanhos moderados, resolver as equaes em (3.13) fazendo os clculos
manualmente tedioso. No obstante, computadores modernos que processam programas padres de
estatstica e econometria podem resolver essas equaes com n e k grandes muito rapidamente.
H somente um pequeno aviso: devemos assumir que as equaes em (3.13) podem ser resolvi
das unicamente para os /3 . Por enquanto, assumimos apenas isso, como usualmente o caso em mode
los bem definidos. Na Seo 3.3 formulamos a hiptese necessria para a existncia de estimativas de
MQO nicas (veja a hiptese RLM.4).
Como na anlise de regresso simples, a equao (3.11) chamada reta de regresso de MQO
ou a funo de regresso amostrai (FRA). Chamaremos /30 a estimativa de intercepto de MQO
e /3,, ..., (3k de estimativas de inclinao de MQO (correspondentes s variveis independentes x,,
x2, ..., xk).
A fim de indicar que uma regresso de MQO foi computada, escreveremos a equao (3.11) com
ye X| , ..., xk substitudos pelos seus nomes de varivel (tais como salrioh, educ e exper), ou diremos
que rodamos uma regresso de MQO de y sobre x,, x2, ..., xk ou que regredimos y sobre x b x2, ..., xk.
Essas expresses so modos de dizer que o mtodo de mnimos quadrados ordinrios foi usado para
obter a equao de MQO (3.11). A no ser que afirmemos explicitamente, sempre estimaremos um
intercepto juntamente com as inclinaes.
Ay = /.Ax, + /32Ax2,
de modo que podemos obter a variao prevista em y dadas as variaes em x, e x2. (Observe que o
intercepto no tem nada a ver com as variaes em y.) Em particular, quando x2 mantido fixo, de
modo que Ax2 = 0, ento
Ay = p l A xu
mantendo x2 fixo. O ponto fundamental que, ao incluir x2 no nosso modelo, obtemos um coeficiente
de X] com uma interpretao ceteris paribus. Essa a razo de a anlise de regresso mltipla ser to
til. Semelhantemente,
Ay = j62Ax2,
mantendo x, fixo.
EXEMPLO 3.1
(Determinantes da Nota Mdia em Curso Superior nos Estados Unidos)
As variveis do arquivo GPA1.RAW incluem a nota mdia em um curso superior (n m g ra d ), a nota mdia do
ensino mdio (n m e m ) e a nota do teste de avaliao de conhecimentos para ingresso em curso superior
(ac) para uma amostra de 141 estudantes de uma grande universidade dos Estados Unidos; tanto n m g ra d
como nm em esto baseados em uma escala de quatro pontos. Obtemos a seguinte reta de regresso de
MQO para estimar n m g ra d a partir de n m e m e tac:
Como interpretamos essa equao? Primeiro, o intercepto de 1,29 o valor previsto de n m g ra d se tanto
n m e m como ta c forem iguais a zero. Como ningum que freqenta um curso superior teve nota mdia no
ensino mdio igual a zero ou uma nota no teste de ingresso no curso superior igual a zero, o intercepto
nessa equao no , por si mesmo, significativo.
As estimativas mais interessantes so os coeficientes de inclinao de n m e m e tac. Como espera
do, h uma relao parcial positiva entre n m g ra d e n m e m : mantendo ta c fixo, um ponto adicional em
nm em est associado a 0,453 de um ponto em n m g ra d , ou quase meio ponto. Em outras palavras, se
escolhermos dois estudantes, A e B, e esses estudantes tiverem a mesma nota tac, mas n m e m do estu
dante A um ponto maior que a n m e m do estudante B, prevemos que o estudante A tem n m g ra d
72 Introduo Econometria Editora Thomson
assim, o coeficiente ta c quase trs vezes maior que a estimativa em (3.15). No entanto, essa equao no
nos permite comparar duas pessoas com o mesmo nmem; ela corresponde a um experimento diferente. Mais
adiante, falaremos mais sobre as diferenas entre as regresses mltipla e simples.
O caso com mais de duas variveis independentes similar. A reta de regresso de MQO
y = o+ i* i + i x2 + - + kxk- 3 *, 6
Ay = t A xu (3.18)
mantendo x2, x3, ..., xk fixos. Assim, controlamos as variveis x2, x3, ..., xk ao estimar o efeito de x,
sobre y. Os outros coeficientes tm uma interpretao similar.
O exemplo seguinte contm trs variveis independentes.
EXEMPLO 3.2
(Equao do Salrio Horrio)
Usando as 526 observaes de trabalhadores do arquivo WAGE1.RAW, inclumos educ (anos de educao
formal), exper (anos de experincia no mercado de trabalho) e perm (anos com o empregador atual) na
equao que explica log(salrioh). A equao estimada
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 73
Como no caso da regresso simples, os coeficientes tm uma interpretao de percentagem. A nica dife
rena que eles tambm tm uma interpretao ceters p arib us. 0 coeficiente 0,092 significa que, manten
do exper e perm fixos, um ano a mais de educao formal aumenta o valor esperado de \og(salrioh) em
0,092, o que se traduz em um aumento aproximado de 9,2% [100(0,092)] em salrioh. Alternativamente,
se considerarmos duas pessoas com os mesmos nveis de experincia e permanncia no trabalho, o coefi
ciente de educ a diferena proporcional no salrio horrio previsto quando seus nveis de educao dife
rem em um ano. Essa medida de retorno da educao mantm fixos ao menos dois importantes fatores de
produtividade; saber se ela uma boa estimativa do retorno ceteris p a rib u s de mais um ano de educao
formal requer que estudemos as propriedades estatsticas de MQO (veja a Seo 3.3).
ou cerca de 2,6%. Como exper e perm aumentam, cada um, em um ano, apenas somamos os coeficien
tes de exper e perm e multiplicamos por 100 para converter o efeito em uma percentagem.
que exatamente o valor previsto obtido inserindo os valores das variveis independentes da observao
i na equao (3.11). Ao obter os valores estimados, no devemos esquecer do intercepto; de outro modo,
a resposta pode ser muito equivocada. Como exemplo, se em (3.15) nmem, = 3,5 e tac, = 24, nmgradj =
1,29 + 0,453(3,5) + 0,0094(24) = 3,101 (arredondado em trs casas aps o decimal).
Normalmente, para qualquer observao i, o valor real v, no se iguala ao valor previsto, y O
mtodo de MQO minimiza o erro quadrado mdio de previso, que no diz nada sobre o erro de pre
viso de qualquer observao especfica. O resduo da observao i definido exatamente como no
caso da regresso simples,
(3.21)
H um resduo para cada observao. Se j > 0, ento y,. est abaixo de y o que significa que, para
essa observao, y, subestimado. Se i < 0, ento y , < y ,, e y , superestimado.
Os valores estimados de MQO e os resduos tm algumas propriedades importantes que so exten
ses imediatas do caso da varivel nica:
1. A mdia amostrai dos resduos zero.
2. A covarincia amostrai entre cada varivel independente e os resduos de MQO zero.
Conseqentemente, a covarincia amostrai entre os valores estimados de MQO e os resduos
de MQO zero.
3. O ponto (3t,, 3c2, ..., x k, y) est sempre sobre a reta de regresso de MQO: y = 0 + l x l +
i xi 4" ... + kxk-
As duas primeiras propriedades so consequncias imediatas do conjunto de equaes usadas para
obter as estimativas de MQO. A primeira equao em (3.13) diz que a soma dos resduos zero. As
equaes restantes so da forma 2 A = 0, implicando que cada varivel independente tem cova-
i=i J
rincia amostrai zero com r A Propriedade 3 decorre imediatamente da Propriedade 1.
Se n m em mdio de cerca de 3,4 e a nota mdia do tac est em torno de 24,2, qual o n m g ra d mdio
na amostra?
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 75
= ( ^ / ( (3.22J
Pi = /3, + /M i>
em que , o coeficiente de inclinao da regresso simples de x(2 sobre x;1, i = 1, ..., n. Essa equa
o mostra como /S, difere do efeito parcial de x, sobre y. O termo que pode causar confuso o efei
to parcial de x2 sobre y multiplicado pela inclinao da regresso amostrai de x2 sobre x ,. (Veja a Seo
3A.4, no apndice do captulo, disponvel no site da Thomson, para uma verificao mais geral.)
76 Introduo Econometria Editora Thomson
A relao entre /3, e /3, tambm mostra que h dois casos distintos em que eles so iguais:
Ainda que as estimativas das regresses mltipla e simples quase nunca sejam idnticas, podemos
usar a frmula anterior para caracterizar o motivo pelo qual elas deveriam ser muito diferentes ou bas
tante similares. Por exemplo, se /32 pequeno, deveramos esperar que as estimativas das regresses
mltipla e simples de f i ] sejam semelhantes. No Exemplo 3.1, a correlao amostrai entre nmem e tac
de cerca de 0,346, o que no uma correlao trivial. Porm, o coeficiente de tac razoavelmente
pequeno. No surpreendente descobrir que a regresso de nmgrad sobre nmem produz uma estimati
va de inclinao de 0,482, no muito diferente da estimativa de 0,453 em (3.15).
EXEMPLO 3.3
(Participao nos Planos de Penso 401 (k))
Vamos usar os dados do arquivo em 401K.RAW para estimar o efeito de uma taxa de contribuio para um
plano (taxcont) sobre a taxa de participao (taxap) dos trabalhadores nos planos de penso de contribuio
definida existentes nos Estados Unidos. A taxa de contribuio a quantidade com a qual a firma contribui
para um fundo de trabalhadores, para cada dlar de contribuio do trabalhador (at certo limite); assim,
taxcont = 0,75 significa que a firma contribui com 75 centavos de dlar para cada dlar contribudo pelo
trabalhador. A taxa de participao a percentagem de trabalhadores habilitados a ter uma conta no plano
de penso. A varivel idade a idade do plano de penso. H 1.534 planos no banco de dados, a taxap
mdia 87,36, a taxcont mdia 0,732 e a idade mdia 13,2.
Regredindo taxap sobre taxcont e idade resulta na equao
Assim, taxcont e idade tm os efeitos esperados. 0 que aconteceria se no controlssemos a varivel idade ?
0 efeito estimado de idade no trivial, e portanto poderamos esperar uma variao grande no efeito esti
mado de taxcont se idade fosse excluda da regresso. Entretanto, a regresso simples de taxap sobre tax
cont produz taxap = 83,08 + 5,86 taxcont. A estimativa de regresso simples do efeito de taxcont sobre
taxap , claramente, diferente da estimativa de regresso mltipla, mas a diferena no muito grande. (A
estimativa da regresso simples somente cerca de 6,2% maior que a estimativa da regresso mltipla.) Isso
pode ser explicado pelo fato de a correlao amostrai entre taxcont e idade ser somente de 0,12.
Grau de Ajuste
Assim como na regresso simples, podemos definir a Soma dos Quadrados Total (SQT), a Soma dos
Quadrados Explicada (SQE) e a Soma dos Quadrados dos Resduos ou Soma dos Resduos Qua
drados (SQR) como
n
SQT - 2 (y, - f f (3.24)
i=I
Usando o mesmo argumento utilizado no caso da regresso simples, podemos mostrar que
Em outras palavras, a variao total em {y,} a soma das variaes totais em {v,} e em { w;}.
Assumindo que a variao total em y no zero como o caso, a no ser que y, seja constan
te na amostra , podemos dividir (3.27) por SQT para obter
SQR/SQT + SQE/SQT = 1.
e interpretado como a proporo da variao amostrai em y, que explicada pela reta de regresso de
MQO. Por definio, R2 um nmero entre zero e um.
Pode-se tambm mostrar que R2 igual ao quadrado do coeficiente de correlao entre os valores
reais v, real e os valores estimados v( ajustado. Isto ,
2 (y. - m -T )
R2 (3.29)
S / y . - j O 2 )! 2 < > , - * >
[Inserimos a mdia de y, em (3.29) por coerncia com a frmula do coeficiente de correlao; sabe
mos que essa mdia igual a y, porque a mdia amostrai dos resduos zero e v, = y. + ..]
Um fato importante sobre R2 que ele nunca diminui, e geralmente aumenta, quando outra
varivel independente adicionada regresso. Esse fato algbrico ocorre por definio, pois a
78 Introduo Econometria Editora Thomson
soma dos resduos quadrados nunca aumenta quando regressores adicionais so acrescentados ao
modelo.
O fato de que R2 nunca diminui quando qualquer varivel for adicionada a uma regresso faz dele um
instrumento fraco para decidir se uma varivel ou diversas variveis deveriam ser adicionadas ao modelo.
O fator que deve determinar se uma varivel explicativa pertence a um modelo se a varivel explicativa
tem, na populao, um efeito parcial sobre y diferente de zero. No Captulo 4, quando cobrirmos a infe
rncia estatstica, mostraremos como testar essa hiptese. Veremos tambm que, quando usado apropria
damente, R2 permite-nos testar um grupo de variveis com a finalidade de ver se ele importante para
explicar y. Por enquanto, usaremos R2 como uma medida do grau de ajuste para um dado modelo.
EXEMPLO 3.4
(Determinantes de nmgrad)
Da regresso de nmgrad que fizemos anteriormente, a equao com R2
Isso significa que nmen e tac explicam, juntos, cerca de 17,6% da variao em nm grad da amostra de estu
dantes. Isso pode no parecer uma percentagem alta, mas devemos nos lembrar de que h muitos outros
fatores incluindo formao da famlia, personalidade, qualidade da educao do ensino mdio, afinidade
com o curso escolhido que contribuem para o desempenho dos estudantes. Se nmem e tac explicassem
quase toda a variao em nmgrad, ento o desempenho no curso superior seria predeterminado pelo
desempenho no ensino mdio!
EXEMPLO 3.S
(Explicando os Registros de Prises)
0 arquivo CRIME1.RAW contm dados de prises durante o ano de 1986 e outras informaes sobre 2.725
homens nascidos em 1960 ou 1961 na Califrnia. Cada homem na amostra foi preso pelo menos uma vez antes
de 1986. A varivel npre86 o nmero de vezes que determinado homem foi preso em 1986: ela zero para
muitos homens da amostra (72,29%), e varia de 0 a 12. (A percentagem de homens presos uma vez em 1986
foi de 20,51%.) A varivel pcond a proporo (no a percentagem) de prises anteriores a 1986 que leva
ram condenao, sentmed a durao mdia da sentena cumprida por condenao prvia (zero para mui
tas pessoas), ptem p86 so os meses passados na priso em 1986 e empr86 o nmero de trimestres duran
te o qual determinado homem ficou empregado em 1986 (de zero a quatro).
Um modelo linear explicando as prises
em que pcond uma varivel (proxy) da probabilidade de um homem ser condenado por um crime, e sent
med uma medida do rigor esperado da pena, em caso de condenao. A varivel ptem p86 captura o efei
to de confinamento do crime: se um indivduo est na priso, ele no pode ser preso por um crime fora da
priso. As oportunidades no mercado de trabalho so capturadas grosseiramente por empr86.
Primeiro, estimamos o modelo sem a varivel sentmed. Obtemos
Wooldridge Capitulo 3 Anlise de Regresso Mltipla: Estimao 79
, Essa equao diz que, como um grupo, as trs variveis p co nd , p te m p 8 6 e e m p r8 6 explicam cerca de 4,1 %
I da variao em n pre 8 6 .
Cada um dos coeficientes de inclinao de MQO tem o sinal esperado. Um aumento na proporo de
; condenaes diminui o nmero previsto de prises. Se aumentarmos p c o n d em 0,50 (um aumento grande
na probabilidade de condenao), ento, mantendo os outros fatores fixos, A n p re 8 6 = -0,150(0,50) =
[ -0,075. Isso pode parecer pouco usual, porque uma priso no pode ser uma frao. No entanto, podemos
! usar esse valor para obter a variao prevista das prises esperadas de um grande grupo de homens. Por
' exemplo, entre cem homens, a queda esperada de prises quando p c o n d aumenta em 0,50 -7 ,5 .
Semelhantemente, um perodo de priso mais longo leva a um nmero previsto menor de prises. De
, fato, se p te m p 8 6 aumenta de 0 para 12, as prises previstas para um determinado homem diminuem em
| 0,034(12) = 0,408. Um trimestre a mais no qual o emprego legal informado diminui as prises esperadas
| em 0,104, o que significaria 10,4 prises entre cem homens.
i Se sentm ed for adicionado ao modelo, sabemos que R2 aumentar. A equao estimada
npre86 = 0,707 0,151 pcond + 0,0074 sentmed 0,037 ptemp86 0,103 empr86
n = 2.725, R2 = 0,0422.
Assim, ao adicionar a varivel sentena mdia, R2 aumenta de 0,0413 para 0,0422, um efeito praticamente
insignificante. O sinal do coeficiente de s e n tm e d tambm inesperado: ele diz que uma durao mais longa
da sentena mdia aumenta a atividade criminal.
O Exemplo 3.5 merece uma palavra final de cautela. O fato de as quatro variveis explicativas
includas na segunda regresso explicarem somente 4,2% da variao em npre86 no necessariamente
significa que a equao intil. Ainda que, coletivamente, essas variveis no expliquem muito da
variao nas prises, possvel que as estimativas de MQO sejam estimativas confiveis dos efeitos
ceteris paribus de cada varivel independente sobre npre86. Como veremos, se esse for o caso, isso
no depende, diretamente, do tamanho do R2. Em geral, um R2 baixo indica que difcil prever resul
tados individuais sobre y com muita preciso, algo que estudaremos com mais detalhes no Captulo 6.
No exemplo da priso, o R 2 pequeno reflete algo sobre o qual suspeitamos nas cincias sociais: geral
mente, muito difcil prever o comportamento individual.
em que o smbolo grfico sobre as estimativas utilizado para distingui-las das estimativas de MQO
obtidas juntamente com o intercepto [como em (3.11)]. Em (3.30), quando x, = 0, x2 = 0,.... xk = 0, o
80 Introduo Econometria Editora Thomson
valor previsto zero. Nesse caso, diz-se que /8,, /3t so as estimativas de MQO da regresso de y
sobre x,, x2, ..., xk atravs da origem.
As estimativas de MQO em (3.30), como sempre, minimizam a soma dos resduos quadrados, mas
com o intercepto igualado a zero. Voc deve estar prevenido de que as propriedades de MQO que deri
vamos anteriormente no se mantm mais para a regresso atravs da origem. Em particular, os resduos
de MQO no tm mais uma mdia amostrai zero. Alm disso, se R2 for definido como 1 SQR/SQT,
n
em que SQT est dado em (3.24) e SQR agora 2 (v, jS, xn ... /3t xn y . ento R2 pode ser, de
/= i
fato, negativo. Isso significa que a mdia amostrai, y, explica mais da variao em y, do que as vari
veis explicativas.
Devemos incluir um intercepto na regresso ou devemos concluir que as variveis explicativas
explicam fracamente y. A fim de sempre ter um R-quadrado no-negativo, alguns economistas prefe
rem calcular R2 como o quadrado do coeficiente de correlao entre os valores reais e estimados de y,
como em (3.29). (Nesse caso, o valor estimado mdio deve ser calculado diretamente, j que ele no
mais igual a y.) Entretanto, no h um conjunto de regras sobre como calcular o R-quadrado para a
regresso atravs da origem.
Uma desvantagem sria com a regresso atravs da origem que, se o intercepto /30 for diferente
de zero no modelo populacional, ento os estimadores dos parmetros de inclinao sero viesados. O
vis pode ser severo em alguns casos. O custo de estimar um intercepto quando /30 realmente zero
que as varincias dos estimadores de inclinao de MQO so maiores.
As vezes, precisamos escrever a equao de uma observao particular i: para uma observao
extrada aleatoriamente da populao, temos
(3.32}
0 termo w, contm os fatores no-observveis para o diretor executivo i que afetam seu salrio. Nas
aplicaes, usualmente mais fcil escrever o modelo na forma populacional, como em (3.31). Ela
menos desordenada e enfatiza que estamos interessados em estimar a relao populacional.
A luz do modelo (3.31), os estimadores de MQO /30, j8,, /32, ..., f$k da regresso de y sobre xu ...,
xk so agora considerados estimadores de /30, /3,, ..., [3k. Vimos, na Seo 3.2, que MQO escolhe as
estimativas de uma amostra particular, de modo que os resduos sejam, em mdia, iguais a zero e a
correlao amostrai entre cada varivel independente e os resduos seja zero. Para que MQO seja no-
viesado, preciso que a verso populacional dessa condio seja verdadeira.
{ h i p t e s e r l m . 3 (m d ia c o n d ic io n a l z e r o )
0 erro u tem um valor esperado igual a zero, dados quaisquer valores das variveis independentes. Em outras
palavras,
E(k|*,,x2..... x k) = 0. (3.34)
Uma maneira como a hiptese RLM.3 pode ser violada quando a relao funcional entre as
variveis explicadas e explicativas est mal-especificada na equao (3.31): por exemplo, se esquece-
82 Introduo Econometria Editora Thomson
mos de incluir o termo quadrtico rend2 na funo consumo cons = (it) + (3, rend + (32rend2 + u
quando estimamos o modelo. Outra forma funcional mal-especificada ocorre quando usamos o nvel
da varivel e, de fato, o log da varivel que aparece no modelo populacional, ou vice-versa. Por exem
plo, se o modelo verdadeiro tiver log (salrio) como varivel dependente, mas usarmos salrio como
varivel dependente em nossa anlise de regresso, ento os estimadores sero viesados. Intuitiva-
mente, isso deveria ser muito claro. No Captulo 9 discutiremos maneiras de detectar a m especifica
o da forma funcional.
Omitir um fator importante que est correlacionado com qualquer uma das variveis jc,, x 2, ..., xk
faz com que a hiptese RLM.3 tambm no se sustente. Com a anlise de regresso mltipla, somos
capazes de incluir muitos fatores entre as variveis explicativas e, por isso, variveis omitidas so
menos provveis de serem um problema na anlise de regresso mltipla do que na anlise de regres
so simples. No obstante, em qualquer aplicao, h sempre muitos fatores que, devido limitao de
dados ou ignorncia deles, no somos capazes de incluir. Se acharmos que esses fatores devem ser
controlados e que eles esto correlacionados com uma ou mais variveis independentes, ento a
hiptese RLM.3 ser violada. Posteriormente, derivaremos esse vis.
H outros modos pelos quais u pode estar correlacionado com uma varivel explicativa. No
Captulo 15 discutiremos o problema do erro de medida em uma varivel explicativa. No Captulo 16
cobriremos o problema, conceitualmente mais difcil, em que uma ou mais variveis explicativas
determinada conjuntamente com y. Vamos postergar nosso estudo desses problemas at que tenhamos
um domnio firme da anlise de regresso mltipla sob um conjunto ideal de hipteses.
Quando a hiptese RLM.3 se mantm, dizemos frequentemente que temos variveis explicativas
exgenas. Se Xj for correlacionado com u por alguma razo, ento se diz que a , uma varivel expli
cativa endgena. Os termos exgena e endgena originaram-se da anlise de equaes simult
neas (veja Captulo 16), mas o significado do termo varivel explicativa endgena evoluiu e passou
a incluir qualquer caso em que uma varivel explicativa pode estar correlacionada com o termo erro.
A ltima hiptese de que precisamos para mostrar que MQO no-viesado assegura que os esti
madores de MQO so, realmente, bem definidos. Para a regresso simples, precisamos assumir que a
nica varivel independente no era constante na amostra. A hiptese correspondente para a anlise de
regresso mltipla mais complicada.
esperamos, com certeza, que gasto e rendfam sejam correlacionados: distritos escolares com rendas
familiares mdias altas tendem a gastar mais em educao por estudante. De fato, a principal motiva
o para incluir rendfam na equao que suspeitamos que ela seja correlacionada com gasto, e,
desse modo, gostaramos de mant-la fixa na anlise. A hiptese RLM.4 somente exclui a correlao
perfeita entre gasto e rendfam em nossa amostra. Teramos muito azar se obtivssemos uma amostra
em que os gastos por estudante fossem perfeitamente correlacionados com a renda familiar mdia.
Porm, espera-se que haja alguma correlao talvez uma quantidade substancial e certamente
ela permitida.
A maneira mais simples como duas variveis independentes podem ser perfeitamente correla
cionadas quando uma varivel um mltiplo constante da outra. Isso pode acontecer quando um
pesquisador, inadvertidamente, coloca a mesma varivel medida em unidades diferentes dentro da
equao de regresso. Por exemplo, ao estimar a relao entre consumo e renda, no faz sentido
incluir como variveis independentes a renda mensurada em dlares e a renda mensurada em milha
res de dlares. Uma delas redundante. Que sentido faria manter a renda mensurada em dlares fixa,
enquanto a renda mensurada em milhares de dlares varia?
J sabemos que diferentes funes no-lineares da mesma varivel podem aparecer entre os
regressores. Por exemplo, o modelo cons = (3n + (31rend + fi2 rend2 + u no viola a hiptese RLM.4:
ainda que x 2 = rend2 seja uma funo exata de x, = rend, rend2 no uma funo linear de rend.
Incluir rend2 no modelo uma maneira til de generalizar a forma funcional, diferentemente de incluir
a renda mensurada em dlares e em milhares de dlares.
O senso comum nos diz para no incluir a mesma varivel explicativa medida em diferentes
unidades na mesma equao de regresso. H tambm maneiras mais sutis de uma varivel indepen
dente poder ser um mltiplo de outra. Suponha que gostaramos de estimar uma extenso da funo de
consumo de elasticidade constante. Poderia parecer natural especificar um modelo tal como
a fim de isolar os efeitos dos gastos de cada candidato e da quantidade total de gastos. No entanto, esse
modelo viola a hiptese RLM.4, porque x3 = x x + ar2 por definio. Tentar interpretar essa equao ao
estilo ceteris paribus revela o problema. Supe-se que o parmetro de /3, na equao (3.36) mea o
efeito de um aumento de um dlar nos gastos do Candidato A sobre os votos do Candidato A, manten
do os gastos do Candidato B e os gastos totais fixos. Isso uma tolice, pois, se gastoB e totalgasto
forem mantidos fixos, no podemos aumentar gastoA.
A soluo para a colinearidade perfeita em (3.36) simples: retire qualquer uma das trs vari
veis do modelo. Provavelmente, tiraramos totalgasto, e conseqentemente o coeficiente de gastoA
mensuraria o efeito de aumentar os gastos de A sobre a percentagem de votos recebidos por A, man
tendo os gastos de B fixos.
O exemplo anterior mostra que a hiptese RLM.4 pode ser violada se no formos cuidadosos ao
especificar nosso modelo. Essa hiptese tambm no se mantm se o tamanho da amostra, n, muito
pequeno em relao ao nmero de parmetros que so estimados. No modelo de regresso geral da
equao (3.31), h k + 1 parmetros, e RLM.4 no se mantm se n < k + 1. Intuitivamente, isso faz
sentido: para estimar k + 1 parmetros, necessitamos de pelo menos k + 1 observaes. No surpreen
dentemente, melhor ter tantas observaes quanto possvel, algo que veremos em nossos clculos da
varincia na Seo 3.4.
No exemplo anterior, se usarmos como variveis explicativas g a sto A , gastoB e p a rtA , em que p a rtA =
]0 0 -{g a s to A /to ta lg a s to ) a participao percentual dos gastos totais de campanha feitos pelo Candidato
A, isso viola a hiptese RLM.4?
T E O R E M A 3 . 1 ( I N E X I S T N C I A D E V I S D E M Q O )
m p = I3j , j = 0 , l , . . . , k , (3.37)
para qualquer valor do parmetro populacional fy . Em outras palavras, os estimadores de MQO so estima
dores no-viesados dos parmetros da populao.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 85
Em nossos exemplos empricos anteriores, a hiptese RLM.4 foi satisfeita (visto que fomos
capazes de calcular as estimativas de MQO). Alm disso, em sua maior parte, as amostras so aleato
riamente escolhidas de uma populao bem-definida. Se acreditamos que os modelos especificados
esto corretos sob a hiptese fundamental RLM.3, ento podemos concluir que MQO no-viesado
nesses exemplos.
Como estamos nos aproximando do ponto em que podemos usar a regresso mltipla no trabalho
emprico til lembrar o significado de inexistncia de vis. E tentador, nos exemplos como o da equa
o do salrio em (3.19), dizer algo como 9,2% uma estimativa no-viesada do retomo da educa
o. Como sabemos, uma estimativa no pode ser viesada: uma estimativa um nmero fixo, obtido
de uma amostra particular, usualmente diferente do parmetro populacional. Quando dizemos que
MQO no-viesado sob as hipteses RLM. 1 a RLM.4, estamos dizendo que o procedimento pelo qual
as estimativas de MQO foram obtidas no-viesado, e tal procedimento visto como algo aplicado em
todas as amostras aleatrias possveis. Esperamos que tenhamos obtido uma amostra que nos d uma
estimativa prxima do valor da populao, mas, infelizmente, isso no pode ser garantido.
e esse modelo satisfaz as hipteses RLM.l a RLM.4. Entretanto, x 3 no tem efeito sobre v aps x, e x 2
terem sido controlados, o que significa que = 0. A varivel x 3 pode ou no ser correlacionada com
Xj e x2; 0 que importa que, uma vez que x, e x 2 estejam controlados, x 3 no tem efeito sobre y. Em
termos de esperanas condicionais, E(y|xl,x 2 ,x3) = Evlx,,x2) = /30 + /3,x , + /32x2.
Como no sabemos que /33 = 0, somos inclinados a estimar a equao com x3:
Inclumos a varivel irrelevante, x3, em nossa regresso. Qual o efeito de incluir x 3 em (3.39), quan
do seu coeficiente no modelo populacional (3.38) zero? Em termos da inexistncia de vis de /, e
jiy no h nenhum efeito. Essa concluso no requer nenhuma derivao especial, j que ela decorre
imediatamente do Teorema 3.1. Lembre-se, a inexistncia de vis significa E/3) = (f para qualquer
valor de fy, incluindo /3; = 0. Assim, podemos concluir que E(/30) = /3(), EQ3,) = f i h E(/3Q = /L e
E(j33) = 0 (para quaisquer valores de /30, /3, e j32). Mesmo que S3, por si mesmo, nunca seja exa
tamente zero, seu valor mdio obtido de muitas amostras aleatrias ser zero.
A concluso do exemplo anterior muito mais geral: incluir uma ou mais variveis irrelevantes
no modelo de regresso mltipla, ou superespecificar o modelo, no afeta a inexistncia de vis dos
estimadores de MQO. Isso significa que incluir variveis irrelevantes incuo? No. Como veremos
na Seo 3.4, incluir variveis irrelevantes pode ter efeitos indesejveis sobre as varincias dos esti
madores de MQO.
86 Introduo Econometria Editora Thomson
y = o + \X\ + 2x2 + K,
(3.40)
y = P o + P ix v (3 -41)
Usamos o smbolo grfico em vez de A para enfatizar que j3, vem de um modelo subespecificado.
Ao aprender, pela primeira vez, o problema de varivel omitida, pode ser difcil para o estudante
distinguir entre o modelo verdadeiro subjacente, (3.40) nesse caso, e o modelo que realmente estima
mos, capturado pela regresso em (3.41). Pode parecer bobagem omitir a varivel x 2 se ela pertence ao
modelo, mas freqentemente no temos escolha. Por exemplo, suponha que salrioh seja determinado
pela equao
onde v = f}2aptid + u. O estimador de /l, da regresso simples de salrioh sobre educ o que esta
mos chamando /3r
Vamos derivar o valor esperado de j3, condicionado aos valores amostrais de x , e x2. Derivar essa
esperana no difcil, pois /3, exatamente o estimador de inclinao de MQO de uma regresso
simples, e j estudamos esse estimador extensivamente no Captulo 2. A diferena aqui que deve
mos analisar suas propriedades quando o modelo de regresso simples mal-especificado devido a
uma varivel omitida.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 87
2 (*/i - *i )
/=1
x = (3.43)
2 (* *i )2
/=1
O prximo passo o mais importante. Visto que (3.40) o modelo verdadeiro, escrevemos y para cada
observao i como
y, = + ,x n + 2x,2 + u, (3.44)
(e no yt = f30 + (3\Xn + un j que o modelo verdadeiro contm x2). Seja SQT, o denominador em
(3.43). Se inserirmos em (3.43) o de (3.44), o numerador em (3.43) passa a ser
Se dividirmos (3.45) por SQT,, considerarmos a esperana condicionada aos valores das variveis
independentes e usarmos E(u,) = 0, obteremos
2 (* - x {) x i2
E(/3t) = / 3 , ---------------- (3.46)
2 (* - *i >2
i=1
x 2 = S 0 + SjX,. (3.47)
o que implica que o vis em /3, E(/3,) /3, = j82 <5,. Essa expresso chamada frequentemente de
vis de varivel omitida.
Da equao (3.48), vemos que h dois casos em que jS, no-viesado. O primeiro bastante
bvio: se /32 = 0 de modo que x 2 no aparece no modelo verdadeiro (3.40) , ento /3, no-vie
sado. J sabemos isso da anlise de regresso simples do Captulo 2. O segundo caso mais interes
sante. Se S, = 0 , ento /3, no-viesado para /3,, mesmo se j82 * 0.
Como Sf a covarincia amostrai entre x, e x 2 sobre a varincia amostrai de x u S, = 0 se, e
somente se, x, e x2 forem no-correlacionados na amostra. Assim, temos a importante concluso de
que, se x, e x 2 forem no-correlacionados na amostra, ento /3, no-viesado. Isso no surpreen
dente: na Seo 3.2, mostramos que o estimador da regresso simples f3{ e o estimador da regresso
mltipla f$! so iguais quando x x e x 2 forem no-correlacionados na amostra. [Podemos tambm mos
trar que /3, no-viesado sem condicionar a xi2 se E(x2lxt) = E(x2); ento, para a estimao de /3,,
deixar x 2 no termo erro no viola a hiptese de mdia condicional zero do erro, uma vez que ajusta
mos o intercepto.]
Quando x, e x 2 forem correlacionados, <5, tem o mesmo sinal da correlao entre x, e x2: <5, >
0 se X, e x2 forem positivamente correlacionados, e 6 , < 0 se x, e x 2 forem negativamente correlacio
nados. O sinal do vis em depende tanto do sinal de ]32 como de <5, e est resumido na Tabela 3.2
para os quatro casos possveis quando h vis. A Tabela 3.2 justifica um estudo cuidadoso. Por exem
plo, o vis em )31 positivo se (i2 > 0 (x2 tem um efeito positivo sobre y) e x, e x2 so positivamen
te correlacionados; o vis negativo se /32 > 0 e x, e x 2 so negativamente correlacionados, e assim
por diante.
Tabela 3.2_____________________________________________________________________________
Sumrio do Vis em /3, quando xz Omitida na Estimao da Equao (3.40)
A Tabela 3.2 resume a direo do vis, mas o tamanho do vis tambm muito importante. Um
vis pequeno de qualquer dos dois sinais no precisa ser causa de preocupao. Por exemplo, se o retor
no da educao formal de 8 ,6 % na populao e o vis do estimador de MQO de 0,1% (um dcimo
de um ponto percentual), ento no precisaramos ficar muito preocupados. De outro lado, um vis da
ordem de trs pontos percentuais seria muito mais srio. O tamanho do vis determinado pelos tama
nhos de / ? 2 eS j.
Na prtica, como /32 um parmetro populacional desconhecido, no podemos estar certos se jS2
positivo ou negativo. Entretanto, temos geralmente uma boa idia sobre a direo do efeito parcial de
x 2 sobre y. Alm disso, ainda que o sinal da correlao entre x, e x 2 no possa ser conhecido se x 2 no
observado, em muitos casos, podemos fazer uma suposio criteriosa sobre se x, e x 2 so positiva ou
negativamente correlacionados.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 89
Na equao do salrio (3.42), por definio, mais aptido conduz a uma produtividade maior e,
portanto, a salrios maiores: f32 > 0. H tambm razes para acreditar que educ e aptid sejam positi
vamente correlacionados: em mdia, indivduos com mais aptido inata escolhem nveis maiores de
educao formal. Assim, as estimativas de MQO da equao de regresso simples do salrioh = /30 +
$ xeduc + v so, em mdia, muito grandes. Isso no significa que a estimativa obtida de nossa amos
tra seja enorme. Somente podemos dizer que, se coletarmos muitas amostras aleatoriamente e obtiver
mos as estimativas da regresso simples a cada vez, a mdia dessas estimativas ser maior que /3,.
EXEMPLO 3.6
(Equao do Salrio Horrio)
j Suponha que o modelo log(salrioh) = /30 + fi^ e d u c + /32apf/cy + u satisfaa as hipteses RLM.1 a
RLM.4. 0 conjunto de dados no arquivo WAGE1.RAW no contm dados sobre aptido, de modo que esti-
j mamos jS, a partir da regresso simples
: Esse somente o resultado de uma nica amostra, de modo que no podemos dizer que 0,083 maior que
I /S o retorno verdadeiro da educao poderia ser menor ou maior que 8,3% (nunca saberemos com certeza).
! Entretanto, sabemos que a mdia dos estimadores de todas as amostras aleatrias seria bastante grande.
Como um segundo exemplo, suponha que, no nvel fundamental do ensino, a nota mdia dos estu
dantes de um exame padronizado seja determinado por
em que gasto o gasto pblico por estudante, e taxpob a taxa de pobreza das crianas da escola.
Usando dados do distrito da escola, temos somente observaes da percentagem de estudantes com
uma nota de aprovao e gastos pblicos por estudante; no temos informaes sobre taxas de pobre
za. Assim, estimamos /3, a partir da regresso simples de notmed sobre gasto.
Podemos obter, uma vez mais, o vis provvel em /3,. Primeiro, fi2 provavelmente negativo: h
ampla evidncia de que crianas que vivem na pobreza tm, em mdia, notas mais baixas em testes
padronizados. Segundo, o gasto pblico mdio por estudante , provavelmente, negativamente corre
lacionado com a taxa de pobreza: quanto maior a taxa de pobreza menor o gasto pblico mdio por
estudante, de modo que Corrix,,x2) < 0. De acordo com a Tabela 3.2, /3 ter um vis positivo. Essa
observao tem implicaes importantes. Pode ser que o efeito verdadeiro do gasto pblico fosse zero:
isto , /3, = 0 . Entretanto, a estimativa de /3, da regresso simples ser, geralmente, maior que zero, e
isso poderia nos levar a concluir que os gastos pblicos so importantes quando eles no so.
Ao ler e ao fazer trabalhos empricos em economia, importante dominar a terminologia associa
da aos estimadores viesados. No contexto de omisso de uma varivel do modelo (3.40), se E(/3,) > /3,,
ento dizemos que /3, tem um vis para cima. Quando E(/3,) < /3,, yS, tem um vis para baixo. Essas
definies so as mesmas, seja /S, positivo ou negativo. A expresso viesado para zero refere-se aos
casos em que E(/3,) est mais prxima de zero do que de /3,. Portanto, se /3, for positivo, /3, ser vie
sado para zero se ele tiver um vis para baixo. De outro lado, se /3, < 0, /3, ser viesado para zero se
ele tiver um vis para cima.
90 Introduo Econometria Editora Thomson
9 = o + i x i + i xr (3.50)
Agora suponha que x2 e x 3 sejam no-correlacionados, mas que x, correlacionado com x3. Em outras
palavras, xj correlacionado com a varivel omitida, mas x 2 no . E tentador pensar que, embora pro
vavelmente /3, seja viesado com base na derivao da subseo anterior, /3, seja no-viesado, pois x 2
no-correlacionado com x (. Infelizmente, esse no , geralmente, o caso: normalmente, tanto j3, como
/32 sero viesados. A nica exceo a isso ocorre quando x t e x 2 tambm so no-correlacionados.
Mesmo em um modelo razoavelmente simples como o apresentado, pode ser difcil obter a dire
o do vis em /3, e (32. Isso se deve ao fato de que x,, x2 e x 3 podem estar correlacionados aos pares.
Entretanto, uma aproximao , frequentemente, til na prtica. Se assumirmos que x, e x 2 so no-
correlacionados, podemos estudar o vis em (3I como se x 2 estivesse ausente dos modelos populacional
e estimado. De fato, quando x, e x 2 so no-correlacionados, pode-se mostrar que
n
2 (Ai - )a 3
E(/3,) = jS, + /S3 ^ ----------------
(Ai - A )2
i= i
Essa equao exatamente igual a (3.46), mas 0 3 substitui 0 2, e x 3 substitui x2. Portanto, o vis em /3,
obtido ao se substituir 0 2 por /33 e x2 por x 3 na Tabela 3.2. Se 0 3 > 0 e Corr(xi,x3) > 0, o vis em
/3j positivo, e assim por diante.
Como um exemplo, suponha que acrescentamos exper ao modelo do salrio:
Se aptid for omitida do modelo, ambos os estimadores de (3, e (32 sero viesados, mesmo se assumir
mos que exper no-correlacionado com aptid. Estamos principalmente interessados no retomo da
educao formal, de modo que seria bom se pudssemos concluir que /3, tem um vis para cima ou
para baixo devido omisso da aptido. Essa concluso no possvel sem hipteses adicionais.
Como uma aproximao, suponhamos que, alm de exper e aptid serem no-correlacionadas, educ e
exper tambm sejam no-correlacionadas. (Na realidade, elas so negativamente correlacionadas.)
Como 0 3 > 0 e educ e aptid so positivamente correlacionadas, f3 teria um vis para cima, exata
mente como se exper no estivesse no modelo.
O raciocnio usado no exemplo anterior , muitas vezes, compreendido como um guia aproxima
do para obter o vis provvel dos estimadores em modelos mais complicados. Geralmente, o foco est
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 91
na relao entre uma varivel explicativa particular, por exemplo x t, e o fator omitido fundamental.
Estritamente falando, ignorar todas as outras variveis explicativas uma prtica vlida somente quan
do cada uma delas no-correlacionada com x,, mas essa ainda uma orientao til. O Apndice 3 A
(disponvel no site de Thomson) contm uma anlise mais cuidadosa do vis de varivel omitida com
mltiplas variveis explicativas.
H I P T E S E R L M . 5 ( H O M O S C E D A S T I C I D A D E )
Var(u|x1,...,xlt) = cr2.
A hiptese RLM.5 significa que a varincia do termo erro, u, condicionada s variveis explica
tivas, a mesma para todas as combinaes de resultados das variveis explicativas. Se essa hiptese
violada, o modelo exibe heteroscedasticidade, exatamente como no caso de duas variveis.
Na equao
a homoscedasticidade requer que a varincia do erro no-observado u no dependa dos nveis de edu
cao, experincia ou permanncia. Isto ,
Se a varincia varia com qualquer uma das trs variveis explicativas, ento a heteroscedasticidade est
presente.
As hipteses RLM. 1 a RLM.5 so, em conjunto, conhecidas como as hipteses de Gauss-Markov
(para a regresso de corte transversal). At agora, nossas asseres sobre as hipteses so adequadas
somente quando aplicadas anlise de corte transversal com amostragem aleatria. Como veremos, as
hipteses de Gauss-Markov para a anlise de sries de tempo e para outras situaes, como a anli
se de dados de painel so mais difceis de se manterem, embora haja muitas similaridades.
Na discusso a seguir, usaremos o smbolo x para representar o conjunto de todas as variveis
independentes, (xt, ..., xk). Assim, na regresso do salrio horrio com educ, exper e perm como vari
veis independentes, x = (educ, exper, perm). Conseqentemente, podemos escrever as hipteses
RLM.l e RLM.3 como
e a hiptese RLM.5 a mesma que Var(_\jx) = cr2. Expressar as hipteses desse modo ilustra como a
hiptese RLM.5 difere muito da hiptese RLM.3. Esta diz que o valor esperado de y, dado x, linear
nos parmetros, mas ele certamente depende de x h x2, ..., xk. A hiptese RLM.5 diz que a varincia de
y, dado x, no depende dos valores das variveis independentes.
Podemos obter, agora, as varincias dos ., que uma vez mais, esto condicionadas aos valores
amostrais das variveis independentes. A prova est no apndice deste captulo.
T E O R E M A 3 . 2 ( V A R I N C I A S A M O S T R A I S D O S E S T I M A D O R E S D E I N C L I
N A O D E M Q O )
Sob as hipteses RLM.1 a RLM.5, condicionadas aos valores amostrais das variveis independentes,
o2
Var ( = (3.51)
SQ Tjd - Rj)
para j = 1, 2,..., k, em que SQT;. = ^ (*, xp 2 a variao amostrai total em x;, e Rj o R-quadra-
/= i
do da regresso x. sobre todas as outras variveis independentes (incluindo um intercepto).
Antes de estudarmos a equao (3.51) mais detalhadamente, importante saber que todas as
hipteses de Gauss-Markov so usadas na obteno dessa frmula. Embora no necessitemos da hip
tese de homoscedasticidade para concluir que MQO no-viesado, precisamos dela para validar a
equao (3.51).
O tamanho de Var(/3) importante na prtica. Uma varincia maior significa um estimador
menos preciso, e isso se traduz em intervalos de confiana maiores e testes de hipteses menos acu
rados (como veremos no Captulo 4). Na prxima subseo, discutiremos os elementos que com
preendem (3.51).
A VARINCIA DO ERRO, a 2. Da equao (3.51), um cr2 maior significa varincias maiores dos esti-
madores de MQO. Isso no totalmente surpreendente: mais rudo na equao (um cr2 maior) toma
mais difcil estimar o efeito parcial de qualquer uma das variveis independentes sobre y, e isso refle
tido nas varincias maiores dos estimadores de inclinao de MQO. Visto que cr2 uma caracterstica
da populao, ele no tem nada a ver com o tamanho da amostra. Ele o componente de (3.51) que
desconhecido. Veremos mais adiante como obter um estimador no-viesado de cr2.
Para uma dada varivel dependente y, h de fato somente uma maneira de reduzir a varincia do
erro, que adicionar mais variveis explicativas equao (retirar alguns fatores do termo erro). Isso
nem sempre possvel, nem sempre desejvel, por razes discutidas posteriormente neste captulo.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 93
A VARIAO AMOSTRAL TOTAL EM x]r SQT). Da equao (3.51), vemos que quanto maior a
variao total em x,-, menor Var(/,), Assim, tudo o mais sendo igual para estimar /3, preferimos ter
tanta variao amostrai em x,- quanto possvel. J descobrimos isso no caso da regresso simples, no
Captulo 2. Embora raramente seja possvel escolher os valores amostrais das variveis independentes,
h uma maneira de aumentar a variao amostrai em cada uma das variveis independentes: aumentar
o tamanho da amostra. De fato, na amostragem aleatria de uma populao, SQT, aumenta sem limi
te quando o tamanho da amostra toma-se maior. Esse o componente da varincia que depende siste
maticamente do tamanho da amostra.
Quando SQT, pequeno, Var(/3,) pode ficar muito grande, mas um SQT, pequeno no uma vio
lao da hiptese RLM.4. Tecnicamente, quando SQT, tende a zero, Var(j3,) aproxima-se do infinito.
0 caso extremo de nenhuma variao amostrai em x,, SQT, = 0, no permitido pela hiptese RLM.4.
4, para a inferncia estatstica, o que essencialmente importa quanto /3r grande com relao a
seu desvio-padro.
Assim como um valor grande de Rj pode causar uma Var(j8 .) grande, um valor pequeno de SQTy
tambm pode fazer com que Var(/3.) seja grande. Portanto, um tamanho pequeno da amostra pode tam
bm levar a varincias amostrais grandes. Preocupar-se com graus elevados de correlao entre vari
veis independentes da amostra no , de fato, diferente de se preocupar com um tamanho pequeno da
amostra: ambos funcionam para aumentar Var(/3p.
O famoso econometrista da Universidade de Wisconsin Arthur Goldberger, reagindo obsesso
dos econometristas pela multicolinearidade, criou (jocosamente) o termo micronumerosidade, que ele
define como o problema do tamanho pequeno da amostra. [Para uma discusso interessante sobre
multicolinearidade e micronumerosidade, veja Goldberger (1991).]
Embora o problema da multicolinearidade no possa ser claramente definido, uma coisa clara:
tudo mais sendo igual, para estimar /3;, melhor ter menos correlao entre ,v; e as outras variveis
independentes. Essa observao muitas vezes leva a uma discusso de como resolver o problema da
multicolinearidade. Nas cincias sociais, em que somos geralmente coletores passivos de dados, no
h uma boa maneira de reduzir as varincias dos estimadores no-viesados que no seja coletar mais
dados. Para um determinado conjunto de dados, podemos tentar, num esforo para reduzir a multico
linearidade, suprimir outras variveis independentes do modelo. Infelizmente, suprimir uma varivel
que pertence ao modelo populacional pode levar vis, como vimos na Seo 3.3.
Neste ponto, talvez um exemplo ajude a esclarecer algumas das questes aqui levantadas relativas
multicolinearidade. Suponha que estamos interessados em estimar o efeito de vrias categorias de
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 93
despesas de escolas sobre o desempenho de estudantes. provvel que as despesas com salrios de
professores, materiais institucionais, atletismo etc. estejam altamente correlacionadas: escolas mais
ricas tendem a gastar mais com tudo, e escolas mais pobres gastam menos com tudo. No surpreen
dentemente, pode ser difcil estimar o efeito de qualquer categoria de despesa especfica sobre o
desempenho dos estudantes quando h pouca variao em uma categoria que no pode ser, em grande
medida, explicada por variaes das outras categorias de despesas (isso leva a um Rj alto para cada
uma das variveis de despesas). Esses problemas de multicolinearidade podem ser mitigados ao cole
tar mais dados mas assim, em certo sentido, ns mesmos nos impusemos o problema: estamos formu
lando questes que podem ser sutis demais para que os dados disponveis as respondam com alguma
preciso. Provavelmente, podemos fazer algo muito melhor mudando o escopo da anlise e agrupando
todas as categorias de despesa em uma nica categoria, desde que no mais estivssemos tentando esti
mar o efeito parcial de cada categoria separadamente.
Outro ponto importante que um elevado grau de correlao entre certas variveis independentes
pode ser irrelevante no que diz respeito a quo bem podemos estimar outros parmetros do modelo.
Por exemplo, considere um modelo com trs variveis independentes:
em que x2 e x 2 so altamente correlacionados. Ento, Var(/32) e Var( /3,) podem ser grandes. Mas o
valor da correlao entre x 2 e x, no tem efeito direto sobre Var( /3,). De fato, se .v, no-correlacio-
nado com x 2 e x,, ento R] = 0 e Var(/3,) = crVSQT,, independentemente da quantia de correlao
existir entre x 2 e x v Se j8 , o parmetro de interesse, realmente no devemos nos preocupar com o
valor da correlao entre x 2 e x,.
Suponha que voc postula um modelo que explica a nota do exame final em termos da freqncia s aulas.
Assim, a varivel dependente a nota do exame final, e a principal varivel explicativa o nmero de aulas
freqentadas. A fim de controlar as aptides dos estudantes e pelos esforos fora da sala de aula, voc inclui
entre as variveis explicativas a nota acumulada durante todo o curso, a nota do teste de avaliao de co
nhecimentos para ingresso em curso superior e as medidas do desempenho do estudante no ensino mdio.
Algum diz: "Voc no pode esperar aprender nada com esse exerccio, pois todas essas variveis so, pro
vavelmente, altamente colineares". Qual seria sua resposta?
y = 0O + 0 1 * 1 + 0 2 * 2 + "
9 0 o 0 i *i 0 2 * 2" (3.S2)
Em outras palavras, inclumos x2, juntamente com x,, no modelo de regresso. O estimador f3 obti
do ao omitir x2 do modelo e computando uma regresso simples de y sobre x ,:
y = 00 + 01*1- (3.53)
Quando /32 * 0, a equao (3.53) exclui uma varivel relevante do modelo e, como vimos na Seo 3.3,
isso induz um vis em f i ], a no ser que x, e x 2 sejam no-correlacionados. De outro lado, /3, no-
viesado para jSj, para qualquer valor de j32, incluindo (i2 = 0. Segue-se que, se o vis for usado como
nico critrio, f i t prefervel a p r
A concluso de que /3j sempre prefervel a /3, no se sustenta quando trazemos a varincia para
dentro da anlise. Condicionando aos valores de x, e x 2 na amostra, temos, de (3.51),
em que SQT, a variao total em x,, e /?, o /{-quadrado da regresso de x, sobre x2. Alm disso,
uma simples modificao da prova para a regresso de duas variveis do Captulo 2 mostra que
Comparar (3.55) a (3.54) mostra que Var(/3,) sempre menor que Var(0 ,), a menos que x, e x2 sejam
no-correlacionados na amostra, caso em que os dois estimadores /3, e /8 , so os mesmos. Ao assumir
que X] e x2 so no-correlacionados, podemos ter as seguintes concluses:
leva a um estimador menos eficiente de /3,. O custo de incluir uma varivel irrelevante no modelo
uma varincia maior do estimador de
O caso em que / ? 2 * 0 mais difcil. Omitindo x 2 do modelo leva a um estimador viesado de
(3l. Tradicionalmente, econometristas tm sugerido comparar o tamanho provvel do vis devido
omisso de x 2 com a reduo na varincia resumida no tamanho de R\ para decidir se x 2 deve
ser includo. Entretanto, quando /S2 * 0, h duas razes favorveis para incluir x 2 no modelo. A mais
importante delas que qualquer vis em /3, no diminui quando o tamanho da amostra cresce; de
fato, o vis no segue, necessariamente, qualquer padro. Portanto, podemos em geral pensar o vis
como mais ou menos o mesmo para qualquer tamanho de amostra. De outro lado, Var(/3,) e Var(/3,)
tendem a zero quando n torna-se grande, o que significa que a multicolinearidade induzida pela adi
o de x2 toma-se menos importante quando o tamanho da amostra cresce. Em amostras grandes,
preferiramos /3r
A outra razo para preferir mais sutil. A frmula da varincia em (3.55) est condicionada
aos valores de x, e x 2 na amostra, o que oferece o melhor cenrio para /3,. Quando f}2 * 0, a varin
cia de /3j condicionada somente ax , maior que aquela apresentada em (3.55). Intuitivamente, quan
do /32 ^ 0 e x 2 excludo do modelo, a varincia do erro aumenta porque o erro efetivamente contm
parte de x2. Mas, (3.55) ignora o aumento da varincia do erro porque ela trata ambos os regressores
como no-aleatrios. Uma discusso completa de quais variveis independentes deveriam ser condi
cionadas nos desviaria demais de nosso caminho. suficiente dizer que (3.55) bastante generosa
quando ela aparece para medir a preciso de j3r
i = yt - 0 0 0 1 *l - 0 2 *.-2 - - - 0A -
Parece natural estimar a 2 ao substituir n, por u.. No caso da regresso simples, vimos que isso leva a
um estimador viesado. O estimador no-viesado de cr2 no caso geral da regresso mltipla
gl = n (k + 1 )
(3.57}
= (nmero de observaes) (nmero de parmetros estimados)
Essa a maneira mais fcil de calcular os graus de liberdade em uma aplicao particular: conte o
nmero de parmetros, incluindo o intercepto, e subtraia esse valor do nmero de observaes. (No
caso raro em que o intercepto no estimado, o nmero de parmetros diminui em um.)
Tecnicamente, a diviso por n k 1 em (3.56) proveniente do fato de que o valor esperado
da soma dos resduos quadrados E(SQR) = (n k 1) cr2. Intuitivamente, podemos entender
porque o ajustamento de graus de liberdade necessrio ao retomarmos s condies de primeira
n n
ordem dos estimadores de MQO. Elas podem ser escritas como ^ ,= 0 e ^ x (m = 0, onde / = 1,
-, = 1
2,..., k. Assim, na obteno dos estimadores de MQO, k + 1 restries so impostas sobre os resduos
de MQO. Isso significa que, dados n (k + 1) dos resduos, os k + 1 resduos restantes so conhe
cidos: h somente n (k + 1) graus de liberdade nos resduos. (Isso pode ser contrastado com os
erros ur os quais tm n graus de liberdade na amostra.)
Para referncia, vamos resumir essa discusso com o Teorema 3.3. Provamos esse teorema para o
caso da anlise de regresso simples no Captulo 2 (veja o Teorema 2.3). (No Apndice E, disponvel
no site de Thomson, dada uma prova geral, que requer lgebra matricial.)
T E O R E M A 3 . 3 ( E S T I M A D O R N O - V I E S A D O D E c r 2 )
A raiz quadrada positiva de cf2, denominada <f, chamada Erro-Padro da Regresso (EPR).
O EPR um estimador do desvio-padro do termo erro. Essa estimativa usualmente informada pelos
programas de regresso, embora ela seja chamada de nomes diferentes pelos diferentes programas.
(Alm de EPR, <x tambm chamado erro-padro da estimativa e a raiz do erro quadrado mdio.)
Observe que <f pode diminuir ou aumentar quando outra varivel independente acrescentada a
uma regresso (para uma dada amostra). Isso ocorre pois, embora SQR deva cair quando outra vari
vel explicativa adicionada, os graus de liberdade tambm diminuem em um. Como SQR est no
numerador e gl est no denominador, no podemos dizer, de antemo, qual efeito prevalecer.
Para construir intervalos de confiana e conduzir testes no Captulo 4, precisaremos estimar o des
vio-padro de jj, que exatamente a raiz quadrada da varincia:
Como a desconhecido, ele substitudo pelo seu estimador, cf. Isso nos d o erro-padro de
Assim como as estimativas de MQO podem ser obtidas para qualquer amostra dada, os erros-padro
tambm podem. Como ep(/3 ) depende de cf, o erro-padro tem uma distribuio amostrai, que desem
penhar um papel importante no Captulo 4.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 99
Devemos enfatizar algo sobre os erros-padro. Como (3.58) obtido diretamente da frmula da
varincia em (3.51), e como (3.51) se apia na hiptese de homoscedasticidade RLM.5, a frmula do
erro-padro em (3.58) no um estimador vlido de dp(/3;) se os erros exibem heteroscedasticidade.
Assim, enquanto a presena de heteroscedasticidade no causa vis emj3j, ela leva vis da frmula
usual da Varj/J,), o que invalida, portanto, os erros-padro. Isso importante porque qualquer progra
ma de regresso calcula (3.58) como o erro-padro bsico de cada coeficiente (com uma interpretao
um pouco diferente para o intercepto). Se suspeitarmos de heteroscedasticidade, ento os erros-padro
de MQO habituais no so vlidos, e alguma ao corretiva deve ser tomada. No Captulo 8 , vere
mos quais mtodos esto disponveis para trabalhar com a heteroscedasticidade.
em que cada Wy pode ser uma funo dos valores amostrais de todas as variveis independentes. Os
estimadores de MQO so lineares, como pode ser visto na equao (3.22).
Finalmente, como definir o melhor? Para o teorema corrente, o melhor definido como a
varincia menor. Dados dois estimadores no-viesados, lgico preferir aquele com a varincia menor
(veja o Apndice C, disponvel no site de Thomson).
Agora, vamos chamar de /30, jS ,,..., os estimadores de MQO do modelo (3.31) sob as hipte
ses RLM.l a RLM.5. O Teorema de Gauss-Markov diz que, para qualquer estimador /3; que
linear e no-viesado, Var(/3,) ^ Var(/3;), e a desigualdade geralmente estrita. Em outras palavras,
na classe dos estimadores lineares no-viesados, MQO tem a menor varincia (sob as cinco hipteses
de Gauss-Markov). De fato, o teorema diz mais do que isso. Se desejarmos estimar qualquer funo
linear de /3,, a combinao linear correspondente dos estimadores de MQO alcana a menor varincia
entre todos os estimadores no-viesados. Vamos concluir com um teorema, o provado no Apndice 3A,
disponvel no site da Thomson.
100 Introduo Econometria Editora Thomson
T E O R E M A 3 . 4 ( T E O R E M A D E G A U S S - M A R K O V )
Sob as hipteses RLM.1 a RLM.5, p o, p t ,..., p k so os melhores estimadores lineares no-viesados (BLUEs)
de p 0, p h p k, respectivamente.
por causa desse teorema que as hipteses RLM.l a RLM.5 so conhecidas como as hipteses de
Gauss-Markov (para a anlise de corte transversal).
A importncia do Teorema de Gauss-Markov que, quando um conjunto padro de hipteses se
mantm, no necessitamos procurar por estimadores no-viesados alternativos da forma expressa em
(3.59): nenhum ser melhor que MQO. Equivalentemente, se somos apresentados a um estimador que
tanto linear como no-viesado, ento sabemos que a varincia desse estimador pelo menos to gran
de quanto a varincia de MQO; nenhum clculo adicional necessrio para mostrar isso.
Para nossos propsitos, o Teorema 3.4 justifica o uso de MQO para estimar modelos de regresso
mltipla. Se qualquer uma das hipteses de Gauss-Markov for violada, o teorema no mais vlido.
J sabemos que a falha da hiptese de mdia condicional zero (hiptese RLM.3) faz com que MQO
seja viesado, de modo que o Teorema 3.4 tambm deixa de ser vlido. Tambm sabemos que a hete-
roscedasticidade (falha da hiptese RLM.5) no faz com que MQO seja viesado. Entretanto, MQO no
tem mais a menor varincia entre os estimadores lineares no-viesados na presena da heteroscedasti-
cidade. No Captulo 8 , analisaremos um estimador que melhora MQO quando conhecemos o tipo da
heteroscedasticidade.123456
1. O modelo de regresso mltipla nos permite, efetivamente, manter os outros fatores fixos ao exa
minarmos os efeitos de uma varivel independente particular sobre a varivel dependente. Ele permite,
explicitamente, que as variveis sejam correlacionadas.
2. Embora o modelo seja linear em seus parmetros, ele pode ser usado para modelar relaes
no-lineares ao se escolher, apropriadamente, as variveis dependente e independente.
3. O mtodo de mnimos quadrados ordinrios facilmente aplicado para estimar o modelo de re
gresso mltipla. Cada estimativa de inclinao mede o efeito parcial da varivel independente corres
pondente sobre a varivel dependente, mantendo todas as outras variveis independentes fixas.
4 . R 2 a proporo da variao amostrai da varivel dependente explicada pelas variveis indepen
dentes, e utilizado como uma medida do grau de ajuste. E importante no dar importncia demais ao
valor do R2 na avaliao de modelos economtricos.
5. Sob as primeiras quatro hipteses de Gauss-Markov (RLM.l a RLM.4), os estimadores de MQO
so no-viesados. Isso implica que incluir uma varivel irrelevante em um modelo no tem nenhum
efeito sobre a inexistncia de vis dos estimadores de intercepto e de inclinao. De outro lado, omitir
uma varivel importante faz com que MQO seja viesado. Em muitas circunstncias, a direo do vis
pode ser determinada.
6. Sob as cinco hipteses de Gauss-Markov, a varincia de um estimador de inclinao de MQO
dada por Var(/T) = cr2/[SQT;( 1 R2)]. Quando a varincia do erro cr2 cresce, o mesmo ocorre com
Var(j8 .), enquanto Var( /T) diminui quando a variao amostrai em x;, SQT;, aumenta. O termo R2
mede a magnitude da colinearidade entre x-t e as outras variveis explicativas. Quando R2 aproximas
se de um, Var( p p ilimitada.
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 101
7. Adicionar uma varivel irrelevante a uma equao geralmente aumenta as varincias dos demais
estimadores de MQO, por causa da multicolinearidade.
8. Sob as hipteses de Gauss-Markov (RLM.l a RLM.5), os estimadores de MQO so os melhores
estimadores lineares no-viesados (BLUE).
3.1 Usando os dados do arquivo GPA2.RAW sobre 4.137 estudantes de curso superior nos Estados
Unidos, estimou-se a seguinte equao por MQO:
em que nmgrad mensurada em uma escala de quatro pontos, emperc o percentil da turma de for
mados do ensino mdio (definido de modo que, por exemplo, emperc = 5 significa os cinco por
cento melhores da sala), e sat uma nota mdia ponderada de matemtica e habilidade verbal do
estudante para ingresso em curso superior.
(i) Por que faz sentido que o coeficiente de emperc seja negativo?
(ii) Qual o valor previsto de nmgrad quando emperc = 20 e sat = 1.050?
(iii) Suponha que dois alunos do ensino mdio, A e B, estejam no mesmo percentil no ensino
mdio, mas a nota sat do Estudante A foi 140 pontos maior (cerca de um desvio-padro na
amostra). Qual a diferena prevista em nmgrad para esses dois estudantes? A diferena
grande?
(iv) Mantendo emperc fixo, que diferena na nota sat levaria a uma diferena prevista de nmgrad
de 0,50? Comente sua resposta.
3.2 Os dados do arquivo WAGE2.RAW, sobre homens que trabalham, foram utilizados para estimar
a seguinte equao:
em que educ anos de escolaridade formal, irms o nmero de irmos, educm anos de escolari
dade formal da me e educp anos de escolaridade formal do pai.
(i) irms tem o efeito esperado? Explique. Mantendo educm e educp fixos, em quanto deveria
irms aumentar para reduzir os anos previstos da educao formal em um ano? (Uma respos
ta incompleta aceitvel aqui.)
(ii) Discuta a interpretao do coeficiente de educm.
(iii) Suponha que o Homem A no tenha irmos, e sua me e seu pai tenham, cada um, 12 anos
de educao formal. Suponha tambm que o Homem B no tenha irmos, e sua me e seu
pai tenham, cada um, 16 anos de educao formal. Qual a diferena prevista em anos de
educao formal entre B e A?
102 Introduo Econometria Editora Thomson
3.3 O modelo seguinte uma verso simplificada do modelo de regresso mltipla usado por Biddle
e Hamermesh (1990) para estudar a escolha entre o tempo gasto dormindo e trabalhando e para
observar outros fatores que afetam o sono:
em que dormir e trabtot (trabalho total) so mensurados em minutos por semana e educ e idade so
mensurados em anos. (Veja tambm o Problema 2.12.)
(i) Se os adultos escolhem entre dormir e trabalhar, qual sinal de ( i, ?
(ii) Que sinais voc espera que /32 e /S3 tero?
(iii) Usando os dados do arquivo SLEEP75.RAW, a equao estimada
Se algum trabalha 5 horas a mais por semana, qual a queda, em minutos, no valor esper
ado de dormir? Esse valor representa uma escolha grande?
(iv) Discuta o sinal e a magnitude do coeficiente de educ.
(v) Voc diria que trabtot, educ e idade explicam muito da variao de dormir? Quais outros
fatores poderiam afetar o tempo gasto dormindo? E provvel que eles sejam correlaciona
dos com trabio f!
3.4 O salrio inicial (mediano) para recm-formados em direito determinado pela equao
log (salrioim) = f30 + f , Isat + f}2nmgrad + f33log(volbib) + (i4\og(custo) + (35rank + u,
em que Isat a nota mediana do Isat (nota de ingresso no curso de direito) dos recm-formados,
nmgrad a nota mediana dos recm-formados nas disciplinas do curso de direito, volbib o nme
ro de volumes da biblioteca da escola de direito, custo o custo anual da escola de direito e rank
a classificao da escola de direito (com rank = 1 sendo o melhor posto de classificao).
(i) Explique a razo de esperarmos /35 < 0.
(ii) Quais so os sinais que voc espera para os outros parmetros de inclinao? Justifique sua
resposta.
(iii) Utilizando os dados do arquivo LAWSCH85.RAW, a equao estimada
log (salrioim) = 8,34 + 0,0047 Isat + 0,248 nmgrad + 0,095 log (volbib)
+ 0,038 log(cnso) 0,0033 rank
n = 136, R2 = 0,842.
Qual a diferena ceteris paribus prevista no salrio para as escolas com um nmgrad media
no diferente em um ponto? (Descreva sua resposta em percentual.)
(iv) Interprete o coeficiente da varivel \og(volbib).
(v) Voc diria que melhor freqentar uma escola de direito que tem uma classificao melhor?
Qual a diferena no salrio inicial esperado para uma escola que tem uma classificao
igual a 2 0 ?
3.5 Em um estudo que relaciona a nota mdia em curso superior (nmgrad) ao tempo gasto em vrias
atividades, voc distribui uma pesquisa para vrios estudantes. Os estudantes devem responder quan
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 103
tas horas eles despendem, em cada semana, em quatro atividades: estudo, sono, trabalho e lazer. Toda
atividade colocada em uma das quatro categorias, de modo que, para cada estudante, a soma das
horas nas quatro atividades deve ser igual a 168.
(i) No modelo
faz sentido manter dormir, trabalhar e lazer fixos, enquanto estudar varia?
(ii) Explique a razo de esse modelo violar a hiptese RLM.4.
(iii) Como voc poderia reformular o modelo, de modo que seus parmetros tivessem uma inter
pretao til e ele satisfizesse a hiptese RLM.4?
3.6 Considere o modelo de regresso mltipla contendo trs variveis independentes, sob as hipte
ses RLM. 1 a RLM.4:
y - o + \ x \ + i x2 + + u.
Assuma que essa equao satisfaa as hipteses de Gauss-Markov. Se um subsdio foi dado s
empresas cujos trabalhadores tm uma aptido menor do que a mdia, de modo que treinmed e
aptidmed sejam negativamente correlacionados, qual o provvel vis em /3j obtido da regresso
simples de prodmed sobre treinmedl
3.9 A equao seguinte descreve o preo mediano das residncias de uma comunidade em termos
da quantidade de poluio (oxn, de xido nitroso) e do nmero mdio de cmodos nas residncias da
comunidade (comods):
(i) Quais so os provveis sinais de /3, e (i2 ! Qual a interpretao de /3, ? Explique.
(ii) Por que oxn [ou, mais precisamente, log(oxn)] e comods deveriam ser negativamente corre
lacionados? Se esse o caso, a regresso simples de log (preo) sobre log (oxn) produz um
estimador viesado para cima ou para baixo de /3, ?
104 Introduo Econometria Editora Thomson
A relao entre as estimativas da elasticidade do preo das regresses simples e mltipla a que voc
previu, tomando como base suas respostas na parte (ii)? Pode-se dizer que 0,718 est claramente
mais prximo da elasticidade verdadeira que 1,043?
3.10 Suponha que o modelo populacional que determina y seja:
y = 00 + 01*1 + 02*2 + 0 3 * 3 + .
e esse modelo satisfaz as hipteses de Gauss-Markov. Entretanto, estimamos o modelo que omite x3.
Sejam /30, 0j e /32 os estimadores de MQO da regresso de y sobre x, e x2. Mostre que o valor espe
rado de /3, (dados os valores das variveis independentes da amostra)
rn xa
2
E(/3.) = 0, + 0 3 ri------ ,
i= i
em que cresc a variao percentual do emprego de 1980 a 1990, enquanto o total das receitas de
impostos tem a seguinte distribuio: parcp a parcela dos impostos sobre a propriedade, parcr a
parcela das receitas de impostos sobre a renda e parcv a parcela das receitas de impostos sobre as
vendas. Todas essas variveis esto mensuradas em 1980. A parcela omitida, parcv inclui taxas e
impostos variados. Por definio, as quatro parcelas somam um. Outros fatores incluiriam despesas
com educao, infra-estrutura, e assim por diante (todos mensurados em 1980).
(i) Por que devemos omitir uma das variveis de parcela de impostos da equao?
(ii) D uma interpretao cuidadosa de
3.12 (i) Considere o modelo de regresso simples y = /30 + 0 ,x + u, sob as primeiras quatro hipte
ses de Gauss-Markov. Para alguma funo g(x), por exemplo, g(x) = x2 ou g(x) = log(l + x2),
defina z, = g(x,). Defina um estimador de inclinao como
Mostre que [3 linear e no-viesado. Lembre-se: como E(w|x) = 0, voc pode tratar tanto x, como
Zj como no-aleatrios em sua derivao.
(ii) Acrescente a hiptese de homoscedasticidade, RLM.5. Mostre que
(iii) Mostre diretamente que, sob as hipteses de Gauss-Markov, Vart/l,) < Var(/3,), em que /3,
o estimador de MQO. [Sugesto: a desigualdade de Cauchy-Schwartz do Apndice B
(disponvel no site da Thomson) implica que
3 A .1 D e r i v a o d a s C o n d i e s d e P r i m e i r a O r d e m d a E q u a o ( 3 . 1 3 ) ______________________________________________
A anlise muito similar do caso da regresso simples. Devemos caracterizar as solues para o
problema
min
2 < J, - K - b x X, bk A*)2-
K hv / -1
-2 2 (A - A> ~ A Al - - - A A*) = 0
1= 1
n
3 A .2 D e r i v a o d a E q u a o ( 3 . 2 2 ) _____________________________________________________________________________________________________________
Para derivar (3.22), escreva xn em termos de seus valores estimados e seus resduos a partir da
regresso de x, sobre x2, .... xk: xix = xn + r ,, para todo i = 1,..., n. Agora, insira essa expresso na
segunda equao de (3.13):
2 (t + r ) ( y , - A A Ai cA*) = 0 (3.60|
106 Introduo Econometria Editora Thomson
Pela definio do resduo de MQO m., como xn exatamente uma funo linear das variveis expli-
n
cativas xi2, x ik, segue que 2 -/j w. = 0. Portanto, a equao (3.60) pode ser expressa como
i= 1
2 = o.
i =1
n
Agora, com um pouco de lgebra chegamos a (3.22), desde que, evidentemente, ^ rft > 0; isso
/= i
garantido pela hiptese RLM.4.
P t = P i + ( .2 (3.62J
Agora, sob as hipteses RLM.2 e RLM.3, o valor esperado de cada w dadas todas as variveis inde
pendentes na amostra, zero. Como os rn so justamente funes das variveis independentes da
amostra, segue-se que
p J = p j + p k 8j . (3.63)
Isso mostra explicitamente que, quando no controlamos xk na regresso, o efeito parcial esti
mado de Xj igual ao efeito parcial quando inclumos xk mais o efeito parcial de xk sobre y vezes a
relao parcial entre a varivel omitida, xk, e Xj,j < k. Condicionado ao conjunto inteiro de variveis
explicativas, X , sabemos que os /3. so todos no-viesados para os correspondentes f3j,j = 1, ..., k.
Alm disso, como 5, exatamente uma funo de X, temos
A equao (3.64) mostra que f[ viesado para /37, a menos que f3k = 0 caso em que x, no
tem efeito parcial na populao , ou 8; igual a zero, o que significa que xik e x,; so parcialmente
no-correlacionados na amostra. A chave para obter a equao (3.64) a equao (3.63). Para mostrar
a equao (3.63), podemos usar a equao (3.22) vrias vezes. Por simplicidade, vamos olhar para7 = 1 .
Agora, jS, o coeficiente de inclinao da regresso simples de y, sobre rn, i = 1 ..., n, em que os rn
so os resduos de MQO da regresso de xn sobre xi2, xi3, ..., xik _ ,. Considere o numerador da
~ n
expresso de /3,: ^ f n yr Para cada i, podemos escrever y; = /30 -t- j8 , xn + ... + f3t xik + : e colocar
;=1
em y,. Agora, pelas propriedades dos resduos de MQO, os rn tm mdia amostrai zero e so no-
correlacionados com x a , x,3, ..., xi k _ | na amostra. Semelhantemente, os i tm mdia amostrai zero e
correlao amostrai zero com jc;1, xa , ..., xik. Segue-se que os f n e j so no-correlacionados na amos
tra (visto que os rn so exatamente uma combinao linear de x iU x i2, ..., xl k _ ,). Assim
2 - r n y, = fii 2 M 2 (3.65)
i= 1 i= 1
fit = fit
= + p k8 r
n n
2 _
Agora, visto que 2 A a soma dos quadrados dos resduos da regresso de x, sobre x2. ,At, 2
i= 1 i=I
SQT|( 1 R2). Isso completa a prova.
n n n n n
porque E( k(-|.X) = 0, para todo i = 1,..., n, sob RLM.2 e RLM.3. Portanto, para E(yS] \X) igualar-se a
j3, para quaisquer valores dos parmetros, devemos ter
Agora, sejam rn os resduos da regresso de x;l sobre x i2, ..., x;Vt. Ento, de (3.66), segue-se que
= 1 (3.67}
;= 1
n
visto que xn = xn + rn e 2 = 0. Agora, considere a diferena entre Var( , \X) e Var(/3, |A)
sob RLM.l a RLM.5:
Wooldridge Captulo 3 Anlise de Regresso Mltipla: Estimao 109
o2 2 w n ~ -2l [ 2 ) (3.68)
Por causa de (3.67), podemos escrever a diferena em (3.68), sem cr2, como
(3.69)
2 K i - ?i ^ii)2 (3.70)
em que y x = 2 w,\ rn jf 2 'n )> como pode ser visto ao se elevar cada termo em (3.70) ao quadra
do, somando e cancelando os termos. Como (3.70) exatamente a soma dos resduos quadrados da
regresso simples de vv,, sobre rn lembre-se de que a mdia amostrai de rn zero , (3.70) deve
ser no-negativo. Isso completa a prova.
Anlise de Regresso Mltipla:
Problemas Adicionais
ste captulo articula vrios problemas da anlise de regresso mltipla que no foram tratados
convenientemente nos captulos anteriores. Estes tpicos no so to fundamentais quanto os dis
cutidos nos captulos 3 e 4, mas so importantes para a aplicao da regresso mltipla em uma
ampla gama de problemas empricos.
onde pesnas o peso dos recm-nascidos, em onas, cigs o nmero mdio de cigarros que a me
fumou por dia durante a gravidez, e rendfam a renda anual familiar, em milhares de dlares. As
estimativas desta equao, obtidas utilizando dados contidos no arquivo BWGHT.RAW, so dadas
na primeira coluna da Tabela 6.1. Os erros-padro esto relacionados entre parnteses. A estimativa
de cigs mostra que se uma mulher fumar cinco ou mais cigarros por dia, o peso previsto dos recm-
174
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 175
nascidos deve estar em torno de 0,4634(5) = 2,317 onas a menos. A estatstica t de cigs -5,06,
de modo que a varivel estatisticamente bastante signiicante.
Variveis Independentes
maos -9,268
(1,832)
Agora, suponha que decidimos medir o peso dos recm-nascidos em libras, em vez de onas.
Faamos pesonaslb = pesonas/ 16 ser o peso dos recm-nascidos em libras. O que acontece com nos
sas estatsticas MQO se usarmos essa varivel dependente em nossa equao? E fcil verificar o efei
to no coeficiente da estimativa pela simples manipulao da equao (6.1). Divida a equao inteira
por 16:
Como o termo da esquerda o peso dos recm-nascidos em libras, segue-se que cada novo coeficien
te corresponder ao coeficiente antigo dividido por 16. Para verificar isso, a regresso de pesonaslb
sobre cigs e rendfam est registrada na coluna (2) da Tabela 6.1. At quatro dgitos, o intercepto e as
inclinaes da coluna (2) so exatamente os da coluna (1) divididos por 16. Por exemplo, o coeficien
te de cigs agora 0,0289; isso significa que, se cigs fosse cinco vezes mais alto, o peso de nascimen
to seria 0,0289(5) = 0,1445 libras mais baixo. Em termos de onas, temos 0,1445(16) = 2,312, que
um pouco diferente dos 2,317 que obtivemos anteriormente devido ao erro de arredondamento. A ques
to importante que, uma vez que os efeitos tenham sido transformados nas mesmas unidades, obte
mos exatamente a mesma resposta, independentemente de como a varivel dependente seja medida.
176 Introduo Econometria - Editora Thomson
Na equao original sobre o peso dos recm-nascidos (6.1), suponha que re n d fa m seja medida em dlares
em lugar de milhares de dlares. Desse modo, defina a varivel re n d fa m d o l = 1.000 -re n d fa m . Como
mudam as estatsticas MQO quando re n d fa m d o l substitui re n d fa m l Para o propsito de apresentar os
resultados da regresso, voc acha melhor medir a renda em dlares ou em milhares de dlares?
Alm do coeficiente de maos, existe outra estatstica na coluna (3) que difere da mostrada na
coluna (1): o erro-padro de maos 20 vezes maior que o de cigs na coluna (1). Isso significa que a
estatstica t para verificar a significncia do hbito de fumar a mesma, quer ele seja medido em cigar
ros ou em maos. Isso natural.
O exemplo anterior explica claramente a maioria das possibilidades que surgem quando a vari
vel dependente e as variveis independentes so redimensionadas. O redimensionamento muitas
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 177
vezes feito com os valores monetrios em economia, especialmente quando os montantes so muito
grandes.
No Captulo 2, argumentamos que, se a varivel dependente aparecer na forma logartmica, a
alterao na unidade de medida no afetar o coeficiente de inclinao. Isso tambm acontece aqui: a alte
rao na unidade de medida da varivel dependente, quando aparece na forma logartmica, no afeta
qualquer das estimativas de inclinao. Isso resulta do simples fato de que l o g i c = log(Cj) + logiv,)
para qualquer constante c t > 0. O novo intercepto ser logic, j + f30. De forma semelhante, a alterao
da unidade de medida de qualquer xjt onde log(jc;) aparece na regresso, afeta somente o intercepto. Isso
corresponde ao que conhecemos sobre alteraes em porcentagens e, em particular, em elasticidades:
elas no sofrem alteraes quando mudam as unidades de medida de y ou de x;. Por exemplo, se tivs
semos especificado a varivel dependente em (6 . 1 ) como log(pesonas), estimssemos a equao, e
depois a tivssemos reestimado com log(jpesonaslb) como a varivel dependente, os coeficientes de cigs
e rendfam seriam os mesmos em ambas as regresses; somente o intercepto seria diferente.
Os Coeficientes Beta
Algumas vezes, em aplicaes economtricas, uma varivel-chave medida em uma dimenso de
difcil interpretao. Economistas especializados na rea de trabalho freqentemente incluem a pon
tuao de testes de conhecimentos em equaes salariais, e a dimenso em que tais testes so registra
dos muitas vezes arbitrria e de difcil interpretao (pelo menos para os economistas!). Em quase
todos os casos estamos interessados em saber como a pontuao de um indivduo em particular se com
para com a populao. Assim, em lugar de perguntarmos a respeito do efeito sobre o salrio por hora
se, digamos, a pontuao do teste for dez pontos mais alta, faz mais sentido perguntar o que acontece
quando a pontuao do teste for um desvio-padro mais alto.
Nada impede que vejamos o que acontece com a varivel dependente quando uma varivel inde
pendente em um modelo estimado aumenta certo nmero de desvios-padro, supondo que tenhamos
obtido o desvio-padro da amostra (o que fcil na maioria dos programas de regresso). Geralmente,
essa uma boa idia. Assim, por exemplo, quando observamos o efeito de uma pontuao de teste
padronizada, como o SAT (nota de ingresso em curso superior nos Estados Unidos), sobre a nota mdia
em curso superior, podemos encontrar o desvio-padro de SAT e verificar o que acontece quando essa
pontuao aumenta em um ou dois desvios-padro.
Algumas vezes til obter resultados de regresso quando todas as variveis envolvidas, a depen
dente e todas as independentes, tenham sido padronizadas. Uma varivel padronizada em uma amos
tra pela subtrao de sua mdia e dividindo o resultado por seu desvio-padro (veja Apndice C
disponvel no site do livro, no site www.thomsonleaming.com.br). Isso significa que computamos a
transformao z de cada varivel na amostra. Depois, fazemos a regresso usando os valores de z-
Por que a padronizao til? E mais fcil comearmos com a equao MQO original, com as
variveis em suas formas originais:
Inclumos o subscrito de observao i para enfatizar que nossa padronizao aplicada a todos os
valores da amostra. Agora, se ao calcularmos a mdia de (6.2), usarmos o fato de que , tem uma mdia
de amostra zero, e subtrairmos o resultado de (6 .2 ), temos
Cada varivel em (6.3) foi padronizada pela substituio de suas mdias por seus valores de z, e isso
resultou em novos coeficientes de inclinao. Por exemplo, o coeficiente de inclinao de (x;l x, (/cr,
(y-,,)/},. Isso simplesmente o coeficiente original, /3,, multiplicado pela razo do desvio-padro de
X, sobre o desvio-padro de v. O intercepto simplesmente desapareceu.
til reescrever (6.3), eliminando o subscrito i, como
EXEMPLO 6.1
(Efeitos da Poluio sobre os Preos de Imveis)
Utilizamos os dados do Exemplo 4.5 (do arquivo HPRICE2.RAW) para ilustrar o uso de coeficientes beta.
Lembre-se de que a principal varivel independente oxn, uma medida do xido nitroso no ar em cada
comunidade. Uma maneira de entender o tamanho do efeito da poluio - sem entrar na questo cientfica
do efeito do xido de nitrognio sobre a qualidade do ar computar os coeficientes beta. (0 Exemplo 4.5
contm um mtodo alternativo: obtivemos uma elasticidade-preo em relao a oxn usando p reo e oxn em
forma logartmica.)
A equao populacional o modelo nvel-nvel
onde todas as variveis exceto c rim e foram definidas no Exemplo 4.5; crim e o nmero de crimes registra
dos p e r capita. Os coeficientes beta aparecem na seguinte equao (portanto cada varivel foi convertida
ao seu valor de z):
zpreo = 0,340 zoxn 0,143 zcrime + 0,514 zcomods 0,235 zdist 0,270 zmzestud.
Esta equao mostra que o aumento de um desvio-padro em oxn reduz o preo em 0,34 desvio-padro; o
aumento de um desvio-padro em c rim e reduz o preo em 0,14 desvio-padro. Assim, o mesmo movimen
to relativo da poluio na populao tem um efeito maior sobre os preos dos imveis do que o da crimina
lidade. 0 tamanho do imvel, medido pelo nmero de cmodos (c o m o d s ), tem o maior efeito padronizado.
Se quisermos saber os efeitos de cada varivel independente sobre o valor da mediana dos preos dos im
veis, teremos que usar as variveis no padronizadas.
0 uso de variveis padronizadas ou no padronizadas no afetar a significncia estatstica: as esta
tsticas f sero as mesmas, em ambos os casos.
onde essas variveis so as mesmas do Exemplo 4.5. Lembre-se de que em todo o texto log(x) o log
natural de x. O coeficiente /3, a elasticidade do preo em relao a oxn (poluio). O coeficiente /32
a mudana em log (preo), quando txcomods = 1 ; como vimos muitas vezes, quando multiplicada por
100, essa a percentagem aproximada de mudana em preo. Lembre-se de que 100 /L algumas
vezes chamado de semi-elasticidade do preo em relao a comods.
Quando estimamos utilizando os dados do arquivo HPRICE2.RAW, obtemos
Assim, quando oxn aumenta em 1%, preo cai em 0,718%, mantendo-se apenas comods fixo.
Quando comods aumenta em um, preo aumenta em aproximadamente 100(0,306) = 30,6%.
A estimativa de que um cmodo a mais aumenta o preo em cerca de 30,6% acaba por ser de certa
forma impreciso para esta aplicao. O erro de aproximao ocorre porque, como a mudana em log(y)
se torna cada vez maior, a aproximao %Ay ~ 1 0 0 Alog(v) se mostra cada vez mais imprecisa.
Felizmente, existe um clculo simples para computar a percentagem exata de mudana.
Para descrever o procedimento, consideremos o modelo estimado de forma geral
onde a multiplicao por 100 transforma a mudana proporcional em uma mudana percentual.
Quando Ax2 = 1,
% hy = 1 0 0 -[exp(j2) - 1 ], (6.9)
A plicada ao exemplo dos preos dos imveis com x 2 = comods e = 0,306, %Apro =
100[exp(0,306) 1] = 35,8%, que visivelmente maior do que a percentagem aproximada de mudan
a, 30,6%, obtida diretamente de (6.7). {A propsito, esse no um estimador no-viesado, pois exp(-)
uma funo no-linear; ele , porm, um estimador consistente de 100[expQ32) 1]- Isso assim
porque o limite de probabilidade calculado por meio de funes contnuas, enquanto o operador valor
esperado no calculado dessa forma. Veja Apndice C, no site da Thomson.}
O ajuste na equao (6 .8 ) no to crucial para pequenas mudanas percentuais. Por exemplo,
quando inclumos na equao (6.7) a relao aluno-professor, seu coeficiente estimado 0,052, o que
significa que, se razestud aumentar em um, preo diminui em aproximadamente 5,2%. A mudana pro
porcional exata exp(0,052) 1 == 0,051, ou 5,1%. De outro lado, se aumentarmos razestud em
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 181
cinco, ento a mudana percentual aproximada em preo ser 26%, enquanto a mudana exata obtida
da equao (6 .8 ) 100[exp(0,26) 1] = 22,9%.
Vimos que o uso de logs naturais leva a coeficientes com interpretaes interessantes e podemos
ignorar o fato de as unidades de medida das variveis aparecerem em forma logartmica, pois os coe
ficientes de inclinao so invariantes em relao a redimensionamentos. Existem vrias outras razes
pelas quais os logs so to usados em trabalhos aplicados. Em primeiro lugar, quando y > 0, os mode
los que usam log(y) como a varivel dependente geralmente satisfazem as hipteses do MLC mais
apropriadamente do que os modelos que usam o nvel de y. Variveis estritamente positivas frequente
mente possuem distribuies condicionais que so heteroscedsticas ou concentradas; o uso do log
pode aliviar, se no eliminar, ambos os problemas.
Alm disso, o uso de logs normalmente estreita a amplitude dos valores das variveis, em alguns
casos em quantidade considervel. Isso toma as estimativas menos sensveis a observaes dspares (ou
extremas) na varivel dependente ou nas variveis independentes. Abordaremos a questo das obser
vaes extremas no Captulo 9.
Existem algumas regras prticas padronizadas para o uso de logs, embora nenhuma definitiva.
Quando a varivel um valor monetrio positivo, ele freqentemente transformado em log. Temos
visto isso para variveis como salrios, vendas de empresas e valores de mercado das empresas.
Variveis como populao, nmero total de empregados e matrculas escolares freqentemente apare
cem em forma logartmica; elas tm a caracterstica comum de serem grandes valores inteiros.
Variveis que so medidas em anos como educao, experincia, tempo de permanncia,
idade etc. normalmente aparecem em sua forma original. Uma varivel que seja uma proporo ou
uma percentagem como a taxa de desemprego, a taxa de participao em planos de aposentadoria,
a taxa de estudantes aprovados em um exame padronizado e a taxa de deteno sobre crimes registra
dos pode aparecer tanto em sua forma original como logartmica, embora haja uma tendncia em
us-la em forma de nvel. Isso se deve ao fato de que quaisquer coeficientes de regresso envolvendo
a varivel original seja ela a varivel dependente ou independente tero uma interpretao de
mudana de pontos percentuais. (Veja Apndice A, no site da Thomson, para uma reviso sobre a
distino entre mudana percentual e mudana de pontos percentuais.) Se usarmos, digamos,
log(desemp) em uma regresso, onde desemp a percentagem de indivduos desempregados, precisa
mos ter muito cuidado para distinguir entre uma mudana de pontos percentuais e uma mudana percen
tual. Lembre-se, quando desemp aumenta de oito para nove, isso um acrscimo de um ponto per
centual, equivalente a um incremento de 12,5% sobre o nvel de desemprego inicial. O uso do log
significa que queremos saber a mudana percentual da taxa de desemprego: log(9) log(8 ) ~ 0,118
ou 11,8%, que a aproximao logartmica do aumento efetivo de 12,5%.
Suponha que o nmero anual de prises por direo de veculo sob embriaguez1 seja determinado por
onde idade! 6_25 a proporo da populao entre 16 e 25 anos de idade. Mostre que p 2 tem a seguinte
interpretao (ceteris paribus): ela a mudana percentual em prises quando a percentagem da popula
o com idade entre 16 e 25 anos aumenta em um ponto percentual.
Uma limitao do log que ele no pode ser usado, caso uma varivel assuma valor zero ou nega
tivo. Em casos nos quais a varivel y no seja negativa, mas pode assumir o valor 0, log(l + y) algu
mas vezes usado. As interpretaes de mudana percentual so, em geral, estritamente preservadas,
exceto para mudanas comeando em y = 0 (em que a percentagem de mudana no sequer defini
da). Geralmente, usar log(l + y) e depois interpretar as estimativas como se a varivel fosse log(y)
aceitvel quando os dados em y no so dominados por zeros. Um exemplo pode ser o de y represen
tar horas de treinamento por funcionrio da populao industrial, quando uma grande frao das
empresas oferece treinamento a, pelo menos, um de seus funcionrios.
Uma desvantagem de usar uma varivel dependente na forma logartmica est na dificuldade de se
prever a varivel original. O modelo original nos permite prever log(y), e no y. No entanto, razoavel
mente fcil transformar uma previso de log(y) em uma previso de y (veja Seo 6.4). Uma questo
relacionada que no vlido comparar /?-quadrados de modelos nos quais y a varivel dependente
em um caso e log(y) a varivel dependente no outro. Essas medidas explicam variaes em diferentes
variveis. Discutimos como computar medidas comparveis de graus de ajuste na Seo 6.4.
Por exemplo, considere y = salrioh x = exper. Como discutimos no Captulo 3, esse modelo no
se enquadra na anlise de regresso simples, mas facilmente trabalhado em regresso mltipla.
importante lembrar que /3] no mede a mudana em y em relao a x; no faz sentido manter x2
fixo quando se altera x. Se escrevermos a equao estimada como
y = Po + P i x + /M 2 (6.10)
teremos a aproximao
Isso nos mostra que a inclinao da relao entre x e y depende do valor de x; a inclinao esti
mada /3, + 2/32x. Se inserirmos x = 0, veremos que /3, pode ser interpretado como a inclinao apro
ximada na alterao de x = 0 para x = 1. Para outras mudanas no valor de x, o segundo termo, 2/3 ^x,
deve ser levado em conta.
Se estivermos interessados em somente computar a mudana prevista em y dado um valor inicial
de x e uma mudana de x, poderamos usar (6 . 1 0 ) diretamente: no h nenhuma razo para usar clcu
los de aproximao. Porm, normalmente estamos mais interessados em resumir rapidamente o efeito
de x em y, e a interpretao de /3, e de /32 na equao (6.11) fornece esse resumo. Em geral, podemos
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 183
inserir o valor mdio de x na amostra, ou outros valores de interesse, como a mediana ou os valores
dos quartis inferior ou superior de x.
Em muitas aplicaes, j3, positivo, e /32 negativo. Por exemplo, utilizando os dados de sal
rios contidos no arquivo WAGE1.RAW, obtemos
n = 526, R2 = 0,093.
A equao estimada sugere que exper tem um efeito de reduo sobre salrioh. O primeiro ano
de experincia vale aproximadamente 30 centavos de dlar por hora (0,298 dlares). O segundo ano de
experincia vale menos [cerca de 0,298 2(0,0061 )(1) ~ 0,286, ou 28,6 centavos de dlar, de acordo
com a aproximao em (6.11) com x = 1]. Aumentando de 10 para 11 os anos de experincia, a pre
viso de aumento do salrio-hora de cerca de 0,298 2(0,0061)(10) = 0,176 ou 17,6 centavos de
dlar. E assim por diante.
Quando o coeficiente de x positivo e o coeficiente de x 2 negativo, a funo quadrtica tem um
formato parablico. Sempre existe um valor positivo de x, no qual o efeito de x sobre y zero; antes
desse ponto, x tem um efeito positivo sobre y; aps esse ponto, x tem um efeito negativo sobre y. Na
prtica, pode ser importante saber onde fica esse ponto crtico.
Na equao estimada (6.10) com /3, > 0 e / ? 2 < 0, esse ponto crtico (ou o mximo da funo)
sempre alcanado na relao entre o coeficiente de x e duas vezes o valor absoluto do coeficiente de x~:
Figura 6.1___________________________
Relao quadrtica entre salnoh e expei.
Quando um modelo tem uma varivel dependente na forma logartmica e uma varivel explicati
va como uma funo quadrtica, necessrio certo cuidado para fazer uma boa interpretao. O exem
plo seguinte tambm mostra que a funo quadrtica pode ter um formato em U, em vez de uma forma
parablica. A forma em U surge na equao (6.10) quando 0 t negativo e /32 positivo; isso captura
um efeito crescente de x sobre y.
EXEMPLO 6.2
(Efeitos da Poluio sobre os Preos dos Imveis)
Modificamos o modelo dos preos dos imveis do Exemplo 4.5 para incluir um termo quadrtico em comods:
n = 506, R2 = 0,603.
0 termo quadrtico comods2 tem uma estatstica t em torno de 4,77 e, portanto, estatisticamente bastan
te significante. Mas o que possvel afirmar sobre a interpretao do efeito de comods sobre log(preo)?
Inicialmente, o efeito parece ser estranho. Como o coeficiente de comods negativo e o coeficiente de
comods2 positivo, a equao literalmente sugere que, com valores baixos de comods, um cmodo adicio
nal tem um efeito negativo sobre log(preo). Em algum ponto, o efeito se torna positivo, e a forma quadr
tica significa que a semi-elasticidade de preo em relao a comods cresce na mesma proporo do cresci
mento de comods. Esta situao mostrada na Figura 6.2.
Obtemos o valor do ponto crtico de comods usando a equao (6.13) (embora /3, seja negativo e
p 2 seja positivo). O valor absoluto do coeficiente de comods, 0,545, dividido pelo dobro do coeficiente de
comods2, 0,062, resulta em com ods* = 0,545/(2(0,062)] ~ 4,4; este ponto est marcado na Figura 6.2.
Figura 6.2__________________________________
log (preo) como uma funo quadrtica de comods.
log(preo)
4,4 cm odos
186 Introduo Econometria Editora Thomson
e assim
Portanto, um aumento em comods, digamos de cinco para seis, aumenta o preo em aproximadamente
-5 4 ,5 + 12,4(5) = 7,5%; o aumento de seis para sete aumenta o preo em aproximadamente -5 4 ,5 +
12,4(6) = 19,9%. Esse um efeito crescente bastante forte.
Existem muitas outras possibilidades de usar funes quadrticas juntamente com logaritmos. Por
exemplo, uma extenso de (6.14) que permita uma elasticidade no-constante entre preo e oxn
Se f32 = 0, f { ser a elasticidade do preo em relao a oxn. Caso contrrio, essa elasticidade
depender do nvel de oxn. Para verificar isso, podemos combinar os argumentos dos efeitos parciais
nos modelos quadrtico e logartmico para mostrar que
portanto, a elasticidade do preo em relao a oxn f3\ + 2/3 Aog( oxn), de forma que ela depende de
log (oxn).
Finalmente, outros termos polinomiais podem ser includos nos modelos de regresso. Certa
mente a funo quadrtica vista com mais freqncia, mas um termo cbico ou at de quarta potn
cia aparece de vez em quando. Uma forma funcional frequentemente razovel de uma funo de custo
total
No complicado estimar este modelo. A interpretao dos parmetros mais trabalhosa (embo
ra objetiva com o uso de clculo infinitesimal); no estudaremos este modelo com mais detalhes.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 187
o efeito parcial de qtdorm sobre preo (mantendo fixas todas as outras variveis)
Se / ? 3 > 0, (6.17) sugere que um quarto a mais produz um aumento maior no preo dos imveis maio
res. Em outras palavras, existe um efeito de interao entre a rea do imvel e o nmero de quartos.
Ao resumirmos o efeito de qtdorm sobre preo, devemos avaliar (6.17) quanto aos valores de interes
se de arquad, como o valor mdio, ou os quartis inferior ou superior na amostra. Se /33 zero ou no,
algo que podemos verificar facilmente.
Pode ser complicado interpretar os parmetros das variveis originais quando inclumos um termo
de interao. Por exemplo, na equao anterior sobre preos de imveis, a equao (6.17) mostra que /32
o efeito de qtdorms sobre preo para um preo com zero de rea construda! Esse efeito, obviamente,
no muito interessante. Em vez disso, devemos ser cuidadosos ao inserirmos valores de interesse da
rea do imvel, como o valor mdio ou a mediana da amostra, na verso estimada da equao (6.17).
Freqentemente, vantajoso reparametrizar um modelo para que os coeficientes das variveis ori
ginais tenham significados interessantes. Considere um modelo com duas variveis explicativas e uma
interao:
Como acabamos de mencionar, f32 o efeito parcial de x 2 quando x, = 0. Muitas vezes, isso no
de interesse. Em vez disso, podemos reparametrizar o modelo como
onde /jl] a mdia populacional de x, e p.2 a mdia populacional de x2. Podemos facilmente ver
que agora o coeficiente de x2, 2, o efeito parcial de x2 sobre y no valor mdio de x ,. (Multiplicando
a interao na segunda equao e comparando os coeficientes, podemos mostrar com facilidade que
2 = j8 2 + O parmetro 8 j tem uma interpretao semelhante.) Portanto, se subtrairmos as
mdias das variveis na prtica, elas seriam, tipicamente, as mdias da amostra antes de criar
mos o termo de interao, os coeficientes das variveis originais tero uma interpretao til. E mais,
obteremos imediatamente os erros-padro dos efeitos parciais ao nvel dos valores mdios. Nada nos
impede de substituir /x, ou pt2 por outros valores das variveis explicativas que possam ser de interesse.
0 exemplo seguinte ilustra como podemos usar os termos de interao.
188 Introduo Econometria Editora Thomson
EXEMPLO 6.3
(Efeitos da Freqncia Escolar no Desempenho de Exames Finais)
Um modelo para explicar o resultado padronizado de um exame final (respad) em termos da taxa de fre-
qncia escolar, da nota mdia anterior* ao curso superior at o penltimo semestre, e da nota do teste de
avaliao de conhecimentos para ingresso em curso superior
(Utilizamos o resultado padronizado do exame pelos motivos discutidos na Seo 6.1: mais fcil interpretar o
desempenho de um aluno em relao ao restante da classe.) Alm dos termos quadrticos em n m g ra d p e tac,
este modelo inclui uma interao entre n m g ra d p e taxafreq. A idia que a freqncia s aulas pode ter um
efeito diferente nos alunos que tiveram desempenhos diferentes no passado, como medido por nmgradp.
Estamos interessados nos efeitos da freqncia sobre as notas do exame final: A re s p a d IA ta x a fre q = /S, +
f i 6nm gradp.
Usando as 680 observaes do arquivo ATTEND.RAW para estudantes da rea de economia, a equa
o estimada
Devemos interpretar essa equao com extremo cuidado. Se simplesmente olharmos o coeficiente de
taxa freq , concluiremos de forma errnea que a freqncia tem um efeito negativo na nota do exame final.
Porm, esse coeficiente supostamente mede o efeito quando n m g ra d p = 0, o que no interessante (nessa
amostra, a menor nota mdia do ensino mdio cerca de 0,86). Tambm devemos ter cuidado para no exa
minarmos separadamente as estimativas de y3, e /36 e concluirmos que, como cada estatstica t no signi-
ficante, no podemos rejeitar H0: /3, = 0, /36 = 0. Alis, o p-valor do teste Fdessa hiptese conjunta 0,014,
de modo que com certeza rejeitamos H0 ao nvel de 5%. Este um bom exemplo de como o exame em sepa
rado de estatsticas t, quando estamos testando uma hiptese conjunta, pode nos levar a equvocos.
Como devemos estimar o efeito parcial de ta x a fre q sobre re s p a d l Devemos inserir valores de interes
se de n m g ra d p para obter o efeito parcial. O valor mdio de n m g ra d p na amostra 2,59, de modo que
nesse valor mdio o efeito de taxa fre q sobre re spa d -0 ,0 0 6 7 + 0,0056(2,59) ~ 0,0078. Qual o signi
ficado disso? Como taxa freq medida como um percentual, isso significa que um aumento de dez pontos
percentuais em ta x a fre q aumenta respad em 0,078 desvios-padro da nota mdia do exame final.
Como podemos dizer se a estimativa 0,0078 estatisticamente diferente de zero? Temos que compu
tar novamente a regresso, substituindo n m g r a d p ta x a fre q por (n m g ra d p - 2,59) -ta x a fre q . Isso pro
duz, como o novo coeficiente de taxafreq, o efeito estimado quando n m g ra d p = 2,59, juntamente com
seu erro-padro; nada mais alterado na regresso. (Descrevemos esse mecanismo na Seo 4.4.) A execu
o dessa nova regresso fornece o erro-padro de /3n + /36(2,59) = 0,0078 como 0,0026, o que produz
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 189
Se adicionarmos o termo fSjtac-taxafreq equao (6.18), qual ser o efeito parcial de taxafreq sobre respadl
O R- Quadrado Ajustado
A maioria dos programas economtricos registra, juntamente com o //-quadrado, uma estatstica
chamada R -quadrado ajustado. Como o //-quadrado ajustado descrito em muitos trabalhos aplica
dos, e como ele tem algumas caractersticas teis, trataremos dele nesta subseo.
Para verificar como o //-quadrado usual pode ser ajustado, til escrev-lo como
R 2 = 1 - (SQR/)/(SQT/), (6.20)
onde SQR a soma dos resduos quadrados e SQT a soma dos quadrados total; comparada com a
equao (3.28), tudo o que fizemos foi dividir tanto SQR como SQT por n. Essa expresso revela o que
R2 est realmente estimando. Defina a 2 como a varincia populacional de y e faa com que cr2, repre
sente a varincia populacional do termo erro, u. (At agora temos usado cr para representar cr, mas e'
vantajoso ser mais especfico neste caso.) O //-quadrado da populao definido como 1 cr2/ cr.,2;
essa a proporo da variao em y na populao explicada pelas variveis independentes. Isso o que,
supostamente, R2 deve estar estimando.
O R~ estima cr por SQR/, que sabemos ser viesado. Ento, por que no substituir SQR/ por
SQR/Li k 1)? Alm disso, podemos usar SQT/( 1) em lugar de SQT/, j que o primeiro o
estimador no-viesado de cr2. Usando esses estimadores, chegamos ao //-quadrado ajustado:
j que cr2 = SQR/(n k 1). Devido notao usada para representar o //-quadrado ajustado, ele ,
algumas vezes, chamado de R-barra-quadrado.
O //-quadrado ajustado algumas vezes chamado de R-quadrado corrigido, mas esse no um
bom nome, pois sugere que / / 2 de alguma forma melhor que R2 como um estimador do //-quadrado
da populao. Infelizmente, R2 no reconhecido, de forma geral, como um melhor estimador. ten
tador imaginar que R2 corrige o vis de R2 na estimativa do //-quadrado da populao, mas ele no
faz isso: a razo de dois estimadores no-viesados no um estimador no-viesado.
O ponto mais atraente do R2 que ele impe uma penalidade incluso de variveis independentes
adicionais em um modelo. Sabemos que R2 nunca pode diminuir quando uma nova varivel indepen
dente includa em uma equao de regresso: isso ocorre porque SQR nunca aumenta (e normal
mente diminui) quando novas variveis independentes so adicionadas. Mas a frmula do R2 mostra
que ele depende explicitamente de k, o nmero de variveis independentes. Se uma varivel indepen
dente for adicionada a uma regresso, SQR diminui, mas o mesmo acontece com os gl na regresso,
k 1. Portanto, SQR/( k 1) pode aumentar ou diminuir quando uma nova varivel indepen
dente adicionada a uma regresso.
Um fato algbrico interessante o seguinte: se adicionarmos uma nova varivel independente a uma
equao de regresso, R 2 aumenta se, e somente se, a estatstica t da nova varivel for maior que um
em valor absoluto. (Uma extenso disto que R2 aumenta quando um grupo de variveis adicionado
a uma regresso se, e somente se, a estatstica F da significncia conjunta das novas variveis for maior
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 191
que a unidade.) Assim, vemos imediatamente que usar o R2 para decidir se determinada varivel inde
pendente (ou conjunto de variveis) pertence a um modelo nos fornece uma resposta diferente daque
las fornecidas pelos testes usuais t ou F (j que uma estatstica t ou F igual unidade no estatistica
mente significante aos nveis tradicionais de significncia).
Algumas vezes til termos uma frmula do R2 em termos de R~. A lgebra simples mostra que
Por exemplo, se R2 = 0,30, n 51, e k = 10, ento R2 = 1 0,70(50)/40 = 0,125. Assim, para
n pequeno e k grande, R2 pode estar substancialmente abaixo de R2. De fato, se o /f-quadrado normal
for pequeno, e n k 1 for pequeno, R2 pode, na realidade, ser negativo! Por exemplo, podemos con
siderar/ ? 2 = 0,10, n = 51, e k = 10 para verificar que R2 = 0,125. Um R2 negativo indica uma adap
tao muito pobre do modelo relativamente ao nmero de graus de liberdade.
O /?-quadrado_ajustado algumas vezes descrito junto com o /?-quadrado habitual ernregresses,
e algumas vezes o R 2 descrito em lugar do R2. importante^lembrar que o R2, e no o R2, que apa
rece na estatstica F em (4.41). A mesma frmula com R2 e R2r no vlida.
Esses dois exemplos so modelos no-aninhados, pois nenhuma equao um caso especial da
outra. A estatstica F, que estudamos no Captulo 4, nos permite testar somente modelos aninhados:
um modelo (o modelo restrito) um caso especial do outro modelo (o modelo sem restries). Veja
as equaes (4.32) e (4.28) para exemplos dos modelos restritos e sem restries. Uma possibilidade
criar um modelo combinado que contenha todas as variveis explicativas dos modelos originais e depois
testar cada modelo contra o modelo geral usando o teste F. O problema deste processo que ambos os
modelos podero ser rejeitados, ou nenhum modelo poder ser rejeitado (como acontece com o exemplo
dos salrios dos jogadores da principal liga de beisebol na Seo 4.5). Assim, esse processo nem sem
pre fornece uma maneira de fazermos a distino entre modelos com regressores no-aninhados.
192 Introduo Econometria Editora Thomson
_Na regresso dos salrios dos jogadores de beisebol, o R2 da regresso contendo hrunano 0,6211
e o R2 da regresso contendo rebrunano 0,6226. Portanto, com base no R-quadrado ajustado, existe
uma preferncia muito pequena para o modelo com rebrunano. Mas a diferena, na prtica, muito
pequena, e podemos obter uma resposta diferente controlando algumas das variveis no Problema 4.16.
(Como ambos os modelos no-aninhados contm cinco parmetros, o R-quadrado habitual pode ser
usado para fornecer a mesma concluso.)
A comparao dos R2 para optarmos entre os diferentes conjuntos no-aninhados de variveis
independentes pode ser de grande valia quando essas variveis representam formas funcionais diferen
tes. Considere dois modelos relacionando a intensidade de P&D s vendas de uma empresa:
O primeiro modelo captura um rendimento decrescente pela incluso de vendas na forma logart
mica; o segundo modelo faz isso com o uso de um termo quadrtico. Assim, o segundo modelo con
tm um parmetro a mais que o primeiro.
Quando as equaes so estimadas usando as 32 observaes das empresas de produtos qumicos
do arquivo RDCHEM.RAW, o R2 0,061, e o R2 da equao (6.24) 0,148. Portanto, parece que a
funo quadrtica faz um ajuste muito melhor. Mas uma comparao dos R-quadrados habituais com
o primeiro modelo injusta, porque ele contm um parmetro a menos que a equao (6.24). Isto ,
(6.23) um modelo mais parcimonioso que (6.24).
Tudo o mais igual, modelos mais simples so melhores. Como o R-quadrado habitual no penali
za modelos mais complicados, melhor usar o R2. O R2 de (6.23) 0,030, enquanto o R2 de (6.24)
0,090. Portanto, mesmo depois dos ajustes das diferenas nos graus de liberdade, o modelo quadrti
co o melhor. O modelo quadrtico tambm o preferido quando margens de lucro so includas em
cada regresso. _
Existe uma limitao importante no uso do R2 para escolher entre modelos no-aninhados: no
podemos us-lo para a escolha entre diferentes formas funcionais da varivel dependente. Isso uma
pena, pois muitas vezes queremos saber se y ou log( v) (ou talvez alguma outra transformao) deve ser
usada como a varivel dependente com base no grau de ajuste. Mas nem o R2 nem o R2 podem ser usa
dos para esse fim. A razo simples: esses R-quadrados medem a proporo explicada do total da va
riao de qualquer varivel dependente que estejamos usando na regresso, e diferentes funes da
varivel dependente tero diferentes montantes de variao a ser explicadas. Por exemplo, as variaes
totais em y e log(y) no so as mesmas. A comparao dos R-quadrados ajustados dessas regresses
com essas diferentes formas das variveis dependentes no nos d nenhuma informao sobre qual
modelo se adapta melhor; eles estimam duas variveis dependentes separadas.
EXEMPLO 6.4
(Remunerao de Diretores Executivos e Desempenho de Empresas)
Considere dois modelos estimados relacionando a remunerao de diretores executivos ao desempenho de
empresas:
onde rma o retorno das aes, discutido no Captulo 2. Para simplificar, Isalrio e Ivendas representam os
logs naturais de salrio e vendas. J sabemos como interpretar essas diferentes equaes estimadas. Mas
podemos dizer se um modelo ajusta os dados melhor que o outro?
0 /?-quadrado da equao (6.25) mostra que vendas e rma explicam somente cerca de 2,9% da variao
do salrio dos diretores executivos na amostra. Tanto vendas como rma tm significncia estatstica marginal.
A equao (6.26) mostra que log(i/endas) e rma explicam cerca de 28,2% da variao do log(salrio).
Em termos de grau de ajuste, esse ff-quadrado bem mais alto parece sugerir que o modelo (6.26)
bem melhor, mas esse no necessariamente o caso. A soma dos quadrados total de salrio na amostra
391.732.982, enquanto a soma dos quadrados total de log(salrio) somente 66,72. Assim, h muito
menos variao em \og{salrio) que precisa ser explicada.
Neste ponto, podemos usar outros recursos alm do R2 e do R2 para optar entre esses modelos. Por
exemplo, log(vendas) e rma so muito mais significantes, estatisticamente, em (6.26) do que so vendas e
rma em (6.25), e os coeficientes em (6.26) provavelmente so de maior interesse. Para termos certeza,
porm, precisaremos fazer uma comparao vlida dos graus de ajuste.
Na Seo 6.4 forneceremos um indicador que efetivamente nos permita comparar modelos nos
quais y aparece tanto na forma em nvel como na forma logartmica.
Para ilustrar esse problema, suponha que estejamos fazendo um estudo para avaliar o impacto dos
impostos estaduais sobre a cerveja em acidentes fatais de trnsito. A idia que um imposto mais ele
vado sobre a cerveja reduzir o consumo de bebidas alcolicas e, da mesma forma, o hbito de dirigir
sob embriaguez, resultando em menos acidentes fatais de trnsito. Para medirmos o efeito ceteris pari-
bus dos impostos sobre esses acidentes, podemos modelar fatalidades como uma funo de diversos
fatores, inclusive o imposto sobre a cerveja:
/31 mede a diferena nas fatalidades devido ao aumento de um ponto percentual no imposto, mantendo
conscerv lixo. E difcil de entender por que isso seria de interesse. No deveramos controlar as diferen
as de conscerv entre os Estados, a menos que quisssemos verificar algum tipo de efeito indireto do
imposto sobre a cerveja. Outros fatores, como a distribuio por sexo e idade, deveriam ser controlados.
A questo de decidir se devemos ou no controlar certos fatores nem sempre bem definida. Por
exemplo, Betts (1995) estuda o efeito da qualidade do ensino mdio sobre a renda subseqente. Ele
salienta que, se qualidade melhor de ensino resulta em mais educao, ento controlar a educao na
regresso juntamente com avaliao da qualidade subestimar o retomo da qualidade. Betts faz a an
lise com e sem anos de escolaridade na equao para obter uma gama de efeitos estimados da qualidade
de ensino.
Para verificar claramente como a nfase em /^-quadrados altos pode criar problemas, considere o
exemplo do preo dos imveis da Seo 4.5 que ilustra a verificao de mltiplas hipteses. Naquele
caso, queramos verificar a racionalidade da avaliao dos preos dos imveis. Fizemos a regresso de
log(preo) sobre log(ava/), \og(tamterr), \ogiarquad), e qtdorm e verificamos se as trs ltimas variveis
tinham coeficientes populacionais zero enquanto \og(aval) tinha um coeficiente unitrio. Entretanto, se
quisermos estimar um modelo de preo hednico, como no Exemplo 4.8, onde os valores marginais de
vrias caractersticas dos imveis so obtidos? Devemos incluir log(aval) na equao? O /^-quadrado
ajustado da regresso com \og{aval) 0,762, enquanto o 7?-quadrado ajustado sem ele 0,630. Com
base somente no grau de ajuste, devemos incluir log(avaZ). Contudo, isso ser incorreto se nossa meta
for determinar os efeitos do tamanho da propriedade, rea construda e nmero de quartos nos valores
dos imveis. A incluso de log(aval) na equao equivale a manter um indicador de valor fixo e indagar
quanto a adio de um quarto alterar outro indicador de valor. Essa medida no faz sentido na avalia
o das caractersticas dos imveis.
Se lembrarmos que modelos diferentes servem a propsitos diferentes, e nos concentrarmos na inter
pretao ceteris paribus da regresso, no incluiremos os fatores errados em um modelo de regresso.
cerbar o problema da multicolinearidade. De outro lado, como estamos retirando algo do termo erro, a
adio de uma varivel geralmente reduz a varincia do erro. De forma geral, no podemos saber que
efeito ser dominante.
Porm, h um caso que bvio: devemos sempre incluir variveis independentes que afetem y e
que sejam no-correlacionadas com todas as variveis independentes de interesse. A razo para esta
incluso simples: a adio dessa varivel no induz multicolinearidade na populao (e, portanto, a
multicolinearidade na amostra deve ser desprezvel), mas reduzir a varincia do erro. Em amostras de
tamanho grande, os erros-padro de todos os estimadores MQO sero reduzidos.
Como exemplo, considere estimar a demanda individual por cerveja como uma funo do preo
mdio da cerveja no municpio. Pode ser razovel assumir que as caractersticas individuais sejam no-
correlacionadas com os preos em nvel de municpios, e assim uma regresso simples do consumo de
cerveja sobre o preo nos municpios seria suficiente para estimar o efeito do preo sobre a demanda
individual. Entretanto, possvel obter uma estimativa mais precisa da elasticidade-preo da demanda por
cerveja com a incluso de caractersticas individuais, como a idade e o grau de escolaridade. Se esses
fatores afetarem a demanda e forem no-correlacionados com o preo, o erro-padro do coeficiente do
preo ser menor, pelo menos em amostras grandes.
Como segundo exemplo, considere o subsdio para equipamentos de computao dado no incio
da Seo 6.3. Se, alm da varivel do subsdio, controlarmos outros fatores que possam explicar a nota
mdia em curso superior, poderemos provavelmente conseguir uma estimativa mais precisa do efeito
do subsdio. Variveis indicadoras da nota mdia no ensino mdio, a classificao da instituio, as
pontuaes sat e tac e os antecedentes familiares so bons candidatos. Como os montantes do subsdio
so determinados aleatoriamente, todas as variveis de controle adicionais sero no-correlacionadas
com o montante de subsdio; nessa amostra, a multicolinearidade entre o montante do subsdio e as
outras variveis independentes deve ser mnima. Porm, a adio de controles extras pode reduzir sig-
nificantemente a varincia do erro, conduzindo a uma estimativa mais precisa do efeito do subsdio.
Lembre-se, neste caso, de que o problema no a inexistncia de vis: obteremos um estimador no-
viesado e consistente, quer incluamos ou no as variveis de desempenho no ensino mdio e de antece
dentes familiares. O problema est na obteno de um estimador com uma menor varincia amostrai.
Infelizmente, casos em que temos informaes sobre as variveis explicativas adicionais que
sejam no-correlacionadas com as variveis explicativas de interesse so raros no campo das cincias
sociais. Porm, vale a pena lembrar que, quando essas variveis esto disponveis, elas podero ser
includas em um modelo para reduzir a varincia do erro sem induzir multicolinearidade.
Quando inserimos valores especficos das variveis independentes nessa equao, obtemos uma pre
viso de y, que uma estimativa do valor esperado de y, dados os valores especficos das variveis
explicativas. Para enfatizar, sejam c,, c2, ck valores particulares de cada uma das k variveis inde
pendentes; elas podero ou no corresponder a um ponto efetivo dos dados em nossa amostra. O par
metro que gostaramos de estimar
O estimador de 0 O
0 = 0 + l Cl + l C2 + - + kCf (6.29)
Na prtica, isso fcil de ser computado. Entretanto, se o que quisermos for um indicador da
incerteza nesse valor previsto? natural construir um intervalo de confiana de 0 Oque seja centrado
em 60.
Para obter um intervalo de confiana de 0Oprecisamos de um erro-padro de 0O. Ento, com
um grande gl, poderemos construir um intervalo de confiana de 95% utilizando a regra prtica
0O 2 ep(<?(l). (Como sempre, podemos usar os percentis exatos em uma distribuio t.)
Como obtemos o erro-padro de 0O? Este o mesmo problema que encontramos na Seo 4.4:
precisamos obter um erro-padro de uma combinao linear dos estimadores MQO. Aqui, o problema
ainda mais complicado, pois todos os estimadores MQO geralmente aparecem em 0O(a menos que
algum Cj seja zero). No entanto, o mesmo truque que usamos na Seo 4.4 funcionar aqui. Escreva
/30 = 60 - /3,c, ... - fkck e agregue isso equao
y - P o + /3 1-^1 + + PkXk + u
para obter
Em outras palavras, subtramos o valor c; de cada observao de x;, e depois computamos a regres
so de
O valor previsto em (6.29) e, mais importante, seu erro-padro, so obtidos do intercepto (ou
constante) na regresso (6.31).
Como exemplo, obtemos um intervalo de confiana de uma previso a partir de uma regresso de
nota mdia em curso superior, das quais usamos informaes do ensino mdio.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 197
EXEMPLO 6.5
(Intervalo de Confiana de nmgrad Previsto)
Utilizando os dados contidos no arquivo GPA2.RAW, obtemos a seguinte equao para prever n m g ra d :
onde apresentamos as estimativas com vrias casas decimais para reduzir o erro de arredondamento. Qual
a previso de n m g ra d quando s a t = 1.200, e m p e rc = 30 e tam clas = 5 (o que significaria 500)? Isso
fcil de ser obtido, incorporando esses valores na equao (6.32): n m g fa d = 2,70 (arredondado para duas
casas decimais). Infelizmente, no podemos usar diretamente a equao (6.32) para obter um intervalo
de confiana da n m g ra d esperada com os valores dados das variveis independentes. Uma maneira simples de
obter um intervalo de confiana definir um novo conjunto de variveis independentes: satO = sat - 1.200,
empercO = e m p e rc - 30, tam dasO = tam clas - 5 e tam d a sq u a d O = tam clas2 - 25. Quando fazemos
a regresso de n m g ra d sobre essas novas variveis independentes, obtemos
A nica diferena entre esta regresso e aquela em (6.32) o intercepto, que a previso que quere
mos, juntamente com seu erro-padro, 0,020. No por acidente que os coeficientes de inclinao, seus
erros-padro, /?-quadrado etc. so os mesmos de antes; esse fato fornece uma maneira de verificarmos se
foram feitas as transformaes adequadas. Podemos construir com facilidade um intervalo de confiana de
95% da nota mdia esperada: 2,70 1,96(0,020) ou em torno de 2,66 a 2,74. Este intervalo de confian
a suficientemente estreito devido ao tamanho bastante grande da amostra.
Como a varincia do estimador do intercepto a menor quando cada varivel explicativa tem
mdia amostrai zero (veja a Questo 2.5 para o caso da regresso simples), segue da regresso em
(6.31) que a varincia da previso nos valores mdios de x-t (isto , c; = x, para todo j) a menor. Este
resultado no to surpreendente, j que o ponto de maior confiabilidade em nossa linha de regresso
est prximo ao centro dos dados. Na medida em que os valores de c; se afastam de .v;, Var( y) se toma
cada vez maior.
O mtodo anteriof nos possibilita colocar um intervalo de confiana em tomo da estimativa MQO
de E(j>jx|, ..., xf ) para quaisquer valores das variveis explicativas. Em outras palavras, obtemos um
198 Introduo Econometria Editora Thomson
Como antes, nossa melhor previso de y o valor esperado de _y, dadas as variveis explicativas
que estimamos da linha de regresso MQO: y0 = 0 Q+ 0 t x + 0 2x2 + + Pi O erro de previ
so com o uso de v para prever y
Agora, E( v) = E (0 O) + E (0 l )xl + E (0 2)x2 + ... + E (0 k)xk = (3n + /3,*',1 + ... + /3kxk, porque
os 0, so no-viesados. (Como antes, essas expectativas so todas condicionais aos valores amostrais
das variveis independentes.) Como u tem mdia zero, E() = 0. Mostramos que o erro de previso
esperado zero.
Ao encontrar a varincia de , observe que u no-correlacionado com cada 0., porque m no-
correlacionado com os erros na amostra usada para a obteno de /3 . Pelas propriedades bsicas da
covarincia (veja Apndice B, no site da Thomson), u e y so no-correlacionados. Portanto, a va
rincia do erro de previso (condicional a todos os valores das variveis independentes includas na
amostra) a soma das varincias:
onde cr2 = Var() a varincia do erro. Existem duas fontes de varincia em . A primeira o erro de
amostragem em y, que surge por termos estimado /3r Como cada 0j tem uma varincia proporcional a
1In, na qual n o tamanho da amostra, Var(v) proporcional a Mn. Isso significa que, para amostras
grandes, Var( v ) pode ser muito pequena. Em contraposio, <r2 a varincia do erro na populao; ela
no muda com o tamanho da amostra. Em muitos exemplos, cr2 ser o termo dominante em (6.35).
Sob as hipteses do modelo linear clssico, /3; e u so normalmente distribudos, e assim tam
bm normalmente distribudo (condicional a todos os valores amostrais das variveis explicativas).
Anteriormente, descrevemos como obter um estimador ne-viesado de Var(_y), e obtivemos nosso esti-
mador no-viesado de cr2 no Captulo 3. Com o uso desses estimadores, podemos definir o erro-padro
de como
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 199
Utilizando o mesmo raciocnio para as estatsticas t de /3., /ep(") tem uma distribuio t com
n (k + 1) graus de liberdade. Portanto,
onde t0 025 o 97,5 percentil na distribuio Para n - k - 1 grande, lembre-se de que /n 02s 5=5
1,96. Inserindo = y y e fazendo a reordenao, obtemos um intervalo de previso de 95% para v:
como sempre, exceto para gl pequeno, uma boa regra prtica y 2ep("). Isso mais amplo que o
prprio intervalo de confiana de y, devido a 2 em (6.36); normalmente ela muito mais ampla para
refletir os fatores em w que no tenhamos controlado.
EXEMPLO 6.6
(Intervalo de Confiana de Notas Mdias Futuras)
Suponha que desejamos um IC de 95% de n m g ra d futuro de um aluno do ensino mdio com s a t = 1.200,
emperc = 30 e tam clas = 5. No Exemplo 6.5 obtivemos um intervalo de confiana de 95% da m dia da
nota mdia entre todos os alunos com as caractersticas particulares s a t = 1.200, e m p e rc = 30 e tam clas
= 5. Agora, queremos um intervalo de confiana de 95% de qualquer aluno que e sp e cifica m e n te tenha
essas caractersticas. 0 intervalo de previso de 95% deve registrar a variao na caracterstica individual,
no-observada, que afeta o desempenho universitrio. Temos tudo que preciso para obter um IC de
nmgrad. Sabemos que ep(y) = 0,020 e & = 0,560 e, portanto, de (6,36), ep() = [(0,020)2 +
(0,560)2]1/2 ~ 0,560. Observe o quanto ep(y) pequeno em relao a & : virtualmente, toda a variao em
vem da variao em u. O IC de 95% 2,70 1,96(0,560) ou est entre 1,60 e 3,80. Este um inter
valo de confiana enorme, e mostra que, com base nos fatores que inclumos na regresso, no podemos
definir com clareza a futura nota de graduao de determinado indivduo. (Em certo sentido, isso bom, por
significar que a classificao no curso mdio e o desempenho no teste de aptido acadmica no predeter
minam o desempenho de algum na faculdade.) Evidentemente, as caractersticas no observadas variam
amplamente de um indivduo para o outro com as mesmas notas no teste de aptido acadmica e na clas
sificao no curso mdio observadas.
Anlise de Resduos
Algumas vezes, til examinar as observaes individuais para verificar se o valor efetivo da
varivel dependente est acima ou abaixo do valor previsto; isto , examinar os resduos das observa
es individuais. Este processo chamado anlise de resduos. Os economistas so conhecidos por
examinarem os resduos de uma regresso para auxili-los, por exemplo, na compra de um imvel.
200 Introduo Econometria Editora Thomson
O exemplo seguinte sobre preos de imveis ilustra a anlise de resduos. Os preos dos imveis
esto relacionados a vrias caractersticas observadas do imvel. Podemos relacionar todas as carac
tersticas que julgarmos importantes, como tamanho, nmero de quartos, nmero de banheiros, e
assim por diante. Podemos usar uma amostra de imveis para estimar o relacionamento entre o preo
e as caractersticas, e terminamos obtendo um valor previsto e um valor real de cada imvel. Ento,
podemos construir os resduos, uj = v, yr O imvel com o maior resduo negativo , pelo menos
com base nos fatores que estamos controlando, o mais barato em relao s suas caractersticas
observadas. claro que um preo de venda substancialmente inferior ao seu preo previsto poderia
indicar alguma caracterstica indesejvel do imvel que deixamos de avaliar, e que portanto est con
tido no erro no-observado. Alm da obteno da previso e do resduo, tambm faz sentido computar
o intervalo de confiana de qual seria o preo de venda do imvel no futuro, utilizando o mtodo
descrito na equao (6.37).
Utilizando os dados contidos no arquivo HPRICE1.RAW, computamos a regresso de preo sobre
tamterr, arquade qtdorm. Na amostra de 88 imveis, o resduo mais negativo 120,206, do 8 Ia im
vel. Portanto, o preo pedido por esse imvel est US$120.206,00 abaixo de seu preo previsto.
Existem muitos outros usos da anlise de resduos. Uma maneira de classificar as faculdades de
direito fazer a regresso da mediana dos salrios iniciais sobre uma variedade de caractersticas dos
alunos (como a mediana das notas de ingresso nos cursos para novos alunos, a mediana das notas
mdias de graduao para novos alunos etc.) e obter um valor previsto e um resduo de cada faculdade
de direito. A faculdade de direito com o maior resduo ter o maior valor agregado previsto. (Natu
ralmente, ainda existir muita incerteza sobre como o salrio inicial de um indivduo se compararia
com a mediana geral de uma faculdade de direito.) Esses resduos podero ser usados juntamente com
mensalidades cobradas pelas faculdades de direito para determinarmos o valor mais vantajoso; isso exi
gir um desconto apropriado dos ganhos futuros.
A anlise de resduos tambm tem participao em decises judiciais. Um artigo publicado no jor
nal The New York Times intitulado Juiz Diz que Pobreza de Alunos, e No a Segregao, Prejudica
Aproveitamento Escolar (28.06.95) descreve um importante processo legal. A questo era se o fraco
desempenho nos exames padronizados do Distrito Escolar de Hartford, em relao ao desempenho nos
distritos vizinhos, era devido baixa qualidade de ensino nas escolas altamente segregadas. O juiz con
cluiu que a disparidade nas notas de aproveitamento escolar no indica que Hartford esteja fazendo
um trabalho inadequado ou insuficiente na educao de seus alunos ou que suas escolas sejam defi
cientes, pois as notas de aproveitamento previstas com base em relevantes fatores socioeconmicos
esto prximas dos nveis esperados. Esta concluso foi, quase com certeza, baseada em uma anlise
de regresso das notas de aproveitamento mdias ou de suas medianas sobre as caractersticas socioe-
conmicas de vrios distritos escolares de Connecticut. A concluso do juiz sugere que, considerando
o nvel de pobreza dos alunos das escolas de Hartford, as notas de aproveitamento efetivas dos alunos
eram semelhantes s previstas em uma anlise de regresso: o resduo de Hartford no era suficiente
mente negativo para se concluir que as escolas em si mesmas eram responsveis pelas baixas notas de
aproveitamento escolar.
Como voc poderia usar a anlise de resduos para determinar quais atores cinematogrficos so remunera- >
dos em nveis acima da bilheteria dos filmes em que atuam? j
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 201
Nesta equao os xf podero ser transformaes de outras variveis; por exemplo, poderamos ter
X, = log(vendas), x2 = log (valmerc), x2 = permceo no exemplo do salrio dos diretores executivos.
Dados os estimadores MQO, sabemos como prever logy para qualquer valor das variveis inde
pendentes:
Agora, como o exponencial desfaz o log, nossa primeira suposio para prever y simples
mente exponenciar o valor previsto de log(y): v = exp(lgy). Isso no funciona; alis, isso sistemati
camente subestimar o valor esperado de y. De fato, se o modelo (6.38) obedecer s hipteses do
modelo linear clssico RLM .l at RLM.6, pode ser demonstrado que
v = exp(cr2/2)exp(lgy), (6.40)
onde cr2 simplesmente o estimador no-viesado de cr2. Como \ o erro-padro da regresso, sem
pre conhecido, a obteno de valores previstos de y ser fcil. Como <x2 > 0, exp(2/2) > 1. Para um
2 grande, esse fator de ajuste poder ser substancialmente maior que a unidade.
A previso em (6.40) no no-viesada, mas consistente. No existem previses no-viesadas
de y, e em muitos casos (6.40) funciona bem. Porm, ela depende da normalidade do termo erro, u.
No Captulo 5, mostramos que o MQO possui propriedades desejveis, mesmo quando u no for nor
malmente distribudo. Portanto, vantajoso ter uma previso que no dependa da normalidade. Se
simplesmente assumirmos que u independente das variveis explicativas, teremos
onde a0 o valor esperado de exp(n), que deve ser maior que a unidade.
202 Introduo Econometria Editora Thomson
que mais uma vez simplesmente requer que faamos a exponenciao do valor previsto do modelo log
e que multipliquemos o resultado por 0.
O resultado que um estimador consistente de 0 facilmente obtido.
EXEMPLO 6.7
(Previso de Salrios de Diretores Executivos)
0 modelo de interesse
log {salrio) = /80 + /3,log {vendas) + (i2\og(valmerc) + /32permceo + u,
de forma que ^ e /32 so elasticidades e 100 /S3 uma semi-elasticidade. A equao estimada utilizando
os dados contidos no arquivo CE0SAL2.RAW
onde, para maior clareza, Isario representa o log de sal rio e, de forma semelhante, Ivendas e Ivalmerc
representam o log de vendas e valm erc. A seguir, obtemos rh, = exp(lslrio-) de cada observao na amos
tra. A regresso de salrio sobre m (sem uma constante) produz 0 = 1,117.
Podemos usar esse valor de 0 juntamente com (6.43) para prever salrio de qualquer valor de vendas, val
m e rc e p e rm c e o . Encontremos a previso de vendas = 5.000 (que significa 5 bilhes de dlares, j que
vendas est em milhes de dlares), valm erc = 10.000 (10 bilhes de dlares), e p e rm ce o = 10. Da equa
o (6.43), a previso de Isario 4,504 + 0,163 log(5.000) + 0,109 - log( 10.000) + 0,0117(10) = 7,013.
0 salrio previsto , portanto, 1,117- exp(7,013) = 1.240,967, ou 1.240.967 dlares. Se esquecermos de
multiplicar por 0 = 1,117, obteremos uma previso de 1.110.983 dlares.
Wooldridge Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 203
Podemos usar o mtodo anterior de obter previses para determinar o quanto o modelo com log(y)
como varivel dependente explica bem a varivel y. J temos indicadores para modelos quando v a
varivel dependente: o P-quadrado e o P-quadrado ajustado. O objetivo encontrar um bom indicador
de grau de ajuste no modelo logCv) que possa ser comparado com um /?-quadrado de um modelo no
qual y a varivel dependente.
Existem vrias maneiras de encontrarmos esse indicador, mas apresentamos um mtodo que
fcil de ser implementado. Aps computar a regresso de y sobre m passando pela origem no passo
(iii), obtemos os valores estimados dessa regresso, = 0m.. Em seguida, encontramos a correlao
amostrai entre yt e o verdadeiro na amostra. O quadrado dessa correlao amostrai pode ser compa
rado com o /?-quadrado que obtemos com o uso de v como a varivel dependente em um modelo de
regresso linear. Lembre-se de que o P-quadrado na equao estimada
y = P0 + /M i + - + /V *
EXEMPLO 6.8
(Previso de Salrios de Diretores Executivos)
Aps o passo (iii) no procedimento precedente, obtemos os valores estimados salrio = 0m,. A correlao
simples entre salrio, e salrio na amostra 0,493; o quadrado desse valor est por volta de 0,243. Esse
o nosso indicador de quanto da variao de salrio explicada pelo modelo log; no se trata do ^-quadra
do de (6.43), que 0,318.
Suponha que estimemos um modelo com todas as variveis em nvel:
0 /?-quadrado obtido estimando esse modelo, usando as mesmas 177 observaes, 0,201. Assim, o modelo
log explica mais da variao em salrio, e assim o nosso preferido com base no grau de ajuste. 0
modelo log tambm o escolhido porque parece ser mais realista e seus parmetros so mais fceis de ser
interpretados.
Neste captulo, tratamos de alguns tpicos importantes sobre a anlise de regresso mltipla.
A Seo 6.1 mostrou que uma mudana nas unidades de medida de uma varivel independente
altera o coeficiente do MQO da maneira esperada: se x- for multiplicado por c, seu coeficiente ser
dividido por c. Se a varivel dependente multiplicada por c, todos os coeficientes de MQO so mul
tiplicados por c. Nem a estatstica t nem a F so alteradas pela mudana das unidades de medida de
quaisquer variveis.
Discutimos os coeficientes beta, que medem os efeitos das variveis independentes sobre a vari
vel dependente em unidades de desvios-padro. Os coeficientes beta so obtidos de uma regresso
204 Introduo Econometria Editora Thomson
MQO padro depois de as variveis dependente e independentes terem sido transformadas em valores
padronizados.
Como vimos em vrios exemplos, a forma funcional logartmica produz coeficientes com inter
pretaes de efeitos percentuais. Comentamos sobre suas vantagens adicionais na Seo 6.2. Tambm
vimos como computar o efeito percentual exato quando um coeficiente em um modelo log-nvel
grande. Modelos com termos quadrticos consideram efeitos marginais decrescentes ou crescentes.
Modelos com interaes possibilitam que o efeito marginal de uma varivel explicativa dependa do
nvel de outra varivel explicativa. _
Introduzimos o -quadrado ajustado, R2, como uma alternativa ao /Cquadrado habitual para medir
o grau de ajuste. Enquanto o R2 nunca pode cair quando outra varivel adicionada na regresso, o R2
penaliza o nmero de regressores e pode cair quando uma varivel independente adicionada. Isso faz
do R2 o preferido para a opo entre modelos no-aninhados com diferentes quantidades de variveis
explicativas. Nem o R2 nem o R2 podem ser usados para comparar modelos com variveis dependen
tes diferentes. No entanto, bastante fcil obter indicadores de graus de ajuste para optarmos entre y e
log( v) como a varivel dependente, como mostrado na Seo 6.4.
Na Seo 6.3 discutimos o problema de certa forma sutil de dependermos demasiadamente do R2
ou do R2 para chegarmos a um modelo final: possvel controlarmos grandes quantidades de fatores
em um modelo de regresso. Por essa razo, importante pensar frente sobre a especificao de
modelos, particularmente sobre a natureza ceteris paribus da equao de regresso mltipla. Variveis
explicativas que afetem y e sejam no-correlacionadas com todas as outras variveis explicativas
podem ser usadas para reduzir a varincia do erro sem induzir multicolinearidade.
Na Seo 6.4 demonstramos como obter um intervalo de confiana de uma previso feita de uma
linha de regresso MQO. Tambm mostramos como um intervalo de confiana pode ser construdo
para um valor futuro e desconhecido de y.
Ocasionalmente, queremos prever y quando log( v) usado como a varivel dependente em um
modelo de regresso. A Seo 6.4 explica esse mtodo simples. Finalmente, algumas vezes estamos
interessados em conhecer o sinal e a magnitude dos resduos de observaes especficas. A anlise de
resduos pode ser usada para determinarmos se elementos especficos da amostra possuem valores pre
vistos que estejam bem acima, ou bem abaixo, dos verdadeiros resultados.
6.1 A seguinte equao foi estimada utilizando os dados contidos no arquivo CEOSAL1.RAW:
n = 209, R2 = 0,282.
Esta equao permite que rma tenha um efeito decrescente sobre log (salrio). Essa generalidade
necessria? Justifique.
6.2 Sejam /30, /,, ..., as estimativas MQO da regresso de y, sobre xn , ..., xik, i = 1, 2,..., n. Para
constantes diferentes de zero c u ..., ck, argumente que o intercepto e as inclinaes MQO da regresso
de coy, sobre c xxn , ..., c&ik, i = 1, 2,..., n so dados por /3() = cn f}Q, /3, = (c,/c,) jS,,..., /3( = (c/c*)
Wooldridge Capitulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 205
k. (Sugesto: Use o fato de que /3 soluciona as condies de primeira ordem em (3.13), e que .
deve solucionar as condies de primeira ordem envolvendo as variveis dependente e independen
tes redimensionadas.)
6.3 Utilizando os dados contidos no arquivo RDCHEM.RAW, a seguinte equao foi obtida por
MQO:
n = 32, R2 = 0,1484.
(i) Em que ponto o efeito marginal de vendas sobre pdintens se toma negativo?
(ii) Voc manteria o termo quadrtico no modelo? Explique.
(iii) Defina vendasbil como vendas expressas em bilhes de dlares: vendasbil = vendas!1.000.
Reescreva a equao com vendasbil e vendasbil2 como as variveis independentes.
Certifique-se de descrever os erros-padro e o R-quadrado. [Sugesto: Observe que ven
dasbil2 = vendas2!{1.000)2.]
(iv) Com o propsito de descrever os resultados, qual equao voc prefere?
6.4 O seguinte modelo permite que o retomo da educao dependa da educao total dos pais, cha
mada edupais:
(i) Mostre que, em forma decimal, o retomo de mais um ano de educao nesse modelo
n = 722, R2 = 0,169.
(Somente 722 observaes contm todas as informaes sobre a educao dos pais.)
Interprete o coeficiente do termo de interao. Pode ser interessante escolher dois valores
especficos para edupais, por exemplo, edupais = 32 se ambos tiverem educao superior,
ou edupais = 24 se ambos tiverem educao de nvel mdio e comparar o retomo esti
mado de educ.
206 Introduo Econometria Editora Thomson
(iii) Quando edupais adicionada como uma varivel separada na equao, obtemos:
O retomo da educao agora depende positivamente da educao dos pais? Teste a hip
tese nula de que o retomo da educao no depende da educao dos pais.
6.5 No Exemplo 4.2, no qual a percentagem de alunos aprovados em um exame de matemtica
do 10" ano (matelO) a varivel dependente, faz sentido incluir cienll a percentagem de alunos do
11" ano aprovados em um exame de cincias como uma varivel explicativa adicional?
6.6 Quando taxafreq2 e tactaxafreq so adicionadas equao (6.19), o ft-quadrado passa a ser
0,232. Esses termos adicionais so conjuntamente significantes no nvel de 10%? Voc os incluiria
no modelo?
6.7 As trs seguintes equaes foram estimadas utilizando-se as 1,534 observaes contidas no
arquivo 401K.RAW.
R2 = 0,100, R2 = 0,098.
R2 = 0,144, R2 = 0,142.
+ 0,0000000039 totemp2
( 0 , 0000000010)
R2 = 0,108, R2 = 0,106.
Qual desses trs modelos voc prefere? Por qu?