Você está na página 1de 5

REGRESSO LINEAR MLTIPLA

1. INTRODUO
A regresso mltipla envolve trs ou mais variveis, portanto, estimadores. Ou seja, ainda
uma nica varivel dependente, porm duas ou mais variveis independentes (explanatrias).
A finalidade das variveis independentes adicionais melhorar a capacidade de predio em
confronto com a regresso linear simples. Isto , reduzir o coeficiente do intercepto, o qual, em
regresso, significa a parte da varivel dependente explicada por outras variveis, que no a
considerada no modelo.
Mesmo quando estamos interessados no efeito de apenas uma das variveis, aconselhvel
incluir as outras capazes de afetar Y, efetuando uma anlise de regresso mltipla, por 2 razes:
a) Para reduzir os resduos estocsticos. Reduzindo-se a varincia residual (ERRO
PADRO DA ESTIMATIVA), aumenta a fora dos testes de significncia;
b) Para eliminar a tendenciosidade que poderia resultar se simplesmente ignorssemos
uma varivel que afeta Y substancialmente.
Uma estimativa tendenciosa quando, por exemplo, numa pesquisa em que se deseja
investigar a relao entre a aplicao de fertilizante e o volume de safra, atribumos erroneamente
ao fertilizante os efeitos do fertilizante mais a precipitao pluviomtrica.
O ideal obter o mais alto relacionamento explanatrio com o mnimo de variveis
independentes, sobretudo em virtude do custo na obteno de dados para muitas variveis e
tambm pela necessidade de observaes adicionais para compensar a perda de graus de
liberdade decorrente da introduo de mais variveis independentes.
2. O MODELO MATEMTICO
A equao da regresso mltipla tem a forma seguinte:

Yc = a + b1x1 + b2x2 + ... + bkxk, onde:


a = intercepto do eixo y;
bi = coeficiente angular da i-sima varivel;
k = nmero de variveis independentes.
ou, como define WONNACOTT (1981, p. 326):
Yi = + xi + zi + ei
interpretado geometricamente como o coeficiente angular do plano, na medida em que
nos deslocamos na direo do eixo dos Xs, mantendo Z constante: , assim, o efeito marginal
da varivel X sobre Y.
o coeficiente do plano na medida em que nos movemos na direo do eixo dos Zs,
mantendo X constante: , assim, o efeito marginal da varivel Z sobre Y.
Enquanto uma regresso simples de duas variveis resulta na equao de uma reta, um
problema de trs variveis implica num plano, e um problema de k variveis implica em um
hiperplano.

Tambm na regresso mltipla, as estimativas dos mnimos quadrados so obtidas pela


escolha dos estimadores que minimizam a soma dos quadrados dos desvios entre os valores
observados Yi e os valores ajustados Yc.
3. INTREPRETAO DA REGRESSO OUTROS FATORES SENDO IGUAIS
Na regresso simples:
b = aumento em Y, decorrente de um aumento unitrio em X.

Na regresso mltipla:
bi = aumento em Y se Xi for aumentado de 1 unidade, mantendo-se constantes todas as
demais variveis Xi.

4. COMPARAO ENTRE REGRESSO SIMPLES E REGRESSO MLTIPLA


Suponha uma investigao sobre os benefcios de um sistema de irrigao em determinada
regio. Ao considerar-se uma regresso simples para se estimar o volume da safra (Y) em funo
dos ndices pluviomtricos (r) de vrios anos, encontrou-se a seguinte equao:
Y = 60 1,67r
Erro padro do coeficiente b = 4,0
O coeficiente negativo estaria indicando que a chuva (ndice pluviomtrico) reduz a safra,
sugerindo que h algo errado. Ao acrescentar-se a varivel temperatura (t), efetuou-se uma
regresso mltipla representada pela equao:
Y = 60 + 5,71r + 2,95t
Erro padro dos coeficientes: b1 = 2,68 e b2 = 0,69
A precipitao pluviomtrica tem, de fato, o efeito esperado de aumentar a safra, os outros
fatores permanecendo iguais (isto , quando a temperatura constante).
Enquanto a regresso mltipla enfatiza e isola a relao direta e a regresso simples no o
faz; ao invs disso, o coeficiente de regresso simples reflete os efeitos tanto diretos como
indiretos (em nosso exemplo, o efeito direto positivo da precipitao pluviomtrica sobre a safra,
e seu efeito negativo indireto o aumento do ndice pluviomtrico leva reduo da temperatura,
que provoca uma reduo na safra).
5. VARIVEIS BINRIAS (0-1)
5.1. Incluso de Variveis Binrias
Imagine uma investigao sobre a relao entre a aquisio de ttulos do governo (B) e a
renda nacional (Y). Observaes anuais realizadas mostram que a relao dos ttulos em funo
da renda acusa dois padres distintos um para o tempo de guerra e outro para o tempo de paz.
A relao normal de B para Y (reta inferior) est sujeita a uma mudana para cima (reta
superior) durante o perodo de guerra (ver figura abaixo). Dessa forma, B deve ser relacionado
com Y e com outra varivel a guerra (W).
2

Yc = a + b1.X + b2.D
Se D = 0:
Yc = a +
b1.X
Se D = 1:
Yc = (a+b2) + b1.X
Y

W no representa uma srie completa de valores, mas apenas dois: fixamos em 1 o seu valor
para todo o perodo de guerra e em 0 para os anos de paz (W uma varivel do tipo 0-1 ou
varivel muda ou ainda varivel DUMMY ou binria).
E(B) = 0 + Y + W
Onde:
W = 0, para os anos de paz
W = 1, para os anos de guerra

E(B) = 0 + Y
E(B) = 0 + Y +

5.2. Tendenciosidade Causada pela Excluso da Varivel Muda


Pela anlise da figura, pode-se observar que o fato de ignorarmos uma varivel favorece a
tendenciosidade e aumenta a varincia residual.
Se deixarmos de calcular a regresso mltipla, incluindo a varivel muda guerra, e
calcularmos erroneamente a regresso simples de B sobre Y, ela acusar coeficiente angular
demasiadamente grande, provocando uma tendenciosidade para cima, causada pelo fato de os
anos de guerra acusarem ligeira tendncia para serem anos de renda elevada.
Assim, as vendas mais altas de ttulos, que deveriam ser atribudas em parte poca de
guerra, seriam erroneamente atribudas renda somente.
6. MULTICOLINEARIDADE
6.1. Na Regresso Simples
Quando os valores de X acusam pequena (ou nenhuma) variao, o efeito de X sobre Y j
no pode ser sensivelmente investigado. Mas se o problema predizer Y ao invs de investigar
a dependncia de Y em relao a X a concentrao dos valores de X a que no ter mesmo
influncia, desde que limitemos nossa predio a este mesmo pequeno intervalo de valores de X.
Na regresso simples, nestes casos, nosso melhor ajustamento para Y no ser uma reta, mas
antes um ponto (X, Y).
3

6.2. Na Regresso Linear Mltipla


Na regresso mltipla, nosso melhor ajustamento para Y, neste mesmo contexto, no um
plano, mas sim uma reta.
Quando duas variveis independentes X e Z so colineares, ou quase colineares (isto ,
altamente correlacionadas), temos o problema da multicolinearidade (no caso de 2 variveis,
apenas colinearidade).
De forma anloga regresso simples, isso no gera problemas na predio de Y, desde que
no procuremos predizer a partir de valores de X e Z afastados de nossa reta de colinearidade.
Entretanto no possvel investigar a influncia de X somente (ou Z somente) sobre Y.
O problema da multicolinearidade surge, num exemplo simples, quando um pesquisador
considera X como a quantidade de fertilizante em libras por are e comete o erro de medir a
quantidade de fertilizante em onas por are, usando-a como outro regressor, Z.
Como qualquer peso avaliado em onas deve ser 16 vezes seu valor em libras (Z = 16X),
todas as combinaes de X e Z devem recair sobre esta reta, num exemplo de colinearidade
perfeita.
Mais sutilmente, a colinearidade pode surgir, por exemplo, quando so usados dois
regressores medidos em termos de preos, exigindo cuidado especial para que tal fato no ocorra.
7. INTERVALOS DE CONFIANA E TESTES ESTATSTICOS
So realizados de forma semelhante ao j estudado em regresso simples, motivo por que no
sero repetidos aqui.
Ateno especial deve ser dada definio dos graus de liberdade (gl) para o teste t, que
dado por: gl = n k 1, ou seja, os k estimadores angulares e o estimador linear.
6. QUANTOS REGRESSORES DEVEM SER REPETIDOS?
Somente a teoria estatstica clssica no nos proporciona orientao absolutamente firme para
aceitar H0: a aceitao deve basear-se tambm em julgamento extra-estatstico.
Assim, se existe uma crena a priori de que a varivel ndice pluviomtrico, por exemplo,
afeta o nvel de colheita, esta varivel deve ser mantida, mesmo que o teste confirmasse
fracamente a hiptese H0 de que no haveria influncia. S se for igual a zero ou negativo que
os resultados estatsticos contradizem nossa crena a priori,
A crena a priori desempenha papel chave, no s na especificao inicial de quais
regressores devem permanecer na equao, mas tambm na deciso sobre que regressores devem
ser abandonados luz da evidncia estatstica, assim como na deciso sobre como o modelo
eventualmente ser utilizado.
Isso levou alguns estatsticos a sugerirem o nvel de 1% para variveis duvidosas,
mantendo o nvel de 5% para as outras variveis que j se esperava afetarem Y.
10. REGRESSO E ANLISE DA VARINCIA (ANOVA)
H 3 casos principais de aplicao da regresso mltipla:
a) Regresso padro: a regresso somente sobre valores numricos.
4

b) Anlise da varincia (ANOVA): equivale somente regresso sobre variveis mudas.


c) Anlise da covarincia (ANOCOVA): a regresso sobre variveis mudas e variveis
numricas.
Em resumo, a regresso padro o instrumento mais poderoso quando a varivel
independente, X, numrica. J a anlise da varincia adequada quando a varivel
independente um conjunto de categorias no-ordenadas.

Você também pode gostar