Você está na página 1de 20

REGRESSO MLTIPLA:

uma digresso sobre seus usos.


Autores: Istvan Karoly Kasznar, PhD
Professor Titular da FGV
e Presidente da IBCI

Bento Mario Lages Gonalves, MSc


Consultor Senior da IBCI

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

REGRESSO MLTIPLA
1- Introduo
A Regresso Mltipla um dos inmeros modelos estatsticos explanatrios
causais referentes ao tratamento de sries temporais de dados. Sua base estatstica
advm da Regresso Linear, que se restringe a duas variveis e a apenas uma
equao funcional do primeiro grau (Y = a + bX) de ajustamento.
A anlise de Regresso Mltipla uma metodologia estatstica de previso de
valores de uma ou mais variveis de resposta (Dependentes) atravs de um
conjunto de variveis explicativas (Independentes)*. Esta metodologia pode ser
utilizada tambm para a avaliao dos efeitos das variveis explicativas como
previsoras das variveis de resposta; isto , serve para contribuir na obteno de
respostas a perguntas do tipo Qual o melhor estimador para ... ?.
Sua aplicao especialmente importante pois permite que se estime o valor
de uma varivel com base num conjunto de outras variveis. Quanto mais
significativo for o peso de uma varivel isolada, ou de um conjunto de variveis
explicativas, tanto mais se poder afirmar que alguns fatores afetam mais o
comportamento de uma varivel de resposta especificamente procurada, do que
outros.
Lamentavelmente, o termo regresso, cunhado do ttulo do primeiro
documento (paper) escrito sobre o assunto, e que de autoria de F. Galton 7, foi
desenvolvido a posteriori por Bowerman e OConnel 3, Neter e Wasserman 13,
Draper e Smith 5, Seber 14, e Goldberger 8 que estenderam a sua aplicabilidade e
desenvolveram as hipteses passveis de regresso mltipla para inmeras
situaes diferenciadas.
O formato geral da equao de Regresso Linear Mltipla :
Y = a + b1X1 + b2X2 + ... + bkXk

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Onde :
Y a Varivel Dependente;
a corresponde a um coeficiente tcnico fixo, a um valor de base a partir do
qual comea Y;
bk corresponde
Independentes; e

aos

coeficientes

tcnicos

atrelados

e Xk as Variveis Independentes.

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Variveis

As instituies financeiras procuram explicar a evoluo dos seus Depsitos


Totais a partir da evoluo de agregados macroeconmicos como o Produto Interno
Bruto PIB, a Populao e a Renda per capita . A Tabela A.1 a seguir, apresenta a
evoluo de tais indicadores no Brasil, ao longo do perodo de 1970 a 1995 :
Tabela A.1 Evoluo dos Depsitos Totais de Instituio Financeira, PIB a custo
de Fatores, Populao e Renda per capita do Brasil no Perodo 1970/1995.

Ano

Depsitos Totais
(Em US$ Milhes)

1970
1975
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995

312,0
381,5
347,4
404,2
402,1
452,0
431,7
582,3
596,6
620,8
513,6
606,9
629,0
602,7
656,7
678,5
637,6
698,2

PIB

Populao

Renda per capita

33.027
105.962
191.842
212.187
222.354
223.354
245.104
273.949
303.496
323.736
335.923
362.286
361.909
376.089
379.411
384.591
395.478
480.361

93.139.037
105.279.615
119.002.706
121.304.828
124.132.901
126.932.107
129.881.714
130.964.997
132.744.121
135.682.832
138.506.432
141.596.301
146.917.459
147.489.931
150.474.909
153.390.844
155.608.189
158.617.875

355
1.006
1.961
1.749
1.791
1.760
1.887
2.092
2.286
2.386
2.425
2.559
2.463
2.550
2.521
2.507
2.541
3.028

o
(Em US$ Milhes) (N de Habitantes)

(Em US$/Hab)

Matematicamente, o relacionamento de tais variveis pode ser descrito por :


Evoluo dos Depsitos Totais = f (PIB, Populao, Renda per capita)
Esta equao simplesmente diz que a evoluo dos Depsitos para a
instituio financeira uma funo de, ou depende de trs variveis independentes
PIB, Populao e Renda per capita. Como vimos a equao que exprime as
relaes lineares e aditivas entre estas variveis :
Y = a + b1X1 + b2X2 + b3X3

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Onde :
Y = Evoluo dos Depsitos Totais.
a = Coeficiente tcnico fixo
b1 = Coeficiente tcnico da varivel PIB.
X1 = PIB.
b2 = Coeficiente tcnico da varivel Populao.
X2 = Populao.
b3 = Coeficiente tcnico da varivel Renda per capita.
X3 = Renda per capita.
2 Aplicando a Regresso Mltipla
Para uma melhor compreenso dos conceitos de Regresso Mltipla, a
metodologia dos mnimos quadrados ser utilizada para obtermos os valores de a,
b1, b2 e b3 na equao de regresso. Ser assumido que a tarefa principal prever o
comportamento dos Depsitos Totais da Instituio Financeira nos prximos cinco
anos (1996 a 2.000), e tais previses so baseadas no comportamento do PIB (b1),
Populao (b2) e Renda per capita(b3). Usando as observaes histricas da Tabela
A.1 , deveremos determinar os valores de a, b1, b2 e b3 de forma a minimizar o Erro
Quadrado Mdio da curva de regresso, e ento utilizar os estimadores de a, b1, b2 e
b3 de forma a montar uma previso do comportamento dos Depsitos Totais.
Usando os dados histricos, de 1970 a 1995 e uma rotina de Regresso
Mltipla computadorizada como a que se encontra no STATISTICA Release 5
(1997),, os resultados obtidos so :
Tabela A.2 Resultados da Regresso Mltipla, Anlise da Varincia, e Matriz de
Correlao obtidos a partir dos dados constantes da Tabela A.1

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

RESULTADOS DA REGRESSO MLTIPLA


Var.Dependente : D.Totais
R Mltiplo : 0,93975482
R2 : 0,88313912
o
2
N de Casos : 18
R Ajustado : 0,85809750
rro Padro da Estimativa : 47,076164896
Intercepto (a) : 447,01798366
rro Padro : 363,8734
b1 (PIB) = 1,87

Regresso
Resduos
Total

b2 (POP) = -0,22

F = 35,26686
DF = 3,14
P = 0,000001

t (14) = 1,2285
P < 0,2395
b3 (Rpc) = -0,75

ANLISE DA VARINCIA ANOVA


Soma dos
Mdia dos
DF
F
Quadrados
Quadrados
234.471,5
3
78.157,18
35,26686
31.026,3
14
2.216,17
265.497,9

Nvel p
0,00001

MATRIZ DE CORRELAO
PIB
POP
Rpc

Correlao Correlao
Tolerncia
bK
R2
Parcial
Semi-Parcial
1,865174
0,562719
0,232705
0,015566 0,984434
-0,219347 -0,105515
-0,036273
0,027346 0,972654
-0,746266 -0,450537
-0,172517
0,053441 0,946559

PIB
POP
Rpc

t (14)

Nvel p

2,54704 0,023251
-0,39702 0,697341
-1,88826 0,079891

CORRELAO DOS COEFICIENTES DE REGRESSO


PIB
POP
Rpc
1,000000
-0,848786
-0,673549
-0,848786
1,000000
0,200493
-0,673549
0,200493
1,000000

Assim, a equao de previso para os Depsitos Totais de uma instituio


financeira fictcia pode ser definida como :
DT = 447,01 + 1,87 X1 - 0,22 X2 0,75 X3

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

(IV.I)

Esta equao revela simplesmente que baseado nas observaes histricas


o melhor modelo de previso a equao IV.1, exposta anteriormente. Contudo, um
problema escalar ocorre com as variveis selecionadas, uma vez que a
Varivel Dependente Depsitos Totais (DT) expressa em milhes de dlares, e as
Variveis Independentes so expressas em medidas escalares diferentes - o PIB a
custo de fatores expresso em milhes de dlares, a Populao em valores
absolutos e a Renda per capita, uma razo entre o PIB e a Populao, expressa
em Dlares/Habitante. Assim, incorreto interpretar que a varivel PIB o melhor
estimador para os Depsitos Totais simplesmente porque esta apresenta o maior
coeficiente tcnico (1,87). Se a Populao fosse expressa, por exemplo, em milhes
de habitantes, a nova unidade escalar poderia alterar o coeficiente b1, e tornar o
coeficiente b2 mais atraente (maior que b1).
A interpretao literal da equao IV.I que quando X1 , X2 e X3 se igualam a
zero, os Depsitos Totais da instituio financeira alcanaro a cifra de US$ 447,01
milhes (o valor do intercepto a); e que quando os Depsitos Totais variarem em
US$ 1 milho, o PIB sofrer uma variao de US$ 1,87 milhes (mantendo-se as
outras variveis constantes). Quando a Populao decrescer em 1 milho de
habitantes os Depsitos Totais sofrero um acrscimo de US$ 200 mil (de novo,
mantendo-se as outras variveis constantes). Assim, os coeficientes determinados
pela Regresso Mltipla simplesmente indicam como alteraes unitrias em cada
Varivel Independente podem influenciar o valor da Varivel Dependente, Y .
Uma vez determinados os parmetros da equao, esta pode ser utilizada
para prever os Depsitos Totais da instituio financeira para cada um dos prximos
cinco anos. Esta previso feita atravs da substituio simples dos valores de X1 ,
X2 e X3 na equao IV.I, e os valores encontrados podem ser plotados, conforme o
grfico de disperso a seguir.

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Predicted vs. Observed Values


Dependent variable: DTOTAIS
750

Observed Values

650

550

450

350

250
250

350

450

550

650

750

850

Regression
95% confid.

Predicted Values

Para introduzirmos uniformidade srie de Variveis Independentes e a


Varivel Dependente, devemos homogeneiz-las atravs do clculo de suas
variaes percentuais ao longo do tempo, o que altera a funo de relacionamento
entre as variveis para :
%DT = f (%PIB, %Populao, %Renda per capita)

(IV.II)

ou seja, a Variao Percentual dos Depsitos Totais (%DT) funo da


Variao Percentual do PIB (PIB), da Variao Percentual da Populao (%Pop)
e da Variao Percentual da Renda per capita (%Rpc).

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Tabela A.3 Variao Percentual dos Depsitos Totais de Instituio Financeira,


Variao Percentual do PIB a custo de Fatores, Variao Percentual da Populao e
Variao Percentual da Renda per capita do Brasil no Perodo 1970/1995.

Ano

%DT
%

1970
1975
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995

0,00
22,28
-8,94
16,35
-0,52
12,41
-4,49
34,89
2,46
4,06
-17,27
18,17
3,64
-4,18
8,96
3,32
-6,03
9,50

%PIB
0,00
220,83
81,05
10,61
4,79
0,45
9,74
11,77
10,79
6,67
3.76
7,85
-0,10
3,92
0,88
1,37
2,83
21,46

%Pop
0,00
13,03
13,03
1,93
2,33
2,26
2,32
0,83
1,36
2,21
2,08
2,23
3,76
0,39
2,02
1,94
1,45
1,93

%Rpc
0,00
183,38
94,93
-10,81
2,40
-1,73
7,22
10,86
9,27
4,37
1,63
5,53
-3,75
3,53
-1,14
-0,56
1,36
19,17

Resolvido o problema de diferenas de escala, atravs da Tabela A.3,


podemos buscar quais ou quais Variveis Independentes explicam melhor a Varivel
Dependente. Se somente uma varivel independente, X1, X2 ou X3, explicar
plenamente a evoluo dos depsitos desta instituio o problema toma a conotao
de uma Regresso Linear Simples.
Desse modo, usando os dados histricos de 1970 a 1995 da Tabela A.3, e a
mesma rotina de Regresso Mltipla computadorizada do STATISTICA Release 5
(1997), os resultados obtidos so :

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Tabela A.4 Resultados da Regresso Mltipla, Anlise da Varincia, e Matriz de


Correlao obtidos a partir dos dados constantes da Tabela A.3

RESULTADOS DA REGRESSO MLTIPLA


Var.Dependente : %DT
R Mltiplo : 0,49037341
R2 : 0,24046608
o
2
N de Casos : 18
R Ajustado : 0,7770881
rro Padro da Estimativa : 11,962482513
Intercepto (a) : 10,940557845
rro Padro : 4,682491
b1 (%PIB) = -0,68

Regresso
Resduos
Total

b2 (%POP) = -0,91

F = 1,477452
DF = 3,14
P = 0,263508

T (14) = 2,3365
P < 0,0348
b3 (%Rpc) = 1,63

ANLISE DA VARINCIA ANOVA


Soma dos
Mdia dos
DF
F
Quadrados
Quadrados
634,275
3
211,4249
1,477452
2.003,414
14
143,1010
2.637,688

Nvel p
0,263508

MATRIZ DE CORRELAO
Correlao Correlao
Tolerncia
bK
R2
Parcial
Semi-Parcial
%PIB -0,680086 -0,319313
-0,293659
0,186449 0,813551
%
%POP -0,908551 -0,398694
-0,378882
0,173904 0,826096
%Rpc 1,628957
0,485842
0,484434
0,088440 0,911560

%PIB
%
%POP
%
%Rpc
%

t (14)

-1,26076 0,228001
-1,62665 0,126101
-2,07982 0,056397

CORRELAO DOS COEFICIENTES DE REGRESSO


%PIB
%
%POP
%
%Rpc
%
1,000000
0,135743
-0,707681
0,135743
1,000000
-0,731026
-0,707681
-0,731026
1,000000

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Nvel p

E os valores observados e previstos so plotados seguir :

Predicted vs. Observed Values


Dependent variable: VAR_DT
45
35

Observed Values

25
15
5
-5
-15
-25
-12

-8

-4

12

16

20

Regression
95% confid.

Predicted Values

3 Correlao Mltipla e Coeficiente de Determinao


bastante comum numa Regresso Linear que a Varivel Dependente (Y) se
relacione com a Varivel Independente (X), mas incorreto afirmar que o valor da
primeira depende em causa e efeito das alteraes no valor da segunda. Neste caso
a inter-relao entre as variveis demonstrada atravs da correlao. O coeficiente
de correlao, r , a medida de inter-relao entre a Varivel Dependente e a
Varivel Independente. Ele pode variar de 0 (que indica ausncia de correlao) a
1 (que indica correlao perfeita). Quando o coeficiente de correlao maior que
0, as duas variveis so positivamente correlacionadas, em contrapartida quando
menor que 0, as duas variveis so negativamente correlacionadas. O sinal do
coeficiente de correlao numa Regresso Linear sempre o mesmo sinal do
coeficiente de regresso, b.
O coeficiente de correlao, r, calculado a partir da seguinte frmula (aonde
n o Nmero de Observaes (pontos) necessrios para o ajuste da linha de
regresso) :

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

n XY X Y

r=

(n X

)(

( X ) nY 2 (Y )
2

Dessa expresso, deduz-se o coeficiente de determinao (r2) que nada mais


que o quociente da variao explicada sobre a variao total; ou seja :

(Y
(y

y)2
_

y)2

(n
[n X

XY)
( X ) ][n Y ]
2

XY
2

Assim, r2 a medida de quo bem as observaes se ajustam ao longo da


linha de regresso. Para ajuste dos pontos Yi , teramos graficamente :

Desvio Inexplicado ou erro = i Y


- Yi
Desvio Total ou erro = Y
-Y
i
Desvio Explicado ou erro = iY- Y

No caso de uma Regresso Mltipla o coeficiente de determinao deve


computar tambm o quociente entre a variao explicada e a variao total, porm
para todas as Variveis Independentes. Este coeficiente de determinao,
IBCI Institutional Business Consultoria Internacional
Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

identificado por R2, pode assumir valores entre 0 e 1, sendo o ltimo o que
representa a situao onde toda a variao explicada. A equao utilizada para o
clculo do coeficiente de determinao de uma Regresso Mltipla a seguinte :

R2 =

(Y
(Y

Y )2

Y )2

_
Onde Yi so as observaes esperadas e Y a mdia das observaes.
No caso do exemplo da Tabela A.2 o coeficiente de determinao encontrado
foi de 0,88313912 - isto significa que 88,31% da variao dos Depsitos Totais da
instituio financeira so explicados pela variao combinada do PIB, Populao e
Renda per capita. No exemplo da Tabela A.4 o coeficiente de determinao
encontrado foi de 0,24046608 o que significa que 24,04% da variao percentual
dos Depsitos Totais da instituio financeira so explicados pela variao
percentual combinada do PIB, Populao e Renda per capita.o que confere ao
segundo conjunto de variveis, um grau explanatrio bastante inferior.
A Matriz de Correlao possui grande significado informativo para a
Regresso Mltipla porque estabelece como os pares de variveis Dependentes(Y)
e Independentes (X1, X2,..., Xk)se correlacionam. Esta informao utilizada na
seleo das variveis que devero fazer parte da equao de regresso - ou seja,
variveis com correlao elevada e positiva devero ser includas no modelo
proposto, enquanto que as variveis na condio inversa devero ser descartadas.
Este ser um dos critrios estatsticos para a seleo de variveis no modelo do
PCPA. A Correlao Mltipla e o Coeficiente de Determinao (R2) tambm indicam
como a relao expressa atravs da equao de regresso explica as variaes da
Varivel Dependente (Y).
4 Testes de Significncia Estatstica
A significncia estatstica dos resultados obtidos na Anlise de Regresso
deve ser estabelecida antes do uso de tais resultados numa previso. A
determinao dos coeficientes tcnicos (b1, b2,...,bk) baseada simplesmente nas
observaes histricas. O propsito dos testes de significncia estatstica
determinar a confiana que pode ser depositada nos resultados da regresso e a
sua aplicabilidade na populao de valores possveis.

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Apesar da existncia de inmeros testes de significncia estatstica, somente


dois dos principais testes sero abordados :
1. O teste F ou estatstica F indica se a equao de regresso significativa ou
seja, se a relao funcional estabelecida entre a Varivel Dependente e os
efeitos combinados das Variveis Independentes so relevantes. O valor do teste
F determinado pelo quociente entre a varincia explicada e a varincia
inexplicada. Esta relao pode ser expressa matematicamente de duas formas
equivalentes :

(Y
=
(Y

) /( k 1)
Y ) /( n k )
Y

R2
F = k 12
1 R
n k

ou :
onde R2 o coeficiente de determinao.
No caso do exemplo da Tabela A.2 a estatstica F encontrada foi de 35,26686
- isto significa que num intervalo de confiana de 95% a equao de regresso
tem um nvel de significncia de 35,26%, o que pode ser considerado baixo. No
exemplo da Tabela A.4 a estatstica F encontrada foi de 1,477452 o que confere
a equao de regresso praticamente nenhuma significncia. O resultado do
teste F no deve ser considerado de forma isolada - isto , somente seus
resultados no devem descartar totalmente uma equao de regresso, uma vez
que os coeficientes da regresso podem apresentar correlao significativa.
2. O segundo teste determina a significncia (correlao) dos coeficientes da
equao de regresso (a, b1, b2,...,bk) individualmente. O questionamento
essencial deste teste se o valor atribudo a cada coeficiente
significativamente diferente de 0 ou se tal valor ocorreu simplesmente ao acaso.
IBCI Institutional Business Consultoria Internacional
Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Este teste consiste em calcular a varincia de cada coeficiente da regresso e,


atravs de sua raiz quadrada, estabelecer o erro padro, o que determina se o
valor de cada coeficiente significativamente diferente de 0.
O teste t para o exemplo da Tabela A.2 foi de 1,2285 para a, 2,54704 para b1,
-0,39702 para b2 e 1,88826 para b3 - isto significa que num intervalo de
confiana de 95% a equao de regresso tem somente uma Varivel
Independente, o PIB, positivamente correlacionada, estando as duas outras
variveis negativamente correlacionadas entre si e com a Varivel Dependente
(Depsitos Totais). Tal fato no implica no simples descarte das variveis
negativamente correlacionadas, mas confere a estas um baixo nvel significncia.
O teste t do intercepto a significa que o mesmo encontra-se num nvel bem
diferente de 0, o que lhe confere significncia na equao de regresso, ou seja,
numa previso com os dados histricos apresentados, a no deve ser
desprezado. No exemplo da Tabela A.4 o teste t foi de 2,3365 para a, -1,26076
para b1, -1,62665 para b2 e 2,07982 para b3 - isto significa que num intervalo de
confiana de 95%, a equao de regresso tem todas as variveis
negativamente correlacionadas entre si e com a Varivel Dependente e diferente
de 0, o que torna o redimensionamento da regresso necessrio.
Alm dos testes de significncia estatstica, tambm podem ser construdos
em torno da equao de regresso intervalos de confiana. Estes intervalos so
baseados no desvio padro da regresso, traduzindo-se num maior nvel de
confiana no modelo de regresso.
5 Os Pressupostos da Anlise de Regresso
Para obteno dos resultados, a anlise de regresso baseia-se em quatro
pressupostos bsicos :
5.1 Linearidade
Apesar de parecer um pressuposto restritivo matematicamente toda funo
no-linear pode ser transformada numa funo linear atravs de tcnicas
logartmicas, polinomiais e de relaes recprocas. No nos cabe neste texto discutir
as formulaes matemticas de transformao, porm a sua existncia de
fundamental importncia uma vez que a anlise de regresso no pode ser aplicada
se a funo no puder ser transformada para a forma linear.
5.2 Independncia dos resduos

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

A violao do pressuposto da independncia dos resduos implica na


existncia de forte correlao (autocorrelao) entre os residuais sucessivos. Isto ,
et no independente de e t-1..., e t-i+1 ..., e t+1, e t+2,..., e t+n . A falta de
independncia no afeta o valor dos parmetros estimados, mas afeta diretamente
as varincias estimadas. A falta de independncia dos resduos implica em R2 e
estatstica F elevados e teste t reduzido se a autocorrelao positiva e todos os
testes com resultados elevados se a autocorrelao for negativa.
(A autocorrelao pode ser resultante de 1) especificao incorreta (a
incluso de um nmero no timo de variveis), o que causa dependncia entre as
Variveis Independentes, (ou 2) forma funcional incorreta (deficincia de
modelagem), (ou 3) forte tendncia entre as variveis. A autocorrelao pode ser
visualizada atravs da plotagem dos resduos, no entanto, existe um teste
estatstico, o de Durbin-Watson (teste D-W) que pode ser utilizado para verificar a
existncia de autocorrelao.
5.3 Homocedasticidade
Se os resduos no esto distribudos ao longo da linha de regresso em
torno de todo o intervalo de observaes, o pressuposto da varincia constante, ou
homocedasticidade, violado.

Varivel Dependente

O grfico a seguir ilustra o significado da varincia constante dos resduos:

Varivel Independente

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

A ocorrncia de varincias no constantes nos resduos chamada de


heterocedasticidade. Sua ocorrncia pode estar condicionada a especificaes
incorretas no modelo de regresso, e sua deteco possvel atravs do estudo
residual dos erros.
A teste Durbin-Watson pode indicar heterodasticidade e sua correo esta
vinculada eliminao de algumas variveis ou a transformao matemtica do
modelo, trazendo uniformidade dos erros percentuais ao longo da linha de
regresso.
5.4 Normalidade dos resduos
Esta hiptese tambm apresenta caractersticas pouco restritivas uma vez
que os resduos so resultantes de um sem nmero de fatores menos importantes
no que tange a influncia no comportamento da varivel dependente (seno
deveriam ser includos na equao de regresso, perdendo sua caracterstica
residual). Na mdia, sua influncia pode ser desprezada, uma vez que o erro mdio
apresenta um comportamento normalizado.
Estatisticamente se possumos um nmero de observaes superior a 30 a
previso de dados assume a normalidade. Isto porque a distribuio amostral dos
estimadores pode ser aproximada a curva normal onde n possua amplitude
suficiente, o que na maior parte ocorre quando n igual a 30. O Teorema do Limite
Central da estatstica permite esta aproximao e torna possvel o uso da curva
normal na avaliao da disperso dos dados, inclusive dos resduos, da amostra em
torno do parmetro central (mdia). Assim ao calcularmos sua mdia e varincia, a
extenso de possveis erros pode ser avaliada; o que introduz um intervalo de
confiana de 30 observaes para a varincia.
Quando o pressuposto da normalidade dos resduos questionado, no
existem testes estatsticos especficos para sua avaliao; todavia os resduos
podem ser plotados com vistas a deteco de sua distribuio prxima a normal e o
seu intervalo de variao (o maior menos o menor valor) pode ser medido com vistas
a determinao de sua disperso (se prxima a 6.0 considerado dentro da
distribuio normal).
6 - Multicolinearidade
A multicolinearidade um problema computacional que se desenvolve
quando duas ou mais variveis independentes possuem forte correlao. O
resultado uma Matriz de Correlao com variabilidade nica (prximo de zero)
tendo em vista o efeito da diviso de um nmero por uma variao absoluta
IBCI Institutional Business Consultoria Internacional
Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

extremamente pequena (prxima de zero). O resultado desta diviso um nmero


com um nmero de casas decimais bastante elevado, o que torna a aproximao
computacional totalmente ineficaz. A existncia de multicolinearidade introduz erros
grosseiros no resultado da regresso, produzindo srios erros na previso da
Varivel Dependente. Felizmente a multicolinearidade de fcil deteco e
correo.
A ocorrncia de multicolinearidade se d quando um ou mais dos testes t
assume resultado(s) muito pequenos (no significativos) e os valores de R2 ou da
estatstica F so muito grandes. Se este for o caso, a Matriz de Correlao deve ser
avaliada e, possivelmente, uma das Variveis Independentes com forte correlao
ser eliminada. (Como regra geral, um coeficiente de correlao superior ou prximo
a 0,7 entre duas Variveis Independentes indica problemas de multicolinearidade).
A multicolinearidade tambm pode ser detectada se a percentagem da
variao explicada por alguma Varivel Independente for negativa. Esta condio
verificada nos dois exemplos de regresso desenvolvidos nas Tabelas A.2 e A.4
aonde se observam correlaes negativas entre as Variveis Independentes e um
nvel de R2 bastante elevado em ambos os casos (o menor valor de R2 encontrado
foi de 0,813551). Tal fato, se deve a incluso de uma Varivel Independente (a
Renda per capita) que resultante do quociente entre as duas outras Variveis
Independentes (o PIB e a Populao), o que introduz a problemtica da
multicolinearidade de forma primria, ou seja, na prpria formulao do modelo de
regresso. Assim, uma das variveis deve ser excluda do modelo de forma a buscar
um conjunto de variveis de maior valor explanatrio para as variaes nos
Depsitos Totais da instituio financeira.
A multicolinearidade um problema freqentemente encontrado nos dados
econmicos e de negcios tendo em vista a elevada correlao do tempo entre
diferentes agregados como a populao,a populao economicamente ativa, o PIB,
o nvel de renda disponvel para consumo, vendas, estoques, custos, lucros, etc. A
problemtica da multicolinearidade em tais casos no deve ser desprezada, uma vez
que a elevada correlao existente entre as mesmas pode prejudicar a sua
utilizao e, consequentemente, a modelagem.
Basicamente podemos encontrar entre os diversos agregados econmicos
Variveis Independentes com elevada correlao entre s, porm de valor limitado
para a regresso mltipla. O que distingue um dado conjunto de Variveis
Independentes como um bom conjunto de estimadores para uma determinada
Varivel Dependente o seu contedo informacional, ou seja, o seu valor
explicativo. claro que do ponto de vista estatstico as Variveis Independentes
mais necessrias so aquelas com um nvel mdio de correlao, o que torna a
sua obteno condicionada a diversas rodadas computacionais com vistas a
depurao do modelo.
IBCI Institutional Business Consultoria Internacional
Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

7 Bibliografia
1. Anderson, T.W., An Introduction to Multivariate Statistical Methods (Second
Edition), New York : John Wiley & Sons, 1984.
2. Belsley, D.A., E.Kuh, and R.E.Welsh, Regression Diagnostics, New York : John
Wiley & Sons, 1980.
3. Bowerman, B.L., and R.T.OConnel, Linear Statistical Models : An Applied
Aproach (Second Edition), Boston : PWS-Kent, 1990.
4. Chatterjee, S. and B.Price, Regression Analysis By Example, New York : John
Wiley & Sons, 1977.
5. Draper, N.R., & H.Smith, Applied Regression Analysis, (Second Edition), New
York : John Wiley & Sons, 1981.
6. Durbin, J. and G.S.Watson, Testing for Serial Correlation in Least Squares
Regression, II, Biometrika, Vol.38 (1951), 159-178.
7. Galton, F., Regretion Toward Mediocrity in Heredity Stature, Journal of
Anthropological Institute, Vol.15 (1885), 246-263.
8. Goldberger, A.S., Econometric Theory, New York : John Wiley & Sons, 1964.
9. Johnson, R.A. & Wichern, D.W., Applied Multivariate Statistical Analysis (Third
Edition) , New Jersey : Prentice Hall, 1992.
10. Kasznar, I.K., Anlise da Evoluo do Produto Interno Bruto (PIB) e das Dvidas
por Estados, 1970-95, Revista de Administrao Pblica, Vol.30 no 6 (1996).
11. Kendall, M.G., Multivariate Analysis, New York: Hafner Press, 1975.
12. Makidrakis, S. and Wheelright S.C., Forecasting Methods and Applications, New
York : John Wiley & Sons, 1978.
13. Neter, J., and W.Wasserman, Applied Linear Statistical Models, Homewood III :
Richard D.Irwin, 1974.
14. Seber, G.A.F., Linear Regression Analysis, New York : John Wiley & Sons, 1977.
15. Sharpe, W.F., Investments, New Jersey : Prentice Hall, 1982.

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

16. Wonnacott T.H. & Wonnacott R.J., Introdutory Statistics for Business and
Economics (Second Edition), New York : John Wiley & Sons, 1979.

IBCI Institutional Business Consultoria Internacional


Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br

Você também pode gostar