Escolar Documentos
Profissional Documentos
Cultura Documentos
Regressao Multipla
Regressao Multipla
REGRESSO MLTIPLA
1- Introduo
A Regresso Mltipla um dos inmeros modelos estatsticos explanatrios
causais referentes ao tratamento de sries temporais de dados. Sua base estatstica
advm da Regresso Linear, que se restringe a duas variveis e a apenas uma
equao funcional do primeiro grau (Y = a + bX) de ajustamento.
A anlise de Regresso Mltipla uma metodologia estatstica de previso de
valores de uma ou mais variveis de resposta (Dependentes) atravs de um
conjunto de variveis explicativas (Independentes)*. Esta metodologia pode ser
utilizada tambm para a avaliao dos efeitos das variveis explicativas como
previsoras das variveis de resposta; isto , serve para contribuir na obteno de
respostas a perguntas do tipo Qual o melhor estimador para ... ?.
Sua aplicao especialmente importante pois permite que se estime o valor
de uma varivel com base num conjunto de outras variveis. Quanto mais
significativo for o peso de uma varivel isolada, ou de um conjunto de variveis
explicativas, tanto mais se poder afirmar que alguns fatores afetam mais o
comportamento de uma varivel de resposta especificamente procurada, do que
outros.
Lamentavelmente, o termo regresso, cunhado do ttulo do primeiro
documento (paper) escrito sobre o assunto, e que de autoria de F. Galton 7, foi
desenvolvido a posteriori por Bowerman e OConnel 3, Neter e Wasserman 13,
Draper e Smith 5, Seber 14, e Goldberger 8 que estenderam a sua aplicabilidade e
desenvolveram as hipteses passveis de regresso mltipla para inmeras
situaes diferenciadas.
O formato geral da equao de Regresso Linear Mltipla :
Y = a + b1X1 + b2X2 + ... + bkXk
Onde :
Y a Varivel Dependente;
a corresponde a um coeficiente tcnico fixo, a um valor de base a partir do
qual comea Y;
bk corresponde
Independentes; e
aos
coeficientes
tcnicos
atrelados
e Xk as Variveis Independentes.
Variveis
Ano
Depsitos Totais
(Em US$ Milhes)
1970
1975
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
312,0
381,5
347,4
404,2
402,1
452,0
431,7
582,3
596,6
620,8
513,6
606,9
629,0
602,7
656,7
678,5
637,6
698,2
PIB
Populao
33.027
105.962
191.842
212.187
222.354
223.354
245.104
273.949
303.496
323.736
335.923
362.286
361.909
376.089
379.411
384.591
395.478
480.361
93.139.037
105.279.615
119.002.706
121.304.828
124.132.901
126.932.107
129.881.714
130.964.997
132.744.121
135.682.832
138.506.432
141.596.301
146.917.459
147.489.931
150.474.909
153.390.844
155.608.189
158.617.875
355
1.006
1.961
1.749
1.791
1.760
1.887
2.092
2.286
2.386
2.425
2.559
2.463
2.550
2.521
2.507
2.541
3.028
o
(Em US$ Milhes) (N de Habitantes)
(Em US$/Hab)
Onde :
Y = Evoluo dos Depsitos Totais.
a = Coeficiente tcnico fixo
b1 = Coeficiente tcnico da varivel PIB.
X1 = PIB.
b2 = Coeficiente tcnico da varivel Populao.
X2 = Populao.
b3 = Coeficiente tcnico da varivel Renda per capita.
X3 = Renda per capita.
2 Aplicando a Regresso Mltipla
Para uma melhor compreenso dos conceitos de Regresso Mltipla, a
metodologia dos mnimos quadrados ser utilizada para obtermos os valores de a,
b1, b2 e b3 na equao de regresso. Ser assumido que a tarefa principal prever o
comportamento dos Depsitos Totais da Instituio Financeira nos prximos cinco
anos (1996 a 2.000), e tais previses so baseadas no comportamento do PIB (b1),
Populao (b2) e Renda per capita(b3). Usando as observaes histricas da Tabela
A.1 , deveremos determinar os valores de a, b1, b2 e b3 de forma a minimizar o Erro
Quadrado Mdio da curva de regresso, e ento utilizar os estimadores de a, b1, b2 e
b3 de forma a montar uma previso do comportamento dos Depsitos Totais.
Usando os dados histricos, de 1970 a 1995 e uma rotina de Regresso
Mltipla computadorizada como a que se encontra no STATISTICA Release 5
(1997),, os resultados obtidos so :
Tabela A.2 Resultados da Regresso Mltipla, Anlise da Varincia, e Matriz de
Correlao obtidos a partir dos dados constantes da Tabela A.1
Regresso
Resduos
Total
b2 (POP) = -0,22
F = 35,26686
DF = 3,14
P = 0,000001
t (14) = 1,2285
P < 0,2395
b3 (Rpc) = -0,75
Nvel p
0,00001
MATRIZ DE CORRELAO
PIB
POP
Rpc
Correlao Correlao
Tolerncia
bK
R2
Parcial
Semi-Parcial
1,865174
0,562719
0,232705
0,015566 0,984434
-0,219347 -0,105515
-0,036273
0,027346 0,972654
-0,746266 -0,450537
-0,172517
0,053441 0,946559
PIB
POP
Rpc
t (14)
Nvel p
2,54704 0,023251
-0,39702 0,697341
-1,88826 0,079891
(IV.I)
Observed Values
650
550
450
350
250
250
350
450
550
650
750
850
Regression
95% confid.
Predicted Values
(IV.II)
Ano
%DT
%
1970
1975
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
0,00
22,28
-8,94
16,35
-0,52
12,41
-4,49
34,89
2,46
4,06
-17,27
18,17
3,64
-4,18
8,96
3,32
-6,03
9,50
%PIB
0,00
220,83
81,05
10,61
4,79
0,45
9,74
11,77
10,79
6,67
3.76
7,85
-0,10
3,92
0,88
1,37
2,83
21,46
%Pop
0,00
13,03
13,03
1,93
2,33
2,26
2,32
0,83
1,36
2,21
2,08
2,23
3,76
0,39
2,02
1,94
1,45
1,93
%Rpc
0,00
183,38
94,93
-10,81
2,40
-1,73
7,22
10,86
9,27
4,37
1,63
5,53
-3,75
3,53
-1,14
-0,56
1,36
19,17
Regresso
Resduos
Total
b2 (%POP) = -0,91
F = 1,477452
DF = 3,14
P = 0,263508
T (14) = 2,3365
P < 0,0348
b3 (%Rpc) = 1,63
Nvel p
0,263508
MATRIZ DE CORRELAO
Correlao Correlao
Tolerncia
bK
R2
Parcial
Semi-Parcial
%PIB -0,680086 -0,319313
-0,293659
0,186449 0,813551
%
%POP -0,908551 -0,398694
-0,378882
0,173904 0,826096
%Rpc 1,628957
0,485842
0,484434
0,088440 0,911560
%PIB
%
%POP
%
%Rpc
%
t (14)
-1,26076 0,228001
-1,62665 0,126101
-2,07982 0,056397
Nvel p
Observed Values
25
15
5
-5
-15
-25
-12
-8
-4
12
16
20
Regression
95% confid.
Predicted Values
n XY X Y
r=
(n X
)(
( X ) nY 2 (Y )
2
(Y
(y
y)2
_
y)2
(n
[n X
XY)
( X ) ][n Y ]
2
XY
2
identificado por R2, pode assumir valores entre 0 e 1, sendo o ltimo o que
representa a situao onde toda a variao explicada. A equao utilizada para o
clculo do coeficiente de determinao de uma Regresso Mltipla a seguinte :
R2 =
(Y
(Y
Y )2
Y )2
_
Onde Yi so as observaes esperadas e Y a mdia das observaes.
No caso do exemplo da Tabela A.2 o coeficiente de determinao encontrado
foi de 0,88313912 - isto significa que 88,31% da variao dos Depsitos Totais da
instituio financeira so explicados pela variao combinada do PIB, Populao e
Renda per capita. No exemplo da Tabela A.4 o coeficiente de determinao
encontrado foi de 0,24046608 o que significa que 24,04% da variao percentual
dos Depsitos Totais da instituio financeira so explicados pela variao
percentual combinada do PIB, Populao e Renda per capita.o que confere ao
segundo conjunto de variveis, um grau explanatrio bastante inferior.
A Matriz de Correlao possui grande significado informativo para a
Regresso Mltipla porque estabelece como os pares de variveis Dependentes(Y)
e Independentes (X1, X2,..., Xk)se correlacionam. Esta informao utilizada na
seleo das variveis que devero fazer parte da equao de regresso - ou seja,
variveis com correlao elevada e positiva devero ser includas no modelo
proposto, enquanto que as variveis na condio inversa devero ser descartadas.
Este ser um dos critrios estatsticos para a seleo de variveis no modelo do
PCPA. A Correlao Mltipla e o Coeficiente de Determinao (R2) tambm indicam
como a relao expressa atravs da equao de regresso explica as variaes da
Varivel Dependente (Y).
4 Testes de Significncia Estatstica
A significncia estatstica dos resultados obtidos na Anlise de Regresso
deve ser estabelecida antes do uso de tais resultados numa previso. A
determinao dos coeficientes tcnicos (b1, b2,...,bk) baseada simplesmente nas
observaes histricas. O propsito dos testes de significncia estatstica
determinar a confiana que pode ser depositada nos resultados da regresso e a
sua aplicabilidade na populao de valores possveis.
(Y
=
(Y
) /( k 1)
Y ) /( n k )
Y
R2
F = k 12
1 R
n k
ou :
onde R2 o coeficiente de determinao.
No caso do exemplo da Tabela A.2 a estatstica F encontrada foi de 35,26686
- isto significa que num intervalo de confiana de 95% a equao de regresso
tem um nvel de significncia de 35,26%, o que pode ser considerado baixo. No
exemplo da Tabela A.4 a estatstica F encontrada foi de 1,477452 o que confere
a equao de regresso praticamente nenhuma significncia. O resultado do
teste F no deve ser considerado de forma isolada - isto , somente seus
resultados no devem descartar totalmente uma equao de regresso, uma vez
que os coeficientes da regresso podem apresentar correlao significativa.
2. O segundo teste determina a significncia (correlao) dos coeficientes da
equao de regresso (a, b1, b2,...,bk) individualmente. O questionamento
essencial deste teste se o valor atribudo a cada coeficiente
significativamente diferente de 0 ou se tal valor ocorreu simplesmente ao acaso.
IBCI Institutional Business Consultoria Internacional
Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ.
Telefax: (21)2263-7017 / 2233-8552 / 2263-0563
e-mail: ibci@ibci.com.br
Home Page: www.ibci.com.br
Varivel Dependente
Varivel Independente
7 Bibliografia
1. Anderson, T.W., An Introduction to Multivariate Statistical Methods (Second
Edition), New York : John Wiley & Sons, 1984.
2. Belsley, D.A., E.Kuh, and R.E.Welsh, Regression Diagnostics, New York : John
Wiley & Sons, 1980.
3. Bowerman, B.L., and R.T.OConnel, Linear Statistical Models : An Applied
Aproach (Second Edition), Boston : PWS-Kent, 1990.
4. Chatterjee, S. and B.Price, Regression Analysis By Example, New York : John
Wiley & Sons, 1977.
5. Draper, N.R., & H.Smith, Applied Regression Analysis, (Second Edition), New
York : John Wiley & Sons, 1981.
6. Durbin, J. and G.S.Watson, Testing for Serial Correlation in Least Squares
Regression, II, Biometrika, Vol.38 (1951), 159-178.
7. Galton, F., Regretion Toward Mediocrity in Heredity Stature, Journal of
Anthropological Institute, Vol.15 (1885), 246-263.
8. Goldberger, A.S., Econometric Theory, New York : John Wiley & Sons, 1964.
9. Johnson, R.A. & Wichern, D.W., Applied Multivariate Statistical Analysis (Third
Edition) , New Jersey : Prentice Hall, 1992.
10. Kasznar, I.K., Anlise da Evoluo do Produto Interno Bruto (PIB) e das Dvidas
por Estados, 1970-95, Revista de Administrao Pblica, Vol.30 no 6 (1996).
11. Kendall, M.G., Multivariate Analysis, New York: Hafner Press, 1975.
12. Makidrakis, S. and Wheelright S.C., Forecasting Methods and Applications, New
York : John Wiley & Sons, 1978.
13. Neter, J., and W.Wasserman, Applied Linear Statistical Models, Homewood III :
Richard D.Irwin, 1974.
14. Seber, G.A.F., Linear Regression Analysis, New York : John Wiley & Sons, 1977.
15. Sharpe, W.F., Investments, New Jersey : Prentice Hall, 1982.
16. Wonnacott T.H. & Wonnacott R.J., Introdutory Statistics for Business and
Economics (Second Edition), New York : John Wiley & Sons, 1979.