Você está na página 1de 20

REGRESSO MLTIPLA: uma digresso sobre seus usos.

Autores: Istvan Karoly Kasznar, PhD Professor Titular da FGV e Presidente da IBCI

Bento Mario Lages Gonalves, MSc Consultor Senior da IBCI

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

REGRESSO MLTIPLA
1- Introduo A Regresso Mltipla um dos inmeros modelos estatsticos explanatrios causais referentes ao tratamento de sries temporais de dados. Sua base estatstica advm da Regresso Linear, que se restringe a duas variveis e a apenas uma equao funcional do primeiro grau (Y = a + bX) de ajustamento. A anlise de Regresso Mltipla uma metodologia estatstica de previso de valores de uma ou mais variveis de resposta (Dependentes) atravs de um conjunto de variveis explicativas (Independentes)*. Esta metodologia pode ser utilizada tambm para a avaliao dos efeitos das variveis explicativas como previsoras das variveis de resposta; isto , serve para contribuir na obteno de respostas a perguntas do tipo Qual o melhor estimador para ... ?. Sua aplicao especialmente importante pois permite que se estime o valor de uma varivel com base num conjunto de outras variveis. Quanto mais significativo for o peso de uma varivel isolada, ou de um conjunto de variveis explicativas, tanto mais se poder afirmar que alguns fatores afetam mais o comportamento de uma varivel de resposta especificamente procurada, do que outros. Lamentavelmente, o termo regresso, cunhado do ttulo do primeiro documento (paper) escrito sobre o assunto, e que de autoria de F. Galton 7, foi desenvolvido a posteriori por Bowerman e OConnel 3, Neter e Wasserman 13, Draper e Smith 5, Seber 14, e Goldberger 8 que estenderam a sua aplicabilidade e desenvolveram as hipteses passveis de regresso mltipla para inmeras situaes diferenciadas. O formato geral da equao de Regresso Linear Mltipla : Y = a + b1X1 + b2X2 + ... + bkXk

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Onde : Y a Varivel Dependente; a corresponde a um coeficiente tcnico fixo, a um valor de base a partir do qual comea Y; bk corresponde Independentes; e aos coeficientes tcnicos atrelados s Variveis

e Xk as Variveis Independentes.

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

As instituies financeiras procuram explicar a evoluo dos seus Depsitos Totais a partir da evoluo de agregados macroeconmicos como o Produto Interno Bruto PIB, a Populao e a Renda per capita . A Tabela A.1 a seguir, apresenta a evoluo de tais indicadores no Brasil, ao longo do perodo de 1970 a 1995 : Tabela A.1 Evoluo dos Depsitos Totais de Instituio Financeira, PIB a custo de Fatores, Populao e Renda per capita do Brasil no Perodo 1970/1995.
Depsitos Totais (Em US$ Milhes)

Ano

1970 1975 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

312,0 381,5 347,4 404,2 402,1 452,0 431,7 582,3 596,6 620,8 513,6 606,9 629,0 602,7 656,7 678,5 637,6 698,2

o (Em US$ Milhes) (N de Habitantes)

PIB

Populao

Renda per capita

(Em US$/Hab)

33.027 105.962 191.842 212.187 222.354 223.354 245.104 273.949 303.496 323.736 335.923 362.286 361.909 376.089 379.411 384.591 395.478 480.361

93.139.037 105.279.615 119.002.706 121.304.828 124.132.901 126.932.107 129.881.714 130.964.997 132.744.121 135.682.832 138.506.432 141.596.301 146.917.459 147.489.931 150.474.909 153.390.844 155.608.189 158.617.875

355 1.006 1.961 1.749 1.791 1.760 1.887 2.092 2.286 2.386 2.425 2.559 2.463 2.550 2.521 2.507 2.541 3.028

Matematicamente, o relacionamento de tais variveis pode ser descrito por : Evoluo dos Depsitos Totais = f (PIB, Populao, Renda per capita) Esta equao simplesmente diz que a evoluo dos Depsitos para a instituio financeira uma funo de, ou depende de trs variveis independentes PIB, Populao e Renda per capita. Como vimos a equao que exprime as relaes lineares e aditivas entre estas variveis : Y = a + b1X1 + b2X2 + b3X3

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Onde : Y = Evoluo dos Depsitos Totais. a = Coeficiente tcnico fixo b1 = Coeficiente tcnico da varivel PIB. X1 = PIB. b2 = Coeficiente tcnico da varivel Populao. X2 = Populao. b3 = Coeficiente tcnico da varivel Renda per capita. X3 = Renda per capita. 2 Aplicando a Regresso Mltipla Para uma melhor compreenso dos conceitos de Regresso Mltipla, a metodologia dos mnimos quadrados ser utilizada para obtermos os valores de a, b1, b2 e b3 na equao de regresso. Ser assumido que a tarefa principal prever o comportamento dos Depsitos Totais da Instituio Financeira nos prximos cinco anos (1996 a 2.000), e tais previses so baseadas no comportamento do PIB (b1), Populao (b2) e Renda per capita(b3). Usando as observaes histricas da Tabela A.1 , deveremos determinar os valores de a, b1, b2 e b3 de forma a minimizar o Erro Quadrado Mdio da curva de regresso, e ento utilizar os estimadores de a, b1, b2 e b3 de forma a montar uma previso do comportamento dos Depsitos Totais. Usando os dados histricos, de 1970 a 1995 e uma rotina de Regresso Mltipla computadorizada como a que se encontra no STATISTICA Release 5 (1997),, os resultados obtidos so : Tabela A.2 Resultados da Regresso Mltipla, Anlise da Varincia, e Matriz de Correlao obtidos a partir dos dados constantes da Tabela A.1

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

RESULTADOS DA REGRESSO MLTIPLA Var.Dependente : D.Totais R Mltiplo : 0,93975482 R2 : 0,88313912 o 2 N de Casos : 18 R Ajustado : 0,85809750 rro Padro da Estimativa : 47,076164896 Intercepto (a) : 447,01798366 rro Padro : 363,8734 b1 (PIB) = 1,87 b2 (POP) = -0,22

F = 35,26686 DF = 3,14 P = 0,000001

t (14) = 1,2285 P < 0,2395 b3 (Rpc) = -0,75

Regresso Resduos Total

ANLISE DA VARINCIA ANOVA Soma dos Mdia dos DF F Quadrados Quadrados 234.471,5 3 78.157,18 35,26686 31.026,3 14 2.216,17 265.497,9

Nvel p 0,00001

MATRIZ DE CORRELAO
PIB POP Rpc Correlao Correlao Tolerncia bK R2 Parcial Semi-Parcial 1,865174 0,562719 0,232705 0,015566 0,984434 -0,219347 -0,105515 -0,036273 0,027346 0,972654 -0,746266 -0,450537 -0,172517 0,053441 0,946559

t (14)

Nvel p

2,54704 0,023251 -0,39702 0,697341 -1,88826 0,079891

PIB POP Rpc

CORRELAO DOS COEFICIENTES DE REGRESSO PIB POP Rpc 1,000000 -0,848786 -0,673549 -0,848786 1,000000 0,200493 -0,673549 0,200493 1,000000

Assim, a equao de previso para os Depsitos Totais de uma instituio financeira fictcia pode ser definida como : DT = 447,01 + 1,87 X1 - 0,22 X2 0,75 X3 (IV.I)

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Esta equao revela simplesmente que baseado nas observaes histricas o melhor modelo de previso a equao IV.1, exposta anteriormente. Contudo, um problema escalar ocorre com as variveis selecionadas, uma vez que a Varivel Dependente Depsitos Totais (DT) expressa em milhes de dlares, e as Variveis Independentes so expressas em medidas escalares diferentes - o PIB a custo de fatores expresso em milhes de dlares, a Populao em valores absolutos e a Renda per capita, uma razo entre o PIB e a Populao, expressa em Dlares/Habitante. Assim, incorreto interpretar que a varivel PIB o melhor estimador para os Depsitos Totais simplesmente porque esta apresenta o maior coeficiente tcnico (1,87). Se a Populao fosse expressa, por exemplo, em milhes de habitantes, a nova unidade escalar poderia alterar o coeficiente b1, e tornar o coeficiente b2 mais atraente (maior que b1). A interpretao literal da equao IV.I que quando X1 , X2 e X3 se igualam a zero, os Depsitos Totais da instituio financeira alcanaro a cifra de US$ 447,01 milhes (o valor do intercepto a); e que quando os Depsitos Totais variarem em US$ 1 milho, o PIB sofrer uma variao de US$ 1,87 milhes (mantendo-se as outras variveis constantes). Quando a Populao decrescer em 1 milho de habitantes os Depsitos Totais sofrero um acrscimo de US$ 200 mil (de novo, mantendo-se as outras variveis constantes). Assim, os coeficientes determinados pela Regresso Mltipla simplesmente indicam como alteraes unitrias em cada Varivel Independente podem influenciar o valor da Varivel Dependente, Y . Uma vez determinados os parmetros da equao, esta pode ser utilizada para prever os Depsitos Totais da instituio financeira para cada um dos prximos cinco anos. Esta previso feita atravs da substituio simples dos valores de X1 , X2 e X3 na equao IV.I, e os valores encontrados podem ser plotados, conforme o grfico de disperso a seguir.

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Predicted vs. Observed Values Dependent variable: DTOTAIS 750

650

Observed Values

550

450

350

250 250

350

450

550 Predicted Values

650

750

850

Regression 95% confid.

Para introduzirmos uniformidade srie de Variveis Independentes e a Varivel Dependente, devemos homogeneiz-las atravs do clculo de suas variaes percentuais ao longo do tempo, o que altera a funo de relacionamento entre as variveis para : %DT = f (%PIB, %Populao, %Renda per capita) (IV.II)

ou seja, a Variao Percentual dos Depsitos Totais (%DT) funo da Variao Percentual do PIB (PIB), da Variao Percentual da Populao (%Pop) e da Variao Percentual da Renda per capita (%Rpc).

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Tabela A.3 Variao Percentual dos Depsitos Totais de Instituio Financeira, Variao Percentual do PIB a custo de Fatores, Variao Percentual da Populao e Variao Percentual da Renda per capita do Brasil no Perodo 1970/1995.

Ano

%DT

1970 1975 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

0,00 22,28 -8,94 16,35 -0,52 12,41 -4,49 34,89 2,46 4,06 -17,27 18,17 3,64 -4,18 8,96 3,32 -6,03 9,50

%PIB 0,00 220,83 81,05 10,61 4,79 0,45 9,74 11,77 10,79 6,67 3.76 7,85 -0,10 3,92 0,88 1,37 2,83 21,46

%Pop 0,00 13,03 13,03 1,93 2,33 2,26 2,32 0,83 1,36 2,21 2,08 2,23 3,76 0,39 2,02 1,94 1,45 1,93

%Rpc 0,00 183,38 94,93 -10,81 2,40 -1,73 7,22 10,86 9,27 4,37 1,63 5,53 -3,75 3,53 -1,14 -0,56 1,36 19,17

Resolvido o problema de diferenas de escala, atravs da Tabela A.3, podemos buscar quais ou quais Variveis Independentes explicam melhor a Varivel Dependente. Se somente uma varivel independente, X1, X2 ou X3, explicar plenamente a evoluo dos depsitos desta instituio o problema toma a conotao de uma Regresso Linear Simples. Desse modo, usando os dados histricos de 1970 a 1995 da Tabela A.3, e a mesma rotina de Regresso Mltipla computadorizada do STATISTICA Release 5 (1997), os resultados obtidos so :

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Tabela A.4 Resultados da Regresso Mltipla, Anlise da Varincia, e Matriz de Correlao obtidos a partir dos dados constantes da Tabela A.3

RESULTADOS DA REGRESSO MLTIPLA Var.Dependente : %DT R Mltiplo : 0,49037341 R2 : 0,24046608 o 2 N de Casos : 18 R Ajustado : 0,7770881 rro Padro da Estimativa : 11,962482513 Intercepto (a) : 10,940557845 rro Padro : 4,682491 b1 (%PIB) = -0,68 b2 (%POP) = -0,91

F = 1,477452 DF = 3,14 P = 0,263508

T (14) = 2,3365 P < 0,0348 b3 (%Rpc) = 1,63

Regresso Resduos Total

ANLISE DA VARINCIA ANOVA Soma dos Mdia dos DF F Quadrados Quadrados 634,275 3 211,4249 1,477452 2.003,414 14 143,1010 2.637,688

Nvel p 0,263508

MATRIZ DE CORRELAO
Correlao Correlao Tolerncia bK R2 Parcial Semi-Parcial %PIB -0,680086 -0,319313 -0,293659 0,186449 0,813551 -0,378882 0,173904 0,826096 %POP -0,908551 -0,398694 %Rpc 1,628957 0,485842 0,484434 0,088440 0,911560

t (14)

Nvel p

-1,26076 0,228001 -1,62665 0,126101 -2,07982 0,056397

%PIB %POP %Rpc

CORRELAO DOS COEFICIENTES DE REGRESSO %PIB %POP %Rpc 1,000000 0,135743 -0,707681 0,135743 1,000000 -0,731026 -0,707681 -0,731026 1,000000

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

E os valores observados e previstos so plotados seguir :

Predicted vs. Observed Values Dependent variable: VAR_DT 45 35 25 Observed Values 15 5 -5 -15 -25 -12 Regression 95% confid.

-8

-4

12

16

20

Predicted Values

3 Correlao Mltipla e Coeficiente de Determinao bastante comum numa Regresso Linear que a Varivel Dependente (Y) se relacione com a Varivel Independente (X), mas incorreto afirmar que o valor da primeira depende em causa e efeito das alteraes no valor da segunda. Neste caso a inter-relao entre as variveis demonstrada atravs da correlao. O coeficiente de correlao, r , a medida de inter-relao entre a Varivel Dependente e a Varivel Independente. Ele pode variar de 0 (que indica ausncia de correlao) a 1 (que indica correlao perfeita). Quando o coeficiente de correlao maior que 0, as duas variveis so positivamente correlacionadas, em contrapartida quando menor que 0, as duas variveis so negativamente correlacionadas. O sinal do coeficiente de correlao numa Regresso Linear sempre o mesmo sinal do coeficiente de regresso, b. O coeficiente de correlao, r, calculado a partir da seguinte frmula (aonde n o Nmero de Observaes (pontos) necessrios para o ajuste da linha de regresso) :

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

r=

n XY X Y

(n X

( X ) nY 2 (Y )
2

)(

Dessa expresso, deduz-se o coeficiente de determinao (r2) que nada mais que o quociente da variao explicada sobre a variao total; ou seja :

(Y (y

y)2
_

y)2

(n [n X

XY
2

XY) [n Y ] ( X ) ]
2 2 2

Assim, r2 a medida de quo bem as observaes se ajustam ao longo da linha de regresso. Para ajuste dos pontos Yi , teramos graficamente :

Desvio Inexplicado ou erro = i Y - Yi Desvio Total ou erro = Y -Y i Desvio Explicado ou erro = iY -Y

No caso de uma Regresso Mltipla o coeficiente de determinao deve computar tambm o quociente entre a variao explicada e a variao total, porm para todas as Variveis Independentes. Este coeficiente de determinao,
IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

identificado por R2, pode assumir valores entre 0 e 1, sendo o ltimo o que representa a situao onde toda a variao explicada. A equao utilizada para o clculo do coeficiente de determinao de uma Regresso Mltipla a seguinte :

R2 =

(Y (Y

Y )2
_

Y )2

_ Onde Yi so as observaes esperadas e Y a mdia das observaes. No caso do exemplo da Tabela A.2 o coeficiente de determinao encontrado foi de 0,88313912 - isto significa que 88,31% da variao dos Depsitos Totais da instituio financeira so explicados pela variao combinada do PIB, Populao e Renda per capita. No exemplo da Tabela A.4 o coeficiente de determinao encontrado foi de 0,24046608 o que significa que 24,04% da variao percentual dos Depsitos Totais da instituio financeira so explicados pela variao percentual combinada do PIB, Populao e Renda per capita.o que confere ao segundo conjunto de variveis, um grau explanatrio bastante inferior. A Matriz de Correlao possui grande significado informativo para a Regresso Mltipla porque estabelece como os pares de variveis Dependentes(Y) e Independentes (X1, X2,..., Xk)se correlacionam. Esta informao utilizada na seleo das variveis que devero fazer parte da equao de regresso - ou seja, variveis com correlao elevada e positiva devero ser includas no modelo proposto, enquanto que as variveis na condio inversa devero ser descartadas. Este ser um dos critrios estatsticos para a seleo de variveis no modelo do PCPA. A Correlao Mltipla e o Coeficiente de Determinao (R2) tambm indicam como a relao expressa atravs da equao de regresso explica as variaes da Varivel Dependente (Y). 4 Testes de Significncia Estatstica A significncia estatstica dos resultados obtidos na Anlise de Regresso deve ser estabelecida antes do uso de tais resultados numa previso. A determinao dos coeficientes tcnicos (b1, b2,...,bk) baseada simplesmente nas observaes histricas. O propsito dos testes de significncia estatstica determinar a confiana que pode ser depositada nos resultados da regresso e a sua aplicabilidade na populao de valores possveis.

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Apesar da existncia de inmeros testes de significncia estatstica, somente dois dos principais testes sero abordados : 1. O teste F ou estatstica F indica se a equao de regresso significativa ou seja, se a relao funcional estabelecida entre a Varivel Dependente e os efeitos combinados das Variveis Independentes so relevantes. O valor do teste F determinado pelo quociente entre a varincia explicada e a varincia inexplicada. Esta relao pode ser expressa matematicamente de duas formas equivalentes :

(Y = (Y

) /( k 1) Y ) /( n k )
Y
2 2

R2 F = k 12 1 R n k

ou : onde R2 o coeficiente de determinao. No caso do exemplo da Tabela A.2 a estatstica F encontrada foi de 35,26686 - isto significa que num intervalo de confiana de 95% a equao de regresso tem um nvel de significncia de 35,26%, o que pode ser considerado baixo. No exemplo da Tabela A.4 a estatstica F encontrada foi de 1,477452 o que confere a equao de regresso praticamente nenhuma significncia. O resultado do teste F no deve ser considerado de forma isolada - isto , somente seus resultados no devem descartar totalmente uma equao de regresso, uma vez que os coeficientes da regresso podem apresentar correlao significativa. 2. O segundo teste determina a significncia (correlao) dos coeficientes da equao de regresso (a, b1, b2,...,bk) individualmente. O questionamento essencial deste teste se o valor atribudo a cada coeficiente significativamente diferente de 0 ou se tal valor ocorreu simplesmente ao acaso.
IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Este teste consiste em calcular a varincia de cada coeficiente da regresso e, atravs de sua raiz quadrada, estabelecer o erro padro, o que determina se o valor de cada coeficiente significativamente diferente de 0. O teste t para o exemplo da Tabela A.2 foi de 1,2285 para a, 2,54704 para b1, -0,39702 para b2 e 1,88826 para b3 - isto significa que num intervalo de confiana de 95% a equao de regresso tem somente uma Varivel Independente, o PIB, positivamente correlacionada, estando as duas outras variveis negativamente correlacionadas entre si e com a Varivel Dependente (Depsitos Totais). Tal fato no implica no simples descarte das variveis negativamente correlacionadas, mas confere a estas um baixo nvel significncia. O teste t do intercepto a significa que o mesmo encontra-se num nvel bem diferente de 0, o que lhe confere significncia na equao de regresso, ou seja, numa previso com os dados histricos apresentados, a no deve ser desprezado. No exemplo da Tabela A.4 o teste t foi de 2,3365 para a, -1,26076 para b1, -1,62665 para b2 e 2,07982 para b3 - isto significa que num intervalo de confiana de 95%, a equao de regresso tem todas as variveis negativamente correlacionadas entre si e com a Varivel Dependente e diferente de 0, o que torna o redimensionamento da regresso necessrio. Alm dos testes de significncia estatstica, tambm podem ser construdos em torno da equao de regresso intervalos de confiana. Estes intervalos so baseados no desvio padro da regresso, traduzindo-se num maior nvel de confiana no modelo de regresso. 5 Os Pressupostos da Anlise de Regresso Para obteno dos resultados, a anlise de regresso baseia-se em quatro pressupostos bsicos : 5.1 Linearidade Apesar de parecer um pressuposto restritivo matematicamente toda funo no-linear pode ser transformada numa funo linear atravs de tcnicas logartmicas, polinomiais e de relaes recprocas. No nos cabe neste texto discutir as formulaes matemticas de transformao, porm a sua existncia de fundamental importncia uma vez que a anlise de regresso no pode ser aplicada se a funo no puder ser transformada para a forma linear. 5.2 Independncia dos resduos

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

A violao do pressuposto da independncia dos resduos implica na existncia de forte correlao (autocorrelao) entre os residuais sucessivos. Isto , et no independente de e t-1..., e t-i+1 ..., e t+1, e t+2,..., e t+n . A falta de independncia no afeta o valor dos parmetros estimados, mas afeta diretamente as varincias estimadas. A falta de independncia dos resduos implica em R2 e estatstica F elevados e teste t reduzido se a autocorrelao positiva e todos os testes com resultados elevados se a autocorrelao for negativa. (A autocorrelao pode ser resultante de 1) especificao incorreta (a incluso de um nmero no timo de variveis), o que causa dependncia entre as Variveis Independentes, (ou 2) forma funcional incorreta (deficincia de modelagem), (ou 3) forte tendncia entre as variveis. A autocorrelao pode ser visualizada atravs da plotagem dos resduos, no entanto, existe um teste estatstico, o de Durbin-Watson (teste D-W) que pode ser utilizado para verificar a existncia de autocorrelao. 5.3 Homocedasticidade Se os resduos no esto distribudos ao longo da linha de regresso em torno de todo o intervalo de observaes, o pressuposto da varincia constante, ou homocedasticidade, violado. O grfico a seguir ilustra o significado da varincia constante dos resduos:

Varivel Dependente

Varivel Independente

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

A ocorrncia de varincias no constantes nos resduos chamada de heterocedasticidade. Sua ocorrncia pode estar condicionada a especificaes incorretas no modelo de regresso, e sua deteco possvel atravs do estudo residual dos erros. A teste Durbin-Watson pode indicar heterodasticidade e sua correo esta vinculada eliminao de algumas variveis ou a transformao matemtica do modelo, trazendo uniformidade dos erros percentuais ao longo da linha de regresso. 5.4 Normalidade dos resduos Esta hiptese tambm apresenta caractersticas pouco restritivas uma vez que os resduos so resultantes de um sem nmero de fatores menos importantes no que tange a influncia no comportamento da varivel dependente (seno deveriam ser includos na equao de regresso, perdendo sua caracterstica residual). Na mdia, sua influncia pode ser desprezada, uma vez que o erro mdio apresenta um comportamento normalizado. Estatisticamente se possumos um nmero de observaes superior a 30 a previso de dados assume a normalidade. Isto porque a distribuio amostral dos estimadores pode ser aproximada a curva normal onde n possua amplitude suficiente, o que na maior parte ocorre quando n igual a 30. O Teorema do Limite Central da estatstica permite esta aproximao e torna possvel o uso da curva normal na avaliao da disperso dos dados, inclusive dos resduos, da amostra em torno do parmetro central (mdia). Assim ao calcularmos sua mdia e varincia, a extenso de possveis erros pode ser avaliada; o que introduz um intervalo de confiana de 30 observaes para a varincia. Quando o pressuposto da normalidade dos resduos questionado, no existem testes estatsticos especficos para sua avaliao; todavia os resduos podem ser plotados com vistas a deteco de sua distribuio prxima a normal e o seu intervalo de variao (o maior menos o menor valor) pode ser medido com vistas a determinao de sua disperso (se prxima a 6.0 considerado dentro da distribuio normal). 6 - Multicolinearidade A multicolinearidade um problema computacional que se desenvolve quando duas ou mais variveis independentes possuem forte correlao. O resultado uma Matriz de Correlao com variabilidade nica (prximo de zero) tendo em vista o efeito da diviso de um nmero por uma variao absoluta
IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

extremamente pequena (prxima de zero). O resultado desta diviso um nmero com um nmero de casas decimais bastante elevado, o que torna a aproximao computacional totalmente ineficaz. A existncia de multicolinearidade introduz erros grosseiros no resultado da regresso, produzindo srios erros na previso da Varivel Dependente. Felizmente a multicolinearidade de fcil deteco e correo. A ocorrncia de multicolinearidade se d quando um ou mais dos testes t assume resultado(s) muito pequenos (no significativos) e os valores de R2 ou da estatstica F so muito grandes. Se este for o caso, a Matriz de Correlao deve ser avaliada e, possivelmente, uma das Variveis Independentes com forte correlao ser eliminada. (Como regra geral, um coeficiente de correlao superior ou prximo a 0,7 entre duas Variveis Independentes indica problemas de multicolinearidade). A multicolinearidade tambm pode ser detectada se a percentagem da variao explicada por alguma Varivel Independente for negativa. Esta condio verificada nos dois exemplos de regresso desenvolvidos nas Tabelas A.2 e A.4 aonde se observam correlaes negativas entre as Variveis Independentes e um nvel de R2 bastante elevado em ambos os casos (o menor valor de R2 encontrado foi de 0,813551). Tal fato, se deve a incluso de uma Varivel Independente (a Renda per capita) que resultante do quociente entre as duas outras Variveis Independentes (o PIB e a Populao), o que introduz a problemtica da multicolinearidade de forma primria, ou seja, na prpria formulao do modelo de regresso. Assim, uma das variveis deve ser excluda do modelo de forma a buscar um conjunto de variveis de maior valor explanatrio para as variaes nos Depsitos Totais da instituio financeira. A multicolinearidade um problema freqentemente encontrado nos dados econmicos e de negcios tendo em vista a elevada correlao do tempo entre diferentes agregados como a populao,a populao economicamente ativa, o PIB, o nvel de renda disponvel para consumo, vendas, estoques, custos, lucros, etc. A problemtica da multicolinearidade em tais casos no deve ser desprezada, uma vez que a elevada correlao existente entre as mesmas pode prejudicar a sua utilizao e, consequentemente, a modelagem. Basicamente podemos encontrar entre os diversos agregados econmicos Variveis Independentes com elevada correlao entre s, porm de valor limitado para a regresso mltipla. O que distingue um dado conjunto de Variveis Independentes como um bom conjunto de estimadores para uma determinada Varivel Dependente o seu contedo informacional, ou seja, o seu valor explicativo. claro que do ponto de vista estatstico as Variveis Independentes mais necessrias so aquelas com um nvel mdio de correlao, o que torna a sua obteno condicionada a diversas rodadas computacionais com vistas a depurao do modelo.
IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

7 Bibliografia 1. Anderson, T.W., An Introduction to Multivariate Statistical Methods (Second Edition), New York : John Wiley & Sons, 1984. 2. Belsley, D.A., E.Kuh, and R.E.Welsh, Regression Diagnostics, New York : John Wiley & Sons, 1980. 3. Bowerman, B.L., and R.T.OConnel, Linear Statistical Models : An Applied Aproach (Second Edition), Boston : PWS-Kent, 1990. 4. Chatterjee, S. and B.Price, Regression Analysis By Example, New York : John Wiley & Sons, 1977. 5. Draper, N.R., & H.Smith, Applied Regression Analysis, (Second Edition), New York : John Wiley & Sons, 1981. 6. Durbin, J. and G.S.Watson, Testing for Serial Correlation in Least Squares Regression, II, Biometrika, Vol.38 (1951), 159-178. 7. Galton, F., Regretion Toward Mediocrity in Heredity Stature, Journal of Anthropological Institute, Vol.15 (1885), 246-263. 8. Goldberger, A.S., Econometric Theory, New York : John Wiley & Sons, 1964. 9. Johnson, R.A. & Wichern, D.W., Applied Multivariate Statistical Analysis (Third Edition) , New Jersey : Prentice Hall, 1992. 10. Kasznar, I.K., Anlise da Evoluo do Produto Interno Bruto (PIB) e das Dvidas por Estados, 1970-95, Revista de Administrao Pblica, Vol.30 no 6 (1996). 11. Kendall, M.G., Multivariate Analysis, New York: Hafner Press, 1975. 12. Makidrakis, S. and Wheelright S.C., Forecasting Methods and Applications, New York : John Wiley & Sons, 1978. 13. Neter, J., and W.Wasserman, Applied Linear Statistical Models, Homewood III : Richard D.Irwin, 1974. 14. Seber, G.A.F., Linear Regression Analysis, New York : John Wiley & Sons, 1977. 15. Sharpe, W.F., Investments, New Jersey : Prentice Hall, 1982.

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

16. Wonnacott T.H. & Wonnacott R.J., Introdutory Statistics for Business and Economics (Second Edition), New York : John Wiley & Sons, 1979.

IBCI Institutional Business Consultoria Internacional Rua da Alfndega, 25, sala 805/806, Centro, Rio de Janeiro, RJ. Telefax: (21)2263-7017 / 2233-8552 / 2263-0563 e-mail: ibci@ibci.com.br Home Page: www.ibci.com.br

Você também pode gostar