Você está na página 1de 20

ANLISE DE REGRESSO

PRESSUPOSTOS DO MODELO DE REGRESSO


A aplicao do modelo de regresso linear mltipla (bem como da simples) pressupe a verificao de alguns pressupostos que condensamos seguidamente. 1. Os erros Ei so variveis aleatrias de mdia zero; 2. Os erros Ei so variveis aleatrias de varincia constante (2) hiptese de homocedasticidade; 3. As variveis aleatrias E1, E2, , En so independentes; 4. As variveis explicativas X1, X2, , Xk so no correlacionadas hiptese de ausncia de multicolinearidade entre as variveis explicativas; Para conduzir os testes de hipteses que abordaremos seguidamente, necessitamos ainda do seguinte pressuposto: 5. Os erros Ei seguem uma distribuio normal: Ei ~ N(0, 2).

ANLISE DE REGRESSO

PROPRIEDADES DOS ESTIMADORES DOS MNIMOS QUADRADOS


O mtodo dos mnimos quadrados fornece estimativas pontuais b0, b1,...,bk para 0, 1,..., k Os estimadores que fornecem estas estimativas so

0 = 1 = XT X M k

X TY

ANLISE DE REGRESSO

Verificadas as hipteses do modelo (referidas anteriormente) pode-se mostrar que os


estimadores 0 , 1 ,..., k so tais que: E i = i Var i = 2cii onde cii o elemento diagonal da linha i+1 da matriz X T X

( )

i=1,...,k;

( )

)1.
1
i =1 2 2 x i nx n

Na regresso simples estas varincias podem ser dadas por:

Var 0 = 2

( )

i =1 n

xi
2

n x i n x
2 i =1

e
2

Var 1 = 2

( )

Cada i tem distribuio normal: i

~ N(i, 2 c ii )

ANLISE DE REGRESSO

Como, em geral, 2 desconhecido estimamos Var i substituindo nas formulas anteriores 2 pelo seu estimador,
SSE S = n k 1
2

( )

por S

2
i

que se obtm

Ento,
S = S 2 cii =
2
i

SSE cii n k 1

ANLISE DE REGRESSO

TESTES DE HIPTESES TESTES SOBRE OS COEFICIENTES DE REGRESSO


Ocasionalmente, poder ser de suspeitar que uma varivel explicativa particular Xi no muito til, isto , que a sua influncia sobre a varivel dependente no significativa. Para saber se este o caso, testamos a hiptese nula de que o coeficiente para esta varivel nulo:

H 0 : i = 0 H1 : i 0
Sabemos que
i ~ N(i, 2 c ii ),

i.e.

i i ~ N (0,1) . cii

ANLISE DE REGRESSO

i i Temos ento ~ N (0,1) . cii Como desconhecido, substitumos pelo seu estimador S = i i S c ii
SSE vindo, n k 1

~ t n k 1 . i 0 S c ii

A estatstica do teste, se H0 verdadeira (H0: i=0), :

~ t n k 1

Se H0 for rejeitada ento temos evidncia de que i0, isto , a varivel explicativa Xi
til na predio do valor da varivel dependente.

Se H0 no for rejeitada ento a varivel explicativa Xi geralmente retirada da equao de regresso pois no influncia significativamente a varivel resposta Y.
6

ANLISE DE REGRESSO

Mais geralmente, podemos testar a hiptese nula de que o coeficiente seja igual a um determinado valor i0:
H 0 : i = i H1 : i i
0 0

A estatstica do teste, se H0 verdadeira, :

i i0 S c ii

~ t n k 1 .

Poderiam tambm ser conduzidos testes unilaterais em vez de testes bilaterais: H 0 : i = i H1 : i > i
0 0

H 0 : i = i H1 : i < i

0 0

ANLISE DE REGRESSO

Exemplo
Recordemos o exemplo em que se pretende estudar a relao entre o volume de vendas (Y) efectuadas durante um dado perodo de tempo por um vendedor, os seus anos de experincia (X1) e o seu score num teste de inteligncia (X2). Com os dados: Vendedor Vendas (Y) Anos de experincia (X1) Score no teste de inteligncia (X2) 1 9 6 3 2 6 5 2 3 4 3 2 4 3 1 1 5 3 4 1 6 5 3 3 7 8 6 3 8 2 2 1 9 7 4 2 10 4 2 2

ANLISE DE REGRESSO

Obtm-se:

1 1 1 1 1 X = 1 1 1 1 1

6 5 3 1 4 3 6 2

3 9 6 2 2 4 3 1 3 1 , y= , 3 5 8 3 1 2 7 4 2 2 2 4

776 56 240 1 1 T 60 56 80 X X = 944 240 80 264

(X X ) (
T 1

0.262712 X T y = 0.745763 . 1.338983

ANLISE DE REGRESSO

Testes para o Exemplo

- Vamos testar a hiptese nula do coeficiente de regresso associado a X


Hipteses:

ser zero.

H 0 : 1 = 0 H 1 : 1 0
Sob H0, T= 1 0
S c11

~ tn k 1 ,

i.e

1 0
S c11

~ t7 .

J calculmos anteriormente o valor do SSE (SSE = 7.48305).

Ento, tem-se:
S2 =

7.48305 SSE = = 1.06901. n k 1 10 2 1

10

ANLISE DE REGRESSO

S = 1.06901 = 1.03393.

S = S c11 = 1.03393
1

60 = 0.26066 . 944

Como o teste bilateral, para o clculo dos pontos crticos procura-se t / 2 tal que
P (T t / 2 ) =

= 0.025 t / 2 = 2.365 .

RC = ]-, -2.365] [2.365, +[ Tobs= 0.745765 = 2.861 RC, logo rejeitamos H0. 0.26066

Ao nvel de significncia de 0.05, h pois evidncia para concluir que a varivel anos de experincia til na predio do volume de vendas, ou seja, a varivel X1 contribui para a explicao do volume de vendas de um vendedor.

11

ANLISE DE REGRESSO

- Vamos verificar se se pode rejeitar a hiptese nula do coeficiente


Hipteses: H0 : 0 = 0

ser nulo.

H1 : 0 0
Sob H0, T=

0 0 S c00 1 3 2
S 0

~ t7

Tem-se:
776 = 0.9374 . 944 RC = ]-, -2.365] [2.365, +[. 0.262712 Tobs= = 0.28 RC, logo no rejeitamos H0, ao nvel de significncia 0.9374 de 0.05. S = S c00 = 1.03393
0

12

ANLISE DE REGRESSO

TESTE F PARA TESTAR A SIGNIFICNCIA DA REGRESSO


Este teste serve para testar a hiptese nula,
H0: a regresso no significativa,

que equivalente s seguintes:


H0: a equao de regresso no explica a variao na varivel resposta; H0: no existe relao linear entre a varivel dependente e o conjunto de variveis

independentes utilizadas.

Matematicamente: H 0 : 1 = 2 = ... = k = 0 H1 : pelo menos um i 0

13

ANLISE DE REGRESSO

Pode-se mostrar que se H0 for verdadeira se tem, F= SSR k SSR k = ~ Fnk k 1 SSE (n k 1) S2

sendo esta a estatstica do teste. Note que, F= SSR k n k 1 SSR n k 1 SSR SST = = SSE (n k 1) k SSE k SSE SST
n k 1 R 2 = . 2 k 1 R

Rejeitamos H0 para valores grandes da estatstica do teste F.


14

ANLISE DE REGRESSO

n k 1 R 2 F= k 1 R 2 parte da constante
explicada em Y. natural que digamos que a regresso significativa s quando a proporo da variao explicada grande. Isto ocorre s quando a razo F grande. Por esta razo devemos sempre rejeitar H0 para valores de F muito grandes. n k 1 , a estatstica F a razo entre a variao explicada e a no k

Se H0 no for rejeitada, ento o mesmo que dizer que o conjunto de variveis explicativas contribuem pouco para a explicao da variao da varivel dependente.

15

ANLISE DE REGRESSO

Na regresso simples para testar a significncia da regresso consideramos as hipteses, H 0 : 1 = 0 H 1 : 1 0

e portanto a estatstica teste a usar deve ser,


1 0 SSR k SSR k 1 F= = ~ Fn11 ou ~ t n2 2 Sob H SSE (n k 1) S S
0 1

16

ANLISE DE REGRESSO

Os resultados descritos podem ser convenientemente resumidos na tabela da ANOVA seguinte:

Fonte de variao Devido Regresso Devido aos resduos Total

Soma dos Quadrados

Graus de Liberdade

Quadrados Mdios
SSR k S 2= SSE n k 1

Razo F

) 2 SSR= ( y i y )
n i =1

F=

SSR k S2

) 2 SSE= ( y i y i )
n i =1

n-k-1

SST= ( y i y )
i =1

n-1

17

ANLISE DE REGRESSO

Exemplo
Para o exemplo em estudo, vamos testar a hiptese nula da regresso no ser significativa.

Hipteses:
H 0 : 1 = 2 = 0 H 1 : pelo menos um i 0

Sob H0,

F=

SSR 2 ~ F72 S2

18

ANLISE DE REGRESSO

Tem-se:

P F72 f = = 0.05

f = 4.74

RC = [4.74, +[.
SSR k n k 1 R 2 7 0.84697 Fobs = = = = 19.37 RC, logo rejeitamos H0. 2 2 2 0.15303 k S 1 R

Ao nvel de significncia de 0.05, rejeitamos a hiptese da regresso no ser significativa.

Ento h evidncia para afirmar que existe um relacionamento linear entre o conjunto de variveis explicativas e o volume de vendas.

19

ANLISE DE REGRESSO

Para o Exemplo, temos a seguinte Tabela ANOVA:

Fonte de variao Devido Regresso Devido aos resduos Total

Soma dos Quadrados SSR=41.41695

Graus de Liberdade 2

Quadrados Mdios

Razo F

SSR 41.41695 = = 20.71 k 2 S2 = SSE 7.48305 = = 1.06901 n k 1 7

F = 19.37

SSE=7.48305

SST=48.9

20

Você também pode gostar