Você está na página 1de 20

ANLISE DE REGRESSO

PRESSUPOSTOS DO MODELO DE REGRESSO


A aplicao do modelo de regresso linear mltipla (bem como da simples) pressupe a
verificao de alguns pressupostos que condensamos seguidamente.
1. Os erros Ei so variveis aleatrias de mdia zero;

2. Os erros Ei so variveis aleatrias de varincia constante (2) hiptese de


homocedasticidade;

3. As variveis aleatrias E1, E2, , En so independentes;

4. As variveis explicativas X1, X2, , Xk so no correlacionadas hiptese de


ausncia de multicolinearidade entre as variveis explicativas;

Para conduzir os testes de hipteses que abordaremos seguidamente, necessitamos


ainda do seguinte pressuposto:
5. Os erros Ei seguem uma distribuio normal: Ei ~ N(0, 2).

1
ANLISE DE REGRESSO

PROPRIEDADES DOS ESTIMADORES DOS MNIMOS QUADRADOS

O mtodo dos mnimos quadrados fornece estimativas pontuais

b0, b1,...,bk

para

0, 1,..., k

Os estimadores que fornecem estas estimativas so

0


(
= 1 = X T X
M
)
1
X TY

k

2
ANLISE DE REGRESSO
Verificadas as hipteses do modelo (referidas anteriormente) pode-se mostrar que os
estimadores 0 , 1 ,..., k so tais que:

( )
E i = i i=1,...,k;

( )
Var i = cii
2

onde cii o elemento diagonal da linha i+1 da matriz X T X ( )1.


Na regresso simples estas varincias podem ser dadas por:
n
xi
2

( )
Var 0 = 2 n
i =1
e ( )
Var 1 = 2 n
1
n x i n x x i nx
2 2 2 2 2

i =1 i =1

Cada i tem distribuio normal: i ~ N(i, 2 c ii )

3
ANLISE DE REGRESSO

Como, em geral, 2 desconhecido estimamos Var i ( ) por S i


2
que se obtm

substituindo nas formulas anteriores 2 pelo seu estimador,


SSE
S =
2

n k 1

Ento,

SSE
S = S 2 cii =
2
cii
i
n k 1

4
ANLISE DE REGRESSO

TESTES DE HIPTESES
TESTES SOBRE OS COEFICIENTES DE REGRESSO
Ocasionalmente, poder ser de suspeitar que uma varivel explicativa particular Xi no
muito til, isto , que a sua influncia sobre a varivel dependente no significativa.

Para saber se este o caso, testamos a hiptese nula de que o coeficiente para esta
varivel nulo:

H 0 : i = 0
H1 : i 0

Sabemos que

i i
i ~ N(i, 2 c ii ), i.e. ~ N (0,1) .
cii

5
ANLISE DE REGRESSO

i i
Temos ento ~ N (0,1) .
cii

SSE
Como desconhecido, substitumos pelo seu estimador S = vindo,
n k 1

i i
~ t n k 1 .
S c ii

i 0
A estatstica do teste, se H0 verdadeira (H0: i=0), : ~ t n k 1
S c ii

Se H0 for rejeitada ento temos evidncia de que i0, isto , a varivel explicativa Xi
til na predio do valor da varivel dependente.

Se H0 no for rejeitada ento a varivel explicativa Xi geralmente retirada da equao


de regresso pois no influncia significativamente a varivel resposta Y.

6
ANLISE DE REGRESSO
Mais geralmente, podemos testar a hiptese nula de que o coeficiente seja igual a um
determinado valor i0:

H 0 : i = i
0

H1 : i i
0

i i 0
A estatstica do teste, se H0 verdadeira, : ~ t n k 1 .
S c ii

Poderiam tambm ser conduzidos testes unilaterais em vez de testes bilaterais:

H 0 : i = i H 0 : i = i
0 0

.
H1 : i > i H1 : i < i
0 0

7
ANLISE DE REGRESSO

Exemplo
Recordemos o exemplo em que se pretende estudar a relao entre o volume de vendas
(Y) efectuadas durante um dado perodo de tempo por um vendedor, os seus anos de
experincia (X1) e o seu score num teste de inteligncia (X2).

Com os dados:
Vendedor Vendas (Y) Anos de experincia (X1) Score no teste de inteligncia (X2)
1 9 6 3
2 6 5 2
3 4 3 2
4 3 1 1
5 3 4 1
6 5 3 3
7 8 6 3
8 2 2 1
9 7 4 2
10 4 2 2

8
ANLISE DE REGRESSO
Obtm-se:
1 6 3 9
1 5 2 6

1 3 2 4
1 1 1 3

1 4 1 3
X = , y= ,
1 3 3 5
1 6 3 8

1 2 1 2
1 4 2 7

1 2 2 4

776 56 240 0.262712


(T 1
X X =) 1
944
56 60 80

e (X X ) (
T 1
)
X T y = 0.745763 .

240 80 264 1.338983

9
ANLISE DE REGRESSO
Testes para o Exemplo

- Vamos testar a hiptese nula do coeficiente de regresso associado a X 1 ser zero.


Hipteses:
H 0 : 1 = 0
H 1 : 1 0

1 0 1 0
Sob H0, T= ~ tn k 1 , i.e ~ t7 .
S c11 S c11
J calculmos anteriormente o valor do SSE (SSE = 7.48305).

Ento, tem-se:
SSE 7.48305
S2 = = = 1.06901.
n k 1 10 2 1

10
ANLISE DE REGRESSO
S = 1.06901 = 1.03393.
60
S = S c11 = 1.03393 = 0.26066 .
1
944
Como o teste bilateral, para o clculo dos pontos crticos procura-se t / 2 tal que

P (T t / 2 ) = = 0.025 t / 2 = 2.365 .
2
RC = ]-, -2.365] [2.365, +[
0.745765
Tobs= = 2.861 RC, logo rejeitamos H0.
0.26066

Ao nvel de significncia de 0.05, h pois evidncia para concluir que a varivel anos
de experincia til na predio do volume de vendas, ou seja, a varivel X1 contribui
para a explicao do volume de vendas de um vendedor.

11
ANLISE DE REGRESSO

- Vamos verificar se se pode rejeitar a hiptese nula do coeficiente 0 ser nulo.

Hipteses:
H0 : 0 = 0
H1 : 0 0
0 0
Sob H0, T= ~ t7
S c00
123
S 0

Tem-se:
776
S = S c00 = 1.03393 = 0.9374 .
0
944
RC = ]-, -2.365] [2.365, +[.
0.262712
Tobs= = 0.28 RC, logo no rejeitamos H0, ao nvel de significncia
0.9374
de 0.05.

12
ANLISE DE REGRESSO

TESTE F PARA TESTAR A SIGNIFICNCIA DA REGRESSO


Este teste serve para testar a hiptese nula,

H0: a regresso no significativa,

que equivalente s seguintes:

H0: a equao de regresso no explica a variao na varivel resposta;

H0: no existe relao linear entre a varivel dependente e o conjunto de variveis


independentes utilizadas.

Matematicamente:

H 0 : 1 = 2 = ... = k = 0
H1 : pelo menos um i 0

13
ANLISE DE REGRESSO

Pode-se mostrar que se H0 for verdadeira se tem,

SSR k SSR k
F= = ~ F k
k 1
SSE (n k 1)
n
S2

sendo esta a estatstica do teste.

Note que,

SSR k n k 1 SSR n k 1 SSR SST


F= = =
SSE (n k 1) k SSE k SSE SST

n k 1 R 2
= .
k 1 R 2

Rejeitamos H0 para valores grandes da estatstica do teste F.

14
ANLISE DE REGRESSO

n k 1 R 2
F=
k 1 R 2
n k 1
parte da constante , a estatstica F a razo entre a variao explicada e a no
k
explicada em Y.

natural que digamos que a regresso significativa s quando a proporo da variao


explicada grande. Isto ocorre s quando a razo F grande. Por esta razo devemos
sempre rejeitar H0 para valores de F muito grandes.

Se H0 no for rejeitada, ento o mesmo que dizer que o conjunto de variveis


explicativas contribuem pouco para a explicao da variao da varivel dependente.

15
ANLISE DE REGRESSO
Na regresso simples para testar a significncia da regresso consideramos as hipteses,

H 0 : 1 = 0
H 1 : 1 0

e portanto a estatstica teste a usar deve ser,

SSR k SSR k 1 0
F= = 1
~ Fn11 ou ~ t n2
SSE (n k 1) S 2
S Sob H
0
1

16
ANLISE DE REGRESSO
Os resultados descritos podem ser convenientemente resumidos na tabela da ANOVA
seguinte:

Fonte de Soma dos Quadrados Graus de Quadrados Razo F


variao Liberdade Mdios
n
) SSR
SSR= ( y i y )
Devido 2 k SSR k
F=
Regresso i =1 k S2

n
) 2
SSE= ( y i y i )
Devido aos n-k-1 SSE
S 2=
resduos i =1 n k 1

n
SST= ( y i y )
Total 2 n-1
i =1

17
ANLISE DE REGRESSO

Exemplo
Para o exemplo em estudo, vamos testar a hiptese nula da regresso no ser
significativa.

Hipteses:

H 0 : 1 = 2 = 0
H 1 : pelo menos um i 0

SSR 2
Sob H0, F= ~ F7
2

S2

18
ANLISE DE REGRESSO
Tem-se:
( )
P F72 f = = 0.05 f = 4.74

RC = [4.74, +[.
SSR k n k 1 R 2 7 0.84697
Fobs = = = = 19.37 RC, logo rejeitamos H0.
S 2
k 1 R 2
2 0.15303

Ao nvel de significncia de 0.05, rejeitamos a hiptese da regresso no ser


significativa.

Ento h evidncia para afirmar que existe um relacionamento linear entre o conjunto
de variveis explicativas e o volume de vendas.

19
ANLISE DE REGRESSO

Para o Exemplo, temos a seguinte Tabela ANOVA:

Fonte de Soma dos Graus de Quadrados Mdios Razo F


variao Quadrados Liberdade

Devido SSR=41.41695 2 SSR 41.41695


= = 20.71
F = 19.37
Regresso k 2

Devido aos SSE=7.48305 7 SSE 7.48305


S2 = = = 1.06901
resduos n k 1 7

Total SST=48.9 9

20