Escolar Documentos
Profissional Documentos
Cultura Documentos
2.1 Um Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 O Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.8 O estimador de 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.12 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Captulo 1
Seja Y1 , Y2 , . . . , Yn uma amostra aleatria simples de uma populao normal com mdia e
varincia 2 . Isso significa que as Yi s so independentes e identicamente distribudas (iid),
cada uma com distribuio N(, 2 ). Ento temos que E(Yi ) = e podemos escrever
Yi = + ui
Yi =
b + i
em que
i = Yi
b
o resduo. Note que o resduo a diferena entre o valor realmente observado e o valor
dado pelo nosso modelo, ou seja, o resduo a diferena entre o valor observado e o valor
ajustado pelo modelo.
2
CAPTULO 1. INFERNCIA SOBRE A MDIA E A VARINCIA DE UMA POPULAO
NORMAL
Para estimar a mdia populacional , vimos que a mdia amostral o estimador na-
tural. Na verdade, Y tambm o estimador de mnimos quadrados, ou seja, Y minimiza a
soma dos quadrados dos resduos. Vamos denotar por Q() essa soma dos quadrados dos
resduos. Ento n n
X X
Q(b) = i =
2
(Yi
b)2
i=1 i=1
O valor
b que minimiza essa soma (para um bom ajuste, os resduos devem ser pequenos!)
obtido derivando-se Q(b
) com relao a
b, igualando-se essa derivada a zero e confirmando
b=Y
d2 Q(b )
= 2n > 0
db 2 b=Y
Logo,
b = Y , de fato, um ponto de mnimo, e Y o estimador de mnimos quadrados de .
Y
2
Y N ; n N(0; 1)
n
(n 1)S 2
2 (n 1) (1.1)
2
Y
n t(n 1) (1.2)
S
onde n n
1 X 1 X 2
S =
2
(Yi Y )2 =
n 1 i=1 n 1 i=1 i
o estimador no-viesado de 2 . Note que esse estimador a soma dos quadrados dos
resduos, dividida por n 1. A partir de (1.2) e (1.1) obtivemos intervalos de confiana e
construmos testes de hipteses para a mdia e para a varincia de uma populao normal.
2.1 Um Exemplo
Consideremos uma populao formada por 60 famlias, para as quais queremos fazer um
estudo sobre os gastos com consumo. Na tabela 2.1 apresentamos um conjunto de dados
hipotticos sobre a renda lquida semanal e gastos semanais com consumo. Aqui estamos
supondo que podemos dividir as 60 famlias em grupos com aproximadamente a mesma renda.
A forma de interpretar essa tabela a seguinte: por exemplo, para uma renda semanal
de $80, existem 5 famlias, cujos gastos variam de $55 a $75. Cada coluna da tabela
fornece a distribuio condicional de Y (consumo), dado o valor de X (renda). Como esses
dados representam toda a populao, podemos calcular as probabilidades condicionais P(Y =
1
Yj | X = Xi ) P(Y | Xi ). Por exemplo, P(Y = 70 | X = 80) = .
5
5
CAPTULO 2. O MODELO CLSSICO DE REGRESSO LINEAR SIMPLES
Na Figura 2.1 temos o grfico que representa os gastos individuais e as rendas das 60
famlias. A reta a exibida representa o comportamento das mdias ou esperanas condicio-
nais para cada valor da renda. Podemos ver que, para cada nvel de renda, h variaes nos
gastos individuais mas existe uma tendncia crescente mdia, isto , aumentando a renda, o
gasto mdio com consumo tende a aumentar. Mais precisamente, E (Y | Xi ) aumenta medida
que aumenta a renda.
O que esse exemplo ilustra o conceito de curva de regresso populacional, que nada
mais que o lugar geomtrico das esperanas condicionais da varivel dependente Y para
valores fixos das variveis independentes. No caso de uma varivel independente, podemos
definir a funo de regresso populacional
E (Y | Xi ) = f (Xi ) (2.1)
A funo f pode ser qualquer. O modelo mais simples sup-la linear, o que nos d o modelo
linear
E (Y | Xi ) = 0 + 1 Xi (2.2)
Nesse caso, temos a funo de regresso linear populacional.
renda X , existe uma flutuao dos valores de Y em torno da sua esperana condicional. Na
Figura 2.2, esse fato ilustrado para a situao em que os Yi s vm de uma distribuio
normal. Ento, para uma determinada famlia com renda Xi temos que o gasto com consumo
pode ser escrito como
Yi = E (Y | Xi ) + ui (2.3)
No caso do modelo linear, essa equao se torna:
Yi = 0 + 1 Xi + ui (2.4)
Na prtica, temos apenas uma amostra da populao, o que equivale a dizer que, para
cada X , temos um nico valor observado de Y . E a partir dessa amostra temos que estimar
a reta de regresso populacional. Isso significa que a partir da amostra temos que obter a
funo de regresso amostral (essa a verso amostral da equao (2.2) ):
Ybi =
b0 +
b1 Xi (2.5)
onde Ybi um estimador para E (Y | Xi ) e
b0 e
b1 so estimadores para 0 e 1 . Para cada
observao especfica, temos a seguinte equao, que a contrapartida amostral de (2.4):
Yi =
b0 +
b1 Xi + u
bi
b1 +
b2 Xi + i
que nos diz que os valores observados de Y esto em torno da reta de regresso amostral,
conforme ilustrado na Figura 2.3. Os i , que so a contrapartida amostral dos ui , so
chamados resduos ou erros.
2.2 O Modelo
Yi = 0 + 1 Xi + ui (2.6)
com as seguintes hipteses:
(a) E (ui ) = 0 i
(b) Var(ui ) = 2
i (homocedasticidade)
(c) Cov ui , uj = 0 i 6= j
Como os Yi s so funes lineares de variveis aleatrias normais, segue que eles pr-
prios so tambm normais. Temos que:
E(Yi ) = 0 + 1 Xi i Reta de regresso populacional
Var(Yi ) = 2
i
Cov(Yi , Yj ) = 0 i 6= j
E (Yi |Xi ) = 0 + 1 Xi
O objetivo estimar essa reta a partir de uma amostra, obtendo-se a reta de regresso
amostral
Ybi =
b0 +
b1 Xi
i = Yi Ybi = Yi
b0
b1 Xi (2.9)
= 2nY + 2nb0 + 2n
b1 X
Q
= 2n > 0
b0 b0
n
Q X
= 2 Yi 0 1 Xi Xi
b b
b1
i=1
Xn n
X n
X
= 2 Xi Yi + 2
b0 Xi + 2
b1 X 2
i
i=1 i=1 i=1
Xn n
X Xn
= 2 Xi Yi + 2
b0 Xi +
b1 Xi2
i=1 i=1 i=1
n
Q X
= Xi2 > 0
b1
b1
i=1
b0 +
b1 X = Y (2.12)
n n n
Q X X X
= 0 2 Xi Yi + 2
b0 Xi +
b1 Xi2 = 0
1
b
i=1 i=1 i=1
n
X n
X n
X
Xi Yi =
b0 Xi +
b1 Xi2 (2.13)
i=1 i=1 i=1
n
X X n n
X
b0 Xi +
b1 Xi2 = Xi Yi (2.14)
i=1 i=1 i=1
b0 = Y
b1 X
i=1 i=1
n
X n
X
2
Xi X Xi2 2Xi X + X
2
=
i=1 i=1
Xn n
X
Xi2 2X Xi + nX
2
=
i=1 i=1
Xn
Xi2 2X nX + nX
2
=
i=1
Xn
Xi2 nX
2
=
i=1
b1 = SX Y
(2.17)
SX X
b0 = Y
b1 X (2.18)
Note que, das equaes (2.9), (2.11) (2.13), resultam as seguintes propriedades dos
resduos: X
i = 0 (2.19)
X
i Xi = 0 (2.20)
Essas duas equaes so a contrapartida das hipteses feitas sobre os ui s na populao:
ui s e i s tm mdia zero e so no correlacionados com os Xi s.
Ybi = b1 Xi = Y
b1 + b1 X +
b1 Xi
ou
Ybi = Y +
b1 Xi X (2.22)
1. A reta passa pelo ponto X , Y .
De fato: fazendo Xi = X na equao, resulta Ybi = Y .
X X
1X b 1 1 1X b
Cov i , Ybi = i Yi i Ybi = i Yi
n n n n
1 hX b i 1 h X X i
= i 0 + 1 Xi =
b 0
b i + 1
b i Xi
n n
Das equaes (2.19) e (2.20), conclui-se que
Cov i , Ybi = 0 (2.23)
4. Vamos calcular a soma dos quadrados dos resduos ou erros, que denotaremos por SQE.
Noa captulo anterior, vimos que aSQ estava diretamente relacionada estimativa de
2.
X X 2 X h i2
SQE = i =
2
Yi Yi =
b Yi Y 1 Xi X
b =
X 2 X 2 X
= Yi Y + b2
1 Xi X 2 b1 Xi X Yi Y =
SX2 Y SX2 Y SX2 Y
= SY Y + SXX 2b S
1 XY = SYY + 2
SX2 X SX X SX X
ou
SQE = SY Y b 1 SX Y (2.24)
Como, em geral, SY Y > 0 (note que SY Y mede a varincia dos Yi s) podemos escrever:
!
b SX Y SX2 Y
SQE = SY Y 1 = SY Y 1
SY Y SX X SY Y
ou seja
SQE = SY Y 1 rX2 Y (2.25)
Isso significa que a variao de Yi em torno de sua mdia pode ser decomposta em 2
parcelas:
Yi Ybi resduo
Ybi Y parte explicada pela regresso (note que no lugar de Yi aparece Ybi )
Figura 2.4 Yi Y = Yi Ybi + Ybi Y
Mas
n
X Xn n
X Xn n
X
Yi Ybi Yi Y =
b Yi Yi Yi Y
b b Yi Yi =
b i Yi Y
b i = 0
i=1 i=1 i=1 i=1 i=1
n
P 2
Yi Y = SQT = soma dos quadrados total (Note que SQT = SY Y )
i=1
n
P 2
Yi Ybi = SQE = soma dos quadrados dos resduos ou erros
i=1
n
P 2
Ybi Y = SQR = soma dos quadrados devidos regresso
i=1
Demonstrao
n
P n
P
Xi X Yi Y Xi X Yi n n
b1 = SX Y = i=1 i=1 Y X X Xi X
= Xi X = Yi
SX X SX X SX X SX X i=1 i=1
SX X
Definindo
Xi X
ci = (2.31)
SX X
temos que
n
X
b1 = ci Yi (2.32)
i=1
Para o estimador
b0 temos que:
X n X X n n
b1 X = 1
b0 = Y Yi X ci Yi =
1
ci X Yi
n i=1 i=1 i=1
n
Definindo
1
di = ci X (2.33)
n
resulta que
n
X
b0 = di Yi (2.34)
i=1
n
P
n
X n
X Xi2 n
X
i=1
di = 1 di2 = di Xi = 0 (2.36)
i=1 i=1
nSX X i=1
n
X X
c i di = (2.37)
i=1
SX X
Demonstrao
n n
X 1 X 1
ci = Xi X = 0=0
i=1
SX X i=1 SX X
n
P 2
n Xi X
X i=1 SX X 1
ci2 = = =
i=1
SX2 X SX X
2 SX X
n
X n n
1 X 1 X
c i Xi = Xi X Xi = Xi X Xi X + X =
i=1
SX X i=1 SX X i=1
n n
1 X 2 X X SX X X
= Xi X + Xi X = + 0=1
SX X i=1 SX X i=1 SX X SX X
n n n
X X 1 1 X
di = ci X = nX ci = 1
i=1 i=1
n n i=1
n n 2 n n n
X
2
X X 1 X 1 2X 2 2X X 1
di2 = ci X = +X ci ci = + =
i=1 i=1
n i=1
n2 i=1
n i=1 n SX X
n
P
Xi2 nX + nX
2 2
n
SX X + nX
2
i=1 1 X 2
X
nSX X i=1 i
= = =
nSX X nSX X
n n n n
X X 1 1X X
d i Xi = ci X Xi = Xi X c i Xi = X X 1 = 0
i=1 i=1
n n i=1 i=1
n n n n
X X 1 1X X X
c i di = ci ci X = ci X ci2 = 0
i=1 i=1
n n i=1 i=1
SX X
TEOREMA 2.3
b0 e
b1 so estimadores no viesados de 0 e 1 respectivamente.
Demonstrao
n
! n n
X X X
E
b1 = E ci Yi = ci E (Yi ) = ci (0 + 1 Xi ) =
i=1 i=1 i=1
n
X n
X
= 0 c i + 1 ci Xi = 0 0 + 1 1 = 1
i=1 i=1
n
! n n
X X X
E
b0 = E di Yi = di E (Yi ) = di (0 + 1 Xi ) =
i=1 i=1 i=1
n
X n
X
= 0 di + 1 d i Xi = 0 1 + 1 0 = 0
i=1 i=1
Demonstrao
n
! n n
X X X X X 2
Var
b1 = Var ci Yi = ci2 Var (Yi )+ ci cj Cov Yi , Yj = ci2 2 + ci cj 0 =
i=1 i=1 i=1
SX X
i6=j i6=j
n
P
n
X
! n
X X n Xi2
X X i=1
Var
b0 = Var di Yi = di2 Var (Yi )+ di dj Cov Yi , Yj = di2 2 + di dj 0 = 2
i=1 i=1 i=1
nSX X
i6=j i6=j
Demonstrao
b0 e
b1 tambm tm distribuio normal. A mdia e a esperana so como calculadas nos
teoremas anteriores.
Demonstrao
Demonstrao
PARTE 1: Seja
e1 um estimador linear no viesado de 1 . Isso significa que:
X
e1 = ki Yi E e1 = 1
Mas
X X X
E
e1 = 1 E ki Yi = 1 ki E (Yi ) = 1 ki (0 + 1 Xi ) = 1
X X
ki = 0 ki Xi = 1
sujeito s restries
X
ki = 0
X
ki Xi = 1
Q
= 0 2ki 1 2 Xi = 0 i = 1, 2, . . . , n (2.43)
ki
Q X
=0 ki = 0 (2.44)
1
Q X
=0 ki Xi = 1 (2.45)
2
Substituindo as equaes (2.44) e (2.45) nas equaes (2.46) e (2.47), obtemos o seguinte
sistema: P
n1 + 2 Xi = 0
P P
1 Xi + 2 Xi2 = 2
ou
1 + 2 X = 0
P
n1 X + 2 Xi2 = 2
PARTE 2: Seja
e0 um estimador linear no viesado de 0 . Isso significa que:
X
0 =
e ki Yi E e0 = 0
Mas
X X X
E 0 = 0 E
e ki Yi = 0 ki E (Yi ) = 0 ki (0 + 0 Xi ) = 0
X X
ki = 1 ki Xi = 0
sujeito s restries
X
ki = 1
X
ki Xi = 0
Q
= 0 2ki 1 2 Xi = 0 i = 1, 2, . . . , n (2.48)
ki
Q X
=0 ki = 1 (2.49)
1
Q X
=0 ki Xi = 0 (2.50)
2
Substituindo as equaes (2.49) e (2.50) nas equaes (2.51) e (2.52), obtemos o seguinte
sistema: P
n1 + 2 Xi = 2
P P
1 Xi + 2 Xi2 = 0
ou
2
1 + 2 X =
n
P
n1 X + 2 Xi2 = 0
Tirando o valor de 1 na primeira equao e substituindo na segunda, resulta:
X X X
2 2X
2 X Xi + 2 Xi2 = 0 2X n2 X + 2 Xi2 = 0 2 =
2
n SX X
Observao
b1 =
2
Var
SX X
Para SX X fixo, Var b1 diretamente proporcional a 2 ; ento, quanto maior a varincia
2.8 O estimador de 2
Nas expresses das varincias dos estimadores, aparece a varincia 2 dos erros ui . Em
geral, tal varincia no conhecida e precisamos estim-la. No modelo populacional, os erros
aleatrios ui representam o desvio de cada observao em relao mdia populacional, que
dada pela funo de regresso linear populacional (FRLP). Quando estamos trabalhando
com uma amostra da populao, passamos a ter uma reta de regresso estimada, a funo de
regresso linear amostral (FRLA), estimada pelo mtodo dos mnimos quadrados. O desvio
de cada observao a essa reta estimada o resduo, e, ento, o resduo i a contrapartida
amostral dos erros aleatrios ui . Sendo assim, de se esperar que a contrapartida amostral
(estimador) da varincia dos ui esteja associada com a varincia dos resduos.
Consideremos o estimador da varincia dos resduos dado por (a menos de uma cons-
tante): X X
(i )2 = i2 = SQE
P
uma vez que i = 0. Da equao (2.24 temos que
X
i2 = SQE = SY Y b 2 SX X
1
Da
definio de varincia de uma varivel
aleatria X qualquer, temos que Var (X ) =
E X [E (X )] e isso implica que E X = Var (X ) + [E (X )]2 . Ento
2 2 2
X X n o n h i2
2 o
E i =
2
Var (Yi ) + [E (Yi )] n Var Y + E Y
2
SX X Var b1 + E b1
X
= (n 2) 2 + 2n0 1 X + 12 Xi2 2n0 1 X 12 SX X + nX =
2
X X X
= (n 2) 2 12 SX X + nX Xi2 = (n 2) 2 12 Xi2 nX + nX Xi2
2 2 2
ou seja, X
E i2 = (n 2) 2
ou ainda P
i2
E = 2
n2
Isso significa que um estimador no viesado para 2 dado pela soma dos quadrados dos
erros, dividida por n 2. P 2
i SQRE
b =
2
= (2.53)
n2 n2
so linear simples; com eles poderemos construir intervalos de confiana e fazer testes de
hipteses sobre os parmetros do modelo.
Demonstrao
Como estamos lidando com variveis normais, basta provar que a covarincia nula.
Temos que:
Cov b0 , i = Cov b0 , Yi b0 b0 Xi = Cov b0 , Yi Var b0 Xi Cov b0 ,
b1 =
X P X2
X 2
i
= Cov dj Yj , Yi Xi
2
nSX X SX X
P 2
Xi 2 Xi X 2
= di Var (Yi ) +
nSX X SX X
P 2
1 Xi X Xi 2 Xi X 2
= X 2
+ =
n SX X nSX X SX X
P 2
2 Xi X 2 X Xi 2 Xi X 2
2
= +
2
+ =
n SX X SX X nSX X SX X
P 2
2 Xi nX 2 2 SX X 2
2
= = =0
n nSX X n nSX X
Cov b1 , i = Cov b1 , Yi b0 b1 Xi = Cov b1 , Yi Cov b1 Xi Var
b0 , b1 =
X X
2 X 2 2
= Cov cj Yj , Yi Xi
2
= ci Var (Yi ) + Xi =
SX X SX X SX X SX X
Xi X X 2 2 Xi X Xi X
= +
2
Xi =
2
2 = 0
SX X SX X SX X SX X SX X
TEOREMA 2.10
b0 0
t(n 2) (2.57)
EP(b0 )
b1 1
t(n 2) (2.58)
epb1
Demonstrao
b
q0P 2 1 N(0, 1)
Xi
nSX X
b1 1
q N(0, 1)
1
SX X
H0 : 1 = 0
H1 : 1 6= 0
b1
t(n 2)
EP(
b1 )
Assim, basta comparar o valor EP(1b ) com a abscissa da distribuio t de Student
b
1
associada ao nvel de significncia desejado. Se
b1
> t/2 ;n2
EP(b1 )
rejeita-se H0. Note que a rejeio de H0 neste caso significa que a varivel independente X
explica Y .
b0 t/2 ;n2 EP(
b0 )
b1 t/2 ;n2 EP(
b1 )
O conceito de varincia est associado disperso dos dados em torno de sua mdia.
Lembre-se que Var(X ) = E[X E(X )]2 e para uma populao de tamanho N, represen-
tada pela varivel aleatria X com mdia , cujos valores so X1 , X2 , . . . , XN , temos que
1 PN
Var(X ) = 2 = (Xi )2 . Alm disso, a partir de uma amostra de tamanho n, podemos
N i=1
1 P n
estimar a varincia populacional por S 2 = (Xi X )2 .
n 1 i=1
No modelo de regresso linear simples, temos a seguinte decomposio para a soma
dos quadrados total:
Xn Xn n
X
Yi Y ) =
2
(Yi Yi ) +
b 2
(Ybi Y )2 (2.59)
i=1 i=1 i=1
n
P
O termo (Yi Y )2 est associado varincia dos Yi s.
i=1
n
P
Como Yb = Y , segue que o termo (Ybi Y )2 est associado varincia dos Ybi s.
i=1
n
P
J o termo (Yi Ybi )2 , que a soma dos quadrados dos resduos, est associado
i=1
estimativa da varincia do modelo , ou seja, varincia dos ui s.
Vemos, ento, cada uma das somas de quadrados envolvidas na equao (2.59) est
associada a uma determinada varincia no modelo de regresso linear simples.
A toda soma de quadrados est associado um nmero chamado graus de liberdade. Po-
demos pensar nesse nmero como sendo o nmero de combinaes lineares das observaes
necessrias para se obter a respectiva soma de quadrados.
n
P 2
Vamos ver o caso da soma dos quadrados total SQT = Yi Y . Dadas as ob-
i=1
servaes Y1 , Y2 , . . . , Yn , temos que a soma dos desvios em torno da mdia zero, isto ,
Pn
Yi Y = 0. Ento, precisamos apenas de n 1 desvios Yi Y para calcular SQT , isto
i=1
, por exemplo, se conhecemos Y1 Y , . . . , Yn1 Y , temos condies de calcular o ltimo
desvio e, portanto, SQT . Logo, o nmero de graus de liberdade associado SQT n 1.
Esse resultado vale em qualquer modelo. Uma outra forma de pensar a seguinte: para cal-
cular SQT, precisamos calcular Y ; logo, sobraram n 1 pedaos de informao disponveis
para calcular SQT .
Pn
Com relao SQR = (Ybi Y )2 , vimos que SQR =
b 2 SX X . Como SX X fixo, SQR
1
i=1
depende de apenas uma combinao linear das observaes (lembre-se que b1 = P ci Yi ).
Logo, o nmero de graus de liberdade associado SQR 1 no modelo de regresso linear
simples.
Note que, como a igualdade (2.59) vale para as somas de quadrados, um resultado
anlogo vale tambm para os graus de liberdade dessas somas de quadrados: n 1 =
(n 2) + 1.
Num bom modelo espera-se que SQR seja capaz de explicar toda a variabilidade dos
Y s, isto , espera-se que SQR seja prxima de SQT (equivalentemente, SQE deve ser
pequena). Foi visto que
(n 2)b
2 SQE
= 2 (n 2) (2.60)
2 2
2
SX X b
Por outro lado, se 1 = 0, ento b1 N 0, ou equivalentemente, 1
SX X
N (0, 1) . Logo, se 1 = 0,
b 2 SX X
SQR
1
= 2 (1) (2.61)
2 2
Como antes, o nmero de graus de liberdade da distribuio qui-quadrado o nmero de
graus de liberdade associado soma de quadrados.
Quando dividimos uma soma de quadrados pelo seu nmero de graus de liberdade,
obtemos o que chamada a mdia quadrtica. Usando a abreviatura MQ para mdia qua-
drtica, podemos escrever o resultado acima na seguinte forma resumida: se 1 = 0, ento
MQR
F= F (1, n 2) (2.62)
MQE
Como usar esse resultado para testar a significncia do modelo? Note que testar a
significncia do modelo como um todo equivale a testar a hiptese de que a varivel X (s)
realmente explica Y . No modelo de regressao linear simples, isso equivale a testar se 1 = 0.
Se essa hiptese verdadeira, ento SQR deve ser praticamente zero. o mesmo ocorrendo
com F . Dito de outra forma, se a hiotese nula no verdadeira, o valor de F deve ser
grande. ou seja, deve estar na cauda superior da distribuio. Por (2.62), se a hiptese
nula verdadeira (isto , a varivel X no explica Y ), ento a razo F tem distribuio
F (1, n 2). Camos, ento, no procedimento usual de teste de hiptese, s que agora usando
a distribuio F : se o valor da estatstica F tiver probabilidade muito pequena, isto , estiver
na cauda superior da distribuio, devemos rejeitar H0 , ou seja, devemos rejeitar a hiptese
de que a varivel independente X no explica Y . Nesse caso dizemos que a regresso
estatisticamente significante.
Fonte SQ gl MQ F Prob
SQR
Regresso SQR 1 MQR = 1
SQE MQR
Erro SQE n 2 MQE = n2
F= p
MQE
Total SQT n1
quadrticas residual e devida regresso. A mdia quadrtica total, igual varincia dos
Y s, em geral no apresentada na tabela da ANOVA. Na coluna F aparece o valor da razo
F , que deve ser usado para testar a significncia da regresso, ou seja, para testar
H0 : 1 = 0
2.12 Exemplo
Consideremos os dados apresentados na tabela 2.4 a seguir, onde temos a taxa de abandono
do emprego (Y ) na indstria (por 100 empregados) e a taxa de desemprego (X ) 1 . Consi-
derando a primeira das variveis como a varivel dependente Y, vamos usar o EXCEL para
ajustar um modelo de regresso linear simples a esses dados.
Ano Y X Ano Y X
1960 1,3 6,2 1967 2,3 3,6
1961 1,2 7,8 1968 2,5 3,3
1962 1,4 5,8 1969 2,7 3,3
1963 1,4 5,7 1970 2,1 5,6
1964 1,5 5,0 1971 1,8 6,8
1965 1,9 4,0 1972 2,2 5,6
1966 2,6 3,2
Estatstica de regresso
R mltiplo 0,808182
R-Quadrado 0,653158
R-quadrado ajustado 0,621627
Erro padro 0,322421
Observaes 13
ANOVA
gl SQ MQ F F de significao
Regresso 1 2,153413 2,153413 20,714768 0,000828
Resduo 11 1,143510 0,103955
Total 12 3,296923
Coeficientes Erro padro Stat t valor-P 95% inferiores 95% superiores Inferior 99,0% Superior 99,0%
Interseo 3,366258 0,331084 10,167388 0,000001 2,637547 4,094969 2,337973 4,394543
Desemprego -0,286212 0,062885 -4,551348 0,000828 -0,424621 -0,147803 -0,481521 -0,090902
Estatsticas da Regresso
Esse coeficiente passa a ter maior importncia nos modelos de regresso mltipla, pois
ele leva em conta o preo de se incluir mais variveis no modelo, uma vez que R 2
sempre aumenta quando se acrescentam variveis.
ANOVA
Coeficientes
Na terceira coluna (Stat t), temos o valor da estatstica t para o teste bilateral da
hiptese nula de que o respectivo coeficiente nulo. A estatstica de teste nesse caso
bi
t=
EP bi