Você está na página 1de 54

1

Regresso linear mltipla


Modelos de regresso linear mltipla
Em um estudo com 67 escritrios de uma rede financeira, a varivel resposta foi o
custo operacional no ano que se findou. Haviam 4 variveis preditoras: o valor
mdio emprestado aos clientes durante o ano, o nmero mdio de emprstimos,
nmero total de novos emprstimos processados, e ndice de salrios dos
escritrios. (Temos um levantamento).
Num estudo sobre a produtividade de trabalhadores ( em aeronave, navios) o
pesquisador deseja controlar o nmero desses trabalhadores e o bnus pago
(remunerao). (Aqui temos um experimento).
Num estudo sobre a resposta uma droga, o pesquisador deseja controlar as
doses da droga e o mtodo de aplicao. (Tambm temos um experimento).

Num estudo sobre o tempo de CPU, para avaliar a demanda por recursos, o
pesquisador decidiu verificar o efeito de X1=disk I/O e X2=memory size.
Exemplos:
2
Em todos os exemplos foram necessrias vrias variveis preditoras no modelo
para um bom ajuste do mesmo.
Um modelo contendo vrias variveis preditoras resulta numa estimao mais
precisa.
As anlises aqui desenvolvidas so vlidas para o delineamento inteiramente
casualizado.
3
Modelo de regresso de primeira ordem com duas
variveis preditoras
O modelo de regresso linear dado por:
(1) X X Y
i i i i
+ + +
2 2 1 1 0
Onde Y
i
a resposta no i-simo ensaio, X
i1
e X
i2
so os valores das duas variveis
preditoras no i-simo ensaio. Os parmetros do modelo so
0
,
1
,
2
e o termo do erro

i
.
Vamos assumir que E(
i
)=0, portanto, a funo de regresso do modelo de primeira
ordem :
(2) X X Y E
2 2 1 1 0
) ( + +
A representao grfica desta funo um plano no espao. A figura, na pgina
seguinte, mostra este plano para a funo:
(3) X X Y E
2 1
5 2 10 ) ( + +
A funo de regresso na regresso mltipla chamada de superfcie de resposta.
4

0
Plano de resposta

(1,33;1,67)
E(Y
i
) = 20,00
Y
i

i
5
Significado dos coeficientes de regresso:
O parmetro
0
o intercepto do plano de regresso. Se a abrangncia do modelo
inclui X
1
=0 e X
2
=0 ento
0
=10 representa a resposta mdia E(Y) neste ponto. Em
outras situaes,
0
no tem qualquer outro significado como um termo separado
no modelo de regresso.
O parmetro
1
indica a mudana na resposta mdia E(Y) por unidade de acrscimo
em X
1
quando X
2
mantido constante. Da mesma forma
2
indica a mudana na
resposta mdia por unidade de aumento em X
2
quando X
1
mantido constante.
Neste modelo, o efeito de X
1
sobre a resposta mdia no depende de X
2
e vice-
versa, assim, dissemos que as variveis preditoras tem efeito aditivo ou no
interagem. Temos um modelo de primeira ordem sem interao.
Exemplo: considerar o modelo de regresso da figura anterior.
Y = vendas no mercado (em 10.000 unidades monetrias); X
1
= despesas com o ponto
de venda (em 1.000 u.m.); X
2
= gastos com TV (em 1.000 u.m.). Como
1
=2, se o
gasto em uma localidade aumenta em 1 unidade (1.000 u.m.), enquanto o gasto com
TV mantido constante, espera-se um acrscimo nas vendas de 2 unidades (20.000
u.m.).
6
Exerccio: faa a interpretao para
2
. Resposta: como
2
=5 se o gasto com TV
em uma localidade aumenta em 1 unidade (1.000 u.m.) e o gasto com o ponto
mantido constante, as vendas esperadas aumentam 50.000 u.m.
Exerccio: no modelo
i p i p i i i
X X X Y + + + + +
1 , 1 2 2 1 1 0
...
Faa a interpretao do parmetro
k
. Resposta: indica a mudana na
resposta mdia E(Y) com o acrscimo de uma (1) unidade na varivel
preditora X
k
, quando todas as outras variveis preditoras so mantidas
constantes.
7
Modelo linear geral de regresso
Vamos supor que temos X
1
, X
2
,..., X
p-1
variveis preditoras. Vamos definir o modelo
de regresso, com erros normais, em termos das variveis preditoras:
(4) X X X Y
i p i p i i i
+ + + + +
1 , 1 2 2 1 1 0
...
Onde:
0
,
1
,...,
p-1
, so os parmetros;
X
i1
,..., X
i,p-1
so constantes conhecidas;

i
so independentes com distribuio N(0,
2
)
i=1,2,...,n.
A funo resposta para o modelo, como E(
i
)=0, dada por:
(5) X X X Y E
p p 1 1 2 2 1 1 0
... ) (

+ + + +
Algumas situaes em que podemos usar o modelo em considerao.
8
1) Temos p-1 variveis preditoras: todas as variveis preditoras apresentam efeito
aditivo, ou seja, no apresentam um efeito de interao entre elas (o efeito de uma
varivel preditora no depende dos nveis da outra varivel preditora).
2) As variveis preditoras so qualitativas: neste caso temos variveis como: sexo,
invalidez (normal, parcialmente invlido, invlido). Usamos variveis indicadoras,
que recebem valores 0 e 1 para identificar as categorias de uma varivel qualitativa.
Exemplo: desejamos fazer uma anlise de regresso para estimar a distncia de um
hospital (Y), baseado na idade dos pacientes (X
1
) e sexo (X
2
).
O modelo de regresso :
(6) X X Y
i i i i
+ + +
2 2 1 1 0
Onde:

'

masculino sexo do paciente o se


feminino sexo do paciente o se
X
pacientes; dos idade X
i
i
0
1
2
1
9
A resposta mdia do modelo (6) :
(7) X X Y E
2 2 1 1 0
) ( + +
Para pacientes do sexo masculino, X
2
=0, temos:
(8) X Y E
1 1 0
) ( +
Para pacientes do sexo feminino, X
2
=1, temos:
(9) X Y E
1 1 2 0
) ( ) ( + +
As duas funes respostas representam duas retas paralelas com diferentes
interceptos. Exerccio: faa a representao grfica das funes 8 e 9.
Outro exemplo: vamos considerar uma terceira varivel no modelo, o status sobre a
invalidez dos pacientes, a qual apresenta trs categorias. Em geral, representamos
uma varivel qualitativa com c categorias, por meio de c-1 variveis indicadoras.
Portanto, no exemplo, vamos definir as variveis X
3
e X
4
como:
10

'

'

categoria outra em est paciente o se


invlido te parcialmen paciente o se
X
categoria outra em est paciente o se
normal paciente o se
X
0
1
0
1
4
3
O modelo com idade, sexo e status da invalidez fica:
(10) X X X X Y
i i i i i i
+ + + + +
4 4 3 3 2 2 1 1 0
Neste curso, temos um captulo somente para o estudo de variveis qualitativas.
Como modelar e interpretar os coeficientes de regresso?
3) Regresso polinomial: contm termos quadrticos e de maior ordem nas
variveis preditoras. Exemplo:
(11) X X Y
i i i i
+ + +
2
2 1 0
11
O grfico deste modelo uma parbola.
D i a g r a m a d e d i s p e r s o p a r a o s d a d o s d e p r o d u o d e m i l h o
D o s e s d e f s f o r o
P
r
o
d
u

o

e
m

k
g
/
p
a
r
c
e
l
a
1
3
5
7
9
1 1
- 2 0 0 2 0 4 0 6 0 8 0 1 0 0 1 2 0
Apesar da natureza curvilnea da funo resposta do modelo (11) ele um caso
especial do modelo (4). Fazendo-se X
i1
=X
i
e X
i2
=X
i
2
, temos o modelo (1).
12
4)Variveis transformadas: uma transformao bastante utilizada a logartmica:
i i
Y Y log
'

O modelo fica:
(12) X X X Y
i i i i i
+ + + +
3 3 2 2 1 1 0
'
Exerccio: coloque o modelo (13) na forma do modelo de regresso linear
geral (4).
(13)
i
X X
i
i i
Y

+
+ +
2 2 1 1 0
1
Basta fazer:
i i i i Y i
X X Y Y
i
+ + +
2 2 1 1 0
'
1
'
A funo resposta complexa. Porm, o modelo (12) da forma do modelo
linear geral de regresso.
13
6) Combinando modelos: Exemplo:
(15) X X X X X X Y
i i i i i i i i
+ + + + + +
2 1 5
2
2 4 2 3
2
1 2 1 1 0
Fazendo-se:
2 1 5
2
2 2 3
2
1 1 1 i i i i i4 i i i i2 i i
X X Z X Z X Z X Z X Z
temos o modelo linear geral de regresso (4).
Observe que fazendo-se X
i3
=X
i1
X
i2
obtemos o modelo linear geral
de regresso (4).
(14) X X X X Y
i i i i i i
+ + + +
2 1 3 2 2 1 1 0
5) Modelos com efeito da interao entre variveis preditoras. O efeito de uma
varivel preditora depende dos nveis das outras variveis preditoras. Exemplo:
14
A figura ilustra um desses modelos mais complexos.
15
Modelo de regresso linear mltipla em termos
matriciais
(16) X X X Y
i p i p i i i
+ + + + +
1 , 1 2 2 1 1 0
...
A expresso do modelo linear geral de regresso dada por:
Em termos matriciais, precisamos definir:
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

n
p
p n n
p
p
n
X X
X X
X X
Y
Y
Y

.
.
.

.
.

. . 1
. . . . .
. . . . .
. . . . .
. . 1
. . 1

.
.
2
1

1
1
0
1 x p
1 , 1
1 , 2 21
1 , 1 11
p n x
2
1
1 n x
1 n x
X Y
16
Em termos matriciais, o modelo de regresso linear geral dado por:
X Y +
um vetor de variveis aleatrias independentes e normalmente distribudas
com esperana (mdia), E()=0 e matriz de varincia-covarincia dada por:
1
1
1
1
]
1

2
2
2
2
. 0 0
. . . .
0 . 0
0 . 0
) (


Assim, o vetor das observaes Y tem esperana e varincia dadas por:
I Y X Y E
2 2
) ( ) (
n x n 1 x n

(17)
=
2
I
(18)
17
Exerccio: uma empresa opera estdios fotogrficos para crianas em 12
cidades. A empresa deseja expandir seus estdios para outras cidades
semelhantes e deseja investigar se as vendas (Y) podem ser estimadas atravs
do nmero de pessoas com 16 anos ou menos (X
1
) e a renda per capita na
cidade (X
2
). Os resultados foram:
18
A) Escreva o modelo de regresso linear de primeira ordem (sem efeito
quadrtico e interao).
B) Faa um grfico de disperso (Scatterplot) entre vendas e nmero e outro
para vendas e renda.
C) Mostre a matriz X, os vetores Y e para os dados do exerccio.
D) calcule os valores mdios (esperanas) das observaes,
E(Y).
19
Respostas:
A)
i i i i
X X Y + + +
2 2 1 1 0
B)
20
21
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
]
1

2
1
0
191
242
137
145
145
163
208
182
154
244
164
174
17 73 1
18 88 1
16 38 1
17 49 1
17 52 1
17 50 1
18 66 1
17 47 1
16 48 1
18 91 1
16 45 1
17 68 1

Y X
C)
22
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
]
1

+ +
+ +
+ +
+ +
+ +
+ +
+ +
+ +
+ +
+ +
+ +
+ +

2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
2 1 0
17 73
18 88
16 38
17 49
17 52
17 50
18 66
17 47
16 48
18 91
16 45
17 68












) (Y E
23
Estimao dos coeficientes de regresso
O sistema de equaes normais para o modelo (17) :
(19) Y X Xb X
' '

E os estimadores de mnimos quadrados so dados por:


(20) Y X X X b
' 1 '
) (

Mtodo de mxima verossimilhana


Vamos considerar o modelo com erros normais (17). A funo de mxima
verossimilhana dada por:
1
]
1


n
i
p i p i i
X X Y L
n
1
2
1 , 1 1 1 0
2
1
) 2 (
1
2
) ... ( exp ) , (
2 2 / 2

Os estimadores de mxima verossimilhana so exatamente os mesmos obtidos com o


mtodo de mnimos quadrados.
(21)
24
Continuao do Exerccio do estdio fotogrfico. Dados os resultados:
1
1
1
]
1

1
1
1
]
1


0,480 0,016 - 7.174 -
0,016 - 0,001 0,228
7,174 - 0,228 108,435
(
3474 12269 204
12269 45921 715
204 715 12
1
)
' '
X X X X
1
1
1
]
1

36772
134330
2149
Y X
'
E) Encontre as estimativas dos parmetros do modelo.
F) Apresente a funo de regresso estimada.
G) Faa a interpretao das estimativas dos parmetros do modelo.
25
Valores estimados e resduos
Os valores estimados so obtidos por:
(22)
1 x n
Xb Y

Os resduos so obtidos atravs da expresso matricial:


(23)
n
Xb Y Y Y e
x1

Exerccio:
H) para verificar o ajuste do modelo de regresso para os dados, necessrio encontrar
os valores estimados e os resduos. Encontre estes resultados para os dados da empresa
de estdio fotogrfico.
26
Anlise de varincia
Soma de quadrados e quadrados mdios
liberdade de graus p - n com Resduo SQ
liberdade de graus 1 - p com Regresso SQ
liberdade de graus 1 - n com SQTotal
n
n
Y H I Y
Y J H Y
Y J I Y
) (
] ) ( [
] ) ( [ '
'
1
'
1



Onde J uma matriz n x n de uns e H=X(XX)
-1
X

a matriz de projeo. Os
quadrados mdios so dados por:
p n
SQErro
1 p
o SQRegress
QMErro
o QMRegress

27
Teste F para regresso
Hipteses em teste:
zero. de diferente um menos pelo H
H
k a
p


:
0 ... :
1 2 1 0


A estatstica de teste dada por:
(24) F
QMErro
o QMRegress *

Se F
*
> F(; p-1,n-p), rejeitamos a hiptese nula, caso contrrio, aceitamos a hiptese.
No devemos esquecer de usar o valor p.
Exemplo: continuao do exerccio sobre a empresa de estdio fotogrfico.
28
Exerccio: interprete o teste F da anlise de varincia com o uso do valor p. Se a hiptese
nula for rejeitada, isto garante que podemos fazer estimao (predio) vlidas? Resp.
no.
29
Coeficiente de determinao (R
2
)
Define-se R
2
por:
(25) R
SQTotal
SQErro
SQTotal
o SQRegress
1
2
Mede a reduo da variabilidade total de Y associada com o uso do conjunto de variveis
X
1
,...,X
p-1
. Como na regresso linear simples, temos:
1 0
2
R
Assim, R
2
=0 se todas as estimativas b
k
=0 (k=1,...,p-1), e R
2
=1 quando todas as
observaes Y carem exatamente na superfcie de regresso ajustada, isto , quando:
i. todo para Y Y
i i

Como R
2
aumenta com a adio de variveis explanatrias, sugere-se utilizar o
coeficiente de determinao ajustado (corrigido) para os graus de liberdade. O
coeficiente de determinao ajustado dado por:
(26) R
SQTotal
SQErro
p n
n
a
n
SQTotal
p n
SQErro

1
2
1 1
1
30
Um alto valor de R
2
no necessariamente implica que o modelo ajustado se presta
para se fazer inferncias precisas, pois apesar de um valor alto de R
2
, o QME ainda
pode ser grande. O modelo pode no ser exatamente linear.
Coeficiente de correlao mltipla (R)
(27) R R
2

Exerccio: calcule o coeficiente de determinao (R


2
), o coeficiente de determinao
ajustado (R
2
a
) e o coeficiente de correlao (R), para os dados da empresa de estdios
fotogrficos . Faa a interpretao desses coeficientes.
Inferncia sobre os parmetros da regresso
Os estimadores de mnimos quadrados ou de mxima verossimilhana so no
tendenciosos, isto : E(b)=.
A matriz de varincia-covarincia dos estimadores,
2
(b), dada por:
(28)
p) x (p
1 ' 2 2
) ( ) (

X X b
O coeficiente de correlao
mltipla mede o relacionamento
linear entre Y e .
31
A estimativa da matriz de varincia-covarincia dada por:
(29) QMErro
p) x (p
1 ' 2
) ( ) (

X X b s
Intervalo de confiana para os parmetros
k
Para o modelo com erros normais, (17), temos:
(30) 1 - p 0,1,..., k p n t
k
k k
b s
b

) ( ~
) (

Assim, o intervalo para
k
, com confiana 1- dado por:
(31) b s p n t b
k k
) ( ) ; 2 / 1 ( t
Exerccio: para o exemplo da empresa de estdios fotogrficos calcule o
intervalo de confiana para
2
, com confiana de 95%. Faa a interpretao.
Exerccio: para o exemplo da empresa de estdios fotogrficos, obtenha
s
2
(b).
32
Testes de hipteses para
k
Hipteses:
(32) H
H
k a
k
0 :
0 :
0

Estatstica de teste:
(33) t
k
k
b s
b
) (
*
Critrio do teste:
Se |t
*
| t(1-/2;n-p), aceita-se a hiptese nula, caso contrrio rejeita-se a mesma.
Exerccio: para o exemplo da empresa de estdios fotogrficos, teste a hiptese
para
2
=0 vs a hiptese de que
2
diferente de zero, ao nvel de significncia de
5%. Faa a interpretao. Verifique se chegamos a mesma concluso com o uso do
intervalo de confiana.
33
Estimao da resposta mdia e predio de uma
nova observao
Intervalo de confiana para E(Y
h
)
Para valores dados de X
1
,X
2
,...,X
P-1
, representados por: X
h1
,X
h2
,...,X
h,P-1
, a resposta
mdia representada por E(Y
h
). Vamos definir o vetor:
1
1
1
1
1
1
]
1

1 ,
1
.
.
1
p h
h
1 x p
X
X
h
X
A resposta mdia estimada, correspondente ao vetor X
h
, dada por :
(34) Y
h h
b X
'


34
A varincia estimada da resposta mdia dada por:
(35) QMErro Y s
h h h h h
X b s X X X X X ) ( ) ) ( ( )

(
2 ' 1 ' ' 2


O intervalo de confiana para a resposta mdia, E(Y
h
), dado por:
(36) Y s p n t Y
h h
)

( ) ; 2 / 1 (

t
Exerccio: encontre o intervalo de confiana.para a resposta mdia (vendas)
considerando X
h1
=65,4 (populao objeto) e X
h2
=17,6, (renda per capita) com
95%. Faa a interpretao. Voc considera que este intervalo d informao
precisa? Utilize os seguintes resultados:
1
1
1
]
1

119,166
4,093 - 0,215
1781,941 - 56,748 26932,446
) (b s
2
,505 ) Y s(
h
6 316 42
2

, )

(
h
Y s
35
Limites de predio para uma nova observao Y
h(novo)
Os limites de predio com confiana 1- para uma nova observao Y
h(nova)

correspondente ao vetor X
h
, os valores das variveis explanatrias, so:
(37) pred s p n t Y
h
) ( ) ; 2 / 1 (

t
A varincia do erro de predio ( a diferena entre a nova observao e o valor
estimado) dado por:
(38) QMErro pred s
h h
) ) ( 1 ( ) (
1 ' ' 2
X X X X

+
Exerccio: a empresa deseja predizer as vendas para uma nova cidade com as
seguintes caractersticas
Cidade A: X
h1
=53,1 X
h2
=17,7
encontre o intervalo de predio com 95%. Faa a interpretao. Voc considera
que este intervalo satisfatrio? Utilize os seguintes resultados:
2,306 3) - t(0,975;12 19,331 s(pred) 034 177,

h
Y
36
Observao: Isto serve para mostrar que apesar de termos um alto valor para o
R
2
=0,845, no temos preciso suficiente para fazer os intervalos de predio. Assim,
alto coeficiente de determinao, no significa que podemos fazer predio precisa.
Pode-se pensar em adicionar ou substituir variveis preditoras do modelo.
Cautela com extrapolaes.
X
1
X
2
X
1
X
2

37
Os procedimentos vistos para o modelo de regresso linear simples aplicam-se
diretamente para o caso do modelo de regresso linear mltipla.
Os captulos 9 e 10 do livro texto apresentam muitos outros procedimentos.
Diagnstico do modelo
matriz de diagrama de disperso
grfico tridimensional (ver a nuvem de pontos de diferentes perspectivas para
identificar padres)
grficos de resduos (versus: valores estimados, tempo, alguma outra seqncia,
variveis regressoras, variveis regressoras omitidas, termos da interao, box-
plot(desenho esquemtico), grfico normal de probabilidades)
testes para homogeneidade de varincias, normalidade, falta de ajuste
Exemplo:
Empresa de estdio fotogrfico em 21 cidades.
38
OBS POPULACA RENDA VENDAS
1 68.5 16.7 174.4
2 45.2 16.8 164.4
3 91.3 18.2 244.2
4 47.8 16.3 154.6
5 46.9 17.3 181.6
6 66.1 18.2 207.5
7 49.5 15.9 152.8
8 52.0 17.2 163.2
9 48.9 16.6 145.4
10 38.4 16.0 137.2
11 87.9 18.3 241.9
12 72.8 17.1 191.1
13 88.4 17.4 232.0
14 42.9 15.8 145.3
15 52.5 17.8 161.1
16 85.7 18.4 209.7
17 41.3 16.5 146.4
18 51.7 16.3 144.0
19 89.6 18.1 232.6
20 82.7 19.1 224.1
21 52.3 16.0 166.5
Dados de 21 cidades da empresa de estdio fotogrfico:
Populao (X
1
)
Renda (X
2
)
Vendas (Y)
39
Matriz de diagrama de disperso:
Observa-se uma tendncia linear entre vendas (Y) e populao (X1); tambm entre
vendas (Y) e renda (X2). Observa-se, tambm, uma relao linear entre X1 e X2.
No se observa outliers, no se observa separaes nos dados.
40
41
A matriz de correlao:
Observe que a renda EST CORRELACIONADA com a populao.
42
A figura indica que razovel admitir uma superfcie plana como modelo de regresso
para os dados.
i i i i
X X y + + +
2 2 1 1 0
43
Exerccio: dados os vetores dos valores estimados e dos resduos. Faa os
seguintes grficos e interprete.
1 - resduos versus valores estimados
2 - resduos versus X
1
3 - resduos versus X
2
4 - resduos versus X
1
X
2
(interao)
44
Y ajustados
187.18411
154.22943
234.39632
153.32853
161.38493
197.74142
152.05508
167.86663
157.7382
136.84602
230.38737
197.18492
222.6857
141.51844
174.21321
228.12389
145.74699
159.00131
230.98702
230.31606
157.0644
ERROS
-12.78411
10.170574
9.8036764
1.271469
20.215072
9.7585779
0.7449178
-4.666632
-12.3382
0.3539791
11.512629
-6.084921
9.3142995
3.7815611
-13.11321
-18.42389
0.6530062
-15.00131
1.6129777
-6.216062
9.4356009
X1X2
1143.95
759.36
1661.66
779.14
811.37
1203.02
787.05
894.4
811.74
614.4
1608.57
1244.88
1538.16
677.82
934.5
1576.88
681.45
842.71
1621.76
1579.57
836.8
45

Indica que a funo de regresso linear mltipla adequada (plano)

Indica que a suposio de homogeneidade de varincia atendida

No apresenta outliers (valores discrepantes).


46

A suposio de normalidade dos erros est satisfeita, ou seja, a


distribuio dos erros segue aproximadamente uma distribuio normal.
47

No se observa nenhum padro, indicando que o modelo linear adequado.

Homogeneidade de varincias.
48

No se observa nenhum padro, indicando que o modelo linear adequado.

Homogeneidade de varincias.
49

Nota-se que no necessrio a incluso da interao X1*X2 no modelo.


50
Grfico dos valores absolutos dos resduos versus valores estimados: homogeneidade de varincias.

No se observa um acrscimo ou decrscimo da variabilidade com o aumento dos valores


estimados. Portanto, considera-se a suposio de homogeneidade de varincia atendida.

Se ocorrer heterogeneidade de varincia, fazer grficos dos resduos absolutos versus cada
varivel preditora para identificar qual(is) esto relacionadas com a falta de homogeneidade.
51
Anlise de varincia:
zero. de diferente um menos pelo :
0 e 0 :
2 1 0
a
H
H
Concluso: Rejeita-se H
0
. Assim, pelo menos um coeficiente de regresso difere
de zero.
Observao: se o modelo de regresso til para realizar estimao e predio
ainda ser visto.
52
Estimao de uma resposta mdia:
1
1
1
]
1

6 , 17
4 , 65
1
h
X
Interpretao: podemos afirmar com 95% de confiana, que para valor de populao igual
a 65,4 e renda igual a 17,6, a venda mdia est entre 185,29 e 196,92.
Importante: os consultores da empresa consideram este intervalo preciso para seus
objetivos.
53
Intervalo de predio: desejam predizer as vendas para duas novas cidades com
as seguintes caractersticas:
Cidade A: Populao (X
h1
)=65,4 Renda (X
h2
)=17,6
Cidade B: Populao (X
h1
)=53,1 Renda (X
h2
)=17,7
Cidade A
Cidade B
Interpretao: as vendas esto dentro dos intervalos acima. A preciso dos
intervalos deixa desejar. Intervalos mais precisos seriam necessrios, pode-se
pensar em outras variveis regressoras para entrar no modelo. Observe que valor
de R
2
alto no significa boas predies.
As duas cidades apresentam
caractersticas dentro dos
padres da amostra estudada.
54
NOTA: fazer lista de exerccios nmero 6.
Medidas Remediadoras

Usar modelo apropriado

Usar transformaes ( na varivel resposta ou na varivel preditora (quando os


efeitos so curvelneos, reduo do efeito de interao)

Você também pode gostar