Escolar Documentos
Profissional Documentos
Cultura Documentos
Yi 0 1 X i1 2 X i 2 i
(1)
Onde Yi a resposta no i-simo ensaio, Xi1 e Xi2 so os valores das duas variveis
preditoras no i-simo ensaio. Os parmetros do modelo so 0, 1, 2 e o termo do erro
i.
Vamos assumir que E(i)=0, portanto, a funo de regresso do modelo de primeira
ordem :
E (Y ) 0 1 X 1 2 X 2
(2)
E (Y ) 10 2 X 1 5 X 2
(3)
Plano de resposta
Yi
E(Yi) = 20,00
(1,33;1,67)
Exerccio: no modelo
Yi 0 1 X i1 2 X i 2 ... p 1 X i , p 1 i
Yi 0 1 X i1 2 X i 2 ... p 1 X i , p 1 i
(4)
E (Y ) 0 1 X 1 2 X 2 ... p 1 X p 1
(5)
Onde:
1 X i 1 2 X i 2 i
(6)
E (Y ) 0 1 X 1 2 X 2 (7)
Para pacientes do sexo masculino, X2=0, temos:
E (Y ) 0 1 X 1
(8)
E (Y ) ( 0 2 ) 1 X 1
(9)
1 se o paciente normal
0 se o paciente est em outra categoria
X3
X4
Yi 0 1 X i1 2 X i 2 3 X i 3 4 X i 4 i
(10)
Yi 0 1 X i 2 X i2 i
(11)
10
Produo em kg/parcela
-20
20
40
60
80
100
120
Doses de fsforo
11
Yi ' log Yi
O modelo fica:
Yi ' 0 1 X i1 2 X i 2 3 X i 3 i
(12)
Yi
0 1X i 1 2 X i 2
(13)
Basta fazer:
Yi '
1
Yi
Yi ' 0 1 X i1 2 X i 2 i
12
Yi 0 1 X i1 2 X i 2 3 X i1 X i 2 i
(14)
Yi 0 1 X i1 2 X i21 3 X i 2 4 X i22 5 X i1 X i 2 i
(15)
Fazendo-se:
Z i1 X i1 Z i2 X i21 Z i 3 X i 2
Z i4 X i22
Z i 5 X i1 X i 2
13
14
Yi 0 1 X i1 2 X i 2 ... p 1 X i , p 1 i
(16)
Y1
Y
2
Y .
n x1
.
Yn
1 X 11 . . X 1, p 1
1 X
.
.
X
21
2 , p 1
X
nxp
. .
. . .
.
.
.
. . .
.
1 X n1 . . X n , p 1
0
1
p x1
p 1
1
2
.
.
.
n x1
15
Y X
(17)
0
2 ( )
.
2 . 0
. . .
0 . 2
=2I
E( Y ) X
n x1
2 ( Y) 2I
nxn
(18)
16
17
18
Respostas:
A)
Yi 0 1 X i1 2 X i 2 i
B)
19
20
68
17
45
16
91
18
48
16
C)
1
1
174
164
244
154
47
17
X
1
1
1
1
1
66
18
182
50
17
52
17
49
17
38
16
88
18
73
17
208
Y
163
145
145
137
242
191
21
0 68 1 17 2
45 16
1
2
0
0 911 18 2
0 48 1 16 2
0 47 1 17 2
66 18
0
1
2
E(Y )
0 50 1 17 2
52 17
1
2
0
0 49 1 17 2
38 16
1
2
0
0 88 1 18 2
0 73 1 17 2
22
X ' Xb X ' Y
(19)
b ( X ' X ) 1 X ' Y
(20)
L(, )
2
1
( 2 2 ) n / 2
(21)
23
204 12269
204
12269
3474
2149
X ' Y 134330
36772
E) Encontre as estimativas dos parmetros do modelo.
F) Apresente a funo de regresso estimada.
G) Faa a interpretao das estimativas dos parmetros do modelo.
24
Y Xb
n x1
(22)
Y Xb
e YY
nx1
(23)
Exerccio:
H) para verificar o ajuste do modelo de regresso para os dados, necessrio
encontrar os valores estimados e os resduos. Encontre estes resultados para os dados
da empresa de estdio fotogrfico.
25
Anlise de varincia
Soma de quadrados e quadrados mdios
QMRegresso
QMErro
SQRegresso
p 1
SQErro
n p
26
H 0 : 1 2 ... p 1 0
H a : pelo menos um k diferente de zero.
A estatstica de teste dada por:
F*
QMRegress o
QMErro
(24)
27
28
R2
SQRegress o
SQTotal
SQErro
SQTotal
(25)
0 R2 1
Assim, R2=0 se todas as estimativas bk=0 (k=1,...,p-1), e R2=1 quando todas as
observaes Y carem exatamente na superfcie de regresso ajustada, isto ,
quando:
Yi Yi para todo i.
Como R2 aumenta com a adio de variveis explanatrias, sugere-se utilizar o
coeficiente de determinao ajustado (corrigido) para os graus de liberdade. O
coeficiente de determinao ajustado dado por:
Ra2 1
SQErro
n p
SQTotal
n 1
SQErro
1 nn1p SQTotal
(26)
29
R R
(27)
O coeficiente de correlao
mltipla mede o relacionamento
linear entre Y e .
2 (b) 2 ( X ' X ) 1
(p x p)
(28)
30
~ t (n p)
k 0,1,..., p - 1
(30)
bk t (1 / 2; n p ) s(bk )
(31)
31
H 0 : k 0
H a : k 0
(32)
Estatstica de teste:
t*
bk
s ( bk )
(33)
Critrio do teste:
Se |t* |t(1-/2;n-p), aceita-se a hiptese nula, caso contrrio rejeita-se a mesma.
Exerccio: para o exemplo da empresa de estdios fotogrficos, teste a hiptese
para 2=0 vs a hiptese de que 2 diferente de zero, ao nvel de significncia de
5%. Faa a interpretao. Verifique se chegamos a mesma concluso com o uso
do intervalo de confiana.
32
1
X
h1
Xh .
p x1
X h , p 1
Yh X 'hb
(34)
33
(35)
Yh t (1 / 2; n p ) s(Yh )
(36)
26932,446
s2 (b)
56,748 - 1781,941
0,215
- 4,093
119,166
Yh t (1 / 2; n p ) s ( pred ) (37)
A varincia do erro de predio ( a diferena entre a nova observao e o valor
estimado) dado por:
(38)
Exerccio: a empresa deseja predizer as vendas para uma nova cidade com as
seguintes caractersticas
Cidade A: Xh1=53,1
Xh2=17,7
35
Observao: Isto serve para mostrar que apesar de termos um alto valor para o
R2=0,845, no temos preciso suficiente para fazer os intervalos de predio.
Assim, alto coeficiente de determinao, no significa que podemos fazer
predio precisa.
Pode-se pensar em adicionar ou substituir variveis preditoras do modelo.
X2
X1
X1
36
Diagnstico do modelo
Os procedimentos vistos para o modelo de regresso linear simples aplicam-se
diretamente para o caso do modelo de regresso linear mltipla.
Os captulos 9 e 10 do livro texto apresentam muitos outros procedimentos.
matriz de diagrama de disperso
grfico tridimensional (ver a nuvem de pontos de diferentes perspectivas para
identificar padres)
grficos de resduos (versus: valores estimados, tempo, alguma outra
seqncia, variveis regressoras, variveis regressoras omitidas, termos da
interao, box-plot(desenho esquemtico), grfico normal de probabilidades)
testes para homogeneidade de varincias, normalidade, falta de ajuste
Exemplo:
Empresa de estdio fotogrfico em 21 cidades.
37
POPULACA
68.5
45.2
91.3
47.8
46.9
66.1
49.5
52.0
48.9
38.4
87.9
72.8
88.4
42.9
52.5
85.7
41.3
51.7
89.6
82.7
52.3
RENDA
16.7
16.8
18.2
16.3
17.3
18.2
15.9
17.2
16.6
16.0
18.3
17.1
17.4
15.8
17.8
18.4
16.5
16.3
18.1
19.1
16.0
VENDAS
174.4
164.4
244.2
154.6
181.6
207.5
152.8
163.2
145.4
137.2
241.9
191.1
232.0
145.3
161.1
209.7
146.4
144.0
232.6
224.1
166.5
Populao (X1)
Renda (X2)
Vendas (Y)
38
Observa-se uma tendncia linear entre vendas (Y) e populao (X1); tambm
entre vendas (Y) e renda (X2). Observa-se, tambm, uma relao linear entre X1 e
X2. No se observa outliers, no se observa separaes nos dados.
39
40
A matriz de correlao:
41
A figura indica que razovel admitir uma superfcie plana como modelo de
regresso para os dados.
yi 0 1 X i1 2 X i 2 i
42
43
Y ajustados
187.18411
154.22943
234.39632
153.32853
161.38493
197.74142
152.05508
167.86663
157.7382
136.84602
230.38737
197.18492
222.6857
141.51844
174.21321
228.12389
145.74699
159.00131
230.98702
230.31606
157.0644
ERROS
-12.78411
10.170574
9.8036764
1.271469
20.215072
9.7585779
0.7449178
-4.666632
-12.3382
0.3539791
11.512629
-6.084921
9.3142995
3.7815611
-13.11321
-18.42389
0.6530062
-15.00131
1.6129777
-6.216062
9.4356009
X1X2
1143.95
759.36
1661.66
779.14
811.37
1203.02
787.05
894.4
811.74
614.4
1608.57
1244.88
1538.16
677.82
934.5
1576.88
681.45
842.71
1621.76
1579.57
836.8
44
45
46
47
48
49
Grfico dos valores absolutos dos resduos versus valores estimados: homogeneidade de
varincias.
50
Anlise de varincia:
H 0 : 1 0 e 2 0
H a : pelo menos um diferente de zero.
51
X h
1
65,4
17,6
Interpretao: podemos afirmar com 95% de confiana, que para valor de populao
igual a 65,4 e renda igual a 17,6, a venda mdia est entre 185,29 e 196,92.
Importante: os consultores da empresa consideram este intervalo preciso para seus
objetivos.
52
Intervalo de predio: desejam predizer as vendas para duas novas cidades com
as seguintes caractersticas:
Cidade A: Populao (Xh1)=65,4
Renda (Xh2)=17,6
Renda (Xh2)=17,7
Cidade A
Cidade B
53
Medidas Remediadoras
Usar modelo apropriado
Usar transformaes ( na varivel resposta ou na varivel preditora (quando
os efeitos so curvelneos, reduo do efeito de interao)
54