Escolar Documentos
Profissional Documentos
Cultura Documentos
Ralph S. Silva
http://www.im.ufrj.br/ralph/multivariada.html
Sumário
y = β0 + β1 z1 + · · · + βr zr + ε
|{z}
|{z} | {z }
resposta média; parte estrutural erro; parte aleatória
yi = β0 + β1 z1i + · · · + βr zri + εi , i = 1, 2, . . . , n.
Suposições:
S1: E(εi ) = 0, ∀i = 1, 2, . . . , n.
S2: Var(εi ) = σ 2 , ∀i = 1, 2, . . . , n (homocedasticidade).
S3: Cov(εi , εk ) = 0, ∀i 6= k , i, k ∈ {1, 2, ..., n}.
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Revisão: Regressão Linear (Univariada) Múltipla
y = |{z}
Z β + |{z}
ε ,
|{z} |{z}
n×1 n×(r +1) (r +1)×1 n×1
com
S1: E(ε) = 0;
S2 e S3: Var(εi ) = σ 2 I n ;
y1 1 z11 z12 ... z1r
y2 1 z21 z22 ... z2r
y = . ; Z = .. .. .. .. ;
.. ..
. . . . .
yn 1 zn1 zn2 ... znr
β0 ε1
β1 ε2
β = . ; e ε= ..
..
.
βr εn
Observe que ainda não fizemos nenhuma suposição a cerca da distribuição
dos erros.
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Revisão: Regressão Linear (Univariada) Múltipla
y b = Z (Z 0 Z )−1 Z 0 y = Hy,
b = Zβ where H , Z (Z 0 Z )−1 Z 0 ,
e os resı́duos
ε=y −y
b b = [I − H]y = Py, where P , I − H,
Observe que
Xn
yi2 = y 0 y = (y − y b )0 (y − y
b+y b+y b0 y
b) = y ε0 b
b+b ε.
i=1
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Revisão: Regressão Linear (Univariada) Múltipla
Considere o modelo
y = Z β + ε.
E(y) = Z β é uma combinação linear das linhas da matriz Z com
coeficientes β0 , β1 , . . . , βr .
E(β)
b = β,
Var(β)
b = σ 2 (Z 0 Z )−1 ,
E(b
ε) = 0, e
Var(b
ε) = σ 2 P.
Temos que
ε0 b
E(b ε) = (n − r − 1)σ 2 ,
ε0 b
ε y 0 Py
tal que s2 = é um estimador não tendencioso de σ 2 .
b
=
n−r −1 n−r −1
Além disso, β
b eb
ε são não correlacionados.
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Revisão: Regressão Linear (Univariada) Múltipla
e
(n − r − 1)s2 ε0 b
ε
= 2 ∼ χ2n−r −1 .
b
σ 2 σ
Podemos então construir uma região de confiança conjunta para β usando
b 0 Z 0 Z (β − β)
(β − β) b
2
∼ (r + 1)Fr +1,n−r −1 .
s
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Revisão: Regressão Linear (Univariada) Múltipla
q p
IC100(1−α)% (βi ) = βbi ± Var(
d βbi ) (r + 1)Fr +1,n−r −1,1−α , i = 0, 1, . . . , r ,
Neste caso deve-se atentar para o fato de que aqui a confiança não é
simultânea para os r + 1 intervalos.
Temos que
z 00 β
b ∼ N (z 00 β, σ 2 z 00 (Z 0 Z )−1 z 0 ).
Suposições:
I E(ε) = 0; e
I Var(ε) = Σ, uma matriz p × p simétrica e positiva definida.
Portanto, os termos de erro associados com diferentes componentes do
vetor resposta podem ser correlacionados.
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Y = |{z}
|{z} Z β + |{z}
ε
|{z}
n×p n×(r +1) (r +1)×p n×p
com
···
y11 y12 y1p
y21 y22 ··· y2p
Y = .. .. .. = y 1, y 2, . . . , y p ,
..
. . . .
yn1 yn2 ··· ynp
···
1 z11 z12 z1r
1 z21 z22 ··· z2r
Z = .. .. .. .. = [1, z 1 , z 2 , . . . , z r ] ,
..
. . . . .
1 zn1 zn2 ··· znr
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
···
β01 β02 β0p
β11 β12 ··· β1p
β = .. .. .. = β1 , β2 , . . . , βp , e
..
. . . .
βr 1 βr 2 ··· βrp
···
ε11 ε12 ε1p
ε21 ε22 ··· ε2p
ε = .. .. .. = [ε1 , ε2 , . . . , εp ] .
..
. . . .
εn1 εn2 ··· εnp
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Y = |{z}
Suposições do Modelo |{z} Z ε :
β + |{z}
|{z}
n×p n×(r +1) (r +1)×p n×p
I E(εj ) = 0, e
I Cov(εj , εk ) = σjk I n , para j, k = 1, 2, . . . , p.
y j = Z β j + εj , para j = 1, 2, . . . , p.
(Y − Z B)0 (Y − Z B).
Valores ajustados:
b = Z B = Z (Z 0 Z )−1 Z 0 Y
Y
Resı́duos:
b = Y − Z B = [I − Z (Z 0 Z )−1 Z 0 ]Y .
ε=Y −Y
b
Propriedades:
Z 0b 0
ε = |{z} e b 0b
Y 0 ;
ε = |{z}
(r +1)×p p×p
0
Y 0Y = Y
b Y ε0 b
b +b ε; e
0 0 0 0
εb
b ε = Y Y − B (Z Z )B.
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
E(B) = β,
Cov(β
b ,β
j
b )
k = σjk (Z 0 Z )−1 ,
E(b
ε) = 0
|{z} , e
matriz nula
1
E( ε0 b
ε) = Σ.
n−r −1
b
Beb
ε são não correlacionados.
B 0 z 0 ∼ Np (β 0 z 0 , z 00 (Z 0 Z )−1 z 0 Σ)
e
b ∼ Wp (n − r − 1, Σ),
nΣ independentemente.
Intervalos-T simultâneos de 100(1-α)% de confiança para E(yk |z 0 ) = z 00 β k :
2
s s
0b p(n − r − 1) n
z 0 βk ± Fp,n−r −p,1−α z 00 (Z 0 Z )−1 z 0 σ
bkk ,
n−r −p n−r −1
para k = 1, 2, . . . , p.
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
Agora,
y 0 ∼ Np (β 0 z 0 , (1 + z 00 (Z 0 Z )−1 z 0 )Σ).
E, assim, intervalos simultâneos de previsão de 100(1-α)% para a k -ésima
componente de y 0 , y0,k , k = 1, 2, . . . , p, são dados por
s s
0b p(n − r − 1) 0 0 −1
n
z 0 βk ± Fp,n−r −p,1−α (1 + z 0 (Z Z ) z 0 ) σ
bkk ,
n−r −p n−r −1
Análise Estatı́stica Multivariada
Regressão Linear Multivariada
O modelo que consideramos trata y como uma variável aleatória cuja média
depende dos valores fixados das covariáveis.
Preditor Linear:
b 0 z,
βb0 + βb1 z1 + · · · + βbr zr = βb0 + β com βb0 = (βb1 , βb1 , . . . , βbr ).
Para um preditor dessa forma, o erro de previsão é dado por:
0
y − βb0 − β
b z.
Resultado:
Suponha
y p×1
∼ Np+r (µ, Σ)
z r ×1
com
µy Σyy Σyz
µ= e Σ= .
µz Σzy Σzz
Vimos que
E(y|z1 , z2 , . . . , zr ] = µy + Σyz Σ−1
zz (z − µz ).
v = y − µy − Σyz Σ−1
zz (z − µz ) e E(vv 0 ) = Σyy.z = Σyy − Σyz Σ−1
zz Σzy .
b yy.z = n − 1 (S yy − S yz S −1
Σ zz S zy ).
n
Observação: a coleção y1 , y2 , . . . , yp , z1 , z2 , . . . , zr leva as seguintes
equações de previsão:
y p×1
Considere ∼ Np+r (µ, Σ).
z r ×1