Escolar Documentos
Profissional Documentos
Cultura Documentos
ANLISE MULTIVARIADA
LAVRAS, MG
1996
ii
SUMRIO Pg.
1.1. Introduo 1
1.4. Distncias 15
1.5. Exerccios 24
2.1. Introduo 25
2.4. Exerccios 82
3. Amostragem multivariada 89
3.1. Introduo 89
Apndices 395
analisa dados de acordo com uma hiptese. Por outro lado, a anlise destes
de outras variveis;
conhecimento das tcnicas e das suas limitaes. A frase utilizada por Marriott
(1974) descreve bem este fato: No h mgica com os mtodos numricos, e que
Medicina
Neste caso, uma tcnica multivariada de classificao, em que se cria uma funo
que pode ser usada para separar as pessoas doentes das no doentes, pode ser
implementada.
Sociologia
Biologia
seleo deve ser realizada de maneira que a prxima gerao seja melhorada em
uma srie de caractersticas para um ndice, na qual a seleo e escolha dos pais
de dados. Por outro lado, nmeros que resumem, ou seja, que descrevem
Arranjos
experimento. A representao destes dados feita com a notao xjk para indicar
Tabela 1.1. Representao de dados atravs da notao xjk para indicar um valor
ou experimental.
Variveis
Exemplo 1.1
Varivel 2 (nmero de
sacos de rao vendidos) 10 12 6 8
80 10
120 12
X =
90 6
110 8
na eficincia so: (1) descrio dos clculos como operaes com matrizes e
ESTATSTICAS DESCRITIVAS
muitas das informaes contidas nos dados podem ser obtidas por clculo de
apresentadas a seguir.
1 n
Xk = X jk
n j =1
k=1, 2, ..., p (1.1)
1 n
( X jk X k )
2
Sk2 = Skk = k = 1, 2, ..., p (1.2)
n 1 j =1
1 n
S kk ' = ( X jk X k )( X jk ' X k ' ) k, k=1,2, ..., p (1.3)
n 1 j =1
juntos, Skk ser positiva. Se grandes valores de uma varivel ocorrem com
valores das duas variveis, Skk ser aproximadamente zero. Quando k=k, a
covarincia reduz-se a varincia amostral. Alm disso, Skk= Skk, para todo k e k.
( X jk X k )( X jk ' X k ' )
n
j =1 j =1
uma covarincia amostral. Suponha que os valores Xjk e Xjk sejam substitudos
( X jk X k ) ( X jk ' X k ' )
pelos valores padronizados, S kk e Sk ' k ' . Esses valores padronizados
propriedades:
Ferreira, D.F. Estatstica multivariada 11
tendncia de um dos valores do par ser maior que sua mdia, quando o outro
for menor do que a sua mdia, e r > 0 indica que quando um valor do par for
pequenos juntos;
variveis.
discrepantes (outliers).
W kk = ( X jk X k ) 2
j =1
n
Wkk ' = ( X jk X k )( X jk ' X k ' )
j =1
Mdias da amostra
X1
X2
X =
#
X p
Exemplo 1.2
1 4 1
X1 =
4 j=1
X j1 = (80 + 120 + 90 + 110) = 100
4
1 4 1
X2 =
4 j=1
X j2 = (10 + 12 + 6 + 8) = 9
4
X 100
X = 1 =
X2 9
S11=[(80-100)2+(120-100)2+(90-100)2+(110-100)2]/3 = 333,333
S22=[(10-9)2+(12-9)2+(6-9)2+(8-9)2]/3 = 6,667
S21=S12=20,000, e
333,333 20,000
S=
20,000 6,667
A correlao amostral :
20
r12 = = 0,424 3
33,333 6,667
r21=r12=0,4243
Portanto,
1, 0000 0, 4243
R=
0, 4243 1, 0000
Ferreira, D.F. Estatstica multivariada 15
1.4. Distncias
de distncia, por mais formidvel que isso possa parecer. O conceito de distncia
euclidiana deve ser familiar para a maioria dos estudantes. Se for considerado um
ponto P=(x1, x2) no plano cartesiano, a distncia deste ponto P da origem O=(0, 0),
d (O, P ) = x 12 + x 22 (1.5)
coordenadas, de tal forma que P=(x1, x2, ... xp), a distncia de P da origem
d(O, P) X2
X1
Figura 1.1. Distncia entre um ponto P=(x1, x2) e a origem O=(0, 0), fornecida pelo
teorema de Pitgoras.
Todos os pontos (x1, x2, .., xp) que contm uma distncia ao
2 2
d (O, P ) = x 12 + x 22 +...+ x 2p = c (1.7)
com coordenadas P=(x1, x2, ... xp) e Q=(y1, y2, ... yp) dada por:
( x 1 y 1) 2 + ( x 2 y 2 ) 2 +...+( x p y p )
2
d ( P ,Q ) = (1.8)
Ferreira, D.F. Estatstica multivariada 17
euclidiana.
diferentes posies para os pontos. Para ilustrar, suponha que se tenha n pares
ponto pode ser dado pelo fato de que os valores de x1 no podem ser preditos
0
X2
-6 -4 -2 0 2 4 6
-1
-2
-3
-4
-5
-6
o que no ocorre na direo de x2. Parece ser razovel, ento, ponderar x2 com
mais peso do que x1 para um mesmo valor, quando as distncias da origem forem
calculadas.
Ferreira, D.F. Estatstica multivariada 19
* 2 * 2 x 12 x 22
d (O, P ) = ( x 1 ) + ( x 2 ) = + (1.9)
S 11 S 22
x 12 x 22 2
+ =c (1.10)
S 11 S 22
menores eixos coincidem com os eixos das coordenadas. A Figura 1.3 mostra o
X2
0.5
cS 22
0.5
-cS 11 O 0.5
cS 11 X1
0.5
-cS 22
x 12 x 22
Figura 1.3. Elipse de uma distncia estatstica quadrtica d2(O,P)= + =c
2
.
S 11 S 22
Exemplo 1.3
2 2
2 x1 x2
d (O, P ) = +
9 1
Ferreira, D.F. Estatstica multivariada 21
Todos os pontos (x1, x2) que possuem distncias quadrada da origem igual a 1,
satisfazem a equao:
2 2
x1 x2
+ =1 (1.11)
9 1
origem.
2 2
0
( 0, 1) 9
+ 11 = 1
2
0
2 ( 1)
( 0,-1) 9
+ 1
=1
2 2
3 0
( 3, 0) 9
+ 1
=1
2
( 3 ) 0
2
(-3, 0) 9
+ 1
=1
5
x2
4
0
-5 -4 -3 -2 -1 0 1 2 3 4
x1 5
-1
-2
-3
-4
-5
equao 1.11.
2 2 2
(x1 y1) (x 2 y 2 ) (x p y p )
d (P ,Q ) = + +"+ (1.12)
S11 S 22 S pp
Ferreira, D.F. Estatstica multivariada 23
abordado com mais detalhe nos prximos captulos. Os dados do exemplo 1.1 so
Proc IML;
X={ 80 10,
120 12,
90 6,
110 8};
Print X;
n=nrow(X);p=ncol(X);
Xbar=x`*j(n,1,1)/n;
Print Xbar;
q=i(n)-(1/n)*j(n,n,1);
print q;
S=(1/(n-1))*X`*q*X;
W=(n-1)*S;
print S W;
V=diag(S);
Vroot=half(V);
IVroot=inv(Vroot);
R=Ivroot*S*Ivroot;
Print V Vroot IVroot;
Print R;
Quit;
1.5. Exerccios
x1 3 5 6 4 8 9 6 7
x2 6 11 11 9 15 16 10 12
x3 14 9 9 13 2 2 9 5
a) Construa o grfico de disperso dos pontos das variveis x1 e x2, x1 e x3, x2 e x3.
vetores.
coordenadas so dadas por (x1, x2, ..., xp). Esse ponto pode ser visto como o final
de um segmento de reta da origem (0, 0, ..., 0) ao ponto (x1, x2, ..., xp). Tal
POSTULADOS
Y = cX
Z = X + Y
3. A adio de vetores :
Comutativa: X + Y = Y + X
Associativa: X + ( Y + Z ) = ( X + Y ) + Z
X + 0 = X
0 .X = 0
n
X.Y = x i yi = x1 y1 + x 2 y 2 + + x n yn
i =1
2. lgebra vetorial e matricial 28
n-dimensional:
n
X = X.X = x i2 = x12 + x 22 +
2
+ x 2n = d 2 (P, O) (2.1)
i =1
X = X.X (2.2)
cosenos, por:
X.Y
Cos ( ) = (2.3)
X.X Y.Y
e Y :
d( X , Y ) d( X , Z ) + d( Y , Z ) (2.5)
a.b a . b (2.6)
ORTOGONALIDADE
X.Y = 0 (2.7)
construir uma base ortonormal de vetores, isto , cada vetor da base possui
( X .X
i j = 0, i j) . Para um conjunto de vetores arbitrrios pode-se empregar a
Passo 1: normalize X1 :
X1
X1 = ; X1 .X1 0
X1.X1
Ortogonalizando X1 e X 2 :
X 2 = X 2 ( X 2 .X1* ) X1*
Ento, normalizando-se X 2 :
Ferreira, D.F. Estatstica multivariada 31
1
X*2 = X 2 ; X 2 .X 2 0
X .X
2 2
Ento, normalizando-se X 3 :
1
X*3 = X 3 ; X 3 .X 3 0
X .X
3 3
vetorial original.
2. lgebra vetorial e matricial 32
Exemplo 2.1
Gram-Schimidt.
1 1 0
1 1 0
X=
1 0 1
1 0 1
X = [ X1 X 2 X 3 ]
Passo 1. Normalize X1 :
1
1 1
X1* =
2 1
1
Passo 2: Ortonormalize X 2 :
1 1 1
1 1
1 1 1
ortogonalizao: X 2 = 1. =
0 2 1 2 1
0 1 1
1 1
1
1 1 1 1
Normalizao: X*2 = . =
1 2 1 2 1
1 1
Passo 3: Ortonormalizao de X 3
0 1 1 0 12 + 12 0
0
1 1 1 1 0 12 + 12 0
ortogonalizao: X 3 = 1. (1). = =
1 2 1 2 1 1 12 12 0
1 1
1 1 1 1 2 2 0
12 1
2
1 1
X 2 = 12 2
2 12
1
2 12
Penrose, obtido de uma base ortonormal das colunas de uma matriz para a qual
T=UA
A+ = T(TT)-1U.
Um exemplo de matriz :
Ferreira, D.F. Estatstica multivariada 35
a 11 a 12 a 1p
a a a 2p
A = 21 22
n x p
a n1 a n2 a np
matriz por:
POSTULADOS
iguais:
2. Adio: A soma de duas matrizes de mesma ordem obtida pela soma dos
elementos correspondentes:
cA = c[ aij] = [ caij]
que a ordem coluna do fator que pr multiplica igual a ordem linha do fator
q
A B
n q q p = AB = a ij b jk = [ai1b1k + ai2b2k + ... + aiqbqk] = [cik] = C
j=1
Ferreira, D.F. Estatstica multivariada 37
Em geral AB BA.
1 0 0
0 1 0
=
0 0 1
Verifica-se que:
nAp pp = nAp
nn nAp = nAp
d1 0 0
0 d 0
D = diag[d1, d2, ..., dn] = 2
0 0 d n
2. lgebra vetorial e matricial 38
pr-fator.
(AB)-1 = B-1A-1
6. Matriz transposta: uma matriz obtida pela troca de linhas por colunas a partir de
(A + B) = A + B
(AB) = BA
Ferreira, D.F. Estatstica multivariada 39
(A-1) = (A)-1
seguir:
A A12 r
A = 11
A 21 A 22 s
p q
1
p A 1 + A 1B ( D CA 1B ) CA 1 A 1B ( D CA 1B )
1 1
p A B
=
q C D q ( D CA 1B ) CA 1
1
( D CA 1B )1
p q p q
( i +1) (i)
a (kji ) a (ji )
a =a ke j
a (jji )
k k
Ferreira, D.F. Estatstica multivariada 41
( i +1)
a (ji )
a = j
a (jji )
j
( i +1)
a (kji )
a = kj
a (jji )
kj
1
a (jji +1) =
a (jji )
original substituda pela sua inversa, garantindo-se que cada linha e coluna seja
Exemplo 2.2
4 2
A(0) =
2 2
primeira ao pivotante :
1 2
4 = 4 2
1 1
A (1) = 4
2 2
2 2 21 1
4 4
1 12 ( 12 ) 12 1 12 1 1 1
A ( 2)
= 4 1 1 1
= 21 =
2 1 2 1 2 1 2
1 1
inversa de A.
Matrizes ortogonais
Exemplo 2.3
12 1
2
Q= 1
2
1
2
1
2
1
2
Q =
t
1 1
2 2
ento,
12 1
2
1
2
1
2
1 2 0 1 0
QQ = 1
t
= =
2 2 0 2 0 1
1 1 1
2
2 2
2. lgebra vetorial e matricial 44
e,
1
2
1
2
12 1
2
1 2 0 1 0
QQ=
t
1 = = 0 1
2 2 0 2
1 1 1
2 2
2
Determinantes
definido por:
A = a11 se n = 1
n (2.9)
A = a ij A ij ( 1)
i+ j
se n > 1
j=1
Exemplo 2.4
4 2 2
4 1
A = [4] B= C = 2 2 0
1 2 2 0 2
A = 4;
2 0 2 0 2 2
C = 4 (1) 2 + 2 (1)3 + 2 (1) 4
0 2 2 2 2 0
C =0
1. A t = A ;
kA = k n A
muda de sinal;
denominado menor de A, e denotado por |Aij|. A relao entre |A| e |Aij| foi
1 1
7. A 1 = =A ;
A
8. |AB| = |A||B|.
Teorema da multiplicao
n x n dadas por:
B C n
A=
D E n
n n
0 B1C
DB1 e
0
o resultado :
2. lgebra vetorial e matricial 48
0 B C B1C
DB1
D E 0
B C B1C B 0
= 1 = 1
0 DB C + E 0 0 E DB C
V 0 n
V= 1
0 V2 n
n n
V = V1 V2
|A|, tem-se:
B 0
A = 1
= B E DB1C
0 E DB C
B C
=B E
0 E
identidade:
I A A 0 0 AB
0 I I B = I B
A 0 0 AB
=
I B I B
A 0 AB 0
= ( 1)n
I B B I
2. lgebra vetorial e matricial 50
blocos, tm-se:
A B = ( 1) AB I
n
A B = ( 1) ( 1) AB
n n
A B = ( 1) AB
2n
AB = A B
A 1A = I
A 1 A = 1
1
A 1 = = A 1
A
vantajoso definir regras que retenham vetores e matrizes na notao (Bock, 1975).
Ferreira, D.F. Estatstica multivariada 51
matricial.
matriz m x n:
a11 a1n
x x
A
= (2.10)
x
a a mn
m1
x x
conformveis.
( A + B ) A B
= + ; m = p, n = q (2.11)
x x x
( AB ) B A
=A + B; n=p (2.12)
x x x
2. lgebra vetorial e matricial 52
( A 1 ) A 1
= A 1 A ; m = n, A 0 (2.13)
x x
X
= 1ij (2.14)
x ij
em que 1ij uma matriz m x n com 1 na i-sima linha e j-sima coluna e 0 nas
X
= 1ii (2.15)
x ii
Seja g uma funo escalar qualquer de uma matriz X, que pode ser por
relao a X :
Ferreira, D.F. Estatstica multivariada 53
g g
x
x1n
g
11
= (2.16)
X
g g
x x mn
m1
a) o trao
n
tr ( A ) = a ii (2.17)
i =1
tr ( A + B ) = tr ( A ) + tr ( B ) , m=n=p=q (2.18)
tr ( A ) = tr ( A ) , m=n (2.19)
tr ( A t ) = tr ( A ) , m=n (2.20)
tr ( AB ) = tr ( BA ) , m = q, n = p (2.21)
2. lgebra vetorial e matricial 54
tr ( C )
= 0, r=s (2.23)
X
tr ( X )
= I, r =s (2.24)
X
tr ( XC )
= Ct , r = v, s = u (2.25)
X
tr ( X t CX )
= ( C + C t ) X, r=v=s=u (2.26)
X
tr ( XC )
= Ct , r = v, s = u (2.27)
X t
tr ( X t CX )
= X t ( Ct + C ) , r=v=s=u (2.28)
X t
tr ( A + B ) tr ( A ) tr ( B )
= + , m=n=p=q (2.29)
X X X
tr ( AB ) tr ( AB ) tr ( AB )
= + , m = q, n = p (2.30)
X X X
tr ( A 1 ) tr ( A 2 A )
= , m = n, A 0 (2.31)
X X
tr ( A 1C ) tr ( A 1CA 1A )
= , m = n = r = s, A 0 (2.32)
X X
b) determinante
X
= adj ( X t ) = X ( X 1 ) ,
t
u = v, X 0 (2.33)
X
ln X adj ( X t )
= ( X 1 ) ,
t
= u = v, X 0 (2.34)
X X
relao a uma varivel que por sua vez est sujeita a restries. Os casos
diagonal so sujeitos a:
1
g + tr [ U ( X X t )]
2
Ferreira, D.F. Estatstica multivariada 57
g 1
+ ( U Ut ) = 0 (2.36)
X 2
Como tambm
t t
g 1 t g 1 t
+ (U U) = (U U) = 0
t
(2.37)
X 2 X 2
restrito:
t
g g
+ =0 (2.38)
X X
E se X = x , ento,
2. lgebra vetorial e matricial 58
tr(Y) tr(Y)
= (2.40)
X x
g g A t
= tr (2.41)
x A x
g ln A ln A A t 1 t A t
x
=
x
= tr = tr ( A ) x (2.42)
A x
a matriz m x n:
Ferreira, D.F. Estatstica multivariada 59
z z i = 1, 2, ..., m
= (2.43)
x t x j ij j = 1, 2, ..., n
simtrica,
x t Ax tr ( x Ax )
t
= = 2Ax (2.44)
x x
por:
x t Ax ( x Ax x ) 2Ax
t
= = = 2A (2.45)
x t x x t x t
Formas quadrticas
x t = [X1 X2 X n ] a expresso:
n n 1 n
Q = x t A x = a ii X i2 + 2 a XX ij i j
i =1 i =1 j= i +1
2. lgebra vetorial e matricial 60
( xix j ) .
Exemplo 2.5
4 1
x = [ x1 x2 ] A=
1 2
4 1 x1 x
Q = [ x1 x2 ] = [ 4x1 + x 2 x1 + 2x 2 ] 1
1 2 x 2 x2
Q = 4x12 + 2x1 x 2 + 2x 22
distncia desse ponto [x1 x2 x p ] da origem pode e deve, nesse caso, ser
n n 1 n
d ( 0,P ) = a ii x + 2 a ijx i x j
2 2
i (2.46)
i =1 i =1 j=i +1
e garantindo que d2 > 0 para todo ponto P0, e fazendo aij=aji, tm-se:
a 11 a 12 a 1p
x
a 21 a a 2p 1
0 < d 2 = x t Ax = x 1 x p
22
(2.47)
x p
a p1 a p2 a pp
definidas). Uma condio necessria e suficiente para que A seja positiva definida
n A n = n Sn n Snt
Se por outro lado, o posto de S for rn, ento o posto de A ser r, e a forma
para obteno do fator de Cholesky de uma matriz pd, est apresentado a seguir.
a1j
1a linha: S11 = a11 S1j = j >1
S11
i-sima linha:
1
i 1
2
2
Sii = a ii Sri
r =1
1 i 1
Sij =
Sii
a ij
r =1
S riSrj
i2 j>i
1 1 i 1
Sii =
Sii
Sij =
Sii
S S
r =1
ri
rj
i> j
4. A obteno da A-1, inversa de A, com elementos aij, em que aij=aji, dada por:
2. lgebra vetorial e matricial 64
n n
a ii = ( Sri ) a ij = SriSrj
2
i> j
r =i r =i
Exemplo 2.6
Obtenha o fator de Cholesky (S), sua inversa (S-1) e a matriz inversa (A-1), a partir
4 2 0
A = 2 2 1
0 1 2
Obteno de St:
Primeira linha:
2 0
S11 = 4 = 2; S12 = = 1; S13 = = 0
2 2
Segunda linha:
1
[1 1 0] = 1
1
S22 = 2 12 = 1 S23 =
2
Terceira linha:
Ferreira, D.F. Estatstica multivariada 65
S33 = 2 ( 02 + 12 ) = 1
1
2
Logo,
2 1 0 2 0 0
S = 0 1 1
t
e S = 1 1 0
0 0 1 0 1 1
Linha 1:
1
S11 = ; S12 = S13 = 0 i < j
2
Linha 2:
1 1 1
S22 = = 1; S21 = 1 1 = ; S12 = 0 pois i < j
1 2 2
linha 3:
1 1 1 1
S33 = = 1; S31 = 1 0 + 1 = S32 = 1 (1 1) = 1
1 2 2 2
2. lgebra vetorial e matricial 66
logo,
1
2 0 0
1
S1 = 1 0
2
1
1 1
2
Diagonal principal:
2 2 2
1 1 1 3
a = + + =
11
2 2 2 4
a 22 = 12 + ( 1) = 2
2
a 33 = 12 = 1
Demais elementos:
1 1
a 21 = 1 + (1) = 1;
2 2
1 1
a 31 = 1 = ; a 32 = 1 (1) = 1;
2 2
1
a12 = a 21 = 1; a13 = a 31 = ; a 23 = a 32 = 1
2
Ferreira, D.F. Estatstica multivariada 67
Logo,
34 1 12
A 1 = 1 2 1
12 1 1
1. SSt = A
2. S-1S = St(S-1) t =
3. S-1A = S t
4. A(S-1) t = S
5. (S-1)A(S-1) t =
maximizao da razo:
x t Ax
=
xtx
para toda matriz A simtrica real. Para a maximizao deve-se tomar a derivada
a seguir.
Q x t Ax x t x
= = 2Ax e = 2x
x x x
homogneo de equaes:
x t Ax
A x = 0
xtx
x t Ax
Desde que = , ento para um ponto estacionrio qualquer i,
xtx
( A i ) x i = 0 (2.48)
soluo trivial, A-i no pode ter posto completo. Isto significa que seu
|A-i| = 0 (2.49)
x t Ax
= B 0
x t Bx
em que B uma matriz pd. O mximo dado da mesma forma que apresentado
apresentado a seguir:
x t Bx x t Ax
= Ax t Bx = (A B)x = 0 (2.50)
x 2 x Bx
( x 0 ), se e somente se,
A B = 0 (2.51)
Ferreira, D.F. Estatstica multivariada 71
prprios. Desde que B seja pd, possvel fator-la atravs do fator de Cholesky,
por:
B = SBSBt
Cholesky tem-se que x = ( SB1 ) z . Agora, se (2.50) for pr multiplicada por SB1 e
t
(2.52)
S1A ( S 1 t
) z = 0
B B
derivado por Hotelling (1936). Esse mtodo apropriado para problemas em que
vetor do estgio i ser representado por v (i) e o da prxima iterao ser obtido
por:
v (i +1) = Av (i)
A 2 = A 1 x1 x1t (2.53)
Exemplo 2.7
apresentada a seguir:
4 2
A=
2 1
1. Determinao de 1 e x1
1
O vetor v (0) ser considerado como: v (0) =
1
(1) (0) 4 2 1 6
(i) v = Av = =
2 1 1 3
Normalizando v (1) :
(1) 66 1
v = 3 = 1
6 2
2. lgebra vetorial e matricial 74
Para avaliar a convergncia, os vetores v (0) e v (1) devem ser comparados. Ser
4 2 1 5
(ii) v (2) = Av (1) = 1 = , normalizando
2 1 2 2.5
1
v (2) = 1
2
V (2) 0,8944
x = =
1
V (2)t V (2) 0, 4472
0,8944
1 = x1t A x1 = [ 4, 4721 2, 2361] =5
0, 4472
2. determinao de 2 e x 2
4 2 0,8944 0 0
A 2 = A 1x1 x1t = 5 [ 0,8944 0, 4472] =
2 1 0, 4472 0 0
Ferreira, D.F. Estatstica multivariada 75
x 2 = 0 ).
a matriz ser psd, e a forma quadrtica poder ser nula para um vetor x 0 .
normalizados associados.
Exemplo 2.8
4 2
A=
2 2
0,8507 0,5257
1 = 5, 2361 e1 = 2 = 0, 7639 e 2 =
0,5257 0,8507
3, 7893 2,3417
1e1e1t =
2,3417 1, 4471
0, 2111 0,3416
2 e 2 e 2t =
0,3416 0,5528
baseada nos autovalores e autovetores de uma matriz. Dada uma matriz A, pxp, e
satisfazem a:
x t Ax = a11X12 + a 22 X 22 + 2a12 X1 X 2 = c 2
A = 1e1e1t + 2 e 2 e 2t
x t Ax = 1 ( X t e1 ) + 2 ( X t e 2 )
2 2
( )
2
se que x = c1 2 e1 satisfaz x t Ax = 1 c1 2 e1t e1 = c2 e x = c 2 2 e 2 fornece a
1 1 1
comprimento de c
.
i
x
2
e
2
e
1
-0,5
c
1
-0,5
c x
2 1
quadrada.
n
A = i ei eit , pode-se construir uma matriz P, cujas colunas so os autovetores
i =1
A = P P t
n
1 (2.55)
A 1 = P 1P t = ei eit
i =1 i
da i-sima diagonal, ento, a matriz a seguir definida como matriz raiz quadrada
n
A = i ei eit = P 2 P t
1 1
2
(2.56)
i =1
Ferreira, D.F. Estatstica multivariada 79
2. A1/2A1/2=A
( )
1 n
= ei eit = P 2 P t
1 1
3. A 2 1
i
i =1
4. A1/2A-1/2=A-1/2A1/2= e A-1/2A-1/2=A-1
Exemplo 2.9
4 2
A=
2 2
0,8507 0,5257
1 = 5, 2361 e1 = 2 = 0, 7639 e 2 =
0,5257 0,8507
A 2 = P 2 P t =
1 1
nesse captulo.
Ferreira, D.F. Estatstica multivariada 81
print Sg Sginv;
II=Sginv`*G*Sginv; /* mostrar que igual a identidade */
print ii;
H=Sginv`*D*Sginv; /* operar D, e em seguida extrair auto valores e vetores */
print H; /* D transformada */
zh=eigvec(H); /* zh matriz de autovetores */
auh=eigval(H); /* auh vetor de autovalores */
xh=Sginv*zh; /* matriz de autovetores recuperados */
teste=xh`*g*xh;
print teste;/*mostrar que resulta na identidade*/
print xh;
print auh;
/* obtencao de matriz raiz quadrada - exemplificar com a matriz D */
aud=eigval(D); /* autovalores de D*/
lamb=diag(aud); /* diagonalizando aud e resultado em lamb */
print lamb;
lambS=root(lamb); /* achando a raiz quadrada de lamb */
avd=eigvec(D); /* autovetores de D em avd */
Droot=avd*lambS*avd`;
/* usando a definio para encontrar a matriz raiz quadrada de D */
print Droot;
DD=avd*lamb*avd`; /* checando propriedades */
print DD; /* deve ser igual a D */
quit;
2.4. Exerccios
entre x e y .
1 1 0 0
1 1 0 0
X = 1 0 1 0
1 0 1 0
1 0 0 1
realizada em (a).
4 2 2 6 4 2
A = 2 2 0 B = 4 4 0
2 0 4 2 0 6
0,8507 0,5257
P=
0,5257 0,8507
2.5. Seja
8 1
A=
1 2
(b) Com base em (a) a matriz A pode ser considerada positiva definida? Porque?
(g) Encontre os autovalores e autovetores de A-1. Verifique que relao tem como
4 4, 001 4 4, 001
A= B=
4, 001 4, 002 4, 001 4, 002001
elemento, a22 e b22 devida a arredondamentos. Mostre que A-1 = -3B-1 (pequenas
diferenas na inversa).
Q = 2x12 2x1 x 2 + 4x 22
positiva definida.
4 1 2 1
A= B=
1 2 1 1
x t Ax
= t B 0
x Bx
A B = 0 .
25 2
S=
2 4
S11 0 0
0 S22 0
D 2 =
1
0 0 Spp
( ) S (D )
1 1
Sendo R = D
1 1
2 2
S= D( ) R (D )
1
2
1
2
2. lgebra vetorial e matricial 88
||[ 3
Amostragem multivariada
]||
3.1. Introduo
outras, e (ii) que a distribuio conjunta das p variveis permanece a mesma para
todos os itens. Essa estrutura de amostra aleatria que justifica uma escolha
dados. Finalmente, quando os dados podem ser tratados como uma amostra
Exemplo 3.1
2 1
X = 3 0
2 2
2 + ( 3) + ( 2 ) 3 1
X = =
(1 + 0 + 2 ) 3 1
3 2
x3
2
_
x x1
1
x2
0 1
-4 -3 -2 -1 0 1 2 3 4
-1
-2
-3
Figura 3.1. Diagrama com n=3 pontos no espao bidimensional (p=2) mostrando o
centro de massa, X .
como coordenadas.
Ferreira, D.F. Estatstica multivariada 93
= y1 y2 " yk " y p
Exemplo 3.2
2 1
X = 3 0
3 2
y1t = [ 2 3 2] e y 2t = [1 0 2]
3. Amostragem multivariada 94
Y2
Y1
tridimensional.
dimenses maiores.
Ferreira, D.F. Estatstica multivariada 95
projeo em 1 ( )
n 1 :
1 1
X jk
t
y
k 1 1=
n n
j=1
n
1
( )
1 = y kt 1 1 = X k 1
n
Xt Y
Proj ( X em Y ) = Y
Y
Dessa forma X k = ( )
1 t
y k 1 corresponde a um mltiplo de 1, obtido a
n
y k e k = y k X k 1
1 X k 1
x1k X k
x 2k X k
ek = yk X k 1 =
#
x nk X k
x3
1
_
_ x 11
x 21 e1
e2 Y1
Y2
x1
x2
de desvio e k = y k X k 1 .
Exemplo 3.3
2 1
X = 3 0 y1t = [ 2 3 2] y 2t = [1 0 2]
3 2
2 + (3) + (2) 1+ 0 + 2
X1 = = 1 X2 = =1
3 3
1 1 1 1
X11 = 1 1 = 1 X 2 1 = 1 1 = 1
1 1 1 1
2 1 3
e1 = y1 X11 = 3 1 = 2
2 1 1
1 1 0
e 2 = y 2 X 2 1 = 0 1 = 1
1 1 1
3
( X 1 ) ( )
y1 X11 = [ 1 1 1] 2 = 3 + 2 + 1 = 0
t
1
1
A decomposio :
Ferreira, D.F. Estatstica multivariada 99
2 1 3 1 1 0
y1 = 3 = 1 + 2 ; e y 2 = 0 = 1 + 1 .
2 1 1 2 1 1
X3
e2
e1
X1
X2
n
| e k |2= e k . e k = ( x jk X k ) 2 (3.1)
j =1
n
ekt eA = ( x jk X k )( x jA X A ) (3.2)
j =1
vetores e k e e A , tem-se:
e kt eA
Cos ( kA ) = (3.3)
e kt e k eAt eA
SkA
rkA = Cos ( kA ) = (3.4)
Skk SAA
conjunto de dados X.
f( x 1) . f( x 2) . ..., . f( x n), sendo f( x j)=f(xj1, xj2, ..., xjp), ento, X1 , X 2 , ..., X n uma
amostra aleatria.
Cov( X ) = 1
n (Matriz de covarincia populacional dividida pelo tamanho da
amostra).
PROVA:
X =( X 1+ X 2+...+ X n)/n
Ferreira, D.F. Estatstica multivariada 103
E(X) = E ( n1 X1 + n1 X 2 + " + n1 X n )
= E ( n1 X1 ) + E ( n1 X 2 ) + " + E ( n1 X n )
1 1
= nE ( X j ) = n
n n
E(X) =
t
1 n 1 n
( ) ( ) ( X
n n
1
)( )
t
( X - ) ( X - ) = Xj
t
XA = 2 j XA
n j=1 n A =1 n j=1 A =1
Ento,
( )( ) E ( X )( )
n n
1
Cov ( X ) = E X X = 2
t t
j XA
n j=1 A =1
( )( )
t
Sendo j A e considerando que E X j X A igual a zero,
E ( X
n
1
Cov ( X ) = 2 )( )
t
j Xj
n j=1
3. Amostragem multivariada 104
( )( )
t
Desde que = E X j X j a covarincia populacional comum
E ( X )( )
n
1 1
Cov ( X ) = 2
t
j X j = 2 ( + + " + ) =
n j=1 n
1 1
= 2
(n) =
n n
S 11 S 12 " S 1p
S S 22 " S 2p
S=
21
# # % #
S Sp2 " S pp
p1
expressar a variao por um nico valor numrico. Uma escolha deste valor o
generalizada.
Exemplo 3.4
2,905 9,096
S=
9,096 90,817
e1
h= Le1Sen()
Le2 e2
Mas,
n
L e1 = (X
j=1
j1 X1 ) 2 = (n 1)S11
n
L e2 = (X
j=1
j2 X 2 ) 2 = (n 1)S22
Cos()=r12
Portanto,
Ferreira, D.F. Estatstica multivariada 107
|S|=(rea)2/(n-1)2
induo:
quadrado do volume gerado pelos p vetores desvios. Na Figura 3.5 (a) e (b)
respectivamente.
3. Amostragem multivariada 108
(a) (b)
e3 e2
e2 e1 e3 e1
Figura 3.5. (a) grande varincia amostral generalizada, e (b) pequena varincia
movidos at possurem ngulos retos. Por outro lado se um ou mais dos vetores
10 8 10 8 6 0
S= S= S=
8 10 8 10 0 6
8 8 0
r12 = = 0,8 r12 = = 0,8 r12 = = 0, 0
10 10 10 10 6 6
| S |= 36 | S |= 36 | S |= 36
como |S| pode oferecer como resumo de S. Pode-se mostrar que |S| pode ser
( X X ) 'S ( X X ) = c
1 2
(3.10)
3. Amostragem multivariada 110
dados. Portanto, mais til apresentar seus valores individuais do que seu
produto. Este tpico ser abordado com mais detalhe quando se discutir sobre os
componentes principais.
residuais pertencerem a um (hiper) plano formado por uma combinao linear dos
dependentes.
Exemplo 3.5
3 3 6
X = 1 3 4
2 0 2
O vetor mdia :
X t = [ 2 2 4]
Os vetores dos desvios so:
Ferreira, D.F. Estatstica multivariada 111
1 1 2
X 1 X t = [ e1 e2 e3 ] = 1 1 0
0 2 2
obteno de |S|.
1 0 1
S = 0 3 3
1 3 4
3 3 0 1 0 1
| S| = 1 ( 1) 2 + 0 ( 1) 3 + 1 ( 1) 4 =
3 4 3 4 3 3
= 131
. . + 0 + 1.( 3).1 = 3 3 = 0
3. Amostragem multivariada 112
e1
e2
e3
1 2
igual a matriz de correlao das variveis originais. Dessa forma pode-se definir:
mesma direo. Em (3.4) foi visto que o co-seno do ngulo ik entre os vetores
forma, o |R| ser grande quando todos os rik forem prximos de zero e ser
verificar que:
|R|=(n-1)-p(volume)2 (3.12)
(a) (b)
e3
e3
e2 e1 e2 e1
Figura 3.7. Volume gerado por trs variveis padronizadas: (a) grande varincia e
Exemplo 3.6
ilustrada atravs deste exemplo a relao (3.13) entre |S| e |R| para p=3
|S|=37,3878
|R|=0,6137
Exemplo 3.7
Tr(S)= S11+S22+S33=4,935+0,686+17,993=23,614
comprimentos ao quadrado dos vetores residuais ei (i=1, 2, ...,p) dividido por n-1.
Ela no considera as orientaes dos vetores residuais, sendo portanto limitada
Ferreira, D.F. Estatstica multivariada 117
para ser utilizada com variveis padronizadas, pois seu valor ser sempre o
mesmo para distintos conjuntos de dados desde que o nmero de variveis destes
seja igual.
3.7. Exerccios
1 1
1 1
X =
1 1
1 1
residuais.
3. Amostragem multivariada 118
total.
3.7.6. Qual a rea do trapezide gerado pelos p=2 vetores desvios, do exerccio
3.7.1.
4
Distribuio normal multivariada
4.1. Introduo
distribuio populacional.
tratamento matemtico, possui duas razes prticas que justificam a sua utilidade.
sistemtica dos dados deve-se presumidamente aos efeitos fixos dos modelos e o
melhor.
Ferreira, D.F. Estatstica multivariada 121
1 ( x )
2
1
f (x) = e 2 2
x ]; + [ (4.1)
22
Figura 4.1. As probabilidades so reas sob a curva entre dois valores da varivel
X, limitada pela abscissa. bem conhecido o fato de que as reas entre 1 desvio
0,683
0,954
2 + +2
(x )
2
= ( x ) ( 2 )
1
( x ) (4.2)
2
( X ) ( ) ( X )
t 1
(4.3)
seja igual a unidade para qualquer p. Pode-se demonstrar (Anderson, 1984) que
esta constante ( 2 )
p2 12
, sendo a densidade dada por:
1
1
( ) ( )
t
f (X) = p 1
exp X
2 1 X (4.4)
( 2 ) 2 2
evidente;
X1
X
i) Fazendo a t X = [1 0 " 0] = X1 a propriedade 2 se torna evidente. Assim,
2
#
X p
q 1 1 q 11q 12( pq )
= = =
q
p 1 e
(p q) 1 2 ( pq ) 21q ( p q )
22 ( p q )
Ferreira, D.F. Estatstica multivariada 125
Logo,
(
X1 ~ N q 1 ; 11
)
Prova: Basta fazer qAp=[qIq | q0(p-q)] e aplicar (ii).
q X1 X1
Dada a partio p X1 = = , logo a distribuio condicional de
(p q) X1 X 2
(
)
c = 1 + 12 221 x 2 2 e c = 11 12 221 21
12
Var(X1)=11, Var(X2)=22 e 12 = = Corr( X1 , X 2 ) . A matriz de covarincia
11 22
4. Distribuio normal multivariada 126
12
= 11
21 22
Cuja inversa ,
1 22 12
1 =
11 22 21
2
12 11
Fazendo 12 = 12 11 22 , obtm-se
1 22 12 11 22 X1 1
[X1 1 X2 2] =
11 22 (1 12 ) X 2 2
2
12 11 22 11
(4.5)
1 2 2 X1 1 X 2 2
= X1 1 + X 2 2
212
1 12
2
11 22
11 22
1
f(x1 ,x2 ) =
2 1122 (1 122 )
(4.6)
2 2
X1 1 X2 2
1 X1 1 X2 2
exp + 212
2(1 12 ) 11
2
22 11 22
pode ser escrita como produto das densidades normais univariadas, ambas com a
normais, fica claro que alguns valores padres de X fornecem alturas constantes
para as densidades elipsides. Isto significa que a densidade normal constante
( ) ( ) ( X )
t 1
em superfcies cujas distncias quadrticas X so constantes.
( ) ( ) ( X ) =c
t 1 2
Contornos={todo X tal que X } (4.7)
( X ) ( ) ( X ) =c
t 1 2
elipside centrada em e tem eixos na direo de
c i
ei (i=1, 2, ..., p).
Considerando como ilustrao a densidade normal bivariada com
11 i 12
= ( 11 i ) 122 = 0
2
12 11 i
= ( i 11 12 )( i 11 + 12 ) = 0
4. Distribuio normal multivariada 130
1 = 11 + 12 e 2 = 11 12
e i = i e i
11 12 e1 e1
e = (11 + 12 ) e
12 11 2 2
ou,
11 e1 + 12 e2 = (11 + 12 ) e1
12 e1 + 11 e2 = (11 + 12 ) e2
1
2
e1 =
1
2
Ferreira, D.F. Estatstica multivariada 131
1
2
e1 =
1
2
c v 11 + 12
cv - 12
2
11
( X ) ( ) ( X )
t 1 2
p () (4.8)
densidade normal bivariada das Figuras 4.2 e 4.3, esto representados nas
99%
2
95%
0
1
0 X1
95%
99%
x 11 x 12
" x
1p
x x " x
2p
X = 21 22
n p
# # % #
" x np
x n1 x n2
2
n
3. X e S so independentes.
Seja S uma matriz positiva definida, com n>p, ento se pode definir,
( )
n X possui distribuio aproximadamente normal Np( 0 , ) para grandes
amostras. Aqui n deve ser tambm bem maior do que p (nmero de variveis).
( )
n X possui distribuio aproximadamente normal Np( 0 , )
e
( ) ( )
t
n X 1 X se distribui aproximadamente como p2 para n - p grande.
Ferreira, D.F. Estatstica multivariada 137
X
z= (4.10)
n
citado por Bock (1975), com erro mximo de 10-6, dada por
G se z 0
( z ) (4.11)
1 G se z > 0
em que,
da distribuio normal de - a z;
G = ( a1 + a2 2 + a3 3 + a4 4 + a5 5 ) ( z );
4. Distribuio normal multivariada 138
1
= ;
1 + 0,2316418| z|
z2
(z) = (2 ) 2 e
1 2
;
a1=0,319381530
a2=-0,356563782
a3=1,781477937
a4=-1,821255978
a5=1,330274429
das pequenas amostras ou teoria exata, a qual vlida para qualquer tamanho
amostral.
limite central que demonstra que muitas estatsticas tm distribuio normal como
limite. Para tais estatsticas necessrio somente obter a mdia e a varincia para
para pequenas amostras, mesmo se a forma limite for normal. Se este for o caso,
algum indicativo de qual tamanho amostral necessrio para uma dada acurcia
(21)
lim F(1 , 2 ) =
2 1
4. Distribuio normal multivariada 140
concluir que ao nvel de 0,05, com erro de duas unidades na segunda casa
decimal, quando 2 for maior que 40, haver boa concordncia. Semelhantemente,
A estatstica
distribuda como uma varivel qui-quadrado com graus de liberdade. Foi obtida
1
P(2 / ) = t ( 2 )1e 2 dt
t
(4.13)
2 ( 2) 0
2
Ferreira, D.F. Estatstica multivariada 141
e n
P( / ) =
2
(4.14)
n=0 ( + n +1)
1 1
quando < max( ,13) , e caso contrrio pela expanso assinttica:
2 2
1 (1)(2)
P( / ) 1e 1+ +
2
+... (4.15)
2
1 1 139 571
(a) =(a1)!eaaa1/2(2)1/2 1+ + 2 (4.16)
12a 288a 51840a 2488320a
3 4
e que sua varincia 2. Para >30, as probabilidades podem ser obtidas usando
unitrio.
4. Distribuio normal multivariada 142
respectivamente. Ento,
12 1
F= 2
2 2
( a )( b )
em que, B( a, b ) =
( a + b )
Ento,
2 1
P( F, 1 , 2 ) = 1 I x ( , )
2 2
2
em que, x =
2 + 1 F
Ferreira, D.F. Estatstica multivariada 143
abordadas nos captulos subsequentes. Por outro lado, nas situaes em que a
( ) ( )
t
distncias envolvendo X da forma n X S1 X , a pressuposio de
multivariada.
e ser livre do tipo de desvios da normalidade que esteja sendo testado (curtose,
teste de 2 .
Ferreira, D.F. Estatstica multivariada 145
este propsito.
a) Distribuio de propores
[ i ]
2 ii ; i + 2 ii (Figura 4.1). Consequentemente, para grandes amostras de
[
que a proporo P i2 de observaes em X i 2 s ii ; X i + 2 s ii seja de cerca de]
0,954. Usando a aproximao normal da distribuio de P i , ento se
b) Processos grficos
i) Q-Q plot
ser aceita.
x(2), ..., x(n) essas observaes ordenadas crescentemente, ou seja, x(1) a menor
descontinuidade.
q( j )
j 12
2
= 1
2
e z /2
dz (4.18)
n
Os percentis q(j) podem ser obtidos, como se percebe por (4.18), pela
(Tabela A.1).
pela inspeo deste tipo de grfico, cujos pontos, quando da normalidade devem
Exemplo 4.1
Seja uma amostra (n=10) obtida de uma populao normal N(3; 4) apresentada a
gerado.
{3,74; 2,91; 4,79; 8,65; 2,06; 4,59; 4,02; 0,46; 1,79; 3,30}
passos:
4. Distribuio normal multivariada 148
1) ordenar a amostra: x(1), x(2), ..., x(n) e obter os seus valores correspondentes de
q(1)
j 12 1 12
2
Ex. Para a observao 1 tem-se: = = 0, 05 = 1
2
e z /2
dz
n 10
3) plotar (q(1), x(1)), (q(2), x(2)), ..., (q(n), x(n)) e examinar os resultados
Ferreira, D.F. Estatstica multivariada 149
10
Q-Q Plot
Outlier
8
6
X(j)
0
-2 -1 0 1 2
Q(j)
Figura 4.7. Q-Q plot para os dados do exemplo 4.1, destacando a presena de um
outlier.
complementar a este processo grfico, o qual mede o ajuste dos pontos do Q-Q
(x ) (q )
n
( j) x ( j) q
j=1
rQ = (4.19)
2 2
(x ) (q )
n n
( j) x ( j) q
j=1 j=1
Tabela 4.1. Valores crticos para o teste para normalidade baseado no coeficiente
18, 77109
rQ = = 0,9523
44,15849 8, 798094
hiptese de normalidade.
4. Distribuio normal multivariada 152
1) ordenar a amostra: x(1), x(2), ..., x(n) e obter os seus valores correspondentes de
2
n
n
Xj
X2j
j=1
j=1 n
Sn = (4.20)
n
Xj X
Zj =
Sn
Pj=(Zj)
Ferreira, D.F. Estatstica multivariada 153
Exemplo 4.2
Com os dados do exemplo 4.1, o algoritmo apresentado no item (ii) foi executado,
j x(j) pj = (j-)/n Pj
ordenada).
1.0
0.8
0.6
pj
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Pj
definida pela reta Pj=pj. Uma vez que o grfico apresenta efeitos cumulativos, os
no lado superior.
platicrtica.
Ferreira, D.F. Estatstica multivariada 155
partir dos dados amostrais, fazendo 1/n como densidade para cada ponto
~ =1
m
n
x rj (4.21)
r
n j=1
por:
Mdia: 1 = 0 (4.22)
Varincia: ~ ~ m
2 = m ~2 (4.23)
2 1
Assimetria ~ ~ 3m
3 = m ~ m ~ + 2m
~3 (4.24)
3 1 2 1
Curtose 4 = m
4 4 m 3 + 6m
1 m 2 3m
12 m 14 (4.25)
4. Distribuio normal multivariada 156
respectivamente:
~
3
b1 = (4.26)
~
2 ~
2
~
b 2 = ~ 42 (4.27)
2
Exemplo 4.3
x x2 x3 x4
Tm-se:
~ =36,31/10=3,631
m 1
~ =176,0001/10=17,6000
m 2
~ =1046,2520/10=104,6252
m 3
~ =7244,135/10=724,4135
m 4
~ = 3,631
1
b2 = 75,6182/(4,4158)2 = 3,8780
obtidos com boa aproximao usando como desvio da normal padro a estatstica:
(n + 1)(n + 3)
Z1 = b1 (4.28)
6(n 2)
seguinte estatstica:
pontuda com caldas mais altas do que a normal; valores menores que 3 indicam
distribuio normal.
normalidade.
4. Distribuio normal multivariada 160
( x ) ( x ) (1)
t
1 2
p
grfico conhecido como Q-Q plot. Dada uma amostra bivariada com n
Exemplo 4.4
A matriz inversa de S :
0,0037 0,0110
S 1 =
0,0110 0,1829
softwares estatsticos.
2
q(j)
Figura 4.9. Q-Q plot para os dados do exemplo 1.1, destacando a possibilidade de
iguais a 2.
{( )}
3
) (
t
1,p = E X 1 Y (4.30)
{( )}
2
) (
t
2,p = E X 1 X (4.31)
n n
1
1,p = 2
n
g
i =1 j=1
3
ij
1 n 1 n
2,p = g i2i = d i4
n i =1 n i =1
em que,
g i j = ( X i X ) Sn1 ( X X) e
t
j di = gi i
Ferreira, D.F. Estatstica multivariada 165
( )
negativos. Sob distribuio normal multivariada espera-se que a E( E 1,p ) seja
zero. O estimador 2,p muitas vezes usado para avaliar observaes que esto a
n 1,p
k1 =
6
k2 =
{ 2 ,p p(p + 2) }
1/ 2
8p(p + 2)
n
Exemplo 4.5
Usando o exemplo das raes testar a normalidade multivariada pelo teste dos
1. 1t = [ 20 1] 2. 2t = [ 20 3] 3. 3t = [ 10 3] 4. 4t = [10 1]
20
Para i=1 e j=1, g 1 1 = [ 20 1]Sn1 = 2,7805
1
20
Para i=1 e j=2, g1 2 = [ 20 1] Sn1 = 0, 6341
3
Ferreira, D.F. Estatstica multivariada 167
Logo,
1,2 =
( 2, 7805
3
+ 2(0, 6341)3 + " + 1, 02443 )
=1,2766
16
ento,
n 1, 2 4 1,2766
k1 = = = 0,8511
6 6
que 02,05; 4 = 9,488 , ento H0 no deve ser falseada, ou seja, no existe razes
1 n 2 1
n i =1 4
(
2,p = g i i = 2,7805 + 2,3902 + 1,8049 + 1,0244 =
2 2 2 2 17,7513
4
= 4,4378 )
4. Distribuio normal multivariada 168
tenha algum desvio de curtose, uma vez que k 2 < z 0, 025 = 1,96 .
observadas.
trivariada.
Proc IML;
n=100;p=3;
SIG={8 4 1,
4 10 3,
1 3 18};
st=Root(sig);
mu={1, 10, 8};
x=j(n,p,0);
zi=j(p,1,0);
do i=1 to n;
do ii=1 to p;
zi[ii]=rannor(0);
end;
xi=st`*zi+mu;
do ii=1 to p;
x[I,ii]=xi[ii];
end;
end;
print x;
create dtnorm from x;
append from x;
quit;
proc print data=dtnorm;
run;quit;
4. Distribuio normal multivariada 170
4.8. Exerccios
4.8.1. Com os dados do exemplo 4.4, tendo como hiptese que os mesmos
estatstica abaixo.
4.8.2. Utilizando os dados deste exemplo (1.1), realize todos os testes univariados,
0,8 1,0 0,6 0,6 0,2 0,8 2,5 1,5 0,3 1,7 1,9 2,5 1,1 5,0 0,9 1,7 2,6 4,5
mensagens centrais da anlise multivariada, que dever ser abordada neste e nos
simultaneamente.
Do ponto de vista dos testes de hipteses este problema pode ser abordado
atravs do teste:
H0 : = 0 vs H1 : 0
caso univariado, e se X1, X2, ..., Xn representam uma amostra aleatria extrada de
uma populao normal, o teste estatstico apropriado para esta hiptese, quando p
igual a 1, :
t=
( X ) , em que, X = 1 X
0 n
e S2 =
1 n
(Xj X)2 .
S n j=1 j
n 1 j=1
n
(GL).
significncia , se
Ferreira, D.F. Estatstica multivariada 173
X 0
< tn1( / 2) (no rejeitar H0) equivalente a:
S
n
S S
X t n 1 ( / 2 ) 0 X + t n 1 ( / 2 ) (5.2)
n n
contero .
( ) ( )
t
T 2 = n X 0 S1 X 0 (5.3)
em que,
01
1 n 1 n 02
X = Xj , S = ( X j X )( X j X ) e 0 =
t
n j=1 n 1 j=1 #
0p
primeira vez obteve a sua distribuio. Felizmente, tabelas especiais dos pontos
(n 1)p
T2 ser distribuda como Fp,n p (5.4)
np
Ferreira, D.F. Estatstica multivariada 175
em que, Fp,n-p representa uma varivel com distribuio F com p e n-p GL.
p
T 2 = Fp,+1 p (5.5)
+1 p
(n 1)p
( ) ( )
t
T 2 = n X 0 S1 X 0 > Fp,n p () (5.6)
np
Exemplo 5.1
11 2
X = 10 4
9 3
Teste a hiptese de que 0t =[9 2] seja um valor plausvel para representar a mdia
populacional.
10 1,0 0,5
X= e S=
3 0,5 1,0
Ento,
1 4 2
S1 =
3 2 4
1 4 2 10 9
T 2 = 3 [10 9 3 2] = 12
3 2 4 3 2
(n 1)p 4
F2,1 = 199,5 = 798,0 .
np 1
(n 1)p
( ) ( )
t
P n X S1 X Fp,n p () (5.8)
np
significncia .
p(n 1)
( ) ( )
t
n X S1 X c2 = Fp,np ()
n p
so determinados por
Ferreira, D.F. Estatstica multivariada 179
i c
= i [p(n 1)Fp,n p ()]/[n(n p)] unidades ao longo de ei .
n
Exemplo 5.2
A partir dos dados do exemplo 5.1, obter a regio de confiana de 95%, e verificar
10 1,0 0,5 1 1 4 2
X = , S= e S =
3 0,5 1,0 3 2 4
1 4 2 10 1 2 (2)
3 [10 1 , 3 2 ] 199,5
3 2 4 3 2 1
o que permite que se conclua que o ponto testado est na regio de confiana. O
grfico da elipse obtida pode ser visualizado na Figura 5.1. com a anlise grfica,
x2
x1
Exemplo 5.3
p(n 1)
n(X ) t S1 (X ) c 2 = Fp,n p ()
np
por 109,23. O valor encontrado de 563,4964 superior a 12,215, o que indica que
x3
x1
x2
simultaneamente com uma alta probabilidade especfica. Isto garante com alta
Ferreira, D.F. Estatstica multivariada 185
A t X = A1 X1 + A 2 X 2 + " + A p X p
A t SA
n
A t SA
A X t n 1 ( / 2)
t
(5.9)
n
p(n 1)
At X Fp,n p ( )A t SA (5.10)
n(n p)
mais curtos (mais precisos) do que o intervalo simultneo de T2. Esta alternativa
Sii
Xi tn1(2m
) i =1,2,...,p = m (5.11)
n
Ferreira, D.F. Estatstica multivariada 187
Exemplo 5.4
10 1,0 0,5
X= e S=
3 0,5 1,0
1. Intervalo T2
p(n 1) S
IC1 (0,95) = X1 Fp,n p () 11
np n
2(3 1) 1
IC1 (0,95) = 10 199,5
32 3
2(3 1) 1
IC2 (0,95) = 3 199,5
3 2 3
respectivos eixos.
2. Intervalo de Bonferroni
1
IC1 (0,95) = 10 6, 21
3
1
IC2 (0,95) = 3 6, 21
3
3. Intervalo t de Student
GL 4,30. Ento,
1
IC1 (0,95) = 10 4,30
3
1
IC2 (0,95) = 3 4,30
3
(1-)p=0,952=0,9025.
5. Inferncias sobre o vetor mdia 190
esto na forma de atributos. Cada indivduo nesta populao pode ser descrito em
termos dos atributos que possui, os quais so codificados, pela sua presena e
possui os atributos 1, 2, ..., q p1, p2, ..., pq. Considerando q atributos mutuamente
p1 p1 (1 p1 ) p1 p 2 " p1 p q
p p p p 2 (1 p 2 ) " p 2 p q 1
1
E(p) =
2
=
e Cov(p)
2 1
= .
# n # # % # n
p q p q p1 pq p 2 " p q (1 p q )
()
estimador de Cov p , (1/n) , for utilizado.
Uma vez que cada elemento da populao est associado a apenas
posto de igual a q-1, portanto sua inversa no existe. Apesar disso, pode-se
qualquer combinao A t p .
Ferreira, D.F. Estatstica multivariada 191
A t A
A t p q2 1 () (5.12)
n
garantindo que n-1-q seja grande. Segundo Johnson e Wichern (1988), o valor
grande de n-q-1, significa que np k deve estar em torno de 20 para cada categoria
k=1, 2, ..., q.
Exemplo 5.5
resultados:
0,1225
p1 : 0,1429 7,815 = 0,1429 0,1654 = [0,0225; 0,3083]
35
0, 2155
p 2 : 0,3143 7,815 = [0,0949; 0,5337]
35
0, 2449
p3 : 0, 4286 7,815 = [0,1948; 0,6624]
35
0,1012
p 4 : 0,1142 7,815 = [0,0361; 0, 2645]
35
ou amostrais.
D
t= (5.14)
SD
n
n
2
1
Dj
1 n 1 n
( )
n
D 2j
2
Dj e Dj D
2 j=1
D=
n j=1 SD = n 1 j=1
=
n 1 n (5.15)
j=1
para a hiptese:
apresentado a seguir.
SD
D t n 1 ( / 2) (5.16)
n
varivel tomada na j-sima unidade, sendo que j=1, 2, ..., n; k=1, 2, ..., p.
p(n 1)
T 2 = n ( D 0 ) Sd1 ( D 0 ) >
t
Fp,n p () (5.17)
(n p)
em que,
1 n 1 n
D = Dj ( D j D )( D j D )
t
e SD =
n j=1 n 1 j=1
5. Inferncias sobre o vetor mdia 196
p(n 1)
T 2 = n(D ) t SD1 (D ) Fp,n p ( ) (5.18)
(n p)
p(n 1) SD(ii)
ICi (1 ) : Di Fp,n p () (5.19)
(n p) n
SD(ii)
ICi (1 ) : Di t n 1 (5.20)
2p n
Ferreira, D.F. Estatstica multivariada 197
Exemplo 5.6
mensuradas a produo leiteira diria mdia por animal (X1) e a renda total diria
Antes Aps
X1j1 X1j2 X2j2 X2j2
10 80 13 90
11 80 15 92
9 60 16 88
8 60 19 90
0
H0 : = 0 =
0
Dj1 Dj2
3 10
4 12
7 28
11 30
0,5195 0,1647 6, 25
T 2 = 4 [ 6, 25 20] = 14, 6515
0,1647 0, 0614 20, 00
O valor crtico :
p(n 1) 2 (4 1)
Fp,n p (5%) = F2,4 2 (5%) = 3 19 = 57
(n p) (4 2)
nominal de 5% de significncia.
2(4 1) 12,9167
IC1 (0,95) : D1 F2,4 2 (0, 05) = 6, 25 13,57 = [ 7,32;19,82]
(4 2) 4
2(4 1) 109,3333
IC2 (0,95) : D 2 F2,4 2 (0, 05) = 20 39, 47 = [ 19, 47; 59, 47 ]
(4 2) 4
Ferreira, D.F. Estatstica multivariada 199
comparaes pareadas.
organizadas como:
(Populao 2) 1 n2 1 n2 t
X 21 , X 22 , ..., X 2n 2 X
2 = X2 j
n 2 j=1
S2 = (
n 2 1 j=1
X 2 j X 2 )( X 2 j X 2 )
Subscritos 1 e 2, denotam a populao.
5. Inferncias sobre o vetor mdia 200
Ainda necessrio assumir que ambas as populaes sejam normais que a matriz
(
)
E X1 X 2 = 1 2
(5.22)
1 1
(
)
Cov X1 X 2 = + (5.23)
n1 n 2
1 1
+ Sp
n1 n2
um estimador de Cov X1 X 2 .
( )
Demonstra-se que o teste da razo de verossimilhana para a
hiptese,
H 0 : 1 2 = 0
1
1 1 (n1 + n 2 2)p
T = [X1 X 2 0 ] + Sp [X1 X 2 0 ] >
2 t
Fp,n + n p 1 ( )
n1 n 2 (n1 + n 2 p 1) 1 2
5. Inferncias sobre o vetor mdia 202
Exemplo 5.7
diferena 1 2 .
A B
Produtividade Altura da planta Produtividade Altura da planta
5,7 2,10 4,4 1,80
8,9 1,90 7,5 1,75
6,2 1,98 5,4 1,78
5,8 1,92 4,6 1,89
6,8 2,00 5,9 1,90
6,2 2,01
1, 4962 0,0448
Sp =
0,0448 0,0048
Ferreira, D.F. Estatstica multivariada 203
1
1 1 (n1 + n 2 2)p
T = [X1 X 2 0 ] + Sp [X1 X 2 0 ]
2 t
Fp,n + n p 1 ( )
n1 n 2 (n1 + n 2 p 1) 1 2
21
em que, 0 = 1 = 11
2 12 22
apresentados a seguir:
5. Inferncias sobre o vetor mdia 204
12 22
11 21
Figura 5.3. Elipse de 95% de confiana para diferena do vetor mdia de ambas
as variedades de milho.
mdia.
Ferreira, D.F. Estatstica multivariada 205
(n1 + n 2 2)p 1 1
A t ( X1 X 2 ) Fp,n1 + n 2 p 1 () + A tSp A (5.24)
n1 + n 2 p 1 n1 n 2
1 1
1i 2i : (X1i X 2i ) t n1 + n 2 2 + Sii (5.25)
2p n1 n 2
de Bartlett pode ser usado para testar H0: 1 2 . No entanto, este teste
1
1 1
[X1 X 2 0 ] S1 + S2 [X1 X 2 0 ] p2 ()
t
(5.26)
n1 n2
1 1
A t ( X1 X 2 ) p2 ( ) A t S1 + S2 A (5.27)
n1 n2
estudadas por Christensen e Rencher (1997) por meio de simulao Monte Carlo,
a) Aproximao de Bennett
a qual assume que n2n1, o que no limitante. Para contornar o problema, caso
essa condio no seja atendida, basta trocar os nomes das amostras, isto , a
n1 n2
n 1 1
Z j = X1j 1 X 2 j +
n2 n 1n 2
X2 j
j=1 n2
X
k =1
2k (5.28)
b) Aproximao de James
1
2 1 1
T = [X1 X 2 ] S1 + S2 [X1 X 2 ] ~ p2
t
(5.30)
n1 n2
2p ( ) ( A + B 2p ( ) ) (5.31)
1 2 1 1 Si
2
A = 1+ tr Se (5.32)
2p i =1 n i 1 ni
1 1 Si 1 Si
2 2
2
1
B= tr 2 Se
2p(p + 2) i =1 n i 1
+ tr Se
ni
ni
(5.33)
em que:
S1 S2
Se = + (5.34)
n1 n 2
Ferreira, D.F. Estatstica multivariada 209
c) Aproximao de Yao
por (5.35).
1 1 2 1 t 1 S
2
( X1 X 2 ) Se Se ( X1 X 2 )
1
=
i
(5.35)
( T 2 ) 2 i =1 n i 1 ni
d) Aproximao de Johansen
dividida por uma constante C para que a estatstica resultante tenha distribuio
T 2
Fc = (5.36)
C
2D + 6D
C = p (5.37)
p(p 1) + 2
5. Inferncias sobre o vetor mdia 210
{ }
2
1 tr ( I V 1V )2 + tr ( I V 1V ) 2
D= (5.38)
i =1 2(n i 1)
i
i
p(p + 2)
= (5.39)
3D
liberdade , em que:
tr ( Se ) + tr ( Se )
2 2
= (5.40)
1 S1 S1 1 S2 S2
2 2 2 2
tr + tr + tr + tr
n1 1 n1 n 1 n 2 1 n 2 n 2
que significa que o trao da matriz A deve ser calculado e o seu quadrado a
resposta almejada.
Ferreira, D.F. Estatstica multivariada 211
f) Aproximao de Kim
S
qt 1 q
n
d= 1
S
qt 2 q
n2
S1 S2
dk qk = 0 (5.41)
n1 n2
w = Q t ( X1 X 2 ) (5.42)
5. Inferncias sobre o vetor mdia 212
1
p 2p
r = dk (5.43)
k =1
dk + 1
Ak = (5.44)
( )
2
dk + r
A 2
k
c= k =1
p
(5.45)
Ak =1
k
2
p
Ak
f = p
k =1
(5.46)
A2k k =1
G = w t ( D1/ 2 + rI ) (D + rI ) w
1 1/ 2 1
(5.47)
( p + 1)G
Fc = (5.48)
cf
Ferreira, D.F. Estatstica multivariada 213
2 2
1 1 w t D(D + I) 2 w 1 w t (D + I) 2 w
= + (5.49)
n1 1 w t (D + I) 1 w n 2 1 w t (D + I) 1 w
covarincias de populaes Wishart foi apresentado por Bartlett (1947). Este autor
H o : 1 = 2 = " = k =
k 1 1 2p 2 + 3p 1
= 1
2
j=1 n j 1 n k 6(p + 1)(k 1)
c
(5.50)
k
( n j 1) ln S j (n k) ln Sp
j=1
5. Inferncias sobre o vetor mdia 214
k
em nj observaes multivariadas de dimenso p; n = n j ; j=1, 2, ..., k, e
j=1
(n
j=1
j 1) S j
Sp =
nk
testada :
H o : 1 = 2 =
hiptese so:
Logo,
1 1 1 2 22 + 3 2 1
c2 = 1 +
10 14 24 6 3 1
= 11, 43
Como o valor calculado (11,43) superior aos valores crticos, rejeita-se H0 com
no sejam iguais.
5.7. Exerccio
11 2
10 4
X =
9 3
10 6
a) T2 de Hotelling
b) Procedimento de Bonferroni
5.7.3. Com os dados do exemplo 5.3, utilizando as duas primeiras variveis, teste
de 90% de confiana.
no nvel de 5% de probabilidade.
Antes Aps
Peso Teor de protena Peso Teor de protena
(%) (%)
250 10 280 12
300 12 320 16
350 13 360 13
320 15 380 18
400 9 410 15
320 11 350 12
5. Inferncias sobre o vetor mdia 218
concluses de interesse.
A B
Produtividade Altura da planta Produtividade Altura da planta
5,7 2,10 4,4 1,80
8,9 1,90 7,5 1,75
6,2 1,98 5,4 1,78
5,8 1,92 4,6 1,89
6,8 2,00 5,9 1,90
6,2 2,01
||[ 6
Anlise de varincia multivariada
]||
6.1. Introduo
(Student, 1908).
Tratamento 2: X 21 , X 22 , ..., X 2n 2
# # # % #
Tratamento g: X g1 , X g 2 , ..., X gn g
Ferreira, D.F. Estatstica multivariada 221
estrutura dos dados devem ser obedecidas para validade da inferncia estatstica:
Xi j = X.. + (X i. X.. ) + (X i j X i. )
Observao Estimativa da Estimativa do resduo (6.2)
mdia geral efeito do tratamento
total corrigido
g ni
( X )( )
t
ij X.. X i j X.. =
i =1 j=1
(6.3)
g g ni
= n i ( X i. X.. )( X i. X.. ) + X i j X i. ( )( X )
t t
ij X i.
i =1 i =1 j=1
g ni
( )( )
t
E = X i j X i. X i j X i. = (n1 1)S1 + (n 2 1)S2 + ... + (n g 1)Sg (6.4)
i =1 j=1
H 0 : 1 = 2 = " = g = 0 (6.5)
Ferreira, D.F. Estatstica multivariada 223
FV GL Matriz de SQP
Tratamento g-1 g
( )( )
t
B = n i X i. X.. X i. X..
i =1
Resduo g g ni
= ni g ( )( )
t
E = X i j X i. X i j X i.
i =1 j=1
i =1
Total corrigido g g ni
n ( )( )
t
i 1 B + E = X i j X.. X i j X..
i =1 j=1
i =1
efeitos dos tratamentos que se deseja testar a igualdade, para o exemplo H=B,
( H k E ) ek = 0
existem para o teste desta hiptese. Muitos autores recomendam utilizar o critrio
pelo menos trs dos quatro critrios forem significativos em um nvel nominal de
Tabela 6.2.
Ferreira, D.F. Estatstica multivariada 225
distribuio F.
Trao de Pillai
V 2n + s + 1 v1=s(2m+s+1)
V = tr[H(H + E)1] = k F=
s V 2m + s + 1
1+k
v2=s(2n+s+1)
Trao de
Hotelling U = tr(HE1) = k F=
2(sn +1)U v1=s(2m+s+1)
Lawley s (2m + s +1)
2
v2=2(sn+1)
Raz mxima
= 1 ( d + q) v1=d
de Roy F=
d
v2= d + q
p: nmero de variveis = posto(H+E); q: GL de tratamento (ou
do contraste); : GL do erro; S=min(p,q); r=- (p-q+1)/2;
f=(pq-2)/4; d=max(p,q); m=(|p-q|-1)/2; n=(-p-1)/2; e
p2q 2 4
Se p 2 + q 2 5 > 0
t = p2 + q 2 5
1 cc
Obs. Critrio de Wilks possui aproximao exata de F se
min(p,q)2
6. Anlise de varincia multivariada 226
Exemplo 6.1
Cultivar
A B C D
P NGV P NGV P NGV P NGV
1082 4,66 1163 5,52 1544 5,18 1644 5,45
1070 4,50 1100 5,30 1500 5,10 1600 5,18
1180 4,30 1200 5,42 1550 5,20 1680 5,18
1050 4,70 1190 5,62 1600 5,30 1700 5,40
1080 4,60 1170 5,70 1540 5,12 1704 5,50
5462 22,76 5823 27,56 7734 25,90 8328 26,71
E a mdia geral:
1367,35000
X.. =
5,1465
Ferreira, D.F. Estatstica multivariada 227
2
g
X i.k X2
SQBkk = g ..k (6.6)
ni
i =1
ni
i =1
g
X i.k X i.A X..A X..k
SPBkA = g (6.7)
ni
i =1
ni
i =1
k A =1, 2, ..., p.
6. Anlise de varincia multivariada 228
2
g ni
SQTkk = X ijk
2 Xg
..k
(6.8)
i =1 j=1
n
i =1
i
g ni
SPTkA = X ijk X ijA X X ..k
g
..A
(6.9)
i =1 j=1
n i =1
i
E=T-B (6.10)
1189302,1500 768,3605
B =
768,3605 2, 6318
FV GL SQ&P
1189302,1500 768, 3605
Tratamento 3 B=
768, 3605 2, 6318
( B k E ) ek = 0
do segundo autovetor (1,7667) fosse algum tipo de erro de digitao, por se tratar
vetores efeitos tratamento (P<0,01), como pode ser visto no quadro seguinte.
^ 1 1 E
Var(X h.k X i.k ) = + kk (6.12)
nh ni
1 1 E kk
X h.k X i.k t + (6.13)
pg(g 1) n h n i
6.4. Exerccio
vs B e iii) C vs D.
||[ 7
Componentes principais
]||
7.1. Introduo
s pode ser efetuada por p componentes principais. No entanto, uma grande parte
investigaes cientficas.
interao entre dois fatores e aplica como base para seus procedimentos a anlise
de componentes principais.
(7.1)
Yp = e pt X = e p1X1 + e p2 X 2 + ... + e pp X p
e t e
restritos ao comprimento unitrio. Seja a forma quadrtica dada por = , ento
et e
( i I ) ei = 0 (7.5)
p p
Var(Xi ) = Var(Yi )
i =1 i =1
11 + 22 + ... + pp = 1 + 2 + ... + p
verifica-se que:
tr() = tr ( PP t )
p p
tr() = ii = tr ( PP t ) = tr ( P t P ) = tr ( ) = i
i =1 i =1
k
%VarExp(Yk ) = p
100 (7.8)
i
i =1
sobre a importncia das variveis para o i-simo componente principal, por meio
eik i
Yi ,Xk = , i, k = 1, 2,..., p (7.9)
kk
expresso individualmente.
Cov ( Yi , X k )
Yi ,Xk =
Var ( Yi ) Var ( X k )
Ferreira, D.F. Estatstica multivariada 239
Mas,
com, t
= [ 0 ...1... 0] , vetor composto de valores 0 e com 1 na k-sima posio.
Logo,
Como ei = i ei , ento,
Cov ( Yi , X k ) = t ei = t i ei = i t ei = i eik
e,
Var(X k ) = kk
Exemplo 7.1
4 1 0
= 1 4 0
0 0 2
Var(Xi ) = Var(Yi )
i =1 i =1
11 + 22 + ... + pp = 1 + 2 + ... + p
Y2 = e 2t X = 0,7071X1 0,7071X 2
Y3 = e3t X = X 3
2 2 2 2 2 2
Var(Y1 ) = Var X1 + X 2 = Var X1 + Var X 2 + 2Cov X1 , X 2 =
2 2 2 2 2 2
1 1 2 2 1 1
= Var ( X1 ) + Var ( X 2 ) + 2 Cov ( X1 , X 2 ) = 4 + 4 + 1 = 5 = 1
2 2 2 2 2 2
11 + 22 + 33 = 1 + 2 + 3
4+4+2=5+3+2
10=10 c.q.m.
7. Componentes principais 242
originais so:
Componente X1 X2 X3
Y1 0,7906 0,7906 0,0000
Y2 0,6124 -0,6124 0,0000
Y3 0,0000 0,0000 1,0000
2
e11 1 5
Y1 ,X1 = = 2 = 0,7906 .
11 4
X1 e X2 so igualmente importantes.
X i i
Zi = (7.10)
ii
(
Z = V 1/ 2 X ) (7.11)
E ( Z ) = 0 e Cov ( Z ) = V 1/ 2 V 1/ 2 =
( )
Yi = eit Z = eit V 1/ 2 X , i=1, 2, ..., p (7.12)
p p
Var(Yi ) = Var(Zi ) = p
i =1 i =1
p
(7.13)
i = p
i =1
substituindo por .
11 0 0
0 0
=
22
(7.15)
0 0 pp
se que:
e i = i e i
= ei = ii ei
0 0
11 0 0
0 0 0
0
=
22
1 = ii 1
0 0
0 0 pp
0 0
ser ganho, uma vez que os eixos originais j esto no sentido de maior
autovalor e componente principal dado por (1, Zi), em que Zi a i-sima varivel
padronizada.
componentes principais.
2 2 2
2
2 2
= (7.16)
2
2 2
1
1
= (7.17)
1
estudadas.
1 = 2 [1 + (p 1)] (7.18)
1 1 1
e1t = , ,..., (7.19)
p p p
que 7.18 e 7.19 permanecem vlidos, sendo necessrio apenas fazer 2=1. A
i = 2 (1 ) ; i = 2, 3, ,p (7.20)
t 1 1
e 2 = , , 0,..., 0
1 2 1 2
t 1 1 2
e 3 = , , , 0,..., 0
23 23 23
(7.21)
1 1 (i 1)
eit = ,..., , , 0,..., 0
(i 1) i (i 1) i (i 1) i
e t = 1
,...,
1
,
(p 1)
p (p 1) p
(p 1) p (p 1) p
(X ) (X ) = c
t
1 2
= p2 ( )
1 t 2 1 t 2 1
( e1X ) + ( e 2 X ) + ... + ( e pt X )
2
2p ( ) = X t 1X =
1 2 p
Ferreira, D.F. Estatstica multivariada 249
1 2 1 2 1
2p ( ) = X t 1X = Y1 + Y2 + ... + Yp2
1 2 p
( )
Yi = eit X , i = 1, 2, ..., p (7.22)
o qual tem mdia zero e direo definida por ei . Na Figura 7.1 ilustram-se os
Y1
Y2
= Var(e
Q = Var(Y) t
X) = e t Se
comprimento unitrio de e . Dessa forma, o mximo tem que ser obtido da forma
e tSe
=
et e
e t Se
S t e = 0
ee
(S ) e = 0 (7.23)
7. Componentes principais 252
( ; e )
i i de S, que correspondem a varincia amostral e combinao linear que
= e t X = e X + e X + ... + e X , i = 1, 2, ..., p
Y (7.24)
i i i1 1 i2 2 ip p
Var Yk k( )
= , k = 1, 2,..., p (7.25)
Y
Cov (
,Y
i k )
= 0, i k = 1, 2,..., p (7.26)
S, dada por S = P
P t e da propriedade que tr(AB)=Tr(BA) demonstra-se que:
Ferreira, D.F. Estatstica multivariada 253
( ) ( ) ( )
p n
tr(S) = Sii = tr P
P t = tr =
P t P = tr
i
i =1 i =1
) = k 100
%VarExp(Y (7.27)
k p
i
i =1
e Xk definida por:
A correlao amostral entre Yi
e ik i
rY ,X = , i, k = 1, 2,..., p (7.28)
i k
Skk
que transforma as escalas das variveis para uma outra escala sem dimenso,
Z j = D 1/ 2 ( X j X ) , j = 1, 2,..., n (7.30)
( )
em que D-1/2= Diag 1/ S11 ,1/ S22 ,...,1/ Spp . O estimador de a covarincia de Z
dado por:
Cov(Z) = D 1/ 2 Cov(X)D
1/ 2
= D 1/ 2SD 1/ 2 = R (7.31)
( )
de autovalores e autovetores de R i ; e i . Assim, o i-simo componente principal
= e t Z = e Z + e Z + ... + e Z ,
Y i = 1, 2, ..., p (7.32)
i i i1 1 i2 2 ip p
por:
) = k 100
%VarExp(Y (7.33)
k
p
Ferreira, D.F. Estatstica multivariada 255
e Zk definida por:
A correlao amostral entre Yi
rY ,Z = e ik i , i, k = 1, 2,..., p (7.34)
i k
Neste contexto pelo menos uma varivel redundante e pode ser eliminada do
ser retido. No existe uma resposta definitiva para essa questo. Os aspectos que
^ 10
i
1 2 3 4 5 6
componente principal
Figura 7.2. Scree plot de um exemplo com p=6 componentes principais para
realizado.
observao amostral.
t = Y
representados pelo vetor Y
j j1 Yj2 ... Yjp para a j-sima observao amostral
e1t
t
= P X = e 2 X
Y t
(7.36)
j j j
e pt
7. Componentes principais 258
utilizados.
( )
1
t = P t P = , portanto P t
pois PP = P , pode-se demonstrar que:
= e e
X j = PY
e p Y
j 1 2 j
(7.37)
e + Y
Xj = Y e + e
+Y
j1 1 j2 2 jp p
e + Y
avaliando quanto Y e + e difere de X , tendo como desvio o valor
+Y
j1 1 j2 2 jq q j
e + Y
dado por Y e + e . Essa medida feita tomando-se o
+Y
jq +1 q +1 jq + 2 q + 2 jp p
2 +Y
por Y 2 + 2 . As observaes consideradas suspeitas so aquelas que
+Y
j q +1 j q+2 jp
,Y
possuem pelo menos uma das coordenadas de Y , que contribui
,Y
j q +1 j q+2 jp
distintos e positivos, quais sejam, 1 > 2 > > p > 0 com correspondentes
, ento,
1. ( )
n tem distribuio aproximadamente N p ( 0, 2 2 ) .
2. Seja
p
k
Ei = i e et
2 k k
(7.38)
k =1 ( )
k i k i
ento, n ( e i ei ) N p 1 ( 0, E i ) .
Ferreira, D.F. Estatstica multivariada 261
associado e i .
i jeis e jr
Cov ( e ir , e js ) = (i j) (7.39)
n ( i j )
2
Entretanto, Anderson (1963) aponta que o resultado 2 requer somente que i seja
distinto dos demais p-1 valores caractersticos, os quais podem ter qualquer
populacionais.
i i
P Z ( / 2 ) = 1 (7.40)
2
i n
ICi (1 ) : i
; i
(7.41)
2 2
1 + Z ( / 2 ) n 1 Z ( / 2 ) n
o limite superior de (7.41) seja vlido. Caso o limite superior no seja vlido e n for
2 2
ICi (1 ) : i Z ( / 2 ) i ; i + Z ( / 2 ) i (7.42)
n n
i 0
Zc = (7.43)
2
0
n
Ferreira, D.F. Estatstica multivariada 263
interesse :
H 0 : q +1 = q + 2 = = q+r (7.44)
especificada da seguinte forma: H1: pelo menos um dos r autovalores difere dos
q+r
j
( )
q+r
2
c = (n 1) ln j + (n 1)r ln
j= q +1
(7.45)
j= q +1 r
1 apresentada a seguir.
7. Componentes principais 264
H 0 : ei = e0 (7.46)
1
c2 = n i e0t S1e0 + e0t Se0 2 = n ( e i e0 ) E ig ( e i e0 )
t
(7.47)
i
1
0 0
( 1 i )
2
2
0 0
( 2 i )
2
i = uma matriz (p-1)x(p-1) originria da
p
0 0
( p i )
2
j
eliminao da i-sima linha e i-sima coluna de uma matriz Diag , pxp.
( )2
j i
px(p-1).
p
j
E i = i Pi i Pit = i e e t
j=1 ( )
2 j j
j i i j
p ( )2
1 1
t
i j
E = Pi i1Pit =
g
i e je j
i i j=1 j
j i
n ( ei e0 ) E ig n ( ei e0 ) 2p 1
t
7. Componentes principais 266
p ( )
2
n
n ( ei e 0 ) E i ( ei e0 ) = ne0 E i e0 = e0 t
t g t g t i j
e je j e 0 =
i j=1 j
j i
n t p ( j 2 i j + i ) t
2 2 p
n tp p
1 t
= e0 e je j e0 = e0 je je j 2 i e je j + i e je j e0 =
t
t
2
p
Como je jetj = , alm disso, somando e subtraindo i ei eit ao
j=1
p
termo da expresso je je tj , tem-se que:
j=1
j i
p
je je tj + i ei eit i ei eit = i ei eit
j=1
j i
p
1
Utilizando o mesmo raciocnio para 1 = e je tj somando e
j=1 j
p 1 1
subtraindo ao termo e je tj a quantidade dada por
ei eit , tem-se:
j=1 j
j i
i
p 1 1 1 1
e je tj + ei eit ei eit = 1 ei eit
j=1 j
j i
i i i
Ferreira, D.F. Estatstica multivariada 267
p
Finalmente, o termo e je tj equivalente a seguinte expresso,
j=1
j i
p
e je tj = I ei eit
j=1
j i
qui-quadrado tem-se:
p
n tp p
1 t
e0 j e j e j 2 i e j e j + i e j e j e0 =
t
t
2
n t 1
= e0 i ei eit 2 i ( I ei eit ) + i2 1 ei eit e0 =
i i
e t e et e et e e t Ie et e et e e t 1e0 et e et e
= n 0 0 0 i i 0 i 0 0 2 i + 2 i 0 i i 0 + i2 0 i2 0 i i 0 =
i i i i i i i
e t e
= n 0 0 e0t ei eit e0 2e0t e0 + 2e0t ei eit e0 + i e0t 1e0 e0t ei eit e0 =
i
e t e
= n 0 0 + i e0t 1e0 2
i
7. Componentes principais 268
principais obtidos da matriz R sejam difceis de derivar, esse caso especial conduz
1
1
H 0 : = 0 = vs H 0 : 0 (7.48)
1
quantidades:
Ferreira, D.F. Estatstica multivariada 269
1 p
rk = rik ; k = 1, 2, ..., p
p 1 i =1
(7.49)
ik
2 p 1 p
r= rik
p(p 1) i =1 k =i +1
(7.50)
(p 1) 2 1 (1 r ) 2
= (7.51)
p (p 2)(1 r ) 2
n 1 p 1 p p 2
c2 = 2
(1 r ) i =1 k =i +1
( rik r )
2
( rk r ) (7.52)
k =1
H0 : = 0 = 2 I (7.53)
7. Componentes principais 270
H 0 : = dada por:
n
1 n
L ( , X ) = f ( X j ) = ( 2 ) np / 2 n / 2 exp ( X j ) 1 ( X j )
t
j =1 2 j =1
n np n 1 n
S( ) = ln ( j ) = 2 ln ( 2 ) 2 ln 2 ( X j ) 1 ( X j )
t
, X f X
j =1 j =1
a) Derivada de S ( , X ) em relao a
Ferreira, D.F. Estatstica multivariada 271
S ( , X ) n
= 1 ( X j )
j =1
(X
j =1
j ) = 0
n
n = X j
j =1
n
j =1
Xj
= =X
n
b) Derivada de S ( , X ) em relao a
S ( , X ) n 1
= ( 1 ) + n 1S n 1
t
2 2
S ( , X )
=0
n 1 t 1 1 1
( ) + n Sn = 0
2 2
1 1 1 n 1
n S n = ( )
2 2
1S n 1 = 1
obtm-se:
1S 1 =
1
n
1 n 1 n
= S n = ( X j X )( X j X )t = W j
n j =1 n j =1
seguinte forma:
1 n
( ) exp ( X j X j ) S n1 ( X j X j )
n / 2 t
L , = ( 2 ) np / 2 S n
2 j =1
1 n 1 t
exp tr S n ( X j X j )( X j X j )
n / 2
= ( 2 ) np / 2 S n
2 j =1
1 1 n t
exp tr S n ( X j X j )( X j X j )
n / 2
= ( 2 ) np / 2 S n
2 j =1
Ferreira, D.F. Estatstica multivariada 273
n / 2 1
= ( 2 ) np / 2 Sn exp tr Sn1nSn
2
n / 2 n
= ( 2 ) np / 2 S n exp tr [ ]
2
n / 2 np
= ( 2 ) np / 2 Sn exp
2
dadas por:
1 n
L ( , 0 X ) = ( 2 ) np / 2 0 exp ( X j ) 01 ( X j )
n / 2 t
2 j =1
1 n
exp 2 ( X j ) ( X j )
t
= ( 2 ) np / 2 ( 2 )
np / 2
2 j =1
np np 1 n
( ) ln ( 2 ) ln ( 2 ) 2 ( X j ) ( X j )
t
S , 2 X =
2 2 2 j =1
(
c) Derivada de S , 2 X em relao a )
(
S , 2 X )= 1 n
( X j )
22 j =1
(X
j =1
j ) = 0
n
n = X j
j =1
n
j =1
Xj
= =X
n
( )
d) Derivada de S , 2 X em relao a 0
(
S , 2 X ) = np 1 n
2
2 2
+
2( )
2 2
(X
j =1
j )t ( X j )
(
S , 2 X ) =0
2
np 1 n
2
+ ( X j X )t ( X j X ) = 0
2 2 ( ) j =1
2
2
1 n
np
2 ( ) 2 2
tr ( X
j =1
j X )t ( X j X ) =
2 2
1 n np
tr
( 2 ) j =1
( X j X )( X j X )t = 2
2
1 np 2
2 tr ( nS n ) =
( )
2 2 2
1 np p
= =
2
n tr ( S n ) tr ( S n )
tr ( S n )
2 =
p
np / 2
tr ( S n )
( ) p n
( X j X j ) ( X j X j )
t
L , 0 = ( 2 ) np / 2 exp
p 2tr ( S n ) j =1
np / 2
tr ( S n ) p
= ( 2 ) np / 2
exp tr ( nS n )
p 2tr ( S n )
np / 2
np / 2 tr ( S n ) np
= ( 2 ) exp
p 2
np / 2
np / 2 tr ( S n ) np
( 2 ) exp
1 =
( )=
L , 0
p
2
=
Sn
n/2
L ( , ) np tr ( S n )
np / 2
n / 2
( 2 ) np / 2 Sn exp
2
p
np / 2
p p
np / 2
i
i
p p
n/2
S i =1
1 = = = p i =1 (7.54)
[ tr(S) / p]
np / 2 np / 2
p
i / p
i / p
i =1 i =1
Ferreira, D.F. Estatstica multivariada 277
anteriormente por:
n np
c2 = 2ln ( 1 ) = 2 ln S + {ln [tr ( S )] ln ( p )} =
2 2
(7.55)
n np p
p
= 2 ln ( ) + ln ln ( p )
2
2 i =1 2 i =1
p ( p + 1) p ( p + 1) 2 ( p + 2)( p 1)
= p+ p 1 = =
2 2 2
melhor performance, sendo que para grandes amostras a estatstica dada por:
(2p 2 + p + 2)
c2 = 2 1 ln ( 1 ) (7.56)
6pn
11 0 0
0 0
H0 : =
22
; ii >0 (7.57)
0 0 pp
n/2
S n/2
2 = n/2
= R (7.58)
p
Sii
i =1
(2p + 11)
c2 = 2 1 ln ( 2 ) (7.59)
6n
Lawley (1940) mostra que o teste (7.59) pode ser aproximado por:
(2p + 11) p 1 p 2
c2 n
6 rik
i =1 k = i +1
(7.60)
Morrison (1976).
Rs=D_12*S*D_12;
print 'Matriz de correlacoes amostrais R';
print Rs;
Lr=diag(eigval(Rs));
print 'Matriz de autovalores de R';
print Lr;
Pr=eigvec(Rs);
print 'Matriz de autovetores de R';
print Pr;
/*intervalo de confianca para autovalores de S - equacao 7.41*/
za2=probit(1-alpha/2);
print 'Intervalos de confianca para os autovalores de S, sendo 1-
alpha=' alpha;
print 'Autovalor Li Ls';
do i=1 to p;
lin=ls[i,i]/(1+za2*(2/n)**0.5);
lsu=ls[i,i]/(1-za2*(2/n)**0.5);
print i lin lsu;
end;
/*Testar a hipotese de que o maior autovalor de S e igual a l0=12.35 -
equacao 7.42 */
/* este teste eh motivado pelo fato de l1=sig2(1+(p-1)rho), com
sig2=4.2 e rho=0.97 */
l0=12.35;
Zc=(ls[1,1]-l0)/(l0*(n/2))**0.5;
przc=2*(1-probnorm(abs(zc)));
print 'Teste de H0: l1=12.35 (igual correlacao). Esse valor eh apenas
um exemplo';
print 'Valor de Zc valor de prob>|zc|';
print 'Se [prob>|zc|]>valor de alpha Ho nao deve ser rejeitada';
print Zc przc;
/* teste 7.43 igualdade de r autovalores intermediarios*/
/* neste exemplo sera testado Ho: l2 = l3 */
/*q=1, r=2, p=3 -teste 7.44 */
aux1=0;aux2=0;q=1;r=2;
do i=q+1 to q+r;
aux1=aux1+log(ls[i,i]);
aux2=aux2+ls[i,i]/r;
end;
qui2c=-(n-1)*aux1+(n-1)*r*log(aux2);
print 'Valores dos somatorios auxiliares para teste H0: l2 = l3';
print 'aux1 = soma ln(lj) e aux2 = media dos lj intermediarios';
print aux1 aux2;
v=r*(r+1)/2-1;
prqui2c=1-probchi(qui2c,v);
print 'Teste da hipotese de que Ho: l2 = l3 ';
print 'Qui-quadrado GL Pr>qui-Quadr';
print qui2c v prqui2c;
/* teste para a hipotese de igualdade de um autovetor a um vetor de
constantes*/
/* Para ilustrar sera testado que e1=[1/3^0.5 1/3^0.5 1/3^0.5], ou
seja, igual*/
/* estrutura de correlacao da matriz Sigma que originou a S */
e0=j(p,1,1/3**0.5);
E1=j(p,p,0);
do i=1 to p;
ek=Ps[,i];
if i^=1 then
do;
E1=E1+(ls[i,i]/(ls[i,i]-ls[1,1])**2)*ek*t(ek);
Ferreira, D.F. Estatstica multivariada 281
end;
end;
E1=ls[1,1]*E1;
Le=eigval(e1);
*print E1 le;
ei1=Ps[,1];
print e0 ei1;
qui2c=n*(ls[1,1]*e0`*inv(S)*e0+e0`*S*e0/ls[1,1]-2);
qui2c2=n*t(Ps[,1]-e0)*ginv(E1)*(Ps[,1]-e0);
v=p-1;
prqui2c=1-probchi(qui2c,v);
print 'Teste da hipotes e1=e0=t([1/3^0.5 1/3^0.5 1/3^0.5])';
print 'Qui-quadrado1 qui-quad2 GL Pr>qui-Quadr';
print qui2c qui2c2 v prqui2c;
/*teste da H0:phoij=pho - igual estrutura de correlacao */
rbar=(sum(Rs)-trace(Rs))/(p*(p-1));
rk=j(p,1,0);
do i=1 to p;
rk[i]=(sum(Rs[,i])-1)/(p-1);
end;
gama=(p-1)**2*(1-(1-rbar)**2)/(p-(p-2)*(1-rbar)**2);
aux1=(Rs-j(p,p,rbar))#(Rs-j(p,p,rbar));
aux2=(sum(aux1)-trace(aux1))/2;
aux3=(rk-j(p,1,rbar))#(rk-j(p,1,rbar));
aux4=sum(aux3);
qui2c=(n-1)/(1-rbar)**2*(aux2-gama*aux4);
v=(p+1)*(p-2)/2;
if qui2c<=0 then qui2c=1e-14;
prqui2=1-probchi(qui2c,v);
print 'Teste da hipotes phij=pho: igual estrutura de correlacao';
print 'Qui-quadrado GL Pr>qui-Quadr';
print qui2c v prqui2;
print 'Valores utilizados no teste-para simples conferencia';
print 'media geral dos rij, vetor de medias de cada coluna de R e gama
chapeu';
print rbar rk gama;
/*teste de esfericidade-H0: Sigma=Sig^2*I*/
Lamb1=((det(S)**(1/p))/(trace(S)/p));
qui2c=-2*(n*p/2)*log(lamb1)*(1-(2*p**2+p+2)/(6*p*n));
v=(p+2)*(p-1)/2;
prqui2=1-probchi(qui2c,v);
print 'Teste de esfericidade - H0: Sigma=Sig^2*I';
print 'Qui-quadrado GL Pr>qui-Quadr Lambida 1^(2/(np))';
print qui2c v prqui2 lamb1;
/*teste de independencia de variaveis mais geral - H0: Sigma =
Diag(sig11 sig22 ... sigpp)*/
Lamb2=det(Rs);
qui2c=-2*(n/2)*log(lamb2)*(1-(2*p+11)/(6*n));
v=p*(p-1)/2;
prqui2=1-probchi(qui2c,v);
print 'Teste de independencia - H0: Sigma = Diag(sig11 sig22 ...
sigpp)';
print 'Qui-quadrado GL Pr>qui-Quadr Lambida 2^2/n';
print qui2c v prqui2 lamb2;
/*teste de independencia de variaveis - uso da aproximacao de Lawley-
pior*/
aux1=Rs#Rs;
aux2=(sum(aux1)-trace(aux1))/2;
qui2c=aux2*(n-(2*p+11)/6);
v=p*(p-1)/2;
7. Componentes principais 282
prqui2=1-probchi(qui2c,v);
print 'Teste de independencia aproximado de Lawley (1940)';
print 'para a hipotese H0: Sigma = Diag(sig11 sig22 ... sigpp)';
print 'Qui-quadrado GL Pr>qui-Quadr Soma de rij^2=aux2';
print 'Obs. para grandes valores de rij essa eh uma pessima
aproximacao';
print qui2c v prqui2 aux2;
quit;
7.6. Exerccios
covarincia.
a normalidade por meio dos dois primeiros componentes. Faa os Q-Q plots
refaa o exerccio.
7. Componentes principais 284
U.A. X1 X2 X3
1 12,80 29,56 45,19
2 14,12 26,54 49,29
3 19,09 33,26 49,79
4 15,98 31,00 51,73
5 16,00 28,94 50,30
6 16,51 31,67 48,06
7 14,05 30,11 55,15
8 14,34 26,47 46,84
9 16,87 29,00 52,16
10 21,93 38,00 39,24
11 15,21 30,68 54,02
12 15,54 27,37 51,52
13 17,71 30,20 51,66
14 14,42 29,99 52,50
15 13,38 31,61 52,33
16 13,91 29,59 44,19
17 15,53 29,30 53,71
18 16,40 28,96 46,56
19 18,35 30,15 52,18
20 13,59 27,70 52,33
21 19,08 31,26 48,59
22 13,95 29,94 54,73
23 16,11 34,52 52,69
24 17,10 29,39 52,03
25 18,81 31,48 49,79
26 15,27 29,54 43,11
27 14,80 31,88 48,08
28 17,39 28,88 50,69
29 18,02 34,02 49,58
30 9,52 25,23 45,89
||[ 8
Anlise de agrupamento
]||
8.1. Introduo
os algoritmos que devem ser usados para efetivamente realiz-los. Encontrar nos
responder. Assim, por exemplo, na Figura 8.1 observa-se uma situao em que A
mais parecido com C do que com B. Intuitivamente para fazer tal inferncia
20 B
18
16
Varivel 2
14
12
A
C
10
Figura 8.1. Disperso entre trs indivduos mensurados com relao a duas
ou razo).
X1t = X11 X12 " X1p e X 2t = X 21 X 22 " X 2p observaes entre dois objetos
(indivduos). Ento, a distncia euclidiana entre eles dada por:
modulares.
1m
p m
d ( X1 , X 2 ) = X1i X i2i (8.3)
i =1
8. Anlise de agrupamento 288
diferenas.
dessa pressuposio.
sejam Zhj e Zij estes valores padronizados, ento, podem ser definidas as
( X X ij )
2
hj
j =1
d h,i = (8.4)
p
2
p X hj X ij
= ( X h Xi ) D 1 ( X h X i )
t
d h,i = (8.5)
j =1 S
jj
Ferreira, D.F. Estatstica multivariada 289
em que, D uma matriz diagonal tendo o j-simo componente igual a varincia Sjj,
ou seja,
S11 0 " 0
0 S " 0
D= 22
# # % #
0 0 " Spp
mdia,
2
p X hj X ij
j =1
( X h Xi ) D 1 ( X h X i )
t
S jj =
d h,i = (8.6)
p p
discrepncia possvel.
1 p X hj X ij
d h,i = log10 1 (8.7)
p j =1 X ( n ) j X (1) j
8. Anlise de agrupamento 290
altura superiores a 1,80m, ento, defini-se a varivel binria (X) da seguinte forma:
cor de olhos pretos determinaria o valor 1 e a ocorrncia de outro com outra cor de
uma caracterstica devem ser representadas por uma varivel binria, a qual
apresentados a seguir.
Bandas
Linhagens 1 2 3 4 5
A 1 0 0 1 1
B 1 1 0 1 0
com 2-2 e duas discordncias, quais sejam, 0-1 e 1-0. Representando o escore (1
ou 0) da j-sima varivel binria no h-simo objeto por Xhj e da mesma forma Xij
0 se X hj = X ij = 1 ou se X hj = X ij = 0
(X X ij )
2
hj = (8.8)
1 se X X
hj ij
d A2 , B = 2
8. Anlise de agrupamento 292
A equao (8.4) pode ser usada muitas vezes como base para
situaes reais (1-1) representa uma forte evidncia de similaridade, mas o (0-0)
Item i
1 0 Totais
1 a b a+b
Item h
0 c d c+d
Totais a+c b+d p = a + b +c + d
exemplo tratado a = 2, b = c = d = 1.
apresentados.
1
Sh,i = (8.9)
1 + d h ,i
distncia euclidiana, calculada com variveis padronizadas, pode ser obtida pelo
2
2 p d h2, i
3
Sh,i = (8.10)
2
2 p + d h2,i
3
2 p d h2, i
Sh,i = (8.11)
2 p + d h2, i
8. Anlise de agrupamento 294
definida. Com a condio de que Si,i = 1, mximo das similaridades, e que a matriz
propriedades de distncia.
d h , i = 2 (1 S h ,i ) (8.12)
Ferreira, D.F. Estatstica multivariada 295
ad + bc
ad bc Produto de momento de correlao -1 - +1 0,17
aplicado a variveis binrias
(a + b)(a + c)( b + d )(c + d )
Ochiai II ad Proporo de coincidncias em 0 -1 0,33
relao mdia geom. total
(a + b)(a + c)(b + d )(c + d ) modificada
8. Anlise de agrupamento 296
Tabela 8.1 (). Este coeficiente de correlao est associado estatstica de qui-
variveis. Uma outra importante observao que pode ser feita que para
8.3. Agrupamentos
sempre so aceitos universalmente. Uma outra razo para isso, que raramente
tantos grupos quanto aos objetos, ou seja, cada objeto forma um agrupamento.
todos os objetos.
dois subgrupos de tal forma que exista o mximo de semelhana entre os objetos
objetos.
cada estgio.
Figura 8.2.
.2 d24 .3 .2 .3
.1 .4 d15
.4
(a) . 5
.
1
.5
(b)
.2 .3
.1 .4
.5
(c)
(d13+d14+d15+d23+d24+d25)/6
Figura 8.2. Distncias entre os grupos para os mtodos da (a) ligao simples, (b)
1. Iniciar com n grupos, cada um com um nico elemento e com uma matriz
apresentada a seguir.
A B C D
A 0
B 3 0
D=
C 7 9 0
D 8 6 5 0
8. Anlise de agrupamento 300
AB C D
AB 0
D = C 7 0
D 6 5 0
DC AB
DC 0
D=
AB 6 0
Ferreira, D.F. Estatstica multivariada 301
Dendrograma
Single Linkage
Matriz de dissmilaridade
Distncia de ligao
vizinho mais prximo, com exceo de que a distncia entre grupos tomada
como a mxima distncia entre dois elementos de cada grupo. Para ilustrar, ser
AB C D
AB 0
D = C 9 0
D 8 5 0
tem-se,
DC AB
DC 0
D=
AB 9 0
Dendrograma
Complete Linkage
Matriz de dissimilaridades
2 3 4 5 6 7 8 9 10
Distncia de ligao
Figuras 8.3 e 8.4, pode-se notar que os dendrogramas para o mtodo do vizinho
sim na magnitude da fuso dos grupos CD com AB, para esse exemplo em
particular.
vizinho mais prximo e mais distante, com exceo de que a distncia entre
grupos tomada como a mdia da distncia entre dois elementos de cada grupo.
d( AB ), C = (dAC + dBC ) / 2 = (7 + 9) / 2 = 8
d ( AB ),D = (d AD + dBD ) / 2 = (8 + 6) / 2 = 7
AB C D
AB 0
D = C 8 0
D 7 5 0
DC AB
DC 0
D=
AB 7,5 0
Ferreira, D.F. Estatstica multivariada 305
Dendrograma
Unweighted pair-group average
Matriz de dissimilaridade
2 3 4 5 6 7 8
Distncia de ligao
o item.
Exemplo 8.1
Observao
Objeto x1 x2
A 2 0
B 5 2
C 1 4
D 8 4
Centride
Objeto X1 X2
AD (2+8)/2=5 (0+4)/2=2
BC (1+5)/2=3 (2+4)/2=3
Ferreira, D.F. Estatstica multivariada 307
ii) Neste passo a distncia de cada item ser computada em relao ao centride
prximo.
2
d A ( AD )
= (2 5) 2 + (0 2) 2 = 13
2
d A (BC )
= (2 3) 2 + (0 3) 2 = 10
Centride
Objeto X1 X2
D 8 4
ABC 2,667 2
2 2 2
d A ,D
= 52 d B ,D
= 13 d C ,D
= 49
2 2 2
d A ,( ABC )
= 4, 44 d B ,( ABC )
= 5, 44 d C ,( ABC )
= 6,77
distncia para os respectivos grupos aos quais eles pertencem. Para realizar uma
8.4. Exerccios
A B C D
A 0
B 9 0
D=
C 25 36 0
D 49 100 16 0
||[ 9
Anlise de fatores
]||
9.1. Introduo
para essa finalidade, esta no deve ser preferida por ser apenas uma
para determinar quando uma proporo suficiente da variao total foi explicada
simples.
pelas p variveis observveis aleatrias X1, X2, ..., Xp. Assumindo que o vetor de
X = L F +
(9.2)
(p1) (p m) (m1) (p1)
associado somente com a i-sima varivel resposta Xi. Os p desvios X1-1, X2-2,
..., Xp-p so representados por p + m variveis aleatrias F1, F2, ..., Fm, 1, 2, ...,
E(F) = 0 (9.3)
E() = 0 (9.5)
1 0 " 0
0 " 0
Cov() = E( ) = =
t 2
(9.6)
# # % #
0 0 " p
Cov(, F) = E ( Ft ) = 0 (9.7)
(p m)
( X )( X ) ( )
t
= ( LF + )( LF + ) = ( LF + ) ( LF ) + t =
t t
= LF ( LF ) + ( LF ) + LF +
t t t t
Ento,
(
)
Cov ( X, F ) = E X Ft = E ( LF + ) Ft = E ( LFFt + Ft ) =
= E ( LFFt ) + E ( Ft ) = LE ( FFt ) + E ( Ft ) = L + 0 = L
9. Anlise de fatores 314
Logo,
m
Var(X i ) = ii = A 2ij + i = A 2i1 + A 2i2 + ... + A 2im + i
j=1
(9.10)
m
Cov(X i , X k ) = ik = A ijA kj = A i1A k1 + A i2A k 2 + ... + A im A km
j=1
Assim,
ii = h i2 + i i = 1, 2, ..., p (9.12)
Ferreira, D.F. Estatstica multivariada 315
de tal forma que =0. A utilidade da anlise de fatores, no entanto, ocorre quando
( A ij e i ).
em que: L* = LT e F* = T t F .
9. Anlise de fatores 316
so alteradas.
sendo que a anlise de fatores determinar alguns poucos fatores comuns. Nesse
verossimilhana apresentado por Lawley (1940, 1942 e 1943). Qualquer que seja
soluo.
1 2 ... p , ento:
exata, esta no til por utilizar tantos fatores quanto variveis e por no deixar
1 e1
2 e2
1 e1 2 e 2 ... m e m = LL
t
(9.16)
#
e
m m
LLt +
(9.17)
m
= Diag( LLt ) ou i = ii A 2ij para i=1, 2, ..., p.
j =1
X1 1
Z1
Z 11
# (
Z = = V 1/ 2 X = #
2
)
(9.18)
X p p
Zp
pp
em que:
1
0 " 0
11
1
0 " 0
V 1/ 2
= 22
# # % #
1
0 0 "
pp
9. Anlise de fatores 320
m
i . Como ii = 1 , fcil perceber que i = 1 A 2ij . A padronizao evita que
j=1
cargas fatoriais.
apresentado.
( )
autovetores i , e i , i = 1, 2, ..., p, em que 1 2 ... p . Seja m < p, o nmero
L = 1 e1 2 e 2 ... m e m = P1
1/ 2 (9.19)
1
Ferreira, D.F. Estatstica multivariada 321
1 0 " 0
0 2 " 0
=
# # % #
t
= Diag S LL ( ) (9.20)
0 0 " p
m
i = Sii A 2ij = Sii h i2 (9.21)
j=1
t +
S LL (9.23)
componentes. O ideal obter uma elevada contribuio dos primeiros fatores para
A
i =1
2
ij = A 1j2 + A 22 j + ... + A 2pj = j e j j e tj = j
(9.24)
Ferreira, D.F. Estatstica multivariada 323
por:
j
100 para fatores de S
Tr(S)
%VarExp = (9.25)
j 100 para fatores de R
p
principais.
11 0 " 0
0 " 0
H0 : =
22
; ii >0
# # % #
0 0 " pp
quadrados dos dois ltimos autovalores, dada por 22 + 32 = 0, 0291 , foi considerada
t
S LL =
2, 2165 0, 0681 0 0
1, 7277 [ 2, 2165 1, 7277 2,1770] 0 0, 0831 0
2,1770 0 0 0, 0870
0 0, 0228 0, 0515
= 0, 0228 0 0, 0429
0, 0515 0, 0429 0
0,0049, a qual limitada por 0,0099. Uma vez que os ganhos foram muito
pequenos, o modelo de 1 fator pode ser julgado adequado. O fator 1 pode ser
1 = h i2 + i .
que estimativas iniciais *i tenham sido obtidas por um meio qualquer, ento,
estabelecer que a matriz Rr pode ser recomposta pelos m fatores comuns. Dessa
estimadores:
*
L r = 1 e1 *2 e *2 *m e *m
* *
(9.28)
m
*i = 1 A*2 ij
j=1
em que ( ; e ) ,
*
i
*
i = 1, 2, ..., m so os (maiores) pares de autovalor-autovetor
obtidos de Rr.
i = A ij
h *2 *2
(9.29)
j=1
estimativas das cargas fatoriais e das varincias especficas para uma dada
preciso.
comuns igual ao posto da matriz reduzida (Rr). Uma das causas dos autovalores
1
i = 1 i = 1
h *2 *
(9.30)
r ii
(Xi) e as (p-1) demais variveis. Essa relao til, pois permite que h *2
i seja
m ii
i = Sii 1
h *2 S (9.31)
2p
Ferreira, D.F. Estatstica multivariada 329
n / 2
L(, ) = (2) np / 2
1 n t
exp tr 1 ( X j X )( X j X ) + n X X = ( )( )
t
2 j=1
(9.32)
(n 1) / 2 1
= (2) (n 1)p / 2
exp tr 1Sn
2
n
(
exp tr X 1 X ) ( )
1/ 2 t
(2) p / 2
2
computacional por:
( 1/ 2
)(
1/ 2
Sn )
1/ 2 L = (
1/ 2 L + ) (9.34)
= L t
1L (9.35)
( 1/ 2
Sn )
1/ 2
1/ 2 L = (
1/ 2 L + L t
1L )
( 1/ 2
Sn )
1/ 2
1/ 2 L
1/ 2 L =
1/ 2 LL
t
1L
( 1/ 2
Sn )
1/ 2
1/ 2 L =
1/ 2 LL
t
1L
Logo,
n(
1/ 2 S
)
1/ 2
1/ 2 L =
1/ 2 LL
t
1L (9.36)
Ferreira, D.F. Estatstica multivariada 331
Como L t
1L uma matriz diagonal para garantir que os elementos
(
1/ 2 S
n
)
1/ 2 , so iguais aos valores correspondentes a diagonal de .
1/ 2 S
ao i-simo autovalor de n
( )
1/ 2 . O clculo desses vetores no um
so tambm desconhecidos, os
processo direto, uma vez que os elementos de
= Diag(S LL
quais devem ser obtidos da relao t ) . Sendo assim, o processo de
, e ento,
caractersticos correspondentes a valores iniciais de os elementos de
utiliz-los para obter novas estimativas mais precisas das varincias especficas
sucessivamente.
valores iniciais do processo iterativo. Os elementos desses vetores devem ser re-
escalonados para que as somas de seus quadrados sejam iguais aos respectivos
10 0 " 0
= 0 " 0
#
20
% #
0
#
0 0 " m0
P0 = Q 1/ 2
0 0
0 n (
= Diag S P P t
0 0 ) (9.37)
3. Obter a matriz
0 (
1/ 2 S
n
0
1/ 2
0 ) (9.38)
(
11 , 21 ,..., m1 ) = [ e e ... e ] sem re-
dessa matriz. Formar a matriz Q1 11 21
m1
11 0 " 0
= 0 21
" 0
1 # # % #
0 0 " m1
P1 = Q 1/ 2
1 1
( )
A primeira aproximao de L L 1 dada por:
L 1 =
1/ 2 P
0 1 (9.39)
4. Calcular
1 n (
= Diag S L L t
1 1 ) (9.40)
Formar a matriz diagonal (D) a partir dos elementos Sii de S. Ento obter as
L Z = D 1/ 2 L (9.41)
= D 1/ 2
D 1/ 2 (9.42)
Z
dadas por:
Print'________________________________________________________________';
Delta=inv(root(psii))*(S-psii)*inv(root(psii));
*print delta;
Li=Diag(eigval(delta));Pi=eigvec(delta);
Li=Li[1:numfac,1:numfac]; Pi=Pi[1:p,1:numfac];
Pi=root(psii)*Pi*root(Li);
*print Li Pi;
Psii=diag(S-Pi*Pi`);
/*soma de quadrados dos residuos do modelo*/
resi=S-pi*pi`-psii;
print 'Soma de quadrados dos residuos';
SQResiduo=sum(resi#resi);
print sqresiduo;
*print psii;
Print'________________________________________________________________';
end;
Print 'Solucao final do modelo de fatores';
Print 'Cargas fatoriais';
print Pi;
print 'Variancias especificas';
print psii; resi=S-pi*pi`-psii;
print 'matriz de residuos';
print resi;
print 'Soma de quadrados dos residuos';
SQResiduo=sum(resi#resi);
print sqresiduo;
print 'Cargas fatoriais de Z-variaveis padronizadas';
D=root(inv(diag(S))); PiZ=D*Pi;
print PiZ;
print 'Variancias especificas fatoriais de Z-variaveis padronizadas';
PsiZ=D*psii*D;
print PsiZ;
Li=Diag(eigval(delta));
print Li;
quit;
9. Anlise de fatores 336
p 2
A ij
i =1 100 para fatores de S
Tr(S)
%VarExp = (9.44)
p
A 2Z(i j)
i =1
p 100 para fatores de R
A ij(t 1) A ijt
A ijt A ij(t +1)
A 2i j t = (9.45)
A ij(t +1) 2A ijt + A ij(t 1)
(3 1) e P (3 1) por:
(1 1), Q
compostas as matrizes 0 0 0
0, 6234937 2, 2164432
= 12,637147 Q = 0, 4859812 L = P = Q
0 0 = 1, 727603
1/ 2
0 0 0 0
0, 612436 2,1771344
0, 0683794 0 0
0 n (
= Diag S P P =
t
0
0 0 ) 0, 0833879 0
0 0 0, 0864857
(3 1) e P (3 1) .
(1 1), Q
foram usados para compor as matrizes 1 1 1
9. Anlise de fatores 338
0,6657947 8,4600381
= 161,45963 Q = 0,4691915 P = Q = 5,9618652
1/ 2
1 1 1 1 1
0,5801523 7,3718074
2,2122546
P = 1,721606
L 1 = 1/ 2
0 1
2,167934
iv) por:
Foi calculado o segundo valor 1
0,0869296 0 0
(
1 = Diag Sn L 0 L 0 =
t
) 0 0,1040727 0
0 0 0,1264622
2,2106526
1/ 2 P = 1,7217993 e
L 41 = 40 41
2,1595433
0,0940152 0 0
41 n (
= Diag S L L
t
41 41 )
= 0 0,1034073 0
0 0 0,1627727
0 2,9835E-8 3,7474E-8
R = 2,9835E-8 0 -7,05E-8
3,7474E-8 -7,05E-8 0
SQResduos= 1,453E-14
1
0 0
4,9810 2,2106526 0,9905177
1
L Z = D 1/ 2 L = 0 0 1,7217993 = 0,983003
3, 0680 2,1595433 0,9829926
1
0 0
4,8264
0, 0188748 0 0
= D 1/ 2
D 1/ 2
= 0 0, 0337051 0
Z
0 0 0, 0337255
so: i) corrida de 100 m rasos; ii) salto em distncia; iii) lanamento de peso; iv)
salto em altura; v) corrida dos 400m livres; vi) 110 m com barreiras; vii) arremesso
de disco; viii) salto com vara; ix) arremesso de dardos; e x) corrida de 1500 m. A
obtida pelo algoritmo apresentado nesse material por meio das estimativas de
tornam as cargas fatoriais mais facilmente interpretveis. Essa rotao rgida dos
fatoriais.
m m
2
p
m 2 p m p m 1 m
A ij = A ij + 2 A ijA ik
i =1 j=1
4 2 2
(9.46)
i =1 j=1 i =1 j=1 k = j+1
tambm invariante.
Fergusson (1954) sugeriu minimizar o termo dos duplos produtos de (9.46) como
Carroll (1953).
cargas fatoriais :
2
p
1 p m 2
m
V = A A ij
4
ij (9.47)
i =1 j=1 pm i =1 j=1
relacionada a soma das varincias das cargas fatoriais quadrticas dentro de cada
1 m p 4 p 2 2
v = 2
*
p
p A ij A ij
j=1 i =1
(9.48)
i =1
critrio alternativo:
1 m p 4 p 2 2
v= 2
p
p x ij x ij
j=1 i =1
(9.49)
i =1
em que:
A ij
x ij = (9.50)
m
A
j=1
2
ij
Ferreira, D.F. Estatstica multivariada 345
j-sima carga fatorial do i-sima varivel resposta dividida pela raiz quadrada de
p 2 p
2
p
2 2p ( x ir x is ) x ir x is ( x ir x is ) 2 x ir x is
2 2
i =1 i =1 i =1
tg() = (9.51)
p p
2
p
2
p ( x ir x is ) ( 2x ir x is ) ( x ir x is ) 2 x ir x is
2 2 2 2 2
i =1 i =1
i =1
destes sinais.
com o terceiro fator original, e assim por diante, at que m(m-1)/2 pares de
dentro de um ciclo.
Sinal do numerador
Sinal do denominador + (positivo) - (negativo)
+ (positivo) : 004<900 V: -9004<00
- (negativo) : 9004<1800 : -18004<-900
Exemplo 9.4. Efetuar a rotao varimax dos m = 3 fatores obtidos por Morrison
(incompleto)
fatoriais conduz a um teste formal para o m-simo modelo fatorial. A hiptese nula
:
Ferreira, D.F. Estatstica multivariada 347
H 0 : = LLt +
(9.52)
H : uma matriz p p p.d. sim.
1
(1954):
(2p + 4m + 5) LL +
t
= n 1
2
c ln S (9.53)
6
n
1
= (p m) 2 p m (9.54)
2
graus de liberdade.
necessrio que os graus de liberdade sejam positivos. Isso significa que o nmero
m<
1
2
(
2p + 1 8p + 1 ) (9.55)
9. Anlise de fatores 348
t +
generalizadas LL e S . Se m for pequeno em relao a p, geralmente H0
n
t +
de LL aproximar de Sn, de tal sorte que o acrscimo de novos fatores no
razes levar a no rejeio de H0. Algum tipo de bom sendo deve ser aplicado na
escolha de m.
dos desvios padres das p variveis na diagonal principal. Ento, a razo que
t +
LL t +
D 1/ 2 LL D 1/ 2
=
Sn D 1/ 2 Sn D 1/ 2
final.
t +
LL t D 1/ 2 + D 1/ 2
D 1/ 2 LL D 1/ 2 L Z L tZ +
z
= =
Sn D 1/ 2Sn D 1/ 2 R
padronizados.
a partir das cargas fatoriais que sofreram rotao e no a partir das originais. No
rotaes.
9. Anlise de fatores 350
X = LF +
(1937) sugeriu o uso dos quadrados mnimos ponderados, usando como peso o
p
i2
( ) ( )
t
i =1
= t 1 = X LF 1 X LF
(9.56)
i
(
F = ( Lt 1L ) Lt 1 X )
1
(9.57)
( ) 1 ( X X ) j = 1, 2, ..., n
1
F j = L t
1L L t j (9.58)
( )
1
F j = L tZ
1L
Z Z L tZ
1Z j = 1, 2, ..., n
Z j (9.59)
F j* = T ' F j (9.60)
X = LF +
LLt + L
=
*
(9.61)
L
t
( )
E ( F / x ) = Lt 1 x = Lt ( LLt + ) ( x )
1
(9.62)
C ov ( F / x ) = Lt 1L = Lt ( LLt + ) L
1
(9.63)
Os coeficientes Lt ( LLt + )
1
so os coeficientes de uma regresso
dados por:
( ) ( X X )
1
F j = L t LL
t +
j j = 1, 2, ..., n (9.64)
Ferreira, D.F. Estatstica multivariada 353
( ) = ( + L L )
1 1
L t LL
t +
t 1
L t
1 (9.65)
pode simplificar o clculo dos escores dos fatores, os quais so dados por:
( ) 1 ( X X ) j = 1, 2, ..., n
1
F j = + L t
1L L t j (9.66)
( ) = ( + L L )
1 1
L t LL
t +
1 t 1
L t
1
Tem-se:
( ) ( + L L ) F ( )
1
= L t + F j
1
F jWLS = L t
1L t 1 LS 1L LS
j
( L L )
1
t 1
uma matriz diagonal e quando o seu valor for prximo de zero os
9. Anlise de fatores 354
9.7. Exerccios
modelo.
fatores obtidos.
||[ 10
Anlise de correlao cannica
]||
10.1. Introduo
variveis em um dos grupos com uma outra combinao linear das variveis do
(1935 e 1936).
10. Anlise de correlao cannica 356
na literatura.
X1(1)
(1)
X2
#
X (1) X (1)p
X = (2) = (2) (10.1)
X X1
(2)
X2
#
X (2)
q
Ferreira, D.F. Estatstica multivariada 357
Cuja mdia :
(1)
= E(X) = (2) (10.2)
p q
p 12 (10.3)
( )( )
t
= E X X = 11
q 21 22
grupos, uma de X (1) e outra de X (2) , esto contidas em 12. Dessa forma, os pq
elementos de 12 medem a associao entre os dois grupos. Se ambos os valores
uma tarefa difcil e na maioria das vezes infrutfera. Como a finalidade, em geral,
10. Anlise de correlao cannica 358
U = a t X (1)
(10.5)
V = b t X (2)
sendo a e b vetores no nulos dos coeficientes dessas combinaes lineares.
Assim,
a t 12 b
Corr(U, V) = U, V = (10.7)
a t 11a b t 22 b
Ferreira, D.F. Estatstica multivariada 359
restries:
a t 11a = b t 22 b = 1 (10.8)
correlao (10.7). Para obter o mximo de U,V preciso derivar a equao (10.7)
U,V 1/ 2 1
= ( b t 22 b ) ( a t 11a ) 12 b + 2 ( a t 12 b )( a t 11a ) 11a
1/ 2 3 / 2
a 2
(10.9)
( a t 12 b ) 11a + 12 b = 0
(10.10)
t
12a ( a 12 b ) 22 b = 0
t
U, V 11a + 12 b = 0
(10.11)
t
12a U, V 22 b = 0
U, V 11 12
=0 (10.12)
12 U, V 22
t
A A12
A = 11 (10.13)
A 21 A 22
Ferreira, D.F. Estatstica multivariada 361
A = A11 A 22 A 21A11 1
A12
ou (10.14)
1
A = A 22 A11 A12 A 22 A 21
1 1
U, V 11 U, V 22 + 12
t
11 12 = 0
U, V
1 1
U, V 22 + 12
t
11 12 = 0
U, V
12 22112
t
2U,V 11 = 0
(10.15)
t 1
12 11 12 U,V 22 = 0
2
(captulo 2) do tipo:
e t Ae
= t
e Be
restrito a e t Be =1.
Assim, os resultados de (10.15) podem ser reescritos (captulo 2) da
seguinte forma:
( 12 22112
t
11 ) a = 0 (a)
(10.16)
t 1
( 12 11 12 22 ) b = 0 (b)
1/ 2 1/ 2
linear c = 1/112 a , ento, a = 11 c . Se a equao (a) for pr-multiplicada por 11 e
1/ 2
a for substitudo por a = 11 c , ento:
Ferreira, D.F. Estatstica multivariada 363
1/ 2
11 ( 1222112t 11 ) 111/ 2c = 0
( 1/ 2
11 12 22112
t 1/ 2
11 1/ 2
11 1/ 2
1111 ) c = 0
equaes homogneas:
( 1/ 2
11 12 22112
t 1/ 2
11 i ) ci = 0
(10.17)
(i) e autovetores ( ci ) de 11
1/ 2
12 22112
t 1/ 2
11 . Os autovalores (i) dessa matriz so
os mesmos do sistema no transformados por serem invariantes com relao a
1/ 2
a i = 11 ci (10.18)
( 1/ 2
22 12
t 1
11 12 221/ 2 i ) d i = 0
(10.19)
bi = 221/ 2 d i (10.20)
a t 12 b
Max ( U, V ) = t = a t 12 b
a, b a 11a b 22 b
t
= ( a t 12 b ) , logo:
2
Max ( U, V ) = i (10.21)
a, b
1/ 2
Sabendo que ci um autovetor de 11 12 22112
t 1/ 2
11 com norma 1, e
procedendo da mesma forma para Var(Vi) verifica-se que:
Logo,
Cov ( U k , U A ) = Corr ( U k , U A ) = 0 ( k A )
(10.23)
Cov V , V = Corr V , V = 0 k A
( k A) ( k A) ( )
Logo,
10. Anlise de correlao cannica 366
U k = a kt Z(1) = c kt 11
1/ 2 (1)
Z
(10.25)
V = b t Z(2) = d t 1/ 2 Z(2)
k k
k 22
1/ 2
em que c k e d k so os autovetores de norma 1 das matrizes 11 1222112
t 1/ 2
11 e
221/ 212
t 1
11 12221/ 2 , respectivamente. Os autovetores originais devem ser
recuperados por:
a k = 11
1/ 2
ck
(10.26)
b = 1/ 2 d
k 22
k
dadas por:
p q
p 12 (10.27)
= E ( ZZt ) = 11
q 21 22
Ferreira, D.F. Estatstica multivariada 367
de forma que:
so dadas por:
a kt 12 b k
Corr(U k , Vk ) = = k (10.29)
a kt 11a k b kt 22 b k
1/ 2
em que k k-simo autovalor de 11 1222112
t 1/ 2
11 , ou equivalentemente de
1/ 2 t 1
22 1211 12221/ 2 .
cannicas de acordo com a magnitude das correlaes das variveis originais com
10. Anlise de correlao cannica 368
cannicos:
a1t b1t
t t
a2 b
A = e B = 2
(10.30)
# #
t t
ap bq
simultaneamente por:
U1 V1
U V
U= 2
= AX (1)
e V = = BX(2)
2
(10.31)
# #
Up Vq
Logo,
Cov (U, X(1) ) = Cov ( AX(1) , X(1) ) = ACov ( X(1) ) = A11 (10.32)
1
0 " 0
11
(1)
(1)
1 X1
0 " 0 X(1)
2
V 1/ 2
X (1)
= (1) (10.33)
#
11 22
# # % # (1)
Xp
1
0 0 "
pp
(1)
Assim,
U, X(1) = Corr (U, X(1) ) = Cov ( AX(1) , V111/ 2 X(1) ) = A11V111/ 2 (10.34)
( 2 ) = A12 V221/ 2 (p q)
U , X
1/ 2
V , X( 2) = B 22 V22 (q q) (10.35)
= B12
t
V111/ 2 (q p)
V , X (1)
em que V221/ 2 uma matriz diagonal (q x q) com o i-simo elemento dado por
1/ ii(2) .
10. Anlise de correlao cannica 370
dadas por:
X1(1)
#
X(1) Xp(1)
X= = (10.37)
X
(2) (2)
X1
#
(2)
Xq
Em que:
1 n 1 n
X(1) = X(1) j e X(2) = X(2) j (10.38)
n j=1 n j=1
p q
p S S12 (10.39)
S = 11
q S21 S 22
10. Anlise de correlao cannica 372
1 n
( )( X )
t
em que SkA = X(j k ) X(k )
n 1 j =1
(A)
j X( A ) , k, A = 1, 2 .
combinaes lineares:
U = a t X (1)
k k
(10.40)
t (2)
Vk = b k X
a kt S12 b k
rU = (10.41)
k , Vk
a kt S11a k b kt S22 b k
(
S12S22 S12 k S11
1 t
) a k = 0 (a)
(10.42)
t 1
(
S12S11 S12 k S22 ) b k = 0 (b)
Ferreira, D.F. Estatstica multivariada 373
b k obtidos por:
a k = S11
1/ 2
c k (a)
(10.43)
1/ 2
b k = S22 d k (b)
1/ 2
sendo que c k k-simo autovetor de S11 S12S221S12
t 1/ 2
S11 e d k o k-simo autovetor de
1/ 2 t
S22 1
S12S11 S12S221/ 2 ; k o k-simo autovalor de ambas as matrizes, por serem
U
Var = Var
k
V ( )
=1
k ( ) (10.44)
2. Correlaes amostrais:
rU = rV ; V = rU = 0 (k A) (10.45)
k ; UA k A k ; VA
rU = k (10.46)
k ; Vk
10. Anlise de correlao cannica 374
(p p) e B
Sejam as matrizes A (q q) definidas pelos vetores
cannicos amostrais:
a 1t b 1t
t
a b t
A = e B = 2
2
(10.47)
#
t #
a p b t
q
U V 1
1
U V (2)
= e V = 2 = BX
= AX
2 (1)
U (10.48)
# #
U V
p q
originais de cada um dos grupos podem ser obtidas. Para isso definiu-se as
1/ 2
matrizes diagonais D11 ( ) ( )
= Diag 1/ Sii(1) , (pxp) e D 221/ 2 = Diag 1/ Sii(2) , (qxq).
e X (1)
1. Matriz de correlaes entre U
D 1/ 2
R U, X(1) = AS (10.49)
11 11
Ferreira, D.F. Estatstica multivariada 375
e X (2)
2. Matriz de correlaes entre U
D 1/ 2
R U, X( 2) = AS (10.50)
12 22
e X (1)
3. Matriz de correlaes entre V
t D 1/ 2
R V, X(1) = BS (10.51)
12 11
e X (2)
4. Matriz de correlaes entre V
D 1/ 2
R V, X( 2 ) = BS (10.52)
22 22
correspondentes so:
U V 1
1
U
U
= 2 = A Z (1)
e = V2 = B Z (2)
V (10.53)
Z
#
Z
#
U V
p q
em que:
A Z = AD
1/ 2 e
11 B Z = BD
1/ 2
22 (10.54)
10. Anlise de correlao cannica 376
substituindo-se nas expresses correspondentes S11, S22 e S12 por R11, R22 e R12,
R (1) = A R =A 1 t
Z 11 Z (1) = B Z R 12
R V,Z
U,Z
(10.55)
1
( 2) = A Z R 12
R U,Z ( 2) = B Z R 22 = B Z
R V,Z
= AX
definies U (1) e V = BX
(2) . Logo, possvel definir:
X(1) = A 1U
e X(2) = B 1V (10.56)
e B
Como A so dadas por:
c1t d 1t
t t
= P (1)tS1/ 2
A
c
= 2 S111/ 2 = P (2)t S1/ 2 = d 2 S1/ 2
e B (10.57)
11
# 22 22
t #
c p d t
p
Ento:
1 = S1/ 2 P (1)
A e 1 = S1/ 2 P (2)
B (10.58)
11 22
devido a P (1) e P (2) serem matrizes ortogonais de autovetores, fcil perceber que
( P ) ( )
1 1
(1)t
= P (1) e P (2)t = P (2) .
e V
Das definies de U sabe-se que a covarincia entre eles
(pxq) com
uma matriz diagonal k na k-sima diagonal para k=1, 2,...p, e
Cov
( U, V ) = AS
12
t = P (1)tS1/ 2S S1/ 2 P (2) =
B 11 12 22
Cov ( U ) = AS
A
11
t
= (10.59)
Cov ( V ) = BS
22
t =
B
Assim,
B
AS t =
12
S12 B 1
t =A
( )
t
1
S12 = A B
1
Da mesma forma:
( ) ( )
t t
1 A
S11 = A 1 e 1 B
S22 = B 1
Da mesma forma desejvel uma boa aproximao das covarincias entre grupos
1/ 2
autovetores de S11 S12S221S12
t 1/ 2
S11 e de S221/ 2S12
t 1
S11 S12S221/ 2 definidas por:
Ferreira, D.F. Estatstica multivariada 379
c1t
t
c
= P (1)t S1/ 2
A = 2 S111/ 2
(10.60)
r r 11
#
t
c r
d 1t
t
= P (2)t S1/ 2 d
B r r 22 = 2 S221/ 2 (10.61)
#
d t
r
1 0 " 0
0 2 " 0
=
(10.62)
r
# # % #
0 0 " r
1 = S1/ 2 P (1) e B
A 1 = S1/ 2 P (2) (10.63)
r 11 r r 22 r
E = S
( A )( A )
t
1 1
(a)
11 11 r r
( B )( B )
t
1 1
E 22 = S22 r r (b) (10.64)
( A ) ( B )
t
1 1
E12 = S12 r r r (c)
por diante para as demais matrizes, a explicao das r variveis cannicas para o
evidente que um teste de hiptese de que (12) seja igual a uma matriz nula
H 0 : 12 = 0 (p q) vs H1 : 12 0 (10.66)
X (1)
j
X j = (2)
X j
cuja covarincia pode ser particionada em:
p q
p 12
= 11
q 21 22
por:
S11 S22 p
c2 = 2 ln( ) = n ln
S (
i =1
)
= n ln 1 i
(10.70)
S11 0
= S11 S22
0 S22
em questo. Bartlett (1939) sugere uma correo para uma melhor aproximao
S11 S22
( )
p
1 1
c2 = n 1 ( p + q + 1) ln = n 1 ( p + q + 1) ln 1 i (10.71)
2 S
2 i =1
as demais (p-2) so nulas; e assim por diante. Para o k-simo passo desse
H (k
0 : 1 0, 2 0," , k 0, k +1 = k + 2 = " = p = 0
)
(10.72)
H (k ) : 0 para algum i k + 1
1 i
( )
p
1
c2 = n 1 ( p + q + 1) ln 1 i (10.73)
2 i = k +1
para os dados normais e deve ser interpretado com cautela, e possivelmente deva
maior raiz caracterstica de Roy, com S=min(p, q), m=(|P-Q| -1)/2 e n=(n-p-q-2)/2.
S
Vc = (10.75)
S11 S22 " Skk
cuja distribuio muito complicada. Mas Box (1949) obteve boa aproximao de
n 1
c2 = ln ( Vc ) (10.76)
C
em que:
10. Anlise de correlao cannica 386
1 1
C = 1 12 (n 1) ( 23 + 3 2 )
(10.77)
1
= 2
2
S
k k
S = pi pSi ; S = 2, 3 (10.78)
i =1 i =1
H0: =diag(ii). Ento, esse teste uma generalizao dos demais supra citados.
10.5. Exerccios
10.5.1. Verifique que a derivao do mximo de (10.7) pode ser obtida a partir de
22, respectivamente.
mximas.
H 0 : 12 = 12 = 0 (p q) vs H1 : 12 = 12 0
H 0 : 1 0; 2 = 0 Vs H 0 : 2 0
c) estime as matrizes E11, E22 e E12 para o primeiro par de variveis cannicas
(r=1).
p.296-298, 1954.
Hill, 1975.
municpio de Jacu - Minas Gerais. UFLA, Lavras, MG, 1996. 61p. (dissertao
de mestrado).
377, 1936.
when the ratios of the population variances are unknown, Biometrika, v.41,
p.19-43, 1954.
11. Referncias bibliogrficas 392
1980.
KAISER, H.F. Computer program for varimax rotation in factor analysis. Journal of
KAISER, H.F. The varimax criterion for analytic rotation in factor analysis.
LAWLEY, D.N. Tests of significance for the latent roots of covariance and
p.59-66, 1959.
LAWLEY, D.N. The estimation of factor loadings by the method of the maximum
NEL, D.G.; Van der MERWE, C.A. A solution to the multivariate Behrens-Fisher
3735, 1986.
PEARSON, E.S.; HARTLEY, H.O. Biometrika Tables for Statisticians Vol. 1 ed.
Cambridge University Press, New York, 1966.
SEARLE, S.R. Matrix algebra for the biological sciences. Wiley, New York,
1966.