Acetatos Inf

Cap.
8 INFERNCIA ESTATSTICA
Alguns conceitos breves sobre aspectos inferenciais em contexto
multivariado.
Problemas tradicionais
Estimao de mdia populacional
Estimao de vector mdio populacional, .
Estimao de varincia populacional

Estimao de matriz de (co)varincias populacional, .
Problemas ligados a tcnicas multivariadas
Aspectos distribucionais de valores/vectores prprios numa ACP;

Anlises Discriminantes com distribuies para cada classe;
MANOVA
etc., etc.
A maioria dos resultados ligada hiptese de Multinormalidade
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
180 / 218
Amostras aleatrias
Cada extraco aleatria dum elemento duma populao com p
variveis um vector aleatrio:
X = (X1 , X2 , ..., Xp )t ,
onde cada Xi representa uma varivel aleatria.
Chamamos amostra aleatria duma populao multivariada a uma
coleco de n extraces aleatrias independentes dessa populao.
Uma amostra aleatria multivariada representa-se de 2 formas:
Uma coleco de n vectores aleatrios independentes:
(X1 , X2 , ..., Xn ) .
Uma matriz aleatria de tamanho n p (cada linha um individuo).

J. Cadima (DM/ISA)
2009-10
181 / 218
Vectores aleatrios
Definio 8.1
Seja X = (X1 , X2 , ..., Xp )t um vector aleatrio. Define-se (admitindo que
existem os valores esperados, varincias e covarincias indicados):
1
O vector esperana de X, E [X], cuja componente i E [Xi ].
A matriz de varincias-covarincias de X, V [X], de elemento

genrico V [X]ij = Cov(Xi , Xj ) , (i = 1 : p, j = 1 : p)
(Os elementos diagonais so as varincias V [Xi ]).
Dado um segundo vector aleatrio Y = (Y1 , Y2 , ..., Yk ), define-se a

matriz de covarincias cruzadas entre X e Y, C[X, Y] como a
matriz cujo elemento genrico C[X, Y]ij = Cov(Xi , Yj ) ,
(i = 1 : p, j = 1 : k).
J. Cadima (DM/ISA)
2009-10
182 / 218
A distribuio Multinormal
Definio 8.2
Seja Y um vector aleatrio n-dimensional. Diz-se que Y tem
distribuio Multinormal, com parmetros dados pelo vector e a
matriz (definida positiva) se a sua funo densidade conjunta fr:
fY (y) =
(2 )n/2
1
p
e 2 (y )
1
)
det(
(y )
y Rn
).
Nesse caso, escreve-se: Y Nn ( ,
J. Cadima (DM/ISA)
2009-10
183 / 218
A funo densidade Binormal
z
y
J. Cadima (DM/ISA)
2009-10
184 / 218
Propriedades duma Multinormal

Teorema 8.1
), ento:
Seja Y Nn ( ,
1
E [Y] = e V [Y] = .
2
Distribuies marginais de Y so tambm multinormais.

.
.
.
). Os subvectores Yi e Yj
Seja Y = [ Yt1 .. Yt2 .. ..Ytr ]t Nn ( ,
so independentes se e s se a submatriz de V [Y] =
correspondente fr constituda apenas por zeros.
Combinaes lineares das componentes dum vector multinormal
so Normais: at Y N (at , at a).
Se Cpn matriz de caracterstica p n, e ap+1 um vector

Ct ).
(no-aleatrio), ento CY + a Np (C + a, C
2 .
Q = (Y )t 1 (Y ) (n)
J. Cadima (DM/ISA)
2009-10
185 / 218
Amostras aleatrias Multinormais

Uma amostra aleatria duma populao Multinormal uma coleco
de vectores aleatrios independentes:
) .
Xi Np ( ,
Uma concretizao duma tal amostra uma matriz (real) n p.
Um estimador do vector mdio populacional, o vector:
=
vector
1
n
Xi
i=1
vectores
Nota: este o estimador de mxima verosimilhana de .

J. Cadima (DM/ISA)
2009-10
186 / 218
Propriedades do estimador X
), (i = 1, ..., n),
Dada uma amostra aleatria Multinormal, Xi Np ( ,
ento:
E [X] =
V [X] =
1
n
(Estimador centrado).
(Semelhante ao univariado).
X Np ( , n1 ) (s neste ponto
1 (X ) p2
Q = (X )t n
precisoMultinormalidade).
O ltimo resultado pode ser usado fazer testes ou criar regies de

confiana para , se a matriz de covarincias seja conhecida.
J. Cadima (DM/ISA)
2009-10
187 / 218
conhecida, Multinormalidade)
Inferncia sobre (
Teste de Hipteses a = 0
Hipteses: H0 : = 0 vs. H1 : 6= 0
1 (X 0 ) p2 , sob H0 .
Estatstica do teste: Q = (X 0 )t n
Regio Crtica: (unilateral direita) Rejeitar H0 se Qcalc > 2 ;p .

(Qcalc calculado substituindo X pelo vector x da nossa amostra)
Qcalc (proporcional ) distncia de Mahalanobis de x a 0 .
Regio de confiana para

A (1 ) 100% de confiana, so admissveis os vectores tais que
1 (x ) 2 (p) .
(x )t n
Estas regies de confiana so interiores de elipsides em Rp .
J. Cadima (DM/ISA)
2009-10
188 / 218
Elipsides em Rp
Seja Cpp uma matriz definida positiva, e k R+ . Ento

(x x0 )t C1 (x x0 )
a equao dum elipside em Rp de:

centro em x0 ;
semi-eixos em direces definidas pelos vectores prprios de C;
comprimento de semi-eixos: 1 , (i valor prprio de C).
k i
J. Cadima (DM/ISA)
2009-10
189 / 218
Elipsides em Rp
Recordar que, se C definida positiva, ento:
Pt
C admite decomposio espectral C = P
(elementos diagonais de positivos);
1 Pt .
C1 existe e tem decomposio espectral C1 = P
(x x0 )t C1 (x x0 )
1
k 1
t
t .
.
P (x x0 )
.
0
0
p
Se P = I, fica
i=1
..
.
0
...
...
..
.
...
1
k p1
...
0
1
k 2
(xi x0i )2
k i
0
0
..
.
= k
0
0
..
.
0
1
k p
t

P (x x0 ) = 1
= 1: elipside alinhado com eixos.
Se P 6= I: P induz uma rotao (rgida) em relao origem.

J. Cadima (DM/ISA)
2009-10
190 / 218
Regio de confiana em R2
Regiao de confianca para
2.3
2.4
confianca =
0.95
2.1
2.2
0.8
0.9
1.0
1.1
1.2
1.3
J. Cadima (DM/ISA)
2009-10
191 / 218
A estimao da matriz de (co)varincias,

E se desconhecida?
Seja Xnp matriz-amostra duma populao p-variada.
Um estimador da matriz de (co)varincias populacional a
matriz amostral de (co)varincias:
S
1
n1
Xt (In P1n )X
No o estimador de mxima verosimilhana (seria com 1n );

usa-se
1
n1
para que seja um estimador centrado:

E [S]
Pode ser usado para substituir . Mas com que consequncias?

J. Cadima (DM/ISA)
2009-10
192 / 218
Distribuio de Wishart
Vrias distribuies surgem associadas Multinormal. Uma a de
Wishart.
Definio 8.3
Seja App uma matriz aleatria, com funo densidade conjunta:
( 1 tr(A1 ))
det(A)(np1)/2 e 2
, A def. positiva
p
2np/2 p(p1)/4 det()1/2n ( 21 (n+1i))
w (A; , n) =
i=1
0
, caso contrario
Diz-se que A tem distribuio de Wishart com parmetros n e :
A Wp (, n). Se = Ip diz-se que temos uma Wishart padro.
Nota: A Wishart uma generalizao da 2 e partilha muitas das

suas propriedades. W1 (I, n) igual a n2 .
Nota: O determinante duma matriz simtrica o produto dos seus
valores prprios.
J. Cadima (DM/ISA)
2009-10
193 / 218
Como surge uma Wishart
Teorema 8.2
Seja Xnp uma matriz aleatria cujas linhas so vectores aleatrios
).
com distribuio Xi Np (0,
t
Seja M = X X. Ento
, n) .
M Wp (
J. Cadima (DM/ISA)
2009-10
194 / 218
A Wishart e o estimador de
Teorema 8.3 (Cochran)
Seja Xnp uma matriz aleatria cujas n linhas so elementos duma
). Seja Cnn uma matriz
amostra aleatria, com distribuio Np (0,
simtrica, no-aleatria. Ento, Xt CX tem distribuio de Wishart se e
s se C fr uma matriz idempotente. Nesse caso, tem-se
, r )
Xt CX Wp (
com r = tr(C) = car (C) .
Como (n 1)S = Xt (In P1n )X, e In P1n matriz de projeco

ortogonal sobre espao de dimenso n 1, temos, para amostra
Multinormais:
(n 1)S
J. Cadima (DM/ISA)
, n 1) .
Wp (
2009-10
195 / 218
Propriedades da distribuio Wishart

, n) e Bpq uma matriz no-aleatria, ento
Se A Wp (
Bt AB Wq (Bt B, n) .
Submatrizes principais de Wishart tm distribuio Wishart (com
a correspondente submatriz de como primeiro parmetro).
, n), ento 1/2 A
1/2 Wp (Ip , n) (Wishart padro).
Se A Wp (
, n) e b Rp vector no-aleatrio:
Se A Wp (
bt Ab
n2 .
bt b
, n1 ) e A2 Wp (
, n2 ), com A1 e A2 independentes,
Se A1 Wp (
, n1 + n2 ) .
A1 + A2 Wp (
J. Cadima (DM/ISA)
2009-10
196 / 218
Substituindo pelo estimador S

Teorema 8.4
). Seja m App
Seja y um vector aleatrio com distribuio Np ( ,
, m). Se y e A forem
uma matriz aleatria com distribuio Wp (
independentes, ento:
mp+1
(y )t A1 (y ) F(p,mp+1) .
mp
Vamos usar com m = n 1, A = S.
Teorema 8.5
Para uma amostra Multinormal, os estimadores X e S so
independentes.
J. Cadima (DM/ISA)
2009-10
197 / 218
Substituindo pelo estimador S (cont.)
Corolrio
Seja Xnp uma matriz aleatria cujas n linhas tm distribuio
) (i = 1, ..., n). Ento
Xi N ( ,
np
n (x )t S1 (x )
{z
}
(n 1)p |
F(p,np)
Estatistica T 2 de Hotelling
(vem de
) e (n 1)S Wp (
, n 1)).
n X Np ( n ,
J. Cadima (DM/ISA)
2009-10
198 / 218
Inferncia sobre (Multinormalidade)

Teste de Hipteses a = 0
Hipteses: H0 : = 0 vs. H1 : 6= 0
Estatstica do teste: F =
sob H0 .
(np)n
(n1)p
(X 0 )t S 1 (X 0 ) F(p,np),
Regio Crtica: (unilateral direita) Rejeitar H0 se Fcalc > f ;(p,np) .

(Fcalc calculado substituindo X pelo vector x da nossa amostra)
Regio de confiana para

A (1 ) 100% de confiana, so admissveis os vectores tais que
(x )t S 1 (x ) f (p,np)
p(n 1)
.
(n p)n
Estas regies de confiana so interiores de elipsides em Rp .

J. Cadima (DM/ISA)
2009-10
199 / 218
O Lambda de Wilks
Uma quantidade que surge com frequncia em tcnicas de Estatstica
Multivariada o lambda de Wilks.
Definio 8.4
Sejam
, m) (m p);
App uma matriz aleatria com distribuio Wp (
, n);
Bpp uma matriz aleatria com distribuio Wp (
A e B independentes.
Ento,
det(A)
det(A + B)
1
det(Ip + A1B)
tem uma distribuio designada Lambda de Wilks, com parmetros p,

m e n, escrevendo-se:
J. Cadima (DM/ISA)
(p, m, n) .
2009-10
200 / 218
Observaes sobre o Lambda de Wilks

Se um valor prprio de A1 B, ento 1 + um valor prprio
de Ip + A1 B:
(I + A1 B)x = x + A1 Bx = x + x = (1 + )x .
Logo, o Lambda de Wilks pode escrever-se como:
1
det(Ip + A1 B)
1
p
(1 + i )
i=1
onde os i s so os valores prprios de A1 B.

A distribuio exacta do Lambda de Wilks no conhecida!
So conhecidas vrias aproximaes distribuio
J. Cadima (DM/ISA)
2009-10
201 / 218
Aproximaes distribuio do Lambda de Wilks

Aproximao assinttica de Bartlett. Quando m +
1
(p, m, n)
(m (p n + 1)) log
2
2
pn
.
Para n = 1 uma transformao de tem distribuio F :

1 (p, m, 1) m p + 1
(p, m, 1)
p
F(p,mp+1) .
Para n = 2 uma transformao de tem distribuio F :

p
1 (p, m, 2) m p + 1
p
p
(p, m, 2)
F(2p,2(mp+1)) .
Para n = 2 e p > 2, tem-se, assintoticamente:

pn
1 1/s as 2 + 1
pn
1/s
com a = m 12 (p n + 1)
J. Cadima (DM/ISA)
s=
F(pn,as pn +1) ,
2
p 2 n 4
.
p2 +n2 5
2009-10
202 / 218
O Lambda de Wilks e a MANOVA

Consideremos a generalizao da ANOVA a um factor com
vector-resposta p-variado, Y:
Xnp
| {z }
Bk p
| {z }
matriz do modelo matriz coeficientes
matriz resposta aleatoria
Cnk
| {z }
np
| {z}
erros aleatorios
com C = I1 | I2 | I3 | ... | Ik a matriz cujas k colunas so as indicatrizes

de cada um dos k nveis do factor.
Objectivo: Estudar se os k vectores mdios de nvel so iguais:
1 = 2 = 3 = ... = k Rp .
J. Cadima (DM/ISA)
2009-10
203 / 218
Pressupostos
Identifica-se cada vector observado (linhas da matriz X) por
dois ndices: Xij , em que o
primeiro ndice (i) indica o nvel do factor (i = 1, ..., k);
segundo ndice (j) indica o repetio no seio do nvel (j = 1, ..., ni ).
Admite-se que
As linhas da matriz X so observaes independentes.
em cada nvel do factor tem-se distribuio Multinormal:
Xij
i ) ,
Np ( i ,
onde Xij indica a j-sima observao no nvel i do factor.

a estrutura de (co)varincias igual nos k nveis:
1 = 2 = ... = k .
J. Cadima (DM/ISA)
2009-10
204 / 218
Se H0 verdade
H0 : 1 = 2 = ... = k
Nesse caso, todas as observaes Xij so identicamente distribudas:
Xij
) .
Np ( ,
Nesse caso, sabemos que um estimador centrado de S e

(n 1)S = T
J. Cadima (DM/ISA)
, n 1) .
Wp (
2009-10
205 / 218
Para quaisquer i
),
Seja, ou no, H0 verdade, tem-se Xij N ( i ,
(tendo em conta que se admitiu comum em todos os nveis).

Se Si a varincia amostral das ni observaes do nvel i, temos:
, ni 1) ,
(ni 1) Si Wp (
i = 1, ..., k .
Um estimador conjunto da matriz de varincias comum, , dado

pela mdia ponderada das varincias amostrais, Si :
k
Sconj =
(ni 1) Si
i=1
k
(ni 1)
1
nk
(ni 1) Si .
i=1
i=1
J. Cadima (DM/ISA)
2009-10
206 / 218
Para quaisquer i (cont.)

k
(n k) Sconj = (ni 1)Si a soma de k Wishart, com comum.

i=1
Os k estimadores Si so independentes (baseiam-se em conjuntos

diferentes de observaes independentes).
Logo,
, n k) .
(n k) Sconj = W Wp (
A matriz 1n W = E a matriz da variabilidade intra-classes j discutida
na Anlise Discriminante Linear:
E =
1 t
X (In PC )X .
{z
}
n|
=W
J. Cadima (DM/ISA)
2009-10
207 / 218
Uma estatstica de teste

Para testar
H0 : 1 = 2 = ... = k
vs.
H1 : i, j tais que i 6= j
Sabemos que se H0 , um estimador de :

T = (n 1) S = Xt (In P1n )X
Sabemos que sempre, um estimador de :
W = (n k) Sconj = Xt (In PC )X
O princpio da razo de verosimilhanas para testar H0 vs. H1 gera a
seguinte estatstica de teste:
det(W )
.
det(T )
Mas T = W + B, onde B = Xt (PC P1n )X n H, sendo H a matriz de

variabilidade inter-classes da ADL.
J. Cadima (DM/ISA)
2009-10
208 / 218
O Lambda de Wilks na MANOVA

=
1
det(W )
=
=
det(W + B)
det(In + W 1 B)
1 + i
i=1
onde i o i-simo maior valor prprio de W 1 B.

O Teorema de Cochran garante que
B
Xt (PC P1n ) X
, k 1) .
Wp (
As matrizes B e W so independentes, graas ao
Teorema de Craig
Seja dada uma matriz aleatria Xnp cujas linhas so vectores
). Sejam C1 e C2 matrizes
aleatrios i.i.d. com distribuio Np ( ,
(no aleatrias e de dimenso n n) simtricas. Ento Xt C1 X e Xt C2 X
so independentes se C1 C2 = 0.
J. Cadima (DM/ISA)
2009-10
209 / 218
Teste MANOVA
Pressupostos: n observaes independentes p-variadas, em k nveis
dum factor
), i = 1; ..., k ; j = 1, ..., ni ; i ni = n.
Xij Np ( i ,
Hipteses:
H0 : 1 = 2 = ... = k
vs.
H1 : i, j t.q. i 6= j .
Estatstica do Teste:
==
det(W )
=
det(W + B)
1
p
(1 + i )
(p, n k, k 1) ,
i=1
com
W = Xt (In PC )X;
B = Xt (PC P1n )X;
i (i = 1, ..., p) valores prprios de W 1 B.
J. Cadima (DM/ISA)
2009-10
210 / 218
Teste MANOVA (cont.)
So os valores pequenos da estatstica que levam a rejeitar H0 .

MAS...
Os p-values da estatstica do teste so calculados usando as
aproximaes (Bartlett, F) que, em geral geram regies crticas
unilaterais direitas.
J. Cadima (DM/ISA)
2009-10
211 / 218
Estatsticas alternativas
Na literatura encontram-se estatsticas alternativas ao Lambda de

Wilks, mas tambm baseadas nos valores prprios i da matriz W 1 B:
p
Lambda de Wilks: =
1 + i .
i=1
p
Bartlett-Pillai: U =
i=1
i
1+i .
Primeira raz de Roy: max .

p
Hotelling-Lawley: V = i .
i=1
J. Cadima (DM/ISA)
2009-10
212 / 218

Acetatos Inf

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Acetatos Inf

Enviado por

Direitos autorais:

Formatos disponíveis

Cap.

Estimao de varincia populacional

Problemas ligados a tcnicas multivariadas

Aspectos distribucionais de valores/vectores prprios numa ACP;

Uma matriz aleatria de tamanho n p (cada linha um individuo).

O vector esperana de X, E [X], cuja componente i E [Xi ].

A matriz de varincias-covarincias de X, V [X], de elemento

Dado um segundo vector aleatrio Y = (Y1 , Y2 , ..., Yk ), define-se a

A funo densidade Binormal

Propriedades duma Multinormal

Distribuies marginais de Y so tambm multinormais.

Se Cpn matriz de caracterstica p n, e ap+1 um vector

Amostras aleatrias Multinormais

Nota: este o estimador de mxima verosimilhana de .

O ltimo resultado pode ser usado fazer testes ou criar regies de

Regio Crtica: (unilateral direita) Rejeitar H0 se Qcalc > 2 ;p .

Regio de confiana para

Seja Cpp uma matriz definida positiva, e k R+ . Ento

a equao dum elipside em Rp de:

= 1: elipside alinhado com eixos.

Se P 6= I: P induz uma rotao (rgida) em relao origem.

A estimao da matriz de (co)varincias,

No o estimador de mxima verosimilhana (seria com 1n );

para que seja um estimador centrado:

Pode ser usado para substituir . Mas com que consequncias?

Nota: A Wishart uma generalizao da 2 e partilha muitas das

Como surge uma Wishart

com r = tr(C) = car (C) .

Como (n 1)S = Xt (In P1n )X, e In P1n matriz de projeco

Propriedades da distribuio Wishart

Substituindo pelo estimador S

Substituindo pelo estimador S (cont.)

Inferncia sobre (Multinormalidade)

Regio Crtica: (unilateral direita) Rejeitar H0 se Fcalc > f ;(p,np) .

Regio de confiana para

Estas regies de confiana so interiores de elipsides em Rp .

tem uma distribuio designada Lambda de Wilks, com parmetros p,

Observaes sobre o Lambda de Wilks

onde os i s so os valores prprios de A1 B.

Aproximaes distribuio do Lambda de Wilks

Para n = 1 uma transformao de tem distribuio F :

Para n = 2 uma transformao de tem distribuio F :

Para n = 2 e p > 2, tem-se, assintoticamente:

O Lambda de Wilks e a MANOVA

matriz do modelo matriz coeficientes

matriz resposta aleatoria

com C = I1 | I2 | I3 | ... | Ik a matriz cujas k colunas so as indicatrizes

onde Xij indica a j-sima observao no nvel i do factor.

Nesse caso, sabemos que um estimador centrado de S e

(tendo em conta que se admitiu comum em todos os nveis).

Um estimador conjunto da matriz de varincias comum, , dado

Para quaisquer i (cont.)

(n k) Sconj = (ni 1)Si a soma de k Wishart, com comum.

Os k estimadores Si so independentes (baseiam-se em conjuntos

Uma estatstica de teste

Sabemos que se H0 , um estimador de :

Mas T = W + B, onde B = Xt (PC P1n )X n H, sendo H a matriz de

O Lambda de Wilks na MANOVA

onde i o i-simo maior valor prprio de W 1 B.

As matrizes B e W so independentes, graas ao

Teste MANOVA (cont.)

So os valores pequenos da estatstica que levam a rejeitar H0 .

Na literatura encontram-se estatsticas alternativas ao Lambda de