Você está na página 1de 33

Cap.

8 INFERNCIA ESTATSTICA
Alguns conceitos breves sobre aspectos inferenciais em contexto
multivariado.
Problemas tradicionais
Estimao de mdia populacional
Estimao de vector mdio populacional, .

Estimao de varincia populacional


Estimao de matriz de (co)varincias populacional, .

Problemas ligados a tcnicas multivariadas

Aspectos distribucionais de valores/vectores prprios numa ACP;


Anlises Discriminantes com distribuies para cada classe;
MANOVA
etc., etc.
A maioria dos resultados ligada hiptese de Multinormalidade
J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

180 / 218

Amostras aleatrias
Cada extraco aleatria dum elemento duma populao com p
variveis um vector aleatrio:
X = (X1 , X2 , ..., Xp )t ,
onde cada Xi representa uma varivel aleatria.
Chamamos amostra aleatria duma populao multivariada a uma
coleco de n extraces aleatrias independentes dessa populao.
Uma amostra aleatria multivariada representa-se de 2 formas:
Uma coleco de n vectores aleatrios independentes:
(X1 , X2 , ..., Xn ) .

Uma matriz aleatria de tamanho n p (cada linha um individuo).


J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

181 / 218

Vectores aleatrios
Definio 8.1
Seja X = (X1 , X2 , ..., Xp )t um vector aleatrio. Define-se (admitindo que
existem os valores esperados, varincias e covarincias indicados):
1

O vector esperana de X, E [X], cuja componente i E [Xi ].

A matriz de varincias-covarincias de X, V [X], de elemento


genrico V [X]ij = Cov(Xi , Xj ) , (i = 1 : p, j = 1 : p)
(Os elementos diagonais so as varincias V [Xi ]).

Dado um segundo vector aleatrio Y = (Y1 , Y2 , ..., Yk ), define-se a


matriz de covarincias cruzadas entre X e Y, C[X, Y] como a
matriz cujo elemento genrico C[X, Y]ij = Cov(Xi , Yj ) ,
(i = 1 : p, j = 1 : k).

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

182 / 218

A distribuio Multinormal

Definio 8.2
Seja Y um vector aleatrio n-dimensional. Diz-se que Y tem
distribuio Multinormal, com parmetros dados pelo vector e a
matriz (definida positiva) se a sua funo densidade conjunta fr:
fY (y) =

(2 )n/2

1
p

e 2 (y )
1

)
det(

(y )

y Rn

).
Nesse caso, escreve-se: Y Nn ( ,

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

183 / 218

A funo densidade Binormal

z
y

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

184 / 218

Propriedades duma Multinormal


Teorema 8.1
), ento:
Seja Y Nn ( ,
1
E [Y] = e V [Y] = .
2

Distribuies marginais de Y so tambm multinormais.


.
.
.
). Os subvectores Yi e Yj
Seja Y = [ Yt1 .. Yt2 .. ..Ytr ]t Nn ( ,
so independentes se e s se a submatriz de V [Y] =
correspondente fr constituda apenas por zeros.
Combinaes lineares das componentes dum vector multinormal
so Normais: at Y N (at , at a).

Se Cpn matriz de caracterstica p n, e ap+1 um vector


Ct ).
(no-aleatrio), ento CY + a Np (C + a, C
2 .
Q = (Y )t 1 (Y ) (n)

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

185 / 218

Amostras aleatrias Multinormais


Uma amostra aleatria duma populao Multinormal uma coleco
de vectores aleatrios independentes:
) .
Xi Np ( ,
Uma concretizao duma tal amostra uma matriz (real) n p.
Um estimador do vector mdio populacional, o vector:
=

vector

1
n

Xi

i=1

vectores

Nota: este o estimador de mxima verosimilhana de .


J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

186 / 218

Propriedades do estimador X

), (i = 1, ..., n),
Dada uma amostra aleatria Multinormal, Xi Np ( ,
ento:
E [X] =
V [X] =

1
n

(Estimador centrado).
(Semelhante ao univariado).

X Np ( , n1 ) (s neste ponto
1 (X ) p2
Q = (X )t n

precisoMultinormalidade).

O ltimo resultado pode ser usado fazer testes ou criar regies de


confiana para , se a matriz de covarincias seja conhecida.

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

187 / 218

conhecida, Multinormalidade)
Inferncia sobre (
Teste de Hipteses a = 0
Hipteses: H0 : = 0 vs. H1 : 6= 0
1 (X 0 ) p2 , sob H0 .
Estatstica do teste: Q = (X 0 )t n

Regio Crtica: (unilateral direita) Rejeitar H0 se Qcalc > 2 ;p .


(Qcalc calculado substituindo X pelo vector x da nossa amostra)
Qcalc (proporcional ) distncia de Mahalanobis de x a 0 .

Regio de confiana para


A (1 ) 100% de confiana, so admissveis os vectores tais que
1 (x ) 2 (p) .
(x )t n
Estas regies de confiana so interiores de elipsides em Rp .
J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

188 / 218

Elipsides em Rp

Seja Cpp uma matriz definida positiva, e k R+ . Ento


(x x0 )t C1 (x x0 )

a equao dum elipside em Rp de:


centro em x0 ;
semi-eixos em direces definidas pelos vectores prprios de C;
comprimento de semi-eixos: 1 , (i valor prprio de C).
k i

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

189 / 218

Elipsides em Rp
Recordar que, se C definida positiva, ento:
Pt
C admite decomposio espectral C = P
(elementos diagonais de positivos);
1 Pt .
C1 existe e tem decomposio espectral C1 = P
(x x0 )t C1 (x x0 )

1
k 1

 t
t .
.
P (x x0 )
.
0

0
p

Se P = I, fica

i=1

..
.
0

...
...
..
.
...

1
k p1

...

0
1
k 2

(xi x0i )2
k i

0
0
..
.

= k
0
0
..
.
0
1
k p

 t

P (x x0 ) = 1

= 1: elipside alinhado com eixos.

Se P 6= I: P induz uma rotao (rgida) em relao origem.


J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

190 / 218

Regio de confiana em R2
Regiao de confianca para

2.3

2.4

confianca =
0.95

2.1

2.2

0.8

0.9

1.0

1.1

1.2

1.3

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

191 / 218

A estimao da matriz de (co)varincias,


E se desconhecida?
Seja Xnp matriz-amostra duma populao p-variada.
Um estimador da matriz de (co)varincias populacional a
matriz amostral de (co)varincias:
S

1
n1

Xt (In P1n )X

No o estimador de mxima verosimilhana (seria com 1n );


usa-se

1
n1

para que seja um estimador centrado:


E [S]

Pode ser usado para substituir . Mas com que consequncias?


J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

192 / 218

Distribuio de Wishart
Vrias distribuies surgem associadas Multinormal. Uma a de
Wishart.

Definio 8.3
Seja App uma matriz aleatria, com funo densidade conjunta:

( 1 tr(A1 ))

det(A)(np1)/2 e 2

, A def. positiva
p
2np/2 p(p1)/4 det()1/2n ( 21 (n+1i))
w (A; , n) =
i=1

0
, caso contrario
Diz-se que A tem distribuio de Wishart com parmetros n e :
A Wp (, n). Se = Ip diz-se que temos uma Wishart padro.

Nota: A Wishart uma generalizao da 2 e partilha muitas das


suas propriedades. W1 (I, n) igual a n2 .
Nota: O determinante duma matriz simtrica o produto dos seus
valores prprios.
J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

193 / 218

Como surge uma Wishart

Teorema 8.2
Seja Xnp uma matriz aleatria cujas linhas so vectores aleatrios
).
com distribuio Xi Np (0,
t
Seja M = X X. Ento
, n) .
M Wp (

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

194 / 218

A Wishart e o estimador de
Teorema 8.3 (Cochran)
Seja Xnp uma matriz aleatria cujas n linhas so elementos duma
). Seja Cnn uma matriz
amostra aleatria, com distribuio Np (0,
simtrica, no-aleatria. Ento, Xt CX tem distribuio de Wishart se e
s se C fr uma matriz idempotente. Nesse caso, tem-se
, r )
Xt CX Wp (

com r = tr(C) = car (C) .

Como (n 1)S = Xt (In P1n )X, e In P1n matriz de projeco


ortogonal sobre espao de dimenso n 1, temos, para amostra
Multinormais:
(n 1)S
J. Cadima (DM/ISA)

, n 1) .
Wp (

Estatstica Multivariada

2009-10

195 / 218

Propriedades da distribuio Wishart


, n) e Bpq uma matriz no-aleatria, ento
Se A Wp (
Bt AB Wq (Bt B, n) .
Submatrizes principais de Wishart tm distribuio Wishart (com
a correspondente submatriz de como primeiro parmetro).
, n), ento 1/2 A
1/2 Wp (Ip , n) (Wishart padro).
Se A Wp (
, n) e b Rp vector no-aleatrio:
Se A Wp (
bt Ab
n2 .
bt b
, n1 ) e A2 Wp (
, n2 ), com A1 e A2 independentes,
Se A1 Wp (
, n1 + n2 ) .
A1 + A2 Wp (
J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

196 / 218

Substituindo pelo estimador S


Teorema 8.4
). Seja m App
Seja y um vector aleatrio com distribuio Np ( ,
, m). Se y e A forem
uma matriz aleatria com distribuio Wp (
independentes, ento:
mp+1
(y )t A1 (y ) F(p,mp+1) .
mp
Vamos usar com m = n 1, A = S.

Teorema 8.5
Para uma amostra Multinormal, os estimadores X e S so
independentes.

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

197 / 218

Substituindo pelo estimador S (cont.)

Corolrio
Seja Xnp uma matriz aleatria cujas n linhas tm distribuio
) (i = 1, ..., n). Ento
Xi N ( ,
np
n (x )t S1 (x )
{z
}
(n 1)p |

F(p,np)

Estatistica T 2 de Hotelling

(vem de

) e (n 1)S Wp (
, n 1)).
n X Np ( n ,

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

198 / 218

Inferncia sobre (Multinormalidade)


Teste de Hipteses a = 0
Hipteses: H0 : = 0 vs. H1 : 6= 0

Estatstica do teste: F =
sob H0 .

(np)n
(n1)p

(X 0 )t S 1 (X 0 ) F(p,np),

Regio Crtica: (unilateral direita) Rejeitar H0 se Fcalc > f ;(p,np) .


(Fcalc calculado substituindo X pelo vector x da nossa amostra)

Regio de confiana para


A (1 ) 100% de confiana, so admissveis os vectores tais que
(x )t S 1 (x ) f (p,np)

p(n 1)
.
(n p)n

Estas regies de confiana so interiores de elipsides em Rp .


J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

199 / 218

O Lambda de Wilks
Uma quantidade que surge com frequncia em tcnicas de Estatstica
Multivariada o lambda de Wilks.

Definio 8.4
Sejam
, m) (m p);
App uma matriz aleatria com distribuio Wp (
, n);
Bpp uma matriz aleatria com distribuio Wp (
A e B independentes.
Ento,

det(A)
det(A + B)

1
det(Ip + A1B)

tem uma distribuio designada Lambda de Wilks, com parmetros p,


m e n, escrevendo-se:

J. Cadima (DM/ISA)

(p, m, n) .

Estatstica Multivariada

2009-10

200 / 218

Observaes sobre o Lambda de Wilks


Se um valor prprio de A1 B, ento 1 + um valor prprio
de Ip + A1 B:
(I + A1 B)x = x + A1 Bx = x + x = (1 + )x .
Logo, o Lambda de Wilks pode escrever-se como:

1
det(Ip + A1 B)

1
p

(1 + i )

i=1

onde os i s so os valores prprios de A1 B.


A distribuio exacta do Lambda de Wilks no conhecida!
So conhecidas vrias aproximaes distribuio

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

201 / 218

Aproximaes distribuio do Lambda de Wilks


Aproximao assinttica de Bartlett. Quando m +
1
(p, m, n)
(m (p n + 1)) log
2

2
pn
.

Para n = 1 uma transformao de tem distribuio F :


1 (p, m, 1) m p + 1

(p, m, 1)
p

F(p,mp+1) .

Para n = 2 uma transformao de tem distribuio F :


p
1 (p, m, 2) m p + 1
p

p
(p, m, 2)

F(2p,2(mp+1)) .

Para n = 2 e p > 2, tem-se, assintoticamente:


pn
1 1/s as 2 + 1

pn
1/s

com a = m 12 (p n + 1)
J. Cadima (DM/ISA)

s=

Estatstica Multivariada

F(pn,as pn +1) ,
2

p 2 n 4
.
p2 +n2 5
2009-10

202 / 218

O Lambda de Wilks e a MANOVA


Consideremos a generalizao da ANOVA a um factor com
vector-resposta p-variado, Y:
Xnp
| {z }

Bk p
| {z }

matriz do modelo matriz coeficientes

matriz resposta aleatoria

Cnk
| {z }

np
| {z}

erros aleatorios

com C = I1 | I2 | I3 | ... | Ik a matriz cujas k colunas so as indicatrizes


de cada um dos k nveis do factor.
Objectivo: Estudar se os k vectores mdios de nvel so iguais:

1 = 2 = 3 = ... = k Rp .

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

203 / 218

Pressupostos
Identifica-se cada vector observado (linhas da matriz X) por
dois ndices: Xij , em que o
primeiro ndice (i) indica o nvel do factor (i = 1, ..., k);
segundo ndice (j) indica o repetio no seio do nvel (j = 1, ..., ni ).
Admite-se que
As linhas da matriz X so observaes independentes.
em cada nvel do factor tem-se distribuio Multinormal:
Xij

i ) ,
Np ( i ,

onde Xij indica a j-sima observao no nvel i do factor.


a estrutura de (co)varincias igual nos k nveis:
1 = 2 = ... = k .

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

204 / 218

Se H0 verdade

H0 : 1 = 2 = ... = k
Nesse caso, todas as observaes Xij so identicamente distribudas:
Xij

) .
Np ( ,

Nesse caso, sabemos que um estimador centrado de S e


(n 1)S = T

J. Cadima (DM/ISA)

, n 1) .
Wp (

Estatstica Multivariada

2009-10

205 / 218

Para quaisquer i
),
Seja, ou no, H0 verdade, tem-se Xij N ( i ,

(tendo em conta que se admitiu comum em todos os nveis).


Se Si a varincia amostral das ni observaes do nvel i, temos:
, ni 1) ,
(ni 1) Si Wp (

i = 1, ..., k .

Um estimador conjunto da matriz de varincias comum, , dado


pela mdia ponderada das varincias amostrais, Si :
k

Sconj =

(ni 1) Si

i=1
k

(ni 1)

1
nk

(ni 1) Si .

i=1

i=1

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

206 / 218

Para quaisquer i (cont.)


k

(n k) Sconj = (ni 1)Si a soma de k Wishart, com comum.


i=1

Os k estimadores Si so independentes (baseiam-se em conjuntos


diferentes de observaes independentes).
Logo,
, n k) .
(n k) Sconj = W Wp (
A matriz 1n W = E a matriz da variabilidade intra-classes j discutida
na Anlise Discriminante Linear:
E =

1 t
X (In PC )X .
{z
}
n|
=W

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

207 / 218

Uma estatstica de teste


Para testar
H0 : 1 = 2 = ... = k

vs.

H1 : i, j tais que i 6= j

Sabemos que se H0 , um estimador de :


T = (n 1) S = Xt (In P1n )X
Sabemos que sempre, um estimador de :
W = (n k) Sconj = Xt (In PC )X
O princpio da razo de verosimilhanas para testar H0 vs. H1 gera a
seguinte estatstica de teste:

det(W )
.
det(T )

Mas T = W + B, onde B = Xt (PC P1n )X n H, sendo H a matriz de


variabilidade inter-classes da ADL.
J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

208 / 218

O Lambda de Wilks na MANOVA


=

1
det(W )
=
=
det(W + B)
det(In + W 1 B)

1 + i

i=1

onde i o i-simo maior valor prprio de W 1 B.


O Teorema de Cochran garante que
B

Xt (PC P1n ) X

, k 1) .
Wp (

As matrizes B e W so independentes, graas ao

Teorema de Craig
Seja dada uma matriz aleatria Xnp cujas linhas so vectores
). Sejam C1 e C2 matrizes
aleatrios i.i.d. com distribuio Np ( ,
(no aleatrias e de dimenso n n) simtricas. Ento Xt C1 X e Xt C2 X
so independentes se C1 C2 = 0.
J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

209 / 218

Teste MANOVA
Pressupostos: n observaes independentes p-variadas, em k nveis
dum factor
), i = 1; ..., k ; j = 1, ..., ni ; i ni = n.
Xij Np ( i ,
Hipteses:
H0 : 1 = 2 = ... = k

vs.

H1 : i, j t.q. i 6= j .

Estatstica do Teste:
==

det(W )
=
det(W + B)

1
p

(1 + i )

(p, n k, k 1) ,

i=1

com

W = Xt (In PC )X;
B = Xt (PC P1n )X;
i (i = 1, ..., p) valores prprios de W 1 B.

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

210 / 218

Teste MANOVA (cont.)

So os valores pequenos da estatstica que levam a rejeitar H0 .


MAS...
Os p-values da estatstica do teste so calculados usando as
aproximaes (Bartlett, F) que, em geral geram regies crticas
unilaterais direitas.

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

211 / 218

Estatsticas alternativas

Na literatura encontram-se estatsticas alternativas ao Lambda de


Wilks, mas tambm baseadas nos valores prprios i da matriz W 1 B:
p

Lambda de Wilks: =

1 + i .

i=1
p

Bartlett-Pillai: U =

i=1

i
1+i .

Primeira raz de Roy: max .


p

Hotelling-Lawley: V = i .
i=1

J. Cadima (DM/ISA)

Estatstica Multivariada

2009-10

212 / 218

Você também pode gostar