Escolar Documentos
Profissional Documentos
Cultura Documentos
Diretoria Executiva
Renato Paiva (Diretor)
Elias Tadeu Fialho
Conselho Editorial
Renato Paiva (Presidente)
Amauri Alves de Alvarenga
Carlos Alberto Silva
Elias Tadeu Fialho
Luiz Carlos de Oliveira Lima
ESTATÍSTICA MULTIVARIADA
Lavras - MG
c 2011 by Daniel Furtado Ferreira, 1a edição: 2008. 2a edição ampliada e revisada
Nenhuma parte desta publicação pode ser reproduzida, por qualquer meio ou forma, sem a
autorização escrita e prévia dos detentores do copyright.
Direitos de publicação reservados à Editora UFLA.
Impresso no Brasil - ISBN: 978-85-87692-52-8
Editora UFLA
Campus Histórico - Caixa Postal 3037
37200-000 - Lavras - MG.
Tel: (35) 3829-1115 - Fax: (35) 3829-1551
E-mail: vendas_editora@ufla.br - editora@ufla.br
Homepage: www.editora.ufla.br
Bibliografia.
ISBN 978-85-87692-52-8
CDD - 519.535
Sumário
1.1 Exercícios
1.1.1 Sejam os vetores x> = [1, 3] e y > = [2, −5]:
x2
3 x
2
kx − yk
1
θx,y
0
−1 0 1 2 3 x1
−1
−2
−3
−4
−5 y
e
v
u p
p uX p
kyk = y > y = t yi2 = 22 + (−5)2
i=1
√
= 29 = 5,3852.
1 0 0 1
√
cuja norma é ke1 k = 5.
O vetor e2 é
1 1 3
1 1 3
v2> e1
2 1
e2 =v2 − e1 0 − 5 1
= = −2 ,
ke1 k2 5
0 1 −2
0 1 −2
O vetor e3 é
0 3 1
0 3 1
v3> e2 v3> e1
2 2
e3 =v3 − e2 − e1 = 1 +
−2 − 1
ke2 k2 ke1 k2 15 5
1 −2 1
0 −2 1
0
0
1
= ,
1
3
1
−2
O vetor e4 é
O vetor x2 é
3
√ 3
1 30
x2 = e2 = −2 .
ke2 k 30
−2
−2
Finalmente, o vetor x3 é
0
√ 0
1 6
x3 = e3 =
.
1
ke3 k 6
1
−2
2 0 4 2 0 6
1 1 1
4 2 2
A(1) = − 12 1 −1 .
− 12 −1 3
(1)
Escolhendo como pivô a22 = 1 temos
1
− 12
2 1
A(2) = − 12 1 −1 .
−1 1 2
(2)
O último possível pivô é a33 = 2. Assim,
1 −1 − 12
A(3) = −1 3 1
,
2 2
− 12 1
2
1
2
que é a inversa
1 −1 − 12
A−1 = −1 3 1
.
2 2
− 12 1
2
1
2
1 2 1
6 3 3
B (1) = − 32 4
− 34 .
3
− 13 − 43 16
3
(1)
Escolhendo como pivô b22 = 4/3 temos
1
− 12
2 1
B (2) = − 12 3
−1 .
4
−1 1 4
(2)
O último possível pivô é b33 = 4. Assim,
3
− 34 − 41
4
B (3) = − 34 1 1
,
4
− 41 1
4
1
4
que é a inversa
3 −3 −1
1
B −1 = −3 4 1 .
4
−1 1 1
2 0 4 2 0 6 20 8 28
(AB)−1 =B −1 A−1
1 −1 − 12
13 −16 −7 3 −3 −1
1 1 3 1
−15 19 8 = −3 4 1 −1
8 4 2 2
1 1 1
−5 6 3 −1 1 1 −2 2 2
13 −16 −7 13 −16 −7
1 1
−15 19 8 = −15 19 8 ,
8 8
−5 6 3 −5 6 3
CQM.
é
" #
(8) 1,000000
v == .
0,618034
A(1) =A − λ1 x1 x>
1
" # " #
4 2 0,8506508 h i
= − 5,236068 0,8506508 0,5257311
2 2 0,5257311
" #
0,2111458 −0,3416409
= .
−0,3416409 0,5527862
λ2 =x>2A
(1)
x2
" #" #
h i 0,2111458 −0,3416409 0,52573
= 0,52573 −0,85065
−0,3416409 0,5527862 −0,85065
=0,763932.
(b) construa uma matriz P com cada coluna formada dos autovetores de A;
A matriz P é
" #
0,8506508 0,5257314
P =
0,5257311 −0,8506506
e
" #" #
> 0,8506508 0,5257314 0,8506508 0,5257311
PP = = I,
0,5257311 −0,8506506 0,5257314 −0,8506506
e, portanto,
P > AP =Λ
" #
5,236068 0,000000
= .
0,000000 0,763932
e, portanto,
P ΛP > =A
" #
4 2
= ,
2 2
CQM.
" # " #
−1 1 0,4 −2,4 −0,008 0,144
A =− = .
50 −2,4 4,8 0,144 −0,092
(g) encontre os autovalores de A−1 e verifique a relação que eles têm com os
autovalores de A.
Utilizando o método da potência encontramos λ1 = 0,1 e λ2 = −0,2.
Podemos verificar facilmente que os autovalores de de A−1 são exatamente
os recíprocos dos autovalores de A.
1.1.6 É possível afirmar que se o determinante de uma matriz está muito próximo
de 0 é porque a matriz está próxima da singularidade?
Não. Determinante próximo de zero não implica necessariamente na quase
singularidade. No exercício a seguir, isso fica muito claro. É claro que a maior
parte das vezes que o determinante aproxima-se de zero, é indicativo de que
algumas linhas ou colunas da matriz está próxima de ser uma combinação linear
das demais, embora isso não seja verdade sempre. Então, afirmar algo sobre a
singularidade de uma matriz baseado no seu determinante é uma prática com
risco de falhar muito alto.
1
|A| =n × =1 e |B| =0,1n .
n
1
lim n × = 1.
n→∞ n
Assim, a matriz A caminha para a singularidade, uma vez que a segunda linha
ou segunda coluna tende para um vetor nulo, enquanto seu determinante fica
inalterado em 1, bem distante de se aproximar de zero.
Por outro, lado se n → ∞, a matriz B fica longe da não-singularidade, pois sua
diagonal fica com elementos iguais a 0,1, embora sua dimensão é que aumente.
Entretanto,
x> Ax
λ(x) = , |B| =
6 0.
x> Bx
np n 1 Pn
1.1.9 Seja a função g(µ,Σ; x) = − ln(2π)− ln(|Σ|)− (xj −µ)> Σ−1 (xj −
2 2 2 j=1
µ), com n, p ∈ N, xj (p × 1) conhecidos e Σ (p × p) e µ (p × 1) desconhecidos.
Obtenha a derivada ∂g(µ,Σ; x)/∂µ. Iguale a função resultante a zero e encon-
tre a solução para µ. Substitua a solução encontrada em g(µ,Σ; x) e obtenha
2.1 Exercícios
2.1.1 Seja a função de distribuição bivariada dada pela seguinte expressão F (y1 , y2 )
= k 25 y14 y2 + 15 y1 y23 , no domínio 0 ≤ y1 ≤ 1 e 0 ≤ y2 ≤ 1. Determine:
(a) A constante k para que F (y1 , y2 ) seja uma função de distribuição legítima.
Para que F (y1 , y2 ) seja uma genuína função de distribuição de probabili-
dade bivariada F (1, 1) = 1 e F (0, 0) = 0. Assim, qualquer que seja k ∈
R, F (0, 0) = 0. Para o outro caso temos
2 1 3k
F (1, 1) =1 = k × 14 × 1 + × 1 × 13 = .
5 5 5
1
F (y1 ,y2 )
0.5
0 1
0 0.5
0.2 0.4
0.6 0.8 y2
y1 1 0
A função de distribuição é
2 1
F (y1 ,y2 ) = y14 y2 + y1 y23 .
3 3
∂ 2 F (y1 ,y2 ) ∂ 8 3 1
f (y1 ,y2 ) = = y1 y2 + y23
∂y1 ∂y2 ∂y2 3 3
8 3
= y1 + y22 ,
3
4
f (y1 ,y2 )
0 1
0 0.5
0.2 0.4
0.6 0.8 y2
y1 1 0
1Z 1
1 3 1
Z
Z 1
8 3 2 8 4
E(Y1 ) =µ1 = y1 y + y2 dy2 dy1 = y y2 + y2 y1 dy1
0 0 3 1 0 3 1 3 0
Z 1 1
8 4 1 8 5 1 2 8 1 7
= y1 + y1 dy1 = y1 + y1 = + = .
0 3 3 15 6 0 15 6 10
1Z 1
4 3 2 1 4 1
Z Z 1
8 3 2
E(Y2 ) =µ2 = y2 y + y2 dy2 dy1 = y y + y dy1
0 0 3 1 0 3 1 2 4 2 0
Z 1 1
4 3 1 1 4 1 1 1 7
= y1 + dy1 = y1 + y1 = + = .
0 3 4 3 3 0 3 4 12
Z 1Z 1 2
2 7 8 3 2
E(Y2 − µ2 ) =σ22 = y2 − y + y2 dy1 dy2
0 0 12 3 1
59
=
720
e
−1/60
ρ12 = p p = −0,2273967435.
59/900 59/720
8
f (x1 ,x2 ) = x31 + x22 .
3
e (y − µ)> Σ−1 (x − µ) é
> −1 53100 43470 10800 7
(y − µ) Σ (x − µ) = y1 − + y2 x 1 − +
3301 3301 3301 10
10800 32340 42480 7
+ y1 − + y2 x 2 −
3301 3301 3301 12
=1,120701108.
e o coeficiente de curtose é
Z 1 Z 1 2
(y − µ)> Σ−1 (y − µ) f (y1 ,y2 )dy1 dy2
β22 =
0 0
=6,610376680.
3
y12 + y22 − 5 ≥0
−
13
y12 + y22 ≤ 5.
Assim, a função apresentada atende aos requisitos para ser considerada uma
função densidade legítima. O seu gráfico apresentado a seguir nos fornece
um mecanismo para verificarmos a primeira das propriedades anteriormente
apresentada.
1.2
1
f (y1 ,y2 )
0.8
1
0 0.5
0.2 0.4
0.6 0.8 y2
y1 1 0
1
F (y1 ,y2 )
0.5
0
0
1
0.5 0.8
0.6
0.4
y1 1 0 0.2
y2
2.1.3 Sejam dois vetores aleatórios y1 = [2, 3]> e y2 = [2, 1]> e considere a matriz
logo, determine:
(d) Qual das três distâncias você considera mais apropriada para essa situação
e por quê?
Houve uma grande diferença nos valores das três distância, sendo que a
mais apropriada para essa situação é a distância de Mahalanobis. Há di-
ferença nas escalas das variáveis, o que não é contemplado pela distância
euclidiana, mas é pela distância de Karl Pearson. Entretanto, a correla-
ção entre as duas variáveis do modelo é de 0,6708. A distância de Karl
Pearson não considera a correlação (covariância) entre as variáveis, o que
é feito pela distância generalizada de Mahalanobis. Assim, a distância