Você está na página 1de 32

TRABALHO 1

ANLISE MULTIVARIADA
Marcela Almeida Alves
Thais Santos Maria
Exerccio 1.14
Os dados relacionam-se com as respostas dois
estmulos visuais diferentes, registrados a partir do
couro cabeludo do sujeito, que produziram respostas
tanto no olho esquerdo (L) como no olho direito (R), e
foram utilizados para desenvolver uma regra para
separar as pessoas que sofrem de uma patologia
visual causada por esclerose mltipla daqueles que
no sofrem da doena.
Exerccio 1.14
Os valores registrados na tabela incluem
x1: idade do sujeito
X2: resposta total de ambos os olhos ao estmulo S1,
isto S1L + S1R
X3: diferena entre as respostas dos olhos ao estmulo
S1, isto |S1L - S1R|
X4: resposta total de ambos os olhos ao estmulo S2,
isto S2L + S2R
X5: diferena entre as respostas dos olhos ao estmulo
S2, isto |S2L - S2R|
Anlise descritiva
Grupo sem esclerose mltipla

37,9855
147,2898
= 1,5623
195,6028
1,6202

277,6321 95,3983 5,3612 103,7235 3,2414


95,3983 112,2947 1,7663 106,7850 2,0422
= 5,3612 1,7663 1,8050 2,2348 0,5013
103,7235 106,7850 2,2348 185,2288 2,3511
3,2414 2,0422 0,5013 2,3511 2,3554
Anlise descritiva
Grupo sem esclerose mltipla

1 0,5402 0,2394 0,4573 0,1267


0,5402 1 0,1240 0,7404 0,1255
= 0,2394 0,1240 1 0,1222 0,2431
0,4573 0,7404 0,1222 1 0,1125
0,1267 0,1255 0,2431 0,1125 1

Percebe-se que h uma correlao positiva mais fraca


entre as variveis. A menor correlao de 0,1125 entre a
resposta total de ambos os olhos ao estmulo S2 e a diferena
entre as respostas dos olhos ao estmulo S2 , e a maior
correlao 0,7404 entre a resposta total de ambos os olhos ao
estmulo S1 e a resposta total de ambos os olhos ao estmulo
S2.
Representao grfica
Matriz de disperso grupo sem esclerose mltipla
Anlise descritiva
Grupo com esclerose mltipla

42,0689
178,2689
= 12,2758
236,9310
13,0827

121,1379 52,7950 20,2197 68,1335 29,8202


52,7950 844,6807 244,4632 912,4149 106,7640
= 20,2197 244,4631 317,2640 232,3654 297,3192
68,1335 912,4149 232,3654 1180,0322 81,0973
29,8202 106,7640 297,3192 81,0973 351,0471
Anlise descritiva
Grupo com esclerose mltipla

1 0,1650 0,1031 0,1802 0,1446


0,1650 1 0,4722 0,9139 0,1960
= 0,1031 0,4722 1 0,3797 0,8909
0,1802 0,9139 0,3797 1 0,1260
0,1446 0,1960 0,8909 0,1260 1

Percebe-se a menor correlao de -0,1446 entre a


diferena entre as respostas dos olhos ao estmulo S2 e a idade,
e a maior correlao 0,9139 entre a resposta total de ambos
os olhos ao estmulo S1 e a resposta total de ambos os olhos ao
estmulo S2.
Representao grfica
Matriz de disperso grupo com esclerose mltipla
Normalidade multivariada
Grupo sem esclerose mltipla
1) O grfico das distncias quadradas 2 versus 2 resultou
em uma reta, mostrando uma relao aproximadamente linear, e
supondo uma distribuio normal multivariada. Porm h um ponto
fora da reta que pode indicar grandes distncias ou observaes
outliers.
Normalidade multivariada
Grupo sem esclerose mltipla

2) Outro modo de obter suposio de distribuio


normal multivariada feita por um teste grosseiro, onde
temos que a metade dos 2 (exatamente 45) so menores ou
iguais a 2 (0,50), ou seja, podemos supor distribuio
normal multivariada.
Como provamos que as observaes do conjunto de
dados provm de uma distribuio normal multivariada,
podemos dizer que cada distribuio marginal univariada
normal.
Representao grfica
Q-Qplot para os dados do grupo sem esclerose mltipla
Normalidade multivariada
Grupo com esclerose mltipla
1) O grfico das distncias quadradas 2 versus 2 resultou
em uma reta, mostrando uma relao aproximadamente linear, e
supondo uma distribuio normal multivariada. Porm h dois
pontos fora da reta que podem indicar grandes distncias ou
observaes outliers.
Normalidade multivariada
Grupo com esclerose mltipla

2) Outro modo de obter suposio de distribuio


normal multivariada feita por um teste grosseiro, onde
temos que a metade dos 2 (exatamente 23) so menores ou
iguais a 2 (0,50), ou seja, podemos supor distribuio
normal multivariada.
Como provamos que as observaes do conjunto de
dados provm de uma distribuio normal multivariada,
podemos dizer que cada distribuio marginal univariada
normal.
Representao grfica
Q-Qplot para os dados do grupo com esclerose mltipla
Exerccio 1.15
Os dados da Tabela 1.7 consistem em
variveis relacionadas com as respostas
radioterapia de pacientes com cncer. A varivel
medida inclui x1 (nmero de sintomas, como dor de
garganta ou nusea), x2 (quantidade de atividade
em uma escala de 1-5), x3 (quantidade de sono em
uma escala de 1-5), x4 (quantidade de alimento
consumido em uma escala de 1-3), x5 (apetite em
uma escala de 1-5) e x6 (reao cutnea em uma
escala de 0-6)
Anlise descritiva
3,5423
1,8093
2,1376
=
2,2090
2,5748
1,2755

4,6547 0,9313 0,5869 0,2769 1,0748 0,1581


0,9313 0,6128 0,1109 0,1184 0,3888 0,0248
0,5896 0,1109 0,5714 0,0870 0,3479 0,1101
=
0,2769 0,1184 0,0870 0,1104 0,2174 0,0218
1,0748 0,3888 0,3479 0,2174 0,8621 0,0088
0,1581 0,0248 0,1101 0,0218 0,0088 0,8614
Anlise descritiva
1 0,5514 0,3615 0,3862 0,5365 0,0789
0,5514 1 0,1874 0,4554 0,5350 0,0342
0,3615 0,1874 1 0,3463 0,4957 0,1569
=
0,3862 0,4554 0,3463 1 0,7046 0,0707
0,5365 0,5350 0,4957 0,7046 1 0,0102
0,0789 0,0342 0,1569 0,0707 0,0102 1

Percebe-se que a menor correlao de -0,0342 entre a


quantidade de atividade e a reao cutnea e a maior
correlao de 07046 entre o apetite e a quantidade de
comida consumida.
Representao grfica
Matriz de disperso
Normalidade multivariada
1) O grfico das distncias quadradas 2 versus
2 , respectivamente, resultou em uma reta, mostrando uma relao
aproximadamente linear, e supondo uma distribuio normal
multivariada. No h pontos fora da reta, ou seja, no temos grandes
distncias ou observaes outliers.
Normalidade multivariada
2) Outro modo de obter suposio de distribuio
normal multivariada feita por um teste grosseiro, onde
temos que a metade dos 2 (exatamente 57) so menores ou
iguais a 2 (0,50), ou seja, podemos supor distribuio
normal multivariada.
Como provamos que as observaes do conjunto de
dados provm de uma distribuio normal multivariada,
podemos dizer que cada distribuio marginal univariada
normal.
Representao grfica
Q-Qplot para os dados da Tabela 1.7
Exerccio 1.16
Em um estudo para determinar se o
exerccio ou suplementos dietticos iria
retardar a perda ssea em mulheres mais
velhas, um investigador mediu o contedo
mineral do osso por absoro de ftons. As
medies foram registradas para trs ossos nos
lados dominante e no-dominante e so
mostrados na tabela 1.8
Tabela 1.8: Contedo mineral nos ossos
Rdio Rdio mero mero Ulna Ulna
dominante no-dominante dominante no-dominante dominante no-dominante
1 1.103 1.052 2.139 2.238 0.873 0.872
2 0.842 0.859 1.873 1.741 0.590 0.744
3 0.925 0.873 1.887 1.809 0.767 0.713
4 0.857 0.744 1.739 1.547 0.706 0.674
5 0.795 0.809 1.734 1.715 0.549 0.654
6 0.787 0.779 1.509 1.474 0.782 0.571
7 0.933 0.880 1.695 1.656 0.737 0.803
8 0.799 0.851 1.740 1.777 0.618 0.682
9 0.945 0.876 1.811 1.759 0.853 0.777
10 0.921 0.906 1.954 2.009 0.823 0.765
11 0.792 0.825 1.624 1.657 0.686 0.668
12 0.815 0.751 2.204 1.846 0.678 0.546
13 0.755 0.724 1.508 1.458 0.662 0.595
14 0.880 0.866 1.786 1.811 0.810 0.819
15 0.900 0.838 1.902 1.606 0.723 0.677
16 0.764 0.757 1.743 1.794 0.586 0.541
17 0.733 0.748 1.863 1.869 0.672 0.752
18 0.932 0.898 2.028 2.032 0.836 0.805
19 0.856 0.786 1.390 1.324 0.578 0.610
20 0.890 0.950 2.187 2.087 0.758 0.718
21 0.688 0.532 1.650 1.378 0.533 0.482
22 0.940 0.850 2.334 2.225 0.757 0.731
23 0.493 0.616 1.037 1.268 0.546 0.615
24 0.835 0.752 1.509 1.422 0.618 0.664
25 0.915 0.936 1.971 1.869 0.869 0.868
Anlise descritiva
0,8438
0,8183
1,7927
=
1,7348
0,7044
0,6938

0,0125 0,0099 0,0214 0,0193 0,0087 0,0076


0,0099 0,0109 0,0178 0,0202 0,0082 0,0085
0,0214 0,0178 0,0771 0,0641 0,0162 0,0123
= 0,0193 0,0202 0,0641 0,0667 0,017 0,0161
0,0087 0,0082 0,0161 0,017 0,0111 0,0077
0,0076 0,0085 0,0123 0,0161 0,0077 0,0101
Anlise descritiva
1 0,8518 0,6915 0,6683 0,7437 0,6779
0,8518 1 0,6119 0,7491 0,7421 0,8098
0,6915 0,6119 1 0,8936 0,5522 0,4402
=
0,6683 0,7490 0,8936 1 0,6255 0,6188
0,7437 0,7421 0,5522 0,6255 1 0,7289
0,6779 0,8098 0,4402 0,6188 0,7289 1

Percebe-se que h uma correlao significativamente


positiva entre todas as variveis. A menor correlao de
0,4402 entre o mero dominante e a ulna no-dominante, e a
maior correlao 0,8936 entre o mero dominante e o mero
no-dominante
Representao grfica
Matriz de disperso
Normalidade multivariada
1) O grfico das distncias quadradas 2 versus
2 , respectivamente, resultou em uma reta, mostrando uma relao
aproximadamente linear, e supondo uma distribuio normal
multivariada. No h pontos fora da reta, ou seja, no temos grandes
distncias ou observaes outliers.
Normalidade multivariada
2) Outro modo de obter suposio de distribuio
normal multivariada feita por um teste grosseiro, onde
temos que a metade dos 2 (exatamente 12) so menores ou
iguais a 2 (0,50), ou seja, podemos supor distribuio
normal multivariada.
Como provamos que as observaes do conjunto de
dados provm de uma distribuio normal multivariada,
podemos dizer que cada distribuio marginal univariada
normal.
Representao grfica
Q-Qplot para os dados da Tabela 1.8
PERGUNTAS?
OBRIGADA