Você está na página 1de 9

Estudo Dirigido – Indicadores (Abordagem Multivariada)

Júlio César Lima Neves


Em estudo sobre a qualidade do solo, áreas submetidas a diferentes
usos e manejos
j d do solo
l fforam amostradas
t d e em cada
d uma d
delas
l 15
variáveis (indicadores) foram avaliadas mediante o uso da técnica de
análise multivariada denominada Análise de Componentes Principais
(ACP).

Para tanto, inicialmente, cada observação foi padronizada mediante o


uso da seguinte fórmula:

Valor padronizado = (observação – média)/desvio-padrão.

Esses valores foram, então, submetidos à ACP, obtendo-se as


informações constantes da Tabela 1 (mostradas apenas para os oito
primeiros componentes principais)
Tabela 1 - Coeficientes de carga ("loadings") das variáveis nos Componentes Principais (CP_1 a CP_8), Respectivos Autovalores,
Percentagem da Variãncia Explicada e "Regra
Regra de Seleção"
Seleção

Variável CP_1 CP_2 CP_3 CP_4 CP_5 CP_6 CP_7 CP_8

1 0.3991 -0.6556 -0.0478 -0.3223 -0.1570 -0.4601 0.2247 0.1101


2 -0.7728 -0.1485 0.4287 -0.2567 0.0698 -0.1797 -0.2781 -0.0334
3 0.6243 0.0516 0.3290 0.3960 -0.5649 -0.0695 -0.0431 0.0553
4 0.5644 -0.0190 0.6985 0.0365 -0.3635 -0.0174 -0.1774 -0.0002
5 -0.5766 0.4678 -0.2860 0.4794 -0.0441 -0.2513 -0.1856 -0.0263
6 -0
0.4328
4328 -0
0.1168
1168 -0
0.2589
2589 0 8120
0.8120 -0
0.0125
0125 -0
0.1324
1324 0 0007
0.0007 -0
0.0219
0219
7 -0.7015 -0.3079 0.1692 0.4901 -0.1339 0.0933 0.2584 -0.0230
8 -0.7196 -0.3343 0.4037 0.0411 -0.1119 0.2585 -0.0094 0.3360
9 -0.7862 -0.2650 0.4940 -0.0524 0.1326 -0.1034 0.0566 -0.0267
10 0.2868 -0.1329 0.7375 0.2515 0.5239 -0.1111 -0.0320 -0.0343
11 0 7742
0.7742 0 0072
0.0072 0 2869
0.2869 0 4005
0.4005 0 3318
0.3318 -0.0055
0 0055 0 1539
0.1539 0 0709
0.0709
12 -0.9249 -0.1272 0.0484 -0.2104 -0.1602 -0.0855 0.1263 -0.0411
13 -0.1721 0.8316 0.4245 -0.1091 -0.1219 0.0068 0.1828 -0.1843
14 -0.1783 0.9112 0.3090 -0.1174 -0.0679 -0.0446 0.1431 -0.0287
15 -0.1134 0.8806 -0.0934 -0.0527 0.1311 -0.1429 0.0130 0.3878

Autovalor do CP -> 5.223932 3.295272 2.279613 1.758204 0.97775 0.458147 0.360426 0.324681
% da Variância Total do CP -> 34.8262 21.9685 15.1974 11.7214 6.5183 3.0543 2.4028 2.1645
% da Variância Total Cumulativa 34.8262 56.7947 71.9921 83.7135 90.2318 93.2861 95.6890 97.8535
Regra de Seleção 0 2188
0.2188 0 2754
0.2754 0 3312
0.3312 0 3771
0.3771 0 5057
0.5057 0 7387
0.7387 0 8328
0.8328 0 8775
0.8775
Tendo em conta que cada variável original, após padronizada,
possuía variância =1, e que o objetivo da ACP é reduzir a
dimensão do conjunto de dados, de modo a obter novas variáveis
mais
i iinformativas
f ti ((os CP
CPs),
) pela
l combinação
bi ã lilinear d
de ttodas
d as
variáveis originais, pergunta-se:

a) Quais os CPs que você selecionaria dentre os mostrados na


tabela 1 ?

b) Em que você se baseou para responder o item a, logo acima ?

c) Qual é a proporção da informação originalmente contida no


conjunto
j t ded d
dados
d explicada
li d pelos
l CPCPs que você
ê selecionou
l i ?
(não se esqueça que os CPs são ortogonais entre si, por isso
pode-se somar a contribuição de cada CP)
Agora, vamos detectar dentre as 15 variáveis que foram avaliadas
(indicadores) aquelas mais informativas, ou seja, aquelas que mais se
correlacionam com os CPs, ou seja, os valores de carga das variáveis
nos CPs ou “loadings”, também mostrados na tabela 1. Apesar de na
tabela 1, se ter valor para a assim chamada regra de seleção, vamos
usar como nosso critério de seleção o valor de 0,70 (não se esqueça
que os valores de loadings devem ser considerados em módulo).
Dessa forma:

d) Em cada um dos CPs de sua resposta ao item a, acima, quais


são os indicadores que seriam selecionados ?

e) Com base na sua resposta ao item d, quais são os indicadores


que não seriam selecionados, pois não se destacaram em nenhum
dos CPs que você escolheu ?
Considere os “loadings” da tabela 1, correspondentes aos PC que voce
selecionou.. Eleve cada um dos valores ao quadrado.

Voce acabou de obter as “comunalidades”, que significam o grau de explicação


de cada variável em cada CP.

Perceba, que ao se considerar como relevantes as variáveis cujos “loadings”sáo


iguais ou maiores (em módulo) que 0,70, como 0,70 ao quadrado = 0,49, ou seja,
aproximadamente 0,50, estáo sendo consideradas relevantes as variáveis cujo
grau de explicaçao em cada componente é de no minimo 50%. %

Para cada PC, multiplique os valores de comunalidade de cada variável pelo


A t V l do
AutoValor d PC.
PC FFaça iisto
t para ttodos
d os PC que voce selecionou.
l i

Para cada variável, obtenha o somatório desses produtórios (Ai)

Para cada PC, obtenha o somatório dos produtórios , some-os.(Bl)

Para cada variável


variável, faça Ai / Bj
Bj. Voce acaba de obter o peso de cada variável no
modelo multivariado. A soma dos pesos das variáveis deve ser igual a 1.
Sua atenção, agora, deve ser posta na tabela 2. Os valores
constantes desta tabela maiores (em módulo) que 0,42, indicam
correlação significativa a 10% de probabilidade. Assim, com base nas
informações contidas na tabela 2, pergunta-se:

f) Há dentre os indicadores que você selecionou (item d


d, logo
acima) redundância mútua, ou seja, há indicadores correlacionados ?

g) Caso exista, quais são eles ?

h) E, dentre estes, quais estão mais estreitamente correlacionados


?

i) Qual é a importância prática de se saber sobre o grau de


correlação entre os indicadores ?
Tabela 2 - Matriz de Correlação Linear Simples ( r ) entre as 15 varíáveis (indicadores)

Indicador vs Indicador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

1 1.000 -0.138 0.188 0.213 -0.588 -0.297 -0.200 -0.162 -0.121 0.046 0.154 -0.141 -0.560 -0.584 -0.515
2 -0.138
0.138 1.000 -0.458
0.458 -0.135
0.135 0.237 0.038 0.449 0.712 0.867 0.120 -0.595
0.595 0.771 0.168 0.132 -0.059
0.059
3 0.188 -0.458 1.000 0.793 -0.188 -0.032 -0.150 -0.250 -0.440 0.226 0.556 -0.558 0.083 0.024 -0.125
4 0.213 -0.135 0.793 1.000 -0.481 -0.363 -0.259 -0.090 -0.131 0.503 0.490 -0.454 0.187 0.092 -0.182
5 -0.588 0.237 -0.188 -0.481 1.000 0.652 0.406 0.109 0.150 -0.302 -0.368 0.348 0.292 0.376 0.480
6 -0.297 0.038 -0.032 -0.363 0.652 1.000 0.643 0.230 0.240 -0.094 -0.093 0.274 -0.215 -0.201 -0.050
7 -0.200 0.449 -0.150 -0.259 0.406 0.643 1.000 0.721 0.661 0.009 -0.323 0.603 -0.054 -0.115 -0.269
8 -0.162 0.712 -0.250 -0.090 0.109 0.230 0.721 1.000 0.786 0.048 -0.432 0.702 -0.029 -0.070 -0.186
9 -0.121 0.867 -0.440 -0.131 0.150 0.240 0.661 0.786 1.000 0.233 -0.445 0.803 0.122 0.058 -0.151
10 0.046 0.120 0.226 0.503 -0.302 -0.094 0.009 0.048 0.233 1.000 0.697 -0.348 0.062 -0.008 -0.162
11 0 154
0.154 -00.595
595 0 556
0.556 0 490
0.490 -00.368
368 -00.093
093 -00.323
323 -00.432
432 -00.445
445 0 697
0.697 1 000
1.000 -00.810
810 -00.069
069 -00.092
092 -00.067
067
12 -0.141 0.771 -0.558 -0.454 0.348 0.274 0.603 0.702 0.803 -0.348 -0.810 1.000 0.149 0.119 -0.024
13 -0.560 0.168 0.083 0.187 0.292 -0.215 -0.054 -0.029 0.122 0.062 -0.069 0.149 1.000 0.973 0.626
14 -0.584 0.132 0.024 0.092 0.376 -0.201 -0.115 -0.070 0.058 -0.008 -0.092 0.119 0.973 1.000 0.787
15 -0.515 -0.059 -0.125 -0.182 0.480 -0.050 -0.269 -0.186 -0.151 -0.162 -0.067 -0.024 0.626 0.787 1.000
Para finalizar:

j) Q
Que outras informações,
ç , além das aqui
q fornecidas,, poderiam
p ser úteis
na seleção final de indicadores ?

Você também pode gostar