Você está na página 1de 60

Anlise Mult ivariada

M aria Fernanda Piment el (UFPE)


Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Reconheciment o de
Padres
Encontrar similaridades e diferenas entre grupos
de amostras que foram submetidos a algum tipo de
anlise.
Supervisionados
No Supervisionados
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Var iveis
Reconheciment o de padres
no super visionado
Avalia a existncia de agrupamentos sem utilizar
o conhecimento prvio dos membros das classes, ou
seja, as amostras so examinadas utilizando apenas
medidas de alguma(s) propriedade(s) com intuito de se
observar agrupamentos naturais.
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Principais t cnicas no
supervisionadas
Anlise de Agrupamento Hierrquico
(HCA Hierarchical Cluster Analysis)
Analise de Componentes Principais
(PCA- Principal Component Analysis)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Reconheciment o de Padres
Super visionados
Um conjunto de Treinamento com objetos de
categorias conhecidas utilizado para a
elaborao de modelos que sejam capazes de
identificar amostras desconhecidas.
Var iveis
ndice de
classes
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Principais t cnicas
super visionadas
SIMCA -- SSoft IIndependent
MModelling of CClass
Analogies
Anlise Discriminante Linear
(LDA Linear Discriminant Analysis)
K-Vizinhos Mais Prximos
(KNN K Nearrest Neighbor)
?
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Bibliografia
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Programas
Minitab Statistica Matlab GNU Octave The Unscrambler
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Anlise de Component es
Principais
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
O que uma PCA? O que uma PCA?
Uma tcnica de projeo do mximo de
informao no mnimo de dimenses no
correlacionadas
Para que serve uma PCA?
Anlise explorat ria:
Reconhecimento de padres de associao
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Para que serve uma PCA?
Reduo da dimensionalidade
Deteco de anomalias
Separao sinal-rudo
Seleo de variveis
Classificao
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Dados:
So organizados em planilhas onde:
As linhas correspondem aos objet os
para os quais os valores das variveis
so determinados ou atribudos.
As colunas correspondem s variveis.
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Exemplo: Dimenses de ris
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Farinhas de t rigo (element os I CP OES)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Farinhas de t rigo
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Biodiesel espect ros MI R
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
leos lubrificant es espect ros NI R
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Est urio gua, sediment o, alga
Silvana Carvalho de Souza Calado
Doutorado em Oceanografia .
Universidade Federal de Pernambuco, UFPE, Brasil.
Nveis de concentraes de metais pesados em macroalgas e em sedimentos
marinhos de Pernambuco-Brasil, Ano de Obteno: 2004.
Orientador: Slvio Jos de Macdo
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
O que uma PCA?
- Uma tcnica de projeo
- do mximo de informao
- no mnimo de dimenses
- no correlacionadas
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Farinhas
Cu (ug/L)
M
n

(
u
g
/
L
)
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0
2
4
6
8
10
12
14
16
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
150 200 250 300 350 400 450 500 550
Mg (ug/L)
2
4
6
8
10
12
14
16
M
n

(
u
g
/
L
)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
1
n
i
i
x
x
n
=
=

Um valor individual: x
i
Mdia de todos os valores x
i
:
Desvio de x
i
em relao mdia:
Recordando:
i i
d x x =
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
A varincia uma medida da informao
( )
( )
2
2 1
V
1
n
i
i
x
x x
x s
n
=

= =

O desvio padro a raiz quadrada da varincia


Varincia:
A varincia mede a
disperso dos valores
em torno da mdia
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Cu (ug/L)
M
n

(
u
g
/
L
)
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0
2
4
6
8
10
12
14
16
Farinhas (Mn x Cu)
6.389
0.1941
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
150 200 250 300 350 400 450 500 550
Mg (ug/L)
2
4
6
8
10
12
14
16
M
n

(
u
g
/
L
)
6.389
4547.43
Farinhas (Mn x Mg)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
A covarincia mede a redundncia da informao
Covarincia:
( ) ( )
1
( , )
1
i i
Cov x y x x y y
n
=


Desvant agem: Dependem das unidades
A covarincia mede a co-disperso (a tendncia de
duas variveis se desviarem ao mesmo tempo para
o mesmo lado da mdia)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Cu (ug/L)
M
n

(
u
g
/
L
)
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0
2
4
6
8
10
12
14
16
0.1941
0.894 6.389
Farinhas (Mn xCu)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
150 200 250 300 350 400 450 500 550
Mg (ug/L)
2
4
6
8
10
12
14
16
M
n

(
u
g
/
L
)
6.389
4547.43
119.28
Farinhas (Mn x Mg)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
O coeficiente de correlao tambm uma
medida da redundncia da informao
Coeficient e de correlao:
Vant agem: O coeficiente de correlao
no depende das unidades, e fica no
intervalo [-1, +1]
1
( , )
1
i i
x y
x x y y
r x y
n s s
| |
| |

=
|
|
|

\ .
\ .

Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Cu (ug/L)
M
n

(
u
g
/
L
)
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0
2
4
6
8
10
12
14
16
Farinhas (Mn x Cu)
0.803
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
150 200 250 300 350 400 450 500 550
Mg (ug/L)
2
4
6
8
10
12
14
16
M
n

(
u
g
/
L
)
0.6997
Farinhas (Mn x Mg)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Pr-processament o
C
x x x =
Centralizao na mdia:
Auto-escalonamento:
A
C
x
x
x
s
=
Adimensional
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Cent ralizao na mdia:
Translao da origem do sistema de eixos
para a mdia.
Todas as mdias ficam iguais a zero.
No muda a escala No altera as
varincias.
Aut o-escalonament o:
Todas as mdias ficam iguais a zero.
Muda a escala Todas as varincias
ficam iguais a um.
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1. 2
Cu centralizado (ug/L)
-6
-4
-2
0
2
4
6
8


M
n

c
e
n
t
r
a
l
i
z
a
d
o

(
u
g
/
L
)
0.1941
6.389
Farinhas (Mn x Cu)
Cent ralizado na mdia
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2. 5
Cu autoescalonado
-2
-1
0
1
2
M
n

a
u
t
o
e
s
c
a
l
o
n
a
d
o

1.0
1.0
Farinhas (Mn x Cu)
Aut oescalonado
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Centralizao dos dados na mdia no Centralizao dos dados na mdia no Unscrambler Unscrambler
The Unscrambler The Unscrambler
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Auto Auto--Escalonamento no Escalonamento no Unscrambler Unscrambler
The Unscrambler
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
PC3: De mxima varincia, ortogonal a PC1 e PC2
Quem so as PCs?
PCk: De mxima varincia, ortogonal ao espao das
componentes anteriores
PC1: Eixo de mxima varincia
PC2: De mxima varincia, ort ogonal a PC1
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Cu (ug/L)
M
n

(
u
g
/
L
)
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0
2
4
6
8
10
12
14
16
Variveis originais
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-2.5 -2.0 -1.5 -1.0 -0.5 0. 0 0.5 1.0 1.5 2.0 2. 5
Cu autoescalonado
-2
-1
0
1
2
M
n

a
u
t
o
e
s
c
a
l
o
n
a
d
o

PC1
PC2
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-2.5 -2.0 -1.5 -1.0 -0.5 0. 0 0.5 1.0 1.5 2.0 2. 5
Cu autoescalonado
-2
-1
0
1
2
M
n

a
u
t
o
e
s
c
a
l
o
n
a
d
o

PC1
PC2
Escores coordenadas
dos objetos nos eixos
das PCs
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2. 5
Cu autoescalonado
-2
-1
0
1
2
M
n

a
u
t
o
e
s
c
a
l
o
n
a
d
o

PC1
PC2
Pesos (loading) co-
senos dos ngulos entre o
eixo PC e as variveis
originais
Obs Obs:: quanto quanto menor menor oo ngulo, ngulo, maior maior oo peso, peso, oo que que reflete reflete na na
maior maior importncia importncia da da varivel varivel naquele naquele PC PC..
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-4 -3 -2 -1 0 1 2 3 4
PC1 (90.14%)
-4.0
-3.5
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
P
C
2

(
9
.
8
6
%
)
Grfico dos escores
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Pesos
x
2
x
1
Loading = cos u
1
~ 0.65
u
1
~ 30
o
Loading = cos u
2
~ 0.45
u
2
~ 60
o
Obs Obs:: quanto quanto menor menor oo ngulo, ngulo, maior maior oo peso, peso, oo que que reflete reflete na na
maior maior importncia importncia da da varivel varivel naquele naquele PC PC..
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Farinhas (Mn x Cu x Zn)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
PC1 (81,3%) = 0,58 Cu + 0,55 Mg + 0,61 Mn
PC2 (13,2%)= -0,57 Cu + 0,80 Mg - 0,18 Mn
PC3 (5,5%) = -0,58 Cu - 0,24 Mg + 0,78 Mn
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5
PC1 (81.30%)
-6.0
-5.5
-5.0
-4.5
-4.0
-3.5
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
P
C
2

(
1
3
.
2
5
%
)
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5
PC1 (81.30%)
-6.0
-5.5
-5.0
-4.5
-4.0
-3.5
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
P
C
3

(
5
.
4
5
%
)
Grficos dos escores
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Farinhas (Mn x Cu x P)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-5 -4 -3 -2 -1 0 1 2 3 4 5
PC1 (60.10%)
-5.0
-4.5
-4.0
-3.5
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
P
C
2

(
3
3
.
4
7
%
)
PC1 (60,1%) = 0,71 Cu + 0,71 Mn + 0,01 P
PC2 (33,5%)= 0,06 Cu + 0,04 Mn + 0,98 P
PC3 (6,4%) = -0,71 Cu + 0,71 Mn 0,07 P
Grficos dos escores
-5 -4 -3 -2 -1 0 1 2 3 4 5
PC1 (60.10)%
-5.0
-4.5
-4.0
-3.5
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
P
C
3

(
6
.
4
3
%
)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Farinhas de t rigo (8 variveis)
54 amostras
autoescalonamento
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
"aju1"
"bel1"
"bel2"
"bsb1" "bsb2"
"bsb3"
"bsb4"
"flp1"
"flp2"
"f lp3"
"f sa1" "f sa2"
"f sa3"
"f sa4"
"ftz1"
"f tz2"
"jeq1"
"jeq2"
"jeq3"
"jeq4"
"mcp1"
"mcp2"
"nit1"
"nit2" "nit3"
"nit4"
"nit5"
"nit6"
"nit7"
"pab1"
"pdc1"
"pdc2"
"pdc3"
"poa1"
"poa2"
"poa3"
"rec1"
"rec2"
"rgn1"
"rio1"
"rio2"
"rio3"
"rio4"
"ssa1"
"ssa2"
"ssa3"
"ssa4"
"ssa5"
"ssa6"
"ssp1"
"ssp2"
"ssp3"
"ssp4"
"ssp5"
-6 -4 -2 0 2 4 6
PC1 (41.07%)
-2
-1
0
1
2
3
4
5
6
P
C
2

(
2
1
.
8
0
%
)
Grficos dos escores
Cuidado com a
escala!!!
"aju1" "bel1"
"bel2"
"bsb1" "bsb2"
"bsb3"
"bsb4"
"flp1"
"flp2"
"flp3"
"fsa1" "fsa2" "fsa3" "fsa4"
"ftz1"
"ftz2"
"jeq1"
"jeq2"
"jeq3"
"jeq4"
"mcp1"
"mcp2"
"nit1"
"nit2" "nit3"
"nit4"
"nit5"
"nit6"
"nit7"
"pab1"
"pdc1"
"pdc2"
"pdc3"
"poa1"
"poa2"
"poa3"
"rec1"
"rec2"
"rgn1"
"rio1"
"rio2"
"rio3"
"rio4"
"ssa1"
"ssa2"
"ssa3"
"ssa4"
"ssa5"
"ssa6"
"ssp1"
"ssp2" "ssp3"
"ssp4"
"ssp5"
-4 -2 0 2 4
PC1 (41.07%)
-5
-4
-3
-2
-1
0
1
2
3
4
5
P
C
2

(
2
1
.
8
0
%
)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
"aju1"
"bel1"
"bel2"
"bsb1" "bsb2"
"bsb3"
"bsb4"
"flp1"
"flp2"
"flp3"
"fsa1" "fsa2"
"fsa3"
"fsa4"
"ftz1"
"ftz2"
"jeq1"
"jeq2"
"jeq3"
"jeq4"
"mcp1"
"mcp2"
"nit1"
"nit2" "nit3"
"nit4"
"nit5"
"nit6"
"nit7"
"pab1"
"pdc1"
"pdc2"
"pdc3"
"poa1"
"poa2"
"poa3"
"rec1"
"rec2"
"rgn1"
"rio1"
"rio2"
"rio3"
"rio4"
"ssa1"
"ssa2"
"ssa3"
"ssa4"
"ssa5"
"ssa6"
"ssp1"
"ssp2"
"ssp3"
"ssp4"
"ssp5"
-4 -2 0 2 4
PC1 (41.07%)
-2
-1
0
1
2
3
4
5
6
P
C
2

(
2
1
.
8
0
%
)
Ca Cu Fe K Mg Mn P Zn
PC1 0,16 -0,46 0,13 -0,14 -0,48 -0,50 0,00 -0,49
PC2 0,66 -0,05 -0,08 0,22 0,11 0,02 0,70 0,06
PC3 -0,09 -0,27 0,66 0,66 0,15 -0,02 -0,10 0,11
PC PC % exp % exp % acul % acul
11 41 41 41 41
22 22 22 63 63
33 15 15 78 78
4 10 88
5 5 93
6 3 96
7 2 98
8 2 100
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
"aju1"
"bel1"
"bel2"
"bsb1"
"bsb2"
"bsb3"
"bsb4"
"flp1"
"flp2"
"flp3"
"fsa1"
"fsa2"
"fsa3"
"fsa4"
"ftz1"
"ftz2"
"jeq1"
"jeq2"
"jeq3"
"jeq4"
"mcp1"
"mcp2" "nit1"
"nit2"
"nit3"
"nit4"
"nit5"
"nit6"
"nit7"
"pab1"
"pdc1"
"pdc2"
"pdc3"
"poa1"
"poa2"
"poa3"
"rec1"
"rec2"
"rgn1"
"rio1"
"rio2"
"rio3"
"rio4"
"ssa1"
"ssa2"
"ssa3"
"ssa4"
"ssa5"
"ssa6"
"ssp1"
"ssp2"
"ssp3"
"ssp4"
"ssp5"
-6 -4 -2 0 2 4 6
PC1 (41.07%)
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
P
C

3

(
1
5
.
3
%
)
Ca Cu Fe K Mg Mn P Zn
PC1 0,16 -0,46 0,13 -0,14 -0,48 -0,50 0,00 -0,49
PC2 0,66 -0,05 -0,08 0,22 0,11 0,02 0,70 0,06
PC3 -0,09 -0,27 0,66 0,66 0,15 -0,02 -0,10 0,11
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
PCA no Unscrambler
Nmero de
PCs
The Unscrambler
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
The Unscrambler (autoescalonados)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
The Unscrambler (centrados apenas)
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
Ca
Cu
Fe
K
Mg
Mn
P
Zn
-1.0 -0.5 0.0 0.5 1.0
Factor 1 : 41.07%
-1.0
-0.5
0.0
0.5
1.0
F
a
c
t
o
r

2

:

2
1
.
8
0
%
Ca
Cu
Fe K
Mg
Mn
P
Zn
-1.0 -0.5 0.0 0.5 1.0
Factor 1 : 41.07%
-1.0
-0.5
0.0
0.5
1.0
F
a
c
t
o
r

3

:

1
5
.
3
3
%
Statistica (autoescalonados)
comunalidades
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-0.1
0
0.1
0.2
0.3
0.4
0.5
4000 3500 3000 2500 2000 1500 1000 500
DA EM100 EG100 ES100 OM100 OG100 OS100
Samples
Soja
Gordura
Mamona
Biodiesel - MI R
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
DE
Petrodiesel
DO
DEO
P
C

2
PC 1
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
DE
Petrodiesel
DO
DEO
P
C

2
PC 1
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
DE
Petrodiesel
DO
DEO
P
C

2
PC 1
Mist uras biodiesel/diesel
Adult eraes com leo in nat ura
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
% varincia
PC 1 99.062
PC 2 99.877
PC 3 99.984
PC 4 99.997
PC 5 99.999
leo lubrificant e - NI R
NOVOS
MDIO USO
MUITO USADOS
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)
PC1 PC2 PC3
OD -0.052 -0.229 -0.232
Prec -0.04 0.137 0.515
Sa -0.08 -0.111 -0.596
pH 0.06 0.027 0.097
T -0.148 -0.096 -0.475
NO2 -0.08 0.505 -0.177
NO3 -0.137 0.533 -0.106
PO4 -0.106 0.548 -0.091
SiO2 -0.365 -0.020 0.019
SePb 0.376 0.060 -0.101
SeCu 0.354 0.150 -0.102
SeZn 0.376 0.013 -0.050
GPb 0.368 -0.090 -0.074
GCu 0.348 0.198 -0.097
GZn 0.363 -0.031 0.028
% Varincia explicada
PC_00 0.000
PC_01 44.4
PC_02 63.0
PC_03 78.2
PC_04 86.3
PC_05 91.6
PC_06 95.4
PC_07 96.8
Est urio
Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)