Escolar Documentos
Profissional Documentos
Cultura Documentos
$QiOLVHGH&RPSRQHQWHV3ULQFLSDLV3&$
,QWURGXomR
&RPSRQHQWHVSULQFLSDLV3&V
Figura 1 - Linha vermelha mostra a distribuio principal dos dados e a linha azul
mostra a componente secundria.
0DWUL]GHFRYDULkQFLD
Em estatstica, existem vrias anlises que podem ser feitas sobre um conjunto
de dados, como a PpGLD aritmtica, o GHVYLR SDGUmR e a YDULkQFLD. Os dois ltimos
medem o quanto os dados esto afastados em relao a mdia (a varincia igual ao
quadrado do desvio padro).
Todas essas medidas, porm, consideram separadamente cada tipo de dados. Por
sua vez, a FRYDULkQFLD sempre medida entre duas dimenses (calcular a covarincia
entre uma dimenso e ela mesma resulta na varincia). A frmula da covarincia para
dados de dimenso 2 (; e <) :
1
P = [
0
=1
0 1 1 1
[1 = 0 ; [2 = 0 ; [3 = 1 ; e [4 = 0
0 0 0 1
3 / 4
P = 1 / 4
1 / 4
as subtraes calcula-se o produto de cada subtrao por ela mesma. A PDWUL] GH
FRYDULkQFLD o resultado da mdia desta soma.
3 / 4 1/ 4 1/ 4 1/ 4
[1 P = 1 / 4 ; [2 P = 1 / 4 ; [3 P = 3 / 4 e [4 P = 1 / 4
1 / 4 1 / 4 1 / 4 3 / 4
O produto de cada um destes vetores por ele mesmo resultar cada um em uma
matriz 3x3, dada por ([ P ) ([ P ) . No exemplo em questo teremos as seguintes
matrizes respectivamente:
9 / 16 3 / 16 3 / 16
([1 P )([1 P ) = 3 / 16 1 / 16 1 / 16 ;
3 / 16 1 / 16 1 / 16
1 / 16 1 / 16 1 / 16
([2 P )([2 P ) = 1 / 16 1 / 16 1 / 16 ;
1 / 16 1 / 16 1 / 16
1 / 16 3 / 16 1 / 16
([3 P )([3 P )
= 3 / 16 9 / 16 3 / 16 e
1 / 16 3 / 16 1 / 16
1 / 16 1 / 16 3 / 16
([4 P )([4 P ) = 1 / 16 1 / 16 3 / 16
3 / 16 3 / 16 9 / 16
12 / 16 4 / 16 4 / 16 3 / 16 1 / 16 1 / 16
1
(& ) = 4 / 16 12 / 16 4 / 16 ou (& ) = 1 / 16 3 / 16 1 / 16
4
4 / 16 4 / 16 12 / 16 1 / 16 1 / 16 3 / 16
1
& = [ [ P P
0
=1
$XWRHVSDoRVDXWRYHWRUHVHDXWRYDORUHV
0 0 2
0 =& = 1 2 1
1 0 3
by: Simone Vasconcelos e P\VHOI
A HTXDomRFDUDFWHUtVWLFD de 0 :
Ou na IRUPDIDWRUDGD:
Por definio vetor Y um DXWRYHWRU da matriz quadrada 0se e somente seY soluo
no trivial de :
0 0 2 [1 0
1 2 1 [2 = 0 para os dois autovalores O eO
1 0 3 [3 0
2V 1 0 1 0
Y1 = W = V 0 + W 1 e como 0 H 1 so linearmente independentes formam
V 1 0 1 0
uma EDVHGRDXWRHVSDoR associado a O
2V 2 2
Y2 = V = V 1 eportanto 1 uma EDVHGRDXWRHVSDoR associado a O
V 1 1
by: Simone Vasconcelos e P\VHOI
0 0 2
Vamos usar estes passos para diagonalizar a 0 = & = 1 2 1 , da qual j
1 0 3
1 0 2
calculamos os 3 autovetores : 0 H 1 associados a O H 1 associado a O
1 0 1
A matriz do passo 2 :
1 0 2
3 = [Y1 Y2 Y3 ]= 0 1 1 que pode ser usada para diagonalizar M.
1 0 1
1 0 2 0 0 2 1 0 2 2 0 0
3 0 3 = 1 1 1 1 2 1 0 1 1 = 0 2 0
1
1 0 1 1 0 3 1 0 1 0 0 1
by: Simone Vasconcelos e P\VHOI
7UDQVIRUPDGDGH+RWHOOLQJ
o auto
vetor correspondente ao menor autovalor, que chamaremos de O
.
como falado no pargrafo anterior. E considere uma transformao definida por esta
matriz como
\ $[P
Ela vai mapear os valores [, em valores \, cuja mdia ser zero, isto P , e cuja
PDWUL[GHFRYDULkQFLDdos\ pode ser obtida de$e& por:
& $& $
Esta matrix & diagonal e tem elementos ao longo da diagonal principal que
so os autovalores de& . Assim & ser:
1 0 0
0 0 ......
2
0 0 3
(& )=
"
..... 0 0
.... 0 2 0 !
0 0 1
!
by: Simone Vasconcelos e P\VHOI
diagonal so seus autovalores, segue que & e & possuem RV PHVPRV DXWRYDORUHV H
\ $[P
chamada de7UDQVIRUPDGDGH+RWHOOLQJ
A nica diferena entre esta com a matriz$e a3da seo anterior, que diagonaliza a
matriz & , a ordenao dos autovetores e autovalores, que esto presentes na
7UDQVIRUPDGDGH+RWHOOLQJ
$QiOLVHGH&RPSRQHQWHV3ULQFLSDLV3&$
A PCA consiste em promover uma transformao linear nos dados de modo que
os dados resultantes desta transformao tenham suas componentes mais relevantes nas
by: Simone Vasconcelos e P\VHOI
Os autovetores desta matriz de fato formam uma nova base que segue a variao
dos dados. A PCA, portanto consiste em uma mudana de base. A PCA e a
decomposio por autovalor de uma matriz so basicamente a mesma coisa, apenas
vem o problema de modos diferentes.
A aplicao da PCA a uma imagem colorida pode ser realizada com trs passos
bsicos: Primeiro gera-VHDPDWUL] DSDUWLUGDRSHUDo descrita abaixo:
= cov ( [R G B] )
2 REWLGR QD HTXDo acima uma matriz 3x3, que representa a matriz de
covarincia {cov} da imagem colorida, e servir para o clculo da matriz que levar a
imagem do RGB para um novo espao, gerado pela PCA. Com a matriz de covarincia
SRGH-se, ento, calcular seus autovalores e autovetores, como representado na
equao: >7DXW@ HLJ
A equao abaixo mostra a gerao do novo espao chamado de [P1, P2, P3].
by: Simone Vasconcelos e P\VHOI
3&$HP5HFRQKHFLPHQWRGH3DGU}HV
7UDQVIRUPDGDGH+RWHOOLQJH3&$QDUHFRQVWUXomR
% &
[ $ \P
'
Se nem todos os autovetores de & forem usados mas apenas osNmaiores, formando
$
6FRUHVH/RDGLQJV
Os VFRUHV (th) e ORDGLQJV(ph) podem ser calculados par a par por um processo
iterativo, como na equao abaixo.
&RQVLGHUDo}HV)LQDLV
5HIHUrQFLDV%LEOLRJUiILFDV
Andrade, M. C.; Pinto, L. C. M. &ODVVLILFDomR GH )ROKDV SRU 7DPDQKR H )RUPD $WUDYpV GH
'HVFULWRUHV *HRPpWULFRV H $QiOLVH GRV &RPSRQHQWHV 3ULQFLSDLV Anais do IV Workshop em
Tratamento de Imagens, NPDI/DCC/ICEx/UFMG, p. 54-61 2003.
Anton , H., Rorres C., OJHEUD/LQHDUFRP$SOLFDo}HV, Bookman, Porto Alegra, 2004.
Farias, M. A. 2SHUDo}HV%RROHDQDVHQWUH2EMHWRV'HOLPLWDGRVSRU6XUIHOV8VDQGR&RQVWUDLQHG%63
WUHHV. Dissertao de Mestrado. Cincia da Computao - UFRS. Porto Alegre, 2006.
Ferreira, E.C.; Rodrigues, S. H. B. G.; Ferreira, M. M. C.; Nbrega I. J. A.; Nogueira, A. R. A. $QiOLVH
H[SORUDWyULD GRV WHRUHV GH FRQVWLWXLQWHV LQRUJkQLFRV HP VXFRV H UHIULJHUDQWHV GH XYD Ecltica
Qumica. vol. 27 n.especial. So Paulo, 2002.
Silva, C. Y. V. W.; Traina, A. J. M. 5HFXSHUDomR GH ,PDJHQV 0pGLFDV SRU &RQWH~GR 8WLOL]DQGR
:DYHOHWVH3&$ Anais do X Congresso Brasileiro de Informtica em Sade, 14-18 de outubro de 2006,
)ORULDQySROLV6&www.sbis.org.br/cbis/arquivos/897.pdf
Souza, G. F. &RPSUHVVmR $XWR$GDSWDWLYDV GH ,PDJHQV &RORULGDV Dissertao de Mestrado em
Cincias Universidade Federal do Rio Grande do Norte. Natal -RN, 2005.
R. C. Gonzalez and R. E. Woods, 3URFHVVDPHQWRGH,PDJHQV'LJLWDLV, Edgard Blucher, So Paulo, 2000
(original :Addison Wesley Pub. Co. 1993) (seo 3.6)
Tutorial e exemplo no Scilab : csnet.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf
Site sobre : Michel Loeve e seu premio (The Loeve Prize) bianual:
http://www.stat.berkeley.edu/users/aldous/Research/Loeve.html
http://sunsite.berkeley.edu/uchistory/archives_exhibits/in_memoriam/catalog/loeve_michel.html