Escolar Documentos
Profissional Documentos
Cultura Documentos
SEMINÁRIO ACADÊMICO
CAMPINA GRANDE
2016
Contra capa
Lista der Figura
Lista de Tabela
Lista de Siglas
Sumário
1. INTRODUÇÃO ................................................................................................................... 8
1.1. Objetivos .................................................................................................................... 10
1.1.1. Geral ................................................................................................................... 10
1.1.2. Específicos .......................................................................................................... 10
2. REVISÃO BIBLIOGRÁFICA ......................................................................................... 11
2.1. Estado da Arte ........................................................................................................... 12
3. FUNDAMENTAÇÃO TEÓRICA ................................................................................... 14
3.1. Restrições do Modelo ICA ........................................................................................ 16
3.1.1. Não – Gaussianidade ......................................................................................... 16
3.1.1.1. Não-gaussianidade por Kurtosis .................................................................. 16
3.1.1.2. Não-gaussianidade por Entropia/Negentropia ............................................. 17
3.1.2. Independência Estatística ................................................................................. 18
3.1.3. Matriz de Mistura Quadrada ........................................................................... 19
3.2. Algoritmo ICA utilizando PCA ................................................................................ 19
3.2.1. Problemas envolvendo a estimação pelo ICA por PCA ................................. 20
3.3. Modificações proposta ao método ICA por PCA. .................................................. 22
3.3.1. Correção estatística proposta ........................................................................... 22
3.3.2. Analise da matriz de separação estimada pelo ICA ....................................... 25
3.4. Algoritmo FastICA .................................................................................................... 26
3.5. Algoritmo JADE ........................................................................................................ 27
4. METODOLOGIA ............................................................................................................. 28
5. RESULTADOS .................................................................................................................. 31
6. CRONOGRAMA .............................................................................................................. 39
7. REFERÊNCIAS ................................................................................................................ 40
Resumo
1. INTRODUÇÃO
1.1. Objetivos
1.1.1. Geral
1.1.2. Específicos
Estudar o algoritmo ICA por PCA proposto por Kun e Chan (2006);
Yingwei e Yang (2010) propuseram uma otimização por PSO (particle swarm
optimization) chamado PSO-ICA, com a finalidade de monitoramento estatístico de
processo multivariado (MSPM), utilizando essa nova abordagem para extrair alguns
componentes independentes dominantes dos dados normais do processo. Esse método foi
aplicado a detecção de falhas e no diagnóstico do “Tennesse Eastman process”,
capturando, segundo o autor, eficazmente as componentes independentes e obtendo uma
solução mais precisa. (Yingwei; Yang, 2010).
Chen et al. (2013), demonstraram que técnicas baseadas em ICA utilizadas no
monitoramento do processo de separação de ar criogênico, apresentou um diagnóstico de
falhas no processo bem mais satisfatórios quando comparados a aplicação da técnica PCA
no mesmo processo.
Yung-Kun Chuang et al, (2014) propôs uma combinação entre a análise de
componente independente (ICA) com o espectro NIR (Near Infrared) para quantificar a
qualidade interna do arroz. No trabalho, foi verificado que o ICA junto com a
espectroscopia de infravermelho próximo (NIR) pode distinguir a “frescura” do arroz
servindo como método de análise, não destrutiva, por rastreio rápido. (Yung-Kun Chuang
et al, 2014).
Em seu trabalho, Carmo (2014) mostrou ser possível a utilização da técnica ICA
para o desacoplamento multivariável em malhas de controle, possibilitando um
entendimento um melhor emparelhamento entres as variáveis controladas e manipuladas,
estabelecendo uma melhor estrutura de controle. Ainda segundo Carmo (2014), a técnica
ICA permitiu obter a separação de sinais, tornando as variáveis independentes, e com
isso, obter um melhor desempenho do sistema de controle, quando comparado ao método
convencional de controle utilizado em grande parte dos processos industriais. (CARMO,
2014).
Lianfang et al. (2014) propôs a utilização do método KTSICA (kernel time structure
independent component analysis), para resolver os problema da existência de mais de
uma distribuição de Gauss presentes no problema de separação cega de fontes, aplicado
no monitoramento de processos não-linear. Nesse Trabalho, Lianfang et al. (2014), faz
uma comparação entre a técnica proposta com a KICA (análise de componentes
independentes de Kernel), mostrando que o método de identificação de falhas KTSICA
superou o KICA, indicando mais eficientemente, as variáveis de falha. (Lianfang et al,
2014).
Bizon et al. (2015), traz uma aplicação da análise de componentes independentes
para imagens 2D de um ciclo de combustão luminosa. Nesse Trabalho o método ICA é
empregado na identificação dos componentes espaciais e temporal durante os ciclos da
combustão. Segundo o autor, o ICA, identificando as informações sobre a morfologia
dominante das variações cíclicas, conseguiu obter as componentes espaciais e os
coeficientes das imagens analisadas, essenciais para o estudo do comportamento
transiente do processo. (Bizon et al., 2015).
Segundo o trabalho de Wang et al. (2016) a matriz de separação gerada pelo o ICA
não preserva toda a informação de mistura, de modo que algumas informação podem ser
perdidas. Nesse trabalho, foi proposto uma estratégia “Multi-block” para melhorar a
eficiência do método ICA, propondo um modelo totalmente orientado a dados que divide
matriz de mistura com base no generalizada dos dados do coeficiente e combina os
resultados de sub-blocos, utilizando inferência Bayesiana. Toda a informação contida
matriz de mistura é totalmente utilizada, possibilitando, uma melhor estimativa das
componentes independentes e uma melhor capacidade de monitoramento de processos
não gaussianos (Wang et al, 2016).
Lu Xian et al. (2016), apresenta o estudo de uma nova metodologia que combina o
EEMD (Conjunto Empírica modelo de decomposição) e a ICA (Analise de Componente
Independentes), aplicado à análise do preço do ouro. O ICA é utilizado para decompor o
VMFS (Virtual Funções do modo intrínseco), revelando uma decomposição do preço do
ouro como combinação das ICs: desenvolvimento do mundo; oferta de ouro e demanda;
dólar, inflação, emergências de mercado, geopolítica internacional e ciclicidade,
possibilitando uma nova maneira de análise do preço do ouro a partir de uma nova
perspectiva. (Lu Xian et al, 2016).
3. FUNDAMENTAÇÃO TEÓRICA
n
X i aij S j (2)
j 1
Usando uma notação matricial, a equação (2) pode ser expressa por:
X=AS (3)
Na forma Matricial:
X1 a11 a12 S11 S12 S1k
(6)
X 2 a21 a22 S21 S22 S2 k
S WX (7)
Como não se tem conhecimento acerca da matriz A , não se pode encontrar uma
matriz W que satisfaça a equação (7). Entretanto, pode-se encontrar um W * tal que:
Y W * X , onde S Y min. (8)
Para que o modelo ICA seja efetivo é necessário, que os componentes Si a serem
estimados, cumpram algumas exigências como: Ser não-gaussianos; independentes entre
si; e que sua matriz de mistura seja quadrática.
Sabe-se que os cumulantes de alta ordem da distribuição gaussiana são zero, sendo
essa informações essencial para a estimação do modelo ICA. Portanto é impossível
estimar as componentes independentes se as mesmas são gaussianas. A estimação da não-
gaussianidade dos sinais, pode ser realizada a partir da cumulantes/momentos de quarta
ordem ou pela entropia dos sinais.
Para o caso do sinal se gaussiano, tem-se que seu valor será zero, devido:
Para o caso dos dados serem branqueados, observa-se que a kurtosis é aproximada há
expressão:
H (Y ) fY ( y ) ln fY ( y )dy (X)
y
Uma variável gaussiana possui a maior entropia entre variáveis de mesma variância.
(HYVÄRINEN, 2001). Logo, a entropia pode ser usada, para o cálculo da não-
gaussianidade, da seguinte maneira:
J (Y ) H (Ygauss ) H (Y ) (X)
p
J (Y ) ki [ E{Gi (Y )} E{Gi ( )}] (X)
i 1
Onde 𝑘𝑖 é uma constante, 𝑣 uma variável gaussiana com média zero e variância unitária
e Y a variável, de media zero e variância 1, há ser calculada. O termo 𝐺𝑖 representa uma
função não-quadrática que não “cresça muito rapidamente”. Algumas dessa funções são
mostradas nas equações X1, X2, X3.
1
G1 (Y ) log cosh(1Y ) 1 1 2 (X1)
1
Y2
G2 (Y ) exp (X2)
2
Y4
G3 (Y ) (X3)
4
Cov(Yi , Y j ) E (YY
i j ) E (Yi ) E (Yi ) 0
(X)
i j ) E (Yi ) E (Yi )
E (YY
têm diferentes Kurtosis. Então, a matriz ortogonal U que é dado pela componente
principal de z (z não é centralizado) realiza ICA em v.
A metodologia ICA por PCA se resume nas seguintes etapas de cálculo:
Branqueamento de x;
Faça uma transformação z v v ;
Como o método ICA por PCA assume que as fontes possuem diferentes
distribuições e, por ser baseado em Diferentes Kurtosis possui sensibilidade a outliers.
Kun e Chan (2006) mostraram, eu seu trabalho, que esse pressuposto afeta o desempenho
da separação, ao ponto que, com a aproximação dos valores de Kurtosis a metodologia
ICA por PCA não consegue separar os sinais fontes. Nesse mesmo trabalho, também foi
mostrado que o desempenho do método ICA por PCA torna-se pior com o aumento do
número de fontes. Segundo os autores, pode haver duas razões para este fenômeno. Em
primeiro lugar, como o número de fontes aumenta, as diferenças entre as distribuições
tornam-se cada vez mais insignificantes. Em segundo lugar, devido ao efeito das amostras
finitas, as fontes podem não ser completamente independentes (KUN, CHAN, 2006).
Em seu trabalho, Damasceno (2013), mostra que o sinal estimado pelo o modelo
ICA por PCA possui diferença, em alguns casos, de amplitude e fase quando comparados
aos sinais fontes de referência. As Figuras 2 e 3 mostram com clareza essa diferença.
Como o método ICA por PCA proposto por Kun e Chan (2006) assume que as fontes
possuem diferentes distribuições e, por ser baseado na diferença de Kurtosi, esse método
possui sensibilidade a outiliers. Os autores mostraram, em seu trabalho, que esse
pressuposto afeta o desempenho da separação, ao ponto de que, com a proximidade dos
valores de Kurtosis, esse método não conseguesss mais estimar os sinais. Em seu trabalho,
Damasceno (2013), mostrou que o sinal estimado pelo método ICA por PCA possui
diferença, em alguns casos, de amplitude e fase, quando comparados aos sinais fontes de
referência (DAMASCENO, 2013).
(Fonte Própria)
Figura 3 – Sinais estimados pelo o ICA por PCA
( X Xˆ )2 ( X W 1 JSˆ )2
( X 2 2 XW 1 JSˆ (W 1Sˆ )2 J 2 )
2 XW 1Sˆ 2(W 1Sˆ ) 2 J (X6)
J
2 XW 1Sˆ 2(W 1Sˆ ) 2 J 0 (X7)
J
Isolando a variável J .
XW 1Sˆ X
J 1 ˆ 2
J 1 (X8)
(W S ) W Sˆ
Onde:
Tem-se que de acordo com a equação (X8) e fazendo uma análise crítica, em relação
as considerações feitas, na equação (X5). Essa variável terá a função de “quantificar”, de
certa forma, a falha de estimação e verificar a Redundância Inerente dos dados.
x
CV (XX)
mx
mx
Coe (XX)
x
A partir de análise do coeficiente proposto com a variação do número de fontes a serem
estimadas, observa-se uma variação desse coeficiente com o número de fontes
determinadas.
Esse algoritmo foi publicado por Hyvarinen (1999b), tendo como objetivo encontrar uma
matriz W com suas linhas 𝑤𝑖𝑡 ajustadas de modo que, a relação 𝑦𝑖 = 𝑤𝑖𝑡 𝑥 resulte na
estimativa das fontes, tendo em vista que a maximização da Negentropia é baseada nos
momentos polinomiais (HYVARINEN, 1999a). Considerando a aproximação pela a
Negentropia e que os dados utilizados foram, previamente branqueados, essa
maximização resulta em encontrar uma matriz W que é descrito pelo seguinte problema
de otimização (HYVARINEN, 2000):
O máximo da equação X é obtido quando é encontrado o valor ótimo de 𝐸{𝐺(𝑦𝑖 )}, sendo
o termo 𝐸{𝐺(𝑥𝑔 )} ser constante (Damasceno 2010). Assim, olhando para o primeiro
termo da equação X, a maximização coincide com um problema de otimização. Segundo
Hyvarinen (1999), esse problema de otimização é resolvido usando o método de
Lagrange, quando a seguinte condição é satisfatória (HYVARINEN, 1999):
Onde o termo 𝐺 ′ representa uma função não linear, derivada das funções não-quadráticas
G (equações X1, X2 e X3), mostradas na sessão 3.1.1.2. Suas derivadas são mostradas
nas equações Y1, Y2, Y3.
G1' (Y ) tanh(1Y ) (Y1)
Y2
G (Y ) Y exp
'
2 (Y2)
2
G3' (Y ) Y 3 (Y3)
z (k ) Qx (k ) 7
Estimar as matrizes de cumulantes;
Minimizar o critério de diagonalização conjunta, ou seja, tornar os matrizes de
cumulantes tão diagonais quanto o possível.
Determinar a matriz de mistura A e estimar os componentes independentes de
acordo com a Equação 8
y (k ) U T z (k ) 8
4. METODOLOGIA
Para testar e comprovar a correção estatística, proposta nesse trabalho. Foram propostos
dois estudos de casos a serem executadas na plataforma Matlab. No intuito de testar, a
eficiência de estimação dos modelos de análise de componentes independentes, bem
como verificar o comportamento da correção proposta nesse trabalha. Os métodos
utilização para promoverem a estimação dos sinais fontes serão:
Nesse primeiro estudo de caso, foram escolhidos 6 sinais ruidosos: Seno duplo; onda
periódica; onda dupla, sinal branco de Gauss, ruído randômico e uma função cosseno,
como um com um número de 1000 amostras. Esses sinais foram misturado por uma matriz
randômica de ordem 3, para que fosse simulado a mistura que ocorre nos casos reais. As
equações X, X1, X3, X4, X5 e X6 mostram os três sinais originais propostos para esse
estudo de caso.
Ainda nessa etapa. O número de pontos será reduzido, para que posso ser avaliada a
influência do número de amostras da estimação dos modelos ICAs. Em um segunda
etapa, serão modificados a quantidade de sinais, a serem estimadas, bem como o número
de amostras de cada sinal, no intuito de verificar o comportamento dos métodos de análise
de componentes independentes.
Nesse Segundo estudo de caso, serão utilizados sinais, já previamente misturados, porem
sem a utilização de uma matriz de mistura artificial, matriz randômica de ordem 3, com
a posterior aplicação dos métodos de análise de componentes independentes
considerados.
5. RESULTADOS
Utilizando a plataforma Matlab, foram gerados os sinais propostos como entrada para a
estimação a partir dos modelos ICAs propostos anteriormente. Seguindo o que foi
determinado na metodologia, os resultados serão divididos numa estimativa de um
sistema artificial e um sistema real.
Para o primeiro estudo de caso proposto, com a mistura dos sinais de referência, a partir
de uma matriz randômica. As figuras Y trazem o comportamento do sinais escolhidos.
(a)
(b)
(c)
(d)
(e)
(f)
Figura Y – Sinais originais: (a) – Seno Duplo; (b) – Onda duplo; (c) – Onda Periódica;
(d) – Sinal Branco de Gauss; (e) – Ruido Branco; (f) – Função cosseno.
(a)
(b)
(c)
Figura W – Sinais Misturados pela a matriz A.
(a)
(b)
(c)
Figura Z – Sinais estimados pelo o FastICA: (a) – Seno duplo; (b) – onda dupla; (c) –
Onda periódica. Sendo o sinal em vermelho e azul o estimado e de referência
respectivamente
(a)
(b)
(c)
Figura Z1 – Gráfico de erros absoluto(FastICA): (a) – desvio em relação ao seno duplo;
(b) desvio em relação a onda dupla; (c) – desvio em relação a onda periódica.
(a)
(b)
(c)
Figura A1 – Sinais estimados pelo o JADE: (a) – Seno duplo; (b) – onda dupla; (c) –
Onda periódica. Sendo o sinal em vermelho e azul o estimado e de referência
respectivamente
(a)
(b)
(c)
Figura A11 – Gráfico de erro absoluto(JADE): (a) – desvio em relação ao seno duplo;
(b) desvio em relação a onda dupla; (c) – desvio em relação a onda periódica.
(b)
(c)
Figura K – Sinais estimados pelo ICA por PCA: (a) – Seno duplo; (b) – onda dupla; (c)
– Onda periódica. Sendo o sinal em vermelho e azul o estimado e de referência
respectivamente
(a)
(b)
(c)
Figura K1 - Gráfico de erro absoluto: (a) – desvio em relação ao seno duplo; (b) desvio
em relação a onda dupla; (c) – desvio em relação a onda periódica.
Analisando as Figuras K e K1, observa-se que o método ICA por PCA apresenta uma
melhor estimativa, quando comparado, com os dados obtidos nas estimativas dos
algoritmos FastICA e JADE. Tem-se que o método ICA por PCA apenas não conseguiu
estimar uma das fases dos sinais proposto, enquanto que nas outras ferramentas houve a
inversão de dois sinais. As figuras K1 (a) e (b) mostram erros semelhantes aos presentes
nas figuras A11 (a) e (b) e Z1 (a) e (b), das estimativas JADE e FastICA respectivamente.
Entretanto a figura K1 (c) menor erro, quando comparado as figuras A11 (c) e Z1 (c).
(a)
(b)
(c)
Figura P – Sinais estimados pelo ICA por PCA com correção: (a) – Seno duplo; (b) –
onda dupla; (c) – Onda periódica. Sendo o sinal em vermelho e azul o estimado e de
referência respectivamente
(a)
(b)
(c)
Figura P2 - Gráfico de erro absoluto: (a) – desvio em relação ao seno duplo; (b) desvio
em relação a onda dupla; (c) – desvio em relação a onda periódica.
Etapa 1
Etapa 2
Etapa 3
Etapa 4
Etapa 5
Etapa 6
Etapa 7
Etapa 8
7. REFERÊNCIAS