Seminário Fábio - Análise de Componentes Independentes

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE – UFCG
CENTRO DE CIÊNCIAS E TECNOLOGIA – CCT

UNIDADE ACADÊMICA DE ENGENHARIA QUÍMICA - UAEQ
PROGRAMA DE PÓS-GRADUAÇÃO EM
ENGENHARIA QUÍMICA - PPEQ
SEMINÁRIO ACADÊMICO
MÉTODO ICA POR PCA COM MODIFICAÇÃO DE CORREÇÃO DE

AMPLITUDE
Fábio George Nogueira Cruz

Orientador: José Nilton Silva
CAMPINA GRANDE
2016
Contra capa
Lista der Figura
Lista de Tabela
Lista de Siglas
Sumário
1. INTRODUÇÃO ................................................................................................................... 8
1.1. Objetivos .................................................................................................................... 10
1.1.1. Geral ................................................................................................................... 10
1.1.2. Específicos .......................................................................................................... 10
2. REVISÃO BIBLIOGRÁFICA ......................................................................................... 11
2.1. Estado da Arte ........................................................................................................... 12
3. FUNDAMENTAÇÃO TEÓRICA ................................................................................... 14
3.1. Restrições do Modelo ICA ........................................................................................ 16
3.1.1. Não – Gaussianidade ......................................................................................... 16
3.1.1.1. Não-gaussianidade por Kurtosis .................................................................. 16
3.1.1.2. Não-gaussianidade por Entropia/Negentropia ............................................. 17
3.1.2. Independência Estatística ................................................................................. 18
3.1.3. Matriz de Mistura Quadrada ........................................................................... 19
3.2. Algoritmo ICA utilizando PCA ................................................................................ 19
3.2.1. Problemas envolvendo a estimação pelo ICA por PCA ................................. 20
3.3. Modificações proposta ao método ICA por PCA. .................................................. 22
3.3.1. Correção estatística proposta ........................................................................... 22
3.3.2. Analise da matriz de separação estimada pelo ICA ....................................... 25
3.4. Algoritmo FastICA .................................................................................................... 26
3.5. Algoritmo JADE ........................................................................................................ 27
4. METODOLOGIA ............................................................................................................. 28
5. RESULTADOS .................................................................................................................. 31
6. CRONOGRAMA .............................................................................................................. 39
7. REFERÊNCIAS ................................................................................................................ 40
Resumo
1. INTRODUÇÃO
Em muitas situações de medição de sinais é necessário o uso de sensores para

coletar informações, nas quais geralmente contém problemas nos sinais fornecidos,
resultando em misturas dos sinais desejados. Além disso, em geral, não há como observar
as fontes diretamente, nem é conhecida a forma como as fontes foram misturadas
(MORETO, 2008). Nos últimos anos, as técnicas de processamento de sinais sofreram
consideradas evoluções, sendo o principal objetivo separar sinais de fontes de um ou mais
sinais de interferência (WIENER, 1949).
Os estudos de Bode e Shannon no final dos anos 40 e no início dos anos 50
(BOLDE, SHANNON, 1950) iniciaram um estudo de filtragem temporal (HALKIN,
2001b). Recentemente, processamentos de sinais tornou-se um tema importante em
pesquisas contemporâneas, visto que possui grande aplicabilidade dentro da engenharia.
O surgimento de novas técnicas de separação é devido a necessidade de superar os limites
teóricos das técnicas classicas, possibilitando resoluções de problemas nas áreas das
ciências como, por exemplo, a separação de imagens, aplicação em sensores e outras
pesquisas (BIRBAUMER et al, 2007).
Em diversos problemas de processamento de sinais MIMO (Multiple Input –
Multiple Output) é desejável encontrar uma transformação dos dados de modo a tornar
sua estrutura mais acessível. Dentre várias técnicas, utilizadas nesse tipo de processo
pode-se citar: Aprendizado não Supervisionado; Analise de Componentes Principais
(PCA); Analise de Fatores; Analise de Componentes Independentes (ICA); Separação
Cega de Fontes (BBS).
Em relação a Separação Cega de Fontes, um problema típico investigado é o
problema “cocktail party” ou separação de sinais de áudio. Considere duas pessoas
conversando em sala fechada, onde há sensores passa a captura das suas vozes. O
problema está relacionado em isolar os sinais captados pelos os sensores, sabendo que os
sinais estão correlacionados. A particularidade da separação cega de fontes perante as
outras técnicas de filtragens é que, nesse caso, não precisa-se conhecer precisamente os
sinais de fontes (HYVÄRINEN, 1999a). Um dos Métodos mais difundidos para BSS é a
Análise de Componentes Independentes (ICA).
A análise de componente independentes é um popular algoritmo de processamento
de sinais e separação cega, tendo dentro dos algoritmos ICA aqueles que utilizam AG
(algoritmos Genéticos) empregando a Negentropia (KAI; MINGLI, 2006). Destacando
também os estudos preliminares realizado por Yoshioka et all. (YOSHIOKA; OMATU,
1998), que emprega a divergência de Kulback Leibler.
Desenvolvida inicialmente como uma técnica de processamento de sinais, a análise
de componentes independentes é um método estocástico e computacional, cujo objetivo
é encontrar uma representação linear de dados não-gaussianos, de modo que os
componentes sejam estatisticamente independentes ou tenham dependência estatística
minimizada. É muitas vezes conhecida como um técnica de separação cega de fontes, que
consiste na extrair ou separação um conjunto de sinais misturados. É aplicado em áreas
como o processamento de sinais, eletromagnetismos, sensores químicos, redes de
telecomunicações, satélites. (LEITE, 2013).
Esse trabalho concentra-se no estudo da melhoria da técnica ICA, buscando resolver
um dos principais problemas associados as metodologias existentes, a saber: problema de
fase e problema de amplitude.
É bem conhecido que a Análise de Componentes Principais (PCA) considera apenas
as estatísticas de segunda ordem e que a Análise de Componentes Independentes (ICA)
utiliza estatísticas de ordem superior dos dados (KUN; CHAN, 2006).
Nesse trabalho, é mostrado, por Kun e Chan em 2006, como incorporar as
estatísticas de ordem superior sob a forma de momentos de segunda ordem, mostrando
que a Análise de Componentes Independentes (ICA) pode ser realizado pela a Análise de
Componentes Principais. Entretanto, como esse método é simples. O mesmo apresenta
problemas quando a amplitude e a fase do sinal estimado, com relação ao sinal de
referência. Portanto, o objetivo desse trabalho é inserir um ajuste de correção de
amplitude na metodologia ICA por PCA, baseado em critério estatístico de mínima
variância entre o sinal misturado e o sinal de mistura estimada por inversão do sinal
estimado. Essa verificação pode ser compreendida como a confirmação da avaliação da
redundância inerente associada a metodologia ICA por PCA. Possibilitando que esse
método, possa ser, efetivamente utilizado, para fins de Controle de Processo.
Em muitas situações industriais a coleta de dados, para monitoramento e controle de
processos industriais, é feita com o uso de sensores que podem fornecer informações
misturadas dos sinais desejados (fontes). É nesse contexto que surge o problema da
Separação Cega de Fontes (BSS- Blind Source Separation), que tem como objetivo
estimar os sinais originais, possuindo somente a informação das suas misturas. O termo
“Cega” refere-se ao fato de que não se tem informação alguma dos a respeito dos sinais
originais e de forma os mesmos foram misturados.
A Análise de Componentes Independentes (ICA) é umas das técnicas mais utilizadas para
se revolver problemas de BSS, principalmente quando se tem um problema de Cocktail
Party.
1.1. Objetivos
1.1.1. Geral
Esse trabalho tem como objetivo o desenvolvimento de uma metodologia de

correção estatística de amplitude de sinais gerados pelo método ICA por PCA, para fins
de aplicação em controle de processos.
1.1.2. Específicos
 Estudar os algoritmos ICA presentes na literatura;
 Avaliar as Técnicas de Separação por ICA;
 Estudar o algoritmo ICA por PCA proposto por Kun e Chan (2006);
 Proposta de melhoria para a metodologia ICA por PCA baseado em critérios

estatísticos e mínimos quadrados;
2. REVISÃO BIBLIOGRÁFICA
A análise de componentes independentes (ICA) teve os seus primeiros trabalhos

formulados por Herault e Jutten (1986) e Herault, Jutten e Ans (1985) na década de 80.
Os seus Trabalhos foram motivados pelo o estudo na área de processamento de sinais
neurofisiológico relacionados à codificação empregada pelo sistema nervoso central para
a ativação muscular. Nesse trabalho foi proposto um modelo e um algoritmo com o
objetivo de obter, separadamente, informações de posição e velocidade angular do
movimente a partir da observação de sinais sensoriais de contração muscular.
Essa técnica foi denominada análise de componentes independentes devido as suas
similaridades com a análise de componentes principais (PCA – Principal Component
Analysis), considerando que a diferença fundamental entre as duas técnicas é que a PCA
obtém componentes não correlacionados, enquanto que a ICA deseja encontrar os
componentes estatisticamente independentes. Através deste modelo simplificado,
abriram-se as margens para vários outras pesquisas e vertentes. Neste Período a
divulgação da nova técnica ficou restrita a pesquisadores franceses.
Em 1989, com a realização do primeiro workshop internacional, foram divulgados
estudos na área de análise espectral com a utilização de ordens superiores com trabalhos
em ICA de Cardoso (1989) e Comon (1994). Em seu trabalho, Cardoso (1989) usou
métodos algébricos como tensores cumulantes de quarta ordem que conduziram à criação
do algoritmo JADE (joint Appoximate Diagonalization of Eigenmatrices) (CARDOSO;
SOULOUMAIAC, 1993). Já o trabalho de Comon (1994) se delineou uma estrutura
matemática mais compatível e mais bem definida para o ICA, demonstrando como a
independência estatística está inserida no problema de separação de fontes. Esse trabalho
foi de total importância para o desenvolvimento de novos métodos de BSS.
Com o desenvolvimento do BSS/ICA, pode-se destacar os trabalhos do grupo
composto pelos os pesquisadores finlandeses: Karhunen, Oja e Hyvärinen. Visto que eles
interpretaram a ICA como uma extensão linear da Técnica PCA (Análise de Componentes
Principais). Tal abordagem teve um papel fundamental para o entendimento da ICA como
ferramenta relevante em análise de dados multivariados. Destaque-se, nessa pesquisa, a
contribuição de Hyvärinen com o critério da maximização da não-gaussianidade e do
algoritmo FastICA (Fast Indenpendent Component Analysis) (HYVÄRINEN; OJA,
2000).
Com o crescente desenvolvimento da Técnica ICA, a sua “aplicabilidade” foi se
diversificando em inúmeras áreas e aos poucos se “afastando” da BSS. Além das
contribuições expostas anteriormente, há outro trabalho importante desenvolvido em
2006 por, Kun Zhang e Lai-wan Chan, da Universidade de Hong Kong, em que foi
desenvolvido uma nova abordagem de ICA utilizando PCA (KUN; CHAN, 2006).
Portanto, pode-se constatar que algoritmos com base em ICA vêm fornecendo
excelentes soluções, sendo aplicados em diversas campos de trabalho.
2.1. Estado da Arte
Yingwei e Yang (2010) propuseram uma otimização por PSO (particle swarm
optimization) chamado PSO-ICA, com a finalidade de monitoramento estatístico de
processo multivariado (MSPM), utilizando essa nova abordagem para extrair alguns
componentes independentes dominantes dos dados normais do processo. Esse método foi
aplicado a detecção de falhas e no diagnóstico do “Tennesse Eastman process”,
capturando, segundo o autor, eficazmente as componentes independentes e obtendo uma
solução mais precisa. (Yingwei; Yang, 2010).
Chen et al. (2013), demonstraram que técnicas baseadas em ICA utilizadas no
monitoramento do processo de separação de ar criogênico, apresentou um diagnóstico de
falhas no processo bem mais satisfatórios quando comparados a aplicação da técnica PCA
no mesmo processo.
Yung-Kun Chuang et al, (2014) propôs uma combinação entre a análise de
componente independente (ICA) com o espectro NIR (Near Infrared) para quantificar a
qualidade interna do arroz. No trabalho, foi verificado que o ICA junto com a
espectroscopia de infravermelho próximo (NIR) pode distinguir a “frescura” do arroz
servindo como método de análise, não destrutiva, por rastreio rápido. (Yung-Kun Chuang
et al, 2014).
Em seu trabalho, Carmo (2014) mostrou ser possível a utilização da técnica ICA
para o desacoplamento multivariável em malhas de controle, possibilitando um
entendimento um melhor emparelhamento entres as variáveis controladas e manipuladas,
estabelecendo uma melhor estrutura de controle. Ainda segundo Carmo (2014), a técnica
ICA permitiu obter a separação de sinais, tornando as variáveis independentes, e com
isso, obter um melhor desempenho do sistema de controle, quando comparado ao método
convencional de controle utilizado em grande parte dos processos industriais. (CARMO,
2014).
Lianfang et al. (2014) propôs a utilização do método KTSICA (kernel time structure
independent component analysis), para resolver os problema da existência de mais de
uma distribuição de Gauss presentes no problema de separação cega de fontes, aplicado
no monitoramento de processos não-linear. Nesse Trabalho, Lianfang et al. (2014), faz
uma comparação entre a técnica proposta com a KICA (análise de componentes
independentes de Kernel), mostrando que o método de identificação de falhas KTSICA
superou o KICA, indicando mais eficientemente, as variáveis de falha. (Lianfang et al,
2014).
Bizon et al. (2015), traz uma aplicação da análise de componentes independentes
para imagens 2D de um ciclo de combustão luminosa. Nesse Trabalho o método ICA é
empregado na identificação dos componentes espaciais e temporal durante os ciclos da
combustão. Segundo o autor, o ICA, identificando as informações sobre a morfologia
dominante das variações cíclicas, conseguiu obter as componentes espaciais e os
coeficientes das imagens analisadas, essenciais para o estudo do comportamento
transiente do processo. (Bizon et al., 2015).
Segundo o trabalho de Wang et al. (2016) a matriz de separação gerada pelo o ICA
não preserva toda a informação de mistura, de modo que algumas informação podem ser
perdidas. Nesse trabalho, foi proposto uma estratégia “Multi-block” para melhorar a
eficiência do método ICA, propondo um modelo totalmente orientado a dados que divide
matriz de mistura com base no generalizada dos dados do coeficiente e combina os
resultados de sub-blocos, utilizando inferência Bayesiana. Toda a informação contida
matriz de mistura é totalmente utilizada, possibilitando, uma melhor estimativa das
componentes independentes e uma melhor capacidade de monitoramento de processos
não gaussianos (Wang et al, 2016).
Lu Xian et al. (2016), apresenta o estudo de uma nova metodologia que combina o
EEMD (Conjunto Empírica modelo de decomposição) e a ICA (Analise de Componente
Independentes), aplicado à análise do preço do ouro. O ICA é utilizado para decompor o
VMFS (Virtual Funções do modo intrínseco), revelando uma decomposição do preço do
ouro como combinação das ICs: desenvolvimento do mundo; oferta de ouro e demanda;
dólar, inflação, emergências de mercado, geopolítica internacional e ciclicidade,
possibilitando uma nova maneira de análise do preço do ouro a partir de uma nova
perspectiva. (Lu Xian et al, 2016).
3. FUNDAMENTAÇÃO TEÓRICA
A análise de componentes independentes é uma técnica estatística utilizada para

encontrar componentes independentes referentes a um conjunto de variáveis aleatórias.
Considere o vetor aleatório X  [ X 1 , X 2 ,..., X n ]T , cujos n elementos são obtidos a partir
da mistura de n componentes estatisticamente independentes entre si de um vetor
aleatório S  [ S1 , S2 ,..., Sn ]T .O modelo ICA expressa cada X i como uma combinação
linear dos componentes independentes, dada por
X i  ai1S1  ai 2 S2  ...  ain Sn , para todo i= 1, 2,..., n (1)
Em que ai1 , j=1, 2,..., n, são coeficientes reais .

Como uma combinação linear, o modelo também pode ser escrito como:
n
X i   aij S j (2)
j 1
Usando uma notação matricial, a equação (2) pode ser expressa por:
X=AS (3)
Em que o termo A pondera a mistura dos sinais fontes. A matriz A é denominada

matriz de mistura.
O modelo ICA é um modelo gerativo, ou seja, ele descreve como os dados
observados são gerados através do processo de mistura das componentes Si . Para ilustrar
o modelo de uma forma mais clara, considera-se o problema de Cocktail Party. (Figura
1). Onde tem-se duas vozes S1 e S2 (fontes originais) e dois sinais misturados X1 e X2
(gerados pelos os sensores).
Figura 1 – Problema Cocktail Party
Fonte: Nielsen (2010)

(Atualizar figura)
Pelo o Modelo ICA, tem-se que as variáveis aleatórias X1 e X2 podem ser escritas
como:
X1  a11S1  a12 S2 (4)
X 2  a21S1  a22 S2 (5)
Na forma Matricial:
 X1   a11 a12   S11 S12 S1k 
    (6)
 X 2   a21 a22  S21 S22 S2 k 
O problema da estimativa do modelo ICA apresentado é estimar as componentes

independentes, partindo do pressuposto que não se conhece valores dos coeficientes de
mistura e das componentes independentes, ou seja, tem-se que estimar uma matriz W
composta por vetores linhas wi , onde i = 1, ..., n tal que:
S  WX (7)
Como não se tem conhecimento acerca da matriz A , não se pode encontrar uma
matriz W que satisfaça a equação (7). Entretanto, pode-se encontrar um W * tal que:
Y  W * X , onde S  Y  min. (8)
3.1. Restrições do Modelo ICA
Para que o modelo ICA seja efetivo é necessário, que os componentes Si a serem
estimados, cumpram algumas exigências como: Ser não-gaussianos; independentes entre
si; e que sua matriz de mistura seja quadrática.
3.1.1. Não – Gaussianidade
Sabe-se que os cumulantes de alta ordem da distribuição gaussiana são zero, sendo
essa informações essencial para a estimação do modelo ICA. Portanto é impossível
estimar as componentes independentes se as mesmas são gaussianas. A estimação da não-
gaussianidade dos sinais, pode ser realizada a partir da cumulantes/momentos de quarta
ordem ou pela entropia dos sinais.
3.1.1.1. Não-gaussianidade por Kurtosis
Kurtosis é um método clássico de medida do caráter gaussiano do sinal. A

Kurtosis é equivalente ao momento de 4a ordem do dado analisado. Considerando um
sinal real “s” e assumindo que o mesmo tem média zero:
kurt (s)  E{s 4 }  3( E{s 2 })2 (X)
Para o caso do sinal se gaussiano, tem-se que seu valor será zero, devido:
E{s 4 }  3( E{s 2 })2 (X)
Para o caso dos dados serem branqueados, observa-se que a kurtosis é aproximada há
expressão:
kurt ( s)  E{s 4 }  3 (X)

Para o caso em que os sinais apresentados sejam não-gaussianos, o valor da Kurtosis será
diferente de zero. Para valores negativos, tem-se que a distribuição de densidade é
conhecida como subgaussianas. Para valores positivos, essa distribuição é denominada
de supergaussianas. Quanto maior for a diferença, em modulo, do valor da Kurtosis em
relação a zero, maior será a não-gaussianidade do sinal observado, permitindo uma
melhor separação dos sinais.
3.1.1.2. Não-gaussianidade por Entropia/Negentropia
Entropia é um conceito da teoria de informação, sendo uma medida da incerteza média

associada à observação de uma variável aleatória (COVER; THOMAS, 1991). Quanto
maior for o grau de “imprevisibilidade” da variável, maior será a sua entropia. Outra
maneira utilizada para quantificar a não gaussianidade é a partir da negentropia, sendo
esse termo baseado na quantidade de informação da entropia diferencial. Pode-se definir
a entropia diferencial (H) a partir da equação X.
H (Y )    fY ( y ) ln fY ( y )dy (X)
y
Sendo Y uma variável aleatória e 𝑓𝑌 (. ) Uma função de densidade.
Uma variável gaussiana possui a maior entropia entre variáveis de mesma variância.
(HYVÄRINEN, 2001). Logo, a entropia pode ser usada, para o cálculo da não-
gaussianidade, da seguinte maneira:
J (Y )  H (Ygauss )  H (Y ) (X)
Utilizando a equação X para o cálculo da entropia e consequentemente a negentropia,

obtém-se sempre um valor positivo, responsável por indicar a diferença de entropia entre
uma variável gaussiana e uma variável observada com os mesmo parâmetros. Como o
calcula da negentropia requer um tempo computacional muito grande, é utilizado, na
maiorias das vezes, aproximações para essa estimativa. Uma dessas aproximações é
mostrada a seguir:
p
J (Y )   ki [ E{Gi (Y )}  E{Gi ( )}] (X)
i 1
Onde 𝑘𝑖 é uma constante, 𝑣 uma variável gaussiana com média zero e variância unitária
e Y a variável, de media zero e variância 1, há ser calculada. O termo 𝐺𝑖 representa uma
função não-quadrática que não “cresça muito rapidamente”. Algumas dessa funções são
mostradas nas equações X1, X2, X3.
1
G1 (Y )  log cosh(1Y ) 1  1  2 (X1)
1
 Y2 
G2 (Y )   exp    (X2)
 2 
Y4
G3 (Y )  (X3)
4
Mostrado todo a definição e/ou procedimento para a utilização da entropia/negentropia,

tem-se que a sua maximização é semelhante a maximização da não-gaussianidade das
fontes. Todavia, a maximização das fontes seria buscar a minimização das entropias
marginais das estimativas das fontes (DAMASCENO, 2010).
3.1.2. Independência Estatística
Duas variáveis aleatórias Yi e Yj são ditas independentes se a informação contida

na variável Yi não fornece nenhuma informação sobre a probabilidade de ocorrência da
variável Yj. Segundo ainda a estatística, independência é determinada em termos das
densidades de probabilidade, isto é:
f ( y1 , y2 ,..., yn )  f1 ( y1 ) f 2 ( y2 )... f n ( yn ) (9)

Em que fi ( yi ) denota a densidade marginal de Yi.
Como, para o caso da análise de componentes independentes, não se tem conhecimento
das fontes a serem estimadas, não há como estimar diretamente a suas funções
distribuições de probabilidade (fdp). Para contornar essa problemático, pode-se fazer uso
dos princípios matemáticos da Correlação/descorrelação para caracterizar uma
determinada distribuição, fazendo as estimativas dos valores esperados, a partir das
misturas como única informação disponível.
A ausência de correlação, entre a variáveis, é usada como uma evidência para a
independência entre as variáveis aleatórias. Entretanto essa evidência não garante a
independência entre essas variáveis. Segundo Leite (2005), se duas variáveis aleatórias
forem independentes, logo elas são descorrelacionadas, entretanto se as mesmas são
descorrelacionadas, não serão, obrigatoriamente independentes. Matematicamente, tem-
se que a descorrelação é determinada quando:
Cov(Yi , Y j )  E (YY
i j )  E (Yi ) E (Yi )  0
(X)
i j )  E (Yi ) E (Yi )
E (YY
3.1.3. Matriz de Mistura Quadrada
O método de separação ICA presume que a matriz de mistura é quadrática, isto é,

que o número de componentes independentes estimados é o próprio número de dados
observados. Caso haja mais misturas que fontes, é possível excluir as misturas
redundantes.
Entretanto, caso o número de fontes for maior que o número de misturas, encontrar a
matriz de mistura não será suficiente para a resolução do problema de separação.
3.2. Algoritmo ICA utilizando PCA
Um algoritmo, desenvolvido recentemente, provou ser superior a algumas

abordagens ICA (KUN, CHAN, 2006). Denominado como ICA por PCA, esta abordagem
resolve o problema de BSS linear a partir da aplicação de PCA seguindo de uma
transformação para a recuperação dos sinais fontes.
Partindo dos dados X , PCA e ICA buscam encontrar uma transformação linear da
equação (9). Entretanto se baseiam em critérios diferentes. O PCA tem como objetivo
encontrar uma ortogonal W responsável por fornecer saídas não correlacionadas. Em
outras palavras, o PCA apenas usa a distribuição gaussiana conjunta para ajustar os dados
encontrar uma transformação ortogonal com o objetivo de fazer a distribuição conjunta
de Gauss fatorável independente da verdadeira distribuição dos dados (KUN, CHAN,
2006).
Para o ICA, tem-se que este, busca uma transformação linear que torna fatorável
a verdadeira distribuição dos dados transformados, de modo que que saídas são
mutualmente independentes. Falando de maneira estatística, a independência mútua é
muito mais “forte” do que a não-correlação entre as variáveis (KUN, CHAN, 2006).
De maneira geral, Kun e Chan (2006) demonstrou que as componentes
independentes têm diferentes Kustosis, possibilitando a seguinte proposição:
 Dados s, v, e z vetores aleatórios tal que v = Ws, onde W é uma matriz ortogonal
e z  v v . Suponha que s tem média zero e que as componentes independentes
têm diferentes Kurtosis. Então, a matriz ortogonal U que é dado pela componente
principal de z (z não é centralizado) realiza ICA em v.
A metodologia ICA por PCA se resume nas seguintes etapas de cálculo:
 Branqueamento de x;
 Faça uma transformação z  v v ;
 Encontre U usando PCA em z;

 Depois de encontrar a matriz ortogonal U finalmente a matriz de separação pode
ser estimada usando a expressão W  UV .
3.2.1. Problemas envolvendo a estimação pelo ICA por PCA
Como o método ICA por PCA assume que as fontes possuem diferentes
distribuições e, por ser baseado em Diferentes Kurtosis possui sensibilidade a outliers.
Kun e Chan (2006) mostraram, eu seu trabalho, que esse pressuposto afeta o desempenho
da separação, ao ponto que, com a aproximação dos valores de Kurtosis a metodologia
ICA por PCA não consegue separar os sinais fontes. Nesse mesmo trabalho, também foi
mostrado que o desempenho do método ICA por PCA torna-se pior com o aumento do
número de fontes. Segundo os autores, pode haver duas razões para este fenômeno. Em
primeiro lugar, como o número de fontes aumenta, as diferenças entre as distribuições
tornam-se cada vez mais insignificantes. Em segundo lugar, devido ao efeito das amostras
finitas, as fontes podem não ser completamente independentes (KUN, CHAN, 2006).
Em seu trabalho, Damasceno (2013), mostra que o sinal estimado pelo o modelo
ICA por PCA possui diferença, em alguns casos, de amplitude e fase quando comparados
aos sinais fontes de referência. As Figuras 2 e 3 mostram com clareza essa diferença.
Como o método ICA por PCA proposto por Kun e Chan (2006) assume que as fontes
possuem diferentes distribuições e, por ser baseado na diferença de Kurtosi, esse método
possui sensibilidade a outiliers. Os autores mostraram, em seu trabalho, que esse
pressuposto afeta o desempenho da separação, ao ponto de que, com a proximidade dos
valores de Kurtosis, esse método não conseguesss mais estimar os sinais. Em seu trabalho,
Damasceno (2013), mostrou que o sinal estimado pelo método ICA por PCA possui
diferença, em alguns casos, de amplitude e fase, quando comparados aos sinais fontes de
referência (DAMASCENO, 2013).
Figura 2 – Sinais fontes de Referência
(Fonte Própria)
Figura 3 – Sinais estimados pelo o ICA por PCA
3.3. Modificações proposta ao método ICA por PCA.
3.3.1. Correção estatística proposta
A técnica desenvolvida nesse trabalho parte do pressuposto da existência de falhas de

estimação. A partir do procedimento clássico do ICA, os valores dos sinais fontes, não
seriam capazes de replicar, através de uma inversão simples do modelo (Equação 3), os
valores dos sinais misturados, usados como valores de entrada para o método. (Figura 1)
Figura 1 – Inversão do Modelo ICA (MODIFICAR FIGURA)

Como a matriz 𝑋0 é conhecida. 𝑋̂0 pode ser calculada, fazendo a inversão na matriz
de separação W e multiplicando pelo a matriz das fontes estimadas.
Realizando esse procedimento, verifica-se a existência do erro de estimação
provocado pelo o método ICA por PCA. Feito isso e tendo a necessidade de melhorar a
estimativa do modelo ICA por PCA, foi proposto, nesse trabalho, a inserção de uma
variável J, como mostrado da Equação X5, para a correção do sinal separado.
Xˆ 0  W 1Sˆ  Xˆ 0  W 1 ( JSˆ ) (X5)
Utilizando o critério de mínimos quadrados em relação ao sinal misturado branqueado

X 0 e o sinal misturado, estimado ( X̂ ) pela a equação (X5).
   ( X  Xˆ )2   ( X  W 1 JSˆ )2
   ( X 2  2 XW 1 JSˆ  (W 1Sˆ )2 J 2 )
Derivando a equação em relação a J .

 2 XW 1Sˆ  2(W 1Sˆ ) 2 J (X6)
J
Para encontrar o mínimo da equação (X6), tem-se que igualar a zero.

 2 XW 1Sˆ  2(W 1Sˆ ) 2 J  0 (X7)
J
Isolando a variável J .
XW 1Sˆ X
J 1 ˆ 2
 J  1 (X8)
(W S ) W Sˆ
Comparando com a equação (5)

X X
J 1 ˆ
, como : Xˆ  W 1Sˆ ,  J  (X8)
W S Xˆ
Onde:
 X - Sinal mistura Branqueado;

 Ŝ - Sinal de referência estimado;
 W 1 - Inversa da matriz W estimada.
Tem-se que de acordo com a equação (X8) e fazendo uma análise crítica, em relação
as considerações feitas, na equação (X5). Essa variável terá a função de “quantificar”, de
certa forma, a falha de estimação e verificar a Redundância Inerente dos dados.
Partindo da obtenção da variável J, dita como a matriz quantificadora do erro de

estimação, é necessário utilizar essa nova informação para uma possível melhoria de
estimação do modelo ICA. Como o termo J é responsável por determinar a variação entre
o valor real e o valor estimado. Olhando para a teoria probabilística, visto que, todas as
variáveis, envolvidas na estimação ICA, são variáveis aleatórias (V.A.), tem-se a
existência do termo coeficiente de variação que também quantifica as variações entre
duas ou mais variáveis aleatórias. Considerando que os sinais estimados, pelos os
modelos ICAs são mais dispersos, em comparação aos sinais originais, a utilização do
inverso do coeficiente de variação, funcionará como correção para o sinal estimado.
Segundo o livro soong (1986), o coeficiente de variação é um número adimensional,
que caracteriza a dispersão em relação à média e também facilita comparações entre
variáveis aleatórias diferentes. Esse coeficiente é expresso da seguinte maneira:
x
CV  (XX)
mx
Logo o coeficiente utilizado, na correção do sinal estimado, seria:
mx
Coe  (XX)
x
A partir de análise do coeficiente proposto com a variação do número de fontes a serem
estimadas, observa-se uma variação desse coeficiente com o número de fontes
determinadas.
3.3.2. Analise da matriz de separação estimada pelo ICA

3.4. Algoritmo FastICA
Esse algoritmo foi publicado por Hyvarinen (1999b), tendo como objetivo encontrar uma
matriz W com suas linhas 𝑤𝑖𝑡 ajustadas de modo que, a relação 𝑦𝑖 = 𝑤𝑖𝑡 𝑥 resulte na
estimativa das fontes, tendo em vista que a maximização da Negentropia é baseada nos
momentos polinomiais (HYVARINEN, 1999a). Considerando a aproximação pela a
Negentropia e que os dados utilizados foram, previamente branqueados, essa
maximização resulta em encontrar uma matriz W que é descrito pelo seguinte problema
de otimização (HYVARINEN, 2000):
wˆ i  arg max( E{G( yi )}  E{G( xg )})2 (X)
O máximo da equação X é obtido quando é encontrado o valor ótimo de 𝐸{𝐺(𝑦𝑖 )}, sendo
o termo 𝐸{𝐺(𝑥𝑔 )} ser constante (Damasceno 2010). Assim, olhando para o primeiro
termo da equação X, a maximização coincide com um problema de otimização. Segundo
Hyvarinen (1999), esse problema de otimização é resolvido usando o método de
Lagrange, quando a seguinte condição é satisfatória (HYVARINEN, 1999):
E{xG '( wit x)}   wi  0 (X)
Onde β é uma constante.
Partindo do princípio que as misturas foram branqueadas, pode-se aplicar o método de

Newton para a solução da expressão (X), tendo como regra de atualização a seguinte
expressão:
wˆ i  E{xG( wit x)}  E{G '( wit x)}wi

wi (X)
wˆ i 
wi
Onde o termo 𝐺 ′ representa uma função não linear, derivada das funções não-quadráticas
G (equações X1, X2 e X3), mostradas na sessão 3.1.1.2. Suas derivadas são mostradas
nas equações Y1, Y2, Y3.
G1' (Y )  tanh(1Y ) (Y1)
 Y2 
G (Y )  Y exp   
'
2 (Y2)
 2 
G3' (Y )  Y 3 (Y3)
3.5. Algoritmo JADE
O algoritmo de Diagonalização Conjunta Aproximada de Automatrizes (JADE)

proposto por Cardoso et al. (Cardoso, 1993) para solucionar o problema da conformação
cega de feixe. A principal restrição utilizada pelo o algoritmo JADE para o problema de
BSS é que as fontes a serem separadas sejam estatisticamente independentes. Esse
algoritmo a independência através de cumulantes de 4a ordem, reduzindo o conjunto de
dados observados a um conjunto de estatísticas.
Umas das principais vantagens apresentado pelo JADE é a capacidade de se mover em
passos macroscópicos através do espaço de parâmetros, solucionando o problema
causado pela escolha incorreta do passo de adaptação, comum em algoritmos que utilizam
técnicas como o gradiente natural (Cichocki, 2002). Por outro lado, a sua implementação
computacional apresenta grande complexidade, principalmente no que diz respeito aos
cálculos das estatísticas de ordem superior. O Algoritmo JADE pode ser resumido nos
seguintes tópicos:
 Encontrar a matriz de branqueamento Q;
 Branquear os dados coletados, utilizando a Equação 7.
z (k )  Qx (k ) 7
 Estimar as matrizes de cumulantes;
 Minimizar o critério de diagonalização conjunta, ou seja, tornar os matrizes de
cumulantes tão diagonais quanto o possível.
 Determinar a matriz de mistura A e estimar os componentes independentes de
acordo com a Equação 8
y (k )  U T z (k ) 8
4. METODOLOGIA
Para testar e comprovar a correção estatística, proposta nesse trabalho. Foram propostos
dois estudos de casos a serem executadas na plataforma Matlab. No intuito de testar, a
eficiência de estimação dos modelos de análise de componentes independentes, bem
como verificar o comportamento da correção proposta nesse trabalha. Os métodos
utilização para promoverem a estimação dos sinais fontes serão:
 Algoritmo ICA por PCA;

 Algoritmo ICA por PCA com correção proposta;
 Algoritmo JADE;
 Algoritmo FastICA;
Para melhor exemplificar a diferença entre os valores estimados, em comparação aos

valores de referência, será determinada o erro de estimação de acordo com a equação (X9)
Erro  abs ( S  Sˆ ) (X9)

Onde 𝑆 é o valor de referência, enquanto 𝑆̂ é o valor estimado, pelos os Algoritmos de
Analise de Componentes Independentes escolhidos previamente. Os dois estudos de
casos proposto são: Sistema com mistura artificial; Sistema de mistura real.
4.1. Sistema com mistura artificial
Nesse primeiro estudo de caso, foram escolhidos 6 sinais ruidosos: Seno duplo; onda
periódica; onda dupla, sinal branco de Gauss, ruído randômico e uma função cosseno,
como um com um número de 1000 amostras. Esses sinais foram misturado por uma matriz
randômica de ordem 3, para que fosse simulado a mistura que ocorre nos casos reais. As
equações X, X1, X3, X4, X5 e X6 mostram os três sinais originais propostos para esse
estudo de caso.
Seno duplo 𝑠1 = 0.75 ∗ sin(𝑤 ∗ 12) + 0,1𝑟𝑎𝑛𝑑𝑛(1, 𝑁) (X1)
Onda Dupla 𝑠2 = 𝑠𝑎𝑤𝑡𝑜𝑜𝑡ℎ(𝑤 ∗ 5, 0.5) + 0.1 ∗ 𝑟𝑎𝑛𝑑𝑛(1, 𝑁) (X2)
Onda periódica 𝑠3 = 𝑝𝑢𝑙𝑠𝑡𝑟𝑎𝑛((0: 999), (0: 5)′ ∗ 180, 𝑘𝑎𝑖𝑠𝑒𝑟(100,3))

(X3)
+ 0.07 ∗ 𝑟𝑎𝑛𝑑𝑛(1, 𝑁)
Sinal branco de Gauss 𝑠4 = 𝑤𝑔𝑛(1, 𝑙𝑒𝑛𝑔𝑡ℎ(𝑡), 0) (X4)
Ruido 𝑠5 = 𝑟𝑎𝑛𝑑𝑛(1, 𝑙𝑒𝑛𝑔𝑡ℎ(𝑡)) (X5)
Função cosseno 𝑠6 = cos(2 ∗ 𝑝𝑖 ∗ 0.03 ∗ 𝑡) (X5)
Onde N representa o número de pontos, w o vetor de frequência e t um vetor de tamanho

N.
Ainda nessa etapa. O número de pontos será reduzido, para que posso ser avaliada a
influência do número de amostras da estimação dos modelos ICAs. Em um segunda
etapa, serão modificados a quantidade de sinais, a serem estimadas, bem como o número
de amostras de cada sinal, no intuito de verificar o comportamento dos métodos de análise
de componentes independentes.
4.2. Sistema de mistura real
Nesse Segundo estudo de caso, serão utilizados sinais, já previamente misturados, porem
sem a utilização de uma matriz de mistura artificial, matriz randômica de ordem 3, com
a posterior aplicação dos métodos de análise de componentes independentes
considerados.
5. RESULTADOS
Utilizando a plataforma Matlab, foram gerados os sinais propostos como entrada para a
estimação a partir dos modelos ICAs propostos anteriormente. Seguindo o que foi
determinado na metodologia, os resultados serão divididos numa estimativa de um
sistema artificial e um sistema real.
5.1. Sistema Artificial
Para o primeiro estudo de caso proposto, com a mistura dos sinais de referência, a partir
de uma matriz randômica. As figuras Y trazem o comportamento do sinais escolhidos.
(a)
(b)
(c)
(d)
(e)
(f)
Figura Y – Sinais originais: (a) – Seno Duplo; (b) – Onda duplo; (c) – Onda Periódica;
(d) – Sinal Branco de Gauss; (e) – Ruido Branco; (f) – Função cosseno.
Determinados os sinais a serem estimados. Utilizou-se, para primeira estimativa, os

sinais: Seno duplo, Onda Duplo, Onda periódica. A serem misturados, por uma matriz
aleatória A, e separados pelas as técnicas de ICA.
Os Sinais misturados pela a matriz A, para os três sinais escolhidos são mostradas na
figura W, sendo a matriz A mostrado pela a equação W.
(a)
(b)
(c)
Figura W – Sinais Misturados pela a matriz A.
A matriz de mistura é mostrada na equação W.
 0.8842 0.7598 0.0061 

 
A   0.7006 0.2909 0.3747  W
 0.2419 0.2774 0.4369 
 
Realizado a mistura dos sinais escolhidos. Partiu-se para o processo de separação a partir
dos vetores de sinais estimados. Para esse estudo de caso, tem-se que o número de fontes
e de sensores são iguais, A figura mostra Z mostra os sinais estimados pelo a metodologia
FastICA proposto por Hyvarinen (1999b). A Figura Z1 mostra a diferença absoluta entre
os sinais estimados e de referência.
(a)
(b)
(c)
Figura Z – Sinais estimados pelo o FastICA: (a) – Seno duplo; (b) – onda dupla; (c) –
Onda periódica. Sendo o sinal em vermelho e azul o estimado e de referência
respectivamente
(a)
(b)
(c)
Figura Z1 – Gráfico de erros absoluto(FastICA): (a) – desvio em relação ao seno duplo;
(b) desvio em relação a onda dupla; (c) – desvio em relação a onda periódica.
Analisando as figuras Z e Z1 fica evidente o erro de estimação, quando se utiliza a

ferramenta FastICA para a separação dos sinais. Observa-se a presença de erros de
amplitudes, para todos os gráficos da figura Z e erros de fase na figura Z (a) e Z (c). Essa
inversão de fase provocou um aumento do erro pontual, como é evidenciado na figura Z1
(a) e Z1 (b).
Feita as análises com a ferramenta FastICA, foi realizado a estimação, utilizando o

modelo JADE proposto por Cardoso (1993). A Figura A1 traz os sinais estimados por
esse modelo. A Figura A11 mostra a diferença absoluta entre o valor estimado e o de
referência.
(a)
(b)
(c)
Figura A1 – Sinais estimados pelo o JADE: (a) – Seno duplo; (b) – onda dupla; (c) –
Onda periódica. Sendo o sinal em vermelho e azul o estimado e de referência
respectivamente
(a)
(b)
(c)
Figura A11 – Gráfico de erro absoluto(JADE): (a) – desvio em relação ao seno duplo;
(b) desvio em relação a onda dupla; (c) – desvio em relação a onda periódica.
Analisando as Figuras Z e A1 observa-se que a estimativo obtida pelos o métodos fastICA

e JADE foram muito parecidas, apresentando os mesmo erros de amplitude e inversão de
fase. Devido a essa fato, tem-se que o comportamento dos gráficos do erro pontual (Figura
A11), ficou muito parecido com os da Figura Z1.
Depois de analisado as estimativas obtidas pelo os métodos FastICA e JADE. Utilizou-se

o algoritmo ICA por PCA proposto por Kun e Chan (2006). As Figuras K e K1, trazem,
respectivamente, os sinais estimados e o erro absoluto.
(a)
(b)
(c)
Figura K – Sinais estimados pelo ICA por PCA: (a) – Seno duplo; (b) – onda dupla; (c)
– Onda periódica. Sendo o sinal em vermelho e azul o estimado e de referência
respectivamente
(a)
(b)
(c)
Figura K1 - Gráfico de erro absoluto: (a) – desvio em relação ao seno duplo; (b) desvio
em relação a onda dupla; (c) – desvio em relação a onda periódica.
Analisando as Figuras K e K1, observa-se que o método ICA por PCA apresenta uma
melhor estimativa, quando comparado, com os dados obtidos nas estimativas dos
algoritmos FastICA e JADE. Tem-se que o método ICA por PCA apenas não conseguiu
estimar uma das fases dos sinais proposto, enquanto que nas outras ferramentas houve a
inversão de dois sinais. As figuras K1 (a) e (b) mostram erros semelhantes aos presentes
nas figuras A11 (a) e (b) e Z1 (a) e (b), das estimativas JADE e FastICA respectivamente.
Entretanto a figura K1 (c) menor erro, quando comparado as figuras A11 (c) e Z1 (c).
Como o principal objetivo desse trabalho é mostrar a eficiência da correção proposta, ao

algoritmo ICA por PCA. A mesma estimativa, realizada com as outra metodologias, foi
realizada, aplicando a correção de amplitude detalhada no tópico 3.3. deste trabalho. As
Figuras P e P2 trazem, respectivamente, os sinais estimados e os gráficos de erros
pontuais.
(a)
(b)
(c)
Figura P – Sinais estimados pelo ICA por PCA com correção: (a) – Seno duplo; (b) –
onda dupla; (c) – Onda periódica. Sendo o sinal em vermelho e azul o estimado e de
referência respectivamente
(a)
(b)
(c)
Figura P2 - Gráfico de erro absoluto: (a) – desvio em relação ao seno duplo; (b) desvio
em relação a onda dupla; (c) – desvio em relação a onda periódica.
Analisando a Figura P e comparando com as figuras Z, A e K1 que trazem as estimativas

de alguns dos métodos clássicos, observa-se uma redução, bastante significativa, no erro
de amplitude do sinal estimado. Mesmo nos casos onde houve a inversão das fases, a
amplitude do sinal estimado está bem próximo, da valor de referência. Essa redução é
evidenciada pelo a análise dos erros pontuais (Figura P2), onde no caso do sinal: onda
periódica (gráfico (c)-sem inversão de fase), o valor do erro está próximo de zero.
6. CRONOGRAMA
As etapas para a conclusão e obtenção do título de mestre em Engenharia Química,

estão especificadas na tabela 1.
Tabela 1 – Cronograma de Trabalho

Primeira Fase Segunda Fase
2015- 2016 2016-2017
Etapa 1
Etapa 2
Etapa 3
Etapa 4
Etapa 5
Etapa 6
Etapa 7
Etapa 8
Etapa 1 - Estudo inicial sobre o ICA envolvendo: conceitos, aplicação, revisão

bibliográfica e levantamento das últimas publicações relevantes.
Etapa 2 - Escolha do modelo de ICA a ser melhor estudado, com o objetivo de encontrar
e solucionar alguma falha existente no modelo escolhido.
Etapa 3 - Obtenção de estudo de caso, para melhor avaliação do modelo escolhido e
obtenção de outros modelos ICA para comparação de desempenho.
Etapa 4 - Construção do algoritmo dos modelo ICA por PCA, FASTTICA e JADE em
Matlab para a aplicação do estudo de caso já escolhido.
Etapa 5, 6 e 7 – Elaboração da defesa de seminário, finalização dos resultados
comparativos entre os modelos de análise de componentes independentes escolhidos e
ajustes finais de simulação.
Etapa 8 – Elaboração e defesa da dissertação de Mestrado.
7. REFERÊNCIAS
BIRBAUMER N., L.G. COHEN, Brain-computer interfaces: Communication and

restoration of movement in paralysis, J.Physiol, v. 579, no 3, p. 621-636, 2007.
Bizon, K., Continilho, G., Lombardi, S., Sementa, P., Independent componente analysis
of cycle resolved combustion images from a spark ignition optical engine. Combustion
and Flame, v.163, p.258-269, 2016.
CARDOSO, J. F. Source separation using higher order moments. In:
INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGAL
PROCESSING, 89., 1989, Glasgow. Proceedings... Glasgow: IEEE, 1089. p.
2109-2112.
CARDOSO, J. F.; SOULOUMIAC, A. Blind beamforming for non Gaussian
signals. IEE Proceedings - Part F, London, v. 140, n. 6, p. 362-370, Dec. 1993.
CARMO, SHIRLENE KELLY SANTOS. Decoupling strategy development in the
distillation column control using the signals separation technique, 2014. 131 p. Thesis
(Chemical Engineering Doctorate) – Federal University of Campina Grande, Paraíba,
2014.
CARMO, SHIRLENE KELLY SANTOS. Desenvolvimento de estratégia de
desacoplamento no controle de coluna de destilação usando a técnica de separação de
sinais, 2014. 131 p. Tese (Doutorado em Engenharia Química) – Universidade Federal de
Campina Grande, Paraíba, 2014.
Chen, B. & Lei, Z., Equilibrium-Based Separation Technologies: Part II. Separation and
Purification Technologies in Biorefineries, First Edition, 2013.
CICHOCKI, A., Amari, S-I. Adaptive Blind Signal and Image Processing: Learning
Algorithms and Applications. John Wiley & Sons, 2002.
COMON, P. Independent component analysis, a new concept? Signal
Processing, Amsterdam, v. 36, n. 3, p. 287-314, 1994.
DAMASCENO N. C, MEDEIROS A. M., Blind Source Separation using genetic
algorithms end negentropy as separation measure. In: XLII SBPO, Bento Gonsalves, RS,
2010.
DAMASCENO N. C, MEDEIROS A. M., Martins Allan de M., Um Algoritmo de
Otimização Para Maximizar a Negentropia de Rényi Aplicado ao problema Blind Source
Separation Não Linear. In: XLV SBPO, Natal, RN, 2013.
FAVERO, Jovani L., SILVA, LUIZ FERNANDO L.R, LAGE, PAULO L.C.,
Comparison of methods for multivariate moment inversion – Introducing independente
componente analysis. Computers and Chemical Engineering,v.60, p.41-56, 2014.
HERAULT, J.; JUTTEN, C. Space or time adaptive signal processing by neural
network models: neural networks for computing. In: CONFERENCE OF THE
AMERICAN INSTITUTE OF PHYSICS, 1., 1986, New York. Proceedings...
New York: AIP, 1986. p. 206-211.
HERAULT, J.; JUTTEN, C.; ANS, B. Détection de grandeurs primitives dans un
message composite par une architecture de calcul neuromimétique en
apprentissage non supervisé. In: XÈME COLLOQUE GRETSI, 1., 1985, Paris.
Actes. Paris: GRETSI, 1985. p. 1017-1022.
HYVÄRINEN A., “Survey on independent component analysis”, Neural Computer
Surveys 2, 1999a.
HYVÄRINEN A., E. OJA. “Independent Component Analisys: Alorithms and
applications Neural Networks”, 2000.
JUTTEN, C.; HERAULT, J. Blind separation of sources, part I: an adaptive
algorithm based on neuromimetic architecture. Signal Processing, Amsterdam,
v. 24, n. 1, p. 1-10, 1991.
KAI S., W. QI, AND D. MINGLI. Approach to nonlinear blind source separation based
on niche genetic algorithm. In: Proceeding of the Sixth International Conference on
Intelligent Systems Design and Applications (ISDA’06), Jinan, China, 2006.
KUN Z, Lai – WAN CHAN, “ ICA by PCA Approach: Relating Higher-Order Statistics
to Second-Order Moments”, 2006.
LEITE, Isabel Cristina Costa. Análise de Componentes Independentes Aplicada a
Avaliação de Imagem radiográfica de sementes. Tese de doutorado. Universidade Federal
de Lavras, 2013.
LIANFANG CAI, XUEMIN TIAN, Ni ZHANG. A Kernel Time Structure Independent
Component Analysis Method for Nonlinear Process Monitoring. Chinese Journal of
Chemical Engineering, v. 22, Issues 11–12, p.1243-1253, November 2014.
LU XIAN, KAIJIAN He, KIN KEUNG LAI. Gold price analysis based on ensemble
empirical model decomposition and independent component analysis, Physica A:
Statistical Mechanics and its Applications, v. 454, p. 11-23, July 2016.
MORETO, F. A. de L., Analise de componentes independentes aplicada à separação de
sinais de áudio. Dissertação de mestrado. Departamento de Engenharia de Sistemas
Eletrônicos. Universidade de São Paulo, 2008.
NIELSEN CASTELO DAMASCENO, Separação cega de fontes lineares e não lineares
usando algoritmo genético, redes Neurais artificiais RBF e Negentripia de Renly como
medida de independência. 2010. Dissertação de mestrado. Universidade federal do rio
grande do norte.
SILVA, ALAN PAULO OLIVEIRA da. Uma implementação de análise de componentes
independentes em plataforma de hadware reconfigurável. Dissertação de mestrado.
Universidade Federal do Rio Grande do Norte. Programa de pós-Graduação em
Engenharia elétrica e de computação, 2010.
WANG, B., YAN, X., JIANG, Q., Independent component analysis model utilizing de-
mixing information for improved non- Gaussian process monitoring. Computer &
Industrial Engineering, v. 94, p.188-200, 2016.
Yingwei Zhang, Yang Zhang, Fault detection of non-Gaussian processes based on
modified independent component analysis. Chemical Engineering Science, v. 65, Issue
16, p.4630-4639, August 2010.
YOSHIOKA M., S. OMATU, “Signal separation metho using genetic algorithms”, in
Proc. IEEE Int. Joint Conf. Neural Networks, vol. 2, pp. 909-912, 1998.
YUNG-Kun CHUANG, Yi-PING Hu, I-Chang Yang, Stephen R. Delwiche, Yangming
MARTIN Lo, CHAO-YIN Tsai, Suming Chen, Integration of independent component
analysis with near infrared spectroscopy for evaluation of rice freshness, Journal of
Cereal Science, v. 60, Issue 1, p.238-242, July 2014.
----------------------------------------------------------------------------------------
HYVARINEN A., E.OJA. “Independent component analysis: A tutorial”. Technical

report, 1999.
HYVARINEN A., “Fast and robust Fixed-point algorithms for independent component
analysis”. IEEE Trans. Neural Networks 10, 1999b.
WIENER N., “Extrapolation, Interpolation and Smoothing of Stationary Time Series,
With Engineering Applications”, Wiley, NY, New York, 1949.
BODE H., C. SHANNON, “A simplified derivation of Linear least squares smoothing
and prediction theory”, Proc. IRE, Vol. 38, pag. 417-425, Apr 1950.
HAYKIN S., “Adaptive Filter Theory”, 4th ed., Prentice-Hall, Englewood Cliffs, NJ,
2001b.
------AJEITAR ESSE REFERENCIA---------------------------------------------------------
DIAS, D., M., B., “ SEPARAÇÃO DE SINAIS GAUSSIANOS E NÃO-GAUSSIANOS

USANDO ICA E BEAMFORMING”. TRABALHO DE CONCLUSÃO DE CURSO.
FACULDADE DE TECNOLOGIA. UNIVERSIDADE DE BRASILIA. JUNHO DE
2014.
Aapo Hyvärinen, Juha Karhunen, and Erkki Oja, Independent Component

Analysis,Wiley interscience Publication, 2001.
COVER, T. M.; THOMAS, J. A.Elementsofinformationtheory. New York: J. Wiley,

1991. 542 p.
LEITÃO, G., “Separação de fontes de sinais de áudio”. Programa de Pós-Graduação em
engenharia elétrica e computação. Dezembro, 2009.
LEITE, Luciana. Análise de Componentes Independentes Aplicada à Identificação de
Regiões lesionadas em Mamogramas. 2005. Dissertação (Mestrado em Engenharia
Elétrica). Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia.
Universidade Federal do RJ, Rio de Janeiro, 2005)

Seminário Fábio - Análise de Componentes Independentes

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Seminário Fábio - Análise de Componentes Independentes

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE – UFCG

CENTRO DE CIÊNCIAS E TECNOLOGIA – CCT

MÉTODO ICA POR PCA COM MODIFICAÇÃO DE CORREÇÃO DE

Fábio George Nogueira Cruz

Em muitas situações de medição de sinais é necessário o uso de sensores para

Esse trabalho tem como objetivo o desenvolvimento de uma metodologia de

 Estudar os algoritmos ICA presentes na literatura;

 Avaliar as Técnicas de Separação por ICA;

 Proposta de melhoria para a metodologia ICA por PCA baseado em critérios

A análise de componentes independentes (ICA) teve os seus primeiros trabalhos

2.1. Estado da Arte

A análise de componentes independentes é uma técnica estatística utilizada para

X i  ai1S1  ai 2 S2  ...  ain Sn , para todo i= 1, 2,..., n (1)

Em que ai1 , j=1, 2,..., n, são coeficientes reais .

Em que o termo A pondera a mistura dos sinais fontes. A matriz A é denominada

Fonte: Nielsen (2010)

X 2  a21S1  a22 S2 (5)

O problema da estimativa do modelo ICA apresentado é estimar as componentes

3.1. Restrições do Modelo ICA

3.1.1. Não – Gaussianidade

3.1.1.1. Não-gaussianidade por Kurtosis

Kurtosis é um método clássico de medida do caráter gaussiano do sinal. A

kurt (s)  E{s 4 }  3( E{s 2 })2 (X)

E{s 4 }  3( E{s 2 })2 (X)

kurt ( s)  E{s 4 }  3 (X)

3.1.1.2. Não-gaussianidade por Entropia/Negentropia

Entropia é um conceito da teoria de informação, sendo uma medida da incerteza média

Sendo Y uma variável aleatória e 𝑓𝑌 (. ) Uma função de densidade.

Utilizando a equação X para o cálculo da entropia e consequentemente a negentropia,

Mostrado todo a definição e/ou procedimento para a utilização da entropia/negentropia,

3.1.2. Independência Estatística

Duas variáveis aleatórias Yi e Yj são ditas independentes se a informação contida

f ( y1 , y2 ,..., yn )  f1 ( y1 ) f 2 ( y2 )... f n ( yn ) (9)

3.1.3. Matriz de Mistura Quadrada

O método de separação ICA presume que a matriz de mistura é quadrática, isto é,

3.2. Algoritmo ICA utilizando PCA

Um algoritmo, desenvolvido recentemente, provou ser superior a algumas

 Encontre U usando PCA em z;

3.2.1. Problemas envolvendo a estimação pelo ICA por PCA

Figura 2 – Sinais fontes de Referência

3.3. Modificações proposta ao método ICA por PCA.

3.3.1. Correção estatística proposta

A técnica desenvolvida nesse trabalho parte do pressuposto da existência de falhas de

Figura 1 – Inversão do Modelo ICA (MODIFICAR FIGURA)

Xˆ 0  W 1Sˆ  Xˆ 0  W 1 ( JSˆ ) (X5)

Utilizando o critério de mínimos quadrados em relação ao sinal misturado branqueado

Derivando a equação em relação a J .

Para encontrar o mínimo da equação (X6), tem-se que igualar a zero.

Comparando com a equação (5)

 X - Sinal mistura Branqueado;

Partindo da obtenção da variável J, dita como a matriz quantificadora do erro de

Logo o coeficiente utilizado, na correção do sinal estimado, seria:

3.3.2. Analise da matriz de separação estimada pelo ICA

wˆ i  arg max( E{G( yi )}  E{G( xg )})2 (X)

E{xG '( wit x)}   wi  0 (X)

Onde β é uma constante.

Partindo do princípio que as misturas foram branqueadas, pode-se aplicar o método de

wˆ i  E{xG( wit x)}  E{G '( wit x)}wi

3.5. Algoritmo JADE

O algoritmo de Diagonalização Conjunta Aproximada de Automatrizes (JADE)

 Algoritmo ICA por PCA;

Para melhor exemplificar a diferença entre os valores estimados, em comparação aos

Erro  abs ( S  Sˆ ) (X9)