Você está na página 1de 14

SISTEMAS NEURAIS HBRIDOS PARA RECONHECIMENTO DE PADRES EM NARIZES ARTIFICIAIS

Cleber Zanchettin
cz@cin.ufpe.br

Teresa Bernarda Ludermir


tbl@cin.ufpe.br

Centro de Informtica Universidade Federal de Pernambuco - UFPE Caixa Postal 7851 - 50.732-970 Recife - PE - Brasil

ABSTRACT
This work investigates the use of Hybrid Intelligent Systems in the pattern recognition system of an articial nose. The connectionist approaches Multi-Layer Perceptron and Time Delay Neural Networks; and the hybrid approaches Feature-weighted Detector and Evolving Neural Fuzzy Networks were investigated. A wavelet lter as preprocessing method of odors signals is evaluated. The signals generated by an articial nose, composed by an array of conducting polymer sensors, exposed to two different odor databases.
KEYWORDS: Hybrid Intelligent Systems, Articial Neural

1 INTRODUO
Os narizes articiais so dispositivos eletrnicos capazes de detectar e classicar odores, vapores e gases automaticamente. Todavia, apesar da pesquisa e desenvolvimento dos narizes articiais serem inspirados no sistema olfativo biolgico, sua implementao, no se aproxima nem da complexidade ou de muitas das funcionalidades de seu equivalente biolgico. Atualmente, estes dispositivos consistem de um sistema sensor e um sistema de reconhecimento de padres. Nos narizes articiais o processo de reconhecimento e classicao do odor se inicia no sistema sensor, responsvel pela captao ou medio dos estmulos odorantes no ambiente frente sensibilidade de seus sensores. Cada composto odorante apresentado ao sistema sensor do nariz articial produz um estmulo caracterstico, frente aos sensores de deteco. Aps a captao destes estmulos ou padres de odores, e antes que estes sinais sejam apresentados ao sistema de reconhecimento de padres, realiza-se uma etapa de prprocessamento nos dados. A fase de pr-processamento nos padres de odores tem como nalidade a anlise dos dados, extrao dos descritores, correo de distores, normalizao e remoo/diminuio dos erros de leitura. Pr-processados, os padres de odores so apresentados ao sistema de reconhecimento de padres. Parte de fundamental importncia no funcionamento dos narizes articiais o sistema de reconhecimento de padres responsvel por classicar os estmulos odorantes captados pelo sistema sensor.
159

Networks, Articial Nose.

RESUMO
Este trabalho investiga a utilizao de Sistemas Hbridos Inteligentes no sistema de reconhecimento de padres de um nariz articial. So abordadas as arquiteturas conexionistas Multi-Layer Perceptron e Time Delay Neural Network; e as arquiteturas hbridas Feature-weighted Detector e Evolving Fuzzy Neural Networks. Alm dos classicadores, um ltro Wavelet avaliado como mtodo de pr-processamento para os sinais de odores. Foram analisados sinais gerados por um nariz articial, composto por um conjunto de sensores de polmeros condutores, exposto a duas bases de odores distintas.
PALAVRAS-CHAVE: Sistemas Hbridos Inteligentes, Redes

Neurais Articiais, Nariz Articial.

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

Os narizes articiais tm sido utilizados com grande sucesso em diversas aplicaes (Keller et al., 1995). Recentemente eles tm despertado especial interesse da indstria petrolfera, onde podem ser utilizados como dispositivos de segurana na deteco e reconhecimento de gases txicos. Em companhias petrolferas, os narizes articiais podem trabalhar na preveno de vazamentos em dutos de transporte e em plataformas de extrao e reno de derivados de petrleo. Posicionados em locais estratgicos, estes dispositivos podem detectar e identicar vazamentos qumicos em estgios iniciais, antes que a concentrao de gases txicos alcance nveis perceptveis e perigosos para os seres humanos e natureza. Tendo grande importncia nos resultados produzidos por um nariz articial, o sistema de reconhecimento de padres tem recebido crescente ateno em seu desenvolvimento. Dentre as abordagens investigadas objetivando o reconhecimento de padres, resultados promissores esto sendo encontrados no desenvolvimento de Sistemas Hbridos Inteligentes (Abraham e Nath, 2002; Mcgarry et al., 2002; Medsker, 1995). Os Sistemas Hbridos Inteligentes so modelos que resultam da combinao de duas ou mais tcnicas computacionais distintas, visando unir vantagens para suprir decincias individuais, na resoluo de determinado problema. Neste trabalho, procuramos investigar tcnicas hbridas que possam contribuir para o aprimoramento do sistema de reconhecimento de padres do prottipo de um nariz articial (Santos, 2000), a ser utilizado na deteco de gases provenientes da indstria petrolfera. So abordadas redes neurais articiais j consagradas na literatura no reconhecimento de odores, como redes neurais Multi-Layer Perceptron (MLP) (Rumelhart et al., 1986) e Time Delay Neural Network (TDNN) (Lang e Hilton, 1988); alm de novas abordagens neurais hbridas como: a rede neuro-difusa Feature-weigthed Detector (FWD) (Li et al., 2002), capaz de efetuar a classicao de padres, seleo dos atributos mais importantes e extrao de regras explicativas difusas da rede; e a rede neural evolutiva Evolving Fuzzy Neural Network (EFuNN) (Kasabov, 1998), que opera de um modo on-line; aprende incrementalmente e manipula o conhecimento adquirido do ambiente a partir de regras difusas de classicao, realizando agregao, insero e extrao destas regras na arquitetura da rede. Para avaliar os classicadores, seus desempenhos sero comparados na classicao de duas bases de dados distintas, uma base de odores de vinhos e uma base de gases derivados da indstria petrolfera. Este artigo est dividido em cinco sees. A seo 2 apresenta os classicadores investigados. Na seo 3 so descritos os experimentos realizados. Na seo 4 so apresentados os resultados obtidos com cada um dos classicadores na anlise dos padres de odores. As consideraes nais

so apresentadas na seo 5.

2 SISTEMAS CONEXIONISTAS NO RECONHECIMENTO DE ODORES


O reconhecimento de padres em narizes articiais tm sido proposto a partir de vrias abordagens no decorrer da ltima dcada (Barbosa et al., 2002; Yamazaki et al., 2001; Santos, 2000; Natale et al., 1995; Gardner et al., 1994; Keller et al., 1994; Sundgren et al., 1991; Gardner et al., 1990). Na grande maioria das abordagens as redes neurais articiais tm sido amplamente utilizadas no reconhecimento de odor, devido a sua capacidade de trabalhar com sinais no-lineares provenientes dos sensores, grande adaptabilidade, tolerncia a erros, tolerncia a rudo e paralelismo inerente, permitindo rapidez no uso aps o treinamento (Gardner et al., 1990).

2.1 Redes Multi-Layer Perceptron


Dentre os vrios modelos de redes neurais articiais existentes, a rede MLP (Rumelhart et al., 1986) a rede neural articial mais difundida, parte por sua facilidade de implementao, parte por sua simplicidade. Caractersticas estas, que a tornaram uma das redes neurais articiais mais utilizadas na classicao de padres de odores em narizes articiais (Yamazaki e Ludermir, 2001; Santos, 2000; Natale et al., 1995; Gardner et al., 1994; Keller et al., 1994; Sundgren et al., 1991; Gardner et al., 1990). Devido a sua ampla utilizao no reconhecimento de odores, a rede MLP se torna necessria como parmetro em qualquer tipo de comparao entre classicadores para narizes articiais. Nas simulaes realizadas com a rede MLP foram utilizados dois mtodos de pr-processamento: normalizao dos dados, de modo a que cassem compreendidos na faixa de valores entre -1 e 1; e o ltro Wavelet, para reduo do rudo e compresso dos dados de odores. Foi utilizada uma rede MLP, contendo apenas uma camada intermediria. Neste experimento foi utilizada a codicao 1-of-m, onde m o nmero de classes (Prechelt, 1994), desta forma a rede neural possui tantas sadas quanto forem o nmero de classes investigadas. As unidades de processamento das camadas, intermediria e de sada possuem funo de ativao tangente hiperblica (Prechelt, 1994). A rede contm todas as possveis conexes de propagao direta (feedforward) entre camadas adjacentes, sem possuir conexes que ligam unidades de processamento de camadas noadjacentes. Em cada um dos experimentos, foram treinadas seis topologias de rede distintas (com 4, 8, 12, 16, 20 e 30 unidades de processamento na camada intermediria). O algoritmo de treinamento utilizado uma verso do mtodo de Lenvenberg-Maquardt, descrita em (Lang e Hil-

160

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

ton, 1988). Para cada topologia, foram realizadas 30 (trinta) treinamentos, com inicializaes de valores diferentes e aleatrios para as conexes entre as camadas de processamento. A parada do treinamento ocorre se for satisfeito o critrio GL5 do Proben1 (Prechelt, 1994) por duas vezes (para evitar que o treinamento seja interrompido por oscilaes iniciais no erro de validao). O critrio GL5 fornece uma idia sobre a perda da generalizao durante o treinamento da rede, sendo muito til para evitar overtting. Este parmetro denido como o aumento do erro de validao em relao ao erro de validao mnimo obtido. O treinamento tambm interrompido se for satisfeito o critrio de progresso de treinamento do Proben1 (Prechelt, 1994), com P5 (t) < 0.1. Este parmetro fornece uma idia de quanto o erro mdio de treinamento maior que o mnimo erro de treinamento, durante uma seqncia de pocas consecutivas. O treinamento tambm encerrado se a quantidade mxima de 5.000 iteraes for alcanada.

ou agrupados em conjuntos maiores). Desta forma, uma das repeties da aquisio dos dados foi utilizada como conjunto de treinamento. Outras duas repeties distintas (com a mesma quantidade de dados) foram utilizadas como conjunto de validao e teste. Foram utilizadas as mesmas tcnicas de pr-processamento adotadas nos experimentos com redes MLP. Para o tratamento temporal dos padres de odores, foi utilizada uma rede TDNN (Lang e Hilton, 1988), contendo apenas uma camada intermediria. A camada de entrada possui o dobro do nmero de sensores do nariz articial, pelo fato da utilizao do atraso no tempo (delay de t-1), para cada uma das curvas de entrada. Este atraso formado pelo valor atual de resistncia do sensor e por um valor temporalmente anterior a este, de cada um dos sensores. Esta quantidade de atrasos no tempo para cada uma das curvas de entrada foi escolhida por ser a menor congurao possvel utilizando caractersticas temporais. Foi utilizada a mesma codicao, topologia, funo de ativao e algoritmo de aprendizado adotados na rede MLP descrita na seo anterior. Da mesma forma, foram realizadas trinta (30) execues com diferentes inicializaes dos valores das conexes entre as camadas de processamento. Os critrios de parada do treinamento foram os mesmos adotados nos experimentos com a rede MLP. importante ressaltar que os erros analisados foram computados separadamente para cada odor, ou seja, a rede avaliou, para cada sensor, as curvas correspondentes a cada independentemente, e no uma nica curva contendo os valores dos odores em seqncia. Isto foi adotado para que a ordem de apresentao dos odores rede no inuencie nos resultados obtidos.

2.2 Rede Time Delay Neural Network


A rede Time Delay Neural Network (Time Delay), foi proposta por (Waibel et al., 1989), com a nalidade de resolver o problema de reconhecimento de fonemas isolados utilizando um espectrograma. Em essncia, uma TDNN uma rede neural articial com arquitetura feedforward, onde a resposta da rede no tempo t baseada nas entradas no tempo (t-1), (t-2),. . . , (t-n). Com isso, considera-se um histrico da seqncia temporal dos dados. A abordagem utilizada neste trabalho foi proposta por (Yamazaki e Ludermir, 2001). Esta abordagem consiste de um sistema de reconhecimento de padres capaz de analisar as caractersticas temporais dos sinais gerados pelos sensores do nariz articial, levando em considerao a variao destes valores ao longo do intervalo de tempo em que foram feitas as aquisies dos dados. Este trabalho tem particular interesse em redes TDNN, a qual, a arquitetura conexionista que tem apresentado os resultados mais promissores na classicao de padres de odores em narizes articiais (Zanchettin e Ludermir, 2003c; Zanchettin e Ludermir, 2003b; Zanchettin e Ludermir, 2003a; Yamazaki e Ludermir, 2001; Yamazaki et al., 2001). Como descrito em Yamazaki e Ludermir (2001), a arquitetura do sistema de reconhecimento de padres necessita receber curvas completas geradas pelos sensores do nariz articial durante a aquisio dos dados. Tais curvas precisam ser obtidas em intervalos ininterruptos de tempo, desta forma, apenas os valores obtidos em cada uma das repeties podem ser utilizados no conjunto de treinamento, validao e teste (os padres no podem ser retirados da ordem de aquisio

2.3 Rede Feature-weighted Detector


A abordagem neuro-difusa Feature-weighted Detector (Li et al., 2002), consiste de uma rede com conexes de memria para classicao de padres e conexes de pesos para seleo de atributos. Esta abordagem possui a capacidade de selecionar as caractersticas importantes de um conjunto de dados, enquanto mantm a taxa mxima de reconhecimento de padres. Alm da capacidade de selecionar atributos e classicar padres, o mtodo possibilita a extrao do conhecimento adquirido pela rede no processo de aprendizagem na forma de um conjunto de regras interpretveis do tipo SeEnto. Este modelo oferece especial interesse no tratamento dos padres de odores por se propor a resolver dois dos principais problemas do reconhecimento de padres: a seleo de atributos e a classicao dos padres, alm da capacidade de

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

161

extrair regras difusas da estrutura da rede. Estas regras podem ser utilizadas na explicao do conhecimento adquirido pela rede na fase de aprendizagem, resolvendo assim uma conhecida decincia das redes neurais articiais. A partir de experimentos prvios, realizados com a rede FWD, vericou-se que a ordem com que os padres de odores so apresentados no treinamento, possui inuncia sobre seu desempenho na classicao dos odores. Assim, nos experimentos, os exemplos de cada um dos odores foram apresentados de forma ordenada no treinamento da rede (primeiramente foram apresentados todos os exemplos de um tipo de odor, posteriormente de outro tipo, etc.). Para o teste da rede neuro-difusa os padres de odores foram apresentados de forma aleatria. A m de considerar esta necessidade de ordenao e vericar o desempenho da rede FWD com vrias parties de dados, os mesmos conjuntos empregados nos experimentos com a rede TDNN foram utilizados. A rede FWD no utiliza conjunto de validao em seu treinamento. importante salientar que os conjuntos de treinamento e teste de cada uma das parties so formados por diferentes repeties de aquisies de dados e que as caractersticas das respostas dos sensores podem se modicar de uma aquisio para outra (Santos, 2000). O conjunto de padres foi normalizado de modo a car compreendido na faixa de valores entre 0 e 1. O prprocessamento a partir do ltro Wavelet no foi utilizado nos experimentos com a rede FWD, pois em anlises preliminares no melhoraram os resultados apresentados pelo modelo. Por questo de objetividade seus resultados foram suprimidos das simulaes realizadas com a rede FWD. Foram realizadas 30 (trinta) execues, para cada uma das parties. So utilizadas inicializaes baseadas nos centros dos dados para as conexes de memria e valores xos em 1 para as conexes de pesos. Os critrios de parada do treinamento utilizados foram o erro mnimo de treinamento = 0 e o nmero mximo de 5.000 iteraes.

Toda a estrutura da rede EFuNN construda sobre um conjunto de regras difusas, onde possvel modicar dinamicamente a topologia da rede. Assim, o modelo pode se adaptar a novos dados de treinamento (inclusive inserindo novas classes) de uma maneira on-line e aprender incrementalmente a partir de caractersticas locais dos exemplos de treinamento. Todo o conhecimento adquirido pela rede pode ser expresso na forma de regras de classicao difusas do tipo Se-Ento. A arquitetura EFuNN denominada evolutiva porque sua topologia cresce com a apresentao de novos dados na fase de aprendizado e regularmente diminui atravs de poda (prunning), ou atravs da agregao de unidades de processamento de regras.

O interesse na aplicao da rede EFuNN no tratamento dos padres de odores surgiu a partir de trs de suas funcionalidades: (1) possibilidade de extrao do conhecimento da rede a partir de regras de classicao; (2) aprendizado incremental, o qual possibilita que novos odores sejam aprendidos durante a operao do dispositivo; e (3) treinamento on-line, que possibilita a apresentao de novos padres e classes a rede, sem a necessidade de re-apresentar toda a base de dados previamente treinada. Em um dispositivo onde se prima pela ecincia, rapidez, plasticidade e tamanho estas caractersticas so muito apreciadas. Pelo fato da rede EFuNN no utilizar conjunto de validao em seu treinamento, nos experimentos realizados a base de dados utilizou somente dois conjuntos de dados: conjunto de treinamento, correspondendo a 50% da quantidade total de padres; e conjunto de teste, correspondendo a 25% dos dados. Foram utilizados os mesmos dados empregados no treinamento da rede MLP. A rede EFuNN no necessita de pr-processamento, desta forma, os dados so apresentados camada de entrada sem processamento algum. Nesta camada os exemplos so transformados em padres difusos, representados pela segunda camada de processamento da rede, no espao de representao do problema. Desta forma, os padres de odores foram apresentados rede com a mesma amplitude de valores captada pelo sistema sensor do nariz articial. Cada unidade de processamento de entrada e sada contm trs funes de pertinncia (Baixo, Mdio e Alto), utilizadas na representao difusa dos dados. A inexistncia de aleatoriedade no treinamento da rede EFuNN faz com que uma execuo da rede seja suciente para fornecer uma idia sobre a generalizao do modelo. Ou seja, como o aprendizado realizado a partir dos exemplos apresentados ao modelo, os mesmos dados iro convergir sempre para um mesmo ponto no espao de busca. Assim,

2.4 Rede Evolving Fuzzy Neural Network


A abordagem evolutiva neuro-difusa EFuNN (Kasabov, 1998), uma estrutura conexionista que possui caractersticas como: aprendizado rpido (possivelmente em modo onepass learning), incremental e on-line; sua estrutura conexionista pode ser interpretada por regras difusas; utiliza regras de classicao para o crescimento, poda e agregao de sua topologia; e suas unidades de processamento e as conexes entre estas unidades so criadas, eliminadas e agregadas dinamicamente durante a operao da rede.

162

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

para realizar a comparao da rede EFuNN com as demais abordagens investigadas neste trabalho foram criadas 30 parties, de forma a se obter um erro mdio de classicao para a base de odores utilizada. O modo de treinamento utilizado foi one pass training, os exemplos so apresentados rede somente uma vez para cada uma das modalidades e parties testadas. Foram realizadas quatro modalidades de experimentos: (1) no primeiro experimento a rede foi inicializada sem nenhuma regra e em seu treinamento no foram realizadas operaes de poda (pruning) ou agregao de nodos de regras; (2) no segundo experimento, a rede tambm foi inicializada sem nenhuma regra, mas durante seu treinamento foi utilizada a tcnica de poda dos nodos de regras que estivessem fora do limiar de ativao pr-estabelecido; (3) no terceiro experimento, a rede foi inicializada com algumas regras, remanescentes de treinamentos prvios e novos dados foram apresentados rede de maneira on-line. Durante este treinamento foram utilizados ambos, poda e agregao; e (4) no quarto experimento, a partir de uma arquitetura previamente treinada com alguns odores, foram apresentados exemplos novas classes de odores, forando a rede a se adaptar a estes novos exemplos e englobar automaticamente esta nova classe em sua topologia.

tos de ITO (substrato vtreo condutor). Algumas vantagens na utilizao deste tipo de sensor so: (1) rpida cintica de absoro em temperatura ambiente; (2) pequeno consumo de energia (da ordem de microwatts), pois no necessrio um elemento aquecedor; (3) resistncia ao envenenamento por compostos que normalmente tornariam inativos os sensores inorgnicos de semicondutores, como os compostos que contm enxofre; e (4) a possibilidade de o polmero ser construdo com especicidade para determinados compostos qumicos (Persaud e Travers, 1997). A aquisio dos dados foi realizada de forma automtica pelo nariz articial, estando os sensores expostos aos odorantes em uma cmara especial de testes. A concentrao de cada um dos odores foi constante em cada uma das aquisies dos dados e entre as diferentes aquisies. Maiores detalhes sobre a construo do prottipo podem ser encontrados em (Santos, 2000). A primeira base trata da classicao de odores provenientes de trs safras distintas (anos 1995, 1996 e 1997) de um mesmo vinho tinto comercial (Almadm, Brasil) produzido com uvas do tipo merlot. Foram realizadas trs repeties de aquisio de dados. Em cada uma destas repeties, para cada uma das trs safras de vinho, o valor da resistncia de cada um dos seis sensores utilizados foi registrado de meio em meio segundo, sendo que o processo estendeu-se por cinco minutos. Dessa forma, cada sensor obteve 600 valores registrados para cada safra de vinho. O conjunto formado pelos seis valores dos seis sensores no mesmo instante de tempo foi considerado como um padro da base de dados. Assim, cada repetio contm 1.800 padres (600 de cada safra). Como existem trs repeties, tem-se um total de 5.400 padres na base de dados de vinhos. A segunda base de dados provm da exposio do nariz articial frente a compostos fornecidos pela pela companhia petrolfera Petrobrs2 . Os testes foram realizados frente aos gases derivados do petrleo: Metano, Etano, Propano e Butano. Tambm foi vericada a sensibilidade frente ao gs Monxido de Carbono. Os dados foram obtidos em nove repeties de testes, para os cinco gases analisados. Em todas as repeties, o valor de resistncia de cada um dos oito sensores utilizados foi registrado em intervalos de 20 segundos. Como o processo de aquisio dos padres de cada arranjo estendeu-se por 40 minutos, cada sensor obteve o registro de 120 valores, para cada um dos cinco gases apresentados ao nariz articial. Desta forma, cada repetio contm 600 padres, formados por 960 valores de cada gs. A partir das nove repeties, obteve-se um total de 5.400 padres que formam a base de dados de gases. A tabela 1 apresenta um exemplo de aquisio dos dados para o gs Butano. Os sensores utilizados so denominados pelo nome do do2 Petrleo

3 EXPERIMENTOS
O processo de aquisio dos estmulos odorantes pelo nariz articial realizado no sistema sensor, o qual composto por uma matriz de sensores que captam informaes do ambiente e as convertem em medidas quantitativas de interesse. O sistema sensor pode ser formado por um conjunto de sensores distintos, em que cada elemento mede uma propriedade diferente do composto odorante, ou por um nico dispositivo que produz um conjunto de medies para cada composto odorante. O sistema sensor pode tambm ser formado por uma combinao das estruturas descritas anteriormente (Yamazaki e Ludermir, 2001; Keller et al., 1995; Keller et al., 1994). Vrios tipos de sensores e dopantes caractersticos podem ser utilizados na construo da matriz de sensores, dependendo da resposta desejada ou do odor analisado. Desta forma, todo composto odorante apresentado ao sistema sensor produz nos sensores alteraes fsicas ou qumicas que o caracterizam. Neste trabalho utilizamos duas bases de dados distintas, obtida a partir da exposio do prottipo de um nariz articial (Santos, 2000) frente a dois compostos distintos. A matriz de sensores composta pelo arranjo de sensores baseados em lmes de polipirrol1 . Os sensores foram preparados com diferentes dopantes, por polimerizao in situ, em substra1 Polmero Condutor, material orgnico, do tipo "plstico", geralmente derivado do petrleo, que conduz eletricidade.

Brasileiro S. A., Brasil. 163

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

Escores em CP 3

pante utilizado em sua constituio, DBS - Dodecilbenzonato de Sdio, OSA - Octil-sulfato de Sdio, NBS - cido Nitrobenzeno Sulfnico, ASA - Antraquinona Sulfonato de Sdio, PTSA - cido P-toluenosulfnico, CAS - cido Canforsulfnico, PER - Perclorato de Ltio, OSA2 - Octil-sulfonato de Sdio. Tabela 1: Exemplo de uma das repeties de aquisio dos dados, para o gs Butano.
Tempo (s) 20 40 60 80 ... 2.400 Sensores (valores de resistncia) DBS OSA NBS ASA PTSA CAS PER OSA2 684 686 686 688 ... 920 360 360 360 360 ... 360 6140 6140 6140 6140 ... 6180 141,6 141,6 141,6 141,6 ... 141,8 269,2 269,4 269,4 269,4 ... 270,8 3222 3228 3222 3228 ... 3250 3238 3236 3234 3236 ... 3182 498 498 498 500 500

PCA Vinhos

2 1.5 1 0.5 0 0.5 1 4 Safra 95 Safra 96 Safra 2 97 0 2 Escores em CP 2 2 4 Escores em CP 1 0

4 2

Figura 1: Projeo dos escores nas trs primeiras CPs de 1800 padres da base de vinhos.

Para auxiliar na anlise dos experimentos que sero realizados neste estudo a Anlise de Componentes Principais (PCA) (Jackson, 1991) foi empregada na visualizao dos padres nas duas bases de dados. Neste tipo de anlise essencial a escolha do nmero de componentes principais (CPs) utilizados na descrio do sistema, de modo a reduzir a dimenso das amostras estudadas. Sero consideradas as trs primeiras CPs, pois juntas correspondem a mais de 97.5% e 99.5% da varincia total dos padres analisados nos dados das bases de vinhos e gases, respectivamente. A projeo dos escores da base vinhos, nas trs primeiras componentes principais, pode ser vista na gura 1. Pode ser vericado que as amostras das Safras 95 e 97 esto mais agrupadas, enquanto que as amostras da Safra 96 est bem separada das demais. A projeo dos escores da base gases apresentada na gura 2. A partir desta gura pode-se observar que a distino entre a maioria dos gases bem denida, apenas os gases Metano e Etano mantm-se agrupados em um plano de difcil separao. A PCA pode tambm ser utilizada para vericar a importncia de cada uma das variveis do conjunto original de dados. Ou seja, as variveis originais ou os sensores em nosso caso, com maior peso na combinao linear dos primeiros componentes principais so os mais importantes do ponto de vista estatstico. A partir da anlise dos pesos de cada uma das variveis, foi possvel vericar quais sensores mais contribuem para a separao dos odores em cada uma das componentes principais. Vericou-se que na separao dos vinhos trs sensores
164

possuem maior relevncia, so eles: Dodecilbenzonato de Sdio - DBS, Antraquinona Sulfonato de Sdio - ASA, Octilsulfonato de Sdio - OSA. Na base de gases vericou-se que cinco sensores so os mais relevantes: Dodecilbenzoato de Sdio - DBS, Octil-sulfonato de Sdio - OSA, Antraquinona Sulfonato de Sdio - ASA, Perclorato de Ltio - PER e Octilsulfonato de Sdio - OSA2, possuem maior relevncia para a separao dos padres nas componentes principais analisadas.

3.1 Pr-Processamento dos Dados


Nos experimentos realizados, foram criadas 3 parties de dados, baseadas na base de dados original. Cada uma das parties possui suas instncias dispostas em diferentes ordens de forma aleatria. A partir destas parties, a base de padres de odores foi dividida em trs conjuntos de dados, os quais correspondem aos conjuntos de treinamento, validao e teste utilizados nos experimentos com os classicadores. A proporo de padres contidos em cada um dos conjuntos foi a seguinte: 50% dos padres de odores foram dispostos no conjunto de treinamento; 25% dos padres correspondem ao conjunto de validao; e os 25% restantes foram utilizados no conjunto de teste. A utilizao de parties de dados necessria para eliminar qualquer vis existente no treinamento das redes neurais articiais. Este tipo de diviso nos padres de treinamento sugerida pelo relatrio Proben1 (Prechelt, 1994), um conhecido Benchmark para o treinamento de redes neurais articiais.

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

PCA Gases

Escores em CP 3

1 Butano Etano Monoxido de Carbono 1 Propano Metano 0 1 Escores em CP 2 2 4 2 Escores em CP 1 0

2 2

suas funes bases (wavelets) no pertencem a um espao nito de solues, isto , existem teoricamente innitas possibilidades de se projetar wavelets com propriedades especiais, voltadas para aplicaes especcas. A Anlise Wavelet uma transformao integral onde os ncleos de integrao usados na transformao do sinal so denominados de wavelets. Estas wavelets so essencialmente utilizadas de duas maneiras no estudo de processos ou sinais: (1) como um ncleo de integrao para analisar a extrao de informaes sobre um processo; e (2) como uma base de representao ou caracterizao do mesmo.
4 2

Figura 2: Projeo dos escores nas trs primeiras CPs de 600 padres da base de gases.

A gura 3 ilustra o processo onde a resoluo de tempodomnio de um sinal x(k ), k = 1, . . . , N alterado pela operaes de ltragem passa/faixa e a escala alterada por operaes de downsampling/upsampling. Os parmetros da Transformada Wavelet so o tipo do ltro Wavelet utilizado e o nmero de nveis de decomposio (l = 1, . . . , L).

3.1.1

Normalizao dos Dados

Para uma maior efetividade e rapidez no treinamento de redes neurais articiais, aconselhvel a transformao de todos os atributos de valores reais para um mesmo intervalo. Dados com atributos em escalas diferentes podem confundir o aprendizado da rede, fazendo que esta tenha maior considerao por valores com grandes magnitudes. As tcnicas de normalizao evitam este tipo de problema, transpondo os dados em intervalos bem denidos. Podem ser utilizadas normalizaes Euclidianas, logartmicas ou funes trigonomtricas, tais como: tangente hiperblica, seno, coseno, etc. Nos experimentos, os padres de odores foram normalizados separadamente para cada sensor do nariz articial. Duas formas de normalizao foram utilizadas: (1) normalizao nos dados para que os valores cassem dispostos entre -1 e 1; e (2) normalizao para que cassem dispostos entre 0 e 1. 3.1.2 Filtro Wavelet

Figura 3: Transformada Wavelet: a) Forward e b) Inversa. Em nveis baixos da escala de decomposio, a denio de tempo negligenciada em favor de uma melhor denio da freqncia. Deste modo eventos de baixa freqncia podem ser melhor analisados com respeito a seu ndice de freqncia mas no com respeito a sua posio no tempo. Em nveis elevados da escala uma melhor denio do tempo obtida, a posio de eventos de alta freqncia bem localizada no tempo, mas seu ndice de freqncia real no exato. A Transformada Wavelet pode ser representada por: d0,0 = g (t), (t) dj,k = g (t), j,k (t) , j = 1, ..., N, k = 1, ..., 2j 1 (1) (2)

Ao considerarmos que os sinais odorantes captados pelo nariz articial so sinais, adquiridos por um sensor em um determinado intervalo de tempo; uma das ferramentas mais indicadas para o tratamento destes padres so tcnicas utilizadas no processamento de sinais digitais. A partir deste pressuposto, a Transformada Wavelet (Daubechies, 1990) foi utilizada como mtodo de pr-processamento dos sinais. A Transformada Wavelets uma ferramenta matemtica que possui vantagens perante tcnicas clssicas de processamento de sinais, como a Anlise de Fourier (Brigham, 1988):

onde dj,k so os coecientes wavelet, g (t) o sinal a ser transformado, (t) a escala da funo, j,k (t) a funo wavelet me (t) dada por: j,k (t) = 2j/2 (2j t k ) (3)

e N o nmero de escalas sobre o qual a Transformada Wavelet gerada. Seguindo esta notao, a Transformada Wavelet Inversa pode ser dada por: g (t) = d0,0 (t) +
j,k

dj,k j,k (t)

(4)

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

165

O ltro Wavelet utilizado neste trabalho foi construdo com a Transformada Wavelets da famlia Daubechies de ordem 3 (Daubechies, 1988), com threshold de ltragem xo (thr = 35). Este ltro utilizado para reduo do rudo inerente ao sinal de odor e como mtodo de compresso deste sinal. Como o mtodo de aquisio dos dados no nariz articial induz a rudos de baixa freqncia, os sinais livres de rudo foram encontrados na componente de mais baixa freqncia de uma rvore de 3 nveis de decomposio.

penho das abordagens existentes. Na agricultura, por exemplo, buscam-se variedades mais adequadas e mais produtivas de cereais. Na computao, buscam-se tcnicas que melhorem a qualidade e o desempenho dos softwares existentes. Nestas situaes preciso comparar as tcnicas usuais com os mtodos alternativos propostos. Esta comparao uma questo importante que surge freqentemente no trabalho de pesquisa. Para se chegar a qualquer concluso necessrio coletar informaes e fazer inferncias a partir de evidncias experimentais ou observacionais. A partir das observaes realizadas, para uma resposta coerente, necessrio generalizar os resultados obtidos no grupo estudado para a populao de interesse. Esta tarefa exige cuidados especiais no planejamento dos experimentos, sendo que fatores que afetem a resposta avaliada devem ser controlados e considerados. O procedimento utilizado para determinar se o resultado de uma anlise aponta para sim ou para no chamado Teste de Hiptese (Duda et al., 2001). Este procedimento amplamente utilizado nas reas de pesquisa onde as variveis envolvidas esto sujeitas grande variabilidade. O teste de hipteses utilizado na comparao dos classicadores investigados neste trabalho o teste de Wilcoxon (Johson e Wichern, 1999). O teste de Wilcoxon, tambm conhecido por Teste dos Sinais por Postos, um teste de hipteses no-paramtrico para dados pareados. O teste de hipteses ser utilizado para comparar os resultados obtidos por cada um dos classicadores. A partir destes testes ser possvel armar qual dos classicadores avaliados possui o melhor desempenho na classicao dos compostos odorantes. Os resultados foram considerados estatisticamente signicativos quando P<0,05.

4 RESULTADOS
Figura 4: Decomposio utilizada para ltrar o rudo e comprimir o sinal de odor. Na gura 4 pode ser vericada a decomposio do sinal analisado. A partir desta decomposio o sinal de odor original foi reconstrudo a partir do terceiro nvel de decomposio sem os componentes ruidosos que poderiam prejudicar o desempenho dos classicadores. A taxa de compresso obtida foi de 85.71%. O ltro foi implementado utilizando o Toolbox Wavelets (Misiti et al., 1996), do software de simulao Matlab 6.5.13 .

4.1 Redes Multi-Layer Perceptron


Foram realizados dois experimentos distintos: (1) um experimento onde o mtodo de pr-processamento utilizado somente a normalizao dos padres captados pelo sistema sensor do nariz articial, de modo que estes valores quem compreendidos no intervalo [-1, 1]; e (2) um experimento que utiliza um ltro Wavelet para reduo do rudo presente no sinal captado pelo sistema sensor do nariz articial e como um mecanismo de compresso para os dados de odor. Na tabela 2 so apresentados os resultados do primeiro experimento, sem o uso do ltro Wavelet. Para cada um dos experimentos apresenta-se uma tabela contendo o nome da base de dados, a melhor topologia encontrada, a mdia dos resultados obtidos nas trinta (30) execues realizadas, com as trs parties (Sum Squared Error - SSE e Erro de Classicao), bem como os valores de mdia e desvio-padro.

3.2 Mtodo de Comparao entre as abordagens


Na maioria das reas de pesquisa h uma busca contnua por novos mtodos que melhorem em algum sentido o desem3 The

MathWorks, Inc.

166

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

Tabela 2: MLP - Experimento 1.


Base Nodos Vinhos Gases 8 8 SSE de Treinamento SSE de Validao Erro de Classicao

Mdia Desvio Mdia Desvio Mdia Desvio 598,63 598,63 295,28 295,28 0,1096 0,1096 1849,76 2681,81 967,09 1379,38 0,1461 0,1913

processamento com ltro Wavelet). Neste teste, vericamos que apesar da menor mdia de classicao do segundo experimento, com nvel de signicncia de 5%, estatisticamente a performance mdia das redes MLP fazendo uso do ltro Wavelet to boa quanto das redes que no usam este tipo de pr-processamento.

4.2 Rede Time Delay Neural Network


Em ambas as bases o menor erro de validao e classicao foi obtido pela topologia com 8 nodos na camada escondida. Correspondendo a um erro de classicao mdio de 10.96% para a base de vinhos e 14.61% para a base de gases (tabela 2). Foi vericado tambm que a partir da topologia com 8 nodos na camada intermediria, o erro obtido pela rede neural aumenta com a adio de novas unidades de processamento nesta camada. Apesar deste indcio, foram realizados experimentos com topologias onde o nmero de unidades de processamento na camada intermediria ultrapassava 30 nodos (com 50, 70, 100, 150 e 300 unidades de processamento na camada intermediria). Porm, nestes experimentos o erro de classicao manteve a mesma tendncia de alta, proporcional ao nmero de unidades de processamento adicionadas. Na tabela 3 so apresentados os resultados do treinamento realizado com as redes MLP utilizando o ltro Wavelet. Tabela 3: MLP com ltro Wavelet - Experimento 2.
SSE de Treinamento SSE de Validao Erro de Classicao

Os mesmos experimentos realizados com a rede MLP foram repetidos coma rede TDNN. Na tabela 4 so apresentados os resultados mdios do treinamento, para as trs parties testadas. Neste experimento somente foi utilizada a normalizao, como mtodo de pr-processamento. Tabela 4: TDNN - Experimento 1.
SSE de Base Nodos Treinamento Vinhos Gases 8 8 0,09 2,77 0,13 2,94 SSE de Validao 22,40 72,27 Erro de Classicao

Mdia Desvio Mdia Desvio Mdia Desvio 13,88 0,0050 0,0227 30,87 0,1217 0,0869

Base Nodos Vinhos Gases 12 8

Mdia Desvio Mdia Desvio Mdia Desvio 689,83 1526,04 344,69 762,52 0,0947 0,2120 1425,66 2373,96 737,11 1209,03 0,1150 0,1734

A partir dos resultados apresentados na tabela 3 se percebe que a utilizao do ltro Wavelet, melhora consideravelmente o desempenho do mtodo de classicao. Os menores erros de validao e classicao foram obtidos pelas topologias com 12 e 8 nodos na camada intermediria, um erro mdio de 9,47% e 11.50% sobre o conjunto de teste, para as bases de vinhos e gases, respectivamente. Se compararmos os melhores resultados obtidos pelos dois experimentos (resultados obtidos pelo classicador sem e com a utilizao do ltro Wavelet) podemos vericar que a melhora foi substancial. A m de vericarmos a relevncia estatstica dos resultados obtidos, foi realizado o teste de hipteses nestes experimentos. O teste realizado a partir dos melhores resultados mdios, obtidos por cada um dos experimentos (com e sem pr-

Como pode ser observado, a abordagem temporal diminuiu consideravelmente a variao dos resultados, reetido no baixo desvio-padro apresentado pelos experimentos. As topologias com menor erro mdio de validao e teste foram as topologias com 8 unidades de processamento na camada intermediria, para ambas as bases de dados. Foi obtido um erro mdio de classicao de 0.50% e 12.17% para as bases de vinhos e gases, respectivamente. importante salientar que os conjuntos de treinamento, validao e teste so formados por diferentes repeties de aquisio de dados, e as caractersticas das respostas dos sensores se modicam de uma repetio para a outra (Santos, 2000). A partir desta armao, pode-se perceber que a rede conseguiu generalizar muito bem o conhecimento adquirido em seu treinamento. Outro fato a ser observado nesta anlise, da mesma forma que o ocorrido com as redes MLP, o acrscimo no nmero de unidades de processamento na camada intermediria no melhora o desempenho da rede. Na tabela 5 so apresentados os resultados mdios do segundo treinamento realizado com as redes TDNN, utilizando o ltro Wavelet. Como ocorreu nos experimentos com a rede MLP, a utilizao do ltro Wavelet melhorou os resultados apresentados pela rede neural articial. No caso das redes TDNN esta melhora foi considervel. NA base de gases o melhor resultado dos experimentos sem o ltro Wavelet foi um erro mdio de classicao de 12.17% (tabela 4). Nos experimentos utilizando este ltro o erro mdio de classicao foi de 0.75%, obtido pela topologia com 8 unidades de processamento na camada intermediria. Na base de vinhos
167

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

o erro de classicao obtido com a utilizao do ltro Wavelet (0.70% de erro - tabela 4) manteve-se estvel em relao aos resultados obtidos sem a utilizao deste ltro (0.70% tabela 5). Tabela 5: TDNN com ltro Wavelet - Experimento 2.
SSE de Base Nodos Treinamento Vinhos Gases 8 8 0,12 1,25 0,34 1,97 SSE de Validao 24,23 26,65 Erro de Classicao

Mdia Desvio Mdia Desvio Mdia Desvio 14,81 0,0070 0,0347 22,01 0,0075 0,0371

um erro mdio de classicao de 5.09% nas trs parties de dados. Porm, esta armao no se verica na classicao dos dados da base de gases, o erro mdio de classicao obtido pela abordagem neuro-difusa foi de 22.18% (tabela 6). Um erro relativamente alto se considerarmos as abordagens previamente apresentadas. Em anlises posteriores vericou-se que a rede apresenta diculdades em separar os gases Etano e Metano, indicados na Anlise de Componentes Principais como classes muito prximas. Isto pode caracterizar uma decincia da rede FWD em tratar dados no-linearmente separveis. 4.3.1 Seleo de Atributos.

Realizamos o teste de hiptese para vericar se esta melhora estatisticamente se conrma. Neste teste vericamos que a performance mdia das redes TDNN fazendo uso da anlise Wavelet melhor que a das mesmas redes no utilizando este tipo de pr-processamento.

No modelo FWD a seleo de atributos realizada a partir dos valores das conexes de pesos obtidas durante a fase de treinamento da rede. Tais valores representam o grau de signicncia dos atributos para cada uma das classes. Para vericar o desempenho do mtodo de seleo de atributos, so realizados dois experimentos. No primeiro experimento, apresentado na tabela 6, a rede foi treinada com os todos os atributos (representando os sensores) da base de dados de odores. Considerando estes resultados, pode-se observar para a base de vinhos: (1) os atributos x3 , x4 , e x6 possuem pequena contribuio na formao dos agrupamentos das classes 1 e 3; e (2) a contribuio destes atributos para a classe 2 pode ser desempenhada pelos atributos x1 , e x2 . Na anlise dos vetores de pesos da base de gases: (1) os atributos x2 , x3 e x5 possuem pequena contribuio na formao dos agrupamentos das classes 3 e 5, e o atributo x4 possui pequena participao nos agrupamentos das classes 1 e 4; (2) a contribuio dos atributos x2 , x3 , x4 e x5 para as classe 1, 3 e 4 pode ser desempenhada pelos demais atributos, que apresentaram grande contribuio na formao dos agrupamentos destas classes. No segundo experimento, os atributos da base de vinhos x2 , x3 e x6 e da base de gases x2 , x3 , x4 e x5 foram excludos e a rede foi novamente treinada somente com os atributos restantes (x1 , x2 e x5 vinhos e x1 , x6 , x7 e x8 gases). No treinamento, foi utilizada a mesma congurao de parmetros do primeiro experimento. Na base de vinhos a mdia do erro de classicao foi de 2.26%, um erro menor que o obtido nos experimentos com 6 atributos. Na base de gases o erro se manteve, um erro mdio de classicao de 20.16%. Este resultado comprova a pequena relevncia dos atributos removidos na formao dos agrupamentos. Os sensores indicados como de menor relevncia foram: base de vinhos - cido Nitrobenzeno Sulfnico - NBS, cido P-toluenosulfnico - PTSA e cido Canforsulfnico - CAS; base de gases - Octil-sulfonato de Sdio - OSA, cido Nitrobenzeno Sulfnico - NBS, Antraquinona Sulfato de Sdio ASA e cido P-toluenosulfnico - PTSA.

4.3 Rede Feature-weighted Detector


Nos experimentos realizados, para cada uma das parties, os aspectos observados nas 30 execues, bem como os valores de mdia e desvio-padro so apresentados na tabela 6. Nesta tabela, representa a nebulosidade no agrupamento, representa a taxa de aprendizado temporal e a taxa de aprendizado. A letra x representa os atributos dos padres de odores (sensores) e w a mdia das conexes de pesos. Tabela 6: Resultados da rede FWD - Experimento 1.
Base Parm. Mdia Desvio w1 Vinhos w2 w3 Mdia Desvio w1 w2 Gases w3 w4 w5 Experimento 1 (x1 , x2 , x3 , x4 , 0.225 0.004 0.300 0.0509 0.1256 0.802 0.644 0.416 0.875 1.000 0.640 0.999 0.948 1.000 0.992 0.586 0.999 0.999 0.999 0.237 0.138 0.999 0.574 0.2218 0.0600 0.913 0.837 0.805 0.418 0.835 0.876 0.702 0.911 0.994 0.900 0.998 0.999 0.998 0.900 0.099 0.998 0.000 0.000 0.001 0.999 0.000 0.000 0.999 0.999 0.935 0.977 0.765 0.000 0.730 0.992 0.089 0.076 0.000 0.001 0.000 0.998 0.000 0.000 0.924 0.949 x5 , x6 , x7 , x8 )

A rede FWD obteve dois resultados bem distintos na classicao dos dois tipos de odores. Na classicao da base de vinhos obteve uma boa generalizao para o problema,
168

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

4.3.2

Consideraes.

zar poda ou agregao sobre os nodos de regras criados na camada de regras durante o treinamento. Como pode ser visto, a rede EFuNN conseguiu uma boa generalizao para o problema de classicao de odores. O erro de mdio de classicao obtido pelas 30 parties foi de 0.15% e 0.88% para as bases de vinhos e gases, respectivamente. Uma taxa de erro extremamente baixa, considerando os resultados obtidos pelos demais classicadores. No segundo experimento, apresentado na tabela 8 - simulao 2, a arquitetura EFuNN tambm foi inicializada sem nenhuma regra. Todos os nodos de regras foram criados dinamicamente durante o treinamento da rede. Porm, durante este treinamento realizada a poda dos nodos de regras que estiverem fora do limiar de ativao estabelecido. Com a aplicao da tcnica de poda, a quantidade de nodos de regras na rede diminuiu e por conseqncia a quantidade de regras extradas da rede neuro-difusa tambm decresceu. No experimento anterior a quantidade mdia de regras foi de 345 e 134 regras, est mdia caiu para 17 e 79 regras, respectivamente para as bases de vinhos e gases. A m de vericar se o mecanismo de agregao poderia melhorar estes resultados (diminuir o erro de classicao em relao segunda simulao e diminuir a quantidade de regras extradas em relao primeira simulao) e comprovar a capacidade da rede em aprender incrementalmente de maneira on-line. Neste experimento (tabela 8 - simulao 3) uma nova arquitetura EFuNN foi criada. Nesta arquitetura foram inseridas 10 regras, remanescentes de treinamentos prvios e novos padres de odores foram apresentados a esta rede. Este experimento nos permite vericar se o modelo realmente pode aprender ou se adaptar a novos padres, sem perder ou "esquecer"o conhecimento previamente adquirido. Para isso, durante o treinamento da rede, foram utilizados os procedimentos de poda e agregao. Nesta simulao, na base de gases, houve uma melhora em relao aos resultados apresentados nos experimentos anteriores. O erro mdio de classicao das 30 parties testadas foi de 2.82% e a quantidade mdia de regras extradas foi de 102 regras. Para a base de vinhos os resultados se mantiveram, pois o nmero de regras na simulao 2 j era baixo (17 regras - tabela 8). Vale ressaltar que este experimento possibilitou vericar alm do treinamento on-line, a insero de regras na topologia da rede. Pois, as regras utilizadas como conhecimento inicial na simulao, eram provenientes de um treinamento prvio e foram inseridas em uma arquitetura vazia de modo automtico. Assim, o conhecimento pode ser inserido na rede EFuNN de duas formas distintas: a partir do treinamento da rede com novos exemplos ou com a insero de regras previamente adquiridas.
169

A m de vericar a ecincia da seleo de atributos da rede FWD, foram novamente realizados dois experimentos com os demais modelos apresentados neste trabalho. Em um dos experimentos os classicadores foram treinados com todos os atributos da base de dados e no outro foram excludos os atributos indicados pela rede FWD como de menor relevncia para a formao dos agrupamentos de dados. A tabela 7 apresenta o teste estatstico realizado com os resultados mdios destes experimentos. A hiptese nula (H0 ) a de que os classicadores possuem o mesmo desempenho com e sem os atributos selecionados. A hiptese alternativa (H1 ) a de que os classicadores possuem desempenhos diferentes. Tabela 7: Anlise dos dados.
Base MLP Vinhos TDNN FWD EFuNN MLP Gases TDNN FWD EFuNN Experimento 1 0,1096 0,0050 0,0509 0,0001 0,1461 0,1217 0,2218 0,0088 0,1096 0,0227 0,1256 0,0003 0,1913 0,0869 0,0600 0,0028 Experimento 2 Desvio 0,1820 0,0127 0,1240 0,0000 0,1952 0,0754 0,0000 0,0035 Deciso Obs. 30 30 30 30 30 30 30 30 0,0735 0,0039 0,0226 0,0000 0,1402 0,0982 0,2016 0,0333 Class. Mdia Desvio Mdia

Estatstica do teste de Wilcoxon Valor Z Valor P MLP Vinhos TDNN FWD EFuNN MLP Gases TDNN FWD EFuNN -0,722 -0,405 -1,000 -2,449 -1,090 -0,905 3,992 4,790 0,470 No rejeitada 0,686 No rejeitada 0,317 No rejeitada 0,014 Rejeitada 0,276 No rejeitada 0,365 No rejeitada 0,001 Rejeitada 0,000 Rejeitada

A tabela 7 apresenta os resultados do teste de Wilcoxon para amostras emparelhadas, com nvel de signicncia de 5%. Os resultados comprovam a hiptese de que a performance dos modelos sem os referidos atributos to boa quanto o das redes treinadas com todos os atributos das bases de dados.

4.4 Rede Evolving Fuzzy Neural Network


Nesta seo sero apresentados os resultados obtidos nos 4 experimentos realizados com a rede EFuNN para cada uma das bases de dados. Na tabela 8 - simulao 1, so apresentados os resultados da primeira simulao, onde uma arquitetura EFuNN inicializada sem nenhuma regra treinada com os padres de odores das 30 parties formadas com cada uma das bases. Neste experimento, optou-se por no reali-

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

O quarto experimento da srie de simulaes realizadas com a rede EFuNN visa vericar as mais interessantes de suas funcionalidades para o reconhecimento de odores: o treinamento on-line e a insero dinmica de classes na arquitetura da rede. A simulao foi realizada da seguinte forma: a partir de uma arquitetura previamente treinada com quatro gases e dois vinhos, escolhidos de forma aleatria, foram apresentados rede exemplos de um quinto gs e uma terceira amostra de vinho. Nenhum dos exemplos do quinto gs ou da terceira safra de vinho foi apresentado rede na fase anterior de treinamento. A incluso desta nova classe de exemplos no treinamento da rede fora o modelo a se adaptar a estes novos padres e englobar o novo odor automaticamente em sua topologia. Desta forma, a rede foi primeiramente treinada com os gases: Butano, Etano, Monxido de Carbono e Metano. Na segunda etapa do treinamento (insero do quinto gs) o gs Propano foi apresentado rede. Na base de vinhos primeiramente foram apresentadas amostras das Safras de 95 e 96 e posteriormente da Safra de 97. Como pode ser vericado na tabela 8 - simulao 4, o fato da terceira amostra de vinho e do quinto gs ter sido apresentado rede posteriormente ao treinamento dos demais odores, no prejudicou em nada a generalizao do modelo. Os testes na rede foram realizados com as trs safras de vinho e os cinco gases, simultaneamente. O erro mdio de classicao desta simulao foi de 0.32% e 0.66%, porm a no utilizao das tcnicas de poda ou agregao pode ser percebida pela grande quantidade de regras extradas da rede.

5 CONSIDERAES FINAIS
A construo de dispositivos que simulem o comportamento do sistema olfativo biolgico uma rea em expanso. Muitas pesquisas esto sendo despendidas com a nalidade de simular a percepo humana. A maioria dos esforos visa reetir nos dispositivos eletrnicos a capacidade humana de perceber o mundo na forma de cinco sentidos ou at mesmo estender nossas potencialidades sensoriais. O presente trabalho est contextualizado na construo de narizes articiais, dispositivos eletrnicos cuja necessidade em diversas aplicaes indiscutvel. O foco principal do artigo foi construo de sistemas de reconhecimento de padres para narizes articiais, buscando tcnicas que apresentem funcionalidades e resultados signicativos na classicao de sinais de odorantes. Foram abordados sistemas de reconhecimento de padres como a rede Multi-Layer Perceptron (Rumelhart et al., 1986), a rede Time Delay Neural Network (Lang e Hilton, 1988) e abordagens hbridas, como as redes Featureweighted Detector (Li et al., 2002) e Evolving Fuzzy Neural Network (Kasabov, 1998). Alm dos classicadores, foi avaliada a utilizao da Transformada Wavelet (Daubechies, 1988) como ltro para reduo do rudo inerente a captao do estmulo odorante e como mtodo de compresso do sinal proveniente do sistema sensor. Nos resultados obtidos com as arquiteturas conexionistas, a rede TDNN conrmou sua superioridade em relao s redes MLP. Quando aliada ao mtodo de pr-processamento com o ltro Wavelet a rede TDNN obteve um erro mdio de classicao de 0.70% e 0.75%, enquanto a rede MLP obteve um erro mdio de 9.47% e 11.5% sobre o conjunto de teste, nas bases de vinhos e gases respectivamente. Dentre as arquiteturas hbridas vericadas, a rede FWD apresentou um desempenho de classicao baixo, em relao s demais abordagens investigadas na classicao da base de gases. A rede FWD apresentou um erro de classicao mdio de 22.18%. Na classicao da base de vinhos ela obteve um bom desempenho, um erro de classicao de 5.09% sobre o conjunto de teste. Apesar do baixo desempenho sobre a base de gases, o mtodo de seleo de atributos demonstrou excelentes resultados em ambas as bases. Estes resultados podem ser comparados aos obtidos com a tcnica de Anlise de Componentes Principais, na indicao dos atributos (ou sensores) mais relevantes na classicao dos odores. Com a utilizao do mtodo de seleo de atributos da rede FWD foi possvel identicar os sensores do nariz articial que apresentam maior relevncia na classicao dos odores investigados. Tambm foi possvel diminuir o tamanho da base de dados e conseqentemente a complexidade da tarefa de classicao dos odores, visto que esta diretamente pro-

Tabela 8: Resultados dos experimentos realizados com a rede Evolving Fuzzy Neural Network
Base 30 Erro Erro Erro Nmero Sim. Parties Treinamento Teste Class. de Regras 1 2 Vinhos 3 4 1 2 Gases 3 4 Mdia Desvio Mdia Desvio Mdia Desvio Mdia Desvio Mdia Desvio Mdia Desvio Mdia Desvio Mdia Desvio 0,0815 0,0060 0,1602 0,0101 0,1614 0,0111 0,1205 0,3651 0,0163 0,5601 0,0064 0,4275 0,0139 0,2469 0,0805 0,0057 0,1224 0,0832 0,1299 0,0922 0,1235 0,2195 0,0462 0,5082 0,0643 0,3717 0,0551 0,1647 0.00015 0,00030 0,01365 0,03251 0,01617 0,03808 0,00324 0,0088 0,0029 0,0467 0,0122 0,0282 0,0081 0,0066 345 12,81 17 2,33 16 2,32 312 134 13,65 79 6,35 102 8,09 228 -

170

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

porcional ao nmero de sensores utilizados na deteco dos odores. Apesar do promisor resultado na indicao dos atributos mais relevantes para classicao dos odores, o mtodo de seleo de atributos da rede FWD apresenta uma decincia, a grande subjetividade para a escolha dos atributos menos relevantes. A rede FWD tambm permite a extrao de regras difusa de sua arquitetura, porm somente pode ser extrada uma regra explicativa difusa por classe, o que prejudica a interpretao das regras em bases de dados com uma grande quantidade de atributos. A rede EFuNN por sua vez, apresentou resultados signicativos na classicao dos padres de odores, obteve um erro mdio de classicao de 0.1% e 0.88% para as bases de vinhos e gases, respectivamente. Alm da boa performance de generalizao, existem outras caractersticas que a tornam mais adequada em relao as demais abordagens apresentadas, podem ser destacadas: a no necessidade de pr-processamento nos dados; seu mtodo de aprendizagem incremental e on-line, que permite a rede aprender novos odores durante a operao do nariz articial; a possibilidade de insero, extrao e agregao de conhecimento, os quais possibilitam que o conhecimento adquirido por um nariz articial possa ser repassado a outros dispositivos de forma extremamente simples; e a extrao de regras de classicao difusas, explicando o conhecimento adquirido pela rede durante o aprendizado. Considerando mtodos estatsticos no-paramtricos de comparao, com nvel de signicncia de 5%, as melhores abordagens para a classicao de odores avaliadas neste trabalho foram as redes TDNN utilizando o ltro Wavelet e as redes EFuNN. Futuras pesquisas poderiam considerar outras funcionalidades na construo dos narizes articiais, como a aquisio automtica de conhecimento, congurao automtica dos dispositivos, praticidade e a versatilidade dos narizes articiais.

ceedings do VII Simpsio Brasileiro de Redes Neurais, pp. 130135. Brigham, E. (1988). The Fast Fourier Transform and its Applications, Prentice Hall, Englewood Cliffs. Daubechies, I. (1988). Orthonormal bases of compactly supported wavelets, Communications of Pure and Applied Mathematics 41: 909996. Daubechies, I. (1990). The wavelet transform, timefrequency localization and signal analysis, IEEE Transactions on Information Theory 36(5): 9611005. Duda, R. O., Hart, P. E. e Stork, D. G. (2001). Pattern Classication, 2 edn, Stork-John Wiley and Sons. Gardner, J. W., Hines, E. L. e Wilkinson, M. (1990). Application of articial neural networks to an electronic olfactory system, Meas. Science Technology 1: 446451. Gardner, J. W., Pearce, T. C., Friel, S., Bartlett, P. N. e Blair, N. (1994). A multisensor system for beer avour monitoring using an array of conducting polymers and predictive classiers, Sensors and Actuators B 18-19: 240 243. Jackson, J. E. (1991). A Users Guide to Principal Components, John Wiley and Sons, Inc., pp. 125. Johson, R. A. e Wichern, D. W. (1999). Applied Multivariate Statistical Analysis, 1 edn, Prentice Hall. Kasabov, N. (1998). Evolving fuzzy neural networks - algorithms, applications and biological motivation, in Y. T e M. G (eds), Methodologies for the Conception, Design and Application of Soft Computing, World Scientic, pp. 271274. Keller, P. E., Kangas, L. J., Liden, L. H., Hashem, S. e Kouzes, R. T. (1995). Electronic noses and their applications, Proceedings of IEEE Technical Applications Conference and Workshop, pp. 116119. Keller, P. E., Kouzes, R. T. e Kangas, L. J. (1994). Three neural network based sensor systems for environmental monitoring, Proceedings of IEEE Electro 94 International Conference, pp. 378382. Lang, K. J. e Hilton, G. E. (1988). The development of the time-delay neural network architeture for speech recognition, Technical Report CMU-CS-88-152, CarnegieMellon University. Li, R. P., Mukaidono, M. e Turksen, I. B. (2002). A fuzzy neural network for pattern classication and feature selection, Fuzzy Sets and Systems 130: 101108.
171

AGRADECIMENTOS
Os autores agradecem ao CNPq, CAPES e FINEP (agncias brasileiras de fomento pesquisa) pela ajuda nanceira.

REFERNCIAS
Abraham, A. e Nath, B. (2002). Hybrid intelligent systems design: A review of a decade of research, Technical report, Monash University. Barbosa, M. S. S., Ludermir, T. B., Santos, F. L., Souza, J. E. G., Santos, M. S. e Melo, C. P. (2002). Uma rbf para a classicao de gases da indstria petrolfera, Pro-

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

Mcgarry, K., Wermter, S. e Maclntyre, J. (2002). Hybrid neural systems: From simple coupling to fully integrated neural networks, Neural Computing Surveys p. 654p. Medsker, L. R. (1995). Hybrid Intelligent Systems, Kluwer Academic Publishers. Misiti, M., Misiti, Y., Oppenheim, G. e Poggi, J. M. (1996). Wavelet Toolbox Users Guide for use with Matlab, The MathwWorks Inc., p. 626. Natale, C. D., Davide, F. A. M., Damico, A., Sberveglieri, G., Nelli, P., Faglia, G. e Perego, C. (1995). Complex chemical pattern recognition with sensor array: the discrimination of vintage years of wine, Sensors and Actuators B 24-25: 801804. Persaud, K. C. e Travers, P. J. (1997). Arrays of broad specicity lms for sensing volatile chemicals, in E. KressRogers (ed.), Handbook of Biosensors and Electronic Noses: Medicine. Food and the Environment, CRC Press, pp. 563592. Prechelt, L. (1994). Proben1 a set of neural network benchmark problems and benchmarking rules, Technical Report 21, Universitt Karlsruhe. Rumelhart, D. E., Hilton, G. E. e Williams, R. J. (1986). Learning representations by backpropagation errors, Nature 323: 533536. Santos, M. S. (2000). Construo de um Nariz Articial usando Redes Neurais, Tese (doutorado em cincia da computao), Universidade Federal de Pernambuco, Recife-PE. Sundgren, H., Winquist, F., Lukkari, I. e Lundstrm, I. (1991). Articial neural networks and gas sensor arrays: Quantication of individual components in a gas mixture, Meas. Science Technology 2: 464469. Waibel, A., Hanazawa, T., Hinton, G., Shikano, K. e Lang, K. (1989). Phonemic recognition using time delay neural networks, IEEE Trans. Acoust. Speech, Signal Processing 37(3): 328339. Yamazaki, A. e Ludermir, T. B. (2001). Classication of vintages of wine by an articial nose with neural networks, Proceedings of 8th International Conference on Neural Information Processing (ICONIP2001), Vol. 1, pp. 184187. Yamazaki, A., Ludermir, T. B. e Souto, M. C. P. D. (2001). Classication of vintages of wine by an articial nose using time delay neural networks, IEE Electronics Letters 37(24): 14661467.
172

Zanchettin, C. e Ludermir, T. B. (2003a). Classication of gases from the petroliferous industry by an articial nose with neural network, Proceedings of Joint 13th International Conference on Articial Neural Networks and 10th International Conference on Neural Information Processing (ICANN/ICONIP 2003), pp. 208211. Zanchettin, C. e Ludermir, T. B. (2003b). A neuro-fuzzy model applied to odor recognition in an articial nose, Proceedings of Hybrid intelligent System, pp. 917926. Zanchettin, C. e Ludermir, T. B. (2003c). Wavelet lter for noise reduction and signal compression in an articial nose, Proceedings of Hybrid intelligent System, Vol. 88, pp. 907916.

Revista Controle & Automao/Vol.16 no.2/Abril, Maio e Junho 2005

Você também pode gostar