Você está na página 1de 30

Sba: Controle & Automao Sociedade Brasileira de Automatica Retirado em 19/03: http://www.scielo.br/scielo.php?

script=sci_arttext&pid=S0103-17592009000400013&lng=pt&nrm=iso Caracterizao de leite bovino utilizando ultra-som e redes neurais artificiais Sergio Luiz Sousa NazrioI; Jacira dos Santos IseponII; Flvio BuiochiIII; Julio Cezar AdamowskiIII; Cludio KitanoI; Ricardo Tokio HigutiI
IDepartamento

de Engenharia Eltrica -Unesp Avenida Brasil, 56, CEP sergionazario@yahoo.com.br, kitano@dee.feis.unesp.br, tokio@dee.feis.unesp.br
IIDepartamento

15385-000,

Ilha

Solteira,

SP,

de Fitotecnia, Tecnologia de Alimentos e Scio-Economia -Unesp Avenida Brasil, 56, CEP 15385-000, Ilha Solteira, SP, jacira@agr.feis.unesp.br
IIIDepartamento

de Mecatrnica e de Sistemas Mecnicos -EPUSP Avenida Prof. Mello Moraes, 2231, CEP 05508-900, So Paulo, SP, fbuiochi@usp.br, jcadamow@usp.br RESUMO O controle da qualidade de alimentos muito importante para determinar as suas composies e teor nutritivo, bem como para detectar eventuais fraudes e adulteraes, sejam elas em matrias-primas ou produtos industrializados. Por exemplo, o leite bovino pode sofrer adulterao por adio de outros produtos, com o objetivo de aumentar o volume ou prolongar o prazo de validade, causando prejuzos econmicos e sanitrios. Este trabalho apresenta um estudo sobre a caracterizao de leite fluido utilizando tcnicas de ultra-som e redes neurais artificiais. Utilizou-se uma clula de medio de propriedades de lquidos por ultra-som para obter dados de densidade, velocidade de propagao e coeficiente de atenuao, que foram relacionados com as concentraes de gordura e gua adicionada em amostras de leite bovino, obtidas com mtodos convencionais utilizados em laticnios, para efeito de calibrao das amostras. Esses dados foram utilizados para projetar redes neurais artificiais, que fornecem na sada o teor de gordura e a quantidade de gua adicionada ao leite, a partir dos parmetros medidos pela clula de medio. As redes neurais desenvolvidas resultaram em mais de 95% de amostras classificadas corretamente, com uma resoluo de 0,1% na determinao da quantidade de gordura. Para quantidade de gua adicionada, a resoluo foi de 1% para 1 a 10% de gua adicionada, e resoluo de 5% para quantidade de gua adicionada de 10 a 60%. Palavras-chave: Ultra-som, Redes Neurais Artificiais, Leite. 1 INTRODUO O controle da qualidade dos alimentos consumidos pela populao muito importante, para averiguar seus teores nutritivos e composio, por exemplo. Uma outra implicao importante na deteco da deteriorao ou adulterao dos alimentos, sejam eles a matria-prima ou o produto industrializado ou processado. Em particular, tem-se noticiado na mdia com certa frequncia a adulterao de leite bovino, na forma de adio de substncias para aumentar o volume ou para prolongar o prazo de validade. A deteco desse tipo de ao muito importante, pois os produtos adulterados trazem riscos sade da populao, alm das consequncias econmicas. O leite pode ser descrito, sob o ponto de vista biolgico e fsico-qumico, como um lquido constitudo por gua, gordura, protena, lactose e minerais. Na adulterao do leite, pode-se acrescentar, por exemplo, gua ou soro de leite, modificando-se a densidade e o teor de gordura. Outros produtos qumicos podem ser adicionados para mascarar a variao dos parmetros do leite, dificultando a deteco da adulterao. Normalmente, as caracterizaes de leite lquido so feitas em laboratrios existentes nos prprios laticnios, em que se medem propriedades como o teor de gordura, protena, slidos totais e gua adicionada, entre outros. Em geral, utilizado um equipamento para cada propriedade de interesse, e as tcnicas podem envolver a manipulao de produtos qumicos, ser demoradas e destrutivas. Por outro lado, apresentam resoluo e acurcias que so padronizadas e aceitas na indstria. Uma alternativa a ser considerada o uso de ultra-som para caracterizar lquidos, que uma tcnica relativamente simples, no-destrutiva e pode ser usada on-line. Aplicaes de ultra-som na rea de alimentos podem ser distinguidas a partir de tcnicas de alta e baixa potncia (Povey, 1997). As tcnicas de alta potncia so em geral de baixa freqncia (20 a 100 kHz), podendo implicar em modificaes fsicoqumicas do material. As tcnicas de alta freqncia (acima de 500 kHz) e baixa potncia so utilizadas para caracterizao de alimentos atravs da determinao de concentrao, densidade, tamanho de partcula, fluxo e dimenses, entre outras aplicaes (McClements, 1995; Mason et al., 1996; Javanaud, 1988). Algumas aplicaes especficas do ultra-som no setor de laticnios so encontradas na literatura para determinar o teor de gordura (Bacaneli, 1998; Dorabiato et al., 2006) e existem estudos de mtodos para determinar a coagulao de leite para fabricao de queijo (Gunasekaran and Ay, 1994; Benedito et al., 2002). Elvira et al. (2005) usaram o ultra-som para detectar micrbios em leite tipo UHT (Ultra High Temperature) embalado, atravs do monitoramento da velocidade de propagao.

Miles et al. (1990) investigaram o fenmeno da atenuao acstica no leite proveniente de dois efeitos: perdas intrnsecas e perdas ligadas s partculas de gordura presentes no meio. Concluram que as perdas causadas por essas partculas so proporcionais concentrao de gordura presente na amostra. Bacaneli (1998) verificou a relao entre parmetros acsticos como velocidade de propagao da onda, atenuao e densidade, em funo do teor de gordura presente no leite. Foram obtidas curvas de calibrao, que foram utilizadas para relacionar esses parmetros acsticos com as caractersticas do leite em funo da temperatura. Dukhin et al. (2005) utilizam um espectrmetro acstico que trabalha entre 3 e 100 MHz, e medem a atenuao do som em amostras de produtos lcteos (leite, manteiga) com diferentes concentraes de gordura e em funo da temperatura. Segundo os autores, devido s propriedades das amostras, para frequncias acima de 50 MHz as perdas intrnsecas so predominantes em relao s perdas trmicas (sendo as perdas viscosas desprezveis), e portanto essa faixa de frequncia seria mais adequada para medir a atenuao sem os efeitos de variao do tamanho de partculas. No entanto, no se faz uma classificao das amostras, apenas se levantam cur-vas que mostram a dependncia da atenuao com o teor de gordura, temperatura e frequncia de operao. Uma limitao em se trabalhar somente com curvas de calibrao pode surgir devido possibilidade de uma amostra de leite adulterado e uma amostra de leite sem adulterao possurem um mesmo valor de velocidade de propagao devido a diferentes teores de gordura, por exemplo, o que pode provocar interpretaes erradas. Portanto, o uso de tcnicas mais elaboradas para a anlise dos resultados necessria. Entre elas, redes neurais artificiais tm sido aplicadas em di-versos problemas de classificao. Redes Neurais Artificiais (RNAs) so sistemas paralelos e distribudos, compostos por unidades de processamento simples, chamados neurnios, que calculam determinadas funes matemticas. Na maioria dos modelos estas conexes esto associadas a pesos, os quais armazenam o conhecimento representado no modelo e servem para ponderar a entrada recebida por cada neurnio da rede (Braga et al., 2000). Redes neurais artificiais so uma excelente alternativa para resoluo de problemas de classificao, uma vez que o processamento estruturalmente paralelo e apresenta diversas funcionalidades, como adaptabilidade, tolerncia falha e abstrao, aliando-as velocidade de resposta, entre outros. Alm disso, o que torna as redes neurais uma tcnica interessante para o problema a capacidade de ser projetada para generalizar e produzir um mapeamento de entradasada correto, mesmo quando a entrada for um pouco diferente dos exemplos usados para treinar a rede (Braga et al., 2000). Existem diversos exemplos de aplicao de redes neurais, juntamente com sinais provenientes de sensores, para classificar produtos na rea alimentcia. Chandraratne et al. (2008) fazem a classificao de cortes de carne de cordeiro, utilizando imagens obtidas por meio de cmeras e RNAs, em funo de teor de gordura, quantidade de osso, textura, etc. A classificao de amostras de ch verde lquido utilizando sensores do tipo nariz ou lngua eletrnica tambm foi realizada utilizando RNAs (Chen et al., 2008; Yua et al., 2008). Lewis et al. (2007) utilizam um sensor a fibra ptica e tcnicas de RNAs para avaliar a colorao de alimentos durante o cozimento e para o monitoramento de gua. Para o caso de caracterizao e classificao de amostras de leite, no se encontraram na literatura mtodos que empregam ultra-som e redes neurais. Alguns trabalhos envolvem a utilizao de outros tipos de sensores, com classificao dos resultados por meio de redes neurais. Por exemplo, Winquist et al. (1998) utilizam uma lngua eletrnica, cujos sensores so baseados em eletrodos que medem a condutividade do meio. O sensor utilizado para detectar crescimento microbiano no leite, e os dados so posteriormente processados por uma rede neural artificial. Brudzewski et al. (2004) utilizam um sensor de gs como nariz eletrnico para classificar amostras de leite submetidos a diferentes tipos de tratamentos trmicos e pasteurizao. Os elementos volteis presentes no leite dependem do tipo de tratamento realizado, que so detectados pelos sensores e classificados pelas redes neurais. No caso, foram utilizadas amostras com teores de gordura iguais a 0, 0,5, 2 e 3,5%. Pertencentes ao mesmo grupo de trabalho, Ciosek et al. (2006) utilizam o mesmo tipo de rede neural, mas com uma lngua eletrnica, baseada em eletrodos, para classificar amostras de leite de diferentes marcas e teores de gordura. So avaliadas amostras com dois teores de gordura: 2 e 3,2%. Na reviso da literatura no se encontraram problemas de caracterizao e classificao de amostras de leite com o intuito de detectar adulteraes, como a adio de gua. Alm disso, os estudos realizados por outros autores no contemplam uma variao mais detalhada nas propriedades das amostras (teor de gordura e gua adicionada), com o objetivo de determinar a acurcia e resoluo do mtodo. Esses pontos so analisados neste trabalho, no qual se mostra a aplicao de tcnicas de ultra-som e de redes neurais para classificar amostras de leite lquido em funo do teor de gordura e de gua adicionada, com o objetivo de detectar adulteraes. So apresentados a seguir a clula de medio de propriedades de lquidos, a preparao e calibrao de amostras, os resultados com ultra-som, o projeto e testes com as redes neurais artificiais. 2 CLULA DE MEDIO POR ULTRASOM A clula de medio por ultra-som utilizada neste trabalho foi originalmente concebida para a medio de densidade de lquidos (Adamowski et al., 1995). Depois foi aperfeioada para caracterizao de lquidos (Higuti and Adamowski, 2002; Higuti et al., 2007), apresentando maior acurcia na medio das propriedades como a densidade, velocidade de propagao e atenuao do som na amostra. Nesta seo se faz uma descrio resumida do funcionamento da clula, e maiores detalhes so encontrados nas referncias citadas anteriormente. A figura 1 mostra um esquema da clula de medio por ultra-som, apresentando trs

partes: transdutor duplo-elemento (TDE), cmara de amostra e refletor. O TDE , por sua vez, composto por um transdutor emissor piezeltrico compsito, uma linha de retardo de acrlico, um receptor de grande abertura de P(VDFTrFE) (Polivinilideno de Flor Tri-Flor Etileno) e uma linha de retardo de vidro. O emissor excitado com um pulso eltrico estreito, e o pulso acstico resultante propaga-se pelas linhas de retardo e amostra, atingindo o receptor como os sinais de eco aT (t), a1 (t), a2 (t) e a3 (t). Zi e Li so a impedncia acstica e o comprimento da linha de retardo de acrlico (i =1) eda amostra (i =2), respectivamente.

Por meio dos sinais de eco (vide figura 2) e do conhecimento de algumas caractersticas da clula, podem ser medidas a densidade, a velocidade de propagao e o coeficiente de atenuao da onda acstica que se propaga pela amostra. A velocidade de propagao pela amostra medida por meio da diferena de tempo (t 12 ) entre os sinais de eco a1 (t) e a2 (t) e do conhecimento prvio do comprimento da cmara de amostra, L 2 :

A densidade da amostra obtida a partir da medio do coeficiente de reflexo na interface linha de retardo de vidro/amostra: R12 =(Z2 - Z1 )/(Z2 + Z1 ), que por sua vez mensurado a partir dos sinais de eco, utilizando o chamado mtodo da energia (Higuti and Adamowski, 2002). A densidade da amostra ento calculada por:

na qual a densidade da linha de retardo de vidro p 1 conhecida e a velocidade de propagao c 1 pode ser medida por meio do conhecimento do comprimento L1 e da medio do intervalo de tempo entre aT (t) e a1 (t). O coeficiente de atenuao medido por:

na qual Ai (f ) so os espectros dos sinais de eco a i(t),e R23 o coeficiente de reflexo na interface entre a amostra e o refletor. A temperatura exerce uma influncia importante sobre o funcionamento da clula e os parmetros medidos, por isso os experimentos descritos a seguir foram conduzidos com temperatura controlada. Como a velocidade de propagao tem uma dependncia desprezvel da freqncia, o intervalo de tempo medido pelo mtodo da correlao cruzada representa uma mdia da velocidade em torno da frequncia de operao do transdutor emissor, que no caso situa-se entre 4 e 6 MHz. Por outro lado, o coeficiente de atenuao tem uma variao significativa com a frequncia, motivo pelo qual foi explicitada sua dependncia com f em (3). 2.1 Procedimento experimental 2.1.1 Preparao das Amostras Foram preparadas amostras calibradas utilizando leite tipo UHT (Ultra High Temperature), que homogeneizado e apresenta distribuio e formato de partculas de gordura regulares. Para obter amostras com diferentes teores de gordura, foram feitas diluies de leite integral (que possui teor de gordura aproximadamente igual a 3,0%) utilizando leite desnatado (teor de gordura de cerca de 0,5%). As amostras assim obtidas foram aferidas utilizando uma tcnica convencionalmente utilizada em laboratrios de tecnologia de alimentos, chamado mtodo cido-butirmetro de Gerber (Behmer, 1984). Com o intuito de verificar eventuais adulteraes, foram preparadas amostras com diferentes teores de gua adicionada, atravs da diluio de leite integral com gua destilada. As amostras foram aferidas com o mtodo de crioscopia, em que se mede o ponto de congelamento da amostra. Quanto maior o teor de gua adicionada, mais alta a temperatura de congelamento do leite. Foram medidas tambm as densidades das amostras com mtodos diferentes do ultra-snico, utilizando um termolactodensmetro, especfico para medies de amostras de leite, e o mtodo do picnmetro, em que se mede a massa de amostra em um volume conhecido. Para isso, e tambm para as diluies de amostras, foi utilizada uma balana de preciso, com resoluo de 0,01 g. 2.1.2 Montagem experimental O sistema de excitao, recepo, aquisio e processamento dos dados est representado na figura 3. A clula de medio colocada em um banho termosttico (Marconi, modelo MA-184) para controle da temperatura. Sensores de temperatura resistivos de platina (Pt-100, marca Minco) so colocados em diversos pontos da clula, como nas linhas de retardo e cmara de amostra. Os sinais dos sensores so digitalizados por uma placa de aquisio com elevada resoluo (National Instruments NI-4351, 24 bits) e um programa escrito em MATLAB faz o controle da placa e a leitura dos dados. A clula de medio conectada a um pulsador/receptor de ultrasom (Panametrics 5077PR), que excita o transdutor emissor com um pulso estreito e amplifica o sinal captado pelo receptor. O sinal amplificado digitalizado por um osciloscpio (Tektronix TDS2022, 8 bits) e enviado ao computador via interface GPIB. No computador, programas escritos em MATLAB fazem o controle dos instrumentos e o processamento dos dados.

Numa aplicao prtica, a parte eletrnica (pulsador/receptor, aquisio e processamento de dados) poderia ser substituda por sistemas dedicados, reduzindo assim o custo e o volume do equipamento, que um fator importante para aplicao em pequenos laticnios. A questo do controle da temperatura pode ser includa no projeto da clula de medio, e uma alternativa seria trabalhar numa temperatura superior ambiente e utilizar uma resistncia eltrica para manter a temperatura no ponto desejado. Cada dado de velocidade, atenuao e densidade foi obtido a partir de cinco aquisies de formas de onda, obtendo-se as mdias e desvios-padro. No osciloscpio digital tambm foi utilizado o recurso de mdias nas formas de onda, para reduzir o rudo aleatrio. 2.2 Resultados A seguir se apresentam os resultados das medies da velocidade de propagao (c), coeficiente de atenuao ()e

densidade (p) para amostras com diferentes concentraes de gordura ( g ) e gua adicionada (a ). Esses resultados so utilizados posteriormente para alimentar as redes neurais, nas fases de treinamento e testes. Os resultados, mostrados na forma grfica, servem para explicitar a dependncia dos parmetros medidos (c, e p) em funo de g e a . Uma observao em relao medio da atenuao que os valores apresentados so normalizados em relao a um valor especfico (em geral, com menor atenuao no conjunto de amostras), representando uma diferena de atenuao, ou atenuao em excesso, representada por . 2.2.1 Calibrao da clula Para medies com elevada exatido da velocidade de propagao, o comprimento da cmara de amostra (L 2 ) deve ser conhecido e corrigido em funo da temperatura T , por meio de uma calibrao da clula. Essa variao causada pelas expanses e contraes trmicas dos diferentes materiais que compem a clula. Para isso, se utiliza como amostra gua destilada, que possui a velocidade de propagao e densidade conhecidas em funo da temperatura. De acordo com calibraes mais detalhadas realizadas em outro trabalho (Higuti et al., 2007), verificou-se que a variao em L2 linear com a temperatura, com taxa de variao do comprimento da cmara de amostra com a temperatura ( L), igual a 0,2 m/C. Dessa forma, medindo-se o comprimento da cmara de amostra (L 2cal ) em uma determinada temperatura de calibrao Tcal , o comprimento em uma outra temperatura T dado por:

Nessa calibrao tambm mensurada a densidade da gua destilada, cujo resultado tambm comparado com valores tabelados para verificar o correto funcionamento da clula de medio. 2.2.2 Teor de gordura Utilizando as amostras de leite calibradas, foram realizados diversos experimentos, com o teor de gordura variando entre 0,5 e 3,0%. Na figura 4, mostra-se a velocidade de propagao em funo da temperatura para as diferentes concentraes de gordura. Nota-se que a velocidade depende fortemente da temperatura e diminui para concentraes de gordura maiores. No entanto, a variao entre as velocidades de diferentes amostras permanece aproximadamente constante na faixa de temperatura mostrada no grfico. Portanto, uma maneira de reduzir o efeito da temperatura seria medir a velocidade da amostra em relao velocidade de uma amostra de referncia. Os desvios nas medidas de velocidade so da ordem de 1 m/s, ou menores que 0,1%.

No h variao considervel no coeficiente de atenuao em funo da temperatura, mas h uma maior dependncia com a frequncia do ultra-som. Na figura 5, apresenta-se o coeficiente de atenuao para diferentes teores de gordura, em funo da frequncia e para a temperatura de 27C. As linhas pontilhadas so aproximaes lineares em funo da frequncia. Para frequncias mais altas, os valores diferem mais entre si, e tem-se um maior poder de discriminao pelo uso da atenuao nessas condies. No caso do transdutor utilizado, a faixa de operao (-3 dB) fica limitada entre 4 e 6 MHz, aproximadamente. O uso de transdutores com banda mais larga pode introduzir mais informao em outras frequncias, sobretudo as maiores. Os desvios das medidas so de cerca de 1 Np/m.

A densidade em funo do teor de gordura apresentada na figura 6. Nota-se uma pequena diminuio da densidade com o aumento do teor de gordura. Como as variaes so tambm pequenas em comparao com os desvios nas medidas, encontra-se uma dificuldade no uso da densidade nesse tipo de caracterizao.

2.2.3 Teor de gua adicionada Na figura 7, mostra-se a velocidade de propagao em funo da temperatura para diferentes teores de gua adicionada. As velocidades aumentam com a temperatura, mas diminuem com o aumento do teor de gua. interessante notar que o aumento do teor de gua adicionada diminui o teor de gordura do leite, devido maior diluio deste. Por outro lado, observando a curva da velocidade em funo da temperatura para diferentes teores de gordura (figura 4), nota-se que, ao diminuir o teor de gordura, a velocidade aumenta. Essa dificuldade em relacionar os diversos parmetros acsticos com as propriedades do leite justifica a utilizao das redes neurais para a classificao das amostras.

Com o aumento do teor de gua, o coeficiente de atenuao e a densidade diminuem, como mostrado nas figuras 8 e 9, respectivamente, na temperatura de 24,5C. A discriminao de baixos teores de gua dificultada pelas pequenas variaes nessa regio e aos desvios das medidas, mas se ver mais adiante que o uso combinado de diversos parmetros medidos pela clula, mais a temperatura, levam identificao correta das amostras de leite.

3 REDES NEURAIS O problema aqui abordado enquadra-se na classificao de padres, ou seja, ao se apresentar um determinado conjunto de dados rede neural artificial, deve-se ter como resposta a classe a que ele pertence. Os dados obtidos pela

clula de medio (velocidade e coeficiente de atenuao acstica em funo da temperatura) so utilizados por uma rede neural do tipo MLP (Multi-Layer Perceptron) para classificar os teores de gordura do leite UHT. Na figura 10, apresenta-se a configurao de sada para a rede projetada para deteco da quantidade de gordura no leite, na qual utilizou-se uma configurao com 5 nodos na camada de entrada, representando os dados de temperatura (T ), velocidade de propagao (c) e atenuao da onda nas frequncias de 4 MHz ( 1 ), 5 MHz (3 ) e 6,5 MHz ( 3 ). Em geral, a variao da densidade de um lquido, em funo de um parmetro de interesse, constitui uma importante propriedade utilizada para sua caracterizao (Adamowski et al., 1995). Entretanto, no caso especfico do leite, observou-se que a densidade no apresentou variao significativa para pequenos teores de gordura e de gua adicionada, e ento decidiu-se por no utilizar esse parmetro como entrada das redes neurais. Foram utilizados vinte e seis nodos na camada de sada, representando os teores de gordura presentes no leite, entre 0,5 e 3,0%, com resoluo de 0,1%.

Uma outra rede neural foi projetada para detectar adulterao de amostras de leite por adio de gua na faixa de 1% at 60%, com uma resoluo de 1% entre 1 e 10% de gua adicionada, e resoluo de 5% entre 10 e 60% de gua adicionada. Esses valores foram utilizados inicialmente, considerando a resoluo de alguns equipamentos comerciais. Para esse problema, foram utilizadas arquiteturas com cinco nodos na camada de entrada assim como a configurao utilizada para obteno da quantidade de gordura, 21 nodos na camada de sada e uma camada oculta. Na figura 11, apresenta-se a configurao de sada para a rede projetada para deteco de gua adicionada ao leite.

O dimensionamento das redes foi realizado atravs do mtodo de refinamento manual, estudando os parmetros e escolhendo a melhor combinao testada. Nesta seleo podem existir situaes nas quais podem-se determinar solues diferentes para o mesmo problema, e com uma mesma eficincia, mas com parmetros diferentes. Para a definio dos parmetros da rede, foram variadas grandezas como a quantidade mxima de interaes, o nmero de

neurnios na camada intermediria, a taxa de aprendizado e a constante de momento. Foram testadas redes MLP com 26, 40 e 52 nodos na camada oculta. Redes MLP apresentam um poder computacional muito maior do que aquele apresentado pelas redes sem camadas intermedirias. A preciso obtida e a implementao da funo objetivo dependem do nmero de nodos utilizados nas camadas intermedirias. Contudo, aumentando-se a quantidade de camadas ocultas e o nmero de nodos, pode ocorrer um efeito indesejado, que a memorizao dos padres de treinamento, que prejudica a capacidade de extrair as caractersticas que possibilitaro o reconhecimento de padres no vistos durante o treinamento. Alm de variar a quantidade de nodos na camada oculta, variou-se tambm a taxa de aprendizado das RNAs em 0,01, 0,001 e 0,0001, e a constante de momento em 0,0002, 0,0008 e 0,0001. Para a classificao do teor de gordura, variouse a quantidade mxima de interaes em 50000, 100000, 150000 e 200000, enquanto que para a classificao do teor de gua adicionada, em 20000, 40000, 50000 e 100000. O particionamento do conjunto de dados foi tal que 50% dos padres de cada classe foram escolhidos aleatoriamente para treinamento, 25% para validao e 25% para teste. Isso implicou em que, para o caso da anlise do teor de gordura no leite, foram utilizadas 11700 amostras 1 para treinamento, 5850 para validao e 5859 para teste. Para anlise do teor de gua adicionada, empregaram-se 9450 amostras para treinamento, 4725 para validao e 4725 para teste. Calcularam-se os erros no conjunto de treinamento e no conjunto de validao, para cada combinao de parmetros. Para cada topologia usou-se a mesma inicializao de pesos quando variou-se a taxa de aprendizado e o nmero mximo de iteraes e, ento, o algoritmo projetado determina a melhor rede, ou seja, a que apresenta o menor erro no conjunto de validao e a menor percentagem de erro. Na figura 12 mostram-se os resultados de erros das redes neurais projetadas para determinao do teor de gordura e quantidade de gua adicionada, com variao do nmero de nodos da camada oculta e o nmero mximo de iteraes.

Para a determinao da quantidade de gordura, a melhor configurao treinada conseguiu uma classificao correta de 95,5% e um erro de 4,5% para a rede com 52 nodos na camada oculta e 200000 iteraes. Para deteco de gua adicionada ao leite, tambm foram obtidos resultados com boa capacidade de classificao. As configuraes com 40 e 52 nodos na camada oculta obtiveram o maior potencial de classificao. Para a topologia com 40 nodos obteve-se um erro de 4,3%, sendo assim uma classificao correta de 95,7%. Para a topologia com 52 nodos, obteve-se uma classificao correta de 96,3% e um erro de 3,7% sendo que para essa rede o tempo de treinamento foi maior que para a configurao com 40 nodos ocultos. Tambm foram realizados testes, com novas aquisies de dados que no foram utilizadas para treinamento nem validao das redes neurais. Esses novos dados (temperatura, velocidade, atenuao) foram armazenados e utilizados como entradas da rede neural e assim avaliadas pela mesma. Os resultados comprovaram a eficcia do algoritmo que obteve um potencial de acerto na faixa de 98 a 100% nos testes para determinao do teor de gordura e de gua adicionada, comprovando os resultados da fase de validao.

Como citado anteriormente, em trabalhos de outros autores no foram realizados estudos to detalhados em relao preparao de amostras e determinao da resoluo do mtodo. Os resultados mostram que o mtodo proposto, utilizando ultra-som e redes neurais, pode alcanar resolues to boas quanto ou melhores que de equipamentos comerciais. Como comparao, as resolues de equipamentos comerciais so: 0,1% para medio do teor de gordura pelo mtodo de Gerber, cerca de 2% para medio de teor de gua pelo mtodo de crioscpio. O mtodo proposto tambm poderia reduzir o nmero de equipamentos necessrios para caracterizar ou classificar as amostras, ou ser utilizado como uma primeira avaliao antes de se efetuarem medies de custo mais elevado. Alm disso, o ultra-som uma tcnica relativamente robusta e de baixo custo, com fcil implementao quando comparada com as tcnicas apresentadas em outros trabalhos. 4 CONCLUSES Atualmente, na maioria dos laticnios, as anlises da qualidade de leite fluido so realizadas por processos fsicoqumicos convencionais, que so demorados, destrutivos e caros. O desenvolvimento de novos equipamentos que possam monitorar com maior facilidade, exatido e rapidez a matria-prima vinda do produtor so aspectos importantes que podem contribuir para controlar melhor os padres de qualidade do produto e para inibir adulteraes. Neste trabalho, utilizou-se uma clula de medio por ultra-som para obter dados de densidade, velocidade de propagao e coeficiente de atenuao, que foram relacionados com a concentrao de gordura e gua adicionada em amostras de leite bovino, medidos tambm com mtodos convencionalmente utilizados em laticnios, para efeito de calibrao de amostras e posterior utilizao pelas redes neurais artificiais. A velocidade de propagao bastante sensvel a qualquer um dos parmetros (teor de gordura e gua adicionada), mas que tambm depende fortemente da temperatura. Sendo assim, medies com temperatura controlada so importantes para se obter resultados confiveis. A atenuao foi um parmetro que no sofreu alteraes significativas com a variao de temperatura, o que a torna muito importante para o mtodo, apesar de no apresentar a mesma resoluo que a velocidade. A densidade no apresentou boa sensibilidade para baixos teores de gordura e gua adicionada, e no foi utilizada como entrada das redes neurais. Observou-se que as redes neurais possibilitaram grande poder de classificao e isso foi comprovado nos experimentos de testes com amostras desconhecidas pelas redes projetadas. Para o problema de adio de gua obteve-se um poder de classificao de 96,3%, enquanto que para a obteno do teor de gordura, 95,5% de classificao correta. As tcnicas utilizadas permitiram obter uma resoluo de 0,1% na determinao do teor de gordura. Para a determinao do teor de gua adicionada (a.a), a resoluo foi de 1% para a faixa entre 1% e 10% a.a. e de 5% para amostras entre 10% e 60% a.a. Essas redes foram utilizadas pelo algoritmo, que diagnosticou com sucesso o tipo de leite, pela concentrao de gordura e pela quantidade de gua adicionada, numa faixa de temperatura entre 25 e 35C. Como comparao, as resolues de equipamentos comerciais so: 0,1% para medio do teor de gordura pelo mtodo de Gerber, cerca de 2% para medio de teor de gua pelo mtodo de crioscpio. Portanto, os resultados mostram que os mtodos por ultra-som e redes neurais so equivalentes aos mtodos de Gerber, ponto de congelamento e equipamentos comerciais disponveis no mercado, com as vantagens de ser uma tcnica no destrutiva e que pode substituir diversos equipamentos por apenas um. A parte eletrnica, que nesse caso foi baseada em uma instrumentao de laboratrio, pode ser implementada com sistemas dedicados, utilizando pulsadores/receptores integrados, conversores analgico-digitais e processadores, como DSPs (Digital Signal Processors) ou FPGAs (Field Programmable Gate Arrays), o que resultaria em um instrumento relativamente de baixo custo para uso em laticnios. AGRADECIMENTOS FAPESP pelo financiamento dado ao laboratrio de ultrasom e Capes pelo auxlio ao programa de ps-graduao. REFERNCIAS Adamowski, J. C., Buiochi, F., Simon, C., Silva, E. C. N. and Sigelmann, R. A. (1995). Ultrasonic measurement of density of liquids, J. Acoust. Soc. Am. 97(1): 354-361. [ Links ] Bacaneli, F. (1998). Determinao do teor de gordura no leite atravs de parmetros acsticos., Dissertao (mestrado), Escola Politcnica da Universidade de So Paulo, So Paulo. [ Links ] Behmer, M. L. A. (1984). Tecnologia do Leite, 13 edn, Nobel. [ Links ] Benedito, J., Carcel, J. A., Gonzales, R. and Mullet, A. (2002). Application of low intensity ultrasonics to cheese manufacturing processes, Ultrasonics 40(1-8): 19-23. [ Links ] Braga, A. P., Carvalho, A. C. L. F. and Ludemir, T. B. (2000). Redes neurais artificiais: teoria e aplicaes, inteligncia artificial, 1edn, LTC, Rio de Janeiro. [ Links ] Brudzewski, K., Osowski, S. and Markiewicz, T. (2004). Classification of milk by means of an electronic nose and svm neural network, Sensors and Actuators B 98(2-3): 291-298. [ Links ] Chandraratne, M., Kulasiri, D. and Samarasinghe, S. (2008). Classification of lamb carcass using machine vision: Comparison of statistical and neural network analyses, Journal of Food Engineering 82(1): 26-34. [ Links ]

Sba: Controle & Automao Sociedade Brasileira de Automatica


Retirado em 19/03: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592007000300003&lng=pt&nrm=iso

Usando redes neurais diretas e regras de produo no controle da concentrao de hormnios tireoideanos
L. G. A. MartinsI; L. H. A. MonteiroII
IFaculdade IIEscola

de Computao, Universidade Federal de Uberlndia gustavo@facom.ufu.br de Engenharia, Ps-Graduao em Engenharia Eltrica, Universidade Presbiteriana Mackenzie e Departamento de Telecomunicaes e Controle, Escola Politcnica, Universidade de So Paulo luizm@mackenzie.br e luizm@usp.br RESUMO O hipotireoidismo uma patologia que ocorre no sistema de regulao dos hormnios tireoideanos, decorrente da deficincia na produo ou na ao desses hormnios. A maioria dos pacientes hipotireoideos deve fazer reposio hormonal durante toda a vida. Neste trabalho, desenvolve-se um modelo de controlador para o fornecimento de medicamentos aos pacientes com hipotireoidismo primrio, devido remoo total da glndula tireide. Duas redes neurais diretas com mltiplas camadas predizem as concentraes dos hormnios TSH e T 4 existentes no sangue. Essas previses e as concentraes correntes so utilizadas como entrada para o controlador. Baseando-se em um conjunto de regras de produo, define-se qual a dosagem da droga que necessria ser aplicada, no presente, a fim de manter as concentraes hormonais dentro de faixas de regularidade, no futuro. A atuao do controlador deve ser tal que mudanas bruscas no ocorram na evoluo temporal das concentraes desses hormnios. Palavras-Chave: Hormnios tireoideanos, redes neurais, regras de produo.

1 INTRODUO Um dos grandes desafios da medicina o controle de doenas crnicas sem sintomas imediatos e claros, influenciadas por fatores externos, como dietas inadequadas, e por fatores de origem interna, como falha na produo e na secreo de hormnios. Para o controle dessas doenas, so necessrios o monitoramento regular do quadro do paciente e a prescrio de tratamentos teraputicos. Normalmente, esses tratamentos envolvem a administrao oral ou intravenosa de medicamentos [Hacisalihzade, 1989]. Sob um enfoque de controle, esse tipo de doena resulta da falha de um ou mais elementos do sistema fisiolgico de realimentao, o qual responsvel pela manuteno da homeostase do corpo humano [Carson e Deutsch, 1992]. Uma soluo desse problema pode se dar atravs do desenvolvimento de um dispositivo capaz de avaliar o quadro do paciente, pela comparao entre as variveis medidas e os valores desejados, e desencadear as aes de controle necessrias para a adequao dessas variveis aos nveis considerados normais, restabelecendo o equilbrio dinmico do sistema. Existem diversos estudos focados no desenvolvimento de mecanismos de regulao, que se d pelo fornecimento de drogas para o tratamento das doenas. Nas ltimas dcadas, as abordagens utilizadas extrapolaram o escopo do controle clssico, adotando tcnicas "inteligentes", com o intuito de aprimorar a flexibilidade do mecanismo em relao dinmica apresentada pelo processo. Dentre as vrias abordagens utilizadas, as redes neurais artificiais vm sendo largamente utilizadas nos processos de controle [Trajanoski e Wach, 1998], [Camps-Valls et alli, 2003]. Esse uso se justifica devido sua capacidade de aprendizado e generalizao. Os sistemas endcrinos so fundamentais para o funcionamento do organismo humano. Dentre esses, destaca-se o sistema de regulao dos hormnios tireoideanos, que envolve a interao entre hipotlamo, hipfise e tireide. Essa interao se d atravs do transporte, pelo sangue, dos hormnios produzidos nesses rgos. Entre as patologias que atingem esse sistema de regulao, destacam-se o hipertireoidismo e o hipotireoidismo. O hipotireoidismo resultante da deficincia de hormnios tireoideanos no organismo. Quando o defeito ocorre na prpria tireide, denomina-se hipotireoidismo primrio [Carvalho, 2003], foco deste estudo. O tratamento relativamente simples. A maioria dos pacientes hipotireoideos faz reposio hormonal, normalmente ingerindo T 4 livre na forma de um sdio denominado levotiroxina. Neste estudo, desenvolveu-se um mecanismo de controle para a dosagem de medicamentos em pacientes com hipotireoidismo primrio. Esse controle baseia-se no emprego de duas redes neurais diretas com mltiplas camadas

para a previso das concentraes dos hormnios TSH e T 4. A partir dessa previso e da aferio das concentraes correntes, o dispositivo de controle utiliza-se de regras de produo para definir qual a quantidade da droga que deve ser administrada. Essa dosagem deve manter as concentraes dos hormnios dentro das respectivas faixas de regularidade, sem provocar mudanas bruscas na sua evoluo temporal. No se encontrou, na literatura, outro trabalho referente ao controle automtico da concentrao de hormnios tireoideanos. Para efeito de avaliao do mecanismo de controle proposto, comparou-se seu desempenho com o desempenho do mtodo usado tradicionalmente pelos mdicos, que adota uma dosagem fixa de medicamento. Na seo 2, so descritos o sistema de regulao natural dos hormnios tireoideanos e suas sndromes principais. As redes neurais preditivas e o dispositivo de controle so apresentados na seo 3. A seo 4 contm os resultados obtidos nos experimentos numricos realizados. As concluses so descritas na seo 5. No apndice A, so apresentados os modelos matemticos propostos e empregados na gerao dos dados para o treinamento das redes neurais e na simulao do mecanismo de controle. 2 REGULAO DAS FUNES TIREOIDEANAS O sistema endcrino de regulao do metabolismo celular funciona atravs do controle e do monitoramento sobre a produo e a secreo de hormnios pelo hipotlamo, pela hipfise e pela tireide, como mostra a Figura 1. Alm desses, o sangue e as clulas-alvo participam do processo, respectivamente, como meio de transporte e entidades "consumidoras" de tais hormnios.

Em seu funcionamento normal, o processo de regulao inicia-se com a produo e a liberao, pelo hipotlamo, do TRH (hormnio estimulante de tireotropina). Esse hormnio excita a glndula pituitria na sntese e secreo do TSH (hormnio estimulante da tireide). O TSH, por sua vez, estimula a tireide para a fabricao e a secreo dos hormnios tireoideanos (TH), a saber, tiroxina (T 4) e triiodotironina (T 3) [Houssay et alli, 1972]. Isso garante um suprimento hormonal satisfatrio para as clulas-alvo, que retiram do sangue a quantidade necessria para seu metabolismo. O nvel de hormnios tireoideanos livres no sangue exerce um efeito de realimentao negativa sobre o suprimento de TSH, de modo que quanto maior a quantidade de TH no sangue, menor ser a produo do TSH pela hipfise, e vice-versa. Outra possvel conseqncia do incremento nos nveis de TH a reduo da densidade de receptores de TRH (TRHR) nas clulas da hipfise [Finke et alli, 1996]. Alm disso, a funo tireoideana regulada, at certo ponto, por alguns fatores endgenos intratiroidais. Entre as doenas que afetam o sistema de regulao dos hormnios tireoideanos, as principais so o hipertireoidismo e o hipotireoidismo [Robbins, 1969]. A primeira um distrbio que resulta em quantidades excessivas de hormnios tireoideanos circulantes, enquanto a segunda resultante da deficincia dos mesmos. O hipotireoidismo uma sndrome clnica relativamente comum. No adulto, alm da deteco clnica de alguns dos sintomas e sinais caractersticos, o diagnstico estabelecido pela aferio laboratorial das dosagens de T 4 e TSH.

Quando no tratado, o hipotireoidismo pode ocasionar srios danos para a sade, tais como cardiomegalia e retardo mental [Carvalho, 2003]. O tratamento padro consiste na reposio hormonal atravs da administrao oral diria do medicamento apropriado, proporcionando, assim, a quantidade supostamente adequada dos hormnios da tireide. O controle do tratamento realizado pelas concentraes de T 4 livre e TSH no sangue, as quais devem ser mantidas sempre dentro do intervalo de normalidade (TSH de 0,4 a 2,0 mUI/ml e T 4 livre de 0,8 a 1,8 ng/dl1). 3 MECANISMO DE CONTROLE O mecanismo desenvolvido formado por duas redes neurais diretas e um controlador de dosagem, conforme ilustrado na Figura 2. Um modelo, baseado em equaes diferenciais, representa a variao das concentraes hormonais do paciente a ser tratado. Com esse modelo, geram-se sries temporais relativas s concentraes de T 4 livre e TSH, que so armazenadas numa base de dados. As duas redes neurais so treinadas com esses dados. Assim, a resposta do paciente droga pode ser prevista por essas redes.

A partir das concentraes hormonais correntes e das previstas pelas redes neurais, o controlador utiliza um conjunto de regras de produo para determinar a quantidade da droga que deve ser administrada ao paciente hipotireoideo. Espera-se que esse mecanismo seja capaz de prover a dosagem adequada, sem causar variaes bruscas nas concentraes dos hormnios envolvidos no processo. Todos os componentes do mecanismo de controle foram desenvolvidos usando o software Matlab . A implementao das equaes diferenciais foi realizada atravs do toolbox Simulink , enquanto que o treinamento e a utilizao das redes preditivas utilizaram funes pr-existentes do toolbox de redes neurais [Demuth e Beale, 1998]. A seguir, descreve-se o dispositivo de controle utilizado nos experimentos numricos. Os modelos para a dinmica hormonal propostos e utilizados neste trabalho so apresentados no apndice A. 3.1 Predio Duas redes neurais artificiais so empregadas para a predio dos prximos valores das concentraes dos hormnios TSH e T4 livre, a partir de informaes histricas das mesmas. Optou-se pela utilizao de redes diretas com mltiplas camadas, tambm conhecidas por MLP (multilayer perceptrons), treinadas atravs do algoritmo error backpropagation. Essa escolha se deu pela farta bibliografia disponvel [Argoud et alli, 2004], pelo seu desempenho satisfatrio e pela facilidade de implementao. Nas redes MLP, os neurnios so organizados em camadas, sendo pelo menos uma camada escondida. A sada de um neurnio alimenta os neurnios da camada seguinte [Haykin, 1999]. Devido dificuldade prtica de se obter um conjunto relevante de dados reais sobre as variaes das concentraes dos hormnios TSH e T4 livre, o conjunto de treinamento utilizado na aprendizagem das redes neurais foi obtido a partir de uma massa de dados gerada pelos nossos modelos matemticos (ver apndice A) dos indivduos eutireoideo e hipotireoideo. Esse conjunto foi normalizado entre -1 e 1, e separado em trs subgrupos. O primeiro engloba 50% da massa de dados e foi utilizado para o treinamento da rede. Os outros dois, com 25% cada, representam as bases de validao e de teste da rede. Cada rede neural composta por seis neurnios na camada de entrada e um nico neurnio na camada de sada. Os neurnios de entrada representam as concentraes do respectivo hormnio no instante corrente (t) e nas cinco

medies antecessoras (entre t - 1 e t - 5). O neurnio de sada, por sua vez, representa o valor estimado da concentrao do hormnio analisado para o prximo passo de tempo (t + 1). Cada passo de tempo corresponde a 12 horas na vida do paciente. Dessa forma, a predio das redes neurais baseia-se nas concentraes hormonais obtidas nos ltimos trs dias. As topologias das redes foram definidas a partir de inmeros testes numricos [Martins, 2004], sendo que a escolhida possui duas camadas escondidas. A rede neural de predio do TSH composta por 24 neurnios na primeira camada intermediria e 12 na segunda, enquanto que a rede do T 4 livre formada por 12 e 6 neurnios, respectivamente. Todos os neurnios so dotados de uma mesma funo de ativao sigmoidal do tipo tangente hiperblica. No treinamento das redes, os pesos sinpticos so ajustados pelo error backpropagation tradicional, a partir de uma inicializao aleatria. Foi utilizada uma taxa de aprendizagem de 0,1 e modo de treinamento incremental. Como critrios de parada, foram empregados o nmero mximo de 10.000 ciclos (cada ciclo refere-se submisso de todo o conjunto de treinamento rede), e margem de erro relativo de 1 x 10 - 4. Para que a rede seja capaz de generalizar, evitou-se o overfitting, utilizando o mtodo early stopping [Demuth e Beale, 1998]. 3.2 Controlador de dosagem O controle deve ser de tal forma que possibilite manter as concentraes do TSH e do T 4 livre dentro de suas respectivas faixas de normalidade, sem provocar variaes bruscas ao longo do tempo. Consideram-se, como variaes bruscas, as oscilaes superiores a 5% em torno dos valores mdios. Para auxiliar na manuteno das concentraes do T 4 livre e TSH dentro das respectivas faixas de normalidade, foi introduzido o conceito de faixa de segurana para cada uma das substncias controladas. Os valores que delimitam essa faixa esto posicionados de modo proporcional s distncias entre a concentrao de equilbrio (valor mdio da faixa de normalidade) e os limites da faixa de normalidade, de modo que ela permanea entre esses nmeros. O clculo desses valores limtrofes feito pelas seguintes expresses:

sendo PE o valor da concentrao de equilbrio, LSS e LSI os valores do limite superior e do limite inferior da faixa de segurana, e LNS e LNI os valores do limite superior e do limite inferior da faixa de normalidade. A estratgia de controle consiste, basicamente, na tomada de deciso de quanta droga liberar, a partir das concentraes correntes do TSH e do T 4 livre e de suas tendncias futuras, dadas pelas previses das redes neurais. As concentraes das substncias controladas no instante t so utilizadas para determinar sua localizao em relao s respectivas faixas de segurana, enquanto as previses no instante t + 1 so comparadas com esses valores, de modo a estimar a derivada da curva associada evoluo da concentrao de cada hormnio. Dessa forma, espera-se que o controlador administre apenas a dosagem de manuteno previamente definida, se as concentraes dos hormnios esto dentro dos padres desejados. Escolheu-se, como dosagem de manuteno, o valor de Q no modelo do indivduo hipotireoideo que resulte numa concentrao de equilbrio de T 4 livre igual quela obtida no modelo do indivduo saudvel ([T4L]* @ 1,08 ng/dl), ou seja, Q* @ 2 mg/kg. Esse valor satisfatrio, dado que, no adulto, as doses de manuteno variam de 1,6 a 2,2 mg por kg do seu peso corporal. Quando as concentraes hormonais estiverem fora dos padres desejados, o controlador aplica um percentual de ajuste sobre a dosagem de manuteno, com o objetivo de levar tais substncias para aos patamares adequados. A dosagem administrada no totalmente absorvida pelo organismo [Zanini e Oga, 1994]. De fato, existe uma grande quantidade de variveis envolvidas no processo de absoro e que, portanto, devem ser consideradas no clculo da dosagem efetivamente absorvida (Q(t)). Entretanto, devido dificuldade em modelar esse processo de absoro, optouse por assumir Q(t) como sendo 80% da dosagem sugerida pelo controlador (Qc(t)), com um rudo branco gaussiano de 30%. Como no se deseja a administrao de doses superiores quelas indicadas pelo controlador, os valores resultantes saturam em 100% de Qc(t). Como resultado, o organismo absorve de 50% a 100% da droga sugerida pelo controlador. A quantidade da droga sugerida pelo controlador obtida em funo da dosagem de manuteno. Para a obteno dessa quantidade, utilizada uma mdia ponderada dos percentuais de ajuste PT4L e PTSH. Nessa mdia, assume-se que o peso associado a PTSH o dobro do associado a PT4L, visando aumentar a influncia do percentual de ajuste do TSH em relao ao do T 4 livre. Dessa forma, o controlador adota uma estratgia inspirada no mtodo tradicional, no qual, aps a estabilizao dos hormnios tireoideanos do paciente, o mdico os controla apenas atravs da aferio da concentrao do TSH. Por isso, assumimos que o peso associado ao TSH maior do que aquele associado ao T 4 livre. Assim, a dosagem sugerida (Qc) dada por:

O percentual de ajuste de cada substncia controlada (PT4L e PTSH) no pode ultrapassar 200% e obtido atravs do conjunto de regras de produo descrito na Tabela 1. Cada regra do tipo: SE a concentrao da substncia est na regio R e apresenta a tendncia V, ENTO o seu percentual de ajuste de X% sobre a dosagem de manuteno.

Na definio dessas regras, consideramos inicialmente que os percentuais de ajuste devem ser de 100% da dosagem de manuteno (Q*), quando as concentraes de T4 livre e TSH estiverem dentro das respectivas faixas de segurana e suas tendncias, dadas pelas redes neurais, indicarem que a permanecero. A partir desses valores, definiram-se empiricamente os demais percentuais atravs do acrscimo ou decrscimo de 15%, de acordo com a substncia analisada e sua tendncia, mantendo-se uma simetria na distribuio dos percentuais [Martins, 2004]. Nas situaes extremas da tabela (abaixo do LNI com tendncia de queda e acima do LNS com tendncia de aumento), os valores foram ajustados com uma variao de 10% em relao s faixas mais prximas, para garantir que os valores de PTSH e PT4L fiquem dentro do intervalo de 0% a 200%. Para P T4L = 100% e PTSH = 100%, o controlador administra apenas a dosagem de manuteno. Valores de PT4L e de PTSH diferentes de 100% indicam a necessidade de se ajustar essa dosagem: valores maiores que 100% mostram que se deve aumentar a quantidade da droga, valores menores revelam que a quantidade do medicamento fornecido deve ser diminuda. 4 EXPERIMENTOS NUMRICOS Devido dificuldade de realizao de experimentos envolvendo pacientes reais, optou-se por fazer simulaes numricas, baseadas em nosso modelo matemtico do paciente com hipotireoidismo. Os resultados obtidos com o uso do controlador foram comparados com aqueles gerados atravs da simulao do tratamento tradicional, no qual uma dosagem de manuteno fixa do medicamento administrada diariamente (Q* = 2 mg/kg). Em ambos os casos, simulou-se um perodo de tratamento de 90 dias. Os experimentos foram feitos em trs situaes distintas que correspondem aos quadros de pacientes hipotireoideos submetidos a tratamentos inadequados de dosagem irregular, subdosagem e superdosagem do medicamento. A primeiro situao visa representar pacientes que, apesar de apresentarem concentraes hormonais dentro da faixa de normalidade, possuem oscilaes bruscas nos valores dessas concentraes, decorrentes da variao inadequada na quantidade do medicamento administrada. Nessas simulaes, a dosagem de manuteno varia aleatoriamente entre

1,5 e 2,5 mg/kg. A segunda situao corresponde ao quadro de pacientes que, durante um perodo de tempo, suspenderam o tratamento; ou seja, esto sem receber a dosagem de manuteno do medicamento necessria para manter o equilbrio no organismo. No terceiro caso, o paciente submetido a uma dosagem diria excessiva do medicamento (4mg/kg), resultando, assim, num quadro temporrio de hipertireoidismo. Os histricos das substncias controladas foram gerados a partir de simulaes com as equaes diferenciais do paciente com hipotireoidismo, partindo-se dos valores de equilbrio de cada substncia e alterando-se os valores pertinentes dosagem absorvida pelo organismo, de acordo com o tratamento pretendido. Para cada situao, foram criados aleatoriamente 100 cenrios de amostragem, nos quais o perodo de tratamento varia de 5 a 8 dias. Alm da gerao dos histricos, as equaes diferenciais tambm foram empregadas nas simulaes da resposta do paciente hipotireoideo aos tratamentos administrados. Nesse caso, as condies iniciais utilizadas para cada simulao foram obtidas a partir da ltima aferio de cada substncia (no instante t), tendo, como ponto de partida, os histricos produzidos para cada situao; e da dosagem Q(t) sugerida, aps ter sido submetida ao fator de perturbao gerado naquele instante. Para cada cenrio, obtiveram-se as curvas das concentraes dos hormnios controlados (TSH e T 4 livre) e das dosagens efetivamente absorvidas pelo organismo (Q(t)). A partir dessas curvas, calcularam-se as respectivas mdias e desvios padres das concentraes hormonais na fase de manuteno (aps a estabilizao), bem como a quantidade total de medicamento absorvido durante o tratamento e o tempo gasto para a regularizao das concentraes hormonais dos pacientes. Visando padronizar o clculo das mdias, considerou-se que a regularizao das curvas hormonais ocorria aps 30 dias de tratamento (60 passos de simulao). Essa escolha foi inspirada no intervalo de tempo necessrio para o medicamento atuar com aproximadamente 98% de sua capacidade total sobre o organismo e , por isso, o perodo que os mdicos geralmente esperam para verificar a resposta do organismo dosagem administrada. Alm disso, em nossas simulaes, esse intervalo de tempo foi suficiente para garantir que, em todas as execues, as curvas do TSH e do T4 livre j se encontrassem estabilizadas. A Tabela 2 apresenta os resultados obtidos nas simulaes com os trs tipos de pacientes analisados: subdosagem, dosagem normal irregular e superdosagem. Para cada quadro, os resultados foram agrupados pelo mtodo de controle empregado: dosagem fixa e adaptativa (com o uso do controlador). Nessa tabela, as colunas l e d de cada concentrao representam, respectivamente, a mdia dos valores mdios de estabilizao obtidos nas 100 simulaes e a mdia dos seus desvios padres. A coluna Q refere-se ao maior desvio padro mdio obtido nas 100 simulaes.

A primeira observao ao se analisar a tabela que os resultados no variaram muito de um quadro para outro. Ou seja, independentemente se o controle (dosagem fixa ou adaptativa) realizado a partir de um quadro de subdosagem ou de dosagem normal irregular ou de superdosagem, comportamentos similares so obtidos. Isso se deve ao fato de que os resultados das concentraes apresentados na tabela foram obtidos a partir do trigsimo dia de tratamento, ou seja, aps a estabilizao no quadro do paciente. Entretanto, nas trs situaes analisadas, observou-se que o uso do controlador resultou em valores mdios (l) mais prximos aos pontos de equilbrio das equaes diferenciais. O mtodo da dosagem fixa ocasionou oscilaes bruscas nas concentraes do T 4 livre, como pode ser observado nos resultados da coluna correspondente oscilao mxima (Q). Constatou-se, ainda, que o mtodo de controle tradicional apresentou menor estabilidade relativa em relao abordagem adaptativa; ou seja, durante a fase de manuteno, algumas das concentraes dos hormnios controlados saram fora da faixa de normalidade. Tal concluso pode ser tirada a partir dos resultados apresentados nas colunas

referentes ao valor mdio (l) e oscilao mdia (d). Alm disso, observa-se que 100% dos cenrios testados sem o uso do controlador apresentaram valores para a concentrao do hormnio T 4 livre abaixo do limite mnimo da faixa de normalidade. Algumas observaes adicionais, obtidas durante a realizao dos experimentos, so apresentadas a seguir [Martins, 2004]. O tempo mdio gasto para a normalizao das concentraes dos hormnios controlados atravs do mtodo de dosagem fixa maior que aqueles obtidos atravs do controlador. No primeiro caso, o tempo mdio para a normalizao foi da ordem de 95 horas, enquanto que com o controlador demorou-se menos de 30 horas. Mas, na abordagem adaptativa, o paciente absorve em mdia 338 mg/kg durante todo o tratamento, enquanto que com a dosagem fixa essa absoro mdia de 271 mg/kg. Na obteno dos resultados apresentados na Tabela 2, foi empregado um rudo de 30% para a simulao das dosagens efetivamente absorvidas pelo organismo (Q(t)). Outros experimentos foram conduzidos com o objetivo de avaliar o comportamento do controlador e do mtodo de dosagem fixa quando submetidos a diferentes nveis de rudo [Martins, 2004]. Avaliaram-se perturbaes entre 10% e 50%, e pode-se afirmar que os resultados do controlador so sempre superiores queles obtidos com a dosagem fixa, em relao aos valores mdios obtidos e suas respectivas oscilaes. Cabe ressaltar que quanto maior o nvel de rudo, mais significativas so as melhorias obtidas com o uso do controlador em relao dosagem fixa. Com controlador, para perturbaes prximas a 50%, verificou-se que os valores mdios do TSH e do T4 livre permanecem dentro das respectivas faixas de normalidade, embora as oscilaes nas concentraes hormonais excedam os 5% desejados. Com dosagem fixa, perturbaes da ordem de 30% j so suficientemente grandes e provocam oscilaes bruscas (acima de 5%) levando esporadicamente a concentrao do T 4 livre para fora de sua faixa de normalidade. Com 50% de rudo na dosagem fixa, aproximadamente 50% dos cenrios avaliados resultaram em valores abaixo da normalidade. 5 CONCLUSES O objetivo principal deste trabalho foi elaborar e avaliar um modelo de controlador capaz de tratar pacientes com hipotireoidismo primrio, mantendo as concentraes dos hormnios TSH e T 4 livre dentro das respectivas faixas de normalidade, sem provocar oscilaes bruscas. Atravs dos experimentos, foi possvel constatar que o controlador, de fato, conseguiu regularizar o quadro do paciente da forma desejada. Alm disso, em nossas simulaes, o tratamento administrado pelo controlador proporcionou, no geral, um comportamento mais adequado que nas simulaes com a abordagem usualmente empregada de dosagem fixa. De fato, o controlador se mostrou mais robusto a rudos que a estratgia de dosagem fixa. Entretanto, a atuao do controlador sempre demanda uma quantidade maior de medicamento administrado. Em princpio, tal medicamento apenas repe o hormnio que falta. Assim, usar uma maior ou menor quantidade no deveria comprometer o quadro clnico do paciente, dado que suas concentraes hormonais sejam mantidas dentro das faixas de normalidade pelo mecanismo de controle investigado. AGRADECIMENTOS Os autores agradecem a colaborao do Prof. J. G. S. C. M. Berlinck na concepo dos modelos de dinmica hormonal apresentados no apndice. LHAM agradece o apoio do CNPq. REFERNCIAS Argoud, F. I. M., Azevedo, F. M., Marino Neto, J. (2004). Sistema de Deteco Automtica de Paroxismos Epileptognicos em Sinais de Eletroencefalograma, Revista Brasileira de Controle & Automao (SBA), Brasil, v. 15, n. 4, p. 467-475. [ Links ] Brandt, M. E., Chen G. (2001). Feedback Control of a Biodynamical Model of HIV-1, IEEE Transactions on Biomedical Engineering, vol. 48, pp. 754-759. [ Links ] Camps-Valls, G., Porta-Oltra, B., Soria-Olivas, E., Martn-Guerrero, J. D., Serrano-Lpez, A. J., Prez-Ruixo, J. J., Jimnez-Torres, N. V. (2003). Prediction of Cyclosporine Dosage in Patients After Kidney Transplantation Using Neural Networks, IEEE Transactions on Biomedical Engineering, vol. 50, pp. 442-448. [ Links ] Carson, E. R., Deutsch, T. (1992). A Spectrum of Approaches for Controlling Diabetes, IEEE Control Systems Magazine, vol. 12, pp. 25-31. [ Links ] Carvalho, D. P. (2003). Hipotireoidismo: diagnstico e princpios teraputicos, thyroid Update, Sociedade Brasileira de Endocrinologia e Metabologia. [ Links ] Demuth, H., Beale, M. (1998). Neural Network Toolbox For Use with MATLAB - User's Guide, The Math Works Inc., Massachusetts, USA. [ Links ] 1 Foram considerados os valores de referncia da faixa de normalidade do T 4 livre e TSH obtidos em exames de sangue realizados, respectivamente, em 06/07/2003 e 26/04/2004, no laboratrio do Hospital Srio Libans, por um dos autores, e em um trabalho publicado pela American Thyroid Association [Spencer et alli, 2002].

Sba: Controle & Automao Sociedade Brasileira de Automatica Retirado em 19/03 http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592005000200005&lng=pt&nrm=iso

Sistemas neurais hbridos para reconhecimento de padres em narizes artificiais


Cleber Zanchettin; Teresa Bernarda Ludermir Centro de Informtica, Universidade Federal de Pernambuco - UFPE, Caixa Postal 7851 - 50.732-970, Recife - PE - Brasil, cz@cin.ufpe.br, tbl@cin.ufpe.br

RESUMO Este trabalho investiga a utilizao de Sistemas Hbridos Inteligentes no sistema de reconhecimento de padres de um nariz artificial. So abordadas as arquiteturas conexionistas Multi-Layer Perceptron e Time Delay Neural Network; e as arquiteturas hbridas Feature-weighted Detector e Evolving Fuzzy Neural Networks. Alm dos classificadores, um filtro Wavelet avaliado como mtodo de pr-processamento para os sinais de odores. Foram analisados sinais gerados por um nariz artificial, composto por um conjunto de sensores de polmeros condutores, exposto a duas bases de odores distintas. Palavras-chave: Sistemas Hbridos Inteligentes, Redes Neurais Artificiais, Nariz Artificial. 1 INTRODUO Os narizes artificiais so dispositivos eletrnicos capazes de detectar e classificar odores, vapores e gases automaticamente. Todavia, apesar da pesquisa e desenvolvimento dos narizes artificiais serem inspirados no sistema olfativo biolgico, sua implementao, no se aproxima nem da complexidade ou de muitas das funcionalidades de seu equivalente biolgico. Atualmente, estes dispositivos consistem de um sistema sensor e um sistema de reconhecimento de padres. Nos narizes artificiais o processo de reconhecimento e classificao do odor se inicia no sistema sensor, responsvel pela captao ou medio dos estmulos odorantes no ambiente frente sensibilidade de seus sensores. Cada composto odorante apresentado ao sistema sensor do nariz artificial produz um estmulo caracterstico, frente aos sensores de deteco. Aps a captao destes estmulos ou padres de odores, e antes que estes sinais sejam apresentados ao sistema de reconhecimento de padres, realiza-se uma etapa de pr-processamento nos dados. A fase de pr-processamento nos padres de odores tem como finalidade a anlise dos dados, extrao dos descritores, correo de distores, normalizao e remoo/diminuio dos erros de leitura. Pr-processados, os padres de odores so apresentados ao sistema de reconhecimento de padres. Parte de fundamental importncia no funcionamento dos narizes artificiais o sistema de reconhecimento de padres responsvel por classificar os estmulos odorantes captados pelo sistema sensor. Os narizes artificiais tm sido utilizados com grande sucesso em diversas aplicaes (Keller et al., 1995). Recentemente eles tm despertado especial interesse da indstria petrolfera, onde podem ser utilizados como dispositivos de segurana na deteco e reconhecimento de gases txicos. Em companhias petrolferas, os narizes artificiais podem trabalhar na preveno de vazamentos em dutos de transporte e em plataformas de extrao e refino de derivados de petrleo. Posicionados em locais estratgicos, estes dispositivos podem detectar e identificar vazamentos qumicos em estgios iniciais, antes que a concentrao de gases txicos alcance nveis perceptveis e perigosos para os seres humanos e natureza. Tendo grande importncia nos resultados produzidos por um nariz artificial, o sistema de reconhecimento de padres tem recebido crescente ateno em seu desenvolvimento. Dentre as abordagens investigadas objetivando o reconhecimento de padres, resultados promissores esto sendo encontrados no desenvolvimento de Sistemas Hbridos Inteligentes (Abraham e Nath, 2002; Mcgarry et al., 2002; Medsker, 1995). Os Sistemas Hbridos Inteligentes so modelos que resultam da combinao de duas ou mais tcnicas computacionais distintas, visando unir vantagens para suprir deficincias individuais, na resoluo de determinado problema. Neste trabalho, procuramos investigar tcnicas hbridas que possam contribuir para o aprimoramento do sistema de reconhecimento de padres do prottipo de um nariz artificial (Santos, 2000), a ser utilizado na deteco de gases provenientes da indstria petrolfera. So abordadas redes neurais artificiais j consagradas na literatura no reconhecimento de odores, como redes neurais Multi-Layer Perceptron (MLP) (Rumelhart et al., 1986) e Time Delay Neural Network (TDNN) (Lang e Hilton, 1988); alm de novas abordagens neurais hbridas como: a rede neuro-difusa Feature-weigthed Detector (FWD) (Li et al., 2002), capaz de efetuar a classificao de padres, seleo dos atributos mais importantes e extrao de regras explicativas difusas da rede; e a rede neural evolutiva Evolving Fuzzy Neural

Network (EFuNN) (Kasabov, 1998), que opera de um modo on-line; aprende incrementalmente e manipula o conhecimento adquirido do ambiente a partir de regras difusas de classificao, realizando agregao, insero e extrao destas regras na arquitetura da rede. Para avaliar os classificadores, seus desempenhos sero comparados na classificao de duas bases de dados distintas, uma base de odores de vinhos e uma base de gases derivados da indstria petrolfera. Este artigo est dividido em cinco sees. A seo 2 apresenta os classificadores investigados. Na seo 3 so descritos os experimentos realizados. Na seo 4 so apresentados os resultados obtidos com cada um dos classificadores na anlise dos padres de odores. As consideraes finais so apresentadas na seo 5. 2 SISTEMAS CONEXIONISTAS NO RECONHECIMENTO DE ODORES O reconhecimento de padres em narizes artificiais tm sido proposto a partir de vrias abordagens no decorrer da ltima dcada (Barbosa et al., 2002; Yamazaki et al., 2001; Santos, 2000; Natale et al., 1995; Gardner et al., 1994; Keller et al., 1994; Sundgren et al., 1991; Gardner et al., 1990). Na grande maioria das abordagens as redes neurais artificiais tm sido amplamente utilizadas no reconhecimento de odor, devido a sua capacidade de trabalhar com sinais nolineares provenientes dos sensores, grande adaptabilidade, tolerncia a erros, tolerncia a rudo e paralelismo inerente, permitindo rapidez no uso aps o treinamento (Gardner et al., 1990). 2.1 Redes Multi-Layer Perceptron Dentre os vrios modelos de redes neurais artificiais existentes, a rede MLP (Rumelhart et al., 1986) a rede neural artificial mais difundida, parte por sua facilidade de implementao, parte por sua simplicidade. Caractersticas estas, que a tornaram uma das redes neurais artificiais mais utilizadas na classificao de padres de odores em narizes artificiais (Yamazaki e Ludermir, 2001; Santos, 2000; Natale et al., 1995; Gardner et al., 1994; Keller et al., 1994; Sundgren et al., 1991; Gardner et al., 1990). Devido a sua ampla utilizao no reconhecimento de odores, a rede MLP se torna necessria como parmetro em qualquer tipo de comparao entre classificadores para narizes artificiais. Nas simulaes realizadas com a rede MLP foram utilizados dois mtodos de pr-processamento: normalizao dos dados, de modo a que ficassem compreendidos na faixa de valores entre -1 e 1; e o filtro Wavelet, para reduo do rudo e compresso dos dados de odores. Foi utilizada uma rede MLP, contendo apenas uma camada intermediria. Neste experimento foi utilizada a codificao 1-of-m, onde m o nmero de classes (Prechelt, 1994), desta forma a rede neural possui tantas sadas quanto forem o nmero de classes investigadas. As unidades de processamento das camadas, intermediria e de sada possuem funo de ativao tangente hiperblica (Prechelt, 1994). A rede contm todas as possveis conexes de propagao direta (feedforward) entre camadas adjacentes, sem possuir conexes que ligam unidades de processamento de camadas no-adjacentes. Em cada um dos experimentos, foram treinadas seis topologias de rede distintas (com 4, 8, 12, 16, 20 e 30 unidades de processamento na camada intermediria). O algoritmo de treinamento utilizado uma verso do mtodo de Lenvenberg-Maquardt, descrita em (Lang e Hilton, 1988). Para cada topologia, foram realizadas 30 (trinta) treinamentos, com inicializaes de valores diferentes e aleatrios para as conexes entre as camadas de processamento. A parada do treinamento ocorre se for satisfeito o critrio GL5 do Proben1 (Prechelt, 1994) por duas vezes (para evitar que o treinamento seja interrompido por oscilaes iniciais no erro de validao). O critrio GL5 fornece uma idia sobre a perda da generalizao durante o treinamento da rede, sendo muito til para evitar overfitting. Este parmetro definido como o aumento do erro de validao em relao ao erro de validao mnimo obtido. O treinamento tambm interrompido se for satisfeito o critrio de progresso de treinamento do Proben1 (Prechelt, 1994), com P5(t) < 0.1. Este parmetro fornece uma idia de quanto o erro mdio de treinamento maior que o mnimo erro de treinamento, durante uma seqncia de pocas consecutivas. O treinamento tambm encerrado se a quantidade mxima de 5.000 iteraes for alcanada. 2.2 Rede Time Delay Neural Network A rede Time Delay Neural Network (Time Delay), foi proposta por (Waibel et al., 1989), com a finalidade de resolver o problema de reconhecimento de fonemas isolados utilizando um espectrograma. Em essncia, uma TDNN uma rede neural artificial com arquitetura feedforward, onde a resposta da rede no tempo t baseada nas entradas no tempo (t-1), (t-2),..., (t-n). Com isso, considera-se um histrico da seqncia temporal dos dados. A abordagem utilizada neste trabalho foi proposta por (Yamazaki e Ludermir, 2001). Esta abordagem consiste de um sistema de reconhecimento de padres capaz de analisar as caractersticas temporais dos sinais gerados pelos sensores do nariz artificial, levando em considerao a variao destes valores ao longo do intervalo de tempo em que foram feitas as aquisies dos dados. Este trabalho tem particular interesse em redes TDNN, a qual, a arquitetura conexionista que tem apresentado os resultados mais promissores na classificao de padres de odores em narizes artificiais (Zanchettin e Ludermir, 2003c; Zanchettin e Ludermir, 2003b; Zanchettin e Ludermir, 2003a; Yamazaki e Ludermir, 2001; Yamazaki et al., 2001). Como descrito em Yamazaki e Ludermir (2001), a arquitetura do sistema de reconhecimento de padres necessita receber curvas completas geradas pelos sensores do nariz artificial durante a aquisio dos dados. Tais curvas precisam ser obtidas em intervalos ininterruptos de tempo, desta forma, apenas os valores obtidos em cada uma das repeties podem ser utilizados no conjunto de treinamento, validao e teste (os padres no podem ser retirados da ordem de aquisio ou agrupados em conjuntos maiores).

Desta forma, uma das repeties da aquisio dos dados foi utilizada como conjunto de treinamento. Outras duas repeties distintas (com a mesma quantidade de dados) foram utilizadas como conjunto de validao e teste. Foram utilizadas as mesmas tcnicas de pr-processamento adotadas nos experimentos com redes MLP. Para o tratamento temporal dos padres de odores, foi utilizada uma rede TDNN (Lang e Hilton, 1988), contendo apenas uma camada intermediria. A camada de entrada possui o dobro do nmero de sensores do nariz artificial, pelo fato da utilizao do atraso no tempo (delay de t-1), para cada uma das curvas de entrada. Este atraso formado pelo valor atual de resistncia do sensor e por um valor temporalmente anterior a este, de cada um dos sensores. Esta quantidade de atrasos no tempo para cada uma das curvas de entrada foi escolhida por ser a menor configurao possvel utilizando caractersticas temporais. Foi utilizada a mesma codificao, topologia, funo de ativao e algoritmo de aprendizado adotados na rede MLP descrita na seo anterior. Da mesma forma, foram realizadas trinta (30) execues com diferentes inicializaes dos valores das conexes entre as camadas de processamento. Os critrios de parada do treinamento foram os mesmos adotados nos experimentos com a rede MLP. importante ressaltar que os erros analisados foram computados separadamente para cada odor, ou seja, a rede avaliou, para cada sensor, as curvas correspondentes a cada independentemente, e no uma nica curva contendo os valores dos odores em seqncia. Isto foi adotado para que a ordem de apresentao dos odores rede no influencie nos resultados obtidos. 2.3 Rede Feature-weighted Detector A abordagem neuro-difusa Feature-weighted Detector (Li et al., 2002), consiste de uma rede com conexes de memria para classificao de padres e conexes de pesos para seleo de atributos. Esta abordagem possui a capacidade de selecionar as caractersticas importantes de um conjunto de dados, enquanto mantm a taxa mxima de reconhecimento de padres. Alm da capacidade de selecionar atributos e classificar padres, o mtodo possibilita a extrao do conhecimento adquirido pela rede no processo de aprendizagem na forma de um conjunto de regras interpretveis do tipo Se-Ento. Este modelo oferece especial interesse no tratamento dos padres de odores por se propor a resolver dois dos principais problemas do reconhecimento de padres: a seleo de atributos e a classificao dos padres, alm da capacidade de extrair regras difusas da estrutura da rede. Estas regras podem ser utilizadas na explicao do conhecimento adquirido pela rede na fase de aprendizagem, resolvendo assim uma conhecida deficincia das redes neurais artificiais. A partir de experimentos prvios, realizados com a rede FWD, verificou-se que a ordem com que os padres de odores so apresentados no treinamento, possui influncia sobre seu desempenho na classificao dos odores. Assim, nos experimentos, os exemplos de cada um dos odores foram apresentados de forma ordenada no treinamento da rede (primeiramente foram apresentados todos os exemplos de um tipo de odor, posteriormente de outro tipo, etc.). Para o teste da rede neuro-difusa os padres de odores foram apresentados de forma aleatria. A fim de considerar esta necessidade de ordenao e verificar o desempenho da rede FWD com vrias parties de dados, os mesmos conjuntos empregados nos experimentos com a rede TDNN foram utilizados. A rede FWD no utiliza conjunto de validao em seu treinamento. importante salientar que os conjuntos de treinamento e teste de cada uma das parties so formados por diferentes repeties de aquisies de dados e que as caractersticas das respostas dos sensores podem se modificar de uma aquisio para outra (Santos, 2000). O conjunto de padres foi normalizado de modo a ficar compreendido na faixa de valores entre 0 e 1. O prprocessamento a partir do filtro Wavelet no foi utilizado nos experimentos com a rede FWD, pois em anlises preliminares no melhoraram os resultados apresentados pelo modelo. Por questo de objetividade seus resultados foram suprimidos das simulaes realizadas com a rede FWD. Foram realizadas 30 (trinta) execues, para cada uma das parties. So utilizadas inicializaes baseadas nos centros dos dados para as conexes de memria e valores fixos em 1 para as conexes de pesos. Os critrios de parada do treinamento utilizados foram o erro mnimo de treinamento = 0 e o nmero mximo de 5.000 iteraes. 2.4 Rede Evolving Fuzzy Neural Network A abordagem evolutiva neuro-difusa EFuNN (Kasabov, 1998), uma estrutura conexionista que possui caractersticas como: aprendizado rpido (possivelmente em modo one-pass learning), incremental e on-line; sua estrutura conexionista pode ser interpretada por regras difusas; utiliza regras de classificao para o crescimento, poda e agregao de sua topologia; e suas unidades de processamento e as conexes entre estas unidades so criadas, eliminadas e agregadas dinamicamente durante a operao da rede. Toda a estrutura da rede EFuNN construda sobre um conjunto de regras difusas, onde possvel modificar dinamicamente a topologia da rede. Assim, o modelo pode se adaptar a novos dados de treinamento (inclusive inserindo novas classes) de uma maneira on-line e aprender incrementalmente a partir de caractersticas locais dos exemplos de treinamento. Todo o conhecimento adquirido pela rede pode ser expresso na forma de regras de classificao difusas do tipo Se-Ento. A arquitetura EFuNN denominada evolutiva porque sua topologia cresce com a apresentao de novos dados na fase de aprendizado e regularmente diminui atravs de poda (prunning), ou atravs da agregao de unidades de processamento de regras. O interesse na aplicao da rede EFuNN no tratamento dos padres de odores surgiu a partir de trs de suas

funcionalidades: (1) possibilidade de extrao do conhecimento da rede a partir de regras de classificao; (2) aprendizado incremental, o qual possibilita que novos odores sejam aprendidos durante a operao do dispositivo; e (3) treinamento on-line, que possibilita a apresentao de novos padres e classes a rede, sem a necessidade de reapresentar toda a base de dados previamente treinada. Em um dispositivo onde se prima pela eficincia, rapidez, plasticidade e tamanho estas caractersticas so muito apreciadas. Pelo fato da rede EFuNN no utilizar conjunto de validao em seu treinamento, nos experimentos realizados a base de dados utilizou somente dois conjuntos de dados: conjunto de treinamento, correspondendo a 50% da quantidade total de padres; e conjunto de teste, correspondendo a 25% dos dados. Foram utilizados os mesmos dados empregados no treinamento da rede MLP. A rede EFuNN no necessita de pr-processamento, desta forma, os dados so apresentados camada de entrada sem processamento algum. Nesta camada os exemplos so transformados em padres difusos, representados pela segunda camada de processamento da rede, no espao de representao do problema. Desta forma, os padres de odores foram apresentados rede com a mesma amplitude de valores captada pelo sistema sensor do nariz artificial. Cada unidade de processamento de entrada e sada contm trs funes de pertinncia (Baixo, Mdio e Alto), utilizadas na representao difusa dos dados. A inexistncia de aleatoriedade no treinamento da rede EFuNN faz com que uma execuo da rede seja suficiente para fornecer uma idia sobre a generalizao do modelo. Ou seja, como o aprendizado realizado a partir dos exemplos apresentados ao modelo, os mesmos dados iro convergir sempre para um mesmo ponto no espao de busca. Assim, para realizar a comparao da rede EFuNN com as demais abordagens investigadas neste trabalho foram criadas 30 parties, de forma a se obter um erro mdio de classificao para a base de odores utilizada. O modo de treinamento utilizado foi one pass training, os exemplos so apresentados rede somente uma vez para cada uma das modalidades e parties testadas. Foram realizadas quatro modalidades de experimentos: (1) no primeiro experimento a rede foi inicializada sem nenhuma regra e em seu treinamento no foram realizadas operaes de poda (pruning) ou agregao de nodos de regras; (2) no segundo experimento, a rede tambm foi inicializada sem nenhuma regra, mas durante seu treinamento foi utilizada a tcnica de poda dos nodos de regras que estivessem fora do limiar de ativao pr-estabelecido; (3) no terceiro experimento, a rede foi inicializada com algumas regras, remanescentes de treinamentos prvios e novos dados foram apresentados rede de maneira on-line. Durante este treinamento foram utilizados ambos, poda e agregao; e (4) no quarto experimento, a partir de uma arquitetura previamente treinada com alguns odores, foram apresentados exemplos novas classes de odores, forando a rede a se adaptar a estes novos exemplos e englobar automaticamente esta nova classe em sua topologia. 3 EXPERIMENTOS O processo de aquisio dos estmulos odorantes pelo nariz artificial realizado no sistema sensor, o qual composto por uma matriz de sensores que captam informaes do ambiente e as convertem em medidas quantitativas de interesse. O sistema sensor pode ser formado por um conjunto de sensores distintos, em que cada elemento mede uma propriedade diferente do composto odorante, ou por um nico dispositivo que produz um conjunto de medies para cada composto odorante. O sistema sensor pode tambm ser formado por uma combinao das estruturas descritas anteriormente (Yamazaki e Ludermir, 2001; Keller et al., 1995; Keller et al., 1994). Vrios tipos de sensores e dopantes caractersticos podem ser utilizados na construo da matriz de sensores, dependendo da resposta desejada ou do odor analisado. Desta forma, todo composto odorante apresentado ao sistema sensor produz nos sensores alteraes fsicas ou qumicas que o caracterizam. Neste trabalho utilizamos duas bases de dados distintas, obtida a partir da exposio do prottipo de um nariz artificial (Santos, 2000) frente a dois compostos distintos. A matriz de sensores composta pelo arranjo de sensores baseados em filmes de polipirrol1. Os sensores foram preparados com diferentes dopantes, por polimerizao in situ, em substratos de ITO (substrato vtreo condutor). Algumas vantagens na utilizao deste tipo de sensor so: (1) rpida cintica de absoro em temperatura ambiente; (2) pequeno consumo de energia (da ordem de microwatts), pois no necessrio um elemento aquecedor; (3) resistncia ao envenenamento por compostos que normalmente tornariam inativos os sensores inorgnicos de semicondutores, como os compostos que contm enxofre; e (4) a possibilidade de o polmero ser construdo com especificidade para determinados compostos qumicos (Persaud e Travers, 1997). A aquisio dos dados foi realizada de forma automtica pelo nariz artificial, estando os sensores expostos aos odorantes em uma cmara especial de testes. A concentrao de cada um dos odores foi constante em cada uma das aquisies dos dados e entre as diferentes aquisies. Maiores detalhes sobre a construo do prottipo podem ser encontrados em (Santos, 2000). A primeira base trata da classificao de odores provenientes de trs safras distintas (anos 1995, 1996 e 1997) de um mesmo vinho tinto comercial (Almadm, Brasil) produzido com uvas do tipo merlot. Foram realizadas trs repeties de aquisio de dados. Em cada uma destas repeties, para cada uma das trs safras de vinho, o valor da resistncia de cada um dos seis sensores utilizados foi registrado de meio em meio segundo, sendo que o processo estendeu-se por cinco minutos. Dessa forma, cada sensor obteve 600 valores registrados para cada safra de vinho. O conjunto formado pelos seis valores dos seis sensores no mesmo instante de tempo foi considerado como um padro da base de dados. Assim, cada repetio contm 1.800 padres (600 de cada safra). Como existem trs repeties, tem-se um total de 5.400 padres na base de dados de vinhos.

A segunda base de dados provm da exposio do nariz artificial frente a compostos fornecidos pela pela companhia petrolfera Petrobrs2. Os testes foram realizados frente aos gases derivados do petrleo: Metano, Etano, Propano e Butano. Tambm foi verificada a sensibilidade frente ao gs Monxido de Carbono. Os dados foram obtidos em nove repeties de testes, para os cinco gases analisados. Em todas as repeties, o valor de resistncia de cada um dos oito sensores utilizados foi registrado em intervalos de 20 segundos. Como o processo de aquisio dos padres de cada arranjo estendeu-se por 40 minutos, cada sensor obteve o registro de 120 valores, para cada um dos cinco gases apresentados ao nariz artificial. Desta forma, cada repetio contm 600 padres, formados por 960 valores de cada gs. A partir das nove repeties, obteve-se um total de 5.400 padres que formam a base de dados de gases. A tabela 1 apresenta um exemplo de aquisio dos dados para o gs Butano. Os sensores utilizados so denominados pelo nome do dopante utilizado em sua constituio, DBS - Dodecilbenzonato de Sdio, OSA - Octil-sulfato de Sdio, NBS cido Nitrobenzeno Sulfnico, ASA - Antraquinona Sulfonato de Sdio, PTSA - cido P-toluenosulfnico, CAS - cido Canforsulfnico, PER - Perclorato de Ltio, OSA2 - Octil-sulfonato de Sdio.

Para auxiliar na anlise dos experimentos que sero realizados neste estudo a Anlise de Componentes Principais (PCA) (Jackson, 1991) foi empregada na visualizao dos padres nas duas bases de dados. Neste tipo de anlise essencial a escolha do nmero de componentes principais (CPs) utilizados na descrio do sistema, de modo a reduzir a dimenso das amostras estudadas. Sero consideradas as trs primeiras CPs, pois juntas correspondem a mais de 97.5% e 99.5% da varincia total dos padres analisados nos dados das bases de vinhos e gases, respectivamente. A projeo dos escores da base vinhos, nas trs primeiras componentes principais, pode ser vista na figura 1. Pode ser verificado que as amostras das Safras 95 e 97 esto mais agrupadas, enquanto que as amostras da Safra 96 est bem separada das demais.

A projeo dos escores da base gases apresentada na figura 2. A partir desta figura pode-se observar que a distino entre a maioria dos gases bem definida, apenas os gases Metano e Etano mantm-se agrupados em um plano de difcil separao.

A PCA pode tambm ser utilizada para verificar a importncia de cada uma das variveis do conjunto original de dados. Ou seja, as variveis originais ou os sensores em nosso caso, com maior peso na combinao linear dos primeiros componentes principais so os mais importantes do ponto de vista estatstico. A partir da anlise dos pesos de cada uma das variveis, foi possvel verificar quais sensores mais contribuem para a separao dos odores em cada uma das componentes principais. Verificou-se que na separao dos vinhos trs sensores possuem maior relevncia, so eles: Dodecilbenzonato de Sdio - DBS, Antraquinona Sulfonato de Sdio ASA, Octil-sulfonato de Sdio - OSA. Na base de gases verificou-se que cinco sensores so os mais relevantes: Dodecilbenzoato de Sdio - DBS, Octil-sulfonato de Sdio - OSA, Antraquinona Sulfonato de Sdio - ASA, Perclorato de Ltio - PER e Octil-sulfonato de Sdio - OSA2, possuem maior relevncia para a separao dos padres nas componentes principais analisadas. 3.1 Pr-Processamento dos Dados Nos experimentos realizados, foram criadas 3 parties de dados, baseadas na base de dados original. Cada uma das parties possui suas instncias dispostas em diferentes ordens de forma aleatria. A partir destas parties, a base de padres de odores foi dividida em trs conjuntos de dados, os quais correspondem aos conjuntos de treinamento, validao e teste utilizados nos experimentos com os classificadores. A proporo de padres contidos em cada um dos conjuntos foi a seguinte: 50% dos padres de odores foram dispostos no conjunto de treinamento; 25% dos padres correspondem ao conjunto de validao; e os 25% restantes foram utilizados no conjunto de teste. A utilizao de parties de dados necessria para eliminar qualquer vis existente no treinamento das redes neurais artificiais. Este tipo de diviso nos padres de treinamento sugerida pelo relatrio Proben1 (Prechelt, 1994), um conhecido Benchmark para o treinamento de redes neurais artificiais. 31.1. Normalizao dos Dados Para uma maior efetividade e rapidez no treinamento de redes neurais artificiais, aconselhvel a transformao de todos os atributos de valores reais para um mesmo intervalo. Dados com atributos em escalas diferentes podem confundir o aprendizado da rede, fazendo que esta tenha maior considerao por valores com grandes magnitudes. As tcnicas de normalizao evitam este tipo de problema, transpondo os dados em intervalos bem definidos. Podem ser utilizadas normalizaes Euclidianas, logartmicas ou funes trigonomtricas, tais como: tangente hiperblica, seno, coseno, etc. Nos experimentos, os padres de odores foram normalizados separadamente para cada sensor do nariz artificial. Duas formas de normalizao foram utilizadas: (1) normalizao nos dados para que os valores ficassem dispostos entre -1 e 1; e (2) normalizao para que ficassem dispostos entre 0 e 1. 3.1.2 Filtro Wavelet Ao considerarmos que os sinais odorantes captados pelo nariz artificial so sinais, adquiridos por um sensor em um determinado intervalo de tempo; uma das ferramentas mais indicadas para o tratamento destes padres so tcnicas utilizadas no processamento de sinais digitais. A partir deste pressuposto, a Transformada Wavelet (Daubechies, 1990) foi utilizada como mtodo de pr-processamento dos sinais. A Transformada Wavelets uma ferramenta matemtica que possui vantagens perante tcnicas clssicas de processamento de sinais, como a Anlise de Fourier (Brigham, 1988): suas funes bases (wavelets) no pertencem a um espao finito de solues, isto , existem teoricamente infinitas possibilidades de se projetar wavelets com propriedades especiais, voltadas para aplicaes especficas. A Anlise Wavelet uma transformao integral onde os ncleos de integrao usados na transformao do sinal so denominados de wavelets. Estas wavelets so essencialmente utilizadas de duas maneiras no estudo de processos ou sinais: (1) como um ncleo de integrao para

analisar a extrao de informaes sobre um processo; e (2) como uma base de representao ou caracterizao do mesmo. A figura 3 ilustra o processo onde a resoluo de tempo-domnio de um sinal x(k), k = 1,,N alterado pela operaes de filtragem passa/faixa e a escala alterada por operaes de downsampling/upsampling. Os parmetros da Transformada Wavelet so o tipo do filtro Wavelet utilizado e o nmero de nveis de decomposio (l = 1,,L).

Em nveis baixos da escala de decomposio, a definio de tempo negligenciada em favor de uma melhor definio da freqncia. Deste modo eventos de baixa freqncia podem ser melhor analisados com respeito a seu ndice de freqncia mas no com respeito a sua posio no tempo. Em nveis elevados da escala uma melhor definio do tempo obtida, a posio de eventos de alta freqncia bem localizada no tempo, mas seu ndice de freqncia real no exato. A Transformada Wavelet pode ser representada por:

onde dj,k so os coeficientes wavelet, g(t) o sinal a ser transformado, f(t) a escala da funo, yj,k(t) a funo wavelet me y(t) dada por:

e N o nmero de escalas sobre o qual a Transformada Wavelet gerada. Seguindo esta notao, a Transformada Wavelet Inversa pode ser dada por:

O filtro Wavelet utilizado neste trabalho foi construdo com a Transformada Wavelets da famlia Daubechies de ordem 3 (Daubechies, 1988), com threshold de filtragem fixo (thr = 35). Este filtro utilizado para reduo do rudo inerente ao sinal de odor e como mtodo de compresso deste sinal. Como o mtodo de aquisio dos dados no nariz artificial induz a rudos de baixa freqncia, os sinais livres de rudo foram encontrados na componente de mais baixa freqncia de uma rvore de 3 nveis de decomposio. Na figura 4 pode ser verificada a decomposio do sinal analisado. A partir desta decomposio o sinal de odor original foi reconstrudo a partir do terceiro nvel de decomposio sem os componentes ruidosos que poderiam prejudicar o desempenho dos classificadores. A taxa de compresso obtida foi de 85.71%. O filtro foi implementado utilizando o Toolbox Wavelets (Misiti et al., 1996), do software de simulao Matlab 6.5.1 3.

3.2 Mtodo de Comparao entre as abordagens Na maioria das reas de pesquisa h uma busca contnua por novos mtodos que melhorem em algum sentido o desempenho das abordagens existentes. Na agricultura, por exemplo, buscam-se variedades mais adequadas e mais produtivas de cereais. Na computao, buscam-se tcnicas que melhorem a qualidade e o desempenho dos softwares existentes. Nestas situaes preciso comparar as tcnicas usuais com os mtodos alternativos propostos. Esta comparao uma questo importante que surge freqentemente no trabalho de pesquisa. Para se chegar a qualquer concluso necessrio coletar informaes e fazer inferncias a partir de evidncias experimentais ou observacionais. A partir das observaes realizadas, para uma resposta coerente, necessrio generalizar os resultados obtidos no grupo estudado para a populao de interesse. Esta tarefa exige cuidados especiais no planejamento dos experimentos, sendo que fatores que afetem a resposta avaliada devem ser controlados e considerados. O procedimento utilizado para determinar se o resultado de uma anlise aponta para sim ou para no chamado Teste de Hiptese (Duda et al., 2001). Este procedimento amplamente utilizado nas reas de pesquisa onde as variveis envolvidas esto sujeitas grande variabilidade. O teste de hipteses utilizado na comparao dos classificadores investigados neste trabalho o teste de Wilcoxon (Johson e Wichern, 1999). O teste de Wilcoxon, tambm conhecido por Teste dos Sinais por Postos, um teste de hipteses no-paramtrico para dados pareados. O teste de hipteses ser utilizado para comparar os resultados obtidos por cada um dos classificadores. A partir destes testes ser possvel afirmar qual dos classificadores avaliados possui o melhor desempenho na classificao dos compostos odorantes. Os resultados foram considerados estatisticamente significativos quando P<0,05. 4 RESULTADOS 4.1 Redes Multi-Layer Perceptron Foram realizados dois experimentos distintos: (1) um experimento onde o mtodo de pr-processamento utilizado somente a normalizao dos padres captados pelo sistema sensor do nariz artificial, de modo que estes valores fiquem compreendidos no intervalo [-1, 1]; e (2) um experimento que utiliza um filtro Wavelet para reduo do rudo presente no sinal captado pelo sistema sensor do nariz artificial e como um mecanismo de compresso para os dados de odor. Na tabela 2 so apresentados os resultados do primeiro experimento, sem o uso do filtro Wavelet. Para cada um dos experimentos apresenta-se uma tabela contendo o nome da base de dados, a melhor topologia encontrada, a mdia dos resultados obtidos nas trinta (30) execues realizadas, com as trs parties (Sum Squared Error - SSE e Erro de Classificao), bem como os valores de mdia e desvio-padro.

Em ambas as bases o menor erro de validao e classificao foi obtido pela topologia com 8 nodos na camada escondida. Correspondendo a um erro de classificao mdio de 10.96% para a base de vinhos e 14.61% para a base de gases (tabela 2). Foi verificado tambm que a partir da topologia com 8 nodos na camada intermediria, o erro obtido pela rede neural aumenta com a adio de novas unidades de processamento nesta camada. Apesar deste indcio, foram realizados experimentos com topologias onde o nmero de unidades de processamento na camada intermediria ultrapassava 30 nodos (com 50, 70, 100, 150 e 300 unidades de processamento na camada intermediria). Porm, nestes experimentos o erro de classificao manteve a mesma tendncia de alta, proporcional ao nmero de unidades de processamento adicionadas. Na tabela 3 so apresentados os resultados do treinamento realizado com as redes MLP utilizando o filtro Wavelet.

A partir dos resultados apresentados na tabela 3 se percebe que a utilizao do filtro Wavelet, melhora consideravelmente o desempenho do mtodo de classificao. Os menores erros de validao e classificao foram obtidos pelas topologias com 12 e 8 nodos na camada intermediria, um erro mdio de 9,47% e 11.50% sobre o conjunto de teste, para as bases de vinhos e gases, respectivamente. Se compararmos os melhores resultados obtidos pelos dois experimentos (resultados obtidos pelo classificador sem e com a utilizao do filtro Wavelet) podemos verificar que a melhora foi substancial. A fim de verificarmos a relevncia estatstica dos resultados obtidos, foi realizado o teste de hipteses nestes experimentos. O teste realizado a partir dos melhores resultados mdios, obtidos por cada um dos experimentos (com e sem pr-processamento com filtro Wavelet). Neste teste, verificamos que apesar da menor mdia de classificao do segundo experimento, com nvel de significncia de 5%, estatisticamente a performance mdia das redes MLP fazendo uso do filtro Wavelet to boa quanto das redes que no usam este tipo de pr-processamento. 4.2 Rede Time Delay Neural Network Os mesmos experimentos realizados com a rede MLP foram repetidos coma rede TDNN. Na tabela 4 so apresentados os resultados mdios do treinamento, para as trs parties testadas. Neste experimento somente foi utilizada a normalizao, como mtodo de pr-processamento.

Como pode ser observado, a abordagem temporal diminuiu consideravelmente a variao dos resultados, refletido no baixo desvio-padro apresentado pelos experimentos. As topologias com menor erro mdio de validao e teste foram as topologias com 8 unidades de processamento na camada intermediria, para ambas as bases de dados. Foi obtido um erro mdio de classificao de 0.50% e 12.17% para as bases de vinhos e gases, respectivamente. importante salientar que os conjuntos de treinamento, validao e teste so formados por diferentes repeties de aquisio de dados, e as caractersticas das respostas dos sensores se modificam de uma repetio para a outra (Santos, 2000). A partir desta afirmao, pode-se perceber que a rede conseguiu generalizar muito bem o conhecimento adquirido em seu treinamento. Outro fato a ser observado nesta anlise, da mesma forma que o ocorrido com as redes MLP, o acrscimo no nmero de unidades de processamento na camada intermediria no melhora o desempenho da rede. Na tabela 5 so apresentados os resultados mdios do segundo treinamento realizado com as redes TDNN, utilizando o filtro Wavelet. Como ocorreu nos experimentos com a rede MLP, a utilizao do filtro Wavelet melhorou os resultados

apresentados pela rede neural artificial. No caso das redes TDNN esta melhora foi considervel. NA base de gases o melhor resultado dos experimentos sem o filtro Wavelet foi um erro mdio de classificao de 12.17% ( tabela 4). Nos experimentos utilizando este filtro o erro mdio de classificao foi de 0.75%, obtido pela topologia com 8 unidades de processamento na camada intermediria. Na base de vinhos o erro de classificao obtido com a utilizao do filtro Wavelet (0.70% de erro - tabela 4) manteve-se estvel em relao aos resultados obtidos sem a utilizao deste filtro (0.70% tabela 5).

Realizamos o teste de hiptese para verificar se esta melhora estatisticamente se confirma. Neste teste verificamos que a performance mdia das redes TDNN fazendo uso da anlise Wavelet melhor que a das mesmas redes no utilizando este tipo de pr-processamento. 4.3 Rede Feature-weighted Detector Nos experimentos realizados, para cada uma das parties, os aspectos observados nas 30 execues, bem como os valores de mdia e desvio-padro so apresentados na tabela 6. Nesta tabela, s representa a nebulosidade no agrupamento, a representa a taxa de aprendizado temporal e b a taxa de aprendizado. A letra x representa os atributos dos padres de odores (sensores) e w a mdia das conexes de pesos.

A rede FWD obteve dois resultados bem distintos na classificao dos dois tipos de odores. Na classificao da base de vinhos obteve uma boa generalizao para o problema, um erro mdio de classificao de 5.09% nas trs parties de dados. Porm, esta afirmao no se verifica na classificao dos dados da base de gases, o erro mdio de classificao obtido pela abordagem neuro-difusa foi de 22.18% (tabela 6). Um erro relativamente alto se considerarmos as abordagens previamente apresentadas. Em anlises posteriores verificou-se que a rede apresenta dificuldades em separar os gases Etano e Metano, indicados na Anlise de Componentes Principais como classes muito prximas. Isto pode caracterizar uma deficincia da rede FWD em tratar dados no-linearmente separveis. 4.3.1 Seleo de Atributos. No modelo FWD a seleo de atributos realizada a partir dos valores das conexes de pesos obtidas durante a fase de treinamento da rede. Tais valores representam o grau de significncia dos atributos para cada uma das classes. Para verificar o desempenho do mtodo de seleo de atributos, so realizados dois experimentos. No primeiro experimento, apresentado na tabela 6, a rede foi treinada com os todos os atributos (representando os sensores) da base de dados de odores. Considerando estes resultados, pode-se observar para a base de vinhos: (1) os atributos x3, x4, e x6 possuem pequena contribuio na formao dos agrupamentos das classes 1 e 3; e (2) a contribuio destes atributos para a classe 2 pode ser desempenhada pelos atributos x1, e x2. Na anlise dos vetores de pesos da base de gases: (1) os atributos x2, x3 e x5 possuem pequena contribuio na formao dos agrupamentos das classes 3 e 5, e o atributo x4 possui pequena participao nos agrupamentos das classes 1 e 4; (2) a contribuio dos atributos x2, x3, x4 e

x5 para as classe 1, 3 e 4 pode ser desempenhada pelos demais atributos, que apresentaram grande contribuio na formao dos agrupamentos destas classes. No segundo experimento, os atributos da base de vinhos x2, x3 e x6 e da base de gases x2, x3, x4 e x5 foram excludos e a rede foi novamente treinada somente com os atributos restantes (x1, x2 e x5 vinhos e x1, x6, x7 e x8 gases). No treinamento, foi utilizada a mesma configurao de parmetros do primeiro experimento. Na base de vinhos a mdia do erro de classificao foi de 2.26%, um erro menor que o obtido nos experimentos com 6 atributos. Na base de gases o erro se manteve, um erro mdio de classificao de 20.16%. Este resultado comprova a pequena relevncia dos atributos removidos na formao dos agrupamentos. Os sensores indicados como de menor relevncia foram: base de vinhos - cido Nitrobenzeno Sulfnico - NBS, cido P-toluenosulfnico - PTSA e cido Canforsulfnico - CAS; base de gases - Octil-sulfonato de Sdio - OSA, cido Nitrobenzeno Sulfnico - NBS, Antraquinona Sulfato de Sdio - ASA e cido P-toluenosulfnico - PTSA. 4.3.2 Consideraes. A fim de verificar a eficincia da seleo de atributos da rede FWD, foram novamente realizados dois experimentos com os demais modelos apresentados neste trabalho. Em um dos experimentos os classificadores foram treinados com todos os atributos da base de dados e no outro foram excludos os atributos indicados pela rede FWD como de menor relevncia para a formao dos agrupamentos de dados. A tabela 7 apresenta o teste estatstico realizado com os resultados mdios destes experimentos. A hiptese nula (H0) a de que os classificadores possuem o mesmo desempenho com e sem os atributos selecionados. A hiptese alternativa (H1) a de que os classificadores possuem desempenhos diferentes.

A tabela 7 apresenta os resultados do teste de Wilcoxon para amostras emparelhadas, com nvel de significncia de 5%. Os resultados comprovam a hiptese de que a performance dos modelos sem os referidos atributos to boa quanto o das redes treinadas com todos os atributos das bases de dados. 4.4 Rede Evolving Fuzzy Neural Network Nesta seo sero apresentados os resultados obtidos nos 4 experimentos realizados com a rede EFuNN para cada uma das bases de dados. Na tabela 8 - simulao 1, so apresentados os resultados da primeira simulao, onde uma arquitetura EFuNN inicializada sem nenhuma regra treinada com os padres de odores das 30 parties formadas com cada uma das bases. Neste experimento, optou-se por no realizar poda ou agregao sobre os nodos de regras criados na camada de regras durante o treinamento.

Como pode ser visto, a rede EFuNN conseguiu uma boa generalizao para o problema de classificao de odores. O erro de mdio de classificao obtido pelas 30 parties foi de 0.15% e 0.88% para as bases de vinhos e gases, respectivamente. Uma taxa de erro extremamente baixa, considerando os resultados obtidos pelos demais classificadores. No segundo experimento, apresentado na tabela 8 - simulao 2, a arquitetura EFuNN tambm foi inicializada sem nenhuma regra. Todos os nodos de regras foram criados dinamicamente durante o treinamento da rede. Porm, durante este treinamento realizada a poda dos nodos de regras que estiverem fora do limiar de ativao estabelecido. Com a aplicao da tcnica de poda, a quantidade de nodos de regras na rede diminuiu e por conseqncia a quantidade de regras extradas da rede neuro-difusa tambm decresceu. No experimento anterior a quantidade mdia de regras foi de 345 e 134 regras, est mdia caiu para 17 e 79 regras, respectivamente para as bases de vinhos e gases. A fim de verificar se o mecanismo de agregao poderia melhorar estes resultados (diminuir o erro de classificao em relao segunda simulao e diminuir a quantidade de regras extradas em relao primeira simulao) e comprovar a capacidade da rede em aprender incrementalmente de maneira on-line. Neste experimento (tabela 8 - simulao 3) uma nova arquitetura EFuNN foi criada. Nesta arquitetura foram inseridas 10 regras, remanescentes de treinamentos prvios e novos padres de odores foram apresentados a esta rede. Este experimento nos permite verificar se o modelo realmente pode aprender ou se adaptar a novos padres, sem perder ou squecer" o conhecimento previamente adquirido. Para isso, durante o treinamento da rede, foram utilizados os procedimentos de poda e agregao. Nesta simulao, na base de gases, houve uma melhora em relao aos resultados apresentados nos experimentos anteriores. O erro mdio de classificao das 30 parties testadas foi de 2.82% e a quantidade mdia de regras extradas foi de 102 regras. Para a base de vinhos os resultados se mantiveram, pois o nmero de regras na simulao 2 j era baixo (17 regras - tabela 8). Vale ressaltar que este experimento possibilitou verificar alm do treinamento on-line, a insero de regras na topologia da rede. Pois, as regras utilizadas como conhecimento inicial na simulao, eram provenientes de um treinamento prvio e foram inseridas em uma arquitetura vazia de modo automtico. Assim, o conhecimento pode ser inserido na rede EFuNN de duas formas distintas: a partir do treinamento da rede com novos exemplos ou com a insero de regras previamente adquiridas. O quarto experimento da srie de simulaes realizadas com a rede EFuNN visa verificar as mais interessantes de suas funcionalidades para o reconhecimento de odores: o treinamento on-line e a insero dinmica de classes na arquitetura da rede. A simulao foi realizada da seguinte forma: a partir de uma arquitetura previamente treinada com quatro gases e dois vinhos, escolhidos de forma aleatria, foram apresentados rede exemplos de um quinto gs e uma terceira amostra de vinho. Nenhum dos exemplos do quinto gs ou da terceira safra de vinho foi apresentado rede na fase anterior de treinamento. A incluso desta nova classe de exemplos no treinamento da rede fora o modelo a se adaptar a estes novos padres e englobar o novo odor automaticamente em sua topologia. Desta forma, a rede foi primeiramente treinada com os gases: Butano, Etano, Monxido de Carbono e Metano. Na segunda etapa do treinamento (insero do quinto gs) o gs Propano foi apresentado rede. Na base de vinhos primeiramente foram apresentadas amostras das Safras de 95 e 96 e posteriormente da Safra de 97. Como pode ser verificado na tabela 8 - simulao 4, o fato da terceira amostra de vinho e do quinto gs ter sido apresentado rede posteriormente ao treinamento dos demais odores, no prejudicou em nada a generalizao do

modelo. Os testes na rede foram realizados com as trs safras de vinho e os cinco gases, simultaneamente. O erro mdio de classificao desta simulao foi de 0.32% e 0.66%, porm a no utilizao das tcnicas de poda ou agregao pode ser percebida pela grande quantidade de regras extradas da rede. 5 CONSIDERAES FINAIS A construo de dispositivos que simulem o comportamento do sistema olfativo biolgico uma rea em expanso. Muitas pesquisas esto sendo despendidas com a finalidade de simular a percepo humana. A maioria dos esforos visa refletir nos dispositivos eletrnicos a capacidade humana de perceber o mundo na forma de cinco sentidos ou at mesmo estender nossas potencialidades sensoriais. O presente trabalho est contextualizado na construo de narizes artificiais, dispositivos eletrnicos cuja necessidade em diversas aplicaes indiscutvel. O foco principal do artigo foi construo de sistemas de reconhecimento de padres para narizes artificiais, buscando tcnicas que apresentem funcionalidades e resultados significativos na classificao de sinais de odorantes. Foram abordados sistemas de reconhecimento de padres como a rede Multi-Layer Perceptron (Rumelhart et al., 1986), a rede Time Delay Neural Network (Lang e Hilton, 1988) e abordagens hbridas, como as redes Feature-weighted Detector (Li et al., 2002) e Evolving Fuzzy Neural Network (Kasabov, 1998). Alm dos classificadores, foi avaliada a utilizao da Transformada Wavelet (Daubechies, 1988) como filtro para reduo do rudo inerente a captao do estmulo odorante e como mtodo de compresso do sinal proveniente do sistema sensor. Nos resultados obtidos com as arquiteturas conexionistas, a rede TDNN confirmou sua superioridade em relao s redes MLP. Quando aliada ao mtodo de pr-processamento com o filtro Wavelet a rede TDNN obteve um erro mdio de classificao de 0.70% e 0.75%, enquanto a rede MLP obteve um erro mdio de 9.47% e 11.5% sobre o conjunto de teste, nas bases de vinhos e gases respectivamente. Dentre as arquiteturas hbridas verificadas, a rede FWD apresentou um desempenho de classificao baixo, em relao s demais abordagens investigadas na classificao da base de gases. A rede FWD apresentou um erro de classificao mdio de 22.18%. Na classificao da base de vinhos ela obteve um bom desempenho, um erro de classificao de 5.09% sobre o conjunto de teste. Apesar do baixo desempenho sobre a base de gases, o mtodo de seleo de atributos demonstrou excelentes resultados em ambas as bases. Estes resultados podem ser comparados aos obtidos com a tcnica de Anlise de Componentes Principais, na indicao dos atributos (ou sensores) mais relevantes na classificao dos odores. Com a utilizao do mtodo de seleo de atributos da rede FWD foi possvel identificar os sensores do nariz artificial que apresentam maior relevncia na classificao dos odores investigados. Tambm foi possvel diminuir o tamanho da base de dados e conseqentemente a complexidade da tarefa de classificao dos odores, visto que esta diretamente proporcional ao nmero de sensores utilizados na deteco dos odores. Apesar do promisor resultado na indicao dos atributos mais relevantes para classificao dos odores, o mtodo de seleo de atributos da rede FWD apresenta uma deficincia, a grande subjetividade para a escolha dos atributos menos relevantes. A rede FWD tambm permite a extrao de regras difusa de sua arquitetura, porm somente pode ser extrada uma regra explicativa difusa por classe, o que prejudica a interpretao das regras em bases de dados com uma grande quantidade de atributos. A rede EFuNN por sua vez, apresentou resultados significativos na classificao dos padres de odores, obteve um erro mdio de classificao de 0.1% e 0.88% para as bases de vinhos e gases, respectivamente. Alm da boa performance de generalizao, existem outras caractersticas que a tornam mais adequada em relao as demais abordagens apresentadas, podem ser destacadas: a no necessidade de pr-processamento nos dados; seu mtodo de aprendizagem incremental e on-line, que permite a rede aprender novos odores durante a operao do nariz artificial; a possibilidade de insero, extrao e agregao de conhecimento, os quais possibilitam que o conhecimento adquirido por um nariz artificial possa ser repassado a outros dispositivos de forma extremamente simples; e a extrao de regras de classificao difusas, explicando o conhecimento adquirido pela rede durante o aprendizado. Considerando mtodos estatsticos no-paramtricos de comparao, com nvel de significncia de 5%, as melhores abordagens para a classificao de odores avaliadas neste trabalho foram as redes TDNN utilizando o filtro Wavelet e as redes EFuNN. Futuras pesquisas poderiam considerar outras funcionalidades na construo dos narizes artificiais, como a aquisio automtica de conhecimento, configurao automtica dos dispositivos, praticidade e a versatilidade dos narizes artificiais.

AGRADECIMENTOS Os autores agradecem ao CNPq, CAPES e FINEP (agncias brasileiras de fomento pesquisa) pela ajuda financeira. REFERNCIAS Abraham, A. e Nath, B. (2002). Hybrid intelligent systems design: A review of a decade of research, Technical report, Monash University. [ Links ] Barbosa, M. S. S., Ludermir, T. B., Santos, F. L., Souza, J. E. G., Santos, M. S. e Melo, C. P. (2002). Uma rbf para a classificao de gases da indstria petrolfera, Proceedings do VII Simpsio Brasileiro de Redes Neurais, pp. 130 135. [ Links ]