Você está na página 1de 27

.

Departamento de Engenharia e Cincias do Mar


Licenciatura em Eng. Informtica e Computao Disciplina: Teoria de Computao

UTILIZAO DAS REDES NEURONAIS EM DATA MINING

Elaborado Por:

Docente:

Adilson Gomes Dias Silva Edson Carlos Silva Andrade Roni Ednei Almeida Lima

Paulo

ndice
ndice..............................................................................................................II RESUMO.........................................................................................................1 INTRODUO..................................................................................................1 .......................................................................................................................1 Redes neuronais.............................................................................................2 Redes neuronais Biolgicas............................................................................2 Caractersticas da rede neuronal artificial......................................................3 Aplicaes de Redes Neuronais Artificiais em Bioinformtica........................4 Anlise de Sequncias de Genomas...............................................................5 Reconhecimento de Sinais ...........................................................................5 Exemplos de sinais a serem reconhecidos em sequncias de nucleotdios:. .5 Identificao de Assinaturas ..........................................................................5 Identificao de Repeties e de Regies de Baixa Complexidade ...............6 Outras Aplicaes:..........................................................................................6 Modelos de Redes Neuronais.........................................................................7 Perceptron Multi-Camadas ............................................................................7 Redes de Kohonen ........................................................................................7 Redes de Hopfield..........................................................................................8 Data Mining ...................................................................................................8 Tecnologia de Data Mining.............................................................................8 Que dados o Data Mining avalia?...................................................................9 Aplicaes do Data Mining...........................................................................10 II

Customer Relationship Management (CRM).................................................10 Suporte Deciso........................................................................................10 Finanas.......................................................................................................10 Investigao Cientfica.................................................................................11 Governo........................................................................................................11 Energia.........................................................................................................11 Administrao em Alto Nvel........................................................................12 Outras Aplicaes.........................................................................................12 Exemplo Prtico..........................................................................................12 PRW Uma Ferramenta para Data Mining...................................................13 Como Carregar (importar) a base de dados.................................................14 Como criar um experimento.........................................................................14 Como seleccionar as variveis de entrada e de sada..................................15 Como seleccionar o conjunto para treinamento e para teste.......................15 Como monitorar os experimentos................................................................15 Como configurar um modelo........................................................................16 Como especificar os parmetros do algoritmo de treinamento....................17 Como especificar os parmetros de configurao dos relatrios.................18 Como executar um experimento (treinamento da rede)..............................18 Como verificar o desempenho do modelo....................................................19 Como preparar a rede para operao configurando uma funo..............19 Como usar a rede sobre novos dados..........................................................20 Como Salvar um Experimento......................................................................20 Como sair do PRW........................................................................................20 ....................................................................................................................21 Concluso.....................................................................................................21 Referencias .................................................................................................22

III

IV

RESUMO
Este trabalho tem por objectivo dar-nos a conhecer de uma maneira mais profunda a utilizao das redes neuronais em uma data mining na qual abordaremos os aspectos fundamentais destas tcnicas e ferramentas no processo de tomada de deciso.

INTRODUO
As redes neuronais surgiram por volta dos anos 50, no tempo em que tambm surgiram os primeiros computadores, baseadas na actividade neuronal humana, definindo componentes lgicos similares aos neurnios naturais. Um dos primeiros conceitos que surgiram sobre neurnio era de uma unidade de processamento que recebia vrios estmulos como entradas e gerava um sinal mediante o resultado do somatrio destes estmulos. Um dos primeiros usos que se fez das redes neuronais foi no desenvolvimento de software de reconhecimento de caracteres. O grande nmero de documentos em papel que as empresas ainda hoje manipulam e o alto grau de informatizao que a maioria das corporaes possui actualmente, criaram uma demanda por estes softwares.

Redes neuronais Conceitos bsicos


Para melhor compreenso de uma rede neuronal artificial necessrio que se apresente tambm, o que so redes neuronais biolgicas.

Redes neuronais Biolgicas


Os sistemas neuronais biolgicos compem-se de clulas autnomas (neurnios). Estes so interligados por intermdio dos dentritos e terminaes dos axnios, formando uma cadeia de aproximadamente 100 bilhes. Tais ligaes so chamadas de Sinapse e so realizadas para transmitir os impulsos de um neurnio para outro, sem ligao fsica. Essa transmisso feita atravs das vesculas sinpticas que servem como acopladores entre os dentritos e terminais axoniais. A capacidade que uma Rede Neuronal Biolgica tem de aprender uma determinada tarefa acontece devido ao reforo ou enfraquecimento dessas ligaes, que so feitas atravs da repetio de um determinado estmulo de entrada. Quanto mais este estmulo ocorre mais o neurnio percebe que este um fato relevante. Passando assim, a dar uma maior nfase para tal. Isto faz com que, a cada acontecimento de uma mesma situao, o sistema nervoso j tenha a informao solidificada. De modo a gerar o que chamamos de movimentos involuntrios, ou reflexos.

Fig.1 Rede Neuronal Biolgica

Caractersticas da rede neuronal artificial


Uma rede neuronal artificial composta por vrias unidades de processamento, cujo funcionamento bastante simples. Essas unidades, geralmente so conectadas por canais de comunicao que esto associados a determinado peso e fazem operaes apenas sobre seus dados locais, que so entradas recebidas pelas suas conexes. O comportamento inteligente de uma Rede Neural Artificial vem das interaes entre as unidades de processamento da rede. A operao de uma unidade de processamento, proposta por McCullock e Pitts em 1943, pode ser resumida da seguinte maneira: Sinais so apresentados entrada; Cada sinal multiplicado por um nmero, ou peso, que indica a sua influncia na sada da unidade; feita a soma ponderada dos sinais que produz um nvel de actividade; Se este nvel de actividade exceder um certo limite (threshold) a unidade produz uma determinada resposta de sada.
3

A maioria dos modelos de redes neuronais possui alguma regra de treinamento, onde os pesos de suas conexes so ajustados de acordo com os padres apresentados. Em outras palavras, elas aprendem atravs de exemplos. Arquitecturas neuronais so tipicamente organizadas em camadas. Usualmente as camadas so classificadas em trs grupos: Camada de Entrada: onde os padres so apresentados rede; Camadas Intermedirias ou Escondidas: onde feita a maior parte do processamento, atravs das conexes ponderadas; podem ser consideradas como extractoras de caractersticas; Camada de Sada: onde o resultado final concludo e apresentado. Uma rede neuronal especificada, principalmente pela sua topologia, pelas caractersticas dos ns e pelas regras de treinamento.

Fig.2: Neurnio artificial proposto por McCulloch e Pitts.

Aplicaes de Redes Neuronais Artificiais em Bioinformtica


As Redes Neuronais Artificias podem ser aplicadas a diversos problemas da Bioinformtica, que costumam envolver reconhecimento de padres. Adequamse aos casos onde h necessidade de manipulao de conhecimento impreciso; alm de possibilitarem a construo de modelos a partir de exemplos depositados em bancos de dados.
4

Anlise de Sequncias de Genomas


Uma importante rea de aplicao da Bioinformtica a Anlise de Sequncias (nucleotdeos ou aminocidos), obtidas a partir do sequencialmente de genomas dos mais diversos organismos. Vrias abordagens podem ser utilizadas, como so apresentadas a seguir.

Reconhecimento de Sinais
Segundo o "Dogma Central da Biologia Molecular", toda informao gentica de um organismo est codificada em seu genoma. Portanto, a anlise de sequncias envolveria a identificao de padres associados a funcionalidades biolgicas. Como o Reconhecimento de Padres uma das principais aplicaes das Redes Neuronais Artificiais, interessante que estas sejam aplicadas em Bioinformtica, quando o problema envolver identificao de sinais biolgicos.

Exemplos de sinais a serem reconhecidos em sequncias de nucleotdios:


Promotores (incio da transcrio); Sinais de trmino de transcrio; Start codon (incio de traduo); Stop codons (trmino de traduo); RBS (ribossome binding site).

Identificao de Assinaturas
Um outro tipo importante de anlise a caracterizao da protena, com base nos motivos encontrados em sua sequncia de aminocidos.

Uma maneira de realizar esta classificao seria atravs da construo de Mapas Auto-Organizveis contendo os motivos de interesse.

Identificao de Repeties e de Regies de Baixa Complexidade


De maneira similar aos motivos em sequncias de aminocidos, tanto as repeties como as regies de baixa complexidade poderiam ser detectadas atravs dos Mapas Auto-Organizveis. Para tanto, estes problemas devem ser tratados como enquadramento de elementos em agrupamentos distintos: primeiramente, so formados conjuntos com elementos semelhantes (segundo uma medida adequada) e, em seguida, calcula-se a que grupo pertence a regio da sequncia a ser analisada.

Similaridade entre Sequncias


Uma forma no convencional de se fazer comparao entre sequncias (um "neuro-alinhamento"), seria a recuperao de sequncias armazenadas em Redes de Hopfield.

Anlise de Cromatogramas
Tambm atravs das Memrias Associativas, Redes de Hopfield, seria possvel analisar os cromatogramas gerados no processo de sequencias de DNA.

Outras Aplicaes:

Anlise de experimentos com expresses de genes (Micro Arrays) Predio de estrutura secundria de protenas
6

Anlise de regies extra-gnicas em DNA Extraco de relaes entre elementos de uma sequncia

Modelos de Redes Neuronais Perceptron Multi-Camadas


O Perceptron Multi-Camadas uma extenso do Perceptron simples, capaz de trabalhar com problemas no-linearmente separveis. Este avano foi possvel atravs da utilizao de, pelo menos, uma camada entre a entrada e a sada. Estas camadas intermedirias, conhecidas como camadas ocultas, trabalham como um reconhecedor de caractersticas, que ficam armazenadas nos pesos sinpticos. O algoritmo de treinamento mais utilizado o "Backpropagation", um tipo de Aprendizado Supervisionado por Correo de Erro.

Fig.3 : Exemplo de arquitectura de um Perceptron Multi-Camadas

Redes de Kohonen
Inspirada nos mapas corticais, a rede de Kohonen utiliza o Aprendizado Competitivo, onde os neurnios competem entre si para responder a um estmulo apresentado. Durante o aprendizado, formam-se agrupamentos de neurnios topologicamente organizados, onde cada grupo responsvel por responder a uma classe de estmulos.

Fig.4 : Exemplo de arquitectura da Rede de Kohonen

Redes de Hopfield
Tambm conhecida como Memria Associativa, a Redes Hopfield armazena padres que so recuperados a partir de estmulos de entrada. O armazenamento de tais padres realizado via Aprendizado Hebbiano. Uma caracterstica importante deste modelo a chamada recorrncia: as sadas ligam-se as entradas por um atraso de tempo; com efeito, a resposta da rede sempre depende de seu estado anterior.

Fig5: Exemplo de uma arquitectura da Rede de Hopfield

Data Mining Tecnologia de Data Mining


"Data Mining um processo de extraco e apresentao de informaes utilizveis, implcitas e recentes a partir de dados, que possam ser utilizadas para resolver um problema.... (Taurion, C.)
8

A sua funo principal a varredura de grandes quantidades de dados, a procura de padres e deteno de relacionamentos entre informaes gerando novos subgrupos de dados. Usado comummente em grandes bancos de dados. Por enquanto podemos pensar que Data Mining como um agregador e organizador de dados. A formao de subgrupos de dados feito pelo Data Mining atravs da execuo de algoritmos capazes de conhecer e aprender mediante a varredura dessas informaes. Baseado em sistemas de redes neuronais, esses dados so examinados e pensados, gerando uma nova informao associativa com outros dados. A formao de estatsticas tambm uma de suas funes. Nmeros estatsticos so gerados trazendo resultados comparativos e levando a uma tomada de deciso inteligente. gigantesco o resultado desse processamento, uma das mais fortes a formao de hipteses e principalmente regras de dados a serem apresentados ao usurio. Falaremos como isso exibodo um pouco mais para frente.

Que dados o Data Mining avalia?


Grandes corporaes no sobrevivem sem um perfeito sistema de gesto. Perfeito pelo motivo de que hoje em dia milhares de informaes so processadas diariamente. Na rotina de pequenas e mdias empresas essas informaes ficam perdidas e esquecidas. Esses sistemas de gesto armazenam em seus bancos de dados os acontecimentos do dia-a-dia: Stock, pedidos, compras, oramentos, contabilidade, financeiro, jurdico, ps-venda, relacionamento com cliente, vendas entre outros. Todos esses departamentos geram informaes independentes. A funo principal de um Business Intelligence trabalhar todo esse histrico de acontecimentos inseridos diariamente e garantir que no final das contas todos os dados sejam visualizados como um todo, trazendo informaes concretas, consistentes e decisivas, basicamente atravs da aco do Data Mining.

Aplicaes do Data Mining


O Data Mining pode ser utilizado num vasto campo de aplicaes e, embora se destaque em aplicaes comerciais e cientficas, tm surgido novas aplicaes relacionadas principalmente com as novas TI. De seguida, sero apresentados alguns exemplos de utilizaes.

Customer Relationship Management (CRM)


Para as empresas mais prioritrio manter os clientes do que angariar novos clientes. De facto, h estudos que apoiam essa estratgia. Nesta rea o Data Mining pode ajudar na obteno de conhecimento sobre o perfil dos clientes e na anteviso das suas necessidades. Desta forma, permite fornecer conhecimento que permita empresa a criao de novos servios, manter servios personalizados, bem como criar outros produtos e servios que permitam ou proporcionem a fidelizao dos clientes

Suporte Deciso
Os gestores tm que tomar decises que afectam o futuro da empresa. As decises tm por base previses do futuro, nomeadamente tendncias, preos, situao futura. O Data Mining pode fazer a diferena, fornecendo melhores previses, identificando segmentos de consumidores e padres de consumo, e ainda, outras ajudas importantes deciso

Finanas
10

Na rea das finanas tem sido aplicado o Data Mining para deteco de fraudes, anlise de crditos, previses, etc. O sector bancrio destaca-se nesta rea, pelo largo leque de aplicaes que vai desde o estudo dos comportamentos de utilizadores de cartes roubados e deteco dos mesmos.

Investigao Cientfica
Trata-se de uma rea onde existem bases de dados com enormes quantidades de informao, embora tambm haja situaes onde os dados disponveis so escassos. O uso de Data Mining vai desde a visualizao da informao at previso. Destaca-se a aplicao na medicina, na fase de diagnstico, na identificao das melhores terapias, na pesquisa de novas formas de tratamento, etc. Destaca-se, tambm, a aplicao na biologia como, por exemplo, na anlise do genoma humano

Governo
O governo dos EUA se utiliza do data mining j h bastante tempo para identificar padres de transferncias de fundos internacionais que se parecem com lavagem de dinheiro do narcotrfico. Data mining usado para identificar fraudes.

Energia

11

Previso de consumo e previso de falhas em sistemas de transmisso ou de distribuio so as duas aplicaes mais comuns, embora muitas outras tenham sido pesquisadas e difundidas na literatura.

Administrao em Alto Nvel


Depois do final da segunda guerra mundial a Pesquisa Operacional (P0) apareceu como ferramenta fundamental para a vitria das tropas contra as potncias do eixo. Com a pesquisa operacional foi possvel resolver matematicamente o problema de alocao ptima de recursos e isto vem sendo utilizado com grande sucesso em altos nveis de deciso at o presente momento. Cerca de cinqenta anos depois, apareceu o data mining. Suas potencialidades esto longe de serem imaginadas e no seria ousado esperar que no mundo globalizado possa vir a dar seus frutos como a PO deu no passado.

Outras Aplicaes
Recentemente, tem-se dado um grande destaque ao Text Mining, ou seja, na extraco de conhecimento de grandes volumes de dados sob a forma de texto. Outras aplicaes de interesse acrescido so: o Web Mining, a aplicao de Data Mining Web.O Biblio Mining, a descoberta de conhecimento em bibliotecas; e ainda, a descoberta de conhecimento em bases de dados multimdia.

Exemplo Prtico
12

(exemplo retirado do site http://www.apostilando.com/download.php?cod=2132&categoria=Banco%20de %20Dados)

Existem muitas tcnicas utilizadas pelo Data Mining, muitas delas desenvolvidas na disciplina Aprendizado de Mquina (Machine Learning, veja, por exemplo, Mitchell 1997). Vamos observar aqui apenas um pequeno exemplo prtico do que podemos utilizar com as expresses abstratas genricas que obtivemos. Uma dessas expresses nos diz que toda vez que encontramos a seqncia "AB", podemos inferir que iremos encontrar mais trs caracteres e isto completaria um "padro". Nesta forma abstrata ainda pode ficar difcil de perceber a relevncia deste resultado. Por isso vamos usar uma representao mais prxima da realidade. Imagine que a letra 'A' esteja representando um item qualquer de um registro comercial. Por exemplo, a letra 'A' poderia significar "aquisio de po" em uma transao de supermercado. A letra 'B' poderia, por exemplo, significar "aquisio de leite". A letra 'C' um indicador de que o leite que foi adquirido do tipo desnatado. interessante notar que a obteno de uma regra com as letras "AB" quer dizer, na prtica, que toda vez que algum comprou po, tambm comprou leite. Esses dois atributos esto associados e isto foi revelado pelo processo de descoberta de padres. Esta associao j nos far pensar em colocar "leite" e "po" mais prximos um do outro no supermercado, pois assim estaramos facilitando a aquisio conjunta desses dois produtos. Mas a coisa pode ir alm disso, bastando continuar nossa explorao da induo.

PRW Uma Ferramenta para Data Mining


Trata-se de um ambiente para concepo, construo e avaliao de modelos computacionais para data mining. A ferramenta possui diferentes
13

algoritmos do tipo supervisionado e do tipo no supervisionado. Dentre os algoritmos supervisionados encontram-se dois modelos neuronais, um MLP Multi Layer Perceptron, treinado com o algoritmo conhecido como backpropagation, e outro RBF Radial Basis Function, que usa gaussianas para fazerem o papel de funes de propagao. Todos os algoritmos podem ser utilizados para realizar tanto classificao como estimao (previso).

Como Carregar (importar) a base de dados


(os procedimentos a seguir consideram que sua base de dados esteja em uma planilha Excel) Abrir a planilha Excel com os dados do problema;

Na opo Edit da barra de ferramentas do PRW, escolha o comando create DDE links...;

Na primeira janela (Service) aparecero algumas opes de origem para

os dados, escolha a linha Excel;


Neste instante aparecero na janela do meio (Service Topics), as

planilhas existentes no arquivo Excel, escolha aquela que corresponder aos dados desejados;
Na janela da direita (Topic items) deve-se fornecer as linhas e colunas

que se deseja importar da planilha Excel. O formato depende da verso do Excel, seingls deve ser da forma: rxcy:rzcw (from row x column y to row z column w), se em portugus, da forma: lxcy:lzcw (da linha x coluna y at a linha z coluna w);

Como criar um experimento


Use a janela ExpMgr1 Setup Screen, j aberta no canto direito do vdeo Escolha e fornea um nome para o experimento Defina a actividade se classificao ou estimao de funo
14

Defina a opo de uso treinamento / teste / treinamento e teste / validao (seleccione a opo treinamento e teste).

Siga para a prxima etapa teclando Next

Como seleccionar as variveis de entrada e de sada

Na coluna central spreadsheet variables aparece uma lista com todas as variveis (colunas) da planilha de dados. Com o cursor marque as variveis de entrada e, usando a seta da esquerda, mova-as para a coluna apropriada (esquerda). Faa mesmo com as variveis de sada, movendo-as para a coluna da direita.

Em caso de dvida, recorra ao help.

Siga para o prximo passo do experimento.

Como seleccionar o conjunto para treinamento e para teste


(os conjuntos devem ser disjuntos)

Escolha a quantidade de variveis para os conjuntos de treinamento (70% um bom numero) e teste (30%). Escolha o mtodo de seleco aleatrio para o conjunto de treinamento e o restante para teste uma boa opo. Se o problema de classificao, voc pode dar uma olhada na distribuio final das classes para ambos os conjuntos treinamento e teste (show class count)

Em caso de dvida, recorra ao help.

Siga para o prximo passo do experimento.

Como monitorar os experimentos


Voc se encontra agora na janela Control Experiments Screen a janela onde todos os modelos que voc criar e experimentos que realizar estaro presentes e sero executados. Possui quatro regies distintas;
15

Na regio superior esquerda aparece um rectngulo com a indicao dos diferentes modelos (prottipos) criados. Na parte superior direita aparecem informaes sobre a execuo de um Na parte inferior esquerda aparece uma barra de comandos com as opes de criar um novo modelo (o primeiro j est automaticamente

experimento qualquer.

criado para voc),

Abrir um modelo existente, copiar um modelo existente, eliminar um modelo ou activar um dos modelos existentes para ser usado no prximo experimento.

Na regio inferior direita aparece o estado do experimento seleccionado

(para seleccionar um modelo basta clicar sobre a figura do mesmo).


Voc pode executar, suspender a execuo temporariamente, ou parar a

execuo.

Como configurar um modelo


Clique duas vezes sobre a figura do modelo desejado na regio superior

esquerda da janela de monitor amento dos experimentos.


Uma outra janela (Experiment # Configuration) vai se abrir ela vai

permitir que voc configure seu modelo.


Esta janela apresenta trs abas: Algorithm, Experiment Parameters e

Reporting.
Na aba Algorithm voc definira o algoritmo a ser implementado. Observe

que a direita aparece uma breve explicao sobre cada algoritmo que seleccionar.
Dentre os algoritmos existentes, aquele de interesse para este curso o

da rede neural do tipo MLP Multi Layer Perceptron, treinada com o algoritmo backpropagation.
Escolha agora a aba Experiment Parameters, observe que duas opes

j esto seleccionadas por default normalizao das entradas e configurao do algoritmo de treinamento, so as que voc deve usar.

16

Para configurar o algoritmo de treinamento, clique duas vezes sobre a

opo configure algoritm na janela que est aberta. Na mesma janela, direita,
Vai aparecer um conjunto de opes sob o ttulo Back Propagation /

MLP Parameters.

Como especificar os parmetros do algoritmo de treinamento

A meia janela Back Propagation / MLP Parameters subdividida em quatro quadrantes no canto superior esquerdo voc define o nmero de camadas internas (hidden layers) que deseja para o seu modelo.

No canto inferior esquerdo voc define o nmero de elementos de processamento (neurnios) que deseja colocar em cada camada escondida escolhida anteriormente, observe que o nmero de neurnios das camadas de entrada e de sada j se encontra definido. Isto ocorre em funo do nmero de variveis que voc definiu no incio do experimento. Voc tambm pode definir se as variveis de sada devem ou no ser normalizadas.

Nos casos de aproximao de funes a sada normalizada o default. J nos casos de classificao de padres, o software automaticamente aloca um nmero de sadas para a rede igual ao nmero de variveis de sada do problema.

No canto superior direito voc define a taxa de aprendizado, a taxa de momento a taxa de ajuste dos pesos. A escolha de uma taxa de aprendizado e de momento pode ser crtica para a capacidade de aprendizado (convergncia) da rede. Inicie a primeira com um valor relativamente alto (em torno de 0.5), e a segunda com um valor baixo (em torno de 0.2 ou 0.1). Durante o treinamento voc pode parar o algoritmo (pause), alterar estes valores e continuar o treino. A taxa de ajuste dos pesos pode ser a cada padro (per pattern) ou a cada conjunto completo de padres (per epoch).

17

No canto inferior direito voc define as condies de parada do treinamento que podem ser: por tempo; por nmero de ciclos; por percentual do erro ou pelo valor absoluto do erro mdio quadrtico RMS. O mais indicado usar um critrio de parada combinando por exemplo, o nmero de ciclos e o erro mdio quadrtico (nos casos de aproximao de funes) ou percentual do erro (nos casos de classificao de padres). Outra opo oferecida nesta regio o critrio da escolha pelo melhor modelo verificado a cada nmero de ciclos que voc determinar (deixe esta opo inicialmente desligada).

Como especificar os parmetros de configurao dos relatrios


Voc deve ir para a opo Reporting da janela Experiment #

Configuration observe que voc pode definir uma variedade de diferentes opes para acompanhamento do treinamento e para verificao dos resultados do teste.
Escolha a opo detailed report que ela selecionar automaticamente

um conjunto de opes que melhor lhe atender em funo do tipo de experimento que est realizando (classificao ou estimao).
Clique agora em Apply e a seguir em OK, voltando para a janela de

monitor amento do experimento.

Como executar um experimento (treinamento da rede)


Uma vez que tenha seleccionado todos os parmetros, voc est pronto para iniciar o treinamento da rede clicando no boto start. Ao iniciar o treinamento, no quadrante dos modelos, ao lado do modelo que estiver usando (seleccionado), aparecer um rectngulo com o formato de um relatrio. Clique duas vezes nesta figura e uma outra janela, de acompanhamento do treino, se abrir.

18

Esta janela apresenta uma barra de comandos com as opes: report, T, auto, manual, options e help. Report permite voc escolher o tipo de relatrio que deseja visualizar, dentre os tipos que tiver previamente seleccionado para serem gerados. T permite voc mudar a apresentao da evoluo do treinamento do modo numrico para o modo grfico. Auto retorna a apresentao para o modo numrico. Options oferece funes para voc definir formas de visualizar o display grfico. Concludo o treinamento voc deve verificar os relatrios com o desempenho alcanado.

Como verificar o desempenho do modelo

Na opo report voc pode avaliar o resultado do teste (test summary) atravs da matriz de confuso (no caso de classificao) ou do padro das sadas (em qualquer dos casos classificao ou estimao).

No relatrio experiment summary voc encontra a opo summary for this report, Que lhe permite realizar a anlise de sensibilidade sobre as variveis de entrada.

Esta anlise possibilita identificar as variveis mais relevantes para o problema.

Uma vez que voc opte por realizar a reduo de dimensionalidade do problema, ser necessrio treinar a rede novamente com o novo conjunto de variveis de entrada e avaliar o desempenho com o modelo original, completo.

Como preparar a rede para operao configurando uma funo

19

A rede, aps treinada, deve ser transformada em uma funo para que possa ser aplicada a outros dados: Na barra de ferramentas tecle na opo build uma janela se abrir com a opo default j estabelecida build function based on an experiment, tecle ok e siga adiante.

Na nova janela que se abre, voc precisa apenas definir o nome que deseja dar para identificar a rede (funo) que acabou de implementar, por exemplo, mlp_teste1.

Como usar a rede sobre novos dados

Voc precisa abrir uma nova planilha de dados e estabelecer os links com a planilha do Excel que deseja carregar ou importar os dados, caso j estejam no formato do PRW (.dat).

Escolha agora uma coluna vazia na nova planilha, clique no cabealho da coluna, por exemplo V33, no espao para comandos situado na barra de ferramentas do PRW, aparecer o rtulo da coluna, no caso v33.

Escreva a partir deste rtulo o comando para utilizar a funo criada na fase anterior, no caso deste exemplo, o comando ficaria: v33=mlp_teste1(v2:v23).

Os argumentos dentro dos parnteses representam as colunas onde esto os dados de entrada. Tecle enter e observe que, a partir da coluna especificada v33, sero acrescentadas as sadas correspondentes para as novas entradas fornecidas.

Como Salvar um Experimento

Use a opo file da barra de ferramentas e em seguida a opo save ou save as.

Como sair do PRW


20

Use a opo file da barra de ferramentas e em seguida a opo exit, salvando ou no o arquivo com os experimentos j realizados.

Concluso
Na elaborao deste trabalho, fomos confrontados com um tema bastante complexo, contudo a finalidade e os objectivos deste trabalho foram atingidos, revelando-se um trabalho muito absorvente e estimulante, com consequncias positivas no processo de auto-aprendizagem, sobretudo pela sua complexidade ficando assim com uma boa base de conhecimento do
21

funcionamento de uma data mining usando redes neurnais no processo de

tomada de decises, conhecendo tcnicas e ferramentas do mesmo nas diversas reas da sua til utilizao

Referencias
Angelo Oliveira Moura*, Diego da Silva Andrade*, Wagner kazumitsu Kikuchi* Inteligncia Artificial Aplicada no Auxlio a Tomadas de Decises na rea de Sade- Disponivel em : http://pt.scribd.com/doc/55904855/293-InteligenciaArtificial-Aplicada-No-Auxilio-a-Tomadas-de-Decisoes-Na-Area-de-Saude. Alessandra Marchiori Oliveira- Aplicao de Algumas Tcnicas de Data Mining em Bancos de Dados utilizando o Weka- Disponvel em:
22

http://materdei.ceicom.com.br/arquivos/Aplica%C3%A7%C3%A3o%20de %20Algumas%20T%C3%A9cnicas%20de%20Data....pdf Antonio Carlos Gay Thom-REDES NEURAIS - UMA FERRAMENTA PARA KDD E DATA MINING- Disponivel em http://pt.scribd.com/doc/50137681/apostila-kdd-mbi Tarciso Cabral - Redes Neurais- Disponvel em: http://amigonerd.net/trabalho/405-redes-neurais

Armando Jorge Ribeiro da Cruz - Data Mining via Redes Neuronais

Artificiais e Mquinas de Vectores de Suporte Disponvel em :


http://repositorium.sdum.uminho.pt/handle/1822/8181 Modelos de redes Neurais disponvel em http://www.lncc.br/~labinfo/tutorialRN/frm1_arquitetura.htm

23

Você também pode gostar