O documento discute redes neurais artificiais, incluindo o algoritmo de retropropagação do erro e aprendizado por reforço. Aborda também aprendizado supervisionado e não supervisionado, perceptrons, Adalines e redes de Kohonen.
O documento discute redes neurais artificiais, incluindo o algoritmo de retropropagação do erro e aprendizado por reforço. Aborda também aprendizado supervisionado e não supervisionado, perceptrons, Adalines e redes de Kohonen.
O documento discute redes neurais artificiais, incluindo o algoritmo de retropropagação do erro e aprendizado por reforço. Aborda também aprendizado supervisionado e não supervisionado, perceptrons, Adalines e redes de Kohonen.
Questão 1) Redes Neurais Artificiais são modelos matemáticos com
estruturas semelhantes a neurônios biológicos que possuem capacidade computacional de generalização e aprendizado. A estrutura de processamento é uma rede de unidades que imita o funcionamento da rede de neurônios. Esse sistema é composto de diversas unidades simples que trabalham paralelamente e distributivamente. Seu processo de aprendizagem é por reforço, a cada nova interação seu aprendizado é reforçado e melhora gradualmente. Questão 2) O algoritmo de retropropagação do erro é o algoritmo de treinamento do Perceptron. Cada camada da rede tem uma função específica. A camada de saída recebe os estímulos da camada intermediária e constrói a resposta. O algoritmo de retropropagação de erro, é um algoritmo utilizado no treinamento de redes neurais multicamadas, e consiste em dois passos de computação: o processamento direto e o processamento reverso. No processamento direto, uma entrada é aplicada à rede neural e seu efeito é propagado pela rede, camada a camada. Durante o processamento direto, os pesos da rede permanecem fixos. No processamento reverso, um sinal de erro calculado na saída da rede é propagado no sentido reverso, camada a camada, e ao final deste processo os pesos são ajustados de acordo com uma regra de correção de erro. Questão 3) Durante o treinamento com o algoritmo backpropagation, a rede opera em uma sequência de dois passos. Primeiro, um padrão é apresentado à camada de entrada da rede. A atividade resultante flui através da rede, camada por camada, até que a resposta seja produzida pela camada de saída. No segundo passo, a saída obtida é comparada à saída desejada para esse padrão particular. Se esta não estiver correta, o erro é calculado. O erro é propagado a partir da camada de saída até a camada de entrada, e os pesos das conexões das unidades das camadas internas vão sendo modificados conforme o erro é retropropagado. As redes que utilizam backpropagation trabalham com uma variação da regra delta, apropriada para redes multi-camadas: a regra delta generalizada. A regra delta padrão essencialmente implementa um gradiente descendente no quadrado da soma do erro para funções de ativação lineares. Redes sem camadas intermediárias, podem resolver problemas onde a superfície de erro tem a forma de um parabolóide com apenas um mínimo. Questão 4) O Aprendizado de Máquina surgiu pela necessidade das pessoas de obter conhecimento acerca de um assunto específico. O único objetivo desse aprendizado é prever os resultados com base nos dados recebidos. Os tipos de Aprendizado de Máquina estão subdivididos em aprendizado supervisionado e não supervisionado. A aprendizagem não supervisionada entende que o conjunto de exemplos não está rotulado, então o sistema tenta classificar os conjuntos agrupando por semelhanças em determinadas classes. O aprendizado não supervisionado não é muito utilizado, já que, na prática, não é possível inferir rótulos e, para a maioria das aplicações existentes, é necessário que seja permitido classificar a amostra. Ou seja, os sistemas devem desenvolver suas próprias conclusões. Geralmente, é útil para a análise exploratória dos dados, mas não como algoritmo principal. Por outro lado, é muito útil quando é necessário agrupar ou encontrar associações dentro de um grande volume de dados. A aprendizagem supervisionada é realizada por meio do treinamento de dados categorizados (rótulos), ou seja, classificados. Esse tipo de algoritmo necessita de um conjunto de dados rotulados para fazer previsão de rótulos/classes em novos dados. Questão 5) O Perceptron é um classificar do tipo linear, pois o resultado da sua função de ativação é tal que a superfície de decisão forma um hiperplano, ou seja, para um dos lados está uma classe, para o outro, a outra. Enquanto o Perceptron ajusta os pesos somente quando um padrão é classificado incorretamente, o Adaline utiliza a regra Delta para minimizar o erro médio após cada padrão ser apresentado, ajustando os pesos proporcionalmente ao erro. Questão 6) As redes de Kohonen apresentam um treinamento não supervisionado e competitivo, visto que os algoritmos de adaptação se baseiam em uma espécie de competição global entre os neurônios. Dessa forma, os neurônios de saída iniciam uma competição entre si para disputarem qual será mais ativado pelos padrões de entrada. Além disso, essa rede apresenta um funcionamento que consiste basicamente em apresentar um padrão de entrada x, para que, em sequência, a rede procure uma unidade mais parecida com x. Durante esse processo, a rede aumenta a semelhança do neurônio escolhido e de seus vizinhos a um padrão determinado. Dessa forma, a rede em questão estabelece um mapa topológico no qual os neurônios que estão topologicamente próximos respondem de forma semelhante a padrões de entrada semelhantes. Este procedimento é efetuado proporcionalmente ao grau de similaridade, de modo que os envolvidos fiquem ainda mais próximos. O neurônio vencedor é aquele que apresenta o maior nível de ativação. Portanto, para que o treinamento possibilite a atualização ou aprendizado, é necessário que se utilize não somente o neurônio vencedor, mas todos os neurônios que se apresentam ao redor da vizinhança do mesmo. Como resultado, obtém-se um mapa discreto, no qual os dados de entrada formam agrupamentos. Os neurônios da camada de saída disputam entre si e os pesos são gerados baseados na distância apresentada não somente pelo ganhador, como também pelos neurônios ao seu redor, fator que implica na função do Chapéu Mexicano. Questão 7) Portanto, para que o treinamento possibilite a atualização ou aprendizado, é necessário que se utilize não somente o neurônio vencedor, mas todos os neurônios que se apresentam ao redor da vizinhança do mesmo. Como resultado, obtém-se um mapa discreto, no qual os dados de entrada formam agrupamentos. O esquema clássico da rede de Kohonen faz com que os neurônios da camada de saída disputem entre si e os pesos sejam gerados baseados na distância apresentada não somente pelo ganhador, como também pelos neurônios ao seu redor, fator que implica na função do Chapéu Mexicano. O modelo de Kohonen promove um aprendizado competitivo juntamente com uma auto-organização da rede neural, criando os mapas de atributos auto-organizáveis. Questão 8) Os elementos fundamentais de uma rede neural são: a função das unidades de processamento e cada unidade é caracterizada por três elementos básicos (um conjunto de conexões de entrada, um estado de ativação e um valor de saída); a topologia da rede e a estratégia ou algoritmo de aprendizagem. Questão 9) ART ou Teoria da Ressonância Adaptativa, desenvolvida inicialmente por Stephen Grossberg, em 1976. As redes neurais artificiais são redes que não precisam da exposição prévia de qualquer número de elementos do conjunto de dados para o seu treinamento. A principal característica dessa família de arquiteturas é a sua capacidade para formar agrupamentos (clusters), que permite identificar padrões desconhecidos. Existem três modelos: ART1: é capaz de aprender a categorizar padrões de entrada binários apresentados em ordem arbitrária; ART2: pode aprender a categorizar padrões de entrada analógicos ou binários; ART3 (ARTMAP): pode realizar uma busca paralela, ou teste de hipóteses, em códigos com reconhecimento distribuído. O processo de aprendizado da rede envolve três fases: reconhecimento, comparação e busca. Questão 10) A principal arquitetura de rede auto-organizada é a Rede de Kohonen. Para descrever os passos envolvidos com o processo de aprendizado competitivo utilizado na rede de Kohonen, considera- se uma estrutura neural constituída de apenas uma camada neural. A maioria das redes utilizadas em problemas com essa configuração se auto-organizam por meio de métodos de treinamento competitivos. Esses métodos têm a capacidade de detectar similaridades, regularidades e correlações entre os padrões do conjunto de entrada, agrupando-os em classes (clusters). Cada uma dessas classes possui então características particulares que estão relacionadas com situações e condições que regem o funcionamento do processo. A identificação destes clusters é importante para entendimento das relações entre os seus elementos constituintes e permite ainda identificar as funções de um componente ou amostra com base nos atributos dos outros elementos que fazem parte do grupo (cluster). As conexões laterais assumem aqui o papel de que um neurônio pode influenciar na resposta de saída produzida por outro neurônio. O princípio básico para o processo de aprendizado competitivo é a concorrência entre os neurônios, para o melhor ficará o ajuste de seus pesos, proporcionalmente aos valores do padrão de entrada buscando aperfeiçoamento para o próximo padrão a ser apresentado. Nesta circunstância, se todas as conexões laterais deste neurônio vencedor forem nulas (ausência de conexões laterais), então somente os seus pesos serão ajustados. No caso de haver valores para as conexões laterais com os seus vizinhos, então um ajuste proporcional a tais quantidades será também efetuado no vetor de pesos desses neurônios adjacentes. Para o aprendizado competitivo, existe a necessidade de se estabelecer uma regra que defina quem vai ser o neurônio vencedor, uma muito utilizada consiste em determinar o nível de proximidade existente entre o vetor de pesos de cada neurônio, frente ao vetor de entrada contendo os elementos da k-ésima amostra {x(k) }, a qual será apresentada nas entradas da rede. Uma métrica de proximidade normalmente usada é a distância euclidiana.