Escolar Documentos
Profissional Documentos
Cultura Documentos
GTM Mapeamento Topogrfico Gerativo uma ferramenta da Minerao de Dados e um modelo algortmico/computacional adaptativo e o uso desse modelo se aplica na recuperao de informao (representao, armazenamento e acesso aos dados).
O que GTM?
O modelo GTM (BISHOP, SVENSN & WILLIAMS, 1998) um modelo que executa um mapeamento paramtrico no linear de um espao L-dimensional de variveis (chamadas latentes) para um espao D-dimensional de dados de entrada onde, normalmente, L<D. Este mapeamento define um subespao S (contido no espao de entrada) que representa o espao de variveis latentes segundo a transformao y(x,W), a qual mapeia pontos x do espao latente para pontos v no espao de dados, como ilustrado na Figura 5 para o caso em que o espao latente reside em R (L=2) e o espao de dados, em R (D=3).
Como ?
Cada ponto do espao latente (X-espao, esquerda) levado ao espao de dados (Vespao, direita) atravs de um mapeamento paramtrico no linear y(x,W), o qual define um subespao S contido no espao de dados. Cada ponto pertencente a S resultante da aplicao de y(x,W) sobre um ponto pertencente ao X-espao. Assim, a transformao y(x,W) leva um ponto xa residente no espao latente e definido pelas suas coordenadas (x1(a), x2(a)), para um ponto y(xa,W), pertencente ao espao S e definido por suas coordenadas (v1(a), v2(a), v3(a)) no espao de dados. A hiptese feita pelo modelo GTM a de que o comportamento do conjunto de dados no espao Ddimensional pode de fato ser expresso por um conjunto menor de atributos 2 (as variveis latentes) atravs de um mapeamento paramtrico no linear y(x,W). Uma aproximao para esse raciocnio imaginar que, embora a dimenso do conjunto de entrada possa ser elevada, muitas das variveis so correlacionadas entre si, resultando num conjunto potencialmente mais simples que pode representar o comportamento dos dados no espao original (BISHOP, SVENSN & WILLIAMS, 1998). Os modelos baseados nesta ideia so chamados modelos de variveis latentes (BARTHOLOMEW, 1987). O mapeamento realizado pelo GTM utiliza-se normalmente de um modelo de probabilidade baseado em mistura de gaussianas, o qual adaptado pelo algoritmo EM (Expectation Maximization) (DEMPSTER, LAIRD & RUBIN, 1987; BISHOP, SVENSN & WILLIAMS, 1996, 1998; SVENSN, 1998).
de caractersticas (alta dimensionalidade) Utilizao de aprendizado no supervisionado; Capacidade de realizar projeo de dados, reduzindo assim a dimensionalidade do conjunto de dados Capacidade de realizar reduo de dados, diminuindo a quantidade de dados exibidos e pela ferramenta; Possibilidade de avaliao grfica dos resultados obtidos; Algoritmos relativamente simples e rpidos; Capacidade de generalizao dos modelos, de forma a possibilitar a representao de dados no disponveis no momento do treinamento.
Referncias Bibliogrficas
http://parati.dca.fee.unicamp.br/media/Attachments/ courseIA368Q1S2012/Monografia/zuchini_mest.pdf http://www.anchieta.br/unianchieta/revistas/ubiquid ade/Site/ubiquidade/pdf/Artigo1.pdf CPBR10 - Software Livre. Oficina: Data Mining Weka (http://youtu.be/sDD8nsZ1fQo)