GTM Final

O que GTM?
GTM Mapeamento Topogrfico Gerativo uma ferramenta da Minerao de Dados e um modelo algortmico/computacional adaptativo e o uso desse modelo se aplica na recuperao de informao (representao, armazenamento e acesso aos dados).
O que GTM?
O modelo GTM (BISHOP, SVENSN & WILLIAMS, 1998) um modelo que executa um mapeamento paramtrico no linear de um espao L-dimensional de variveis (chamadas latentes) para um espao D-dimensional de dados de entrada onde, normalmente, L<D. Este mapeamento define um subespao S (contido no espao de entrada) que representa o espao de variveis latentes segundo a transformao y(x,W), a qual mapeia pontos x do espao latente para pontos v no espao de dados, como ilustrado na Figura 5 para o caso em que o espao latente reside em R (L=2) e o espao de dados, em R (D=3).
Como ?

Cada ponto do espao latente (X-espao, esquerda) levado ao espao de dados (Vespao, direita) atravs de um mapeamento paramtrico no linear y(x,W), o qual define um subespao S contido no espao de dados. Cada ponto pertencente a S resultante da aplicao de y(x,W) sobre um ponto pertencente ao X-espao. Assim, a transformao y(x,W) leva um ponto xa residente no espao latente e definido pelas suas coordenadas (x1(a), x2(a)), para um ponto y(xa,W), pertencente ao espao S e definido por suas coordenadas (v1(a), v2(a), v3(a)) no espao de dados. A hiptese feita pelo modelo GTM a de que o comportamento do conjunto de dados no espao Ddimensional pode de fato ser expresso por um conjunto menor de atributos 2 (as variveis latentes) atravs de um mapeamento paramtrico no linear y(x,W). Uma aproximao para esse raciocnio imaginar que, embora a dimenso do conjunto de entrada possa ser elevada, muitas das variveis so correlacionadas entre si, resultando num conjunto potencialmente mais simples que pode representar o comportamento dos dados no espao original (BISHOP, SVENSN & WILLIAMS, 1998). Os modelos baseados nesta ideia so chamados modelos de variveis latentes (BARTHOLOMEW, 1987). O mapeamento realizado pelo GTM utiliza-se normalmente de um modelo de probabilidade baseado em mistura de gaussianas, o qual adaptado pelo algoritmo EM (Expectation Maximization) (DEMPSTER, LAIRD & RUBIN, 1987; BISHOP, SVENSN & WILLIAMS, 1996, 1998; SVENSN, 1998).
Caractersticas do modelo GTM

Capacidade de operar com conjuntos volumosos de dados; Capacidade de operar com dados representados por um grande nmero
de caractersticas (alta dimensionalidade) Utilizao de aprendizado no supervisionado; Capacidade de realizar projeo de dados, reduzindo assim a dimensionalidade do conjunto de dados Capacidade de realizar reduo de dados, diminuindo a quantidade de dados exibidos e pela ferramenta; Possibilidade de avaliao grfica dos resultados obtidos; Algoritmos relativamente simples e rpidos; Capacidade de generalizao dos modelos, de forma a possibilitar a representao de dados no disponveis no momento do treinamento.
Para que serve?

GTM oferece recursos consistentes para anlise de dados, onde h variao de dimensionalidade, quantidade e tipo de dados disponveis (discretos, contnuos, binrios etc.). H uma grande variedade de bancos de dados disponveis(Glass, Ionosphere, Letter, Zoo) para utilizao com o mtodo GTM passveis de uso em minerao de dados. http://parati.dca.fee.unicamp.br/media/Attachments/course IA368Q1S2012/Monografia/zuchini_mest.pdf (pag 102)
Quem usa / Onde se aplica?

A rede de lojas Walmart na dcada de 90, fez um grande investimento em minerao de dados, com uma pergunta bsica: Que produto est relacionado a qual? Uma pessoa que compra cervejas compraria mais o que?. Investiram em hardware com super processadores para buscar essa informao e com os ferramentas da minerao de dados, descobriram que quem compra cervejas, tambm comprava fraldas, o perfil da pessoa era: homem com filho pequeno, normalmente o primognito, com habito de tomar cerveja as sextas-feiras e finais de semana. O Walmart com essa informao fazia promoes na quinta ou sexta feira com esses produtos. Banco Ita com as malas diretas, atravs da minerao de dados, eles traaram o perfil das pessoas que respondiam essas malas diretas e a partir das informaes comearam a investir num determinado perfil. Bank of America utilizou a minerao de dados para verificar para quem o banco deveria fornecer crdito/emprstimo e saber qual perfil de usurio inadimplente, com isso para quem o banco deveria oferecer esse emprstimo. O banco Nossa Caixa, Nosso Banco em 2008 desenvolveu um data mining para deteco de fraudes. Um site de poker que promove partidas online com grandes profissionais suspendeu um jogador, porque o mesmo utilizava a minerao de dados para traar o perfil dos seus adversrios.
Referncias Bibliogrficas
http://parati.dca.fee.unicamp.br/media/Attachments/ courseIA368Q1S2012/Monografia/zuchini_mest.pdf http://www.anchieta.br/unianchieta/revistas/ubiquid ade/Site/ubiquidade/pdf/Artigo1.pdf CPBR10 - Software Livre. Oficina: Data Mining Weka (http://youtu.be/sDD8nsZ1fQo)
GTM: Generative Topographic Mapping

lide Matos de Oliveira Fabio Martins da Silva Lidiane Cristina de Moraes Marcelo Henrique Fernandes Ribeiro

GTM Final

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

GTM Final

Enviado por

Direitos autorais:

Formatos disponíveis

O que GTM?

Caractersticas do modelo GTM

Para que serve?

Quem usa / Onde se aplica?

GTM: Generative Topographic Mapping

Você também pode gostar