Você está na página 1de 9

O que GTM?

GTM Mapeamento Topogrfico Gerativo uma ferramenta da Minerao de Dados e um modelo algortmico/computacional adaptativo e o uso desse modelo se aplica na recuperao de informao (representao, armazenamento e acesso aos dados).

O que GTM?
O modelo GTM (BISHOP, SVENSN & WILLIAMS, 1998) um modelo que executa um mapeamento paramtrico no linear de um espao L-dimensional de variveis (chamadas latentes) para um espao D-dimensional de dados de entrada onde, normalmente, L<D. Este mapeamento define um subespao S (contido no espao de entrada) que representa o espao de variveis latentes segundo a transformao y(x,W), a qual mapeia pontos x do espao latente para pontos v no espao de dados, como ilustrado na Figura 5 para o caso em que o espao latente reside em R (L=2) e o espao de dados, em R (D=3).

Como ?

Cada ponto do espao latente (X-espao, esquerda) levado ao espao de dados (Vespao, direita) atravs de um mapeamento paramtrico no linear y(x,W), o qual define um subespao S contido no espao de dados. Cada ponto pertencente a S resultante da aplicao de y(x,W) sobre um ponto pertencente ao X-espao. Assim, a transformao y(x,W) leva um ponto xa residente no espao latente e definido pelas suas coordenadas (x1(a), x2(a)), para um ponto y(xa,W), pertencente ao espao S e definido por suas coordenadas (v1(a), v2(a), v3(a)) no espao de dados. A hiptese feita pelo modelo GTM a de que o comportamento do conjunto de dados no espao Ddimensional pode de fato ser expresso por um conjunto menor de atributos 2 (as variveis latentes) atravs de um mapeamento paramtrico no linear y(x,W). Uma aproximao para esse raciocnio imaginar que, embora a dimenso do conjunto de entrada possa ser elevada, muitas das variveis so correlacionadas entre si, resultando num conjunto potencialmente mais simples que pode representar o comportamento dos dados no espao original (BISHOP, SVENSN & WILLIAMS, 1998). Os modelos baseados nesta ideia so chamados modelos de variveis latentes (BARTHOLOMEW, 1987). O mapeamento realizado pelo GTM utiliza-se normalmente de um modelo de probabilidade baseado em mistura de gaussianas, o qual adaptado pelo algoritmo EM (Expectation Maximization) (DEMPSTER, LAIRD & RUBIN, 1987; BISHOP, SVENSN & WILLIAMS, 1996, 1998; SVENSN, 1998).

Caractersticas do modelo GTM


Capacidade de operar com conjuntos volumosos de dados; Capacidade de operar com dados representados por um grande nmero

de caractersticas (alta dimensionalidade) Utilizao de aprendizado no supervisionado; Capacidade de realizar projeo de dados, reduzindo assim a dimensionalidade do conjunto de dados Capacidade de realizar reduo de dados, diminuindo a quantidade de dados exibidos e pela ferramenta; Possibilidade de avaliao grfica dos resultados obtidos; Algoritmos relativamente simples e rpidos; Capacidade de generalizao dos modelos, de forma a possibilitar a representao de dados no disponveis no momento do treinamento.

Para que serve?


GTM oferece recursos consistentes para anlise de dados, onde h variao de dimensionalidade, quantidade e tipo de dados disponveis (discretos, contnuos, binrios etc.). H uma grande variedade de bancos de dados disponveis(Glass, Ionosphere, Letter, Zoo) para utilizao com o mtodo GTM passveis de uso em minerao de dados. http://parati.dca.fee.unicamp.br/media/Attachments/course IA368Q1S2012/Monografia/zuchini_mest.pdf (pag 102)

Quem usa / Onde se aplica?


A rede de lojas Walmart na dcada de 90, fez um grande investimento em minerao de dados, com uma pergunta bsica: Que produto est relacionado a qual? Uma pessoa que compra cervejas compraria mais o que?. Investiram em hardware com super processadores para buscar essa informao e com os ferramentas da minerao de dados, descobriram que quem compra cervejas, tambm comprava fraldas, o perfil da pessoa era: homem com filho pequeno, normalmente o primognito, com habito de tomar cerveja as sextas-feiras e finais de semana. O Walmart com essa informao fazia promoes na quinta ou sexta feira com esses produtos. Banco Ita com as malas diretas, atravs da minerao de dados, eles traaram o perfil das pessoas que respondiam essas malas diretas e a partir das informaes comearam a investir num determinado perfil. Bank of America utilizou a minerao de dados para verificar para quem o banco deveria fornecer crdito/emprstimo e saber qual perfil de usurio inadimplente, com isso para quem o banco deveria oferecer esse emprstimo. O banco Nossa Caixa, Nosso Banco em 2008 desenvolveu um data mining para deteco de fraudes. Um site de poker que promove partidas online com grandes profissionais suspendeu um jogador, porque o mesmo utilizava a minerao de dados para traar o perfil dos seus adversrios.

Referncias Bibliogrficas
http://parati.dca.fee.unicamp.br/media/Attachments/ courseIA368Q1S2012/Monografia/zuchini_mest.pdf http://www.anchieta.br/unianchieta/revistas/ubiquid ade/Site/ubiquidade/pdf/Artigo1.pdf CPBR10 - Software Livre. Oficina: Data Mining Weka (http://youtu.be/sDD8nsZ1fQo)

GTM: Generative Topographic Mapping


lide Matos de Oliveira Fabio Martins da Silva Lidiane Cristina de Moraes Marcelo Henrique Fernandes Ribeiro

Você também pode gostar