Você está na página 1de 52

Qualicao de Doutorado Direto ca

Aprendizado semissupervisionado via competio ca de part culas em redes complexas: modelagem, anlise e aplicaes a co
Thiago Christiano Silva
Orientador: Dr. Zhao Liang Instituto de Cincias Matemticas e de Computao e a ca Universidade de So Paulo a

20 de setembro de 2011

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Sumrio a
1

Introduo ca Macrocontexto Motivaes co Objetivos Reviso Bibliogrca a a Redes Complexas Aprendizado Semissupervisionado Proposta de Pesquisa e Resultados Obtidos Estratgia de Desenvolvimento e Resultados Obtidos e Forma de Anlise dos Resultados a Cronograma de Atividades Consideraes Finais co
2 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Macrocontexto

O. Chapelle, B. Schlkopf e A. Zien (2006), Semi-supervised Learning, The MIT Press o 3 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Motivaoes c

E importante investigar e aplicar Redes Complexas So um mecanismo poderoso para representao dos dados a ca Em funo da sua complexidade, existe um grande espao para ca c explorao ca

Existe a necessidade de desenvolver novas tcnicas de Aprendizado e Semissupervisionado Envolvem minimizao de custo e inverses matriciais ca o Incorrem de alto custo computacional: O(n3 ) ou superior

4 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Motivaoes c
Merece aprofundamento e aplicaes a tcnica de Competio de co e ca Part culas No s oferece um mecanismo de deteco de comunidades, a o ca mas tambm um esquema geral de aprendizado de mquina e a competitivo Apresenta alta preciso e baixa complexidade computacional a Carece de fundamentao matemtica ca a E valioso investigar o assunto de conabilidade de dados em Aprendizado Semissupervisionado A propagao de erros cr ca e tica em alguns sistemas
Diagnstico Mdico: rotulao inicial incorreta o e ca

Figura-se como um tpico pouco estudado na literatura o


M. G. Quiles, L. Zhao, R. L. Alonso e R. A. F. Romero (2008), Particle competition for complex network community detection, Chaos, 18(3):033107 5 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Objetivos Principais

Modelagem de um sistema competitivo de vrias part a culas em aprendizado semissupervisionado, via um sistema dinmico esa tocstico a Anlise matemtica do modelo competitivo a a Extenso do modelo competitivo para o campo no supervisioa a nado Deteco de vrtices sobrepostos ca e Preveno da propagao de rtulos de dados erroneamente ca ca o rotulados

6 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Redes Complexas
Redes de larga escala com topologia no trivial a Aplicabilidade em vrios ramos da Cincia a e
Internet, redes de prote nas, sociais, metablicas, o distribuio de energia eltrica e de transporte ca e

A representao em rede complexa unica a esca trutura, dinmica e funes do sistema o qual rea co presenta Capaz de descrever a estrutura topolgica do siso tema original
S. Fortunato (2010), Community detection in graphs, Physics Reports, 486(35):75174 L. F. Costa, F. A. Rodrigues, G. Travieso e P. R. V. Boas (2007), Characterization of complex networks: A survey of measurements, Advances in Physics, 56:167242 G. Palla, I. Dernyi, I. Farkas e T. Vicsek (2005), Uncovering the overlapping community structure of e complex networks in nature and society, Nature, 435:814818 M. Newman (2003), The structure and function of complex networks, SIAM Review, 45:167256 7 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Comunidades
DEFINICAO: Um grupo de vrtices que est densamente inter e a conectado e, ao mesmo tempo, poucas conexes existem entre o este grupo e a rede remanescente

M. Girvan, M.E.J. Newman (2002), Community structure in social and biological networks, Proc. Natl. Acad. Sci. USA, 99(12):78217826 A. Lancichinetti, S. Fortunato, F. Radicchi (2008), Benchmark graphs for testing community detection algorithms, Phys. Rev. E, 78(4):046110 8 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Tcnica: Competio de Part e ca culas


Proposta para o modo de aprendizado no supervisionado a Vrias part a culas navegam pela rede e competem umas com as outras com o intuito de demarcar novos vrtices e
Simultaneamente, tentam expulsar de seus territrios part o culas rivais

Cada part cula pode realizar: movimentao aleatria ou deca o termin stica Aplicada apenas a tarefas de deteco de comunidades ca Descrita como um modelo procedimental, sem rigor matemtico a
M. G. Quiles, L. Zhao, R. L. Alonso e R. A. F. Romero (2008), Particle competition for complex network community detection, Chaos, 18(3):033107 9 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Vrtices Sobrepostos e
DEFINICAO: Vrtices que, naturalmente, so membros de mais e a de uma comunidade
Ex: Uma pessoa membro, ao mesmo tempo, das comunidades e representando sua fam empresa em que trabalha e c lia, rculo de amigos

S. Fortunato (2010), Community detection in graphs, Physics Reports, 486(35):75174 G. Palla, I. Dernyi, I. Farkas, T. Vicsek (2005), Uncovering the overlapping community structure of e complex networks in nature and society, Nature, 435:814818 10 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Aprendizado de Mquina a

No Supervisionado a

Semissupervisionado

Supervisionado

11 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Motivaoes: Aprendizado Semissupervisionado c

Por que utilizar aprendizado semissupervisionado?


Rotular dados constitui uma tarefa onerosa: categorizar textos manualmente, descobrir estruturas tridimensionais em redes de prote nas, identicar comportamentos de indiv duos em uma rede social, entre outros Dados no rotulados so fceis de obter: texto (palavras), caa a a racter sticas pessoais (rede social), entre outros

V. N. Vapnik (1998), Statistical learning theory, Wiley & Sons Inc X. Zhu e A. B. Goldberg (2009), Introduction to semi-supervised learning, Morgan & Claypool Publishers 12 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Motivaoes: Aprendizado Semissupervisionado c


Por que utilizar aprendizado semissupervisionado?
Grande parte do aprendizado natural ocorre no regime semissupervisionado: reconhecimento fonolgico por uma criana o c Em alguns casos, pode melhorar a taxa de classicao em taca refas de classicao supervisionada ca

M. Belkin, I. Matveeva e P. Niyogi (2004), Regularization and semi-supervised learning on large graphs, COLT, pp. 24638 M. Belkin, P. Niyogi e V. Sindhwani (2006), Manifold regularization: A geometric framework for learning from labeled and unlabeled examples, Journal of Machine Learning Research, 7:23992434 13 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Suposioes c
Os dados no rotulados iro SEMPRE auxiliar no processo? a a
Suposio de Agrupamento: Dados de uma mesma classe devem ca pertencer a uma regio de alta densidade a Suposio de Suavidade: A funo classicadora deve ser suave ca ca em regies de alta densidade de dados o Suposio de Existncia Manifolds: Reduzir o fenmeno da ca e o maldio de dimensionalidade e facilitar classicao ca ca

V. N. Vapnik (1998), Statistical learning theory, Wiley & Sons Inc O. Chapelle, B. Scholkopf e A. Zien (2006), Semi-supervised learning, The MIT Press X. Zhu e A. B. Goldberg (2009), Introduction to semi-supervised learning, Morgan & Claypool Publishers 14 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Classicao Semissupervisionada em Grafos ca


OBJETIVO: Dado um grafo com alguns ns rotulados, deseo jamos classicar o restante dos ns no-rotulados o a A grande vantagem na utilizao de grafos a habilidade de ca e identicar classes de distribuies variadas co A maioria das tcnicas baseadas em grafos fundamenta-se em e um framework de regularizao ca
Basicamente, diferem na escolha da funo de perda e da funo ca ca regularizadora Portanto, so O(n3 ): aplicabilidade e escabilidade limitadas a

X. Zhu, Z. Ghahramani e J. Laerty (2003), Semi-supervised learning using gaussian elds and harmonic functions, ICML, pp. 912919 D. Zhou e B. Schlkopf (2004), Learning from labeled and unlabeled data using random walks, Pattern o Recognition, Proceedings of the 26th DAGM Symposium, 3175:237244 X. Zhu (2005), Semi-supervised learning Literature Survey, Computer Sciences, University of Wisconsin-Madison 15 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Motivao para Utilizao de Grafos ca ca

D. Zhou, O. Bousquet, T. N. Lal, J. Weston e B. Schlkopf (2004), Learning with local and global o consistency, Advances in Neural Information Processing Systems, 16:321-328 16 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Discriminative Walks (D-Walks)


O modelo de caminhadas aleatrias em grafos pode ser tratado o utilizando a Teoria de Cadeias de Markov Discreta
A cada n associado um estado da cadeia oe A varivel aleatria Xt representa o estado da cadeia de Markov a o no tempo t A caminhada aleatria regida pela seguinte matriz de transio: o e ca P[Xt+1 = q | Xt = q] = pqq
aqq
q V

aqq

onde A a matriz de adjacncia que, pela e e gura, dada por: e 0 1 0 0 0 0 A=


1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 0 1 0 1 1 1 0 1 0 0 0 0 1 0 0

J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 J. D. Noh e H. Rieger (2004), Random walks on complex networks, PRL, 92:118701 17 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Denio: D-Walks ca

(i) OBJETIVO: Classicar o vrtice no e a rotulado marcado com ?

(ii) Uma D-Walk sempre inicia e termina em vrtices da mesma classe e

(iii) Uma D-Walk pode percorrer vrtices no rotulados e a

(iv) Uma D-Walk pode percorrer vrtices de outras classes e

J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 18 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Denio: Betweenness de vrtices no rotulados ca e a


O Betweenness de um vrtice q, B(q, y ), o nmero de pase e u sagens esperado de D-Walks da classe y que visitam o vrtice e no rotulado q: a E[pt(q) | Dy ]

B(q, y )

O nmero de passagens no vrtice q dado por: u e e

pt(q)
t=1

1{Xt =q}

J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 19 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Como calcular o betweenness?

J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 20 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Como reduzir a complexidade do clculo do betweenness? a


Para diminuir a complexidade, restringe-se o comprimento da D-Walk at no mximo L, conforme a equao abaixo: e a ca
y E [pt(q) | DL ]

BL (q, y )

Benef cios Melhores taxas de classicao ca Betweenness pode ser calculado de maneira eciente (variveis a backward e forward estocsticas) a
J. Callut (2007), First passage times dynamics in markov models with applications to HMM induction, Sequence Classication and Graph Mining, PhD Thesis dissertation, Universit Catolique de Louvain e J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 21 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Classicao Final dos Vrtices No Rotulados ca e a


Os vrtices so classicados usando uma regra de deciso de e a a maximizao da a posteriori (MAP) do betweenness de cada ca classe A probabilidade de o vrtice rotulado q pertencer ` classe y e a e dada por: BL (q, y ) y Y BL (q, y )

P[q | y ]

E a classe que o vrtice q recebe pela tcnica : e e e yq = arg max P[q | y ]P[y ]
y Y
J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 22 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Classicao Guiada pela Modularidade ca


CONCEITO: Algoritmo de Otimizao da Modularidade ca
Originalmente proposto para o aprendizado no supervisionado a A modularidade quantica a qualidade de uma diviso da rede: a 1 2m kv kw (cv , cw ) 2m

Q=

Avw
vw

No algoritmo original, a cada passo, as duas comunidades com o maior Q(i, j) so fundidas, sem quaisquer restries: a co
1/2m

Q(i, j) =

0,

ki kj/(2m)2 , se i, j forem conectadas caso contrrio a

M. E. J. Newman (2006), Modularity and community structure in networks, Proceedings of the National Academy of Sciences, 103(23):85778582 A. Clauset, M. E. J. Newman e C. Moore (2004), Finding community structure in very large networks, Physical Review E, 70(6):066111 23 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Classicao Guiada pela Modularidade ca

Inspirado no algoritmo original, as seguintes modicaes esco truturais foram conduzidas:


1

Inicialmente, existem |L| vrtices rotulados na rede. Objetiva-se e a propagao destes rtulos para os vrtices ainda no rotulaca o e a dos. Uma vez que um vrtice no rotulado seja rotulado, no e a a e permitida a redesignao de classe ca A cada passo, so fundidas as duas comunidades com o maior a Q(i, j). Todavia, tal fuso sujeita a algumas restries a e co

T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042 24 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Restrioes em uma Fuso c a

Com o m de imitar o processo de propagao de rtulos em ca o uma rede, uma fuso se estabelecer somente se pelo menos a a uma das comunidades a serem fundidas estiver sido rotulada previamente Seja o pseudo-rtulo de uma comunidade ainda no rotulada o a Suponha que as comunidades ci e cj foram selecionadas para serem fundidas, cada qual carregando os rtulos cil e cjl o

T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042 25 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Restrioes em uma Fuso c a

Neste cenrio, um dos 4 casos abaixo sempre acontecer a a


1

A fuso no ocorrer se cil = cjl , desde que cil = e cjl = . a a a Este caso representa um confronto entre os limites estabelecidos pelas regies das classes i e j, ambas j rotuladas o a A fuso no ocorrer se cil = cjl = , uma vez que nenhum a a a rotulado est sendo propagado a

T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042 26 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Restrioes em uma Fuso c a

Neste cenrio, um dos 4 casos abaixo sempre acontecer a a


3

A fuso ocorrer se cil = e cjl = , ou cil = e cjl = . a a Este caso representa o mecanismo tradicional de propagao de ca rtulos de uma comunidade rotulada para outra no rotulada o a A fuso ocorrer se cil = cjl , desde que cil = e cjl = . Neste a a caso, o processo de fuso apenas coloca duas comunidades da a mesma classe na mesma comunidade, maximizando a modularidade

T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042 27 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Ultimos Pontos a Destacar da Tcnica e

Processo de Fuso a Se uma fuso no ocorrer, ento as duas comunidades com a a a o segundo maior valor de Q sero selecionadas para serem a potencialmente fundidas e assim sucessivamente Este processo realizado at que no exista nenhum dado no e e a a rotulado remanescente

T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042 28 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa (Etapa I)

ETAPA I Modelagem da tcnica de competio de part e ca culas para aprendizado semissupervisionado via sistema dinmico estocstico a a J foi completada a

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 29 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Descrio da Tcnica (Etapa I) ca e

Dado um grafo G = V, E , insere-se uma part cula em cada vrtice pr-rotulado e e Cada part cula responsvel por conquistar novos vrtices por e a e meio da constante visita aos mesmos
Fortalece o seu n de dominao no vrtice visitado vel ca e Enfraquece o n de dominao de todos os times rivais naquele vel ca vrtice e

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 30 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Algumas Notaes Relevantes (Etapa I) co


p(t) = [p (1) (t), . . . , p (K ) (t)] denota a localizao de todas as ca part culas Ni (t) = [Ni (t), . . . , Ni (t)] indica o nmero de visitas que u o vrtice i recebeu de todas as part e culas no instante t (1) (K ) Ni (t) = [Ni (t), . . . , Ni (t)] revela o n de dominao de vel ca todas as part culas ao vrtice i no instante t, cuja expresso : e a e
(k) (1) (K )

(k) Ni (t)

Ni (t)
(u) K u=1 Ni (t)

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 31 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Regra de Atualizao da Energia das Part ca culas (Etapa I)


Quando uma part cula k visita um vrtice i, uma das seguintes e situaes ocorrer: co a
O vrtice visitado dominado por uma part e e cula rival
A energia da part cula k reduzida e

O vrtice dominado pela prpria part e e o cula k


A energia da part cula k fortalecida e

E (k) (t) =

min(max , E (k) (t 1) + ), se proprietario(k, t) max(min , E (k) (t 1) ), se proprietario(k, t)

Estados de uma Part cula Exausto: Indica que a part cula est com a m a nima energia permitida Ativo: Indica que a part cula tem energia suciente para navegar pela rede
T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 32 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Pol tica de Movimentao das Part ca culas (Etapa I)


A cada passo, a k-sima part e cula realiza uma movimentao ca em consonncia com a seguinte matriz de transio: a ca

Ptrans (t)

(k)

(1 S (k) (t)) Ppref (t) + (1 )Paleat +S (k) (t) Termo Ativo

(k)

P(k) (t) rean Termo Exausto

S (k) (t) atua como uma chave: 0, se a part cula k est ativa no instante t a 1, se a part cula k est exausta no instante t a

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 33 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Descrio dos Tipos de Movimentaoes (Etapa I) ca c


Quando a part cula k est ATIVA: a Termo Aleatrio o Comportamento aventureiro No leva em conta os n a veis de dominao ca Invariante no tempo ai,j
V u=1 ai,u

Termo Preferencial Comportamento defensivo Prefere visitar vrtices j doe a minados Variante no tempo

Paleat (i, j)

(k) Ppref (i, j, t)

ai,j Nj (t)
V (k) u=1 ai,u Nu (t)

(k)

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 34 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Descrio dos Tipos de Movimentaoes (Etapa I) ca c


Quando a part cula k est EXAUSTA: a
E transportada de volta ao seu territrio com o o intuito de ser recarregada O transporte feito no importando se existe e a uma conexo f a sica na matriz de adjacncia e No modelo, h isonomia no ato de escolha a do vrtice que a part e cula ser transportada a (distribuio uniforme) ca

1
P(k) (i, j, t) rean
V u=1

arg max mK

(m) Nj (t) =k (m) Nu (t) =k

arg max mK

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 35 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Sistema Dinmico Estocstico (Etapa I) a a


X (t) = [N(t) p(t) E (t) S(t)]T (k) (k) Ni (t + 1) = Ni (t) + 1{p(k) (t+1)=i} min(max , E (k) (t) + ), se proprietario(k, t + 1) : E (k) (t + 1) = max(min , E (k) (t) ), se proprietario(k, t + 1) (k) S (t + 1) = 1{E (k) (t+1)=min } E qual a expresso para calcular p (k) (t + 1)? e a p (k) (t + 1) dado pela gerao de um nmero aleatrio, cuja distribuio e ca u o ca (k) probabil stica segue a matriz de transio Ptrans (t): ca
Ptrans (t)
(k)

(1 S (k) (t)) Ppref (t) + (1 )Paleat + S (k) (t)P(k) (t) rean

(k)

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 36 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Condioes Iniciais (Etapa I) c


p(0): Cada part cula inicia no vrtice o qual representa e N(0): Iniciado a partir da seguinte expresso: a
(k)

Ni (0) =

, se a part cula k representa o vrtice i e 1, caso contrrio a

E (0): Todas as part culas comeam com uma energia c intermediria: a E (k) (0) = min + max min K

S(0): Todas as part culas comeam no estado ativo: c (k) (0) = 0 S


T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 37 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Contribuioes da Etapa I c

Um descrio rigorosa do modelo competitivo foi realizada por ca meio de um sistema dinmico estocstico no linear a a a
Inexiste tal modelagem na literatura

Generalizao da teoria de caminhada aleatria simples para ca o um modelo matemtico que comporta mltiplas caminhadas a u aleatrias com interao o ca
> 0: mltiplos caminhantes com interao u ca = 0: mltiplos caminhantes sem interao (mltiplas camiu ca u nhadas aleatrias) o

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 38 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa (Etapa II)

ETAPA II Anlise matemtica do modelo de competio semissupervisionado a a ca J foi completada a

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 39 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Contribuioes da Etapa II c

Expresses probabil o sticas foram deduzidas a partir do modelo dinmico estocstico a a


Permitem prever o comportamento do sistema dinmico a

Validaes das equaes tericas obtidas, contra o resultado co co o emp rico do modelo, foram conduzidas
Conrmam a anlise terica a o

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 40 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa (Etapa III)

ETAPA III Extenso do modelo competitivo para o aprendizado no supervia a sionado e criao de mecanismos para estimar o nmero de clusca u ters/comunidades de uma base de dados

41 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Algumas Ideias Iniciais (Etapa III)


Sugere-se mudar as condies iniciais do sistema competitivo: co
Ni (0) =
(k)

2, 1,

se a part cula k for gerada em i caso contrrio a

Para estimar o nmero de clusters/comunidades, o comportamento u da seguinte medida ser estudado: a


R(t) = 1 V
V

(m) max Nu (t)


u=1 mK

R(t) ser baixo quando: a K for maior que o nmero de clusters: mais de uma part u cula dominando um cluster K for menor que o nmero de clusters: uma part u cula dominando mais de um cluster Ideia para estimar nmero de clusters ou comunidades u Usar esse avaliador externo e vericar para que K a quantidade R(t) e maximizada
42 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa (Etapa IV)

ETAPA IV Deteco de vrtices e comunidades sobrepostos ca e

43 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Algumas Ideias Iniciais (Etapa IV)


Sugere-se utilizar a informao gerada pelo prprio processo ca o competitivo para caracterizar e identicar vrtices e comunidae des sobrepostos
Assim, nenhum processo dedicado necessrio e a

Oi (t) = 1 (Mi (1, t) Mi (2, t)) Mi (x, t) produz o x-simo maior n de dominao imposto e vel ca ao vrtice i no tempo t e
Ideia para detectar vrtices e comunidades sobrepostos e Vericar relativamente os vrtices com os maiores valores de Oi (t) e
44 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa (Etapa V)

ETAPA V Tratamento da conabilidade dos dados no processo de aprendizado semissupervisionado

45 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Algumas Ideias Iniciais (Etapa V)


Estudo e Anlise de Propagao de Erros: introduo intencia ca ca onal de vrtices incorretamente rotulados e

Ideias para prevenir ou reduzir a propagao de rtulos errados ca o Utilizar o n de dominao da vizinhana vel ca c Utilizar a distncia mdia percorrida pela part a e cula Utilizar a informao de quantas vezes uma part ca cula se tornou exausta
46 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Forma de Anlise dos Resultados a

Os resultados obtidos das simulaes sero avaliados quanto `: co a a


Complexidade Computacional Acurcia: benchmarks e bases de dados reais a

Os modelos matemticos sero avaliados quanto ` preciso na a a a a previso dos processos emp a ricos
Mtodos estat e sticos devem gurar em cena para mensurar e validar o desempenho das tcnicas desenvolvidas e

47 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Cronograma de Atividades
: Incompleta : Completa
Atividade hhhh h 1 2 3 4 5 6 7 8 9

hhhh
Semestre

1S/2010 2S/2010 1S/2011 2S/2011 1S/2012 2S/2012 1S/2013 2S/2013 1 2 3 4 5

Disciplinas (84 crditos) e Pesquisa Bibliogrca a Exame de Qualicao e TOEFL ca Desenvolvimento Terico o Testes e Simulaoes c

6 7 8

Aplicaoes c Gerao de Artigos ca Elaborao de Relatrios (FAca o PESP) Defesa da Tese


48 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Consideraoes Finais c

Em consonncia ao aumento de dados dispon a veis, o aprendizado semissupervisionado se destaca como um tipo de aprendizado vivel a Conquanto existam inmeras tcnicas presentes na literatura u e concernentes ao aprendizado semissupervisionado, a maioria se fundamenta, essencialmente, em minimizao de funes de ca co energia

49 / 52

Introduo ca

Reviso Bibliogrca a a

Proposta de Pesquisa e Resultados Obtidos

Consideraoes Finais c

Em constraste `s tcnicas tradicionais, aqui, buscam-se mtodos a e e alternativos de soluo, que harmonizem bons resultados com ca baixa complexidade computacional H a expressa preocupao com: a ca
a descrio matemtica do modelo, cujo propsito revelar, ca a o e seno integralmente, grande parte de seu comportamento evoa lucional frente aos parmetros de entrada a a anlise do impacto da propagao de erros, fenmeno oriundo a ca o da insero errada de rtulos, no contexto de aprendizado seca o missupervisionado

50 / 52

Artigos Submetidos, Aceitos e Publicados em Peridicos o

Publicado (Peridico) o
1

T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042

Submetidos (Peridicos) o
1

T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a T. C. Silva e L. Zhao (2011), Network-based high level data classication, IEEE Transactions on Neural Networks and Learning Systems, em reviso a

Artigos Submetidos, Aceitos e Publicados em Congressos


Publicados (Congressos)
1

T. C. Silva e L. Zhao (2011), Network-based learning through particle competition for data clustering, International Joint Conference on Neural Networks (IJCNN2011), pp. 45-52 T. C. Silva e L. Zhao (2011), Semi-supervised learning in complex networks, VIII Encontro Nacional de Inteligncia Articial (ENIA2011), e XXXI Congresso da Sociedade Brasileira de Computao, pp. 406-417. ca T. C. Silva, T. H. Cupertino e L. Zhao (2011), High level classication for pattern recognition, XXIV Sibgrapi Conference on Graphics, Patterns and Images (SIBGRAPI2011) T. C. Silva, T. H. Cupertino e L. Zhao (2011), Stochastic competitive learning applied to handwritten digit and letter clustering, XXIV Sibgrapi Conference on Graphics, Patterns and Images (SIBGRAPI2011) B. Arajo, F. A. Rodrigues, T. C. Silva e L. Zhao (2010), Identifying u abnormal nodes in protein-protein interaction networks, XI Brazilian Symposium on Articial Neural Network (SBRN2010), pp. 97-102

Aceito (Congresso)
1

T. C. Silva e L. Zhao (2011), Uncovering overlapping structures via stochastic competitive learning, X Brazilian Congress on Computational Intelligence (CBIC2011), aceito

Você também pode gostar