Aprendizado Semissupervisionado Via Competição de Partículas em Redes Complexas: Modelagem, Análise e Aplicações

Qualicao de Doutorado Direto ca
Aprendizado semissupervisionado via competio ca de part culas em redes complexas: modelagem, anlise e aplicaes a co
Thiago Christiano Silva
Orientador: Dr. Zhao Liang Instituto de Cincias Matemticas e de Computao e a ca Universidade de So Paulo a
20 de setembro de 2011
Introduo ca
Reviso Bibliogrca a a
Proposta de Pesquisa e Resultados Obtidos
Sumrio a
1
Introduo ca Macrocontexto Motivaes co Objetivos Reviso Bibliogrca a a Redes Complexas Aprendizado Semissupervisionado Proposta de Pesquisa e Resultados Obtidos Estratgia de Desenvolvimento e Resultados Obtidos e Forma de Anlise dos Resultados a Cronograma de Atividades Consideraes Finais co
2 / 52
Introduo ca
Macrocontexto
O. Chapelle, B. Schlkopf e A. Zien (2006), Semi-supervised Learning, The MIT Press o 3 / 52
Introduo ca
Motivaoes c
E importante investigar e aplicar Redes Complexas So um mecanismo poderoso para representao dos dados a ca Em funo da sua complexidade, existe um grande espao para ca c explorao ca
Existe a necessidade de desenvolver novas tcnicas de Aprendizado e Semissupervisionado Envolvem minimizao de custo e inverses matriciais ca o Incorrem de alto custo computacional: O(n3 ) ou superior
4 / 52
Introduo ca
Motivaoes c
Merece aprofundamento e aplicaes a tcnica de Competio de co e ca Part culas No s oferece um mecanismo de deteco de comunidades, a o ca mas tambm um esquema geral de aprendizado de mquina e a competitivo Apresenta alta preciso e baixa complexidade computacional a Carece de fundamentao matemtica ca a E valioso investigar o assunto de conabilidade de dados em Aprendizado Semissupervisionado A propagao de erros cr ca e tica em alguns sistemas
Diagnstico Mdico: rotulao inicial incorreta o e ca
Figura-se como um tpico pouco estudado na literatura o

M. G. Quiles, L. Zhao, R. L. Alonso e R. A. F. Romero (2008), Particle competition for complex network community detection, Chaos, 18(3):033107 5 / 52
Introduo ca
Objetivos Principais
Modelagem de um sistema competitivo de vrias part a culas em aprendizado semissupervisionado, via um sistema dinmico esa tocstico a Anlise matemtica do modelo competitivo a a Extenso do modelo competitivo para o campo no supervisioa a nado Deteco de vrtices sobrepostos ca e Preveno da propagao de rtulos de dados erroneamente ca ca o rotulados
6 / 52
Introduo ca
Redes Complexas
Redes de larga escala com topologia no trivial a Aplicabilidade em vrios ramos da Cincia a e
Internet, redes de prote nas, sociais, metablicas, o distribuio de energia eltrica e de transporte ca e
A representao em rede complexa unica a esca trutura, dinmica e funes do sistema o qual rea co presenta Capaz de descrever a estrutura topolgica do siso tema original
S. Fortunato (2010), Community detection in graphs, Physics Reports, 486(35):75174 L. F. Costa, F. A. Rodrigues, G. Travieso e P. R. V. Boas (2007), Characterization of complex networks: A survey of measurements, Advances in Physics, 56:167242 G. Palla, I. Dernyi, I. Farkas e T. Vicsek (2005), Uncovering the overlapping community structure of e complex networks in nature and society, Nature, 435:814818 M. Newman (2003), The structure and function of complex networks, SIAM Review, 45:167256 7 / 52
Introduo ca
Comunidades
DEFINICAO: Um grupo de vrtices que est densamente inter e a conectado e, ao mesmo tempo, poucas conexes existem entre o este grupo e a rede remanescente
M. Girvan, M.E.J. Newman (2002), Community structure in social and biological networks, Proc. Natl. Acad. Sci. USA, 99(12):78217826 A. Lancichinetti, S. Fortunato, F. Radicchi (2008), Benchmark graphs for testing community detection algorithms, Phys. Rev. E, 78(4):046110 8 / 52
Introduo ca
Tcnica: Competio de Part e ca culas

Proposta para o modo de aprendizado no supervisionado a Vrias part a culas navegam pela rede e competem umas com as outras com o intuito de demarcar novos vrtices e
Simultaneamente, tentam expulsar de seus territrios part o culas rivais
Cada part cula pode realizar: movimentao aleatria ou deca o termin stica Aplicada apenas a tarefas de deteco de comunidades ca Descrita como um modelo procedimental, sem rigor matemtico a
M. G. Quiles, L. Zhao, R. L. Alonso e R. A. F. Romero (2008), Particle competition for complex network community detection, Chaos, 18(3):033107 9 / 52
Introduo ca
Vrtices Sobrepostos e
DEFINICAO: Vrtices que, naturalmente, so membros de mais e a de uma comunidade
Ex: Uma pessoa membro, ao mesmo tempo, das comunidades e representando sua fam empresa em que trabalha e c lia, rculo de amigos
S. Fortunato (2010), Community detection in graphs, Physics Reports, 486(35):75174 G. Palla, I. Dernyi, I. Farkas, T. Vicsek (2005), Uncovering the overlapping community structure of e complex networks in nature and society, Nature, 435:814818 10 / 52
Introduo ca
Aprendizado de Mquina a
No Supervisionado a
Semissupervisionado
Supervisionado
11 / 52
Introduo ca
Motivaoes: Aprendizado Semissupervisionado c
Por que utilizar aprendizado semissupervisionado?

Rotular dados constitui uma tarefa onerosa: categorizar textos manualmente, descobrir estruturas tridimensionais em redes de prote nas, identicar comportamentos de indiv duos em uma rede social, entre outros Dados no rotulados so fceis de obter: texto (palavras), caa a a racter sticas pessoais (rede social), entre outros
V. N. Vapnik (1998), Statistical learning theory, Wiley & Sons Inc X. Zhu e A. B. Goldberg (2009), Introduction to semi-supervised learning, Morgan & Claypool Publishers 12 / 52
Introduo ca
Motivaoes: Aprendizado Semissupervisionado c

Por que utilizar aprendizado semissupervisionado?
Grande parte do aprendizado natural ocorre no regime semissupervisionado: reconhecimento fonolgico por uma criana o c Em alguns casos, pode melhorar a taxa de classicao em taca refas de classicao supervisionada ca
M. Belkin, I. Matveeva e P. Niyogi (2004), Regularization and semi-supervised learning on large graphs, COLT, pp. 24638 M. Belkin, P. Niyogi e V. Sindhwani (2006), Manifold regularization: A geometric framework for learning from labeled and unlabeled examples, Journal of Machine Learning Research, 7:23992434 13 / 52
Introduo ca
Suposioes c
Os dados no rotulados iro SEMPRE auxiliar no processo? a a
Suposio de Agrupamento: Dados de uma mesma classe devem ca pertencer a uma regio de alta densidade a Suposio de Suavidade: A funo classicadora deve ser suave ca ca em regies de alta densidade de dados o Suposio de Existncia Manifolds: Reduzir o fenmeno da ca e o maldio de dimensionalidade e facilitar classicao ca ca
V. N. Vapnik (1998), Statistical learning theory, Wiley & Sons Inc O. Chapelle, B. Scholkopf e A. Zien (2006), Semi-supervised learning, The MIT Press X. Zhu e A. B. Goldberg (2009), Introduction to semi-supervised learning, Morgan & Claypool Publishers 14 / 52
Introduo ca
Classicao Semissupervisionada em Grafos ca

OBJETIVO: Dado um grafo com alguns ns rotulados, deseo jamos classicar o restante dos ns no-rotulados o a A grande vantagem na utilizao de grafos a habilidade de ca e identicar classes de distribuies variadas co A maioria das tcnicas baseadas em grafos fundamenta-se em e um framework de regularizao ca
Basicamente, diferem na escolha da funo de perda e da funo ca ca regularizadora Portanto, so O(n3 ): aplicabilidade e escabilidade limitadas a
X. Zhu, Z. Ghahramani e J. Laerty (2003), Semi-supervised learning using gaussian elds and harmonic functions, ICML, pp. 912919 D. Zhou e B. Schlkopf (2004), Learning from labeled and unlabeled data using random walks, Pattern o Recognition, Proceedings of the 26th DAGM Symposium, 3175:237244 X. Zhu (2005), Semi-supervised learning Literature Survey, Computer Sciences, University of Wisconsin-Madison 15 / 52
Introduo ca
Motivao para Utilizao de Grafos ca ca
D. Zhou, O. Bousquet, T. N. Lal, J. Weston e B. Schlkopf (2004), Learning with local and global o consistency, Advances in Neural Information Processing Systems, 16:321-328 16 / 52
Introduo ca
Discriminative Walks (D-Walks)

O modelo de caminhadas aleatrias em grafos pode ser tratado o utilizando a Teoria de Cadeias de Markov Discreta
A cada n associado um estado da cadeia oe A varivel aleatria Xt representa o estado da cadeia de Markov a o no tempo t A caminhada aleatria regida pela seguinte matriz de transio: o e ca P[Xt+1 = q | Xt = q] = pqq
aqq
q V
aqq
onde A a matriz de adjacncia que, pela e e gura, dada por: e 0 1 0 0 0 0 A=

1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 0 1 0 1 1 1 0 1 0 0 0 0 1 0 0
J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 J. D. Noh e H. Rieger (2004), Random walks on complex networks, PRL, 92:118701 17 / 52
Introduo ca
Denio: D-Walks ca
(i) OBJETIVO: Classicar o vrtice no e a rotulado marcado com ?
(ii) Uma D-Walk sempre inicia e termina em vrtices da mesma classe e
(iii) Uma D-Walk pode percorrer vrtices no rotulados e a
(iv) Uma D-Walk pode percorrer vrtices de outras classes e
J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 18 / 52
Introduo ca
Denio: Betweenness de vrtices no rotulados ca e a

O Betweenness de um vrtice q, B(q, y ), o nmero de pase e u sagens esperado de D-Walks da classe y que visitam o vrtice e no rotulado q: a E[pt(q) | Dy ]
B(q, y )
O nmero de passagens no vrtice q dado por: u e e
pt(q)
t=1
1{Xt =q}
Introduo ca
Como calcular o betweenness?
Introduo ca
Como reduzir a complexidade do clculo do betweenness? a

Para diminuir a complexidade, restringe-se o comprimento da D-Walk at no mximo L, conforme a equao abaixo: e a ca
y E [pt(q) | DL ]
BL (q, y )
Benef cios Melhores taxas de classicao ca Betweenness pode ser calculado de maneira eciente (variveis a backward e forward estocsticas) a
J. Callut (2007), First passage times dynamics in markov models with applications to HMM induction, Sequence Classication and Graph Mining, PhD Thesis dissertation, Universit Catolique de Louvain e J. Callut, K. Franoise, M. Saerens e P. Duppont (2008), Semi-supervised classication from discriminative c random walks, ECML PKDD, LNAI, 5211:162-177 21 / 52
Introduo ca
Classicao Final dos Vrtices No Rotulados ca e a

Os vrtices so classicados usando uma regra de deciso de e a a maximizao da a posteriori (MAP) do betweenness de cada ca classe A probabilidade de o vrtice rotulado q pertencer ` classe y e a e dada por: BL (q, y ) y Y BL (q, y )
P[q | y ]
E a classe que o vrtice q recebe pela tcnica : e e e yq = arg max P[q | y ]P[y ]
y Y
Introduo ca
Classicao Guiada pela Modularidade ca

CONCEITO: Algoritmo de Otimizao da Modularidade ca
Originalmente proposto para o aprendizado no supervisionado a A modularidade quantica a qualidade de uma diviso da rede: a 1 2m kv kw (cv , cw ) 2m
Q=
Avw
vw
No algoritmo original, a cada passo, as duas comunidades com o maior Q(i, j) so fundidas, sem quaisquer restries: a co
1/2m
Q(i, j) =
0,
ki kj/(2m)2 , se i, j forem conectadas caso contrrio a
M. E. J. Newman (2006), Modularity and community structure in networks, Proceedings of the National Academy of Sciences, 103(23):85778582 A. Clauset, M. E. J. Newman e C. Moore (2004), Finding community structure in very large networks, Physical Review E, 70(6):066111 23 / 52
Introduo ca
Classicao Guiada pela Modularidade ca
Inspirado no algoritmo original, as seguintes modicaes esco truturais foram conduzidas:

1
Inicialmente, existem |L| vrtices rotulados na rede. Objetiva-se e a propagao destes rtulos para os vrtices ainda no rotulaca o e a dos. Uma vez que um vrtice no rotulado seja rotulado, no e a a e permitida a redesignao de classe ca A cada passo, so fundidas as duas comunidades com o maior a Q(i, j). Todavia, tal fuso sujeita a algumas restries a e co
T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042 24 / 52
Introduo ca
Restrioes em uma Fuso c a
Com o m de imitar o processo de propagao de rtulos em ca o uma rede, uma fuso se estabelecer somente se pelo menos a a uma das comunidades a serem fundidas estiver sido rotulada previamente Seja o pseudo-rtulo de uma comunidade ainda no rotulada o a Suponha que as comunidades ci e cj foram selecionadas para serem fundidas, cada qual carregando os rtulos cil e cjl o
Introduo ca
Neste cenrio, um dos 4 casos abaixo sempre acontecer a a

1
A fuso no ocorrer se cil = cjl , desde que cil = e cjl = . a a a Este caso representa um confronto entre os limites estabelecidos pelas regies das classes i e j, ambas j rotuladas o a A fuso no ocorrer se cil = cjl = , uma vez que nenhum a a a rotulado est sendo propagado a
Introduo ca
Neste cenrio, um dos 4 casos abaixo sempre acontecer a a

3
A fuso ocorrer se cil = e cjl = , ou cil = e cjl = . a a Este caso representa o mecanismo tradicional de propagao de ca rtulos de uma comunidade rotulada para outra no rotulada o a A fuso ocorrer se cil = cjl , desde que cil = e cjl = . Neste a a caso, o processo de fuso apenas coloca duas comunidades da a mesma classe na mesma comunidade, maximizando a modularidade
Introduo ca
Ultimos Pontos a Destacar da Tcnica e
Processo de Fuso a Se uma fuso no ocorrer, ento as duas comunidades com a a a o segundo maior valor de Q sero selecionadas para serem a potencialmente fundidas e assim sucessivamente Este processo realizado at que no exista nenhum dado no e e a a rotulado remanescente
Introduo ca
Proposta de Pesquisa (Etapa I)
ETAPA I Modelagem da tcnica de competio de part e ca culas para aprendizado semissupervisionado via sistema dinmico estocstico a a J foi completada a
T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a 29 / 52
Introduo ca
Descrio da Tcnica (Etapa I) ca e
Dado um grafo G = V, E , insere-se uma part cula em cada vrtice pr-rotulado e e Cada part cula responsvel por conquistar novos vrtices por e a e meio da constante visita aos mesmos
Fortalece o seu n de dominao no vrtice visitado vel ca e Enfraquece o n de dominao de todos os times rivais naquele vel ca vrtice e
Introduo ca
Algumas Notaes Relevantes (Etapa I) co

p(t) = [p (1) (t), . . . , p (K ) (t)] denota a localizao de todas as ca part culas Ni (t) = [Ni (t), . . . , Ni (t)] indica o nmero de visitas que u o vrtice i recebeu de todas as part e culas no instante t (1) (K ) Ni (t) = [Ni (t), . . . , Ni (t)] revela o n de dominao de vel ca todas as part culas ao vrtice i no instante t, cuja expresso : e a e
(k) (1) (K )
(k) Ni (t)
Ni (t)
(u) K u=1 Ni (t)
Introduo ca
Regra de Atualizao da Energia das Part ca culas (Etapa I)

Quando uma part cula k visita um vrtice i, uma das seguintes e situaes ocorrer: co a
O vrtice visitado dominado por uma part e e cula rival
A energia da part cula k reduzida e
O vrtice dominado pela prpria part e e o cula k

A energia da part cula k fortalecida e
E (k) (t) =
min(max , E (k) (t 1) + ), se proprietario(k, t) max(min , E (k) (t 1) ), se proprietario(k, t)
Estados de uma Part cula Exausto: Indica que a part cula est com a m a nima energia permitida Ativo: Indica que a part cula tem energia suciente para navegar pela rede
Introduo ca
Pol tica de Movimentao das Part ca culas (Etapa I)

A cada passo, a k-sima part e cula realiza uma movimentao ca em consonncia com a seguinte matriz de transio: a ca
Ptrans (t)
(k)
(1 S (k) (t)) Ppref (t) + (1 )Paleat +S (k) (t) Termo Ativo
(k)
P(k) (t) rean Termo Exausto
S (k) (t) atua como uma chave: 0, se a part cula k est ativa no instante t a 1, se a part cula k est exausta no instante t a
Introduo ca
Descrio dos Tipos de Movimentaoes (Etapa I) ca c

Quando a part cula k est ATIVA: a Termo Aleatrio o Comportamento aventureiro No leva em conta os n a veis de dominao ca Invariante no tempo ai,j
V u=1 ai,u
Termo Preferencial Comportamento defensivo Prefere visitar vrtices j doe a minados Variante no tempo
Paleat (i, j)
(k) Ppref (i, j, t)
ai,j Nj (t)
V (k) u=1 ai,u Nu (t)
(k)
Introduo ca
Descrio dos Tipos de Movimentaoes (Etapa I) ca c

Quando a part cula k est EXAUSTA: a
E transportada de volta ao seu territrio com o o intuito de ser recarregada O transporte feito no importando se existe e a uma conexo f a sica na matriz de adjacncia e No modelo, h isonomia no ato de escolha a do vrtice que a part e cula ser transportada a (distribuio uniforme) ca
1
P(k) (i, j, t) rean
V u=1
arg max mK
(m) Nj (t) =k (m) Nu (t) =k
arg max mK
Introduo ca
Sistema Dinmico Estocstico (Etapa I) a a

X (t) = [N(t) p(t) E (t) S(t)]T (k) (k) Ni (t + 1) = Ni (t) + 1{p(k) (t+1)=i} min(max , E (k) (t) + ), se proprietario(k, t + 1) : E (k) (t + 1) = max(min , E (k) (t) ), se proprietario(k, t + 1) (k) S (t + 1) = 1{E (k) (t+1)=min } E qual a expresso para calcular p (k) (t + 1)? e a p (k) (t + 1) dado pela gerao de um nmero aleatrio, cuja distribuio e ca u o ca (k) probabil stica segue a matriz de transio Ptrans (t): ca
Ptrans (t)
(k)
(1 S (k) (t)) Ppref (t) + (1 )Paleat + S (k) (t)P(k) (t) rean
(k)
Introduo ca
Condioes Iniciais (Etapa I) c

p(0): Cada part cula inicia no vrtice o qual representa e N(0): Iniciado a partir da seguinte expresso: a
(k)
Ni (0) =
, se a part cula k representa o vrtice i e 1, caso contrrio a
E (0): Todas as part culas comeam com uma energia c intermediria: a E (k) (0) = min + max min K
S(0): Todas as part culas comeam no estado ativo: c (k) (0) = 0 S

Introduo ca
Contribuioes da Etapa I c
Um descrio rigorosa do modelo competitivo foi realizada por ca meio de um sistema dinmico estocstico no linear a a a
Inexiste tal modelagem na literatura
Generalizao da teoria de caminhada aleatria simples para ca o um modelo matemtico que comporta mltiplas caminhadas a u aleatrias com interao o ca
> 0: mltiplos caminhantes com interao u ca = 0: mltiplos caminhantes sem interao (mltiplas camiu ca u nhadas aleatrias) o
Introduo ca
Proposta de Pesquisa (Etapa II)
ETAPA II Anlise matemtica do modelo de competio semissupervisionado a a ca J foi completada a
Introduo ca
Contribuioes da Etapa II c
Expresses probabil o sticas foram deduzidas a partir do modelo dinmico estocstico a a

Permitem prever o comportamento do sistema dinmico a
Validaes das equaes tericas obtidas, contra o resultado co co o emp rico do modelo, foram conduzidas
Conrmam a anlise terica a o
Introduo ca
Proposta de Pesquisa (Etapa III)
ETAPA III Extenso do modelo competitivo para o aprendizado no supervia a sionado e criao de mecanismos para estimar o nmero de clusca u ters/comunidades de uma base de dados
41 / 52
Introduo ca
Algumas Ideias Iniciais (Etapa III)

Sugere-se mudar as condies iniciais do sistema competitivo: co
Ni (0) =
(k)
2, 1,
se a part cula k for gerada em i caso contrrio a
Para estimar o nmero de clusters/comunidades, o comportamento u da seguinte medida ser estudado: a

R(t) = 1 V
V
(m) max Nu (t)

u=1 mK
R(t) ser baixo quando: a K for maior que o nmero de clusters: mais de uma part u cula dominando um cluster K for menor que o nmero de clusters: uma part u cula dominando mais de um cluster Ideia para estimar nmero de clusters ou comunidades u Usar esse avaliador externo e vericar para que K a quantidade R(t) e maximizada
42 / 52
Introduo ca
Proposta de Pesquisa (Etapa IV)
ETAPA IV Deteco de vrtices e comunidades sobrepostos ca e
43 / 52
Introduo ca
Algumas Ideias Iniciais (Etapa IV)

Sugere-se utilizar a informao gerada pelo prprio processo ca o competitivo para caracterizar e identicar vrtices e comunidae des sobrepostos
Assim, nenhum processo dedicado necessrio e a
Oi (t) = 1 (Mi (1, t) Mi (2, t)) Mi (x, t) produz o x-simo maior n de dominao imposto e vel ca ao vrtice i no tempo t e
Ideia para detectar vrtices e comunidades sobrepostos e Vericar relativamente os vrtices com os maiores valores de Oi (t) e
44 / 52
Introduo ca
Proposta de Pesquisa (Etapa V)
ETAPA V Tratamento da conabilidade dos dados no processo de aprendizado semissupervisionado
45 / 52
Introduo ca
Algumas Ideias Iniciais (Etapa V)

Estudo e Anlise de Propagao de Erros: introduo intencia ca ca onal de vrtices incorretamente rotulados e
Ideias para prevenir ou reduzir a propagao de rtulos errados ca o Utilizar o n de dominao da vizinhana vel ca c Utilizar a distncia mdia percorrida pela part a e cula Utilizar a informao de quantas vezes uma part ca cula se tornou exausta
46 / 52
Introduo ca
Forma de Anlise dos Resultados a
Os resultados obtidos das simulaes sero avaliados quanto `: co a a

Complexidade Computacional Acurcia: benchmarks e bases de dados reais a
Os modelos matemticos sero avaliados quanto ` preciso na a a a a previso dos processos emp a ricos
Mtodos estat e sticos devem gurar em cena para mensurar e validar o desempenho das tcnicas desenvolvidas e
47 / 52
Introduo ca
Cronograma de Atividades
: Incompleta : Completa
Atividade hhhh h 1 2 3 4 5 6 7 8 9
hhhh
Semestre
1S/2010 2S/2010 1S/2011 2S/2011 1S/2012 2S/2012 1S/2013 2S/2013 1 2 3 4 5
Disciplinas (84 crditos) e Pesquisa Bibliogrca a Exame de Qualicao e TOEFL ca Desenvolvimento Terico o Testes e Simulaoes c
6 7 8
Aplicaoes c Gerao de Artigos ca Elaborao de Relatrios (FAca o PESP) Defesa da Tese

48 / 52
Introduo ca
Consideraoes Finais c
Em consonncia ao aumento de dados dispon a veis, o aprendizado semissupervisionado se destaca como um tipo de aprendizado vivel a Conquanto existam inmeras tcnicas presentes na literatura u e concernentes ao aprendizado semissupervisionado, a maioria se fundamenta, essencialmente, em minimizao de funes de ca co energia
49 / 52
Introduo ca
Consideraoes Finais c
Em constraste `s tcnicas tradicionais, aqui, buscam-se mtodos a e e alternativos de soluo, que harmonizem bons resultados com ca baixa complexidade computacional H a expressa preocupao com: a ca
a descrio matemtica do modelo, cujo propsito revelar, ca a o e seno integralmente, grande parte de seu comportamento evoa lucional frente aos parmetros de entrada a a anlise do impacto da propagao de erros, fenmeno oriundo a ca o da insero errada de rtulos, no contexto de aprendizado seca o missupervisionado
50 / 52
Artigos Submetidos, Aceitos e Publicados em Peridicos o
Publicado (Peridico) o
1
T. C. Silva e L. Zhao (2011), Semi-supervised learning guided by the modularity measure in complex networks, Neurocomputing, DOI: 10.1016/j.neucom.2011.04.042
Submetidos (Peridicos) o
1
T. C. Silva e L. Zhao (2011), Network-based stochastic semi-supervised learning, IEEE Transactions on Neural Networks and Learning Systems, em reviso a T. C. Silva e L. Zhao (2011), Network-based high level data classication, IEEE Transactions on Neural Networks and Learning Systems, em reviso a
Artigos Submetidos, Aceitos e Publicados em Congressos

Publicados (Congressos)
1
T. C. Silva e L. Zhao (2011), Network-based learning through particle competition for data clustering, International Joint Conference on Neural Networks (IJCNN2011), pp. 45-52 T. C. Silva e L. Zhao (2011), Semi-supervised learning in complex networks, VIII Encontro Nacional de Inteligncia Articial (ENIA2011), e XXXI Congresso da Sociedade Brasileira de Computao, pp. 406-417. ca T. C. Silva, T. H. Cupertino e L. Zhao (2011), High level classication for pattern recognition, XXIV Sibgrapi Conference on Graphics, Patterns and Images (SIBGRAPI2011) T. C. Silva, T. H. Cupertino e L. Zhao (2011), Stochastic competitive learning applied to handwritten digit and letter clustering, XXIV Sibgrapi Conference on Graphics, Patterns and Images (SIBGRAPI2011) B. Arajo, F. A. Rodrigues, T. C. Silva e L. Zhao (2010), Identifying u abnormal nodes in protein-protein interaction networks, XI Brazilian Symposium on Articial Neural Network (SBRN2010), pp. 97-102
Aceito (Congresso)
1
T. C. Silva e L. Zhao (2011), Uncovering overlapping structures via stochastic competitive learning, X Brazilian Congress on Computational Intelligence (CBIC2011), aceito

Aprendizado Semissupervisionado Via Competição de Partículas em Redes Complexas: Modelagem, Análise e Aplicações

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aprendizado Semissupervisionado Via Competição de Partículas em Redes Complexas: Modelagem, Análise e Aplicações

Enviado por

Direitos autorais:

Formatos disponíveis

Qualicao de Doutorado Direto ca

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

O. Chapelle, B. Schlkopf e A. Zien (2006), Semi-supervised Learning, The MIT Press o 3 / 52

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Figura-se como um tpico pouco estudado na literatura o

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Tcnica: Competio de Part e ca culas

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Motivaoes: Aprendizado Semissupervisionado c

Por que utilizar aprendizado semissupervisionado?

Proposta de Pesquisa e Resultados Obtidos

Motivaoes: Aprendizado Semissupervisionado c

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa e Resultados Obtidos

Classicao Semissupervisionada em Grafos ca

Proposta de Pesquisa e Resultados Obtidos

Motivao para Utilizao de Grafos ca ca

Proposta de Pesquisa e Resultados Obtidos

Discriminative Walks (D-Walks)

onde A a matriz de adjacncia que, pela e e gura, dada por: e 0 1 0 0 0 0 A=

Proposta de Pesquisa e Resultados Obtidos

(i) OBJETIVO: Classicar o vrtice no e a rotulado marcado com ?

(ii) Uma D-Walk sempre inicia e termina em vrtices da mesma classe e

(iii) Uma D-Walk pode percorrer vrtices no rotulados e a

(iv) Uma D-Walk pode percorrer vrtices de outras classes e

Proposta de Pesquisa e Resultados Obtidos

Denio: Betweenness de vrtices no rotulados ca e a

O nmero de passagens no vrtice q dado por: u e e

Proposta de Pesquisa e Resultados Obtidos

Como calcular o betweenness?

Proposta de Pesquisa e Resultados Obtidos

Como reduzir a complexidade do clculo do betweenness? a

Proposta de Pesquisa e Resultados Obtidos

Classicao Final dos Vrtices No Rotulados ca e a

Proposta de Pesquisa e Resultados Obtidos

Classicao Guiada pela Modularidade ca

ki kj/(2m)2 , se i, j forem conectadas caso contrrio a

Proposta de Pesquisa e Resultados Obtidos

Classicao Guiada pela Modularidade ca

Inspirado no algoritmo original, as seguintes modicaes esco truturais foram conduzidas:

Proposta de Pesquisa e Resultados Obtidos

Restrioes em uma Fuso c a

Proposta de Pesquisa e Resultados Obtidos

Restrioes em uma Fuso c a

Neste cenrio, um dos 4 casos abaixo sempre acontecer a a

Proposta de Pesquisa e Resultados Obtidos

Restrioes em uma Fuso c a

Neste cenrio, um dos 4 casos abaixo sempre acontecer a a

Proposta de Pesquisa e Resultados Obtidos

Ultimos Pontos a Destacar da Tcnica e

Proposta de Pesquisa e Resultados Obtidos

Proposta de Pesquisa (Etapa I)

Proposta de Pesquisa e Resultados Obtidos

Descrio da Tcnica (Etapa I) ca e

Proposta de Pesquisa e Resultados Obtidos

Algumas Notaes Relevantes (Etapa I) co