Você está na página 1de 112

Introdução

Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Defesa de Doutorado

Agrupamento de instâncias em classes de equivalência para lidar


com o problema da dimensionalidade em inferência de redes
gênicas

Universidade Federal do ABC


Centro de Matemática, Computação e Cognição (CMCC)

Candidato: Carlos Fernando Montoya Cubas (CMCC-UFABC)


Orientador: David Correa Martins Junior (CMCC-UFABC)

9 de fevereiro de 2021
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 1 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Sumário

Introdução

Conceitos Básicos

Agrupamento de instâncias em classes de equivalência

Resultados experimentais para dados simulados

Resultados para transferência de aprendizado dos graus

Resultados para microarrays de Plasmodium falciparum

Conclusão

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 2 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 1 Introdução

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 3 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Introdução
Controle celular por sinais de expressão gênica (transcrição)

Figura: Controle celular por sinais de expressão gênica (Fonte:


[Martins-Jr., 2008])
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 4 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Introdução
Rede de regulação gênica

Figura: Rede de regulação gênica (Fonte: [Hecker et al., 2009])

A é preditor de A
A é preditor de B
A e B são preditores de C
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 5 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Introdução
Sinais de expressão gênica (transcrição)

t1 t2 t3 ... tM
gene1 3.35 2.12
3.42 ... 1.23
 
gene2 2.46 4.12
5.15 ... 1.33
 
gene3 3.63 4.14
2.18 ... 2.87
 
gene4 3.56 4.16
0.12 ... 1.60
 
gene5 2.12 2.14
3.17 ... 2.12
 
. 
 . 

. 
 . 

.  . 
geneN 3.12 2.72 1.20 ... 0.52
NM
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 6 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Introdução
Motivação

• Entender o comportamento dinâmico dos genes por atuarem


como agentes de controle, regulando grande parte dos
fenômenos que ocorrem nos organismos.
• Controle celular: resultado de atividade multivariada entre
genes.
• Aplicações médicas, tais como:
• Entendimento da biologia do câncer.
• Tratamento de doenças como a AIDS e doenças
neurodegenerativas e do neurodesenvolvimento como a
esquizofrenia, o transtorno do espectro autista (TEA) dentre
outros.
• No contexto atual de pandemia, há um grande esforço mundial
envolvendo o entendimento do novo coronavirus SARS-COV-2
responsável pela COVID-19.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 7 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Introdução
Desafios

Desafios:
• Inferência de parâmetros de uma rede regulatória a partir de
dados experimentais.
• Poucas observações disponíveis (dezenas) para muitas variáveis
(milhares).
• Muitas instâncias não observadas.
• Alto erro de estimação das probabilidades condicionais de um
gene alvo dados seus genes preditores.
• Dados contêm ruído proveniente do processo de obtenção dos
dados de expressão.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 8 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Objetivos
• Objetivo Geral: Amenizar o problema da dimensionalidade no
contexto da inferência de redes gênicas modeladas como redes
discretas.
• Hipótese: Agrupar instâncias (valores) dos genes preditores em
classes de equivalência ajuda na estimação das probabilidades
condicionais.
• Objetivos específicos:
• Análise multiresolução
- Agrupamento de instâncias mal observadas.
• Desenvolver método de busca no reticulado de partições que
devolva a melhor partição (agrupamento).
• Agrupamentos baseados em conhecimento biológico a priori.
• Transferência de aprendizado supervisionado para estimar o
grau correto (dimensão do conjunto de preditores) de um gene
alvo.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 9 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Objetivos
• Objetivo Geral: Amenizar o problema da dimensionalidade no
contexto da inferência de redes gênicas modeladas como redes
discretas.
• Hipótese: Agrupar instâncias (valores) dos genes preditores em
classes de equivalência ajuda na estimação das probabilidades
condicionais.
• Objetivos específicos:
• Análise multiresolução
- Agrupamento de instâncias mal observadas.
• Desenvolver método de busca no reticulado de partições que
devolva a melhor partição (agrupamento).
• Agrupamentos baseados em conhecimento biológico a priori.
• Transferência de aprendizado supervisionado para estimar o
grau correto (dimensão do conjunto de preditores) de um gene
alvo.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 9 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Objetivos
• Objetivo Geral: Amenizar o problema da dimensionalidade no
contexto da inferência de redes gênicas modeladas como redes
discretas.
• Hipótese: Agrupar instâncias (valores) dos genes preditores em
classes de equivalência ajuda na estimação das probabilidades
condicionais.
• Objetivos específicos:
• Análise multiresolução
- Agrupamento de instâncias mal observadas.
• Desenvolver método de busca no reticulado de partições que
devolva a melhor partição (agrupamento).
• Agrupamentos baseados em conhecimento biológico a priori.
• Transferência de aprendizado supervisionado para estimar o
grau correto (dimensão do conjunto de preditores) de um gene
alvo.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 9 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Objetivos
• Objetivo Geral: Amenizar o problema da dimensionalidade no
contexto da inferência de redes gênicas modeladas como redes
discretas.
• Hipótese: Agrupar instâncias (valores) dos genes preditores em
classes de equivalência ajuda na estimação das probabilidades
condicionais.
• Objetivos específicos:
• Análise multiresolução
- Agrupamento de instâncias mal observadas.
• Desenvolver método de busca no reticulado de partições que
devolva a melhor partição (agrupamento).
• Agrupamentos baseados em conhecimento biológico a priori.
• Transferência de aprendizado supervisionado para estimar o
grau correto (dimensão do conjunto de preditores) de um gene
alvo.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 9 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Objetivos
• Objetivo Geral: Amenizar o problema da dimensionalidade no
contexto da inferência de redes gênicas modeladas como redes
discretas.
• Hipótese: Agrupar instâncias (valores) dos genes preditores em
classes de equivalência ajuda na estimação das probabilidades
condicionais.
• Objetivos específicos:
• Análise multiresolução
- Agrupamento de instâncias mal observadas.
• Desenvolver método de busca no reticulado de partições que
devolva a melhor partição (agrupamento).
• Agrupamentos baseados em conhecimento biológico a priori.
• Transferência de aprendizado supervisionado para estimar o
grau correto (dimensão do conjunto de preditores) de um gene
alvo.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 9 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Objetivos
• Objetivo Geral: Amenizar o problema da dimensionalidade no
contexto da inferência de redes gênicas modeladas como redes
discretas.
• Hipótese: Agrupar instâncias (valores) dos genes preditores em
classes de equivalência ajuda na estimação das probabilidades
condicionais.
• Objetivos específicos:
• Análise multiresolução
- Agrupamento de instâncias mal observadas.
• Desenvolver método de busca no reticulado de partições que
devolva a melhor partição (agrupamento).
• Agrupamentos baseados em conhecimento biológico a priori.
• Transferência de aprendizado supervisionado para estimar o
grau correto (dimensão do conjunto de preditores) de um gene
alvo.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 9 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 2 Conceitos Básicos

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 10 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Modelagem de redes gênicas – Contextualização

• Redes Booleanas (BN) [Kauffman et al., 1969]


• Redes Booleanas Probabilísticas (PBN) [Shmulevich et al., 2002]
• Redes Gênicas Probabilísticas (PGN) [Barrera et al., 2007]

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 11 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Modelagem de redes gênicas – Redes Booleanas (BN)

Figura: Exemplo de estrutura básica de uma rede booleana. A e B:


preditores. X: alvo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 12 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Modelagem de redes gênicas – Redes Booleanas Probabilísticas (PBN)

Figura: Exemplo de estrutura básica de uma rede booleana probabilística


(PBN). N1 e N2: preditores. N3: alvo. Fonte: [Trairatphisan et al., 2014]
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 13 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Modelagem de redes gênicas – Redes Gênicas Probabilísticas (PGN)

• Redes Gênicas Probabilísticas (PGN): modelo adotado neste


trabalho;
• PGNs são PBNs com algumas restrições baseadas em
hipóteses simplificadoras (axiomas):
i independência condicional: o comportamento de cada gene é
determinado por uma função que depende apenas de um
subconjunto de genes preditores
ii cadeia de Markov de primeira ordem: o próximo estado do
sistema depende apenas do estado anterior
iii função de transição homogênea: sempre a mesma ao longo do
tempo
iv quasi-determinismo: de qualquer estado, existe um próximo
estado preferencial
v funções preditoras são caracterizadas por combinações lineares
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 14 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Inferência de redes gênicas

Problema: Como medir o grau de dependência de um gene em


relação aos outros?

g1
? g3
g2

Abordagem: Identificar os genes preditores de um gene alvo, e


predizer o valor desse gene alvo dados os valores de seus genes
preditores é um problema de Reconhecimento de Padrões
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 15 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Inferência de redes gênicas

Problema: Como medir o grau de dependência de um gene em


relação aos outros?

g1
? g3
g2

Abordagem: Identificar os genes preditores de um gene alvo, e


predizer o valor desse gene alvo dados os valores de seus genes
preditores é um problema de Reconhecimento de Padrões
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 15 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Reconhecimento de padrões

Padrão: x = [x1 .x2 , ..., xn ] Classe: y

x2
y
x1
..
.
xn

• Foco: Classificação supervisionada (y conhecido no conjunto


de treinamento)
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 16 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Reconhecimento de padrões

Padrão: x = [x1 .x2 , ..., xn ] Classe: y

x2
y
x1
..
.
xn

• Foco: Classificação supervisionada (y conhecido no conjunto


de treinamento)
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 16 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Função critério: Entropia condicional média

Entropia baixa Entropia alta


(Fonte: [Martins-Jr., 2008])

• Minimizar entropia

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 17 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Inferência de redes de regulação gênica – Tabela de frequências

Tabela de frequências
g1 g2 f (Y = 0) f (Y = 1)

0 0 1 0
0 1 0 0
1 0 0 0
1 1 0 0

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 18 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Inferência de redes de regulação gênica – Tabela de frequências

Tabela de frequências
g1 g2 f (Y = 0) f (Y = 1)

0 0 1 0
0 1 0 0
1 0 0 0
1 1 0 1

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 18 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Inferência de redes de regulação gênica – Tabela de frequências

Tabela de frequências
g1 g2 f (Y = 0) f (Y = 1)

0 0 9 2
0 1 1 7
1 0 0 3
1 1 1 4

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 18 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conceitos Básicos
Inferência de redes de regulação gênica – Problema da dimensionalidade

Tabela: Problema da dimensionalidade: o número de instâncias


(histogramas de frequências a serem estimadas) cresce exponencialmente
com o número de preditores → instâncias mal observadas
g1 g2 g3 f (Y = 0) f (Y = 1)
0 0 0 3 4
0 0 1 0 0
0 1 0 1 0
0 1 1 0 0
1 0 0 2 1
1 0 1 0 0
1 1 0 0 1
1 1 1 1 5
Total 7 11
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 19 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 3 Agrupamento de instâncias em classes de


equivalência

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 20 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Problema de busca no reticulado de partições

Figura: Reticulado de partições (agrupamentos) para um conjunto de


n = 4 instâncias {00, 01, 10, 11} representando possíveis agrupamentos
para k = 2 preditores Booleanos.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 21 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Problema de busca no reticulado de partições

# preditores # instâncias # agrupamentos


2 22 = 4 15
3 23 = 8 4.140
4 24 = 16 10.480.142.147
5 25 = 32 128.064.670.052.407.582.646.900.609
Tabela: Crescimento superexponencial do número de partições
(agrupamentos) em função do número de preditores considerando
preditores binários.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 22 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento Linear (LG)

Definir vetores de coeficientes A em {−1, +1}n


Combinações lineares
L = a1 X1 + a2 X2 + ..., +an Xn
ai = −1 Inibição.
ai = +1 Ativação.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 23 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento Linear (LG) - Representação de uma partição

Agrupamento Linear
• Define k + 1
hiperplanos de corte no
reticulado.
• Redução da
dimensionalidade de 2k
para k + 1.
Figura: Corte no reticulado
Booleano representando uma das
possíveis partições lineares
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 24 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento Linear (LG) - Exemplo de agrupamento

Agrupamento com (a1 , a2 , a3 ) = (−1, −1, −1)

Tabela: Sem agrupamento


L x1 x2 x3 f (Y = 0) f (Y = 1) Tabela: Com agrupamento
0 0 0 0 3 4
-1 0 0 1 0 0 L= −1x1 − 1x2 − 1x3 f (Y = 0) f (Y = 1)
-1 0 1 0 1 0 0 000 3 4
-2 0 1 1 0 0 -1 001,010,100 3 1
-1 1 0 0 2 1 -2 011,101,110 0 1
-2 1 0 1 0 0 -3 111 1 5
-2 1 1 0 0 1 Total 7 11
-3 1 1 1 1 5
Total 7 11

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 25 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por SFS no Reticulado de Partições (GLSFS)

• Serão explorados entre n2 e n3 possíveis agrupamentos (para


n = 8 → no máximo 84 de 4.140), sendo n o número de
instâncias.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 26 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento de instâncias em classes de equivalência


Agrupamento por canalização (CG)
• Agrupamento por canalização (LG)
• Um estado de um dos genes preditores determina (canaliza) o
estado do gene alvo.
• Exemplo: X1 = 0 canaliza o estado Y = 0
(X1 = 0 =⇒ Y = 0)

Tabela: Sem agrupamento


x1 x2 x3 f (Y = 0) f (Y = 1)
Tabela: Com agrupamento
0 0 0 3 0
Grupos f (Y = 0) f (Y = 1)
0 0 1 0 0
000,001,010,011 4 0
0 1 0 1 0
100 2 1
0 1 1 0 0
101 0 4
1 0 0 2 1
110 0 1
1 0 1 0 4
111 1 5
1 1 0 0 1
Total 7 11
1 1 1 1 5
Total 7 11

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 27 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agrupamento em classes de equivalência


Comparação dos números de partições exploradas para k = 3 preditores

Método # partições exploradas


sem agrupamento (SA) 1
agrupamento linear (LG) 4
agrupamento por SFS no reticulado (GLSFS) 84
agrupamento por canalização (CG) 6
Total de partições 4.140
Tabela: Número de partições exploradas por método para k = 3
preditores (23 = 8 instâncias).

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 28 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 4 Resultados experimentais para dados


simulados

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 29 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Protocolo experimental

Tabela: Parâmetros adotados nos experimentos.


Parâmetro Valores
Tamanho da rede gabarito (número de genes n) 50
Grau médio da rede gabarito hkgab i {3}
Número de amostras (tamanho do sinal m) {30,50}
Probabilidades das funções das PBNs (0, 98; 0, 02)
Topologias das Redes Erdös-Rényi
Número de redes 250
Conjunto de amostras geradas por rede 4
Função critério Informação Mutua

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 30 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Siglas dos métodos considerados

• SA: sem agrupamento


• LG: agrupamento linear
• GLSFS: agrupamento por busca sequencial para frente no
reticulado de partições
• CG: agrupamento por canalização

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 31 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica

Tabela: Matriz de adjacência Gabarito Tabela: Matriz de adjacência Inferida

0 1 0 0 1 0 0 0 0 1
1 0 0 1 0 1 0 0 1 0
0 1 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 1 0 0

TP Verdadeiro Positivo

TN Verdadeiro Negativo

FP Falso Positivo

FN Falso Negativo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 32 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica

Tabela: Matriz de adjacência Gabarito Tabela: Matriz de adjacência Inferida

0 1 0 0 1 0 0 0 0 1
1 0 0 1 0 1 0 0 1 0
0 1 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 1 0 0

TP Verdadeiro Positivo

TN Verdadeiro Negativo

FP Falso Positivo

FN Falso Negativo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 32 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica

Tabela: Matriz de adjacência Gabarito Tabela: Matriz de adjacência Inferida

0 1 0 0 1 0 0 0 0 1
1 0 0 1 0 1 0 0 1 0
0 1 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 1 0 0

TP Verdadeiro Positivo

TN Verdadeiro Negativo

FP Falso Positivo

FN Falso Negativo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 32 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica

Tabela: Matriz de adjacência Gabarito Tabela: Matriz de adjacência Inferida

0 1 0 0 1 0 0 0 0 1
1 0 0 1 0 1 0 0 1 0
0 1 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 1 0 0

TP Verdadeiro Positivo

TN Verdadeiro Negativo

FP Falso Positivo

FN Falso Negativo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 32 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica

Tabela: Matriz de adjacência Gabarito Tabela: Matriz de adjacência Inferida

0 1 0 0 1 0 0 0 0 1
1 0 0 1 0 1 0 0 1 0
0 1 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 1 0 0

TP Verdadeiro Positivo

TN Verdadeiro Negativo

FP Falso Positivo

FN Falso Negativo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 32 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica

Tabela: Matriz de adjacência Gabarito Tabela: Matriz de adjacência Inferida

0 1 0 0 1 0 0 0 0 1
1 0 0 1 0 1 0 0 1 0
0 1 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 1 0 0

TP Verdadeiro Positivo

TN Verdadeiro Negativo

FP Falso Positivo

FN Falso Negativo

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 32 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação topológica: F-SCORE

2TP
F − SCORE =
2TP + FP + FN

• Note que não leva em conta TN, já que a matriz de adjacência


é esparsa

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 33 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Avaliação topológica: F-Scores para redes com funções de canalização
30 50

1.00

0.75
F−SCORE

0.50

0.25

0.00
SA

LG

GLSFS

CG

SA

LG

GLSFS

CG
Métodos de agrupamento

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 34 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Critério adotado para avaliação da dinâmica: Taxa de acerto

• 1000 estados iniciais sorteados


• G: próximo estado obtido pela rede Gabarito
• I: próximo estado obtido pela rede Inferida
• Taxa de acerto: % de bits iguais
(1 - Distância de Hamming normalizada)

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 35 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Avaliação da dinâmica: Taxas de acerto para redes com funções de canalização
30 50

1.0

0.9

0.8
Taxa de acerto

0.7

0.6

0.5
SA

LG

GLSFS

CG

SA

LG

GLSFS

CG
Métodos de agrupamento

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 36 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Avaliação dos graus (dimensões) dos conjuntos de preditores inferidos

• Matriz de confusão
• Erro quadrático médio

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 37 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Avaliação dos graus (dimensões) - Matrizes de confusão dos graus

Gabarito SA LG GLSFS CG

30
3

2
Grau Gabarito

50
3

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Grau Inferência

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 38 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Avaliação dos graus (dimensões) - Sumário das matrizes de confusão

Tabela: Grau médio (GM) e erro quadrático médio (EQM)

Método GM.30 EQM.30 GM.50 EQM.50


Gabarito 2.897 — 2.897 —
SA 2.850 0.676 3.313 0.995
LG 2.850 0.695 3.147 1.026
GLSFS 2.850 0.676 3.313 0.995
CG 3.048 0.805 3.378 1.149

• Problema: Maior número de amostras =⇒


Superestimação dos graus!

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 39 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados experimentais para dados simulados


Problema: Superestimação dos graus

• Problema: Maior número de amostras =⇒


Superestimação dos graus!
• Solução: Transferência de aprendizado supervisionado dos
graus via redes simuladas

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 40 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 5 Resultados para transferência de


aprendizado dos graus

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 41 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Método de transferência de aprendizado dos graus


• Geração de PBNs: Gerar aleatoriamente diversas PBNs com as
mesmas características das redes a inferir.
• Geração de conjuntos de amostras: Para cada PBN, gerar um
conjuntos de amostras de tamanho M
• cada amostra consiste de um par (S, Φ(S))
• Aplicação de um algoritmo de seleção de características:
Aplicar um algoritmo de seleção de características para cada
gene Y ,e obter o perfil de evolução da função critério
F = f1 , f2 , ..., fmax
• Associar o perfil de evolução ao grau certo:
Vi = f1 , f2 , ..., fmax , gc .
• Treinar algoritmos de classificação supervisionada para associar
conjuntos de perfis aos seus respectivos rótulos.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 42 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Método de transferência de aprendizado dos graus


• Geração de PBNs: Gerar aleatoriamente diversas PBNs com as
mesmas características das redes a inferir.
• Geração de conjuntos de amostras: Para cada PBN, gerar um
conjuntos de amostras de tamanho M
• cada amostra consiste de um par (S, Φ(S))
• Aplicação de um algoritmo de seleção de características:
Aplicar um algoritmo de seleção de características para cada
gene Y ,e obter o perfil de evolução da função critério
F = f1 , f2 , ..., fmax
• Associar o perfil de evolução ao grau certo:
Vi = f1 , f2 , ..., fmax , gc .
• Treinar algoritmos de classificação supervisionada para associar
conjuntos de perfis aos seus respectivos rótulos.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 42 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Método de transferência de aprendizado dos graus


• Geração de PBNs: Gerar aleatoriamente diversas PBNs com as
mesmas características das redes a inferir.
• Geração de conjuntos de amostras: Para cada PBN, gerar um
conjuntos de amostras de tamanho M
• cada amostra consiste de um par (S, Φ(S))
• Aplicação de um algoritmo de seleção de características:
Aplicar um algoritmo de seleção de características para cada
gene Y ,e obter o perfil de evolução da função critério
F = f1 , f2 , ..., fmax
• Associar o perfil de evolução ao grau certo:
Vi = f1 , f2 , ..., fmax , gc .
• Treinar algoritmos de classificação supervisionada para associar
conjuntos de perfis aos seus respectivos rótulos.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 42 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Método de transferência de aprendizado dos graus


• Geração de PBNs: Gerar aleatoriamente diversas PBNs com as
mesmas características das redes a inferir.
• Geração de conjuntos de amostras: Para cada PBN, gerar um
conjuntos de amostras de tamanho M
• cada amostra consiste de um par (S, Φ(S))
• Aplicação de um algoritmo de seleção de características:
Aplicar um algoritmo de seleção de características para cada
gene Y ,e obter o perfil de evolução da função critério
F = f1 , f2 , ..., fmax
• Associar o perfil de evolução ao grau certo:
Vi = f1 , f2 , ..., fmax , gc .
• Treinar algoritmos de classificação supervisionada para associar
conjuntos de perfis aos seus respectivos rótulos.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 42 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para transferência de aprendizado dos graus


Siglas

• IM: avaliação da evolução da Informação Mútua como critério


de parada para definição do grau (sem aprendizado)
• KNN: Aprendizado supervisionado dos graus via geração de
redes simuladas por K Nearest Neighbors (vizinhos mais
próximos)

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 43 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para transferência de aprendizado dos graus


Matrizes de confusão para 30 amostras – Redes com funções de canalização
Gabarito SA LG GLSFS CG

IM
3

2
Grau Gabarito

KNN
3

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Grau Inferência

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 44 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para transferência de aprendizado dos graus


Matrizes de confusão para 50 amostras – Redes com funções de canalização
Gabarito SA LG GLSFS CG

IM
3

2
Grau Gabarito

KNN
3

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Grau Inferência

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 45 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para transferência de aprendizado dos graus


Sumário das matrizes de confusão

Tabela: Grau médio (GM) e erro quadrático médio (EQM)

Método KNN - IM GM.30 EQM.30 GM.50 EQM.50


Gabarito 2.897 — 2.897 —
SA IM 2.850 0.676 3.313 0.995
SA KNN 2.655 0.604 2.852 0.370
LG IM 2.850 0.695 3.147 1.026
LG KNN 2.663 0.614 2.712 0.471
GLSFS IM 2.850 0.676 3.313 0.995
GLSFS KNN 2.647 0.611 2.846 0.362
CG IM 3.048 0.805 3.378 1.149
CG KNN 2.717 0.724 2.812 0.480
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 46 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para transferência de aprendizado dos graus


Avaliação topológica: F-Scores para redes com funções de canalização
SA LG GLSFS CG

1.00

0.75

30
0.50

0.25
FSCORE

0.00

1.00

0.75

50
0.50

0.25

0.00
IM

KNN

IM

KNN

IM

KNN

IM

KNN
Ajuste de Grau

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 47 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para transferência de aprendizado dos graus


Avaliação da dinâmica: Taxas de acerto para redes com funções de canalização
SA LG GLSFS CG

1.0

0.9

0.8

30
0.7

0.6
Taxa de acerto

0.5

1.0

0.9

0.8

50
0.7

0.6

0.5
IM

KNN

IM

KNN

IM

KNN

IM

KNN
Ajuste de Grau

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 48 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 6 Resultados para microarrays de Plasmodium


falciparum

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 49 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Dados de microarrays de Plasmodium falciparum

Tabela: Características dos microarrays de Plasmodium falciparum


Característica Valores
Tamanho da rede 5080 genes
Número de amostras temporais 46 amostras
Níveis de quantização {0, 1} e {−1, 0, 1}

(Fonte: [Bozdech et al., 2003].)

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 50 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação topológica: protocolo experimental

Tabela: Protocolo experimental


Parâmetro Valores
Algoritmo de busca Busca Exaustiva até d = 2, SFS até d = 6
- Via glicolítica (nós amarelos).
Genes Alvos
- Plastídeo - apicoplasto (nós verdes)
Recorte da rede ”Pais”, ”avôs”, e ”filhos” dos genes alvos.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 51 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação topológica: vizinhança ao redor dos genes sementes

(A) Sem Agrupamento (SA) (B) Agrupamento Linear (LG)

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 52 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação topológica: vizinhança ao redor dos genes sementes

(A) Sem Agrupamento (SA) (C) Agrupamento por GLSFS

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 52 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação topológica: vizinhança ao redor dos genes sementes

(A) Sem Agrupamento (SA) (D) Agrupamento por Canalização (CG)

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 52 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Transferência de aprendizado dos graus: protocolo experimental

Tabela: Protocolo experimental

Parâmetro Valores
Classificador k-nn
- 250 redes artificiais com 50 genes (funções aleatórias)
- Topologia Erdös-Renyi
Dados treinamento
- Grau médio hkgab i = 3;
- 4 conjunto de dados com 50 amostras temporais
- Via glicolítica (nós amarelos).
Genes Alvos
- Plastídeo - apicoplasto (nós verdes)
Recorte da rede ”Pais”, ”avôs”, e ”filhos” dos genes alvos.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 53 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Transferência de aprendizado dos graus: vizinhança ao redor dos genes sementes

Sem Agrupamento (SA) - IM Sem Agrupamento (SA) - KNN

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 54 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Transferência de aprendizado dos graus: vizinhança ao redor dos genes sementes

Agrupamento Linear (LG) - IM Agrupamento Linear (LG) - KNN

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 54 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Transferência de aprendizado dos graus: vizinhança ao redor dos genes sementes

Agrupamento por GLSFS - IM Agrupamento por GLSFS - KNN

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 54 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Transferência de aprendizado dos graus: vizinhança ao redor dos genes sementes

Agrupamento por Canalização (CG) - IM Agrupamento por Canalização (CG) - KNN

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 54 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação da dinâmica: protocolo experimental

Tabela: Protocolo experimental

Parâmetro Valores
Algoritmo de busca Busca Exaustiva até d = 2, SFS até d = 6
- Classificador k-nn
- Redes artificiais com 50 genes
Transferência de aprendizado - Topologia Erdös-Renyi
- Grau médio hkgab i = 3
- 4 conjunto de dados com 50 amostras temporais
- Numero de janelas: 5 janelas
Validação cruzada - Dados de treinamento 38 amostras
- Dados de teste: quatro de 8 e uma de 6
Método de validação Taxa de acerto nos dados de teste.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 55 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação da dinâmica: evolução temporal das taxas de acerto

1.0

0.9
Taxa de acerto

Método
0.8 SA
LG

0.7 CG
GLSFS

0.6

0.5

1 2 3 4 5 6 7 8
Tempo
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 56 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Resultados para microarrays de Plasmodium falciparum


Avaliação da dinâmica: evolução temporal das taxas de acerto - SA (IM X KNN)
Taxa de acerto

0.8

IM
KNN

0.7

1 2 3 4 5 6 7 8
Tempo
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 57 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Seção 7 Conclusão

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 58 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Apesar dos métodos de agrupamento apresentarem perda de


informação ao mapear as instâncias originais para um conjunto
menor de instâncias agrupadas, embutir informação a priori
sobre os tipos de funções que sejam frequentes em redes
gênicas reais levou a melhores resultados em comparação ao
método original sem agrupamento
• tanto do ponto de vista topológico, como do ponto de vista da
dinâmica em redes simuladas compostas por funções com estas
caraterísticas
• do ponto de vista topológico para dados de microarray do
Plasmodium falciparum

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 59 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Apesar dos métodos de agrupamento apresentarem perda de


informação ao mapear as instâncias originais para um conjunto
menor de instâncias agrupadas, embutir informação a priori
sobre os tipos de funções que sejam frequentes em redes
gênicas reais levou a melhores resultados em comparação ao
método original sem agrupamento
• tanto do ponto de vista topológico, como do ponto de vista da
dinâmica em redes simuladas compostas por funções com estas
caraterísticas
• do ponto de vista topológico para dados de microarray do
Plasmodium falciparum

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 59 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Apesar dos métodos de agrupamento apresentarem perda de


informação ao mapear as instâncias originais para um conjunto
menor de instâncias agrupadas, embutir informação a priori
sobre os tipos de funções que sejam frequentes em redes
gênicas reais levou a melhores resultados em comparação ao
método original sem agrupamento
• tanto do ponto de vista topológico, como do ponto de vista da
dinâmica em redes simuladas compostas por funções com estas
caraterísticas
• do ponto de vista topológico para dados de microarray do
Plasmodium falciparum

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 59 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Todos os métodos de agrupamento desenvolvidos tenderam a


superestimar os graus dos genes, introduzindo falsos positivos
que impactam negativamente os resultados topológicos e as
dinâmicas geradas pelas redes inferidas.
• O método de transferência de aprendizado supervisionado dos
graus (dimensões) via redes simuladas aliviou
consideravelmente o problema da superestimação dos graus, o
que induziu a uma melhora da qualidade das redes inferidas
para todos os métodos

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 60 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Todos os métodos de agrupamento desenvolvidos tenderam a


superestimar os graus dos genes, introduzindo falsos positivos
que impactam negativamente os resultados topológicos e as
dinâmicas geradas pelas redes inferidas.
• O método de transferência de aprendizado supervisionado dos
graus (dimensões) via redes simuladas aliviou
consideravelmente o problema da superestimação dos graus, o
que induziu a uma melhora da qualidade das redes inferidas
para todos os métodos

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 60 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Para os dados de microarray de Plasmodium falciparum:


• A transferência de aprendizado dos graus levou a redes um
pouco mais intramodulares (mais conexões dentro de um
mesmo módulo) e menos conexões conectando os módulos
distintos, sugerindo um melhor desempenho;
• Já do ponto de vista da dinâmica gerada pelas redes inferidas,
apenas os métodos original (sem agrupamento) e o de
agrupamento por canalização obtiveram alguma melhora
perceptível com a transferência de aprendizado dos graus.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 61 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Considerações finais

• Para os dados de microarray de Plasmodium falciparum:


• A transferência de aprendizado dos graus levou a redes um
pouco mais intramodulares (mais conexões dentro de um
mesmo módulo) e menos conexões conectando os módulos
distintos, sugerindo um melhor desempenho;
• Já do ponto de vista da dinâmica gerada pelas redes inferidas,
apenas os métodos original (sem agrupamento) e o de
agrupamento por canalização obtiveram alguma melhora
perceptível com a transferência de aprendizado dos graus.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 61 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Trabalhos futuros

• Investigar outros tipos de agrupamento biologicamente


inspirados, por exemplo agrupamentos por funções de
canalização aninhadas (n−canalizadoras)
• Testar o método de agrupamento linear para outros conjuntos
de pesos (por exemplo {−2, −1, 0, +1, +2}), projetando um
método que combine vários conjuntos de pesos e defina aquele
que obtiver o melhor desempenho
• Projetar um classificador que tente obter a priori o tipo de
função mais provável dado o perfil de expressão, de modo a
obter um método hibrido que aplique um tipo de agrupamento
sob demanda

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 62 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Trabalhos futuros

• Investigar outros tipos de agrupamento biologicamente


inspirados, por exemplo agrupamentos por funções de
canalização aninhadas (n−canalizadoras)
• Testar o método de agrupamento linear para outros conjuntos
de pesos (por exemplo {−2, −1, 0, +1, +2}), projetando um
método que combine vários conjuntos de pesos e defina aquele
que obtiver o melhor desempenho
• Projetar um classificador que tente obter a priori o tipo de
função mais provável dado o perfil de expressão, de modo a
obter um método hibrido que aplique um tipo de agrupamento
sob demanda

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 62 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Trabalhos futuros

• Investigar outros tipos de agrupamento biologicamente


inspirados, por exemplo agrupamentos por funções de
canalização aninhadas (n−canalizadoras)
• Testar o método de agrupamento linear para outros conjuntos
de pesos (por exemplo {−2, −1, 0, +1, +2}), projetando um
método que combine vários conjuntos de pesos e defina aquele
que obtiver o melhor desempenho
• Projetar um classificador que tente obter a priori o tipo de
função mais provável dado o perfil de expressão, de modo a
obter um método hibrido que aplique um tipo de agrupamento
sob demanda

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 62 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Trabalhos futuros

• Explorar alternativas ao algoritmo de busca no reticulado de


partições (GLSFS), por exemplo, com funções critérios de
agrupamento de instâncias por distância de Hamming miníma,
e com outros algoritmos de busca eficientes (eg. SFFS);
• Buscar melhorar a estratégia de transferência de aprendizado
dos graus, acrescentando mais caraterísticas biológicas ao
conjunto de treinamento, como modelos topológicos
Barabási-Albert e mundo pequeno (small world ), assim como
otimizar os parâmetros do classificador;
• Testar as contribuições desta tese em outras aplicações de
reconhecimento de padrões e aprendizado de máquina,
envolvendo conjuntos de dados de alta dimensionalidade e um
número limitado de amostras.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 63 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Trabalhos futuros

• Explorar alternativas ao algoritmo de busca no reticulado de


partições (GLSFS), por exemplo, com funções critérios de
agrupamento de instâncias por distância de Hamming miníma,
e com outros algoritmos de busca eficientes (eg. SFFS);
• Buscar melhorar a estratégia de transferência de aprendizado
dos graus, acrescentando mais caraterísticas biológicas ao
conjunto de treinamento, como modelos topológicos
Barabási-Albert e mundo pequeno (small world ), assim como
otimizar os parâmetros do classificador;
• Testar as contribuições desta tese em outras aplicações de
reconhecimento de padrões e aprendizado de máquina,
envolvendo conjuntos de dados de alta dimensionalidade e um
número limitado de amostras.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 63 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Trabalhos futuros

• Explorar alternativas ao algoritmo de busca no reticulado de


partições (GLSFS), por exemplo, com funções critérios de
agrupamento de instâncias por distância de Hamming miníma,
e com outros algoritmos de busca eficientes (eg. SFFS);
• Buscar melhorar a estratégia de transferência de aprendizado
dos graus, acrescentando mais caraterísticas biológicas ao
conjunto de treinamento, como modelos topológicos
Barabási-Albert e mundo pequeno (small world ), assim como
otimizar os parâmetros do classificador;
• Testar as contribuições desta tese em outras aplicações de
reconhecimento de padrões e aprendizado de máquina,
envolvendo conjuntos de dados de alta dimensionalidade e um
número limitado de amostras.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 63 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Função critério de seleção de características baseada na


informação mútua normalizada pela dimensão;
• Reformulação do problema de agrupamento de instâncias
como um problema de busca no espaço de partições;
• Proposta de um método de agrupamento linear de instâncias
baseado na hipótese de linearidade nas funções de predição;
• Proposta de um método de agrupamento de instâncias baseado
em busca sequencial para frente no reticulado de partições;
• Proposta de um método de agrupamento de instâncias
baseado na hipótese de presença de canalização nas funções de
predição;
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 64 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Função critério de seleção de características baseada na


informação mútua normalizada pela dimensão;
• Reformulação do problema de agrupamento de instâncias
como um problema de busca no espaço de partições;
• Proposta de um método de agrupamento linear de instâncias
baseado na hipótese de linearidade nas funções de predição;
• Proposta de um método de agrupamento de instâncias baseado
em busca sequencial para frente no reticulado de partições;
• Proposta de um método de agrupamento de instâncias
baseado na hipótese de presença de canalização nas funções de
predição;
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 64 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Função critério de seleção de características baseada na


informação mútua normalizada pela dimensão;
• Reformulação do problema de agrupamento de instâncias
como um problema de busca no espaço de partições;
• Proposta de um método de agrupamento linear de instâncias
baseado na hipótese de linearidade nas funções de predição;
• Proposta de um método de agrupamento de instâncias baseado
em busca sequencial para frente no reticulado de partições;
• Proposta de um método de agrupamento de instâncias
baseado na hipótese de presença de canalização nas funções de
predição;
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 64 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Função critério de seleção de características baseada na


informação mútua normalizada pela dimensão;
• Reformulação do problema de agrupamento de instâncias
como um problema de busca no espaço de partições;
• Proposta de um método de agrupamento linear de instâncias
baseado na hipótese de linearidade nas funções de predição;
• Proposta de um método de agrupamento de instâncias baseado
em busca sequencial para frente no reticulado de partições;
• Proposta de um método de agrupamento de instâncias
baseado na hipótese de presença de canalização nas funções de
predição;
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 64 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Função critério de seleção de características baseada na


informação mútua normalizada pela dimensão;
• Reformulação do problema de agrupamento de instâncias
como um problema de busca no espaço de partições;
• Proposta de um método de agrupamento linear de instâncias
baseado na hipótese de linearidade nas funções de predição;
• Proposta de um método de agrupamento de instâncias baseado
em busca sequencial para frente no reticulado de partições;
• Proposta de um método de agrupamento de instâncias
baseado na hipótese de presença de canalização nas funções de
predição;
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 64 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Proposta de um método de transferência do aprendizado das


dimensões (graus) dos genes sobre redes geradas
artificialmente, para um cenário de dados reais; (microarrays
temporais de Plasmodium falciparum);
• Publicação do artigo [Montoya-Cubas et al., 2015] sobre o
método de agrupamento linear e variantes propostas, bem
como uma avaliação desse método em dados simulados e
dados reais do Plasmodium falciparum;
• Finalização de um artigo a ser submetido no periódico
Bioinformatics sobre os métodos de agrupamento
desenvolvidos, bem como a estratégia de transferência de
aprendizado supervisionado dos graus com base em redes
simuladas geradas artificialmente.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 65 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Proposta de um método de transferência do aprendizado das


dimensões (graus) dos genes sobre redes geradas
artificialmente, para um cenário de dados reais; (microarrays
temporais de Plasmodium falciparum);
• Publicação do artigo [Montoya-Cubas et al., 2015] sobre o
método de agrupamento linear e variantes propostas, bem
como uma avaliação desse método em dados simulados e
dados reais do Plasmodium falciparum;
• Finalização de um artigo a ser submetido no periódico
Bioinformatics sobre os métodos de agrupamento
desenvolvidos, bem como a estratégia de transferência de
aprendizado supervisionado dos graus com base em redes
simuladas geradas artificialmente.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 65 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Conclusão
Síntese das contribuições

• Proposta de um método de transferência do aprendizado das


dimensões (graus) dos genes sobre redes geradas
artificialmente, para um cenário de dados reais; (microarrays
temporais de Plasmodium falciparum);
• Publicação do artigo [Montoya-Cubas et al., 2015] sobre o
método de agrupamento linear e variantes propostas, bem
como uma avaliação desse método em dados simulados e
dados reais do Plasmodium falciparum;
• Finalização de um artigo a ser submetido no periódico
Bioinformatics sobre os métodos de agrupamento
desenvolvidos, bem como a estratégia de transferência de
aprendizado supervisionado dos graus com base em redes
simuladas geradas artificialmente.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 65 / 67
Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Agradecimentos

• Bolsa CAPES – Código de Financiamento 001


• Universidade Federal do ABC.
• Prof. David Correa Martins Jr, pelo assessoramento neste
trabalho.
• Rodrigo Cesar Bonini, pela colaboração em relação a estratégia
de transferência de aprendizado e a correção do texto da tese.

Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 66 / 67


Introdução
Conceitos Básicos
Agrupamento de instâncias em classes de equivalência
Resultados experimentais para dados simulados
Resultados para transferência de aprendizado dos graus Universidade Federal do ABC
Resultados para microarrays de Plasmodium falciparum
Conclusão

Referências
Bishop, C. M. (2006).
Pattern Recognition and Machine Learning.
Springer.

Hecker, M., Lambeck, S., Toepfer, S., van Someren, E., and Guthke, R. (2009).
Gene regulatory network inference: data integration in dynamic models-a review.
Biosystems, 96:86–103.

Kauffman, S. A. (1969).
Homeostasis and differentiation in random genetic control networks.
Nature, 224(215):177–178.

Martins-Jr., D. C. (2008).
Seleção de características e predição intrinsecamente multivariada em identificação de redes de
regulação gênica.
PhD thesis, Instituto de Matemática e Estatística - Universidade de São Paulo, Rua do Matão,
1010.
Montoya-Cubas, C. F., Martins-Jr, D. C., Santos, C. S., and Barrera, J. (2015).
Linear grouping of predictor instances to infer gene networks.
Network Modeling Analysis in Health Informatics and Bioinformatics, 4:34.

Reis, M. S. (2012).
Minimização de curvas decomponíveis em curvas em U definidas sobre cadeias de posets -
algoritmos e aplicações.
PhD thesis, Instituto de Matemática e Estatística - Universidade de São Paulo, Rua do Matão,
1010.
Fernando Montoya 9 de fevereiro de 2021 Defesa de Doutorado 67 / 67

Você também pode gostar