Dissertacao

Lara Carvalho Menezes
COMITÊS DE AGRUPAMENTOS BIDIMENSIONAIS DE DADOS

GERADOS VIA ALGORITMOS BIO-INSPIRADOS MULTIMODAIS
Fortaleza
2011
Lara Carvalho Menezes
COMITÊS DE AGRUPAMENTOS BIDIMENSIONAIS DE DADOS

GERADOS VIA ALGORITMOS BIO-INSPIRADOS MULTIMODAIS
Dissertação apresentada ao
Programa de Pós-Graduação em
Informática Aplicada da
Universidade de Fortaleza como
requisito parcial para obtenção do
Título de Mestre em Informática.
Orientador: Prof. Dr. André Luís Vasconcelos Coelho
Fortaleza
2011
___________________________________________________________________________
M543c Menezes, Lara Carvalho.

Comitês de agrupamentos bidimensionais de dados gerados via algoritmos
bio-inspirados multimodais / Lara Carvalho Menezes. - 2011.
251 f.
Dissertação (mestrado) – Universidade de Fortaleza, 2011.

“Orientação: Prof. Dr. André Luís Vasconcelos Coelho.”
1. Algoritmos. 2. Mineração de dados. 3. Bases de dados. 4. Heurística.

I. Título.
CDU 681.3.06:510.5
___________________________________________________________________________
Aos meus pais.
AGRADECIMENTOS
Aos meus pais, Haroldo e Marisa, pela educação e exemplo que me
proporcionaram.
Ao professor André Coelho, por ter me orientado e me motivado durante este

trabalho.
Ao professor Blaise Hanczar, por ter cedido o código para geração das bases de
dados artificiais utilizadas neste trabalho.
Aos amigos Plauto Benevides e Diego Mello, por terem disponibilizado a

infraestrutura para a realização dos experimentos deste trabalho.
Ao meu namorado Luiz e à minha irmã Andréa, pelo apoio e paciência.
A todos os colegas e professores do MIA, fundamentais para minha formação

acadêmica.
À banca examinadora, pelas críticas e sugestões.
À CAPES, pelo suporte financeiro.
A todos aqueles que me incentivaram nesta jornada.

X
XI
Resumo da dissertação apresentada ao Corpo Docente do programa de Pós-

Graduação em Informática Aplicada da Universidade de Fortaleza, como parte dos
requisitos necessários para a obtenção do grau de Mestre em Informática.
Comitês de agrupamentos bidimensionais de dados gerados via algoritmos

bio-inspirados multimodais
Autor: Lara Carvalho Menezes

Orientador: Prof. Dr. André Luís Vasconcelos Coelho
A área de Mineração de Dados (MD) fornece um conjunto de tarefas e

algoritmos voltados à extração de informações de grandes bases de dados. Entre essas
tarefas, temos o agrupamento bidimensional de dados (biclustering), em que linhas e
colunas de uma matriz são agrupadas simultaneamente com base na similaridade dos
seus elementos. Os objetivos deste trabalho são realizar um estudo comparativo
sistemático entre algoritmos bio-inspirados multimodais aplicados à tarefa de
agrupamento bidimensional de dados e investigar o desempenho de comitês de
biclusters gerados por esses algoritmos, tomando como base problemas de
bioinformática. Após se introduzir conceitos gerais de MD e específicos da tarefa de
biclustering, passa-se a discorrer sobre algoritmos bio-inspirados multimodais e sobre
modelos de comitês aplicados a essa tarefa. Experimentos conduzidos de forma
sistemática avaliam o desempenho dos algoritmos bio-inspirados e de dois arranjos de
comitês de biclusters, sendo que os resultados obtidos indicam que, em geral, os
comitês obtiveram um desempenho mais satisfatório que os algoritmos multimodais
aplicados isoladamente, de acordo com as métricas de avaliação levantadas e testes
estatísticos.
Palavras-Chave: Mineração de dados, Aprendizado de máquina, Agrupamento

bidimensional, Comitês de máquinas, Meta-heurísticas, Algoritmos bio-inspirados,
Bioinformática.
XII
XIII
Abstract of the dissertation presented to the board of faculties of the Graduate

Program in Applied Informatics at the University of Fortaleza, as partial fulfillment of
the requirements for the Master’s degree in Computer Science.
Ensembles of biclusters generated by multimodal bio-inspired algorithms
Author: Lara Carvalho Menezes

Advisor: Prof. Dr. André Luís Vasconcelos Coelho
The goal of Data Mining (DM) as a research area is to provide a set of tasks and
algorithms aiming at extracting interesting and useful information from large databases.
Among several DM tasks lies that of biclustering, whereby rows and columns of a data
matrix are simultaneously grouped based on the similarity of their elements. The main
objectives of this work are to provide a thorough comparative assessment on the
performance of several multimodal bio-inspired algorithms while coping with
biclustering as well as to investigate the potentials of ensemble models induced over
biclusters generated by these algorithms, having in mind bioinformatics problems. After
introducing general DM concepts as well as specific concepts related to biclustering, a
detailed characterization of the multimodal bio-inspired algorithms and ensemble
models investigated here is provided. Experiments have been systematically conducted
to evaluate the performance of these algorithms, and the overall results achieved
indicate that the ensemble models can usually outperform the multimodal bio-inspired
algorithms when applied alone, as evidenced by several efficiency and effectiveness
measures and hypothesis tests.
Keywords: Data mining, Machine learning, Biclustering, Committee machines,

Metaheuristics, Bio-inspired algorithms, Bioinformatics.
XIV
XV
SUMÁRIO
LISTA DE FIGURAS ................................................................................................................... 17

LISTA DE TABELAS ................................................................................................................... 21
LISTA DE ACRÔNIMOS E ABREVIATURAS ................................................................................. 27
1. INTRODUÇÃO .................................................................................................................... 1
2. AGRUPAMENTO BIDIMENSIONAL DE DADOS.....................................................................7
2.1. Agrupamento bidimensional de dados: definição ......................................... 9
2.2. Classificação dos algoritmos de biclustering ............................................... 11
2.2.1. Tipos .............................................................................................................. 11
2.2.2. Estruturas ..................................................................................................... 12
2.2.3. Métodos de identificação........................................................................... 13
2.2.4. Aplicações .................................................................................................... 14
2.3. Algoritmos tradicionais ..................................................................................... 16
2.4. Critérios e medidas de avaliação..................................................................... 18
2.5. Conclusão ............................................................................................................ 25
3. ALGORITMOS HEURÍSTICOS BIO-INSPIRADOS .................................................................. 27
3.1. Genetic algorithms ............................................................................................. 31
3.2. Differential evolution .......................................................................................... 37
3.3. Particle swarm optimization ............................................................................. 39
3.4. Density based fish school search ................................................................... 42
3.5. Artificial bee colony............................................................................................ 49
3.6. Biclustering ant colony optimization .............................................................. 52
3.7. Glowworm swarm optimization........................................................................ 53
3.8. Harmony search .................................................................................................. 56
3.9. Swarm intelligence biclustering ...................................................................... 58
3.10. Artificial immune network for biclustering ................................................ 63
3.11. Funções de aptidão para biclustering ........................................................ 64
XVI
3.12. Conclusão ........................................................................................................ 66

4. COMITÊS DE AGRUPAMENTOS BIDIMENSIONAIS DE DADOS ........................................... 67
4.1. Bagged biclustering ........................................................................................... 68
4.2. Modelo genérico de comitês de biclusters .................................................... 71
4.3. Conclusão ............................................................................................................ 73
5. EXPERIMENTOS COMPUTACIONAIS ................................................................................. 75
5.1. Bases de dados ................................................................................................... 75
5.2. Configuração dos experimentos ..................................................................... 76
5.3. Testes estatísticos.............................................................................................. 79
5.4. Experimentos com algoritmos unimodais ..................................................... 81
5.5. Experimentos com algoritmos multimodais ................................................. 82
5.6. Experimentos com comitês de biclusters...................................................... 91
5.6.1. Fusão direta com sobreposição............................................................... 92
5.6.2. Fusão direta sem sobreposição ............................................................. 100
5.6.3. Bagged biclustering com sobreposição ............................................... 108
5.6.4. Bagged biclustering sem sobreposição ............................................... 116
5.7. Análise geral ...................................................................................................... 124
5.8. Conclusão .......................................................................................................... 130
6. CONCLUSÃO .................................................................................................................. 133
6.1. Síntese ................................................................................................................ 134
6.2. Limitações da pesquisa ................................................................................... 135
6.3. Sugestões de trabalhos futuros .................................................................... 136
BIBLIOGRAFIA ....................................................................................................................... 139
Trabalhos científicos publicados pelo autor ........................................................................... 147
Apêndice A – Ferramentas para o problema de agrupamento bidimensional ........................ 149
Apêndice B – Variação dos parâmetros ................................................................................. 153
Apêndice C – Experimentos computacionais ......................................................................... 159
Apêndice D – Testes estatísticos ........................................................................................... 227
Apêndice E – Gráficos ........................................................................................................... 235
XVII
LISTA DE FIGURAS
Figura 1 - Exemplos de otimização multimodal...................................................................3

Figura 2 - Exemplo de uma matriz de dados original (à esquerda) e reordenada (à
direita). ....................................................................................................................................4
Figura 3 - Esquema geral KDD. ............................................................................................ 8
Figura 4 - Clusters e biclusters. .......................................................................................... 10
Figura 5 - Tipos de biclusters. (a) bicluster constante; (b) linhas constantes; (c) colunas
constantes; (d) valores coerentes (modelo aditivo); (e) valores coerentes (modelo
multiplicativo); (f) evolução global coerente; (g) evoluções coerentes nas linhas; (h)
evoluções coerentes nas colunas; (i) evoluções coerentes nas colunas; e (j) evoluções
coerentes em linhas e colunas. .......................................................................................... 11
Figura 6 - Estrutura dos biclusters. (a) único; (b) exclusivos; (c) em xadrez; (d) linhas
exclusivas; (e) colunas exclusivas; (f) não-sobrepostos com estrutura em árvore; (g)
não-sobrepostos e não-exclusivos; (h) sobrepostos com estrutura hierárquica; e (i)
sobrepostos e arbitrariamente posicionados. .................................................................... 13
Figura 7 - Exemplo de biclusters similares com valores de MSR diferentes. ................. 21
Figura 8 - Exemplo de biclusters com alto e baixo níveis de correlação linear.............. 24
Figura 9 - Exemplo de bicluster. ......................................................................................... 31
Figura 10 - Tipos de recombinação. (a) crossover de um único ponto; (b) crossover de
dois pontos; e (c) crossover de múltiplos pontos. ............................................................. 34
Figura 11 - Tipos de mutação. (a) mutação de um único gene; (b) e (c) mutação de
múltiplos genes. ................................................................................................................... 35
Figura 12 - Exemplo de reamostragem no algoritmo Bagged Biclustering. ................... 68
Figura 13 - Exemplo de geração de meta-clusters. .......................................................... 70
Figura 14 - Geração dos biclusters a partir de meta-clusters. ......................................... 70
Figura 15 - Comparação múltipla entre os algoritmos unimodais referente aos valores
de LC e MI. ........................................................................................................................... 82
Figura 16 - MSR do melhor bicluster para os algoritmos multimodais nas bases
Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung. ..................................................... 85
Figura 17 - MSR do melhor bicluster para os algoritmos multimodais nas bases
Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6. ................................................... 86
Figura 18 - Comparação múltipla entre os algoritmos multimodais referente ao valor de
MSR do melhor bicluster. .................................................................................................... 87
Figura 19 - Comparação múltipla entre os algoritmos multimodais referente ao valor
médio de MSR da população final...................................................................................... 87
Figura 20 - Comparação múltipla entre os algoritmos multimodais referente ao volume
do melhor bicluster............................................................................................................... 88
XVIII
Figura 21 - Comparação múltipla entre os algoritmos multimodais referente ao volume

médio da população final..................................................................................................... 88
Figura 22 - Comparação múltipla entre os algoritmos multimodais referente à cobertura
dos elementos. ..................................................................................................................... 89
Figura 23 - Comparação múltipla entre os algoritmos multimodais referente à
sobreposição. ....................................................................................................................... 90
Figura 24 - Comparação múltipla entre os algoritmos multimodais referente ao valor de
MS da população final. ........................................................................................................ 90
Figura 25 - Comparação múltipla entre as diferentes configurações da Fusão Direta
com sobreposição referente ao valor de MSR do melhor bicluster. ................................ 93
com sobreposição referente ao valor médio de MSR da população final....................... 93
com sobreposição referente ao volume do melhor bicluster............................................ 94
com sobreposição referente ao volume médio da população final. ................................ 94
com sobreposição referente à cobertura dos elementos. ................................................ 95
com sobreposição referente à sobreposição..................................................................... 96
com sobreposição referente ao valor de MS da população final. .................................... 96
Figura 32 - MSR do melhor bicluster para a Fusão Direta com sobreposição nas bases
Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung. ..................................................... 98
Figura 33 - MSR do melhor bicluster para a Fusão Direta com sobreposição nas bases
Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6.................................................... 99
Figura 34 - MSR do melhor bicluster para a Fusão Direta sem sobreposição nas bases
Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung. ................................................... 102
Figura 35 - MSR do melhor bicluster para a Fusão Direta sem sobreposição nas bases
Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6. ................................................. 103
sem sobreposição referente ao valor de MSR do melhor bicluster. .............................. 104
sem sobreposição referente ao valor médio de MSR da população final..................... 104
sem sobreposição referente ao volume do melhor bicluster.......................................... 105
sem sobreposição referente ao volume médio da população final. .............................. 105
sem sobreposição referente à cobertura dos elementos. .............................................. 106
sem sobreposição referente à sobreposição................................................................... 106
sem sobreposição referente ao valor de MS da população final. .................................. 107
Figura 43 - MSR do melhor bicluster para o Bagged Biclustering com sobreposição nas
bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung. ........................................ 110
XIX
Figura 44 - MSR do melhor bicluster para o Bagged Biclustering com sobreposição nas
bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6. ..................................... 111
Figura 45 - Comparação múltipla entre as diferentes configurações do Bagged
Biclustering com sobreposição referente ao valor de MSR do melhor bicluster. ......... 112
Biclustering com sobreposição referente ao valor médio de MSR da população final.
............................................................................................................................................. 112
Biclustering com sobreposição referente ao volume do melhor bicluster. .................... 113
Biclustering com sobreposição referente ao volume médio da população final........... 113
Biclustering com sobreposição referente à cobertura dos elementos........................... 114
Biclustering com sobreposição referente à sobreposição. ............................................. 114
Biclustering com sobreposição referente ao valor de MS da população final. ............. 115
Figura 52 - MSR do melhor bicluster para o Bagged Biclustering sem sobreposição nas
bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung. ........................................ 118
Figura 53 - MSR do melhor bicluster para o Bagged Biclustering sem sobreposição nas
bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6. ..................................... 119
Biclustering sem sobreposição referente ao valor de MSR do melhor bicluster. ......... 120
Biclustering sem sobreposição referente ao valor médio de MSR da população final.
............................................................................................................................................. 120
Biclustering sem sobreposição referente ao volume do melhor bicluster. .................... 121
Biclustering sem sobreposição referente ao volume médio da população final........... 121
Biclustering sem sobreposição referente à cobertura dos elementos........................... 122
Biclustering sem sobreposição referente à sobreposição. ............................................. 122
Biclustering sem sobreposição referente ao valor de MS da população final. ............. 123
Figura 61 - Ferramenta BiVisu. ......................................................................................... 150
Figura 62 - Ferramenta BiGGEsTS. ................................................................................. 150
Figura 63 - Ferramenta BicBox. ........................................................................................ 151
Figura 64 - Ferramenta BicAT. ......................................................................................... 151
Figura 65 - MSR do melhor bicluster para a base Artificial_2........................................ 236
Figura 66 - Volume do melhor bicluster para a base Artificial_2. .................................. 237
Figura 67 - MSR médio da população para a base Artificial_2...................................... 238
Figura 68 - Volume médio da população para a base Artificial_2. ................................ 239
Figura 69 - Tempo para a base Artificial_2...................................................................... 240
Figura 70 - Cobertura dos elementos para a base Artificial_2....................................... 241
XX
Figura 71 - Cobertura de linhas e colunas para a base Artificial_2. .............................. 242

Figura 72 - Sobreposição para a base Artificial_2. ......................................................... 243
Figura 73 - Índice de Jaccard para a base Artificial_2.................................................... 244
Figura 74 - VE para a base Artificial_2. ........................................................................... 245
Figura 75 - TVE para a base Artificial_2. ......................................................................... 246
Figura 76 - MI para a base Artificial_2. ............................................................................ 247
Figura 77 - LC para a base Artificial_2............................................................................. 248
Figura 78 - RMS para a base Artificial_2. ........................................................................ 249
Figura 79 - CMS para a base Artificial_2. ........................................................................ 250
Figura 80 - MS para a base Artificial_2. ........................................................................... 251
XXI
LISTA DE TABELAS
Tabela 1: Algoritmos de agrupamento bidimensional de dados ...................................... 16

Tabela 2: Pseudocódigo do algoritmo CC ......................................................................... 19
Tabela 3: Métricas que avaliam o critério da coerência ................................................... 26
Tabela 4: Pseudocódigo do algoritmo GA ......................................................................... 33
Tabela 5: Procedimento de Clearing .................................................................................. 36
Tabela 6: Pseudocódigo do algoritmo DE ......................................................................... 38
Tabela 7: Pseudocódigo do algoritmo CDE ....................................................................... 38
Tabela 8: Pseudocódigo do algoritmo gbest PSO ............................................................ 40
Tabela 9: Pseudocódigo do algoritmo NichePSO ............................................................. 41
Tabela 10: Pseudocódigo do algoritmo FSS ..................................................................... 44
Tabela 11: Pseudocódigo do algoritmo dFSS ................................................................... 48
Tabela 12: Pseudocódigo do operador de divisão do cardume principal ....................... 49
Tabela 13: Pseudocódigo do algoritmo ABC..................................................................... 51
Tabela 14: Pseudocódigo do algoritmo BicACO ............................................................... 54
Tabela 15: Pseudocódigo do algoritmo GSO .................................................................... 55
Tabela 16: Pseudocódigo do algoritmo HS ....................................................................... 57
Tabela 17: Pseudocódigo do algoritmo MHS .................................................................... 58
Tabela 18: Pseudocódigo do algoritmo SwarmBcluster ................................................... 59
Tabela 19: Pseudocódigo da heurística construtiva do algoritmo SwarmBcluster ........ 60
Tabela 20: Pseudocódigo do algoritmo ACO para a heurística construtiva ................... 61
Tabela 21: Procedimento de mutação do algoritmo BIC-aiNet........................................ 63
Tabela 22: Pseudocódigo do algoritmo BIC-aiNet ............................................................ 64
Tabela 23: Pseudocódigo do algoritmo Bagged Biclustering........................................... 69
Tabela 24: Pseudocódigo do algoritmo genérico de Ensembles de Biclusters .............. 73
Tabela 25: Bases de dados................................................................................................. 76
Tabela 26: Parâmetros de controle dos algoritmos unimodais ........................................ 77
Tabela 27: Parâmetros de controle dos algoritmos multimodais ..................................... 77
Tabela 28: Parâmetros de controle dos algoritmos de comitês ....................................... 77
Tabela 29: Parâmetros das bases de dados ..................................................................... 78
Tabela 30: Experimentos com comitês .............................................................................. 78
Tabela 31: Teste de Friedman (algoritmos multimodais) ................................................. 84
Tabela 32: Teste de Friedman sobre bases artificiais (algoritmos multimodais) ........... 91
Tabela 33: Teste de Friedman (Fusão Direta com sobreposição) .................................. 97
Tabela 34: Teste de Friedman sobre bases artificiais (Fusão Direta com sobreposição)
............................................................................................................................................. 100
XXII
Tabela 35: Teste de Friedman (Fusão Direta sem sobreposição) ................................ 101
Tabela 36: Teste de Friedman sobre bases artificiais (Fusão Direta sem sobreposição)
............................................................................................................................................. 107
Tabela 37: Teste de Friedman (Bagged Biclustering com sobreposição) .................... 109
Tabela 38: Teste de Friedman sobre bases artificiais (Bagged Biclustering com
sobreposição) ..................................................................................................................... 115
Tabela 39: Teste de Friedman (Bagged Biclustering sem sobreposição) .................... 117
Tabela 40: Teste de Friedman sobre bases artificiais (Bagged Biclustering sem
sobreposição) ..................................................................................................................... 123
Tabela 41: Síntese dos Testes de Friedman com algoritmos multimodais e comitês . 125
Tabela 42: Teste de Friedman para os algoritmos ABC, BicACO e BIC-aiNet ............ 126
Tabela 43: Teste de Friedman para os algoritmos CDE, CGA e dFSS ........................ 127
Tabela 44: Teste de Friedman para os algoritmos FSGA, GSO e MHS....................... 128
Tabela 45: Teste de Friedman para os algoritmos NichePSO e SwarmBcluster......... 129
Tabela 46: Quantidade de vezes que um algoritmo isolado ou um dos comitês obteve
o melhor desempenho ....................................................................................................... 129
Tabela 47: Parâmetros do algoritmo GA.......................................................................... 153
Tabela 48: Parâmetros do algoritmo PSO ....................................................................... 153
Tabela 49: Parâmetros do algoritmo FSS........................................................................ 154
Tabela 50: Parâmetros do algoritmo DE .......................................................................... 154
Tabela 51: Parâmetros do algoritmo HS .......................................................................... 154
Tabela 52: Parâmetros do algoritmo FSGA..................................................................... 155
Tabela 53: Parâmetros do algoritmo CGA ....................................................................... 155
Tabela 54: Parâmetros do algoritmo CDE ....................................................................... 155
Tabela 55: Parâmetros do algoritmo NichePSO ............................................................. 156
Tabela 56: Parâmetros do algoritmo dFSS...................................................................... 156
Tabela 57: Parâmetros do algoritmo ABC ....................................................................... 156
Tabela 58: Parâmetros do algoritmo MHS....................................................................... 157
Tabela 59: Parâmetros do algoritmo BicACO ................................................................. 157
Tabela 60: Parâmetros do algoritmo GSO....................................................................... 157
Tabela 61: Parâmetros do algoritmo SwarmBcluster ..................................................... 157
Tabela 62: Parâmetros do algoritmo BIC-aiNet............................................................... 158
Tabela 63: Parâmetros dos comitês ................................................................................. 158
Tabela 64: Resultado dos algoritmos unimodais para Artificial_2 ................................. 159
Tabela 67: Resultado dos algoritmos unimodais para Arabidopsis............................... 162
Tabela 68: Resultado dos algoritmos unimodais para Brain_1 ..................................... 162
Tabela 69: Resultado dos algoritmos unimodais para Brain_2 ..................................... 163
Tabela 70: Resultado dos algoritmos unimodais para Breast_Colon ........................... 163
Tabela 71: Resultado dos algoritmos unimodais para Lung .......................................... 164
Tabela 72: Resultado dos algoritmos unimodais para Multitissue ................................. 164
Tabela 73: Resultado dos algoritmos unimodais para Yeast ......................................... 165
Tabela 74: Resultado dos algoritmos multimodais para Artificial_2 .............................. 166
XXIII
Tabela 77: Resultado dos algoritmos multimodais para Arabidopsis............................ 169
Tabela 78: Resultado dos algoritmos multimodais para Brain_1................................... 170
Tabela 79: Resultado dos algoritmos multimodais para Brain_2................................... 171
Tabela 80: Resultado dos algoritmos multimodais para Breast_Colon......................... 172
Tabela 81: Resultado dos algoritmos multimodais para Lung ....................................... 173
Tabela 82: Resultado dos algoritmos multimodais para Multitissue .............................. 174
Tabela 83: Resultado dos algoritmos multimodais para Yeast ...................................... 175
Tabela 84: Resultado da Fusão Direta com um algoritmo (com sobreposição) para
Artificial_2 ........................................................................................................................... 176
Artificial_4 ........................................................................................................................... 177
Artificial_6 ........................................................................................................................... 178
Arabidopsis ......................................................................................................................... 179
Brain_1 ................................................................................................................................ 180
Brain_2 ................................................................................................................................ 181
Breast_Colon ...................................................................................................................... 182
Lung..................................................................................................................................... 183
Multitissue ........................................................................................................................... 184
Yeast ................................................................................................................................... 185
Tabela 94: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para
Artificial_2 ........................................................................................................................... 186
Artificial_4 ........................................................................................................................... 187
Artificial_6 ........................................................................................................................... 188
Arabidopsis ......................................................................................................................... 189
Brain_1 ................................................................................................................................ 190
Brain_2 ................................................................................................................................ 191
Breast_Colon ...................................................................................................................... 192
Lung..................................................................................................................................... 193
Multitissue ........................................................................................................................... 194
XXIV
Yeast ................................................................................................................................... 195
Tabela 104: Resultado do Bagged Biclustering com um algoritmo (com sobreposição)
para Artificial_2 ................................................................................................................... 196
para Artificial_4 ................................................................................................................... 197
para Artificial_6 ................................................................................................................... 198
para Arabidopsis ................................................................................................................ 199
para Brain_1 ....................................................................................................................... 200
para Brain_2 ....................................................................................................................... 201
para Breast_Colon ............................................................................................................. 202
para Lung ............................................................................................................................ 203
para Multitissue .................................................................................................................. 204
para Yeast........................................................................................................................... 205
Tabela 114: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição)
para Artificial_2 ................................................................................................................... 206
para Artificial_4 ................................................................................................................... 207
para Artificial_6 ................................................................................................................... 208
para Arabidopsis ................................................................................................................ 209
para Brain_1 ....................................................................................................................... 210
para Brain_2 ....................................................................................................................... 211
para Breast_Colon ............................................................................................................. 212
para Lung ............................................................................................................................ 213
para Multitissue .................................................................................................................. 214
para Yeast........................................................................................................................... 215
Tabela 124: Resultado da Fusão Direta com 11 algoritmos para Artificial_2 ............... 216
Tabela 127: Resultado da Fusão Direta com 11 algoritmos para Arabidopsis ............ 217
XXV
Tabela 128: Resultado da Fusão Direta com 11 algoritmos para Brain_1 ................... 218
Tabela 129: Resultado da Fusão Direta com 11 algoritmos para Brain_2 ................... 218
Tabela 130: Resultado da Fusão Direta com 11 algoritmos para Breast_Colon ......... 219
Tabela 131: Resultado da Fusão Direta com 11 algoritmos para Lung ........................ 219
Tabela 132: Resultado da Fusão Direta com 11 algoritmos para Multitissue .............. 220
Tabela 133: Resultado da Fusão Direta com 11 algoritmos para Yeast....................... 220
Tabela 134: Resultado do Bagged Biclustering com 11 algoritmos para Artificial_2... 221
Tabela 137: Resultado do Bagged Biclustering com 11 algoritmos para Arabidopsis 223
Tabela 138: Resultado do Bagged Biclustering com 11 algoritmos para Brain_1 ....... 224
Tabela 139: Resultado do Bagged Biclustering com 11 algoritmos para Brain_2 ....... 224
Tabela 140: Resultado do Bagged Biclustering com 11 algoritmos para Breast_Colon
............................................................................................................................................. 225
Tabela 141: Resultado do Bagged Biclustering com 11 algoritmos para Lung ............ 225
Tabela 142: Resultado do Bagged Biclustering com 11 algoritmos para Multitissue .. 226
Tabela 143: Resultado do Bagged Biclustering com 11 algoritmos para Yeast........... 226
Tabela 144: Valores críticos baseados na Studentized range statistic divididos por
............................................................................................................................................. 227
Tabela 145: Teste de Nemenyi com bases artificiais (algoritmos multimodais)........... 228
Tabela 146: Teste de Nemenyi com bases artificiais (Fusão Direta com sobreposição)
............................................................................................................................................. 228
Tabela 147: Teste de Nemenyi com bases artificiais (Fusão Direta sem sobreposição)
............................................................................................................................................. 228
Tabela 148: Teste de Nemenyi com bases artificiais (Bagged Biclustering com
sobreposição) ..................................................................................................................... 228
Tabela 149: Teste de Nemenyi com bases artificiais (Bagged Biclustering sem
sobreposição) ..................................................................................................................... 228
Tabela 150: Teste de Nemenyi (algoritmos multimodais) .............................................. 229
Tabela 151: Teste de Nemenyi (Fusão Direta com sobreposição) ............................... 230
Tabela 152: Teste de Nemenyi (Fusão Direta sem sobreposição) ............................... 231
Tabela 153: Teste de Nemenyi (Bagged Biclustering com sobreposição) ................... 232
Tabela 154: Teste de Nemenyi (Bagged Biclustering sem sobreposição) ................... 233
XXVI
XXVII
LISTA DE ACRÔNIMOS E ABREVIATURAS
ABC: Artificial Bee Colony

ACO: Ant Colony Optimization
AIS: Artificial Immune System
AS: Ant System
Bagging: Bootstrapping and Aggregating
BicACO: Biclustering Ant Colony Optimization
BIC-aiNet: Artificial Immune Network for Biclustering
BicAT: Biclustering Analysis Toolbox
BicBox: Biclustering Toolbox
BiGGesTS: Biclustering Gene Expression Time-Series
CC: Cheng & Church Algorithm
CDE: Crowding based Differential Evolution
CGA: Clearing based Genetic Algorithm
CMS: Column Match Score
DE: Differential Evolution
dFSS: Density based Fish School Search
EA: Evolutionary Algorithm
FSGA: Fitness Sharing based Genetic Algorithm
FSS: Fish School Search
GA: Genetic Algorithm
GSO: Glowworm Swarm Optimization
HCL: Hierarchical Clustering
HS: Harmony Search
ISA: Iterative Signature Algorithm
KDD: Knowledge Discovery in Databases
LC: Linear Correlation
MD: Mineração de Dados
MHS: Multimodal Harmony Search
XXVIII
MI: Mutual Information

MS: Match Score
MSR: Mean Squared Residue Score
NichePSO: Niche based Particle Swarm Optimization
OPSM: Order Preserving Submatrix Algorithm
POFMM: Problema de Otimização de Função Multimodal
PSO: Particle Swarm Optimization
RMS: Row Match Score
SI: Swarm Intelligence
SwarmBcluster: Swarm Intelligence Biclustering
TVE: Transposed Virtual Error
VE: Virtual Error
1. INTRODUÇÃO
Avanços recentes nas áreas de Ciência e Engenharia de Computação vêm

proporcionando um aumento considerável da capacidade de coletar, gerar, e armazenar
dados em formato digital. Entretanto, esses dados devem ser processados para gerar
informações e conhecimento úteis. A Mineração de Dados (MD) é uma das etapas do
processo de Extração de Conhecimento de Bases de Dados (KDD) e visa extrair
conhecimento (i.e., padrões e tendências) relevante embutido em grandes bases de
dados através da aplicação de algoritmos de classificação, agrupamento, sumarização,
regressão, entre outros (Fayyad et al. 1996).
A tarefa de agrupamento de dados (clustering) consiste em separar amostras de

dados relativas a um determinado domínio de estudo em grupos (clusters) distintos,
sendo que instâncias pertencentes a um mesmo grupo devem apresentar características
semelhantes (Jain, Murty e Flynn 1999). Já o agrupamento bidimensional de dados
(biclustering) permite fazer esse agrupamento simultaneamente em linhas e colunas de
uma tabela relacional e pode ser uma tarefa útil em diversos domínios, tais como em
Bioinformática, Previsão de Séries Temporais, Reconhecimento de Padrões, Análise e
Processamento de Imagens e Recuperação de Informação. Nomes como biclusterização,
agrupamento duplo de dados, simultaneous clustering, co-clustering, two-way
clustering, block clustering, bidimensional clustering, entre outros, também são
frequentemente usados na literatura para referenciar a tarefa de biclustering (Barkow et
al. 2006) (Cheng e Church 2000) (de França 2010) (Madeira e Oliveira 2004) (Charrad
e Bem Ahmed 2011) (Nie et al. 2011).
As técnicas de clustering apresentam duas limitações: primeiro, elas não são

capazes de encontrar correlações dos dados em relação a apenas um subconjunto de
atributos; e, segundo, elas não podem designar uma amostra a mais de um grupo. Essas
1
2
limitações têm um grande impacto em algumas aplicações, como na análise de dados de

expressão gênica e extração de informações em filtragem colaborativa. Em aplicações
reais, amostras de dados são, geralmente, correlatas a vários subconjuntos de amostras
diferentes, quando são considerados subconjuntos distintos de atributos (de França e
Von Zuben 2009).
Na análise de expressão gênica, em particular, há uma grande dificuldade em se

aplicar algoritmos de clustering, pois vários padrões de ativação são comuns para um
mesmo grupo de genes, considerando apenas certas condições específicas (Ben-Dor et
al. 2002) (Madeira e Oliveira 2004). Já na mineração de textos a maior dificuldade
associada com a análise automática de documentos é que informações textuais são
altamente subjetivas. Embora algoritmos padrões de clustering venham obtendo sucesso
quando aplicados à mineração de textos, eles apresentam uma conhecida limitação ao
lidar com bases de dados grandes e heterogêneas: já que agrupam textos baseados nas
similaridades globais de seus atributos, parte da combinação pode não ser detectada. Se
dois ou mais textos compartilham apenas um subconjunto de atributos similares, tais
algoritmos tendem a falhar em identificar de forma adequada essa especificidade. Além
disso, tais algoritmos atribuem o texto para uma única categoria, mesmo quando os
textos estão envolvidos em mais de uma (de Castro et al. 2007b).
Biclustering surge como uma alternativa para tratar essas limitações da tarefa de
clustering, já que (Cheng e Church 2000) (de França 2010): agrupa itens tomando como
base uma medida de similaridade que depende de um contexto, ou seja, um conjunto de
atributos, descobrindo não somente o agrupamento, mas também o contexto; permite
que linhas e colunas sejam incluídas em vários biclusters ao mesmo tempo; e provê um
modo de lidar com valores faltantes e medidas corrompidas, selecionando de forma
automática linhas e colunas com medidas mais coerentes e excluindo aquelas ruidosas.
Já existe na literatura um bom repertório de algoritmos de agrupamento

bidimensional de dados (Ben-Dor et al. 2002) (Ihmels et al. 2004) (Madeira e Oliveira
2004) (Murali e Kasif 2003) (Prelić et al. 2006), dentre os quais algoritmos de natureza
bio-inspirada (Coelho et al. 2009) (Divina e Aguilar-Ruiz 2006) (de França et al. 2008)
(Mitra e Banka 2006) (Xie et al. 2007).
3
A complexidade do problema de biclustering depende da sua formulação e,

especificamente, da função de avaliação utilizada para avaliar a qualidade de um dado
bicluster. Na sua forma mais simples, quando A for uma matriz binária, um bicluster
corresponde a um biclique de um grafo bipartido, supondo que as linhas da matriz A
sejam os vértices à esquerda e as colunas os vértices à direita, e os valores dos
elementos, representados por 0 ou 1, indicam se existe ou não uma aresta ligando uma
linha a uma coluna. Encontrar o bicluster de tamanho máximo, nessa situação, é
equivalente a encontrar o biclique com o máximo de arestas em um grafo bipartido, que
é um problema NP-completo. Consequentemente, em casos mais complexos, é possível
inferir que estes também sejam NP-completos. Diante disso, boa parte dos algoritmos
de biclustering são métodos inexatos, baseados em heurísticas ou meta-heurísticas
(Madeira e Oliveira 2004) (de França 2010) (Veroneze 2011).
A geração de biclusters pode ser modelada como um problema de otimização

combinatória multimodal (de Castro et al. 2007a). O conceito de um problema
multimodal pode ter diferentes interpretações, entre as quais (Yu e Gen 2010): (1)
existem diversos ótimos globais e deseja-se encontrar o maior número possível deles;
(2) existem diversas soluções globais e locais e deseja-se encontrar o maior número
delas; e (3) existem diversos ótimos locais em um espaço de busca e deseja-se que o
algoritmo encontre o ótimo global o mais rápido possível. Exemplos hipotéticos
ilustrativos de (1) e (2) são mostrados, respectivamente, na Figura 1(a) e Figura 1(b).
Figura 1 - Exemplos de otimização multimodal.

Fonte: (Yu e Gen 2010, p. 166).
A Figura 2, por sua vez, evidencia que é realmente possível existirem diferentes
biclusters de qualidade em uma matriz de dados, os quais correspondem a pontos
4
ótimos globais e locais de uma determinada função-objetivo. Nesse exemplo, evidencia-

se a similaridade entre os elementos, sendo que as cores verde e vermelho significam
valores similares baixos e altos, respectivamente. Outras funções-objetivo podem levar
em conta o volume do bicluster, se os elementos seguem algum comportamento padrão,
etc. A necessidade de algoritmos que encontrem o maior número possível desses pontos
ótimos para o problema de agrupamento bidimensional passa então a ser justificada.
Figura 2 - Exemplo de uma matriz de dados original (à esquerda) e reordenada (à direita).

Fonte: (Sharan et al. 2006, p. 2).
Todavia, algoritmos bio-inspirados tradicionais, como os algoritmos genéticos e

de enxames de partículas, não possuem, em suas versões canônicas, mecanismos para
obter mais de uma solução distinta e satisfatória a cada execução (Yu e Gen 2010).
Portanto, neste trabalho, o foco de investigação se dará sobre algoritmos bio-inspirados
populacionais aplicados comumente a problemas de otimização de função multimodal
(POFMM), sendo escolhidos representantes significativos dos domínios de Computação
Evolucionária, Inteligência de Enxame e Sistemas Imunológicos Artificiais.
Por outro lado, recentemente, foram propostas as primeiras abordagens de

comitês (ensembles) de agrupamentos bidimensionais de dados (Hanczar e Nadif 2010,
2011) (Kaiser 2011). O princípio por trás de métodos de comitês, em geral, é o de gerar
um conjunto de modelos (máquinas de aprendizado) e depois agregá-los mediante
algum esquema de combinação (por exemplo, via votação). Exemplos bem conhecidos
de tais métodos no contexto das tarefas de classificação ou de regressão são os de
Boosting e Bagging (Opitz e Maclin 1999). Já foi mostrado, teórica e empiricamente,
5
que a combinação de múltiplos modelos de classificação ou de regressão tende a

produzir melhores resultados quando comparada à estratégia padrão de se adotar um
único modelo bem calibrado, considerando as limitações de tempo e de recursos
computacionais. Estudos na área de clustering também evidenciam, em alguns casos,
ganhos substanciais dessa abordagem (Strehl 2002) (Strehl e Ghosh 2002).
Estudos analisando experimentalmente algoritmos tradicionais de biclustering já

podem ser encontrados na literatura (Gonçalves 2007) (Prelić et al. 2006) (Tanay et al.
2004). Porém, até onde se sabe, ainda não foi realizado um estudo empírico abrangente
comparando diferentes meta-heurísticas bio-inspiradas de cunho multimodal e também
avaliando a sua adoção em arranjos de comitês para o tratamento eficaz do problema de
agrupamento bidimensional de dados.
Com base no exposto acima, este trabalho apresenta dois objetivos gerais. O
primeiro é o de realizar um estudo comparativo experimental sistemático sobre a
aplicação de algoritmos bio-inspirados multimodais no tratamento do problema de
agrupamento bidimensional de dados, sendo analisados os seguintes algoritmos já
existentes na literatura1:
 Artificial Bee Colony (ABC) (Karaboga 2005);
 Biclustering Ant Colony Optimization (BicACO) (de França et al. 2008);
 Artificial Immune Network for Biclustering (BIC-aiNet) (de Castro et al.

2007b);
 Density based Fish School Search (dFSS) (Madeiro 2010);
 Crowding based Differential Evolution (CDE) (Storn e Price 1995);
 Glowworm Swarm Optimization (GSO) (Krishnanand e Ghose 2009);
 Multimodal Harmony Search (MHS) (Geem et al. 2001);
 Fitness Sharing based Genetic Algorithm (FSGA) (Goldberg e Richardson

1987);
 Clearing based Genetic Algorithm (CGA) (Pétrowski 1996);
1
Embora existam traduções para o português, preferiu-se adotar, por uma questão de uniformidade e
estilo, a designação original desses algoritmos em inglês, ao longo deste texto.
6
 Niche based Particle Swarm Optimization (NichePSO) (Engelbrecht 2007); e
 Swarm Intelligence Biclustering (SwarmBcluster) (de França 2010).
O segundo objetivo geral desta dissertação é o de investigar o desempenho de

arranjos de comitês para biclustering utilizando biclusters gerados pelos algoritmos
multimodais supracitados. Com isso, almeja-se ganhos ainda maiores de desempenho
em termos de critérios de eficácia.
Constam ainda como contribuições: a apresentação de um estudo introdutório

acerca da área de biclustering, dando ênfase aos algoritmos bio-inspirados aplicados a
esse problema; a aplicação das técnicas de agrupamento bidimensional e da abordagem
de ensembles no domínio da bioinformática; e o levantamento e utilização de diferentes
critérios de avaliação para comparar o desempenho dos algoritmos escolhidos.
O trabalho se organiza da seguinte forma. No Capítulo 2, são apresentados

alguns conceitos de agrupamento bidimensional de dados, bem como métricas de
avaliação de algoritmos, que podem ser utilizadas para esse problema. No Capítulo 3,
são descritos os algoritmos heurísticos bio-inspirados multimodais empregados nesta
investigação. No Capítulo 4, é abordado o conceito de comitês para biclustering. No
Capítulo 5, são apresentados os experimentos conduzidos para este trabalho, assim
como é feita uma análise detalhada dos resultados obtidos. O Capítulo 6 é destinado à
conclusão e à discussão de trabalhos futuros.
2. AGRUPAMENTO BIDIMENSIONAL DE
DADOS
O presente capítulo aborda conceitos básicos de Mineração de Dados, com

ênfase especial na tarefa de agrupamento bidimensional de dados, mostrando seus
objetivos, algoritmos tradicionais e métricas de avaliação.
A descoberta de conhecimento em bases de dados é um campo de pesquisa cujo

rápido crescimento tem sido motivado pela existência de uma poderosa tecnologia para
coleta, armazenamento e gerenciamento de grandes quantidades de dados (Fayyad et al.
1996). Muitos desses dados possuem informações valiosas, como tendências e padrões
que poderiam ser usados para melhorar as decisões de negócios, além de outras
aplicações. Considerando que, em geral, as bases contêm um enorme volume de dados,
tornou-se necessário o desenvolvimento de procedimentos de análise automática, como
os de Mineração de Dados (Rezende 2003).
O processo de KDD é descrito em detalhes por Fayyad et al. (1996a),

consistindo em nove etapas: (1) conhecer o domínio da aplicação e identificar os
objetivos de todo o processo de análise; (2) criar a base de dados alvo; (3) limpar e pré-
processar os dados; (4) selecionar e reduzir os dados de acordo com o objetivo da tarefa;
(5) combinar os objetivos do processo de KDD com uma ou mais tarefas particulares de
MD; (6) selecionar os algoritmos de MD; (7) aplicar tais algoritmos; (8) interpretar os
padrões encontrados; e (9) atuar sobre o conhecimento descoberto.
A Figura 3 mostra um modelo do processo de KDD, em que se identificam esses

passos fundamentais.
7
8
Figura 3 - Esquema geral KDD.

Fonte: Adaptado de (Fayyad et al. 1996a, p.41).
As tarefas de um algoritmo de extração de padrões podem ser agrupadas em

atividades preditivas, cujo propósito é predizer o comportamento futuro de algumas
entidades, consistindo na generalização de exemplos ou experiências passadas, ou
descritivas, cujo objetivo é apresentar um padrão ao usuário em um formato que possa
ser entendido, identificando comportamentos intrínsecos ao conjunto de amostras.
Para Fayyad et al. (1996b), os objetivos da predição e descrição podem ser

alcançados com as seguintes tarefas de MD:
 classificação: aprendizado de uma função que mapeia (classifica) um dado

item em uma dentre várias classes predefinidas;
 regressão: aprendizado de uma função que mapeia um dado item em uma ou

mais variáveis de valor real;
 clustering: identificação de um grupo finito de categorias ou clusters para

descrever as amostras de dados;
 sumarização: obtenção de uma descrição compacta para um conjunto de

amostras, derivação de sumário ou regras de associação, bem como o uso de
técnicas de visualização multivariadas;
 modelagem de dependência: encontrar um modelo que descreva dependências

associativas genéricas entre variáveis; e
9
 detecção de mudanças e de desvios: descoberta das mudanças mais

significativas dentro das amostras, de acordo com valores previamente
mensurados ou normativos.
De acordo com Jain et al. (1999), a tarefa de clustering consiste em organizar

uma coleção de dados em grupos baseados na similaridade. Intuitivamente, amostras
(instâncias, padrões) de um mesmo grupo são mais similares entre si do que em relação
àquelas de outro grupo. Assim, tal tarefa está geralmente associada a problemas que
possuem pouca informação prévia disponível a respeito dos dados, sendo
particularmente apropriada para explorar as inter-relações dos dados e fazer uma
avaliação da sua estrutura. O processo de agrupamento envolve diversas etapas, que vão
desde a preparação das amostras até a interpretação dos clusters obtidos (Faceli et al.
2005).
2.1. Agrupamento bidimensional de dados: definição
O primeiro uso do conceito de agrupamento bidimensional de dados remete ao

início da década de 1970. Essa tarefa, porém, tornou-se mais popular recentemente,
quando Cheng e Church (2000) ressaltaram a sua importância no contexto da
bioinformática, para fins de análise de expressão gênica. Biclustering pode ser definido
como o agrupamento simultâneo de linhas e colunas da matriz de amostras.
A Figura 4 enaltece a diferença entre clustering e biclustering: o primeiro faz

agrupamento unidimensional; o segundo, bidimensional. Na tarefa de clustering cada
objeto em um cluster é definido usando todos os atributos ou todos os objetos. Por
exemplo, em um agrupamento de linhas (objetos), um subconjunto das linhas da matriz
é agrupado se os seus elementos, perante todo o conjunto de atributos (colunas da
matriz), são semelhantes. Por outro lado, em um agrupamento de colunas (atributos),
parte das colunas da matriz é agrupada se os seus elementos, considerando todo o
conjunto de objetos, são semelhantes. Já na tarefa de biclustering, são identificados
grupos de objetos que têm comportamento similar dentro de contextos (subconjuntos de
atributos) específicos, ou seja, um bicluster pode conter apenas um subconjunto das
linhas e um subconjunto das colunas disponíveis (Madeira e Oliveira 2004) (de França
2010) (Charrad e Ben Ahmed 2011).
10
Figura 4 - Clusters e biclusters.

Fonte: (Oliveira 2006, p.10).
Para fins de definição formal do problema, toma-se como base uma matriz de
dados genérica , contendo linhas e colunas, em que cada elemento é denotado por
, com ∈ {1, . . . , } sendo o índice da linha e ∈ {1, . . . , } sendo o índice da coluna.
Denominam-se = {1, . . . , } e = {1, . . . , } o conjunto de linhas e colunas,
respectivamente, da matriz , e ⊆ e ⊆ como subconjuntos das linhas e
colunas, sendo que = { , . . . , } é um subconjunto contendo ≤ linhas, com
∈ e ∈ {1, . . . , }, e = { , . . . , } é um subconjunto contendo ≤ colunas,
com ∈ e ∈ {1, . . . , }. Portanto, a matriz pode ser descrita como ( , ); a
submatriz de contendo apenas os elementos que tenham índices dentro dos
conjuntos e pode ser descrita como ( , ); um agrupamento de linhas pode ser
descrito como ( , ); e um agrupamento de colunas como ( , ) (Madeira e Oliveira
2004) (de França 2010).
Partindo dessas definições, um bicluster pode ser definido como a submatriz de

, denotada por ( , ), cujos elementos apresentam alguma similaridade definida pelo
problema estudado. Por sua vez, o problema geral de agrupamento bidimensional pode
ser definido como: dada uma matriz de dimensão × , encontrar um conjunto de
biclusters = ( , ), com = 1, . . . , , sendo que cada bicluster satisfaz alguma
condição de homogeneidade definida pelo método de agrupamento bidimensional (de
França 2010).
11
2.2. Classificação dos algoritmos de biclustering
Madeira e Oliveira (2004) propõem quatro dimensões de análise para classificar

os algoritmos de biclustering já existentes na literatura: os tipos de biclusters
encontrados, a estrutura dos biclusters na matriz, o método utilizado para identificar os
biclusters e seu domínio de aplicação.
2.2.1. Tipos
Madeira e Oliveira (2004) identificam quatro classes principais de biclusters.

Esses tipos são mostrados na Figura 5.
Figura 5 - Tipos de biclusters. (a) bicluster constante; (b) linhas constantes; (c) colunas
constantes; (d) valores coerentes (modelo aditivo); (e) valores coerentes (modelo multiplicativo);
(f) evolução global coerente; (g) evoluções coerentes nas linhas; (h) evoluções coerentes nas
colunas; (i) evoluções coerentes nas colunas; e (j) evoluções coerentes em linhas e colunas.
Fonte: (Madeira e Oliveira 2004, p. 26).
12
 Biclusters com valores constantes: Os algoritmos de biclustering mais

simples identificam subconjuntos de linhas e colunas com valores constantes.
Um bicluster constante perfeito é uma submatriz ( , ) em que todos os
valores são iguais, ou seja, ∀ ∈ e∀ ∈ : = .
 Biclusters com valores constantes em linhas ou colunas: Um bicluster

perfeito com valores constantes nas linhas é obtido pelas fórmulas = +
ou = ∙ , enquanto um bicluster com valores constantes nas colunas
é obtido a partir de = + ou = ∙ . Nessa formalização, e
representam, respectivamente, o ajuste para cada linha ∈ e o ajuste para
cada coluna ∈ .
 Biclusters com valores coerentes: Algoritmos mais sofisticados procuram

por biclusters com valores coerentes em linhas e colunas. Pode-se adotar o
modelo aditivo ou multiplicativo mediante as expressões: = + +
ou = ∙ ∙ .
 Biclusters com evoluções coerentes: Essa abordagem encara os elementos da

matriz como valores simbólicos, tentando descobrir biclusters com
comportamento (perfil qualitativo) semelhante em vez de valores numéricos
exatos na matriz de dados.
2.2.2. Estruturas
Enquanto a maioria dos algoritmos assume a existência de vários biclusters,

existem outros que pretendem identificar apenas um. Quando o algoritmo de
biclustering assume a existência de vários biclusters na matriz de amostras, os
biclusters identificados podem ter as seguintes estruturas: bicluster de linhas e colunas
exclusivas; biclusters não-sobrepostos com uma estrutura em xadrez; biclusters de
linhas exclusivas; biclusters de colunas exclusivas; biclusters não-sobrepostos com
estrutura em árvore; biclusters não-sobrepostos e não-exclusivos; biclusters sobrepostos
e com estrutura hierárquica; e biclusters sobrepostos com posicionamento arbitrário
(Gonçalves 2007) (Ramalho 2006). As estruturas são exemplificadas na Figura 6.
13
Figura 6 - Estrutura dos biclusters. (a) único; (b) exclusivos; (c) em xadrez; (d) linhas exclusivas;
(e) colunas exclusivas; (f) não-sobrepostos com estrutura em árvore; (g) não-sobrepostos e não-
exclusivos; (h) sobrepostos com estrutura hierárquica; e (i) sobrepostos e arbitrariamente
posicionados.
Fonte: (Ramalho 2006, p. 29).
2.2.3. Métodos de identificação
De acordo com Madeira e Oliveira (2004), os algoritmos de biclustering podem

ter dois tipos de objetivos: identificar o melhor bicluster ou identificar um conjunto de
biclusters de alta qualidade, segundo algum critério. Algumas abordagens procuram
identificar um bicluster de cada vez. Outras permitem descobrir um conjunto de
biclusters em cada execução. Existem também algoritmos que fazem a identificação de
biclusters em simultâneo, isto é, tentam descobrir todos os biclusters em uma única
execução. Devido à complexidade do problema, diversas abordagens têm sido usadas
(Madeira e Oliveira 2004) (Charrad e Ben Ahmed 2011):
 combinação iterativa de clustering em linhas e colunas: consiste em agrupar

linhas e colunas separadamente e combinar esses resultados posteriormente,
através de um procedimento iterativo, de forma a obter os biclusters;
 divisão-e-conquista: divide o problema em vários subproblemas, que são

14
resolvidos recursivamente, combinando posteriormente as soluções para gerar

a solução do problema original;
 pesquisa gulosa: consiste em efetuar escolhas ótimas para os casos locais, na

esperança de que a otimização local leve a uma solução global aceitável. São
baseados na ideia de criar biclusters por adição ou remoção de linhas e
colunas, usando um critério que maximiza o ganho local;
 enumeração exaustiva de biclusters: baseia-se na ideia de os biclusters só

poderem ser encontrados mediante a enumeração exaustiva de todas as
possibilidades existentes na matriz; e
 identificação de parâmetros de uma dada distribuição: assume que os

biclusters são gerados segundo um determinado modelo estatístico e procura
identificar os parâmetros da distribuição que aproximam da melhor forma a
distribuição observada nos dados reais, otimizando iterativamente um
determinado critério de qualidade.
2.2.4. Aplicações
Problemas de agrupamento de dados podem ser encontrados em diferentes áreas

do conhecimento (Sunaga 2006): reconhecimento de padrões, análise espacial de dados,
processamento de imagens, classificação de documentos, análise e processamento de
séries temporais, inferência filogenética, análise de dados de expressão gênica, etc.
Como a tarefa de biclustering pode ser vista como uma extensão ou mesmo
generalização da tarefa de clustering, espera-se que a sua adoção nessas áreas também
seja bastante explorada nos próximos anos.
Existem diversos trabalhos aplicando a tarefa de biclustering na análise de dados

de expressão gênica, entre os quais pode-se destacar: (Cheng e Church 2000) (Ben-Dor
et al. 2002) (Bleuler et al. 2004) (Hanczar e Nadif 2011) (Ihmels et al. 2004) (Mitra e
Banka 2006) (Murali e Kasif 2003) (Nepomuceno et al. 2010) (Divina e Aguilar-Ruiz
2006) (Prelić et al. 2006) (Xie et al. 2007).
Geralmente, dados de expressão gênica são arranjados em uma matriz, em que

cada gene corresponde a uma linha e cada condição a uma coluna. Cada elemento nessa
15
matriz representa o nível de expressão de um gene sob uma condição específica e é

representado por um número real, que é o logaritmo da abundância relativa de RNAm
do gene sob a condição específica (Madeira e Oliveira 2004). Esses dados são obtidos a
partir de experimentos com microarrays.
Os microarrays permitem medir a resposta ou o nível de expressão de um

elevado número de genes, potencialmente todos os genes de um determinado
organismo, sob determinadas condições experimentais. Essas condições podem
corresponder à medição da expressão gênica em órgãos diferentes, em tecidos
diferentes, ou até mesmo em indivíduos diferentes. Permitem analisar, em simultâneo, o
nível de expressão dos genes como reação a estímulos diferentes (tais como utilização
de drogas, existência ou não de determinada doença) ou observar a evolução da
expressão em diferentes instantes temporais em determinada condição de teste (por
exemplo, após um antibiótico ser adicionado). A ativação de conjuntos de genes em
determinadas condições corresponde, em muitos casos, à ativação de um dado processo
biológico. Nesse contexto, a geração de biclusters pode levar à identificação de
processos biológicos e, consequentemente, a uma melhor compreensão dos sistemas
biológicos (Gonçalves 2007) (Souto et al. 2003).
Quando um experimento com microarray é realizado, um scanner registra

valores da intensidade da fluorescência – o nível de fluorescência em cada ponto do
array. A tecnologia de microarrays está geralmente disponível em duas plataformas,
cDNA e Affymetrix. Medidas de arrays Affymetrix são estimativas do número de
cópias de RNA encontradas na amostra de determinada célula, enquanto os valores dos
microarrays cDNA são proporções do número de cópias em relação a uma amostra de
células de controle (de Souto, Prudencio et al. 2008).
Outra aplicação possível para a tarefa de agrupamento bidimensional é na

filtragem colaborativa, em que a entrada do sistema é, basicamente, um conjunto de
avaliações atribuídas a itens de interesse pelos usuários. Nesse domínio, a tarefa de
biclustering pode ser útil identificando subgrupos de clientes com preferências ou
comportamentos similares em relação a um subconjunto de produtos. Essa informação
pode ser utilizada em sistemas de sugestão e/ou definição de público-alvo (Veroneze
2011) (de França 2010).
16
Um terceiro exemplo de aplicação das técnicas de biclustering é na mineração

de textos, em que o objetivo é identificar subgrupos de documentos com propriedades
similares em relação a subgrupos de atributos, como palavras ou elementos gráficos.
Esse tipo de informação pode ser muito importante para a consulta e indexação no
domínio das máquinas de busca (Veroneze 2011).
2.3. Algoritmos tradicionais
A Tabela 1 contém cinco dos algoritmos mais proeminentes2 de agrupamento

bidimensional de dados, quais sejam CC (Cheng e Church 2000), OPSM (Ben-Dor et al.
2002), ISA (Ihmels et al. 2004), Xmotifs (Murali e Kasif 2003) e Bimax (Prelić et al.
2006), e a sua classificação segundo os critérios supracitados.
Tabela 1: Algoritmos de agrupamento bidimensional de dados

Algoritmo Tipos de biclusters Estrutura dos biclusters Métodos de identificação
Único, sobrepostos e
CC Valores coerentes Pesquisa gulosa
arbitrariamente posicionados
Identificação de parâmetros
Valores constantes e Sobrepostos e arbitrariamente
ISA de uma dada distribuição (Z-
valores coerentes posicionados
score statistics)
OPSM Evoluções coerentes Pesquisa gulosa
Xmotifs Evoluções coerentes Pesquisa gulosa
Valores constantes e
Sobrepostos e arbitrariamente
Bimax valores coerentes Divisão-e-conquista
posicionados
modelo aditivo
Dentre tais algoritmos, presumivelmente aquele proposto por Cheng e Church

(2000) seja o mais conhecido e estendido. Tais autores modelaram um bicluster como
sendo um subconjunto de genes e um subconjunto de condições experimentais com
elevado nível de similaridade. Também definiram similaridade como sendo a medida de
coerência dos genes e condições de um bicluster. Para encontrar esse tipo de bicluster
com valores coerentes, definiram um critério (função-custo), designado de mean
squared residue score ( ), ou resíduo quadrático médio, para mensurar a
similaridade dos elementos dos biclusters induzidos (Tanay et al. 2004).
2
Segundo Prelić et al. (2006).
17
O resultado do indica se os níveis de expressão dos genes variam em

uníssono. Esse resultado inclui biclusters perfeitos com valores coerentes, bem como
biclusters com valores constantes, de variância igual a 0. Genericamente, o objetivo do
algoritmo CC é encontrar biclusters em que os valores de estão abaixo de um
limiar predefinido pelo usuário (sendo ≥ 0), sendo tais biclusters denominados -
biclusters (de França 2010) (Ramalho 2006).
O algoritmo CC é descrito na Tabela 2, ao passo que as Eqs. (1)-(6) a seguir

trazem, respectivamente, os cálculos efetuados para: (1) a média das linhas; (2) a média
das colunas; (3) a média da submatriz; (4) o ; (5) o nível residual das linhas; e (6) o
nível residual das colunas. O algoritmo CC consiste de três passos e recebe como
parâmetros, além de , (taxa utilizada na remoção de múltiplos nós, sendo >1e
“nó” o termo utilizado para definir linhas ou colunas de uma matriz de dados) e
(número de biclusters a serem encontrados).
∑ ∈
= | |
(1)
∑∈
= | |
(2)
∑∈,∈
= | || |
(3)
MSR(I, J) = | || |
∑∈, ∈ − − + (4)
MSR(i, J) = ∑ ∈ − − + (5)
| |
MSR(I, j ) = | |
∑∈ − − + (6)
O primeiro passo desse algoritmo, denominado remoção de múltiplos nós, inicia

com a matriz completa sendo um bicluster. Esse passo consiste em encontrar um
conjunto de linhas que possuam nível residual maior que ∙ ( , ) e removê-lo do
bicluster. O do bicluster é, então, recalculado e o mesmo é feito para a remoção
das colunas. O segundo passo, chamado de remoção de nó único, remove iterativamente
o nó do bicluster que mais contribui para o aumento no valor de , até que o
bicluster atinja ( , ) < . O último passo, chamado inserção de múltiplos nós,
18
serve para procurar os nós removidos nos passos anteriores e que, dado o estado atual
do bicluster, possam ser inseridos novamente, sem que haja aumento no valor de .
Após esses três passos, o algoritmo retorna um único bicluster que respeita a restrição
do valor do resíduo, enquanto maximiza o volume. Para encontrar os biclusters
subsequentes, os valores pertencentes ao bicluster encontrado são substituídos por
números aleatórios, introduzindo assim um ruído que direciona o algoritmo a buscar por
diferentes biclusters (Cheng e Church 2000) (de França 2010).
2.4. Critérios e medidas de avaliação
Para avaliar a qualidade dos biclusters e dos algoritmos de agrupamento

bidimensional de dados, diferentes critérios e métricas vêm sendo utilizados na
literatura. Conforme já citado, o é uma métrica criada para mensurar
especificamente o grau de coerência de um bicluster, sendo este o critério de qualidade.
Isso é feito calculando-se o erro entre o bicluster encontrado e o modelo perfeito de
coerência (segundo o modelo aditivo) mais próximo a ele (de França 2010).
Já o volume de um bicluster é um critério espacial e a medida comumente

adotada para avaliar a qualidade de um bicluster, segundo esse critério, é calculada pela
dimensão do espaço ocupado pelo bicluster na matriz de dados (Eq. (7)). O ideal é que
um algoritmo possa encontrar biclusters com grandes volumes e elevada coerência.
( , ) = | | ∙| | (7)
O critério da cobertura, por sua vez, refere-se à porcentagem dos elementos da

matriz de dados que estão contidos no conjunto de biclusters recuperados (de França
2010). A medida de qualidade para esse critério pode ser definida para todos os
elementos da matriz (Eq. (8)) ou somente para as linhas e colunas (Eq. (9)).
, se
∑ ,
, caso contrário
= | | ∙| |
(8)
| ∪ …∪ | ∙ | ∪ …∪ |
ℎ = | |∙| |
(9)
19
Tabela 2: Pseudocódigo do algoritmo CC

Repita
Inicie o bicluster ( , ) contendo todas as linhas e colunas da
matriz original
Remoção de múltiplos nós:

Calcule ( , )
Remova todas as linhas ∈ que satisfazem (, )> ∙ (, )
Calcule ( , )
Remova todas as colunas ∈ que satisfazem ( , )> ∙ ( , )
Remoção de nó único:
Calcule ( , )
Enquanto ( , )>
Remova a linha ou coluna que possui maior ( , ) ou ( , )
Calcule (, )
Fim enquanto
Inserção de múltiplos nós:

Repita
Calcule (, )
Insira em ( , ) todas as colunas ∉ que satisfazem ( , )<
( , )
Calcule (, )
Insira em ( , ) todas as linhas ∉ que satisfazem (, )<
( , )
Calcule (, )
Insira todas as linhas ∉ que, com seus valores
multiplicados por -1, satisfazem (, )< (, )
Até que nada seja inserido
Substitua na base de dados os valores do bicluster encontrado

por valores aleatórios
Até que biclusters sejam encontrados
Outro critério de qualidade é o da sobreposição, que indica o quanto um

determinado bicluster está contido em outro (de França 2010). O que se almeja é
20
biclusters com pouca sobreposição. A Eq. (10) traz uma possível medida a ser adotada
para fins de avaliação, segundo esse critério:
| ∩ |∙| ∩ |
çã ( , )=
| |∙| |
. (10)
Outra medida usada para avaliar o grau de sobreposição entre biclusters é o

índice de Jaccard, sendo este definido de acordo com a Eq. (11).
| ∩ | | ∩ |
( , )= (11)
| ∪ | | ∪ |
Quando se pretende avaliar a qualidade de um conjunto de biclusters

descobertos a partir de uma matriz de dados artificiais, situação em que se sabe
exatamente quais são os verdadeiros biclusters existentes, uma taxa de correspondência
entre o conjunto de biclusters encontrados por um determinado algoritmo e o
conjunto de biclusters verdadeiros pode ser calculada (Prelić et al. 2006). A taxa
pode considerar a similaridade dos biclusters ( ), das linhas dos biclusters ( ) ou
das colunas dos biclusters ( ), sendo estas dadas pelas Eqs. (12) a (14):
( , )= ∑ ∈ max ∈ ( , ) , (12)
| |
| ∩ |
( , )= ∑ ∈ max ∈ , (13)
| | | ∪ |
| ∩ |
( , )= ∑ ∈ max ∈ . (14)
| | | ∪ |
Além do MSR, mais recentemente outras medidas vêm sendo propostas para
avaliar a qualidade de biclusters, segundo o critério da coerência. Dentre elas, está a
medida Virtual Error ( ), proposta por Pontes et al. (2007). Enquanto o leva em
conta as similaridades numéricas de todos os elementos da submatriz, o tenta
capturar o comportamento (perfil) de variação das linhas, supondo que estas sejam mais
importantes que as colunas (algo verdadeiro, por exemplo, para dados de expressão
gênica). O uso do destina-se a revelar biclusters com valores coerentes, ao passo
que o uso do promove a descoberta de biclusters com evoluções coerentes.
Considerando um problema hipotético de expressão gênica, a Figura 7 mostra

dois biclusters cujos genes variam em uníssono ao longo de determinadas condições
21
experimentais. Apesar do fato dos genes apresentarem o mesmo comportamento ao

longo das condições, o valor do MSR para os dois biclusters não indica que eles
apresentam a mesma qualidade. Como pode ser visto na Figura 7, os biclusters têm
valores exatamente iguais nas linhas 1, 2 e 4. A única diferença entre esses dois
biclusters é representada pelos valores assumidos pelo terceiro gene (linha),
representado na cor verde. Segundo Pontes et al. (2007), comparando esses dois
biclusters graficamente, não se pode concluir que um seja de melhor qualidade (mais
coerente) que o outro, pois seria incorreto afirmar que genes apresentando valores de
expressão mais baixos são preferíveis àqueles com valores mais altos, para as mesmas
condições. A ideia principal por trás do é, portanto, criar um padrão a partir de cada
bicluster para representar as tendências gerais contidas no mesmo. Esse padrão tenta
capturar o comportamento geral dos genes ao longo das condições, verificando se os
seus níveis de expressão variam em harmonia, independente dos valores específicos.
Figura 7 - Exemplo de biclusters similares com valores de MSR diferentes.

Fonte: Adaptado de (Pontes et. al. 2007, p. 219).
O primeiro passo do cálculo do é encontrar o conjunto de padrões. Para um

bicluster ( , ), os padrões são representados por uma coleção de elementos
representados por , dados pelas médias das linhas:
22
= . (15)
O segundo passo é a normalização do bicluster como ’, cujos elementos são

representados por ′ , dados pela diferença entre o elemento e a média da sua
coluna dividida pelo desvio padrão da coluna :
′ = . (16)
Os padrões também devem ser normalizados. ′ é dado pela diferença entre e

a média dos padrões dividida pelo desvio padrão dos padrões , ou seja:
′ = . (17)
Por fim, a medida Virtual Error é dada pela média das diferenças numéricas de
cada coluna e de cada padrão normalizados para cada linha:
( , )= ∑∈ , ∈ ′ − ′ . (18)
| || |
Segundo Pontes et al. (2010), ao contrário do MSR, VE é capaz de reconhecer

biclusters apresentando padrões de coerência aditiva ou multiplicativa. Contudo, não é
capaz de revelar biclusters apresentando ambos os tipos de padrões simultaneamente.
Nesse sentido, foi proposta a medida Transposed Virtual Error ( ), que é calculada
de forma similar ao , considerando porém o bicluster transposto (Pontes et al. 2010).
Primeiramente, calcula-se o conjunto de padrões. Para um bicluster ( , ), os

padrões envolvem uma coleção de elementos, dados pelas médias das colunas:
= . (19)
Em seguida, ocorre a normalização do bicluster como , cujos elementos são

representados por , dados pela diferença entre o elemento e a média da sua linha
dividida pelo desvio padrão da linha , ou seja:
= . (20)
23
Os padrões também são normalizados. é dado pela diferença entre e a

média dos padrões dividida pelo desvio padrão dos padrões , ou seja:
= . (21)
Por fim, o Transposed Virtual Error é dado pela média das diferenças numéricas
de cada linha e de cada padrão normalizados para cada coluna, como a seguir:
( , )= ∑∈, ∈ − . (22)
| || |
Outra métrica recentemente utilizada para avaliar a coerência de biclusters é o

coeficiente de correlação de Pearson ( , ) (Nepomuceno et al. 2010). Este mede a
dependência linear entre as variáveis e :
â ( , ) ∑ ( ̅ )( )
( , )= = . (23)
∙ ∙ ∙
Os valores para o coeficiente de correlação ( , ) podem variar entre [−1, 1].

Se ( , ) = 0, e são linearmente independentes. Se ( , ) = ±1, e são
linearmente dependentes. Quando o coeficiente de correlação é igual a −1 (+1), e
são dependentes com correlação negativa (positiva), ou seja, quando os valores de
aumentam, os de diminuem (aumentam) linearmente.
Para medir o nível médio de correlação linear de um bicluster ( ( , )), são

calculados os coeficientes de correlação das linhas par a par (Nepomuceno et al. 2010).
| |
Como ( , ) é igual a ( , ), constam somente elementos no cálculo de (Eq.
(24)). A Figura 8 traz exemplos de biclusters com alto e baixo níveis de correlação
linear.
( , ) = | | ∑ ∑ | ( , )| (24)
Uma possível deficiência do coeficiente de correlação é que ele captura somente

relacionamentos lineares. Já a informação mútua , do inglês Mutual Information,
provê uma medida mais geral para investigar dependências entre variáveis (Qiu et al.
2009).
24
Figura 8 - Exemplo de biclusters com alto e baixo níveis de correlação linear.

Fonte: Adaptado de (Nepomuceno et al. 2010, p. 1144).
O nível de informação mútua entre duas variáveis e mede a quantidade de

informação contida em acerca de ou a informação contida em acerca de . Se e
são independentes, a informação mútua entre elas é zero. Quanto maior o nível de ,
mais dependentes ou relacionadas são e . Assim, o valor médio de informação
mútua de um bicluster é dado por , que é a média dos valores de informação
mútua entre as linhas, tomados par a par. Dadas as distribuições de probabilidade
conjunta ( ) e marginal ( ), o grau de informação mútua entre duas variáveis
pode ser calculado – vide Eqs. (25)-(30). Nestas equações ℎ denota a largura de banda
ou parâmetro de dispersão (Gupta e Aggarwal 2008).
Steuer et al. (2002) mostraram empiricamente que, no contexto de agrupamento

de dados de expressão gênica, alta correlação linear geralmente implica alto nível de
informação mútua, porém duas variáveis com baixa correlação (sem relação linear)
podem ainda estar de algum modo relacionadas (via dependências não-lineares). Já no
contexto de agrupamento bidimensional de dados, recentemente Gupta e Aggarwal
(2008) propuseram um algoritmo heurístico construtivo composto de três estágios,
sendo que em todos eles a informação mútua é usada para recrutar genes (linhas) ou
condições (colunas) para compor o bicluster formado a partir de um gene-semente
escolhido aleatoriamente.
25
( , )= | | ∑ ∑ | ( , )| (25)
( , , )
( , )= ∑ log (26)
| | ( , )× ( , )
(, , , )
( , , )= ∑ (27)
| |
(, , )
(, )= ∑ (28)
| | √
(, , , )= ( , , )+ ( , , ) (29)
( , , )= − (30)
2.5. Conclusão
Neste capítulo, foram apresentados conceitos importantes relacionados às áreas

de KDD e MD. Em especial, foram discutidas as tarefas de agrupamento
unidimensional e bidimensional de dados. Foi feito também um levantamento de
métricas para avaliar algoritmos de biclustering, sendo estas usadas no Capítulo 5 para
avaliar o desempenho dos algoritmos bio-inspirados considerados nesta dissertação.
Os biclusters encontrados devem apresentar uma alta similaridade entre os

elementos para representar amostras altamente correlacionadas, e também devem
apresentar um grande volume, para permitir uma análise mais profunda do conjunto de
dados. No entanto, além de volume e coerência de elementos existem outros aspectos
desejáveis de um bom conjunto de soluções. É também importante, para várias
aplicações que empregam biclusters, que o conjunto final de biclusters forneça uma boa
cobertura do conjunto de dados, já que quanto maior o número de correlações
destacadas, maior a quantidade de informação que pode ser inferida a partir do conjunto
de dados (de França 2010).
A Tabela 3 traz uma síntese das vantagens e desvantagens de métricas que

avaliam o critério da coerência.
26
Tabela 3: Métricas que avaliam o critério da coerência

Medida Vantagens/Desvantagens
Procura biclusters com valores coerentes. Com essa medida de avaliação, também podem
ser encontrados biclusters com valores constantes e biclusters com valores constantes em
MSR linhas ou colunas. Pode falhar em tentar encontrar biclusters de evoluções coerentes, ou
seja, biclusters com propriedades coerentes nos seus valores (Cheng e Church 2000)
(Pontes et. al. 2007).
Tenta capturar o comportamento de variação das linhas, promovendo a descoberta de
VE biclusters com evoluções coerentes. Capaz de reconhecer biclusters apresentando padrões
de coerência aditiva ou multiplicativa, mas não apresentando ambos os tipos de padrões
simultaneamente (Pontes et. al. 2007, 2010).
TVE Tenta encontrar padrões de coerência aditiva e multiplicativa simultaneamente. Porém,
ainda não foi testada com dados reais (Pontes et. al. 2010).
Mede o nível médio de correlação entre as linhas de um bicluster. Captura somente
relacionamentos lineares, no entanto, duas variáveis com baixa correlação linear podem
LC
ainda estar relacionadas via dependências não-lineares (Nepomuceno et al. 2010) (Gupta e
Aggarwal 2008).
Investiga dependências entre as linhas de um bicluster. Essa medida provê um critério
mais geral para investigar relacionamentos (correlação positiva ou negativa e dependências
MI
não-lineares) entre variáveis. Tem como desvantagem o alto custo computacional (Gupta e
Aggarwal 2008) (Qiu et al. 2009).
No próximo capítulo, serão abordados os algoritmos heurísticos bio-inspirados

multimodais utilizados neste trabalho para lidar especificamente com o problema de
agrupamento bidimensional de dados.
3. ALGORITMOS HEURÍSTICOS BIO-
INSPIRADOS
Serão abordados neste capítulo conceitos relacionados aos algoritmos heurísticos

bio-inspirados utilizados neste estudo para atacar o problema de biclustering.
O problema de biclustering pode ser visto como um problema NP-completo e

por isso, boa parte dos algoritmos de biclustering utilizam abordagens heurísticas para
encontrar biclusters (Madeira e Oliveira 2004). Nos problemas NP-completos, não é
possível garantir que a solução ótima seja encontrada em tempo polinomial. Dada a
natureza combinatória do problema, pode ser que, no pior caso, todas as soluções devam
ser analisadas. Esse fato impede o uso exclusivo de métodos exatos, dado o tempo
proibitivo de se encontrar a solução ótima. Em geral, pode ser suficiente encontrar uma
boa solução para o problema, em vez do ótimo global, o qual, para essa classe de
problemas, somente pode ser encontrado após um considerável esforço computacional.
Por esse motivo, pesquisadores têm concentrado esforços na utilização de heurísticas
para solucionar problemas desse nível de complexidade (Souza 2008).
O termo heurística pode ser definido como sendo uma técnica inspirada em
processos intuitivos que procura uma boa solução a um custo computacional aceitável,
sem, no entanto, estar capacitada a garantir que a solução encontrada seja ótima. A
partir da década de 1980 intensificaram-se os estudos no sentido de se desenvolver
procedimentos heurísticos mais flexíveis, dando origem às meta-heurísticas (Souza
2008). As meta-heurísticas são procedimentos destinados a encontrar uma boa solução,
eventualmente a ótima, consistindo na aplicação de uma heurística subordinada, a qual
deve ser modelada para cada problema específico. As meta-heurísticas são de caráter
geral e providas de mecanismos para tentar escapar de ótimos locais ainda distantes dos
ótimos globais, através da combinação de componentes para exploração e
27
28
aproveitamento do espaço de busca. Estes importantes componentes são: intensificação

e diversificação. Para um algoritmo ser eficiente e eficaz, ele deve ser capaz de gerar
um conjunto diversificado de soluções, ao mesmo tempo que intensifica sua busca em
toda a vizinhança de uma solução ótima ou quase ótima. A diversificação geralmente se
refere à exploração do espaço de busca, enquanto o termo intensificação se refere a
exploração de soluções passadas (Blum e Roli 2003) (Geem et al. 2001).
Para este trabalho, foram escolhidas meta-heurísticas significativas de três

subdomínios da área de Computação Natural: algoritmos evolucionários, inteligência
coletiva e sistemas imunológicos artificiais.
De acordo com de Castro (2007), Computação Natural é uma terminologia usada

para englobar três classes de abordagens: aquelas que se inspiram na natureza para o
desenvolvimento de novas técnicas computacionais para a solução de problemas;
aquelas que se baseiam no uso de computadores para sintetizar fenômenos naturais; e
aquelas que usam novos materiais naturais como substrato para o ato de computar.
Dentre os principais campos de pesquisa que compõem essas três classes, citam-se:
algoritmos evolucionários, redes neurais artificiais, sistemas imunológicos artificias,
inteligência coletiva, geometria fractal, vida artificial, computação de DNA e
computação quântica.
A área da Computação Evolucionária (do inglês Evolutionary Computation)

surgiu nas décadas de 1950 e 60 e consiste basicamente em mimetizar o processo de
evolução natural para resolver problemas, geralmente simulando-o em um computador
(de Castro 2007). Vários algoritmos evolucionários (do inglês Evolutionay Algorithms
(EAs)) têm sido propostos, diferenciando-se pelas suas estruturas de representação da
solução e pelos operadores que atuam sobre essas soluções. Tais algoritmos geralmente
são classificados em uma dentre quatro categorias ou dialetos (Blum e Roli 2003)
(Weise 2009) (Wu 2005): (1) os Algoritmos Genéticos (do inglês Genetic Algorithms
(GAs)), cujos elementos no espaço de busca são representados como cadeias binárias,
sendo usados com frequência para lidar com problemas de otimização combinatória; (2)
as Estratégias de Evolução (do inglês Evolution Strategies), que operam sobre cadeias
numéricas, sendo destinadas a tratar, primordialmente, problemas de otimização
contínua; (3) a Programação Genética (do inglês Genetic Programming), destinada à
geração automática de programas de computadores; e (4) a Programação Evolucionária
29
(do inglês Evolutionary Programming), que almeja a síntese de agentes adaptativos cujo
comportamento é modelado por máquinas de estado finito ou cadeias numéricas.
Apesar das diferenças entre essas abordagens, todas apresentam características

básicas do processo evolucionário: o modo de operação baseado em conceitos genéticos
e evolucionários; contêm uma população de soluções-candidatas; promovem
combinações e modificações aleatórias de estruturas para gerar novas soluções; e
possuem um mecanismo de seleção para aumentar a proporção de melhores soluções na
população (de Castro 2007) (Wu 2005).
De acordo com Zitzler et al. (2004), EAs possuem mecanismos de busca

poderosos e robustos, além de caraterísticas desejáveis para lidar com problemas
envolvendo objetivos conflitantes e espaços de busca complexos. Recentemente, EAs
vêm sendo aplicados também ao problema de Biclustering (Bleuler et al. 2004) (Divina
e Aguilar-Ruiz 2006) (Mitra e Banka 2006) (Xie et al. 2007). Neste trabalho, ênfase foi
dada aos algoritmos genéticos e à evolução diferencial.
Inteligência Coletiva (do inglês Swarm Intelligence (SI)) é a área que estuda o
comportamento coletivo que emerge de grupos de agentes simples, tendo em vista a
síntese de modelos computacionais. Esse comportamento inteligente, capaz de resolver
problemas não-triviais, emerge da interação dos agentes, que se comunicam direta ou
indiretamente, atuando sobre o ambiente. Indivíduos de um enxame interagem para
alcançar um objetivo global trocando informação local, que se propaga para todo o
grupo. Assim, o problema pode ser resolvido de forma mais eficiente do que seria por
um único indivíduo (de Castro 2007) (Engelbrecht 2007).
Portanto, a SI envolve algoritmos que modelam o comportamento de agentes em

um enxame, tendo como inspiração geralmente o comportamento de insetos e outras
sociedades de animais. O objetivo dos modelos de SI é capturar o comportamento
simples dos indivíduos e suas interações locais com o ambiente e com seus vizinhos, de
forma a obter comportamentos complexos que possam resolver problemas complexos,
em sua maioria problemas de otimização. Os enxames que inspiram tais modelos
computacionais incluem os de formigas, cupins, abelhas, aranhas, peixes, pássaros,
entre outros (Bonabeau et al. 1999) (Engelbrecht 2007). No escopo deste trabalho,
foram escolhidos os seguintes algoritmos para representar esse domínio de pesquisa:
30
Artificial Bee Colony, Biclustering Ant Colony Optimization, Density based Fish School
Search, Glowworm Swarm Optimization, Harmony Search, Niche based Particle
Swarm Optimization e Swarm Intelligence Biclustering. Exemplos de algoritmos de SI
aplicados ao problema de Biclustering podem ser encontrados em (de França et al.
2008) (de França 2010) (Menezes e Coelho 2011b) (Xie et al. 2007).
Sistemas imunológicos artificiais, do inglês Artificial Immune Systems (AIS), se

baseiam em metáforas, abstrações e princípios da imunologia para a solução de
problemas computacionais (de Castro e Timmis 2002) (de Castro e Timmis 2003).
Existem AIS aplicados a domínios como aprendizagem de máquina, reconhecimento de
padrões, detecção de anomalias, segurança de sistemas de informação, mineração de
dados, sistemas baseados em agentes, busca e otimização, entre outros (de Castro 2007).
De acordo com de Castro et al. (2007b), quando comparados a propostas

alternativas, algoritmos imuno-inspirados apresentam características distintivas que
provaram ser de especial interesse para resolver problemas multimodais, tais como:
(1) o paradigma multi-populacional, em que várias populações são evoluídas
simultaneamente (diferente de outros algoritmos, em que somente uma população
converge para uma única solução); (2) o controle dinâmico do tamanho da população,
que permite a definição automática do número de soluções-candidatas com base nas
características do problema; e (3) a propriedade de manutenção da diversidade,
permitindo a coexistência de múltiplas soluções alternativas na mesma execução.
Exemplos de AIS aplicados ao problema de biclustering são encontrados em (Coelho et
al. 2009) (de Castro et al. 2007a, 2007b). Esse campo de pesquisa é representado neste
trabalho pelo algoritmo Artificial Immune Network for Biclustering.
As soluções encontradas pelos algoritmos pertencentes a esses três domínios

apresentados podem assumir diferentes representações. Para a resolução do problema de
biclustering, as soluções devem ter duas cadeias binárias que indiquem as
linhas/colunas que pertencem à solução. Em se tratando do GA adotado neste trabalho
para lidar com a tarefa de biclustering, cada indivíduo da população denota um
bicluster, sendo composto por duas cadeias binárias de tamanho e . Se o valor de
um gene for “1”, isso significa que a linha ou coluna correspondente pertencerá ao
bicluster. Para um elemento da matriz de dados pertencer ao bicluster, este deve ter sua
linha e coluna assinaladas com um valor “1”. Por exemplo, sejam as cadeias “11010” e
31
“100100” partes do cromossomo representando, respectivamente, as linhas e as colunas

de um indivíduo (vide Figura 9). Nesse caso, teríamos um bicluster na forma de uma
submatriz 3 × 2, contendo os elementos , , , , e .
Figura 9 - Exemplo de bicluster.
Como os algoritmos DE, PSO, FSS, ABC, GSO e HS foram originalmente

concebidos para lidar com problemas de otimização em espaços contínuos, o mesmo
“truque” adotado no contexto do algoritmo PSO por Xie et al. (2007) (vide Seção 3.3)
foi utilizado para converter a representação das soluções do espaço dos reais para o
espaço dos valores binários. Para isso, é usada uma função sigmoide (∙) para gerar um
vetor de posições binárias ( ′ ), que codifica a solução (bicluster) associada a cada
algoritmo, como a seguir:
( )= (31)
ℯ
1, se > (0, 1)
′ = . (32)
0, caso contrário
Na implementação dos algoritmos BicACO, SwarmBcluster e BIC-aNet, cada

solução é representada por dois vetores de valores inteiros, que representam os índices
das linhas/colunas que pertencem ao bicluster.
A seguir, passa-se a discorrer mais detalhadamente sobre os algoritmos bio-

inspirados adotados neste trabalho para fins de tratamento da tarefa de biclustering.
3.1. Genetic algorithms
Os algoritmos genéticos são algoritmos de busca que usam o vocabulário e

princípios baseados no campo da genética. Sua versão mais simples e popular foi
32
apresentada por Holland (1975). De acordo com Mitchell (1996), GAs operam
transformando uma população de cromossomos em uma nova população, usando
seleção de indivíduos em conjunto com operadores genéticos que simulam
recombinação, mutação e mesmo inversão de cadeias genéticas. GAs são também
influenciados pelo princípio da Seleção Natural, segundo o qual, dada uma população,
indivíduos mais aptos têm mais chance de sobreviver e de gerar descendentes, enquanto
indivíduos menos adaptados tendem a desaparecer.
Segundo a terminologia biológica, um gene é a entidade funcional que codifica

uma característica específica de um indivíduo, como a cor do cabelo. O termo alelo
descreve cada uma das formas alternativas do mesmo gene, determinando a
manifestação de um atributo, como loiro ou moreno para a cor do cabelo. O genótipo se
refere à combinação específica dos genes de um indivíduo em particular, enquanto o
fenótipo relaciona-se à manifestação do genótipo, responsável pela constituição física
de um organismo (Wu 2005). No contexto dos algoritmos genéticos, o genótipo de um
indivíduo diz respeito à codificação de uma solução potencial para o problema-alvo, ao
passo que o seu fenótipo representa a solução decodificada. As estruturas de dados
representando os genótipos são chamadas de cromossomos. Cada unidade de um
cromossomo é um gene, posicionado em um lugar chamado de locus. Os alelos denotam
os diferentes valores ou instâncias que um gene pode assumir. O significado de um
cromossomo – em particular, seu fenótipo – é definido de acordo com o problema em
questão (Blum e Roli 2003) (de Castro 2007).
De acordo com Mitchell (1996), a forma mais simples (também chamada de

canônica ou tradicional) de GAs envolve três tipos de operadores: seleção, reprodução e
mutação. O ciclo básico do GA simples é apresentado na Tabela 4.
O esquema de seleção aumenta a proporção de indivíduos bem adaptados na

população. A cada iteração, dois tipos de seleção devem ser realizados: um para
reprodução e outro para escolher os indivíduos que comporão a população da geração
seguinte (Blum e Roli 2003) (de Castro 2007) (Wu 2005).
Existem diversas maneiras de escolher indivíduos para o processo de

reprodução. Uma delas é a seleção por torneio de tamanho igual a k, em que k
(tipicamente, dois) indivíduos da população corrente são escolhidos aleatoriamente e
33
aquele que for mais adaptado (tiver um melhor valor de aptidão) será escolhido como o
primeiro pai. O segundo pai é escolhido da mesma forma. Outra abordagem é escolher
os dois pais de forma puramente aleatória.
Tabela 4: Pseudocódigo do algoritmo GA

Inicie aleatoriamente a população
Avalie cada indivíduo
Enquanto o critério de parada não for alcançado faça
Enquanto a população dos descendentes for menor que faça
Selecione dois pais para gerar dois novos indivíduos
Execute o operador genético de recombinação de acordo com a
probabilidade
Execute o operador genético de mutação de acordo com a
probabilidade
Fim enquanto
Avalie todos os descendentes
Selecione indivíduos para compor a próxima geração
Fim enquanto
Reporte o melhor indivíduo
O ato de selecionar os indivíduos da geração seguinte exclusivamente a partir

dos descendentes gerados na atual é chamado de substituição por geração. Mas também
é possível transferir indivíduos diretamente da população corrente para a próxima
geração. O elitismo ocorre quando uma porcentagem dos indivíduos mais aptos, dentre
os da população corrente e os descendentes gerados, são sempre selecionados. Nesse
caso, quanto mais indivíduos sobreviverem para a próxima geração, menor tende a ser a
diversidade da nova população (Engelbrecht 2007).
Para ambos os tipos de seleção, um operador chamado de seleção através de

roleta pode ser aplicado, em que para cada cromossomo é calculada uma probabilidade
de seleção proporcional ao seu valor de aptidão. Assim, indivíduos com melhor valor de
aptidão têm uma probabilidade maior de serem escolhidos para compor a próxima
geração ou para atuarem como pais para a geração de novos indivíduos. O operador de
seleção através de roleta é um caso especial de seleção proporcional ao fitness.
A seleção por ranking pode ser utilizada em conjunto com a seleção através de
roleta para evitar a convergência prematura e a dominância de um superindivíduo. O seu
princípio consiste em ordenar todos os elementos de acordo com o valor de aptidão e
34
usar esse ranking como base da seleção, em vez de usar diretamente o valor de aptidão
(Linden 2006).
O valor de aptidão do indivíduo é modificado para ′ , tal que e

são os valores que serão atribuídos, respectivamente, ao pior e ao melhor colocado no
ranking, é o número de indivíduos da população e é a posição do indivíduo
na geração corrente – vide Eq. (33).
= +( − ) ∙ (33)
Os parâmetros e denotam, respectivamente, as probabilidades de uma

recombinação e de uma mutação ocorrerem.
A recombinação (via operador de crossover) combina genes de dois pais de

forma a gerar descendentes e explorar o espaço de busca (Wu 2005). A Figura 10
mostra um exemplo de recombinação de dois cromossomos feita trocando-se partes dos
seus genótipos. Na recombinação de um único ponto, os dois pais são partidos em um
ponto aleatório e, posteriormente, um filho é gerado com a primeira parte do primeiro
pai e a segunda parte do segundo pai, ao passo que um segundo filho é gerado com a
segunda parte do primeiro pai e a primeira parte do segundo pai (Weise 2009). Se é
maior que um número aleatório no intervalo [0, 1], a recombinação ocorre; senão, os
descendentes serão uma cópia dos pais.
Figura 10 - Tipos de recombinação. (a) crossover de um único ponto; (b) crossover de dois pontos;
e (c) crossover de múltiplos pontos.
Fonte: (Weise 2009, p. 148).
Uma das maiores dificuldades referentes aos EAs padrões é a de controlar a sua
tendência à convergência prematura para soluções ótimas locais. O princípio mais
simples para diversificar o processo de busca é o uso de um operador de mutação, cujo
proposito é preservar a diversidade das soluções-candidatas através da introdução de
pequenas perturbações nas mesmas (Blum e Roli 2003) (Weise 2009) (Wu 2005). A
35
Figura 11 mostra tipos de mutação. A mutação ocorre para um dado gene, se for
maior que um número aleatório no intervalo [0, 1].
Figura 11 - Tipos de mutação. (a) mutação de um único gene; (b) e (c) mutação de múltiplos genes.
Fonte: (Weise 2009, p. 147).
A busca realizada pelo GA tradicional é notadamente de caráter unimodal.

Porém, existem estratégias para torná-la multimodal. Tais estratégias são conhecidas
como métodos de niching ou especiação. Na Biologia, esse termo se refere à formação
de novas espécies que exploram diferentes nichos (recursos) do ecossistema, enquanto
em um sistema artificial ele significa a formação de subpopulações em uma população
de tamanho fixo. Portanto, métodos de especiação em sistemas artificiais consistem em
técnicas que promovem a competição ou cooperação entre indivíduos por recursos
limitados, objetivando a divisão da população em subpopulações (Madeiro 2010). Neste
trabalho, serão abordados os métodos de fitness sharing (Goldberg e Richardson 1987)
e clearing (Pétrowski 1996), dadas a sua eficácia e importância histórica.
Esses métodos são aplicados após a avaliação dos pais da população corrente e
antes do operador de seleção. São usados juntamente com um esquema de restrição de
cruzamento, cujo propósito é evitar o cruzamento entre indivíduos de nichos diferentes,
reduzindo a formação de indivíduos letais (Sareni e Krahenbuhl 1998).
Em um cruzamento com restrição, o primeiro pai é escolhido por torneio de

tamanho igual a dois. Para o segundo pai, são selecionados membros da população
e um desses membros é escolhido se a distância de Hamming entre o mesmo e o
primeiro pai for menor que um limiar . Caso o segundo pai não possa ser
escolhido do conjunto , este é escolhido de forma aleatória, levando em
consideração toda a população (Miller e Shaw 1996).
O procedimento de fitness sharing reduz o valor de fitness de um indivíduo de

acordo com a densidade de indivíduos na região em torno dele. Ou seja, reduz-se do
36
valor de aptidão de cada indivíduo da população uma quantidade proporcional ao

número de indivíduos similares a ele na população atual – vide Eqs. (34)-(36).
′ = (34)
= ∑ ℎ( ) (35)
1− ⁄ , se <
ℎ = (36)
0, caso contrário
Nas equações acima, ′ indica o novo valor de fitness do indivíduo ; mede o

número aproximado de indivíduos cujos valores de fitness são compartilhados com o
indivíduo ; é o tamanho da população; é a distância entre os indivíduos e ; é
um limiar de dissimilaridade; e é uma constante que regula a função de sharing ℎ(∙).
Tabela 5: Procedimento de Clearing

Ordene os indivíduos pelo valor de aptidão de forma decrescente
De = 1 até
Se o valor de aptidão do indivíduo for maior que zero
= 1
De = + 1 até
Se o valor de aptidão do indivíduo for maior que zero e a
distância entre os indivíduos e for menor que
Se <
= + 1
Senão
= 0
Fim se
Fim se
Fim
Fim se
Fim
Já o procedimento de Clearing (Tabela 5) inspira-se no princípio de divisão de

recursos limitados entre subpopulações de indivíduos com características semelhantes,
ditado por Holland (1975). Porém, em vez de dividir os recursos disponíveis entre os
indivíduos de uma subpopulação, o procedimento de Clearing provê tais recursos
somente aos melhores indivíduos de cada subpopulação (Pétrowski 1996).
37
O método de Clearing possui dois parâmetros salientes: o número de vencedores

( ), que terão seus valores de aptidão preservados enquanto os dos
outros serão zerados; e o raio de clearing ( ), que é um limiar de dissimilaridade.
3.2. Differential evolution
A Evolução Diferencial, do inglês Differential Evolution (DE), foi desenvolvida

por Storn e Price (1995) em meados da década de 1990 e surgiu a partir de tentativas de
resolver o problema de ajuste polinomial de Chebychev, modelado como um problema
de otimização contínua (Arantes et al. 2006).
O algoritmo DE, assim como o GA, é composto de três operações básicas:

mutação, cruzamento e seleção. Porém, enquanto o GA padrão lida com vetores
binários, o DE tradicionalmente lida com vetores de números reais.
A ideia principal da evolução diferencial é gerar novos indivíduos, denotados

como vetores modificados ou doadores , pela adição da diferença ponderada entre
dois indivíduos aleatórios da população ( e ) a um terceiro indivíduo . Essa
operação é chamada mutação e, após esta, ocorre o cruzamento, em que os componentes
do indivíduo doador são misturados com os componentes de um indivíduo
(denominado vetor-alvo), para resultar no vetor experimental – vide Eqs. (37) e (38).
= ( )+ ( ( )− ( )) (37)
, se (0, 1) ≤
= (38)
( ), caso contrário
Por fim, na seleção, se o vetor experimental obtiver um valor da função-objetivo

melhor que o do vetor-alvo , então o vetor experimental substitui o vetor-alvo na
geração seguinte (Arantes et al. 2006). O algoritmo DE é mostrado na Tabela 6.
Para o algoritmo DE tornar-se multimodal (CDE), foi adotada a estratégia de

crowding. Esta técnica interfere na substituição dos indivíduos da população corrente
pelos seus descendentes, favorecendo a substituição entre indivíduos similares. Quando
um novo descendente é gerado, este é comparado com o indivíduo mais similar da
população; se o descendente for melhor, ele substitui tal indivíduo da população
corrente (Zaharie 2004). O algoritmo CDE é mostrado na Tabela 7.
38
Tabela 6: Pseudocódigo do algoritmo DE

Inicie a população de indivíduos
Avalie os indivíduos
Para cada indivíduo da população
Escolha três outros indivíduos diferentes da população ( , ,
) de forma aleatória para gerar o vetor-doador
Crie um novo vetor (vetor experimental) realizando o
crossover entre o vetor-doador e o vetor-alvo
Avalie
Fim para
Para cada indivíduo da população (vetor-alvo)
Se o vetor experimental for melhor que o vetor-alvo
Substitua o vetor-alvo pelo experimental ( + 1) =
Senão
Mantenha o vetor-alvo para a próxima geração ( + 1) = ( )
Fim se
Fim para
Fim enquanto
Tabela 7: Pseudocódigo do algoritmo CDE

Inicie a população de indivíduos
Avalie os indivíduos
Para cada indivíduo da população
Escolha três outros indivíduos diferentes da população ( , ,
) de forma aleatória para gerar o vetor-doador
Crie um novo vetor (vetor experimental) realizando o
crossover entre o vetor-doador e o vetor-alvo
Avalie
Encontre o indivíduo mais similar a
Se o vetor experimental for melhor que
Substitua pelo vetor experimental x = u
Fim se
Fim para
Fim enquanto
39
3.3. Particle swarm optimization
O algoritmo Particle Swarm Optimization (PSO) mantém uma nuvem de

partículas, sendo que cada partícula representa uma possível solução para o problema-
alvo (Engelbrecht 2007). As partículas “flutuam” em um espaço de busca
multidimensional executando basicamente três operações: o cálculo do seu valor de
aptidão, a comparação da qualidade de sua solução com a de seus vizinhos e a tentativa
de imitar o vizinho com o melhor desempenho até o momento. Assim, a posição de cada
partícula é ajustada a cada iteração com base na sua experiência anterior e na
experiência de seus vizinhos.
Originalmente, duas variantes do PSO foram criadas, diferindo no tipo de

vizinhança entre as partículas: (1) Global Best PSO, conhecido como gbest PSO, em
que a vizinhança de cada partícula é todo o enxame; e (2) Local Best PSO, ou lbest
PSO, que cria uma vizinhança para cada partícula compreendendo um número reduzido
de vizinhos (Engelbrecht 2007).
Cada partícula possui um conjunto de atributos, que são: sua posição atual ( ),
velocidade ( ), a melhor posição descoberta pela partícula até o momento ( )ea
melhor posição descoberta até o momento pelos seus vizinhos ( ou ).
Todas as partículas começam com sua velocidade e posição iniciadas com valores
aleatórios. A posição de uma partícula é ajustada adicionando uma velocidade à posição
atual. É o vetor da velocidade que guia o processo de busca, e reflete tanto a experiência
adquirida pela partícula quanto a informação trocada com a vizinhança da partícula.
Na atualização da velocidade de uma partícula (Eq. (39)), três parâmetros de

controle assumem importantes papéis: o peso de inércia, , que controla a influência da
velocidade anterior; e e , que são coeficientes de aceleração (conhecidos como
fatores cognitivo e social), delimitando o quão forte a partícula é atraída para regiões
próximas de e , respectivamente. O impacto desses parâmetros é modulado
por variáveis aleatórias, responsáveis pela natureza estocástica do algoritmo
(Engelbrecht 2007) (Xie et al. 2007).
40
( + 1) =
∙ ( )+ (0, 1) ( )− ( ) + (0, 1) ( )− ( )
(39)
Neste trabalho, uma versão binária do algoritmo gbest PSO foi usada. Nesse
caso, para uma partícula flutuando em um espaço de busca binário, sua posição deve
estar no intervalo [0, 1]. Para isso, a função sigmoide (∙) recebe como parâmetro a
velocidade da partícula para transformar a posição do espaço real para o espaço binário
(Xie et al. 2007) – vide Eqs. (31) e (40).
1, se ( + 1) > (0, 1)
( + 1) = (40)
0, caso contrário
O pseudocódigo do algoritmo PSO é exibido na Tabela 8.
Tabela 8: Pseudocódigo do algoritmo gbest PSO

Inicie a população de partículas aleatoriamente
Para cada partícula
Calcule o valor de aptidão
Se o valor de aptidão corrente for melhor que o valor de
aptidão de
Faça a posição corrente ser
Fim se
Fim para
Escolha o melhor entre todas as partículas para ser
Para cada partícula
Atualize a velocidade
Atualize a posição
Fim para
Fim enquanto
NichePSO é uma extensão do algoritmo PSO que divide o enxame principal em

subenxames, para que múltiplas soluções relacionadas a diferentes nichos possam ser
localizadas em uma única execução (Engelbrecht 2007). Cada subenxame criado é
responsável por localizar e manter um nicho, ou seja, uma partição do espaço de busca
para a qual potencialmente existe uma solução para o problema em questão (Madeiro
2010).
41
A atualização da velocidade de uma partícula pode ocorrer de duas formas. Se a

partícula estiver no enxame principal, utiliza-se somente sua própria experiência:
( + 1) = ∙ ( )+ (0, 1)[ ( )− ( )]. (41)
Se a partícula estiver em um subenxame, somente as outras partículas desse subenxame

serão consideradas vizinhas. Para cada subenxame irá existir um , que é a melhor
partícula desse subenxame, sendo que o cálculo da velocidade é dado como na Eq. (42).
( + 1) =
∙ ( )+ (0, 1) ( )− ( ) + (0, 1) ( )− ( )
(42)
Tabela 9: Pseudocódigo do algoritmo NichePSO

Inicie a população de partículas aleatoriamente
Para cada partícula no enxame principal
Atualize a velocidade
Atualize a posição
Avalie a partícula
Fim para
Para cada subenxame
Atualize a velocidade das partículas
Atualize a posição das partículas
Avalie as partículas
Atualize o raio
Fim para
Junte dois subenxames se |gbest − gbest | < µ
Remova partículas do enxame principal e adicione a um
subenxame se |gbest − x| ≤ R
Crie um novo subenxame com a partícula e seu vizinho mais
próximo caso σ < α, considerando as últimas iterações
Fim enquanto
Subenxames podem ser unidos ou absorver partículas do enxame principal. Para

juntar dois subenxames, a distância entre suas melhores partículas deve ser menor que
um dado parâmetro . Por outro lado, as partículas do enxame principal que adentrarem
a área de exploração de um subenxame são removidas do enxame principal e
42
adicionadas a esse subenxame. Para isso, a distância entre a melhor partícula do

subenxame e a partícula do enxame principal deve ser menor que o raio do subenxame
, que é atualizado a cada iteração conforme a Eq. (43).
= | − | (43)
Além disso, o algoritmo NichePSO monitora o valor de aptidão de uma partícula

através da sua variância em um número determinado de iterações (Panigrahi et al.
2011). Se houver pouca mudança no valor de aptidão de uma partícula considerando as
últimas iterações, um novo subenxame é criado com essa partícula e seu vizinho mais
próximo. Nesse caso, um limiar é usado para criar um novo subenxame. O
pseudocódigo do NichePSO é apresentado na Tabela 9.
3.4. Density based fish school search
Cardumes de peixes são um dos melhores exemplos de comportamento coletivo

(Sumpter 2010). Cardumes são grupos compostos de vários peixes, geralmente da
mesma espécie, atuando como uma única unidade e se movendo em padrões
harmoniosos pelos oceanos. Esses grupos possuem uma estrutura simplificada e
comportamento uniforme com o objetivo de evitar predadores e encontrar comida. Os
peixes se juntam aos cardumes por razões egoístas; portanto, os cardumes devem
oferecer benefícios superiores aos custos de uma maior visibilidade aos predadores, do
aumento da concorrência e da instabilidade energética (Hamilton 1970).
A meta-heurística bio-inspirada chamada de Fish School Search (FSS) foi

introduzida por Bastos Filho et al. (2009). Em resumo, o algoritmo FSS é inspirado pelo
comportamento coletivo exibido por cardumes reais e, assim, é composto de operadores
que tentam imitar as atividades de movimentação e alimentação dos cardumes (Bastos
Filho et al. 2009) (Madeiro 2010).
As principais características comportamentais derivadas de cardumes reais de

peixes e incorporadas ao algoritmo FSS podem ser agrupadas em duas categorias
(Bastos Filho et al. 2009) (Madeiro 2010): (1) Alimentação, inspirada pelo instinto
natural da busca por comida para se fortalecer e gerar descendentes; e (2)
43
Movimentação, tentando imitar o movimento coordenado produzido por todos os peixes

do cardume para localizar comida. Esses comportamentos servem de metáforas para,
respectivamente, a avaliação de soluções-candidatas no processo de busca e para o
próprio processo de busca.
No FSS, o cardume se movimenta (processo de busca) para localizar comida

(soluções-candidatas) no aquário (espaço de busca). O peso de um peixe atua como uma
memória do seu sucesso individual, ao passo que os movimentos individuais e coletivos
são desempenhados para localizar e explorar áreas promissoras do aquário.
Os operadores de movimentação são encarregados de guiar o esforço do

processo de busca para regiões do aquário percebidas coletivamente como mais
promissoras em relação à função de aptidão escolhida. Esses operadores são divididos
em três classes (Bastos Filho et al. 2009): movimento individual, movimento coletivo
instintivo e movimento coletivo volitivo.
Quanto ao movimento individual (44), este ocorre somente se o ponto de destino

candidato encontrar-se dentro dos limites do aquário e a densidade de alimento nesse
ponto parecer ser melhor que no local atual, . A direção desse movimento é escolhida
aleatoriamente e um parâmetro, , é definido para determinar o deslocamento dos
peixes no aquário. Para incluir a aleatoriedade no processo de busca, deve ser
multiplicado por um número aleatório retirado de uma distribuição uniforme. Somente
após esse movimento a alimentação dos peixes pode acontecer (Bastos Filho et al.
2009) (Madeiro 2010).
( + 1) = ( )+ (−1, 1) ∙ (44)
Todos os peixes contêm uma memória inata de seu sucesso – seu peso.
Conforme proposto por Bastos Filho et al. (2009), a variação de peso dos peixes é
proporcional à diferença normalizada entre o valor de aptidão das posições anterior e
atual do peixe (vide Eq. (46)), objetivando-se modelar a diferença de concentração de
alimentos nesses locais. Se o peixe não encontrar uma posição melhor, o movimento
não ocorre ( = 0) e seu peso permanece constante (Madeiro 2010). Na Eq. (45),
( ( )) representa o valor de aptidão vinculado à posição (solução) do i-ésimo peixe
na iteração t.
44
Δ = ( ( + 1)) − ( ( )) (45)
∆
( + 1) = ( )+ (46)
(∆ )
Após a alimentação, o movimento coletivo instintivo ocorre (Eqs. (47) e (48)),

calculando uma média ponderada dos movimentos individuais com base no sucesso
imediato de todos os peixes no cardume (Bastos Filho et al. 2009) (Madeiro 2010).
Apenas aqueles peixes que obtiveram sucesso nos movimentos individuais influenciam
a direção resultante ( ) nesse movimento coletivo. Quando a direção geral é calculada,
cada peixe é reposicionado.
∑ ∆ ∆
( )= (47)
∑ ∆
( + 1) = ( )+ ( ) (48)
Tabela 10: Pseudocódigo do algoritmo FSS

Inicie a população de peixes aleatoriamente
Avalie os peixes
Para cada peixe
Atualize a sua posição utilizando o operador de movimento
individual
Avalie o peixe
Aplique o operador de alimentação
Fim para
Calcule a média ponderada dos movimentos individuais
Para cada peixe
Aplique o operador de movimento coletivo instintivo
Fim para
Calcule o baricentro do cardume
Para cada peixe
Aplique o operador de movimento coletivo volitivo
Fim para
Atualize o tamanho dos passos individual e volitivo
Fim enquanto
45
Finalmente, o terceiro operador de movimento, referido como movimento

coletivo volitivo, envolve uma avaliação geral do sucesso/fracasso do cardume baseado
na variação incremental do peso total do cardume – vide Eqs. (49)-(52). Se o cardume
está acumulando peso, o raio do cardume deve se contrair; caso contrário, deve
aumentar. Essa ampliação ou contração é aplicada como um pequeno desvio na posição
de cada peixe, tomando como referência o baricentro do cardume. O baricentro é
calculado considerando todas as posições dos peixes e seus respectivos pesos. Também,
nesse movimento, um parâmetro de controle, , é adotado para determinar o
deslocamento efetivo dos peixes no aquário. O valor desse parâmetro pode ser calculado
em função de . A atualização de e ocorre após o terceiro
movimento (Bastos Filho et al. 2009) (Madeiro 2010). O FSS é mostrado na Tabela 10.
∑ ( )
( )= (49)
∑ ( )
( ) ( )
( + 1) = ( )− ∙ (0, 1) , se o peso do cardume aumentou
‖ ( ) ( )‖
( ) ( )
(50)
( + 1) = ( )+ ∙ (0, 1) , caso contrário
‖ ( ) ( )‖
( )
( + 1) = ( ) − çõ
(51)
( + 1) = 2 ∙ ( + 1) (52)
O algoritmo Density based Fish School Search (dFSS), proposto por Madeiro
(2010), é uma extensão do algoritmo FSS que permite localizar e manter ao longo das
iterações do algoritmo múltiplos ótimos de um POFMM.
De acordo com Madeiro (2010), no dFSS, cada subcardume criado ao longo da

execução do algoritmo corresponde a uma região do espaço de busca para a qual pode
existir um ponto ótimo. Logo, cada subcardume criado é responsável por localizar um
ponto ótimo distinto dos demais e preservar esse ponto ótimo ao longo das iterações do
algoritmo. Para isso, foram feitas algumas modificações no algoritmo FSS original.
Foram criados dois novos operadores para o dFSS, denominados operador de memória
ou afinidade e operador de divisão do cardume, ao passo que os operadores de
alimentação, movimento individual, coletivo instintivo e coletivo volitivo sofreram
modificações.
46
Conforme explicado por Madeiro (2010), no dFSS, da mesma forma que no

FSS, após o movimento individual, a variação Δ no valor da aptidão de um peixe é
considerada a porção de alimento que esse peixe encontrou e pode ser positiva ou nula.
Entretanto, diferentemente do FSS, no dFSS, a porção de alimento Δ encontrada por
é partilhada entre os membros do cardume. Sendo Δ a porção de alimento encontrada
por em uma dada iteração do algoritmo, a partilha desse valor com outros membros
do cardume depende de dois fatores: a distância relativa entre e ; e a quantidade
de peixes para os quais < , incluindo-se o próprio peixe , sendo que
representa outros peixes no cardume. Portanto, a porção de alimento Δ encontrada
para cada peixe é partilhada de tal modo que representa a porção de alimento que o
peixe irá receber devido a Δ e ( , ) é a parcela que o peixe irá receber de –
vide Eqs. (53)-(56).
Δ = × ∑ ⇒ = (53)
( ) ∑
( )
= ( )
(54)
( , )= (55)
( )
∆
( + 1) = ( )+ ∑ (56)
( ) ∙∑
( )
No dFSS, cada peixe possui uma memória que acumula a quantidade de

alimento que coube a devido ao peixe ao longo das iterações do algoritmo (Eq.
(57)). A memória quantifica a influência que exerce sobre , manifestada em
termos de sincronia de movimento. Ou seja, o peixe irá repetir os movimentos
executados pelo peixe em uma intensidade que depende de . O parâmetro
(0 ≤ ≤ 1) regula a dinâmica da rede de influências entre peixes por meio do
decaimento da memória de um peixe ao longo da execução do algoritmo. O movimento
coletivo instintivo será atualizado em função dessa memória (Madeiro 2010) – vide Eqs.
(58) e (59).
47
∆
( + 1 ) = (1 − ) ∙ ( )+ (57)
( ) ∙ ∑
( )
∑ ∆
( )= (58)
∑
( + 1) = ( )+ () (59)
No FSS, a direção do movimento coletivo instintivo é a mesma para todos os

peixes; já para o dFSS, cada peixe possui a sua respectiva direção de movimento
coletivo instintivo (Eq. (58)), em que cada peixe no cardume segue preferencialmente
o comportamento de um outro peixe mais próximo do qual ele recebeu alimento
(Madeiro 2010).
No dFSS, a cada iteração do algoritmo, o cardume principal é dividido em

subcardumes. Um peixe está no mesmo subcardume de um peixe se e somente se
é o peixe que exerce maior influência sobre ou é o peixe que exerce maior influência
sobre (Eq. (60)). A relação de influência não é necessariamente uma relação
simétrica. Entretanto, por definição, considera-se que, se está no mesmo subcardume
de , então também está no mesmo subcardume de (Madeiro 2010).
= max( )∨ = max( ) (60)
A modificação no movimento individual, dada pelas Eqs. (61)-(64), diz respeito

somente à atualização do passo de um peixe, sendo que uma descrição mais detalhada
do papel dos parâmetros ∗ dessas equações pode ser encontrada em (Madeiro
2010).
( + 1) = ∙ ( ) (61)
( ) ( )
= − ( ) ( )
∙ ( − ( ))
(62)
( )= ∙ (63)
∆
( )= ∑ (64)
( ) × ∑
( )
48
Tabela 11: Pseudocódigo do algoritmo dFSS

Inicie aleatoriamente a posição de todos os peixes
Avalie todos os peixes
Calcule a distância entre os peixes
Para cada peixe faça
Avalie o peixe
Execute o movimento individual
Avalie a posição-candidata
Se a posição-candidata for melhor que a posição atual
Para cada peixe
Execute o operador de alimentação
Atualize o peso do peixe
Execute o operador de memória
Fim para
Fim se
Fim para
Execute o movimento instintivo
Determine qual o peixe que exerce mais influência sobre
Fim para
Execute o Operador de Divisão do Cardume Principal
Para cada subcardume criado faça
Calcule o baricentro
Fim para
Atualize o tamanho do passo individual do peixe
Execute o movimento volitivo
Fim para
Avalie todos os peixes
Atualize a distância entre os peixes
Atualize o valor de decay (t)
Fim enquanto
Finalmente, para o dFSS, o movimento coletivo volitivo é executado

independentemente para cada subcardume criado (Eq. (65)). O baricentro ( ) é
calculado para cada subcardume baseado no peso dos peixes (Madeiro 2010). O
49
algoritmo dFSS é descrito na Tabela 11 e o operador de divisão do cardume principal é

descrito na Tabela 12.
( + 1) = ( )+ 1− ( ) ∙( ( )− ( )) (65)
Tabela 12: Pseudocódigo do operador de divisão do cardume principal

Enquanto houver peixes no cardume principal faça
Escolha aleatoriamente um peixe no cardume principal
Crie um novo subcardume
Adicione ao subcardume
Remova do cardume principal
Procure o outro peixe no cardume principal que mais
influencia ou é mais influenciado por
Enquanto existir faça
Adicione ao subcardume
Remova do cardume principal
Faça =
Procure o outro peixe no cardume principal que mais
influencia ou é mais influenciado por
Fim enquanto
Fim enquanto
3.5. Artificial bee colony
Proposto por Karaboga (2005), Artificial Bee Colony (ABC) é um algoritmo de

otimização baseado no comportamento inteligente exibido por enxames de abelhas –
vide Tabela 13. Nele, a colônia de abelhas artificiais está dividida em três grupos:
abelhas operárias, seguidoras e escudeiras. A posição de uma fonte de alimento
representa uma possível solução do problema de otimização e a quantidade de néctar
encontrado nessa posição corresponde à qualidade ou valor de aptidão associado a essa
solução.
No ABC, o ciclo de busca por fontes de alimentos consiste em três passos: (1) o
envio de abelhas operárias para as fontes de comida e a avaliação da quantidade de
néctar nessas posições; (2) a seleção de fontes de comida pelas seguidoras, após
receberem informações das operárias; e (3) a determinação das fontes de comida
50
abandonadas e envio das abelhas escudeiras em busca de novas fontes. Metade da

colônia de abelhas consiste de abelhas operárias, enquanto a outra metade consiste de
abelhas seguidoras. Para cada fonte de comida, existe uma abelha operária. Quando a
fonte de comida de uma abelha operária é esgotada, esta torna-se uma abelha escudeira
(Karaboga e Basturk 2007).
No início do algoritmo, uma fonte de comida é iniciada aleatoriamente para cada

operária e a quantidade de néctar é determinada. A cada novo ciclo do algoritmo, cada
abelha operária vai para a fonte de comida visitada por ela no ciclo anterior, já que
ela consta na sua memória, e também escolhe uma nova fonte na vizinhança. Essa nova
fonte é calculada escolhendo uma fonte de comida existente na memória de outra
abelha operária e adicionando à posição atual um número aleatório no intervalo
[−1, 1] multiplicado pela diferença entre as posições – vide Eq. (66) (Karaboga e
Basturk 2007).
= + (−1, 1) ∙ ( − ) (66)
Após a avaliação das fontes, as abelhas operárias passam as informações das

posições e a quantidade de néctar disponível para as seguidoras. Uma abelha seguidora
escolhe uma certa fonte de comida de acordo com uma probabilidade proporcional à
quantidade de néctar existente nessa posição (Eq. (67)) (Karaboga e Basturk 2007).
= ∑
(67)
Da mesma forma que as operárias, as seguidoras buscam uma fonte de comida

na vizinhança, avaliam a quantidade de néctar da posição-candidata e, esta sendo maior
que a da posição anterior, a abelha memoriza a nova posição e esquece a anterior.
Se o número de tentativas sem sucesso de descobrir novas fontes de alimento

ultrapassar vezes, as abelhas escudeiras devem abandonar suas fontes estagnadas
e buscar novas fontes de alimento. A nova fonte de alimento é determinada de forma
aleatória e substitui a fonte abandonada (Karaboga e Basturk 2007).
51
Tabela 13: Pseudocódigo do algoritmo ABC

Inicie as fontes de comida aleatoriamente
Avalie as fontes de comida
Envie as abelhas operárias para as fontes de comida
Para cada abelha operária
Busque uma nova fonte de comida na vizinhança da fonte atual
Avalie a nova fonte
Se a nova fonte for melhor que a atual
Substitua a fonte atual pela nova fonte
Fim se
Fim para
Calcule a probabilidade das fontes de comida serem escolhidas
por uma abelha seguidora
Utilize a roleta para escolher as melhores fontes de comida
com base na probabilidade calculada
Coloque as abelhas seguidoras nas fontes escolhidas por
sorteio
Para cada abelha seguidora
Busque uma nova fonte de comida na vizinhança da fonte
escolhida
Avalie a nova fonte
Se a nova fonte for melhor que a atual
Substitua a fonte escolhida pela nova fonte
Fim se
Fim para
Determine as fontes de comida abandonadas:

Para cada fonte de comida
Determine o número de iterações em que não houve melhora na
quantidade de néctar da fonte
Se esse número for maior que
é uma fonte abandonada
Fim se
Fim para
Faça as abelhas escudeiras encontrarem uma nova fonte de

comida no lugar daquelas que foram abandonadas
Fim enquanto
52
3.6. Biclustering ant colony optimization
O algoritmo Ant Colony Optimization (ACO) é inspirado no comportamento das

formigas em busca de comida e no modo como elas são capazes de encontrar os
menores caminhos entre o seu ninho e a fonte de comida. Essas formigas depositam
feromônio na trilha para marcar caminhos favoráveis que devem ser seguidos por outros
membros da colônia. O algoritmo ACO explora um mecanismo similar para resolver
problemas de otimização (Blum e Roli 2003) (Dorigo et al. 2006) (Weise 2009).
A inspiração biológica para o ACO veio de experimentos conduzidos nas

décadas de 1940 e 50 pelo entomologista Pierre-Paul Grassé. Ele estudou algumas
espécies de cupins e observou uma forma de comunicação indireta através de
modificações no ambiente. O termo estigmergia foi usado para descrever esse tipo de
comunicação, diferenciando-o de outras formas de comunicação por duas características
principais: (1) é uma forma indireta e não simbólica de comunicação mediada pelo
ambiente; e (2) a informação é local, ou seja, só pode ser acessada por indivíduos que
visitem o local em que esta foi deixada. Exemplos de estigmergia podem ser observados
em colônias de formigas. Em várias espécies, ao procurar por comida, as formigas
inicialmente exploram a área ao redor do ninho de forma aleatória. Enquanto se movem,
deixam uma trilha de feromônio no local. Na hora de escolher um caminho, as formigas
percebem esse feromônio e tendem a escolher caminhos marcados por uma forte
concentração deste. Via esse mecanismo, formigas são capazes de transportar comida
para o formigueiro de forma bastante efetiva (Blum e Roli 2003) (Weise 2009).
Algoritmos ACO são baseados em um modelo probabilístico parametrizado que

é usado para modelar as trilhas de feromônio. Formigas artificiais constroem soluções
de forma incremental via a adição de componentes a uma solução parcial em construção
(Blum e Roli 2003). O primeiro algoritmo baseado em formigas, referenciado como Ant
System (AS), foi proposto por Dorigo (1992) e focava no problema do caixeiro viajante.
de França et al. (2008) propuseram uma adaptação do ACO para tratar o problema de
agrupamento bidimensional, sendo o algoritmo resultante nomeado Biclustering Ant
Colony Optimization (BicACO). As modificações propostas foram:
 Cada formiga possui uma tabela de feromônio separada;
 Cada uma das formigas (número desejado de biclusters) começa com a matriz
53
original completa e decide que linha/coluna remover, de acordo com uma

equação probabilística – vide Eq. (68). Cada formiga repete este passo
enquanto o resíduo ( ) do bicluster estiver acima de um limiar e o
volume estiver acima de um valor mínimo .
[ ] ∙ [ ]
( )= , se ∈
∑ [ ] ∙ [ ] (68)
0, caso contrário
 O parâmetro heurístico da Eq. (68) é definido como o resíduo médio da
linha/coluna ( , )/ ( , ) . A probabilidade de remover uma dada

linha/coluna torna-se maior se o resíduo correspondente for maior quando
comparado a outras linhas/colunas;
 Cada valor da tabela de feromônio irá representar a probabilidade de remover

uma linha ou uma coluna da matriz original de dados (dimensão × );
portanto, a tabela de feromônio terá tamanho + . Após cada formiga
construir um bicluster, essa tabela deve ser atualizada de forma proporcional
aos resultados obtidos – vide Eqs. (69) e (70).
= + ( − ) (69)
= (70)
∑∈
O pseudocódigo com essas modificações para tratar o problema de Biclustering

é apresentado na Tabela 14 (de França et al. 2008).
3.7. Glowworm swarm optimization
O algoritmo Glowworm Swarm Optimization (GSO) é inspirado no

comportamento de um enxame de vagalumes, sendo que cada vagalume no algoritmo
representa uma possível solução para um problema de otimização. Assim como na
natureza, vagalumes no GSO possuem um nível de luciferina, que é uma substância
usada para produzir luz e atrair parceiros para reprodução (Krishnanand e Ghose 2009).
54
Tabela 14: Pseudocódigo do algoritmo BicACO

Inicie as formigas com =
Inicie com o resíduo médio de cada linha/coluna da matriz
Seja o melhor bicluster encontrado e o seu valor de
aptidão
Para cada formiga
Comece com toda a matriz sendo um bicluster
Enquanto o resíduo do bicluster for maior que δ e o volume
for maior que
Remova uma linha/coluna de acordo com a função
probabilística (Eq. (68))
Calcule o resíduo do bicluster
Fim enquanto
Fim para
Se um melhor bicluster foi encontrado
Atualize e
Fim se
Atualize o feromônio
Fim enquanto
Os vagalumes utilizam o resultado da qualidade da solução que representam,

obtido através da função-objetivo, para calcular o valor da luciferina que são capazes
de transmitir aos seus vizinhos – vide Eq. (71). Aqui, (0 ≤ ≤ 1) é uma constante
que representa a taxa de decaimento do nível de luciferina e define a porção do valor
da função-objetivo ( ) que é incorporada ao nível de luciferina (Madeiro 2010).
( + 1) = ( 1 − ) ∙ ( )+ ∙ ( ) (71)
O vagalume identifica seus vizinhos e calcula seus movimentos através da

exploração de uma vizinhança variável, delimitada por um raio . Cada vagalume
seleciona probabilisticamente um vizinho que possui um valor de luciferina maior que o
seu próprio e move-se em direção a este (Eqs. (72) e (73)). Esses movimentos, baseados
somente em informações locais e interação entre vizinhos, dão ao enxame de vagalumes
a capacidade de se organizarem em subgrupos distintos, que convergem em múltiplos
ótimos de uma dada função multimodal (Krishnanand e Ghose 2009).
55
∈ ( ) se < ( )e ( )< ( ) (72)
( ) ( )
( )= (73)
∑∈ ( ) ( ) ( )
O valor de varia ao longo das iterações do algoritmo com o objetivo de ajustar

a quantidade de vizinhos de de acordo com uma constante , que representa a
quantidade máxima de vizinhos permitida para um vagalume. Caso a quantidade de
vizinhos de seja maior do que , o raio de vizinhança diminui ao longo das
iterações do algoritmo; caso contrário, o raio aumenta até um limite definido por uma
constante (Eq. (74)). O parâmetro é uma constante que afeta a taxa de mudança da
faixa de vizinhança e é um número real positivo que representa o tamanho do passo a
ser dado pelo vagalume na direção do vagalume (Eq. (75)) (Madeiro 2010). O
pseudocódigo do GSO é mostrado na Tabela 15.
( + 1) = min , max 0, ( )+ ∙ ( − | ( )|) (74)
( ) ( )
( + 1) = ( )+ ∙ (75)
Tabela 15: Pseudocódigo do algoritmo GSO

Inicie aleatoriamente os vagalumes do enxame
Avalie os vagalumes
Para cada vagalume faça
Atualize o nível de luciferina
Fim para
Para cada vagalume faça
Atualize o conjunto de vizinhos mais brilhosos do que
Para cada vagalume de faça
Atualize a probabilidade de escolha de um vizinho
Fim para
Selecione um vagalume do conjunto de acordo com a
probabilidade
Atualize a posição do vagalume
Atualize o raio de vizinhança de
Fim para
Fim enquanto
56
3.8. Harmony search
O algoritmo Harmony Search (HS) é uma meta-heurística populacional baseada

em conceitos musicais proposta por Geem et al. (2001), inspirada pela observação de
que o objetivo da música é a busca de um estado perfeito de harmonia.
O esforço destinado a se encontrar a harmonia perfeita em uma música é análogo

àquele de buscar o ponto de ótimo global em um problema de otimização. Em outras
palavras, o processo de improvisação de um músico de jazz pode ser comparado com o
processo de busca em otimização, de forma que, quando um músico está improvisando,
ele tem três possíveis escolhas: (1) tocar uma melodia famosa exatamente como na sua
memória; (2) tocar algo similar à melodia famosa ajustando o tom ligeiramente; ou (3)
compor notas aleatórias. Essas três opções foram formalizadas em um processo de
otimização quantitativa e foram transformadas respectivamente no uso de uma memória
contendo harmonias, ajuste do tom e utilização de variáveis aleatórias (Yang 2009)
(Gao et al. 2009).
O primeiro passo do HS é iniciar uma memória contendo as harmonias ( ). A

coleção consiste inicialmente de certo número de soluções geradas aleatoriamente
para o problema em consideração. Depois, novas soluções são improvisadas a partir da
coleção . O uso dessa memória é importante porque garante que harmonias boas
serão consideradas como elementos de vetores nas novas soluções. A fim de utilizar
essa memória de forma eficaz, cada componente da solução é obtido com base na taxa
de aceitação das harmonias da memória ( ). O parâmetro é definido como
a probabilidade de se selecionar um componente de um membro de , ao passo que
1– passa a ser a probabilidade de gerá-lo aleatoriamente – vide Eq. (76) (Gao et
al. 2009).
= ( , se
) (0, 1) <
(76)
= (−1, 1), caso contrário
Se o componente vier da coleção , ele pode sofrer uma mutação de acordo

com a taxa de ajuste do tom ( ). O parâmetro determina a probabilidade de um
candidato de sofrer mutação (Gao et al. 2009), dada conforme a Eq. (77). Como o
ajuste do tom na música significa mudar a frequência, no HS isso significa gerar um
57
valor ligeiramente diferente do valor obtido pelo elemento selecionado a partir da

memória.
= + (−1, 1) (77)
Por fim, se houver melhora no valor de aptidão, a nova solução substitui a pior
solução na coleção . O pseudocódigo do HS é mostrado na Tabela 16.
No caso da abordagem multimodal, a nova solução irá substituir o pior dos seus
vizinhos, caso haja melhora no valor de aptidão. O conjunto de vizinhos de uma
solução envolve aqueles que estão a uma distância menor que um limiar . Já
denota um parâmetro que indica o número máximo desejado de vizinhos. O algoritmo
MHS é apresentado na Tabela 17.
Tabela 16: Pseudocódigo do algoritmo HS

Inicie um conjunto de harmonias
Avalie as harmonias
Crie uma nova harmonia :

Para cada
Se rand(0, 1) < HMCR então
Selecione o componente de uma solução armazenada na memória
Se rand(0, 1) < PAR então
Ajuste o componente
Fim se
Senão
Gere o componente de forma aleatória
Fim se
Fim para
Se a nova harmonia é melhor que a pior harmonia armazenada

Substitua a pior harmonia pela nova harmonia
Fim se
Fim enquanto
58
Tabela 17: Pseudocódigo do algoritmo MHS

Inicie um conjunto de harmonias
Avalie as harmonias
Crie uma nova harmonia :

Para cada
Se rand(0, 1) < HMCR então
Selecione o componente de uma solução armazenada na memória
Se rand(0, 1) < PAR então
Ajuste o componente
Fim se
Senão
Gere o componente de forma aleatória
Fim se
Fim para
Calcule a quantidade de vizinhos | | da nova harmonia tal que

d <V
Se |M| < M
Se a nova harmonia é melhor que a pior harmonia armazenada
Substitua a pior harmonia pela nova harmonia
Fim se
Senão
Se a nova harmonia é melhor que a média de aptidão dos
vizinhos
Substitua o pior vizinho pela nova harmonia
Fim se
Fim se
Fim enquanto
3.9. Swarm intelligence biclustering
SwarmBcluster é um algoritmo de Inteligência de Enxame capaz de encontrar

um conjunto de biclusters que maximiza a cobertura da base de dados sem degradar de
modo significativo o volume médio e o grau de coerência (MSR). Foi proposto por de
59
França e Von Zuben (2010) e é baseado no algoritmo ACO e em uma heurística

construtiva para a busca de δ-biclusters direcionados para regiões desejadas, ou seja,
que ainda não foram exploradas, sem a necessidade de gerar ruído junto aos elementos
da base de dados (de França 2010) (Veroneze 2011).
Tabela 18: Pseudocódigo do algoritmo SwarmBcluster

Inicie a lista de candidatos
Inicie a lista de biclusters
Enquanto a lista de candidatos contiver elementos e a lista de
biclusters for menor que faça
Escolha o próximo candidato a ser utilizado como ponto inicial
Gere um novo bicluster usando diretamente a heurística
construtiva ou usando a heurística a partir do algoritmo ACO
Se a sobreposição com qualquer um dos biclusters for menor do
que então
Insira o bicluster na lista de biclusters
Senão
Se o bicluster novo for melhor que o bicluster que está sendo
sobreposto
Substitua o bicluster sobreposto pelo novo bicluster
Fim se
Fim se
Atualize a lista de candidatos:

Para cada linha do bicluster faça
Para cada coluna do bicluster faça
Elimine a coluna da entrada correspondente à linha da
lista de candidatos
Fim para
Se a lista de colunas para a linha estiver vazia então
Elimine linha da lista de candidatos
Fim se
Fim para
Fim enquanto
60
Tabela 19: Pseudocódigo da heurística construtiva do algoritmo SwarmBcluster

Inicie o bicluster com uma dada linha e o conjunto de
colunas que ainda não foram cobertas para essa linha
Para cada linha da base de dados faça
Insira a linha no bicluster
Calcule ( , ) para cada coluna
Remova todas as colunas que possuem ( , )>
Se o bicluster resultante possuir um número de colunas
inferior a então
Volte ao estado anterior e adicione a mesma linha com valores
negativos
Calcule ( , ) para cada coluna
Remova todas as colunas que possuem ( , )>
Se o bicluster resultante possuir um número de colunas
inferior a então
Volte ao estado original
Fim se
Fim se
Se o bicluster resultante possuir exatamente colunas
então
Saia do laço
Fim se
Fim para
Inserção de múltiplos nós:

Repita
Calcule (, )
Insira em ( , ) todas as colunas ∉ que satisfazem ( , )<
( , )
Calcule (, )
Insira em ( , ) todas as linhas ∉ que satisfazem (, )<
( , )
Calcule (, )
Insira todas as linhas ∉ que, com seus valores
multiplicados por -1, satisfazem (, )< (, )
Até que nada seja inserido
O primeiro passo do algoritmo é criar uma lista de candidatos, que representa a

lista de elementos da base de dados original que ainda não foram cobertos até o
momento. Essa lista inicia-se contendo todas as linhas e, para cada linha, deve haver
61
uma sub-lista com todas as colunas. A lista de candidatos é atualizada de tal forma que,
para todas as linhas pertencentes a um bicluster encontrado, removem-se todas as
colunas contidas nele das respectivas sub-listas.
A heurística construtiva (Tabela 19) inicia-se com um bicluster de tamanho

reduzido contendo apenas uma linha e o conjunto de todas as colunas da base de dados
que ainda não foram cobertas para essa linha. Quando a busca por um novo bicluster é
iniciada, a decisão da escolha da linha inicial é baseada apenas no conjunto de linhas da
lista de candidatos que tenham o maior número de colunas na sub-lista.
Uma vez que se escolhe a linha inicial e se obtém um bicluster reduzido, é

necessário aumentar o volume deste bicluster inserindo novas linhas. Para isso, é
necessário escolher a ordem em que as inserções de novas linhas devem ser feitas. Essa
ordem pode ser sequencial, ou aleatória, ou determinada por alguma regra (de França
2010).
Tabela 20: Pseudocódigo do algoritmo ACO para a heurística construtiva

Inicie a tabela de feromônio de uma dada linha com =
Inicie com a distância euclidiana entre as linhas
Inicie os biclusters e
Para cada formiga
Execute a heurística construtiva para gerar o bicluster
Atualize e
Fim para
Atualize o feromônio
Fim enquanto
O algoritmo ACO (Tabela 20) é então utilizado com essa heurística construtiva
para obter a ordem de inserção das linhas de forma probabilística e proporcional ao
feromônio referente à ordem da linha atual e à próxima linha a ser inserida.
Opcionalmente, uma informação heurística também pode ser utilizada para melhorar
a tomada de decisão de quais linhas inserir; em de França (2010), foi utilizada a
distância euclidiana entre as linhas da base de dados. O cálculo dos principais
parâmetros são dados nas Eqs. (78)-(80).
62
( + 1) = ( 1 − ) ∙ ( )+ ∙ ∆ (78)
( )
∑ ∈ , se ( , ) ∈
∆ = ( ) (79)
0, caso contrário
[ ] ∙ [ ]
( )= , se ∈
∑ [ ] ∙ [ ] (80)
0, caso contrário
Definida a ordem de inserção das linhas no bicluster, adiciona-se uma linha de

cada vez e, ao adicionar, verifica-se o valor do para cada coluna. As colunas com
um valor residual maior do que o estabelecido por são removidas. Se o bicluster
resultante dessa operação possuir um número de colunas menor do que um limiar
estabelecido, a adição dessa linha é desfeita e o conjunto de colunas anterior é
restaurado. Se esse for o caso, pode-se tentar adicionar a mesma linha, porém com
valores negativos, repetindo em seguida o procedimento de remoção de colunas. Caso
ainda assim o número de colunas seja menor que o limiar, a operação é novamente
desfeita e o procedimento passa para a próxima iteração. Caso o número mínimo de
colunas tenha sido atingido ou então todas as linhas tenham sido verificadas,
efetua-se uma busca local, para tentar aumentar o volume do bicluster.
O procedimento de busca local pode se tornar necessário, pois uma linha que
não seria apta a ser adicionada ao bicluster, em determinado momento, pode se tornar
apta com o conjunto de colunas do bicluster final. Da mesma forma, uma coluna que foi
removida, em certo momento, pode se tornar apta a ser adicionada à configuração final.
A saída do laço por causa do limite mínimo de colunas ocorre porque, ao atingir esse
mínimo, nenhuma operação de remoção de colunas poderá ser feita e, portanto, a busca
local é suficiente para inserir as linhas restantes (de França 2010) (Veroneze 2011).
Nesse algoritmo, existe uma restrição proibindo que dois ou mais biclusters se
sobreponham em uma taxa superior a um determinado limiar ( ),
combatendo assim a redundância. O algoritmo SwarmBcluster é mostrado na Tabela 18.
63
3.10. Artificial immune network for biclustering
O algoritmo BIC-aiNet inspira-se na meta-heurística aiNet (de Castro e Von

Zuben 2000). Os biclusters do algoritmo BIC-aiNet são representados por dois vetores
de tamanhos variáveis, com valores inteiros que representam o índice de uma linha ou
coluna da matriz original. A população inicial é formada por biclusters, ou células,
gerados aleatoriamente, cada um contendo apenas uma linha e uma coluna. No ciclo
principal do algoritmo são gerados para cada célula. Esses clones passam por
um processo de mutação e, posteriormente, são avaliados. A mutação consiste em um
processo aleatório que escolhe com igual probabilidade remover ou inserir uma linha ou
uma coluna, seguindo o procedimento descrito na Tabela 21 (de Castro et al. 2007b).
Tabela 21: Procedimento de mutação do algoritmo BIC-aiNet

se (0, 1) < 0,5 insira uma linha
se (0, 1) < 0,5
senão insira uma coluna
se (0, 1) < 0,5 remova uma linha
senão
senão remova uma coluna
Se o melhor clone for melhor que o bicluster que o gerou, ele o substitui. Em
determinados momentos, ou seja, a cada iterações, também são realizados dois
processos para a manutenção da diversidade da população: a supressão de biclusters e a
inserção de novos biclusters.
A supressão verifica biclusters dentro da população que estão muito próximos

uns dos outros e, consequentemente, caminhando para o mesmo ótimo local, e elimina
aqueles que menos se aproximam do ótimo. Esse processo é feito comparando cada
possível par de biclusters da população entre si e, caso a semelhança entre eles seja
maior que um determinado limiar, aquele que tiver o menor valor de aptidão será
removido. Para medir a semelhança entre dois biclusters, é medido o volume do
bicluster obtido pela interseção desses dois biclusters. A inserção de novos biclusters na
população tem o objetivo de explorar regiões do espaço de busca que não estão sendo
exploradas, no momento, pela população e opera gerando novos biclusters na
população, da mesma forma como ocorre para a população inicial (de França 2010). O
algoritmo BIC-aiNet é mostrado na Tabela 22.
64
Tabela 22: Pseudocódigo do algoritmo BIC-aiNet

Inicie aleatoriamente as células contendo apenas uma linha e
uma coluna
Avalie as células
=0
Para cada célula
Crie clones da célula
Execute a mutação dos clones
Avalie os clones
Se o melhor clone é melhor que a célula original
Substitua a célula original pelo melhor clone
Fim se
Fim para
Se = 0
Para cada par de células e
∙ ( ( é , é ))
Se célula ⋂ célula >
Remova a pior célula
Fim se
Fim para
Insira novas células
Fim se
= +1
Fim enquanto
3.11. Funções de aptidão para biclustering
Um fator crucial para lidar com o problema de biclustering mediante a adoção

de qualquer algoritmo heurístico bio-inspirado está na escolha de uma boa função de
aptidão para avaliar a qualidade dos biclusters gerados ao longo da busca. Geralmente,
tais funções tentam otimizar objetivos (critérios de qualidade) conflitantes, como, por
exemplo, maximizar a coerência e maximizar o volume de um bicluster. O problema de
extração biclusters pode ser considerado um problema de otimização multiobjetivo, já
que pelo menos dois critérios devem ser otimizados.
65
A maioria dos problemas de busca e otimização do mundo real normalmente

envolve múltiplos objetivos. Em problemas com mais de um objetivo conflitante não
existe uma única solução ótima, existe um conjunto de soluções que são todas ótimas
envolvendo ganhos e perdas entre os objetivos conflitantes (Mitra e Banka 2006).
As funções , e , definidas nas Eqs. (81)-(86) e retiradas de (Xie et al.

2007) (Coelho et al. 2009) (de Castro et al. 2007b) (Divina e Aguilar-Ruiz 2006),
seguem essa estratégia de minimizar o MSR (medida de coerência) e maximizar o
volume do bicluster, sendo que denota um peso de importância para as linhas,
denota um peso de importância para as colunas, ( , ) é a variância das linhas,
é a quantidade de biclusters que contêm o elemento e é o limiar de
qualidade pelo critério da coerência.
| || |, se ( , )≤
( , )= (81)
( , )
, caso contrário
( , )
( , )= + _ (82)
( , )
( , )= + + _ + (83)
( , )
∑∈, ∈
( , )= (84)
| || |
∙ ∙
_ = | |
+ | |
(85)
0, se =0
= ∑∈ , ∈ ∑ ∈ , ∈ | ( )| (86)
, se ≥1
Pontes et al. (2007) modificaram a função para avaliar a qualidade da medida

, conforme (Eq. (87)).
( , )= ( , )+ _ + (87)
Já a função (Eq. (88)) utiliza a medida de correlação para dar preferência a

biclusters com grande volume e linhas altamente correlacionadas. e são fatores
de penalização para controlar o volume do bicluster (Nepomuceno et al. 2010).
66
( , ) = (1 − ( , )) + +| (88)
| | |
Vale frisar que, enquanto é de maximização, a são de minimização.
3.12. Conclusão
Foram apresentados, neste capítulo, conceitos básicos relativos aos domínios de

Computação Evolucionária, Inteligência Coletiva e Sistemas Imunológicos Artificias.
Foram também apresentados em detalhes os algoritmos heurísticos bio-inspirados que
serviram de alvo de investigação neste trabalho.
No próximo capítulo, serão apresentados conceitos referentes à área de Comitês

de Máquinas, dando-se ênfase a modelos de comitês de agrupamentos bidimensionais.
4. COMITÊS DE AGRUPAMENTOS
BIDIMENSIONAIS DE DADOS
Neste capítulo, são apresentados conceitos referentes a comitês de máquinas,

dando ênfase à sua aplicação no problema de agrupamento bidimensional de dados.
Métodos de ensemble, ou comitês, combinam múltiplos modelos de predição em

um único modelo com o objetivo de obter melhores resultados em tarefas de
Aprendizado de Máquina (Opitz e Maclin 1999). Esses métodos surgiram
primeiramente no contexto de aprendizado supervisionado; porém, nos últimos anos,
vários trabalhos têm mostrado que eles podem ser adotados com sucesso também em
problemas de aprendizado não-supervisionado (Strehl e Ghosh 2002).
Uma abordagem bastante conhecida de ensemble é Bagging, do inglês

Bootstrapping and aggregating, que é baseada na ideia de reamostragem dos dados
(Breiman 1996) (Opitz e Maclin 1999). No contexto supervisionado, a diversidade dos
modelos-componentes que integram o comitê é promovida através de réplicas dos dados
de treinamento produzidas de forma aleatória por reamostragem. Tipicamente, cada
nova base de dados terá o mesmo número de instâncias da base original; no entanto,
como instâncias irão aparecer repetidamente enquanto outras não irão aparecer, o
tamanho efetivo da nova base será menor e esta terá alguma taxa de sobreposição. Cada
base de dados derivada é usada para induzir um modelo-componente e, quando da fase
de estimação de uma instância de teste, as saídas dos modelos individuais são agregadas
via votação por maioria simples (para o caso de classificação) ou via média simples ou
ponderada (para o caso de regressão) (Breiman 1996) (Opitz e Maclin 1999).
Recentemente, o método de Bagging foi adaptado por Hanczar e Nadif (2010,

2011) para lidar com biclustering, dando origem à abordagem Bagged Biclustering.
67
68
4.1. Bagged biclustering
Conforme a proposta de Hanczar e Nadif (2010, 2011), o método Bagged

Biclustering é baseado em um mecanismo de consenso, proposto anteriormente por
Strehl e Ghosh (2002) para comitês de agrupamentos simples de dados, e consiste em
três passos sequenciais: (1) a geração de um repertório de biclusters; (2) a criação de
meta-clusters a partir desse repertório; e (3) a consolidação dos biclusters finais a partir
dos meta-clusters.
Especificamente no primeiro passo, são produzidas réplicas da base de dados

original pelo processo de reamostragem aleatória, conforme mostrado na Figura 12,
sobre as quais um ou mais algoritmos tradicionais de biclustering (tais como aqueles
apresentados na Tabela 1 à página 16) serão então aplicados para gerar o repertório
inicial de biclusters. Hanczar e Nadif (2010, 2011) recomendam realizar a
reamostragem em apenas uma dimensão, aquela que contém mais elementos. Isso
ocorre porque uma réplica gerada por reamostragem contém em média 68% dos
elementos originais. No caso da tarefa de biclustering, a reamostragem dos dados
deveria ser feita em ambas as dimensões da matriz de dados original. No entanto, se isso
for feito, a amostra gerada irá conter em média 63% das linhas e 63% dos colunas
originais, o que significa que a amostra gerada irá conter em média apenas 46% dos
dados da matriz original. Portanto, para manter a mesma proporção do processo de
reamostragem clássico, a reamostragem é feita para apenas uma dimensão.
Figura 12 - Exemplo de reamostragem no algoritmo Bagged Biclustering.

69
Para identificar os meta-clusters, primeiramente o índice de Jaccard é usado para

avaliar a similaridade entre os biclusters e, então, constrói-se uma matriz de distâncias
entre os biclusters, dadas por ( , ) – vide Eq. (89). Utilizando a matriz de
distâncias, o algoritmo HCL (Hierarchical Clustering) com ligação média (average
linkage) é aplicado para obter meta-clusters a partir do correspondente corte no
dendograma.
( , )=1− ( , ) (89)
Tabela 23: Pseudocódigo do algoritmo Bagged Biclustering

Crie bases de dados por reamostragem a partir da base
original
Para cada base criada
Aplique um algoritmo de biclustering para produzir
biclusters
Fim para
Aplique o algoritmo HCL para produzir meta-clusters
Calcule a probabilidade de cada elemento da base de dados
original pertencer a um meta-cluster
Gere um bicluster-consenso a partir de cada meta-cluster:

Para cada elemento da matriz original
Se a sobreposição for possível
Adicione o elemento a todos os biclusters cujos valores de
probabilidade são maiores que
Senão
Se existe mais de uma probabilidade maior que
Adicione o elemento ao bicluster que possui o maior valor de
probabilidade
Fim se
Fim se
Fim para
Conforme exemplificado na Figura 13, o algoritmo HCL é aplicado da seguinte

forma: primeiramente, calcula-se uma matriz de distâncias entre os elementos da matriz.
Neste caso, cada elemento (bicluster) vai ser tratado como um grupo (meta-cluster).
Depois, o ciclo do algoritmo consiste em encontrar o par de grupos mais similar, juntar
esses grupos e recalcular a matriz de distâncias. A condição de saída do ciclo é
encontrar um número pré-determinado de grupos.
70
Figura 13 - Exemplo de geração de meta-clusters.
Figura 14 - Geração dos biclusters a partir de meta-clusters.

71
Para consolidar os biclusters finais, a probabilidade de cada elemento da base de

dados original pertencer a um determinado meta-cluster é calculada. Essa probabilidade
é dada pela proporção de biclusters associados a um meta-cluster que contêm o dado
elemento. Nesse processo, duas opções estão disponíveis: permitir ou não a
sobreposição de biclusters. Se a sobreposição for possível e a probabilidade calculada
para o elemento em questão for maior que um parâmetro pré-definido, então o
elemento pode pertencer a um ou mais meta-clusters. Por outro lado, se a sobreposição
não for possível e existir mais de um valor de probabilidade maior que , então o
elemento vai pertencer ao meta-cluster com maior valor de probabilidade. Finalmente,
cada meta-cluster irá gerar um bicluster através de consenso, como exemplificado na
Figura 14. O algoritmo Bagged Biclustering é descrito na Tabela 23 à página 69.
4.2. Modelo genérico de comitês de biclusters
Kaiser (2011) propôs uma abordagem muito similar à de Hanczar e Nadif (2010,
2011), segundo a qual também devem ser escolhidos o método de agrupamento para os
biclusters e a medida de similaridade na geração dos meta-clusters. Contudo, em vez de
se adotar apenas um algoritmo de agrupamento duplo sobre várias bases de dados
criadas por reamostragem, Kaiser (2011) propôs que um ou mais algoritmos sejam
aplicados sobre as bases usando diferentes configurações de seus parâmetros, sendo que
essas bases podem ser réplicas idênticas à original, ou criadas por reamostragem, ou
ainda conterem apenas uma parte das amostras originais (subamostragem).
Kaiser (2011) utiliza as métricas índice de Jaccard e correlação linear (vide

Seção 2.4) para determinar os níveis de similaridade entre biclusters, armazenados em
uma matriz de similaridades . Essa matriz é gerada de acordo com a Eq. (90), caso
se adote o índice de Jaccard, ou Eqs. (91) a (93), caso se adote a correlação linear.
72
1, ( , )≥
= (90)
0, á
1, ( , ) ≥ ( , ) ≥
= (91)
0, á
( , ) = | ( , )| (92)
( , ) = | ( , )| (93)
Nas Eqs. (90) a (93), , , e indicam vetores binários que contêm as linhas e
colunas pertencentes aos biclusters e , ao passo que , e denotam limiares
de similaridade pré-definidos.
Alternativamente, Kaiser (2011) sugere a utilização do algoritmo Quality

Clustering (QT Clust) para a geração dos meta-clusters. Este algoritmo foi proposto por
Heyer et al. (1999) no contexto de análise de dados de expressão gênica e utiliza dois
passos para a geração de um cluster: primeiro, para cada gene, será gerado um cluster
utilizando esse gene como base, sendo que outros genes são adicionados de forma
iterativa nesse cluster. Durante cada iteração, o gene que minimiza o aumento do
diâmetro do cluster é adicionado. O processo continua até que nenhum gene possa ser
adicionado sem ultrapassar um limiar pré-definido de diâmetro do cluster. Após o
primeiro passo, um conjunto de clusters candidatos é criado. Em seguida, o maior
cluster é selecionado entre os candidatos e os genes que pertencem a este cluster são
removidos da base de dados. Esses passos são repetidos de forma que os maiores
clusters vão sendo identificados iterativamente entre os dados que restaram até que um
critério de parada seja atingido.
No presente trabalho, as métricas índice de Jaccard e correlação linear foram

usadas para fins de construção das matrizes de distâncias. Essas distâncias são dadas,
respectivamente, pelas Eqs. (89) e (94). Os experimentos reportados no próximo
capítulo foram conduzidos tomando como base duas abordagens de manipulação dos
dados para a geração dos biclusters: uma baseada no algoritmo Bagged Biclustering, em
que as bases de dados são geradas por reamostragem aleatória; e a outra, denominada
Fusão Direta, em que as bases de dados são réplicas idênticas à original (Menezes e
Coelho 2011a). Destina-se a trabalhos futuros avaliar também o potencial da abordagem
de subamostragem indicada por Kaiser (2011).
73
( , )=1−( ( , ) ∙ ( , ) ) (94)
Na Tabela 24, o algoritmo genérico de ensembles de biclusters investigado nesta

dissertação é descrito em detalhes.
Tabela 24: Pseudocódigo do algoritmo genérico de Ensembles de Biclusters

Escolha os algoritmos de biclustering e suas configurações
Escolha o processo de geração das bases de dados (replicação,
reamostragem ou subamostragem)
Escolha uma medida de similaridade (Índice de Jaccard ou LC)
Escolha um método de agrupamento (HCL ou Quality Clustering)
Gere as bases de dados
Aplique um algoritmo de biclustering para cada base gerada
Escolha os melhores biclusters e guarde-os em uma lista
Crie uma matriz de similaridade (ou de distâncias) a partir da
lista de biclusters
Execute o agrupamento dos biclusters
Gere um bicluster-consenso a partir de cada meta-cluster
4.3. Conclusão
Neste capítulo, foram apresentados métodos recém-propostos de comitês

(ensembles) aplicados especificamente ao problema de agrupamento bidimensional de
dados.
O próximo capítulo é dedicado aos experimentos computacionais.

74
5. EXPERIMENTOS COMPUTACIONAIS
Neste capítulo, são apresentados e discutidos os experimentos computacionais

realizados, abordando os algoritmos heurísticos bio-inspirados e os métodos de comitês
adotados para tratamento de problemas de agrupamento bidimensional de dados.
Primeiramente, são apresentadas as bases de dados utilizadas, sendo três bases

de dados artificiais e sete que fazem parte do domínio da bioinformática. Em seguida,
são expostos aspectos de configuração dos experimentos computacionais realizados e é
feita uma breve análise dos algoritmos bio-inspirados unimodais. Por fim, são descritos
os testes com algoritmos bio-inspirados multimodais e comitês de biclusters.
5.1. Bases de dados
Neste estudo, foram utilizadas sete bases de dados reais de microarray (vide
Seção 2.2.4). A primeira base de dados é de uma pequena planta, conhecida como
Arabidopsis thaliana, e pode ser encontrada em:
<http://www.tik.ee.ethz.ch/~sop/bimax/>.
Brain_1, Brain_2, Breast_Colon, Lung e Multitissue são encontradas em

<http://algorithmics.molgen.mpg.de/Static/Supplements/CompCancer/datasets.htm> e
fazem parte de um conjunto de 35 bases de dados públicas de expressão gênica de
diferentes tipos de câncer que foram transformadas e filtradas (de Souto, Costa et al.
2008) (de Souto, Prudencio et al. 2008). Essas cinco bases seguem o padrão da
plataforma Affymetrix. De acordo com Bleuler et al. (2004), não há dados faltantes a
serem tratados em bases de dados adquiridas através dessa plataforma.
75
76
A última base de dados, Saccharomyces cerevisiae cell cycle expression data,

mais conhecida como Yeast, representa um conjunto de dados de expressão gênica,
contendo 2.884 genes sob 17 condições. Essa base possui dois registros faltantes, sendo
que, neste trabalho, foram manipulados apenas os 2.882 registros completos que ela
possui. Essa base pode ser encontrada em <http://arep.med.harvard.edu/biclustering/>.
A Tabela 25 mostra o número de linhas, o número de colunas, o tamanho e a

referência das bases de dados reais.
Tabela 25: Bases de dados

Base Linhas Colunas Tamanho Referência
Arabidopsis 734 69 50.646 Wille et al. 2004
Brain_1 1.377 50 68.850 Nutt et al. 2003
Brain_2 1.379 42 57.918 Pomeroy et al. 2002
Breast_Colon 182 104 18.928 Chowdary et al. 2006
Lung 1.543 203 313.229 Bhattacharjee et al. 2001
Multitissue 1.363 190 258.970 Ramaswamy et al. 2001
Yeast 2.884 17 49.028 Cho et al. 1998
Já as três bases de dados artificiais são matrizes com valores aleatórios em que
foram incluídos alguns biclusters. Essas bases contêm 200 linhas, 100 colunas e
biclusters. Nas simulações conduzidas para este trabalho, adotou-se ∈ {2, 4, 6}. O
tamanho de cada bicluster foi escolhido aleatoriamente entre 20 a 40 linhas e 10 a 20
colunas. Os biclusters inseridos foram biclusters de valores coerentes, seguindo o
modelo aditivo, e sobrepostos com posicionamento arbitrário. O código de geração das
bases artificiais, implementado na linguagem R e utilizado em (Hanczar e Nadif 2010,
2011), foi fornecido pelo Prof. Blaise Hanczar.
5.2. Configuração dos experimentos
A Tabela 26 traz uma síntese dos parâmetros de controle variados para cada
algoritmo unimodal, enquanto a Tabela 27 lista os parâmetros dos algoritmos
multimodais. Esses algoritmos têm os seguintes parâmetros em comum: (tamanho da
população); (número de iterações); e , para , função de fitness
escolhida neste trabalho para avaliar os biclusters – vide Seção 3.11. A condição de
parada foi atingir o número de iterações pré-determinado, com exceção do
77
SwarmBcluster, em que a condição de parada foi atingir biclusters ou a lista de

candidatos ficar vazia. A Tabela 28 lista os parâmetros dos algoritmos de comitês.
Tabela 26: Parâmetros de controle dos algoritmos unimodais

Algoritmo Parâmetros
GA , , ,
PSO , ,
FSS ,
DE ,
HS ,
Tabela 27: Parâmetros de controle dos algoritmos multimodais

CGA , , MF, , ,
FSGA , , MF, , ,
CDE ,
NichePSO , , , , ,
dFSS , , , ,
ABC
MHS , , ,
BicACO , , ,
GSO , , , , , ,
SwarmBcluster , , , , ,
BIC-aiNet , , ,
Tabela 28: Parâmetros de controle dos algoritmos de comitês

Bagged Biclustering , , , çã
Fusão Direta , , , çã
Os parâmetros em comum e foram iniciados, respectivamente,

como 50 e 100. Como HS só gera uma solução por iteração, para este foi
iniciado como 5.000. Para SwarmBcluster, = 50 e o algoritmo ACO foi
configurado para produzir biclusters em uma única iteração e utilizando apenas uma
única formiga, de forma a se investigar apenas o desempenho da heurística construtiva.
Isso foi feito porque, segundo a análise de sensibilidade paramétrica do algoritmo
SwamBcluster conduzida por Veroneze (2011), os resultados obtidos utilizando
somente a heurística construtiva já foram satisfatórios com relação à qualidade da
imputação de dados faltantes obtida pelos biclusters gerados por esse algoritmo. Por
outro lado, o aumento do valor desses dois parâmetros relacionados ao ACO tende a
aumentar significativamente o tempo de execução do algoritmo SwarmBcluster.
78
Os valores de e dos parâmetros que capturam a noção de distância entre

indivíduos ( , , , ) dependem da base de dados. Tais valores foram propostos
com base, respectivamente, no menor valor do MSR e na mediana das distâncias entre
indivíduos gerados aleatoriamente. Os valores de para as bases artificiais foram
calculados pela média dos biclusters inseridos em cada base.
Tabela 29: Parâmetros das bases de dados

Base Distância
Yeast 300 1.450
Brain_1 9.000 714
Brain_2 290.000 710
Breast_Colon 22.000 143
Lung 36.000 873
Multitissue 170.000 776
Arabidopsis thaliana 700 402
Artificial_2 0,92055 150
Nas Tabelas 47 a 63 do Apêndice B, são mostradas as 10 configurações de

valores dos parâmetros que foram realizadas para cada algoritmo.
A Tabela 30 descreve os experimentos que foram realizados com comitês

usando as 10 configurações da Tabela 63, sendo que a criação das bases de dados para
geração dos biclusters iniciais foi feita por réplica (Fusão Direta) ou reamostragem
(Bagged Biclustering), ao passo que a geração dos biclusters iniciais foi feita usando
apenas um algoritmo com as 10 configurações listadas ( = 10) ou usando os 11
algoritmos multimodais descritos neste trabalho e suas diferentes configurações
( = 110). Os biclusters iniciais usados no processo de fusão foram “filtrados” dos
experimentos com 11 algoritmos, sendo usados somente biclusters com < .
Tabela 30: Experimentos com comitês

Experimento Algoritmos Criação da base
Fusão Direta 1 algoritmo com 10 configurações Réplica
Bagged Biclustering 1 algoritmo com 10 configurações Reamostragem
Fusão Direta 11 algoritmos com 10 configurações Réplica
Bagged Biclustering 11 algoritmos com 10 configurações Reamostragem
As métricas usadas neste estudo comparativo foram: tempo (em segundos);

MSR (Eq. (4)) e volume (Eq. (7)) do melhor bicluster encontrado de acordo com (Eq.
(81)), ou seja, o bicluster que possui menor MSR se este valor for maior que , caso
contrário, o que possui MSR menor que e o maior volume; MSR e volume médio da
população final; os níveis de cobertura dos elementos da matriz considerando a
79
população final, como calculado na Eq. (8); a cobertura de linhas e colunas, medida pela
Eq. (9); a taxa de sobreposição dos elementos considerando a população final (Eq.
(10)); o nível de similaridade da população final, medido pelo índice de Jaccard (Eq.
(11)); a iteração em que o melhor bicluster foi encontrado (não existe no algoritmo
SwarmBcluster e nos comitês); a quantidade de biclusters com < (não exibido
para os algoritmos unimodais, já que estes só reportam um bicluster); a taxa de sucesso
por encontrar pelo menos um δ-bicluster; e os valores de Virtual Error (Eq. (18)),
Transposed Virtual Error (Eq. (22)), Mutual Information (Eq. (25)) e correlação linear
(Eq. (24)) para o melhor bicluster. Para as bases artificiais, foram calculados: Match
Score (Eq. (12)), Row Match Score (Eq. (13)) e Column Match Score (Eq. (14)) para o
conjunto de biclusters com < e para a população final. O tempo computado
para os comitês foi o de gerar meta-clusters e realizar a etapa de consenso, ou seja, não
envolve o tempo de geração dos biclusters iniciais, uma vez que este pode ser analisado
nos experimentos com os algoritmos multimodais.
O conjunto completo de tabelas com os resultados dos experimentos

computacionais encontra-se no Apêndice C. Somente os resultados referentes às
melhores configurações de cada algoritmo para cada base de dados são mostrados. A
configuração é citada juntamente com o nome do algoritmo. Os valores das médias e
dos desvios padrões foram coletados, sendo que tais valores para as métricas VE e TVE
estão multiplicados por 10 . Os critérios de escolha dessas configurações foram, nesta
ordem: taxa de sucesso, cobertura dos elementos, cobertura das linhas e colunas,
sobreposição, índice de Jaccard e volume do melhor bicluster. Para as bases artificiais,
foi priorizada a métrica Match Score, considerando a população final. No caso dos
comitês, além da configuração da Tabela 63, é citada a métrica utilizada na geração dos
meta-clusters que induziu ao melhor resultado, sendo (J) para índice de Jaccard e (LC)
para correlação linear.
5.3. Testes estatísticos
Para verificar a significância estatística das diferenças de desempenho entre os

algoritmos, foram empregados o teste de Friedman (1937) e o pós-teste de Nemenyi
80
(1963), indicados para comparar vários algoritmos aplicados em diferentes conjuntos de

dados. Gráficos de testes de comparação múltipla também foram gerados.
Testes de hipóteses podem ser empregados para fazer inferências sobre uma ou
mais populações de amostras de dados (Derrac et al. 2011). Para isso, duas hipóteses
são definidas: a hipótese nula e a hipótese alternativa . A hipótese nula é uma
afirmação de nenhum efeito ou nenhuma diferença, enquanto a hipótese alternativa
representa a presença de um efeito ou uma diferença, ou seja, diferenças significativas
entre os algoritmos. Ao aplicar um procedimento estatístico para rejeitar uma hipótese,
um nível de significância é utilizado para determinar em que nível a hipótese pode ser
rejeitada. Em vez de estabelecer a priori um nível de significância , é possível calcular
o menor nível de significância que resulta na rejeição de . Esta é a definição do
, que é a probabilidade de se obter um resultado pelo menos tão extremo quanto
o que foi realmente observado, assumindo que é verdadeira. O informa se o
resultado do teste de hipótese estatística é significativo ou não. Quanto menor o ,
há mais forte evidência contra (Derrac et al. 2011).
Para aplicar o teste de Friedman, o primeiro passo é converter os resultados

originais de cada algoritmo em ranks para cada conjunto de dados, separadamente. O
algoritmo que obtiver o melhor desempenho recebe o rank um; o que obtiver o segundo
melhor recebe o rank dois; e assim por diante. Em caso de empate, a média dos ranks é
associada a todos os algoritmos que apresentaram igual desempenho (Demšar 2006)
(Derrac et al. 2011).
Dados algoritmos e conjuntos de dados, é o rank do j-ésimo algoritmo

para o i-ésimo conjunto de dados. No teste de Friedman, a hipótese nula é a de que
todos os algoritmos são equivalentes e, por isso, a média de seus ranks, , deve ser
igual. A estatística de Friedman é distribuída de acordo com a distribuição , com
( − 1) graus de liberdade (vide Eq. (95)).
( )
= ∑ − (95)
( )
Iman e Davenport (1980) propuseram a estatística (vide Eq. (96)) como uma
derivação da estatística de Friedman, dado que esta produz um efeito conservador
indesejável. é distribuída de acordo com a distribuição F, apresentando ( − 1) e
81
( − 1)( − 1) graus de liberdade (Demšar 2006) (Derrac et al. 2011). Valores críticos
para as distribuições e F podem ser encontrados em Zar (1998) e Sheskin (2000).
( )
= ( )
(96)
Se a hipótese nula for rejeitada, pode ser utilizado um pós-teste. O teste de

Nemenyi pode ser usado para comparar cada algoritmo com todos os demais. De acordo
com esse teste, dois algoritmos são significativamente diferentes se a média dos seus
ranks difere de pelo menos uma diferença crítica (vide Eq. (97)), em que os valores
críticos, , baseiam-se na Studentized range statistic, divididos por √2 (Demšar 2006).
( )
= (97)
Neste trabalho, para o teste de Nemenyi, adotou-se ∈ {0,01, 0,05, 0,1}. Para
os testes de Friedman e gráficos de comparação múltipla, adotou-se = 0,01. Os testes
de Nemenyi são exibidos no Apêndice D, da Tabela 145 à Tabela 154.
5.4. Experimentos com algoritmos unimodais
Os resultados dos experimentos com os algoritmos bio-inspirados unimodais são

exibidos nas Tabelas 64 a 73. De acordo com estes, o algoritmo FSS foi o mais rápido
com relação ao tempo de execução e à convergência. O GA foi o mais custoso nas bases
reais e o PSO nas bases artificiais, que têm o menor tamanho. A maior diferença entre
as médias de tempo do PSO e do FSS foi de apenas 1,34 segundos, enquanto, na base
Lung, a diferença média de tempo entre GA e FSS chegou a 70,16 segundos.
Com relação aos critérios da coerência e do volume do melhor bicluster e do

bicluster médio da população, o algoritmo FSS foi o que reportou biclusters com os
maiores volumes nas bases artificiais. Porém, também com maior valor de MSR. Os
algoritmos PSO e HS obtiveram os menores valores de volume e MSR, tanto para o
melhor bicluster quanto para a média da população final. Já em todas as bases reais, o
PSO apresentou o pior caso em pelo menos uma dessas quatro métricas.
82
O GA apresentou as piores taxas de cobertura, sobreposição e similaridade entre

as soluções da população final. Já FSS obteve as melhores taxas de cobertura,
sobreposição e similaridade para as bases artificiais, enquanto PSO obteve as melhores
taxas de cobertura para as bases reais.
A taxa de sucesso dos algoritmos unimodais para todas as bases artificiais foi
igual a zero, enquanto, para as bases reais, foi de 100%, com exceção do algoritmo FSS
para a base Breast_Colon, que obteve taxa de sucesso igual a 95%. O valor de MS do
único bicluster reportado por esses algoritmos unimodais foi maior que o valor de MS
da população, com exceção do algoritmo HS na base Artificial_4. FSS obteve as piores
taxas de acerto (RMS, CMS e MS), enquanto PSO e GA obtiveram as melhores.
Somente em três bases de dados os algoritmos que obtiveram, respectivamente,

o melhor e o pior desempenho com a métrica MI também obtiveram o melhor e o pior
desempenho com a métrica LC. Nas outras sete bases, o comportamento foi inverso: o
que obteve melhor MI também obteve pior LC, e vice-versa. Porém, a Figura 15 mostra
que não houve diferença significativa no desempenho dos algoritmos unimodais com
relação aos valores de LC e MI.
Figura 15 - Comparação múltipla entre os algoritmos unimodais referente aos valores de LC e MI.
5.5. Experimentos com algoritmos multimodais
Da Tabela 74 à Tabela 83 são mostrados comparativos entre os algoritmos

multimodais de acordo com as métricas já citadas anteriormente para as 10 bases de
83
dados utilizadas. A Tabela 32 apresenta o resultado da aplicação do teste de Friedman

somente sobre as bases artificiais, para as métricas MS, RMS e CMS da população. Já a
Tabela 31 apresenta o resultado da aplicação do teste de Friedman sobre todas as bases
de dados, considerando as métricas/critérios: MSR e volume do melhor bicluster; MSR
e volume médio da população final; tempo; cobertura de elementos e de linhas e
colunas; sobreposição, índice de Jaccard; e VE, TVE, MI e LC.
O algoritmo BicACO foi, em média, o mais custoso computacionalmente,

embora não tenha sido pior que SwarmBcluster em três bases de dados. O desempenho
do BicACO foi significativamente diferente ( = 0,01) apenas do ABC, BIC-aiNet,
CDE, GSO e NichePSO. BIC-aiNet foi o mais rápido para todas as bases de dados.
SwarmBcluster e BIC-aiNet obtiveram os menores valores de MSR. No entanto,

o volume dos biclusters produzidos também foram os menores. O algoritmo FSGA
obteve os maiores volumes, tanto do melhor bicluster quanto da média da população
final; e ficou em terceiro lugar no ranking do MSR do melhor bicluster e do MSR
médio da população, de acordo com o teste de Friedman (Tabela 31).
Na Figura 19 pode-se observar que os algoritmos BIC-aiNet e SwarmBcluster

obtiveram os melhores ranks considerando o MSR médio da população e na Figura 21
observa-se que estes foram os que obtiveram os piores ranks considerando o volume
médio da população final. No entanto, não houve diferença significativa, com relação a
MSR e volume médio, comparando o desempenho do SwarmBcluster com o do FSGA.
Nessas figuras, o algoritmo que apresentou melhor desempenho está assinalado em azul
e os que apresentaram diferença significativa em relação a este estão em vermelho.
Duas médias são significativamente diferentes se seus intervalos são disjuntos e não são
significativamente diferentes se seus intervalos se sobrepõem.
A Figura 18 mostra que não houve diferença significativa com relação ao valor
de MSR do melhor bicluster entre o algoritmo SwarmBcluster e os algoritmos BIC-
aiNet, CDE, CGA, FSGA e NichePSO. Já a Figura 20 mostra que não houve diferença
significativa com relação ao volume do melhor bicluster entre o algoritmo FSGA e os
algoritmos ABC, BicACO, CDE, dFSS, CGA, GSO, MHS e NichePSO.
84
Tabela 31: Teste de Friedman (algoritmos multimodais)

Cobertura
MSR Volume MSR Volume Cobertura Linhas e Sobrepo-
Multimodais (melhor) (melhor) (média) (média) Tempo Elementos Colunas sição Jaccard VE TVE MI LC
ABC 7,3 6,2 9,5 5,6 5,1 2,3 2,45 4 3,3 6,5 6,2 6,1 5,6
BicACO 7,5 3,4 4,6 4 10,7 6,3 7,1 6,9 7,5 7,9 6,6 5,4 7,5
BIC-aiNet 2,8 10,4 2,1 11 1 10,8 8,5 1 1,1 5,7 7,1 6,8 5,1
CDE 5,2 5,8 6,7 7,3 3,7 5 4,9 6,5 6,7 5,8 6,8 5,2 4,5
Ranking
dFSS 7,2 5,6 9,2 5,4 6,5 3,7 3,4 6,8 6,4 6,3 6,8 5,3 5,8
CGA 6,1 4,7 3,9 5 8,4 10,1 11 11 11 5,2 7,7 5,6 6,2
FSGA 4,4 2,8 3,9 3,5 8,1 8,6 9,6 9,9 9,5 5 5,6 5,4 8
GSO 10,5 5,8 11 4 2,3 1 2,45 4,3 3,1 5,4 5 4,7 6,1
MHS 8,7 7,1 7,7 7,9 9,3 4,7 4,6 4,9 4,9 6,3 5,2 5,8 5,8
NichePSO 5,1 3,9 6,3 4,2 4,7 5,2 5,8 7,3 7 5,8 7 6,3 6,4
SwarmBcluster 1,2 10,3 1,1 8,1 6,2 8,3 6,2 3,4 5,5 6,1 2 9,4 5
Ff 63,83636 56,76364 91,78182 48,83636 81,74545 90,27273 73,30455 75,87273 74,83636 5,654545 22,34545 14,58182 9,781818
pvalue 7,37E-10 1,48E-08 7,48E-11 4,36E-07 5,14E-11 6,85E-11 4,58E-11 8,24E-11 4,65E-11 0,843404 0,013438 0,148068 0,459839
Ff
Rejeita H0 =
0,01 (23,2093) Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Não Não Não
Fid 15,88688 11,81581 100,5133 8,590618 40,30279 83,52336 24,7136 28,30219 26,7659 0,53941 2,589792 1,536398 0,975816
Fid
Rejeita H0 =
0,01 (2,524) Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Sim Não Não
85
Figura 16 - MSR do melhor bicluster para os algoritmos multimodais nas bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung.
86
Figura 17 - MSR do melhor bicluster para os algoritmos multimodais nas bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6.
Figura 18 - Comparação múltipla entre os algoritmos multimodais referente ao valor de MSR do
melhor bicluster.
Figura 19 - Comparação múltipla entre os algoritmos multimodais referente ao valor médio de MSR
da população final.
87
88
Figura 20 - Comparação múltipla entre os algoritmos multimodais referente ao volume do melhor

bicluster.
Figura 21 - Comparação múltipla entre os algoritmos multimodais referente ao volume médio da

população final.
A Figura 16 ilustra a variação do valor do MSR do melhor bicluster para as

bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung. A Figura 17 faz o mesmo
para as bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6. É possível
89
perceber que todos os algoritmos apresentaram desvios; SwarmBcluster foi o algoritmo

que obteve menor variação no valor de MSR.
Somente dois algoritmos obtiveram 100% de sucesso em encontrar pelo menos

um -bicluster para todas as bases de dados: BIC-aiNet e SwarmBcluster. Cinco
algoritmos obtiveram 100% de sucesso somente para as bases reais: BicACO, CDE,
CGA, FSGA e NichePSO. A média de sucesso considerando somente as bases reais foi
de 95% para o dFSS, 87,86% para o ABC, 54,29% para o MHS e 12,85% para o GSO.
O algoritmo CGA encontrou 50 -biclusters em todas as bases reais, porém com

100% de sobreposição e de similaridade. Os algoritmos SwarmBcluster e BIC-aiNet são
os que, em geral, encontram mais -biclusters e também obtêm as menores taxas de
sobreposição. Entre os algoritmos que obtiveram 100% de sucesso para as bases reais,
NichePSO e CDE foram os que obtiveram as maiores coberturas. BIC-aiNet obteve a
pior cobertura de elementos, enquanto CGA, seguido de FSGA, obtiveram as piores
coberturas de linhas e colunas. A Figura 22 e a Figura 23 mostram as diferenças
significativas entre os algoritmos com relação à cobertura e à sobreposição,
respectivamente.
Figura 22 - Comparação múltipla entre os algoritmos multimodais referente à cobertura dos

elementos.
90
Figura 23 - Comparação múltipla entre os algoritmos multimodais referente à sobreposição.
Figura 24 - Comparação múltipla entre os algoritmos multimodais referente ao valor de MS da

população final.
Considerando as bases artificiais, o algoritmo SwarmBcluster foi o que obteve as

maiores taxas de correspondência considerando o bicluster inteiro. No entanto, obteve
as piores taxas de correspondência para as linhas e as maiores para as colunas. Já CGA,
que ficou em segundo lugar no ranking do MS (Tabela 32), obteve a maior taxa de
91
correspondência para as linhas e a segunda maior para as colunas. O pior desempenho

foi o do algoritmo BIC-aiNet. Não houve diferenças significativas com relação às taxas
de correspondência entre os algoritmos ( = 0,01). A Figura 24 compara o
desempenho dos algoritmos quanto ao valor de MS da população final.
Tabela 32: Teste de Friedman sobre bases artificiais (algoritmos multimodais)

Multimodais RMS CMS MS
ABC 6,666667 7,666667 7,666667
BicACO 2 9 6,333333
BIC-aiNet 10 11 11
CDE 5,333333 4,333333 5
Ranking
dFSS 8,333333 7,333333 8,666667

CGA 1,333333 2,333333 1,666667
FSGA 4,666667 4,666667 4,666667
GSO 7,333333 10 9,666667
MHS 6,666667 6 6,666667
NichePSO 2,666667 2,666667 3,333333
SwarmBcluster 11 1 1,333333
Ff 27,33333 29,63636 27,09091
Ff
pvalue 0,002306 0,000982 0,002519

Rejeita H0 = 0,01 (23,2093) Sim Sim Sim
Fid 20,5 163 18,625
Fid
pvalue 2,2E-08 6,56E-17 5,09E-08

Os desempenhos dos algoritmos com relação às métricas VE, TVE, MI e LC

foram semelhantes, conforme a Tabela 31. Os comportamentos das métricas levantadas
são exemplificados nos gráficos do Apêndice E para a base Artificial_2.
5.6. Experimentos com comitês de biclusters
Conforme mencionado anteriormente, foram investigados os arranjos de comitês

Fusão Direta e Bagged Biclustering, com e sem sobreposição de biclusters. Para tanto,
foram adotadas as métricas índice de Jaccard e correlação linear, usando apenas um ou
todos os algoritmos multimodais apresentados no Cap. 3, no total de 11. Os comitês que
usam os 11 algoritmos são chamados de “Todos (J)” e “Todos (LC)”, de acordo com as
métricas que utilizam na geração dos meta-clusters, sendo “J” para índice de Jaccard e
LC para correlação linear. As designações “O” e “NO” significam, respectivamente,
com e sem sobreposição.
92
5.6.1. Fusão direta com sobreposição
Os resultados dos experimentos com a variante Fusão Direta com sobreposição

são mostrados nas Tabelas 84 a 93 (com um algoritmo) e nas Tabelas 124 a 133 (com
11 algoritmos). Os resultados da aplicação do teste de Friedman são reportados na
Tabela 34, somente com bases artificiais, e na Tabela 33, com todas as bases de dados.
Como se pode perceber na Tabela 33, os comitês que demandaram mais tempo
computacional utilizaram biclusters iniciais provenientes dos 11 algoritmos. Isso
ocorreu porque, mesmo sendo filtrados da população final, o número de biclusters
iniciais ainda foi maior que a quantidade usada para se chegar ao consenso quando os
biclusters foram produzidos por apenas um algoritmo. Deve-se notar também que o
volume médio dos biclusters finais gerados pelos algoritmos multimodais influenciou
diretamente no quesito eficiência. Enquanto os comitês sintetizados a partir dos
biclusters finais gerados por BIC-aiNet, SwarmBcluster, MHS e CDE (que
apresentaram, em geral, os menores volumes na população final) demandaram menor
dispêndio computacional, aqueles sintetizados a partir dos biclusters produzidos pelo
FSGA foram os mais custosos, ficando atrás apenas dos comitês criados a partir dos
biclusters produzidos por todos os 11 algoritmos.
Os comitês que geraram biclusters com os menores volumes foram os que

utilizaram o algoritmo BIC-aiNet e os biclusters advindos dos 11 algoritmos, tanto com
a métrica índice de Jaccard quanto com a métrica correlação linear. Os comitês
Todos (J) e Todos (LC) também obtiveram os menores valores de MSR e foram os que
obtiveram a maior taxa de sucesso e geraram mais -biclusters, juntamente com os
comitês que usaram o algoritmo SwarmBcluster. Já os biclusters com maiores volumes
foram os gerados via comitês que usaram os algoritmos CDE e BicACO. Assim como
os biclusters produzidos pelo algoritmo GSO, aqueles gerados por comitês de biclusters
produzidos pelo GSO obtiveram os piores valores de MSR, taxa de sucesso e
quantidade de -biclusters.
A Figura 25 exibe o desempenho relativo dos comitês de Fusão Direta com

sobreposição em relação ao valor de MSR do melhor bicluster, ao passo que a Figura 26
faz o mesmo com relação ao MSR médio da população final. A Figura 27 e a Figura 28
exibem o desempenho relativo considerando o volume do melhor bicluster e o volume
93
médio da população final respectivamente. A Figura 32 e a Figura 33 mostram a

variação do valor do MSR do melhor bicluster.
Figura 25 - Comparação múltipla entre as diferentes configurações da Fusão Direta com

sobreposição referente ao valor de MSR do melhor bicluster.

sobreposição referente ao valor médio de MSR da população final.
94

sobreposição referente ao volume do melhor bicluster.

sobreposição referente ao volume médio da população final.
Os menores níveis de sobreposição e similaridade dos biclusters foram obtidos

via comitês que usaram os algoritmos BIC-aiNet, SwarmBcluster e 11 algoritmos com a
métrica índice de Jaccard. Já os maiores níveis de sobreposição e similaridade foram
95
obtidos via comitês que usaram os algoritmos CGA e CDE. Os maiores valores de
cobertura foram obtidos via comitês que utilizaram o algoritmo GSO, que apresentou as
piores taxas de correspondência de colunas e do bicluster completo, juntamente com os
comitês de Todos (J) e o comitê do BIC-aiNet. A Figura 29 mostra as diferenças entre
as médias dos valores de cobertura de elementos e a Figura 30 mostra as diferenças
entre as médias dos valores de sobreposição.
As maiores taxas de correspondência do bicluster completo foram obtidas pelos

comitês de SwarmBcluster, seguidos por Todos (LC) e CGA. A Figura 31 mostra que
não há diferença significativa de desempenho entre comitês com SwarmBcluster e
Todos (J). Com α = 0,05, passa a existir diferença entre os comitês dos algoritmos:
SwarmBcluster e BIC-aiNet; SwarmBcluster e Todos (J); e Todos (J) e Todos (LC).
Nos algoritmos multimodais, a hipótese nula foi rejeitada para VE, MI e LC.
Nos comitês de Fusão Direta com sobreposição, a Tabela 33 mostra que os
comportamentos dos comitês usando diferentes algoritmos não são equivalentes quanto
às métricas VE, MI e LC. Existe equivalência no desempenho dos comitês somente em
relação a TVE.

sobreposição referente à cobertura dos elementos.
96

sobreposição referente à sobreposição.

sobreposição referente ao valor de MS da população final.
97
Tabela 33: Teste de Friedman (Fusão Direta com sobreposição)

Cobertura
Fusão Direta com MSR Volume MSR Volume Cobertura Linhas e Sobrepo-
sobreposição (melhor) (melhor) (média) (média) Tempo Elementos Colunas sição Jaccard VE TVE MI LC
ABC 6,1 7,3 8,8 4,7 7,9 3,15 4,4 7,9 7 6,3 6,4 8,6 8,3
BicACO 10,3 1,5 4,9 3,8 7,6 8,1 7,5 10 9,6 9,6 8 5 9,3
BIC-aiNet 5,1 11,5 5,3 12 1 11,9 10,9 2 1,9 5,6 5,7 6 4,6
CDE 7,9 4,1 7,6 2,9 6,3 5,35 5,35 10,1 9,6 7,7 9,7 7 8,7
dFSS 8,1 8 11 5,8 6,4 3,35 3,15 7,2 6,3 6,6 6,6 6,3 6,3
Ranking
CGA 9,2 7,1 3,6 7,1 7,8 11 11,4 12,5 11,9 7,4 7,3 5,4 5,9
FSGA 9,1 5 4,2 5 8,7 9,7 9 9,9 8,9 7,5 7,8 5,1 8,2
GSO 12,5 7,6 12,7 4,5 6,5 1,9 3,15 8,7 7,7 6,7 5,9 5 5,1
MHS 7,8 5,9 7 5,5 4,3 6,45 6,9 7,6 6,9 7,9 8,3 6,5 6,8
NichePSO 4,5 5,5 11,1 6,1 7,3 2,8 3,15 7,1 6,7 7,1 8,1 8,8 8,5
SwarmBcluster 3,5 5,3 7,5 11,4 2,2 11,3 10,9 2,1 4 11,3 6,2 7,4 6
Todos (J) 4,2 12 3,8 11,4 12,7 8,8 7,9 2,5 1,1 4,7 7,4 8,7 2,9
Todos (LC) 2,7 10,2 3,5 10,8 12,3 7,2 7,3 3,4 9,4 2,6 3,6 11,2 10,4
Ff 67,45055 69,86374 78,02637 82,58901 87,56044 95,67033 71,7956 94,68132 77,67033 35,81538 18,26374 27,95604 35,63077
Ff
Rejeita H0 =
0,01 (26,217) Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Sim Sim
Fid 11,55207 12,54129 16,73044 19,86852 24,29268 35,39024 13,4046 33,65625 16,51402 3,828947 1,615684 2,733524 3,800875
pvalue 1,3E-14 1,22E-15 1,42E-19 3,74E-22 2,25E-25 6,21E-32 1,67E-16 5,08E-31 2,19E-19 7,23E-05 0,097665 0,002863 7,94E-05
Fid
Rejeita H0 =
98
Figura 32 - MSR do melhor bicluster para a Fusão Direta com sobreposição nas bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung.
99
Figura 33 - MSR do melhor bicluster para a Fusão Direta com sobreposição nas bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6.
Tabela 34: Teste de Friedman sobre bases artificiais (Fusão Direta com sobreposição)
Fusão Direta com sobreposição RMS CMS MS
ABC 5 6,666667 7
BicACO 4,333333 10 6,666667
BIC-aiNet 10 12 12
CDE 2,666667 3,666667 4,666667
dFSS
Ranking 7 8,666667 9,333333
CGA 3 5,333333 3,666667
FSGA 5,666667 4,666667 5,666667
GSO 7,666667 10,33333 10,66667
MHS 4 5,333333 5,666667
NichePSO 5,666667 8 9
Todos (J) 11 13 13
Todos (LC) 13 2,333333 2,333333
Ff 28,65934 32,61538 31,25275
Ff
pvalue 0,004425 0,001111 0,001802

Fid 7,808383 19,27273 13,16667
Fid
pvalue 1,13E-05 1,88E-09 8,95E-08

5.6.2. Fusão direta sem sobreposição
Os resultados dos experimentos adotando Fusão Direta sem sobreposição são

mostrados nas Tabelas 94 a 103 (com um algoritmo) e nas Tabelas 124 a 133 (com 11
algoritmos). Os testes de Friedman são exibidos na Tabela 35 e na Tabela 36.
Assim como para a Fusão Direta com sobreposição, o tempo de execução dos
comitês de Fusão Direta sem sobreposição com 11 algoritmos foi maior, seguido do
tempo demandando pelo comitê com FSGA. Já o tempo demandado pelos comitês com
SwarmBcluster e BIC-aiNet foi menor.
Os comitês que utilizaram os algoritmos FSGA e CGA, com relação ao melhor

bicluster, obtiveram os piores valores de MSR e os maiores volumes, apresentando
diferenças significativas quando comparados ao comitê de 11 algoritmos com a métrica
LC, que obteve o melhor MSR (Figura 36); e ao comitê de 11 algoritmos com a métrica
índice de Jaccard, que obteve o pior volume (Figura 38). Quanto ao MSR médio (Figura
37), o melhor desempenho foi do comitê que utilizou o algoritmo CGA. Mais uma vez,
os menores volumes da população final foram dos comitês que usaram os algoritmos
SwarmBcluster e BIC-aiNet (Figura 39), que também foram os que produziram mais -
biclusters.
100
101
Tabela 35: Teste de Friedman (Fusão Direta sem sobreposição)

Cobertura
Fusão Direta sem MSR Volume MSR Volume Cobertura Linhas e Sobrepo-
sobreposição (melhor) (melhor) (média) (média) Tempo Elementos Colunas sição Jaccard VE TVE MI LC
ABC 6,2 8,1 10,9 4,9 7,9 3,25 3,35 9,2 5,8 5,8 4,15 8,7 6,7
BicACO 6,7 5,7 9,1 9,1 7,6 8,2 8 4,4 8,4 6,6 4,7 8,4 9,4
BIC-aiNet 8,8 7,8 3,5 11,8 1 12 10,9 2,5 3,5 8,4 8,5 3,7 5,8
CDE 4,7 8,3 9,8 4,8 6 5,1 4,85 9,4 6,1 5,75 7,4 10,45 7,65
dFSS 8,7 7,4 8,4 3,8 6,8 3 3,35 10,2 7,7 6,8 8 6 5,7
Ranking
CGA 12,1 2,8 3,3 2,4 7,9 11 11,4 12,3 12,1 9,2 8,5 3,3 8,3
FSGA 11,1 3,4 5 5,8 8,9 9,6 9,9 8,2 9,1 7,8 8,7 3,9 7,6
GSO 8,8 6 7,8 4,2 5,8 1,65 3,35 8,6 7,4 7,9 6 5,7 6,1
MHS 4,3 8,8 10 6,3 4,3 5,6 5,55 8 4,2 4,95 6,45 10,35 7,55
NichePSO 5,1 8,4 8,1 6,1 7,6 3,2 3,35 7,7 5 7,2 7,6 8,7 5,7
SwarmBcluster 6,1 4,3 5,1 11,9 2,2 11,3 11 2,3 10,7 11,5 9,4 4,9 6
Todos (J) 4,9 11,2 4,8 9,3 12,7 9 8,3 4,7 1 5,9 7,3 6,4 4,6
Todos (LC) 3,5 8,8 5,2 10,6 12,3 8,1 7,7 3,5 10 3,2 4,3 10,5 9,9
Ff 57,08571 46,39121 54 79,74066 89,23516 99,95275 80,55495 79,81978 77,84176 34,01868 24,24066 55,88901 19,4011
pvalue 7,63E-08 5,94E-06 2,73E-07 7,98E-11 8,17E-11 7,44E-11 5,86E-11 8,33E-11 6,34E-11 0,00067 0,018861 1,25E-07 0,079298
Ff
Rejeita H0 =
0,01 (26,217) Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Sim Não
Fid 8,166213 5,672161 7,363636 17,82607 26,10502 44,87272 18,37986 17,8789 16,61777 3,560868 2,278273 7,845786 1,735704
Fid
Rejeita H0 =
0,01 (2,37) Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Sim Não
102
Figura 34 - MSR do melhor bicluster para a Fusão Direta sem sobreposição nas bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung.
103
Figura 35 - MSR do melhor bicluster para a Fusão Direta sem sobreposição nas bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6.
Figura 36 - Comparação múltipla entre as diferentes configurações da Fusão Direta sem

104
105


106


107

Tabela 36: Teste de Friedman sobre bases artificiais (Fusão Direta sem sobreposição)
Fusão Direta sem sobreposição RMS CMS MS
ABC 5 7,333333 7,333333
BicACO 2,333333 5 5
BIC-aiNet 9,333333 12 12
CDE 5 7,666667 7,666667
dFSS 8,333333 10 10
Ranking
CGA 1 2,333333 2,333333

FSGA 6 6 6
GSO 2,666667 4 4
MHS 6 9 9
NichePSO 9,666667 11 11
SwarmBcluster 12 1,666667 1,666667
Todos (J) 10,66667 13 13
Todos (LC) 13 2 2
Ff 34,68132 35,56044 35,56044
Ff
pvalue 0,000526 0,000381 0,000381

Fid 52,6 161,8 161,8
Fid
pvalue 3,04E-14 6,42E-20 6,42E-20

108
A Figura 34 e a Figura 35 mostram a variação do valor do MSR do melhor

bicluster. Pode-se perceber que a variação das médias foi maior na Fusão Direta sem
sobreposição do que na Fusão Direta com sobreposição.
Os comitês que utilizaram os algoritmos ABC, dFSS, GSO e NichePSO

apresentaram desempenho equivalentes quanto à cobertura de linhas e colunas. Já as
médias da cobertura de elementos são exibidas na Figura 40, que mostra que o comitê
que utilizou GSO foi o melhor. A Figura 41 exibe as médias de sobreposição, sendo que
o comitê usando SwarmBcluster obteve o melhor desempenho apresentando diferenças
significativas em relação aos outros quatro algoritmos. O comitê que usou
SwarmBcluster, no entanto, também obteve um dos piores níveis de similaridade (dado
pelo índice de Jaccard) entre os biclusters.
Na Fusão Direta sem sobreposição também não houve diferenças significativas

nas médias das taxas de correspondência do bicluster, como pode ser visto na Figura 42.
Na Fusão Direta sem sobreposição, de acordo com o teste de Friedman (Tabela

35), os algoritmos são equivalentes em relação aos valores de TVE e LC. O comitê
Todos (LC) obteve as piores médias de MI e as melhores de VE.
5.6.3. Bagged biclustering com sobreposição
Da Tabela 104 à Tabela 113 (com um algoritmo) e da Tabela 134 à Tabela 143
(com 11 algoritmos) são mostrados os experimentos computacionais de comitês com
bases de dados geradas por reamostragem (Bagged Biclustering) e com sobreposição.
Os testes de Friedman são exibidos na Tabela 38 e na Tabela 37.
Com relação ao tempo computacional, o comitê Bagged Biclustering com

sobreposição se comportou da mesma forma que a Fusão Direta. E quanto às métricas
VE, TVE e MI, o teste de Friedman (Tabela 37) apontou que existe equivalência entre
as médias dos algoritmos. A única diferença significativa ocorreu apenas entre os
comitês que usaram o algoritmo SwarmBcluster e 11 algoritmos com a métrica LC,
quanto aos valores de VE (Tabela 153, com ( = 0,01)).
109
Tabela 37: Teste de Friedman (Bagged Biclustering com sobreposição)

Cobertura
Bagged Biclustering MSR Volume MSR Volume Cobertura Linhas e Sobrepo-
com sobreposição (melhor) (melhor) (média) (média) Tempo Elementos Colunas sição Jaccard VE TVE MI LC
ABC 6,1 8,9 8,5 7,3 6,5 4,95 4,1 5,7 4,9 6,9 7,3 7,3 5,8
BicACO 9,7 1,4 4,9 3,9 7,5 6,8 8,9 9,4 8,6 9,1 7,7 5,4 9
BIC-aiNet 4,5 11,7 5 12,1 1 12,1 11,1 1,7 1,8 6 6,4 8,2 4,2
CDE 7,6 4,8 8,1 3,3 5,8 4,1 4,6 9,4 8,5 6,6 8,9 6,4 8,7
dFSS 7,5 6,7 11,1 4,7 6,6 3,05 3,5 8,9 8,1 5,8 7,4 7,4 7,5
Ranking
CGA 8,7 7,3 3,5 6,9 7,8 11,1 11,3 12,9 12,4 6,1 7,6 6,7 5,6
FSGA 9 5,3 4 4,7 8,7 10 10 10,3 10,1 7,1 8,4 5,2 7,6
GSO 12,5 7,9 12,6 6 8,3 4,45 3,9 7,2 6,5 8 5,6 5,9 5,2
MHS 8,1 7 7 5,8 4,3 5,75 5,3 7,2 6,5 7,6 7,6 5,7 8,3
NichePSO 7,6 4,4 10,7 3,6 7,2 3,2 3,5 9,5 8,4 7,9 7,1 6,1 10,8
SwarmBcluster 2,8 4,3 7,8 10,7 2,3 9,5 10,1 3,4 3,6 10,7 7,6 8 5,8
Todos (J) 4 11,5 3,7 11,6 12,7 8,6 7,6 2 1,2 5,7 5,4 8,2 2,6
Todos (LC) 2,9 9,8 4,1 10,4 12,3 7,4 7,1 3,4 10,4 3,5 4 10,5 9,9
Ff 64,03516 71,15604 75,77143 79,38462 87,9033 73,54945 71,90769 97,49011 89,31429 24,81758 14,03077 17,36703 44,38681
pvalue 4,18E-09 2,42E-10 1,01E-10 6,61E-11 8,25E-11 1,11E-10 2,17E-10 8,63E-11 8,55E-11 0,015711 0,298748 0,136305 1,31E-05
Ff
Rejeita H0 =
0,01 (26,217) Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Não Não Sim
Fid 10,29783 13,11123 15,4186 17,59091 24,64832 14,25053 13,45681 38,97891 26,19553 2,346633 1,191638 1,522935 5,283223
pvalue 3,04E-13 3,25E-16 2,07E-18 2,61E-20 1,29E-25 2,53E-17 1,48E-16 1,02E-33 1,23E-26 0,01023 0,298295 0,126826 6,01E-07
Fid
Rejeita H0 =
0,01 (2,37) Sim Sim Sim Sim Sim Sim Sim Sim Sim Não Não Não Sim
110
Figura 43 - MSR do melhor bicluster para o Bagged Biclustering com sobreposição nas bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung.
111
Figura 44 - MSR do melhor bicluster para o Bagged Biclustering com sobreposição nas bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6.
Figura 45 - Comparação múltipla entre as diferentes configurações do Bagged Biclustering com

112
113


114


115

Tabela 38: Teste de Friedman sobre bases artificiais (Bagged Biclustering com sobreposição)
Bagged Biclustering com
sobreposição RMS CMS MS
ABC 8 7,666667 7,666667
BicACO 5 9 8
BIC-aiNet 10 12 12
CDE 4 4,666667 5
dFSS 6,666667 8 8
Ranking
CGA 1 3,333333 3
FSGA 4 4 4,666667
GSO 3,666667 11 11
MHS 5 5,666667 6
NichePSO 7,666667 9,333333 9,666667
SwarmBcluster 12 1 1
Todos (J) 11 13 13
Todos (LC) 13 2,333333 2
Ff 31,78022 34,68132 34,41758
Ff
pvalue 0,001496 0,000526 0,000579

Fid 15,0625 52,6 43,5
Fid
pvalue 2,35E-08 3,04E-14 2,62E-13

Em geral, comitês utilizando o algoritmo SwarmBcluster obtiveram a melhor

média de MSR e a segunda melhor média de volume do melhor bicluster, enquanto,
mais uma vez, os comitês gerados via BIC-aiNet, Todos (J) e Todos (LC) obtiveram
116
boas médias de MSR e, porém, os menores volumes (Tabela 37). Comitês usando o
algoritmo GSO obtiveram os piores valores de MSR, taxa de sucesso e quantidade de -
biclusters. Esses fatos podem ser observados nas Figuras 45 a 48. A Figura 43 e a
Figura 44 mostram a variação do MSR do melhor bicluster.
Os comitês que produziram mais -biclusters e obtiveram as menores médias de

sobreposição foram: o comitê de 11 algoritmos com a métrica índice de Jaccard, o do
algoritmo SwarmBcluster, de todos com a métrica LC e o do algoritmo BIC-aiNet.
Entre estes, o comitê de 11 algoritmos que usou a correlação linear obteve a segunda
pior média de similaridade, enquanto os outros obtiveram as três melhores. A Figura 49
aponta o algoritmo que obteve as maiores médias de cobertura de elementos, sendo este
o dFSS, e os que obtiveram as menores (em vermelho). A Figura 50 mostra a variação
das médias de sobreposição, em que o BIC-aiNet apresentou o melhor desempenho. A
Figura 51 comprova que houve equivalência entre os algoritmos quanto à taxa de
correspondência dos biclusters.
5.6.4. Bagged biclustering sem sobreposição
Os experimentos computacionais para Bagged Biclustering sem sobreposição

estão nas Tabelas 114 a 123 (com um algoritmo) e nas Tabelas 134 a 143 (com 11
algoritmos). A Tabela 40 apresenta os testes de Friedman com bases artificiais e a
Tabela 39 com todas as bases.
Todos os comitês demandaram mais tempo computacional para gerar um

consenso utilizando biclusters provenientes dos 11 algoritmos e, em seguida, com o
algoritmo FSGA; e menos tempo com os algoritmos SwarmBcluster e BIC-aiNet.
O comparativo das médias de MSR do melhor bicluster é mostrado na Figura 54

e o comparativo das médias de volume para o melhor bicluster é exibido na Figura 56.
A variação das médias de MSR do melhor bicluster é mostrada nas Figuras 52 e 53.
Essas figuras evidenciam que o comitê de 11 algoritmos com a métrica correlação linear
foi o melhor com relação aos valores de MSR, ao passo que CGA foi o melhor com
relação ao volume do melhor bicluster. A Figura 55 mostra o comparativo do MSR
médio e a Figura 57 mostra o comparativo do volume médio da população final.
117
Tabela 39: Teste de Friedman (Bagged Biclustering sem sobreposição)

Cobertura
Bagged Biclustering MSR Volume MSR Volume Cobertura Linhas e Sobrepo-
sem sobreposição (melhor) (melhor) (média) (média) Tempo Elementos Colunas sição Jaccard VE TVE MI LC
ABC 4,5 10,6 9,4 8,6 7,1 2,8 3,5 6 3,5 6,9 3,7 9,4 6,9
BicACO 6,1 4,6 8,7 5,1 7,5 7,4 8,2 6,3 10,2 6,3 7 7,6 9
BIC-aiNet 8,4 7,3 3,7 12 1 12,1 11,1 2,3 4 5,6 6,9 5,9 5,5
CDE 7,7 6,1 9,6 5,6 5,8 5,1 5,05 9,3 5,1 8,4 8,4 7,4 6,9
dFSS 8,5 7,5 9,4 5,7 6,9 2,8 2,45 8,3 5,5 6,8 8,3 5,3 7,2
Ranking
CGA 12,3 2,5 3,3 1,4 7,8 11,1 11,3 13 12 7,8 8,6 3,9 8,8
FSGA 10,9 2,9 4,3 3,2 8,9 10 10,2 11 9 9 9,2 4,6 7,2
GSO 7,6 8,4 8,3 6,3 8,4 2,8 3,8 6,7 8,5 6,4 5,3 4,3 7,9
MHS 4,2 9,15 8,5 5,2 3,9 5,8 5,55 9,2 3,5 6,4 7,2 10,8 6,4
NichePSO 6 9,3 9,7 6,6 6,4 2,6 3,8 7,5 6,8 7,5 8 7,4 5,8
SwarmBcluster 5,2 3,85 6,6 10 2,3 10,1 10,5 4,9 10,8 11,2 8,6 5,4 6,7
Todos (J) 6,8 11 4,7 11,7 12,7 9,4 8,1 2,5 1,1 4,9 5,9 7,3 2,6
Todos (LC) 2,8 7,8 4,8 9,6 12,3 9 7,45 4 11 3,8 3,9 11,7 10,1
Ff 56,16264 62,87802 49,16044 80,67692 90,03956 98,03077 79,10769 80,04396 96,35604 27,92967 25,88571 47,72308 27,2044
Ff
Rejeita H0 =
Fid 7,917992 9,906908 6,245719 18,46479 27,04754 40,15966 17,41084 18,0297 36,67764 2,730163 2,47541 5,942529 2,638482
Fid
Rejeita H0 =
0,01 (2,37) Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim Sim
118
Figura 52 - MSR do melhor bicluster para o Bagged Biclustering sem sobreposição nas bases Arabidopsis, Brain_1, Brain_2, Breast_Colon e Lung.
119
Figura 53 - MSR do melhor bicluster para o Bagged Biclustering sem sobreposição nas bases Multitissue, Yeast, Artificial_2, Artificial_4 e Artificial_6.
Figura 54 - Comparação múltipla entre as diferentes configurações do Bagged Biclustering sem

120
121


122


123

Tabela 40: Teste de Friedman sobre bases artificiais (Bagged Biclustering sem sobreposição)
Bagged Biclustering sem
sobreposição RMS CMS MS
ABC 6,666667 8,666667 9
BicACO 2,333333 4 4
BIC-aiNet 9,666667 12 12
CDE 4 5,333333 5,333333
dFSS 8 10 10
Ranking
CGA 1 3 2,666667
FSGA 2,666667 7,666667 6,333333
GSO 9,333333 6,666667 7,333333
MHS 5 7,333333 7,333333
NichePSO 6,333333 10,33333 10,66667
Todos (J) 11 13 13
Todos (LC) 13 2 1,666667
Ff 35,73626 34,28571 34,72527
Ff
pvalue 0,000357 0,000608 0,000518

Fid 271 40 54,48276
Fid
pvalue 1,43E-22 6,72E-13 2,04E-14

A Figura 58 exibe as diferenças entre as médias de cobertura de elementos. A

Figura 59 exibe as diferenças entre as médias de sobreposição, e, assim como para os
outros comitês, o comitê que utilizou o algoritmo CGA foi o pior tanto em relação aos
124
valores de sobreposição quanto aos valores do índice de Jaccard. O comitê que utilizou
NichePSO ficou com os melhores valores de cobertura de elementos e o que utilizou
BIC-aiNet, com os melhores valores de sobreposição.
A Figura 60 comprova que, assim como nos algoritmos multimodais e nos

outros comitês apresentados anteriormente, não houve diferenças significativas nas
médias de taxa de correspondência entre os comitês de Bagged Biclustering sem
sobreposição. O teste de Friedman (Tabela 39) comprovou que, em relação a TVE,
houve equivalência entre os comitês de Bagged Biclustering sem sobreposição.
5.7. Análise geral
A partir dos resultados apresentados nas seções anteriores, pode-se concluir que
os comitês são bem mais custosos do que os algoritmos multimodais, uma vez que é
necessário computar os biclusters iniciais e, a partir destes, gerar um consenso.
O consenso via Fusão Direta geralmente demanda mais tempo que o do

algoritmo Bagged Biclustering. Isso acontece porque, como no Bagged Biclustering as
bases de dados são geradas por reamostragem, os biclusters iniciais acabam sendo
menores, já que linhas e colunas repetidas são desconsideradas da solução que será
reportada para a geração dos meta-clusters.
A Tabela 41 traz uma síntese do que foi apresentado anteriormente, conforme os

resultados do teste de Friedman. Nessa tabela, “FD” representa Fusão Direta; “B”,
Bagged Biclustering; “O”, sobreposição e “NO”, sem sobreposição.
O teste de Friedman também foi aplicado para cada um dos 11 algoritmos, em

que foram comparados cinco grupos, sendo estes os quatro comitês citados
anteriormente, com biclusters gerados por apenas um algoritmo, e o respectivo
algoritmo multimodal que gerou os biclusters utilizados nos comitês. Assim, foi
comprovado que os comitês obtiveram posições melhores que o respectivo algoritmo
multimodal nos rankings das métricas apresentadas, conforme mostram as Tabelas 42 a
45. A Tabela 46 faz uma síntese dessas quatro tabelas, apresentando a quantidade de
vezes que um algoritmo isolado ou um dos comitês obteve o melhor desempenho dentro
dos 11 testes que foram feitos para cada métrica.
125
Tabela 41: Síntese dos Testes de Friedman com algoritmos multimodais e comitês
Multimodais FDO FDNO BO BNO
melhor pior melhor pior melhor pior melhor pior melhor pior
MSR SwarmBcluster GSO Todos(LC) GSO Todos(LC) CGA SwarmBcluster GSO Todos(LC) CGA
(melhor)
Volume FSGA BIC-aiNet BicACO Todos(J) CGA Todos(J) BicACO BIC-aiNet CGA Todos(J)
(melhor)
MSR SwarmBcluster GSO Todos(LC) GSO CGA ABC CGA GSO CGA NichePSO
(média)
Volume FSGA BIC-aiNet CDE BIC-aiNet CGA SwarmBcluster CDE BIC-aiNet CGA BIC-aiNet
(média)
Tempo BIC-aiNet BicACO BIC-aiNet Todos(J) BIC-aiNet Todos(J) BIC-aiNet Todos(J) BIC-aiNet Todos(J)
Cobertura GSO BIC-aiNet GSO BIC-aiNet GSO BIC-aiNet dFSS BIC-aiNet NichePSO BIC-aiNet
Elementos
Cobertura ABC, MHS CGA dFSS, GSO, CGA ABC, dFSS, CGA dFSS, CGA dFSS CGA
Linhas e NichePSO GSO, NichePSO
Colunas NichePSO
Sobreposição BIC-aiNet CGA BIC-aiNet CGA SwarmBcluster CGA BIC-aiNet CGA BIC-aiNet CGA
Jaccard BIC-aiNet CGA Todos(J) CGA Todos(J) CGA Todos(J) CGA Todos(J) CGA
VE FSGA BicACO Todos(LC) SwarmBcluster Todos(LC) SwarmBcluster Todos(LC) SwarmBcluster Todos(LC) SwarmBcluster
TVE SwarmBcluster CGA Todos(LC) CDE ABC SwarmBcluster Todos(LC) CDE ABC FSGA
MI GSO SwarmBcluster BicACO, Todos(LC) CGA Todos(LC) FSGA Todos(LC) CGA Todos(LC)
GSO
LC CDE FSGA Todos(J) Todos(LC) Todos(J) Todos(LC) Todos(J) NichePSO Todos(J) Todos(LC)
MS SwarmBcluster BIC-aiNet SwarmBcluster Todos(J) SwarmBcluster Todos(J) SwarmBcluster Todos(J) SwarmBcluster Todos(J)
RMS CGA SwarmBcluster CDE Todos(LC) CGA Todos(LC) CGA Todos(LC) CGA Todos(LC)
CMS SwarmBcluster BIC-aiNet SwarmBcluster Todos(J) SwarmBcluster Todos(J) SwarmBcluster Todos(J) SwarmBcluster Todos(J)
126
Tabela 42: Teste de Friedman para os algoritmos ABC, BicACO e BIC-aiNet

Cobertura
MSR Volume MSR Volume Cobertura Linhas e Sobreposi-
Teste de Friedman (melhor) (melhor) (média) (média) Elementos Colunas ção Jaccard VE TVE MI LC RMS CMS MS
ABC 3,2 2,2 2,8 2,8 2,5 2,15 4 4 3,4 3,6 2,6 2,9 2 3 3
BNO 2,3 4,7 3,1 5 3,4 3,55 1 1,3 2,8 2,4 3,7 2,5 5 4 4,666667
BO 4,2 2,2 2,8 2,3 4,05 4 3,5 3,3 2,7 3,6 2,1 3,6 3 2 2
FDNO 1,7 4,3 3,6 3,5 2,65 2,15 2 1,7 2,3 2 4,3 2,6 4 5 4,333333
FDO 3,6 1,6 2,7 1,4 2,4 3,15 4,5 4,7 3,8 3,4 2,3 3,4 1 1 1
ABC
Ff 16,08 31,28 2,16 29,36 7,98 11,08 34 34,24 5,68 8,96 14,56 3,76 12 12 11,46667
pvalue 0,002914 2,68E-06 0,706359 6,61E-06 0,092314 0,025679 7,45E-07 6,65E-07 0,224355 0,062107 0,005706 0,43946 0,017351 0,017351 0,021791
Rejeita Sim Sim Não Sim Não Não Sim Sim Não Não Sim Não Não Não Não
Fid 6,050167 32,2844 0,513742 24,83459 2,242973 3,448133 51 53,5 1,48951 2,597938 5,150943 0,933775 ∞ ∞ 43
pvalue 0,000788 1,86E-11 0,726018 6,32E-10 0,083639 0,017443 2,41E-14 1,16E-14 0,225805 0,05239 0,002189 0,455389 0 0 1,88E-05
Rejeita Sim Sim Não Sim Não Não Sim Sim Não Não Sim Não Sim Sim Sim
BicACO 3,3 2,4 2,8 2,8 3,6 3,9 4,1 4,3 3,8 3,5 2,6 2,6 1 3 2,333333
BNO 2 4,3 3,2 3,9 3,15 3,2 2 1,9 1,9 2,8 3,7 2,7 5 4 4
BO 3,4 2,5 3,1 2,4 3,05 3,3 3,4 3,3 3,3 3,6 2,4 3,1 3 2 2,333333
FDNO 1,8 4,1 4,1 4,5 2,9 2,35 1 1,1 2,3 1,7 4,3 3,4 4 5 5
BicACO
FDO 4,5 1,7 1,8 1,4 2,3 2,25 4,5 4,4 3,7 3,4 2 3,2 2 1 1,333333
Ff 19,76 20,8 10,96 24,08 3,54 7,7 34,48 34,24 11,68 10 14,8 1,84 12 12 10,4
pvalue 0,000557 0,000347 0,027017 7,7E-05 0,471822 0,103207 5,94E-07 6,65E-07 0,019896 0,040428 0,005135 0,765157 0,017351 0,017351 0,034203
Fid 8,786561 9,75 3,396694 13,61307 0,873834 2,145511 56,21739 53,5 3,711864 3 5,285714 0,433962 ∞ ∞ 13
pvalue 4,68E-05 1,9E-05 0,018623 7,43E-07 0,489128 0,095145 5,44E-15 1,16E-14 0,0125 0,031007 0,001872 0,783154 0 0 0,001412
BIC-aiNet 3 3,4 2,6 4,2 4,6 3,4 1,4 3,8 3,1 3,2 2,6 3,8 5 1 1
BNO 2,8 3,75 3,1 3,8 3,7 3,7 3,4 2,7 2,3 2,7 4,1 3 3,333333 4,333333 4,333333
BO 2,8 3,15 3,1 2,8 2,7 3,7 4,7 3,7 2,2 2,8 4,1 3 2,333333 3,333333 3,333333
FDNO 3,3 2,7 3,2 2,6 2,5 2,1 2,1 1,9 3,7 3,5 2,1 2,3 2,666667 3,666667 3,666667
BIC-aiNet
FDO 3,1 2 3 1,6 1,5 2,1 3,4 2,9 3,7 2,8 2,1 2,9 1,666667 2,666667 2,666667
Ff 0,72 7,34 0,88 16,96 22,56 11,04 26,32 9,76 8,48 1,84 16,8 4,56 7,733333 7,733333 7,733333
pvalue 0,94884 0,118975 0,927412 0,001968 0,000155 0,026118 2,73E-05 0,04467 0,075496 0,765157 0,002114 0,335492 0,10185 0,10185 0,10185
Rejeita Não Não Não Sim Sim Não Sim Não Não Não Sim Não Não Não Não
Fid 0,164969 2,022658 0,202454 6,625 11,6422 3,430939 17,31579 2,904762 2,42132 0,433962 6,517241 1,158014 3,625 3,625 3,625
pvalue 0,954761 0,111939 0,935373 0,00042 3,62E-06 0,017829 5,26E-08 0,035087 0,066093 0,783154 0,000472 0,345455 0,05718 0,05718 0,05718
Rejeita Não Não Não Sim Sim Não Sim Não Não Não Sim Não Não Não Não
127
Tabela 43: Teste de Friedman para os algoritmos CDE, CGA e dFSS

Cobertura
CDE 3,2 2,3 2,8 3 3,8 3,75 3,3 3,5 2,8 3,2 2,8 2,9 1,333333 2,333333 2
BNO 2,5 4,2 3 4,9 3,5 3,1 1 1,1 3,2 2,7 3,3 2 5 4 4
BO 4,2 2,4 2,8 2,2 3,5 3,35 3,8 3,6 2,8 3,1 1,8 3,6 3 2,333333 2,666667
FDNO 1,3 4,7 3,6 3,5 2 1,85 2 1,9 2,3 2,2 4,8 2,8 4 5 5
FDO 3,8 1,4 2,8 1,4 2,2 2,95 4,9 4,9 3,9 3,8 2,3 3,7 1,666667 1,333333 1,333333
CDE
Ff 21,04 30,96 1,92 28,24 11,12 8,08 37,36 36,16 5,68 5,68 21,2 7,6 11,46667 10,4 10,66667
pvalue 0,000311 3,12E-06 0,75047 1,12E-05 0,025248 0,088691 1,52E-07 2,68E-07 0,224355 0,224355 0,000289 0,10738 0,021791 0,034203 0,030577
Fid 9,987342 30,82301 0,453782 21,61224 3,465374 2,278195 127,3636 84,75 1,48951 1,48951 10,14894 2,111111 43 13 16
pvalue 1,53E-05 3,53E-11 0,768973 3,69E-09 0,017065 0,079835 1,01E-20 8,28E-18 0,225805 0,225805 1,32E-05 0,099576 1,88E-05 0,001412 0,000694
CGA 3 3 3 3 4,6 5 5 5 2,9 3,2 3,4 3,2 1 1 1
BNO 3,8 4,4 4,4 4,1 1,8 1,5 1 1 2,6 2,9 2,7 2,8 4 3,666667 3,666667
BO 3 3,6 3,4 3,8 1,8 1,5 3 3 2,7 2,9 3,1 3,2 5 3,333333 4
FDNO 2,95 2,25 2,7 2,2 3,4 3,5 2 2 3,35 2,95 2,85 2,55 2,333333 4 3
FDO 2,25 1,75 1,5 1,9 3,4 3,5 4 4 3,45 3,05 2,95 3,25 2,666667 3 3,333333
CGA
Ff 4,82 17,78 17,84 14,8 23,04 36 40 40 2,34 0,26 1,14 1,54 11,46667 6,666667 6,666667
pvalue 0,30627 0,001362 0,001326 0,005135 0,000124 2,89E-07 4,33E-08 4,33E-08 0,673496 0,992248 0,887875 0,819533 0,021791 0,154587 0,154587
Rejeita Não Sim Sim Sim Sim Sim Sim Sim Não Não Não Não Não Não Não
Fid 1,233087 7,20162 7,245487 5,285714 12,22642 81 ∞ ∞ 0,559214 0,058883 0,264025 0,360374 43 2,5 2,5
pvalue 0,314172 0,000228 0,000218 0,001872 2,23E-06 1,72E-17 0 0 0,693673 0,993287 0,899103 0,835111 1,88E-05 0,125726 0,125726
Rejeita Não Sim Sim Sim Sim Sim Sim Sim Não Não Não Não Sim Não Não
dFSS 3 2,5 3 2,7 4 3,2 4,2 4,3 3,4 3 3,1 3,1 1,666667 3 3
BNO 1,8 4,7 3,3 5 3 3,35 1 1,2 3,1 2,8 3,1 2,6 4,666667 4 4
BO 4 2 2,8 2,4 3,85 4,05 3,7 3,9 2,4 3,4 2,6 4,2 3 2 1,666667
FDNO 2,4 4 3,2 3,6 2,2 2,2 2,1 1,8 2,6 2,5 3,7 1,5 4,333333 5 5
FDO 3,8 1,8 2,7 1,3 1,95 2,2 4 3,8 3,5 3,3 2,5 3,6 1,333333 1 1,333333
dFSS
Ff 13,76 26,32 1,04 30,8 13,86 10,18 30,96 31,28 3,76 2,16 3,68 16,88 10,93333 12 11,46667
pvalue 0,008102 2,73E-05 0,903671 3,36E-06 0,007756 0,037502 3,12E-06 2,68E-06 0,43946 0,706359 0,451041 0,00204 0,027324 0,017351 0,021791
Rejeita Sim Sim Não Sim Sim Não Sim Sim Não Não Não Sim Não Não Não
Fid 4,719512 17,31579 0,240246 30,13043 4,771997 3,072435 30,82301 32,2844 0,933775 0,513742 0,911894 6,570934 20,5 1,8E+308 43
pvalue 0,00364 5,26E-08 0,913666 4,82E-11 0,00342 0,028234 3,53E-11 1,86E-11 0,455389 0,726018 0,467491 0,000446 0,00029 0 1,88E-05
Rejeita Sim Sim Não Sim Sim Não Sim Sim Não Não Não Sim Sim Sim Sim
128
Tabela 44: Teste de Friedman para os algoritmos FSGA, GSO e MHS

Cobertura
FSGA 3 3,1 2,9 3,1 4,6 4,8 5 5 2,6 2,7 3,4 3,3 1,333333 2,666667 1,666667
BNO 3,2 4,4 2,5 4,4 3,7 2,35 1,3 1,5 2,9 3 3,2 1,8 5 4 4,333333
BO 4 3,2 3,6 2,4 2,4 1,75 3 3 2,8 3,7 2,6 3,3 3 2,333333 2,333333
FDNO 2,1 2,9 3,1 3,7 2,75 3,35 1,7 1,5 2,9 2,6 3 2,5 4 5 4,666667
FDO 2,7 1,4 2,9 1,4 1,55 2,75 4 4 3,8 3 2,8 4,1 1,666667 1 2
FSGA
Ff 7,76 18,32 2,56 21,52 22,3 21,64 38,32 38 3,44 2,96 1,6 12,32 11,46667 11,46667 9,333333
pvalue 0,100776 0,001068 0,633925 0,00025 0,000175 0,000236 9,63E-08 1,12E-07 0,48706 0,564541 0,808792 0,015124 0,021791 0,021791 0,053287
Rejeita Não Sim Não Sim Sim Sim Sim Sim Não Não Não Não Não Não Não
Fid 2,166253 7,605166 0,615385 10,48052 11,33898 10,60784 205,2857 171 0,846827 0,719222 0,375 4,00578 43 43 7
pvalue 0,09257 0,000151 0,654346 9,82E-06 4,67E-06 8,78E-06 3,02E-24 6,9E-23 0,50493 0,584422 0,824918 0,008665 1,88E-05 1,88E-05 0,010026
Rejeita Não Sim Não Sim Sim Sim Sim Sim Não Não Não Sim Sim Sim Não
GSO 3 2,2 3 2,7 2,85 2,35 3,9 3,9 2,9 3,1 3 3,3 3 4 3,333333
BNO 1,6 4,7 1,8 5 3,2 3,7 1 1,7 2,3 2,6 3 3,1 5 5 5
BO 3,6 2,8 3,4 2,7 4,1 4,25 3 3,1 3,6 2,9 2,6 2,9 2 2,666667 2
FDNO 2,4 3,6 2,4 3 2,65 2,35 2,6 1,8 2,9 2,6 4 2,1 4 2,333333 3,666667
FDO 4,4 1,7 4,4 1,6 2,2 2,35 4,5 4,5 3,3 3,8 2,4 3,6 1 1 1
GSO
Ff 18,56 22,48 15,68 24,56 8,14 13,28 28,88 24,8 3,84 3,92 6,08 5,12 12 11,46667 11,46667
pvalue 0,000959 0,000161 0,00348 6,17E-05 0,086582 0,009986 8,27E-06 5,52E-05 0,428092 0,416941 0,193253 0,275205 0,017351 0,021791 0,021791
Rejeita Sim Sim Sim Sim Não Sim Sim Sim Não Não Não Não Não Não Não
Fid 7,791045 11,54795 5,802632 14,31606 2,299435 4,473054 23,3741 14,68421 0,955752 0,977827 1,613208 1,321101 1,8E+308 43 43
pvalue 0,000125 3,91E-06 0,001038 4,36E-07 0,077626 0,004893 1,38E-09 3,32E-07 0,443482 0,431773 0,192102 0,280761 0 1,88E-05 1,88E-05
Rejeita Sim Sim Sim Sim Não Sim Sim Sim Não Não Não Não Sim Sim Sim
MHS 3,2 2,2 2,8 2,9 2,9 2,75 3,4 3,8 3,5 3,4 2,5 2,9 2 3 3
BNO 2,4 4,4 2,9 4,9 3,3 2,85 1 1,3 2,5 3 3,7 2,4 5 4 4
BO 4 2,3 2,9 2,4 3,75 3,25 4 3,5 3,5 3,1 1,7 3,6 3 2 2
FDNO 1,4 4,6 3,7 3,3 2,1 2,3 2 1,7 1,8 2 4,9 3,1 4 5 5
FDO 4 1,5 2,7 1,5 2,95 3,85 4,6 4,7 3,7 3,5 2,2 3 1 1 1
MHS
Ff 19,84 31,6 2,56 25,28 5,9 5,44 34,88 33,44 10,72 5,68 26,72 2,96 12 12 12
pvalue 0,000537 2,31E-06 0,633925 4,42E-05 0,206742 0,245054 4,92E-07 9,71E-07 0,029898 0,224355 2,26E-05 0,564541 0,017351 0,017351 0,017351
Fid 8,857143 33,85714 0,615385 15,45652 1,557185 1,416667 61,3125 45,87805 3,295082 1,48951 18,10843 0,719222 ∞ ∞ ∞
pvalue 4,37E-05 9,6E-12 0,654346 1,9E-07 0,206722 0,248207 1,42E-15 1,18E-13 0,021204 0,225805 3,13E-08 0,584422 0 0 0
129
Tabela 45: Teste de Friedman para os algoritmos NichePSO e SwarmBcluster

Cobertura
NichePSO 3 2,3 2,6 2,5 4,4 4,4 4,4 4,5 3 3 2,6 3,1 1 1 1
BNO 2,6 4,7 3,4 5 2,5 3,35 1,2 1,9 2,8 2,5 3,1 2,2 4 4 4
BO 4,3 1,9 3,1 2 4 3,75 3,8 3,6 3,5 3,3 2,2 4,2 3 3 3
FDNO 2,1 4,2 3,2 3,8 2,45 1,75 1,8 1,1 2,3 2,7 4,3 1,8 5 5 5
NichePSO
FDO 3 1,9 2,7 1,7 1,65 1,75 3,8 3,9 3,4 3,5 2,8 3,7 2 2 2
Ff 10,64 28,96 1,84 30,32 21,34 23,08 31,68 32,96 3,76 2,72 10,16 16,08 12 12 12
pvalue 0,030922 7,97E-06 0,765157 4,21E-06 0,000271 0,000122 2,22E-06 1,22E-06 0,43946 0,605719 0,037817 0,002914 0,017351 0,017351 0,017351
Rejeita Não Sim Não Sim Sim Sim Sim Sim Não Não Não Sim Não Não Não
Fid 3,26158 23,6087 0,433962 28,19008 10,2926 12,2766 34,26923 42,13636 0,933775 0,656652 3,064343 6,050167 ∞ ∞ ∞
pvalue 0,022134 1,21E-09 0,783154 1,19E-10 1,16E-05 2,14E-06 8,1E-12 4,16E-13 0,455389 0,626068 0,028531 0,000788 0 0 0
Rejeita Não Sim Não Sim Sim Sim Sim Sim Não Não Não Sim Sim Sim Sim
SwarmBcluster 1,8 4,2 2,6 2,5 2,8 2,4 3,7 4,3 1,8 1,7 3,5 3 5 2 2,333333
BNO 3,5 3,8 4,5 3,1 2,7 2,35 3,1 1,7 3,2 3,4 1,9 2,8 1,833333 4,666667 4,666667
BO 3,8 2,5 3,5 1,4 1,7 2,25 4,2 2,5 3,2 3,4 2,8 3,1 1,166667 3 2,333333
SwarmBcluster
FDNO 2,7 2,5 2,45 4,65 4,25 4 1,35 2,65 3,35 3,45 3,4 2,8 3,666667 3,5 3,833333
FDO 3,2 2 1,95 3,35 3,55 4 2,65 3,85 3,45 3,05 3,4 3,3 3,333333 1,833333 1,833333
Ff 9,84 14,32 16,26 22,66 14,74 13,38 19,14 17,9 7,38 8,86 7,28 0,72 11,13333 6,466667 6,866667
pvalue 0,043211 0,006341 0,002689 0,000148 0,005272 0,009561 0,000738 0,001291 0,117119 0,064696 0,121811 0,94884 0,025106 0,166903 0,143104
Rejeita Não Sim Sim Sim Sim Sim Sim Sim Não Não Não Não Não Não Não
Fid 2,93634 5,018692 6,16428 11,76125 5,251781 4,523666 8,25791 7,289593 2,036174 2,560694 2,002445 0,164969 25,69231 2,337349 2,675325
pvalue 0,033676 0,002555 0,000694 3,27E-06 0,001947 0,004603 7,82E-05 0,000208 0,109955 0,055017 0,114973 0,954761 0,000128 0,142659 0,110134
Rejeita Não Sim Sim Sim Sim Sim Sim Sim Não Não Não Não Sim Não Não
Tabela 46: Quantidade de vezes que um algoritmo isolado ou um dos comitês obteve o melhor desempenho
Cobertura
(melhor) (melhor) (média) (média) Elementos Colunas ção Jaccard VE TVE MI LC RMS CMS MS Total
Algoritmo isolado 1 0 3 0 0 2 1 0 2 1 0 1 5 3 4 23
BNO 3 0 2 0 1 1 8 8 3 4 2 5 0 0 0 37
BO 1 1 1 1 2 3 0 0 2 1 5 0 1 0 0 18
FDNO 6 0 0 0 2 7 2 4 4 7 1 6 0 0 0 39
FDO 1 11 7 10 7 5 0 0 0 0 4 0 5 8 7 65
130
A Fusão Direta com sobreposição foi melhor em relação aos valores de MSR,
volume, MS e CMS da população final, volume do melhor bicluster e cobertura de
elementos. Além disso, obteve um empate com os algoritmos multimodais para a
métrica RMS. Já a Fusão Direta sem sobreposição foi melhor em relação aos valores de
MSR do melhor bicluster, VE, TVE, LC, cobertura de linhas e colunas e taxa de
sucesso. Os melhores valores de MI foram apresentados por Bagged Biclustering com
sobreposição. E os valores de sobreposição, índice de Jaccard e quantidade de -
biclusters foram melhores com o algoritmo Bagged Biclustering sem sobreposição.
5.8. Conclusão
Neste capítulo, foram apresentadas inicialmente as bases de dados utilizadas nos

experimentos computacionais, a configuração dos algoritmos e os testes estatísticos
aplicados. Os algoritmos unimodais GA, DE, PSO, FSS e HS foram brevemente
analisados e os algoritmos multimodais FSGA, CGA, CDE, NichePSO, dFSS, ABC,
BicACO, GSO, MHS, SwarmBcluster e BIC-aiNet e os métodos de comitês Fusão
Direta e Bagged Biclustering foram, então, investigados.
Os algoritmos multimodais aplicados isoladamente e comitês que utilizaram

esses algoritmos foram comparados com relação aos valores de: MSR e volume do
melhor bicluster encontrado; MSR e volume médio da população final; tempo de
execução, cobertura dos elementos e das linhas e colunas; sobreposição, índice de
Jaccard; VE, TVE, MI, LC; e para as bases de dados artificiais, RMS, CMS e MS da
população final. Também foram mostrados os testes de Friedman, gráficos de
comparação múltipla e diagramas de caixa referentes aos valores do MSR do melhor
bicluster.
Os algoritmos CGA e GSO obtiveram os piores desempenhos quanto à taxa de

sobreposição e ao valor de MSR respectivamente. O algoritmo BicACO foi o que
demandou mais custo computacional e o BIC-aiNet obteve os menores volumes de
biclusters e a pior cobertura de elementos. O algoritmo SwarmBcluster, tanto isolado
quanto nos comitês, obteve as melhores taxas de correspondência entre os biclusters
verdadeiros e os biclusters encontrados.
131
Os resultados obtidos apontam que, em geral, os comitês que utilizaram

biclusters provenientes de 11 algoritmos se saíram melhores que a maior parte dos
algoritmos multimodais e comitês com apenas um algoritmo em se tratando de
encontrar pelo menos um -bicluster. No entanto, estes comitês de 11 algoritmos
incorreram em um grande custo computacional, já que utilizaram um maior número de
biclusters iniciais do que os comitês de apenas um algoritmo.
Os algoritmos multimodais isolados foram comparados com quatro arranjos de

comitês que utilizaram biclusters provenientes apenas desse algoritmo. Pelo menos um
dos quatro comitês apresentados se saiu melhor que seu respectivo algoritmo
multimodal, considerando os valores de: taxa de sucesso, taxa de correspondência,
cobertura de elementos e de linhas e colunas, MSR e volume do melhor bicluster, MSR
e volume médio, sobreposição e similaridade.
Supondo que os critérios/medidas mais importantes sejam o MSR médio e

volume médio da população, cobertura de elementos, taxa de sobreposição e MS, os
melhores algoritmos multimodais são o SwarmBcluster e o NichePSO e os melhores
comitês são os de 11 algoritmos com a métrica de correlação linear.
No próximo capítulo, passa-se às considerações finais acerca deste trabalho.

132
6. CONCLUSÃO
Este trabalho teve como objetivo investigar o uso de comitês de agrupamentos

bidimensionais de dados gerados via algoritmos multimodais bio-inspirados, uma vez
que já foi evidenciado na área de clustering que a combinação de múltiplos
agrupamentos tende a produzir melhores resultados quando comparada à estratégia
padrão de se adotar um único agrupamento bem ajustado aos dados (Strehl 2002)
(Strehl e Ghosh 2002). Além disso, a utilização de algoritmos bio-inspirados tem se
mostrado uma estratégia promissora para lidar com problemas multimodais e
multiobjetivo, como é o caso do agrupamento bidimensional de dados (de Castro et al.
2007a,b) (Coelho et al. 2009) (Divina e Aguilar-Ruiz 2006) (de França et al. 2008)
(Mitra e Banka 2006) (Xie et al. 2007).
O referencial teórico deste trabalho apresenta uma consolidação de extensa

pesquisa bibliográfica do estado-da-arte acerca da área de biclustering; de algoritmos
bio-inspirados multimodais; e de métricas de avaliação para comparar o desempenho
dos algoritmos escolhidos no problema de agrupamento bidimensional de dados.
O Capítulo 1 delineou o problema e os objetivos deste trabalho. O Capítulo 2 fez

uma revisão da literatura acerca do problema de biclustering, assim como um
levantamento de métricas comumente usadas para avaliar algoritmos aplicados a esse
problema. O Capítulo 3 apresentou os algoritmos bio-inspirados que foram utilizados
neste estudo para gerar biclusters a serem usados em arranjos de comitês. As técnicas
para a geração de comitês de biclusters foram investigadas no Capítulo 4. Por fim, os
experimentos computacionais foram reportados no Capítulo 5.
O presente estudo objetivou contribuir com um estudo comparativo experimental

sobre a utilização de algoritmos bio-inspirados multimodais no problema de
agrupamento bidimensional de dados e sobre a utilização de arranjos de comitês para
133
134
biclustering, utilizando biclusters gerados pelos algoritmos multimodais investigados.

De acordo com os experimentos apresentados, comprovou-se a hipótese de que há um
ganho de desempenho ao se adotar arranjos de comitês em relação aos algoritmos
multimodais no problema de biclustering, em se tratando de métricas de eficácia. Ou
seja, os comitês de biclustering se mostraram vantajosos em relação ao algoritmo
multimodal que utilizaram para gerar os biclusters iniciais, considerando coerência,
volume, cobertura, sobreposição e taxa de correspondência.
6.1. Síntese
Os seguintes algoritmos multimodais foram investigados: ABC, BIC-aiNet,

BicACO, CDE, CGA, dFSS, FSGA, GSO, MHS, NichePSO e SwarmBcluster. Entre
estes, BicACO foi o que demandou mais tempo para executar, enquanto BIC-aiNet foi o
mais rápido. SwarmBcluster e BIC-aiNet obtiveram os melhores valores de MSR e
sobreposição e foram os únicos a encontrar pelo menos um -bicluster em todas as
execuções. No entanto, também obtiveram os piores volumes de biclusters. O algoritmo
CGA foi o pior em relação à sobreposição e o BIC-aiNet obteve a pior cobertura de
elementos, enquanto o CGA, seguido do FSGA obtiveram as piores coberturas de linhas
e colunas. O algoritmo SwarmBcluster foi o que obteve as maiores taxas de
correspondência nas bases artificiais.
Os experimentos com comitês foram conduzidos utilizando biclusters de apenas

um algoritmo com 10 configurações e 11 algoritmos, cada qual com 10 configurações.
Foram testadas duas formas de geração das bases de dados para os comitês (réplica e
reamostragem); duas medidas para a geração dos meta-clusters (índice de Jaccard e
correlação linear); e geração de consenso com e sem sobreposição dos biclusters.
Todos os arranjos de comitês investigados incorreram em mais custo

computacional quando usaram biclusters iniciais provenientes dos 11 algoritmos,
mesmo estes tendo sido filtrados; em seguida, vieram os comitês de biclusters
produzidos pelo algoritmo FSGA, que obtiveram os maiores volumes. Os comitês
demandaram menos tempo computacional com os métodos SwarmBcluster e BIC-
aiNet. Os comitês utilizando o algoritmo CGA foram os piores no critério de
sobreposição e os que utilizaram BIC-aiNet foram os melhores. Os comitês que
135
utilizaram BIC-aiNet foram os piores em relação à cobertura. Comitês que utilizaram

GSO e CGA foram os piores em relação ao MSR e os que utilizaram 11 algoritmos com
a métrica LC foram os melhores. Os comitês de 11 algoritmos com a métrica índice de
Jaccard foram os piores em relação aos valores de volume.
Quanto às bases de dados artificiais, os comitês que utilizaram SwarmBcluster

foram os melhores com relação à taxa de correspondência e os de 11 algoritmos com a
métrica índice de Jaccard foram os piores. Porém, de acordo com os testes estatísticos
realizados, não houve diferenças significativas nas taxas de correspondência entre os
comitês.
6.2. Limitações da pesquisa
Este estudo se limitou a analisar o desempenho de algoritmos de otimização bio-

inspirados, uma vez que outros trabalhos já fizeram estudos comparativos envolvendo
algoritmos tradicionais de biclustering (Prélic et al. 2006), inclusive no contexto de
comitês (Hanczar e Nadif 2010, 2011).
Uma segunda limitação foi causada pelo custo computacional no cálculo da

métrica MI. Desejava-se fazer um estudo analisando o impacto do uso das métricas MI,
LC, VE e TVE como funções de fitness, no lugar de MSR. No entanto, na maior base de
dados utilizada neste estudo (Lung, de tamanho 313.229), a média de tempo de
execução considerando todos os algoritmos multimodais e todas as configurações foi de
aproximadamente 200 segundos. O cálculo de MI e LC de apenas um indivíduo levou
em média 49 e 0,4 segundos, chegando a 340 e 2 segundos, respectivamente, ao passo
que o cálculo de MSR, VE e TVE leva em média menos de 0,01 segundo. Para calcular
o valor de MI de uma população inteira, em apenas uma iteração, com os parâmetros de
tamanho e número de iterações utilizados neste trabalho, seria necessário
aproximadamente 12 vezes mais tempo de execução. Vale ressaltar que, neste trabalho,
o cálculo da métrica MI foi feito com base no algoritmo proposto por Qiu et al. (2009),
que, segundo estes, apresenta um desempenho computacional bastante satisfatório.
Quando comparado a outro algoritmo bem conhecido de reconstrução de redes de
regulação gênica com base em MI, denominado ARACNE (Margolin et al. 2006), o
tempo computacional incorrido pelo algoritmo de Qiu et al. para computar o valor de
136
MI para uma base de tamanho 3.213.168 foi de 1,6 horas, ao passo que o tempo exigido
pelo ARACNE foi de aproximadamente 142 horas.
6.3. Sugestões de trabalhos futuros
Possíveis extensões deste trabalho envolvem realizar um estudo mais abrangente

da calibração dos parâmetros de cada algoritmo multimodal e dos comitês e analisar o
impacto da escolha de outras funções de fitness, como as citadas na Seção 3.11, pois
acredita-se que isso possa trazer, para alguns casos, ganhos de desempenho. Neste
contexto, pretende-se investigar também a adoção de abordagens multiobjetivo baseadas
nos conceitos de solução não-dominada e de ótimo de Pareto para biclustering (Coelho
et al. 2009) (Mitra e Banka 2006).
Quanto aos algoritmos multimodais utilizados neste estudo que lidam com um
espaço de busca contínuo, pretende-se avaliar a customização dos respectivos
operadores para lidar com o espaço de busca binário e investigar o desempenho desses
algoritmos quando aplicados diretamente no problema de biclustering.
Com relação aos comitês de agrupamentos bidimensionais de dados, propõe-se

avaliar o potencial da abordagem de subamostragem utilizando algoritmos bio-
inspirados e investigar novas formas de gerar o consenso para formar um bicluster.
Neste estudo, foram avaliadas duas métricas para a construção da matriz de
dissimilaridade a ser utilizada pelo algoritmo HCL no agrupamento dos biclusters.
Pode-se ainda avaliar a geração dos meta-clusters a partir do algoritmo Quality
Clustering (Heyer et al. 1999), conforme proposto por Kaiser (2011).
Outra linha de atuação é investigar o uso de comitês de biclusters gerados por

algoritmos bio-inspirados multiobjetivos. Sugere-se também que os comitês de
agrupamentos bidimensionais utilizando algoritmos bio-inspirados sejam comparados a
comitês utilizando algoritmos tradicionais (vide Seção 2.3).
Além disso, pretende-se investigar o potencial da aplicação de algoritmos bio-

inspirados para fins de seleção (poda) de biclusters antes da sua efetiva combinação nos
comitês. Ou seja, a partir do repertório de biclusters produzidos pelos algoritmos
137
multimodais, seria realizada uma etapa de seleção dos biclusters que efetivamente iriam
ser agregados em meta-clusters. Esse processo é justificado, uma vez que nem todos os
componentes gerados contribuem para o desempenho global do comitê, sendo
recomendável identificar e descartar tais componentes para melhorar o desempenho do
comitê final (Zhou et al. 2002).
Finalmente, pretende-se investigar o potencial de arranjos de comitês de

biclustering quando aplicados a outros domínios de pesquisa, tais como filtragem
colaborativa, mineração de textos e previsão de séries temporais (de França 2010) (Nie
et al. 2011) (de Castro et al. 2007a) (de Castro et al. 2007b).
138
BIBLIOGRAFIA
Arantes, M. B., G. T. Oliveira, e S. F. Saramago. “Evolução diferencial aplicada à solução de

alguns problemas de engenharia de produção.” Revista Científica Eletrônica da
Faculdade de Matemática da Universidade Federal de Uberlândia (FAMAT em Revista)
6, 2006: 48-61.
Barkow, S. et al. “BicAT: a biclustering analysis toolbox.” Bioinformatics 22(10), 2006: 1282-
1283.
Bastos, C. J. A. et al. “Fish School Search.” In: Nature-Inspired Algorithms for Optimisation,
Studies in Computational Intelligence 193, por R. Chiong, 261-277. Springer, 2009.
Ben-Dor, A. et al. “Discovering local structure in gene expression data: the order-preserving
submatrix problem.” Proc. of the 6th Annual International Conference on
Computational Biology, 2002: 49-57.
Bhattacharjee, A., et al. “Classification of human lung carcinomas by mRNA expression profiling
reveals distinct adenocarcinoma subclasses.” Proc. of the National Academy of
Sciences USA 98(24), 2001: 13790-13795.
Bleuler, S., A. Prelić, e E. Zitzler. “An EA framework for biclustering of gene expression data.”
Proc. of IEEE Congress on Evolutionary Computation (CEC), 2004: 166-173.
Blum, C., e A. Roli. “Metaheuristics in combinatorial optimization: overview and conceptual

comparison.” ACM Computing Surveys 35(3), 2003: 268-308.
Bonabeau, E., M. Dorigo, e G. Théraulaz. Swarm intelligence: from natural to artificial systems.
Oxford University Press, 1999.
Breiman, L. “Bagging predictors.” Machine Learning 24, 1996: 123-140.
Charrad, M., e M. Ben Ahmed. “Simultaneous clustering: a survey.” Proc. of the 4th
International Conference on Pattern Recognition and Machine Intelligence (PReMI),
LNCS 6744, 2011: 370-375.
Cheng, K. O. et al. “BiVisu: software tool for bicluster detection and visualization.”
Bioinformatics 23(17), 2007: 2342-2344.
139
140
Cheng, Y., e G. M. Church. “Biclustering of gene expression data.” Proc. of the 8th International
Conference on Intelligent Systems for Molecular Biology, 2000: 93-103.
Cho, R., Campbell, M., Winzeler, E., Steinmetz, L., Conway, A., Wodicka, L., Wolfsberg, T.,
Gabrielian, A., Landsman, D., Lockhart, D., Davis, R. “A genome-wide transcriptional
analysis of the mitotic cell cycle.” Molecular Cell 2, 1998: 65-73.
Chowdary, D., et al. “Prognostic gene expression signatures can be measured in tissues
collected in RNAlater preservative.” Journal of Molecular Diagnostics 8(1), 2006: 31-39.
Coelho, G. P., F. O. de Franca, e F. J. Von Zuben. “Multi-objective biclustering: when non-

dominated solutions are not enough.” Journal of Mathematical Modelling and
Algorithms 8, 2009: 175-202.
de Castro, L. N. “Fundamentals of natural computing: an overview.” Physics of Life Reviews 4,

2007: 1-36.
de Castro, L. N., e F. J. Von Zuben. “An evolutionary immune network for data clustering.” Proc.
of 6th Brazilian Symposium on Neural Networks, 2000: 84-89.
de Castro, L. N., e J. Timmis. “Artificial immune systems as a novel soft computing paradigm.”
Soft Computing 7(8), 2003: 526-544.
—. Artificial Immune Systems: A New Computational Intelligence Approach. Springer, 2002.
de Castro, P. A. D., F. O. de França, H. M. Ferreira, e F. J. Von Zuben. “Applying Biclustering to

Text Mining: An Immune-Inspired Approach.” Proc. of the 6th International Conference
on Artificial Immune Systems (ICARIS), LNCS 4628, 2007: 83-94.
—. “Applying biclustering to perform collaborative filtering.” Proc. of the 7th International

Conference on Intelligent Systems Design and Applications, 2007: 421-426.
de França, F. O. Biclusterização na análise de dados incertos. Tese de Doutorado, Faculdade de

Engenharia Elétrica e de Computação da Unicamp, Campinas, 2010.
—. Toolboxes. s.d. http://sites.google.com/site/fabricioolivetti/toolboxes (acesso em 8 de

Novembro de 2011).
de França, F. O., e F. J. Von Zuben. “Finding a high coverage set of δ-biclusters with swarm
intelligence.” Proc. of IEEE Congress on Evolutionary Computation (CEC), 2010: 1-8.
de França, F. O., e Von Zuben F. J. “Algoritmo multi-objetivo e multipopulacional para

biclusterização.” Anais do Segundo Encontro dos Alunos e Docentes do Departamento
de Engenharia de Computação e Automação Industrial, Campinas, 2009.
de França, F. O., G. P. Coelho, e F. J. Von Zuben. “BicACO: an ant colony inspired biclustering
algorithm.” Proc. of 6th International Conference on Ant Colony Optimization and
Swarm Intelligence, LNCS 5217, 2008: 401-402.
141
de Souto, M. C. P., et al. “Ranking and selecting clustering algorithms using a meta-learning
approach.” Proc. of International Joint Conference on Neural Networks (IJCNN), 2008:
3729-3735.
de Souto, M. C. P., I. G. Costa, D. S. A. de Araujo, T. B. Ludermir, e A. Schliep. “Clustering cancer

gene expression data: a comparative study.” BMC Bioinformatics 9(497), 2008: 1-14.
Demŝar, J. “Statistical comparisons of classifiers over multiple data sets.” Journal of Machine
Learning Research 7, 2006: 1-30.
Derrac, J., S. García, D. Molina, e F. Herrera. “A practical tutorial on the use of nonparametric
statistical tests as a methodology for comparing evolutionary and swarm intelligence
algorithms.” Swarm and Evolutionary Computation 1, 2011: 3-18.
Divina, F., e J. S. Aguilar-Ruiz. “Biclustering of expression data with evolutionary computation.”

IEEE Transactions on Knowledge and Data Engineering 18, 2006: 590-602.
Dorigo, M. Optimization, learning and natural algorithms. Tese de doutorado, Politecnico di

Milano, Italy, 1992.
Dorigo, M., M. Birattar, e T. Stützle. “Ant colony optimization: artificial ants as a computational
intelligence technique.” IEEE Computational Intelligence Magazine 1(4), 2006: 28-39.
Dorigo, M., V. Maniezzo, e A. Colorni. “Ant system: optimization by a colony of cooperating

agents.” IEEE Transactions on Systems, Man, and Cybernetics-Part B 26(1), 1996: 29-
41.
Engelbrecht, A. P. Fundamentals of Computational Swarm Intelligence. England: John Wiley &

Sons, 2007.
Faceli, K., A. C. P. L. F. de Carvalho, e M. C. P. de Souto. Algoritmos de agrupamento de dados.

Relatório Técnico 249, São Carlos: Instituto de Ciências Matemáticas e de Computação
da USP, 2005.
Fayyad, U., G. Piatetsky-Shapiro, e P. Smyth. “From data mining to knowledge discovery in

databases.” AI Magazine 17(3), 1996: 37-53.
—. “Knowledge discovery and data mining: towards a unifying framework.” Proc. of the 2nd
International Conference on Knowledge Discovery and Data Mining, 1996: 82-88.
Friedman, M. “The use of ranks to avoid the assumption of normality implicit in the analysis of
variance.” Journal of the American Statistical Association 32, 1937: 675-701.
Gao, X. Z., X. Wang, e S. J. Ovaska. “Harmony Search Methods for Multi-modal and Constrained
Optimization.” In: Music-Inspired Harmony Search Algorithm - Theory and Applications,
por Z. W. Geem, 39-51. Springer, 2009.
Geem, Z. W., J. H. Kim, e G. V. Loganathan. “A new heuristic optimization algorithm: Harmony

search.” Simulation 76, 2001: 60-68.
142
Goldberg, D. E., e J. Richardson. “Genetic algorithms with sharing for multimodal function
optimization.” Proc. of the 2nd International Conference on Genetic Algorithms, 1987:
41-49.
Gonçalves, J. S. BiGGEsTS – biclustering gene expression time-series. Tese de Doutorado,

Departamento de Informática, Universidade da Beira Interior, Covilhã, 2007.
Gupta, N, e S. Aggarwal. “MIBiClus: mutual information based biclustering algorithm.”

International Journal of Computer Science 3(2), 2008: 102-106.
Hamilton, W. D. “Geometry for the selfish herd.” Journal of Theoretical Biology 31(2), 1970:
295-311.
Hanczar, B., e M. Nadif. “Bagging for biclustering: application to microarray data.” Proc. of the
European Conference on Machine Learning and Principles and Practice of Knowledge
Discovery in Databases (ECML PKDD), 2010: 490-505.
Hanczar, B., e M. Nadif. “Using the bagging approach for biclustering of gene expression data.”
Neurocomputing 74, 2011: 1595-1605.
Heyer, L.J., S. Kruglyak, e S. Yooseph. “Exploring expression data: Identification and analysis of
coexpressed genes.” Genome Research 9 (11), 1999: 1106-1115.
Holland, J. Adaptation in Natural and Artificial Systems. MIT Press, 1975.
Ihmels, J., S. Bergmann, e N. Barkai. “Defining transcription modules using large-scale gene
expression data.” Bioinformatics 20(13), 2004: 1993-2003.
Iman, R., e J. Davenport. “Approximations of the critical region of the friedman statistic.”
Communications in Statistics 9, 1980: 571-595.
Jain, A. K., M. N. Murty, e Flynn P. J. “Data clustering: a review.” ACM Computing Surveys 31(3),
1999: 264-23.
Kaiser, S. Biclustering: methods, software and application. Tese de Doutorado, Ludwig-

Maximilians-Universitat München, 2011.
Karaboga, D. “An idea based on honey bee swarm for numerical optimization.” Technical
Report-TR06, Erciyes University, Engineering Faculty, Computer Engineering
Department, 2005.
Karaboga, D., e B. Basturk. “A powerful and efficient algorithm for numerical function
optimization: artificial bee colony (ABC) algorithm.” Journal of Global Optimization
39(3), 2007: 459-471.
Krishnanand, K. N., e D. Ghose. “Glowworm swarm optimization for simultaneous capture of

multiple local optima of multimodal functions.” Swarm Intelligence 3, 2009: 87-124.
Linden, R. Algoritmos Genéticos. Rio de Janeiro: Brasport, 2006.

143
Madeira, S. C., e A. L. Oliveira. “Biclustering algorithms for biological data analysis: a survey.”
IEEE/ACM Transactions on Computational Biology and Bioinformatics 1(1), 2004: 24-
45.
Madeiro, S. Buscas multimodais por cardumes baseados em densidade. Dissertação de

Mestrado, Departamento de Sistemas e Computação, Universidade de Pernambuco,
Recife, 2010.
Margolin, A. A., et al. “ARACNE: an algorithm for the reconstruction of gene regulatory
networks in a mammalian cellular context.” BMC Bioinformatics 7(1), 2006: 1-15.
Menezes, L., e A. L. V. Coelho. “On ensembles of biclusters generated by NichePSO.” Proc. of

IEEE Congress on Evolutionary Computation (CEC), 2011: 601-607.
—. “Mining coherent biclusters with fish school search.” Proc. of the International Conference
on Swarm Intelligence (ICSI), LNCS 6729, 2011: 573-582.
Miller, B. L., e M. J. Shaw. “Genetic algorithms with dynamic niche sharing for multimodal
function optimization.” Proc. of IEEE International Conference on Evolutionary
Computation, 1996: 786-791.
Mitchell, M. An Introduction to Genetic Algorithms. MIT Press, 1996.
Mitra, S., e H. Banka. “Multi-objective evolutionary biclustering of gene expression data.”

Pattern Recognition Journal 39, 2006: 2464-2477.
Murali, T. M., e S. Kasif. “Extracting conserved gene expression motifs from gene expression
data.” Proc. of the 8th Pacific Symposium on Biocomputing, 2003: 77-88.
Nemenyi, P. B. Distribution-free multiple comparisons. Tese de doutorado, Princeton

University, 1963.
Nepomuceno, J. A., A. Troncoso, e J. S. Aguilar-Ruiz. “Evolutionary metaheuristic for

biclustering based on linear correlations among genes.” Proc. of the 25th ACM
Symposium On Applied Computing (SAC), 2010: 1143-1147.
Nie, D., Y. Fu, J. Zhou, e Y. Fang. “Predicting time series with multiple mixed models.” Journal of
Computational Information Systems 7(4), 2011: 1092-1099.
Nutt, C. L., et al. “Gene expression-based classification of malignant gliomas correlates better
with survival than histological classification.” Cancer Research 63(7), 2003: 1602-1607.
Oliveira, A. Técnicas de inteligência artificial aplicadas à biologia computacional. Nota de aula,

Lisboa: Instituto de Engenharia de Sistemas e Computadores do IST, 2006.
Opitz, D., e R. Maclin. “Popular ensemble methods: an empirical study.” Journal of Artificial
Intelligence Research 11, 1999: 169-198.
Panigrahi, B. K., Y. Shi, e M.-H. Lim. Handbook of Swarm Intelligence: Concepts, Principles and
Applications. Springer, 2011.
144
Pétrowski, A. “A clearing procedure as a niching method for genetic algorithms.” Proc. of the
3rd IEEE International Conference on Evolutionary Computation, 1996: 798-803.
Poli, R., J. Kennedy, e T. Blackwell. “Particle swarm optimization: an overview.” Swarm

Intelligence, 2007: 33-57.
Pomeroy, S. L., et al. “Prediction of central nervous system embryonal tumour outcome based
on gene expression.” Nature 415(6870), 2002: 436-442.
Pontes, B., F. Divina, R. Giráldez, e J. Aguilar-Ruiz. “Virtual error: a new measure for
evolutionary biclustering.” Proc. of the 5th European conference on Evolutionary
computation, machine learning and data mining in bioinformatics, LNCS 4447, 2007:
217-226.
Pontes, B., R. Giráldez, e J. Aguilar-Ruiz. “Measuring the quality of shifting and scaling patterns
in biclusters.” Proc. of the 5th IAPR International Conference on Pattern Recognition in
Bioinformatics, LNBI 6282, 2010: 242-252.
Prelić, A. et al. “A systematic comparison and evaluation of biclustering methods for gene
expression data.” Bioinformatics 22(9), 2006: 1122-1129.
Qiu, P., A. J. Gentles, e S. K. Plevritis. “Fast calculation of pairwise mutual information for gene
regulatory network reconstruction.” Computer Methods and Programs in Biomedicine
94(2), 2009: 177-180.
Ramalho, A. P. P. Métodos de biclustering para a identificação de mecanismos de regulação

genética. Dissertação de Mestrado, Instituto Superior Técnico, Universidade Técnica
de Lisboa, 2006.
Ramaswamy, S., et al. “Multiclass cancer diagnosis using tumor gene expression signatures.”
Proc. of the National Academy of Sciences USA 98(26), 2001: 15149-15154.
Rezende, S. O. Sistemas Inteligentes: Fundamentos e Aplicações. Barueri: Manole, 2003.
Sareni, B., e L. Krahenbuhl. “Fitness sharing and niching methods revisited.” IEEE Transactions
on Evolutionary Computation 2(3), 1998: 97-106.
Sharan, R., U. B. Porat, e O. Bleiberg. Analysis of biological networks: network modules –

clustering and biclustering. Lecture 5. 23 de Novembro de 2006.
http://www.cs.tau.ac.il/~roded/courses/bnet-a06/lec05.pdf (acesso em 8 de
Novembro de 2011).
Sheskin, D. J. Handbook of Parametric and Nonparametric Statistical Procedures. Chapman &

Hall/CRC, 2000.
Souto, M. C. P. et al. “Técnicas de aprendizado de máquina para problemas de biologia

molecular.” Sociedade Brasileira de Computação. Anais da III Jornadas de Mini-Cursos
de Inteligência Artificial, 2003: 103-152.
145
Souza, M. J. F. Inteligência computacional para otimização. Notas de aula, Departamento de

Computação, Universidade Federal de Ouro Preto, 2008.
Steuer, R., J. Kurths, C. O. Daub, J. Weise, e J. Selbig. “The mutual information: detecting and
evaluating dependencies between variables.” Bioinformatics 18(2), 2002: 231-240.
Storn, R., e K. Price. “Differential evolution – a simple and efficient adaptive scheme for global
optimization over continuous spaces.” Technical Report TR-95-012, ICSI, 1995.
Strehl, A. Relationship-based clustering and cluster ensembles for high-dimensional data

mining. Tese de Doutorado, Universidade do Texas, 2002.
Strehl, A., e J. Ghosh. “Cluster ensembles – a knowledge reuse framework for combining
multiple partitions.” Journal of Machine Learning Research 3, 2002: 583-617.
Sumpter, D. Collective Animal Behavior. Princeton University Press, 2010.
Sunaga, D. Y. Aplicação de técnicas de validação estatística e biológica em agrupamento de

dados de expressão gênica. Dissertação de Mestrado, Centro de Ciências Exatas e
Tecnologia, Pontifícia Universidade Católica do Paraná, Curitiba, 2006.
Tanay, A., R. Sharan, e R. Shamir. “Biclustering Algorithms: A Survey.” In: Handbook of

Computational Molecular Biology, por S. Aluru. Chapman, 2004.
Veroneze, R. Tratamento de dados faltantes empregando biclusterização com imputação

múltipla. Dissertação de Mestrado, Faculdade de Engenharia Elétrica e de Computação
da Unicamp, Campinas, 2011.
Weise, T. Global Optimization Algorithms – Theory and Application. 26 de Junho de 2009.

http://www.it-weise.de/ (acesso em 8 de Novembro de 2011).
Wille, A., et al. “Sparse graphical gaussian modeling of the isoprenoid gene network in
Arabidopsis thaliana.” Genome Biology 5(11), 2004.
Wu, H. C. Evolutionary Computation. Department of Mathematics, National Kaohsiung Normal

University, Kaohsiung 802, Taiwan, Lecture notes. 2005.
http://nknucc.nknu.edu.tw/~hcwu/pdf/evolec.pdf (acesso em 25 de Janeiro de 2011).
Xie, B., S. Chen, e F. Liu. “Biclustering of gene expression data using PSO-GA hybrid.” The 1st
International Conference on Bioinformatics and Biomedical Engineering, 2007: 302-
305.
Yang, X. “Harmony search as a metaheuristic algorithm.” In: Music-Inspired Harmony Search

Algorithm – Theory and Applications, por Z.W. Geem, 1-14. Springer, 2009.
Yu, X., e M. Gen. Introduction to Evolutionary Algorithms. Springer, 2010.
Zaharie, D. “Extensions of differential evolution algorithms for multimodal optimization.” Proc.

of SYNASC'04, 6th International Symposium of Symbolic and Numeric Algorithms for
Scientific Computing, 2004: 523-534.
146
Zar, J. H. Biostatistical Analysis. New Jersey: Prentice Hall, Englewood Clifs, 1998.
Zhou, Z., J. Wu, e W. Tang. “Ensembling neural networks: many could be better than all.”
Artificial Intelligence 137, 2002: 239-263.
Zitzler, E., M. Laumanns, e S. Bleuler. “A tutorial on evolutionary multiobjective optimization.”

In: Metaheuristics for multiobjective optimisation, por X. Gandibleux, M. Sevaux, K.
Sörensen e V. T'kindt, 3-38. Springer, 2004.
Trabalhos científicos publicados pelo autor
Menezes, L., e A. L. V. Coelho. “On ensembles of biclusters generated by NichePSO.” Proc. of

IEEE Congress on Evolutionary Computation (CEC), 2011: 601-607.
—. “Mining coherent biclusters with fish school search.” Proc. of the International Conference
on Swarm Intelligence (ICSI), LNCS 6729, 2011: 573-582.
—. “Tackling the biclustering problem with cooperative coevolutionary algorithms.” Proc. of

the International Conference on Intelligent Systems Design and Applications (ISDA),
2010: 1189-1194.
147
148
Apêndice A – Ferramentas para o problema
de agrupamento bidimensional
Já existem algumas ferramentas computacionais disponíveis para aplicação das

técnicas de agrupamento bidimensional de dados (vide Figuras 61 a 64). Entre as quais:
BiVisu disponível em <http://www.eie.polyu.edu.hk/~nflaw/Biclustering/>, BiGGesTS
(Biclustering Gene Expression Time-Series), disponível em <http://kdbio.inesc-
id.pt/software/biggests/> (Gonçalves 2007), BicBox, disponível em
<http://sites.google.com/site/fabricioolivetti/toolboxes> e BicAT (Biclustering Analysis
Toolbox), disponível em <http://www.tik.ee.ethz.ch/sop/bicat/>.
BicAT é uma ferramenta implementada na linguagem Java para análise de

dados, a qual integra várias técnicas de clustering e biclustering. Além disso, provê
funções para preparação dos dados, inspeção e pós-processamento como discretização,
filtragem de biclusters de acordo com critérios específicos ou análises de pares de genes
para a construção de gráficos interligados (Barkow et al. 2006). A ferramenta pode ser
aplicada a outros domínios, além de análise de expressão gênica, e foi usada como base
para a implementação dos algoritmos bio-inspirados e dos comitês usados neste
trabalho.
149
150
Figura 61 - Ferramenta BiVisu.

Fonte: (Cheng et al. 2007.)
Figura 62 - Ferramenta BiGGEsTS.

Fonte: (Gonçalves 2007, p.86.)
151
Figura 63 - Ferramenta BicBox.

Fonte: (de França 2011).
Figura 64 - Ferramenta BicAT.

Fonte: (Barkow et al. 2006, p.1283).
152
Apêndice B – Variação dos parâmetros
As configurações de parâmetros que foram variadas para cada algoritmo são

mostradas neste apêndice. Estas configurações foram escolhidas com base nos seguintes
trabalhos: (Arantes et al. 2006) (de França 2010) (Hanczar e Nadif 2010) (Madeiro
2010) (Menezes e Coelho 2011a) (Menezes e Coelho 2011b) (Poli et al. 2007) (Storn e
Price 1995) (Veroneze 2011) (Xie et al. 2007) (Yang 2009).
Tabela 47: Parâmetros do algoritmo GA

Configuração Parâmetros
1 = 0,05, = 0,75, = 1, =5
2 = 0,05, = 0,75, = 1, = 10
3 = 0,1, = 0,75, = 1, =5
4 = 0,1, = 0,75, = 1, = 10
5 = 0,05, = 0,9, = 1, =5
6 = 0,05, = 0,9, = 1, = 10
7 = 0,1, = 0,9, = 1, =5
8 = 0,1, = 0,9, = 1, = 10
9 = 0,1, = 0,5, = 1, =5
10 = 0,1, = 0,5, = 1, = 10
Tabela 48: Parâmetros do algoritmo PSO

1 = = 1, = 0,5
2 = = 1, = 0,7
3 = = 1, =1
4 = = 1,5, = 0,5
5 = = 1,5, = 0,7
6 = = 1,5, =1
7 = = 2, = 0,5
8 = = 2, = 0,7
9 = = 2, = 0,9
10 = = 2, =1
153
154
Tabela 49: Parâmetros do algoritmo FSS

1 = 100, =1
2 = 10, =1
3 = 10, = 0,1
4 = 10, = 0,01
5 = 10, = 0,001
6 = 1, = 0,1
7 = 1, = 0,01
8 = 1, = 0,001
9 = 0,1, = 0,01
10 = 0,1, = 0,001
Tabela 50: Parâmetros do algoritmo DE

1 = 0,5, = 0,3
2 = 0,8, = 0,3
3 = 1, = 0,3
4 = 0,5, = 0,5
5 = 0,8, = 0,5
6 = 1, = 0,5
7 = 0,5, = 0,8
8 = 0,8, = 0,8
9 = 1, = 0,8
10 = 1, = 0,2
Tabela 51: Parâmetros do algoritmo HS

1 = 0,7, = 0,2
2 = 0,7, = 0,3
3 = 0,7, = 0,4
4 = 0,8, = 0,2
5 = 0,8, = 0,3
6 = 0,8, = 0,4
7 = 0,9, = 0,2
8 = 0,9, = 0,3
9 = 0,9, = 0,4
10 = 0,95, = 0,5
155
Tabela 52: Parâmetros do algoritmo FSGA

1 = 0,05, = 0,75, MF = 10, = = â , =1
2 = 0,05, = 0,75, MF = 10, = = â , = 0,5
3 = 0,05, = 0,75, MF = 10, = = â /2, = 1
4 = 0,05, = 0,75, MF = 10, = = â /2, = 0,5
5 = 0,1, = 0,9, MF = 10, = = â , =1
6 = 0,1, = 0,9, MF = 10, = = â , = 0,5
7 = 0,1, = 0,9, MF = 10, = = â /2, = 1
8 = 0,1, = 0,9, MF = 10, = = â /2, = 0,5
9 = 0,1, = 0,75, MF = 10, = = â /2, = 1
10 = 0,1, = 0,75, MF = 10, = = â /4, = 1
Tabela 53: Parâmetros do algoritmo CGA

1 = 0,05, = 0,75, MF = 10, = = â , = 10
2 = 0,05, = 0,75, MF = 10, = = â , = 20
3 = 0,05, = 0,75, MF = 10, = = â /2, = 10
4 = 0,05, = 0,75, MF = 10, = = â /2, = 20
5 = 0,1, = 0,9, MF = 10, = = â , = 10
6 = 0,1, = 0,9, MF = 10, = = â , = 20
7 = 0,1, = 0,9, MF = 10, = = â /2, = 10
8 = 0,1, = 0,9, MF = 10, = = â /2, = 20
9 = 0,1, = 0,75, MF = 10, = = â /2, = 10
10 = 0,1, = 0,75, MF = 10, = = â /4, = 10
Tabela 54: Parâmetros do algoritmo CDE

1 = 0,5, = 0,3
2 = 0,8, = 0,3
3 = 1, = 0,3
4 = 0,5, = 0,5
5 = 0,8, = 0,5
6 = 1, = 0,5
7 = 0,5, = 0,8
8 = 0,8, = 0,8
9 = 1, = 0,8
10 = 1, = 0,2
156
Tabela 55: Parâmetros do algoritmo NichePSO

1 = = 1,2, = 0,7, = 0,1, = 0,001, = 3
2 = = 1, = 0,7, = 0,1, = 0,001, = 3
3 = = 1,5, = 0,7, = 0,1, = 0,001, = 3
4 = = 2, = 0,7, = 0,1, = 0,001, = 3
5 = = 1, = 1, = 0,1, = 0,001, = 3
6 = = 1,2, = 0,7, = 1, = 0,01, = 3
7 = = 1, = 0,7, = 1, = 0,01, = 3
8 = = 1,5, = 0,7, = 1, = 0,01, = 3
9 = = 2, = 0,7, = 1, = 0,01, = 3
10 = = 1, = 1, = 1, = 0,01, = 3
Tabela 56: Parâmetros do algoritmo dFSS

1 = 0,05, = 0,999, = 0,99, = 0,95,
= 0,3
2 = 10, = 0,99, = 0,9, = 0,8, = 0,3
3 = 0,05, = 0,999, = 0,99, = 0,95,
= 0,5
4 = 10, = 0,99, = 0,9, = 0,8, = 0,5
5 = 10, = 0,999, = 0,99, = 0,95,
= 0,3
6 = 10, = 0,999, = 0,99, = 0,95,
= 0,5
7 = 10, = 0,99, = 0,95, = 0,7, = 0,3
8 = 10, = 0,99, = 0,9, = 0,6, = 0,3
9 = 10, = 0,9, = 0,8, = 0,7, = 0,3
10 = 10, = 0,99, = 0,9, = 0,7, = 0,3
Tabela 57: Parâmetros do algoritmo ABC

1 =3
2 =5
3 =7
4 = 10
5 = 15
6 = 20
7 = 25
8 = 30
9 = 40
10 = 45
157
Tabela 58: Parâmetros do algoritmo MHS

1 = 0,7, = 0,2, = â , = 10
2 = 0,7, = 0,2, = â /2, = 10
3 = 0,7, = 0,2, = â /4, = 10
4 = 0,8, = 0,2, = â , = 10
5 = 0,8, = 0,2, = â /2, = 10
6 = 0,8, = 0,2, = â /4, = 10
7 = 0,7, = 0,3, = â , = 10
8 = 0,7, = 0,3, = â /2, = 10
9 = 0,7, = 0,3, = â /4, = 10
10 = 0,8, = 0,3, = â /2, = 10
Tabela 59: Parâmetros do algoritmo BicACO

1 = ℎ /20, = 0,2, = 1, =3
2 = ℎ /20, = 0,2, = 3, =1
3 = ℎ /20, = 0,2, = 1, =1
4 = ℎ /20, = 0,5, = 1, =3
5 = ℎ /20, = 0,5, = 3, =1
6 = ℎ /20, = 0,5, = 1, =1
7 = ℎ /20, = 0,7, = 1, =3
8 = ℎ /20, = 0,7, = 3, =1
9 = ℎ /20, = 0,7, = 1, =1
10 = ℎ /20, = 0,9, = 1, =1
Tabela 60: Parâmetros do algoritmo GSO

1 = 5, = â , = 0,4, = 0,6, = 0,08, = 0,03, = 5
2 = 5, = â /2, = 0,4, = 0,6, = 0,08, = 0,03, = 5
3 = 5, = â , = 0,4, = 0,3, = 0,1, = 0,5, = 5
4 = 5, = â , = 0,7, = 0,6, = 0,08, = 0,03, = 5
5 = 5, = â , = 0,7, = 0,9, = 0,1, = 0,1, = 5
6 = 5, = â , = 0,4, = 0,9, = 0,1, = 0,1, = 5
7 = 5, = â /2, = 0,4, = 0,9, = 0,1, = 0,1, = 5
8 = 5, = â /2, = 0,4, = 0,3, = 0,1, = 0,5, = 5
9 = 5, = â /2, = 0,7, = 0,6, = 0,08, = 0,03, = 5
10 = 5, = â /2, = 0,7, = 0,9, = 0,1, = 0,1, = 5
Tabela 61: Parâmetros do algoritmo SwarmBcluster

1 = ∗ 0,4, = 0,6
2 = ∗ 0,6, = 0,6
3 = ∗ 0,8, = 0,6
4 = ∗ 0,4, = 0,8
5 = ∗ 0,6, = 0,8
6 = ∗ 0,8, = 0,8
7 = ∗ 0,4, = 0,95
8 = ∗ 0,6, = 0,95
9 = ∗ 0,8, = 0,95
10 = ∗ 0,4, = 0,5
158
Tabela 62: Parâmetros do algoritmo BIC-aiNet

1 = 10, = 10, = 20, = 0,5
2 = 10, = 20, = 20, = 0,5
3 = 10, = 10, = 30, = 0,5
4 = 10, = 20, = 30, = 0,5
5 = 20, = 20, = 20, = 0,5
6 = 20, = 30, = 20, = 0,5
7 = 20, = 20, = 30, = 0,5
8 = 20, = 30, = 30, = 0,5
9 = 10, = 10, = 20, = 0,2
10 = 10, = 10, = 20, = 0,7
Tabela 63: Parâmetros dos comitês

1 = 50, = 0,1, çã =
2 = 50, = 0,2, çã =
3 = 50, = 0,3, çã =
4 = 50, = 0,4, çã =
5 = 50, = 0,5, çã =
6 = 50, = 0,1, çã =
7 = 50, = 0,2, çã =
8 = 50, = 0,3, çã =
9 = 50, = 0,4, çã =
10 = 50, = 0,5, çã =
Apêndice C – Experimentos computacionais
As tabelas a seguir apresentam os resultados dos experimentos com algoritmos

unimodais, multimodais e comitês.
Tabela 64: Resultado dos algoritmos unimodais para Artificial_2

Artificial_2 DE 9 FSS 1 GA 7 HS 10 PSO 10
Tempo 3,647 ± 0,08 2,752 ± 0,164 3,409 ± 0,288 3,11 ± 0,081 3,676 ± 0,133
MSR (melhor) 23,335 ± 0,882 27,471 ± 0,67 19,381 ± 2,932 13,777 ± 0,662 9,99 ± 1,453
MSR (média) 24,778 ± 0,724 29,343 ± 0,284 19,381 ± 2,932 15,728 ± 0,701 12,312 ± 1,181
Volume 3.011 ± 407,74 3.903,75 ± 2.661,5 ± 1.679,8 ± 1.479,45 ±
(melhor) 569,994 646,944 236,057 218,509
Volume 3.231,548 ± 4.377,006 ± 2.661,5 ± 1.779,395 ± 1.660,398 ±
(média) 326,314 161,508 646,944 130,41 241,133
Cobertura 0,557 ± 0,067 0,995 ± 0,002 0,133 ± 0,032 0,523 ± 0,027 0,302 ± 0,029
elementos
Cobertura 0,679 ± 0,084 1±0 0,133 ± 0,032 0,739 ± 0,041 0,433 ± 0,044
linhas e
colunas
Sobreposição 0,649 ± 0,039 0,28 ± 0,01 1±0 0,431 ± 0,021 0,83 ± 0,022
Jaccard 0,675 ± 0,038 0,361 ± 0,008 1±0 0,469 ± 0,014 0,838 ± 0,015
Iteração 94,7 ± 5,939 28,55 ± 10,704 42,35 ± 5,47 4.662,5 ± 98,85 ± 1,309
416,803
Sucesso 0 0 0 0 0
VE 0,001 ± 0,23 0,002 ± 0,221 -0,031 ± 0,284 0,072 ± 0,25 0,037 ± 0,398
TVE 0,031 ± 0,427 -0,121 ± 0,291 0,105 ± 0,484 0,303 ± 0,739 -0,09 ± 0,877
MI 1,159 ± 0,055 1,269 ± 0,039 1,016 ± 0,098 0,809 ± 0,037 0,692 ± 0,07
LC 0,19 ± 0,009 0,164 ± 0,011 0,224 ± 0,031 0,237 ± 0,024 0,251 ± 0,02
RMS 0,294 ± 0,028 0,228 ± 0,027 0,386 ± 0,057 0,432 ± 0,044 0,521 ± 0,076
(bicluster)
RMS 0,278 ± 0,024 0,22 ± 0,009 0,386 ± 0,057 0,408 ± 0,032 0,483 ± 0,068
(população)
CMS 0,518 ± 0,057 0,489 ± 0,045 0,534 ± 0,069 0,495 ± 0,069 0,492 ± 0,083
(bicluster)
CMS 0,501 ± 0,037 0,412 ± 0,016 0,534 ± 0,069 0,483 ± 0,03 0,501 ± 0,081
(população)
MS (bicluster) 0,372 ± 0,033 0,319 ± 0,031 0,436 ± 0,047 0,45 ± 0,049 0,496 ± 0,081
MS 0,356 ± 0,022 0,289 ± 0,011 0,436 ± 0,047 0,432 ± 0,036 0,481 ± 0,078
(população)
159
160

Tempo 3,71 ± 0,094 2,895 ± 0,169 3,607 ± 0,235 3,243 ± 0,063 4,237 ± 0,156
MSR (melhor) 14,668 ± 0,645 18,05 ± 0,535 13,035 ± 1,205 9,045 ± 0,492 10,245 ± 0,904
MSR (média) 15,811 ± 0,452 19,772 ± 0,266 13,035 ± 1,205 10,482 ± 0,346 12,065 ± 0,652
Volume 2.857,5 ± 3.890,4 ± 2.672,85 ± 1.409,15 ± 2.056,75 ±
(melhor) 469,996 641,391 516,881 252,059 381,089
Volume 3.192,839 ± 4.482,881 ± 2.672,85 ± 1.687,236 ± 2.443,433 ±
(média) 381,441 165,769 516,881 131,031 362,751
Cobertura 0,575 ± 0,058 0,994 ± 0,003 0,134 ± 0,026 0,518 ± 0,024 0,537 ± 0,039
elementos
Cobertura 0,705 ± 0,071 1±0 0,134 ± 0,026 0,712 ± 0,034 0,756 ± 0,037
linhas e
colunas
Sobreposição 0,633 ± 0,045 0,287 ± 0,01 1±0 0,421 ± 0,017 0,708 ± 0,029
Jaccard 0,662 ± 0,035 0,367 ± 0,008 1±0 0,471 ± 0,013 0,737 ± 0,026
Iteração 95,1 ± 4,459 33,3 ± 12,355 42,45 ± 4,174 4.647,2 ± 98,1 ± 2,426
227,9
Sucesso 0 0 0 0 0
VE 0,027 ± 0,083 -0,035 ± 0,115 0,012 ± 0,085 0,016 ± 0,076 0,023 ± 0,072
TVE -0,003 ± 0,047 -0,012 ± 0,048 0,001 ± 0,033 -0,001 ± 0,046 -0,007 ± 0,038
MI 0,961 ± 0,039 1,08 ± 0,043 0,901 ± 0,053 0,731 ± 0,034 0,784 ± 0,048
LC 0,155 ± 0,014 0,135 ± 0,012 0,158 ± 0,014 0,228 ± 0,036 0,188 ± 0,026
RMS 0,25 ± 0,024 0,23 ± 0,019 0,277 ± 0,033 0,286 ± 0,026 0,288 ± 0,029
(bicluster)
RMS 0,241 ± 0,017 0,221 ± 0,006 0,277 ± 0,033 0,277 ± 0,016 0,281 ± 0,023
(população)
CMS 0,432 ± 0,062 0,402 ± 0,045 0,419 ± 0,037 0,32 ± 0,042 0,386 ± 0,05
(bicluster)
CMS 0,428 ± 0,034 0,395 ± 0,009 0,419 ± 0,037 0,344 ± 0,017 0,399 ± 0,038
(população)
MS (bicluster) 0,306 ± 0,033 0,282 ± 0,021 0,323 ± 0,027 0,293 ± 0,028 0,313 ± 0,031
MS 0,298 ± 0,019 0,273 ± 0,006 0,323 ± 0,027 0,294 ± 0,015 0,313 ± 0,023
(população)
161

Tempo 3,593 ± 0,078 2,867 ± 0,261 3,353 ± 0,162 3,532 ± 0,059 3,774 ± 0,154
MSR (melhor) 21,038 ± 0,825 24,615 ± 0,489 18,039 ± 1,258 20,925 ± 0,931 9,781 ± 1,568
MSR (média) 22,454 ± 0,609 26,469 ± 0,251 18,039 ± 1,258 22,429 ± 0,479 12,922 ± 1,113
Volume 2.778,85 ± 3.580,55 ± 2.329,55 ± 2.568,9 ± 1.134,25 ±
(melhor) 320,698 449,968 345,857 415,177 321,067
Volume 3.064,168 ± 4.362,763 ± 2.329,55 ± 2.906,635 ± 1.412,649 ±
(média) 303,561 149,932 345,857 166,186 271,596
Cobertura 0,646 ± 0,062 0,994 ± 0,003 0,116 ± 0,017 0,917 ± 0,019 0,354 ± 0,033
elementos
Cobertura 0,785 ± 0,059 1±0 0,116 ± 0,017 0,99 ± 0,01 0,524 ± 0,044
linhas e
colunas
Sobreposição 0,538 ± 0,043 0,284 ± 0,011 1±0 0,293 ± 0,011 0,746 ± 0,032
Jaccard 0,58 ± 0,034 0,364 ± 0,01 1±0 0,373 ± 0,008 0,781 ± 0,021
Iteração 91,7 ± 10,245 33,35 ± 12,106 44,45 ± 4,466 4.540,3 ± 98,95 ± 1,356
273,464
Sucesso 0 0 0 0 0
VE -0,099 ± 0,665 -0,072 ± 0,733 0,055 ± 0,598 0,108 ± 0,4 -0,13 ± 0,585
TVE 0,112 ± 0,383 -0,047 ± 0,284 -0,013 ± 0,356 -0,174 ± 0,352 -0,029 ± 0,688
MI 1,122 ± 0,032 1,186 ± 0,028 1,049 ± 0,053 1,13 ± 0,051 0,808 ± 0,05
LC 0,199 ± 0,018 0,177 ± 0,01 0,215 ± 0,021 0,214 ± 0,015 0,298 ± 0,036
RMS 0,216 ± 0,024 0,201 ± 0,028 0,232 ± 0,04 0,212 ± 0,023 0,268 ± 0,038
(bicluster)
RMS 0,201 ± 0,015 0,196 ± 0,005 0,232 ± 0,04 0,203 ± 0,006 0,254 ± 0,03
(população)
CMS 0,427 ± 0,045 0,397 ± 0,036 0,421 ± 0,059 0,386 ± 0,059 0,291 ± 0,082
(bicluster)
CMS 0,42 ± 0,029 0,389 ± 0,01 0,421 ± 0,059 0,396 ± 0,012 0,324 ± 0,061
(população)
MS (bicluster) 0,271 ± 0,026 0,258 ± 0,022 0,289 ± 0,041 0,26 ± 0,025 0,273 ± 0,045
MS 0,263 ± 0,019 0,252 ± 0,006 0,289 ± 0,041 0,257 ± 0,007 0,272 ± 0,035
(população)
162
Tabela 67: Resultado dos algoritmos unimodais para Arabidopsis

Arabidopsis DE 6 FSS 2 GA 7 HS 8 PSO 8
Tempo 13,737 ± 1,403 11,502 ± 1,307 23,432 ± 3,539 14,262 ± 1,478 16,069 ± 1,472
MSR (melhor) 676,725 ± 676,52 ± 663,377 ± 659,19 ± 678,604 ±
22,22 16,356 17,962 30,187 23,553
MSR (média) 798,287 ± 923,051 ± 663,377 ± 739,903 ± 2.242,937 ±
53,419 72,076 17,962 42,265 205,698
Volume 12.620,2 ± 12.301,45 ± 18.295 ± 12.189,5 ± 11.599,05 ±
(melhor) 1.069,586 1.140,092 2.106,363 1.244,487 1.160,492
Volume 11.004,937 ± 11.498,957 ± 18.295 ± 10.762,922 ± 12.128,845 ±
(média) 493,488 570,166 2.106,363 528,028 491,535
Cobertura 0,989 ± 0,008 0,982 ± 0,011 0,361 ± 0,042 0,98 ± 0,009 0,998 ± 0,001
elementos
Cobertura 0,998 ± 0,005 0,998 ± 0,007 0,361 ± 0,042 0,995 ± 0,007 1±0
linhas e
colunas
Sobreposição 0,267 ± 0,013 0,319 ± 0,019 1±0 0,268 ± 0,011 0,322 ± 0,013
Jaccard 0,354 ± 0,007 0,4 ± 0,011 1±0 0,356 ± 0,005 0,401 ± 0,009
Iteração 89,45 ± 9,35 28,4 ± 11,587 55,7 ± 4,725 4.092,55 ± 58 ± 28,459
698,871
Sucesso 100 100 100 100 100
VE 0,063 ± 0,105 -0,009 ± 0,1 -0,003 ± 0,074 0,014 ± 0,117 0,005 ± 0,13
TVE -0,01 ± 0,033 -0,001 ± 0,039 0,006 ± 0,041 0,004 ± 0,034 -0,009 ± 0,038
MI 1,279 ± 0,043 1,307 ± 0,04 1,274 ± 0,043 1,31 ± 0,047 1,317 ± 0,06
LC 0,125 ± 0,007 0,126 ± 0,007 0,109 ± 0,007 0,128 ± 0,008 0,132 ± 0,01
Tabela 68: Resultado dos algoritmos unimodais para Brain_1

Brain_1 DE 6 FSS 2 GA 7 HS 10 PSO 5
Tempo 26,182 ± 0,535 23,586 ± 1,008 49,588 ± 1,087 30,402 ± 0,449 29,9 ± 0,517
MSR (melhor) 8.398,669 ± 8.652,341 ± 8.540,78 ± 8.548,827 ± 8.592,299 ±
396,805 243,92 230,862 449,34 375,735
MSR (média) 8.390,385 ± 10.366,837 ± 8.540,78 ± 8.433,746 ± 17.177,058 ±
120,979 720,791 230,862 100,879 583,888
Volume 20.529,55 ± 17.199,5 ± 26.129,25 ± 33.631,75 ± 15.970,7 ±
(melhor) 1.580,855 2.288,661 2.260,835 796,743 2.010,253
Volume 16.479,749 ± 15.396,729 ± 26.129,25 ± 31.737,775 ± 16.640,758 ±
(média) 1.170,917 1.071,318 2.260,835 723,616 867,69
Cobertura 0,912 ± 0,021 0,937 ± 0,029 0,38 ± 0,033 0,962 ± 0,014 0,999 ± 0
elementos
Cobertura 0,953 ± 0,021 0,973 ± 0,023 0,38 ± 0,033 0,98 ± 0,019 1±0
linhas e
colunas
Sobreposição 0,38 ± 0,025 0,363 ± 0,042 1±0 0,617 ± 0,009 0,307 ± 0,013
Jaccard 0,398 ± 0,01 0,418 ± 0,025 1±0 0,51 ± 0,006 0,387 ± 0,005
Iteração 93,85 ± 5,641 24,15 ± 9,427 66,8 ± 5,156 4.754,2 ± 61,05 ± 20,811
215,917
Sucesso 100 100 100 100 100
VE 0,064 ± 0,615 0,132 ± 0,604 -0,154 ± 0,602 0,004 ± 0,66 0,076 ± 0,443
TVE 0,089 ± 0,521 -0,063 ± 0,491 -0,081 ± 0,459 -0,038 ± 0,481 0,195 ± 0,387
MI 2,448 ± 0,058 2,373 ± 0,066 2,504 ± 0,046 2,67 ± 0,031 2,316 ± 0,077
LC 0,269 ± 0,015 0,285 ± 0,016 0,272 ± 0,012 0,26 ± 0,005 0,283 ± 0,024
163
Tabela 69: Resultado dos algoritmos unimodais para Brain_2

Brain_2 DE 5 FSS 5 GA 1 HS 10 PSO 9
Tempo 24,609 ± 0,422 22,395 ± 0,573 42,973 ± 1,08 26,681 ± 0,335 28,992 ± 0,509
MSR (melhor) 265.399,169 ± 276.723,625 ± 272.803,439 ± 271.283,594 ± 277.599,863 ±
22.658,31 16.094,312 11.414,341 13.962,268 9.457,411
MSR (média) 349.122,447 ± 370.269,431 ± 272.803,439 ± 266.298,715 ± 442.571,23 ±
34.712,448 22.809,42 11.414,341 2.799,474 13.087,074
Volume 12.734,05 ± 13.267,15 ± 18.631,6 ± 26.395,3 ± 16.966,9 ±
(melhor) 1.912,284 1.829,25 2.114,102 1.144,639 1.600,059
Volume 11.445,429 ± 11.704,648 ± 18.631,6 ± 24.601,761 ± 15.718,867 ±
(média) 704,207 991,479 2.114,102 1.013,171 1.078,612
Cobertura 0,946 ± 0,032 0,946 ± 0,029 0,322 ± 0,037 0,961 ± 0,018 0,952 ± 0,008
elementos
Cobertura 0,982 ± 0,024 0,987 ± 0,018 0,322 ± 0,037 0,98 ± 0,016 1±0
linhas e
colunas
Sobreposição 0,3 ± 0,019 0,336 ± 0,028 1±0 0,598 ± 0,012 0,517 ± 0,015
Jaccard 0,368 ± 0,01 0,408 ± 0,016 1±0 0,496 ± 0,006 0,545 ± 0,009
Iteração 88,8 ± 12,237 31,15 ± 13,244 60,6 ± 5,266 4.615,85 ± 70,3 ± 16,206
306,086
Sucesso 100 100 100 100 100
VE -0,117 ± 0,614 0,082 ± 0,488 0,075 ± 0,582 -0,126 ± 0,604 -0,132 ± 0,46
TVE -0,04 ± 0,311 0,008 ± 0,333 -0,06 ± 0,402 0,166 ± 0,398 0,009 ± 0,463
MI 0,79 ± 0,038 0,796 ± 0,054 0,827 ± 0,04 0,914 ± 0,016 0,836 ± 0,039
LC 0,209 ± 0,016 0,205 ± 0,012 0,184 ± 0,008 0,16 ± 0,003 0,185 ± 0,009
Tabela 70: Resultado dos algoritmos unimodais para Breast_Colon

Breast, Colon DE 6 FSS 3 GA 7 HS 7 PSO 5
Tempo 3,817 ± 0,05 2,814 ± 0,179 5,752 ± 0,265 3,821 ± 0,045 4,489 ± 0,088
MSR (melhor) 20.611,769 ± 20.969,994 ± 20.843,632 ± 20.795,938 ± 20.296,997 ±
1.145,384 1.435,321 523,957 776,931 1.442,305
MSR (média) 21.316,774 ± 38.489,57 ± 20.843,632 ± 23.333,606 ± 121.928,109 ±
1.184,404 3.889,442 523,957 1.900,142 10.528,479
Volume 5.834,35 ± 4.647,25 ± 7.861,75 ± 4.969,65 ± 4.911,7 ±
(melhor) 361,245 594,838 723,121 538,239 612,616
Volume 4.670,891 ± 4.560,376 ± 7.861,75 ± 4.312,14 ± 4.799,447 ±
(média) 229,872 174,335 723,121 164,911 187,154
Cobertura 0,929 ± 0,003 0,978 ± 0,007 0,415 ± 0,038 0,934 ± 0,003 0,999 ± 0,001
elementos
Cobertura 0,938 ± 0,003 0,991 ± 0,007 0,415 ± 0,038 0,939 ± 0,004 1±0
linhas e
colunas
Sobreposição 0,334 ± 0,022 0,307 ± 0,016 1±0 0,276 ± 0,009 0,315 ± 0,011
Jaccard 0,404 ± 0,019 0,383 ± 0,013 1±0 0,356 ± 0,008 0,391 ± 0,009
Iteração 95,05 ± 4,85 27,4 ± 12,024 39,5 ± 5,463 4.001,6 ± 66,55 ± 23,141
886,219
Sucesso 100 95 100 100 100
VE 0,025 ± 0,406 0,001 ± 0,406 -0,214 ± 0,572 0,02 ± 0,412 0,037 ± 0,488
TVE -0,138 ± 0,562 -0,113 ± 0,495 0,023 ± 0,596 -0,152 ± 0,69 0,256 ± 0,502
MI 1,742 ± 0,091 1,742 ± 0,123 1,807 ± 0,074 1,76 ± 0,083 1,742 ± 0,108
LC 0,25 ± 0,016 0,26 ± 0,014 0,241 ± 0,011 0,251 ± 0,016 0,258 ± 0,015
164
Tabela 71: Resultado dos algoritmos unimodais para Lung

Lung DE 5 FSS 2 GA 7 HS 6 PSO 7
Tempo 62,843 ± 0,559 41,226 ± 4,535 111,387 ± 61,39 ± 0,637 64,882 ± 0,909
3,519
MSR (melhor) 33.461,205 ± 34.361,734 ± 32.604,1 ± 34.823,281 ± 34.288,232 ±
1.542,941 1.558,431 1.765,149 950,683 1.188,294
MSR (média) 35.385,249 ± 39.431,348 ± 32.604,1 ± 36.600,367 ± 62.193,272 ±
1.669,991 2.414,814 1.765,149 1.309,792 1.407,235
Volume 91.330,75 ± 89.355,35 ± 131.180,15 ± 88.010,05 ± 82.594,95 ±
(melhor) 3.003,247 4.622,373 9.701,631 3.239,345 6.299,533
Volume 80.230,449 ± 79.922,953 ± 131.180,15 ± 77.078,317 ± 79.128,893 ±
(média) 2.157,708 2.526,253 9.701,631 1.286,962 1.792,944
Cobertura 0,995 ± 0,001 0,977 ± 0,013 0,419 ± 0,031 0,996 ± 0,001 1±0
elementos
Cobertura 0,997 ± 0,001 0,995 ± 0,007 0,419 ± 0,031 0,998 ± 0,001 1±0
linhas e
colunas
Sobreposição 0,303 ± 0,015 0,372 ± 0,026 1±0 0,266 ± 0,004 0,294 ± 0,007
Jaccard 0,375 ± 0,011 0,434 ± 0,021 1±0 0,348 ± 0,003 0,369 ± 0,004
Iteração 87,75 ± 9,84 28,45 ± 14,226 67,8 ± 7,878 3.655,45 ± 49,55 ± 29,86
961,582
Sucesso 100 100 100 100 100
VE 0,127 ± 0,528 0,121 ± 0,726 0,166 ± 0,648 0,03 ± 0,437 -0,11 ± 0,437
TVE -0,163 ± 1,822 0,287 ± 1,416 0,678 ± 2,208 -0,01 ± 2,133 0,178 ± 1,905
MI 2,526 ± 0,045 2,553 ± 0,047 2,517 ± 0,043 2,517 ± 0,064 2,541 ± 0,045
LC 0,172 ± 0,008 0,175 ± 0,01 0,167 ± 0,007 0,169 ± 0,006 0,173 ± 0,007
Tabela 72: Resultado dos algoritmos unimodais para Multitissue

Multitissue DE 5 FSS 5 GA 7 HS 6 PSO 5
Tempo 51,298 ± 0,739 33,216 ± 3,979 86,762 ± 2,592 49,825 ± 0,758 53,517 ± 0,74
MSR (melhor) 159.396,002 ± 161.665,279 ± 157.796,592 ± 163.058,982 ± 160.884,516 ±
9.243,32 5.449,31 8.292,751 5.437,417 7.418,917
MSR (média) 169.317,525 ± 189.904,202 ± 157.796,592 ± 175.091,5 ± 302.790,913 ±
7.615,296 16.845,597 8.292,751 7.542,795 7.545,789
Volume 72.758,95 ± 69.009,45 ± 100.722,45 ± 67.442,85 ± 66.195,45 ±
(melhor) 3.720,3 3.088,929 6.281,8 2.819,069 3.551,153
Volume 63.839,395 ± 62.555,63 ± 100.722,45 ± 61.139,57 ± 65.390,033 ±
(média) 2.267,822 2.112,515 6.281,8 1.080,149 1.360,276
Cobertura 0,979 ± 0,004 0,968 ± 0,017 0,389 ± 0,024 0,983 ± 0,003 0,999 ± 0
elementos
Cobertura 0,987 ± 0,004 0,99 ± 0,007 0,389 ± 0,024 0,989 ± 0,003 1±0
linhas e
colunas
Sobreposição 0,308 ± 0,019 0,352 ± 0,028 1±0 0,268 ± 0,004 0,315 ± 0,006
Jaccard 0,377 ± 0,013 0,418 ± 0,022 1±0 0,347 ± 0,003 0,389 ± 0,004
Iteração 88,4 ± 13,504 27 ± 11,248 65,3 ± 7,63 3.615,9 ± 62,5 ± 24,492
970,466
Sucesso 100 100 100 100 100
VE 0,182 ± 0,517 0,041 ± 0,4 -0,2 ± 0,884 0,168 ± 0,598 0,137 ± 0,664
TVE 0,087 ± 0,412 -0,051 ± 0,295 -0,015 ± 0,413 0,035 ± 0,334 0,06 ± 0,26
MI 0,724 ± 0,026 0,729 ± 0,035 0,749 ± 0,023 0,724 ± 0,024 0,732 ± 0,029
LC 0,14 ± 0,019 0,139 ± 0,01 0,135 ± 0,014 0,139 ± 0,014 0,136 ± 0,012
165
Tabela 73: Resultado dos algoritmos unimodais para Yeast

Yeast DE 2 FSS 5 GA 8 HS 2 PSO 4
Tempo 60,585 ± 1,208 71,07 ± 6,07 139,693 ± 64,391 ± 1,515 75,747 ± 5,146
1,566
MSR (melhor) 205,45 ± 234,153 ± 261,614 ± 255,931 ± 255,111 ±
95,555 31,084 22,232 32,943 30,21
MSR (média) 528,284 ± 388,999 ± 261,614 ± 409,536 ± 935,434 ±
35,42 88,408 22,232 54,672 24,139
Volume 2.685,15 ± 2.975,3 ± 3.212,2 ± 2.946,1 ± 2.954 ± 41,564
(melhor) 529,682 55,594 82,441 55,092
Volume 5.976,525 ± 4.229,898 ± 3.212,2 ± 4.225,092 ± 9.656,801 ±
(média) 580,813 891,703 82,441 534,631 332,568
Cobertura 0,805 ± 0,037 0,715 ± 0,084 0,066 ± 0,002 0,748 ± 0,043 1±0
elementos
Cobertura 0,835 ± 0,049 0,83 ± 0,08 0,066 ± 0,002 0,8 ± 0,055 1±0
linhas e
colunas
Sobreposição 0,182 ± 0,02 0,224 ± 0,058 1±0 0,14 ± 0,018 0,218 ± 0,008
Jaccard 0,336 ± 0,002 0,444 ± 0,029 1±0 0,338 ± 0,001 0,362 ± 0,003
Iteração 60,35 ± 27,364 27 ± 12,917 45,55 ± 5,453 3.666,25 ± 51,65 ± 31,612
1.152,078
Sucesso 100 100 100 100 100
VE 0,02 ± 0,074 0,028 ± 0,101 -0,018 ± 0,112 0,013 ± 0,084 0,005 ± 0,074
TVE -19,845 ± 33,858 ± -0,873 ± -13,463 ± -0,325 ± 2,064
97,719 94,466 15,713 37,983
MI 0,338 ± 0,151 0,393 ± 0,043 0,422 ± 0,028 0,401 ± 0,043 0,414 ± 0,034
LC 0,489 ± 0,219 0,568 ± 0,062 0,609 ± 0,041 0,579 ± 0,062 0,598 ± 0,049
166
Tabela 74: Resultado dos algoritmos multimodais para Artificial_2

Artificial_2 ABC 6 BICACO 4 BIC-aiNet 9 CDE 6 dFSS 2 CGA 6 FSGA 10 GSO 6 MHS 10 NichePSO 5 SwarmBclust
er 1
Tempo 7,438 ± 0,036 66,606 ± 0,379 ± 0,023 7,166 ± 0,042 9,724 ± 0,174 12,52 ± 0,217 13,484 ± 5,068 ± 0,077 21,485 ± 7,687 ± 0,046 1,167 ± 0,025
0,117 0,212 0,042
MSR 28,147 ± 12,846 ± 1 0,906 ± 0,012 25,193 ± 27,76 ± 0,577 22,824 ± 26,93 ± 0,666 29,535 ± 28,675 ± 24,651 ± 0,1 ± 0,127
(melhor) 0,478 0,766 1,292 0,218 0,376 0,494
MSR (média) 30,187 ± 17,73 ± 0,329 0,5 ± 0,066 27,183 ± 0,42 30,315 ± 22,826 ± 28,795 ± 32,157 ± 29,619 ± 0,22 27,015 ± 0,098 ± 0,005
0,171 0,278 1,295 0,702 0,083 0,145
Volume 3.845,1 ± 984,3 ± 9,68 385,85 ± 3.306,1 ± 3.817,5 ± 3.138,25 ± 3.968,2 ± 4.516,9 ± 4.004,05 ± 3.892,8 ± 94,1 ± 8,246
(melhor) 400,015 206,28 452,979 422,561 498,794 511,933 596,947 477,914 392,682
Volume 4.558,962 ± 984,527 ± 63,655 ± 3.672,839 ± 4.609,908 ± 3.141,9 ± 4.465,179 ± 5.003,55 ± 4.367,991 ± 4.644,328 ± 98,652 ± 1,09
(média) 99,441 1,464 8,605 236,111 262,339 499,528 526,13 90,906 136,301 136,884
Cobertura 1±0 0,552 ± 0,012 0,102 ± 0,013 0,951 ± 0,018 0,986 ± 0,006 0,157 ± 0,025 0,365 ± 0,038 1±0 0,999 ± 0,001 0,983 ± 0,004 0,238 ± 0,004
elementos
Cobertura 1±0 0,84 ± 0,023 0,893 ± 0,091 0,993 ± 0,007 1 ± 0,002 0,157 ± 0,025 0,367 ± 0,04 1±0 1±0 1 ± 0,002 0,334 ± 0,01
linhas e
colunas
Sobreposição 0,244 ± 0,005 0,19 ± 0,005 0,001 ± 0,001 0,303 ± 0,014 0,296 ± 0,015 1±0 0,788 ± 0,017 0,25 ± 0,005 0,249 ± 0,008 0,325 ± 0,009 0,002 ± 0,001
Jaccard 0,329 ± 0,005 0,285 ± 0,004 0,091 ± 0,035 0,381 ± 0,012 0,372 ± 0,013 1±0 0,8 ± 0,009 0,334 ± 0,004 0,335 ± 0,006 0,397 ± 0,006 0,638 ± 0,014
Iteração 84,7 ± 13,7 4,8 ± 0,523 94,05 ± 5,491 91,4 ± 8,262 70,9 ± 20,175 46,65 ± 4,416 57,8 ± 23,79 43,95 ± 3.652,65 ± 97 ± 2,492 -
27,424 1.185,31
Qtd. - 0±0 0±0 32,6 ± 2,741 0±0 0±0 0±0 0±0 0±0 0±0 0±0 50 ± 0
biclusters
Sucesso 0 0 100 0 0 0 0 0 0 0 100
VE -0,028 ± -0,012 ± 0,24 0,117 ± 0,887 0,007 ± 0,199 0,011 ± 0,3 0,009 ± 0,278 -0,012 ± -0,004 ± 0,02 ± 0,176 -0,034 ± 0,14 ± 0,408
0,288 0,288 0,231 0,274
TVE 0,064 ± 0,254 -0,121 ± -0,544 ± 0,024 ± 0,473 -0,056 ± -0,089 ± 0,034 ± 0,334 0,051 ± 0,279 0,055 ± 0,312 0,097 ± 0,346 0,005 ± 0,046
0,464 0,773 0,305 0,303
MI 1,312 ± 0,044 0,824 ± 0,064 0,461 ± 0,133 1,213 ± 0,033 1,298 ± 0,032 1,131 ± 0,064 1,25 ± 0,049 1,303 ± 0,043 1,303 ± 0,035 1,171 ± 0,042 0,5 ± 0,631
LC 0,165 ± 0,009 0,289 ± 0,032 0,588 ± 0,204 0,182 ± 0,012 0,166 ± 0,009 0,197 ± 0,015 0,168 ± 0,01 0,149 ± 0,007 0,157 ± 0,008 0,18 ± 0,008 0,391 ± 0,492
RMS 0±0 0±0 0,075 ± 0,028 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,021 ± 0,001
(biclusters)
RMS 0,208 ± 0,003 0,363 ± 0,009 0,075 ± 0,028 0,248 ± 0,013 0,205 ± 0,009 0,324 ± 0,029 0,232 ± 0,025 0,178 ± 0,003 0,214 ± 0,006 0,258 ± 0,006 0,021 ± 0,001
(população)
CMS 0±0 0±0 0,186 ± 0,056 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,537 ± 0,006
(biclusters)
CMS 0,39 ± 0,007 0,35 ± 0,007 0,186 ± 0,056 0,462 ± 0,018 0,391 ± 0,017 0,529 ± 0,072 0,433 ± 0,056 0,332 ± 0,004 0,408 ± 0,012 0,511 ± 0,012 0,537 ± 0,006
(população)
MS 0±0 0±0 0,153 ± 0,025 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,359 ± 0,003
(biclusters)
MS 0,273 ± 0,004 0,353 ± 0,005 0,153 ± 0,025 0,322 ± 0,011 0,271 ± 0,01 0,399 ± 0,036 0,305 ± 0,024 0,233 ± 0,003 0,283 ± 0,008 0,344 ± 0,007 0,359 ± 0,003
(população)
167

er 1
Tempo 7,529 ± 0,045 66,447 ± 0,362 ± 0,025 7,219 ± 0,048 9,905 ± 0,11 13,101 ± 13,045 ± 5,384 ± 0,078 21,445 ± 0,27 7,816 ± 0,057 0,942 ± 0,021
0,326 0,161 0,177
MSR 18,61 ± 0,42 7,86 ± 0,348 0,909 ± 0,015 16,021 ± 18,179 ± 16,214 ± 16,245 ± 19,962 ± 19,097 ± 15,96 ± 0,283 1,805 ± 3,535
(melhor) 0,721 0,466 0,988 1,398 0,304 0,243
MSR (média) 20,459 ± 10,042 ± 0,545 ± 0,072 17,684 ± 20,783 ± 16,215 ± 17,581 ± 22,791 ± 19,993 ± 17,658 ± 1,873 ± 0,413
0,187 0,119 0,455 0,198 0,988 1,416 0,096 0,164 0,111
Volume 4.073,7 ± 980,05 ± 557,85 ± 3.373,7 ± 3.896,5 ± 3.735,3 ± 3.731,9 ± 4.548,15 ± 4.225,5 ± 3.927,15 ± 91,7 ± 6,752
(melhor) 545,485 11,772 220,362 388,348 580,641 461,905 707,79 683,661 558,412 448,707
Volume 4.577,598 ± 985,495 ± 1,4 81,998 ± 3.766,956 ± 4.725,915 ± 3.746,35 ± 4.123,561 ± 4.979,357 ± 4.465,382 ± 4.788,067 ± 92,21 ± 1,199
(média) 138,051 17,744 224,598 170,459 469,309 571,198 78,469 145,84 121,629
Cobertura 1±0 0,419 ± 0,008 0,112 ± 0,022 0,94 ± 0,021 0,999 ± 0 0,187 ± 0,023 0,51 ± 0,072 1±0 0,999 ± 0,001 0,967 ± 0,009 0,216 ± 0,004
elementos
Cobertura 1±0 0,558 ± 0,023 0,882 ± 0,104 0,989 ± 0,009 1±0 0,187 ± 0,023 0,525 ± 0,072 1±0 1±0 0,994 ± 0,009 0,416 ± 0,012
linhas e
colunas
Sobreposição 0,247 ± 0,006 0,245 ± 0,005 0,003 ± 0,001 0,313 ± 0,018 0,268 ± 0,009 1±0 0,628 ± 0,03 0,249 ± 0,004 0,256 ± 0,008 0,334 ± 0,006 0,003 ± 0,001
Jaccard 0,331 ± 0,006 0,313 ± 0,004 0,074 ± 0,027 0,387 ± 0,015 0,349 ± 0,007 1±0 0,652 ± 0,023 0,332 ± 0,003 0,339 ± 0,006 0,405 ± 0,005 0,37 ± 0,006
Iteração 85,95 ± 11,98 4,4 ± 0,995 95,8 ± 2,764 92,55 ± 8,624 85,8 ± 13,431 49,6 ± 6,202 97,65 ± 4,258 39,65 ± 3.389,9 ± 96 ± 3,613 -
28,359 1.242,29
Qtd. - 0±0 0±0 27,95 ± 2,46 0±0 0±0 0±0 0±0 0±0 0±0 0±0 39,4 ± 2,798
biclusters
Sucesso 0 0 100 0 0 0 0 0 0 0 100
VE -0,005 ± 0,006 ± 0,058 0,027 ± 0,073 0,003 ± 0,082 0,023 ± 0,101 0,037 ± 0,109 -0,004 ± -0,001 ± -0,01 ± 0,127 -0,01 ± 0,095 0,012 ± 0,05
0,125 0,086 0,122
TVE -0,004 ± -0,011 ± 0,011 ± 0,034 -0,004 ± -0,001 ± 0,019 ± 0,053 0,001 ± 0,024 0,005 ± 0,045 0,004 ± 0,029 -0,004 ± 0,002 ± 0,017
0,038 0,041 0,037 0,047 0,035
MI 1,08 ± 0,026 0,691 ± 0,039 0,232 ± 0,072 1,009 ± 0,027 1,084 ± 0,033 1,001 ± 0,041 0,998 ± 0,047 1,119 ± 0,046 1,098 ± 0,041 0,987 ± 0,026 0,629 ± 0,399
LC 0,13 ± 0,008 0,205 ± 0,012 0,246 ± 0,126 0,142 ± 0,008 0,134 ± 0,01 0,135 ± 0,008 0,137 ± 0,012 0,124 ± 0,009 0,128 ± 0,011 0,139 ± 0,008 0,7 ± 0,415
RMS 0±0 0±0 0,11 ± 0,02 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,039 ± 0,001
(biclusters)
RMS 0,217 ± 0,003 0,247 ± 0,006 0,11 ± 0,02 0,23 ± 0,006 0,217 ± 0,004 0,248 ± 0,032 0,236 ± 0,016 0,204 ± 0,003 0,219 ± 0,003 0,24 ± 0,005 0,042 ± 0,001
(população)
CMS 0±0 0±0 0,19 ± 0,052 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,589 ± 0,008
(biclusters)
CMS 0,38 ± 0,006 0,357 ± 0,006 0,19 ± 0,052 0,413 ± 0,012 0,381 ± 0,011 0,433 ± 0,043 0,432 ± 0,027 0,338 ± 0,005 0,391 ± 0,007 0,446 ± 0,008 0,596 ± 0,007
(população)
MS 0±0 0±0 0,166 ± 0,026 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,367 ± 0,004
(biclusters)
MS 0,266 ± 0,003 0,272 ± 0,004 0,166 ± 0,026 0,284 ± 0,007 0,265 ± 0,005 0,311 ± 0,031 0,296 ± 0,016 0,241 ± 0,003 0,271 ± 0,004 0,302 ± 0,006 0,367 ± 0,003
(população)
168

er 1
Tempo 7,373 ± 0,043 66,176 ± 0,36 ± 0,027 7,263 ± 0,047 9,792 ± 0,092 13,377 ± 13,67 ± 0,176 5,322 ± 0,072 22,294 ± 7,762 ± 0,052 0,846 ± 0,032
0,199 0,238 0,098
MSR 25,327 ± 14,088 ± 0,918 ± 0,021 22,389 ± 24,62 ± 0,785 23,023 ± 24,877 ± 1,4 26,526 ± 25,782 ± 22,152 ± 0,4 0,253 ± 0,032
(melhor) 0,442 0,662 1,331 1,029 0,288 0,404
MSR (média) 27,184 ± 17,109 ± 0,559 ± 0,06 25,546 ± 27,469 ± 23,025 ± 26,575 ± 29,423 ± 26,768 ± 24,215 ± 0,258 ± 0,004
0,122 0,202 0,644 0,186 1,028 1,015 0,093 0,129 0,101
Volume 3.824,65 ± 985,1 ± 12,81 448,45 ± 3.032,8 ± 3.951,95 ± 3.450,6 ± 4.018,8 ± 4.251,2 ± 3.856,95 ± 3.519,75 ± 87,6 ± 5,215
(melhor) 424,963 213,132 430,238 502,002 506,473 567,029 582,208 446,919 381,223
Volume 4.547,077 ± 985,764 ± 80,471 ± 4.014,53 ± 4.662,741 ± 3.451,25 ± 4.559,39 ± 4.976,169 ± 4.386,068 ± 4.409,177 ± 87,689 ±
(média) 76,451 1,117 11,983 224,294 142,836 511,083 562,725 68,236 111,262 99 0,853
Cobertura 1±0 0,484 ± 0,01 0,11 ± 0,015 0,991 ± 0,009 1±0 0,173 ± 0,026 0,59 ± 0,048 1±0 1±0 0,981 ± 0,006 0,205 ± 0,004
elementos
Cobertura 1±0 0,743 ± 0,025 0,902 ± 0,075 1±0 1±0 0,173 ± 0,026 0,603 ± 0,049 1±0 1±0 0,998 ± 0,004 0,457 ± 0,013
linhas e
colunas
Sobreposição 0,245 ± 0,003 0,247 ± 0,005 0,003 ± 0,001 0,298 ± 0,029 0,265 ± 0,007 1±0 0,586 ± 0,029 0,249 ± 0,004 0,249 ± 0,006 0,312 ± 0,007 0,003 ± 0,001
Jaccard 0,33 ± 0,003 0,313 ± 0,004 0,078 ± 0,02 0,376 ± 0,023 0,347 ± 0,007 1±0 0,622 ± 0,021 0,333 ± 0,003 0,335 ± 0,005 0,389 ± 0,005 0,288 ± 0,004
Iteração 76,35 ± 4,55 ± 0,686 95,6 ± 4,109 95,4 ± 5,567 85,3 ± 17,475 46,8 ± 6,598 85,65 ± 45,6 ± 30,322 3.317,85 ± 96,1 ± 2,882 -
18,568 20,072 1.046,695
Qtd. - 0±0 0±0 28,15 ± 2,498 0±0 0±0 0±0 0±0 0±0 0±0 0±0 50 ± 0
biclusters
Sucesso 0 0 100 0 0 0 0 0 0 0 100
VE 0,147 ± 0,698 0,136 ± 0,282 0,134 ± 0,98 -0,216 ± -0,203 ± -0,065 ± 0,7 -0,004 ± 0,64 -0,209 ± 0,104 ± 0,694 0,011 ± 0,676 -0,176 ±
0,539 0,445 0,409 1,277
TVE 0,009 ± 0,274 0,026 ± 0,446 -0,077 ± -0,134 ± -0,009 ± -0,164 ± -0,014 ± -0,08 ± 0,298 -0,063 ± 0,37 0,018 ± 0,387 -0,013 ±
0,892 0,473 0,295 0,266 0,316 0,077
MI 1,197 ± 0,035 0,965 ± 0,039 0,461 ± 0,086 1,137 ± 0,047 1,164 ± 0,045 1,152 ± 0,04 1,16 ± 0,04 1,209 ± 0,038 1,22 ± 0,03 1,119 ± 0,025 1,049 ± 0,18
LC 0,176 ± 0,008 0,22 ± 0,014 0,475 ± 0,1 0,192 ± 0,016 0,173 ± 0,013 0,184 ± 0,016 0,17 ± 0,012 0,166 ± 0,011 0,172 ± 0,011 0,193 ± 0,012 0,967 ± 0,014
RMS 0±0 0±0 0,131 ± 0,022 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,06 ± 0,001
(biclusters)
RMS 0,194 ± 0,002 0,196 ± 0,004 0,131 ± 0,022 0,194 ± 0,005 0,192 ± 0,004 0,21 ± 0,025 0,194 ± 0,012 0,194 ± 0,003 0,194 ± 0,003 0,202 ± 0,003 0,06 ± 0,001
(população)
CMS 0±0 0±0 0,21 ± 0,064 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,609 ± 0,005
(biclusters)
CMS 0,379 ± 0,005 0,361 ± 0,006 0,21 ± 0,064 0,396 ± 0,018 0,377 ± 0,01 0,428 ± 0,051 0,396 ± 0,036 0,342 ± 0,005 0,383 ± 0,005 0,428 ± 0,008 0,609 ± 0,005
(população)
MS 0±0 0±0 0,19 ± 0,028 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,385 ± 0,003
(biclusters)
MS 0,248 ± 0,003 0,231 ± 0,002 0,19 ± 0,028 0,254 ± 0,01 0,247 ± 0,005 0,279 ± 0,029 0,257 ± 0,02 0,234 ± 0,003 0,25 ± 0,002 0,268 ± 0,005 0,385 ± 0,003
(população)
169
Tabela 77: Resultado dos algoritmos multimodais para Arabidopsis

Arabidopsis ABC 6 BICACO 8 BIC-aiNet 6 CDE 8 dFSS 5 CGA 6 FSGA 5 GSO 2 MHS 7 NichePSO 5 SwarmBclu
ster 7
Tempo 27,812 ± 121,251 ± 1,778 ± 23,271 ± 34,67 ± 46,133 ± 45,94 ± 18,546 ± 62,317 ± 25,524 ± 35,551 ±
2,473 1,236 0,105 0,944 1,594 2,981 3,245 1,091 1,82 0,833 2,774
MSR 671,135 ± 696,081 ± 582,699 ± 673,445 ± 679,973 ± 671,86 ± 659,011 ± 767,912 ± 739,574 ± 668,458 ± 0±0
(melhor) 44,034 3,153 80,985 30,934 17,885 21,767 24,171 70,285 58,26 23,388
MSR 1.368,004 ± 695,099 ± 258,541 ± 923,607 ± 1.697,637 ± 671,847 ± 654,237 ± 3.189,705 ± 986,444 ± 752,499 ± 33,537 ±
(média) 91,78 0,741 19,573 47,85 158,652 21,751 12,424 166,109 24,262 30,162 2,802
Volume 11.968,55 ± 42.126,7 ± 2.601 ± 0 11.795 ± 12.472,65 ± 16.259,7 ± 19.565,7 ± 11.070,5 ± 10.986,55 ± 18.909,5 ± 17,5 ±
(melhor) 1.191,262 552,371 1.516,78 1.345,489 1.660,986 1.472,029 1.623,937 1.659,958 861,458 1,192
Volume 12.105,196 38.516,201 276,436 ± 11.514,112 12.745,63 ± 16.259,7 ± 19.079,822 12.571,342 11.603,48 ± 15.186,135 5.539,896 ±
(média) ± 214,953 ± 240,193 20,414 ± 356,944 320,475 1.660,986 ± 1.419,361 ± 280,781 170,534 ± 290,558 369,418
Cobertura 1±0 0,964 ± 0,2 ± 0,021 0,997 ± 1±0 0,321 ± 0,417 ± 1±0 0,999 ± 0,994 ± 0,963 ±
elementos 0,011 0,003 0,033 0,034 0,001 0,005 0,004
Cobertura 1±0 0,965 ± 0,547 ± 1±0 1±0 0,321 ± 0,417 ± 1±0 1±0 0,999 ± 1±0
linhas e 0,012 0,032 0,033 0,034 0,004
colunas
Sobreposi- 0,245 ± 0,872 ± 0,005 ± 0,258 ± 0,269 ± 1±0 0,948 ± 0,248 ± 0,245 ± 0,341 ± 0,067 ±
ção 0,004 0,005 0,001 0,011 0,009 0,007 0,006 0,004 0,007 0,011
Jaccard 0,333 ± 0,915 ± 0,055 ± 0,346 ± 0,346 ± 1±0 0,91 ± 0,333 ± 0,335 ± 0,405 ± 0,205 ±
0,002 0,002 0,003 0,007 0,006 0,012 0,002 0,003 0,004 0,008
Iteração 79,4 ± 3,85 ± 99 ± 0 79,95 ± 60,9 ± 58,05 ± 98,3 ± 48,5 ± 2.683,1 ± 90,65 ± -
20,069 0,933 18,383 27,069 5,871 2,793 26,855 1.446,137 13,06
Qtd. - 0,95 ± 0,51 50 ± 0 39,7 ± 4,95 ± 1,05 ± 50 ± 0 49,4 ± 0,1 ± 0,308 0,3 ± 0,571 23,75 ± 50 ± 0
biclusters 2,179 3,663 0,224 1,392 0,639
Sucesso 85 100 100 100 100 100 100 10 25 100 100
VE -0,035 ± -0,007 ± 0,016 ± 0,043 ± 0,017 ± 0,038 ± 0,006 ± -0,008 ± -0,011 ± -0,002 ± 0±0
0,189 0,127 0,129 0,08 0,109 0,101 0,105 0,113 0,076 0,109
TVE 0,001 ± -0,001 ± 0,024 ± 0,028 ± 0,011 ± -0,005 ± -0,004 ± 0,013 ± -0,004 ± -0,001 ± 0±0
0,035 0,022 0,056 0,047 0,028 0,035 0,037 0,045 0,031 0,032
MI 1,307 ± 1,224 ± 1,299 ± 1,301 ± 1,302 ± 1,291 ± 1,267 ± 1,323 ± 1,313 ± 1,275 ± 0±0
0,048 0,011 0,075 0,038 0,038 0,037 0,021 0,055 0,041 0,028
LC 0,128 ± 0,086 ± 0,098 ± 0,13 ± 0,01 0,126 ± 0,114 ± 0,105 ± 0,135 ± 0,135 ± 0,106 ± 0±0
0,009 0,001 0,005 0,01 0,007 0,005 0,013 0,012 0,003
170
Tabela 78: Resultado dos algoritmos multimodais para Brain_1

Brain_1 ABC 5 BICACO 3 BIC-aiNet 6 CDE 9 dFSS 6 CGA 6 FSGA 1 GSO 4 MHS 10 NichePSO 5 SwarmBclu
ster 7
Tempo 51,943 ± 228,356 ± 2,441 ± 43,421 ± 65,466 ± 92,185 ± 89,058 ± 35,388 ± 109,441 ± 45,753 ± 256,156 ±
0,509 1,77 0,125 0,113 0,895 0,997 0,899 0,807 1,968 0,936 20,378
MSR 8.738,742 ± 8.962,033 ± 7.275,993 ± 8.420,846 ± 8.778,112 ± 8.674,013 ± 8.273,505 ± 11.013,367 8.820,548 ± 8.716,643 ± 1.325,23 ±
(melhor) 272,04 31,807 948,211 346,602 281,775 227,291 339,769 ± 718,057 568,63 224,424 698,756
MSR 15.614,009 8.900,438 ± 5.023,904 ± 11.238,173 14.927,558 8.674,013 ± 8.232,045 ± 22.735,315 11.823,697 8.895,474 ± 1.775,093 ±
(média) ± 821,455 18,465 299,027 ± 461,486 ± 676,779 227,291 299,01 ± 658,66 ± 765,847 119,727 635,615
Volume 15.543,85 ± 62.425,95 ± 2.599,45 ± 18.943,8 ± 16.807,75 ± 21.721,05 ± 25.378,15 ± 14.654,15 ± 13.070,55 ± 26.923 ± 15.872 ±
(melhor) 2.880,34 485,197 1,877 1.176,785 2.181,859 2.229,279 1.710,657 2.603,269 2.427,206 1.026,439 9.572,549
Volume 16.412,617 57.364,86 ± 338,424 ± 15.565,8 ± 16.306,914 21.721,05 ± 24.850,886 17.162,459 14.881,732 21.360,006 17.605,219
(média) ± 392,952 295,114 32,121 541,13 ± 404,6 2.229,279 ± 1.657,391 ± 343,952 ± 447,191 ± 441,695 ± 908,021
Cobertura 0,999 ± 0,993 ± 0,194 ± 0,984 ± 0,999 ± 0,315 ± 0,413 ± 1±0 0,973 ± 0,944 ± 0,891 ±
elementos 0,001 0,001 0,022 0,008 0,001 0,032 0,031 0,011 0,014 0,005
Cobertura 1±0 0,993 ± 0,387 ± 0,999 ± 1±0 0,315 ± 0,413 ± 1±0 0,985 ± 0,967 ± 0,97 ±
linhas e 0,001 0,023 0,004 0,032 0,031 0,011 0,02 0,007
colunas
Sobreposi- 0,253 ± 0,873 ± 0,004 ± 0,304 ± 0,266 ± 1±0 0,936 ± 0,249 ± 0,258 ± 0,407 ± 0,363 ±
ção 0,006 0,005 0,001 0,023 0,008 0,01 0,005 0,01 0,008 0,038
Jaccard 0,335 ± 0,92 ± 0,082 ± 0,367 ± 0,344 ± 1±0 0,884 ± 0,333 ± 0,341 ± 0,41 ± 0,45 ±
0,002 0,001 0,007 0,014 0,005 0,018 0,002 0,003 0,003 0,039
Iteração 82,9 ± 4,35 ± 99 ± 0 89,5 ± 9,11 74,55 ± 66,5 ± 98,65 ± 49,85 ± 3.887,6 ± 96,7 ± -
20,946 0,933 24,431 5,472 1,531 24,003 984,159 3,197
Qtd. - 1,3 ± 0,47 50 ± 0 42,35 ± 19,85 ± 1,6 ± 1,095 50 ± 0 49,9 ± 0±0 0,8 ± 0,696 25 ± 0 49,05 ±
biclusters 1,461 6,293 0,308 0,887
Sucesso 100 100 100 100 95 100 100 0 65 100 100
VE 0,062 ± 0,324 ± 0,021 ± 0,025 ± -0,011 ± 0,057 ± -0,099 ± 0,028 ± 0,155 ± -0,103 ± 0,594 ±
0,477 0,764 0,244 0,635 0,551 0,447 0,479 0,455 0,532 0,593 1,162
TVE 0,138 ± 0,096 ± 0,152 ± -0,131 ± 0,212 ± -0,007 ± 0,129 ± -0,049 ± 0,075 ± -0,099 ± -0,075 ±
0,405 0,681 0,541 0,457 0,39 0,591 0,587 0,442 0,465 0,669 0,331
MI 2,304 ± 2,761 ± 2,745 ± 2,399 ± 2,354 ± 2,453 ± 2,49 ± 2,289 ± 2,203 ± 2,521 ± 2,33 ±
0,142 0,013 0,106 0,055 0,063 0,071 0,048 0,108 0,147 0,046 0,283
LC 0,29 ± 0,256 ± 0,249 ± 0,271 ± 0,28 ± 0,274 ± 0,27 ± 0,295 ± 0,307 ± 0,266 ± 0,442 ±
0,015 0,002 0,015 0,016 0,015 0,016 0,013 0,018 0,035 0,014 0,26
171
Tabela 79: Resultado dos algoritmos multimodais para Brain_2

Brain_2 ABC 4 BICACO 8 BIC-aiNet 6 CDE 9 dFSS 8 CGA 5 FSGA 5 GSO 4 MHS 10 NichePSO 5 SwarmBclu
ster 4
Tempo 49,488 ± 167,864 ± 2,365 ± 40,238 ± 61,349 ± 89,729 ± 90,857 ± 35,263 ± 110,004 ± 42,37 ± 128,235 ±
0,305 1,398 0,096 0,236 0,681 0,969 1,441 0,417 1,946 0,489 8,612
MSR 299.611,562 289.005,486 227.087,406 270.641,721 282.851,431 274.886,516 255.251,061 423.307,502 340.225,308 274.345,156 14.189,719
(melhor) ± ± 1.177,176 ± ± ± ± 8.858,085 ± ± ± ± ±
29.943,365 40.520,774 16.943,941 26.613,803 13.841,166 31.771,264 32.013,636 11.635,192 16.485,776
MSR 601.094,417 287.439,926 119.148,796 427.317,876 518.057,713 274.886,516 254.437,922 851.326,566 452.538,597 293.596,307 22.233,742
(média) ± 35.757,36 ± 454,622 ± 8.963,281 ± ± ± 8.858,085 ± ± ± ± 4.665,209 ± 3.212,085
31.518,842 72.686,874 10.741,382 18.618,934 16.498,477
Volume 11.285,75 ± 54.391,7 ± 2.515,05 ± 13.810,45 ± 12.399,5 ± 17.118,55 ± 19.707,85 ± 12.316,8 ± 10.509,35 ± 20.731,95 ± 6.159,35 ±
(melhor) 2.813,542 341,823 11,138 1.916,859 1.738,113 2.025,728 1.845,544 2.177,362 1.970,324 931,094 7.174,703
Volume 13.606,619 50.861,284 327,735 ± 12.334,948 13.168,912 17.118,55 ± 19.252,468 14.344,453 12.207,3 ± 15.765,833 13.916,034
(média) ± 359,217 ± 289,51 41,081 ± 733,302 ± 1.303,961 2.025,728 ± 1.789,431 ± 340,656 471,532 ± 334,326 ± 908,559
Cobertura 1±0 0,992 ± 0,215 ± 0,987 ± 0,951 ± 0,296 ± 0,379 ± 1±0 0,992 ± 0,952 ± 0,948 ±
elementos 0,001 0,025 0,014 0,034 0,035 0,04 0,005 0,016 0,003
Cobertura 1±0 0,992 ± 0,382 ± 0,996 ± 0,99 ± 0,296 ± 0,379 ± 1±0 1±0 0,982 ± 1 ± 0,001
linhas e 0,001 0,019 0,012 0,015 0,035 0,04 0,019
colunas
Sobreposi- 0,25 ± 0,918 ± 0,005 ± 0,291 ± 0,337 ± 1±0 0,937 ± 0,248 ± 0,254 ± 0,375 ± 0,276 ±
ção 0,006 0,005 0,001 0,032 0,026 0,01 0,006 0,006 0,01 0,036
Jaccard 0,334 ± 0,954 ± 0,094 ± 0,364 ± 0,407 ± 1±0 0,885 ± 0,333 ± 0,34 ± 0,406 ± 0,465 ±
0,002 0,001 0,006 0,02 0,022 0,017 0,002 0,002 0,002 0,049
Iteração 82,35 ± 4,1 ± 0,788 99 ± 0 92,05 ± 76,2 ± 66,25 ± 99,15 ± 57,55 ± 3.241,3 ± 91,85 ± -
16,959 8,775 19,075 4,575 1,089 26,201 1.193,274 7,393
Qtd. - 0,45 ± 0,51 50 ± 0 41,55 ± 12,5 ± 2,7 ± 5,342 50 ± 0 49,75 ± 0±0 0,1 ± 0,308 24,8 ± 0,41 49,95 ±
biclusters 1,669 7,402 0,786 0,224
Sucesso 45 100 100 100 80 100 100 0 10 100 100
VE 0,152 ± -0,083 ± -0,015 ± 0,11 ± 0,014 ± -0,02 ± 0,045 ± 0,052 ± -0,066 ± -0,097 ± -0,009 ±
0,358 0,139 0,245 0,492 0,371 0,552 0,463 0,414 0,401 0,608 0,59
TVE -0,105 ± 0,082 ± 0,108 ± 0,105 ± 0,117 ± 0,09 ± 0,38 -0,001 ± -0,048 ± 0,074 ± 0,127 ± 0,035 ±
0,333 0,417 0,276 0,407 0,268 0,403 0,326 0,361 0,373 0,268
MI 0,75 ± 0,954 ± 0,926 ± 0,802 ± 0,777 ± 0,807 ± 0,843 ± 0,797 ± 0,763 ± 0,85 ± 0,429 ±
0,051 0,006 0,076 0,045 0,053 0,031 0,039 0,06 0,074 0,032 0,426
LC 0,223 ± 0,151 ± 0 0,151 ± 0,203 ± 0,212 ± 0,189 ± 0,181 ± 0,214 ± 0,229 ± 0,179 ± 0,197 ±
0,028 0,01 0,013 0,013 0,008 0,008 0,02 0,02 0,005 0,29
172
Tabela 80: Resultado dos algoritmos multimodais para Breast_Colon

Breast, ABC 4 BICACO 8 BIC-aiNet 6 CDE 9 dFSS 7 CGA 6 FSGA 6 GSO 2 MHS 10 NichePSO 5 SwarmBclu
Colon ster 8
Tempo 7,567 ± 28,803 ± 1,089 ± 7,155 ± 10,051 ± 13,732 ± 13,461 ± 4,396 ± 20,293 ± 7,794 ± 5,842 ±
0,092 0,457 0,039 0,043 0,147 0,331 0,235 0,072 0,329 0,07 0,605
MSR 20.590,215 21.770,935 20.374,71 ± 20.589,944 20.642,648 20.804,957 20.142,245 27.720,935 22.312,399 20.613,484 0±0
(melhor) ± 1.506,091 ± 264,979 869,708 ± 1.333,598 ± 1.300,231 ± 597,526 ± 1.100,979 ± 2.066,144 ± 1.773,804 ± 947,662
MSR 88.837,872 21.741,631 12.499,842 33.544,465 50.391,407 20.835,82 ± 19.883,3 ± 207.754,525 31.344,778 24.811,985 1.405,271 ±
(média) ± ± 41,08 ± 965,359 ± 2.368,995 ± 589,685 662,733 ± ± 2.380,234 ± 2.408,495 158,608
11.338,559 11.384,521 12.531,056
Volume 4.935,45 ± 15.037 ± 2.601 ± 0 5.444,7 ± 5.277,45 ± 6.843,55 ± 9.479,65 ± 4.315,25 ± 4.264,8 ± 7.826,75 ± 34,05 ±
(melhor) 642,468 157,183 639,655 671,17 766,474 876,096 457,266 365,318 314,337 4,662
Volume 4.653,206 ± 13.558,016 206,425 ± 4.494,564 ± 4.710,937 ± 6.843,55 ± 8.889,877 ± 4.709,438 ± 4.442,454 ± 6.183,384 ± 1.974,318 ±
(média) 79,568 ± 119,409 9,883 233,678 314,364 766,474 800,406 67,082 111,654 144,147 216,262
Cobertura 0,998 ± 0,917 ± 0,322 ± 0,971 ± 0,966 ± 0,362 ± 0,531 ± 1±0 0,946 ± 0,954 ± 0,917 ±
elementos 0,002 0,006 0,018 0,006 0,022 0,04 0,055 0,005 0,008 0,005
Cobertura 1±0 0,918 ± 0,906 ± 0,982 ± 0,994 ± 0,362 ± 0,531 ± 1±0 0,95 ± 0,966 ± 1±0
linhas e 0,006 0,028 0,008 0,01 0,04 0,055 0,009 0,011
colunas
Sobreposi- 0,252 ± 0,87 ± 0,011 ± 0,288 ± 0,4 ± 0,058 1±0 0,919 ± 0,249 ± 0,261 ± 0,38 ± 0,078 ±
ção 0,004 0,006 0,001 0,024 0,016 0,004 0,006 0,008 0,018
Jaccard 0,335 ± 0,862 ± 0,048 ± 0,366 ± 0,461 ± 1±0 0,913 ± 0,332 ± 0,343 ± 0,442 ± 0,266 ±
0,003 0,006 0,002 0,02 0,049 0,016 0,003 0,005 0,007 0,01
Iteração 78,2 ± 4,5 ± 0,688 99 ± 0 90,65 ± 70,9 ± 43,1 ± 97,35 ± 49,05 ± 3.615,5 ± 96,45 ± -
20,97 7,862 30,385 4,811 3,014 27,186 863,629 2,819
Qtd. - 1,05 ± 0,51 50 ± 0 34,65 ± 14,4 ± 6,05 ± 6,37 50 ± 0 48,5 ± 0±0 0,6 ± 0,754 24,75 ± 49,95 ±
biclusters 1,268 6,386 2,482 0,444 0,224
Sucesso 95 100 100 100 95 100 100 0 45 100 100
VE 0,094 ± 0,821 ± 0,064 ± -0,081 ± -0,248 ± -0,09 ± -0,211 ± -0,064 ± -0,038 ± -0,028 ± 0±0
0,385 0,805 0,314 0,495 0,413 0,282 0,61 0,377 0,521 0,435
TVE 0,022 ± -0,107 ± 0,035 ± -0,017 ± 0,101 ± 0,179 ± 0,066 ± -0,01 ± -0,029 ± 0,069 ± 0±0
0,822 1,039 0,342 0,538 0,557 0,598 0,815 0,475 0,351 0,482
MI 1,76 ± 1,885 ± 1,795 ± 1,784 ± 1,819 ± 1,762 ± 1,818 ± 1,768 ± 1,748 ± 1,792 ± 0±0
0,092 0,025 0,112 0,06 0,096 0,078 0,065 0,132 0,074 0,066
LC 0,254 ± 0,238 ± 0,269 ± 0,257 ± 0,264 ± 0,248 ± 0,24 ± 0,26 ± 0,253 ± 0,247 ± 0±0
0,018 0,003 0,041 0,02 0,019 0,011 0,011 0,019 0,013 0,015
173
Tabela 81: Resultado dos algoritmos multimodais para Lung

Lung ABC 5 BICACO 8 BIC-aiNet 6 CDE 9 dFSS 5 CGA 5 FSGA 6 GSO 4 MHS 10 NichePSO 5 SwarmBclu
ster 7
Tempo 120,318 ± 405,851 ± 4,143 ± 84,207 ± 144,458 ± 168,215 ± 166,454 ± 75,714 ± 166,947 ± 91,861 ± 922,963 ±
0,472 6,391 0,16 1,183 2,575 2,63 2,173 0,756 0,988 0,436 105,469
MSR 34.539,461 35.691,649 23.610,922 33.272,359 34.449,182 34.071,082 31.957,488 41.455,711 35.699,626 33.839,751 2.953,378 ±
(melhor) ± 1.495,871 ± 275,983 ± 7.257,654 ± 2.397,948 ± 1.702,296 ± 1.078,949 ± 1.792,804 ± 2.056,282 ± 1.448,785 ± 1.331,746 3.286,534
MSR 55.966,164 35.688,999 13.932,067 42.842,329 54.634,164 34.071,082 31.272,325 77.125,797 45.252,91 ± 35.244,116 4.649,491 ±
(média) ± 1.848,681 ± 46,502 ± 1.003,666 ± 1.822,636 ± 1.923,915 ± 1.078,949 ± 1.073,427 ± 1.675,438 3.799,375 ± 350,205 838,819
Volume 89.641,85 ± 307.291,25 2.601 ± 0 91.903,1 ± 84.292,8 ± 112.789,05 130.451,15 74.808,6 ± 75.719,75 ± 126.954 ± 52.397,25 ±
(melhor) 4.749,181 ± 335,023 3.288,892 4.395,592 ± 5.408,8 ± 6.994,387 5.462,608 5.625,913 3.486,67 49.873,883
Volume 78.067,028 303.368,682 497,97 ± 80.133,551 77.514,736 112.789,05 125.834,183 77.834,83 ± 77.012,775 110.150,74 78.674,505
(média) ± 652,599 ± 538,018 26,483 ± 1.649,515 ± 1.033,542 ± 5.408,8 ± 6.538,669 717,35 ± 1.106,555 ± 1.373,699 ± 7.056,23
Cobertura 1±0 0,997 ± 0,094 ± 0,999 ± 1±0 0,36 ± 0,496 ± 1±0 0,999 ± 0,996 ± 0,953 ±
elementos 0,001 0,007 0,001 0,017 0,03 0,001 0,001 0,004
Cobertura 1±0 0,997 ± 0,543 ± 1±0 1±0 0,36 ± 0,496 ± 1±0 0,999 ± 0,997 ± 1±0
linhas e 0,001 0,023 0,017 0,03 0,001 0,001
colunas
Sobreposi- 0,252 ± 0,981 ± 0,001 ± 0 0,295 ± 0,258 ± 1±0 0,903 ± 0,248 ± 0,255 ± 0,369 ± 0,245 ±
ção 0,002 0,002 0,016 0,005 0,01 0,002 0,004 0,004 0,042
Jaccard 0,335 ± 0,98 ± 0,025 ± 0,37 ± 0,341 ± 1±0 0,872 ± 0,333 ± 0,339 ± 0,417 ± 0,44 ± 0,05
0,002 0,001 0,001 0,013 0,004 0,011 0,002 0,003 0,002
Iteração 79,85 ± 3,65 ± 99 ± 0 88,35 ± 79,35 ± 71,35 ± 98,35 ± 47,55 ± 2.989,5 ± 95,95 ± -
19,334 0,875 12,667 14,855 4,056 1,872 24,248 1.268,261 2,946
Qtd. - 1,35 ± 50 ± 0 61,9 ± 20,55 ± 1,75 ± 1,02 50 ± 0 50 ± 0 0±0 1,1 ± 1,294 25 ± 0 49,75 ±
biclusters 0,745 2,693 5,726 0,444
Sucesso 100 100 100 100 100 100 100 0 65 100 100
VE -0,029 ± 0,467 ± 0,004 ± -0,045 ± -0,068 ± 0,014 ± 0,042 ± 0,007 ± 0,063 ± -0,07 ± -0,163 ±
0,479 0,248 0,286 0,488 0,384 0,666 0,794 0,442 0,529 0,501 1,309
TVE 1,091 ± -0,377 ± -0,024 ± 0,036 ± -0,379 ± -0,089 ± 0,235 ± -0,069 ± -0,88 ± 1,013 ± 0,046 ±
1,904 2,796 0,693 2,516 1,286 2,065 1,854 1,69 1,894 2,157 0,747
MI 2,528 ± 2,486 ± 2,456 ± 2,535 ± 2,499 ± 2,53 ± 2,503 ± 2,519 ± 2,529 ± 2,515 ± 2,197 ±
0,042 0,003 0,134 0,039 0,056 0,043 0,034 0,058 0,062 0,041 1,484
LC 0,172 ± 0,164 ± 0 0,191 ± 0,174 ± 0,168 ± 0,168 ± 0,166 ± 0,171 ± 0,177 ± 0,169 ± 0,306 ±
0,007 0,022 0,008 0,012 0,007 0,005 0,008 0,01 0,009 0,353
174
Tabela 82: Resultado dos algoritmos multimodais para Multitissue

Multitissue ABC 4 BICACO 3 BIC-aiNet 6 CDE 9 dFSS 6 CGA 5 FSGA 6 GSO 4 MHS 10 NichePSO 4 SwarmBclu
ster 8
Tempo 99,416 ± 835,945 ± 3,544 ± 70,786 ± 111,187 ± 125,628 ± 126,328 ± 60,468 ± 142,476 ± 70,309 ± 1.012,488 ±
1,18 8,123 0,205 1,338 1,169 4,453 7,658 2,664 4,045 0,13 86,382
MSR 166.083,834 168.467,949 115.613,244 160.391,43 164.094,184 162.960,909 150.776,841 206.601,31 163.490,546 162.559,97 0±0
(melhor) ± 6.240,47 ± 1.479,502 ± ± 9.114,242 ± 5.752,985 ± 4.671,59 ± 8.855,277 ± 7.640,183 ± 8.983,649 ± 6.451,473
30.782,619
MSR 293.096,272 167.546,17 63.706,727 207.358,583 272.411,085 162.960,219 149.792,405 395.176,815 218.837,828 305.266,992 6.121,924 ±
(média) ± 9.127,059 ± 456,79 ± 6.624,217 ± 9.096,919 ± 9.041,014 ± 4.670,965 ± 6.491,598 ± 9.751,972 ± ± 6.240,995 328,569
17.040,165
Volume 66.991,9 ± 233.628,15 2.601 ± 0 75.072,2 ± 68.280,25 ± 86.796,3 ± 100.861,25 60.571,6 ± 60.135,15 ± 63.931 ± 75,25 ±
(melhor) 5.444,021 ± 1.019,525 3.556,849 4.446,633 5.797,041 ± 4.837,153 3.869,305 4.961,303 4.539,681 0,55
Volume 64.333,914 225.044,386 447,738 ± 64.621,753 64.169,377 86.796,3 ± 97.707,128 64.650,393 62.202,555 63.469,447 86.711,671
(média) ± 518,772 ± 580,431 42,594 ± 1.856,139 ± 848,097 5.797,041 ± 4.612,308 ± 864,378 ± 856,74 ± 905,843 ± 4.953,829
Cobertura 1±0 0,999 ± 0 0,094 ± 0,992 ± 1±0 0,335 ± 0,454 ± 1±0 0,99 ± 1±0 0,941 ±
elementos 0,011 0,003 0,022 0,025 0,003 0,007
Cobertura 1±0 0,999 ± 0 0,542 ± 0,996 ± 1±0 0,335 ± 0,455 ± 1±0 0,992 ± 1±0 1±0
linhas e 0,029 0,003 0,022 0,026 0,003
colunas
Sobreposi- 0,252 ± 0,909 ± 0,002 ± 0 0,298 ± 0,262 ± 1±0 0,912 ± 0,25 ± 0,258 ± 0,25 ± 0,426 ±
ção 0,002 0,002 0,018 0,006 0,01 0,003 0,004 0,004 0,054
Jaccard 0,334 ± 0,92 ± 0,025 ± 0,371 ± 0,342 ± 1±0 0,881 ± 0,333 ± 0,34 ± 0,335 ± 0,503 ±
0,002 0,001 0,001 0,012 0,004 0,009 0,002 0,002 0,002 0,048
Iteração 76,35 ± 4,4 ± 0,754 99 ± 0 85,5 ± 70,75 ± 66,15 ± 98,85 ± 58,55 ± 3.389,45 ± 60,2 ± -
25,169 13,694 26,576 5,47 1,137 28,629 1.390,085 25,245
Qtd. - 1 ± 0,459 50 ± 0 56,85 ± 19,3 ± 4,68 1,65 ± 50 ± 0 49,6 ± 0±0 0,95 ± 2,7 ± 1,559 50 ± 0
biclusters 2,477 0,933 1,188 0,686
Sucesso 90 100 100 100 100 100 100 0 75 100 100
VE 0,051 ± 0,401 ± -0,058 ± -0,074 ± 0,06 ± -0,051 ± 0,199 ± 0,211 ± 0,192 ± 0,177 ± 0±0
0,538 0,821 0,18 0,843 0,462 0,618 0,785 0,852 0,693 0,436
TVE -0,046 ± -0,103 ± 0,005 ± 0,176 ± 0,034 ± 0,113 ± 0,13 ± 0,014 ± -0,061 ± 0,039 ± 0±0
0,32 0,389 0,192 0,252 0,33 0,477 0,416 0,298 0,246 0,419
MI 0,731 ± 0,805 ± 0,712 ± 0,743 ± 0,744 ± 0,747 ± 0,755 ± 0,758 ± 0,733 ± 0,718 ± 0±0
0,038 0,009 0,059 0,028 0,031 0,024 0,016 0,043 0,031 0,03
LC 0,142 ± 0,142 ± 0,176 ± 0,141 ± 0,145 ± 0,134 ± 0,132 ± 0,154 ± 0,14 ± 0,142 ± 0±0
0,011 0,008 0,021 0,011 0,012 0,012 0,013 0,015 0,015 0,01
175
Tabela 83: Resultado dos algoritmos multimodais para Yeast

Yeast ABC 1 BICACO 8 BIC-aiNet 6 CDE 9 dFSS 6 CGA 1 FSGA 1 GSO 4 MHS 10 NichePSO 4 SwarmBclu
ster 10
Tempo 164,994 ± 1.558,151 ± 3,136 ± 107,953 ± 181,619 ± 263,187 ± 252,306 ± 91,277 ± 231,924 ± 101,761 ± 93,095 ±
19,294 16,889 0,106 3,826 15,101 10,997 4,461 2,556 1,671 0,564 12,43
MSR 220,705 ± 299,651 ± 297,631 ± 257,614 ± 238,145 ± 256,95 ± 239,822 ± 240,016 ± 204,532 ± 245,335 ± 204,927 ±
(melhor) 98,458 0,453 1,887 37,269 91,904 41,109 35,853 134,771 110,135 38,647 411,458
MSR 886,701 ± 308,135 ± 282,64 ± 433,709 ± 792,373 ± 256,933 ± 240,137 ± 1.013,007 ± 632,522 ± 863,95 ± 153,388 ±
(média) 16,36 11,76 6,618 37,957 28,654 41,093 35,326 19,424 124,825 30,285 29,714
Volume 2.704,25 ± 6.675,4 ± 1.043,7 ± 3.017,5 ± 2.848,9 ± 3.171,1 ± 3.180,1 ± 2.903,15 ± 2.631 ± 2.980,9 ± 1.216,1 ±
(melhor) 536,987 343,437 56,157 39,331 567,769 80,774 95,445 951,646 589,924 36,852 865,662
Volume 10.875,998 3.950,884 ± 174,322 ± 5.143,11 ± 9.675,194 ± 3.171,092 ± 3.124,43 ± 12.003,549 7.558,88 ± 8.323,456 ± 1.318,331 ±
(média) ± 454,062 160,265 7,036 426,349 588,743 80,766 93,483 ± 338,067 1.802,449 437,5 143,878
Cobertura 1±0 0,705 ± 0,141 ± 0,863 ± 0,999 ± 0,065 ± 0,077 ± 1±0 0,862 ± 1±0 0,507 ±
elementos 0,025 0,008 0,034 0,002 0,002 0,003 0,074 0,021
Cobertura 1±0 0,884 ± 0,229 ± 0,921 ± 1±0 0,065 ± 0,077 ± 1±0 0,894 ± 1±0 0,716 ±
linhas e 0,059 0,015 0,048 0,002 0,003 0,073 0,017
colunas
Sobreposi- 0,232 ± 0,171 ± 0,005 ± 0,169 ± 0,233 ± 1±0 0,917 ± 0,245 ± 0,204 ± 0,176 ± 0,058 ±
ção 0,01 0,011 0,001 0,023 0,017 0,011 0,007 0,024 0,01 0,009
Jaccard 0,333 ± 0,442 ± 0,13 ± 0,353 ± 0,34 ± 1±0 0,847 ± 0,334 ± 0,337 ± 0,335 ± 0,068 ±
0,001 0,013 0,014 0,006 0,004 0,019 0,002 0,002 0,001 0,007
Iteração 54,15 ± 4,9 ± 0,308 98,85 ± 84,95 ± 51,5 ± 68,45 ± 97,3 ± 43,4 ± 2.720,15 ± 54 ± 27,785 -
31,225 0,366 13,559 27,086 6,637 3,262 32,72 1.628,177
Qtd. - 1,05 ± 38,8 ± 43,85 ± 21,1 ± 5,21 1,3 ± 0,733 50 ± 0 49,4 ± 0,85 ± 3,85 ± 14,85 ± 47,35 ±
biclusters 0,224 3,088 2,007 2,683 0,489 2,134 3,438 1,565
Sucesso 100 100 100 100 95 100 100 80 95 100 100
VE -0,012 ± -0,226 ± -0,391 ± -0,001 ± -0,118 ± -0,008 ± 0,004 ± 0,302 ± 0,03 ± -0,004 ± 0,265 ±
0,058 2,106 0,832 0,098 0,559 0,078 0,078 0,874 0,067 0,098 0,866
TVE 1,06 ± 0,987 ± 1,022 ± 3,352 ± -49,787 ± 6,925 ± -143,817 ± -1,069 ± -0,89 ± -16,014 ± -0,968 ±
4,493 2,721 5,054 63,529 162,51 22,277 630,314 5,705 13,881 64,085 3,591
MI 0,348 ± 0,815 ± 1,122 ± 0,42 ± 0,05 0,382 ± 0,403 ± 0,391 ± 0,363 ± 0,329 ± 0,402 ± 0,974 ±
0,154 0,05 0,103 0,145 0,043 0,045 0,206 0,173 0,054 0,252
LC 0,502 ± 0,447 ± 0,286 ± 0,607 ± 0,533 ± 0,582 ± 0,564 ± 0,458 ± 0,475 ± 0,581 ± 0,535 ±
0,222 0,027 0,022 0,072 0,188 0,062 0,065 0,237 0,25 0,078 0,236
176
Tabela 84: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Artificial_2
Artificial_2 ABC 4 (LC) BICACO 1 BIC-aiNet 1 CDE 4 (LC) dFSS 1 (LC) CGA 1 (J) FSGA 1 (J) GSO 1 (LC) MHS 4 (LC) NichePSO 2 SwarmBclust
(LC) (LC) (LC) er 1 (J)
Tempo 10,331 ± 5,55 ± 0,074 2,218 ± 0,299 10,053 ± 10,389 ± 9,096 ± 0,205 10,188 ± 10,57 ± 0,047 9,981 ± 0,053 10,145 ± 6,094 ± 0,037
0,028 0,037 0,068 0,127 0,079
MSR 6,215 ± 1,649 24,746 ± 0,6 1,331 ± 2,175 19,761 ± 29,969 ± 21,827 ± 28,571 ± 30,668 ± 19,813 ± 2,9 27,857 ± 0,85 0,361 ± 0,058
(melhor) 2,086 0,725 1,176 0,718 0,592
MSR (média) 29,906 ± 0,15 29,558 ± 21,055 ± 29,477 ± 32,163 ± 24,412 ± 30,748 ± 32,465 ± 29,569 ± 31,649 ± 0,102 ± 0,005
0,123 0,809 0,121 0,134 1,105 0,275 0,069 0,118 0,097
Volume 702,5 ± 6.703,25 ± 27,25 ± 21,45 3.732,4 ± 4.340,8 ± 2.694,95 ± 4.215,95 ± 4.426,6 ± 3.837,75 ± 5.332,1 ± 141,95 ±
(melhor) 180,845 1.406,722 574,466 1.089,646 390,707 706,083 1.397,41 1.073,498 1.627,644 22,698
Volume 5.967,379 ± 5.401,018 ± 201,059 ± 5.733,502 ± 12.429,542 ± 3.382,979 ± 7.355,398 ± 12.258,092 ± 5.362,751 ± 9.138,713 ± 98,596 ±
(média) 284,786 229,722 26,838 273,225 691,904 449,249 447,881 612,646 251,566 136,062 1,135
Cobertura 1±0 1±0 0,39 ± 0,043 1±0 1±0 0,638 ± 0,035 0,997 ± 0,001 1±0 1±0 1±0 0,183 ± 0,005
elementos
Cobertura 1±0 1±0 0,997 ± 0,005 1±0 1±0 0,814 ± 0,045 1±0 1±0 1±0 1±0 0,224 ± 0,01
linhas e
colunas
Sobreposição 0,316 ± 0,015 0,303 ± 0,012 0,009 ± 0,001 0,319 ± 0,016 0,623 ± 0,035 0,797 ± 0,019 0,458 ± 0,016 0,613 ± 0,031 0,298 ± 0,014 0,463 ± 0,007 0,011 ± 0,001
Jaccard 0,377 ± 0,014 0,365 ± 0,012 0,047 ± 0,003 0,385 ± 0,014 0,615 ± 0,035 0,818 ± 0,017 0,503 ± 0,014 0,603 ± 0,029 0,368 ± 0,012 0,516 ± 0,005 0,627 ± 0,014
Qtd. - 0±0 0±0 2,05 ± 1,276 0±0 0±0 0±0 0±0 0±0 0±0 0±0 48 ± 0
biclusters
Sucesso 0 0 90 0 0 0 0 0 0 0 100
VE 0,051 ± 0,227 0,148 ± 0,421 -0,066 ± -0,056 ± -0,032 ± 0,23 -0,02 ± 0,212 0,022 ± 0,234 -0,006 ± -0,17 ± 0,383 -0,124 ± 0,203 ± 1,877
0,229 0,258 0,168 0,196
TVE 0,082 ± 0,722 0,115 ± 0,394 -0,022 ± -0,095 ± 0,033 ± 0,249 -0,118 ± -0,116 ± 0,007 ± 0,24 -0,099 ± -0,093 ± 0,28 0,077 ± 0,491
0,203 0,534 0,484 0,263 0,552
MI 0,551 ± 0,068 1,079 ± 0,064 0,709 ± 0,485 0,958 ± 0,076 1,327 ± 0,048 1,117 ± 0,069 1,299 ± 0,034 1,358 ± 0,049 0,968 ± 0,097 1,24 ± 0,046 0,465 ± 0,197
LC 0,291 ± 0,035 0,161 ± 0,009 0,671 ± 0,39 0,193 ± 0,016 0,148 ± 0,009 0,212 ± 0,016 0,155 ± 0,009 0,145 ± 0,01 0,192 ± 0,016 0,157 ± 0,01 0,762 ± 0,172
RMS 0±0 0±0 0,041 ± 0,028 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,033 ± 0,001
(biclusters)
RMS 0,218 ± 0,005 0,243 ± 0,004 0,098 ± 0,006 0,225 ± 0,004 0,2 ± 0,002 0,3 ± 0,029 0,21 ± 0,009 0,193 ± 0,002 0,221 ± 0,004 0,203 ± 0,004 0,033 ± 0,001
(população)
CMS 0±0 0±0 0,036 ± 0,019 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,539 ± 0,007
(biclusters)
CMS 0,418 ± 0,01 0,408 ± 0,008 0,114 ± 0,009 0,445 ± 0,011 0,432 ± 0,011 0,497 ± 0,053 0,438 ± 0,019 0,412 ± 0,008 0,435 ± 0,009 0,435 ± 0,007 0,539 ± 0,007
(população)
MS 0±0 0±0 0,035 ± 0,021 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,362 ± 0,003
(biclusters)
MS 0,287 ± 0,006 0,303 ± 0,004 0,103 ± 0,007 0,301 ± 0,005 0,279 ± 0,005 0,37 ± 0,026 0,289 ± 0,011 0,268 ± 0,004 0,295 ± 0,004 0,283 ± 0,004 0,362 ± 0,003
(população)
177
Artificial_4 ABC 3 (LC) BICACO 1 BIC-aiNet 1 CDE 3 (LC) dFSS 2 (LC) CGA 1 (LC) FSGA 1 (J) GSO 1 (LC) MHS 3 (LC) NichePSO 2 SwarmBclust
(J) (LC) (LC) er 1 (J)
Tempo 10,403 ± 5,522 ± 0,019 1,812 ± 0,245 10,126 ± 10,446 ± 9,35 ± 0,163 10,075 ± 10,582 ± 10,098 ± 0,05 10,188 ± 5,633 ± 0,032
0,042 0,048 0,054 0,131 0,049 0,058
MSR 18,473 ± 14,039 ± 1,018 ± 0,846 17,195 ± 0,64 20,214 ± 14,647 ± 0,69 17,065 ± 0,78 21,053 ± 19,419 ± 0,36 18,106 ± 0,331 ± 0,071
(melhor) 0,323 0,254 0,597 0,705 0,755
MSR (média) 21,351 ± 18,047 ± 0,15 14,731 ± 20,788 ± 0,1 22,47 ± 0,1 16,052 ± 19,585 ± 23,021 ± 20,795 ± 22,055 ± 1,993 ± 0,439
0,149 0,629 0,508 0,433 0,088 0,088 0,115
Volume 11.055,95 ± 6.802,6 ± 77,8 ± 8.470,2 ± 5.142,55 ± 2.997 ± 4.000 ± 4.773,5 ± 10.069,5 ± 5.930,4 ± 120,15 ±
(melhor) 1.949,388 311,079 177,111 1.938,171 2.232,643 388,255 950,811 2.414,37 3.920,036 2.445,628 6,915
Volume 8.896,651 ± 4.755,395 ± 235,768 ± 8.674,646 ± 10.883,606 ± 3.515,048 ± 6.621,443 ± 12.398,197 ± 8.112,654 ± 9.040,111 ± 91,713 ±
(média) 434,262 215,179 30,064 303,323 412,316 276,185 478,882 722,977 330,175 209,507 1,276
Cobertura 1±0 0,991 ± 0,002 0,441 ± 0,041 1 ± 0 1±0 0,659 ± 0,031 0,987 ± 0,008 1±0 1±0 1±0 0,185 ± 0,004
elementos
Cobertura 1±0 1±0 0,997 ± 0,005 1±0 1±0 0,817 ± 0,038 0,997 ± 0,007 1±0 1±0 1±0 0,364 ± 0,012
linhas e
colunas
Sobreposição 0,46 ± 0,021 0,313 ± 0,014 0,011 ± 0,001 0,463 ± 0,016 0,546 ± 0,021 0,799 ± 0,018 0,452 ± 0,016 0,619 ± 0,036 0,432 ± 0,017 0,459 ± 0,011 0,006 ± 0,001
Jaccard 0,497 ± 0,019 0,369 ± 0,016 0,05 ± 0,003 0,503 ± 0,015 0,557 ± 0,022 0,821 ± 0,016 0,498 ± 0,013 0,612 ± 0,033 0,475 ± 0,016 0,513 ± 0,009 0,35 ± 0,006
Qtd. - 0±0 0±0 2,2 ± 1,24 0±0 0±0 0±0 0±0 0±0 0±0 0±0 36,4 ± 2,798
biclusters
Sucesso 0 0 90 0 0 0 0 0 0 0 100
VE 0,028 ± 0,101 -0,022 ± 0,09 -0,011 ± 0,07 0,007 ± 0,092 0,013 ± 0,086 -0,019 ± 0,044 ± 0,092 0,025 ± 0,125 -0,015 ± 0,02 ± 0,138 -0,163 ±
0,082 0,166 0,313
TVE -0,007 ± 0,005 ± 0,029 -0,003 ± 0,007 ± 0,041 -0,004 ± 0,003 ± 0,043 -0,005 ± 0,011 ± 0,033 0 ± 0,025 -0,006 ± 0,012 ± 0,031
0,019 0,098 0,039 0,041 0,031
MI 0,961 ± 0,05 0,852 ± 0,008 0,669 ± 0,35 0,949 ± 0,038 1,11 ± 0,065 0,967 ± 0,039 1,037 ± 0,039 1,154 ± 0,057 1,005 ± 0,086 1,02 ± 0,044 0,56 ± 0,245
LC 0,106 ± 0,013 0,115 ± 0,002 0,712 ± 0,244 0,112 ± 0,011 0,121 ± 0,014 0,153 ± 0,012 0,135 ± 0,012 0,123 ± 0,011 0,108 ± 0,018 0,122 ± 0,013 0,855 ± 0,126
RMS 0±0 0±0 0,073 ± 0,055 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,047 ± 0,001
(biclusters)
RMS 0,225 ± 0,003 0,237 ± 0,004 0,127 ± 0,007 0,23 ± 0,003 0,223 ± 0,002 0,241 ± 0,018 0,23 ± 0,006 0,221 ± 0,002 0,227 ± 0,002 0,222 ± 0,002 0,049 ± 0,001
(população)
CMS 0±0 0±0 0,056 ± 0,037 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,602 ± 0,008
(biclusters)
CMS 0,422 ± 0,006 0,417 ± 0,008 0,147 ± 0,012 0,435 ± 0,007 0,407 ± 0,006 0,417 ± 0,029 0,437 ± 0,015 0,4 ± 0,006 0,428 ± 0,006 0,411 ± 0,006 0,606 ± 0,008
(população)
MS 0±0 0±0 0,059 ± 0,045 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,372 ± 0,005
(biclusters)
MS 0,281 ± 0,003 0,292 ± 0,005 0,132 ± 0,01 0,288 ± 0,003 0,273 ± 0,003 0,298 ± 0,019 0,292 ± 0,006 0,268 ± 0,003 0,285 ± 0,003 0,276 ± 0,003 0,371 ± 0,004
(população)
178
(J) (LC) (LC) er 1 (J)
Tempo 10,495 ± 5,531 ± 0,059 1,82 ± 0,268 10,248 ± 10,478 ± 9,065 ± 0,197 10,202 ± 10,618 ± 10,114 ± 10,215 ± 5,476 ± 0,092
0,063 0,096 0,091 0,131 0,073 0,056 0,097
MSR 25,891 ± 22,46 ± 0,445 0,978 ± 1,003 25,77 ± 0,937 26,993 ± 20,186 ± 24,942 ± 27,487 ± 26,187 ± 24,322 ± 0,99 0,324 ± 0,046
(melhor) 0,785 0,779 0,728 0,867 0,779 0,538
MSR (média) 28,841 ± 26,057 ± 18,13 ± 1,019 28,683 ± 29,399 ± 21,718 ± 27,344 ± 29,714 ± 28,521 ± 28,826 ± 0,355 ± 0,029
0,154 0,129 0,136 0,098 1,068 0,385 0,092 0,118 0,106
Volume 3.380,1 ± 5.589,1 ± 27,3 ± 16,355 3.230,05 ± 4.415,85 ± 2.725,9 ± 3.882,1 ± 4.412,4 ± 3.497,35 ± 4.719,95 ± 116,25 ± 7,84
(melhor) 942,051 2.018,791 524,601 1.254,912 370,172 715,966 2.287,534 604,581 1.360,829
Volume 12.311,548 ± 4.939,497 ± 253,453 ± 12.477,272 ± 12.348,069 ± 3.100,542 ± 6.936,277 ± 12.412,038 ± 11.703,906 ± 9.517,046 ± 89,926 ±
(média) 674,86 193,111 36,423 545,102 882,142 337,768 425,9 720,181 524,261 223,934 1,136
Cobertura 1±0 1±0 0,462 ± 0,046 1 ± 0 1±0 0,627 ± 0,027 0,995 ± 0,003 1±0 1±0 1±0 0,206 ± 0,004
elementos
Cobertura 1±0 1±0 0,995 ± 0,006 1±0 1±0 0,819 ± 0,033 1±0 1±0 1±0 1±0 0,457 ± 0,013
linhas e
colunas
Sobreposição 0,62 ± 0,033 0,294 ± 0,009 0,012 ± 0,002 0,633 ± 0,027 0,618 ± 0,044 0,791 ± 0,014 0,45 ± 0,014 0,62 ± 0,036 0,596 ± 0,026 0,482 ± 0,011 0,003 ± 0,001
Jaccard 0,613 ± 0,033 0,348 ± 0,011 0,05 ± 0,004 0,63 ± 0,027 0,612 ± 0,044 0,812 ± 0,012 0,497 ± 0,013 0,612 ± 0,035 0,596 ± 0,027 0,528 ± 0,011 0,289 ± 0,004
Qtd. - 0±0 0±0 2,4 ± 1,392 0±0 0±0 0±0 0±0 0±0 0±0 0±0 48 ± 0
biclusters
Sucesso 0 0 95 0 0 0 0 0 0 0 100
VE 0,007 ± 0,548 -0,042 ± -0,068 ± -0,054 ± -0,153 ± -0,12 ± 0,66 -0,193 ± 0,105 ± 0,702 -0,195 ± -0,017 ± -0,701 ±
0,599 0,195 0,467 0,479 0,438 0,599 0,757 3,795
TVE -0,012 ± -0,169 ± 0,053 ± 0,235 0,048 ± 0,421 0,04 ± 0,305 -0,033 ± 0,47 -0,089 ± -0,042 ± -0,086 ± 0,085 ± 0,378 0,037 ± 0,268
0,276 0,512 0,398 0,244 0,339
MI 1,233 ± 0,038 1,09 ± 0,067 0,722 ± 0,327 1,219 ± 0,03 1,214 ± 0,046 1,097 ± 0,036 1,179 ± 0,033 1,227 ± 0,061 1,223 ± 0,047 1,156 ± 0,037 0,837 ± 0,226
LC 0,175 ± 0,009 0,166 ± 0,019 0,742 ± 0,27 0,178 ± 0,014 0,166 ± 0,008 0,199 ± 0,015 0,172 ± 0,014 0,165 ± 0,013 0,175 ± 0,015 0,177 ± 0,012 0,937 ± 0,034
RMS 0±0 0±0 0,074 ± 0,028 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,06 ± 0,001
(biclusters)
RMS 0,201 ± 0,002 0,187 ± 0,003 0,145 ± 0,01 0,202 ± 0,002 0,201 ± 0,002 0,199 ± 0,009 0,197 ± 0,007 0,201 ± 0,002 0,202 ± 0,002 0,202 ± 0,002 0,061 ± 0,001
(população)
CMS 0±0 0±0 0,056 ± 0,03 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,604 ± 0,006
(biclusters)
CMS 0,419 ± 0,006 0,395 ± 0,006 0,167 ± 0,014 0,425 ± 0,005 0,406 ± 0,009 0,412 ± 0,039 0,415 ± 0,014 0,398 ± 0,008 0,423 ± 0,004 0,406 ± 0,004 0,607 ± 0,006
(população)
MS 0±0 0±0 0,059 ± 0,023 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,383 ± 0,004
(biclusters)
MS 0,265 ± 0,003 0,25 ± 0,004 0,149 ± 0,011 0,267 ± 0,002 0,26 ± 0,004 0,261 ± 0,018 0,262 ± 0,008 0,257 ± 0,004 0,266 ± 0,002 0,26 ± 0,002 0,385 ± 0,003
(população)
179
Tabela 87: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Arabidopsis
Arabidopsis ABC 5 (J) BICACO 5 BIC-aiNet 1 CDE 4 (J) dFSS 5 (J) CGA 1 (J) FSGA 1 (J) GSO 5 (LC) MHS 5 (J) NichePSO 5 SwarmBclu
(J) (LC) (J) ster 1 (J)
Tempo 31,289 ± 51,737 ± 1,538 ± 31,155 ± 31,25 ± 31,844 ± 32,507 ± 31,185 ± 30,585 ± 31,398 ± 17,234 ±
0,034 0,039 0,119 0,06 0,124 0,437 0,296 0,091 0,072 0,125 0,545
MSR 622,011 ± 690,545 ± 504,282 ± 588,642 ± 582,663 ± 668,712 ± 671,147 ± 856,281 ± 652,072 ± 472,133 ± 184,02 ±
(melhor) 53,27 8,057 118,988 130,29 89,644 19,735 16,335 163,125 51,129 81,024 233,421
MSR 1.182,728 ± 692,139 ± 1.361,532 ± 1.148,331 ± 2.166,413 ± 670,3 ± 656,259 ± 3.134,551 ± 875,417 ± 2.258,237 ± 4.475,304 ±
(média) 72,971 1,57 547,905 71,207 149,559 20,494 23,681 218,079 21,714 181,971 3.367,153
Volume 6.210,95 ± 40.825,15 ± 1.711,45 ± 15.124,45 ± 7.277,6 ± 17.800,9 ± 22.306,9 ± 6.735,5 ± 10.264,15 ± 15.055,85 ± 3.911,7 ±
(melhor) 2.375,706 847,65 549,532 4.356,074 3.241,192 1.175,437 1.335,845 3.958,195 1.472,214 2.020,853 4.637,225
Volume 7.589,787 ± 36.135,949 664,475 ± 16.211,857 8.797,978 ± 14.381,926 16.857,39 ± 11.013,734 8.570,482 ± 9.519,889 ± 1.014,174 ±
(média) 434,991 ± 284,884 47,864 ± 829,555 496,662 ± 1.447,248 1.160,407 ± 381,663 374,682 217,51 155,188
Cobertura 0,998 ± 0,955 ± 0,486 ± 1±0 1±0 0,88 ± 0,925 ± 1±0 0,993 ± 1±0 0,882 ±
elementos 0,003 0,006 0,026 0,018 0,017 0,005 0,016
Cobertura 0,999 ± 0,956 ± 0,867 ± 1±0 1±0 0,959 ± 0,965 ± 1±0 0,999 ± 1±0 0,921 ±
linhas e 0,003 0,006 0,014 0,019 0,018 0,004 0,013
colunas
Sobreposi- 0,155 ± 0,823 ± 0,013 ± 0,339 ± 0,177 ± 0,814 ± 0,543 ± 0,216 ± 0,184 ± 0,192 ± 0,009 ±
ção 0,009 0,006 0,001 0,017 0,01 0,017 0,04 0,008 0,008 0,004 0,002
Jaccard 0,23 ± 0,01 0,88 ± 0,061 ± 0,399 ± 0,247 ± 0,83 ± 0,553 ± 0,298 ± 0,265 ± 0,284 ± 0,173 ±
0,002 0,003 0,012 0,01 0,013 0,03 0,007 0,01 0,003 0,009
Qtd. - 5,15 ± 49,3 ± 30,2 ± 3,25 ± 2,5 ± 1,395 49,6 ± 46,4 ± 5,96 0,2 ± 0,523 7 ± 2,103 1,65 ± 35,2 ±
biclusters 1,694 0,923 4,287 1,164 0,681 0,875 1,908
Sucesso 100 100 100 100 95 100 100 15 100 100 100
VE 0,023 ± 0,008 ± -0,003 ± 0,011 ± -0,035 ± -0,042 ± -0,034 ± 0,039 ± -0,019 ± 0,001 ± 0,034 ±
0,103 0,116 0,106 0,082 0,119 0,06 0,101 0,098 0,099 0,165 0,081
TVE -0,003 ± -0,015 ± 0,012 ± -0,001 ± -0,007 ± 0,001 ± -0,004 ± 0,004 ± 0,007 ± 0,013 ± -0,002 ±
0,026 0,029 0,037 0,053 0,049 0,024 0,029 0,051 0,042 0,034 0,027
MI 1,327 ± 1,228 ± 1,348 ± 1,222 ± 1,31 ± 1,273 ± 1,263 ± 1,336 ± 1,305 ± 1,195 ± 0,698 ±
0,047 0,012 0,062 0,145 0,057 0,043 0,023 0,075 0,06 0,037 0,563
LC 0,162 ± 0,087 ± 0,134 ± 0,149 ± 0,153 ± 0,108 ± 0,102 ± 0,176 ± 0,137 ± 0,12 ± 0,112 ±
0,022 0,001 0,013 0,136 0,021 0,004 0,004 0,051 0,012 0,008 0,163
180
Tabela 88: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Brain_1
Brain_1 ABC 3 (J) BICACO 4 BIC-aiNet 1 CDE 3 (J) dFSS 4 (J) CGA 1 FSGA 1 (J) GSO 5 (J) MHS 3 (J) NichePSO 5 SwarmBclu
(J) (LC) (LC) (J) ster 1 (J)
Tempo 57,789 ± 98,327 ± 2,152 ± 57,294 ± 57,117 ± 59,488 ± 59,46 ± 56,899 ± 56,236 ± 57,587 ± 32,245 ±
0,149 0,053 0,162 0,128 0,24 0,532 0,451 0,303 0,168 0,181 0,99
MSR 6.349,838 ± 8.924,425 ± 6.007,645 ± 7.501,192 ± 7.067,06 ± 8.611,366 ± 8.486,246 ± 11.600,027 7.208,653 ± 4.463,761 ± 4.482,294 ±
(melhor) 842,807 55,204 1.993,763 898,025 1.256,949 237,613 379,28 ± 934,815 703,261 331,202 154,211
MSR 16.698,673 8.913,422 ± 8.704,187 ± 13.595,547 19.008,917 8.503,982 ± 8.347,712 ± 22.658,206 13.161,765 17.391,678 9.199,252 ±
(média) ± 315,8 20,402 1.225,355 ± 332,734 ± 719,06 314,688 101,667 ± 694,072 ± 406,005 ± 597,37 3.161,211
Volume 39.363,5 ± 62.130,4 ± 1.638,8 ± 41.788,15 ± 23.733,1 ± 23.344,2 ± 29.780,3 ± 14.849,2 ± 42.213,2 ± 26.861,35 ± 56.483,2 ±
(melhor) 2.815,187 581,109 361,31 2.288,743 2.946,709 1.412,071 1.881,763 2.537,078 2.494,688 2.066,405 362,248
Volume 34.136,739 57.427,938 487,263 ± 31.598,812 24.983,737 18.681,95 ± 23.416,284 17.053,388 28.871,911 13.274,753 4.769,985 ±
(média) ± 1.595,862 ± 312,499 48,479 ± 1.057,402 ± 1.161,321 2.009,866 ± 1.316,655 ± 331,408 ± 1.552,653 ± 321,486 660,816
Cobertura 1±0 0,993 ± 0,295 ± 0,994 ± 1±0 0,787 ± 0,837 ± 1±0 0,988 ± 1±0 0,886 ±
elementos 0,001 0,025 0,007 0,032 0,021 0,008 0,009
Cobertura 1±0 0,993 ± 0,61 ± 0,996 ± 1±0 0,867 ± 0,881 ± 1±0 0,991 ± 1±0 0,907 ±
linhas e 0,001 0,024 0,008 0,046 0,027 0,01 0,01
colunas
Sobreposi- 0,518 ± 0,873 ± 0,007 ± 0,515 ± 0,369 ± 0,825 ± 0,566 ± 0,248 ± 0,476 ± 0,201 ± 0,029 ±
ção 0,023 0,005 0,001 0,017 0,017 0,021 0,031 0,005 0,024 0,005 0,008
Jaccard 0,553 ± 0,92 ± 0,062 ± 0,55 ± 0,424 ± 0,828 ± 0,533 ± 0,331 ± 0,516 ± 0,29 ± 0,225 ±
0,019 0,001 0,004 0,016 0,014 0,019 0,025 0,003 0,024 0,003 0,011
Qtd. - 1,1 ± 0,308 48,8 ± 33,9 ± 2,8 ± 1,105 1,45 ± 49,85 ± 48,65 ± 0±0 1,25 ± 0,55 1,25 ± 0,55 42,85 ±
biclusters 0,523 2,553 0,605 0,366 1,663 1,694
Sucesso 100 100 100 100 100 100 100 0 100 100 100
VE 0,128 ± 0,726 ± -0,038 ± 0,027 ± -0,14 ± 0,132 ± -0,151 ± -0,053 ± 0,155 ± 0,069 ± -0,747 ±
0,964 1,177 0,243 0,957 0,647 0,496 0,639 0,442 0,923 0,76 0,556
TVE 0,074 ± 0,063 ± -0,021 ± -0,109 ± -0,006 ± 0,061 ± 0,15 ± 0,041 ± 0,149 ± 0,056 ± 0,044 ±
0,484 0,664 0,353 0,756 0,54 0,561 0,565 0,431 0,554 0,58 0,555
MI 2,416 ± 2,76 ± 2,524 ± 2,453 ± 2,386 ± 2,482 ± 2,525 ± 2,328 ± 2,452 ± 2,357 ± 2,673 ±
0,052 0,013 0,118 0,058 0,086 0,064 0,055 0,113 0,04 0,046 0,004
LC 0,253 ± 0,256 ± 0,286 ± 0,25 ± 0,269 ± 0,27 ± 0,268 ± 0,297 ± 0,257 ± 0,253 ± 0,258 ± 0
0,008 0,001 0,023 0,008 0,019 0,015 0,012 0,023 0,007 0,012
181
Tabela 89: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Brain_2
Brain_2 ABC 4 (J) BICACO 1 BIC-aiNet 1 CDE 3 (J) dFSS 5 (J) CGA 1 (J) FSGA 1 GSO 5 (LC) MHS 4 (J) NichePSO 5 SwarmBclu
(J) (LC) (LC) (J) ster 1 (J)
Tempo 56,246 ± 96,44 ± 1,88 ± 56,028 ± 55,94 ± 58,223 ± 58,065 ± 55,681 ± 55,003 ± 56,678 ± 40,688 ±
0,071 0,054 0,153 0,104 0,238 0,53 0,466 0,244 0,132 0,118 1,127
MSR 195.832,516 287.683,559 177.708,304 253.798,768 234.762,645 275.784,083 267.565,738 453.832,69 230.498,524 110.376,603 230.778,937
(melhor) ± ± 2.114,247 ± ± 27.794,8 ± ± 8.853,233 ± ± ± ± ±
118.287,408 71.711,203 54.481,737 17.931,974 54.007,747 82.524,344 16.163,188 15.032,228
MSR 546.092,583 291.217,503 293.279,559 537.443,288 659.477,25 275.181,758 265.338,682 848.048,303 452.380,784 666.849,277 1.423.645,3
(média) ± ± 1.612,15 ± ± ± ± 6.700,99 ± ± ± ± 99 ±
21.909,453 41.476,862 14.248,631 26.491,883 10.090,619 19.071,262 12.332,035 20.997,239 352.199,213
Volume 9.079,7 ± 53.237,15 ± 1.354,75 ± 30.089 ± 9.023,75 ± 18.802,35 ± 23.565,15 ± 13.810,9 ± 12.358,05 ± 17.128,2 ± 50.156,4 ±
(melhor) 5.728,571 593,17 349,554 2.578,775 3.387,509 1.545,678 1.352,233 2.640,679 5.222,037 1.824,6 316,536
Volume 18.221,56 ± 49.191,649 411,841 ± 26.490,676 9.762,486 ± 14.623,009 17.922,041 14.205,762 16.209,551 10.787,153 3.228,491 ±
(média) 865,64 ± 299,161 63,984 ± 1.015,17 562,264 ± 1.616,951 ± 1.359,946 ± 361,472 ± 825,505 ± 336,614 569,179
Cobertura 1±0 0,99 ± 0,296 ± 1 ± 0,001 1±0 0,778 ± 0,823 ± 1±0 0,996 ± 1±0 0,909 ±
elementos 0,001 0,039 0,038 0,036 0,005 0,008
Cobertura 1±0 0,99 ± 0,582 ± 1±0 1±0 0,864 ± 0,878 ± 1±0 0,999 ± 1±0 0,928 ±
linhas e 0,001 0,037 0,04 0,05 0,005 0,008
colunas
Sobreposi- 0,344 ± 0,885 ± 0,007 ± 0,511 ± 0,175 ± 0,817 ± 0,566 ± 0,245 ± 0,331 ± 0,194 ± 0,018 ±
ção 0,018 0,005 0,001 0,018 0,009 0,01 0,032 0,006 0,016 0,007 0,004
Jaccard 0,393 ± 0,937 ± 0,064 ± 0,56 ± 0,02 0,244 ± 0,822 ± 0,542 ± 0,331 ± 0,392 ± 0,289 ± 0,239 ±
0,015 0,001 0,006 0,011 0,008 0,023 0,003 0,012 0,003 0,011
Qtd. - 2,05 ± 47,75 ± 33,3 ± 2,5 ± 0,688 3,35 ± 49,75 ± 46,9 ± 0±0 2,35 ± 1,05 ± 38,05 ±
biclusters 0,887 1,07 2,598 1,226 0,444 6,766 1,182 0,224 2,089
Sucesso 100 100 100 100 100 100 100 0 100 100 100
VE 0,027 ± 0,077 ± 0,009 ± 0,289 ± 0,084 ± 0,132 ± 0,027 ± 0,044 ± 0,028 ± 0,027 ± 0,579 ±
0,331 0,785 0,211 0,763 0,463 0,57 0,441 0,492 0,385 0,66 0,302
TVE 0,023 ± 0,081 ± -0,074 ± 0,159 ± -0,097 ± 0,099 ± 0,087 ± -0,067 ± -0,035 ± -0,096 ± 0,072 ±
0,255 0,417 0,27 0,38 0,259 0,376 0,379 0,312 0,314 0,345 0,513
MI 0,594 ± 0,95 ± 0,87 ± 0,824 ± 0,756 ± 0,84 ± 0,862 ± 0,805 ± 0,74 ± 0,734 ± 0,896 ±
0,325 0,006 0,098 0,032 0,062 0,035 0,03 0,043 0,058 0,031 0,003
LC 0,165 ± 0,152 ± 0,19 ± 0,179 ± 0,216 ± 0,182 ± 0,174 ± 0,207 ± 0,216 ± 0,197 ± 0,15 ± 0
0,087 0,001 0,021 0,006 0,02 0,007 0,005 0,017 0,02 0,009
182
Tabela 90: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Breast_Colon
Breast_Colo ABC 5 (LC) BICACO 4 BIC-aiNet 1 CDE 3 (J) dFSS 5 (J) CGA 1 (J) FSGA 1 (J) GSO 4 (J) MHS 4 (J) NichePSO 5 SwarmBclu
n (LC) (LC) (J) ster 1 (J)
Tempo 10,001 ± 14,863 ± 0,686 ± 9,973 ± 10,01 ± 10,625 ± 11,646 ± 10,097 ± 9,746 ± 10,178 ± 5,691 ±
0,039 0,036 0,07 0,059 0,065 0,19 0,184 0,035 0,047 0,103 0,12
MSR 19.653,008 21.634,018 17.314,333 18.126,949 18.847,845 20.644,907 20.499,358 37.991,985 16.367,054 11.091,328 15.779,793
(melhor) ± 2.124,779 ± 405,749 ± 3.925,278 ± 1.658,433 ± 2.546,742 ± 794,803 ± 968,714 ± ± 5.306,144 ± 997,427 ± 4.583,784
20.596,644
MSR 56.662,901 21.478,158 83.280,929 36.854,001 123.999,392 21.158,088 20.720,08 ± 210.259,067 31.206,077 131.852,835 107.870,683
(média) ± 7.004,637 ± 104,639 ± ± 1.418,689 ± ± 684,951 2.032,588 ± ± 1.032,375 ± ±
24.149,029 16.595,405 14.145,456 11.621,986 32.022,004
Volume 2.725,65 ± 12.575,35 ± 4.987,25 ± 13.554 ± 3.256,65 ± 7.332,95 ± 10.336,4 ± 2.959,2 ± 3.442,85 ± 8.130,2 ± 12.333,8 ±
(melhor) 1.032,002 878,164 4.385,898 649,306 1.017,792 556,322 633,257 2.398,698 2.047,609 652,519 3.140,329
Volume 2.834,576 ± 11.222,552 829,086 ± 8.570,554 ± 3.297,554 ± 5.551,336 ± 6.715,859 ± 5.799,344 ± 5.436,992 ± 3.772,607 ± 993,312 ±
(média) 123,578 ± 124,21 111,34 344,027 249,705 531,406 511,857 262,194 329,316 71,564 144,345
Cobertura 0,987 ± 0,898 ± 0,899 ± 0,97 ± 1±0 0,863 ± 0,91 ± 1±0 0,947 ± 1±0 0,941 ±
elementos 0,006 0,005 0,036 0,007 0,021 0,008 0,008 0,015
Cobertura 0,996 ± 0,9 ± 0,005 1 ± 0,001 0,975 ± 1±0 0,915 ± 0,924 ± 1±0 0,951 ± 1±0 0,997 ±
linhas e 0,005 0,009 0,01 0,007 0,011 0,004
colunas
Sobreposi- 0,155 ± 0,739 ± 0,043 ± 0,483 ± 0,178 ± 0,822 ± 0,58 ± 0,306 ± 0,31 ± 0,203 ± 0,036 ±
ção 0,007 0,006 0,006 0,02 0,014 0,015 0,037 0,014 0,019 0,004 0,006
Jaccard 0,233 ± 0,742 ± 0,086 ± 0,515 ± 0,253 ± 0,84 ± 0,609 ± 0,367 ± 0,373 ± 0,29 ± 0,218 ±
0,007 0,006 0,004 0,02 0,015 0,014 0,031 0,012 0,015 0,004 0,008
Qtd. - 2,9 ± 1,832 48,2 ± 16,1 ± 1,6 ± 0,754 3,1 ± 1,553 47,55 ± 40,8 ± 0,15 ± 1,75 ± 1,5 ± 0,607 32,25 ± 2,9
biclusters 0,951 4,025 9,556 11,857 0,366 0,786
Sucesso 95 100 100 100 100 100 100 15 100 100 100
VE -0,038 ± 0,308 ± 0,124 ± 0,249 ± 0,016 ± -0,011 ± -0,044 ± 0,054 ± 0,056 ± 0,152 ± 0,596 ±
0,413 0,653 0,447 0,636 0,326 0,309 0,711 0,352 0,379 0,499 1,449
TVE 0,195 ± 0,133 ± -0,161 ± 0,226 ± 0,124 ± 0,085 ± 0,076 ± 0,053 ± 0,078 ± 0,287 ± -0,085 ±
0,361 0,759 0,752 0,734 0,467 0,593 0,762 0,278 0,436 0,547 0,412
MI 1,668 ± 1,886 ± 1,762 ± 1,817 ± 1,748 ± 1,809 ± 1,827 ± 1,646 ± 1,681 ± 1,734 ± 1,778 ±
0,151 0,027 0,137 0,035 0,105 0,086 0,073 0,324 0,109 0,067 0,139
LC 0,266 ± 0,245 ± 0,261 ± 0,236 ± 0,265 ± 0,244 ± 0,239 ± 0,343 ± 0,266 ± 0,249 ± 0,255 ±
0,031 0,009 0,03 0,005 0,017 0,012 0,012 0,119 0,023 0,012 0,027
183
Tabela 91: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Lung
Lung ABC 3 (J) BICACO 5 BIC-aiNet 1 CDE 3 (J) dFSS 5 CGA 1 (J) FSGA 1 (J) GSO 5 (LC) MHS 4 (J) NichePSO 5 SwarmBclu
(J) (LC) (LC) (J) ster 1 (J)
Tempo 88,215 ± 155,078 ± 11,75 ± 87,92 ± 85,603 ± 88,215 ± 90,246 ± 85,052 ± 86,208 ± 86,743 ± 62,764 ±
0,162 0,262 0,81 0,181 0,256 0,754 0,867 0,285 0,248 0,187 1,978
MSR 21.357,029 35.581,634 24.599,725 26.436,373 31.559,716 33.937,312 32.421,085 43.242,365 34.472,028 16.830,103 14.179,604
(melhor) ± 1.628,878 ± 501,84 ± 6.990,798 ± 3.331,028 ± 2.935,759 ± 1.419,712 ± 1.389,15 ± 3.518,047 ± 1.775,378 ± 1.214,261 ± 594,299
MSR 58.385,057 35.490,846 29.372,019 48.269,927 61.668,977 34.597,946 32.268,713 76.857,372 42.787,399 61.956,86 ± 74.434,043
(média) ± 1.659,285 ± 93,541 ± 4.426,406 ± 895,377 ± 1.768,009 ± 680,918 ± 792,692 ± 1.654,282 ± 666,49 1.553,734 ± 28.424,94
Volume 211.822,9 ± 302.052,9 ± 10.339 ± 266.500,3 ± 70.654,85 ± 115.821,75 155.567,55 75.875,6 ± 150.668,9 ± 146.978,1 ± 271.167,4 ±
(melhor) 13.080,045 2.021,322 2.798,388 8.022,952 12.784,521 ± 4.915,403 ± 7.952,845 5.283,181 28.275,055 12.232,374 1.902,714
Volume 166.136,83 295.122,435 1.983,2 ± 165.396,227 54.530,175 99.478,336 121.273,318 77.135,775 104.385,253 63.593,527 9.329,472 ±
(média) ± 7.949,134 ± 550,177 291,644 ± 7.272,855 ± 3.593,98 ± 6.242,179 ± 8.455,37 ± 952,304 ± 3.787,033 ± 926,376 1.904,734
Cobertura 1±0 0,997 ± 0,269 ± 1±0 1±0 0,933 ± 0,979 ± 1±0 0,999 ± 0 1±0 0,896 ±
elementos 0,001 0,035 0,018 0,002 0,008
Cobertura 1±0 0,997 ± 0,755 ± 1±0 1±0 0,983 ± 0,992 ± 1±0 1±0 1±0 0,912 ±
linhas e 0,001 0,028 0,007 0,001 0,009
colunas
Sobreposi- 0,532 ± 0,954 ± 0,006 ± 0,533 ± 0,176 ± 0,816 ± 0,547 ± 0,246 ± 0,339 ± 0,204 ± 0,006 ±
ção 0,026 0,002 0,001 0,023 0,011 0,019 0,036 0,003 0,012 0,003 0,002
Jaccard 0,554 ± 0,966 ± 0,038 ± 0,556 ± 0,245 ± 0,828 ± 0,556 ± 0,33 ± 0,392 ± 0,289 ± 0,281 ±
0,024 0,001 0,003 0,021 0,012 0,017 0,032 0,002 0,01 0,002 0,012
Qtd. - 1,15 ± 48,85 ± 37,45 ± 2,2 ± 0,951 4,65 ± 50 ± 0 49,15 ± 0±0 6,15 ± 1,05 ± 39,2 ±
biclusters 0,366 0,489 2,704 1,387 1,725 1,755 0,224 2,966
Sucesso 100 100 100 100 100 100 100 0 100 100 100
VE -0,137 ± 0,148 ± 0,071 ± -0,109 ± -0,135 ± 0,143 ± -0,216 ± 0,005 ± 0,059 ± -0,154 ± 0,149 ±
0,95 0,524 0,231 0,746 0,505 0,689 0,796 0,423 0,792 0,675 0,531
TVE -0,5 ± 2,17 -0,008 ± -0,144 ± -0,545 ± 0,531 ± 0,178 ± 0,015 ± 0,402 ± 0,942 ± 0,539 ± 0,133 ±
1,449 1,058 1,383 1,954 2,058 2,566 1,67 1,696 2,121 0,848
MI 2,452 ± 2,481 ± 2,512 ± 2,475 ± 2,53 ± 2,534 ± 2,502 ± 2,528 ± 2,513 ± 2,478 ± 2,323 ±
0,024 0,007 0,099 0,019 0,058 0,045 0,033 0,053 0,038 0,031 0,007
LC 0,156 ± 0,164 ± 0,182 ± 0,162 ± 0,175 ± 0,168 ± 0,165 ± 0,175 ± 0,167 ± 0,162 ± 0,174 ±
0,006 0,001 0,015 0,004 0,009 0,006 0,005 0,008 0,007 0,007 0,001
184
Tabela 92: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Multitissue
Multitissue ABC 3 (J) BICACO 5 BIC-aiNet 1 CDE 3 (J) dFSS 5 CGA 1 (J) FSGA 1 (J) GSO 5 (LC) MHS 3 (J) NichePSO 5 SwarmBclu
(J) (LC) (LC) (J) ster 1 (J)
Tempo 78,248 ± 129,245 ± 9,377 ± 77,554 ± 75,831 ± 78,146 ± 79,773 ± 74,994 ± 76,467 ± 76,381 ± 54,221 ±
0,18 0,385 0,72 0,188 0,314 1,102 0,756 0,288 0,16 0,234 1,591
MSR 107.911,29 168.188,759 133.678,573 133.173,575 135.370,957 162.495,096 157.126,624 220.290,185 140.506,945 67.018,678 121.776,612
(melhor) ± 14.029,81 ± 2.071,385 ± 24.479,29 ± ± ± 4.357,713 ± 7.109,33 ± ± ± 9.968,584 ±
15.724,093 27.200,791 13.464,105 11.453,881 16.763,261
MSR 293.896,633 167.428,136 227.540,866 242.657,792 310.735,642 161.904,61 154.833,378 393.858,033 235.251,344 311.209,17 782.548,138
(média) ± 6.776,696 ± 494,899 ± ± 5.460,75 ± ± 4.625,208 ± 2.314,692 ± 9.413,478 ± 5.528,601 ± 6.642,773 ±
32.722,929 10.391,788 178.421,175
Volume 179.175,8 ± 235.692,5 ± 5.271,9 ± 204.349 ± 50.949,9 ± 91.193,55 ± 119.287,95 62.328,35 ± 210.478,95 113.938,1 ± 213.259,4 ±
(melhor) 9.260,047 6.044,17 2.069,835 6.032,228 11.421,451 4.507,794 ± 3.857,838 14.904,12 ± 4.001,737 8.680,585 6.270,148
Volume 135.557,501 225.004,421 1.798,328 ± 133.061,533 45.048,569 77.891,278 90.459,913 64.211,107 121.011,784 51.893,974 11.238,145
(média) ± 6.454,32 ± 572,923 260,257 ± 5.872,393 ± 2.901,916 ± 5.944,008 ± 6.152,419 ± 1.005,722 ± 3.702,844 ± 892,61 ± 3.458,408
Cobertura 1±0 0,999 ± 0 0,292 ± 0,995 ± 1±0 0,903 ± 0,942 ± 1±0 0,993 ± 1±0 0,872 ±
elementos 0,035 0,003 0,014 0,006 0,003 0,032
Cobertura 1±0 0,999 ± 0 0,81 ± 0,03 0,996 ± 1±0 0,959 ± 0,965 ± 1±0 0,995 ± 1±0 0,906 ±
linhas e 0,004 0,009 0,007 0,004 0,029
colunas
Sobreposi- 0,53 ± 0,909 ± 0,006 ± 0,531 ± 0,176 ± 0,811 ± 0,548 ± 0,248 ± 0,484 ± 0,204 ± 0,018 ±
ção 0,025 0,002 0,001 0,023 0,012 0,01 0,039 0,004 0,014 0,004 0,011
Jaccard 0,555 ± 0,92 ± 0,039 ± 0,556 ± 0,248 ± 0,823 ± 0,557 ± 0,331 ± 0,514 ± 0,29 ± 0,23 ±
0,023 0,001 0,004 0,023 0,013 0,009 0,035 0,003 0,013 0,003 0,018
Qtd. - 1,05 ± 48,85 ± 23,7 ± 3,45 2,4 ± 0,995 4,05 ± 50 ± 0 47,5 ± 0±0 1,2 ± 0,41 1,1 ± 0,308 35,65 ±
biclusters 0,224 1,04 1,276 2,065 3,15
Sucesso 100 100 100 100 100 100 100 0 100 100 100
VE 0,175 ± -0,294 ± 0,08 ± -0,343 ± 0,033 ± -0,239 ± 0,124 ± -0,093 ± 0,487 ± -0,06 ± 0,188 ±
1,025 0,737 0,399 0,997 0,534 0,629 0,946 0,669 1,293 1,049 0,962
TVE -0,01 ± 0,074 ± -0,057 ± 0,189 ± -0,005 ± 0,085 ± 0,084 ± -0,119 ± -0,199 ± 0,034 ± 0,1 ± 0,327
0,485 0,366 0,211 0,473 0,153 0,25 0,323 0,351 0,537 0,568
MI 0,723 ± 0,815 ± 0,751 ± 0,749 ± 0,706 ± 0,755 ± 0,753 ± 0,764 ± 0,756 ± 0,67 ± 0,02 0,756 ±
0,011 0,012 0,064 0,012 0,045 0,025 0,022 0,035 0,008 0,016
LC 0,115 ± 0,149 ± 0,181 ± 0,114 ± 0,146 ± 0,139 ± 0,126 ± 0,156 ± 0,115 ± 0,119 ± 0,15 ±
0,002 0,003 0,019 0,001 0,013 0,015 0,008 0,011 0,003 0,003 0,011
185
Tabela 93: Resultado da Fusão Direta com um algoritmo (com sobreposição) para Yeast
Yeast ABC 5 (J) BICACO 1 BIC-aiNet 1 CDE 2 (LC) dFSS 5 CGA 1 FSGA 1 GSO 5 (LC) MHS 4 (J) NichePSO 4 SwarmBclu
(LC) (LC) (LC) (LC) (LC) (LC) ster 1 (J)
Tempo 115,542 ± 96,468 ± 1,813 ± 115,571 ± 113,491 ± 119,21 ± 117,212 ± 115,038 ± 113,23 ± 116,841 ± 10,503 ±
0,107 1,011 0,146 0,173 4,33 1,212 1,327 0,349 0,142 0,392 0,538
MSR 174,114 ± 295,631 ± 297,06 ± 301,922 ± 177,935 ± 247,241 ± 232,587 ± 243,003 ± 214,369 ± 240,657 ± 260,956 ±
(melhor) 106,47 5,711 1,959 144,864 121,698 30,175 27,455 138,803 96,79 231,381 32,946
MSR 583,963 ± 320,13 ± 345,207 ± 665,483 ± 759,977 ± 239,131 ± 344,588 ± 1.009,704 ± 579,874 ± 909,127 ± 194,613 ±
(média) 37,44 8,24 27,195 15,438 46,299 121,717 99,963 20,734 35,734 27,087 16,783
Volume 1.570,65 ± 4.928,7 ± 906,65 ± 4.100,25 ± 1.764,9 ± 3.331 ± 3.739,2 ± 2.819 ± 2.227,7 ± 2.382 ± 4.999,65 ±
(melhor) 744,426 480,437 141,128 2.143,077 1.023,813 258,672 69,819 878,37 793,457 2.594,968 1.207,679
Volume 5.090,244 ± 3.806,093 ± 395,828 ± 16.017,278 6.409,865 ± 3.271,544 ± 4.639,385 ± 11.935,229 7.829,507 ± 10.741,271 1.894,49 ±
(média) 469,794 252,183 70,785 ± 885,019 864,755 1.055,905 1.476,903 ± 365,506 779,329 ± 542,233 198,167
Cobertura 0,914 ± 0,69 ± 0,306 ± 0,865 ± 0,996 ± 0,328 ± 0,424 ± 1±0 0,853 ± 1±0 0,607 ±
elementos 0,035 0,028 0,039 0,034 0,005 0,051 0,067 0,057 0,025
Cobertura 0,968 ± 0,891 ± 0,48 ± 0,876 ± 1±0 0,433 ± 0,523 ± 1±0 0,879 ± 1±0 0,704 ±
linhas e 0,04 0,016 0,027 0,042 0,075 0,097 0,073 0,015
colunas
Sobreposi- 0,136 ± 0,17 ± 0,01 ± 0,469 ± 0,143 ± 0,749 ± 0,409 ± 0,244 ± 0,237 ± 0,226 ± 0,083 ±
ção 0,011 0,013 0,002 0,023 0,018 0,037 0,087 0,008 0,021 0,013 0,012
Jaccard 0,198 ± 0,357 ± 0,037 ± 0,605 ± 0,205 ± 0,817 ± 0,527 ± 0,333 ± 0,339 ± 0,375 ± 0,068 ±
0,013 0,008 0,005 0,022 0,02 0,018 0,026 0,003 0,019 0,007 0,006
Qtd. - 5,85 ± 35 ± 3,277 34,5 ± 0,45 ± 3,2 ± 2,191 38,7 ± 28,25 ± 0,95 ± 3,3 ± 1,658 0,65 ± 40,3 ±
biclusters 3,031 3,103 0,686 18,918 17,627 0,605 0,671 2,003
Sucesso 100 100 100 35 90 100 100 80 100 55 100
VE 0,015 ± 0,836 ± 0,089 ± 0,353 ± -0,021 ± -0,012 ± -0,009 ± -0,195 ± -0,009 ± -0,409 ± 0,024 ±
0,068 2,018 0,735 1,474 0,496 0,139 0,114 0,567 0,064 1,03 1,283
TVE -0,801 ± -0,52 ± -0,149 ± -4,954 ± -6,437 ± -35,796 ± -4,001 ± -0,697 ± -0,969 ± -0,124 ± 0,731 ±
7,612 4,214 7,698 24,555 50,678 130,057 60,646 5,814 2,677 2,16 4,012
MI 0,293 ± 0,874 ± 1,094 ± 0,466 ± 0,299 ± 0,405 ± 0,391 ± 0,357 ± 0,356 ± 0,326 ± 1,116 ±
0,176 0,038 0,099 0,227 0,193 0,043 0,038 0,198 0,159 0,299 0,222
LC 0,423 ± 0,424 ± 0,295 ± 0,483 ± 0,4 ± 0,243 0,573 ± 0,564 ± 0,466 ± 0,514 ± 0,345 ± 0,325 ±
0,254 0,029 0,029 0,214 0,055 0,056 0,244 0,229 0,301 0,068
186
Tabela 94: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Artificial_2
Artificial_2 ABC 10 (LC) BICACO 8 BIC-aiNet 6 CDE 10 (LC) dFSS 6 (LC) CGA 6 (LC) FSGA 10 GSO 6 (J) MHS 10 NichePSO 7 SwarmBclust
(LC) (LC) (LC) (LC) (J) er 6 (LC)
Tempo 10,297 ± 5,478 ± 0,028 2,216 ± 0,314 10,009 ± 10,259 ± 9,017 ± 0,206 10,094 ± 10,425 ± 9,937 ± 0,041 10,022 ± 6,076 ± 0,032
0,031 0,049 0,062 0,119 0,056 0,074
MSR 18,793 ± 4,706 ± 1,531 1,276 ± 2,015 3,021 ± 4,683 6,079 ± 9,607 22,004 ± 17,433 ± 23,464 ± 4,666 ± 3,692 0,352 ± 1,459 0,361 ± 0,058
(melhor) 9,984 0,972 6,757 13,039
MSR (média) 29,524 ± 28,712 ± 21 ± 0,833 28,369 ± 26,496 ± 24,462 ± 29,721 ± 29,883 ± 29,2 ± 0,423 25,731 ± 0,102 ± 0,005
0,427 0,253 0,519 3,341 0,425 0,455 4,311 2,434
Volume 459,25 ± 723,3 ± 24,4 ± 15,776 88,1 ± 58,1 ± 2.756,75 ± 81,35 ± 7.613,55 ± 197,2 ± 2,2 ± 1,735 141,95 ±
(melhor) 604,627 98,496 182,625 225,125 433,262 100,73 8.758,799 260,433 22,698
Volume 1.816,754 ± 1.442,406 ± 198,65 ± 1.709,938 ± 6.139,475 ± 3.344,684 ± 2.064,888 ± 13.289,102 ± 1.742,232 ± 3.507,127 ± 79,686 ± 1,21
(média) 85,882 85,2 26,173 91,59 1.448,319 241,184 140,926 4.408,712 116,744 379,63
Cobertura 0,995 ± 0,002 0,966 ± 0,008 0,387 ± 0,042 0,991 ± 0,005 1 ± 0 0,638 ± 0,035 0,969 ± 0,009 1±0 0,996 ± 0,002 1±0 0,183 ± 0,005
elementos
Cobertura 1±0 1±0 0,997 ± 0,005 1±0 1±0 0,814 ± 0,045 0,998 ± 0,004 1±0 1±0 1±0 0,224 ± 0,01
linhas e
colunas
Sobreposição 0,088 ± 0,004 0,077 ± 0,004 0,009 ± 0,001 0,083 ± 0,005 0,33 ± 0,067 0,296 ± 0,028 0,111 ± 0,01 0,558 ± 0,27 0,081 ± 0,007 0,131 ± 0,022 0,002 ± 0,001
Jaccard 0,149 ± 0,009 0,153 ± 0,005 0,046 ± 0,003 0,139 ± 0,01 0,184 ± 0,054 0,363 ± 0,026 0,165 ± 0,013 0,433 ± 0,325 0,138 ± 0,01 0,127 ± 0,022 0,399 ± 0,014
Qtd. - 0,25 ± 0,55 0±0 2,05 ± 1,276 0,75 ± 0,716 0,8 ± 0,834 0±0 0,05 ± 0,224 0,15 ± 0,366 0,2 ± 0,41 2,3 ± 1,418 48 ± 0
biclusters
Sucesso 20 0 90 60 60 0 5 15 20 95 100
VE -0,049 ± 0,11 0,196 ± 0,761 -0,063 ± 0,23 -0,042 ± 0,017 ± 0,087 0,003 ± 0,241 -0,001 ± -0,01 ± 0,104 0,342 ± 1,014 0±0 0,2 ± 1,876
0,213 0,098
TVE 0,045 ± 0,139 -0,37 ± 0,775 -0,052 ± -0,091 ± 0,013 ± 0,054 -0,103 ± 0,014 ± 0,117 0,007 ± 0,213 -0,008 ± 0±0 0,077 ± 0,491
0,233 0,448 0,498 0,587
MI 1,094 ± 0,577 0,487 ± 0,064 0,675 ± 0,488 0,309 ± 0,357 0,405 ± 0,568 1,115 ± 0,073 1,153 ± 0,418 1,033 ± 0,475 0,543 ± 0,186 0,092 ± 0,227 0,465 ± 0,197
LC 0,225 ± 0,138 0,315 ± 0,022 0,702 ± 0,39 0,218 ± 0,296 0,271 ± 0,405 0,209 ± 0,018 0,451 ± 0,283 0,185 ± 0,186 0,373 ± 0,18 0,2 ± 0,41 0,762 ± 0,172
RMS 0,005 ± 0,013 0±0 0,04 ± 0,028 0,008 ± 0,018 0,002 ± 0,007 0±0 0±0 0,002 ± 0,007 0,031 ± 0,085 0,011 ± 0,012 0,033 ± 0,001
(biclusters)
RMS 0,155 ± 0,009 0,184 ± 0,007 0,097 ± 0,006 0,155 ± 0,007 0,112 ± 0,025 0,295 ± 0,014 0,146 ± 0,008 0,172 ± 0,032 0,152 ± 0,009 0,11 ± 0,013 0,033 ± 0,001
(população)
CMS 0,005 ± 0,01 0±0 0,036 ± 0,019 0,015 ± 0,023 0,003 ± 0,007 0±0 0±0 0,004 ± 0,009 0,032 ± 0,077 0,008 ± 0,009 0,445 ± 0,007
(biclusters)
CMS 0,259 ± 0,009 0,272 ± 0,009 0,114 ± 0,009 0,251 ± 0,013 0,241 ± 0,054 0,504 ± 0,021 0,271 ± 0,017 0,391 ± 0,084 0,243 ± 0,016 0,216 ± 0,017 0,445 ± 0,007
(população)
MS 0,004 ± 0,01 0±0 0,035 ± 0,021 0,011 ± 0,018 0,003 ± 0,005 0±0 0±0 0,003 ± 0,007 0,028 ± 0,069 0,009 ± 0,007 0,29 ± 0,004
(biclusters)
MS 0,192 ± 0,008 0,216 ± 0,006 0,102 ± 0,007 0,189 ± 0,009 0,159 ± 0,035 0,37 ± 0,014 0,194 ± 0,011 0,248 ± 0,049 0,182 ± 0,01 0,148 ± 0,012 0,29 ± 0,004
(população)
187
Artificial_4 ABC 10 (LC) BICACO 7 BIC-aiNet 6 CDE 10 (LC) dFSS 10 CGA 6 (LC) FSGA 10 GSO 6 (J) MHS 10 NichePSO 6 SwarmBclust
(J) (LC) (LC) (LC) (LC) (J) er 6 (J)
Tempo 10,307 ± 5,501 ± 0,04 1,834 ± 0,249 10,051 ± 10,325 ± 9,292 ± 0,17 9,995 ± 0,126 10,437 ± 10,01 ± 0,035 10,102 ± 5,645 ± 0,029
0,038 0,042 0,059 0,042 0,056
MSR 14,727 ± 10,86 ± 0,393 1,029 ± 0,892 5,241 ± 3,94 5,028 ± 5,335 14,724 ± 0,66 9,504 ± 5,736 15,053 ± 3,114 ± 2,851 0,351 ± 1,106 0,331 ± 0,071
(melhor) 3,766 11,333
MSR (média) 20,631 ± 18,51 ± 0,191 14,705 ± 19,884 ± 20,745 ± 16,199 ± 19,443 ± 19,002 ± 20,553 ± 18,483 ± 1,993 ± 0,439
0,369 0,641 0,412 0,517 0,335 0,614 6,122 0,418 1,944
Volume 757,15 ± 2.893,75 ± 77,35 ± 343,3 ± 71,2 ± 2.998,4 ± 639,6 ± 11.342,55 ± 151,2 ± 202,2 3,45 ± 4,673 120,15 ±
(melhor) 780,834 189,791 177,218 361,728 254,987 431,212 1.131,727 9.035,297 6,915
Volume 1.780,185 ± 1.628,777 ± 233,162 ± 1.791,147 ± 1.748,533 ± 3.535,208 ± 2.035,79 ± 14.815,774 ± 1.736,252 ± 3.607,632 ± 84,888 ±
(média) 111,036 46,591 29,504 77,663 87,344 179,193 140,47 5.700,171 101,362 458,197 1,249
Cobertura 0,993 ± 0,003 0,937 ± 0,005 0,438 ± 0,041 0,988 ± 0,005 1±0 0,659 ± 0,031 0,932 ± 0,018 1 ± 0 0,992 ± 0,002 1±0 0,185 ± 0,004
elementos
Cobertura 1±0 0,997 ± 0,003 0,997 ± 0,005 1±0 1±0 0,817 ± 0,038 0,99 ± 0,01 1±0 1±0 1±0 0,364 ± 0,012
linhas e
colunas
Sobreposição 0,085 ± 0,006 0,097 ± 0,003 0,011 ± 0,001 0,089 ± 0,006 0,078 ± 0,004 0,291 ± 0,024 0,122 ± 0,013 0,44 ± 0,37 0,082 ± 0,006 0,132 ± 0,023 0,003 ± 0,001
Jaccard 0,143 ± 0,009 0,172 ± 0,003 0,05 ± 0,003 0,146 ± 0,011 0,115 ± 0,006 0,367 ± 0,025 0,179 ± 0,018 0,339 ± 0,397 0,138 ± 0,009 0,125 ± 0,02 0,299 ± 0,003
Qtd. - 0±0 0±0 2,2 ± 1,24 0,45 ± 0,759 0,6 ± 0,883 0±0 0,15 ± 0,366 0,55 ± 0,999 0,35 ± 0,489 2,5 ± 1,539 36,4 ± 2,798
biclusters
Sucesso 0 0 90 30 40 0 15 35 35 90 100
VE 0,023 ± 0,09 0,006 ± 0,105 -0,015 ± -0,009 ± -0,003 ± -0,003 ± -0,009 ± 0,108 ± 0,205 -0 ± 0,041 0,014 ± 0,05 -0,163 ±
0,071 0,055 0,054 0,076 0,064 0,313
TVE -0,003 ± 0,003 ± 0,053 -0,006 ± -0,003 ± -0,008 ± 0,002 ± 0,048 0,01 ± 0,055 -0,006 ± -0,031 ± -0,002 ± 0,012 ± 0,031
0,057 0,097 0,036 0,056 0,037 0,033 0,057
MI 1,105 ± 0,198 0,785 ± 0,018 0,668 ± 0,35 0,54 ± 0,318 0,604 ± 0,481 0,968 ± 0,042 0,887 ± 0,367 0,629 ± 0,475 0,492 ± 0,235 0,166 ± 0,349 0,56 ± 0,245
LC 0,336 ± 0,263 0,149 ± 0,005 0,715 ± 0,243 0,27 ± 0,225 0,401 ± 0,369 0,152 ± 0,012 0,365 ± 0,356 0,056 ± 0,042 0,439 ± 0,284 0,169 ± 0,364 0,855 ± 0,126
RMS 0±0 0±0 0,073 ± 0,055 0,009 ± 0,015 0,005 ± 0,009 0±0 0,003 ± 0,008 0,009 ± 0,013 0,026 ± 0,063 0,015 ± 0,016 0,047 ± 0,001
(biclusters)
RMS 0,17 ± 0,007 0,197 ± 0,004 0,127 ± 0,008 0,174 ± 0,006 0,147 ± 0,005 0,242 ± 0,009 0,174 ± 0,011 0,191 ± 0,059 0,168 ± 0,006 0,131 ± 0,012 0,049 ± 0,001
(população)
CMS 0±0 0±0 0,056 ± 0,037 0,013 ± 0,026 0,01 ± 0,015 0±0 0,006 ± 0,019 0,006 ± 0,011 0,019 ± 0,038 0,013 ± 0,009 0,584 ± 0,008
(biclusters)
CMS 0,264 ± 0,012 0,305 ± 0,007 0,147 ± 0,012 0,264 ± 0,014 0,23 ± 0,008 0,417 ± 0,017 0,292 ± 0,022 0,352 ± 0,122 0,252 ± 0,012 0,218 ± 0,023 0,592 ± 0,008
(população)
MS 0±0 0±0 0,059 ± 0,045 0,009 ± 0,018 0,006 ± 0,01 0±0 0,004 ± 0,012 0,006 ± 0,009 0,023 ± 0,048 0,012 ± 0,008 0,353 ± 0,004
(biclusters)
MS 0,195 ± 0,007 0,226 ± 0,004 0,131 ± 0,01 0,197 ± 0,009 0,17 ± 0,006 0,299 ± 0,01 0,211 ± 0,013 0,229 ± 0,077 0,189 ± 0,007 0,154 ± 0,015 0,357 ± 0,004
(população)
188
Artificial_6 ABC 10 (LC) BICACO 7 BIC-aiNet 6 CDE 10 (LC) dFSS 10 CGA 6 (LC) FSGA 10 GSO 6 (J) MHS 10 NichePSO 7 SwarmBclust
(LC) (LC) (LC) (LC) (LC) (LC) er 6 (J)
Tempo 10,34 ± 0,078 5,494 ± 0,057 1,854 ± 0,278 10,05 ± 0,099 10,314 ± 9,001 ± 0,174 10,124 ± 10,461 ± 10,016 ± 10,088 ± 5,456 ± 0,077
0,092 0,156 0,081 0,075 0,085
MSR 4,743 ± 8,453 16,038 ± 1,013 ± 0,979 5,424 ± 4,948 4,686 ± 6,528 20,322 ± 15,637 ± 7,22 22,072 ± 8,612 ± 4,088 0,012 ± 0,053 0,324 ± 0,046
(melhor) 0,416 0,751 13,09
MSR (média) 26,931 ± 26,713 ± 18,041 ± 26,219 ± 26,598 ± 22,195 ± 26,776 ± 26,33 ± 7,326 27,065 ± 23,65 ± 2,335 0,355 ± 0,029
0,356 0,219 1,012 0,492 0,823 0,408 0,669 0,384
Volume 306,9 ± 2.290,25 ± 27,25 ± 120,6 ± 9,6 ± 15,132 2.658 ± 209,75 ± 11.319,55 ± 446,55 ± 2,05 ± 1,432 116,25 ± 7,84
(melhor) 807,315 112,321 16,412 197,697 449,53 566,903 8.207,284 290,399
Volume 1.802,907 ± 1.608,2 ± 249,206 ± 1.712,766 ± 1.708,544 ± 3.104,942 ± 1.997,903 ± 13.996,314 ± 1.711,497 ± 3.453,164 ± 89,926 ±
(média) 89,986 54,186 34,521 95,781 82,928 197,248 161,729 4.773,579 87,314 372,313 1,136
Cobertura 0,996 ± 0,002 0,972 ± 0,006 0,458 ± 0,045 0,99 ± 0,004 1±0 0,627 ± 0,027 0,957 ± 0,015 1±0 0,995 ± 0,002 1±0 0,206 ± 0,004
elementos
Cobertura 1±0 1±0 0,995 ± 0,006 1±0 1±0 0,819 ± 0,033 0,996 ± 0,007 1±0 1±0 1±0 0,457 ± 0,013
linhas e
colunas
Sobreposição 0,087 ± 0,006 0,086 ± 0,003 0,012 ± 0,002 0,083 ± 0,006 0,075 ± 0,005 0,273 ± 0,018 0,112 ± 0,014 0,547 ± 0,309 0,08 ± 0,004 0,127 ± 0,019 0,003 ± 0,001
Jaccard 0,147 ± 0,01 0,16 ± 0,004 0,049 ± 0,003 0,143 ± 0,01 0,111 ± 0,008 0,348 ± 0,016 0,17 ± 0,021 0,445 ± 0,382 0,142 ± 0,01 0,121 ± 0,019 0,289 ± 0,004
Qtd. - 0,7 ± 0,571 0±0 2,4 ± 1,392 0,45 ± 0,686 0,8 ± 1,196 0±0 0,1 ± 0,308 0,3 ± 0,571 0,15 ± 0,489 3,05 ± 1,504 48 ± 0
biclusters
Sucesso 65 0 95 35 45 0 10 25 10 100 100
VE 0,077 ± 0,32 -0,045 ± -0,103 ± 0,24 0,101 ± 0,184 -0,058 ± 0,17 -0,139 ± 0,52 0,028 ± 0,215 -0,395 ± 0,011 ± 0,409 0±0 -0,701 ±
0,535 0,705 3,795
TVE 0,084 ± 0,373 -0,017 ± 0,08 ± 0,258 0,166 ± 0,391 0,004 ± 0,129 -0,078 ± -0,056 ± -0,055 ± 0,23 ± 0,607 0±0 0,037 ± 0,268
0,499 0,381 0,276 0,334
MI 0,44 ± 0,465 0,972 ± 0,013 0,771 ± 0,284 0,514 ± 0,36 0,575 ± 0,473 1,103 ± 0,034 0,914 ± 0,354 0,816 ± 0,439 0,739 ± 0,291 0,069 ± 0,213 0,837 ± 0,226
LC 0,418 ± 0,444 0,194 ± 0,003 0,789 ± 0,209 0,449 ± 0,377 0,58 ± 0,448 0,2 ± 0,014 0,627 ± 0,323 0,15 ± 0,208 0,345 ± 0,246 0,1 ± 0,308 0,937 ± 0,034
RMS 0,027 ± 0,027 0±0 0,074 ± 0,027 0,01 ± 0,015 0,02 ± 0,025 0±0 0,007 ± 0,021 0,007 ± 0,013 0,004 ± 0,013 0,03 ± 0,006 0,06 ± 0,001
(biclusters)
RMS 0,166 ± 0,004 0,168 ± 0,003 0,144 ± 0,01 0,164 ± 0,003 0,144 ± 0,006 0,209 ± 0,011 0,162 ± 0,007 0,178 ± 0,04 0,166 ± 0,006 0,131 ± 0,009 0,061 ± 0,001
(população)
CMS 0,025 ± 0,021 0±0 0,056 ± 0,03 0,012 ± 0,019 0,015 ± 0,018 0±0 0,004 ± 0,012 0,007 ± 0,013 0,003 ± 0,01 0,028 ± 0,007 0,604 ± 0,006
(biclusters)
CMS 0,262 ± 0,01 0,284 ± 0,005 0,166 ± 0,013 0,253 ± 0,009 0,233 ± 0,008 0,406 ± 0,017 0,272 ± 0,019 0,368 ± 0,099 0,246 ± 0,008 0,219 ± 0,023 0,607 ± 0,006
(população)
MS 0,024 ± 0,021 0±0 0,059 ± 0,022 0,01 ± 0,015 0,012 ± 0,015 0±0 0,004 ± 0,012 0,005 ± 0,01 0,003 ± 0,01 0,021 ± 0,007 0,383 ± 0,004
(biclusters)
MS 0,187 ± 0,006 0,197 ± 0,004 0,148 ± 0,011 0,183 ± 0,005 0,166 ± 0,006 0,267 ± 0,011 0,192 ± 0,01 0,233 ± 0,058 0,181 ± 0,006 0,151 ± 0,013 0,385 ± 0,003
(população)
189
Tabela 97: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Arabidopsis
Arabidopsis ABC 9 (J) BICACO 6 BIC-aiNet 6 CDE 8 (J) dFSS 10 (J) CGA 6 FSGA 6 (J) GSO 10 MHS 7 (J) NichePSO SwarmBclu
(J) (LC) (LC) (LC) 10 (J) ster 6 (J)
Tempo 31,231 ± 51,262 ± 1,534 ± 30,976 ± 31,161 ± 31,629 ± 32,288 ± 30,514 ± 30,489 ± 31,207 ± 17,217 ±
0,038 0,05 0,117 0,058 0,117 0,426 0,295 0,09 0,062 0,104 0,535
MSR 464,26 ± 585,645 ± 504,282 ± 446,541 ± 554,817 ± 670,54 ± 672,142 ± 445,903 ± 313,765 ± 414,453 ± 143,872 ±
(melhor) 192,602 216,754 118,988 204,118 129,276 18,142 16,697 167,104 229,626 165,028 215,296
MSR 11.802,993 3.854,482 ± 1.362,445 ± 10.433,615 2.513,321 ± 691,795 ± 626,689 ± 2.900,392 ± 9.524,674 ± 5.107,118 ± 4.535,173 ±
(média) ± 1.394,727 549,593 ± 9.009,51 842,122 13,851 378,991 2.216,202 4.061,979 5.318,818 3.485,924
10.507,742
Volume 958,55 ± 22.545,15 ± 1.711,45 ± 6.426,9 ± 4.105,65 ± 17.588,9 ± 22.106,85 ± 1.282,8 ± 174,25 ± 2.318,9 ± 245,7 ±
(melhor) 1.587,917 17.932,876 549,532 10.791,698 2.978,27 1.232,682 1.520,855 1.363,8 229,25 3.138,661 449,238
Volume 5.673,261 ± 2.227,167 ± 663,938 ± 7.010,661 ± 4.347,542 ± 14.009,08 ± 5.672,174 ± 4.429,251 ± 6.618,15 ± 3.533,961 ± 925,315 ±
(média) 400,611 651,099 47,793 589,523 284,269 663,646 787,016 319,181 582,228 177,765 47,489
Cobertura 1±0 0,955 ± 0,486 ± 1±0 1±0 0,88 ± 0,925 ± 1±0 1±0 1±0 0,882 ±
elementos 0,006 0,026 0,018 0,017 0,016
Cobertura 1±0 0,956 ± 0,867 ± 1±0 1±0 0,959 ± 0,965 ± 1±0 1±0 1±0 0,921 ±
linhas e 0,006 0,014 0,019 0,018 0,013
colunas
Sobreposi- 0,094 ± 0,026 ± 0,012 ± 0,106 ± 0,078 ± 0,316 ± 0,075 ± 0,07 ± 0,102 ± 0,053 ± 0,007 ±
ção 0,009 0,003 0,001 0,011 0,006 0,018 0,017 0,007 0,013 0,004 0,002
Jaccard 0,077 ± 0,062 ± 0,061 ± 0,08 ± 0,096 ± 0,354 ± 0,09 ± 0,075 ± 0,065 ± 0,067 ± 0,149 ±
0,009 0,013 0,003 0,011 0,009 0,024 0,022 0,006 0,008 0,005 0,011
Qtd. - 13,05 ± 21,95 ± 30,2 ± 11,8 ± 10,75 ± 7,05 ± 20,25 ± 14,35 ± 12 ± 3,713 13,2 ± 34,95 ±
biclusters 2,665 3,62 4,287 2,587 2,673 1,146 3,905 3,265 2,441 2,012
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE 0,017 ± -0,043 ± -0,003 ± 0,01 ± 0,01 ± -0,046 ± -0,035 ± 0,019 ± -0,014 ± -0,026 ± -0,011 ±
0,049 0,144 0,106 0,107 0,071 0,052 0,081 0,074 0,026 0,066 0,062
TVE -0 ± 0,042 0,002 ± 0,012 ± -0,018 ± 0,003 ± -0,01 ± 0,001 ± 0,001 ± -0 ± 0,048 0,002 ± 0,01 ±
0,024 0,037 0,066 0,038 0,028 0,031 0,029 0,031 0,029
MI 1,27 ± 1,12 ± 0,43 1,348 ± 1,222 ± 1,316 ± 1,277 ± 1,264 ± 1,391 ± 0,957 ± 1,303 ± 0,899 ±
0,243 0,062 0,206 0,078 0,04 0,026 0,101 0,359 0,097 0,78
LC 0,262 ± 0,172 ± 0,134 ± 0,331 ± 0,167 ± 0,109 ± 0,103 ± 0,204 ± 0,555 ± 0,217 ± 0,191 ±
0,117 0,22 0,013 0,234 0,028 0,004 0,005 0,035 0,273 0,073 0,282
190
Tabela 98: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Brain_1
Brain_1 ABC 9 (J) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 9 CGA 6 FSGA 6 (J) GSO 10 MHS 6 NichePSO SwarmBclu
(J) (LC) (LC) (LC) (LC) (LC) 10 (J) ster 6 (J)
Tempo 57,456 ± 97,524 ± 2,146 ± 56,778 ± 56,738 ± 59,169 ± 59,091 ± 55,389 ± 55,83 ± 57,458 ± 32,201 ±
0,199 0,046 0,161 0,118 0,255 0,503 0,453 0,272 0,169 0,245 1,012
MSR 4.958,517 ± 0±0 6.007,645 ± 1.341,143 ± 5.953,886 ± 8.619,742 ± 8.449,534 ± 5.713,689 ± 989,352 ± 5.712,622 ± 4.482,294 ±
(melhor) 2.849,247 1.993,763 2.330,322 1.966,749 237,769 322,713 2.440,229 2.034,791 2.350,425 154,211
MSR 33.598,82 ± 76.794,372 8.710,365 ± 63.445,82 ± 20.863,477 9.214,914 ± 8.559,622 ± 17.298,306 61.680,798 33.192,706 9.833,037 ±
(média) 16.669,02 ± 1.229,177 31.552,529 ± 4.354,875 410,339 2.896,669 ± 2.629,792 ± ± 3.230,924
14.112,785 21.678,503 21.148,407
Volume 2.926,25 ± 46,55 ± 1.638,8 ± 264,8 ± 3.592,4 ± 23.319,6 ± 29.340,35 ± 791,55 ± 533,2 ± 3.910,1 ± 56.483,2 ±
(melhor) 6.869,04 1,356 361,31 200,104 5.450,918 1.435,038 2.065,041 1.038,423 472,778 7.058,57 362,248
Volume 7.435,703 ± 2.107,614 ± 487,155 ± 7.262,63 ± 8.545,195 ± 17.603,068 5.552,912 ± 5.575,427 ± 5.487,541 ± 4.579,571 ± 1.721,998 ±
(média) 622,307 190,541 48,442 1.738,348 836,798 ± 1.157,186 602,864 380,568 1.414,322 193,442 210,57
Cobertura 1±0 0,993 ± 0,295 ± 0,998 ± 1±0 0,787 ± 0,837 ± 1±0 0,993 ± 1±0 0,886 ±
elementos 0,001 0,025 0,002 0,032 0,021 0,007 0,009
Cobertura 1±0 0,993 ± 0,61 ± 1±0 1±0 0,867 ± 0,881 ± 1±0 0,997 ± 1±0 0,907 ±
linhas e 0,001 0,024 0,046 0,027 0,007 0,01
colunas
Sobreposi- 0,089 ± 0,016 ± 0,007 ± 0,095 ± 0,109 ± 0,326 ± 0,059 ± 0,054 ± 0,075 ± 0,05 ± 0,013 ±
ção 0,011 0,004 0,001 0,026 0,013 0,029 0,011 0,007 0,013 0,003 0,002
Jaccard 0,068 ± 0,18 ± 0,062 ± 0,059 ± 0,072 ± 0,318 ± 0,1 ± 0,026 0,057 ± 0,048 ± 0,058 ± 0,258 ±
0,012 0,035 0,004 0,013 0,009 0,038 0,006 0,01 0,004 0,011
Qtd. - 8,7 ± 3,181 15,5 ± 33,9 ± 9,3 ± 2,867 10,3 ± 6,5 ± 1,051 22,95 ± 10,8 ± 11,3 ± 8,6 ± 2,836 41,2 ±
biclusters 2,947 2,553 2,577 3,72 2,505 2,716 1,765
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE -0,03 ± 0±0 -0,038 ± 0,003 ± -0,026 ± 0,161 ± -0,275 ± -0,009 ± 0,004 ± 0,03 ± -0,747 ±
0,232 0,243 0,022 0,369 0,468 0,605 0,199 0,017 0,221 0,556
TVE -0,009 ± 0±0 -0,021 ± -0,106 ± -0,066 ± 0,016 ± -0,294 ± -0,022 ± 0,046 ± 0,039 ± 0,044 ±
0,253 0,353 0,489 0,512 0,545 0,555 0,254 0,206 0,355 0,555
MI 1,391 ± 0±0 2,524 ± 0,185 ± 1,946 ± 2,48 ± 2,528 ± 1,939 ± 0,12 ± 1,799 ± 2,673 ±
0,739 0,118 0,291 0,481 0,066 0,05 0,339 0,247 0,511 0,004
LC 0,464 ± 0±0 0,286 ± 0,274 ± 0,348 ± 0,271 ± 0,269 ± 0,359 ± 0,18 ± 0,37 0,377 ± 0,258 ± 0
0,269 0,023 0,43 0,089 0,015 0,014 0,059 0,112
191
Tabela 99: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Brain_2
Brain_2 ABC 9 (J) BICACO 6 BIC-aiNet 6 CDE 7 (LC) dFSS 9 (J) CGA 6 FSGA 6 GSO 10 MHS 7 (J) NichePSO SwarmBclu
(J) (LC) (LC) (LC) (LC) 10 (J) ster 6 (J)
Tempo 56,032 ± 95,794 ± 1,874 ± 55,67 ± 55,815 ± 57,982 ± 57,772 ± 54,465 ± 54,784 ± 56,399 ± 40,65 ±
0,073 0,044 0,164 0,113 0,246 0,52 0,453 0,238 0,105 0,125 1,098
MSR 128.186,425 0±0 177.708,304 83.158,493 166.629,696 276.227,223 264.565,979 123.707,84 83.075,758 130.875,355 230.778,937
(melhor) ± ± ± ± ± 9.222,478 ± ± ± ± ±
90.938,848 71.711,203 100.181,455 69.419,789 18.132,706 82.549,786 106.001,463 86.746,352 15.032,228
MSR 1.164.210,2 3.052.689,1 293.440,878 1.842.121,9 775.795,152 305.953,941 274.750,169 637.107,498 1.706.913,5 937.718,98 1.429.542,7
(média) 68 ± 25 ± ± 78 ± ± ± ± ± 65 ± ± 91 ±
209.220,227 546.417,147 41.506,792 503.495,602 185.567,759 20.912,192 100.755,753 67.570,956 557.548,093 170.816,404 322.479,561
Volume 2.023,7 ± 39,6 ± 1.354,75 ± 57,05 ± 2.699,9 ± 18.623,8 ± 23.296,5 ± 439,55 ± 108,45 ± 1.835,15 ± 50.156,4 ±
(melhor) 4.721,726 1,429 349,554 79,017 3.738,869 1.637,61 1.147,496 577,196 107,775 3.825,714 316,536
Volume 5.746,095 ± 1.897,662 ± 411,672 ± 6.767,484 ± 6.785,135 ± 13.513,388 4.743,436 ± 4.711,822 ± 5.908,095 ± 3.714,239 ± 1.215,712 ±
(média) 668,424 182,448 63,973 729,033 487,339 ± 1.171,078 809,799 338,765 555,059 189,551 54,889
Cobertura 1 ± 0,001 0,99 ± 0,296 ± 1±0 1±0 0,778 ± 0,823 ± 1±0 1 ± 0,001 1±0 0,909 ±
elementos 0,001 0,039 0,038 0,036 0,008
Cobertura 1±0 0,99 ± 0,582 ± 1±0 1±0 0,864 ± 0,878 ± 1±0 1±0 1±0 0,928 ±
linhas e 0,001 0,037 0,04 0,05 0,008
colunas
Sobreposi- 0,085 ± 0,015 ± 0,007 ± 0,091 ± 0,103 ± 0,304 ± 0,062 ± 0,055 ± 0,075 ± 0,049 ± 0,008 ±
ção 0,011 0,004 0,001 0,014 0,008 0,031 0,014 0,005 0,01 0,003 0,002
Jaccard 0,065 ± 0,228 ± 0,064 ± 0,061 ± 0,069 ± 0,298 ± 0,087 ± 0,057 ± 0,055 ± 0,057 ± 0,247 ±
0,012 0,05 0,007 0,011 0,006 0,041 0,02 0,004 0,007 0,004 0,015
Qtd. - 9,7 ± 3,278 16 ± 3,129 33,3 ± 9,65 ± 10,25 ± 6,3 ± 1,174 22,65 ± 10,85 ± 11,25 ± 10 ± 2,791 35,7 ±
biclusters 2,598 2,346 2,712 5,324 1,981 2,673 2,179
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE -0,001 ± 0±0 0,009 ± 0,012 ± 0,031 ± 0,014 ± 0,066 ± 0,025 ± -0,01 ± -0,073 ± 0,579 ±
0,14 0,211 0,059 0,125 0,582 0,503 0,121 0,092 0,187 0,302
TVE -0,035 ± 0±0 -0,074 ± -0,064 ± -0,054 ± 0,067 ± 0,078 ± -0,014 ± -0,084 ± -0,118 ± 0,072 ±
0,332 0,27 0,196 0,193 0,434 0,389 0,203 0,496 0,369 0,513
MI 0,558 ± 0±0 0,87 ± 0,26 ± 0,754 ± 0,849 ± 0,864 ± 0,648 ± 0,212 ± 0,652 ± 0,896 ±
0,181 0,098 0,292 0,177 0,034 0,028 0,136 0,254 0,162 0,003
LC 0,35 ± 0±0 0,19 ± 0,232 ± 0,265 ± 0,183 ± 0,174 ± 0,27 ± 0,212 ± 0,276 ± 0,15 ± 0
0,123 0,021 0,253 0,069 0,007 0,004 0,045 0,252 0,064
192
Tabela 100: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Breast_Colon
Breast_Colo ABC 6 (J) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 9 CGA 6 FSGA 6 GSO 10 (J) MHS 6 NichePSO SwarmBclu
n (LC) (LC) (LC) (LC) (LC) (LC) 10 (J) ster 6 (J)
Tempo 9,987 ± 14,72 ± 0,685 ± 9,875 ± 9,994 ± 10,52 ± 11,589 ± 9,894 ± 9,686 ± 10,123 ± 5,671 ±
0,032 0,041 0,074 0,048 0,084 0,204 0,181 0,041 0,044 0,11 0,118
MSR 0±0 6.985,698 ± 17.342,133 0±0 15.958,206 20.630,888 20.639,584 12.026,348 0±0 10.140,291 15.591,156
(melhor) 8.455,97 ± 3.912,304 ± 5.613,489 ± 790,711 ± 848,962 ± 6.832,1 ± 4.958,015 ± 5.220,934
MSR 745.295,802 28.706,329 83.833,737 169.627,335 303.403,391 22.161,609 25.450,414 222.182,777 107.860,781 270.929,686 119.752,933
(média) ± ± ± ± ± ± 938,41 ± 5.107,247 ± ± ± ± 43.987,03
300.356,26 28.781,074 24.857,987 69.479,666 158.054,024 58.168,095 60.878,228 85.454,667
Volume 29,45 ± 133,6 ± 4.979,75 ± 74,45 ± 2.491,2 ± 7.322,15 ± 10.120,85 ± 186,4 ± 71,45 ± 758,65 ± 10.140,8 ±
(melhor) 19,798 43,756 4.391,962 22,075 2.412,714 561,277 817,033 227,463 32,14 1.996,636 5.349,344
Volume 2.097,796 ± 942,459 ± 818,771 ± 1.701,55 ± 2.575,978 ± 5.558,856 ± 3.179,686 ± 1.712,24 ± 2.525,069 ± 1.403,455 ± 754,36 ±
(média) 814,704 148,187 106,252 678,145 267,028 329,555 767,651 89,519 1.211,738 100,427 113,158
Cobertura 1±0 0,898 ± 0,898 ± 0,977 ± 1±0 0,863 ± 0,91 ± 1±0 0,955 ± 1±0 0,939 ±
elementos 0,005 0,036 0,004 0,021 0,008 0,011 0,016
Cobertura 1±0 0,9 ± 0,005 1 ± 0,001 0,982 ± 1±0 0,915 ± 0,924 ± 1±0 0,96 ± 1±0 0,997 ±
linhas e 0,006 0,01 0,007 0,011 0,004
colunas
Sobreposi- 0,088 ± 0,021 ± 0,042 ± 0,046 ± 0,116 ± 0,343 ± 0,117 ± 0,078 ± 0,094 ± 0,051 ± 0,023 ±
ção 0,022 0,008 0,006 0,02 0,014 0,029 0,036 0,005 0,058 0,005 0,004
Jaccard 0,07 ± 0,189 ± 0,085 ± 0,067 ± 0,111 ± 0,404 ± 0,128 ± 0,11 ± 0,074 ± 0,079 ± 0,144 ±
0,017 0,045 0,004 0,018 0,014 0,029 0,037 0,007 0,03 0,006 0,015
Qtd. - 7,35 ± 14,4 ± 16 ± 3,907 11,15 ± 8,55 ± 6,7 ± 0,865 9,7 ± 3,197 6,4 ± 2,371 7,1 ± 2,864 8,6 ± 1,698 30,05 ±
biclusters 1,954 3,033 2,059 3,187 3,379
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE 0±0 -0,027 ± 0,085 ± 0±0 0,084 ± -0,03 ± -0,2 ± 0,69 -0,001 ± 0±0 0,019 ± 0,9 ± 0,93
0,084 0,459 0,392 0,297 0,129 0,194
TVE 0±0 -0,01 ± -0,167 ± 0±0 -0,051 ± 0,167 ± -0,013 ± 0,095 ± 0±0 0,086 ± 0,014 ±
0,023 0,749 0,437 0,512 0,593 0,272 0,198 0,374
MI 0±0 0,342 ± 1,763 ± 0±0 1,445 ± 1,802 ± 1,83 ± 1,161 ± 0±0 1,147 ± 1,774 ±
0,45 0,137 0,401 0,084 0,082 0,425 0,376 0,228
LC 0±0 0,272 ± 0,261 ± 0±0 0,355 ± 0,245 ± 0,241 ± 0,391 ± 0±0 0,467 ± 0,259 ±
0,312 0,03 0,175 0,011 0,012 0,141 0,15 0,038
193
Tabela 101: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Lung
Lung ABC 7 (J) BICACO 6 BIC-aiNet 6 CDE 6 (J) dFSS 10 (J) CGA 6 FSGA 6 GSO 10 (J) MHS 6 (J) NichePSO SwarmBclu
(J) (LC) (LC) (LC) 10 (LC) ster 6 (J)
Tempo 86,062 ± 150,342 ± 11,772 ± 85,637 ± 85,285 ± 86,617 ± 88,332 ± 82,628 ± 84,831 ± 86,106 ± 62,756 ±
0,12 0,148 0,829 0,203 0,227 0,743 0,769 0,309 0,249 0,153 2,02
MSR 4.704,361 ± 0±0 24.599,725 3.430,307 ± 26.785,126 33.876,748 32.934,585 23.375,477 5.060,596 ± 19.141,717 13.867,196
(melhor) 8.793,988 ± 6.990,798 8.090,54 ± 6.089,71 ± 1.434,517 ± 1.635,508 ± 8.642,113 10.748,531 ± ± 1.529,876
11.125,872
MSR 655.714,997 86.949,884 29.361,895 656.324,093 72.164,195 34.726,583 44.464,334 61.931,698 594.413,058 135.089,036 73.489,45 ±
(média) ± ± ± 4.423,96 ± ± 4.708,772 ± 541,607 ± ± ± ± 28.675,368
135.380,671 82.340,561 199.018,109 14.409,997 12.047,187 173.516,554 21.475,683
Volume 7,1 ± 8,813 199,4 ± 10.339 ± 32,8 ± 36.797,55 ± 115.798,15 150.791,1 ± 3.867,75 ± 66,05 ± 13.560,75 ± 267.797,6 ±
(melhor) 1,635 2.798,388 21,985 18.460,325 ± 4.927,235 7.397,073 5.089,655 51,749 24.613,649 15.415,708
Volume 31.831,246 26.350,424 1.983,016 ± 23.172,773 34.410,255 99.259,196 25.795,932 27.603,358 18.783,186 26.001,619 6.085,677 ±
(média) ± 3.978,173 ± 3.973,778 291,665 ± ± 1.819,119 ± 1.966,029 ± 2.605,259 ± 1.767,904 ± 8.889,968 ± 771,746 566,606
12.595,704
Cobertura 1±0 0,997 ± 0,269 ± 1±0 1±0 0,933 ± 0,979 ± 1±0 1±0 1±0 0,896 ±
elementos 0,001 0,035 0,018 0,002 0,008
Cobertura 1±0 0,997 ± 0,755 ± 1±0 1±0 0,983 ± 0,992 ± 1±0 1±0 1±0 0,912 ±
linhas e 0,001 0,028 0,007 0,001 0,009
colunas
Sobreposi- 0,113 ± 0,01 ± 0,01 0,006 ± 0,072 ± 0,104 ± 0,34 ± 0,068 ± 0,062 ± 0,055 ± 0,068 ± 0,004 ±
ção 0,021 0,001 0,021 0,006 0,015 0,01 0,006 0,008 0,003 0,001
Jaccard 0,062 ± 0,257 ± 0,038 ± 0,061 ± 0,136 ± 0,373 ± 0,075 ± 0,068 ± 0,061 ± 0,081 ± 0,271 ±
0,006 0,061 0,003 0,015 0,012 0,019 0,017 0,007 0,01 0,004 0,013
Qtd. - 6,6 ± 1,818 10,3 ± 37,45 ± 10,45 ± 5,45 ± 7,4 ± 0,821 26,9 ± 13,65 ± 11,9 ± 4,6 ± 1,698 38,5 ± 3
biclusters 2,003 2,704 3,364 1,395 3,523 3,36 2,713
Sucesso 100 100 100 100 100 100 100 100 100 95 100
VE 0,041 ± 0±0 0,071 ± 0,297 ± 0,032 ± 0,168 ± 0,05 ± -0,051 ± -0,126 ± -0,013 ± 0,13 ±
0,185 0,231 0,938 0,454 0,679 0,691 0,207 1,049 0,251 0,539
TVE -0 ± 0,018 0±0 -0,144 ± -0,001 ± -0,242 ± -0,077 ± 0,151 ± 0,055 ± 0,009 ± -0,394 ± 0,28 ±
1,058 0,029 1,586 1,856 2,273 0,665 0,061 1,425 1,193
MI 0,436 ± 0±0 2,512 ± 0,771 ± 2,517 ± 2,537 ± 2,5 ± 0,028 2,137 ± 0,717 ± 2,133 ± 2,324 ±
0,667 0,099 1,413 0,09 0,041 0,323 1,565 0,349 0,011
LC 0,348 ± 0±0 0,182 ± 0,249 ± 0,18 ± 0,169 ± 0,166 ± 0,231 ± 0,198 ± 0,256 ± 0,174 ±
0,487 0,015 0,442 0,014 0,006 0,004 0,063 0,406 0,115 0,002
194
Tabela 102: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Multitissue
Multitissue ABC 6 (J) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 10 (J) CGA 6 FSGA 6 (J) GSO 10 MHS 6 NichePSO SwarmBclu
(J) (LC) (LC) (LC) (LC) 10 (J) ster 6 (J)
Tempo 76,418 ± 125,764 ± 9,343 ± 75,824 ± 75,425 ± 76,966 ± 78,263 ± 72,922 ± 74,868 ± 75,748 ± 54,121 ±
0,162 0,165 0,667 0,215 0,362 1,082 0,697 0,26 0,147 0,214 1,599
MSR 0±0 57.489,456 131.462,8 ± 0±0 119.479,145 162.495,096 157.055,481 93.871,963 3.613,161 ± 65.028,334 121.776,612
(melhor) ± 25.210,53 ± ± 4.357,713 ± 7.104,267 ± 16.158,549 ± ±
77.787,523 31.064,448 52.128,383 46.146,102 16.763,261
MSR 902.167,514 3.892.174,7 227.669,93 1.061.856,7 347.137,945 164.248,911 269.371,861 323.759,724 1.386.206,6 553.886,204 800.439,835
(média) ± 41 ± ± 65 ± ± ± 2.328,989 ± ± 57 ± ± ±
366.805,272 871.746,359 33.801,861 494.692,142 19.261,821 202.874,926 49.647,537 490.900,036 123.269,56 171.830,155
Volume 324,5 ± 66.970,1 ± 5.266,8 ± 397,2 ± 27.705,05 ± 91.193,55 ± 118.121,3 ± 2.289,35 ± 344,1 ± 22.229,85 ± 213.259,4 ±
(melhor) 338,812 104.467,913 2.077,215 303,492 12.089,689 4.507,794 4.244,015 3.005,725 248,16 33.846,464 6.270,148
Volume 19.618,877 10.486,665 1.797,926 ± 31.283,015 28.067,803 78.997,264 22.639,61 ± 23.822,703 16.928,168 21.560,837 7.408,682 ±
(média) ± 6.892,592 ± 3.716,443 260,345 ± 8.535,21 ± 1.035,285 ± 2.930,196 2.370,177 ± 1.080,65 ± 4.113,81 ± 882,44 1.361,136
Cobertura 1±0 0,999 ± 0 0,292 ± 0,997 ± 1±0 0,903 ± 0,942 ± 1±0 0,995 ± 1±0 0,871 ±
elementos 0,035 0,003 0,014 0,006 0,003 0,032
Cobertura 1±0 0,999 ± 0 0,81 ± 0,03 0,999 ± 1±0 0,959 ± 0,965 ± 1±0 0,997 ± 1±0 0,906 ±
linhas e 0,002 0,009 0,007 0,003 0,029
colunas
Sobreposi- 0,062 ± 0,022 ± 0,006 ± 0,101 ± 0,102 ± 0,345 ± 0,07 ± 0,065 ± 0,082 ± 0,068 ± 0,01 ±
ção 0,027 0,003 0,001 0,022 0,004 0,019 0,011 0,005 0,016 0,003 0,004
Jaccard 0,042 ± 0,068 ± 0,039 ± 0,073 ± 0,136 ± 0,379 ± 0,076 ± 0,072 ± 0,051 ± 0,083 ± 0,218 ±
0,011 0,014 0,004 0,018 0,008 0,021 0,025 0,006 0,009 0,004 0,019
Qtd. - 9,2 ± 3,982 17,45 ± 23,8 ± 8,25 ± 2,9 4,95 ± 8,15 ± 27,7 ± 11,75 ± 9,4 ± 2,137 5 ± 2,428 34,2 ±
biclusters 3,62 3,592 1,905 0,671 5,141 1,916 3,054
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE 0±0 -0,106 ± 0,078 ± 0±0 0,149 ± -0,239 ± 0,057 ± -0,032 ± 0,001 ± 0,06 ± 0,188 ±
0,467 0,399 0,396 0,629 0,93 0,159 0,004 0,374 0,962
TVE 0±0 0,009 ± -0,047 ± 0±0 -0,146 ± 0,085 ± 0,077 ± -0,063 ± 0±0 0,12 ± 0,1 ± 0,327
0,063 0,217 0,318 0,25 0,361 0,193 0,288
MI 0±0 0,313 ± 0,751 ± 0±0 0,655 ± 0,755 ± 0,751 ± 0,61 ± 0,018 ± 0,551 ± 0,756 ±
0,407 0,065 0,057 0,025 0,023 0,131 0,079 0,135 0,016
LC 0±0 0,13 ± 0,181 ± 0±0 0,157 ± 0,139 ± 0,126 ± 0,216 ± 0,026 ± 0,213 ± 0,15 ±
0,246 0,019 0,024 0,015 0,007 0,049 0,114 0,087 0,011
195
Tabela 103: Resultado da Fusão Direta com um algoritmo (sem sobreposição) para Yeast
Yeast ABC 6 (J) BICACO 8 BIC-aiNet 6 CDE 6 (LC) dFSS 9 CGA 6 FSGA 6 GSO 10 MHS 6 NichePSO 8 SwarmBclu
(LC) (LC) (LC) (LC) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 115,417 ± 96,33 ± 1,813 ± 115,427 ± 113,471 ± 119 ± 1,222 117,126 ± 112,858 ± 113,061 ± 116,665 ± 10,491 ±
0,093 1,025 0,142 0,178 4,326 1,333 0,346 0,168 0,383 0,558
MSR 0±0 286,631 ± 297,343 ± 55,475 ± 182,219 ± 241,184 ± 239,145 ± 155,888 ± 0±0 120,434 ± 239,443 ±
(melhor) 10,283 1,765 113,883 103,89 32,779 26,827 96,501 111,198 57,341
MSR 538,877 ± 480,984 ± 353,993 ± 426,76 ± 775,783 ± 242,756 ± 261,567 ± 773,994 ± 415,634 ± 732,352 ± 223,586 ±
(média) 86,807 17,719 31,639 60,334 72,918 41,445 87,115 59,587 74,381 80,27 21,608
Volume 475,8 ± 8.793,85 ± 702,5 ± 974,15 ± 21,5 ± 3.244,9 ± 3.717,1 ± 167,9 ± 603,05 ± 103,7 ± 2.765,9 ±
(melhor) 348,329 1.755,182 236,101 879,522 19,83 55,427 80,204 655,679 417,612 193,991 1.116,541
Volume 3.312,338 ± 1.275,779 ± 373,102 ± 4.240,757 ± 4.610,836 ± 2.440,87 ± 755,971 ± 3.291,007 ± 3.533,175 ± 2.784,812 ± 1.259,747 ±
(média) 707,729 86,457 60,082 578,293 498,002 430,683 98,904 242,044 956,095 275,993 106,386
Cobertura 1±0 0,652 ± 0,306 ± 0,895 ± 1±0 0,328 ± 0,424 ± 1±0 0,909 ± 1±0 0,605 ±
elementos 0,018 0,039 0,033 0,051 0,067 0,061 0,025
Cobertura 1±0 0,888 ± 0,48 ± 0,935 ± 1±0 0,433 ± 0,523 ± 1±0 0,935 ± 1±0 0,704 ±
linhas e 0,017 0,027 0,046 0,075 0,097 0,057 0,015
colunas
Sobreposi- 0,068 ± 0,031 ± 0,007 ± 0,073 ± 0,082 ± 0,066 ± 0,016 ± 0,043 ± 0,064 ± 0,037 ± 0,033 ±
ção 0,014 0,004 0,001 0,011 0,011 0,021 0,008 0,005 0,016 0,004 0,003
Jaccard 0,042 ± 0,055 ± 0,038 ± 0,058 ± 0,047 ± 0,229 ± 0,059 ± 0,041 ± 0,048 ± 0,039 ± 0,054 ±
0,007 0,005 0,005 0,016 0,005 0,06 0,017 0,004 0,014 0,004 0,004
Qtd. - 9,6 ± 2,062 5,1 ± 1,971 25,3 ± 12,75 ± 7,55 ± 6,95 ± 1,05 25,55 ± 7,1 ± 2,198 12,85 ± 9,25 ± 35,45 ±
biclusters 5,545 2,381 2,114 5,443 3,528 2,751 3,034
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE 0±0 0,024 ± 0,092 ± 0,002 ± -0,016 ± -0,019 ± -0,01 ± 0,033 ± 0±0 0,17 ± 0,128 ±
1,077 0,73 0,043 0,101 0,091 0,098 0,119 0,695 1,163
TVE 0±0 -0,448 ± 0,986 ± -0,666 ± 0,631 ± -27,838 ± -6,761 ± -0,403 ± 0±0 1,564 ± -1,857 ±
3,442 5,509 2,323 12,292 133,29 59,799 6,287 14,507 3,575
MI 0±0 0,954 ± 1,09 ± 0,086 ± 0,421 ± 0,399 ± 0,395 ± 0,417 ± 0±0 0,276 ± 1,006 ±
0,05 0,135 0,177 0,338 0,042 0,038 0,206 0,274 0,215
LC 0±0 0,38 ± 0,313 ± 0,124 ± 0,457 ± 0,576 ± 0,57 ± 0,512 ± 0±0 0,372 ± 0,391 ±
0,027 0,042 0,256 0,344 0,06 0,055 0,265 0,355 0,129
196
Tabela 104: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Artificial_2
Artificial_2 ABC 3 (LC) BICACO 1 BIC-aiNet 1 CDE 2 (LC) dFSS 1 (LC) CGA 1 (J) FSGA 1 (J) GSO 1 (LC) MHS 3 (LC) NichePSO 2 SwarmBclust
(LC) (LC) (LC) er 1 (J)
Tempo 9,164 ± 0,212 5,068 ± 0,033 2,154 ± 0,369 8,909 ± 0,048 9,222 ± 0,079 7,896 ± 0,206 8,972 ± 0,134 9,383 ± 0,053 8,873 ± 0,048 9,033 ± 0,066 6,141 ± 0,039
MSR 28,442 ± 23,049 ± 1,055 ± 1,533 28,244 ± 29,506 ± 22,68 ± 0,943 27,978 ± 29,858 ± 28,844 ± 29,734 ± 0,372 ± 0,078
(melhor) 0,468 1,141 0,804 0,482 1,211 0,696 0,401 0,509
MSR (média) 31,101 ± 29,908 ± 20,884 ± 0,64 30,983 ± 31,9 ± 0,17 25,031 ± 30,643 ± 32,227 ± 0,14 30,654 ± 31,768 ± 0,929 ± 0,347
0,108 0,258 0,164 1,223 0,397 0,091 0,134
Volume 2.659,5 ± 4.654,55 ± 22,2 ± 14,27 3.416,45 ± 3.332,95 ± 2.256,25 ± 2.999,5 ± 3.640,2 ± 2.797,95 ± 3.098,1 ± 134,45 ±
(melhor) 278,392 1.025,927 1.552,957 650,827 372,603 579,437 1.219,015 320,196 278,061 25,49
Volume 6.024,309 ± 4.540,741 ± 211,822 ± 6.530,748 ± 7.566,382 ± 2.601,044 ± 5.241,788 ± 7.301,731 ± 5.757,369 ± 6.979,627 ± 117,338 ±
(média) 244,112 252,494 28,708 277,609 377,007 392,872 351,164 408,836 251,144 391,937 7,943
Cobertura 1±0 0,998 ± 0,002 0,401 ± 0,045 1 ± 0 1±0 0,655 ± 0,022 0,984 ± 0,006 1 ± 0 1±0 1 ± 0,001 0,182 ± 0,013
elementos
Cobertura 1±0 0,999 ± 0,002 0,989 ± 0,008 1±0 1±0 0,894 ± 0,025 0,998 ± 0,002 1±0 1±0 1 ± 0,001 0,317 ± 0,018
linhas e
colunas
Sobreposição 0,324 ± 0,013 0,26 ± 0,014 0,011 ± 0,002 0,356 ± 0,016 0,404 ± 0,019 0,734 ± 0,007 0,366 ± 0,014 0,382 ± 0,022 0,317 ± 0,014 0,376 ± 0,022 0,021 ± 0,003
Jaccard 0,362 ± 0,011 0,297 ± 0,014 0,048 ± 0,004 0,39 ± 0,015 0,431 ± 0,017 0,759 ± 0,006 0,421 ± 0,012 0,432 ± 0,026 0,36 ± 0,013 0,405 ± 0,02 0,364 ± 0,009
Qtd. - 0±0 0±0 1,8 ± 1,196 0±0 0±0 0±0 0±0 0±0 0±0 0±0 41,9 ± 2,594
biclusters
Sucesso 0 0 90 0 0 0 0 0 0 0 100
VE 0,034 ± 0,133 0,046 ± 0,318 -0,003 ± 0,012 ± 0,211 0,03 ± 0,188 -0,078 ± -0,002 ± -0,015 ± -0,004 ± -0,006 ± 1,21 ± 1,809
0,094 0,245 0,224 0,236 0,208 0,183
TVE -0,025 ± -0,005 ± 0,467 ± 1,896 0,073 ± 0,287 -0,05 ± 0,199 0,044 ± 0,391 -0,056 ± -0,057 ± 0,031 ± 0,192 -0,012 ± 0,136 ± 0,421
0,245 0,402 0,161 0,203 0,314
MI 1,354 ± 0,037 1,047 ± 0,073 0,565 ± 0,308 1,307 ± 0,078 1,336 ± 0,041 1,154 ± 0,065 1,308 ± 0,048 1,372 ± 0,036 1,34 ± 0,057 1,348 ± 0,04 0,572 ± 0,172
LC 0,167 ± 0,007 0,178 ± 0,016 0,705 ± 0,364 0,158 ± 0,014 0,152 ± 0,009 0,198 ± 0,013 0,162 ± 0,012 0,152 ± 0,011 0,16 ± 0,011 0,152 ± 0,008 0,873 ± 0,153
RMS 0±0 0±0 0,04 ± 0,033 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,058 ± 0,002
(biclusters)
RMS 0,182 ± 0,005 0,192 ± 0,008 0,1 ± 0,008 0,189 ± 0,006 0,182 ± 0,007 0,234 ± 0,03 0,189 ± 0,011 0,183 ± 0,006 0,188 ± 0,007 0,181 ± 0,006 0,068 ± 0,003
(população)
CMS 0±0 0±0 0,032 ± 0,028 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,609 ± 0,018
(biclusters)
CMS 0,417 ± 0,01 0,395 ± 0,011 0,116 ± 0,012 0,438 ± 0,009 0,415 ± 0,009 0,484 ± 0,06 0,431 ± 0,018 0,367 ± 0,007 0,435 ± 0,006 0,412 ± 0,01 0,626 ± 0,015
(população)
MS 0±0 0±0 0,034 ± 0,028 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,382 ± 0,01
(biclusters)
MS 0,274 ± 0,007 0,273 ± 0,009 0,105 ± 0,008 0,286 ± 0,007 0,274 ± 0,006 0,333 ± 0,037 0,283 ± 0,012 0,25 ± 0,005 0,284 ± 0,005 0,271 ± 0,006 0,396 ± 0,006
(população)
197
(LC) (LC) (LC) er 1 (J)
Tempo 9,252 ± 0,063 5,097 ± 0,052 1,693 ± 0,25 9,011 ± 0,134 9,255 ± 0,094 8,198 ± 0,151 8,885 ± 0,16 9,464 ± 0,066 8,928 ± 0,054 9,126 ± 0,067 5,769 ± 0,077
MSR 18,874 ± 13,538 ± 1,209 ± 1,476 18,624 ± 19,954 ± 14,694 ± 17,153 ± 20,178 ± 19,141 ± 20,218 ± 0,334 ± 0,212
(melhor) 0,533 0,382 0,672 0,713 0,692 0,845 0,522 0,406 0,561
MSR (média) 21,504 ± 18,604 ± 0,31 14,472 ± 21,276 ± 22,444 ± 16,448 ± 19,786 ± 22,872 ± 20,859 ± 22,427 ± 5,273 ± 0,627
0,165 0,838 0,163 0,174 0,893 0,536 0,145 0,196 0,134
Volume 2.783,15 ± 4.969,1 ± 27 ± 18,739 3.318 ± 3.573,7 ± 2.344,4 ± 3.086,85 ± 3.847,5 ± 2.777,2 ± 3.183,1 ± 125,8 ± 87,38
(melhor) 620,213 548,385 1.502,942 1.089,958 343,596 838,975 1.376,07 207,165 922,266
Volume 6.125,7 ± 3.922,258 ± 233,027 ± 6.413,387 ± 7.611,499 ± 2.819,31 ± 4.763,905 ± 7.205,861 ± 5.771,063 ± 7.358,337 ± 180,567 ±
(média) 295,74 314,853 29,236 191,235 335,377 326,05 201,472 378,094 253,851 534,303 17,732
Cobertura 1±0 0,985 ± 0,007 0,431 ± 0,041 1 ± 0 1±0 0,664 ± 0,026 0,972 ± 0,007 1 ± 0 0,999 ± 0 1 ± 0,001 0,339 ± 0,028
elementos
Cobertura 1±0 0,998 ± 0,002 0,991 ± 0,009 1±0 1±0 0,874 ± 0,024 0,999 ± 0,003 1±0 1±0 1 ± 0,001 0,544 ± 0,029
linhas e
colunas
Sobreposição 0,331 ± 0,015 0,255 ± 0,016 0,012 ± 0,002 0,354 ± 0,013 0,406 ± 0,016 0,738 ± 0,004 0,365 ± 0,019 0,377 ± 0,019 0,322 ± 0,014 0,395 ± 0,029 0,013 ± 0,001
Jaccard 0,37 ± 0,014 0,294 ± 0,017 0,05 ± 0,003 0,387 ± 0,012 0,432 ± 0,015 0,762 ± 0,004 0,419 ± 0,017 0,426 ± 0,022 0,363 ± 0,013 0,42 ± 0,028 0,323 ± 0,008
Qtd. - 0±0 0±0 2,25 ± 1,333 0±0 0±0 0±0 0±0 0±0 0±0 0±0 20,2 ± 2,913
biclusters
Sucesso 0 0 90 0 0 0 0 0 0 0 100
VE -0,025 ± 0,023 ± 0,108 -0,007 ± -0,003 ± -0,016 ± 0,1 0,002 ± 0,108 -0,026 ± -0,061 ± 0,005 ± 0,081 -0,027 ± -0,652 ±
0,079 0,049 0,106 0,135 0,121 0,093 3,053
TVE 0,001 ± 0,043 -0,008 ± 0,001 ± 0,079 0,01 ± 0,027 0,019 ± 0,053 0,004 ± 0,043 0,012 ± 0,035 -0,009 ± 0,008 ± 0,033 -0,011 ± -0,001 ±
0,043 0,044 0,024 0,027
MI 1,133 ± 0,043 0,841 ± 0,018 0,62 ± 0,3 1,104 ± 0,066 1,129 ± 0,042 0,969 ± 0,042 1,04 ± 0,039 1,164 ± 0,041 1,139 ± 0,033 1,16 ± 0,048 0,888 ± 0,346
LC 0,136 ± 0,009 0,117 ± 0,003 0,67 ± 0,284 0,133 ± 0,015 0,127 ± 0,013 0,151 ± 0,014 0,133 ± 0,013 0,133 ± 0,009 0,135 ± 0,006 0,131 ± 0,011 0,829 ± 0,285
RMS 0±0 0±0 0,057 ± 0,023 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,05 ± 0,004
(biclusters)
RMS 0,206 ± 0,006 0,21 ± 0,005 0,12 ± 0,007 0,208 ± 0,006 0,206 ± 0,004 0,219 ± 0,022 0,211 ± 0,008 0,21 ± 0,006 0,207 ± 0,005 0,203 ± 0,005 0,085 ± 0,006
(população)
CMS 0±0 0±0 0,047 ± 0,03 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,547 ± 0,024
(biclusters)
CMS 0,402 ± 0,006 0,404 ± 0,008 0,147 ± 0,01 0,415 ± 0,007 0,401 ± 0,007 0,425 ± 0,037 0,433 ± 0,01 0,364 ± 0,006 0,413 ± 0,006 0,396 ± 0,009 0,569 ± 0,012
(população)
MS 0±0 0±0 0,047 ± 0,024 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,334 ± 0,014
(biclusters)
MS 0,274 ± 0,004 0,278 ± 0,005 0,127 ± 0,007 0,278 ± 0,004 0,273 ± 0,005 0,29 ± 0,024 0,287 ± 0,009 0,255 ± 0,003 0,278 ± 0,005 0,268 ± 0,004 0,367 ± 0,008
(população)
198
(LC) (LC) (LC) er 1 (J)
Tempo 9,241 ± 0,114 5,099 ± 0,099 1,695 ± 0,29 8,993 ± 0,115 9,229 ± 0,066 7,956 ± 0,112 8,973 ± 0,132 9,391 ± 0,088 8,945 ± 0,135 9,003 ± 0,042 5,437 ± 0,028
MSR 25,572 ± 21,654 ± 0,697 ± 0,314 25,345 ± 26,675 ± 20,253 ± 24,261 ± 26,93 ± 0,535 25,883 ± 26,711 ± 0,435 ± 0,236
(melhor) 0,499 0,592 0,893 0,597 0,841 1,339 0,377 0,511
MSR (média) 28,449 ± 26,447 ± 17,971 ± 28,216 ± 29,141 ± 22,248 ± 27,043 ± 29,51 ± 0,132 28,047 ± 29,071 ± 4,255 ± 0,498
0,154 0,206 0,844 0,162 0,195 1,156 0,481 0,149 0,155
Volume 2.824,5 ± 4.447,15 ± 24,5 ± 9,817 2.724,35 ± 3.392,3 ± 2.092,25 ± 2.941,4 ± 3.567,65 ± 2.783,85 ± 3.004,6 ± 122,75 ±
(melhor) 306,549 1.578,92 517,571 673,18 288,343 616,626 1.053,411 317,364 277,781 45,875
Volume 6.714,599 ± 4.284,031 ± 237,683 ± 6.937,791 ± 7.593,849 ± 2.449,47 ± 4.953,791 ± 7.259,983 ± 6.584,06 ± 7.214,023 ± 189,195 ±
(média) 342,346 320,015 39,942 306,396 345,926 299,117 318,263 410,388 250,333 295,884 18,975
Cobertura 1±0 0,997 ± 0,002 0,437 ± 0,052 1 ± 0 1±0 0,647 ± 0,022 0,983 ± 0,005 1 ± 0 1±0 1 ± 0,001 0,38 ± 0,035
elementos
Cobertura 1±0 1 ± 0,002 0,99 ± 0,008 1±0 1±0 0,897 ± 0,026 0,999 ± 0,002 1±0 1±0 1 ± 0,001 0,62 ± 0,037
linhas e
colunas
Sobreposição 0,358 ± 0,018 0,257 ± 0,018 0,012 ± 0,002 0,376 ± 0,016 0,405 ± 0,018 0,733 ± 0,004 0,361 ± 0,013 0,38 ± 0,022 0,356 ± 0,013 0,387 ± 0,018 0,009 ± 0,001
Jaccard 0,386 ± 0,017 0,294 ± 0,018 0,05 ± 0,004 0,4 ± 0,015 0,431 ± 0,017 0,757 ± 0,003 0,415 ± 0,013 0,43 ± 0,025 0,382 ± 0,013 0,414 ± 0,017 0,316 ± 0,007
Qtd. - 0±0 0±0 2,4 ± 1,465 0±0 0±0 0±0 0±0 0±0 0±0 0±0 26,9 ± 2,222
biclusters
Sucesso 0 0 95 0 0 0 0 0 0 0 100
VE 0,051 ± 0,387 -0,093 ± -0,023 ± -0,189 ± 0,042 ± 0,489 0,006 ± 0,372 0,095 ± 0,714 0,1 ± 0,664 -0,038 ± 0,047 ± 0,591 0,731 ± 2,587
0,704 0,088 0,532 0,734
TVE 0,109 ± 0,239 -0,198 ± -0,052 ± 0,086 ± 0,387 -0,111 ± 0,023 ± 0,401 0,117 ± 0,355 0,009 ± 0,364 0,03 ± 0,277 0,024 ± 0,246 -0,171 ±
0,492 0,301 0,299 0,748
MI 1,21 ± 0,04 1,073 ± 0,064 0,564 ± 0,341 1,216 ± 0,047 1,21 ± 0,043 1,125 ± 0,042 1,166 ± 0,043 1,222 ± 0,038 1,23 ± 0,035 1,241 ± 0,029 0,927 ± 0,434
LC 0,171 ± 0,011 0,163 ± 0,025 0,743 ± 0,344 0,175 ± 0,017 0,162 ± 0,012 0,213 ± 0,026 0,174 ± 0,018 0,167 ± 0,013 0,17 ± 0,011 0,165 ± 0,009 0,839 ± 0,19
RMS 0±0 0±0 0,068 ± 0,022 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,06 ± 0,002
(biclusters)
RMS 0,19 ± 0,005 0,18 ± 0,004 0,136 ± 0,012 0,193 ± 0,005 0,192 ± 0,004 0,197 ± 0,019 0,191 ± 0,007 0,195 ± 0,005 0,192 ± 0,005 0,192 ± 0,004 0,103 ± 0,006
(população)
CMS 0±0 0±0 0,051 ± 0,02 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,523 ± 0,012
(biclusters)
CMS 0,397 ± 0,008 0,385 ± 0,009 0,162 ± 0,016 0,404 ± 0,004 0,398 ± 0,007 0,409 ± 0,031 0,413 ± 0,013 0,367 ± 0,005 0,401 ± 0,007 0,391 ± 0,007 0,544 ± 0,008
(população)
MS 0±0 0±0 0,05 ± 0,016 0±0 0±0 0±0 0±0 0±0 0±0 0±0 0,337 ± 0,009
(biclusters)
MS 0,26 ± 0,004 0,25 ± 0,006 0,141 ± 0,013 0,265 ± 0,003 0,262 ± 0,005 0,269 ± 0,017 0,265 ± 0,009 0,245 ± 0,004 0,263 ± 0,005 0,258 ± 0,004 0,372 ± 0,005
(população)
199
Tabela 107: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Arabidopsis
Arabidopsis ABC 5 (LC) BICACO 5 BIC-aiNet 1 CDE 4 (LC) dFSS 5 CGA 1 (J) FSGA 1 (J) GSO 5 (J) MHS 5 (J) NichePSO 5 SwarmBclu
(LC) (LC) (LC) (J) ster 1 (J)
Tempo 25,414 ± 35,94 ± 1,599 ± 25,35 ± 25,474 ± 26,789 ± 27,205 ± 25,466 ± 24,841 ± 25,364 ± 12,185 ±
0,088 0,283 0,133 0,089 0,141 0,314 0,256 0,109 0,134 0,094 0,243
MSR 602,161 ± 683,635 ± 476,152 ± 643,854 ± 617,428 ± 671,256 ± 678,744 ± 723,55 ± 631,923 ± 597,251 ± 397,252 ±
(melhor) 76,234 22,419 145,055 42,672 53,382 28,187 20,081 153,829 57,77 52,403 226,118
MSR 1.323,396 ± 751,499 ± 1.481,586 ± 1.127,188 ± 2.219,29 ± 708,042 ± 695,654 ± 2.999,687 ± 859,583 ± 1.855,071 ± 4.831,283 ±
(média) 131,653 12,087 690,918 91,726 351,368 31,648 16,712 395,046 41,409 243,973 2.249,594
Volume 6.860,9 ± 25.534,7 ± 1.647,75 ± 16.998,95 ± 9.578,7 ± 13.390,75 ± 16.595,65 ± 4.122,8 ± 8.186,55 ± 18.025,35 ± 21.035,3 ±
(melhor) 1.531,125 2.224,372 590,633 1.357,884 1.350,192 1.432,984 1.242,51 2.085,454 1.569,418 1.787,716 11.452,233
Volume 6.636,005 ± 24.144,249 642,109 ± 12.279,493 7.966,436 ± 11.486,537 13.377,81 ± 6.913,87 ± 6.535,087 ± 6.791,977 ± 3.641,494 ±
(média) 411,34 ± 689,167 60,573 ± 714,622 213,804 ± 1.558,245 759,757 572,974 413,429 260,528 434,703
Cobertura 0,99 ± 0,972 ± 0,461 ± 0,997 ± 0,994 ± 0,901 ± 0,931 ± 0,992 ± 0,984 ± 0,99 ± 0,991 ±
elementos 0,002 0,004 0,031 0,002 0,003 0,012 0,006 0,003 0,005 0,003 0,005
Cobertura 0,999 ± 0,977 ± 0,83 ± 1±0 1 ± 0,001 0,984 ± 0,987 ± 1 ± 0,001 1±0 1 ± 0,001 0,992 ±
linhas e 0,001 0,003 0,018 0,012 0,009 0,005
colunas
Sobreposi- 0,147 ± 0,658 ± 0,013 ± 0,273 ± 0,177 ± 0,754 ± 0,458 ± 0,155 ± 0,151 ± 0,156 ± 0,058 ±
ção 0,009 0,036 0,001 0,016 0,005 0,007 0,038 0,013 0,009 0,005 0,007
Jaccard 0,213 ± 0,644 ± 0,062 ± 0,314 ± 0,251 ± 0,763 ± 0,459 ± 0,214 ± 0,218 ± 0,221 ± 0,156 ±
0,009 0,055 0,005 0,011 0,008 0,003 0,034 0,01 0,007 0,004 0,012
Qtd. - 6,5 ± 1,732 6,95 ± 30,65 ± 4,6 ± 1,569 2,9 ± 1,483 25,55 ± 27,2 ± 0,8 ± 1,105 14,2 ± 8,5 ± 2,013 23,35 ±
biclusters 2,625 2,231 21,481 10,149 2,308 3,573
Sucesso 100 100 100 100 100 100 100 50 100 100 100
VE 0,016 ± 0,009 ± -0,017 ± -0,027 ± -0,001 ± -0,009 ± 0,012 ± -0,004 ± 0,004 ± -0,032 ± -0,003 ±
0,12 0,114 0,091 0,154 0,105 0,088 0,133 0,044 0,08 0,13 0,098
TVE 0,005 ± 0,003 ± 0,002 ± 0,015 ± -0,006 ± -0,004 ± -0,002 ± 0,004 ± -0,015 ± 0 ± 0,026 -0,001 ±
0,041 0,029 0,041 0,034 0,039 0,029 0,029 0,038 0,038 0,034
MI 1,303 ± 1,235 ± 1,345 ± 1,253 ± 1,298 ± 1,288 ± 1,256 ± 1,351 ± 1,304 ± 1,229 ± 1,009 ±
0,044 0,02 0,086 0,028 0,061 0,035 0,038 0,058 0,058 0,024 0,075
LC 0,13 ± 0,089 ± 0,137 ± 0,102 ± 0,129 ± 0,109 ± 0,101 ± 0,181 ± 0,128 ± 0,099 ± 0,102 ±
0,008 0,004 0,017 0,005 0,011 0,006 0,004 0,046 0,009 0,005 0,029
200
Tabela 108: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Brain_1
Brain_1 ABC 5 (J) BICACO 5 BIC-aiNet 1 CDE 4 (LC) dFSS 5 CGA 1 (J) FSGA 1 (J) GSO 5 (J) MHS 4 (J) NichePSO 4 SwarmBclu
(J) (LC) (LC) (LC) ster 1 (J)
Tempo 45,344 ± 66,092 ± 2,178 ± 45,386 ± 45,261 ± 47,13 ± 47,262 ± 45,458 ± 44,608 ± 45,415 ± 24,313 ±
0,148 0,341 0,184 0,126 0,172 0,472 0,352 0,23 0,122 0,203 0,588
MSR 7.673,46 ± 8.652,75 ± 6.531,302 ± 7.827,791 ± 7.728,503 ± 8.718,827 ± 8.563,848 ± 11.394,543 8.386,128 ± 8.063,869 ± 5.151,215 ±
(melhor) 1.194,298 383,745 1.316,406 624,264 1.001,165 201,982 247,462 ± 2.372,201 482,753 552,645 1.314,069
MSR 13.943,217 9.652,234 ± 8.121,247 ± 12.794,542 17.392,217 9.085,351 ± 8.838,514 ± 22.223,272 12.256,49 ± 17.746,092 11.435,899
(média) ± 795,564 130,449 1.016,325 ± 388,141 ± 1.069,203 455,796 323,051 ± 1.793,883 378,555 ± 930,995 ± 4.326,309
Volume 9.865,9 ± 39.349,95 ± 1.619,05 ± 22.572,75 ± 12.612,05 ± 17.434,8 ± 21.876,7 ± 7.476,65 ± 21.721,15 ± 29.029,75 ± 39.113,3 ±
(melhor) 1.169,699 2.516,502 376,541 1.193,409 1.595,518 1.907,567 1.791,082 4.394,809 1.508,852 1.919,639 3.903,386
Volume 9.383,894 ± 37.136,449 455,22 ± 16.511,022 10.542,339 14.295,87 ± 17.480,37 ± 9.450,266 ± 15.495,392 18.969,707 7.754,834 ±
(média) 490,558 ± 704,18 35,738 ± 737,434 ± 611,128 1.652,239 1.018,982 819,293 ± 539,354 ± 784,594 612,887
Cobertura 0,986 ± 0,987 ± 0,275 ± 0,982 ± 0,991 ± 0,804 ± 0,834 ± 0,988 ± 0,977 ± 0,998 ± 0,911 ±
elementos 0,004 0,002 0,018 0,008 0,003 0,023 0,022 0,005 0,008 0,001 0,009
Cobertura 1±0 0,988 ± 0,572 ± 0,995 ± 1±0 0,907 ± 0,902 ± 1±0 0,991 ± 1±0 0,93 ±
linhas e 0,002 0,016 0,009 0,027 0,029 0,01 0,008
colunas
Sobreposi- 0,162 ± 0,735 ± 0,007 ± 0,297 ± 0,177 ± 0,762 ± 0,476 ± 0,165 ± 0,281 ± 0,314 ± 0,062 ±
ção 0,007 0,016 0,001 0,014 0,009 0,006 0,043 0,013 0,01 0,012 0,011
Jaccard 0,218 ± 0,716 ± 0,06 ± 0,322 ± 0,248 ± 0,759 ± 0,439 ± 0,213 ± 0,304 ± 0,331 ± 0,159 ±
0,005 0,032 0,004 0,011 0,008 0,002 0,042 0,009 0,008 0,01 0,01
Qtd. - 9,65 ± 5,5 ± 1,638 34,8 ± 7,15 ± 5,1 ± 1,971 20,5 ± 31,35 ± 0,15 ± 7,05 ± 2,05 ± 37,7 ±
biclusters 1,954 3,205 1,424 20,679 10,038 0,366 1,638 0,394 3,028
Sucesso 100 100 100 100 100 100 100 15 100 100 100
VE -0,028 ± 0,308 ± -0,024 ± 0,146 ± -0,02 ± -0,161 ± -0,105 ± -0,052 ± 0,218 ± -0,175 ± -0,107 ±
0,454 0,742 0,265 0,437 0,545 0,657 0,504 0,426 0,403 0,491 0,749
TVE -0,043 ± 0,176 ± 0,049 ± 0,236 ± -0,12 ± 0,156 ± 0,168 ± -0,012 ± -0,114 ± -0,119 ± -0,065 ±
0,483 0,519 0,368 0,59 0,316 0,46 0,661 0,398 0,658 0,599 0,77
MI 2,319 ± 2,746 ± 2,505 ± 2,461 ± 2,306 ± 2,449 ± 2,512 ± 2,178 ± 2,475 ± 2,489 ± 2,677 ±
0,079 0,044 0,125 0,05 0,059 0,07 0,059 0,273 0,056 0,053 0,027
LC 0,273 ± 0,259 ± 0,279 ± 0,256 ± 0,277 ± 0,271 ± 0,265 ± 0,319 ± 0,258 ± 0,253 ± 0,258 ±
0,018 0,004 0,025 0,01 0,019 0,013 0,01 0,034 0,011 0,01 0,004
201
Tabela 109: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Brain_2
Brain_2 ABC 5 (J) BICACO 5 BIC-aiNet 1 CDE 4 (LC) dFSS 5 CGA 1 (J) FSGA 1 GSO 5 (J) MHS 4 (J) NichePSO 4 SwarmBclu
(J) (LC) (LC) (LC) (J) ster 1 (J)
Tempo 44,496 ± 64,839 ± 1,85 ± 44,456 ± 44,548 ± 46,276 ± 45,996 ± 44,638 ± 43,677 ± 44,528 ± 28,346 ±
0,148 0,226 0,157 0,135 0,211 0,394 0,348 0,243 0,112 0,192 0,49
MSR 223.837,827 280.415,498 197.190,975 240.593,187 242.381,893 279.480,271 274.618,666 332.510,737 260.680,549 256.491,197 233.492,829
(melhor) ± ± 8.943,365 ± ± ± ± 9.765,9 ± ± ± 29.417,56 ± ±
41.926,413 71.837,704 29.517,537 27.980,282 11.471,538 107.503,067 25.561,904 44.282,068
MSR 505.390,021 315.487,024 324.000,651 509.929,217 668.742,903 293.473,063 284.904,049 818.267,592 480.562,344 691.209,181 1.393.504,6
(média) ± ± 5.278,275 ± ± ± ± ± 8.627,462 ± 44.972,55 ± ± 63 ±
12.610,106 56.678,071 25.500,921 42.288,907 17.665,552 17.111,295 32.967,915 338.920,062
Volume 7.473,05 ± 33.587,3 ± 1.392 ± 15.515,35 ± 9.701,45 ± 13.353,05 ± 17.160,25 ± 4.252,35 ± 16.413,25 ± 22.020,25 ± 32.594,1 ±
(melhor) 930,668 2.155,603 379,195 1.206,538 1.565,206 1.815,944 1.536,883 2.720,344 1.481,707 2.002,526 2.071,892
Volume 7.773,832 ± 31.437,893 435,138 ± 13.361,586 9.031,994 ± 11.176,062 13.558,779 7.863,083 ± 12.566,103 15.458,387 6.718,994 ±
(média) 338,818 ± 613,369 43,065 ± 586,299 457,294 ± 1.517,271 ± 1.027,373 481,17 ± 589,832 ± 649,515 512,557
Cobertura 0,986 ± 0,987 ± 0,307 ± 0,993 ± 0,991 ± 0,792 ± 0,823 ± 0,988 ± 0,99 ± 0,999 ± 0,967 ±
elementos 0,004 0,001 0,027 0,003 0,003 0,039 0,021 0,006 0,006 0,001 0,004
Cobertura 1±0 0,987 ± 0,583 ± 1±0 1±0 0,92 ± 0,914 ± 1±0 1±0 1±0 0,976 ±
linhas e 0,001 0,025 0,046 0,029 0,004
colunas
Sobreposi- 0,164 ± 0,687 ± 0,008 ± 0,286 ± 0,18 ± 0,01 0,755 ± 0,459 ± 0,162 ± 0,272 ± 0,302 ± 0,057 ±
ção 0,008 0,038 0,001 0,013 0,007 0,033 0,009 0,011 0,012 0,008
Jaccard 0,219 ± 0,645 ± 0,067 ± 0,32 ± 0,01 0,253 ± 0,757 ± 0,43 ± 0,03 0,21 ± 0,303 ± 0,324 ± 0,152 ±
0,006 0,061 0,005 0,008 0,001 0,006 0,008 0,01 0,013
Qtd. - 8,55 ± 7,45 ± 32,45 ± 4,45 ± 3,45 ± 19,05 ± 28,95 ± 0,45 ± 3,9 ± 1,586 1,9 ± 0,308 32,65 ±
biclusters 1,605 2,523 3,379 1,468 1,395 20,231 7,323 0,605 2,033
Sucesso 100 100 100 100 100 95 100 40 100 100 100
VE 0,061 ± 0,044 ± 0,043 ± 0,056 ± 0,101 ± 0,037 ± -0,068 ± 0,071 ± 0,109 ± -0,122 ± 0,337 ±
0,218 0,668 0,182 0,458 0,447 0,512 0,477 0,277 0,404 0,446 0,917
TVE 0,041 ± -0,255 ± -0,146 ± -0,137 ± -0,093 ± -0,017 ± -0,097 ± 0,017 ± 0,001 ± 0,09 ± -0,015 ±
0,373 0,459 0,231 0,391 0,374 0,438 0,34 0,24 0,311 0,453 0,326
MI 0,794 ± 0,949 ± 0,855 ± 0,833 ± 0,768 ± 0,821 ± 0,858 ± 0,663 ± 0,829 ± 0,847 ± 0,898 ±
0,051 0,017 0,091 0,037 0,053 0,055 0,037 0,138 0,05 0,039 0,021
LC 0,199 ± 0,154 ± 0,188 ± 0,185 ± 0,206 ± 0,188 ± 0,177 ± 0,276 ± 0,18 ± 0,176 ± 0,15 ±
0,01 0,003 0,014 0,007 0,012 0,01 0,007 0,049 0,008 0,006 0,001
202
Tabela 110: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Breast_Colon
Breast_Colo ABC 5 (J) BICACO 1 BIC-aiNet 1 CDE 4 (J) dFSS 5 (J) CGA 1 (J) FSGA 1 GSO 5 (J) MHS 5 (J) NichePSO 5 SwarmBclu
n (LC) (LC) (LC) (J) ster 1 (J)
Tempo 8,761 ± 11,979 ± 0,683 ± 8,705 ± 8,782 ± 9,428 ± 10,008 ± 8,855 ± 8,492 ± 8,774 ± 4,68 ±
0,048 0,092 0,062 0,068 0,075 0,181 0,142 0,04 0,058 0,061 0,086
MSR 19.959,093 21.454,199 18.614,782 19.309,828 19.857,791 20.860,37 ± 21.333,435 29.861,845 19.152,939 15.880,226 11.337,512
(melhor) ± 2.157,941 ± 489,322 ± 2.917,066 ± 1.723,183 ± 1.937,154 1.000,97 ± 603,485 ± 9.548,282 ± 2.224,731 ± 1.943,938 ± 4.847,122
MSR 60.822,643 25.249,716 86.025,147 37.000,664 132.518,774 22.237,217 23.245,034 204.116,375 31.241,235 108.795,125 129.691,389
(média) ± ± 858,233 ± ± 3.292,742 ± ± 1.149,294 ± 3.639,835 ± ± 2.469,37 ± ±
10.607,576 26.231,618 19.980,278 31.009,058 19.960,183 32.965,256
Volume 2.607,05 ± 8.023,85 ± 4.425,45 ± 7.182,2 ± 3.879,85 ± 5.262,1 ± 6.650,15 ± 1.637,3 ± 2.886,05 ± 7.442,6 ± 9.463,7 ±
(melhor) 555,853 616,249 3.906,022 655,344 602,957 611,631 744,835 583,424 246,165 854,747 718,242
Volume 2.454,295 ± 8.061,973 ± 781,428 ± 4.625,206 ± 2.978,732 ± 4.319,031 ± 4.735,451 ± 1.856,253 ± 2.373,233 ± 2.434,557 ± 1.377,248 ±
(média) 130,322 247,076 80,473 123,034 131,742 430,469 310,286 150,58 109,486 116,884 112,744
Cobertura 0,982 ± 0,907 ± 0,856 ± 0,967 ± 0,993 ± 0,866 ± 0,904 ± 0,945 ± 0,945 ± 0,986 ± 0,956 ±
elementos 0,006 0,012 0,035 0,007 0,002 0,012 0,009 0,013 0,008 0,005 0,009
Cobertura 0,999 ± 0,908 ± 0,995 ± 0,978 ± 0,999 ± 0,928 ± 0,931 ± 0,988 ± 0,965 ± 0,999 ± 0,992 ±
linhas e 0,004 0,012 0,004 0,008 0,002 0,008 0,009 0,009 0,013 0,002 0,005
colunas
Sobreposi- 0,145 ± 0,594 ± 0,044 ± 0,279 ± 0,175 ± 0,76 ± 0,485 ± 0,125 ± 0,148 ± 0,152 ± 0,062 ±
ção 0,007 0,023 0,004 0,008 0,009 0,006 0,053 0,011 0,006 0,007 0,006
Jaccard 0,228 ± 0,644 ± 0,087 ± 0,344 ± 0,258 ± 0,785 ± 0,533 ± 0,227 ± 0,23 ± 0,232 ± 0,212 ±
0,008 0,017 0,004 0,007 0,009 0,006 0,046 0,009 0,007 0,008 0,012
Qtd. - 3,45 ± 8,45 ± 15,8 ± 4,75 ± 1,41 2,6 ± 1,392 23,5 ± 24,2 ± 0,2 ± 0,41 7,8 ± 2,397 4,75 ± 22,85 ±
biclusters 1,986 5,042 3,334 20,98 12,837 1,618 4,246
Sucesso 95 95 100 100 100 95 100 20 100 100 100
VE 0,038 ± 0,088 ± 0,047 ± 0,025 ± 0,091 ± 0,2 ± 0,439 0,078 ± 0,022 ± 0,053 ± -0,017 ± -0,116 ±
0,305 0,335 0,399 0,431 0,392 0,447 0,278 0,37 0,569 0,78
TVE 0,135 ± -0,028 ± -0,092 ± -0,028 ± 0,087 ± 0,128 ± -0,054 ± -0,099 ± 0,06 ± 0,056 ± 0,109 ±
0,368 0,793 0,441 0,762 0,709 0,714 0,623 0,528 0,509 0,692 0,386
MI 1,708 ± 1,877 ± 1,684 ± 1,813 ± 1,767 ± 1,786 ± 1,812 ± 1,725 ± 1,783 ± 1,778 ± 1,734 ±
0,135 0,057 0,188 0,063 0,086 0,109 0,103 0,104 0,109 0,083 0,055
LC 0,261 ± 0,242 ± 0,259 ± 0,238 ± 0,247 ± 0,24 ± 0,237 ± 0,304 ± 0,262 ± 0,251 ± 0,29 ±
0,021 0,011 0,032 0,017 0,021 0,015 0,015 0,067 0,033 0,014 0,024
203
Tabela 111: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Lung
Lung ABC 5 (LC) BICACO 5 BIC-aiNet 1 CDE 4 (J) dFSS 5 CGA 1 FSGA 1 (J) GSO 5 (LC) MHS 4 (J) NichePSO 4 SwarmBclu
(LC) (LC) (LC) (LC) (LC) ster 1 (J)
Tempo 72,605 ± 108,181 ± 11,788 ± 73,088 ± 72,349 ± 74,448 ± 75,948 ± 73,453 ± 72,384 ± 74,041 ± 50,372 ±
0,22 0,386 0,912 0,239 0,242 0,417 0,512 0,262 0,358 0,312 0,99
MSR 30.616,141 35.357,061 20.763,481 31.478,282 31.681,627 34.552,521 33.858,086 40.381,796 32.045,873 33.178,619 7.331,268 ±
(melhor) ± 3.557,608 ± 545,185 ± 5.813,589 ± 2.217,865 ± 2.872,674 ± 1.327,786 ± 1.483,697 ± 4.868,557 ± 2.551,689 ± 2.128,311 1.617,749
MSR 52.328,586 39.069,6 ± 30.768,797 48.164,605 64.293,285 35.964,781 34.481,851 76.024,96 ± 47.296,866 64.293,273 83.206,632
(média) ± 2.436,127 710,722 ± 5.853,962 ± 3.267,369 ± 3.960,937 ± 1.822,851 ± 1.097,573 2.668,301 ± 1.394,586 ± 2.945,64 ±
19.704,072
Volume 47.131,05 ± 193.942,45 9.707,9 ± 135.899,95 67.633,8 ± 88.611,4 ± 112.233,75 34.066,5 ± 131.932,2 ± 182.855,05 241.641,05
(melhor) 7.416,519 ± 4.340,421 3.354,335 ± 5.736,036 3.967,596 4.662,628 ± 5.986,157 12.460,225 4.909,22 ± 5.035,302 ±
10.299,604
Volume 44.724,462 188.479,629 1.981,295 ± 88.030,464 50.279,485 76.751,457 86.032,419 44.968,344 83.184,166 101.319,415 22.449,349
(média) ± 2.158,442 ± 2.192,687 315,068 ± 2.633,205 ± 2.264,041 ± 4.865,894 ± 4.740,218 ± 2.864,713 ± 3.659,244 ± 2.853,632 ± 4.872,596
Cobertura 0,995 ± 0,996 ± 0,265 ± 0,999 ± 0,995 ± 0,934 ± 0,965 ± 0,99 ± 0,999 ± 1±0 0,963 ±
elementos 0,001 0,001 0,036 0,001 0,002 0,006 0,004 0,003 0,001 0,011
Cobertura 1±0 0,996 ± 0,728 ± 1±0 1±0 0,988 ± 0,991 ± 1±0 1 ± 0,001 1±0 0,972 ±
linhas e 0,001 0,024 0,002 0,002 0,01
colunas
Sobreposi- 0,156 ± 0,758 ± 0,007 ± 0,307 ± 0,18 ± 0,754 ± 0,448 ± 0,171 ± 0,287 ± 0,352 ± 0,033 ±
ção 0,008 0,049 0,001 0,009 0,008 0,003 0,041 0,011 0,013 0,009 0,008
Jaccard 0,224 ± 0,716 ± 0,039 ± 0,34 ± 0,255 ± 0,764 ± 0,462 ± 0,228 ± 0,319 ± 0,367 ± 0,201 ±
0,007 0,067 0,002 0,007 0,009 0,002 0,038 0,008 0,01 0,008 0,012
Qtd. - 7,35 ± 4,9 ± 2,245 37,65 ± 7,3 ± 2,296 4,35 ± 22,7 ± 36,35 ± 0,15 ± 5,9 ± 1,518 1,75 ± 34,45 ±
biclusters 2,277 3,483 1,348 21,568 8,022 0,366 0,716 2,038
Sucesso 100 95 100 100 100 100 100 15 100 90 100
VE -0,039 ± 0,009 ± 0,054 ± -0,003 ± -0,028 ± -0,029 ± -0,115 ± -0,037 ± 0,223 ± -0,03 ± -0,035 ±
0,491 0,578 0,336 0,554 0,526 0,45 0,414 0,295 0,556 0,804 0,941
TVE -0,387 ± -0,556 ± 0,052 ± 0,155 ± 0,041 ± -0,003 ± -0,371 ± -0,085 ± -0,402 ± 0,548 ± 0,211 ±
1,985 2,038 1,112 2,317 2,113 1,431 1,727 0,891 2,507 2,275 1,332
MI 2,518 ± 2,49 ± 2,443 ± 2,488 ± 2,525 ± 2,542 ± 2,511 ± 2,525 ± 2,489 ± 2,477 ± 2,32 ±
0,052 0,019 0,088 0,029 0,05 0,034 0,031 0,066 0,024 0,018 0,008
LC 0,17 ± 0,164 ± 0,184 ± 0,165 ± 0,166 ± 0,173 ± 0,168 ± 0,184 ± 0,163 ± 0,163 ± 0,182 ±
0,013 0,002 0,018 0,006 0,008 0,008 0,006 0,018 0,005 0,004 0,002
204
Tabela 112: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Multitissue
Multitissue ABC 5 (J) BICACO 5 BIC-aiNet 1 CDE 3 (J) dFSS 5 CGA 1 (J) FSGA 1 (J) GSO 5 (J) MHS 4 (J) NichePSO 4 SwarmBclu
Tempo 63,104 ± 91,914 ± 9,301 ± 63,48 ± 62,72 ± 64,703 ± 65,976 ± 62,747 ± 62,109 ± 63,128 ± 40,44 ±
0,232 0,451 0,591 0,303 0,206 0,402 0,458 0,223 0,172 0,146 1,153
MSR 122.406,395 154.642,713 130.028,291 160.522,791 149.660,393 160.078,842 159.506,538 216.293,095 154.276,17 152.526,213 109.627,176
(melhor) ± ± ± ± 8.239,764 ± ± 7.652,656 ± 6.231,009 ± ± ± ±
17.700,351 14.766,126 35.286,237 16.297,249 40.646,015 10.402,878 12.610,378 39.843,972
MSR 248.735,144 183.566,994 218.542,691 250.089,908 306.606,522 167.766,539 162.918,001 391.280,715 223.204,313 312.836,299 910.834,112
(média) ± ± 2.796,329 ± ± 8.638,517 ± ± ± 3.879,734 ± ± 7.429,06 ± ±
13.100,193 28.680,343 19.864,921 10.029,633 23.500,561 13.407,467 258.690,056
Volume 38.658,15 ± 146.926,3 ± 5.654,85 ± 124.177,1 ± 53.884,25 ± 70.228,15 ± 87.737,4 ± 31.991,95 ± 104.196,4 ± 137.788,1 ± 157.465,85
(melhor) 2.229,333 6.005,371 2.194,188 7.805,905 2.612,077 3.392,608 4.164,848 15.506,514 4.704,284 3.758,346 ±
17.813,806
Volume 36.879,213 145.542,817 1.784,154 ± 88.390,7 ± 41.415,105 61.288,906 70.940,251 37.243,834 66.940,144 79.184,405 23.698,291
(média) ± 1.723,734 ± 1.584,811 189,863 3.771,152 ± 1.684,012 ± 4.504,388 ± 3.110,048 ± 2.144,917 ± 2.125,721 ± 3.534,055 ± 4.187,076
Cobertura 0,992 ± 0,994 ± 0,286 ± 0,994 ± 0,994 ± 0,896 ± 0,931 ± 0,989 ± 0,991 ± 1±0 0,971 ±
elementos 0,002 0,002 0,026 0,003 0,002 0,008 0,008 0,003 0,002 0,01
Cobertura 1 ± 0,001 0,996 ± 0,775 ± 0,997 ± 1±0 0,965 ± 0,97 ± 1±0 0,995 ± 1±0 0,997 ±
linhas e 0,001 0,018 0,003 0,007 0,006 0,003 0,008
colunas
Sobreposi- 0,159 ± 0,726 ± 0,007 ± 0,377 ± 0,18 ± 0,755 ± 0,469 ± 0,172 ± 0,288 ± 0,337 ± 0,05 ±
ção 0,008 0,033 0,001 0,016 0,007 0,006 0,045 0,009 0,009 0,016 0,015
Jaccard 0,226 ± 0,689 ± 0,04 ± 0,379 ± 0,254 ± 0,764 ± 0,477 ± 0,229 ± 0,32 ± 0,359 ± 0,184 ±
0,007 0,045 0,002 0,013 0,007 0,005 0,042 0,008 0,007 0,013 0,013
Qtd. - 10,8 ± 6,6 ± 2,234 24,95 ± 1,8 ± 0,834 5,65 ± 27,35 ± 34,9 ± 0,1 ± 0,308 7,45 ± 2,05 ± 0,51 31 ± 4,052
biclusters 2,745 4,032 1,631 20,699 5,946 1,905
Sucesso 100 100 100 100 100 100 100 10 100 100 100
VE -0,028 ± 0,34 ± -0,035 ± -0,019 ± 0,014 ± -0,033 ± -0,013 ± 0,116 ± -0,045 ± 0,209 ± -0,431 ±
0,579 0,991 0,356 0,921 0,472 0,593 0,394 0,455 0,468 0,834 1,564
TVE -0,065 ± 0,053 ± -0,053 ± -0,061 ± 0,022 ± 0,208 ± 0,037 ± -0,039 ± 0,186 ± 0,115 ± -0,209 ±
0,342 0,408 0,18 0,332 0,299 0,282 0,404 0,288 0,497 0,382 0,544
MI 0,701 ± 0,794 ± 0,714 ± 0,758 ± 0,708 ± 0,749 ± 0,766 ± 0,736 ± 0,757 ± 0,765 ± 0,706 ±
0,033 0,023 0,08 0,021 0,027 0,034 0,028 0,073 0,017 0,016 0,056
LC 0,128 ± 0,14 ± 0,01 0,181 ± 0,12 ± 0,137 ± 0,135 ± 0,132 ± 0,168 ± 0,12 ± 0,115 ± 0,13 ±
0,008 0,026 0,005 0,012 0,015 0,012 0,02 0,007 0,003 0,027
205
Tabela 113: Resultado do Bagged Biclustering com um algoritmo (com sobreposição) para Yeast
Yeast ABC 5 (J) BICACO 3 BIC-aiNet 1 CDE 1 (LC) dFSS 5 CGA 1 FSGA 1 GSO 5 (J) MHS 1 NichePSO 4 SwarmBclu
(LC) (LC) (LC) (LC) (LC) (LC) (J) ster 1 (J)
Tempo 91,126 ± 70,766 ± 1,76 ± 91,253 ± 89,529 ± 95,485 ± 94,092 ± 91,325 ± 91,38 ± 93,05 ± 7,616 ±
0,148 0,831 0,153 0,224 3,869 1,143 0,573 0,276 0,212 0,315 0,279
MSR 169,931 ± 278,668 ± 296,988 ± 218,727 ± 167,731 ± 228,839 ± 245,574 ± 259,547 ± 167,896 ± 128,783 ± 261,661 ±
(melhor) 106,549 12,89 2,993 143,803 131,049 37,494 33,408 302,228 163,975 100,453 31,459
MSR 637,532 ± 344,889 ± 356,584 ± 672,803 ± 810,85 ± 261,257 ± 341,236 ± 951,269 ± 695,634 ± 894,174 ± 273,357 ±
(média) 31,567 22,536 22,062 19,204 31,454 69,289 112,482 64,149 42,935 35,715 15,138
Volume 1.416,9 ± 5.034,6 ± 871,4 ± 2.318,6 ± 1.543,7 ± 2.514,8 ± 2.772,7 ± 1.839,2 ± 2.018,35 ± 1.137,7 ± 3.904,85 ±
(melhor) 554,56 524,841 211,386 1.360,111 569,505 35,006 40,561 1.416,822 1.192,538 554,879 1.205,973
Volume 4.898,88 ± 2.820,219 ± 357,154 ± 11.410,136 6.403,112 ± 2.490,931 ± 3.493,081 ± 6.591,596 ± 11.423,638 10.491,026 2.090,076 ±
(média) 437,041 130,015 55,166 ± 737,823 547,946 500,109 1.212,128 731,277 ± 1.205,818 ± 1.058,199 232,335
Cobertura 0,937 ± 0,613 ± 0,28 ± 0,859 ± 0,98 ± 0,343 ± 0,388 ± 0,989 ± 0,906 ± 0,996 ± 0,654 ±
elementos 0,014 0,027 0,032 0,034 0,007 0,028 0,041 0,005 0,05 0,002 0,025
Cobertura 0,994 ± 0,839 ± 0,455 ± 0,891 ± 0,999 ± 0,539 ± 0,569 ± 1±0 0,947 ± 0,999 ± 0 0,728 ±
linhas e 0,018 0,016 0,027 0,055 0,001 0,049 0,081 0,066 0,017
colunas
Sobreposi- 0,137 ± 0,151 ± 0,009 ± 0,343 ± 0,158 ± 0,662 ± 0,343 ± 0,1 0,161 ± 0,318 ± 0,251 ± 0,077 ±
ção 0,013 0,01 0,002 0,018 0,014 0,061 0,017 0,026 0,024 0,008
Jaccard 0,188 ± 0,295 ± 0,039 ± 0,378 ± 0,232 ± 0,724 ± 0,439 ± 0,196 ± 0,349 ± 0,296 ± 0,059 ±
0,008 0,015 0,006 0,014 0,007 0,052 0,047 0,011 0,018 0,016 0,003
Qtd. - 4,7 ± 2,452 16,7 ± 31,45 ± 0,85 ± 2,05 ± 1,82 43,6 ± 29,25 ± 1,2 ± 1,642 1,4 ± 1,273 1,8 ± 0,696 27,55 ± 3
biclusters 3,028 3,348 0,813 12,592 18,113
Sucesso 100 100 100 65 90 100 100 65 75 100 100
VE -0,018 ± 0,593 ± -0,066 ± 0,151 ± 0,024 ± -0,001 ± -0,02 ± -0,12 ± -0,077 ± 0,013 ± -0,229 ±
0,073 1,833 0,487 0,633 0,096 0,095 0,099 0,747 0,467 0,054 1,206
TVE -0,803 ± 0,853 ± -0,617 ± -1,316 ± -0,989 ± 149,836 ± 7,493 ± -0,411 ± -4,37 ± -3,118 ± -1,24 ±
16,139 4,24 6,486 7,49 9,34 1.457,347 16,195 1,894 19,314 10,576 6,082
MI 0,278 ± 0,923 ± 1,065 ± 0,329 ± 0,274 ± 0,385 ± 0,409 ± 0,318 ± 0,253 ± 0,229 ± 1,218 ±
0,168 0,044 0,134 0,212 0,214 0,044 0,044 0,355 0,245 0,177 0,304
LC 0,402 ± 0,404 ± 0,309 ± 0,432 ± 0,38 ± 0,29 0,556 ± 0,591 ± 0,263 ± 0,309 ± 0,331 ± 0,346 ±
0,242 0,031 0,034 0,262 0,064 0,064 0,273 0,289 0,255 0,063
206
Tabela 114: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Artificial_2
Artificial_2 ABC 10 (LC) BICACO 7 BIC-aiNet 6 CDE 10 (LC) dFSS 10 CGA 6 (LC) FSGA 10 GSO 10 (LC) MHS 10 NichePSO 10 SwarmBclust
(LC) (LC) (LC) (LC) (LC) (LC) er 6 (LC)
Tempo 9,057 ± 0,049 5,041 ± 0,037 2,17 ± 0,361 8,82 ± 0,062 9,136 ± 0,072 7,812 ± 0,202 8,912 ± 0,13 9,154 ± 0,133 8,811 ± 0,034 8,956 ± 0,051 6,142 ± 0,027
MSR 9,285 ± 5,298 12,039 ± 1,056 ± 1,536 15,988 ± 21,126 ± 22,745 ± 16,216 ± 19,88 ± 5,75 12,538 ± 12,161 ± 0,364 ± 0,067
(melhor) 4,521 5,712 4,063 0,936 8,869 5,628 6,103
MSR (média) 28,388 ± 28,877 ± 20,812 ± 28,56 ± 0,27 30,157 ± 0,38 25,261 ± 29,313 ± 30,348 ± 28,138 ± 29,235 ± 0,29 0,97 ± 0,35
0,323 0,317 0,653 0,355 0,518 0,405 0,354
Volume 28,95 ± 834,1 ± 21,55 ± 327,7 ± 184,8 ± 2.272,5 ± 69,65 ± 152,2 ± 129,3 ± 201,25 ± 129,3 ±
(melhor) 39,069 690,263 12,821 347,063 251,26 382,666 108,627 191,486 230,988 487,28 13,542
Volume 1.381,619 ± 1.828,18 ± 208,242 ± 1.459,486 ± 1.478,375 ± 2.623,125 ± 1.741,05 ± 1.194,033 ± 1.412,195 ± 1.394,409 ± 101,01 ± 7,58
(média) 48,879 74,76 27,479 54,992 43,768 153,275 122,025 56,436 60,913 59,988
Cobertura 0,984 ± 0,005 0,978 ± 0,006 0,398 ± 0,044 0,978 ± 0,006 0,994 ± 0,002 0,655 ± 0,022 0,931 ± 0,014 0,963 ± 0,017 0,978 ± 0,009 0,982 ± 0,005 0,182 ± 0,013
elementos
Cobertura 1 ± 0,001 0,998 ± 0,002 0,989 ± 0,008 1 ± 0,001 1±0 0,894 ± 0,025 0,996 ± 0,005 0,996 ± 0,004 1±0 0,999 ± 0,002 0,317 ± 0,018
linhas e
colunas
Sobreposição 0,064 ± 0,004 0,096 ± 0,004 0,01 ± 0,001 0,071 ± 0,004 0,065 ± 0,003 0,194 ± 0,012 0,103 ± 0,008 0,053 ± 0,003 0,068 ± 0,004 0,064 ± 0,003 0,013 ± 0,002
Jaccard 0,124 ± 0,007 0,163 ± 0,006 0,047 ± 0,003 0,136 ± 0,007 0,134 ± 0,007 0,269 ± 0,011 0,162 ± 0,013 0,154 ± 0,011 0,128 ± 0,007 0,129 ± 0,006 0,248 ± 0,022
Qtd. - 0,25 ± 0,55 0±0 1,8 ± 1,196 0±0 0±0 0±0 0,2 ± 0,523 0±0 0±0 0,05 ± 0,224 41,9 ± 2,594
biclusters
Sucesso 20 0 90 0 0 0 15 0 0 5 100
VE -0,005 ± -0,01 ± 0,229 0 ± 0,096 0,017 ± 0,114 -0,007 ± -0,074 ± 0,018 ± 0,066 -3,633 ± 0,003 ± 0,084 -0,047 ± 1,017 ± 1,801
0,108 0,119 0,257 16,296 0,175
TVE 0,018 ± 0,143 0,042 ± 0,428 0,464 ± 1,897 0,092 ± 0,293 -0,023 ± 0,16 0,065 ± 0,4 -0,043 ± 0,034 ± 0,235 0,056 ± 0,149 -0,088 ± 0,142 ± 0,415
0,099 0,219
MI 0,904 ± 0,384 0,836 ± 0,147 0,568 ± 0,31 1,113 ± 0,207 1,388 ± 0,174 1,16 ± 0,067 1,074 ± 0,558 1,35 ± 0,283 1,111 ± 0,239 0,896 ± 0,463 0,601 ± 0,152
LC 0,429 ± 0,299 0,353 ± 0,231 0,705 ± 0,364 0,333 ± 0,194 0,281 ± 0,112 0,198 ± 0,015 0,39 ± 0,278 0,271 ± 0,146 0,388 ± 0,17 0,441 ± 0,297 0,895 ± 0,111
RMS 0,007 ± 0,016 0±0 0,039 ± 0,033 0±0 0±0 0±0 0,007 ± 0,018 0±0 0±0 0,001 ± 0,005 0,058 ± 0,001
(biclusters)
RMS 0,123 ± 0,006 0,151 ± 0,007 0,098 ± 0,008 0,134 ± 0,006 0,118 ± 0,005 0,234 ± 0,013 0,142 ± 0,01 0,103 ± 0,006 0,13 ± 0,007 0,123 ± 0,005 0,068 ± 0,003
(população)
CMS 0,008 ± 0,016 0±0 0,032 ± 0,028 0±0 0±0 0±0 0,001 ± 0,003 0±0 0±0 0±0 0,467 ± 0,04
(biclusters)
CMS 0,28 ± 0,012 0,32 ± 0,007 0,115 ± 0,012 0,301 ± 0,015 0,268 ± 0,009 0,476 ± 0,019 0,273 ± 0,017 0,278 ± 0,013 0,288 ± 0,013 0,276 ± 0,013 0,501 ± 0,029
(população)
MS 0,006 ± 0,013 0±0 0,034 ± 0,028 0±0 0±0 0±0 0,004 ± 0,01 0±0 0±0 0,001 ± 0,002 0,295 ± 0,025
(biclusters)
MS 0,189 ± 0,007 0,221 ± 0,004 0,104 ± 0,008 0,203 ± 0,009 0,183 ± 0,006 0,328 ± 0,015 0,194 ± 0,01 0,188 ± 0,008 0,195 ± 0,008 0,188 ± 0,007 0,32 ± 0,017
(população)
207
(J) (LC) (LC) (LC) (LC) (LC) er 7 (J)
Tempo 9,163 ± 0,091 5,06 ± 0,072 1,658 ± 0,247 8,94 ± 0,093 9,224 ± 0,074 8,137 ± 0,175 8,864 ± 0,145 9,145 ± 0,062 8,879 ± 0,075 9,034 ± 0,058 5,774 ± 0,083
MSR 6,177 ± 4,499 9,76 ± 1,697 1,209 ± 1,476 9,769 ± 3,939 13,898 ± 14,695 ± 9,538 ± 5,589 13,08 ± 4,636 6,712 ± 5,192 5,933 ± 4,663 0,309 ± 0,195
(melhor) 2,277 0,693
MSR (média) 19,763 ± 18,256 ± 14,445 ± 19,787 ± 21,267 ± 16,438 ± 19,3 ± 0,652 21,489 ± 0,37 19,43 ± 0,373 20,359 ± 5,013 ± 0,816
0,313 0,311 0,821 0,347 0,337 0,385 0,347
Volume 67 ± 87,977 555,35 ± 26,95 ± 472 ± 175,8 ± 2.341,2 ± 524,65 ± 109,1 ± 52,75 ± 124,35 ± 97,55 ± 8,775
(melhor) 764,939 18,788 458,117 209,735 344,567 966,147 113,74 87,197 362,167
Volume 1.411,494 ± 1.698,143 ± 229,586 ± 1.491,937 ± 1.495,744 ± 2.750 ± 1.699,08 ± 1.211,424 ± 1.423,852 ± 1.396,922 ± 136,009 ±
(média) 54,555 115,693 28,332 58,148 49,778 141,36 105,915 52,875 51,646 70,872 10,781
Cobertura 0,986 ± 0,003 0,938 ± 0,014 0,428 ± 0,04 0,976 ± 0,007 0,994 ± 0,002 0,664 ± 0,026 0,897 ± 0,017 0,966 ± 0,014 0,975 ± 0,006 0,983 ± 0,005 0,267 ± 0,019
elementos
Cobertura 1±0 0,994 ± 0,005 0,991 ± 0,009 0,999 ± 0,002 1 ± 0,001 0,874 ± 0,024 0,99 ± 0,008 0,997 ± 0,005 0,999 ± 0,002 0,999 ± 0,002 0,463 ± 0,026
linhas e
colunas
Sobreposição 0,065 ± 0,004 0,101 ± 0,006 0,011 ± 0,001 0,072 ± 0,004 0,066 ± 0,003 0,202 ± 0,009 0,11 ± 0,01 0,054 ± 0,002 0,068 ± 0,004 0,064 ± 0,004 0,009 ± 0,001
Jaccard 0,125 ± 0,008 0,166 ± 0,006 0,049 ± 0,003 0,137 ± 0,005 0,135 ± 0,006 0,276 ± 0,008 0,17 ± 0,014 0,157 ± 0,01 0,128 ± 0,007 0,128 ± 0,008 0,285 ± 0,01
Qtd. - 0,25 ± 0,55 0±0 2,25 ± 1,333 0±0 0±0 0±0 0,15 ± 0,366 0,05 ± 0,224 0,4 ± 0,598 0,25 ± 0,444 21,8 ± 3,254
biclusters
Sucesso 20 0 90 0 0 0 15 5 35 25 100
VE -0,006 ± -0,003 ± -0,007 ± -0,016 ± -0,017 ± 0,009 ± 0,11 0,017 ± 0,064 -0,011 ± 0,041 ± 0,086 0,018 ± 0,064 -0,699 ±
0,061 0,113 0,049 0,104 0,061 0,092 3,046
TVE 0,021 ± 0,038 0,001 ± 0,043 0,001 ± 0,079 0,016 ± 0,036 0,013 ± 0,074 0,003 ± 0,044 -0,004 ± 0,01 ± 0,028 -0,001 ± 0,04 -0,003 ± -0,01 ± 0,022
0,025 0,052
MI 0,655 ± 0,38 0,879 ± 0,112 0,62 ± 0,3 0,843 ± 0,263 1,132 ± 0,18 0,969 ± 0,042 0,806 ± 0,392 1,177 ± 0,265 0,617 ± 0,487 0,748 ± 0,477 0,906 ± 0,329
LC 0,291 ± 0,279 0,222 ± 0,102 0,67 ± 0,284 0,309 ± 0,268 0,288 ± 0,185 0,151 ± 0,014 0,407 ± 0,338 0,308 ± 0,215 0,324 ± 0,331 0,297 ± 0,226 0,858 ± 0,232
RMS 0,004 ± 0,009 0±0 0,057 ± 0,023 0±0 0±0 0±0 0,004 ± 0,013 0,001 ± 0,006 0,008 ± 0,012 0,007 ± 0,013 0,048 ± 0,002
(biclusters)
RMS 0,143 ± 0,005 0,174 ± 0,006 0,119 ± 0,007 0,152 ± 0,004 0,139 ± 0,003 0,227 ± 0,01 0,164 ± 0,009 0,125 ± 0,005 0,148 ± 0,007 0,143 ± 0,005 0,07 ± 0,005
(população)
CMS 0,009 ± 0,019 0±0 0,047 ± 0,03 0±0 0±0 0±0 0,016 ± 0,053 0,003 ± 0,013 0,026 ± 0,054 0,015 ± 0,037 0,512 ± 0,028
(biclusters)
CMS 0,283 ± 0,012 0,333 ± 0,01 0,146 ± 0,01 0,298 ± 0,009 0,282 ± 0,01 0,42 ± 0,013 0,297 ± 0,02 0,295 ± 0,01 0,289 ± 0,01 0,278 ± 0,011 0,531 ± 0,021
(população)
MS 0,005 ± 0,011 0±0 0,047 ± 0,024 0±0 0±0 0±0 0,01 ± 0,032 0,002 ± 0,01 0,015 ± 0,03 0,009 ± 0,022 0,309 ± 0,016
(biclusters)
MS 0,194 ± 0,008 0,231 ± 0,005 0,126 ± 0,007 0,204 ± 0,005 0,193 ± 0,006 0,295 ± 0,009 0,21 ± 0,012 0,199 ± 0,007 0,198 ± 0,007 0,191 ± 0,006 0,337 ± 0,012
(população)
208
(J) (LC) (LC) (LC) (LC) (LC) er 6 (J)
Tempo 9,119 ± 0,111 5,068 ± 0,08 1,711 ± 0,297 8,858 ± 0,083 9,176 ± 0,104 7,898 ± 0,105 8,948 ± 0,151 9,159 ± 0,088 8,813 ± 0,051 8,926 ± 0,052 5,421 ± 0,029
MSR 7,289 ± 5,506 12,515 ± 0,683 ± 0,313 14,145 ± 16,635 ± 20,259 ± 16,444 ± 17,077 ± 7,697 ± 6,01 9,091 ± 6,308 0,436 ± 0,235
(melhor) 4,505 5,142 5,809 0,928 7,185 7,621
MSR (média) 25,765 ± 26,026 ± 17,939 ± 25,825 ± 27,539 ± 22,589 ± 26,402 ± 0,49 27,796 ± 25,403 ± 0,41 26,385 ± 4,29 ± 0,506
0,309 0,321 0,878 0,311 0,419 0,327 0,429 0,457
Volume 45,65 ± 280,25 ± 23,45 ± 9,881 296,1 ± 215,65 ± 2.062,15 ± 399,35 ± 107,6 ± 73,1 ± 133,35 ± 122,65 ±
(melhor) 65,128 575,105 345,355 322,845 355,148 712,372 91,436 134,164 251,211 45,948
Volume 1.387,927 ± 1.770,023 ± 233,366 ± 1.461,209 ± 1.469,491 ± 2.518,555 ± 1.696,071 ± 1.206,645 ± 1.387,527 ± 1.380,906 ± 184,35 ±
(média) 45,386 88,952 39,086 40,267 51,272 89,477 117,7 60,082 44,324 61,244 18,037
Cobertura 0,984 ± 0,005 0,969 ± 0,006 0,433 ± 0,051 0,978 ± 0,007 0,994 ± 0,002 0,647 ± 0,022 0,92 ± 0,015 0,965 ± 0,015 0,973 ± 0,006 0,982 ± 0,004 0,38 ± 0,035
elementos
Cobertura 1 ± 0,001 0,999 ± 0,002 0,99 ± 0,008 0,999 ± 0,002 1±0 0,897 ± 0,026 0,995 ± 0,005 0,996 ± 0,005 1 ± 0,001 1 ± 0,001 0,62 ± 0,037
linhas e
colunas
Sobreposição 0,065 ± 0,003 0,096 ± 0,005 0,011 ± 0,002 0,071 ± 0,003 0,065 ± 0,002 0,185 ± 0,008 0,105 ± 0,01 0,054 ± 0,003 0,068 ± 0,003 0,063 ± 0,004 0,008 ± 0,001
Jaccard 0,123 ± 0,006 0,16 ± 0,005 0,049 ± 0,004 0,134 ± 0,005 0,132 ± 0,006 0,259 ± 0,007 0,168 ± 0,016 0,151 ± 0,011 0,126 ± 0,006 0,126 ± 0,008 0,291 ± 0,012
Qtd. - 0,15 ± 0,366 0±0 2,35 ± 1,424 0,05 ± 0,224 0,05 ± 0,224 0±0 0,05 ± 0,224 0,05 ± 0,224 0,25 ± 0,444 0,25 ± 0,444 26,9 ± 2,222
biclusters
Sucesso 15 0 95 5 5 0 5 5 25 25 100
VE 0,068 ± 0,221 -0,035 ± -0,048 ± -0,06 ± 0,341 -0,045 ± -0,07 ± 0,397 -0,114 ± 0,063 ± 0,147 0,064 ± 0,321 0,019 ± 0,17 0,622 ± 2,564
0,298 0,139 0,224 0,191
TVE 0,017 ± 0,291 0,352 ± 1,913 -0,02 ± 0,285 0,052 ± 0,295 0,036 ± 0,202 -0,038 ± 0,33 0,009 ± 0,176 0,028 ± 0,173 -0,056 ± 0,029 ± 0,241 -0,173 ±
0,539 0,747
MI 0,803 ± 0,409 0,999 ± 0,243 0,596 ± 0,33 1,01 ± 0,273 1,122 ± 0,4 1,121 ± 0,035 0,99 ± 0,344 1,141 ± 0,369 0,77 ± 0,4 0,771 ± 0,494 0,936 ± 0,441
LC 0,456 ± 0,331 0,419 ± 0,237 0,733 ± 0,339 0,298 ± 0,164 0,362 ± 0,248 0,212 ± 0,026 0,41 ± 0,25 0,295 ± 0,191 0,387 ± 0,223 0,315 ± 0,249 0,839 ± 0,19
RMS 0,005 ± 0,013 0±0 0,066 ± 0,022 0,002 ± 0,01 0,001 ± 0,006 0±0 0,001 ± 0,005 0,001 ± 0,005 0,013 ± 0,026 0,009 ± 0,018 0,06 ± 0,002
(biclusters)
RMS 0,147 ± 0,007 0,158 ± 0,004 0,135 ± 0,012 0,151 ± 0,005 0,143 ± 0,004 0,198 ± 0,007 0,159 ± 0,008 0,129 ± 0,006 0,151 ± 0,006 0,144 ± 0,006 0,103 ± 0,006
(população)
CMS 0,004 ± 0,01 0±0 0,051 ± 0,02 0,001 ± 0,007 0,001 ± 0,007 0±0 0,001 ± 0,006 0,001 ± 0,007 0,015 ± 0,033 0,012 ± 0,022 0,478 ± 0,026
(biclusters)
CMS 0,279 ± 0,007 0,312 ± 0,008 0,161 ± 0,016 0,294 ± 0,009 0,28 ± 0,008 0,411 ± 0,018 0,281 ± 0,021 0,295 ± 0,01 0,281 ± 0,01 0,276 ± 0,008 0,516 ± 0,015
(população)
MS 0,003 ± 0,008 0±0 0,05 ± 0,017 0,002 ± 0,008 0,001 ± 0,006 0±0 0,001 ± 0,005 0,001 ± 0,005 0,013 ± 0,029 0,009 ± 0,018 0,307 ± 0,018
(biclusters)
MS 0,191 ± 0,005 0,21 ± 0,004 0,14 ± 0,013 0,2 ± 0,004 0,192 ± 0,006 0,27 ± 0,01 0,197 ± 0,012 0,199 ± 0,006 0,192 ± 0,006 0,189 ± 0,005 0,354 ± 0,01
(população)
209
Tabela 117: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Arabidopsis
Arabidopsis ABC 6 (J) BICACO 6 BIC-aiNet 6 CDE 6 (J) dFSS 6 (J) CGA 6 FSGA 6 (J) GSO 6 (J) MHS 6 (J) NichePSO 6 SwarmBclu
Tempo 25,343 ± 35,574 ± 1,523 ± 25,187 ± 25,346 ± 26,502 ± 26,897 ± 25,364 ± 24,772 ± 25,247 ± 12,023 ±
0,088 0,268 0,115 0,093 0,129 0,309 0,242 0,113 0,12 0,113 0,232
MSR 372,611 ± 307,581 ± 476,152 ± 452,596 ± 456,687 ± 670,241 ± 678,418 ± 425,113 ± 410,325 ± 441,762 ± 398,817 ±
(melhor) 181,663 291,802 145,055 176,524 192,556 27,646 19,731 193,444 176,844 152,796 254,785
MSR 24.242,904 2.671,965 ± 1.471,896 ± 8.157,965 ± 4.328,774 ± 728,396 ± 654,861 ± 2.012,445 ± 4.728,524 ± 4.261,281 ± 5.714,194 ±
(média) ± 1.290,588 677,088 9.303,9 8.183,669 19,063 220,155 2.853,749 2.552,676 2.996,788 2.882,522
24.656,891
Volume 595,95 ± 1.898,65 ± 1.647,75 ± 994,6 ± 979,6 ± 13.197,55 ± 15.167,05 ± 822,05 ± 1.171,25 ± 711,75 ± 10.838,65 ±
(melhor) 546,397 3.464,657 590,633 903,925 844,932 1.406,571 2.639,562 1.185,488 1.685,826 461,283 9.057,572
Volume 2.280,076 ± 4.012,515 ± 641,648 ± 2.842,331 ± 2.694,414 ± 11.314,72 ± 5.921,208 ± 2.643,256 ± 3.043,554 ± 2.392,835 ± 2.419,479 ±
(média) 400,074 785,476 60,581 330,945 775,153 501,175 636,25 525,394 434,522 509,889 237,014
Cobertura 1±0 0,978 ± 0,461 ± 1±0 1±0 0,901 ± 0,931 ± 1±0 1±0 1±0 0,991 ±
elementos 0,003 0,031 0,012 0,006 0,005
Cobertura 1±0 0,981 ± 0,83 ± 1±0 1±0 0,984 ± 0,987 ± 1±0 1±0 1±0 0,992 ±
linhas e 0,002 0,018 0,012 0,009 0,005
colunas
Sobreposi- 0,042 ± 0,049 ± 0,013 ± 0,049 ± 0,049 ± 0,23 ± 0,083 ± 0,044 ± 0,049 ± 0,047 ± 0,051 ±
ção 0,007 0,01 0,001 0,006 0,008 0,015 0,014 0,01 0,007 0,008 0,005
Jaccard 0,062 ± 0,071 ± 0,062 ± 0,05 ± 0,069 ± 0,252 ± 0,106 ± 0,095 ± 0,046 ± 0,072 ± 0,124 ±
0,017 0,014 0,005 0,006 0,013 0,016 0,025 0,024 0,008 0,011 0,015
Qtd. - 17,15 ± 15,35 ± 30,7 ± 18,25 ± 20,05 ± 2,75 ± 12,35 ± 13,9 ± 18,8 ± 15,85 ± 23,3 ±
biclusters 3,588 3,183 2,179 3,508 3,953 1,118 2,601 2,882 4,034 3,265 3,511
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE 0,001 ± -0,006 ± -0,018 ± -0,044 ± -0,016 ± -0,007 ± 0,029 ± 0,003 ± 0,006 ± 0,014 ± 0,038 ±
0,076 0,051 0,091 0,161 0,14 0,095 0,127 0,073 0,079 0,083 0,158
TVE -0,005 ± 0,005 ± 0,002 ± 0,016 ± -0,01 ± 0,04 -0,009 ± 0,007 ± 0,001 ± -0,01 ± 0,01 ± 0,014 ±
0,043 0,035 0,041 0,049 0,036 0,029 0,021 0,048 0,061 0,029
MI 1,284 ± 0,753 ± 1,345 ± 1,306 ± 1,286 ± 1,287 ± 1,281 ± 1,304 ± 1,227 ± 1,279 ± 1,151 ±
0,165 0,558 0,086 0,145 0,148 0,032 0,036 0,102 0,26 0,154 0,354
LC 0,135 ± 0,285 ± 0,137 ± 0,209 ± 0,136 ± 0,109 ± 0,106 ± 0,144 ± 0,288 ± 0,148 ± 0,103 ±
0,099 0,346 0,017 0,119 0,064 0,005 0,008 0,084 0,22 0,085 0,049
210
Tabela 118: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Brain_1
Brain_1 ABC 6 (J) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 6 (J) CGA 6 FSGA 6 (J) GSO 6 (J) MHS 6 NichePSO 6 SwarmBclu
(J) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 45,169 ± 65,451 ± 2,165 ± 45,173 ± 45,114 ± 46,907 ± 46,97 ± 45,298 ± 44,37 ± 45,117 ± 24,232 ±
0,145 0,374 0,18 0,155 0,182 0,479 0,33 0,202 0,14 0,175 0,571
MSR 5.528,156 ± 4.535,739 ± 6.531,302 ± 5.855,795 ± 5.336,22 ± 8.727,818 ± 8.535,689 ± 5.464,568 ± 4.917,236 ± 5.650,225 ± 5.378,051 ±
(melhor) 2.158,83 2.573,004 1.316,406 2.439,41 1.896,431 231,552 266,288 2.426,483 3.208,854 2.323,079 768,714
MSR 27.112,475 51.326,485 8.119,94 ± 34.701,693 20.488,168 9.617,061 ± 7.904,856 ± 13.310,025 38.886,648 27.848,153 12.683,081
(média) ± ± 1.019,279 ± ± 8.612,548 486,765 3.161,288 ± 4.277,028 ± ± ± 4.267,561
11.780,845 14.000,408 10.377,983 19.565,393 11.531,583
Volume 692,45 ± 850,1 ± 1.619,05 ± 1.212,75 ± 652,3 ± 17.010,8 ± 21.126,45 ± 937,35 ± 720,5 ± 516,35 ± 36.655,55 ±
(melhor) 774,156 963,13 376,541 1.091,484 857,971 2.266,586 2.327,907 974,583 1.350,538 601,632 1.600,12
Volume 2.521,202 ± 2.761,928 ± 455,067 ± 3.633,704 ± 3.080,879 ± 13.728,99 ± 5.576,982 ± 3.575,682 ± 3.909,289 ± 3.059,215 ± 2.631,734 ±
(média) 340,805 472,744 35,86 502,774 801,374 606,379 897,401 734,884 398,045 708,698 230,645
Cobertura 1±0 0,992 ± 0,275 ± 0,994 ± 1±0 0,804 ± 0,834 ± 1±0 0,987 ± 1±0 0,91 ±
elementos 0,001 0,018 0,004 0,023 0,022 0,007 0,009
Cobertura 1±0 0,992 ± 0,572 ± 1±0 1±0 0,907 ± 0,902 ± 1±0 0,993 ± 1±0 0,93 ±
linhas e 0,001 0,016 0,027 0,029 0,01 0,008
colunas
Sobreposi- 0,038 ± 0,025 ± 0,007 ± 0,048 ± 0,044 ± 0,231 ± 0,064 ± 0,04 ± 0,051 ± 0,043 ± 0,024 ±
ção 0,004 0,005 0,001 0,005 0,008 0,02 0,012 0,006 0,003 0,006 0,003
Jaccard 0,046 ± 0,187 ± 0,06 ± 0,048 ± 0,051 ± 0,217 ± 0,1 ± 0,029 0,085 ± 0,043 ± 0,061 ± 0,179 ±
0,006 0,039 0,004 0,005 0,008 0,02 0,025 0,004 0,01 0,012
Qtd. - 15,45 ± 13,55 ± 34,8 ± 10,8 ± 18 ± 3,893 3,05 ± 18,3 ± 13,45 ± 11 ± 2,938 13,2 ± 33,3 ±
biclusters 3,268 3,62 3,205 3,205 1,761 5,332 3,72 3,397 3,028
Sucesso 100 100 100 100 100 95 100 100 100 100 100
VE 0,105 ± -0,039 ± -0,024 ± -0,056 ± -0,093 ± -0,045 ± -0,115 ± 0,023 ± 0,043 ± 0,018 ± 0,166 ±
0,329 0,217 0,265 0,189 0,189 0,706 0,535 0,311 0,109 0,249 0,75
TVE 0 ± 0,52 0,075 ± 0,049 ± 0,002 ± 0,077 ± 0,113 ± 0,126 ± 0,034 ± 0,369 ± 0,106 ± -0,018 ±
0,315 0,368 0,503 0,414 0,471 0,593 0,403 1,322 0,316 0,665
MI 2,175 ± 2,484 ± 2,505 ± 2,171 ± 2,369 ± 2,451 ± 2,495 ± 2,515 ± 1,22 ± 2,183 ± 2,693 ±
0,67 0,885 0,125 0,786 0,279 0,065 0,068 0,714 0,951 0,564 0,023
LC 0,328 ± 0,242 ± 0,279 ± 0,304 ± 0,291 ± 0,273 ± 0,271 ± 0,269 ± 0,45 ± 0,342 ± 0,257 ±
0,185 0,142 0,025 0,153 0,041 0,013 0,016 0,106 0,343 0,123 0,003
211
Tabela 119: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Brain_2
Brain_2 ABC 6 (J) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 6 (J) CGA 6 FSGA 6 (J) GSO 6 (J) MHS 6 NichePSO 6 SwarmBclu
(J) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 44,394 ± 64,266 ± 1,842 ± 44,266 ± 44,377 ± 46,082 ± 45,797 ± 44,511 ± 43,499 ± 44,311 ± 28,248 ±
0,148 0,217 0,153 0,161 0,209 0,383 0,359 0,233 0,117 0,16 0,486
MSR 162.934,181 69.496,51 ± 197.190,975 152.400,87 165.740,601 283.788,742 273.785,874 135.345,024 131.803,427 159.956,437 232.279,895
(melhor) ± 81.841,106 ± ± ± ± 8.421,464 ± 9.881,913 ± ± ± ±
77.403,826 71.837,704 88.912,487 79.064,579 64.032,564 92.212,699 84.083,027 52.262,308
MSR 873.894,425 2.028.808,3 324.045,777 1.365.392,9 687.909,908 317.394,796 322.280,013 504.617,791 1.333.309,6 975.894,984 1.511.113,0
(média) ± 15 ± ± 06 ± ± ± ± ± 58 ± ± 1±
326.595,878 746.287,103 56.676,173 360.135,742 226.884,041 16.092,806 169.090,929 235.674,93 437.914,083 267.834,378 352.700,349
Volume 529,75 ± 564,15 ± 1.392 ± 666,95 ± 690,3 ± 13.130,3 ± 16.459,95 ± 407,65 ± 195,25 ± 402,3 ± 14.142,85 ±
(melhor) 485,516 834,003 379,195 818,6 768,584 2.148,7 1.528,443 254,053 219,11 318,766 8.775,457
Volume 2.229,072 ± 2.241,792 ± 434,91 ± 2.863,203 ± 2.593,281 ± 11.009,015 4.614,282 ± 3.076,468 ± 3.206,308 ± 2.380,384 ± 1.915,881 ±
(média) 322,644 279,709 42,969 516,628 406,101 ± 637,762 537,773 742,529 278,862 432,196 99,222
Cobertura 1±0 0,99 ± 0,307 ± 0,999 ± 1±0 0,792 ± 0,823 ± 1±0 0,999 ± 1±0 0,967 ±
elementos 0,001 0,027 0,001 0,039 0,021 0,001 0,004
Cobertura 1±0 0,991 ± 0,583 ± 1±0 1±0 0,92 ± 0,914 ± 1±0 1±0 1±0 0,976 ±
linhas e 0,001 0,025 0,046 0,029 0,004
colunas
Sobreposi- 0,038 ± 0,018 ± 0,008 ± 0,048 ± 0,043 ± 0,231 ± 0,063 ± 0,044 ± 0,05 ± 0,042 ± 0,027 ±
ção 0,004 0,006 0,001 0,004 0,005 0,02 0,011 0,008 0,005 0,004 0,003
Jaccard 0,048 ± 0,253 ± 0,067 ± 0,045 ± 0,052 ± 0,228 ± 0,091 ± 0,078 ± 0,036 ± 0,058 ± 0,165 ±
0,005 0,049 0,005 0,004 0,008 0,022 0,021 0,015 0,003 0,007 0,015
Qtd. - 17,85 ± 13,15 ± 32,45 ± 10,45 ± 19,7 ± 2,45 ± 15,95 ± 13,35 ± 14,15 ± 13,8 ± 27,8 ±
biclusters 3,216 3,281 3,379 2,417 4,143 1,572 3,692 3,924 3,99 1,908 2,419
Sucesso 100 100 100 100 100 85 100 100 100 100 100
VE 0,058 ± -0,01 ± 0,043 ± 0,022 ± 0,017 ± 0,035 ± -0,006 ± 0,018 ± 0,016 ± -0,063 ± 0,356 ±
0,174 0,233 0,182 0,16 0,203 0,552 0,447 0,173 0,087 0,376 0,516
TVE -0,005 ± 0,077 ± -0,146 ± -0,023 ± -0,044 ± 0,047 ± 0,091 ± -0,007 ± 0,244 ± -0,04 ± 0,019 ±
0,155 0,212 0,231 0,214 0,273 0,359 0,326 0,158 1,259 0,174 0,388
MI 0,803 ± 0,755 ± 0,855 ± 0,679 ± 0,759 ± 0,823 ± 0,859 ± 0,837 ± 0,576 ± 0,779 ± 0,937 ±
0,23 0,544 0,091 0,289 0,189 0,054 0,044 0,209 0,251 0,269 0,032
LC 0,212 ± 0,119 ± 0,188 ± 0,278 ± 0,228 ± 0,188 ± 0,18 ± 0,18 ± 0,331 ± 0,232 ± 0,152 ±
0,094 0,116 0,014 0,14 0,066 0,009 0,007 0,066 0,132 0,089 0,005
212
Tabela 120: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Breast_Colon
Breast_Colo ABC 6 (LC) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 6 (J) CGA 6 FSGA 6 GSO 6 (LC) MHS 6 NichePSO 6 SwarmBclu
n (LC) (LC) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 8,741 ± 11,892 ± 0,697 ± 8,672 ± 8,791 ± 9,328 ± 9,976 ± 8,869 ± 8,459 ± 8,764 ± 4,657 ±
0,058 0,079 0,09 0,073 0,096 0,199 0,149 0,105 0,059 0,065 0,091
MSR 5.921,142 ± 11.943,07 ± 18.724,685 10.092,335 9.608,869 ± 21.036,303 19.602,802 6.954,568 ± 5.651,406 ± 5.675,939 ± 9.746,193 ±
(melhor) 7.896,37 7.975,211 ± 2.869,605 ± 8.791,784 6.907,773 ± 971,062 ± 4.696,866 7.567,205 7.478,946 6.733,989 4.047,546
MSR 426.786,178 23.434,64 ± 86.650,502 91.858,038 228.003,094 23.752,903 22.919,82 ± 125.706,626 77.923,547 321.749,636 151.171,615
(média) ± 8.707,914 ± ± ± ± 825,63 5.761,727 ± ± ± ±
172.972,996 28.255,339 40.252,262 119.861,192 29.583,387 44.179,068 191.002,931 44.889,979
Volume 97,1 ± 831,15 ± 4.417,85 ± 820,85 ± 124,9 ± 5.238,45 ± 5.667,55 ± 219 ± 345,1 ± 118,8 ± 6.739 ±
(melhor) 114,595 1.548,061 3.913,556 1.132,138 160,102 695,433 2.171,65 354,376 605,657 134,381 2.045,955
Volume 1.039,075 ± 1.184,367 ± 769,476 ± 879,995 ± 1.180,704 ± 4.270,94 ± 2.725,096 ± 1.486,514 ± 1.106,006 ± 1.202,337 ± 943,397 ±
(média) 152,534 257,9 77,357 176,033 230,089 188,151 577,66 316,521 270,476 226,551 98,729
Cobertura 0,999 ± 0 0,907 ± 0,855 ± 0,974 ± 1±0 0,866 ± 0,904 ± 1±0 0,964 ± 1±0 0,952 ±
elementos 0,012 0,035 0,007 0,012 0,009 0,012 0,009
Cobertura 1±0 0,908 ± 0,995 ± 0,983 ± 1±0 0,928 ± 0,931 ± 1±0 0,974 ± 1±0 0,992 ±
linhas e 0,012 0,004 0,008 0,008 0,009 0,016 0,005
colunas
Sobreposi- 0,048 ± 0,036 ± 0,042 ± 0,034 ± 0,052 ± 0,242 ± 0,113 ± 0,07 ± 0,047 ± 0,053 ± 0,041 ±
ção 0,006 0,016 0,004 0,007 0,011 0,012 0,035 0,017 0,011 0,011 0,006
Jaccard 0,077 ± 0,302 ± 0,085 ± 0,063 ± 0,082 ± 0,323 ± 0,139 ± 0,134 ± 0,079 ± 0,104 ± 0,148 ±
0,011 0,089 0,004 0,011 0,02 0,013 0,045 0,023 0,02 0,017 0,018
Qtd. - 9,35 ± 9,9 ± 3,508 15,65 ± 16,65 ± 12,15 ± 2,45 ± 8,5 ± 3,818 7,85 ± 12,6 ± 4,21 8 ± 2,734 21,8 ±
biclusters 2,661 3,329 2,777 3,313 1,504 2,796 4,526
Sucesso 100 100 100 100 100 90 100 100 100 100 100
VE 0,038 ± -0,089 ± 0,018 ± -0,046 ± -0,024 ± 0,099 ± 0,026 ± 0,055 ± 0,043 ± 0,151 ± 0,106 ±
0,142 0,326 0,403 0,196 0,202 0,433 0,511 0,273 0,328 0,348 0,632
TVE 0,012 ± -0,043 ± -0,13 ± 0,42 -0,034 ± 0,053 ± 0,038 ± -0,218 ± 0,018 ± 0,005 ± -0,027 ± 0,075 ±
0,057 0,328 0,186 0,156 0,619 0,72 0,163 0,092 0,118 0,38
MI 0,76 ± 1,618 ± 1,682 ± 1,196 ± 1,324 ± 1,795 ± 1,736 ± 1,065 ± 0,912 ± 1,023 ± 1,715 ±
1,016 0,895 0,19 0,98 0,651 0,081 0,232 0,872 1,111 0,865 0,119
LC 0,235 ± 0,22 ± 0,259 ± 0,187 ± 0,428 ± 0,238 ± 0,289 ± 0,276 ± 0,111 ± 0,237 ± 0,293 ±
0,335 0,148 0,032 0,176 0,241 0,015 0,174 0,249 0,147 0,28 0,028
213
Tabela 121: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Lung
Lung ABC 6 (J) BICACO BIC-aiNet 6 CDE 6 (J) dFSS 6 (J) CGA 6 FSGA 6 GSO 6 (J) MHS 6 (J) NichePSO 6 SwarmBclu
10 (J) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 71,84 ± 105,271 ± 11,848 ± 71,871 ± 71,59 ± 73,221 ± 74,55 ± 72,715 ± 71,166 ± 72,574 ± 50,031 ±
0,191 0,42 0,792 0,215 0,29 0,391 0,526 0,336 0,275 0,352 1,012
MSR 16.039,63 ± 26.891,899 20.763,481 17.655,572 21.703,185 34.707,911 33.924,472 21.651,044 11.493,673 16.356,719 18.438,165
(melhor) 13.262,75 ± ± 5.813,589 ± ± 8.760,922 ± 1.353,768 ± 1.381,609 ± 9.650,032 ± 12.212,34 ± ± 5.529,275
11.733,926 12.008,089 13.511,102
MSR 178.914,812 199.857,415 30.774,251 335.797,22 85.987,553 36.644,834 46.170,906 52.652,143 372.086,098 126.574,161 89.017,817
(média) ± ± ± 5.865,943 ± ± ± 912,075 ± ± 14.523,69 ± 75.740,13 ± 58.620,46 ±
73.054,589 73.789,726 96.403,002 36.166,638 14.503,128 20.391,647
Volume 3.947,5 ± 74.906,8 ± 9.707,9 ± 3.581,7 ± 8.479,25 ± 88.272,55 ± 110.674,35 6.459 ± 933,3 ± 3.585,7 ± 189.256,9 ±
(melhor) 7.961,163 90.417,254 3.354,335 3.470,081 6.634,575 4.537,595 ± 6.950,122 7.928,955 1.915,877 4.401,525 27.994,878
Volume 12.266,795 15.023,456 1.981,063 ± 13.424,501 15.165,389 76.774,335 24.205,079 13.524,163 11.526,031 15.504,049 9.493,781 ±
(média) ± 1.909,687 ± 1.773,382 315,11 ± 2.223,806 ± 2.823,361 ± 1.659,455 ± 2.396,634 ± 1.981,242 ± 1.997,821 ± 3.630,897 948,933
Cobertura 1±0 0,996 ± 0,265 ± 1±0 1±0 0,934 ± 0,965 ± 1±0 1±0 1±0 0,963 ±
elementos 0,001 0,036 0,006 0,004 0,011
Cobertura 1±0 0,996 ± 0,728 ± 1±0 1±0 0,988 ± 0,991 ± 1±0 1±0 1±0 0,972 ±
linhas e 0,001 0,024 0,002 0,002 0,01
colunas
Sobreposi- 0,042 ± 0,012 ± 0,007 ± 0,047 ± 0,047 ± 0,244 ± 0,062 ± 0,043 ± 0,046 ± 0,046 ± 0,026 ±
ção 0,005 0,005 0,001 0,006 0,005 0,006 0,011 0,005 0,007 0,007 0,005
Jaccard 0,071 ± 0,334 ± 0,039 ± 0,093 ± 0,066 ± 0,272 ± 0,066 ± 0,08 ± 0,084 ± 0,09 ± 0,189 ±
0,013 0,069 0,002 0,013 0,009 0,005 0,017 0,017 0,015 0,013 0,014
Qtd. - 12,65 ± 12,2 ± 37,55 ± 10 ± 3,699 21,5 ± 4,15 ± 23,9 ± 16,95 ± 10,85 ± 11,95 ± 2,8 30,85 ±
biclusters 3,703 2,353 3,517 2,236 1,785 3,726 3,034 3,345 1,663
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE -0,352 ± -0,061 ± 0,055 ± 0,074 ± 0,043 ± -0,015 ± -0,067 ± 0,027 ± -0,046 ± -0,038 ± 0,041 ±
1,316 0,394 0,336 0,221 0,173 0,478 0,432 0,234 0,319 0,293 0,915
TVE -0,006 ± 0,074 ± 0,052 ± -0,111 ± -0,233 ± 0,026 ± -0,272 ± -0,107 ± 0,051 ± -0,144 ± 0,298 ±
0,697 1,251 1,112 0,794 1,198 1,364 1,503 1,096 0,84 0,526 1,947
MI 2,097 ± 2,292 ± 2,443 ± 2,161 ± 2,494 ± 2,538 ± 2,502 ± 2,357 ± 1,461 ± 2,251 ± 2,367 ±
0,783 0,565 0,088 0,65 0,167 0,037 0,036 0,222 1,06 0,637 0,037
LC 0,177 ± 0,15 ± 0,184 ± 0,179 ± 0,171 ± 0,173 ± 0,168 ± 0,177 ± 0,149 ± 0,182 ± 0,171 ±
0,094 0,042 0,018 0,112 0,027 0,007 0,006 0,046 0,125 0,076 0,005
214
Tabela 122: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Multitissue
Multitissue ABC 6 (J) BICACO 6 BIC-aiNet 6 CDE 6 (LC) dFSS 6 (J) CGA 6 FSGA 6 GSO 6 (J) MHS 6 NichePSO 6 SwarmBclu
(LC) (LC) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 62,568 ± 89,557 ± 9,204 ± 62,304 ± 62,037 ± 63,734 ± 64,958 ± 62,165 ± 61,161 ± 62,03 ± 40,037 ±
0,176 0,428 0,57 0,226 0,289 0,37 0,431 0,234 0,177 0,145 1,135
MSR 80.944,348 22.142,716 130.028,291 94.928,055 99.376,363 160.166,22 159.688,723 90.532,577 66.849,673 85.991,017 84.075,569
(melhor) ± ± ± ± ± ± 7.700,671 ± 7.301,153 ± 52.298,63 ± ± ±
58.363,795 45.596,603 35.286,237 57.743,869 51.360,706 62.045,741 47.216,693 29.907,327
MSR 730.282,679 1.915.868,0 219.095,547 789.188,548 507.286,362 169.892,039 211.853,564 283.749,529 763.281,319 548.579,325 1.052.705,5
(média) ± 31 ± ± ± ± ± 2.628,111 ± ± ± ± 14 ±
200.749,24 963.563,228 29.456,227 216.351,515 170.677,519 102.451,577 136.552,491 292.928,503 186.335,701 277.417,463
Volume 938,55 ± 3.363,85 ± 5.654,85 ± 4.435,95 ± 2.364,3 ± 70.208,05 ± 86.059,6 ± 2.111,75 ± 2.216,85 ± 2.019,85 ± 140.943,35
(melhor) 951,024 11.779,101 2.194,188 9.321,417 4.418,079 3.439,894 4.987,008 1.940,036 5.040,716 1.729,381 ±
28.762,762
Volume 10.299,63 ± 13.942,809 1.783,8 ± 13.603,754 11.948,751 61.901,085 20.026,038 12.260,106 14.106,58 ± 12.754,915 12.535,044
(média) 2.299,778 ± 2.871,596 189,897 ± 1.660,688 ± 2.365,956 ± 1.616,891 ± 1.492,476 ± 2.275,784 1.941,591 ± 2.672,115 ± 999,704
Cobertura 1±0 0,998 ± 0,286 ± 0,995 ± 1±0 0,896 ± 0,931 ± 1±0 0,994 ± 1±0 0,97 ± 0,01
elementos 0,001 0,026 0,002 0,008 0,008 0,002
Cobertura 1±0 0,999 ± 0,775 ± 0,998 ± 1±0 0,965 ± 0,97 ± 1±0 0,997 ± 1±0 0,997 ±
linhas e 0,001 0,018 0,003 0,007 0,006 0,003 0,008
colunas
Sobreposi- 0,041 ± 0,026 ± 0,007 ± 0,049 ± 0,047 ± 0,256 ± 0,066 ± 0,045 ± 0,049 ± 0,047 ± 0,027 ±
ção 0,005 0,006 0,001 0,004 0,005 0,01 0,011 0,004 0,005 0,008 0,005
Jaccard 0,052 ± 0,078 ± 0,04 ± 0,059 ± 0,063 ± 0,283 ± 0,071 ± 0,086 ± 0,051 ± 0,075 ± 0,188 ±
0,009 0,018 0,002 0,005 0,01 0,007 0,018 0,017 0,009 0,013 0,012
Qtd. - 13,8 ± 17,6 ± 24,9 ± 9,1 ± 2,732 15,6 ± 4,7 ± 1,72 24 ± 4,735 13,4 ± 12,1 ± 12,1 ± 26,7 ±
biclusters 3,189 2,393 4,128 4,235 2,501 3,401 4,141 3,881
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE -0,062 ± 0,062 ± -0,035 ± -0,03 ± -0,067 ± -0,135 ± -0,102 ± 0,006 ± 0,038 ± 0,066 ± -0,035 ±
0,29 0,246 0,356 0,298 0,288 0,638 0,467 0,374 0,313 0,559 1,011
TVE -0,019 ± -0,017 ± -0,053 ± 0,01 ± 0,029 ± 0,186 ± 0,08 ± -0,074 ± 0,072 ± -0,027 ± -0,005 ±
0,15 0,068 0,181 0,217 0,186 0,295 0,418 0,203 0,155 0,19 0,541
MI 0,583 ± 0,198 ± 0,714 ± 0,636 ± 0,676 ± 0,752 ± 0,762 ± 0,699 ± 0,473 ± 0,773 ± 0,608 ±
0,275 0,324 0,08 0,291 0,145 0,032 0,031 0,16 0,361 0,281 0,075
LC 0,19 ± 0,058 ± 0,181 ± 0,169 ± 0,201 ± 0,136 ± 0,131 ± 0,204 ± 0,186 ± 0,167 ± 0,115 ±
0,106 0,107 0,026 0,172 0,069 0,016 0,013 0,072 0,181 0,078 0,004
215
Tabela 123: Resultado do Bagged Biclustering com um algoritmo (sem sobreposição) para Yeast
Yeast ABC 6 (LC) BICACO 9 BIC-aiNet 6 CDE 6 (LC) dFSS 6 CGA 6 FSGA 6 GSO 6 (J) MHS 6 NichePSO 6 SwarmBclu
(LC) (LC) (LC) (LC) (LC) (LC) (J) ster 6 (J)
Tempo 91,004 ± 70,705 ± 1,767 ± 91,031 ± 89,496 ± 95,434 ± 93,681 ± 91,128 ± 90,9 ± 0,21 92,801 ± 7,542 ±
0,169 0,841 0,165 0,194 3,878 1,034 0,533 0,286 0,318 0,258
MSR 53,055 ± 268,034 ± 292,387 ± 129,727 ± 88,81 ± 242,28 ± 247,89 ± 96,247 ± 76,027 ± 140,326 ± 248,675 ±
(melhor) 110,395 34,706 9,094 134,331 105,382 41,611 32,788 103,849 120,85 104,747 36,939
MSR 621,502 ± 413,819 ± 363,266 ± 563,984 ± 757,736 ± 267,84 ± 252,713 ± 666,501 ± 508,795 ± 765,095 ± 306,62 ±
(média) 53,252 23,728 23,088 40,035 96,93 39,114 96,716 108,506 60,818 86,791 20,021
Volume 151,7 ± 4.022,25 ± 678,45 ± 189,85 ± 19,75 ± 2.500,9 ± 2.733,1 ± 15,2 ± 553,7 ± 10,9 ± 2.043,15 ±
(melhor) 158,632 1.937,73 283,911 179,467 11,346 37,817 51,379 9,024 388,403 6,512 703,701
Volume 1.735,654 ± 1.106,644 ± 339,946 ± 2.150,008 ± 1.944,722 ± 2.074,973 ± 677,182 ± 2.453,918 ± 2.430,536 ± 2.061,405 ± 1.476,782 ±
(média) 242,217 77,379 48,439 273,297 355,001 220,606 98,524 687,304 435,198 258,497 104,093
Cobertura 0,998 ± 0,594 ± 0,28 ± 0,848 ± 0,999 ± 0 0,343 ± 0,388 ± 1±0 0,898 ± 1±0 0,652 ±
elementos 0,002 0,028 0,032 0,032 0,028 0,041 0,05 0,025
Cobertura 1±0 0,833 ± 0,455 ± 0,891 ± 1±0 0,539 ± 0,569 ± 1±0 0,947 ± 1±0 0,728 ±
linhas e 0,017 0,027 0,055 0,049 0,081 0,066 0,017
colunas
Sobreposi- 0,033 ± 0,032 ± 0,007 ± 0,048 ± 0,041 ± 0,049 ± 0,011 ± 0,039 ± 0,047 ± 0,04 ± 0,037 ±
ção 0,003 0,003 0,001 0,005 0,005 0,015 0,006 0,008 0,006 0,004 0,002
Jaccard 0,031 ± 0,055 ± 0,04 ± 0,036 ± 0,039 ± 0,171 ± 0,064 ± 0,061 ± 0,033 ± 0,045 ± 0,048 ±
0,002 0,003 0,007 0,004 0,003 0,024 0,022 0,01 0,004 0,005 0,002
Qtd. - 12,95 ± 9,9 ± 2,732 24,5 ± 9,9 ± 3,059 10,65 ± 7,9 ± 1,334 25,75 ± 7,6 ± 2,415 13,65 ± 9,2 ± 3,156 23,95 ±
biclusters 2,982 5,042 3,281 5,29 4,095 3,12
Sucesso 100 100 100 100 100 100 100 100 100 100 100
VE -0,006 ± 0,225 ± -0,029 ± -0,043 ± -0,025 ± 0,017 ± -0,03 ± -0,073 ± 0,018 ± -0,02 ± -0,4 ± 1,207
0,025 1,655 0,544 0,231 0,129 0,086 0,091 0,248 0,106 0,303
TVE 0,126 ± 0,363 ± 0,079 ± -4,789 ± -0,558 ± 143,963 ± 4,055 ± 0,046 ± -0,077 ± 0,777 ± 0,831 ±
0,555 3,958 5,543 19,131 3,609 1.457,82 11,899 0,756 0,721 5,859 6,202
MI 0,087 ± 0,845 ± 0,992 ± 0,232 ± 0,315 ± 0,388 ± 0,41 ± 0,04 0,406 ± 0,137 ± 0,568 ± 1,299 ±
0,18 0,105 0,124 0,247 0,431 0,045 0,523 0,215 0,451 0,43
LC 0,106 ± 0,458 ± 0,313 ± 0,288 ± 0,242 ± 0,561 ± 0,592 ± 0,285 ± 0,172 ± 0,47 ± 0,398 ±
0,229 0,076 0,039 0,309 0,306 0,065 0,057 0,33 0,277 0,361 0,076
Tabela 124: Resultado da Fusão Direta com 11 algoritmos para Artificial_2
Artificial_2 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 18,15 ± 0,93 21,389 ± 18,066 ± 0,93 21,306 ± 1,326
1,187
MSR (melhor) 1,582 ± 2,713 0±0 1,577 ± 2,55 0±0
MSR (média) 20,166 ± 1,231 0±0 20,106 ± 1,229 0±0
Volume (melhor) 23,95 ± 10,46 100 ± 0 24,35 ± 11,717 100 ± 0
Volume (média) 167,814 ± 100 ± 0 165,792 ± 100 ± 0
21,59 21,296
Cobertura elementos 0,336 ± 0,037 0,189 ± 0,005 0,333 ± 0,036 0,189 ± 0,005
Cobertura linhas e colunas 0,989 ± 0,011 0,189 ± 0,005 0,989 ± 0,011 0,189 ± 0,005
Sobreposição 0,008 ± 0,001 0,009 ± 0,001 0,007 ± 0,001 0±0
Jaccard 0,044 ± 0,003 0,981 ± 0 0,043 ± 0,003 0,98 ± 0
Qtd. -biclusters 2,55 ± 1,731 49 ± 0 2,55 ± 1,731 37,85 ± 0,933
Sucesso 90 100 90 100
VE -0,029 ± 0,123 0±0 -0,026 ± 0,124 0±0
TVE 0,02 ± 0,267 0±0 0,021 ± 0,267 0±0
MI 0,789 ± 0,356 0±0 0,807 ± 0,283 0±0
LC 0,759 ± 0,333 0±0 0,826 ± 0,279 0±0
RMS (biclusters) 0,033 ± 0,02 0,003 ± 0 0,032 ± 0,02 0,004 ± 0
RMS (população) 0,096 ± 0,007 0,003 ± 0 0,095 ± 0,007 0,004 ± 0
CMS (biclusters) 0,035 ± 0,018 0,48 ± 0 0,035 ± 0,018 0,48 ± 0
CMS (população) 0,1 ± 0,006 0,48 ± 0 0,099 ± 0,006 0,48 ± 0
MS (biclusters) 0,029 ± 0,014 0,339 ± 0 0,029 ± 0,014 0,339 ± 0
MS (população) 0,095 ± 0,006 0,339 ± 0 0,094 ± 0,006 0,339 ± 0

Tempo 14,941 ± 0,794 18,145 ± 14,927 ± 0,808 18,1 ± 1,2
1,086
MSR (melhor) 1,197 ± 1,369 0±0 1,197 ± 1,369 0±0
MSR (média) 13,997 ± 0,8 0±0 13,993 ± 0,802 0±0
Volume (melhor) 31,4 ± 19,885 100 ± 0 31,4 ± 19,885 100 ± 0
Volume (média) 199,799 ± 100 ± 0 197,653 ± 100 ± 0
26,071 25,443
Cobertura elementos 0,388 ± 0,038 0,195 ± 0 0,386 ± 0,038 0,195 ± 0
Cobertura linhas e colunas 0,993 ± 0,005 0,195 ± 0 0,993 ± 0,005 0,195 ± 0
Sobreposição 0,009 ± 0,001 0,009 ± 0 0,009 ± 0,001 0±0
Jaccard 0,046 ± 0,003 0,981 ± 0 0,046 ± 0,003 0,98 ± 0
Qtd. -biclusters 2,65 ± 1,496 49 ± 0 2,65 ± 1,496 39 ± 0
Sucesso 90 100 90 100
VE -0,003 ± 0,054 0±0 -0,003 ± 0,054 0±0
TVE 0,007 ± 0,071 0±0 0,007 ± 0,071 0±0
MI 0,639 ± 0,249 0±0 0,639 ± 0,249 0±0
LC 0,768 ± 0,219 0±0 0,768 ± 0,219 0±0
RMS (biclusters) 0,067 ± 0,031 0,015 ± 0 0,066 ± 0,031 0,019 ± 0
RMS (população) 0,127 ± 0,007 0,015 ± 0 0,127 ± 0,007 0,019 ± 0
CMS (biclusters) 0,047 ± 0,024 0,44 ± 0 0,047 ± 0,024 0,44 ± 0
CMS (população) 0,132 ± 0,011 0,44 ± 0 0,132 ± 0,011 0,44 ± 0
MS (biclusters) 0,052 ± 0,023 0,316 ± 0 0,051 ± 0,023 0,317 ± 0
MS (população) 0,124 ± 0,009 0,316 ± 0 0,124 ± 0,009 0,317 ± 0
216
217

Tempo 15,656 ± 0,81 19,626 ± 15,641 ± 0,816 19,62 ± 1,174
1,091
MSR (melhor) 0,767 ± 0,202 0±0 0,767 ± 0,202 0±0
MSR (média) 17,159 ± 0,869 0±0 17,114 ± 0,901 0±0
Volume (melhor) 29,15 ± 13,948 100 ± 0 29,05 ± 14,099 100 ± 0
Volume (média) 191,843 ± 100 ± 0 188,967 ± 100 ± 0
24,292 23,261
Cobertura elementos 0,373 ± 0,038 0,245 ± 0 0,37 ± 0,037 0,245 ± 0
Cobertura linhas e colunas 0,989 ± 0,009 0,245 ± 0 0,989 ± 0,009 0,245 ± 0
Sobreposição 0,009 ± 0,001 0±0 0,009 ± 0,001 0±0
Jaccard 0,045 ± 0,003 0,98 ± 0 0,044 ± 0,003 0,98 ± 0
Qtd. -biclusters 3,3 ± 1,976 49 ± 0 3,3 ± 1,976 49 ± 0
Sucesso 100 100 100 100
VE 0,012 ± 0,352 0±0 0,012 ± 0,352 0±0
TVE 0,132 ± 0,56 0±0 0,132 ± 0,56 0±0
MI 0,606 ± 0,276 0±0 0,606 ± 0,276 0±0
LC 0,734 ± 0,275 0±0 0,734 ± 0,275 0±0
RMS (biclusters) 0,083 ± 0,016 0,03 ± 0 0,083 ± 0,016 0,03 ± 0
RMS (população) 0,137 ± 0,009 0,03 ± 0 0,136 ± 0,009 0,03 ± 0
CMS (biclusters) 0,056 ± 0,025 0,44 ± 0 0,056 ± 0,025 0,44 ± 0
CMS (população) 0,141 ± 0,009 0,44 ± 0 0,141 ± 0,009 0,44 ± 0
MS (biclusters) 0,064 ± 0,014 0,33 ± 0 0,064 ± 0,014 0,33 ± 0
MS (população) 0,132 ± 0,008 0,33 ± 0 0,132 ± 0,008 0,33 ± 0
Tabela 127: Resultado da Fusão Direta com 11 algoritmos para Arabidopsis

Arabidopsis 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 606,717 ± 319,547 ± 17,982 603,991 ± 35,378 318,77 ± 19,303
34,35
MSR (melhor) 444,985 ± 595,197 ± 93,554 362,078 ± 499,858 ±
119,72 170,944 145,529
MSR (média) 1.426,331 ± 2.075,966 ± 5.457,002 ± 14.746,278 ±
1.186,6 506,126 9.626,917 11.770,201
Volume (melhor) 1.559,6 ± 4.541,95 ± 190,75 ± 104,766 1.133,4 ±
534,375 4.456,079 3.632,885
Volume (média) 1.453,058 ± 5.826,884 ± 1.318,126 ± 1.915,374 ±
46,27 1.226,512 94,102 285,804
Cobertura elementos 0,992 ± 0,006 1 ± 0,001 0,991 ± 0,008 0,998 ± 0,002
Cobertura linhas e 0,999 ± 0,001 1±0 0,999 ± 0,001 1±0
colunas
Sobreposição 0,028 ± 0,001 0,113 ± 0,025 0,025 ± 0,003 0,039 ± 0,007
Jaccard 0,051 ± 0,004 0,192 ± 0,02 0,021 ± 0,003 0,053 ± 0,008
Qtd. -biclusters 33,15 ± 3,815 13,95 ± 3,967 32,35 ± 3,36 24,8 ± 3,622
Sucesso 100 100 100 100
VE 0,002 ± 0,128 -0,014 ± 0,142 0,005 ± 0,08 -0,03 ± 0,07
TVE 0,012 ± 0,028 0,029 ± 0,027 0,016 ± 0,068 0,02 ± 0,049
MI 1,32 ± 0,062 1,297 ± 0,067 1,399 ± 0,165 1,324 ± 0,175
LC 0,138 ± 0,016 0,107 ± 0,013 0,3 ± 0,097 0,333 ± 0,14
218
Tabela 128: Resultado da Fusão Direta com 11 algoritmos para Brain_1

Brain_1 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 1.305,205 ± 45,32 614,092 ± 1.304,36 ± 45,386 611,709 ±
21,509 19,665
MSR (melhor) 5.765,618 ± 0±0 935,314 ± 2.278,644 0±0
2.283,381
MSR (média) 6.888,954 ± 359,241 ± 15.023,616 ± 818,662 ±
1.853,893 16,756 41.545,148 58,894
Volume (melhor) 657,9 ± 285,626 50 ± 0 7,65 ± 3,083 50 ± 0
Volume (média) 1.558,092 ± 1.416,3 ± 6.466,629 ± 3.145,923 ±
20,021 2,155 1.813,897 162,394
Cobertura linhas e 0,996 ± 0,002 0,999 ± 0,001 0,996 ± 0,002 0,999 ± 0,001
colunas
Sobreposição 0,023 ± 0 0,05 ± 0,003 0,078 ± 0,024 0,028 ± 0,004
Jaccard 0,039 ± 0,002 0,926 ± 0 0,033 ± 0,01 0,474 ± 0,023
Qtd. -biclusters 40,2 ± 2,648 49 ± 0 9,4 ± 2,683 21 ± 1,124
Sucesso 100 100 100 100
VE -0,002 ± 0,265 0±0 0,008 ± 0,112 0±0
TVE 0,143 ± 0,294 0±0 0,028 ± 0,073 0±0
MI 2,317 ± 0,147 0±0 0,238 ± 0,542 0±0
LC 0,326 ± 0,125 0±0 0,133 ± 0,295 0±0
Tabela 129: Resultado da Fusão Direta com 11 algoritmos para Brain_2

Brain_2 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 1.213,781 ± 551,82 ± 20,074 1.213,944 ± 40,48 547,687 ±
40,372 18,585
MSR (melhor) 134.777,59 ± 0±0 96.372,191 ± 0±0
49.873,018 95.238,866
MSR (média) 206.081,91 ± 12.800,775 ± 212.689,439 ± 22.399,569 ±
55.610,127 699,712 274.222,094 1.793,465
Volume (melhor) 516,75 ± 144,372 42 ± 0 11,45 ± 4,298 42 ± 0
Volume (média) 1.319,677 ± 24,47 1.186,794 ± 4.190,642 ± 964,757 2.033,971 ±
2,044 98,689
colunas
Sobreposição 0,023 ± 0 0,034 ± 0,003 0,058 ± 0,016 0,019 ± 0,003
Jaccard 0,043 ± 0,005 0,919 ± 0 0,037 ± 0,008 0,558 ± 0,028
Qtd. -biclusters 39,95 ± 2,856 49 ± 0 12,45 ± 3,486 27,65 ± 1,424
Sucesso 100 100 100 100
VE -0,055 ± 0,225 0±0 0,866 ± 3,791 0±0
TVE -0,003 ± 0,248 0±0 -0,013 ± 0,078 0±0
MI 0,759 ± 0,094 0±0 0,598 ± 0,656 0±0
LC 0,208 ± 0,017 0±0 0,235 ± 0,29 0±0
219
Tabela 130: Resultado da Fusão Direta com 11 algoritmos para Breast_Colon

Breast_Colon 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 232,804 ± 146,045 ± 6,712 232,413 ± 10,21 143,78 ± 6,547
10,286
MSR (melhor) 17.688,005 ± 19.385,092 ± 13.149,969 ± 2.257,552 ±
3.752,443 2.910,055 5.777,292 6.287,109
MSR (média) 77.368,77 ± 95.700,512 ± 154.846,995 ± 453.479,525 ±
20.222,262 12.504,942 49.074,761 244.564,851
Volume (melhor) 828,95 ± 4.401,55 ± 82,55 ± 61,782 165,9 ± 220,585
233,669 3.348,676
Volume (média) 764,906 ± 2.114,409 ± 470,661 ± 41,346 649,365 ±
57,497 328,815 66,443
colunas
Sobreposição 0,04 ± 0,003 0,126 ± 0,016 0,017 ± 0,003 0,023 ± 0,004
Jaccard 0,072 ± 0,006 0,307 ± 0,023 0,024 ± 0,003 0,082 ± 0,014
Qtd. -biclusters 18,45 ± 4,174 19 ± 2,636 22,45 ± 4,174 15,55 ± 3
Sucesso 100 100 100 100
VE -0,067 ± 0,288 -0,051 ± 0,439 0,015 ± 0,254 0 ± 0,113
TVE 0,094 ± 0,349 -0,084 ± 0,304 0,014 ± 0,154 0,014 ± 0,084
MI 1,584 ± 0,148 1,71 ± 0,187 1,281 ± 0,494 0,287 ± 0,721
LC 0,276 ± 0,047 0,266 ± 0,039 0,458 ± 0,227 0,052 ± 0,137
Tabela 131: Resultado da Fusão Direta com 11 algoritmos para Lung

Lung 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 1.915,449 ± 49,03 988,184 ± 1.912,126 ± 48,511 983,207 ±
24,828 27,477
MSR (melhor) 25.927,725 ± 0±0 0±0 0±0
5.180,558
MSR (média) 29.279,49 ± 915,949 ± 52.900,082 ± 3.022,66 ±
4.570,88 31,699 59.859,589 181,257
Volume (melhor) 12.584,25 ± 203 ± 0 17,6 ± 4,489 203 ± 0
1.937,546
Volume (média) 8.587,528 ± 6.411,349 ± 53.777,897 ± 20.659,121 ±
398,108 5,631 27.544,805 1.342,462
colunas
Sobreposição 0,027 ± 0,001 0,037 ± 0,001 0,094 ± 0,101 0,024 ± 0,004
Jaccard 0,042 ± 0,003 0,956 ± 0 0,015 ± 0,006 0,482 ± 0,081
Qtd. -biclusters 37,65 ± 3,066 49 ± 0 5,05 ± 1,905 14,2 ± 1,005
Sucesso 100 100 100 100
VE -0,067 ± 0,478 0±0 0±0 0±0
TVE 0,339 ± 1,218 0±0 0±0 0±0
MI 2,507 ± 0,104 0±0 0±0 0±0
LC 0,181 ± 0,014 0±0 0±0 0±0
220
Tabela 132: Resultado da Fusão Direta com 11 algoritmos para Multitissue

Multitissue 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 1.654,606 ± 838,266 ± 20,214 1.648,857 ± 39,7 837,602 ± 22,665
38,344
MSR (melhor) 122.858,413 ± 84.694,65 ± 74.769,815 ± 19.692,032 ±
38.577,732 57.844,825 50.266,307 44.114,388
MSR (média) 219.566,958 ± 191.654,744 ± 517.520,543 ± 1.332.306,673 ±
38.211,67 23.505,618 231.562,614 390.294,603
Volume (melhor) 4.676,85 ± 78.892,9 ± 189,15 ± 180,774 142,1 ± 68,409
2.291,425 46.084,324
Volume (média) 6.352,377 ± 21.688,548 ± 8.719,633 ± 7.231,897 ±
207,209 5.827,367 1.233,727 551,357
Cobertura 0,988 ± 0,002 0,996 ± 0,002 0,986 ± 0,002 0,991 ± 0,002
elementos
colunas
Sobreposição 0,024 ± 0,001 0,082 ± 0,022 0,025 ± 0,006 0,022 ± 0,003
Jaccard 0,035 ± 0,002 0,173 ± 0,014 0,01 ± 0,002 0,034 ± 0,004
Qtd. -biclusters 26,9 ± 3,194 22,35 ± 3,422 21,8 ± 2,984 15,25 ± 2,552
Sucesso 100 100 100 100
VE 0,059 ± 0,308 -0,048 ± 0,671 0,03 ± 0,132 -0,02 ± 0,057
TVE -0,006 ± 0,213 -0,188 ± 0,315 -0,053 ± 0,134 -0,005 ± 0,087
MI 0,706 ± 0,063 0,618 ± 0,155 0,497 ± 0,243 0,128 ± 0,27
LC 0,176 ± 0,029 0,134 ± 0,026 0,287 ± 0,14 0,065 ± 0,134
Tabela 133: Resultado da Fusão Direta com 11 algoritmos para Yeast

Yeast 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 1.736,471 ± 1.051,105 ± 1.733,9 ± 259,55 1.045,261 ±
258,814 126,913 126,211
MSR (melhor) 240,657 ± 50,44 231,638 ± 83,936 228,386 ± 62,207 247,819 ±
66,436
MSR (média) 308,093 ± 17,771 570,679 ± 45,433 331,312 ± 22,683 640,433 ±
54,241
Volume (melhor) 2.777,9 ± 4.102,35 ± 2.107,75 ± 3.351,1 ±
1.590,313 2.172,272 1.444,561 2.371,668
Volume (média) 1.350,936 ± 6.135,205 ± 1.201,473 ± 2.862,58 ±
161,189 886,962 114,859 447,156
colunas
Sobreposição 0,032 ± 0,005 0,128 ± 0,019 0,022 ± 0,003 0,06 ± 0,011
Jaccard 0,032 ± 0,004 0,197 ± 0,03 0,031 ± 0,004 0,081 ± 0,012
Qtd. -biclusters 35,4 ± 2,257 14,95 ± 4,11 20,4 ± 3,619 11,8 ± 2,191
Sucesso 100 100 100 100
VE -0,205 ± 1,314 -0,026 ± 0,366 -0,136 ± 0,775 -0,011 ±
0,154
TVE -1,825 ± 6,346 0,143 ± 32,533 0,997 ± 3,829 5,412 ±
25,584
MI 1,177 ± 0,25 0,542 ± 0,421 1,141 ± 0,286 0,572 ± 0,431
LC 0,435 ± 0,179 0,491 ± 0,217 0,483 ± 0,18 0,591 ± 0,186
221
Tabela 134: Resultado do Bagged Biclustering com 11 algoritmos para Artificial_2

Tempo 15,184 ± 0,762 16,708 ± 15,162 ± 0,757 16,637 ± 0,908
0,863
MSR (melhor) 0,649 ± 0,303 0±0 0,649 ± 0,303 0±0
MSR (média) 18,683 ± 1,272 0±0 18,64 ± 1,288 0±0
Volume (melhor) 21,2 ± 6,254 100 ± 0 20,75 ± 6,172 100 ± 0
Volume (média) 150,111 ± 100 ± 0 147,878 ± 100 ± 0
24,419 23,705
Sobreposição 0,007 ± 0,001 0,002 ± 0,001 0,007 ± 0,001 0±0
Jaccard 0,042 ± 0,004 0,98 ± 0 0,041 ± 0,003 0,98 ± 0
Qtd. -biclusters 4,7 ± 2,179 49 ± 0 4,7 ± 2,179 46,7 ± 1,593
Sucesso 100 100 100 100
VE -0 ± 0,065 0±0 -0 ± 0,065 0±0
TVE -0,029 ± 0,104 0±0 -0,029 ± 0,104 0±0
MI 0,706 ± 0,433 0±0 0,706 ± 0,433 0±0
LC 0,777 ± 0,354 0±0 0,777 ± 0,354 0±0
RMS (biclusters) 0,04 ± 0,015 0,003 ± 0,001 0,039 ± 0,015 0,003 ± 0,001
RMS (população) 0,091 ± 0,007 0,003 ± 0,001 0,09 ± 0,006 0,003 ± 0,001
CMS (biclusters) 0,036 ± 0,015 0,48 ± 0 0,036 ± 0,015 0,48 ± 0
CMS (população) 0,097 ± 0,006 0,48 ± 0 0,097 ± 0,006 0,48 ± 0
MS (biclusters) 0,035 ± 0,011 0,339 ± 0 0,035 ± 0,011 0,339 ± 0
MS (população) 0,092 ± 0,005 0,339 ± 0 0,091 ± 0,005 0,339 ± 0
222

Tempo 12,285 ± 0,525 14.33 ± 12,262 ± 0,511 14.256 ± 0.701
0.669
MSR (melhor) 0,793 ± 0,081 0±0 0,793 ± 0,081 0±0
MSR (média) 12,944 ± 0,734 0±0 12,929 ± 0,725 0±0
Volume (melhor) 26,85 ± 9,258 100 ± 0 26,85 ± 9,258 100 ± 0
Volume (média) 158,072 ± 100 ± 0 156,237 ± 100 ± 0
21,552 21,228
Cobertura elementos 0,32 ± 0,036 0.233 ± 0,317 ± 0,035 0.233 ± 0.008
0.008
Cobertura linhas e colunas 0,978 ± 0,011 0.233 ± 0,978 ± 0,011 0.233 ± 0.008
0.008
Sobreposição 0,008 ± 0,001 0.002 ± 0,007 ± 0,001 0±0
0.001
Jaccard 0,042 ± 0,002 0.98 ± 0 0,041 ± 0,002 0.98 ± 0
Qtd. -biclusters 4,6 ± 1,759 49 ± 0 4,6 ± 1,759 46.5 ± 1.504
Sucesso 100 100 100 100
VE -0,01 ± 0,034 0±0 -0,01 ± 0,034 0±0
TVE 0,022 ± 0,234 0±0 0,022 ± 0,234 0±0
MI 0,668 ± 0,323 0±0 0,668 ± 0,323 0±0
LC 0,748 ± 0,224 0±0 0,748 ± 0,224 0±0
RMS (biclusters) 0,065 ± 0,019 0.014 ± 0,064 ± 0,018 0.015 ± 0.002
0.002
RMS (população) 0,111 ± 0,008 0.014 ± 0,111 ± 0,007 0.015 ± 0.002
0.002
CMS (biclusters) 0,051 ± 0,013 0.44 ± 0 0,051 ± 0,013 0.44 ± 0
CMS (população) 0,125 ± 0,009 0.44 ± 0 0,125 ± 0,008 0.44 ± 0
MS (biclusters) 0,053 ± 0,015 0.316 ± 0 0,052 ± 0,014 0.316 ± 0
MS (população) 0,113 ± 0,007 0.316 ± 0 0,112 ± 0,007 0.316 ± 0
223

Tempo 12,842 ± 0,514 15,579 ± 12,824 ± 0,448 15,495 ± 0,608
0,618
MSR (melhor) 0,792 ± 0,142 0±0 0,792 ± 0,142 0±0
MSR (média) 15,961 ± 1,067 0±0 15,93 ± 1,066 0±0
Volume (melhor) 34,9 ± 14,782 100 ± 0 34,9 ± 14,782 100 ± 0
Volume (média) 159,352 ± 100 ± 0 157,097 ± 100 ± 0
30,878 29,93
Sobreposição 0,008 ± 0,002 0±0 0,007 ± 0,002 0±0
Jaccard 0,042 ± 0,004 0,98 ± 0 0,041 ± 0,003 0,98 ± 0
Qtd. -biclusters 5,65 ± 2,56 49 ± 0 5,65 ± 2,56 48,95 ± 0,224
Sucesso 100 100 100 100
VE -0,05 ± 0,163 0±0 -0,05 ± 0,163 0±0
TVE 0,017 ± 0,393 0±0 0,017 ± 0,393 0±0
MI 0,616 ± 0,212 0±0 0,616 ± 0,212 0±0
LC 0,83 ± 0,186 0±0 0,83 ± 0,186 0±0
RMS (biclusters) 0,079 ± 0,03 0,03 ± 0,001 0,079 ± 0,03 0,03 ± 0,001
RMS (população) 0,125 ± 0,009 0,03 ± 0,001 0,124 ± 0,008 0,03 ± 0,001
CMS (biclusters) 0,065 ± 0,024 0,44 ± 0 0,065 ± 0,024 0,44 ± 0
CMS (população) 0,135 ± 0,01 0,44 ± 0 0,134 ± 0,01 0,44 ± 0
MS (biclusters) 0,064 ± 0,024 0,33 ± 0 0,063 ± 0,024 0,33 ± 0
MS (população) 0,123 ± 0,009 0,33 ± 0 0,122 ± 0,009 0,33 ± 0
Tabela 137: Resultado do Bagged Biclustering com 11 algoritmos para Arabidopsis

Arabidopsis 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 137,631 ± 122,954 ± 137,577 ± 24,776 120,818 ± 16,73
24,673 16,942
MSR (melhor) 454,81 ± 622,757 ± 404,502 ± 365,648 ± 179,804
140,196 120,484 131,418
MSR (média) 1.438,869 ± 2.885,424 ± 2.785,366 ± 12.592,011 ±
690,878 875,714 1.864,825 8.530,241
Volume (melhor) 1.297,45 ± 9.359,7 ± 387,05 ± 203,274 4.879,75 ±
360,844 4.626,141 7.686,441
Volume (média) 1.460,354 ± 8.409,88 ± 1.169,252 ± 3.544,955 ±
55,632 1.390,968 43,533 611,391
Cobertura elementos 0,996 ± 0,003 1±0 0,996 ± 0,003 0,999 ± 0,001
colunas
Sobreposição 0,029 ± 0,001 0,166 ± 0,027 0,024 ± 0,001 0,057 ± 0,01
Jaccard 0,054 ± 0,004 0,238 ± 0,018 0,03 ± 0,003 0,056 ± 0,007
Qtd. -biclusters 33,95 ± 2,089 8,95 ± 4,273 32,8 ± 2,546 21,3 ± 3,643
Sucesso 100 100 100 100
VE -0 ± 0,098 0,022 ± 0,089 -0,003 ± 0,073 -0,017 ± 0,112
TVE 0,021 ± 0,046 0,002 ± 0,03 0,022 ± 0,117 0,015 ± 0,044
MI 1,355 ± 0,072 1,296 ± 0,061 1,501 ± 0,108 1,2 ± 0,238
LC 0,144 ± 0,014 0,112 ± 0,02 0,209 ± 0,042 0,3 ± 0,207
224
Tabela 138: Resultado do Bagged Biclustering com 11 algoritmos para Brain_1

Brain_1 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 311,01 ± 45,301 246,627 ± 308,299 ± 45,22 245,184 ± 28,304
28,617
MSR (melhor) 5.742,757 ± 0±0 6.542,786 ± 0±0
2.108,536 1.733,624
MSR (média) 6.829,937 ± 266,055 ± 8.979,811 ± 415,914 ± 36,849
964,717 18,271 2.546,468
Volume (melhor) 817,45 ± 996,957 50 ± 0 325,1 ± 571,272 50 ± 0
Volume (média) 1.494,678 ± 1.286,463 ± 1.459,711 ± 1.968,912 ±
58,116 47,384 87,658 149,328
colunas
Sobreposição 0,022 ± 0,001 0,031 ± 0,004 0,02 ± 0,002 0,016 ± 0,002
Jaccard 0,039 ± 0,002 0,925 ± 0 0,021 ± 0,002 0,564 ± 0,038
Qtd. -biclusters 38,7 ± 2,452 49 ± 0 32,15 ± 3,897 31,1 ± 2,15
Sucesso 100 100 100 100
VE -0,002 ± 0,186 0±0 0,05 ± 0,217 0±0
TVE -0,004 ± 0,249 0±0 0,065 ± 0,377 0±0
MI 2,275 ± 0,159 0±0 1,788 ± 0,303 0±0
LC 0,307 ± 0,039 0±0 0,372 ± 0,049 0±0
Tabela 139: Resultado do Bagged Biclustering com 11 algoritmos para Brain_2

Brain_2 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 237,955 ± 46,631 193,11 ± 28,9 237,671 ± 46,677 190,082 ± 28,939
MSR (melhor) 140.411,003 ± 8.923,076 ± 122.318,533 ± 12.808,241 ±
77.296,396 39.905,21 52.858,429 57.280,194
MSR (média) 248.498,379 ± 11.319,758 ± 405.411,227 ± 20.258,324 ±
52.584,696 2.363,101 115.128,673 4.719,444
Volume (melhor) 886,1 ± 571,368 153,3 ± 497,749 251,05 ± 336,354 149,1 ± 478,966
Volume (média) 1.338,769 ± 1.165,447 ± 1.263,752 ± 29,766 2.033,348 ±
29,244 20,357 124,436
Cobertura 0,988 ± 0,003 0,979 ± 0,015 0,988 ± 0,003 0,979 ± 0,015
elementos
colunas
Sobreposição 0,023 ± 0,001 0,033 ± 0,004 0,022 ± 0,001 0,015 ± 0,004
Jaccard 0,046 ± 0,004 0,917 ± 0,009 0,031 ± 0,004 0,686 ± 0,047
Qtd. -biclusters 39,4 ± 2,415 49 ± 0 32,8 ± 2,484 27,2 ± 1,673
Sucesso 100 100 100 100
VE -0,013 ± 0,204 0,012 ± 0,054 0,029 ± 0,204 -0,009 ± 0,041
TVE 0,015 ± 0,242 -0,017 ± 0,078 0,01 ± 0,287 0,013 ± 0,058
MI 0,8 ± 0,142 0,044 ± 0,196 0,758 ± 0,205 0,037 ± 0,164
LC 0,235 ± 0,122 0,008 ± 0,036 0,309 ± 0,121 0,008 ± 0,035
225
Tabela 140: Resultado do Bagged Biclustering com 11 algoritmos para Breast_Colon

Breast_Colon 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 60,578 ± 8,583 50,752 ± 5,973 59,223 ± 8,665 49,584 ± 6,22
MSR (melhor) 18.289,339 ± 16.616,873 ± 16.827,895 ± 2.691,45 ±
2.698,335 6.535,878 3.976,136 6.330,854
MSR (média) 68.866,609 ± 126.855,332 ± 125.874,705 ± 490.511,627 ±
18.485,131 14.851,443 42.534,666 153.666,163
Volume (melhor) 1.096,9 ± 3.371,7 ± 138,2 ± 66,559 111,05 ± 42,855
419,815 3.287,926
Volume (média) 819,444 ± 2.694,715 ± 466,9 ± 31,412 857,129 ± 140,84
44,768 567,63
Cobertura 0,948 ± 0,007 0,998 ± 0,002 0,934 ± 0,007 0,985 ± 0,006
elementos
colunas
Sobreposição 0,045 ± 0,003 0,14 ± 0,025 0,024 ± 0,002 0,035 ± 0,009
Jaccard 0,078 ± 0,004 0,407 ± 0,04 0,039 ± 0,004 0,138 ± 0,018
Qtd. -biclusters 17,75 ± 2,731 13,65 ± 2,72 15,25 ± 3,567 13,15 ± 3,265
Sucesso 100 100 100 100
VE -0,062 ± 0,377 -0,056 ± 0,26 -0,006 ± 0,172 -0,019 ± 0,065
TVE -0,087 ± 0,399 0,111 ± 0,487 0,008 ± 0,254 -0,016 ± 0,049
MI 1,636 ± 0,166 1,549 ± 0,543 1,417 ± 0,304 0,32 ± 0,671
LC 0,29 ± 0,046 0,255 ± 0,101 0,372 ± 0,143 0,054 ± 0,126
Tabela 141: Resultado do Bagged Biclustering com 11 algoritmos para Lung

Lung 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 563,814 ± 81,862 450,49 ± 50,048 563,58 ± 81,447 449,597 ± 51,098
MSR (melhor) 25.933,909 ± 1.759,21 ± 21.423,267 ± 1.759,21 ±
6.363,01 7.867,427 9.210,568 7.867,427
MSR (média) 30.810,728 ± 777,388 ± 84.806,976 ± 1.318,617 ±
5.339,863 40,057 19.851,776 128,864
Volume (melhor) 10.266,6 ± 15.529,5 ± 608,55 ± 443,587 15.529,5 ±
1.978,702 68.542,192 68.542,192
Volume (média) 8.182,454 ± 6.361,411 ± 6.806,936 ± 10.588,073 ±
294,063 19,327 346,993 808,78
colunas
Sobreposição 0,027 ± 0,001 0,033 ± 0,004 0,023 ± 0,001 0,017 ± 0,002
Jaccard 0,041 ± 0,004 0,956 ± 0 0,021 ± 0,004 0,49 ± 0,074
Qtd. -biclusters 37,85 ± 2,996 49,05 ± 0,224 22,15 ± 4,859 28,7 ± 2,273
Sucesso 100 100 100 100
VE -0,186 ± 0,208 0,006 ± 0,026 -0,012 ± 0,176 0,006 ± 0,026
TVE -0,042 ± 0,827 0,054 ± 0,244 0,002 ± 0,236 0,054 ± 0,244
MI 2,51 ± 0,102 0,124 ± 0,555 2,143 ± 0,271 0,124 ± 0,555
LC 0,185 ± 0,012 0,008 ± 0,037 0,255 ± 0,069 0,008 ± 0,037
226
Tabela 142: Resultado do Bagged Biclustering com 11 algoritmos para Multitissue

Multitissue 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 454,214 ± 46,647 374,425 ± 31,106 452,985 ± 46,621 372,465 ± 31,493
MSR (melhor) 133.059,639 ± 145.166,603 ± 119.223,3 ± 115.775,768 ±
30.122,005 26.967,074 28.565,848 64.600,312
MSR (média) 214.399,037 ± 237.690,482 ± 381.665,153 ± 552.760,225 ±
27.281,996 18.760,964 86.463,183 84.298,055
Volume (melhor) 5.967,3 ± 34.214,55 ± 1.386,45 ± 10.420,9 ±
3.036,148 31.141,921 828,729 23.005,455
Volume (média) 6.737,361 ± 15.723,909 ± 5.697,173 ± 11.342,227 ±
128,97 2.817,005 113,37 1.915,439
Cobertura 0,971 ± 0,005 0,993 ± 0,003 0,968 ± 0,005 0,99 ± 0,004
elementos
colunas
Sobreposição 0,026 ± 0,001 0,059 ± 0,01 0,022 ± 0,001 0,04 ± 0,006
Jaccard 0,041 ± 0,002 0,176 ± 0,018 0,022 ± 0,002 0,066 ± 0,014
Qtd. -biclusters 25,75 ± 3,416 18,95 ± 3,12 20,15 ± 2,277 9,2 ± 2,505
Sucesso 100 100 100 100
VE 0,03 ± 0,288 -0,02 ± 0,408 -0,002 ± 0,231 0,076 ± 0,311
TVE 0,032 ± 0,242 0,083 ± 0,189 0,023 ± 0,139 0,009 ± 0,169
MI 0,734 ± 0,065 0,771 ± 0,035 0,715 ± 0,097 0,607 ± 0,322
LC 0,174 ± 0,025 0,158 ± 0,023 0,233 ± 0,069 0,185 ± 0,115
Tabela 143: Resultado do Bagged Biclustering com 11 algoritmos para Yeast

Yeast 1 (J) 1 (LC) 6 (J) 6 (LC)
Tempo 935,564 ± 748,861 ± 74,186 934,588 ± 742,921 ± 75,51
118,095 118,584
MSR (melhor) 268,968 ± 255,321 ± 62,798 263,041 ± 255,18 ± 62,84
21,188 37,133
MSR (média) 316,572 ± 557,182 ± 75,901 340,156 ± 586,281 ± 83,228
16,416 21,189
Volume (melhor) 4.399,6 ± 5.771,95 ± 4.236,25 ± 5.691,05 ±
1.664,136 3.460,747 1.844,706 3.500,73
Volume (média) 1.635,738 ± 4.267,083 ± 1.449,116 ± 2.609,361 ±
158,94 1.118,225 106,129 410,851
colunas
Sobreposição 0,043 ± 0,007 0,088 ± 0,024 0,03 ± 0,003 0,047 ± 0,009
Jaccard 0,036 ± 0,005 0,19 ± 0,05 0,032 ± 0,005 0,103 ± 0,026
Qtd. -biclusters 28,95 ± 3,316 14,9 ± 5,19 18,7 ± 3,729 13,15 ± 4,804
Sucesso 100 100 100 100
VE 0,21 ± 1,466 0,026 ± 0,634 0,096 ± 1,133 0,031 ± 0,634
TVE 0,547 ± 6,578 -0,081 ± 4,399 0,414 ± 4,306 0,761 ± 7,636
MI 1,19 ± 0,173 0,697 ± 0,439 1,177 ± 0,2 0,697 ± 0,439
LC 0,341 ± 0,06 0,471 ± 0,205 0,369 ± 0,125 0,473 ± 0,209
Apêndice D – Testes estatísticos
As tabelas a seguir apresentam os resultados dos testes de Nemenyi, tomando

como base o resultado dos testes de Friedman apresentados anteriormente. Três níveis
de significância ( ) foram utilizados: 0,01, 0,05 e 0,1. A Tabela 144 apresenta os
valores críticos utilizados. Vale ressaltar que, quanto menor o valor de , mais forte é a
evidência da diferença entre dois algoritmos. Portanto, nestas tabelas, se dois algoritmos
apresentam uma diferença significativa considerando = 0,01, essa diferença não foi
repetida na coluna de = 0,05, de forma que esta diferença é apresentada apenas na
coluna de menor nível de significância possível. Por exemplo, a diferença entre os ranks
dos algoritmos multimodais BicACO e SwarmBcluster aplicados isoladamente
considerando a métrica RMS (Tabela 32) foi igual a 9 e as diferenças críticas para
∈ {0,01, 0,05, 0,1}, foram iguais a 10,009, 8,716 e 8,063 respectivamente.
Portanto, como 9 é menor que 10,009, os algoritmos não são considerados diferentes
com = 0,01. Porém, como 9 é maior que 8,716, os algoritmos apresentam diferença
com = 0,05 e são citados na coluna que representa este nível de significância (Tabela
145).
Tabela 144: Valores críticos baseados na Studentized range statistic divididos por √
Nr. Algoritmos 11 13
, 3,696047 3,781607
, 3,21875 3,312795
, 2,977627 3,076622
227
228
Tabela 145: Teste de Nemenyi com bases artificiais (algoritmos multimodais)

Métrica Diferenças significativas
0,01 0,05 0,1
BicACO e SwarmBcluster, CGA e BIC-aiNet e CGA, NichePSO e
RMS SwarmBcluster SwarmBcluster
BIC-aiNet e SwarmBcluster, GSO e BIC-aiNet e CGA, BIC-aiNet e
CMS SwarmBcluster NichePSO
BIC-aiNet e CGA, BIC-aiNet e
MS SwarmBcluster GSO e SwarmBcluster
Tabela 146: Teste de Nemenyi com bases artificiais (Fusão Direta com sobreposição)
0,01 0,05 0,1
CDE e Todos(LC), CGA e
RMS Todos(LC)
BIC-aiNet e SwarmBcluster, SwarmBcluster e Todos(J),
CMS Todos(J) e Todos(LC)
BIC-aiNet e SwarmBcluster, SwarmBcluster e Todos(J),
MS Todos(J) e Todos(LC)
Tabela 147: Teste de Nemenyi com bases artificiais (Fusão Direta sem sobreposição)
0,01 0,05 0,1
BicACO e Todos(LC), CGA e SwarmBcluster,
RMS CGA e Todos(LC) GSO e Todos(LC)
CGA e Todos(J), SwarmBcluster e Todos(J), BIC-aiNet e SwarmBcluster, BIC-
CMS Todos(J) e Todos(LC) aiNet e Todos(LC)
CGA e Todos(J), SwarmBcluster e Todos(J), BIC-aiNet e SwarmBcluster, BIC-
MS Todos(J) e Todos(LC) aiNet e Todos(LC)
Tabela 148: Teste de Nemenyi com bases artificiais (Bagged Biclustering com sobreposição)
0,01 0,05 0,1
RMS CGA e SwarmBcluster, CGA e Todos(LC) CGA e Todos(J)
BIC-aiNet e SwarmBcluster, SwarmBcluster e
CMS Todos(J), Todos(J) e Todos(LC) GSO e SwarmBcluster
BIC-aiNet e SwarmBcluster, SwarmBcluster e BIC-aiNet e Todos(LC), CGA e
MS Todos(J), Todos(J) e Todos(LC) Todos(J), GSO e SwarmBcluster
Tabela 149: Teste de Nemenyi com bases artificiais (Bagged Biclustering sem sobreposição)
0,01 0,05 0,1
BicACO e Todos(LC), CGA e SwarmBcluster,
RMS CGA e Todos(LC) CGA e Todos(J), FSGA e Todos(LC)
BIC-aiNet e SwarmBcluster, SwarmBcluster e BIC-aiNet e Todos(LC), CGA e
CMS Todos(J), Todos(J) e Todos(LC) Todos(J)
SwarmBcluster e Todos(J), Todos(J) e BIC-aiNet e SwarmBcluster, BIC-
MS Todos(LC) aiNet e Todos(LC), CGA e Todos(J)
229
Tabela 150: Teste de Nemenyi (algoritmos multimodais)

0,01 0,05 0,1
MSR (melhor) ABC e SwarmBcluster, BicACO e SwarmBcluster, BIC-aiNet e GSO, BIC-aiNet e CDE e GSO, CGA e SwarmBcluster, ABC e BIC-aiNet, BicACO e BIC-aiNet
MHS, dFSS e SwarmBcluster, FSGA e GSO, GSO e SwarmBcluster, MHS e GSO e NichePSO
SwarmBcluster
Volume BicACO e BIC-aiNet, BicACO e SwarmBcluster, BIC-aiNet e CGA, BIC-aiNet e BIC-aiNet e dFSS BIC-aiNet e CDE, BIC-aiNet e GSO,
(melhor) FSGA, BIC-aiNet e NichePSO, CGA e SwarmBcluster, FSGA e SwarmBcluster, CDE e SwarmBcluster, dFSS e
NichePSO e SwarmBcluster SwarmBcluster, GSO e SwarmBcluster
MSR (média) ABC e BIC-aiNet, ABC e CGA, ABC e FSGA, ABC e SwarmBcluster, BicACO e ABC e BicACO, dFSS e CGA, dFSS e BicACO e dFSS, BIC-aiNet e CDE,
GSO, BIC-aiNet e dFSS, BIC-aiNet e GSO, BIC-aiNet e MHS, CDE e FSGA, NichePSO e SwarmBcluster GSO e NichePSO
SwarmBcluster, dFSS e SwarmBcluster, CGA e GSO, FSGA e GSO, GSO e
SwarmBcluster, MHS e SwarmBcluster
Volume BicACO e BIC-aiNet, BIC-aiNet e dFSS, BIC-aiNet e CGA, BIC-aiNet e FSGA, ABC e BIC-aiNet FSGA e SwarmBcluster
(média) BIC-aiNet e GSO, BIC-aiNet e NichePSO
Tempo ABC e BicACO, BicACO e BIC-aiNet, BicACO e CDE, BicACO e GSO, BicACO e BIC-aiNet e SwarmBcluster BicACO e SwarmBcluster, CDE e
NichePSO, BIC-aiNet e dFSS, BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-aiNet e CGA, MHS e NichePSO
MHS, CDE e MHS, CGA e GSO, FSGA e GSO, GSO e MHS
Cobertura ABC e BIC-aiNet, ABC e CGA, ABC e FSGA, ABC e SwarmBcluster, BIC-aiNet e BicACO e GSO, CDE e CGA, dFSS e BicACO e BIC-aiNet, dFSS e
Elementos CDE, BIC-aiNet e dFSS, BIC-aiNet e GSO, BIC-aiNet e MHS, BIC-aiNet e FSGA, CGA e MHS, CGA e NichePSO SwarmBcluster
NichePSO, dFSS e CGA, CGA e GSO, FSGA e GSO, GSO e SwarmBcluster
Cobertura ABC e BIC-aiNet, ABC e CGA, ABC e FSGA, BIC-aiNet e GSO, CDE e CGA, BIC-aiNet e dFSS, CGA e NichePSO, ABC e BicACO, BicACO e GSO, CDE
Linhas e dFSS e CGA, dFSS e FSGA, CGA e GSO, CGA e MHS, FSGA e GSO CGA e SwarmBcluster, FSGA e MHS e FSGA
Colunas
Sobreposição ABC e CGA, ABC e FSGA, BicACO e BIC-aiNet, BIC-aiNet e CDE, BIC-aiNet e FSGA e MHS CDE e CGA
dFSS, BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-aiNet e NichePSO, CGA e GSO,
CGA e MHS, CGA e SwarmBcluster, FSGA e GSO, FSGA e SwarmBcluster
Jaccard ABC e CGA, ABC e FSGA, BicACO e BIC-aiNet, BIC-aiNet e CDE, BIC-aiNet e BIC-aiNet e dFSS dFSS e CGA, FSGA e MHS
CGA, BIC-aiNet e FSGA, BIC-aiNet e NichePSO, CGA e GSO, CGA e MHS, CGA
e SwarmBcluster, FSGA e GSO
VE
TVE CGA e SwarmBcluster BIC-aiNet e SwarmBcluster, CDE e BicACO e SwarmBcluster
SwarmBcluster, dFSS e
SwarmBcluster, NichePSO e
SwarmBcluster
MI GSO e SwarmBcluster
LC
230
Tabela 151: Teste de Nemenyi (Fusão Direta com sobreposição)

Diferenças significativas
Métrica 0,01 0,05 0,1
dFSS e Todos(LC), CGA e
BicACO e SwarmBcluster, BicACO e Todos(LC), BIC-aiNet e GSO, GSO e ABC e GSO, BicACO e NichePSO, BicACO e SwarmBcluster, FSGA e
MSR (melhor) NichePSO, GSO e SwarmBcluster, GSO e Todos(J), GSO e Todos(LC) Todos(J), CGA e Todos(LC), FSGA e Todos(LC) SwarmBcluster
ABC e BicACO, BicACO e dFSS, BicACO e
GSO, BIC-aiNet e FSGA, BIC-aiNet e NichePSO,
Volume BicACO e BIC-aiNet, BicACO e Todos(J), BicACO e Todos(LC), BIC-aiNet e BIC-aiNet e SwarmBcluster, CDE e Todos(LC), BicACO e CGA, BIC-aiNet e
(melhor) CDE, CDE e Todos(J), FSGA e Todos(J), SwarmBcluster e Todos(J) MHS e Todos(J), NichePSO e Todos(J) MHS
BicACO e GSO, BIC-aiNet e GSO, dFSS e CGA, dFSS e FSGA, dFSS e Todos(J),
dFSS e Todos(LC), CGA e GSO, CGA e NichePSO, FSGA e GSO, FSGA e
NichePSO, GSO e Todos(J), GSO e Todos(LC), NichePSO e Todos(J), NichePSO BicACO e dFSS, BicACO e NichePSO, BIC-aiNet
MSR (média) e Todos(LC) e NichePSO BIC-aiNet e dFSS, GSO e MHS
ABC e Todos(LC), BIC-aiNet e dFSS, BIC-aiNet
ABC e BIC-aiNet, ABC e SwarmBcluster, ABC e Todos(J), BicACO e BIC-aiNet, e MHS, BIC-aiNet e NichePSO, FSGA e
BicACO e SwarmBcluster, BicACO e Todos(J), BicACO e Todos(LC), BIC-aiNet SwarmBcluster, FSGA e Todos(J), FSGA e
e CDE, BIC-aiNet e FSGA, BIC-aiNet e GSO, CDE e SwarmBcluster, CDE e Todos(LC), GSO e Todos(LC), MHS e dFSS e SwarmBcluster, dFSS e
Volume (média) Todos(J), CDE e Todos(LC), GSO e SwarmBcluster, GSO e Todos(J) SwarmBcluster, MHS e Todos(J) Todos(J)
ABC e SwarmBcluster, BicACO e
BIC-aiNet e NichePSO, CDE e Todos(J), CDE e SwarmBcluster, BIC-aiNet e
ABC e BIC-aiNet, BicACO e BIC-aiNet, BIC-aiNet e CGA, BIC-aiNet e FSGA, Todos(LC), dFSS e Todos(J), dFSS e Todos(LC), dFSS, BIC-aiNet e GSO, CGA e
BIC-aiNet e Todos(J), BIC-aiNet e Todos(LC), MHS e Todos(J), MHS e FSGA e SwarmBcluster, GSO e Todos(J), GSO e SwarmBcluster, NichePSO e
Tempo Todos(LC), SwarmBcluster e Todos(J), SwarmBcluster e Todos(LC) Todos(LC) Todos(J)
ABC e BIC-aiNet, ABC e CGA, ABC e SwarmBcluster, BIC-aiNet e dFSS, BIC-
aiNet e GSO, BIC-aiNet e NichePSO, dFSS e CGA, dFSS e SwarmBcluster, CGA ABC e FSGA, BicACO e GSO, BIC-aiNet e CDE, ABC e Todos(J), BIC-aiNet e
Cobertura e GSO, CGA e NichePSO, FSGA e GSO, FSGA e NichePSO, GSO e CDE e SwarmBcluster, dFSS e FSGA, NichePSO MHS, CDE e CGA, dFSS e
Elementos SwarmBcluster, GSO e Todos(J), NichePSO e SwarmBcluster e Todos(J) Todos(J)
Cobertura ABC e CGA, BIC-aiNet e dFSS, BIC-aiNet e GSO, BIC-aiNet e NichePSO, dFSS ABC e BIC-aiNet, ABC e SwarmBcluster, CDE e
Linhas e e CGA, dFSS e SwarmBcluster, CGA e GSO, CGA e NichePSO, GSO e CGA, dFSS e FSGA, FSGA e GSO, FSGA e BIC-aiNet e CDE, CDE e
Colunas SwarmBcluster, NichePSO e SwarmBcluster NichePSO SwarmBcluster
BicACO e BIC-aiNet, BicACO e SwarmBcluster, BicACO e Todos(J), BicACO e
Todos(LC), BIC-aiNet e CDE, BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-aiNet e
GSO, CDE e SwarmBcluster, CDE e Todos(J), CDE e Todos(LC), CGA e ABC e Todos(J), BIC-aiNet e
SwarmBcluster, CGA e Todos(J), CGA e Todos(LC), FSGA e SwarmBcluster, ABC e BIC-aiNet, ABC e SwarmBcluster, FSGA MHS, CGA e NichePSO, MHS e
Sobreposição FSGA e Todos(J), GSO e SwarmBcluster e Todos(LC), GSO e Todos(J) SwarmBcluster
BicACO e BIC-aiNet, BicACO e Todos(J), BIC-aiNet e CDE, BIC-aiNet e CGA, BicACO e SwarmBcluster, CDE e
BIC-aiNet e FSGA, BIC-aiNet e Todos(LC), CDE e Todos(J), CGA e SwarmBcluster, dFSS e CGA,
SwarmBcluster, CGA e Todos(J), FSGA e Todos(J), GSO e Todos(J), Todos(J) e ABC e Todos(J), BIC-aiNet e GSO, MHS e NichePSO e Todos(J),
Jaccard Todos(LC) Todos(J) SwarmBcluster e Todos(LC)
VE BicACO e Todos(LC), SwarmBcluster e Todos(J), SwarmBcluster e Todos(LC) BIC-aiNet e SwarmBcluster
TVE CDE e Todos(LC)
BicACO e Todos(LC), CGA e Todos(LC), FSGA
MI e Todos(LC), GSO e Todos(LC)
BicACO e Todos(J), BIC-aiNet e Todos(LC), ABC e Todos(J), NichePSO e
LC Todos(J) e Todos(LC) CDE e Todos(J) Todos(J)
231
Tabela 152: Teste de Nemenyi (Fusão Direta sem sobreposição)

Métrica 0,01 0,05 0,1
CDE e CGA, CGA e MHS, CGA e NichePSO, CGA e Todos(J), CGA e ABC e CGA, CDE e FSGA, CGA e SwarmBcluster,
MSR (melhor) Todos(LC), FSGA e MHS, FSGA e Todos(LC) FSGA e NichePSO, FSGA e Todos(J) BicACO e CGA
BicACO e Todos(J), CDE e CGA,
Volume CGA e NichePSO, FSGA e MHS,
(melhor) CGA e Todos(J), FSGA e Todos(J), SwarmBcluster e Todos(J) CGA e MHS, CGA e Todos(LC) FSGA e Todos(LC)
ABC e FSGA, ABC e SwarmBcluster, ABC e Todos(J),
BicACO e CGA, BIC-aiNet e CDE, BIC-aiNet e MHS, ABC e Todos(LC), BicACO e
MSR (média) ABC e BIC-aiNet, ABC e CGA, CGA e MHS CDE e CGA BIC-aiNet
ABC e BIC-aiNet, ABC e SwarmBcluster, BicACO e CGA, BIC-aiNet e ABC e Todos(LC), BIC-aiNet e
CDE, BIC-aiNet e dFSS, BIC-aiNet e CGA, BIC-aiNet e GSO, CDE e BIC-aiNet e FSGA, CDE e Todos(LC), FSGA e MHS, BIC-aiNet e NichePSO,
SwarmBcluster, dFSS e SwarmBcluster, dFSS e Todos(LC), CGA e SwarmBcluster, GSO e Todos(LC), NichePSO e dFSS e Todos(J), MHS e
Volume (média) SwarmBcluster, CGA e Todos(J), CGA e Todos(LC), GSO e SwarmBcluster SwarmBcluster SwarmBcluster
ABC e BIC-aiNet, BicACO e BIC-aiNet, BIC-aiNet e CGA, BIC-aiNet e ABC e SwarmBcluster, BicACO e
FSGA, BIC-aiNet e NichePSO, BIC-aiNet e Todos(J), BIC-aiNet e SwarmBcluster, dFSS e
Todos(LC), CDE e Todos(J), FSGA e SwarmBcluster, GSO e Todos(J), Todos(LC), CGA e
MHS e Todos(J), MHS e Todos(LC), SwarmBcluster e Todos(J), BIC-aiNet e dFSS, CDE e Todos(LC), dFSS e Todos(J), SwarmBcluster, NichePSO e
Tempo SwarmBcluster e Todos(LC) GSO e Todos(LC) SwarmBcluster
ABC e BIC-aiNet, ABC e CGA, ABC e SwarmBcluster, BIC-aiNet e CDE,
BIC-aiNet e dFSS, BIC-aiNet e GSO, BIC-aiNet e NichePSO, dFSS e CGA,
dFSS e FSGA, dFSS e SwarmBcluster, CGA e GSO, CGA e NichePSO, ABC e FSGA, BicACO e GSO, BIC-aiNet e MHS, CDE
Cobertura FSGA e GSO, GSO e SwarmBcluster, GSO e Todos(J), NichePSO e e CGA, CDE e SwarmBcluster, dFSS e Todos(J), FSGA ABC e Todos(J), CGA e MHS,
Elementos SwarmBcluster e NichePSO, GSO e Todos(LC), NichePSO e Todos(J) MHS e SwarmBcluster
ABC e BIC-aiNet, ABC e CGA, ABC e SwarmBcluster, BIC-aiNet e dFSS,
Cobertura BIC-aiNet e GSO, BIC-aiNet e NichePSO, dFSS e CGA, dFSS e ABC e FSGA, BIC-aiNet e CDE, CDE e CGA, CDE e
Linhas e SwarmBcluster, CGA e GSO, CGA e NichePSO, GSO e SwarmBcluster, SwarmBcluster, dFSS e FSGA, CGA e MHS, FSGA e
Colunas NichePSO e SwarmBcluster GSO, FSGA e NichePSO MHS e SwarmBcluster
ABC e BIC-aiNet, ABC e SwarmBcluster, BicACO e CGA, BIC-aiNet e ABC e Todos(LC), BIC-aiNet e
CDE, BIC-aiNet e dFSS, BIC-aiNet e CGA, CDE e SwarmBcluster, dFSS e FSGA, BIC-aiNet e MHS, dFSS e
SwarmBcluster, dFSS e Todos(LC), CGA e SwarmBcluster, CGA e BicACO e dFSS, BIC-aiNet e GSO, CDE e Todos(LC), Todos(J), MHS e SwarmBcluster,
Sobreposição Todos(J), CGA e Todos(LC) FSGA e SwarmBcluster, GSO e SwarmBcluster NichePSO e SwarmBcluster
BicACO e Todos(J), BIC-aiNet e CGA, BIC-aiNet e SwarmBcluster, dFSS e ABC e CGA, BIC-aiNet e Todos(LC), CDE e CGA,
Todos(J), CGA e MHS, CGA e NichePSO, CGA e Todos(J), FSGA e GSO e Todos(J), MHS e SwarmBcluster, MHS e BIC-aiNet e FSGA, NichePSO e
Jaccard Todos(J), SwarmBcluster e Todos(J), Todos(J) e Todos(LC) Todos(LC) SwarmBcluster
ABC e SwarmBcluster, CDE e
SwarmBcluster, SwarmBcluster e
VE SwarmBcluster e Todos(LC) CGA e Todos(LC), MHS e SwarmBcluster Todos(J)
TVE
ABC e CGA, CDE e
SwarmBcluster, CGA e
NichePSO, MHS e
BIC-aiNet e CDE, BIC-aiNet e MHS, BIC-aiNet e Todos(LC), CDE e CGA, SwarmBcluster, SwarmBcluster e
MI CGA e MHS, CGA e Todos(LC), FSGA e Todos(LC) CDE e FSGA, FSGA e MHS Todos(LC)
LC
232
Tabela 153: Teste de Nemenyi (Bagged Biclustering com sobreposição)

Métrica 0,01 0,05 0,1
BicACO e SwarmBcluster, BicACO e Todos(LC), BIC-aiNet e GSO, GSO ABC e GSO, CGA e SwarmBcluster, CGA e Todos(LC),
MSR (melhor) e SwarmBcluster, GSO e Todos(J), GSO e Todos(LC) FSGA e SwarmBcluster, FSGA e Todos(LC) BicACO e Todos(J)
ABC e BicACO, BicACO e BIC-aiNet, BicACO e Todos(J), BicACO e
Todos(LC), BIC-aiNet e CDE, BIC-aiNet e NichePSO, BIC-aiNet e BicACO e MHS, NichePSO e
Volume SwarmBcluster, CDE e Todos(J), NichePSO e Todos(J), SwarmBcluster e BicACO e CGA, BicACO e GSO, BIC-aiNet e FSGA, Todos(LC), SwarmBcluster e
(melhor) Todos(J) FSGA e Todos(J) Todos(LC)
BicACO e GSO, BIC-aiNet e GSO, dFSS e CGA, dFSS e FSGA, dFSS e
Todos(J), dFSS e Todos(LC), CGA e GSO, CGA e NichePSO, FSGA e
GSO, FSGA e NichePSO, GSO e Todos(J), GSO e Todos(LC), NichePSO BIC-aiNet e NichePSO, GSO e
MSR (média) e Todos(J), NichePSO e Todos(LC) BicACO e dFSS, BicACO e NichePSO, BIC-aiNet e dFSS MHS
BicACO e BIC-aiNet, BicACO e SwarmBcluster, BicACO e Todos(J),
BIC-aiNet e CDE, BIC-aiNet e dFSS, BIC-aiNet e FSGA, BIC-aiNet e
NichePSO, CDE e SwarmBcluster, CDE e Todos(J), CDE e Todos(LC), BicACO e Todos(LC), BIC-aiNet e GSO, BIC-aiNet e
dFSS e Todos(J), FSGA e Todos(J), NichePSO e SwarmBcluster, MHS, dFSS e SwarmBcluster, FSGA e SwarmBcluster, dFSS e Todos(LC), FSGA e
Volume (média) NichePSO e Todos(J), NichePSO e Todos(LC) MHS e Todos(J) Todos(LC), GSO e Todos(J)
BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-aiNet e GSO, BIC-aiNet e ABC e BIC-aiNet, BIC-aiNet e
Todos(J), BIC-aiNet e Todos(LC), CDE e Todos(J), MHS e Todos(J), ABC e Todos(J), ABC e Todos(LC), BicACO e BIC- dFSS, dFSS e Todos(LC), CGA e
MHS e Todos(LC), SwarmBcluster e Todos(J), SwarmBcluster e aiNet, BIC-aiNet e NichePSO, CDE e Todos(LC), dFSS e SwarmBcluster, NichePSO e
Tempo Todos(LC) Todos(J), FSGA e SwarmBcluster, GSO e SwarmBcluster Todos(J)
ABC e BIC-aiNet, BIC-aiNet e CDE, BIC-aiNet e dFSS, BIC-aiNet e CDE e SwarmBcluster, dFSS e
Cobertura GSO, BIC-aiNet e NichePSO, CDE e CGA, dFSS e CGA, dFSS e FSGA, ABC e CGA, BIC-aiNet e MHS, CDE e FSGA, dFSS e Todos(J), FSGA e GSO,
Elementos CGA e GSO, CGA e NichePSO, FSGA e NichePSO SwarmBcluster, NichePSO e SwarmBcluster NichePSO e Todos(J)
ABC e BIC-aiNet, ABC e CGA, BIC-aiNet e dFSS, BIC-aiNet e GSO,
Cobertura BIC-aiNet e NichePSO, CDE e CGA, dFSS e CGA, dFSS e ABC e FSGA, ABC e SwarmBcluster, BIC-aiNet e CDE, BicACO e dFSS, BicACO e
Linhas e SwarmBcluster, CGA e GSO, CGA e NichePSO, NichePSO e BIC-aiNet e MHS, dFSS e FSGA, CGA e MHS, FSGA e NichePSO, CDE e FSGA, CDE e
Colunas SwarmBcluster GSO, FSGA e NichePSO, GSO e SwarmBcluster SwarmBcluster
ABC e CGA, BicACO e BIC-aiNet, BicACO e Todos(J), BIC-aiNet e
CDE, BIC-aiNet e dFSS, BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-
aiNet e NichePSO, CDE e Todos(J), dFSS e Todos(J), CGA e BIC-aiNet e GSO, BIC-aiNet e
SwarmBcluster, CGA e Todos(J), CGA e Todos(LC), FSGA e BicACO e SwarmBcluster, BicACO e Todos(LC), CDE e MHS, dFSS e SwarmBcluster,
SwarmBcluster, FSGA e Todos(J), FSGA e Todos(LC), NichePSO e SwarmBcluster, CDE e Todos(LC), NichePSO e dFSS e Todos(LC), CGA e GSO,
Sobreposição Todos(J) SwarmBcluster, NichePSO e Todos(LC) CGA e MHS
CDE, BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-aiNet e NichePSO, BIC-
aiNet e Todos(LC), CDE e Todos(J), dFSS e Todos(J), CGA e
SwarmBcluster, CGA e Todos(J), FSGA e Todos(J), NichePSO e Todos(J), BIC-aiNet e dFSS, CGA e GSO, CGA e MHS, FSGA e
Jaccard SwarmBcluster e Todos(LC), Todos(J) e Todos(LC) SwarmBcluster ABC e Todos(LC)
VE SwarmBcluster e Todos(LC) BicACO e Todos(LC)
TVE
MI
BIC-aiNet e Todos(LC), GSO e
LC BIC-aiNet e NichePSO, NichePSO e Todos(J), Todos(J) e Todos(LC) BicACO e Todos(J), CDE e Todos(J) NichePSO, MHS e Todos(J)
233
Tabela 154: Teste de Nemenyi (Bagged Biclustering sem sobreposição)

Métrica 0,01 0,05 0,1
BIC-aiNet e Todos(LC), dFSS e
ABC e CGA, CGA e MHS, CGA e SwarmBcluster, CGA e Todos(LC), Todos(LC), CGA e Todos(J),
MSR (melhor) FSGA e MHS, FSGA e Todos(LC) ABC e FSGA, BicACO e CGA, CGA e NichePSO FSGA e SwarmBcluster
Volume ABC e CGA, ABC e FSGA, ABC e SwarmBcluster, CGA e MHS, CGA e ABC e BicACO, BicACO e Todos(J), CGA e GSO, FSGA FSGA e GSO, NichePSO e
(melhor) NichePSO, CGA e Todos(J), FSGA e Todos(J), SwarmBcluster e Todos(J) e MHS, FSGA e NichePSO SwarmBcluster
ABC e BIC-aiNet, BicACO e
ABC e CGA, BIC-aiNet e CDE, BIC-aiNet e NichePSO, CGA, BIC-aiNet e dFSS, FSGA e
MSR (média) CDE e CGA, dFSS e CGA, CGA e NichePSO NichePSO
CGA, BIC-aiNet e FSGA, BIC-aiNet e MHS, CGA e SwarmBcluster, ABC e FSGA, BIC-aiNet e GSO,
CGA e Todos(J), CGA e Todos(LC), FSGA e SwarmBcluster, FSGA e BIC-aiNet e CDE, BIC-aiNet e dFSS, CDE e Todos(J), BIC-aiNet e NichePSO, GSO e
Volume (média) Todos(J) dFSS e Todos(J), FSGA e Todos(LC), MHS e Todos(J) Todos(J)
BIC-aiNet e CGA, BIC-aiNet e FSGA, BIC-aiNet e GSO, BIC-aiNet e ABC e BIC-aiNet, BicACO e BIC-aiNet, BIC-aiNet e
Todos(J), BIC-aiNet e Todos(LC), CDE e Todos(J), FSGA e dFSS, CDE e Todos(LC), dFSS e Todos(J), GSO e ABC e Todos(J), BIC-aiNet e
SwarmBcluster, MHS e Todos(J), MHS e Todos(LC), SwarmBcluster e SwarmBcluster, NichePSO e Todos(J), NichePSO e NichePSO, dFSS e Todos(LC),
Tempo Todos(J), SwarmBcluster e Todos(LC) Todos(LC) CGA e SwarmBcluster
ABC e BIC-aiNet, ABC e CGA, ABC e FSGA, ABC e SwarmBcluster,
ABC e Todos(J), BIC-aiNet e CDE, BIC-aiNet e dFSS, BIC-aiNet e GSO,
BIC-aiNet e NichePSO, dFSS e CGA, dFSS e FSGA, dFSS e
SwarmBcluster, dFSS e Todos(J), CGA e GSO, CGA e NichePSO, FSGA
Cobertura e GSO, FSGA e NichePSO, GSO e SwarmBcluster, GSO e Todos(J), ABC e Todos(LC), BIC-aiNet e MHS, CDE e CGA, dFSS
Elementos NichePSO e SwarmBcluster, NichePSO e Todos(J) e Todos(LC), GSO e Todos(LC), NichePSO e Todos(LC)
ABC e BIC-aiNet, ABC e CGA, ABC e FSGA, ABC e SwarmBcluster,
Cobertura BIC-aiNet e dFSS, BIC-aiNet e GSO, BIC-aiNet e NichePSO, dFSS e BicACO e dFSS, BIC-aiNet e
Linhas e CGA, dFSS e FSGA, dFSS e SwarmBcluster, CGA e GSO, CGA e BIC-aiNet e CDE, CDE e CGA, FSGA e GSO, FSGA e MHS, CDE e SwarmBcluster,
Colunas NichePSO, GSO e SwarmBcluster, NichePSO e SwarmBcluster NichePSO dFSS e Todos(J), CGA e MHS
ABC e CGA, BicACO e CGA, BIC-aiNet e CDE, BIC-aiNet e CGA, BIC-
aiNet e FSGA, BIC-aiNet e MHS, CDE e Todos(J), CGA e
SwarmBcluster, CGA e Todos(J), CGA e Todos(LC), FSGA e Todos(J), BIC-aiNet e dFSS, dFSS e Todos(J), CGA e GSO, FSGA
Sobreposição FSGA e Todos(LC), MHS e Todos(J) e SwarmBcluster CGA e NichePSO
ABC e BicACO, ABC e CGA, ABC e SwarmBcluster, ABC e Todos(LC),
BicACO e MHS, BicACO e Todos(J), BIC-aiNet e CGA, BIC-aiNet e ABC e FSGA, CDE e
SwarmBcluster, BIC-aiNet e Todos(LC), CDE e CGA, CGA e MHS, CGA SwarmBcluster, dFSS e
e Todos(J), FSGA e Todos(J), GSO e Todos(J), MHS e SwarmBcluster, Todos(LC), FSGA e MHS,
Jaccard MHS e Todos(LC), SwarmBcluster e Todos(J), Todos(J) e Todos(LC) BicACO e BIC-aiNet, CDE e Todos(LC), dFSS e CGA NichePSO e Todos(J)
VE SwarmBcluster e Todos(LC) SwarmBcluster e Todos(J) BIC-aiNet e SwarmBcluster
TVE ABC e FSGA
BIC-aiNet e Todos(LC), dFSS e Todos(LC), FSGA e ABC e CGA, dFSS e MHS, MHS
MI CGA e MHS, CGA e Todos(LC), FSGA e Todos(LC), GSO e Todos(LC) MHS, GSO e MHS, SwarmBcluster e Todos(LC) e SwarmBcluster
LC Todos(J) e Todos(LC) BicACO e Todos(J), CGA e Todos(J)
234
Apêndice E – Gráficos
Os gráficos a seguir exemplificam o comportamento dos algoritmos multimodais

e dos comitês com relação às métricas: MSR e volume do melhor bicluster; MSR e
volume médio da população final; tempo; cobertura dos elementos e das linhas e
colunas; sobreposição, índice de Jaccard; e VE, TVE, MI, LC do melhor bicluster e
RMS, CMS e MS da população final. As configurações dos comitês são mostradas da
seguinte forma: “algoritmo usado para gerar os biclusters iniciais (método de criação
das bases de dados para a geração dos biclusters iniciais /sobreposição /métrica para
criação de meta-clusters)”. A notação adotada foi: “FD” representa Fusão Direta; “B”
representa Bagged Biclustering; “O” indica que há sobreposição; “NO” indica que não
há sobreposição; “J” denota a métrica índice de Jaccard; e “LC” indica a métrica
correlação linear.
235
236
Figura 65 - MSR do melhor bicluster para a base Artificial_2.

237
Figura 66 - Volume do melhor bicluster para a base Artificial_2.

238
Figura 67 - MSR médio da população para a base Artificial_2.

239
Figura 68 - Volume médio da população para a base Artificial_2.

240
Figura 69 - Tempo para a base Artificial_2.

241
Figura 70 - Cobertura dos elementos para a base Artificial_2.

242
Figura 71 - Cobertura de linhas e colunas para a base Artificial_2.

243
Figura 72 - Sobreposição para a base Artificial_2.

244
Figura 73 - Índice de Jaccard para a base Artificial_2.

245
Figura 74 - VE para a base Artificial_2.

246
Figura 75 - TVE para a base Artificial_2.

247
Figura 76 - MI para a base Artificial_2.

248
Figura 77 - LC para a base Artificial_2.

249
Figura 78 - RMS para a base Artificial_2.

250
Figura 79 - CMS para a base Artificial_2.

251
Figura 80 - MS para a base Artificial_2.

Dissertacao

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Dissertacao

Enviado por

Direitos autorais:

Formatos disponíveis

Lara Carvalho Menezes

COMITÊS DE AGRUPAMENTOS BIDIMENSIONAIS DE DADOS

COMITÊS DE AGRUPAMENTOS BIDIMENSIONAIS DE DADOS

Orientador: Prof. Dr. André Luís Vasconcelos Coelho

M543c Menezes, Lara Carvalho.

Dissertação (mestrado) – Universidade de Fortaleza, 2011.

1. Algoritmos. 2. Mineração de dados. 3. Bases de dados. 4. Heurística.

Ao professor André Coelho, por ter me orientado e me motivado durante este

Aos amigos Plauto Benevides e Diego Mello, por terem disponibilizado a

Ao meu namorado Luiz e à minha irmã Andréa, pelo apoio e paciência.

A todos os colegas e professores do MIA, fundamentais para minha formação

À banca examinadora, pelas críticas e sugestões.

À CAPES, pelo suporte financeiro.

A todos aqueles que me incentivaram nesta jornada.

Resumo da dissertação apresentada ao Corpo Docente do programa de Pós-

Comitês de agrupamentos bidimensionais de dados gerados via algoritmos

Autor: Lara Carvalho Menezes

A área de Mineração de Dados (MD) fornece um conjunto de tarefas e

Palavras-Chave: Mineração de dados, Aprendizado de máquina, Agrupamento

Abstract of the dissertation presented to the board of faculties of the Graduate

Ensembles of biclusters generated by multimodal bio-inspired algorithms

Author: Lara Carvalho Menezes

Keywords: Data mining, Machine learning, Biclustering, Committee machines,

LISTA DE FIGURAS ................................................................................................................... 17

3.12. Conclusão ........................................................................................................ 66

Figura 1 - Exemplos de otimização multimodal...................................................................3

Figura 21 - Comparação múltipla entre os algoritmos multimodais referente ao volume

Figura 71 - Cobertura de linhas e colunas para a base Artificial_2. .............................. 242

Tabela 1: Algoritmos de agrupamento bidimensional de dados ...................................... 16

LISTA DE ACRÔNIMOS E ABREVIATURAS

ABC: Artificial Bee Colony

MI: Mutual Information

Avanços recentes nas áreas de Ciência e Engenharia de Computação vêm

A tarefa de agrupamento de dados (clustering) consiste em separar amostras de

As técnicas de clustering apresentam duas limitações: primeiro, elas não são

limitações têm um grande impacto em algumas aplicações, como na análise de dados de

Na análise de expressão gênica, em particular, há uma grande dificuldade em se

Já existe na literatura um bom repertório de algoritmos de agrupamento

A complexidade do problema de biclustering depende da sua formulação e,

A geração de biclusters pode ser modelada como um problema de otimização

Figura 1 - Exemplos de otimização multimodal.

ótimos globais e locais de uma determinada função-objetivo. Nesse exemplo, evidencia-

Figura 2 - Exemplo de uma matriz de dados original (à esquerda) e reordenada (à direita).

Todavia, algoritmos bio-inspirados tradicionais, como os algoritmos genéticos e

Por outro lado, recentemente, foram propostas as primeiras abordagens de

que a combinação de múltiplos modelos de classificação ou de regressão tende a

Estudos analisando experimentalmente algoritmos tradicionais de biclustering já

 Artificial Bee Colony (ABC) (Karaboga 2005);

 Biclustering Ant Colony Optimization (BicACO) (de França et al. 2008);

 Artificial Immune Network for Biclustering (BIC-aiNet) (de Castro et al.

 Density based Fish School Search (dFSS) (Madeiro 2010);

 Crowding based Differential Evolution (CDE) (Storn e Price 1995);

 Glowworm Swarm Optimization (GSO) (Krishnanand e Ghose 2009);

 Multimodal Harmony Search (MHS) (Geem et al. 2001);

 Fitness Sharing based Genetic Algorithm (FSGA) (Goldberg e Richardson

 Clearing based Genetic Algorithm (CGA) (Pétrowski 1996);

 Niche based Particle Swarm Optimization (NichePSO) (Engelbrecht 2007); e

 Swarm Intelligence Biclustering (SwarmBcluster) (de França 2010).

O segundo objetivo geral desta dissertação é o de investigar o desempenho de

Constam ainda como contribuições: a apresentação de um estudo introdutório

O trabalho se organiza da seguinte forma. No Capítulo 2, são apresentados

O presente capítulo aborda conceitos básicos de Mineração de Dados, com

A descoberta de conhecimento em bases de dados é um campo de pesquisa cujo