Escolar Documentos
Profissional Documentos
Cultura Documentos
Machine Learning I
Random Forest for unbalanced datasets
Executive Summary
• Goals
Compreensão do algoritmo Random Forest
Resolver problemas de classificação binários desbalanceados
Implementar uma melhoria no Random Forest de forma a optimizar a performance para o
problema acima.
• Description
Implementar um uma técnica de amostragem (sampling) em que aumentamos a presença da
classe minoritária através de um parâmetro que controla a relação entre a duas classes
Empirical Study
• Experimental setup
Datasets and their characteristics
Datasets rotulados por completo. O rótulo é binário
Escolhemos no total quatro datasets
Focusing on the data characteristic of interest
O ponto de interesse é sobre o desbalanceamento
• No geral não houve grande diferenças entre o Random Forest e o Random Forest com
balanceamento.
• A excepção foi no dataset BNG – no qual foi possível comprovar que no caso do
precision sampling_strategy 0.8 é superior ao Random Forest. Também no recall se
notou diferenças sendo que neste caso foi o sampling_strategy 1.2 superior ao Random
Forest.
• Em relação ao recall, estes resultados de certa forma eram expectáveis uma vez que
quanto maior o sampling_strategy, maior a presença da classe maioritária o que por sua
vez leva a um maior recall.
Conclusions and Future Work
• Conclusions
Foi comprovado que com a nova abordagem obtivemos melhores resultados em alguns datasets. Verificamos isso tanto
em precision, recall.
Foi comprovado que esta abordagem é eficaz em datasets desbalanceados. Todos os datasets usados são desbalanceados.
• Future Work
Comparar/usar em conjunto com outros métodos para datasets desbalanceados como por exemplo smote, under
sampling, modelos de machine-learning que implementam class-weight.
Implementar um class-weight dentro do Random Forest
Usando os métodos referidos anteriormente testar usando outros datasets
Grupo
Elementos:
- Igor Gabriel Soares Melo
- Nuno Joaquim Borges da Silva
- Rafael Ferreira Rangel Tavares da Silva