Escolar Documentos
Profissional Documentos
Cultura Documentos
Florestas Aleatórias
Prof. Genaro Dueire Lins
Classificadores de Votação
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
• Bagging – A instância de
treinamento pode ser
amostrada diversas vezes no
mesmo previsor.
• Pasting – Instância de
treinamento só pode ser
amostrada uma vez por
preditor
Classificadores de Votação
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
Assertividade árvore
normal
Exemplo de arvore de decisão única versus um
bagging ensemble de 500 árvores
Classificadores de Votação
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
A validação é a prova
dos 9!
Qual a probabilidade em um
grupo de n pessoas ter pelo
menos duas que fazem a fazerem
aniversário no mesmo dia?
Qual a probabilidade de nenhuma delas fazer
aniversário no mesmo dia?
1 1 1
1− ∗ 1− ∗ ⋯∗ 1 −
364 363 365 − 𝑛
m o tamanho do conjunto.
• A probabilidade de uma instância não 0,6
sair é:
! "
• 1− ~37% 0,4
"
63% Amostra de treino
0,2
• Logo, a probabilidade da instância não
! "
sair é 1 − 1 − ~ 63%
" 0
0 5 10 15 20 25 30 35 40 45
No Scikit-Learn
Classificadores de Votação
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
• É um ensemble de Árvores de
Decisão, geralmente,
treinados pelo método de
bagging com max_samples
ajustadas ao conjunto de
treinamento.
• Além disso, usa também um
subconjunto aleatório de
características.
No Scikit-Learn
Classificadores de Votação
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias
No Scikit-Learn
Avaliação Out-of-Bag
Florestas Aleatórias