Escolar Documentos
Profissional Documentos
Cultura Documentos
ao ensino
Orientado por
Professor Doutor Stéphane Louis Clain
14 de Junho de 2020
1 Introdução
2 Dados e árvores
3 Probabilidade e Teoria da Informação
4 Árvore de decisão
5 Qualidade da Árvore
6 Poda
7 Aplicação
8 Conclusões
Objetivos:
Fazer um estudo sobre as várias técnicas de construção de árvores de
decisão e a poda(pré-poda)
Objetivos:
Fazer um estudo sobre as várias técnicas de construção de árvores de
decisão e a poda(pré-poda)
Objetivos:
Fazer um estudo sobre as várias técnicas de construção de árvores de
decisão e a poda(pré-poda)
Árvores de decisão?
Árvores de decisão?
Árvores de decisão?
Árvores de decisão?
Tabela: Tab.Eventos
Exemplo:
A1 = {F , M} a1 = F , a2 = M e P = {D1 , D2 } D1 = {1, 2, 3, 4, 5, 8}
D2 = {6, 7, 9}
Exemplo:
A1 = {F , M} a1 = F , a2 = M e P = {D1 , D2 } D1 = {1, 2, 3, 4, 5, 8}
D2 = {6, 7, 9}
Figura: árvore
Frequências
Noção de Impureza
Satisfaz as seguintes
Propriedades:
I (E ) = 0 se a pF = 1 e
pM = 0.
I (E ) atingira o seu
máximo quando
1
pF = pM = .
2
Figura: Nı́veis de impureza
Função de impureza
1 A entropia:P
IE (E ) = − K
k=1 (pk log2 pk )
2 Índice de Gini:
IG (E ) = 1 − K 2
P
k=1 pk
3 Misclassification:
IM (E ) = 1 − max(pk , ..., pK ).
Ganho de informação
Primeiro Exemplo
Primeiro Exemplo
Primeiro Exemplo
Primeiro Exemplo
Matriz de confusão
1 Evitar o Sobre-ajuste(Overfitting )
2 Reduzir o esforço computacional
Critérios de paragem
Profundidade máxima
Parametros: dmax = 2, β = 0, α = 1 e ε = 0.
28
RecallTraining = = 0, 622
28 + 17
36
EspecificityTraining = = 0.655.
36 + 19
7
RecallTest = = 0, 466
7+9
8
EspecificityTest = = 0.571.
8+6
Figura: A Figura: B
Muito Obrigada
J. Ross Quinlan.
Induction of decision trees.
Machine learning, 1(1):81–106, 1986.
Wei-Yin Loh.
Classification and regression trees.
Wiley Interdisciplinary Reviews: Data Mining and Knowledge
Discovery, 1(1):14–23, 2011.
João Gama, André Carlos Ponce de Leon Carvalho, Katti Faceli,
Ana Carolina Lorena, Márcia Oliveira, et al.
Extracção de conhecimento de dados: data mining.
Available in the net, 2015.
Lior Rokach and Oded Z Maimon.
Data mining with decision trees: theory and applications, volume 69.
World scientific, 2008.
Paulina da S. O. Suquina (Uminho) 14 de Junho de 2020 27 / 27