Escolar Documentos
Profissional Documentos
Cultura Documentos
2/38
Introdução
3/38
Exemplo: detecção de spam
4/38
Exemplo
5/38
Exemplo
6/38
Exemplo
Matriz de confusão
6/38
Exemplo
7/38
Exemplo
8/38
Exemplo
9/38
Exemplo
10/38
Exemplo
11/38
Acurácia
12/38
Acurácia
No nosso exemplo:
11
Ac = ≈ 78.57%
14
12/38
Acurácia: nem sempre é o caso
13/38
Acurácia: nem sempre é o caso
13/38
Acurácia: nem sempre é o caso
999900
Ac = = 99.99%
1000000
13/38
Acurácia: nem sempre é o caso
14/38
Detecção carro defeituoso v.s. Filtro de Spam
15/38
Detecção carro defeituoso v.s. Filtro de Spam
15/38
Detecção carro defeituoso
16/38
Medida indicada: Revocação (Recall)
17/38
Filtro Spam
Detecção de spam
I Positivo: Spam;
I Negativo: E-mail normal.
18/38
Filtro Spam
Detecção de spam
I Positivo: Spam;
I Negativo: E-mail normal.
19/38
Medida indicada: Precisão (Precision)
20/38
Carro defeituoso
21/38
Filtro de SPAM
22/38
Equilibrando revocação e precisão
23/38
Primeira tentativa: média
I Filtros de SPAM:
I Carro defeituoso:
24/38
Caso extremo: detecção de fraude em cartão de crédito
25/38
Caso extremo: detecção de fraude em cartão de crédito
25/38
Caso extremo: detecção de fraude em cartão de crédito
Verdadeiro Positivo 1
Precisão = = = 100%
Verdadeiro Positivo + Falso Positivo 1+0
Média = 55.5%
25/38
Caso extremo: detecção de fraude em cartão de crédito
26/38
Caso extremo: detecção de fraude em cartão de crédito
26/38
Caso extremo: detecção de fraude em cartão de crédito
Verdadeiro Positivo 1
Precisão = = = 100%
Verdadeiro Positivo + Falso Positivo 1+0
Média = 55.5%
26/38
F1 score
27/38
F1 score
I Filtros de SPAM:
I Carro defeituoso:
I Detecção de fraude:
28/38
Média harmônica ≤ Média aritmética
29/38
Média harmônica ≤ Média aritmética
29/38
Média harmônica ≤ Média aritmética
29/38
Média harmônica ≤ Média aritmética
29/38
Média harmônica ≤ Média aritmética
29/38
Média harmônica ≤ Média aritmética
29/38
Média harmônica ≤ Média aritmética
29/38
Fβ score
Definimos o Fβ score como sendo:
P ·R
Fβ = (1 + β 2 ) .
β2 ·P +R
Note que:
I F0 = P·R
R = Precisão;
P·R
I F1 = 2 P+R = F1 score usual;
P ·R
I lim Fβ = lim (1 + β 2 ) , então:
β→+∞ β→+∞ β2 ·P +R
1 P ·R
lim Fβ = lim +1 = Revocação.
β→+∞ β→+∞ β2 P + β12 R
30/38
Intermediário entre Precisão e Recall
31/38
Intermediário entre Precisão e Recall
31/38
Intermediário entre Precisão e Recall
31/38
Intermediário entre Precisão e Recall
Perfeito
1
Exemplo análogo ao do curso “Introdução ao Machine Learning” da Udacity.
32/38
Receiver operating characteristic - ROC1
Perfeito
Bom
1
Exemplo análogo ao do curso “Introdução ao Machine Learning” da Udacity.
32/38
Receiver operating characteristic - ROC1
Perfeito
Bom
Aleatório
1
Exemplo análogo ao do curso “Introdução ao Machine Learning” da Udacity.
32/38
Curva ROC
Verdadeiro Positivos 6
Taxa de Verdadeiro Positivos = = = 0.857
Todos os positivos 7
Falso Positivos 2
Taxa de Falso Positivos = = = 0.286
Todos os positivos 7
33/38
Curva ROC - extremo esquerdo
Verdadeiro Positivos 7
Taxa de Verdadeiro Positivos = = =1
Todos os positivos 7
Falso Positivos 7
Taxa de Falso Positivos = = =1
Todos os positivos 7
(0.826, 0.857)
34/38
Curva ROC - extremo direito
Verdadeiro Positivos 0
Taxa de Verdadeiro Positivos = = =0
Todos os positivos 7
Falso Positivos 0
Taxa de Falso Positivos = = =0
Todos os positivos 7
35/38
Curva ROC
36/38
Curva ROC e AUC
37/38
Obrigado!
Contato:
edson.junior@ufsc.br