Escolar Documentos
Profissional Documentos
Cultura Documentos
LINGUAGEM NATURAL
Aprendizado Bayesiano
TÓPICOS
1. Aprendizado Bayesiano
2. Classificador Naïve Bayes
3. Análise
2
CLASSIFICAÇÃO
TEOREMA DE BAYES
𝑝 𝑥1 = 𝑎, 𝑥2 = 𝑏, … 𝑥𝑚 = 𝑧 𝑐𝑗 × 𝑝(𝑐𝑗 )
𝑝 𝑐𝑗 𝑥1 = 𝑎, 𝑥2 = 𝑏, … 𝑥𝑚 =𝑧 =
𝑝(𝑥1 = 𝑎, 𝑥2 = 𝑏, … 𝑥𝑚 = 𝑧)
Mas há um problema!
Õ p(x ) i
i=1
TÓPICOS
1. Aprendizado Bayesiano
2. Classificador Naïve Bayes
3. Análise
6
CLASSIFICADOR NAÏVE BAYES
Thomas Bayes
1702 - 1761
NAÏVE BAYES
Õ p(x ) i
i=1
EXEMPLO
Outlook (A1) Temperature (A2) Humidity (A3) Windy (A4) Play (B)
Rainy 3 2 Cool 3 1
Sunny 2/9 3/5 Hot 2/9 2/5 High 3/9 4/5 False 6/9 2/5 9/14 5/14
Overcast 4/9 0/5 Mild 4/9 2/5 Normal 6/9 1/5 True 3/9 3/5
Õ p(x ) i
i=1
EXEMPLO
Outlook (A1) Temperature (A2) Humidity (A3) Windy (A4) Play (B)
Rainy 3 2 Cool 3 1
Sunny 2/9 3/5 Hot 2/9 2/5 High 3/9 4/5 False 6/9 2/5 9/14 5/14
Overcast 4/9 0/5 Mild 4/9 2/5 Normal 6/9 1/5 True 3/9 3/5
Õ p(x ) i
i=1
EXEMPLO
Outlook (A1) Temperature (A2) Humidity (A3) Windy (A4) Play (B)
Rainy 3 2 Cool 3 1
Sunny 2/9 3/5 Hot 2/9 2/5 High 3/9 4/5 False 6/9 2/5 9/14 5/14
Overcast 4/9 0/5 Mild 4/9 2/5 Normal 6/9 1/5 True 3/9 3/5
Outlook (A1) Temperature (A2) Humidity (A3) Windy (A4) Play (B)
Rainy 3 2 Cool 3 1
Sunny 2/9 3/5 Hot 2/9 2/5 High 3/9 4/5 False 6/9 2/5 9/14 5/14
Overcast 4/9 0/5 Mild 4/9 2/5 Normal 6/9 1/5 True 3/9 3/5
• Alternativa 1: Discretização
• Alternativa 2: Assumir ou estimar alguma função de
probabilidades
• Usualmente a distribuição Gaussiana (Normal)
𝑁
1 𝑖
𝜇𝑗 = 𝑥𝑗
𝑁
𝑖=1
𝑁
2 1 𝑖
2
𝜎𝑗 = 𝑥𝑗 − 𝜇𝑗
𝑁−1
𝑖=1
𝑖 2
𝑥𝑗 −𝜇𝑗
1 −
𝑖 2𝜎𝑗2
𝑓(𝑥𝑗 ) = 𝑒
2𝜋𝜎𝑗
ESTATÍSTICAS
Outlook (A1) Temperature (A2) Humidity (A3) Windy (A4) Play (B)
Sunny 2 3 False 6 2 9 5
64, 68, 65, 71, 70, 85,
65, 70, 70,
Overcast 4 0 69, 70, 72, 80, 90, 91, True 3 3
75, 80, …
72, … 85, … 95, …
Rainy 3 2
Overcast 4/9 0/5 σ = 6.2 σ = 7.9 σ = 10.2 σ = 9.7 True 3/9 3/5
• Valor de densidade:
1 66−73 2
−
𝑓 𝑡𝑒𝑚𝑝𝑒𝑟𝑎𝑡𝑢𝑟𝑒 = 66|𝑦𝑒𝑠 = 𝑒 2×6.22 = 0.0340
2𝜋6.2
REPRESENTAÇÃO
… P(x
Masc Sim 0.15
Não 0.85
P(x1|cj) P(x2|cj) m|cj)
Fem Sim 0.01
Não 0.99
TÓPICOS
1. Aprendizado Bayesiano
2. Classificador Naïve Bayes
3. Análise
19
ATRIBUTOS IRRELEVANTES
10
• O classificador
Naïve Bayes gera 9
uma fronteira de 8
decisão quadrática 7
6
5
4
3
2
1
1 2 3 4 5 6 7 8 9 10
CONCLUSÕES
• Vantagens:
• Rápido para treinar (varredura única)
• Rápido para classificar
• Insensível a atributos irrelevantes
• Lida com dados discretos e contínuos
• Lida bem com fluxos de dados (data streams)
• Desvantagem:
• Assume independência dos atributos
• Caso haja alta redundância entre atributos, seleção de
atributos resolve o problema!
• Caso contrário, utilizar abordagem mais robusta (ex.: Redes
Bayesianas)
O QUE VIMOS?
• Aprendizado Bayesiano
• Classificador Naïve Bayes
• Análise
23
PRÓXIMA VIDEOAULA
24