Você está na página 1de 23

INSTITUTO DE ENSINO SUPERIOR FUCAPI

INTELIGÊNCIA ARTIFICIAL

Técnicas de classificação

Prof. Sergio Cleger Tamayo.


sergio.cleger@gmail.com
Agenda
 Rede Bayesiana ou Classificador
Bayesiano.
Rede Bayesiana ou Classificador
Bayesiano
Classificadores Bayesianos
 Classificam um registro desconhecido
numa determinada classe Y baseando-se
na probabilidade do registro pertencer à
classe Y

 Vantagens
◦ Processo de classificação rápido
◦ Grande precisão quando aplicados a grandes
volumes de dados.
Classificador Bayesiano
 Um classificador Bayesiano é fundamentado em
um teorema probabilístico conhecido como o
teorema de Bayes.

 O teorema de Bayes é normalmente


empregado para resolver problemas de
previsões.
◦ Exemplo
 Previsões climáticas, bolsa de valores
Classificador Bayesiano
 É uma técnica que se destaca por empregar o
cálculo das probabilidades para predizer a
classe, y, do atributo- classe de um registro de
desconhecido.

 Algoritmo de classificação Bayesianos


◦ Naive Bayes
Classificador Bayesiano
 Suponha que X denote um registro
desconhecido e Y o valor de uma
determinada classe.
 A probabilidade de Y ser o valor do
atributo-classe do registro desconhecido
X pode ser obtida por meio do cálculo da
probabilidade condicional.
 A probabilidade condicional também é
chamada de probabilidade posterior.
Classificador Bayesiano
 A probabilidade condicional pode ser calculada por
meio da seguinte fórmula:

P X | Y  PY 
PY | X  
P X 
Onde X=registro e Y=classe
 P(Y|X) = Probabilidade da classe Y dado registro X
 P(X|Y) = Probabilidade do registro X dada a classe Y
 P(Y) = Probabilidade anterior da classe Y
 P(X) = Evidência
Classificador Bayesiano
 O processo de aprendizagem
◦ consiste em, calcular as probabilidades
anteriores P(Y) a partir do conjunto de
registros da base de conhecimento.

 Para obter a fração dos registros que


pertence a cada classe.
Classificador Bayesiano
 A Predição
◦ A partir das probabilidades obtidas, dado um
registro, X, desconhecido pode ser classificado
obtendo-se o valor Y que maximiza a
probabilidade condicional P(Y|X)
Teorema de Bayes na Classificação
Exemplo:
ID Idade Renda Estudante Crédito Compra_computador
1 <= 30 Alta Não Bom Não
2 <= 30 Alta Não Bom Não
3 31..40 Alta Não Bom Sim
4 > 40 Média Não Bom Sim
5 > 40 Baixa Sim Bom Sim
6 > 40 Baixa Sim Excelente Não
7 31..40 Baixa Sim Excelente Sim
8 <= 30 Média Não Bom Não
9 <= 30 Baixa Sim Bom Sim
10 > 40 Média Sim Bom Sim
11 <= 30 Média Sim Excelente Sim
12 31..40 Média Não Excelente Sim
13 31..40 Alta Sim Bom Sim
14 > 40 Média Não Excelente Não

Classificar o seguinte registro de teste:


X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
Y = Compra_Computador=?
Teorema de Bayes na Classificação
Exemplo:
ID Idade Renda Estudante Crédito Compra_computador
1 <= 30 Alta Não Bom Não
2 <= 30 Alta Não Bom Não
3 31..40 Alta Não Bom Sim
4 > 40 Média Não Bom Sim
5 > 40 Baixa Sim Bom Sim
6 > 40 Baixa Sim Excelente Não
7 31..40 Baixa Sim Excelente Sim
8 <= 30 Média Não Bom Não
9 <= 30 Baixa Sim Bom Sim
10 > 40 Média Sim Bom Sim
11 <= 30 Média Sim Excelente Sim
12 31..40 Média Não Excelente Sim
13 31..40 Alta Sim Bom Sim
14 > 40 Média Não Excelente Não

P(Y) - Probabilidade anterior de Y


P(Y=sim) e P(Y=não)
P(Y=sim) = 9/14 = 0,643 Fração dos registros que
P(Y=não) = 5/14 = 0,357 pertence a cada classe
Teorema de Bayes na Classificação
X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador
1 <= 30 Alta Não Bom Não
2 <= 30 Alta Não Bom Não
3 31..40 Alta Não Bom Sim
4 > 40 Média Não Bom Sim
5 > 40 Baixa Sim Bom Sim
6 > 40 Baixa Sim Excelente Não
7 31..40 Baixa Sim Excelente Sim
8 <= 30 Média Não Bom Não
9 <= 30 Baixa Sim Bom Sim
10 > 40 Média Sim Bom Sim
11 <= 30 Média Sim Excelente Sim
12 31..40 Média Não Excelente Sim
13 31..40 Alta Sim Bom Sim
14 > 40 Média Não Excelente Não
P(X|Y) - Probabilidade condicional de X dado Y
P[Idade <= 30 | Y = sim] = 2/9 = 0,222
P[Idade <= 30 | Y = não] = 3/5 = 0,6
Fração dos registros que pertence a cada classe
caso a idade seja menor igual 30.
Teorema de Bayes na Classificação
X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador
1 <= 30 Alta Não Bom Não
2 <= 30 Alta Não Bom Não
3 31..40 Alta Não Bom Sim
4 > 40 Média Não Bom Sim
5 > 40 Baixa Sim Bom Sim
6 > 40 Baixa Sim Excelente Não
7 31..40 Baixa Sim Excelente Sim
8 <= 30 Média Não Bom Não
9 <= 30 Baixa Sim Bom Sim
10 > 40 Média Sim Bom Sim
11 <= 30 Média Sim Excelente Sim
12 31..40 Média Não Excelente Sim
13 31..40 Alta Sim Bom Sim
14 > 40 Média Não Excelente Não
P(X|Y) - Probabilidade condicional de X dado Y
P[Renda = Media | Y = sim] = 4/9 = 0,444
P[Renda = Media | Y = não] = 2/5 = 0,4
Fração dos registros que pertence a cada classe
caso a Renda é igual Media.
Teorema de Bayes na Classificação
X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador
1 <= 30 Alta Não Bom Não
2 <= 30 Alta Não Bom Não
3 31..40 Alta Não Bom Sim
4 > 40 Média Não Bom Sim
5 > 40 Baixa Sim Bom Sim
6 > 40 Baixa Sim Excelente Não
7 31..40 Baixa Sim Excelente Sim
8 <= 30 Média Não Bom Não
9 <= 30 Baixa Sim Bom Sim
10 > 40 Média Sim Bom Sim
11 <= 30 Média Sim Excelente Sim
12 31..40 Média Não Excelente Sim
13 31..40 Alta Sim Bom Sim
14 > 40 Média Não Excelente Não
P(X|Y) - Probabilidade condicional de X dado Y
P[Estudante = sim | Y = sim] = 6/9 = 0,667
P[Estudante = sim | Y = não] =1/5 = 0,2
Fração dos registros que pertence a cada classe
caso a Estudante é igual Sim.
Teorema de Bayes na Classificação
X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador
1 <= 30 Alta Não Bom Não
2 <= 30 Alta Não Bom Não
3 31..40 Alta Não Bom Sim
4 > 40 Média Não Bom Sim
5 > 40 Baixa Sim Bom Sim
6 > 40 Baixa Sim Excelente Não
7 31..40 Baixa Sim Excelente Sim
8 <= 30 Média Não Bom Não
9 <= 30 Baixa Sim Bom Sim
10 > 40 Média Sim Bom Sim
11 <= 30 Média Sim Excelente Sim
12 31..40 Média Não Excelente Sim
13 31..40 Alta Sim Bom Sim
14 > 40 Média Não Excelente Não
P(X|Y) - Probabilidade condicional de X dado Y
P[Credito = bom | Y = sim] = 6/9 = 0,667
P[Credito = bom | Y = não] = 3/5 =0,6
Fração dos registros que pertence a cada classe
caso a Credito é igual Bom.
Teorema de Bayes na Classificação

Temos as seguintes probabilidades anteriores obtidas:


P(Y=sim) = 0,643
P(Y=não) = 0,357
Temos as seguintes probabilidades condicionais obtidas:

P(X|Y=sim) = 0,222 * 0,444 * 0,667 * 0,667 = 0,044


P(X|Y=não) = 0,6 * 0,6 * 0,2 * 0,4 = 0,0288

Evidência:
P(X) = P(X|Y=sim)*P(Y=sim) + P(X|Y=não)*P(Y=não)
P(X) = 0,044*0,643 + 0,0288*0,357 = 0,028 + 0,010 = 0,038
Teorema de Bayes na Classificação

 Probabilidade condicional:
P(Y=sim|X) = P(X|Y=sim) * P(Y=sim) / P(X) =
0,044 * 0,643 = 0,028 / 0,038 = 0,7

P(Y=nao|X) = P(X|Y=não) * P(Y=não) / P(X) =


0,019 * 0,357 = 0,007 / 0,038= 0,1

 Ou seja, P(Y=sim|X) > P(Y=não|X)


 O classificador Bayesiano prediz que o
registro desconhecido X é classificado
na classe Compra-Computador = sim
Exercício de fixação
 Suponha que se deseja prever se alguém deseja assistir um determinado tipo
de programa de TV de acordo com o contexto do usuário
Lugar Dia Período Programa de TV Assistir-Programa de TV

Conjunto de Casa Domingo Noite Filme Sim

treinamento Escritório
Casa
Segunda
Sábado
Manhã
Tarde
Desenho
Desenho
Não
Sim
Carro Sábado Noite Filme Não
Escritório Segunda Manhã Economia Sim
Casa Domingo Manha Esportes Não

Dia Período Programa de TV Assistir-Programa de


Registro X TV
Casa Domingo Manhã Esportes ?

 Para classificar um registro, X, de teste deve-se, calcular as probabilidades


condicionais P(Y=Sim|X) e P(Y=Não|X) a partir dos dados registros do
conjunto de treinamento.
 Se a probabilidade posterior P(Y=Sim|X)> P(Y=Não|X), então o registro de
teste é classificado como Sim, senão é classificado como Não.
Implementação em Java
Aprendizagem Supervisionada
baseada em Classificador Bayesiano
 Implementação da etapa de aprendizagem por
meio de um classificador Bayesiano
 É utilizado o algoritmo Naive Bayes disponível na
API Weka
Predição baseada em um Classificador Bayesiano

 Implementação da etapa de predição por meio de


um classificador Bayesiano
 Usado para predizer um rótulo, y, de classe para
uma instância do registro de teste
INSTITUTO DE ENSINO SUPERIOR FUCAPI

INTELIGÊNCIA ARTIFICIAL

Técnicas de classificação

Prof. Sergio Cleger Tamayo.


sergio.cleger@gmail.com