Escolar Documentos
Profissional Documentos
Cultura Documentos
DSC/UFCG
Marcus Sampaio
O Problema DSC/UFCG
Dados
Um banco de transaes de compra
Cada transao um conjunto de tens comprados
de Associao
Regras do tipo Se X ento Y
Outra representao: X Y
X Y =
Qualquer nmero de tens no conseqente
(Y)
Qualquer nmero de tens no antecedente (X)
Clusulas conjuntivas
Antecedente e conseqente
Uma generalizao de regras de classificao
Marcus Sampaio
Aplicaes DSC/UFCG
Desempenho
Um modelo induzido de Regras de
Associao deve ser avaliado
Duas mtricas de desempenho
Suporte
Confiana
Marcus Sampaio
Confiana DSC/UFCG
Suporte DSC/UFCG
Exemplos DSC/UFCG
Exemplo 1
Id Transaao Itens Comprados
1 {1, 2, 3}
2 {1, 4}
3 {1, 3}
4 {2, 5, 6}
Exemplo 2
Id Transao Itens Comprados
1 {1, 2, 3}
2 {1, 4}
3 {1, 3}
4 {2, 5, 6}
Para suporte mnimo = 50%, e confiana
mnima = 90%, temos as seguintes regras
3 => 1 com 50% de suporte e 100% de confiana
O Algortimo Apriori de Marcus Sampaio
DSC/UFCG
Regras de Associao
H dois motivos fortes para mostrar como
funciona um algoritmo de regras de
associao, ou como funciona qualquer
algoritmo de Minerao de Dados
Os usurios do algoritmo ganham confiana
Algoritmos de minerao de dados geralmente so
muito simples, no requerendo tcnologias de
inteligncia artificial, como linguagens indutivas do
tipo Prolog
Resultados inteligentes
Algoritmos tradicionais, e mais importante, com bom
desempenho
Marcus Sampaio
DSC/UFCG
Algoritmo Apriori
Etapa 1: Encontrar todos os conjuntos de tens
com suporte mnimo conjuntos de tens
freqentes
Fase mais pesada, em termos de custos
Muitos trabalhos de pesquisa em otimizao
Etapa 2: Uso dos conjuntos de tens freqentes
para induzir as regras de associao, com suporte
e confinaa acima dos mnimos especificados
Fase leve, em termos de custos
Marcus Sampaio
DSC/UFCG
TID Itens
1 {1, 2, 3} Suporte mnimo = 50%
2 {1, 3}
3 {1, 4}
Confiana mnima = 50%
4 {2, 5, 6}
Entrada: k Fk
Para cada Fk 1
Para cada X, Y Fk
Se (Suporte(Fk) / Suporte(X)) Confiana Mnima ento
seleciona a regra X Y
Marcus Sampaio
Otimizao DSC/UFCG
C2 F2
{2, 3} 2 It. Freq. Sup.
Varre BD
{2, 5} 3 {2, 5} 3
{3, 5} 2
Marcus Sampaio
DSC/UFCG
Etapa 2
Entrada: {2,5}
2 => 5?
Suporte {2,5} / Suporte {2} = 3 / 3 = 100%
5 => 2?
Suporte {2,5} / Suporte {5} = 3 / 3 = 100%
Regras Induzidas
2 => 5 1,0 1,0
5 => 2 1,0 1,0
Marcus Sampaio
DSC/UFCG
A Famlia Apriori
O algoritmo Apriori *seminal*
Inspirou muitos outros algoritmos de regra de
associao
Essas variaes constituem a famlia de
algoritmos Apriori
Algumas variaes diferem do Apriori com
relao abordagem
Apriori: consulta aberta
Variaes: consultas semi-abertas
Algoritmos parametrizados
Outras variaes exploram o carter temporal
das transaes
Regras de Associao Marcus Sampaio
DSC/UFCG
Generalizadas
Hierarquias de tens
vesturio
outwear camisas calados
Dadas
Uma seqncia de transaes de clientes
Cada transao um conjunto de tens
Encontrar os padres das seqncias de
transaes desses clientes
Exemplo: 10% dos clientes que compraram
um PC fizeram um upgrade da memria do
PC em uma transao subsequente
10% o suporte dos padres de seqncia