Você está na página 1de 3

Regras:

● O trabalho deve ser feito em duplas.


● As respostas devem ser escritas após cada um dos itens abaixo.
● O documento respondido deve ser enviado pelo Moodle. Nomeie o arquivo para
Nome1-Nome2.docx ou .pdf. Apenas um integrante da dupla deve enviar.
● Faça o download do spmf.jar e do test_files.zip do site http://www.philippe-fournier-
viger.com/spmf/index.php?link=download.php
● Se receber uma mensagem de estouro de memória ao executar algum dos
algoritmos, execute o spmf.jar por meio do comando java -Xmx1024m -jar spmf.jar

1. Execute o .jar, selecione o algoritmo GSP, navegue até o arquivo de teste


contextPrefixSpan.txt e o selecione como entrada. Selecione uma pasta qualquer
para a saída e suporte de 0.6. Dê um check em text editor.
a. Quantos padrões sequenciais foram encontrados?
R: 8
b. Quais os dois maiores padrões encontrados?
R: {1,3,2} e {1,3,3}
c. O que significa o #SUP de cada padrão encontrado?
R: Significa quantas vezes aquele padrão aparece levando em conta o suporte
mínimo.
d. Abra também a base de dados dada como entrada e compare com a saída. O
que significam os números -1 e -2?
R: O -1 significa o final de um item, como {}, e o -2 indica o fim da sequência, esses
meios são necessários para que que se encaixam no padrão de entendimento do
programa.

2. Acesse a página http://www.philippe-fournier-


viger.com/spmf/index.php?link=datasets.php e baixe as bases de dados Leviathan e
FIFA. Em ambas as bases, adicione:
@CONVERTED_FROM_TEXT
@ITEM=-1=|
a. Sobre o que é cada base de dados?
R: FIFA é uma stream de dados do site da Copa do Mundo FIFA 98, e Leviathan é
conjunto de dados é uma conversão do romance Leviathan de Thomas Hobbes
(1651)
b. O que é um item em cada uma das bases?
R: Em Leviathan cada item é uma palavra do livro, e em FIFA cada item
corresponde a um click do mouse em algo no site da Copa do mundo FIFA 98.
3. Execute o GSP sobre a base Leviathan com suporte 0.4.
a. Qual o maior padrão sequencial encontrado?
R: {8,18,8}
b. Qual o suporte desse padrão em porcentagem?
R: a base Leviathan tem 5834 regras no total, logo meu padrão encontrado teve um
#SUP=2482, portanto:
2482/5834 = 0,42%
4. Execute o GSP sobre a base Leviathan com suporte 0.1.
a. Quantos padrões foram encontrados?
R: 651
b. Quantos padrões de maior tamanho foram encontrados? Qual esse tamanho?
R: 4 padrões de tamanho 6
{8, 8, 18, 8, 18, 8} #SUP: 618
{8,18, 8, 8, 18, 8} #SUP: 682
{8, 18, 8, 18, 8, 8} #SUP: 621
{8,18, 8, 18, 8, 18} #SUP: 677
c. Qual o suporte de cada maior padrão encontrado em porcentagem? Considere
duas casas decimais.
R:#SUP/quantidade de regras totais da base de dado(5834)
{8, 8, 18, 8, 18, 8} #SUP: 618 – 0,10%
{8,18, 8, 8, 18, 8} #SUP: 682 – 0,11%
{8, 18, 8, 18, 8, 8} #SUP: 621 – 0,10%
{8,18, 8, 18, 8, 18} #SUP: 677 – 0,11%
5. Execute o GSP sobre a base FIFA com suporte 0.4.
a. Quantos padrões foram encontrados?
R: 5 padrões
b. Qual o suporte do item <90> em porcentagem? Duas casas decimais.
R:
Itens totais da base: 20.450
item 90 - #SUP8191
0,40%
6. Execute o GSP sobre a base FIFA com suporte 0.18.
a. Quantos padrões de maior tamanho foram encontrados? Qual esse tamanho?
R: 19 padrões de maior tamanho, contendo 4 itens
b. Mostre os padrões de maior tamanho.
R:
{ 155 | 135 | 50 | 36 } {155 | 135 | 50 | 37 } {155 | 147 | 8 | 24 }
{155 | 147 | 8 | 36 } {155 | 147 | 8 | 37 } {155 | 147 | 44 | 24 } {155 | 147 | 44 | 36 }
{155 | 147 | 44 | 37 } {155 | 147 | 44 | 59 } {155 | 147 | 90 | 10 } {155 | 147 | 90 | 14 }
{155 | 147 | 90 | 21 } {155 | 147 | 90 | 24 } {155 | 147 | 90 | 36 } {155 | 147 | 90 | 37 }
{155 | 147 | 90 | 57 } {155 | 147 | 90 | 59 } {155 | 147 | 90 | 82 } {155 | 147 | 131 | 36 }
c. Qual o tempo total de execução?
R: 13515 ms
7. Execute o SPADE sobre a base FIFA com suporte também 0.18.
a. Qual o tempo total de execução?
R: 22418 ms
b. Os maiores padrões encontrados com o GSP também foram encontrados
aqui?
R: Não, os maiores padrões encontrados tem 3 itens, ou seja, bem menores que os
padrões encontrados com o algoritmo GSP.
8. Considerando a base FIFA, qual algoritmo é melhor? GSP ou SPADE?

R: Levando em consideração o tempo de execução sob o mesmo suporte, o GSP é


melhor.

Você também pode gostar