Você está na página 1de 11

ANLISE DE DADOS E PADRES COM WEKA

Chaiana Layza Fabiana Nunes Gabriel Rocha

Sistemas de Informao 8 Perodo

Campos dos Goytacazes Maro/2012

Sumrio
INFORMAES TCNICAS..................................................................................................................3 MINERAO DE DADOS.................................................................................................................3 CLASSIFICAO...............................................................................................................................3 WEKA...................................................................................................................................................3 GUIA DE INSTALAO DO WEKA................................................................................................3 ARFF.....................................................................................................................................................4 FALSOS NEGATIVO E POSITIVO...................................................................................................4 THRESHOLD.......................................................................................................................................4 UTILIZAO DO WEKA PARA CLASSIFICAO DE UMA BASE DE DADOS ARFF...............5 CONCLUSO.........................................................................................................................................11

INFORMAES TCNICAS
MINERAO DE DADOS
A minerao de dados, basicamente, a transformao de grandes quantidades de dados em padres e regras significativos.

CLASSIFICAO
A tcnica cria uma rvore de classificao (uma rvore de deciso), onde os dados podem ser minerados para determinar as probabilidades de certo fato acontecer.

WEKA
WEKA um produto da Universidade de Waikato (Nova Zelndia) e foi implementado pela primeira vez em sua forma moderna em 1997. Ele usa a GNU General Public License (GPL). O software foi escrito na linguagem Java e contm uma GUI para interagir com arquivos de dados e produzir resultados visuais (pense em tabelas e curvas). Ele tambm tem uma API geral, assim possvel incorporar o WEKA, como qualquer outra biblioteca, a seus prprios aplicativos para fazer coisas como tarefas de minerao de dados automatizadas no lado do servidor.

GUIA DE INSTALAO DO WEKA


O weka foi desenvolvido em java e por isso necessita da maquina virtual JAVA. Para executar esse procedimento devemos: Instalar primeiro o pacote java apt-get install openjdk-6-jdk Download do weka wget http://prdownloads.sourceforge.net/weka/weka-3-7-5.zip Descompactar o pacote unzip weka-3-7-5.zip Acessar a pasta cd weka-3-7-5 Executar o comando java -jar weka.jar

ARFF

ARFF (Attribute-Relation File Format) um arquivo de texto ASCII que descreve uma lista de instncias que compartilham um conjunto de atributos. Os arquivos ARFFs foram desenvolvidas pelo Projeto Machine Learning no Departamento de Cincia da Computao da Universidade de Waikato para uso com o software de aprendizagem de mquina Weka.

FALSOS NEGATIVO E POSITIVO


Falso-negativo quando um resultado de algum teste ou equao d negativo devido as suas caractersticas mas na verdade o resultado positivo. Falso-positivo quando um resultado de algum teste ou equao d positivo devido as suas caractersticas mas na verdade o resultado negativo.

UTILIZAO DO WEKA PARA CLASSIFICAO DE UMA BASE DE DADOS ARFF


1 - Execute o WEKA java -jar weka.jar 2 - Selecione a opo Explore do WEKA.

3 - Selecione Open file... depois v at a pasta onde se encontra o arquivo de extenso .arff e aperte o boto Open.

4 - O WEKA ir carregar a base de dados e mostrar os grficos e as opes de parmetros do arquivo.

5 - As vezes necessrio remover algumas colunas da base de dados pois elas podem atrapalhar ou no sou obrigatrias para a anlise.

6 - Agora deve se classificar os dados. Selecione a opo Classify.

7 - Em Classifer deve-se escolher a tcnica de classificao, que neste caso tree/j48

8 - Mude a forma de teste para Use trainng set, com o intuito de melhorar o aprendizado do WEKA.

9 - Start. O WEKA ir analisar a base de dados e mostrar os falsos positivos e falsos negativos.

10 - Tambm ser gerado uma rvore da classificao.

11 - Essa rvore pode tambm ser visualizada em forma de grfico.

12 - Dentre as opes de visualizar a rvore existem varias outras, uma delas de visualizar o threshold das classes.

CONCLUSO
Com o WEKA consegue-se uma anlise mais completa dos dados e uma vasta gama de tcnicas de classificao e filtragem de dados, que auxiliam em tarefas do dia a dia dos analistas.