Escolar Documentos
Profissional Documentos
Cultura Documentos
Ferramenta
algoritmos de
preparao de dados aprendizagem de mquina (minerao) validao de resultados
/public/soft/linux/weka-3-4/
Java jar weka.jar Selecione Explorer copie os arquivos no dir /public/soft/linux/weka-3-4/data$ para sua area
Interface e Funcionalidades
(A) Open File, Open URL, Open DB (B) No boto filter possvel efetuar sucessivas filtragens de atributos e instncias na base de dados previamente carregada
Seleo Discretizao Normalizao Amostragem
Laboratrio 1
Abra o arquivo weather.nominal.arff
Perguntas
Nmeros de instancias, exemplos, registros?? Atributos ??? Quais os valores que o atributo temperatura pode ter ?? Repita o processo para outra base.
Editando bases
Abra a base weather.nominal.arff Clique em Editar Responda
Qual o valor da classe para a instncia 8? Algum atributo possui valor no ?
Aplicar filtros
Weka possui vrios filtros Remover atributos Escolha Choose... Remove ... Save..Name Abra o arquivo weather.nominal.arff Remova todos as instncias com valor de atributo humidity high Volte aos dados originais
Painel de Visualizao
Abra a base iris.arff (medidas de flores) Utilize o menu Visualize para selecionar algumas instncias e remover outras.
Classificao
Observe a saida dos diferentes tipos de classificadores. === Classifier model (full training set) === J48 pruned tree -----------------outlook = sunny | humidity = high: no (3.0) | humidity = normal: yes (2.0) outlook = overcast: yes (4.0) outlook = rainy | windy = TRUE: no (2.0) | windy = FALSE: yes (3.0) Number of Leaves
Responda
Utilizando a base weather Como seria classificada a seguinte instncia ??? outlook = sunny, temperature = cool, humidity = high, windy = TRUE
Modo de Testar
Use training set: Usa toda a base para teste Cross-validation: Divide a base em folds (disjuntos) Percentage split: Divide a base uma percentagem para treinamento e outra para teste.
Visualize as instncias
Visualize cada instncias e responda quais foram classificadas erroneamente ???