Você está na página 1de 1

Exercı́cios - Mineração de Dados

Profa. Nádia Félix


(Dated: 12 de Maio de 2020)

1. Em https://archive.ics.uci.edu/ml/datasets/Breast+Cancer é disponibilizado
um importante conjunto de dados para detecção de câncer de mama. Tal conjunto
inclui 201 instâncias da uma classe no-recurrence-events (sem câncer), e 85 instâncias
da classe recurrence-events (câncer). As instâncias são descritas por 9 atributos, alguns
dos quais são contı́nuos e alguns são nominais (categóricos). Aplique os algoritmos
KNN com K=1,3,4 e 5 e Árvore de Decisão utilizando o package sklearn (http://
scikit-learn.org/stable/). Separe 20% para teste e use o restante para treino.
Compare os algoritmos pedidos, utilizando a acurácia. Qual dos algoritmos foi o
melhor?

2. Um cliente irá adquirir um produto bancário? (sim ou não). Seja o dataset dis-
ponı́vel em https://archive.ics.uci.edu/ml/datasets/Bank+Marketing. Tais
dados estão relacionados à campanhas de marketing de uma instituição bancária
portuguesa. As campanhas de marketing foram baseadas em chamadas telefônicas.
Muitas vezes, era necessário mais de um contato para o mesmo cliente, a fim de desco-
brir se o cliente iria adquirir ou não o serviço bancário. Aplique os algoritmos Aplique
os algoritmos KNN com K=1,3,4 e 5 e Árvore de Decisão utilizando o package sklearn
(http://scikit-learn.org/stable/) Separe 20% para teste e use o restante para
treino. Compare os algoritmos pedidos, utilizando a acurácia. Compare os algoritmos
pedidos, utilizando a acurácia, mostre a matriz de confusão. Qual dos algoritmos foi
o melhor?

Você também pode gostar