Fe 07 PT

Enviado por

Alexandru

0% acharam este documento útil (0 voto)

6 visualizações2 páginas

rarasadasdas

Título original

fe07pt

Direitos autorais

Formatos disponíveis

PDF, TXT ou leia online no Scribd

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Denunciar este documento

rarasadasdas

Direitos autorais:

Formatos disponíveis

Baixe no formato PDF, TXT ou leia online no Scribd

Sinalizar o conteúdo como inadequado

0% acharam este documento útil (0 voto)

6 visualizações2 páginas

Fe 07 PT

Enviado por

Alexandru

rarasadasdas

Direitos autorais:

Formatos disponíveis

Baixe no formato PDF, TXT ou leia online no Scribd

Sinalizar o conteúdo como inadequado

Pular para a página

Você está na página 1de 2

Pesquisar no documento

FE07

Curso: Mestrado Integrado em Informática – Engenharia do Conhecimento

U.C.: Descoberta do Conhecimento

Folha de Exercícios FE07

Docente Cristiana Neto
Tema RapidMiner – K-means Clustering
Turma PL
Ano Letivo 2019-20 – 2º Semestre
Duração da aula 2 horas

1. 1. Parte I

[1] O que significa o ‘k’ em k-Means clustering?

[2] Como se identificam os clusters? Qual é o processo que o RapidMiner usa para definir e colocar as
observações num determinado cluster?

[3] O que revela a Centroid Table ao utilizador? Como se interpretam os valores dessa tabela?

[4] Como é que a presença de outliers nos atributos de um dataset influencia a utilidade de um modelo
de k-Means clustering? O que poderia ser feito para resolver este problema?

2. 2. Parte II

[1] Pense num problema que possa ser resolvido agrupando observações em clusters. Procure na internet
um dataset que possa ser utilizado e aplicado a um modelo de k-Means. Sugestão: ir ao website da UCI –
Machine Learning Repository e escolher um dataset cuja Default Task seja Clustering.

(a) Importe os dados para o RapidMiner. Não se esqueça de garantir que estes estejam no
formato CSV. Execute a etapa de Data Understanding.

(b) Efectue a etapa de Data Preparation. Pode incluir componentes de inconsistência de dados,
missing values, ou alteração do tipo de dados;

(c) Adicione um operador de k-means clustering ao dataset no RapidMiner e altere os

parâmetros de acordo com a necessidade (sobretudo o valor k, para adequar ao problema em
questão);

(d) Estude a Centroid Table, Folder View, e outras ferramentas de avaliação;

(e) Reporte todos os passos anteriores e as evidências encontradas, bem como de que forma o
que foi encontrado permite responder ao problema inicial.
[2] Experimente o mesmo dataset com diferentes operadores de k-Means como o Kernel ou Fast. Em que
medida diferem do modelo original. Estes operadores mudam os clusters originais? Se sim, em que
medida?

Você também pode gostar

Estruturação de Um Ambiente de Business Intelligence (BI) para Gestão Da Informação em Saúde A Experiência Da Secretaria Municipal de Saúde de Belo Horizonte
Documento6 páginas
Estruturação de Um Ambiente de Business Intelligence (BI) para Gestão Da Informação em Saúde A Experiência Da Secretaria Municipal de Saúde de Belo Horizonte
Secretaria Saúde Uruçuca
Ainda não há avaliações
2014 - 2sem - Ricardo Aparecido Junior Theodoro
Documento75 páginas
2014 - 2sem - Ricardo Aparecido Junior Theodoro
Décio Gedeão
Ainda não há avaliações
Fluxo Do Mes
Documento6 páginas
Fluxo Do Mes
Jardel Sampaio
Ainda não há avaliações
A Revolução Do Branding - Ana Couto
Documento175 páginas
A Revolução Do Branding - Ana Couto
Katleen Mara
Ainda não há avaliações
835-Texto Do Artigo-3609-1-10-20230612
Documento35 páginas
835-Texto Do Artigo-3609-1-10-20230612
HUAYNZE
Ainda não há avaliações
Nomenclatura CPU AMD IntroduçãoJoao
Documento4 páginas
Nomenclatura CPU AMD IntroduçãoJoao
joao oliveira
Ainda não há avaliações
Request
Documento4 páginas
Request
Eduardo Atene Silva
Ainda não há avaliações
Ensaios Com o Umectante DS 95
Documento4 páginas
Ensaios Com o Umectante DS 95
Célio Augusto Valenga
Ainda não há avaliações
Integração de Ferramentas para Gestão de Projetos
Documento81 páginas
Integração de Ferramentas para Gestão de Projetos
pedrorrn182hc
Ainda não há avaliações
Toshiba Satellite L650-11F - Dynabook
Documento3 páginas
Toshiba Satellite L650-11F - Dynabook
goldenspitfire
100% (1)
PSN No HD Externo
Documento5 páginas
PSN No HD Externo
Douglas Rubens
Ainda não há avaliações
Alocação de Memória
Documento5 páginas
Alocação de Memória
Antonio Yves Sousa
Ainda não há avaliações
NF e Msonhador 3
Documento1 página
NF e Msonhador 3
Antonio Moura
Ainda não há avaliações
Secadora Se10
Documento17 páginas
Secadora Se10
Ismael Viana
Ainda não há avaliações
Introdução À Cibersegurança
Documento203 páginas
Introdução À Cibersegurança
Diego santos
Ainda não há avaliações
Tutorial - Software Market Up - 2
Documento15 páginas
Tutorial - Software Market Up - 2
Alexandre Vecchietti
Ainda não há avaliações
Atividade Contextualizada - Fundamentos de Topografia
Documento3 páginas
Atividade Contextualizada - Fundamentos de Topografia
Junior Santos
Ainda não há avaliações
Planilha Despesas Fixas e Variaveis
Documento24 páginas
Planilha Despesas Fixas e Variaveis
Jocirlei
Ainda não há avaliações
Conceitos de Automação Industrial
Documento14 páginas
Conceitos de Automação Industrial
Sérgio fabiao pita Mbofana
Ainda não há avaliações
TABELA DE REGISTROS Do Smart CONTROL D Protocolo de Comunicação MODBUS-RTU
Documento11 páginas
TABELA DE REGISTROS Do Smart CONTROL D Protocolo de Comunicação MODBUS-RTU
ISSO Tecnologia
Ainda não há avaliações
HAC-015 HAC-016 Manual Box
Documento1 página
HAC-015 HAC-016 Manual Box
Luiz Antonio Motta
Ainda não há avaliações
História e Evolução Dos Computadores
Documento9 páginas
História e Evolução Dos Computadores
Arly maluleque Maluleque
Ainda não há avaliações
Questão 01 - Lista de Exercísio Com Vetores
Documento11 páginas
Questão 01 - Lista de Exercísio Com Vetores
Andreza Ávilla
Ainda não há avaliações
Questoes Prova 3
Documento25 páginas
Questoes Prova 3
romirreis
Ainda não há avaliações
SW Documentação Nelogica Julho 2020
Documento353 páginas
SW Documentação Nelogica Julho 2020
Rodrigo Vergara
Ainda não há avaliações
Apostila ABAP Data Interface
Documento70 páginas
Apostila ABAP Data Interface
Leandro Faria
Ainda não há avaliações
Celesc Relaçao Materiais
Documento70 páginas
Celesc Relaçao Materiais
Roger Gevaerd
Ainda não há avaliações
Gerador Viana
Documento1 página
Gerador Viana
Amperdidata Treinamentos
Ainda não há avaliações
Manual de Instrução
Documento90 páginas
Manual de Instrução
Cleyson Ramos
Ainda não há avaliações
2 Ciencia Da Computação Estácio
Documento12 páginas
2 Ciencia Da Computação Estácio
Smab Smab
Ainda não há avaliações