Escolar Documentos
Profissional Documentos
Cultura Documentos
FGV SEFAZ-AM
Com relação ao algoritmo de K-Means, analise as afirmativas a seguir e assinale (V) para
a verdadeira e (F) para a falsa.
( ) Consiste em fixar k centroides de modo quadrático, sendo um para cada novo
cluster.
( ) Associa cada indivíduo ao centroide do seu vizinho, obtido pelo cálculo da
minimização da soma quadrática das distâncias entre os dados e os centroides mais
próximos.
( ) Recalcula os centroides com base nos indivíduos classificados.
A Apriori.
B C4.5
C K-mean.
D Naive Bayes.
E PageRank.
3. CESPE PREF. DE ARACAJÚ - SE
O enriquecimento de dados da etapa de pré-processamento e preparação do data
mining tem como objetivo
A a de duplicidade de registros.
B a seleção de amostras.
C a integração de bases diferentes.
D o tratamento de valores nulos.
E o acréscimo de dados à base já existente.
4. CESPE PREF. DE ARACAJÚ - SE
Em um projeto de data mining, a coleta do dado que será garimpado ocorre no processo
de
A mineração.
B preparação.
C aplicação.
D associação.
E classificação.
4. UFSC
Assinale a alternativa CORRETA sobre o processo de mineração de dados (data mining).
A Algoritmos de associação.
B Algoritmos de clusterização.
C Árvores de decisão.
D Modelagem de dados.
E Regressão linear.
7. CEBRASPE PCDF
A detecção de novos tipos de fraudes é uma das aplicações comuns da técnica de
modelagem descritiva da mineração de dados, a qual viabiliza o mapeamento rápido e
preciso de novos tipos de golpes por meio de modelos de classificação de padrões
predefinidos de fraudes.
8. CEBRASPE SERPRO
Nos agrupamentos hierárquicos, um dendrograma é uma árvore que controla quando
os clusters são criados e que determina qual é a métrica das distâncias.
9. CEBRASPE APEX-BRASIL
Um data mining revela informações que consultas manuais não poderiam revelar
efetivamente. Por exemplo, em data mining, o algoritmo de classificação permite
Rafael resolveu trabalhar esses dados, e agrupar esses alunos de modo que cada um
ficasse no grupo mais adequado para a sua nota. Assim, poderia preparar atividades
específicas para cada grupo.
Assinale a opção que indica o algoritmo mais adequado para essa tarefa.
A Bubble sort.
B K-means.
C Monte Carlo.
D Linear regression.
E Logistic regression.
21. CESGRANRIO TRANSPETRO
Um desenvolvedor recebeu um conjunto de dados representando o perfil de um grupo
de clientes, sem nenhuma informação do tipo de cada cliente, onde cada um era
representado por um conjunto fixo de atributos, alguns contínuos, outros discretos.
Exemplos desses atributos são: idade, salário e estado civil. Foi pedido a esse
desenvolvedor que, segundo a similaridade entre os clientes, dividisse os clientes em
grupos, sendo que clientes parecidos deviam ficar no mesmo grupo. Não havia
nenhuma informação que pudesse ajudar a verificar se esses grupos estariam corretos
ou não nos dados disponíveis para o desenvolvedor.
Esse é um problema de data mining conhecido, cuja solução mais adequada é um
algoritmo
A de regressão
B não supervisionado
C por reforço
D semissupervisionado
E supervisionado
22. CESGRANRIO PETROBRAS
Dois funcionários de uma empresa de crédito discutiam sobre quais algoritmos
deveriam usar para ajudar a classificar seus clientes como bons ou maus pagadores. A
empresa possui, para todos os empréstimos feitos no passado, um registro formado
pelo conjunto de informações pessoais sobre o cliente e de como era composta a dívida
inicial. Todos esses registros tinham classificações de bons ou maus pagadores, de
acordo com o perfil de pagamento dos clientes. A partir desses dados, os funcionários
querem construir um modelo, por meio de aprendizado de máquina, que classifique os
novos clientes, que serão descritos por registros com o mesmo formato.
A melhor opção, nesse caso, é usar um algoritmo