Você está na página 1de 5

A descoberta de conhecimento em

base de dados (KDD)


1. O processo de descoberta de conhecimento em base de dados (KDD) vem sendo
utilizado em diversos ramos do conhecimento, devido à sua eficácia.
Qual alternativa mostra a sequência correta de todas as etapas do processo KDD?

Resposta incorreta.
A. Entender o problema e selecionar os dados, transformação dos dados, pré-
processamento dos dados, mineração dos dados e interpretação dos resultados para
produzir conhecimento.

Você acertou!
B. Entender o problema e selecionar os dados, pré-processamento dos dados,
transformação dos dados, mineração dos dados e interpretação dos resultados para
produzir conhecimento.

As etapas do processo KDD são:


1 - Entender o problema como um todo, para determinar quais variáveis são importantes
e selecionar os dados.
2 - Pré-processamento dos dados.
3 - Transformação dos dados.
4 - Mineração dos dados.
5 - Interpretação dos resultados para produzir conhecimento.

Antes de transformar os dados para o formato adequado em relação ao método a ser


utilizado na etapa de mineração de dados, é necessário realizar o pré-processamento dos
dados. A etapa de mineração dos dados ocorre após a transformação. A etapa de
interpretação dos resultados para extrair conhecimento deve ser feita após a mineração
dos dados.

Resposta incorreta.
C. Entender o problema e selecionar os dados, pré-processamento dos dados, mineração
dos dados, transformação dos dados e interpretação dos resultados para produzir
conhecimento.

Resposta incorreta.
D. Entender o problema e selecionar os dados, pré-processamento dos dados,
interpretação dos resultados para produzir conhecimento, transformação dos dados e
mineração dos dados.

Resposta incorreta.
E. Entender o problema e selecionar os dados, transformação dos dados, mineração dos
dados, pré-processamento dos dados e interpretação dos resultados para produzir
conhecimento.
2. O uso do processo KDD vem se intensificando nos últimos anos e o termo mineração
de dados se tornou muito comum. Apesar disso, ainda existem pessoas que expressam
de forma errada a correlação entre KDD e mineração de dados.
Qual é a explicação correta sobre a correlação entre KDD e mineração de dados?

Resposta incorreta.
A. São iguais. Ambos têm como objetivo fazer o pré-processamento dos dados.

Resposta incorreta.
B. O KDD é apenas uma etapa do processo de extração de conhecimento da base de
dados e a mineração de dados representa todas as etapas.

Resposta incorreta.
C. O KDD é utilizado para processar os dados, e a mineração de dados é responsável
por interpretar os resultados do KDD.

Você acertou!
D. A mineração de dados é uma etapa do processo KDD e é utilizada para aplicar
métodos capazes de extrair padrões a partir dos dados pré-processados.

O correto é dizer que a mineração de dados é uma etapa do processo KDD e é utilizada
para aplicar métodos capazes de extrair padrões a partir dos dados pré-processados. A
mineração de dados e o KDD, além de serem distintos, não são apenas para fazer pré-
processamento dos dados; o KDD representa todas as etapas necessárias para extrair
conhecimento da base de dados e a mineração é apenas uma etapa do KDD, responsável
por aplicar métodos capazes de extrair padrões a partir dos dados pré-processados.

Resposta incorreta.
E. A mineração de dados é uma etapa do processo KDD e é utilizada na etapa de pré-
processamento dos dados.

3. Em um estudo para extrair informações a partir de uma base de dados com múltiplas
variáveis, os cientistas de dados planejaram utilizar um método durante a mineração dos
dados para fazer agrupamentos das variáveis.
Assinale a alternativa que representa o método mais adequado para atingir o objetivo
estabelecido.

Resposta correta.
A. Fuzzy k-médias.

Entre as opções, o método mais adequado para agrupamento é o fuzzy k-médias.


Árvores de decisão é um método indicado para classificação, regressão linear é indicada
para estimação, rede de causalidade expressa associação de causa e efeito entre as
variáveis e diagrama de dispersão fornece uma análise descritiva dos dados.

Resposta incorreta.
B. Árvores de decisão.

Resposta incorreta.
C. Regressão linear.

Você não acertou!


D. Rede de causalidade.

Resposta incorreta.
E. Diagrama de dispersão.

4. O processo KDD pode ser organizado por etapas. Entre elas, tem-se a etapa de pré-
processamento dos dados.
Assinale a alternativa que representa a descrição correta da função da etapa de pré-
processamento.

Resposta incorreta.
A. A etapa de pré-processamento utiliza ferramentas que não são sofisticadas e tem
como objetivo quantificar, explorar e descrever características intrínsecas aos dados.

Resposta incorreta.
B. A etapa de pré-processamento é responsável por transformar os dados em um
formato adequado ao exigido pela metodologia empregada na mineração dos dados.

Você acertou!
C. O pré-processamento visa preparar os dados para uma análise eficiente e eficaz,
eliminando ruídos e dados inconsistentes (limpeza dos dados) e preenchendo valores
faltantes.

O pré-processamento visa preparar os dados para uma análise eficiente e eficaz,


eliminando ruídos e dados inconsistentes (limpeza dos dados) e preenchendo valores
faltantes. O pré-processamento não é responsável por quantificar, explorar, descrever
características intrínsecas aos dados, transformar os dados, agrupar as variáveis da base
de dados e tão pouco obter medidas de posição e dispersão.

Resposta incorreta.
D. O pré-processamento dos dados é responsável por aplicar técnicas de agrupamento
para organizar as variáveis em grupos, para uso na etapa de mineração dos dados.

Resposta incorreta.
E. O pré-processamento dos dados é responsável por obter medidas de posição e
dispersão para começar a gerar conhecimentos úteis a partir da base de dados.

5. Uma empresa do setor de energia elétrica conta com fontes renováveis e não
renováveis. O interesse da empresa é otimizar a produção em função do tipo de fonte,
para reduzir a poluição ambiental. Uma das fontes renováveis é a energia eólica. Prever
a quantidade de energia que vai ser gerada pela fonte eólica permite planejar o quanto
será necessário usar das fontes não renováveis para suprir a demanda dos consumidores.
Assinale a alternativa que descreve a tarefa e os métodos indicados para atingir o
objetivo da empresa.

Você não acertou!


A. A tarefa mais adequada é a associação. Os métodos indicados são: informação
mútua, correlação e partial directed coherence (PDC).

Resposta correta.
B. A tarefa mais adequada é a estimação. Os métodos indicados são: regressão linear,
regressão polinomial e redes neurais.

A tarefa mais adequada para fazer a previsão de geração de energia é a de estimação,


que tem como objetivo inferir o valor de um ou mais atributos de uma variável
utilizando seu histórico de dados. A regressão linear, regressão polinomial e redes
neurais são métodos de estimação amplamente utilizados para previsão de dados. A
tarefa de associação é indicada quando o objetivo é descobrir e mensurar a interação
entre as variáveis de um processo. A tarefa de classificação é utilizada quando o
objetivo consiste em detectar padrões a partir dos dados que permitem classificar um
objeto como pertencente a uma classe conhecida a priori. A análise descritiva dos dados
permite investigar a distribuição de frequência dos dados e também avaliar medidas de
posição e dispersão, sendo indicada para a etapa inicial do processo de mineração dos
dados. A tarefa de agrupamento é indicada quando o objetivo é agrupar um conjunto de
variáveis em grupos de variáveis similares, ou seja, utilizando apenas os dados de
entrada, agrupando os objetos com padrões semelhantes sem nenhum tipo de
conhecimento a priori.

Resposta incorreta.
C. A tarefa mais adequada é a classificação. Os métodos indicados são: classificador K-
NN, árvores de decisão e classificador Naive Bayes.

Resposta incorreta.
D. A tarefa mais adequada é a análise descritiva dos dados. Os métodos indicados são:
diagrama de dispersão, medidas de tendência central e posição e medidas de
variabilidade.

Resposta incorreta.
E. A tarefa mais adequada é o agrupamento. Os métodos indicados são: algoritmo k-
médias (k-means), fuzzy k-médias e árvore geradora mínima.

Você também pode gostar