Você está na página 1de 53

____________________________________

1
____________________________________

Data Mining

Questões Comentadas
1- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da
Informação - Ciência de Dados) Julgue o item a seguir, relativos a conceitos de
modelagem dimensional.
Em um processo de modelagem dimensional, a operação de merge/pruge agrega
informações das dimensões para diminuir a tabela de fatos.
Resolução:
A operação merge/purge é um processo que envolve a agregação de vários conjuntos de
dados, seguida da eliminação de duplicados. Contudo, esse processo é realizado no processo
de ETL, isto é, antes de os dados serem carregados para o ambiente multidimensional.
Portanto, a agregação não ocorre nas informações presentes nas tabelas de fatos ou de
dimensões, mas sim antes de os dados serem carregados para o ambiente multidimensional.
Gabarito: Errado.

2- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Acerca de conceitos, premissas e aplicações de big data,
julgue o item subsequente.
O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para
serem analisados sem erros de incompletudes, inconsistências e ruídos.
Resolução:
Os dados disponíveis nas bases de dados existentes são altamente suscetíveis a ruídos,
perdas e inconsistências devido ao grande tamanho dessas bases e suas origens de múltiplas
fontes heterogêneas. Se forem utilizados dados de baixa qualidade, os resultados da
mineração serão de baixa qualidade e, portanto, estes dados precisam ser preparados ou pré-
processados. As técnicas de pré-processamento buscam melhorar a qualidade dos
dados e, consequentemente, da eficiência e resultados da mineração.
Gabarito: Certo.

2
____________________________________

3- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
A análise de regressão em mineração de dados tem como objetivos a sumariação, a predição,
o controle e a estimação.
Resolução:
A regressão é uma aplicação especial da regra de classificação, que ocorre quando esta regra
de classificação é uma função sobre as variáveis mapeando essas variáveis em uma variável
de classe de destino. Ex.: identificar a probabilidade de um paciente sobreviver com base
em variáveis como grau de infecção ou idade.
Gabarito: Certo.

4- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers, que são
objetos completamente diferentes do padrão da amostra.
Resolução:
Os outliers são dados que não apresentam o mesmo comportamento padrão da maioria. Ex.:
identificação de pessoa com renda muito superior aos perfis de renda em determinada
organização.
O aprendizado de Máquina (ou machine learning) é um método de análise de dados que
automatiza o desenvolvimento de modelos analíticos. Usando algoritmos que aprendem
interativamente a partir de dados, o aprendizado de máquinas permite que os computadores
encontrem insights ocultos sem serem explicitamente programados para procurar algo
específico.
Outliers podem sim ser identificados com o auxílio de aprendizado de máquina.
Gabarito: Certo.

5- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
A técnica de agregação na mineração de dados atua em conjunto de registros que tenham
sido previamente classificados.
Resolução:
Atenção para não confundir agregação com classificação. A técnica que utiliza classes
previamente definidas é a classificação e não a agregação (agrupamentos ou clusterização).
Gabarito: Errado.

3
____________________________________

6- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
A etapa de modelagem do modelo CRISP-DM permite a aplicação de diversas técnicas de
mineração sobre os dados selecionados, conforme os formatos dos próprios dados.
Resolução:
Na etapa de construção do modelo (ou modelagem), várias técnicas de modelagem são
selecionadas e aplicadas em um conjunto de dados já preparado para atender às necessidades
específicas do negócio. Dependendo da necessidade do negócio, a tarefa de mineração de
dados pode ser de uma predição (classificação ou regressão), uma associação ou uma
clusterização, cada uma podendo usar uma variedade de métodos ou algoritmos. Esta etapa
também abrange a avaliação e análise comparativa dos vários modelos construídos, pois
como não existe um melhor método ou algoritmo universalmente conhecido para uma
tarefa de mineração de dados, deve-se usar uma variedade de tipos de modelos viáveis,
juntamente com uma experimentação bem definida e estratégia de avaliação para identificar
o "melhor" método para um determinado propósito. Mesmo para um único método ou
algoritmo, é necessário calibrar uma série de parâmetros para obter melhores resultados.
Alguns métodos podem ter requisitos específicos na forma como os dados devem ser
formatados.
Gabarito: Certo.

7- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Mecanismos de busca utilizam mineração de textos para apresentar ao usuário os resultados
de suas pesquisas, de modo que ambos os conceitos se equivalem.
Resolução:
Mecanismo de busca difere de mineração de texto.
A mineração de texto (também conhecida como mineração de dados de texto ou descoberta
de conhecimento em bancos de dados textuais) é o processo semiautomático de extração de
padrões (informações úteis e conhecimento) de grandes quantidades de fontes de dados não
estruturadas.
Um mecanismo de busca é um programa desenhado para procurar palavras-chave
fornecidas pelo utilizador em documentos e bases de dados. Atualmente existem inúmeros
sites de busca na Internet. Os mais utilizados são Google, Bing e o Yahoo. Na verdade, 99%
das pessoas que fazem uma busca na Internet, usam o Google.
Gabarito: Errado.

4
____________________________________

8- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
O objetivo da técnica de sequência de tempo é identificar a ocorrência de dois eventos
diferentes no mesmo momento.
Resolução:
Com o uso de padrões sequenciais (sequência de tempo), uma sequência de ações ou
eventos é buscada. A detecção de padrões sequenciais é equivalente à detecção de
associações entre eventos com certos relacionamentos temporais. Ex.: se um paciente fuma
excessivamente, provavelmente sofrerá com problemas pulmonares. Os eventos ocorrem
em momentos diferentes (e sequenciais) e não no mesmo momento
Gabarito: Errado.

9- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão
analisados, por meio da aplicação de filtros e de eliminadores de palavras.
Resolução:
Os dados disponíveis nas bases de dados existentes são altamente suscetíveis a ruídos,
perdas e inconsistências devido ao grande tamanho dessas bases e suas origens de múltiplas
fontes heterogêneas. Se forem utilizados dados de baixa qualidade, os resultados da
mineração serão de baixa qualidade e, portanto, estes dados precisam ser preparados ou pré-
processados. As técnicas de pré-processamento buscam melhorar a qualidade dos dados e,
consequentemente, da eficiência e resultados da mineração.
Dentre as tarefas de pré-processamento figura a limpeza dos dados, em que há a correção
dos dados, por exemplo, por meio da eliminação de redundâncias ou correção de códigos
inválidos.
Gabarito: Certo.

10- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data. A
mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que
os textos representam um tipo específico de dado.
Resolução:
A mineração de texto é semelhante a mineração de dados, na medida em que tem o mesmo
propósito e usa os mesmos processos; mas com a mineração de texto, a entrada para o
processo é uma coleção de arquivos de dados não estruturados ou semiestruturados, como
documentos do Word, arquivos PDF, trechos de texto, arquivos XML e assim por diante.
Gabarito: Errado.

5
____________________________________

11- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Estratificação é a abordagem da técnica de árvore de decisão que determina as regras para
direcionar cada caso a uma categoria já existente.
Resolução:
As árvores de decisão classificam os dados em um número finito de classes com base nos
valores das variáveis de entrada. As árvores de decisão são essencialmente uma hierarquia
de declarações se-então e, portanto, são significativamente mais rápidas do que as redes
neurais. Elas são mais apropriadas para dados categorizados e intervalos de dados.
Portanto, incorporar variáveis contínuas em uma estrutura de árvore de decisão requer
discretização; ou seja, converter variáveis numéricas de valor contínuo em intervalos e
categorias.
Estratificar significa separar em níveis. Logo, a árvore de decisão auxilia nesse processo,
separando as classes com base nos valores de entrada.
Gabarito: Certo.

12- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Na etapa de mineração do data mining, ocorre a seleção dos conjuntos de dados que serão
utilizados no processo de mining.
Resolução:
Que confusão hein? rsrsrs.Mineração de dados é a tradução de data mining, logo não é uma
etapa do processo.
O examinador deve ter tido o objetivo de tratar da etapa de entendimento dos dados do
modelo CRISP-DM.
Gabarito: Errado.

13- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Modelagem preditiva é utilizada para antecipar comportamentos futuros, por meio do
estudo da relação entre duas ou mais variáveis.
Resolução:
A predição busca descrever a natureza de ocorrências futuras de certos eventos com base
nos acontecimentos passados. Difere da adivinhação, pois leva em consideração as

6
____________________________________

experiências, opiniões e outras informações relevantes na condução da previsão.


Dependendo da natureza da predição, podemos falar em classificação ou regressão.
Gabarito: Certo.

14- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Na análise hierárquica de agrupamentos, é possível realocar um elemento que tenha sido
alocado incorretamente no início do processo.
Resolução:
A análise de agrupamentos pode ser realizada com métodos hierárquicos ou não-
hierárquicos.
Os métodos hierárquicos da análise de cluster tem como principal característica um
algoritmo capaz de fornecer mais de um tipo de partição dos dados. Ele gera vários
agrupamentos possíveis, onde um cluster pode ser mesclado a outro em determinado passo
do algoritmo. Esses métodos não exigem que já se tenha um número inicial de clusters e
são considerados inflexíveis uma vez que não se pode trocar um elemento de grupo.
Os métodos não-hierárquicos da análise de cluster são caracterizados pela necessidade de
definir uma partição inicial e pela flexibilidade, uma vez que os elementos podem ser
trocados de grupo durante a execução do algoritmo.
Gabarito: Errado.

15- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
A técnica de associação é utilizada para indicar um grau de afinidade entre registros de
eventos diferentes, para permitir o processo de data mining.
Resolução:
As regras de associação visam descobrir relacionamentos entre variáveis em grandes
bancos de dados. Dito de outro modo, as regras de associação correlacionam a presença de
um item com uma faixa de valores para um conjunto de variáveis diverso.
Gabarito: Certo.

16- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Acerca de visualização e análise exploratória de dados,
julgue o item seguinte.
Outlier ou anomalias são padrões nos dados que não estão de acordo com uma noção bem
definida de comportamento normal.

7
____________________________________

Resolução:
Os outliers são dados que não apresentam o mesmo comportamento padrão da maioria. Ex.:
identificação de pessoa com renda muito superior aos perfis de renda em determinada
organização.
Gabarito: Certo.

17- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
No modelo CRISP-DM, a fase na qual se planejam todas as atividades para carga dos dados
é denominada entendimento dos dados.
Resolução:
O planejamento das atividades é realizado na fase de entendimento de negócio.
A fase de entendimento dos dados visa identificar os dados relevantes das diferentes fontes
de dados. A fase de entendimento dos dados começa com uma coleta inicial de dados e
prossegue com atividades para se familiarizar com os dados, identificar problemas de
qualidade de dados, descobrir novos insights sobre os dados ou detectar subconjuntos
interessantes para formar hipóteses para informações ocultas. O analista deve ser claro e
conciso sobre a descrição da tarefa de mineração de dados para que os dados mais relevantes
possam ser identificados e deve construir uma compreensão adequada das fontes de dados
e das variáveis existentes.
Gabarito: Errado.

18- (CESPE - 2019 - TCE-RO - Auditor de Controle Externo - Administração) Série


temporal consiste em
a) estrutura de dados qualitativos medidos negativamente por padrão.
b) estrutura de dados que podem ser medidos sem métrica definida.
c) estrutura de dados que rastreiam mudanças nos valores de uma métrica ao longo do
tempo.
d) estrutura em que os dados podem ser marcados como verdadeiros ou falsos por padrão.
e) estrutura de dados numéricos que têm um número infinito de valores possíveis.
Resolução:
Com o uso de padrões dentro de série temporal, as similaridades entre os dados podem
ser detectadas dentro de posições de uma série temporal, que é uma sequência de dados
tomados em intervalos regulares. Ex.: os casacos de frio são mais baratos no verão e mais
caros no inverno.
Gabarito: Letra C.

8
____________________________________

19- (CESPE / CEBRASPE - 2019 - TJ-AM - Assistente Judiciário - Suporte ao


Usuário de Informática) A respeito de data warehouse e data mining, julgue o item que
se segue.
A técnica machine learning pode ser utilizada para apoiar um processo de data mining.
Resolução:
As tarefas e técnicas de mineração de dados estão bem relacionadas com o aprendizado de
máquina, pois a mineração de dados descobre padrões e conhecimento previamente
desconhecidos e o aprendizado de máquina usa esses padrões e conhecimentos
adquiridos, aplicando isso a outros dados, e, em seguida, aplicando automaticamente esses
resultados à tomada de decisões e ações.
Gabarito: Certo.

20- (CESPE / CEBRASPE - 2019 - TJ-AM - Analista Judiciário - Analista de


Sistemas) A respeito de bancos de dados relacionais, julgue o item a seguir.
Em sistemas de suporte à decisão, uma das abordagens da árvore de decisão é a predição,
em que são criadas regras com base em eventos já ocorridos para aplicação em eventos
futuros similares.
Resolução:
A predição é usada para descrever a natureza de ocorrências futuras de certos eventos
com base nos acontecimentos passados. Dentre os algoritmos que podem ser usados na
predição temos a árvore de decisão e as redes neurais, além de muitos outros métodos.
Gabarito: Certo.

21- (CESPE - 2018 – EBSERH) Julgue o item que se segue, a respeito de arquitetura e
tecnologias de sistemas de informação.
A descoberta de novas regras e padrões em conjuntos de dados fornecidos, ou aquisição de
conhecimento indutivo, é um dos objetivos de data mining.
Resolução:
Assertiva de acordo com o conceito de data mining. A mineração de dados (data mining)
refere-se à mineração ou descoberta de novas informações em termos de padrões ou
regras com base em grandes quantidades de dados.
Gabarito: Certo.

9
____________________________________

22- (CESPE - 2018 - Polícia Federal - Agente de Polícia Federal) Julgue o item que
segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.
Situação hipotética: Na ação de obtenção de informações por meio de aprendizado de
máquina, verificou-se que o processo que estava sendo realizado consistia em examinar as
características de determinado objeto e atribuir-lhe uma ou mais classes; verificou-se
também que os algoritmos utilizados eram embasados em algoritmos de aprendizagem
supervisionados.
Assertiva: Nessa situação, a ação em realização está relacionada ao processo de
classificação.
Resolução:
A aprendizagem supervisionada ou indução supervisionada está relacionada à
classificação, pois neste processo, as classes são definidas de forma prévia, antes de ser
realizada a análise dos dados.
Gabarito: Certo.

23- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Julgue o item a


seguir, a respeito de data mining e OLAP.
No data mining, uma regra de associação relaciona a presença de um conjunto de itens com
outra faixa de valores de um outro conjunto de variáveis.
Resolução:
As regras de associação são uma técnica popular para descobrir relacionamentos
interessantes entre variáveis em grandes bancos de dados. Graças a tecnologias
automatizadas de coleta de dados, o uso de regras de associação para descobrir os
relacionamentos entre os produtos em transações de larga escala registradas nos sistemas
de ponto de venda nos supermercados tornou-se uma tarefa comum de descoberta de
conhecimento no ramo varejista, em que é chamada de análise de cesta de mercado.
Gabarito: Certo.

24- (CESPE - 2018 - TCE-MG - Analista de Controle Externo - Ciência da


Computação) Na técnica de árvore de decisão em data mining, é empregada a abordagem
denominada
a) análise de volumetria.
b) combinação de variáveis.
c) estratificação.
d) avaliação de dados.
e) percepção.

10
____________________________________

Resolução:
As árvores de decisão classificam os dados em um número finito de classes com base
nos valores das variáveis de entrada. As árvores de decisão são essencialmente uma
hierarquia de declarações se-então e, portanto, são significativamente mais rápidas do que
as redes neurais. Elas são mais apropriadas para dados categorizados e intervalos de dados.
Portanto, incorporar variáveis contínuas em uma estrutura de árvore de decisão requer
discretização; ou seja, converter variáveis numéricas de valor contínuo em intervalos e
categorias.
Estratificar significa separar em níveis. Logo, a árvore de decisão auxilia nesse processo,
separando as classes com base nos valores de entrada.
Gabarito: Letra C.

25- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Conhecimentos


Básicos - Todas as Áreas) Acerca de banco de dados, julgue o seguinte item.
A mineração de dados se caracteriza especialmente pela busca de informações em grandes
volumes de dados, tanto estruturados quanto não estruturados, alicerçados no conceito dos
4V’s: volume de mineração, variedade de algoritmos, velocidade de aprendizado e
veracidade dos padrões.
Resolução:
A questão está relacionada a Big Data e não a Mineração de Dados.
O Big Data foi inicialmente conceituado com base em três premissas básicas, também
conhecidas como 3Vs: volume, velocidade e variedade. Além dessas premissas precursoras
do conceito de Big Data, outras premissas (ou Vs) complementam o conceito e têm sido
discutidas quando se trata do tema.
Gabarito: Errado.

26- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Conhecimentos


Básicos - Todas as Áreas) Acerca de banco de dados, julgue o seguinte item.
Descobrir conexões escondidas e prever tendências futuras é um dos objetivos da mineração
de dados, que utiliza a estatística, a inteligência artificial e os algoritmos de aprendizagem
de máquina.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados. Dito de outro modo, o termo mineração de dados foi originalmente usado para
descrever o processo pelo qual os padrões anteriormente desconhecidos em dados são
descobertos.
Tecnicamente falando, a mineração de dados é um processo que utiliza técnicas de
estatística, matemática e inteligência artificial para extrair e identificar

11
____________________________________

informações úteis e subsequentes conhecimentos (ou padrões) em grandes conjuntos de


dados.
Em outro conceito, a mineração de dados é entendida como o processo não trivial de
identificar padrões válidos, novos, potencialmente úteis e, em última
instância, compreensíveis em dados armazenados em bancos de dados estruturados.
Gabarito: Certo.

27- (CESPE - 2018 - Polícia Federal - Agente de Polícia Federal) Julgue o item que
segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.
Pode-se definir mineração de dados como o processo de identificar, em dados, padrões
válidos, novos, potencialmente úteis e, ao final, compreensíveis.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados. Dito de outro modo, o termo mineração de dados foi originalmente usado para
descrever o processo pelo qual os padrões anteriormente desconhecidos em dados são
descobertos.
Tecnicamente falando, a mineração de dados é um processo que utiliza técnicas de
estatística, matemática e inteligência artificial para extrair e identificar
informações úteis e subsequentes conhecimentos (ou padrões) em grandes conjuntos de
dados.
Em outro conceito, a mineração de dados é entendida como o processo não trivial de
identificar padrões válidos, novos, potencialmente úteis e, em última
instância, compreensíveis em dados armazenados em bancos de dados estruturados.
Gabarito: Certo.

28- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue o item que se segue, a respeito
de tecnologias de sistemas de informação.
Na busca de padrões no data mining, é comum a utilização do aprendizado não
supervisionado, em que um agente externo apresenta ao algoritmo alguns conjuntos de
padrões de entrada e seus correspondentes padrões de saída, comparando-se a resposta
fornecida pelo algoritmo com a resposta esperada.
Resolução:
A questão descreve a aprendizagem supervisionada.
A classificação é o processo de aprender um modelo que descreve diferentes classes
de dados. As classes são predefinidas e, portanto, esse tipo de atividade é também
chamado de aprendizado supervisionado.

12
____________________________________

Já na clusterização, o objetivo é classificar casos (por exemplo, pessoas, coisas, eventos)


em grupos ou clusters, de modo que o grau de associação seja forte entre os membros
do mesmo cluster e fraco entre os membros de diferentes clusters. Contudo, as classes
não são previamente definidas, logo falamos em aprendizado não supervisionado.
Gabarito: Errado.

29- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) Assinale a


opção correta a respeito do CRISP-DM.
a) CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da
indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias
para a realização de um projeto de mineração de dados.
b) A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados.
c) Durante a fase de preparação dos dados, é realizado um inventário de requisitos,
suposições e restrições de recursos.
d) Na fase de avaliação dos dados, são realizadas as atividades de identificar valores especiais
dos dados e catalogar seu significado.
e) Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de
implantação de cada resultado e estimar o potencial de melhoria do processo atual.
Resolução:
Vamos analisar cada um dos itens:
a) Incorreto: O modelo de referência CRISP-DM é provavelmente o mais popular e foi
proposto por um consórcio de empresas europeu para servir como metodologia padrão
não proprietária para a mineração de dados.
b) Correto: A fase de entendimento dos dados começa com uma coleta inicial de dados
e prossegue com atividades para se familiarizar com os dados, identificar problemas de
qualidade de dados, descobrir novos insights sobre os dados ou detectar subconjuntos
interessantes para formar hipóteses para informações ocultas.
c) Incorreto: Durante a fase de preparação dos dados entendimento do negócio, é
realizado um inventário de requisitos, suposições e restrições de recursos.
d) Incorreto: Na fase de avaliação dos dados modelagem, são realizadas as atividades de
identificar valores especiais dos dados e catalogar seu significado.
e) Incorreto: Na fase de preparação dos dados teste e avaliação, são realizadas as
atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de
melhoria do processo atual.
Gabarito: Letra B.

13
____________________________________

30- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) A respeito


das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.
a) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam
coocorrência.
b) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os
valores associados aos dados em um ou mais valores reais.
c) A regressão ou predição promove o aprendizado de uma função que pode ser usada para
mapear dados em uma de várias classes discretas definidas previamente, bem como
encontrar tendências que possam ser usadas para entender e explorar padrões de
comportamento dos dados.
d) As regras de associação identificam grupos de dados, em que os dados têm características
semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.
e) Os métodos de classificação supervisionada podem ser embasados em separabilidade
(entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM
(support vector machines).
Resolução:
Vamos analisar cada um dos itens:
a) Incorreto: O agrupamento (ou clustering) As regras de associação realizam
identificação de grupos de dados que apresentam coocorrência.
b) Incorreto: A classificação regressão realiza o aprendizado de uma função que pode ser
usada para mapear os valores associados aos dados em um ou mais valores reais.
c) Incorreto: A regressão ou predição classificação promove o aprendizado de uma função
que pode ser usada para mapear dados em uma de várias classes discretas definidas
previamente, bem como encontrar tendências que possam ser usadas para entender e
explorar padrões de comportamento dos dados.
d) Incorreto: As regras de associação A clusterização identificam grupos de dados, em que
os dados têm características semelhantes aos do mesmo grupo e os grupos têm
características diferentes entre si.
e) Correto: Os métodos de classificação supervisionada podem ser embasados em
separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento,
utilizando SVM (support vector machines).
Gabarito: Letra E.

31- (CESPE - 2018 - STJ - Técnico Judiciário - Desenvolvimento de Sistemas)


Julgue o item que se segue, acerca de data mining e data warehouse.
O processo de mineração de dados está intrinsecamente ligado às dimensões e a fato, tendo
em vista que, para a obtenção de padrões úteis e relevantes, é necessário que esse processo
seja executado dentro dos data warehouses.

14
____________________________________

Resolução:
É importante destacar que a mineração de dados pode ser utilizada junto com um data
warehouse para ajudar com certos tipos de decisões. Porém, não está restrita a um DW,
podendo ser aplicada também a bancos de dados operacionais com transações individuais.
Alguns recursos de mineração são fornecidos por SGBDs relacionais, mas de forma
limitada.
Gabarito: Errado.

32- (CESPE - 2017 - TCE-PE - Analista de Controle Externo - Auditoria de Contas


Públicas) Em relação à análise de agrupamentos (clusterização) em mineração de dados,
julgue o item seguinte.
O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada
observação pertence ao grupo mais próximo da média.
Resolução:
A análise de clusters pode ser baseada em métodos estatísticos como o k-means (media), k-
modes (moda), k-medoids (mediana), etc.
O K-means (k média) é o algoritmo que atribui cada ponto de dados (cliente, evento,
objeto, etc.) ao cluster cujo centro (também chamado centróide) é o mais próximo. O
centro é calculado como a média de todos os pontos no cluster; ou seja, suas
coordenadas são a média aritmética para cada dimensão separadamente em todos os pontos
do cluster.
Gabarito: Certo.

33- (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas


Públicas) Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard
Process of Data Mining).
Durante a fase de entendimento do negócio, busca-se descrever claramente o problema,
fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são
interdependentes.
Resolução:
Há um equívoco quanto a fase descrita no item. O item descreve a fase de entendimento
dos dados e não a de entendimento do negócio.
A fase de entendimento do negócio objetiva o entendimento das necessidades
gerenciais e das especificações de objetivos de negócio. Um plano de projeto para
busca de conhecimento é desenvolvido de modo a especificar as pessoas responsáveis por
coletar, analisar e reportar dados. Um orçamento de alto nível pode ser estabelecido.

15
____________________________________

Na fase de entendimento de dados, busca-se a identificação dos dados relevantes das


diferentes fontes de dados. O analista deve considerar a tarefa de data mining a ser
realizada e construir um conhecimento acerca das bases de dados e variáveis.
Gabarito: Errado.

34- (CESPE - 2017 - TRE-BA - Analista Judiciário – Análise de Sistemas) O


agrupamento de dados no processo de data mining procura, em uma massa de dados que
caracterizam uma população de indivíduos, grupos semelhantes e diferentes. O algoritmo
baseado na teoria dos grafos e que dispensa a definição de protótipos utilizado para
segmentar a base de dados em diferentes grupos é denominado
a) K média.
b) K medoides.
c) Apriori.
d) DBSCAN.
e) Árvore geradora mínima.
Resolução:
Questão que define árvore geradora mínima, portanto o Gabarito é letra E.
Vejamos os conceitos dos demais algoritmos:
a) K média (K-means): o algoritmo atribui cada ponto de dados (cliente, evento, objeto,
etc.) ao cluster cujo centro (também chamado centróide) é o mais próximo. O centro é
calculado como a média de todos os pontos no cluster; ou seja, suas coordenadas são a média
aritmética para cada dimensão separadamente em todos os pontos do cluster.
b) K medoides (K-medoids): o elemento que melhor representa o cluster, é definido
de acordo com seus atributos sem que haja muita influência dos valores próximos aos
limites do cluster.
c) Apriori: dado um conjunto de itens, o algoritmo tenta encontrar subconjuntos que são
comuns a, pelo menos, um número mínimo de conjuntos.
d) DBSCAN: dado um conjunto de pontos em algum espaço, agrupa pontos que estão
intimamente empacotados (pontos com muitos vizinhos próximos), marcando como pontos
atípicos que ficam sozinhos em regiões de baixa densidade (cujos vizinhos mais próximos
estão muito distantes).
Gabarito: Letra E.

16
____________________________________

35- (CESPE - 2017 - SEDF - Analista de Gestão Educacional - Tecnologia da


Informação) Com relação a data mining e data warehouse, julgue o item que se segue.
Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes
entre si e diferentes dos registros em outros grupos é uma maneira de descrever
conhecimento descoberto durante processos de mineração de dados.
Resolução:
Assertiva refere-se a tarefa ou técnica de clusterização ou agrupamento.
A análise de cluster é uma ferramenta de análise exploratória de dados para resolver
problemas de classificação. O objetivo é classificar casos (por exemplo, pessoas, coisas,
eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os
membros do mesmo cluster e fraco entre os membros de diferentes clusters.
Gabarito: Certo.

36- (CESPE - 2016 - FUNPRESP-JUD - Analista - Tecnologia da Informação)


Julgue o item subsecutivo, referente às tecnologias de bancos de dados.
Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para
atribuir informação de tipo.
Resolução:
As árvores de decisão classificam os dados em um número finito de classes com base
nos valores das variáveis de entrada.
As árvores de decisão são ferramentas que podem ser utilizadas para a classificação dos
dados. Ao percorrer a árvore, a classe ou tipo dos dados será definido. Por exemplo, um
conjunto de regras definido em uma árvore pode definir os tipos de clientes com base em
riscos de crédito por meio das classes “risco fraco”, “risco médio”, e “risco bom”.
Gabarito: Certo.

37- (CESPE - 2016 - TCE-PA - Auditor de Controle Externo - Área Informática -


Analista de Sistema) Julgue o item a seguir, em relação a data warehouse e data mining.
No contexto de data mining, o processo de descoberta de conhecimento em base de dados
consiste na extração não trivial de conhecimento previamente desconhecido e
potencialmente útil.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados. Pode ser entendida também como o processo não trivial de identificar padrões
válidos, novos, potencialmente úteis e, em última instância, compreensíveis em dados
armazenados em bancos de dados estruturados.
Gabarito: Certo.

17
____________________________________

38- (CESPE - 2016 - TRT - 8ª Região (PA e AP) - Analista Judiciário - Tecnologia
da Informação) Acerca de data mining, assinale a opção correta.
a) A fase de preparação para implementação de um projeto de data mining consiste, entre
outras tarefas, em coletar os dados que serão garimpados, que devem estar exclusivamente
em um data warehouse interno da empresa.
b) As redes neurais são um recurso matemático/computacional usado na aplicação de
técnicas estatísticas nos processos de data mining e consistem em utilizar uma massa de
dados para criar e organizar regras de classificação e decisão em formato de diagrama de
árvore, que vão classificar seu comportamento ou estimar resultados futuros.
c) As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a
análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes
conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas
características analisadas.
d) As séries temporais correspondem a técnicas estatísticas utilizadas no cálculo de previsão
de um conjunto de informações, analisando-se seus valores ao longo de determinado
período. Nesse caso, para se obter uma previsão mais precisa, devem ser descartadas
eventuais sazonalidades no conjunto de informações.
e) Os processos de data mining e OLAP têm os mesmos objetivos: trabalhar os dados
existentes no data warehouse e realizar inferências, buscando reconhecer correlações não
explícitas nos dados do data warehouse.
Resolução:
Vamos analisar as assertivas:
a) Incorreto: a fase de preparação de dados consiste em coletar os dados identificados
e prepará-los para análise. É a etapa que consome mais tempo. No entanto, os dados são
coletados de múltiplas fontes e não somente de um DW interno.
b) Incorreto: item refere-se a árvores de decisão e não a redes neurais. As redes
neurais envolvem o desenvolvimento de estruturas matemáticas (um tanto parecidas com
as redes neurais biológicas no cérebro humano) que têm a capacidade de aprender com
experiências passadas apresentadas sob a forma de conjuntos de dados bem estruturados.
As árvores de decisão classificam os dados em um número finito de classes com base nos
valores das variáveis de entrada. As árvores de decisão são essencialmente uma hierarquia
de declarações se-então.
c) Correto: gabarito da questão. Data mining é o processo que usa técnicas estatísticas,
matemáticas e de inteligência artificial para extrair e identificar informações úteis e
padrões. A análise de clusters identifica agrupamentos naturais de coisas baseada em
suas características similares.
d) Incorreto: a análise temporal deve considerar a sazonalidade, pois podem ser
identificados comportamentos que somente ocorrem em determinados períodos.
e) Incorreto: Data mining e OLAP são diferentes. O OLAP é uma abordagem para
responder rapidamente questões ad hoc através da execução de consultas analíticas

18
____________________________________

multidimensionais em repositórios de dados organizacionais (data warehouses, data marts).


O Data Mining é usado para descrever o processo pelo qual são descobertos padrões em
dados.
Gabarito: Letra C.

39- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo - Informática)


Julgue o item subsecutivo, acerca de mineração de dados.
Para a realização de prognósticos por meio de técnicas de mineração de dados, parte-se de
uma série de valores existentes obtidos de dados históricos bem como de suposições
controladas a respeito das condições futuras, para prever outros valores e situações que
ocorrerão e, assim, planejar e preparar as ações organizacionais.
Resolução:
O prognóstico ou previsão pode ser realizado com o uso do data mining. Navathe destaca
a previsão como um dos quatro objetivos da mineração de dados, sendo os outros a
identificação, a classificação e a otimização.
Para ser mais assertivo, o prognóstico deve ser realizado com base na lógica de negócios,
baseando-se nos dados históricos para avaliar o comportamento passado da organização em
determinadas situações e realizando suposições de como a organização irá se comportar em
situações futuras semelhantes ou com variações.
Gabarito: Certo.

40- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo - Informática)


Julgue o item subsecutivo, acerca de mineração de dados.
As aglomerações, tipos de informação obtidos por meio da mineração de dados,
caracterizam-se por se ligarem a um único e específico evento, em torno do qual ocorrem
várias ações, com produção sistêmica de informações gerenciais que apoiarão uma nova
ocorrência do mesmo tipo de evento.
Resolução:
Os clusters não estão relacionados a um único e específico evento, pois os dados de um
mesmo cluster se relacionam com base em suas semelhanças.
As aglomerações ou clusters descrevem as classes a que os membros de uma base de dados
pertencem. O objetivo da análise de clusters é classificar casos (por exemplo, pessoas,
coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte
entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters.
Gabarito: Errado.

19
____________________________________

41- (CESPE - 2016 - FUNPRESP-EXE - Especialista - Tecnologia da Informação)


Com relação à forma como os dados são armazenados e manipulados no desenvolvimento
de aplicações, julgue o item a seguir.
Na implementação de mineração de dados (data mining), a utilização da técnica de padrões
sequenciais pode ser útil para a identificação de tendências.
Resolução:
A tarefa de padrões sequenciais busca uma sequência de ações ou eventos. A detecção
de padrões sequenciais é equivalente à detecção de associações entre eventos com
certos relacionamentos temporais. Com base nas sequências de eventos identificadas é
possível avaliar as tendências, por exemplo, se um paciente fuma excessivamente,
provavelmente sofrerá com problemas pulmonares.
Gabarito: Certo.

42- (CESPE - 2015 - MPOG - Analista em Tecnologia da Informação - Cargo 12)


Julgue o item subsequente, acerca dos conceitos de data mining, data warehouse e sistemas
colaborativos.
Em data mining, a técnica boosting é utilizada para fazer a seleção inicial dos dados a serem
analisados durante o estágio de construção do modelo.
Resolução:
Pessoal, dá pra resolver essa questão apenas sabendo que a análise dos dados não acontece
na etapa de construção do modelo. Os dados só são analisados na etapa de implantação do
CRISP-DM. Na etapa de construção, há a seleção dos métodos ou modelos de mineração
que serão aplicados.
Sobre a técnica de boosting, saiba que é uma técnica que combina diversos classificadores
com o objetivo de melhorar a precisão geral da classificação.
Gabarito: Errado.

43- (CESPE - 2015 - TJ-DFT - Técnico Judiciário - Programação de Sistemas)


Julgue o item a seguir, a respeito de datawarehouse e de datamining.
Em um processo de mineração, durante a etapa de preparação dos dados, são analisados os
requisitos de negócio para consolidar os dados.
Resolução:
Há um equívoco quanto a fase descrita no item. O item descreve a fase de entendimento
do negócio e não a de preparação de dados.
A fase de entendimento do negócio objetiva o entendimento das necessidades
gerenciais e das especificações de objetivos de negócio. Um plano de projeto para
busca de conhecimento é desenvolvido de modo a especificar as pessoas responsáveis por
coletar, analisar e reportar dados. Um orçamento de alto nível pode ser estabelecido.

20
____________________________________

Na fase de preparação dos dados, o propósito é carregar os dados identificados e


prepará-los para análise por métodos de mineração de dados. A fase de preparação de
dados abrange todas as atividades para construir o conjunto de dados final (dados que
serão alimentados na ferramenta de modelagem) a partir dos dados brutos iniciais.
Gabarito: Errado.

44- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
O uso prático de data mining envolve o emprego de processos, ferramentas, técnicas e
métodos oriundos da matemática, da estatística e da computação, inclusive de inteligência
artificial.
Resolução:
A mineração de dados é um processo que utiliza técnicas de estatística, matemática
e inteligência artificial para extrair e identificar informações úteis e subsequentes
conhecimentos (ou padrões) em grandes conjuntos de dados.
Vale ressaltar que a mineração de dados não é uma nova disciplina, mas sim uma nova
definição para o uso de muitas disciplinas. A mineração de dados está bem posicionada na
interseção de muitas disciplinas, incluindo estatística, inteligência artificial,
aprendizado de máquinas, ciência de gestão, sistemas de informação e bancos de
dados.
Gabarito: Certo.

45- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
A finalidade do uso do data mining em uma organização é subsidiar a produção de
afirmações conclusivas acerca do padrão de comportamento exibido por agentes de
interesse dessa organização.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados. Os gestores das organizações usam estes padrões, regras, tendências e
comportamentos excepcionais para que possam tomar decisões e agir para otimizar os
negócios.
Gabarito: Certo.

21
____________________________________

46- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
No ambiente organizacional, devido à grande quantidade de dados, não é recomendado o
emprego de data mining para atividades ligadas a marketing.
Resolução:
Uma das características da mineração de dados é justamente a sua aplicação a grandes
bases de dados. Portanto, a assertiva ficaria correta da seguinte forma: No ambiente
organizacional, devido à grande quantidade de dados, não é recomendado o emprego de
data mining para atividades ligadas a marketing.
A mineração de dados é amplamente utilizada em diversos ramos. As pesquisas
genéticas, astronômicas, físicas, médicas e farmacêuticas são bastante auxiliadas com as
técnicas de mineração de dados. No ramo comercial, a mineração pode ser utilizada em
diversos setores, como o financeiro, varejo, marketing e manufatura.
Gabarito: Errado.

47- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
Quem utiliza o data mining tem como objetivo descobrir, explorar ou minerar
relacionamentos, padrões e vínculos significativos presentes em grandes massas
documentais registradas em arquivos físicos (analógicos) e arquivos lógicos (digitais).
Resolução:
O data mining é utilizado para encontrar padrões em grandes bases de dados. Novas
ferramentas sofisticadas ajudam a recuperar informações de arquivos corporativos e
registros públicos e podem extrair dados de bancos não estruturados (ex. bancos do
Lotus Notes, textos e intranets empresariais). No entanto, não há de se falar em análise
de dados registrados em arquivos físicos, pois isto não é possível com ferramentas de
data mining. Para realizar análise das informações destes arquivos físicos através da
mineração de dados, estes devem ser primeiramente transformados em arquivos lógicos por
meio de digitalização com reconhecimento de texto e, então, utilizar-se ferramentas
avançadas de mineração de texto para análise.
Gabarito: Errado.

22
____________________________________

48- (CESPE - 2015 - DEPEN - Agente Penitenciário Federal - Área 7) Acerca de


datawarehouse e datamining, julgue o item subsequente.
Os objetivos do datamining incluem identificar os tipos de relacionamentos que se
estabelecem entre informações armazenadas em um grande repositório.
Resolução:
Um dos objetivos do datamining é a classificação dos dados que consiste em particionar os
dados de modo que diferentes classes ou categorias possam ser identificadas com base
em combinações de parâmetros.
O conhecimento descoberto com o uso do data mining pode ser descrito por meio de
associação, classificação, agrupamento, padrões sequenciais e padrões temporais que
representam relacionamentos entre as informações com base em algum critério pré-
estabelecido ou definido durante a própria análise.
Gabarito: Certo.

49- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
Selecionar uma amostra e determinar os conjuntos de itens frequentes dessa amostra para
formar a lista de previsão de subconjunto são as principais características do algoritmo de
previsão.
Resolução:
A questão descreve os algoritmos de amostragem utilizados nas regras de associação
e não os algoritmos de previsão. Segundo Navathe, a ideia principal para o algoritmo de
amostragem é selecionar uma amostra pequena e determinar os conjuntos de dados
(itemsets) frequentes com base na amostra.
Gabarito: Errado.

50- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
A predição em algoritmos de data mining objetiva modelar funções sobre valores para
apresentar o comportamento futuro de determinados atributos.
Resolução:
Assertiva conforme o objetivo da predição.
A Predição (ou previsão) busca descrever a natureza de ocorrências futuras de certos
eventos com base nos acontecimentos passados. Difere da adivinhação, pois leva em
consideração as experiências, opiniões e outras informações relevantes na condução da
previsão. Dependendo da natureza da predição, podemos falar em classificação ou regressão.
Gabarito: Certo.

23
____________________________________

51- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
O conhecimento obtido no processo de data mining pode ser classificado como uma regra
de associação quando, em um conjunto de eventos, há uma hierarquia de tuplas sequenciais.
Resolução:
Questão misturou a classificação com a associação. Uma hierarquia está relacionada às
tarefas de classificação e não de associação.
A Associação (ou aprendizagem de regras) visa descobrir relacionamentos entre
variáveis em grandes bancos de dados. Dito de outro modo, as regras de associação
correlacionam a presença de um item com uma faixa de valores para um conjunto de
variáveis diverso.
Gabarito: Errado.

52- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Acerca de data


warehouse (DW), Business Intelligence (BI) e data mining, julgue o item que se segue.
Situação hipotética: Após o período de inscrição para o vestibular de determinada
universidade pública, foram reunidas informações acerca do perfil dos candidatos, cursos
inscritos e concorrências. Ademais, que, por meio das soluções de BI e DW que integram
outros sistemas, foram realizadas análises para a detecção de relacionamentos sistemáticos
entre as informações registradas.
Assertiva: Nessa situação, tais análises podem ser consideradas como data mining, pois
agregam valor às decisões do MEC e sugerem tendências, como, por exemplo, o aumento
no número de escolas privadas e a escolha de determinado curso superior.
Resolução:
Item corretíssimo. A mineração de dados (data mining) refere-se à mineração ou
descoberta de novas informações em termos de padrões ou regras com base em
grandes quantidades de dados. Os gestores das organizações usam estes padrões, regras,
tendências e comportamentos excepcionais para que possam tomar decisões e agir para
otimizar os negócios.
Gabarito: Certo.

53- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
Algoritmo genético é uma das ferramentas do data mining que utiliza mecanismos de
biologia evolutiva, como hereditariedade, recombinação, seleção natural e mutação, para
solucionar e agrupar problemas.

24
____________________________________

Resolução:
Os algoritmos genéticos podem ser usados na mineração de dados tanto para realizar
a análise de clusters quanto para a classificação.
Os Algoritmos genéticos são implementados como uma simulação de computador em
que uma população de representações abstratas de solução é selecionada em busca
de soluções melhores. A evolução geralmente se inicia a partir de um conjunto de soluções
criado aleatoriamente e é realizada por meio de gerações. A cada geração, a adaptação de
cada solução na população é avaliada, alguns indivíduos são selecionados para a próxima
geração, e recombinados ou mutados para formar uma nova população. A nova população
então é utilizada como entrada para a próxima iteração do algoritmo.
Gabarito: Certo.

54- (CESPE - 2014 - ANATEL - Analista Administrativo - Suporte e Infraestrutura


de TI) A respeito de banco de dados, julgue os itens que se seguem.
No processo de Data Mining (mineração de dados), é indispensável o uso de técnica
conhecida como Data Warehousing, uma vez que a mineração de dados deve ocorrer
necessariamente em estruturas não normalizadas (FN0).
Resolução:
A mineração de dados pode ser utilizada junto com um data warehouse para ajudar com
certos tipos de decisões. Porém, não está restrita a um DW, podendo ser aplicada também
a bancos de dados operacionais com transações individuais. Alguns recursos de mineração
são fornecidos por SGBDs relacionais, mas de forma limitada.
Gabarito: Errado.

55- (CESPE - 2014 - TJ-SE - Analista Judiciário - Análise de Sistemas) Com relação
a sistemas de suporte à decisão, julgue os seguintes itens.
DataMining pode ser considerado uma etapa no processo de descoberta de conhecimento
em base de dados, consistindo em análise de conjuntos de dados cujo objetivo é descobrir
padrões úteis para tomada de decisão.
Resolução:
A descoberta de conhecimento nos bancos de dados (KDD) abrange mais do que a
mineração de dados. O processo de descoberta do conhecimento compreende seis fases: (1)
seleção de dados; (2) limpeza de dados; (3) enriquecimento; (4) transformação ou codificação
de dados; (5) mineração de dados; e (6) relatório e exibição de informação descoberta.
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados.
Gabarito: Certo.

25
____________________________________

56- (CESPE - 2014 - TJ-SE - Técnico Judiciário - Programação de Sistemas) Acerca


de DataMining e de DataWarehouse, julgue o item subsecutivo.
Os principais processos de DataMining são a identificação de variações embasado em
normas, a detecção e análise de relacionamentos, a paginação de memória e o controle de
periféricos.
Resolução:
A paginação de memória e o controle de periféricos são funções do sistema
operacional e não da mineração de dados.
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados. Estes padrões podem incluir variações e relacionamentos.
Gabarito: Errado.

57- (CESPE - 2014 - TC-DF - Analista de Administração Pública - Sistemas de TI)


Julgue os itens subsecutivos, com relação a Data Mining, desempenho de sistemas de
bancos de dados e controle de concorrência.
Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma
classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto
com outras técnicas de mineração de dados.
Resolução:
Questão que parece ambígua, podendo levar a confusão quando fala em identificação de uma
classe. Pode-se levar a crer que se trataria de identificação das classes, no entanto, o termo
utilizado é “identificação de uma classe”, que se refere a identificar a que classe determinado
objeto pertence com base em seus atributos. Assim, estas classes já estariam pré-definidas
e os objetos serão atribuídos a elas.
A classificação é o processo de aprender um modelo que descreve diferentes classes
de dados. As classes são predefinidas e, portanto, esse tipo de atividade é também
chamado de aprendizado supervisionado.
Gabarito: Certo.

58- (CESPE - 2014 - ANTAQ - Analista Administrativo - Infraestrutura de TI) A


respeito de Data Warehouse e Data Mining, julgue os itens subsecutivos.
Em um processo de descoberta do conhecimento, um Data Mining executado para atingir
uma meta pode falhar nas classes de predição, de identificação, de classificação e de
otimização.
Resolução:
A mineração de dados costuma ser executada com alguns objetivos finais ou aplicações.
Segundo Navathe, de um modo geral, estes objetivos se encontram nas seguintes classes de

26
____________________________________

previsão, identificação, classificação e otimização. É possível, porém, haver falhas durante a


busca destes objetivos por causa de uma má modelagem ou mesmo de problemas com os
dados.
Gabarito: Certo.

59- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os


próximos itens, com relação a DataMining e ETL.
O uso de agrupamento (clustering) em DataMining exige que os registros sejam
previamente categorizados, tendo por finalidade aproximar registros similares para
predizer valores de variáveis.
Resolução:
A clusterização difere da classificação justamente porque os grupos são definidos
posteriormente, isto é, não há uma determinação de classes previamente. Já na
classificação, há uma determinação prévia dos grupos para os dados serem dispostos.
Gabarito: Errado.

60- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os


próximos itens, com relação a DataMining e ETL.
Embora os algoritmos genéticos apresentem elevada demanda computacional, eles
possibilitam a resolução de problemas em paralelo; por isso, são uma boa ferramenta para
mineração de dados.
Resolução:
Os algoritmos genéticos são usados para solução e agrupamento de problemas. Sua
capacidade de solucionar problemas em paralelo oferece uma ferramenta poderosa para
a mineração de dados. As desvantagens dos algoritmos genéticos incluem a grande
superprodução de soluções individuais, o caráter aleatório do processo de pesquisa e a alta
demanda no processamento do computador.
Gabarito: Certo.

61- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os


próximos itens, com relação a DataMining e ETL.
O processo de transformação de dados pode exigir que dados logicamente relacionados,
mas fisicamente separados, sejam recompostos, ainda que envolvam registros distintos ou
até mesmo estejam em bancos de dados operacionais distintos.
Resolução:
A Transformação do Dados é a fase do KDD que antecede a fase de Data Mining. Após
serem selecionados, limpos e pré-processados, os dados necessitam ser armazenados e
formatados adequadamente para que os algoritmos possam ser aplicados.

27
____________________________________

Em grandes corporações é comum encontrar computadores rodando diferentes sistemas


operacionais e diferentes Sistemas Gerenciadores de Bancos de Dados (SGDB). Estes dados
que estão dispersos devem ser agrupados em um repositório único.
Gabarito: Certo.

62- (CESPE - 2014 - TJ-SE - Analista Judiciário - Análise de Sistemas) Com relação
a sistemas de suporte à decisão, julgue os seguintes itens.
Assim como o DataMining, os DataMarts são voltados para a obtenção de informações
estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir
da análise de dados oriundos de DataWarehouses.
Resolução:
Os DataMarts são repositórios de dados departamentais ou setoriais e não ferramentas
para obtenção de informações. O DataMining pode ser usado para análise de dados tanto
em DataWarehouses quanto em DataMarts, bem com em outros bancos de dados.
Gabarito: Errado.

63- (CESPE - 2014 - TJ-CE - Analista Judiciário - Ciências Computação) Assinale a


opção correta acerca de datamining.
a) A informação acerca dos resultados obtidos no processo de mineração é apresentada
apenas de forma gráfica.
b) A classificação, uma das principais tecnologias da mineração de dados, caracteriza-se por
possuir um conjunto de transações, sendo cada uma delas relacionada a um itemset.
c) É possível realizar mineração de dados em documentos textuais como, por exemplo, uma
página da Internet.
d) A grande desvantagem de um datamining consiste no fato de que a identificação de um
padrão, para a geração do conhecimento, só é possível por meio da análise em pequenas
quantidades de dados.
e) Durante a fase de reconhecimento de padrões, para cada banco de dados, é permitido um
único tipo de padrão.
Resolução:
Vamos analisar cada um dos itens:
a) Incorreto: a apresentação dos resultados em mineração não é restrita a forma gráfica.
b) Incorreto: a classificação é uma tarefa da mineração que busca categorizar os dados em
classes pré-definidas.
c) Correto: a mineração de texto é uma forma de mineração de dados que pode ser utilizada
para minerar documentos em texto.

28
____________________________________

d) Incorreto: o data mining pode ser utilizado para descobrir padrões em grandes
quantidades de dados.
e) Incorreto: é possível identificar vários padrões em cada banco de dados.
Gabarito: Letra C.

64- (CESPE - 2013 - SERPRO - Programador de computador) Julgue os itens que se


seguem à luz dos conceitos básicos de datamining e datawarehouse.
Tarefas descritivas têm como objetivo derivar padrões como correlações, tendências,
grupos, trajetórias e anomalias, os quais sumarizam as relações subjacentes nos dados.
Resolução:
As tarefas ou técnicas de mineração de dados podem ser preditivas ou descritivas. A questão
descreve corretamente o objetivo das tarefas descritivas.
As tarefas descritivas têm como objetivo encontrar padrões que descrevam os dados,
permitindo sua análise. Nestas tarefas, podemos identificar correlações (por meio da
associação e análise de ligações), grupos (através da clusterização), trajetórias (uso de
padrões sequenciais e de série temporal) e anomalias (pela análise de outliers).
As tarefas preditivas realizam inferências sobre os dados existentes para predizer o
comportamento de novos dados. As principais tarefas preditivas são a classificação e
regressão.
Gabarito: Certo.

65- (CESPE - 2013 - SERPRO - Analista - Negócios em Tecnologia da Informação)


Com relação a datamining, datawarehouse, gerenciamento de conteúdo, ambientes
colaborativos e portais corporativos, julgue os próximos itens.
Clusterização é a tarefa preditiva relativa à identificação de um conjunto finito de categorias
empregadas para descrever uma informação. Essas categorias nunca poderão ser
mutuamente exclusivas.
Resolução:
Temos algumas incoerências nesta questão:
1. A clusterização não é tarefa preditiva. As tarefas preditivas são a classificação e a
regressão.
2. Na clusterização, as classes não são previamente conhecidas e, portanto, não há como
falar que elas não serão mutuamente exclusivas.
Gabarito: Errado.

29
____________________________________

66- (CESPE - 2013 - MPU - Analista - Suporte e Infraestrutura) Julgue os próximos


itens, acerca de sistemas de suporte à decisão.
Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a
descoberta de dados por faixa de valores, por meio do exame de alguns atributos das
entidades envolvidas.
Resolução:
Assertiva correta. A clusterização é a partição de uma coleção de coisas, eventos ou itens
em segmentos cujos membros possuem características semelhantes. O objetivo é
classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo
que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre
os membros de diferentes clusters.
Gabarito: Certo.

67- (CESPE - 2013 - INPI - Analista de Planejamento - Desenvolvimento e


Manutenção de Sistemas) Em relação a Data Warehouse, Data Mining e banco de dados
distribuídos, julgue os itens subsequentes. O Data Mining possibilita descobrir padrões
úteis de diferentes formas. Uma delas é por meio de classificação, utilizando-se o algoritmo
ID3 que recebe como entrada um conjunto de tuplas para treinamento chamado exemplos
e um atributo objetivo, que permite criar árvores de decisão.
Resolução:
O Algoritmo ID3 é constrói uma árvore de decisão que é uma das ferramentas utilizadas
para a tarefa de classificação. As ferramentas (por vezes chamados de algoritmos)
comuns de classificação incluem redes neurais e árvores de decisão (da aprendizagem de
máquina), regressão logística e análise discriminatória (das estatísticas tradicionais) e
ferramentas emergentes, como conjuntos aproximados, máquinas de vetores de suporte e
algoritmos genéticos. Vamos falar as duas principais: redes neurais e árvores de decisão.
O algoritmo ID3 (Iterative Dichotomiser 3) foi desenvolvido por J. Ross Quinlan na
Universidade de Sidney e publicado em 1975. O ID3 constrói a árvore de decisão a partir
da raiz, selecionando o melhor atributo classificador dentre todos os atributos do conjunto
de dados. O melhor atributo classificador é selecionado com base numa avaliação estatística
de todos os atributos. Após a escolha, os dados são separados de acordo com as classes do
atributo escolhido, gerando uma subdivisão dos dados para cada descendente na árvore. O
algoritmo é aplicado recursivamente a cada descendente, até que algum critério de parada
seja atingido. Isto gera uma árvore de decisão aceitável, na qual o algoritmo nunca
retrocede para reconsiderar escolhas feitas anteriormente.
Gabarito: Certo.

30
____________________________________

68- (CESPE - 2013 - SERPRO - Programador de computador) Julgue os itens que se


seguem à luz dos conceitos básicos de datamining e datawarehouse.
Nos métodos de particionamento para k-clusterização e k-medoids, o elemento que melhor
representa o cluster é definido de acordo com seus atributos, sem que haja muita influência
dos valores próximos aos limites do cluster.
Resolução:
Os métodos de clusterização baseados em estatística (k-clusterização) podem utilizar a
média (k-means), a mediana (k-medoids) ou a moda (k-mode) para definir os elementos
centrais dos clusters. No k-medoids ao invés de usar a média para definir o centro dos
clusters, utiliza a mediana (valor mais ao centro do conjunto de dados). Assim, o elemento
que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita
influência dos valores próximos aos limites do cluster.
Gabarito: Certo.

69- (CESPE - 2013 - SERPRO - Programador de computador) Julgue os itens


seguintes, relativos à arquitetura e às tecnologias de sistemas de informação.
Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante
racionalização e potencialização por meio de dois componentes: organização e tecnologia.
Resolução:
Data mining ou mineração de dados não objetiva a automatização de processos. A
automatização destes processos fica mais a cargo das ferramentas de modelagem de
processos de negócio.
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados.
Gabarito: Errado.

70- (CESPE - 2013 - BACEN - Analista - Análise e Desenvolvimento de Sistemas)


Com relação à inteligência de negócios, julgue o item subsecutivo.
Árvores de decisão e regras de associação são exemplos de algoritmos de data mining.
Resolução:
Pessoal, chamo a atenção para a confusão entre os termos utilizados para descreve os
conceitos relacionados a data mining. Geralmente chamamos a classificação, a associação e
a clusterização de técnicas ou tarefas. Essas tarefas podem utilizar diversos algoritmos para
realizar a análise, incluindo árvores de decisão, redes neurais, apriori, métodos estatísticos,
entre outros.

31
____________________________________

Contudo, muitas vezes não há distinção entre os termos técnicas, tarefas e algoritmos, sendo
utilizado qualquer desses termos de forma indistinta. Foi isso que houve na questão, ao
colocar regras de associação no mesmo nível de árvores de decisão.
Gabarito: Certo.

71- (CESPE - 2012 - TRE-RJ - Técnico Judiciário - Programação de Sistemas) Com


referência a conceitos de banco de dados textual, julgue os itens seguintes.
Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e
descobrir informações em bases textuais escritas em linguagem natural. Com text mining
é possível manipular mais facilmente informações não estruturadas, tais como notícias,
textos em websites, blogs e documentos em geral.
Resolução:
A mineração de texto (também conhecida como mineração de dados de texto ou
descoberta de conhecimento em bancos de dados textuais) é o processo
semiautomático de extração de padrões (informações úteis e conhecimento) de
grandes quantidades de fontes de dados não estruturadas.
A mineração de texto é semelhante a mineração de dados, na medida em que tem o mesmo
propósito e usa os mesmos processos; mas com a mineração de texto, a entrada para o
processo é uma coleção de arquivos de dados não estruturados ou semiestruturados,
como documentos do Word, arquivos PDF, trechos de texto, arquivos XML e assim por
diante.
Gabarito: Certo.

72- (CESPE - 2012 - PEFOCE - Perito Criminal - Análise de Sistemas) No que se


refere a banco de dados e sistemas de suporte a decisão, julgue os itens subsecutivos.
O data mining tem por objetivo a extração de informações úteis para tomadas de decisão
com base nos grandes volumes de dados armazenados nas organizações. Os dados para o
data mining são originados restritamente dos data warehouses, pois estes são os que
aglomeram enorme quantidade de dados não voláteis e organizados por assunto.
Resolução:
A mineração de dados pode ser utilizada junto com um data warehouse para ajudar com
certos tipos de decisões. Porém, não está restrita a um DW, podendo ser aplicada também
a bancos de dados operacionais com transações individuais. Alguns recursos de mineração
são fornecidos por SGBDs relacionais, mas de forma limitada.
Gabarito: Errado.

32
____________________________________

73- (CESPE - 2012 - TJ-AC - Analista Judiciário - Análise de Sistemas) No que diz
respeito a sistemas de suporte a decisão, julgue os itens subsequentes.
O data mining possibilita analisar dados para obtenção de resultados estatísticos que
poderão gerar novas oportunidades ao negócio.
Resolução:
A mineração de dados é um processo que utiliza técnicas de estatística, matemática
e inteligência artificial para extrair e identificar informações úteis e subsequentes
conhecimentos (ou padrões) em grandes conjuntos de dados.
A mineração pode ser utilizada em vários ramos. A mineração de dados oferece às
organizações um ambiente indispensável para melhorar a decisão de forma a explorar
novas oportunidades pela transformação dos dados em uma arma estratégica.
Gabarito: Certo.

74- (CESPE - 2011 - TJ-ES - Analista Judiciário - Informática) Julgue os itens a


seguir, a respeito de administração de dados e de administração de banco de dados.
Mineração de dados, em seu conceito pleno, consiste na realização, de forma manual, de
sucessivas consultas ao banco de dados com o objetivo de descobrir padrões úteis, mas não
necessariamente novos, para auxílio à tomada de decisão.
Resolução:
Aqui nesta questão temos dois erros: primeiro, a mineração de dados ocorre de forma
automatizada ou, ao menos semi-automizada, de consulta para a descoberta de padrões
de dados. Em segundo lugar, os padrões identificados precisam ser desconhecidos
(novos).
A mineração de dados é entendida como o processo não trivial de identificar padrões
válidos, novos, potencialmente úteis e, em última instância, compreensíveis em dados
armazenados em bancos de dados estruturados.
Gabarito: Errado.

75- (CESPE - 2011 - Correios - Analista de Correios - Analista de Sistemas -


Produção) Acerca de datawarehouse (DW) e datamining, julgue os próximos itens.
Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster),
por meio do qual são determinadas características sequenciais utilizando-se dados que
dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo.
Resolução:
As características sequenciais são identificadas nos métodos de associação e não nos
métodos de análise de agrupamento.
A associação (ou aprendizagem de regras) visa descobrir relacionamentos entre
variáveis em grandes bancos de dados. Dito de outro modo, as regras de associação

33
____________________________________

correlacionam a presença de um item com uma faixa de valores para um conjunto de


variáveis diverso.
▪ Análise de ligações: a ligação entre os diversos objetos de interesse é descoberta
automaticamente. Ex.: quando um cliente do sexo masculino compra fraldas em
supermercado, geralmente ele compra cerveja.
▪ Padrões sequenciais: uma sequência de ações ou eventos é buscada. A detecção
de padrões sequenciais é equivalente à detecção de associações entre eventos
com certos relacionamentos temporais. Ex.: se um paciente fuma
excessivamente, provavelmente sofrerá com problemas pulmonares.
▪ Padrões dentro de série temporal: as similaridades entre os dados podem
ser detectadas dentro de posições de uma série temporal, que é uma sequência de
dados tomados em intervalos regulares. Ex.: os casacos de frio são mais baratos
no verão e mais caros no inverno.
A análise de clusters (análise de agrupamentos ou análise de aglomerações) é um
método de mineração de dados essencial para classificar itens, eventos ou conceitos em
agrupamentos comuns chamados de clusters.
Gabarito: Errado.

76- (CESPE - 2011 - STM - Analista Judiciário - Análise de Sistemas) A respeito de


bancos de dados textuais, julgue o item a seguir.
Bancos de dados textuais auxiliam a tomada de decisão nos níveis gerenciais, uma vez que
tratam de dados históricos. Na mineração de dados para um data warehouse, é necessária a
montagem de um banco de dados textual, tal que as pesquisas possam ser realizadas por
meio de dados históricos.
Resolução:
A mineração de dados não exige a montagem de um banco de dados textual, podendo
ser realizada em um Data Warehouse estruturado. Quando esta mineração ocorre nestes
bancos de dados textuais, temos a chamada mineração de texto (text mining).
A mineração de texto (também conhecida como mineração de dados de
texto ou descoberta de conhecimento em bancos de dados textuais) é o processo
semiautomático de extração de padrões (informações úteis e conhecimento) de
grandes quantidades de fontes de dados não estruturadas.
Gabarito: Errado.

34
____________________________________

77- (CESPE - 2011 - SEDUC-AM - Estatístico) Para orientar os investimentos em


educação em certo município, um analista foi contratado para criar um ranking das escolas
públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de
turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área
do terreno.
A partir dessa situação, julgue o item.
A mineração de dados (data mining) é um método computacional que permite extrair
informações a partir de grande quantidade de dados.
Resolução:
A mineração de dados é um processo que utiliza técnicas de estatística, matemática
e inteligência artificial para extrair e identificar informações úteis e subsequentes
conhecimentos (ou padrões) em grandes conjuntos de dados.
Gabarito: Certo.

78- (CESPE - 2010 - Banco da Amazônia - Técnico Científico - Tecnologia da


Informação - Administração de Dados) Os dois métodos principais de busca por frases
em bancos de dados textuais de larga escala, utilizando indexação de textos, são os arquivos
invertidos com contadores de posição e índices para a próxima palavra.
Resolução:
Um banco de dados textual é uma coleção de documentos, que pode também ser visto
como um largo conjunto de registros, em que cada registro contém apenas uma lista de
palavras de tamanho arbitrário.
Os dois métodos principais de busca por frases em bancos de dados textuais de larga
escala, utilizando indexação de textos, são os arquivos invertidos com contadores de posição
e índices para a próxima palavra.
▪ Um arquivo invertido possui duas partes principais: uma estrutura de busca, chamada
de vocabulário, contendo todos os termos distintos existentes no texto indexados e,
para cada termo, uma lista invertida que armazena os identificadores dos registros
contendo o termo. Consultas são feitas tomando-se a lista invertida correspondente ao
termo procurado. As consultas booleanas são feitas obtendo-se a conjunção ou disjunção
entre as listas relativas aos termos presentes na consulta. Arquivos invertidos podem
ser utilizados para busca de frases, através da adição de mais informações a lista
invertida. Basicamente, adiciona-se os deslocamentos no texto em que ocorrem as
palavras.
▪ Os índices para a próxima palavra apresentam uma abordagem mais eficiente do que
o uso de arquivos invertidos com contadores de posição. Nessa abordagem, para cada
palavra existente no vocabulário é criado uma lista com as palavras que ocorrem em
uma posição subsequente no texto, juntamente com apontadores de posição para essas
ocorrências.
Gabarito: Certo.

35
____________________________________

79- (CESPE - 2008 - SERPRO - Analista - Suporte Técnico) Julgue os itens que se
seguem, acerca de data mining e data warehouse.
A data mining apoia a descoberta de regras e padrões em grandes quantidades de dados.
Em data mining, um possível foco é a descoberta de regras de associação. Para que uma
associação seja de interesse, é necessário avaliar o seu suporte, que se refere à frequência
com a qual a regra ocorre no banco de dados.
Resolução:
As regras de associação são uma técnica popular para descobrir relacionamentos
interessantes entre variáveis em grandes bancos de dados. Para que uma regra de
associação seja de interesse de um analista de dados, ela deve obedecer a alguma medida de
interesse.
Duas medidas comuns são o suporte e a confiança.
❖ Suporte ou prevalência: frequência que um conjunto de itens específico
ocorre no banco de dados, ou seja, o percentual de transações que contém todos
os itens em um dado conjunto. Ex.: 30% das compras realizadas em um
supermercado contém fraldas e cervejas.
❖ Confiança ou força: probabilidade de que exista relação entre itens. Ex.: 70%
dos clientes que compram fraldas também compram cerveja.
Gabarito: Certo.

80- (CESPE - 2008 - IPEA - Analista de Sistemas - Suporte de Banco de Dados)


Com relação a BI (business inteligence), indicadores da produção, administração da
produção, monitoração do ambiente operacional, julgue os próximos itens.
O data mining é um processo utilizado para a extração de dados de grandes repositórios
para tomada de decisão, mas sua limitação é não conseguir analisar dados de um data
warehouse.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou descoberta de novas
informações em termos de padrões ou regras com base em grandes quantidades de
dados. Dito de outro modo, o termo mineração de dados foi originalmente usado para
descrever o processo pelo qual os padrões anteriormente desconhecidos em dados são
descobertos.
É importante destacar que a mineração de dados pode ser utilizada junto com um data
warehouse para ajudar com certos tipos de decisões. Porém, não está restrita a um DW,
podendo ser aplicada também a bancos de dados operacionais com transações
individuais. Alguns recursos de mineração são fornecidos por SGBDs relacionais, mas
de forma limitada.
Gabarito: Errado.

36
____________________________________

Lista de Questões
1- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da
Informação - Ciência de Dados) Julgue o item a seguir, relativos a conceitos de
modelagem dimensional.
Em um processo de modelagem dimensional, a operação de merge/pruge agrega
informações das dimensões para diminuir a tabela de fatos.

2- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Acerca de conceitos, premissas e aplicações de big data,
julgue o item subsequente.
O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para
serem analisados sem erros de incompletudes, inconsistências e ruídos.

3- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
A análise de regressão em mineração de dados tem como objetivos a sumariação, a predição,
o controle e a estimação.

4- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers, que são
objetos completamente diferentes do padrão da amostra.

5- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
A técnica de agregação na mineração de dados atua em conjunto de registros que tenham
sido previamente classificados.

6- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
A etapa de modelagem do modelo CRISP-DM permite a aplicação de diversas técnicas de
mineração sobre os dados selecionados, conforme os formatos dos próprios dados.

37
____________________________________

7- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Mecanismos de busca utilizam mineração de textos para apresentar ao usuário os resultados
de suas pesquisas, de modo que ambos os conceitos se equivalem.

8- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data.
O objetivo da técnica de sequência de tempo é identificar a ocorrência de dois eventos
diferentes no mesmo momento.

9- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão
analisados, por meio da aplicação de filtros e de eliminadores de palavras.

10- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Julgue o seguinte item, a respeito de big data. A
mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que
os textos representam um tipo específico de dado.

11- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Estratificação é a abordagem da técnica de árvore de decisão que determina as regras para
direcionar cada caso a uma categoria já existente.

12- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Na etapa de mineração do data mining, ocorre a seleção dos conjuntos de dados que serão
utilizados no processo de mining.

13- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.

38
____________________________________

Modelagem preditiva é utilizada para antecipar comportamentos futuros, por meio do


estudo da relação entre duas ou mais variáveis.

14- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
Na análise hierárquica de agrupamentos, é possível realocar um elemento que tenha sido
alocado incorretamente no início do processo.

15- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
A técnica de associação é utilizada para indicar um grau de afinidade entre registros de
eventos diferentes, para permitir o processo de data mining.

16- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) Acerca de visualização e análise exploratória de dados,
julgue o item seguinte.
Outlier ou anomalias são padrões nos dados que não estão de acordo com uma noção bem
definida de comportamento normal.

17- (CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da


Informação - Ciência de Dados) No que se refere à mineração de dados, julgue o item a
seguir.
No modelo CRISP-DM, a fase na qual se planejam todas as atividades para carga dos dados
é denominada entendimento dos dados.

18- (CESPE - 2019 - TCE-RO - Auditor de Controle Externo - Administração) Série


temporal consiste em
a) estrutura de dados qualitativos medidos negativamente por padrão.
b) estrutura de dados que podem ser medidos sem métrica definida.
c) estrutura de dados que rastreiam mudanças nos valores de uma métrica ao longo do
tempo.
d) estrutura em que os dados podem ser marcados como verdadeiros ou falsos por padrão.
e) estrutura de dados numéricos que têm um número infinito de valores possíveis.

39
____________________________________

19- (CESPE / CEBRASPE - 2019 - TJ-AM - Assistente Judiciário - Suporte ao


Usuário de Informática) A respeito de data warehouse e data mining, julgue o item que
se segue.
A técnica machine learning pode ser utilizada para apoiar um processo de data mining.

20- (CESPE / CEBRASPE - 2019 - TJ-AM - Analista Judiciário - Analista de


Sistemas) A respeito de bancos de dados relacionais, julgue o item a seguir.
Em sistemas de suporte à decisão, uma das abordagens da árvore de decisão é a predição,
em que são criadas regras com base em eventos já ocorridos para aplicação em eventos
futuros similares.

21- (CESPE - 2018 – EBSERH) Julgue o item que se segue, a respeito de arquitetura e
tecnologias de sistemas de informação.
A descoberta de novas regras e padrões em conjuntos de dados fornecidos, ou aquisição de
conhecimento indutivo, é um dos objetivos de data mining.

22- (CESPE - 2018 - Polícia Federal - Agente de Polícia Federal) Julgue o item que
segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.
Situação hipotética: Na ação de obtenção de informações por meio de aprendizado de
máquina, verificou-se que o processo que estava sendo realizado consistia em examinar as
características de determinado objeto e atribuir-lhe uma ou mais classes; verificou-se
também que os algoritmos utilizados eram embasados em algoritmos de aprendizagem
supervisionados.
Assertiva: Nessa situação, a ação em realização está relacionada ao processo de
classificação.

23- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Julgue o item a


seguir, a respeito de data mining e OLAP.
No data mining, uma regra de associação relaciona a presença de um conjunto de itens com
outra faixa de valores de um outro conjunto de variáveis.

40
____________________________________

24- (CESPE - 2018 - TCE-MG - Analista de Controle Externo - Ciência da


Computação) Na técnica de árvore de decisão em data mining, é empregada a abordagem
denominada
a) análise de volumetria.
b) combinação de variáveis.
c) estratificação.
d) avaliação de dados.
e) percepção.

25- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Conhecimentos


Básicos - Todas as Áreas) Acerca de banco de dados, julgue o seguinte item.
A mineração de dados se caracteriza especialmente pela busca de informações em grandes
volumes de dados, tanto estruturados quanto não estruturados, alicerçados no conceito dos
4V’s: volume de mineração, variedade de algoritmos, velocidade de aprendizado e
veracidade dos padrões.

26- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Conhecimentos


Básicos - Todas as Áreas) Acerca de banco de dados, julgue o seguinte item.
Descobrir conexões escondidas e prever tendências futuras é um dos objetivos da mineração
de dados, que utiliza a estatística, a inteligência artificial e os algoritmos de aprendizagem
de máquina.

27- (CESPE - 2018 - Polícia Federal - Agente de Polícia Federal) Julgue o item que
segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.
Pode-se definir mineração de dados como o processo de identificar, em dados, padrões
válidos, novos, potencialmente úteis e, ao final, compreensíveis.

28- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue o item que se segue, a respeito
de tecnologias de sistemas de informação.
Na busca de padrões no data mining, é comum a utilização do aprendizado não
supervisionado, em que um agente externo apresenta ao algoritmo alguns conjuntos de
padrões de entrada e seus correspondentes padrões de saída, comparando-se a resposta
fornecida pelo algoritmo com a resposta esperada.

41
____________________________________

29- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) Assinale a


opção correta a respeito do CRISP-DM.
a) CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da
indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias
para a realização de um projeto de mineração de dados.
b) A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados.
c) Durante a fase de preparação dos dados, é realizado um inventário de requisitos,
suposições e restrições de recursos.
d) Na fase de avaliação dos dados, são realizadas as atividades de identificar valores especiais
dos dados e catalogar seu significado.
e) Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de
implantação de cada resultado e estimar o potencial de melhoria do processo atual.

30- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) A respeito


das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.
a) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam
coocorrência.
b) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os
valores associados aos dados em um ou mais valores reais.
c) A regressão ou predição promove o aprendizado de uma função que pode ser usada para
mapear dados em uma de várias classes discretas definidas previamente, bem como
encontrar tendências que possam ser usadas para entender e explorar padrões de
comportamento dos dados.
d) As regras de associação identificam grupos de dados, em que os dados têm características
semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.
e) Os métodos de classificação supervisionada podem ser embasados em separabilidade
(entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM
(support vector machines).

31- (CESPE - 2018 - STJ - Técnico Judiciário - Desenvolvimento de Sistemas)


Julgue o item que se segue, acerca de data mining e data warehouse.
O processo de mineração de dados está intrinsecamente ligado às dimensões e a fato, tendo
em vista que, para a obtenção de padrões úteis e relevantes, é necessário que esse processo
seja executado dentro dos data warehouses.

42
____________________________________

32- (CESPE - 2017 - TCE-PE - Analista de Controle Externo - Auditoria de Contas


Públicas) Em relação à análise de agrupamentos (clusterização) em mineração de dados,
julgue o item seguinte.
O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada
observação pertence ao grupo mais próximo da média.

33- (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas


Públicas) Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard
Process of Data Mining).
Durante a fase de entendimento do negócio, busca-se descrever claramente o problema,
fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são
interdependentes.

34- (CESPE - 2017 - TRE-BA - Analista Judiciário – Análise de Sistemas) O


agrupamento de dados no processo de data mining procura, em uma massa de dados que
caracterizam uma população de indivíduos, grupos semelhantes e diferentes. O algoritmo
baseado na teoria dos grafos e que dispensa a definição de protótipos utilizado para
segmentar a base de dados em diferentes grupos é denominado
a) K média.
b) K medoides.
c) Apriori.
d) DBSCAN.
e) Árvore geradora mínima.

35- (CESPE - 2017 - SEDF - Analista de Gestão Educacional - Tecnologia da


Informação) Com relação a data mining e data warehouse, julgue o item que se segue.
Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes
entre si e diferentes dos registros em outros grupos é uma maneira de descrever
conhecimento descoberto durante processos de mineração de dados.

36- (CESPE - 2016 - FUNPRESP-JUD - Analista - Tecnologia da Informação)


Julgue o item subsecutivo, referente às tecnologias de bancos de dados.
Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para
atribuir informação de tipo.

43
____________________________________

37- (CESPE - 2016 - TCE-PA - Auditor de Controle Externo - Área Informática -


Analista de Sistema) Julgue o item a seguir, em relação a data warehouse e data mining.
No contexto de data mining, o processo de descoberta de conhecimento em base de dados
consiste na extração não trivial de conhecimento previamente desconhecido e
potencialmente útil.

38- (CESPE - 2016 - TRT - 8ª Região (PA e AP) - Analista Judiciário - Tecnologia
da Informação) Acerca de data mining, assinale a opção correta.
a) A fase de preparação para implementação de um projeto de data mining consiste, entre
outras tarefas, em coletar os dados que serão garimpados, que devem estar exclusivamente
em um data warehouse interno da empresa.
b) As redes neurais são um recurso matemático/computacional usado na aplicação de
técnicas estatísticas nos processos de data mining e consistem em utilizar uma massa de
dados para criar e organizar regras de classificação e decisão em formato de diagrama de
árvore, que vão classificar seu comportamento ou estimar resultados futuros.
c) As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a
análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes
conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas
características analisadas.
d) As séries temporais correspondem a técnicas estatísticas utilizadas no cálculo de previsão
de um conjunto de informações, analisando-se seus valores ao longo de determinado
período. Nesse caso, para se obter uma previsão mais precisa, devem ser descartadas
eventuais sazonalidades no conjunto de informações.
e) Os processos de data mining e OLAP têm os mesmos objetivos: trabalhar os dados
existentes no data warehouse e realizar inferências, buscando reconhecer correlações não
explícitas nos dados do data warehouse.

39- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo - Informática)


Julgue o item subsecutivo, acerca de mineração de dados.
Para a realização de prognósticos por meio de técnicas de mineração de dados, parte-se de
uma série de valores existentes obtidos de dados históricos bem como de suposições
controladas a respeito das condições futuras, para prever outros valores e situações que
ocorrerão e, assim, planejar e preparar as ações organizacionais.

44
____________________________________

40- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo - Informática)


Julgue o item subsecutivo, acerca de mineração de dados.
As aglomerações, tipos de informação obtidos por meio da mineração de dados,
caracterizam-se por se ligarem a um único e específico evento, em torno do qual ocorrem
várias ações, com produção sistêmica de informações gerenciais que apoiarão uma nova
ocorrência do mesmo tipo de evento.

41- (CESPE - 2016 - FUNPRESP-EXE - Especialista - Tecnologia da Informação)


Com relação à forma como os dados são armazenados e manipulados no desenvolvimento
de aplicações, julgue o item a seguir.
Na implementação de mineração de dados (data mining), a utilização da técnica de padrões
sequenciais pode ser útil para a identificação de tendências.

42- (CESPE - 2015 - MPOG - Analista em Tecnologia da Informação - Cargo 12)


Julgue o item subsequente, acerca dos conceitos de data mining, data warehouse e sistemas
colaborativos.
Em data mining, a técnica boosting é utilizada para fazer a seleção inicial dos dados a serem
analisados durante o estágio de construção do modelo.

43- (CESPE - 2015 - TJ-DFT - Técnico Judiciário - Programação de Sistemas)


Julgue o item a seguir, a respeito de datawarehouse e de datamining.
Em um processo de mineração, durante a etapa de preparação dos dados, são analisados os
requisitos de negócio para consolidar os dados.

44- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
O uso prático de data mining envolve o emprego de processos, ferramentas, técnicas e
métodos oriundos da matemática, da estatística e da computação, inclusive de inteligência
artificial.

45- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
A finalidade do uso do data mining em uma organização é subsidiar a produção de
afirmações conclusivas acerca do padrão de comportamento exibido por agentes de
interesse dessa organização.

45
____________________________________

46- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
No ambiente organizacional, devido à grande quantidade de dados, não é recomendado o
emprego de data mining para atividades ligadas a marketing.

47- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo - Conhecimentos


Gerais) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte
item.
Quem utiliza o data mining tem como objetivo descobrir, explorar ou minerar
relacionamentos, padrões e vínculos significativos presentes em grandes massas
documentais registradas em arquivos físicos (analógicos) e arquivos lógicos (digitais).

48- (CESPE - 2015 - DEPEN - Agente Penitenciário Federal - Área 7) Acerca de


datawarehouse e datamining, julgue o item subsequente.
Os objetivos do datamining incluem identificar os tipos de relacionamentos que se
estabelecem entre informações armazenadas em um grande repositório.

49- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
Selecionar uma amostra e determinar os conjuntos de itens frequentes dessa amostra para
formar a lista de previsão de subconjunto são as principais características do algoritmo de
previsão.

50- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
A predição em algoritmos de data mining objetiva modelar funções sobre valores para
apresentar o comportamento futuro de determinados atributos.

51- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
O conhecimento obtido no processo de data mining pode ser classificado como uma regra

46
____________________________________

52- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Acerca de data


warehouse (DW), Business Intelligence (BI) e data mining, julgue o item que se segue.
Situação hipotética: Após o período de inscrição para o vestibular de determinada
universidade pública, foram reunidas informações acerca do perfil dos candidatos, cursos
inscritos e concorrências. Ademais, que, por meio das soluções de BI e DW que integram
outros sistemas, foram realizadas análises para a detecção de relacionamentos sistemáticos
entre as informações registradas.
Assertiva: Nessa situação, tais análises podem ser consideradas como data mining, pois
agregam valor às decisões do MEC e sugerem tendências, como, por exemplo, o aumento
no número de escolas privadas e a escolha de determinado curso superior.

53- (CESPE - 2015 - MEC - Administrador de Banco de Dados) Julgue o item


seguinte, referente a data mining.
Algoritmo genético é uma das ferramentas do data mining que utiliza mecanismos de
biologia evolutiva, como hereditariedade, recombinação, seleção natural e mutação, para
solucionar e agrupar problemas.

54- (CESPE - 2014 - ANATEL - Analista Administrativo - Suporte e Infraestrutura


de TI) A respeito de banco de dados, julgue os itens que se seguem.
No processo de Data Mining (mineração de dados), é indispensável o uso de técnica
conhecida como Data Warehousing, uma vez que a mineração de dados deve ocorrer
necessariamente em estruturas não normalizadas (FN0).

55- (CESPE - 2014 - TJ-SE - Analista Judiciário - Análise de Sistemas) Com relação
a sistemas de suporte à decisão, julgue os seguintes itens.
DataMining pode ser considerado uma etapa no processo de descoberta de conhecimento
em base de dados, consistindo em análise de conjuntos de dados cujo objetivo é descobrir
padrões úteis para tomada de decisão.

56- (CESPE - 2014 - TJ-SE - Técnico Judiciário - Programação de Sistemas) Acerca


de DataMining e de DataWarehouse, julgue o item subsecutivo.
Os principais processos de DataMining são a identificação de variações embasado em
normas, a detecção e análise de relacionamentos, a paginação de memória e o controle de
periféricos.

47
____________________________________

57- (CESPE - 2014 - TC-DF - Analista de Administração Pública - Sistemas de TI)


Julgue os itens subsecutivos, com relação a Data Mining, desempenho de sistemas de
bancos de dados e controle de concorrência.
Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma
classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto
com outras técnicas de mineração de dados.

58- (CESPE - 2014 - ANTAQ - Analista Administrativo - Infraestrutura de TI) A


respeito de Data Warehouse e Data Mining, julgue os itens subsecutivos.
Em um processo de descoberta do conhecimento, um Data Mining executado para atingir
uma meta pode falhar nas classes de predição, de identificação, de classificação e de
otimização.

59- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os


próximos itens, com relação a DataMining e ETL.
O uso de agrupamento (clustering) em DataMining exige que os registros sejam
previamente categorizados, tendo por finalidade aproximar registros similares para
predizer valores de variáveis.

60- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os


próximos itens, com relação a DataMining e ETL.
Embora os algoritmos genéticos apresentem elevada demanda computacional, eles
possibilitam a resolução de problemas em paralelo; por isso, são uma boa ferramenta para
mineração de dados.

61- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os


próximos itens, com relação a DataMining e ETL.
O processo de transformação de dados pode exigir que dados logicamente relacionados,
mas fisicamente separados, sejam recompostos, ainda que envolvam registros distintos ou
até mesmo estejam em bancos de dados operacionais distintos.

62- (CESPE - 2014 - TJ-SE - Analista Judiciário - Análise de Sistemas) Com relação
a sistemas de suporte à decisão, julgue os seguintes itens.
Assim como o DataMining, os DataMarts são voltados para a obtenção de informações
estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir
da análise de dados oriundos de DataWarehouses.

48
____________________________________

63- (CESPE - 2014 - TJ-CE - Analista Judiciário - Ciências Computação) Assinale a


opção correta acerca de datamining.
a) A informação acerca dos resultados obtidos no processo de mineração é apresentada
apenas de forma gráfica.
b) A classificação, uma das principais tecnologias da mineração de dados, caracteriza-se por
possuir um conjunto de transações, sendo cada uma delas relacionada a um itemset.
c) É possível realizar mineração de dados em documentos textuais como, por exemplo, uma
página da Internet.
d) A grande desvantagem de um datamining consiste no fato de que a identificação de um
padrão, para a geração do conhecimento, só é possível por meio da análise em pequenas
quantidades de dados
e) Durante a fase de reconhecimento de padrões, para cada banco de dados, é permitido um
único tipo de padrão

64- (CESPE - 2013 - SERPRO - Programador de computador) Julgue os itens que se


seguem à luz dos conceitos básicos de datamining e datawarehouse.
Tarefas descritivas têm como objetivo derivar padrões como correlações, tendências,
grupos, trajetórias e anomalias, os quais sumarizam as relações subjacentes nos dados.

65- (CESPE - 2013 - SERPRO - Analista - Negócios em Tecnologia da Informação)


Com relação a datamining, datawarehouse, gerenciamento de conteúdo, ambientes
colaborativos e portais corporativos, julgue os próximos itens.
Clusterização é a tarefa preditiva relativa à identificação de um conjunto finito de categorias
empregadas para descrever uma informação. Essas categorias nunca poderão ser
mutuamente exclusivas.

66- (CESPE - 2013 - MPU - Analista - Suporte e Infraestrutura) Julgue os próximos


itens, acerca de sistemas de suporte à decisão.
Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a
descoberta de dados por faixa de valores, por meio do exame de alguns atributos das
entidades envolvidas.

67- (CESPE - 2013 - INPI - Analista de Planejamento - Desenvolvimento e


Manutenção de Sistemas) Em relação a Data Warehouse, Data Mining e banco de dados
distribuídos, julgue os itens subsequentes. O Data Mining possibilita descobrir padrões
úteis de diferentes formas. Uma delas é por meio de classificação, utilizando-se o algoritmo
ID3 que recebe como entrada um conjunto de tuplas para treinamento chamado exemplos
e um atributo objetivo, que permite criar árvores de decisão.

49
____________________________________

68- (CESPE - 2013 - SERPRO - Programador de computador) Julgue os itens que se


seguem à luz dos conceitos básicos de datamining e datawarehouse.
Nos métodos de particionamento para k-clusterização e k-medoids, o elemento que melhor
representa o cluster é definido de acordo com seus atributos, sem que haja muita influência
dos valores próximos aos limites do cluster.

69- (CESPE - 2013 - SERPRO - Programador de computador) Julgue os itens


seguintes, relativos à arquitetura e às tecnologias de sistemas de informação.
Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante
racionalização e potencialização por meio de dois componentes: organização e tecnologia.

70- (CESPE - 2013 - BACEN - Analista - Análise e Desenvolvimento de Sistemas)


Com relação à inteligência de negócios, julgue o item subsecutivo.
Árvores de decisão e regras de associação são exemplos de algoritmos de data mining.

71- (CESPE - 2012 - TRE-RJ - Técnico Judiciário - Programação de Sistemas) Com


referência a conceitos de banco de dados textual, julgue os itens seguintes.
Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e
descobrir informações em bases textuais escritas em linguagem natural. Com text mining
é possível manipular mais facilmente informações não estruturadas, tais como notícias,
textos em websites, blogs e documentos em geral.

72- (CESPE - 2012 - PEFOCE - Perito Criminal - Análise de Sistemas) No que se


refere a banco de dados e sistemas de suporte a decisão, julgue os itens subsecutivos.
O data mining tem por objetivo a extração de informações úteis para tomadas de decisão
com base nos grandes volumes de dados armazenados nas organizações. Os dados para o
data mining são originados restritamente dos data warehouses, pois estes são os que
aglomeram enorme quantidade de dados não voláteis e organizados por assunto.

73- (CESPE - 2012 - TJ-AC - Analista Judiciário - Análise de Sistemas) No que diz
respeito a sistemas de suporte a decisão, julgue os itens subsequentes.
O data mining possibilita analisar dados para obtenção de resultados estatísticos que
poderão gerar novas oportunidades ao negócio.

50
____________________________________

74- (CESPE - 2011 - TJ-ES - Analista Judiciário - Informática) Julgue os itens a


seguir, a respeito de administração de dados e de administração de banco de dados.
Mineração de dados, em seu conceito pleno, consiste na realização, de forma manual, de
sucessivas consultas ao banco de dados com o objetivo de descobrir padrões úteis, mas não
necessariamente novos, para auxílio à tomada de decisão.

75- (CESPE - 2011 - Correios - Analista de Correios - Analista de Sistemas -


Produção) Acerca de datawarehouse (DW) e datamining, julgue os próximos itens.
Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster),
por meio do qual são determinadas características sequenciais utilizando-se dados que
dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo.

76- (CESPE - 2011 - STM - Analista Judiciário - Análise de Sistemas) A respeito de


bancos de dados textuais, julgue o item a seguir.
Bancos de dados textuais auxiliam a tomada de decisão nos níveis gerenciais, uma vez que
tratam de dados históricos. Na mineração de dados para um data warehouse, é necessária a
montagem de um banco de dados textual, tal que as pesquisas possam ser realizadas por
meio de dados históricos.

77- (CESPE - 2011 - SEDUC-AM - Estatístico) Para orientar os investimentos em


educação em certo município, um analista foi contratado para criar um ranking das escolas
públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de
turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área
do terreno.
A partir dessa situação, julgue o item.
A mineração de dados (data mining) é um método computacional que permite extrair
informações a partir de grande quantidade de dados.

78- (CESPE - 2010 - Banco da Amazônia - Técnico Científico - Tecnologia da


Informação - Administração de Dados) Os dois métodos principais de busca por frases
em bancos de dados textuais de larga escala, utilizando indexação de textos, são os arquivos
invertidos com contadores de posição e índices para a próxima palavra.

79- (CESPE - 2008 - SERPRO - Analista - Suporte Técnico) Julgue os itens que se
seguem, acerca de data mining e data warehouse.
A data mining apoia a descoberta de regras e padrões em grandes quantidades de dados.
Em data mining, um possível foco é a descoberta de regras de associação. Para que uma
associação seja de interesse, é necessário avaliar o seu suporte, que se refere à frequência
com a qual a regra ocorre no banco de dados.

51
____________________________________

80- (CESPE - 2008 - IPEA - Analista de Sistemas - Suporte de Banco de Dados)


Com relação a BI (business inteligence), indicadores da produção, administração da
produção, monitoração do ambiente operacional, julgue os próximos itens.
O data mining é um processo utilizado para a extração de dados de grandes repositórios
para tomada de decisão, mas sua limitação é não conseguir analisar dados de um data
warehouse.

52
____________________________________

Gabarito
1- Errado 17- Errado 33- Errado 49- Errado 65- Errado
2- Certo 18- Letra C 34- Letra E 50- Certo 66- Certo
3- Certo 19- Certo 35- Certo 51- Errado 67- Certo
4- Certo 20- Certo 36- Certo 52- Certo 68- Certo
5- Errado 21- Certo 37- Certo 53- Certo 69- Errado
6- Certo 22- Certo 38- Letra C 54- Errado 70- Certo
7- Errado 23- Certo 39- Certo 55- Certo 71- Certo
8- Errado 24- Letra C 40- Errado 56- Errado 72- Errado
9- Certo 25- Errado 41- Certo 57- Certo 73- Certo
10- Errado 26- Certo 42- Errado 58- Certo 74- Errado
11- Certo 27- Certo 43- Errado 59- Errado 75- Errado
12- Errado 28- Errado 44- Certo 60- Certo 76- Errado
13- Certo 29- Letra B 45- Certo 61- Certo 77- Certo
14- Errado 30- Letra E 46- Errado 62- Errado 78- Certo
15- Certo 31- Errado 47- Errado 63- Letra C 79- Certo
16- Certo 32- Certo 48- Certo 64- Certo 80- Errado

53

Você também pode gostar