Você está na página 1de 9

T EC INFORMAÇÃO DAT A MINING

DYWILLY GONÇALVES DIAS - 016.14 2.68 2-4 0


Acessar Lista

Questão 1 Classif icação Algoritmos e técnicas

Em relação à classificação de textos em Recuperação de Informação, é correto afirmar:

A Classificadores do tipo Bayes ingênuo estimam a probabilidade de uma classificação


correta e são uma alternativa competitiva para a classificação de textos.

B Entre os métodos supervisionados, o de agrupamento por particionamento é utilizando


em processos de autorrotulagem.

C Máquinas de vetores de suporte (em inglês, SVM) assumem que os pesos dos termos
são binários, não considerando a frequência dos termos no processo de classificação.

D Classificadores do tipo ensemble são metaclassificadores de técnicas baseadas em


frequência de documentos de um termo.

E O classificador de Rocchio é um método de ranqueamento de documentos baseado no


número de links que apontam para o documento.
6207918 8

Questão 2 Abordagem para outros problemas de mineração

Em sistemas de Recuperação de Informação, os termos de indexação podem ser extraídos


diretamente do texto dos documentos, fornecendo uma visão lógica dos documentos. Assinale
a alternativa que apresenta corretamente uma das operações realizadas para obter as palavras-
chaves.

A No processo de reconhecimento da estrutura, ocorre a análise léxica e a remoção de


palavras sem semântica associada.

B O processo de quebra do texto em palavras (tokenização) é dependente da stoplist, um


dicionário próprio aplicado à separação das palavras.

C A classificação de grupos nominais visa a identificação dos verbos e remoção das demais
palavras, através de listas de palavras, etiquetadores automáticos e um thesaurus da
língua ou do domínio.

D Acentos, espaçamento e demais símbolos são delimitadores considerados naturais no


processo de stemming.

E O processo de stemming consiste em remover os afixos, preservando o radical e


possibilitando o casamento entre variações de uma mesma palavra.
6207918 4

Questão 3 Mineração de Dados Data Mining


Castro e Ferrari (2016) mencionam que as funcionalidades da mineração de dados são utilizadas
para especi car os tipos de informação a serem obtidos nas tarefas de mineração. Sobre esse
tema, considere as seguintes funcionalidades:

1. Análise de grupos: tarefa supervisionada que separa um conjunto de objetos em grupos.

2. Classificação: tarefa supervisionada para predição de valores discretos.

3. Regressão (ou estimação): tarefa supervisionada para predição de valores contínuos.

4. Associação: tarefa que descobre relações entre atributos por meio da detecção de anomalias
nos conjuntos de dados.

É/São funcionalidade(s) da etapa de mineração:

A 1 apenas.

B 2 apenas.

C 1 e 4 apenas.

D 2 e 3 apenas.

E 3 e 4 apenas.
62078 98 9

Questão 4 Mineração de Dados Data Mining

Considere que a SANASA busca realizar a gestão de recursos hídricos subterrâneos com base
em parâmetros conhecidos que determinam a poluição das águas subterrâneas. Um desses
parâmetros, para exempli car, seria o nitrato, um indicador de poluição difusa de água
subterrânea. Criando-se regras para realizar o aprendizado supervisionado do sistema de Data
Mining utilizando-se uma certa técnica, chegar-se-á a um resultado que considera os diversos
parâmetros para se descobrir se um certo aquífero tem água potável ou não, comparando-se
com uma definição conhecida.

Nesse cenário, a técnica aplicada é denominada


A Associação.

B Classificação.

C Clustering.

D Regressão.

E Prediction.
Essa questão po ssui co mentário do pro fesso r no site 62064 178

Questão 5 Modelagem multidimensional Conceitos e características Conceitos básicos

“A Secretaria da Fazenda realizou procedimento que visa estimular os contribuintes paulistas a,


voluntariamente, regularizarem as obrigações tributárias que devem ser transmitidas ao Fisco. Em
uma etapa da operação foram selecionados 48 contribuintes do Regime Periódico de Apuração com
R$ 143 milhões em débitos de ICMS.

Esta ação tem caráter orientador, com o objetivo de alertar as empresas sobre divergências em suas
declarações e indicar a regularização, porém, a ação pode resultar em indicações de empresas de
fachada que apresentaram um conjunto de indícios que sugerem tratar-se de documentos scais
inidôneos ou de simulação de operações para gerar créditos falsos de ICMS na apuração mensal do
tributo a recolher.

Para a elaboração da operação autorregularização foram selecionados contribuintes com


divergências nas notas scais emitidas entre janeiro a dezembro de 2016 em comparação com as
informações declaradas nas Guias de Informação e Apuração do ICMS do mesmo período."

(Baseado em: https://portal.fazenda.sp.gov.br)

Ao ler esta notícia, uma Auditora Fiscal da área de TI concluiu, corretamente, que o cruzamento
e a análise simultânea de diversas informações, como Nota Fiscal Eletrônica (NF-e),
inadimplência, regularidade no cumprimento de obrigações, porte da empresa, composição do
quadro societário, autos de infração anteriores, localização geográ ca e atividade econômica,
entre outras,
A caracterizam-se como operações HOLAP, que não usam a base de dados relacional para
acessar os dados do cubo.

B podem ter sido realizados com a ajuda de ferramentas de Data Mining, que permitem a
exploração de grandes volumes de dados para identificar padrões de comportamento e
relacionamentos.

C podem ter sido realizados com ferramentas de Data Mining em tempo real, uma vez que
os dados do DW são constantemente atualizados a partir da chave de tempo que indica
o dia no qual os dados foram extraídos dos sistemas transacionais.

D caracterizam-se como operações MOLAP, que usam a base de dados relacional para
acessar os dados do cubo.

E podem ter sido realizados com a ajuda de ferramentas de Data Marts integrados, que
não requerem a construção de um DW.
4 8 8 8 53 4 0

Questão 6 Mineração de Dados Data Mining

O conceito de Data Mining descreve

A o uso de teorias, métodos, processos e tecnologias para organizar uma grande


quantidade de dados brutos para identificar padrões de comportamentos em
determinados públicos.

B o conjunto de métodos, tecnologias e estratégias para atração voluntária de visitantes,


buscando a conversão consistente de leads em clientes (realização de compra).

C as atividades coordenadas de modo sistemático por uma determinada organização para


relacionamento com os seus distintos públicos, bem como com outras organizações,
sejam públicas, privadas ou não governamentais.

D o conjunto de tarefas e processos, organizados e sistematizados, normalmente como


uso de uma plataforma tecnológica (hardware e software, ou até mesmo em cloud
computing) para a gestão do relacionamento com clientes.

E o trabalho de produzir levantamento sobre os hábitos de consumo de mídia de um


determinado público, identificando horários, tempo gasto etc., associando ao perfil
socioeconômico, potencial de consumo, persuasão etc.
3 78 603 006

Questão 7 Classif icação Conceitos e Def inições

Classi cação é o processo de encontrar um modelo que descreva classes diferentes de dados.
As classes são predeterminadas, por exemplo, em uma aplicação bancária, clientes que possuam
um cartão de crédito podem ser classi cados como “risco baixo”, “risco justo”, ou “risco alto”. Esse
tipo de atividade é também chamada, em modelagem de dados, de

A estratégia

B planejamento

C esquema

D data mining

E aprendizado supervisionado
29094 64 60

Questão 8 T aref as de mineração Abordagem para outros problemas de mineração

Na técnica de árvore de decisão em data mining, é empregada a abordagem denominada

A análise de volumetria.

B combinação de variáveis.

C estratificação.

D avaliação de dados.

E percepção.
2273 09606

Questão 9 Mineração de Dados Data Mining

O cálculo do valor esperado provê um framework que é extremamente útil para organizar o
pensamento sobre problemas envolvendo análise de dados (data-analytic).

PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data
mining and data-analytic thinking. O'Reilly Media, 2013, tradução livre.

O valor esperado pode ser representado matematicamente por

A E(X) = (x₁ – y) + (x₂ – y) + (x₃ – y) + … + (xₙ – y)

B E(X) = x₁ + x₂ + x₃ + … + xₙ

C E(X) = (x₁ – y) p₁ + (x₂ – y) p₂ + (x₃– y) p₃ + … + (xₙ – y) pₙ

D E(X) = x₁ p₁ + x₂ p₂ + x₃ p₃ + … + xₙ pₙ

E E(X) = x₁ p₁ – x₂ p₂ + x₃ p₃ – … + xₙ pₙ
62057252
Questão 10 Mineração de Dados Data Mining

Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard Process of Data
Mining).

Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a


identi cação dos dados e veri car se as variáveis relevantes para o projeto não são
interdependentes.

A Certo.

B Errado.
4 62924 14

Questão 11 Mineração de Dados Data Mining

São objetivos da Mineração de Dados:

A Distribuição, Identificação, Organização e Otimização.

B Previsão, Priorização, Classificação e Alocação.

C Previsão, Identificação, Classificação e Otimização.

D Mapeamento, Identificação, Classificação e Atribuição.

E Planejamento, Redirecionamento, Classificação e Otimização.


158 2507914

Questão 12 Mineração de Dados Data Mining Conceitos básicos Processo de mineração

No que concerne a data mining (mineração de dados) e big data, julgue o seguinte item.

Devido à quantidade de informações manipuladas, a (cloud computing) computação em nuvem


torna-se inviável para soluções de big data.

A Certo.

B Errado.
62128 74 0

Questão 13 Conceitos básicos Processo de mineração Classif icação

No que concerne a data mining (mineração de dados) e big data, julgue o seguinte item.

Quem utiliza o data mining tem como objetivo descobrir, explorar ou minerar relacionamentos,
padrões e vínculos signi cativos presentes em grandes massas documentais registradas em
arquivos físicos (analógicos) e arquivos lógicos (digitais).
A Certo.

B Errado.
62128 73 0

Questão 14 Mineração de Dados Data Mining

Julgue os itens subsequentes, acerca dos conceitos de data mining, data warehouse e sistemas
colaborativos.

Em data mining, a técnica boosting é utilizada para fazer a seleção inicial dos dados a serem
analisados durante o estágio de construção do modelo

A Certo.

B Errado.
62078 73 1

Questão 15 T aref as de mineração Regras de associação Agrupamento Clustering

Julgue o item, acerca de mineração de dados.

As aglomerações, tipos de informação obtidos por meio da mineração de dados, caracterizam-se


por se ligarem a um único e especí co evento, em torno do qual ocorrem várias ações, com
produção sistêmica de informações gerenciais que apoiarão uma nova ocorrência do mesmo tipo
de evento.

A Certo.

B Errado.
4 5992513

Questão 16 T aref as de mineração

Julgue o item, acerca de mineração de dados.

Para a realização de prognósticos por meio de técnicas de mineração de dados, parte-se de uma
série de valores existentes obtidos de dados históricos bem como de suposições controladas a
respeito das condições futuras, para prever outros valores e situações que ocorrerão e, assim,
planejar e preparar as ações organizacionais.

A Certo.

B Errado.
4 5991091

Questão 17 T aref as de mineração


A revista da CGU − Controladoria Geral da União, em sua 8a edição, publicou um artigo que
relata que foram aplicadas técnicas de exploração de dados, visando a descoberta de
conhecimento útil para auditoria, em uma base de licitações extraída do sistema ComprasNet,
em que são realizados os pregões eletrônicos do Governo Federal. Dentre as técnicas preditivas
e descritivas utilizadas, estão a classi cação, clusterização e regras de associação. Como
resultado, grupos de empresas foram detectados em que a média de participações juntas e as
vitórias em licitações levavam a indícios de conluio.

As técnicas aplicadas referem-se a

A On-Line Analytical Processing.

B Data Mining.

C Business Process Management.

D Extraction, Transformation and Load.

E Customer Churn Trend Analysis.


4 2018 4 796

Questão 18 Classif icação

Julgue o item subsecutivo, com relação a Data Mining, desempenho de sistemas de bancos de
dados e controle de concorrência.

Com o uso da classi cação como técnica de Data Mining, busca-se a identi cação de uma classe
por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras
técnicas de mineração de dados.

A Certo.

B Errado.
61924 614

Questão 19 Regras de associação

Uma importante ferramenta utilizada na área de Mineração de Dados é o algoritmo Árvore de


Padrão-Frequente.

Em relação aos métodos tradicionais de Mineração de Dados, esse algoritmo é utilizado para a
extração de
A Agrupamentos

B Sumarizações

C Padrões com Séries Temporais

D Hierarquias de Classificação

E Regras de Associação
8 8 208 2250

Questão 20 Mineração de Dados Data Mining

Considerando as etapas e tarefas de Mineração de Dados, é correto afirmar que

A a Mineração é a etapa essencial do processo; ela consiste na aplicação de técnicas


inteligentes, a fim de se extrair os padrões de interesse do usuário. Para que essa etapa
ocorra, é necessário que os dados estejam preparados através de etapas, tais como
limpeza, seleção e transformação dos dados.

B as etapas de Pós-processamento e visualização dos Resultados ocorrem quando a


técnica de Análise de Outliers é a escolhida para analisar os dados.

C Redes Neurais podem ser usadas na tarefa de classificação. Nesse caso, o algoritmo de
classificação terá como entrada um banco de dados de treinamento e retornará como
saída uma rede neural que contém uma árvore de decisão a ser analisada.

D na tarefa de análise de Agrupamentos (ou análise de clusters), são trabalhados dados


que já foram classificados. Por isso, a tarefa consiste em identificar agrupamentos com
regras de associação embutidas.
3 3 63 4 93 59

Respostas:

1 A 2 E 3 D 4 B 5 B 6 A 7 E 8 C 9 D 10 B 11 C

12 B 13 B 14 B 15 B 16 A 17 B 18 A 19 E 20 A

Você também pode gostar