Você está na página 1de 15

17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Desafio do Módulo 1
Entrega
18 ago em 19:00
Pontos
40
Perguntas
15
Disponível
até 18 ago em 19:00
Limite de tempo
Nenhum

Instruções
O Desafio do Módulo 1 está disponível!

1. Instruções para realizar o desafio

Consulte a data de entrega no teste e em seu calendário.

Reserve um tempo para realizar a atividade, leia as orientações e enunciados com atenção. Em
caso de dúvidas utilize o "Fórum de dúvidas do Desafio do Módulo 1".

Para iniciá-lo clique em "Fazer teste". Você tem somente uma tentativa e não há limite de tempo
definido para realizá-lo. Caso precise interromper a atividade, apenas deixe a página e, ao retornar,
clique em "Retomar teste".

Clique em "Enviar teste" somente quando você concluí-lo. Antes de enviar confira todas as


questões.

Caso o teste seja iniciado e não enviado até o final do prazo de entrega, a plataforma enviará a
tentativa não finalizada automaticamente, independente do progresso no teste. Fique atento ao seu
teste e ao prazo final, pois novas tentativas só serão concedidas em casos de questões médicas.

O gabarito será disponibilizado partir de sexta-feira, 20/08/2021, às 23h59.

Bons estudos!

2. O arquivo abaixo contém o enunciado do desafio

Enunciado do - Desafio - Modulo 1 - Bootcamp Analista de Dados.pdf

ArquivosComplementaresDesafio.zip

Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1
91 minutos 40 de 40


As respostas corretas estarão disponíveis em 20 ago em 23:59.

Pontuação deste teste:


40 de 40

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 1/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Enviado 17 ago em 11:04


Esta tentativa levou 91 minutos.

Pergunta 1 2,67
/ 2,67 pts

Existem quatro tipos de análise de dados que se destacam pela


usabilidade e potencialidade de seus resultados. Cada tipo de análise
visa responder uma pergunta padrão. Analise as colunas 1 e 2 abaixo,
marque a alternativa que melhor representa a sequência de
numeração da relação entre estas duas colunas. 

Coluna 2 
Coluna 1 
Pergunta padrão 
Tipo de análise de dados 
(  ) Por que aconteceu? 
1 - Análise descritiva 
(  ) O que pode acontecer? 
2 - Análise diagnóstica 
(  ) O que aconteceu? 
3 - Análise preditiva 
(  ) Se acontecer, o que devo
4 - Análise prescritiva 
fazer? 

 
2, 4, 3, 1.

 
4, 2, 1, 3.

 
2, 3, 1, 4.

 
1, 2, 3, 4.

Pergunta 2 2,67
/ 2,67 pts

Sobre os tipos de tarefas de mineração de dados, analise as


alternativas abaixo e marque a INCORRETA. 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 2/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

 
A classificação consiste em descobrir uma função que mapeie um
conjunto de registros em um conjunto de rótulos categóricos pré-
definidos, denominadas classes.

 
A sumarização consiste em procurar identificar e indicar características
comuns entre conjuntos de dados. São métodos para encontrar uma
descrição compacta para um subconjunto de dados.

 
A clusterização tem o objetivo de encontrar grupos de observações
intimamente relacionadas de modo que observações dentro de um
grupo tenham uma semelhança mais acentuada quando comparadas a
outros grupos.

 
Regressão é um tipo de mineração de dados que visa descrever
características com alto grau de correlação nos padrões reconhecidos
em um conjunto de dados.

Pergunta 3 2,67
/ 2,67 pts

Classifique os tipos de tarefa de mineração de dados (coluna 2) em


relação ao tipo de análise que ela representa (coluna 1). Analise as
colunas 1 e 2 abaixo, marque a alternativa que melhor representa a
sequência de numeração da relação entre estas duas colunas. 

Coluna 1  Coluna 2 

Tipo de análise de dados  Tipo de tarefa de KDD 

1 - Análise descritiva  (  ) Clustering ou clusterização 

2 - Análise preditiva  (  ) Classificação 

(  ) Sumarização 

(  ) Associação 

(  ) Regressão 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 3/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

 
2, 1, 1, 2, 2.

 
2, 2, 1, 1, 2.

 
1, 2, 1, 2, 1.

 
2, 1, 2, 2, 1.

Pergunta 4 2,67
/ 2,67 pts

Considerando os resultados obtidos na atividade 3 sobre a tarefa de


regressão no dataset IRIS, e a imagem do workflow apresentada no
enunciado da questão. Marque abaixo a alternativa que melhor
representa o gráfico gerado no nó denominado “Gráfico 1”. 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 4/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Pergunta 5 2,67
/ 2,67 pts

Dos nós apresentados abaixo, marque a opção que representa um nó


que pode ser utilizado para gerar um modelo de agrupamento
ou clusterização. 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 5/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Pergunta 6 2,67
/ 2,67 pts

Dos nós apresentados abaixo, marque a opção que representa um nó


que pode ser utilizado para gerar um modelo de classificação. 

Pergunta 7 2,67
/ 2,67 pts

Sobre a etapa de interpretação e avaliação do processo de descoberta


de conhecimento em banco de dados, é CORRETO afirmar: 

 
Quando o resultado não é satisfatório, conclui-se que o processo de
mineração de dados foi um sucesso pois não detectou nenhuma
anomalia no conjunto de dados analisado.

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 6/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

 
Após serem selecionados, limpos e pré-processados os dados
necessitam de interpretação e avaliação para indicar se será possível
submeter tais dados ao processo de mineração de dados.

 
Algumas técnicas de visualização de dados comumente conhecidas
são os dashboards e as narrativas de dados (data storytelling)

 
Uma das etapas iniciais do KDD consiste em interpretar e avaliar os
dados a fim de identificar quais são os dados que podem ser usados
pela etapa de mineração de dados.

Pergunta 8 2,67
/ 2,67 pts

Considerando os resultados obtidos na atividade 1 sobre a tarefa


de clusterização no dataset IRIS, e a imagem do workflow apresentada
no enunciado da questão. Marque abaixo a alternativa que melhor
representa o gráfico gerado no nó denominado “Gráfico 1”. 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 7/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Pergunta 9 2,67
/ 2,67 pts

Considerando os resultados obtidos na atividade 2 sobre a tarefa de


classificação no dataset IRIS, e a imagem do workflow apresentada no
enunciado da questão, responda: uma das técnicas de avaliação
da acurácia do modelo de classificação é a matriz de confusão da

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 8/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

análise realizada. Marque abaixo a alternativa que melhor representa o


resultado da matriz de confusão (uma das saídas do nó “Scorer”) do
nó denominado “Avalia acurácia da previsão”. 

Pergunta 10 2,67
/ 2,67 pts

Relacione os tipos de tarefa de mineração de dados (coluna 2) às


técnicas de mineração de dados (coluna 1) que podem ser aplicadas.
Analise as colunas 1 e 2 abaixo, marque a alternativa que melhor
representa a sequência de numeração da relação entre estas duas
colunas. 

Coluna 1 - Técnica  Coluna 2 - Tarefa de mineração 

1 - Algoritmo Apriori  (  ) Clustering ou clusterização 

2 - Algoritmo árvores de decisão  (  ) Classificação 

3 – Regressão linear  (  ) Associação 

4 – Algoritmo K-means  (  ) Regressão 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 9/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

 
4, 2, 1, 3.

 
2, 4, 1, 3.

 
1, 4, 2, 3.

 
2, 1, 4, 3.

Pergunta 11 2,67
/ 2,67 pts

Considerando os resultados obtidos na atividade 2 sobre a tarefa de


classificação no dataset IRIS, e a imagem do workflow apresentada no
enunciado da questão. Marque abaixo a alternativa que melhor
representa o gráfico gerado no nó denominado “Gráfico 1”. 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 10/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Pergunta 12 2,67
/ 2,67 pts

Considerando a atividade 4, a tarefa de classificação do dataset Iris


utilizando o Weka, marque a alternativa que melhor representa o
modelo de classificação apresentado na saída da execução da tarefa. 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 11/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Pergunta 13 2,67
/ 2,67 pts

Considerando os gráficos de visualização gerados no Weka para a


classificação realizada. Marque a alternativa que melhor representa o
gráfico onde os parâmetros são: 

X: Larg_Sepala_Cm 

Y: Larg_Petala_Cm 

Colour: Especie 

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 12/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

Pergunta 14 2,67
/ 2,67 pts

Em relação às ferramentas e os fundamentos de Mineração de dados,


é correto afirmar: 

 
A técnica de classificação em mineração de dados verifica se há
controle ou influência entre atributos ou valores de atributos, no intuito
de verificar, mediante a análise de probabilidades condicionais,
dependências entre esses atributos.

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 13/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

 
A etapa de KDD do Mineração de dados consiste em aplicar técnicas
que auxiliem na busca de relações entre os dados.

 
A técnica de associação em mineração de dados possibilita a definição
de classes e o enquadramento de elementos em grupos de afinidades,
por meio de avaliação de similaridade entre esses elementos.

 
Mineração de dados é o processo de descobrir conhecimento em
banco de dados, que envolve várias etapas. O KDD é uma destas
etapas, portanto, a mineração de dados é um conceito que abrange o
KDD.

 
As ferramentas de Mineração de dados permitem ao usuário avaliar
tendências e padrões não conhecidos entre os dados. Esses tipos de
ferramentas podem utilizar técnicas avançadas de computação como
redes neurais, algoritmos genéticos e lógica nebulosa, dentre outras.

Pergunta 15 2,62
/ 2,62 pts

Considerando os resultados obtidos na atividade 3 sobre a tarefa de


regressão no dataset IRIS, e a imagem do workflow apresentada no
enunciado da questão. Uma das técnica de avaliação da acurária do
modelo foi utilizar o nó “Numeric Scorer”. Marque abaixo a alternativa
que melhor representa a resposta correta. 

 
A média de erro absoluto do modelo é de 0.25, indicando que 25% das
predições foram realizadas erradas.

 
O coeficiente de determinação, também chamado de R² (R^2) obtido,
foi 0.07, e significa que o modelo linear explica 7% da variável predita.

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 14/15
17/08/2021 Desafio do Módulo 1: 2021-3 - Bootcamp Analista de Dados

 
A média absoluta do percentual de erro do modelo é de 0.043,
indicando que apenas 4% das predições foram realizadas erradas.

 
O coeficiente de determinação R² (R^2) obtido, foi 0.93, e significa que
o modelo linear explica 93% da variável predita.

Pontuação do teste:
40 de 40

https://online.igti.com.br/courses/3797/quizzes/36188?module_item_id=236411 15/15

Você também pode gostar